KR20040032891A - 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및방법 - Google Patents
답토마이신 생합성 유전자 클러스터에 관련된 조성물 및방법 Download PDFInfo
- Publication number
- KR20040032891A KR20040032891A KR10-2004-7001843A KR20047001843A KR20040032891A KR 20040032891 A KR20040032891 A KR 20040032891A KR 20047001843 A KR20047001843 A KR 20047001843A KR 20040032891 A KR20040032891 A KR 20040032891A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- acid molecule
- daptomycin
- acid sequence
- gene cluster
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 답토마이신 생합성 유전자의 전부 또는 일부를 포함하는 핵산 분자를 제공한다. 답토마이신 생합성 유전자 클러스터는 스트렙토마이세스, 바람직하게는 에스. 로제오스포루스로부터 유래될 수 있다. 본 발명은 또한 에스. 로제오스포루스로부터의 다른 핵산 분자를 제공한다. 본 발명은 추가로 상기 핵산 분자들에 의해 코딩되는 폴리펩티드, 이 폴리펩티드에 특이적으로 결합하는 항체, 및 상기 핵산 분자, 폴리펩티드 및 항체를 이용하여 답토마이신 및 다른 화합물을 제조하는 방법을 제공한다.
Description
방선균을 포함한 박테리아 및 진균류는 다양한 저분자량 펩티드와 폴리케티드 화합물(대략 2-48 잔기의 길이)을 합성한다. 이들 화합물의 생합성은 비리보솜 펩티드 신세타제(synthetase)(NRPSs)에 의해, 그리고 폴리케티드 신타제(synthase)(PKs)에 의해 촉매된다. 유전자 코드에 따른 리보솜-매개 RNA 번역에 관련되지 않는 NRPS 과정은, 리보솜에 의해 RNA 주형으로부터 번역되는 펩티드에 비해 방대한 구조적 다양성을 나타내는 펩티드를 생산할 수 있다. 이들은 D- 및 L- 아미노산과 하이드록시산의 통합, 선형, 고리형 또는 분지쇄 고리 구조를 형성하는 펩티드 주쇄내의 변이, 및 산화, 아실화, 글리코실화, N-메틸화 및 헤테로사이클형 고리 형성을 포함한 부가의 구조적 변형을 포함한다. 많은 비리보솜 합성 펩티드는 유용한 약리학적(예, 항생제, 항바이러스, 항진균, 항기생충, 사이드로포어(siderophore), 세포증식억제, 면역억제, 항콜레스테롤 및 항암), 농화학적 또는 물리화학적(예, 생계면활성제) 특성을 갖는 것으로 확인되었다.
비리보솜 합성 펩티드는 하나 이상의 서브유닛을 포함하는 커다란(예, 약 200-2000 kDa) 다기능성 NRPS 효소 복합체에 의해 조립된다. 그 예는 답토마이신, 반코마이신, 에치노칸딘 및 사이클로스포린을 포함한다. 유사하게, 폴리케티드는하나 이상의 서브유닛을 포함하는 커다란 다기능성 PKS 효소 복합체에 의해 조립된다. 그 예는 에리스로마이신, 티로신, 모넨신 및 아베르멕틴을 포함한다. 일부 경우에는, 혼합된 PKS/NRPS 시스템에 의해 복합체 분자들이 합성될 수 있다. 그 예는 라파마이신, 블레오마이신 및 에포티론을 포함한다.
NRPS는 일반적으로 NRPS 복합체를 구성하는 하나 이상의 오픈 리딩 프레임으로 이루어진다. NRPS 복합체는, 특정 빌딩 블록 기질에 결합하여 이를 활성화시키고 펩티드 쇄 형성과 연장을 촉매하도록 배열된 단백질 생합성 단위 시리즈를 포함하며 단백질 주형으로 작용한다.(참고: Konz and Marahiel, Chem.Biol.,6,pp.39-48(1999) 및 이 문헌에 인용된 문헌; vonDohern et al., Chem. Biol., 6, pp. 273-279(1999) 및 이 문헌에 인용된 문헌; 및 Cane and Walsh, Chem.Biol., 6, pp.319-325,(1999) 및 이 문헌에 인용된 문헌 - 이들 각각은 그 모두가 본원에 참고로 통합됨). 각 NRPS 또는 NRPS 서브유닛은 하나 이상의 모듈을 포함한다. "모듈"은 하나의 빌딩 블록(예, 하나의 아미노산)을 성장하는 펩티드 쇄에통합시키는 촉매 단위로 정의된다. NRPS 단백질 주형을 형성하는 생합성 모듈의 순서 및 특이성은 최종적인 펩티드 생성물의 서열과 구조를 지배한다.
NRPS의 각 모듈은 펩티드 쇄 연장에 필요한 특이적 반응을 촉매하는 분별된, 접힌 단백질 도메인을 함유하는 반자치성 활성 부위로 작용한다. (단일 모듈 복합체내의) 최소 모듈은 적어도 두 개의 핵심 도메인인 1) 아미노산(또는 때로는 하이드록시산)을 활성화시키는 아데닐화 도메인, 및 2) 활성화된 중간체를 효소-결합된 판테테인 보조인자로 전달하는 티올화 또는 아실 운반체 도메인으로 이루어진다.대부분의 모듈은 또한 3) 활성화된 중간체간의 펩티드 결합 형성을 촉매하는 축합 도메인을 함유한다. 도 9 참고. 이들 세 개의 핵심 도메인을 보충하는 것은 예를 들어, 결합된 아미노산 중간체의 N-메틸화(M 또는 메틸화 도메인)와 L-에서 D-로의 전환(E 또는 에피머화 도메인), 및 헤테로사이클 고리 형성(Cy 또는 고리화 도메인)을 매개할 수 있는 다양한 수의 부가 도메인이다. 이 도메인들은 일반적으로 특이적인 아미노산 모티프 또는 특징에 의해 특징지어진다. NRPS와 혼합 NRPS/PKS 효소 복합체에 의해 조립된 성숙한 펩티드 생성물의 방대한 구조적 및 기능적 다양성에 기여하는 것은 근처 모듈들내에 묶여진(tethered) 중간체에 국소적으로 작용하는 그러한 부가 도메인들의 조합이다.
각 최소 모듈의 아데닐화 도메인은 동족 아미노산의 특이적 인식과 활성화를 촉매한다. 비리보솜 펩티드 생합성의 이 초기 단계에서, 각 NRPS 모듈의 동족 아미노산은 아데닐화 도메인에 결합되고 불안정한 아실 아데닐레이트로서 활성화된다(수반되는 ATP 가수분해와 함께). (참고: 예, Stachelhaus et al.,Chem., Biol. 6:493-505(1999)와 Challis et al., Chem.Biol. 7:211-224(2000), 각각 본원에 참고로 통합됨). 대부분의 NRPS 모듈에서, 아실 아데닐레이트 중간체는 이어서 모듈의 T(티올화) 도메인(또한 펩티딜 운반체 단백질 또는 PCP 도메인으로 칭함)으로 옮겨지며, 여기서 티오에스테르 중간체로 전환되고 트랜스티올화 반응을 통해 공유적으로 결합된 효소 보조인자에 묶인다(4‘-포스포판테테이닐(4’-PP) 중간체). D-배열된 또는 N-메틸화된 아미노산을 통합시키는 모듈은 여분의 변형 도메인을 보유할 수 있으며, 이들은 몇몇 연구된 NRPS에서는 A 도메인과 T 도메인 사이에 위치한다.
각 모듈의 효소-결합된 중간체는 이어서 단계적인 축합 반응에 의해 펩티드 생성물로 조립되는데, 이들 축합 반응은 한 모듈의 한 잔기의 티오에스테르-활성화된 카르복실기를 예를 들어 다음 모듈내의 다음 아미노산의 이웃 아미노기로 이전시키는 것에 관련되며, 이때 중간체는 NRPS에 공유적으로 연결된 채로 유지된다. 각 축합 반응은 일반적으로 두 개의 최소 모듈 사이에 위치한 축합 (C) 도메인에 의해 촉매된다. NRPS내의 축합 도메인의 수는 일반적으로 최종 (선형) 펩티드 내에 존재하는 펩티드 결합의 수에 상응한다. 여분의 C 도메인은 몇몇 NRPS에서(예를 들어, 사이클로스포린 합성 효소의 아미노 말단과 라파마이신의 카르복실 말단에서; 참고: 예를 들어 Konz and Marahiel, 상기 문헌) 발견되어 펩티드 쇄 종결과 고리화 반응에 관련되는 것으로 제안되었다. 하지만, 많은 기타 NRPS 복합체는 C-말단 티오에스테라제(Te) 도메인(약 28-35K 상대 분자량)에 의해 촉매되는 반응에서 전길이 쇄를 방출한다.
대부분의 NRPS 복합체의 티오에스테라제 도메인은 촉매적 트리아드(잘 알려진 키모트립신 기작과 유사함)를 이용하며, 이는 히스티딘과 산성 잔기에 대해 보존된 삼차원 배열의 보존된 세린(가끔씩은 시스테인 또는 아스파테이트) 잔기를 포함한다. 예를 들어, 각각 참고로 본원에 통합되는 V.De Crecy Lagard in Comprehensive Natural Products Chemistry, Volume 4, ed. J.W.Kelly(New York:Elsevier), 1999, pp. 221-238 참고. 티오에스테르 절단은 2 단계 과정이다. 첫 번째(아실화) 단계에서는, 전길이 펩티드 쇄가 티올화 도메인내의 티올 결합된효소 중간체로부터(상기 참고) Te 도메인내의 보존된 세린 잔기로 옮겨져, 아실-O-Te 에스테르 중간체를 형성한다. 두 번째(탈아실화) 단계에서는, 에스테르 중간체가 물에 의해(가수분해) 공격되는지 또는 활성화된 분자내 친핵체에 의해(고리화) 공격되는 지에 따라, Te 도메인 세린 에스테르 중간체가 가수분해되거나(그래서 선형의 전길이 생성물을 방출함), 또는 고리화를 일으킨다.
NRPS 수퍼패밀리의 다양한 일원으로부터의 C-말단 티오에스테라제 도메인의 서열 비교에 의해, 세린 촉매 잔기를 포함하는 보존된 모티프(GXSXG 모티프)가 밝혀졌으며, 이는 종종 보존된 세린 잔기로부터 약 25 아미노산 하부의 아스파르트산 잔기가 뒤따른다. 두 번째 유형의 티오에스테라제, 유리(free) 티오에스테라제 효소는 일부 펩티드와 폴리케티드 이차 대사물의 생합성에 참여하는 것으로 알려져 있다. 예를 들어 각각 참고로 본원에 통합되는 Schneider and Marahiel, Arch.Microbiol. 169,pp.404-410(1998), 및 Butler et al., Chem.Biol.,6,pp.87-292(1999) 참고. 이들 티오에스테라제는 종종 효율적인 천연 생성물 합성에 필요하다. Butler et al.은 효율적인 티로신 생성에 요구되는 폴리케티드 티로신 유전자 클러스터에서 발견된 유리 티오에스테라제가 편집과 교정 기능에 관여할 수도 있다는 가설을 세웠다.
NRPS 다효소 복합체의 모듈 조직화는 이 모듈들을 코딩하는 게놈 DNA의 수준에서 보여진다. 몇몇 다른 NRPS들을 코딩하는 유전자의 조직과 DNA 서열이 연구되어 왔다(예를 들어, 본원에 참고로 통합되는 Marahiel, Chem.Biol., 4, pp.561-567(1997) 참고). 많은 다양한 유기체에서 유래한 NRPS 서열을 비교함으로써 특정NRPS 기능성 도메인을 특징짓는 보존된 서열이 동정되었으며, 이들 보존된 서열 모티프는 새로운 NRPS 유전자와 모듈을 동정하고 분리하는 데 유용한 프로브를 고안하는 데 이용되어 왔다.
유전 공학과 생체내 재조합에 의해 DNA 수준에서 모듈의 수와 위치를 변화시킴으로써 새로운 특이성을 갖는 새로운 효소를 설계하기 위해 PKS와 NRPS 효소 복합체의 모듈 구조를 이용할 수 있다. 기능성 하이브리드 NRPS는 예를 들어 전체 모듈 융합에 기초하여 구성될 수 있다. 예를 들어 본원에 참고로 통합되는 Gokhale et al., Science, 284, pp. 482-485(1999); Mootz et al., Proc.Natl.Acad.Sci.USA 97,pp.5848-5853(2000) 참고. 재조합 기술을 이용하여 이종성 PKS 또는 NRPS 복합체에서 유래한 도메인을 성공적으로 교환할 수도 있다. 예를 들어, 본원에 참고로 통합되는 Schneider et al., Mol.Gen.Genet., 257, pp.308-318(1998); McDaniel et al., Proc.Natl.Acad.Sci. USA., 96, pp. 1846-1851(1999); 미국 특허 제 5,652,116호와 5,795,738호; 및 국제 공개 번호 WO 00/56896호 참고.
아데닐화 도메인의 기질 결합 포켓을 형성하는 잔기를 변화시켜 모듈내에 새로운 기질 특이성을 설계하는 것 또한 개시되어 있다. 예를 들어 참고로 본원에 통합되는 Cane and Walsh, Chem.Biol.,6, 319-325(1999); Stachelihaus et al., Chem.Biol.,6,493-505(1999); 및 WO 00/52152호를 참고. 바실러스 서브틸리스 펩티드 합성 효소 GrsA 아데닐화 도메인(PheA)(그 구조는 공지임)의 서열을 원핵 및 진핵 NRPS로부터의 160개의 다른 아데닐화 도메인의 서열과 비교함으로써, 예를 들어 Stachelhaus et al.,(상기)과 Challis et al., Chem.Biol., 7, pp.211-224(2000)은다양한 아미노산 기질에 대한 아데닐화 (A) 도메인 싸인 서열(유전자 코드의 코돈에 유사함)을 정의하였다. 이들 싸인 서열의 수집으로부터, 추정적인 NRPS 선택성 부여 코드(유전자 코드처럼 축퇴성을 가짐)를 설립하였다.
모듈을 첨가하거나, 결실시키거나 교환하여 새로운 모듈 주형 구조와 새로운 기질 특이성을 갖는 NRPS를 설계하는 능력은 변화되고 잠재적으로 유익한 특성을 갖는 새로운 펩티드를 생성할 수 있게 한다. 예를 들어 라파마이신 PKS(다른 기질 특이성을 코딩함)로부터의 카운터파트 서열을 치환시킴으로써 에리스로마이신 전구체(DEBS)를 합성하는 PKS를 체계적으로 변형시켜 50개 이상의 새로운 폴리케티드를 포함하는 조합 라이브러리를 제조하였다. 예를 들어 참고로 본원에 통합되는 WO00/63361과 McDaniel et al.,(1999), 상기 참고.
항생제와 기타 잠재적 독성 화합물들을 생산하는 많은 박테리아는 ATP 결합 카세트(ABC) 운반자(transporter)를 합성한다. ABC 운반자는 양자-의존성 경막 전기화학 포텐셜을 이용하여 항생제와 같은 독성 세포 대사물을 내보내고 예를 들어 철 또는 기타 금속과 같은 환경으로부터의 물질을 들여보낸다. 세 가지 유형의 ABC 운반자와 항생제 내성을 나타내는 펌프를 코딩하는 유전자가 있으며, 이들은 종종 항생제 생산자 유기체내의 생합성 집단에 연결되어 있다(예를 들어, 스트렙토마이세스 코엘리컬러에서의 액티노로딘 내성). 예를 들어, 본원에 참고로 통합되는 Mendez et al., FEMS Microbiol. Lett. 158:1-8(1998) 참고. 모두 워커(Walker) A와 B 모티프를 포함하는 ATP-결합 영역을 갖는다. Id. 유형 I 시스템은 친수성 ATP-결합 도메인과 소수성 막통합(intergral membrane) 도메인을 위한 별도의 유전자들에 관련된다. 유형 III 시스템은 소수성 N-말단과 친수성의 ATP-결합 C-말단을 가진 단백질을 코딩하는 단일 유전자에 관련된다. 유형 II 수송자는 소수성 도메인을 갖지 않으며, 두 세트의 워커 모티프를 A:B:A:B의 순서로 갖는다.
스트렙토마이세스 글라우스센스 유전자, StrV(PIR 기탁 번호 S57561)와 StrW(PIR 기탁 번호 S57562)는 스트렙토마이신-관련 화합물들에 대한 내성에 연관된 유형 III 수송자를 코딩한다. 두 유전자들은 5'-하이드록시스트렙토마이신 항생제 생합성 유전자 클러스터내에 있다. 예를 들어, 본원에 참고로 통합되는 Beyer et al., Mol. Gen. Genet. 250:775-84(1996)를 참고. 독소루비신 및 관련 항생제에 대한 내성은 스트렙토마이세스 퓨세티우스내의 두 개의 유형 I 수송자에 의해 부여되며, 이들은 drrA 와 drrB에 의해 코딩된다. 예를 들어, 참고로 본원에 통합되는 Guifoile et al., Proc.Natl.Acad.Sci. USA 88: 8553-57 (1991)을 참고. 또한, 스트렙토마이세스 로체이로부터 분리된 drrAB의 상동체는 에스. 리비단스에서 액티노로딘 PKS 프로모터의 조절하에 발현될 때 다약제 내성을 부여한다. 예를 들어, 본원에 참고로 통합되는 Fernandez-Moreno et al., J.Bacteriol. 179:6929-36(1998) 참고.
답토마이신(Biotechnology of Antibiotics, 2nd Ed., ed. W.R.Strohl(New York: Marcel Dekker, Inc.), 1997, pp.415-435에서 R.H.Baltz에 의해 개시됨)은 NRPS에 의해 만들어진, 비리보솜 합성 펩티드의 예이다. LY146032로도 알려진 답토마이신은 스트렙토마이세스 로제오스포루스(Streptomyces roseosporus)의 발효에 의해 생산되는 고리형 리포펩티드 항생제이다. 답토마이신은 에스. 로제오스포루스의 인자 A-21978C 유형 항생제의 일원이며 3-아미노산 쇄를 통해 고리형 10-아미노산 펩티드의 N-말단 트립토판에 연결된 n-데카노일 측쇄를 포함한다. 이 화합물은 메티실린 내성 스타필로코커스 아우레우스, 반코마이신 내성 장내구균, 글리코펩티드 중간 민감성 스타필로코커스 아우레우스, 코아귤라제-음성 포도알균, 및 페니실린 내성 스트렙토코커스 뉴모니아를 포함하며 이에 한정되지 않는 박테리아에 의해 야기되는 감염과 같이, 치료 조건이 한정되는 심각한 감염을 치료하기 위한 다양한 제제로 개발되고 있다. 예를 들어, Tally et al., Exp. Opin. Invest. Drugs 8:1223-1238, 1999 참고. 그람 양성 박테리아에 대한 답토마이신의 항생제 작용은 이것이 막 전위를 간섭하고 리포테이코산 합성을 억제하는 능력에 기여했다.
답토마이신 NRPS를 포함한, 답토마이신 생합성 경로에 관여하는 단백질을 코딩하는 유전자의 동정은, 개선된 항생제(예를 들어 더 큰 성능을 가짐)를 생산할 수 있거나, 천연의 또는 새로운 항생제를 증가된 양으로 생산할 수 있거나, 또는 유용한 생물학적 특성을 갖는 다른 펩티드 생성물을 생산할 수 있는 다른 숙주 균주 뿐만 아니라 변형된 스트렙토마이세스 로제오스포루스를 생성하는 데 있어서 첫 번째 단계를 제공할 것이다. 분리된 핵산과 분리된 단백질을 포함하여, 스트렙토마이세스 로제오스포루스 답토마이신 생합성 유전자 클러스터에 관련된 조성물과 방법은 2000년 10월 17일에 출원된 미국 가출원 60/240,879호; 2001년 2월 28일에 출원된 60/272,207호; 및 2001년 8월 8일에 출원된 60/310,385호에 개시되어 있으며 이들은 모두 본원에 참고로 통합된다.
더욱이, 스트렙토마이세스 로제오스포루스와 이종성 숙주에서의 발현을 위한전길이 답토마이신 NRPS 주형을 구성하기 위하여, 스트렙토마이세스 로제오스포루스 답토마이신 생합성 유전자 클러스터의 유전자 및 모듈 조직을 동정하는 것은 유익할 것이다. 특히, 답토마이신 유전자 클러스터가 티오에스테라제(Te) 도메인을 포함하는지 여부를 아는 것은 유익할 것이다. 만일 포함한다면, Te 도메인은 분리되어 융합 펩티드로서 또는 유리 펩티드로서 발현되어 새로운 NRPS 모듈과 주형에서 펩티드 쇄 종결을 촉매하기 위해 이용될 수 있을 것이다. 예를 들어, de Ferra et al., J.Biol.Chem., 272, pp.25304-25309(1997); Guenzi et al., J.Biol.Chem., 273, pp.14403-14410(1998); 및 Trauger et al., Nature, 407, pp. 215-218(2000)을 참고하며 이들은 모두 참고로 본원에 통합된다. 답토마이신 생합성에 관련된 폴리펩티드를 코딩하는 다른 핵산 분자들을 동정하는 것 또한 유익할 것이다. 이들은 제한없이, 답토마이신의 펩티드 도메인에 지질 꼬리를 부착시키는 데 관련된 효소, 항생제 내성을 조절하는 폴리펩티드 및 ABC 수송자를 포함한다. 항생제 내성을 조절하는 폴리펩티드와 ABC 수송자는 내성을 부여하거나, 또는 답토마이신 및 관련 항생제에 대한 박테리아의 내성을 증가, 변형 또는 감소시키는데 이용될 수 있다. 항생제 내성에 관련된 폴리펩티드는 또한 박테리아의 내성 기작을 결정하는 데 유용하여, 답토마이신과 관련 항생제를 변형시켜 이들을 내성 박테리아에 대해 더욱 강력하게 만들 수 있다.
발명의 요약
본 발명은 답토마이신 생합성 유전자 클러스터, 바람직하게는 에스. 로제오스포루스로부터의 답토마이신 생합성 유전자 클러스터의 전부 또는 일부를 포함하는 핵산 분자를 제공하여 이들 문제점을 해결한다. 이 핵산 분자는 DptA, DptBC 또는 DptD를 코딩할 수 있으며, 또는 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터로부터의 dptA, dptBC 또는 dptD 유전자 중 하나 이상을 포함할 수도 있다.
본 발명은 또한 답토마이신 생합성 유전자 클러스터로부터의 유리 티오에스테라제와 통합 티오에스테라제를 코딩하는 핵산 분자들을 제공한다. 이 핵산 분자는 DptH 또는 DptD로부터의 티오에스테라제 도메인을 코딩할 수도 있으며, 답토마이신 생합성 유전자 클러스터로부터의 dptH 또는 dptD 유전자를 포함할 수도 있다.
본 발명의 다른 목적은 에스. 로제오스포루스로부터의 핵산 서열을 포함하는 박테리아 인공 염색체로부터의 DNA 서열을 포함하는 핵산 분자를 제공하는 것이다. 바람직하게는 이 핵산 분자는 박테리아 인공 염색체(BAC) 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함한다.(상기 클론들 중, 단지 B12:03A05만이 기탁되었으며; ATCC 기탁번호 PTA-3141로서 2001년 3월 1일에 기탁되었음). 바람직한 구체예에서, 이 핵산 분자는 폴리펩티드를 코딩한다. 다른 바람직한 구체예에서, 이 핵산 분자는 본원에 개시된 바와 같은 dptA, dptBC, dptD, dptE, dptF, dptH와 같은 답토마이신 생합성에 관련된 폴리펩티드, ABC 수송자, 또는 항생제 내성을 조절하는 폴리펩티드를 코딩한다.
본 발명은 또한 전술한 핵산 분자의 선택적 하이브리드화 또는 상동성 핵산분자를 제공한다. 본 발명은 추가로 대립유전자 변이체와 그 부분들을 제공한다. 본 발명은 추가로 전술한 핵산 분자의 전사를 조절하는 발현 조절 서열 하나 이상을 포함하는 핵산 분자를 제공한다. 발현 조절 서열은 답토마이신 생합성 유전자 클러스터의 발현 조절 서열로부터 유래되거나 또는 이종성 핵산 서열로부터 유래될 수도 있다.
다른 구체예에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터의 답토마이신 NRPS 및/또는 티오에스테라제를 코딩하는 핵산 서열을 포함하는 유전자로부터의 하나 이상의 발현 조절 서열을 포함하는 핵산 분자를 제공한다. 바람직하게는, 핵산 분자는 답토마이신 NRPS 또는 dptH의 발현 조절 서열의 일부 또는 전부를 포함한다.
본 발명의 다른 목적은 전술한 핵산 분자 중 하나 이상을 포함하는 벡터 및/또는 숙주 세포를 제공한다. 바람직한 구체예에서, 벡터 및/또는 숙주 세포는 DptA, DptBC, DptD, DptE, DptF, 및/또는 DptH의 전부 또는 일부를 코딩하는 핵산 분자, 또는 전술한 BAC 클론의 전부 또는 일부를 포함한다. 숙주 세포는 답토마이신 NRPS와 같은 NRPS 또는 PKS의 전부 또는 일부를 포함할 수도 있다. 숙주 세포는 추가로 하나 이상의 티오에스테라제를 포함할 수도 있다.
본 발명의 다른 목적은 답토마이신 생합성 유전자 클러스터에서 유래한 폴리펩티드, 바람직하게는 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터로부터 유래한 폴리펩티드를 제공하는 것이다. 이 폴리펩티드는 DptA, DptBC, 또는 DptD일 수 있다.
본 발명은 또한 통합 또는 유리 티오에스테라제에서 유래한, 바람직하게는 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터에서 유래한 폴리펩티드를 제공한다. 바람직한 구체예에서, 이 폴리펩티드는 티오에스테라제에서 유래한다. 폴리펩티드는 DptH 또는 DptD의 티오에스테라제 도메인으로부터 유래할 수도 있다.
본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 하나의 핵산 분자에 의해 코딩되는 폴리펩티드를 제공한다. 이들 폴리펩티드는 다른 것들 중에서 지질 꼬리를 답토마이신의 펩티드 도메인에 붙이는 데 관여하는 효소, 항생제 내성을 조절하는 폴리펩티드 및 ABC 수송자를 포함한다.
본 발명의 다른 목적은 전술한 폴리펩티드의 단편을 제공하는 것이다. 한 구체예에서, 그 단편은 본원에서 정의된 도메인 또는 모듈 적어도 하나를 포함한다. 다른 구체예에서, 이 단편은 폴리펩티드의 하나 이상의 에피토프를 포함한다.
본 발명의 다른 목적은 답토마이신 NRPS 폴리펩티드, 티오에스테라제, 및 본원에서 제공된 BAC 클론의 핵산 분자에 의해 코딩된 폴리펩티드의 돌연변이 단백질, 융합 단백질, 상동성 단백질 또는 대립유전자 변이체인 폴리펩티드를 제공하는 것이다.
본 발명은 또한 답토마이신 NRPS의 폴리펩티드, 답토마이신 생합성 유전자 클러스터의 티오에스테라제 폴리펩티드, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 하나로부터의 핵산 분자에 의해 코딩되는 폴리펩티드에 특이적으로 결합하는 항체를 제공한다. 본 발명은 또한 전술한 폴리펩티드 또는 단백질중 어느 하나의 단편, 폴리펩티드 돌연변이, 융합 단백질, 대립유전자 변이체에 의해 코딩되는 폴리펩티드 또는 상동성 단백질에 결합할 수 있는 항체를 제공한다. 이 항체를 이용하여 본 발명의 폴리펩티드의 존재 또는 양을 검출하거나 폴리펩티드의 활성을 억제하거나 활성화시킬 수 있다.
본 발명의 다른 목적은 핵산 분자를 숙주 세포내로 도입하고 폴리펩티드를 발현시킴으로써 본원에서 개시된 핵산 분자를 이용하여 폴리펩티드를 재조합적으로 생산할 수 있는 방법을 제공하는 것이다.
본 발명은 또한 본 발명의 핵산 분자를 이용하여 본원에서 개시된 핵산 분자와 비교하여 유사하거나 동일한 핵산 서열을 갖는 핵산 분자를 검출하거나 증폭시키는 방법을 제공한다.
이 핵산 분자와 폴리펩티드는 예를 들어, 천연 생성물의 생합성과 생산 및 새로운 화합물의 설계된 생합성에 유용하다. 답토마이신 NRPS 및/또는 티오에스테라제를 이용하여 자연 발생 화합물 및 신규 화합물 둘 다를 포함한 기타 리포펩티드와 답토마이신을 생산할 수도 있다. 폴리펩티드를 이용하여 비리보솜 펩티드 합성에 의해 생산되는 다른 화합물뿐만 아니라 고리형 또는 비고리형 리포펩티드를 생체외에서 생산할 수도 있다. 다르게는, 본 발명의 핵산 분자를 숙주 세포내로 도입하여 발현시킬 수 있으며, 숙주 세포는 이어서 비리보솜 펩티드 합성에 의해 생산되는 다른 화합물과 리포펩티드를 생산하기 위해 이용될 수도 있다.
본 발명의 다른 목적은 비리보솜 펩티드 합성에 의해 신규 화합물을 생산할 수 있는 신규한 유전자 클러스터를 제공하는 것이다. 답토마이신 생합성 유전자 클러스터의 뉴클레오티드를 변화시킴으로써, 구체적으로는 답토마이신 NRPS의 뉴클레오티드, 도메인 또는 모듈을 변화시켜, 비리보솜 펩티드 합성에 관여하는 새로운 폴리펩티드를 만들기 위해 신규의 유전자 클러스터를 얻을 수도 있다. 이러한 방식으로, 자연 발생 폴리펩티드에 의해 생산되는 펩티드 외에 비리보솜 펩티드 합성에 의해 생성되는 펩티드 내로 다른 아미노산들을 통합시킬 수도 있다. 본 발명은 또한 본원에 개시된 방법에 의해 생성된 화합물을 포함한다.
본 발명의 다른 목적은 본 발명의 핵산과 아미노산 서열을 저장하는 컴퓨터 판독가능 수단을 제공하는 것이다. 컴퓨터 판독 가능 수단의 기록은 서열의 판독과 전시 및 본 발명의 서열을 다른 서열과 비교, 배열 및 순서지정하기 위해 이용할 수 있다.
도면의 간단한 설명
도 1은 답토마이신 NRPS 유전자를 조작하여 유전자 발현 또는 코딩된 단백질의 발현을 변화시키는 방법의 도식이다.
도 2A는 BAC 클론 B12:03A05의 도식이다. 이 도식은 90 kb 단편으로 불리는 90 kb 영역, SP6 단편으로 불리는 약 13 kb 영역, 및 본원에서 GTC2 단편으로 불리는 약 25-28 kb 영역을 보여준다. 서열 번호 1은 90 kb 단편의 핵산 서열을 보여준다. 서열 번호 103은 SP6 단편의 핵산 서열을 보여준다. SP6 단편은 왼쪽에서 90 kb 단편과 인접한다. GTC 단편은 오른쪽에서 90 kb 단편과 인접한다. 서열 번호104는 GTC2 단편의 핵산 서열을 보여준다.
도 2B는 90 kb 단편의 도식을 보여준다. 답토마이신 생합성 유전자 클러스터의 영역에는 폴리펩티드를 코딩하는 핵산 서열인 38개의 오픈 리딩 프레임이 있다.
도 2C는 SP6 단편의 도식을 보여준다. SP6 단편에는 9개의 ORF가 있다. 90 kb와 SP6 단편의 ORF를 위한 아미노산 및 핵산 서열 동정자를 위해서는 표 5를 참고하라.
도 2D는 GTC2 단편의 도식을 보여준다.
도 3은 Clustal W 프로그램을 이용한, 스트렙토마이세스 코엘리컬러의 칼슘 의존성 항생제(CDA) III 단백질의 아미노산 서열(서열 번호 164)과 DptD의 아미노산 서열(서열 번호 7)의 비교를 보여준다. 실시예 3 참고.
도 4는 Clustal W 프로그램을 이용한, DptH의 아미노산 서열(서열 번호 8)과 스트렙토마이세스 코엘리컬러의 CDA NRPS와 연관된 가능한 하이드롤라제(티오에스테라제로 가정됨)의 아미노산 서열(서열 번호 165)의 비교를 보여준다. 실시예 3 참고.
도 5A-5C는 답토마이신 생합성 유전자 클러스터를 함유한 스트렙토마이세스 리비단스 TK64 클론 CBUK138742(ATCC 기탁번호 PTA3140, 2001년 3월 1일 기탁)에서 생산된 A21978C 리포펩티드 또는 답토마이신의 분석을 보여준다. 도 5A는 CBUK138742의 브로스의 HPLC 분석을 보여준다. 하부 패널은 HPLC 용출액에 대해 200-600 nm 범위에 걸쳐 관찰한 최대 흡광도를 시간에 대해 플롯팅한 것을 보여준다. 세 개의 천연 리포펩티드인, 리포펩티드 A21978C1(C1 리포펩티드),A21978C2(C2 리포펩티드) 및 A21978C3(C3 리포펩티드)의 존재는 각각 보유 시간 5.61, 5.77, 및 5.89분의 피크에 의해 나타내진다. 상부 패널은 이들 피크에 대해 관찰된 UV-가시광선 스펙트럼을 보여준다. 도 5B는 답토마이신 유전자 클러스터를 함유한 스트렙토마이세스 리비단스 TK64 클론의 데카노산 공급 발효로부터 정제된 답토마이신의 ESI 질량 스펙트럼을 보여준다. 도 5C는 CBUK138742의 데카노산 공급 발효로부터 정제된 답토마이신의 1H NMR 스펙트럼(400 MHz, d6-DMSO)를 보여준다.
도 6은 클로닝 벡터 pStreptoBAC V의 다이아그램이다.
도 7은 답토마이신 생합성 유전자 클러스터로부터의 BAC 클론의 HinDIII 분해를 보여준다. 레인 1은 B12:01G05(82 kb 삽입체)을 보여주고; 레인 2는 B12:03A05(120 kb 삽입체)을 보여주며; 레인 3은 B12:06A12(85 kb 삽입체)을 보여주며; 레인 4는 B12:12FG06(65 kb 삽입체)을 보여주며; 레인 5는 B12:18H04(46 kb 삽입체)을 보여주며, 레인 6은 B12:20C09(65 kb 삽입체)을 보여준다.
도 8은 스트렙토마이세스 로제오스포루스의 답토마이신 NPRS 영역의 약 180-200 kb를 커버하는 일부 BAC 클론들의 지도를 보여준다.
도 9는 NRPS의 유전자 구조의 도식이다.
도 10은 스트렙토마이세스 코엘리컬러로부터의 CDA NRPS와 답토마이신 NRPS의 Asn과 Asp를 특정하는 도메인에 대한 아데닐화(A) 도메인 유사성을 나타내는 덴드로그램이다. 실시예 5 참고.
도 11은 Asn의 입체화학을 결정하는 HPLC 분석의 결과를 보여준다. 실시예 6 참고.
도 12는 답토마이신 NRPS의 조직을 보여주는 도식이다.
도 13은 실시예 12C에 개시된 대로 생성된 신규의 리포펩티드의 1H NMR 스펙트럼을 보여준다.
발명의 상세한 설명
정의와 일반적 기술
본원에서 달리 정의되지 않으면, 본 발명과 관련하여 사용되는 과학적 및 기술적 용어는 당업자에 의해 상식적으로 이해되는 의미를 갖는다. 또한, 내용상 달리 요구되지 않으면, 단수 용어는 복수를 포함하며 복수 용어는 단수를 포함한다. 일반적으로, 본원에서 개시된 명명법, 세포와 조직 배양, 분자 생물학, 면역학, 미생물학, 유전학 및 단백질과 핵산 화학 및 하이브리드화의 기법 및 이와 관련된 명명법은 당업계에 잘 알려져 있으며 통상적으로 이용되는 것들이다. 본 발명의 방법과 기술은 일반적으로 당업계에 잘 알려지고 달리 나타내지 않으면 본 명세서의 전반에 걸쳐 인용되고 언급되는 다양한 일반적이고 보다 구체적인 참고 문헌들에 개시된 통상의 방법에 따라 수행된다. 예를 들어, Sambrook et al., Molecular Cloning; A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1989); Sambrook et al., Molecular Cloning:3d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2000); Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates(1992, and Supplements to 2000); Ausubel et al., Short Protocols in Molecular Biology; A Compendium of Methods from Current Protocols inMolecular Biology, 4th ed.,Wiley & Sons(1999); Harlow and Lane Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1990); Harlow and Lane Using Antibodies:A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1998); 및 T.Kieser et al., Practical Streptomyces Genetics, John Innes Foundation, Norwich(2000)를 참고하며, 각각 본원에 참고로 통합된다.
효소 반응과 정제 기법은 당업계에서 통상적으로 이루어지거나 본원에 개시된 대로, 제조자의 지침에 따라 수행된다. 본원에 개시된 분석 화학, 합성 유기 화학 및 의학적 및 약학적 화학의 실험 과정과 기술 및 관련하여 이용되는 명명법은 당업계에 잘 알려져 있으며 흔히 사용되고 있다. 화학 합성, 화학 분석, 약학 제제, 제제, 및 전달 그리고 환자의 치료에 표준 기법이 이용된다.
달리 나타내지 않으면, 하기 용어는 다음 의미를 갖는 것으로 이해된다.
용어 "티오에스테라제"는 티오에스테르 결합의 절단을 촉매하여 고리형 또는 선형 분자를 생성할 수 있는 효소를 의미한다.
용어 "티오에스테라제 활성"은 티오에스테라제, 또는 뮤테인, 상동성 단백질, 유사체, 유도체, 융합 단백질 또는 이들의 단편이 티오에스테르 결합의 절단을 촉매하는 효소 활성을 의미한다. 티오에스테라제 활성은 예를 들어 결합 및/또는 해리 상수, 촉매 속도 및 기질 전환 속도를 포함한다. 폴리펩티드의 티오에스테라제 활성은 DptH, DptD의 티오에스테라제 도메인, dptH에 의해 코딩되는 폴리펩티드, dptD의 티오에스테라제 도메인에 의해 코딩되는 폴리펩티드, 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖는 폴리펩티드 또는 서열 번호 8의 아미노산 서열을 갖는 폴리펩티드의 티오에스테라제 활성과 동일할 수도 있다. 티오에스테라제 활성은 또한 전술한 티오에스테라제들의 활성과 다를 수도 있다; 예를 들어, 그것은 증가되거나 감소된 촉매 활성, 다른 결합 및/또는 해리 상수 또는 촉매를 위한 다른 기질을 가질 수도 있다. "감소된" 또는 "증가된" 티오에스테라제 활성은 각각 티오에스테라제의 감소되거나 증가된 촉매 활성을 의미한다.
"답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제"는 답토마이신 합성에 관련된 폴리펩티드를 코딩하는 유전자 클러스터의 유전자중 하나에 의해 코딩되는 티오에스테라제 또는 티오에스테라제 도메인이다. 바람직하게는, 이 티오에스테라제는 스트렙토마이세스로부터의 답토마이신 생합성 유전자 클러스터로부터 유래하며, 바람직하게는 에스. 로제오스포루스로부터의 답토마이신 생합성 유전자 클러스터로부터 유래한다.
"답토마이신 생합성 유전자 클러스터"는 본원에서 유기체, 바람직하게는 박테리아 세포에서 답토마이신의 합성을 위해 필요한 많은 폴리펩티드를 코딩하는 핵산 분자로 정의된다. 답토마이신 생합성 유전자 클러스터는 적어도 DptA, DptBC, DptD 및 DptH를 코딩하거나 또는 그 뮤테인, 상동성 단백질, 대립유전자 변이체 또는 그 단편을 코딩하는 핵산 분자와 답토마이신 합성에 필요한 다른 폴리펩티드를 코딩하는 다른 핵산 서열을 포함한다. 바람직하게는, 답토마이신 생합성 유전자 클러스터는 박테리아 세포내로 도입되고 발현될 때 답토마이신의 합성을 허용하는 BAC B12:03A05의 일부를 포함한다.
"답토마이신 NRPS"는 적절한 박테리아 세포에서 답토마이신을 합성할 수 있는 NRPS로 정의된다. 답토마이신 NRPS는 폴리펩티드 서브유닛 DptA, DptBC 및 DptD, 또는 적절한 세포에서 발현될 때 답토마이신의 합성을 지시할 수 있는 그것의 뮤테인, 상동성 단백질, 대립유전자 변이체 또는 단편을 포함한다. 답토마이신 NRPS는 추가로 DptH 및/또는 DptE 또는 DptF와 같은 기타 폴리펩티드를 포함할 수도 있다. 바람직하게는, 답토마이신 NRPS는 스트렙토마이세스로부터의 답토마이신 생합성 유전자 클러스터로부터 유래되며, 보다 바람직하게는 답토마이신 NRPS는 에스. 로제오스포루스로부터 유래된다. 용어 "답토마이신 NRPS"는 답토마이신 NRPS가 단지 답토마이신만을 합성하기 위해 이용될 수 있다는 것을 의미하지 않는다. 그렇다기보다는, 본원에서 이용될 때, 이 용어는 NRPS가 답토마이신 생합성 유전자 클러스터로부터 원래 유래한다는 것을 개시하기 위한 목적으로만 이용된다. 답토마이신 NRPS는 본원에서 개시된 대로, 답토마이신 외의 다른 분자를 합성하기 위해 이용될 수 있다.
"유전자"는 폴리펩티드를 코딩하는 핵산 서열과 그 폴리펩티드를 코딩하는 핵산 서열에 작동가능하게 연결된 발현 조절 서열을 포함하는 핵산 분자로 정의된다. 예를 들어, 유전자는 프로모터, 하나 이상의 인핸서, 폴리펩티드를 코딩하는 핵산 서열, 하부 조절 서열 및, 가능하게는 RNA의 발현의 조절에 관련된 다른 핵산 서열을 포함할 수도 있다.
만일 핵산 분자 또는 폴리펩티드가 특정 종으로부터 분리되거나 또는 핵산 분자 또는 폴리펩티드가 특정 종으로부터 분리된 핵산 분자 또는 폴리펩티드와 상동이면, 핵산 분자 또는 폴리펩티드는 이 특정 종으로부터 "유래된" 것이다.
용어 "dptA", "dptBC", 및 "dptD"는 답토마이신 NRPS의 서브유닛을 코딩하는 핵산 분자를 의미한다. 바람직한 구체예에서, 핵산 분자는 스트렙토마이세스로부터 유래되고, 보다 바람직하게는 핵산 분자는 에스. 로제오스포루스로부터 유래된다. 바람직한 구체예에서, dptA, dptBC, 및 dptD는 각각 서열 번호 9, 11, 및 7의 아미노산 서열을 갖는 폴리펩티드를 코딩한다. 용어 "dptA", "dptBC", 및 "dptD"는 또한 이들 유전자의 대립유전자 변이체를 의미하며, 이들은 스트렙토마이세스의 다른 종으로부터 또는 다른 에스. 로제오스포루스 균주로부터 얻을 수 있다.
용어 "dptH"는 그 코딩 도메인이 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 유전자를 의미하며, 이때 자연 발생 티오에스테라제는 "유리" 티오에스테라제이다. 유리 티오에스테라제는 그것이 자연 발생일 때 더 큰 폴리펩티드의 기능성 도메인이 아닌 티오에스테라제이다. dptH 유전자는 또한 하기에 개시된 바처럼, 그 유전자의 코딩 영역의 상부에 위치한 발현 조절 서열을 포함한다. 한 구체예에서, dptH의 발현 조절 서열은 서열 번호 5의 핵산 서열을 갖는다. 용어 "dptH"는 또한 서열 번호 8에 의해 정의된 폴리펩티드를 코딩하는 핵산을 의미한다. 용어 "dptH"는 또한 이 유전자의 대립유전자 변이체를 의미하며, 이는 스트렙토마이세스의 다른 종 또는 다른 에스. 로제오스포루스 균주로부터 얻을 수 있다.
용어 "대립유전자 변이체"는 한 유전자의 둘 이상의 자연 발생 대체형중 하나를 의미하며, 이때 각 대립유전자는 다른 뉴클레오티드 서열을 갖는다. 대립유전자 변이체는 동일한 폴리펩티드 또는 다른 폴리펩티드를 코딩할 수도 있다. 본원에서 사용될 때, 대립유전자는 기준 핵산 서열에 대하여 90% 이상의 서열 동일성, 바람직하게는 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 서열 동일성을 가지며 기준 핵산 분자에 의해 코딩되는 폴리펩티드와 유사하거나 동일한 생물학적 특성을 갖는 폴리펩티드를 코딩하는 것이다.
용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 적어도 10 염기 길이의, 리보뉴클레오티드 또는 데옥시뉴클레오티드 또는 이들 유형 중 어느 유형의 변형된 형태의 뉴클레오티드의 중합체 형태를 의미한다. 이 용어는 단일쇄 및 이중쇄 형태의 DNA를 포함한다. 또한, 폴리뉴클레오티드는 자연 발생 및/또는 비-자연 발생 뉴클레오티드 연결에 의해 함께 연결된 자연 발생 뉴클레오티드 및 변형된 뉴클레오티드 중 하나 또는 둘다를 포함할 수 있다.
"분리된" 또는 "실질적으로 순수한" 핵산 또는 폴리뉴클레오티드(예, RNA, DNA, 또는 혼합된 중합체)는 자연 숙주 세포내에서 천연 폴리뉴클레오티드에 자연적으로 수반되는 다른 세포 성분들(예, 리보솜, 폴리머라제, 또는 그 폴리뉴클레오티드가 천연적으로 연합되어 있는 게놈 서열)로부터 실질적으로 분리된 것이다. 이 용어는 (1) 그것의 자연 발생 환경으로부터 제거되거나 (2) "분리된 폴리뉴클레오티드”가 자연에서 발견되는 폴리뉴클레오티드의 전부 또는 일부와 연합되어 있지 않거나, (3) 자연에서는 연결되어 있지 않는 폴리뉴클레오티드에 작동적으로 연결되거나, 또는 (4) 더 큰 서열의 일부로서 자연에서는 발생하지 않는 핵산 또는 폴리뉴클레오티드를 포함한다. 용어 "분리된" 또는 "실질적으로 순수한"은 또한 재조합 또는 클론된 DNA 분리물, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종성 시스템에 의해 생물학적으로 합성된 폴리뉴클레오티드 유사체에 대하여 사용될 수 있다.
핵산 분자 또는 폴리뉴클레오티드의 "일부"는 기준 핵산 분자의 적어도 14 뉴클레오티드의 부분적인 인접 서열을 포함하는 핵산 분자를 의미한다. 바람직하게는, 일부는 기준 핵산 분자의 적어도 17 또는 20 뉴클레오티드를 포함한다. 보다 바람직하게는, 일부는 적어도 25, 30, 35, 40, 50, 60, 70, 80,90, 100, 200, 300, 400, 500, 또는 1000 뉴클레오티드를 포함하며, 최대로는 기준 핵산 분자보다 1 뉴클레오티드 짧은 뉴클레오티드를 포함한다. 핵산 분자의 일부는 다른 핵산 서열을 전혀 포함하지 않을 수도 있다. 다르게는, 핵산 분자의 일부는 다른 핵산 분자로부터의 다른 핵산 분자를 포함할 수도 있다.
용어 "올리고뉴클레오티드"는 일반적으로 200 뉴클레오티드 또는 그 이하의 길이를 포함하는 폴리뉴클레오티드를 말한다. 바람직하게는, 올리고뉴클레오티드는 10 내지 60 뉴클레오티드 길이이며, 가장 바람직하게는 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 또는 60 뉴클레오티드 길이이다. 올리고뉴클레오티드는 단일쇄일 수 있어 예를 들어 프로브 또는 프라이머로 이용될 수 있으며, 또는 돌연변이 유전자의 작제에 사용하기 위한 이중쇄일 수도 있다. 본 발명의 올리고뉴클레오티드는 센스 또는 안티센스 올리고뉴클레오티드일 수 있다. 올리고뉴클레오티드는 필요하면 검출을 위한 표지를 포함할 수 있다.
본원에서 언급되는 용어 "자연 발생 뉴클레오티드"는 자연 발생 데옥시리보뉴클레오티드와 리보뉴클레오티드를 포함한다. 본원에서 언급되는 용어 "변형된 뉴클레오티드"는 변형되거나 치환된 당 기 등을 가진 뉴클레오티드를 포함한다. 본원에서 언급된 용어 "뉴클레오티드 결합"은 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포르아니라데이트, 포스포로아미데이트 등과 같은 뉴클레오티드 결합을 포함한다. 예를 들어 본원에 참고로 통합되는 LaPlanche et al., Nucl.Acids.Res. 14:9081(1986); Stec et al.,J.Am.Chem.Soc.106:6077(1984); Stein et al.Nucl.Acids.Res.16:3209(1988); Zon et al.,Anti-Cancer Drug Design 6:539(1991); Zon et al. Oligonucleotides and Analogues:A Practical Approach, pp.87-108(F.Eckstein, Ed., Oxford University Press, Oxford England(1991)); Stec et al. U.S. Patent No.5,151,510; Uhlmann and Peyman Chemical Reviews 90:543(1990) 참고.
달리 기재되지 않으면, 센스 배향의 폴리뉴클레오티드 서열의 왼쪽 말단은 5' 말단이고 오른쪽 말단은 3' 말단이다. 또한, 센스 배향의 폴리뉴클레오티드의 왼쪽 방향은 5' 방향으로 칭해지며, 오른쪽 방향은 3' 방향으로 칭해진다.
핵산 서열의 문맥에서 용어 "퍼센트 서열 동일성" 또는 "동일한"은 최대로 일치되도록 배열될 때 두 서열내의 동일한 잔기를 말한다. 서열 동일성 비교의 길이는 약 9 뉴클레오티드 이상의 길이이며, 일반적으로 약 20 뉴클레오티드 이상, 보다 일반적으로 약 24 뉴클레오티드 이상, 일반적으로 약 28 뉴클레오티드 이상, 보다 일반적으로 약 32 뉴클레오티드 이상, 및 바람직하게는 약 36 이상 또는 그이상의 뉴클레오티드 길이이다. 뉴클레오티드 서열 동일성을 측정하기 위해 이용될 수 있는 많은 상이한 알고리즘이 당업계에 공지되어 있다. 한 구체예에서, 폴리뉴클레오티드 서열은 Blast(Altschl et al., J.Mol.Biol. 215:403-410, 1990)를 이용하여 비교할 수 있다. 예를 들어, 폴리뉴클레오티드 서열은 FASTA, Gap 또는 Bestfit를 이용하여 비교할 수 있으며, 이들은 위스콘신 매디슨의 Genetics Computer Group(GCG)의 Wisconsin Package Version 10.0에 들어 있다. FASTA는 문제 서열과 조사 서열간의 배열과 최대 겹침 영역의 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 본원에 참고로 통합됨). 예를 들어, 핵산 서열간의 퍼센트 서열 동일성은 디폴트 파라미터(글자 크기 6과 점수 매기기 매트릭스를 위한 NOPAM 인자)를 가진 FASTA를 이용하거나 또는 본원에 참고로 통합되는 GCG Version 6.1에 제공된 디폴트 파라미터를 가진 Gap을 이용하여 결정할 수 있다.
핵산 또는 그 단편을 언급할 때, 용어 "실질적 상동성” 또는 "실질적 유사성"은, 전술한 대로 FASTA, BLAST 또는 Gap과 같은 서열 동일성의 공지된 알고리즘에 의해 측정할 때, 적절한 뉴클레오티드 삽입 또는 결실을 가지면서 다른 핵산(또는 그 상보성 쇄)과 적절히 배열될 때 적어도 약 50%, 보다 바람직하게는 60%, 대개 적어도 약 70%, 보다 일반적으로 적어도 약 80%, 바람직하게는 적어도 약 90%, 그리고 보다 바람직하게는 적어도 약 95%, 96%, 97%, 98%, 또는 99%의 뉴클레오티드 염기에서 뉴클레오티드 서열 동일성이 있음을 나타낸다.
다르게는, 핵산 또는 그 단편이 선택적인 하이브리드화 조건하에서 다른 핵산, 다른 핵산의 쇄, 또는 그 상보성 쇄에 하이브리드화할 때 실질적인 상동성 또는 유사성이 존재한다. 일반적으로, 선택적 하이브리드화는 적어도 약 14 뉴클레오티드 길이에 걸쳐 적어도 약 55% 서열 동일성- 바람직하게는 적어도 약 65%, 보다 바람직하게는 적어도 약 75%, 그리고 가장 바람직하게는 적어도 약 90%의 서열 동일성이 있을 때 일어난다. 예를 들어 본원에 참고로 통합되는 Kanehisa, 1984를 참고.
핵산 하이브리드화는 염 농도, 온도, 용매, 하이브리드화하는 종의 염기 조성, 상보성 영역의 길이, 및 하이브리드화하는 핵산간의 뉴클레오티드 염기 미스매치의 수과 같은 조건에 의해 영향을 받을 것이며, 이는 당업자에 의해 쉽게 인식될 것이다. 핵산 하이브리드화 실험의 내용에서 "엄격한 하이브리드화 조건"과 "엄격한 세척 조건"은 여러 가지의 다른 물리적 파라미터에 의존한다. 가장 중요한 파라미터는 하이브리드화 온도, 핵산의 염기 조성, 염농도 및 핵산의 길이를 포함한다. 당업자는 특정 하이브리드화 엄격도를 얻기 위해 이들 파라미터를 어떻게 변화시키는지 안다.
일반적으로, "엄격한 하이브리드화"는 구체적 조건하에서 특정 DNA 하이브리드의 열 융점(Tm)보다 약 25℃ 이하에서 수행된다. "엄격한 세척"은 특정 조건하에서 특정 DNA 하이브리드의 Tm보다 약 5℃ 낮은 온도에서 수행된다. Tm은 표적 서열의 50%가 완전히 매치되는 프로브에 하이브리드화하는 온도이다. 예를 들어 참고로 본원에 통합되는 상기 Sambrook et al., page 9.51을 참고.
특정 DNA-DNA 하이브리드의 Tm은 식 Tm=81.5℃ + 16.6(log10[Na+]) + 0.41(분획 G+C)-0.63(% 포름아미드)-(600/l)에 의해 평가될 수 있으며, 이때 l은 염기 쌍인 하이브리드의 길이이다.
특정 RNA-RNA 하이브리드의 Tm은 식 Tm=79.8℃ + 18.5(log10[Na+]) + 0.58(분획 G+C)+11.8(분획 G+C)2-0.35(% 포름아미드)-(820/l)에 의해 평가될 수 있다.
특정 RNA-DNA 하이브리드의 Tm은 식 Tm=79.8℃ + 18.5(logic [Na+]) + 0.58(분획 G+C)+11.8(분획 G+C)2-0.50(% 포름아미드)-(820/l)에 의해 평가될 수 있다.
일반적으로, Tm은 두 핵산간의 각 1%의 미스매치에 대해 1-1.5℃씩 감소한다. 따라서, 당업자는 표적 핵산에 대해 더 높거나 더 낮은 정도의 서열 동일성을 갖는 서열을 얻기 위해 하이브리드화 및/또는 세척 조건을 변화시킬 수 있다. 예를 들어, 표적 핵산 서열로부터 최대 10% 미스매치를 함유하는 하이브리드화 핵산을 얻기 위해서는, 완전히 매치되는 하이브리드의 계산된 Tm으로부터 10-15℃를 빼고, 이어서 이에 따라 하이브리드화 및 세척 온도를 조정하면 될 것이다. 프로브 서열은 또한 어떤 조건하에서는 이중 DNA에 특이적으로 하이브리드화하여 삼중 또는 그 이상의 DNA 복합체를 형성할 수도 있다. 그러한 프로브와 적절한 하이브리드화 조건의 준비는 당업계에 공지되어 있다.
서던 또는 노던 블롯의 필터상에서의 100 이상의 상보성 잔기를 가진 상보성 핵산 서열의 하이브리드화 또는 라이브러리 스크리닝을 위한 엄격한 하이브리드화 조건의 예는 42℃에서 50% 포름아미드/6X SSC에서 10 시간 이상, 바람직하게는 12-16 시간이다. 엄격한 하이브리드화 조건의 다른 예는 포름 아미드없이 68℃의 6X SSC에서 적어도 10 시간, 바람직하게는 12-16 시간이다. 서던 또는 노던 블롯의 필터상에서의 100 이상의 상보성 잔기를 가진 상보성 핵산 서열의 하이브리드화 또는 라이브러리 스크리닝을 위한 낮은 엄격도 하이브리드화 조건의 예는 42℃에서 6X SSC에서 10 시간 이상, 바람직하게는 12-16 시간이다. 유사하지만 동일하지 않은 핵산 서열을 동정하기 위한 하이브리드화 조건은 염농도를 일정하게 유지하면서(6X SSC) 하이브리드화 온도를 68℃에서 42℃로 변화시키거나, 또는 하이브리드화 온도와 염농도를 일정하게 유지하고(예, 42℃와 6X SSC) 포름아미드 농도를 50%에서 0%로 변화시킴으로써 찾을 수 있다. 하이브리드화 완충액은 또한 백그라운드를 낮추기 위해 블로킹 제제를 포함할 수 있다. 이들 제제는 당업계에 잘 공지되어 있다. 예를 들어 본원에 참고로 통합되는 Sambrook et al., 상기, pages 8.46과 9.46-9.58 참고.
세척 조건 또한 엄격도 조건을 바꾸기 위해 변화될 수 있다. 엄격한 세척 조건의 예는 65℃에서 15분간 0.2X SSC로 세척하는 것이다(SSC 완충액을 위해서는 Sambrook et al., 상기 참고). 종종 높은 엄격도 세척은 과다한 프로브를 제거하기 위한 낮은 엄격도 세척에 의해 선행된다. 100 염기쌍 이상의 이중쇄 DNA를 위한 중간 엄격도 세척의 예는 1X SSC로 45℃에서 15분간이다. 그러한 이중쇄를 위한 낮은 엄격도 세척의 예는 4X SSC로 40℃에서 15분간이다. 일반적으로, 특정 하이브리드화 분석에서 무관한 프로브에 대해 관찰된 것보다 2배 이상 높은 시그날-대-노이즈 비는 특이적 하이브리드화의 검출을 나타낸다.
본원에서 정의된 대로, 엄격한 조건하에서 서로 하이브리드화하지 않는 핵산은, 만일 그들이 실질적으로 서로 동일한 폴리펩티드를 코딩한다면 그들은 실질적으로 서로 상동성이다. 예를 들어, 핵산이 유전자 코드의 풍부함(redundancy)에 의해 허용되는 높은 코돈 축퇴성을 이용하여 합성적으로 또는 재조합적으로 생성될 경우에 이러한 일이 발생한다.
본 발명의 폴리뉴클레오티드는 RNA, cDNA, 게놈 DNA 및 이들의 합성 형태와 혼합된 중합체의 센스 및 안티센스 쇄 모두를 포함할 수 있다. 이들은 화학적으로 또는 생화학적으로 변형될 수 있으며 또는 비-천연 또는 유도체화된 뉴클레오티드 염기를 함유할 수도 있으며, 이는 당업자에게 쉽게 이해될 것이다. 그러한 변형은 예를 들어, 표지, 메틸화, 하나 이상의 자연 발생 뉴클레오티드의 유사체에 의한 치환, 비하전 결합(예, 메틸 포스포네이트, 포스포트리에스테르, 포스포르아미데이트, 카바메이트 등), 하전 결합(예, 포스포로티오에이트, 포스포로디티오에이트 등), 펜던트 부(예, 폴리펩티드), 삽입되는 물질(intercalators)(예, 아크리딘, 프소라렌 등), 킬레이터, 알킬레이터, 및 변형된 결합(예, 알파 아노머 핵산 등)과 같은 뉴클레오티드간 변형을 포함한다. 또한 수소 결합 및 기타 화학적 상호작용을 통해 지정된 서열에 결합하는 능력에서 폴리뉴클레오티드를 모방하는 합성 분자도 포함된다. 그러한 분자는 당업계에 공지되어 있으며, 예를 들어 분자의 주쇄내의 포스페이트 결합을 펩티드 결합이 대신하는 것을 포함한다.
핵산 서열에 적용될 때, 용어 "돌연변이된"은 기준 핵산 서열에 비교할 때 핵산 서열내의 뉴클레오티드가 삽입, 결실, 또는 변화될 수 있음을 의미한다. 단일변화가 한 위치에서 만들어질 수 있으며(점 돌연변이), 또는 여러 개의 뉴클레오티드가 단일 위치에서 삽입, 결실 또는 변화될 수 있다. 또한 하나 이상의 변화가 핵산 서열내의 임의의 수의 위치에서 이루어질 수 있다. 바람직한 구체예에서, 핵산 서열은 티오에스테라제의 야생형 핵산 서열이다. 핵산 서열은 하기에서 개시되는 돌연변이 기법을 포함한 당업계에 공지된 임의의 방법에 의해 돌연변이될 수 있다.
용어 "에러-프론(error-prone) PCR"은 DNA 폴리머라제의 복사 신뢰성이 낮아서 PCR 생성물의 전체 길이를 따라 높은 비율의 점 돌연변이가 얻어지는 조건하에서 PCR을 수행하는 방법을 의미한다. 예를 들어, Leung et al., Technique, 1.pp.11-15(1989)와 Caldwell and Joyce PCR Methods Applic., 2.pp.28-33(1992) 참고.
용어 "올리고뉴클레오티드-지시된 돌연변이 유발"은 임의의 클론된 DNA 절편에서 부위 특이적인 돌연변이를 생성시킬 수 있게 하는 방법을 의미한다. 예를 들어, Reidhaar-Olson et al., Science, 241, pp.53-57(1988) 참고.
용어 "어셈블리 PCR"은 작은 DNA 단편들의 혼합물로부터 PCR 생성물을 조립하는 것에 관련되는 방법을 의미한다. 많은 상이한 PCR 반응이 동일한 바이알내에서 평행하게 일어나며 한 반응의 생성물이 다른 반응의 생성물을 프라임한다.
용어 "성적 PCR 돌연변이 유발" 또는 "DNA 셔플링(shuffling)"은 생체외에서 상이하지만 관련성이 높은 DNA 서열의 DNA 분자간의 강요된 상동성 재조합과 결합된 에러-프론 PCR 방법을 의미하며, 이는 서열 상동성에 기초한 DNA 분자의 임의 단편화에 의해 야기되고, 이어서 에러-프론 PCR 반응에서의 프라이머 연장에 의한크로스오버의 고정이 일어난다. 예를 들어, Stemmer, Proc.Natl.Acad.Sci. USA 91, pp.10747-10751(1994) 참고. DNA 셔플링은 몇몇 관련 유전자들사이에서 수행될 수 있다("패밀리 셔플링")
용어 "생체내 돌연변이 유발"은 임의의 클론된 DNA에서 임의 돌연변이를 생성시키는 방법을 의미하며, 이는 DNA 수선 경로의 하나 이상에서 돌연변이를 보유한 이. 콜라이같은 박테리아 균주에서의 DNA의 증식에 관련된다. 이들 "돌연변이체" 균주는 야생형 부모보다 더 높은 비율의 임의 돌연변이를 갖는다. 돌연변이체 균주에서 DNA를 증식시키는 것은 궁극적으로 DNA 내의 임의 돌연변이를 생성시킬 것이다.
용어 "카세트 돌연변이 유발"은 이중쇄 DNA 분자의 작은 영역을 원래 서열과는 다른 합성 올리고뉴클레오티드 "카세트"로 대체하는 임의의 방법을 의미한다. 이 올리고뉴클레오티드는 종종 완전히 및/또는 부분적으로 임의화된 천연 서열을 함유한다.
용어 "순환 앙상블 돌연변이 유발(recursive ensemble mutagenesis)"은 그 일원들이 아미노산 서열이 상이한, 표현형적으로 관련된 돌연변이체들의 다양한 집단을 생성시키기 위해 개발된 단백질 공학(단백질 돌연변이 유발)을 위한 알고리즘을 의미한다. 이 방법은 조합 카세트 돌연변이 유발의 연속적인 순환을 조절하는 피드백 기작을 이용한다. 예를 들어, Arkin and Youvan, Proc.Natl.Acad.Sci.USA 89, pp.7811-7815(1992) 참고.
용어 "지수적 앙상블 돌연변이 유발(exponential ensemble mutagenesis)"은높은 비율의 독특하고 기능적인 돌연변이를 가진 조합 라이브러리를 생성시키기 위한 방법을 의미하며, 여기서 잔기들의 작은 그룹들이 평행하게 임의화되어 기능적 단백질로 이끄는 아미노산을 각각의 변화된 위치에서 동정한다. 예를 들어, Delegrave and Youvan, Biotechnol.Res., 11, pp.1548-1552(1993); 및 random and site-directed mutagenesis, Arnold, Curr.Opin.Biotechnol., 4, pp.450-455(1993) 참고. 전술한 참고문헌 각각은 참고로 본원에 통합된다.
"작동적으로 연결된" 발현 조절 서열은 발현 조절 서열이 관심 유전자와 인접하여 이 관심 유전자를 조절하는 연결 뿐만 아니라, 발현 조절 서열이 관심 유전자를 조절하기 위해 트랜스로 또는 먼거리에서도 작용하는 연결을 의미한다.
본원에서 사용되는 용어 "발현 조절 서열"은 그들이 작동적으로 연결된 코딩 서열의 발현에 영향을 주기 위해 필요한 폴리뉴클레오티드 서열을 의미한다. 발현 조절 서열은 전사, 전사 후 사건들 및 핵산 서열의 번역을 조절하는 서열이다. 발현 조절 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 스플라이싱 및 폴리아데닐화 시그날과 같은 효율적인 RNA 프로세싱 시그날; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 증가시키는 서열(예, 리보솜 결합 부위); 단백질 안정성을 증가시키는 서열; 및 필요할 경우, 단백질 분비를 증가시키는 서열을 포함한다. 이러한 조절 서열의 특성은 숙주 유기체에 따라 다르다: 원핵 세포에서는, 그러한 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열을 포함한다. 용어 "조절 서열"은 최소한 그 존재가 발현에 필수적인 모든 성분들을 포함할 것을 의도하며, 또한 그 존재가 유익한 부가 성분들, 예를 들어 리더 서열 과 융합파트너 서열을 포함할 수 있다.
본원에서 사용되는 용어 "벡터"는 그것이 연결되어 있는 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미한다. 벡터의 한 유형은 "플라스미드"이며, 이는 원형의 이중쇄 DNA 루프로서 그 내부로 부가의 DNA 단편들이 연결될 수 있다. 다른 벡터들은 코스미드, 박테리아 인공 염색체(BAC) 및 효모 인공 염색체(YAC)를 포함한다. 다른 유형의 벡터는 바이러스 벡터이며, 이때 부가의 DNA 단편들이 바이러스 게놈내로 연결될 수 있다. 박테리아 세포를 감염시키는 바이러스 벡터는 박테리오파아지라 불린다. 일부 벡터들은 그들이 도입되는 숙주 세포에서 자가 복제를 할 수 있다(예, 박테리아의 복제 오리진을 보유한 박테리아 벡터). 다른 벡터들은 숙주 세포내로 도입시 숙주 세포의 게놈내로 통합되어 숙주 게놈과 함께 복제될 수 있다. 더욱이, 일부 벡터들은 그들이 작동적으로 연결된 유전자의 발현을 지시할 수 있다. 그러한 벡터들은 본원에서 "재조합 발현 벡터"(또는 간단하게, "발현 벡터")라고 불린다. 일반적으로, 재조합 DNA 기법에서 이용되는 발현 벡터는 종종 플라스미드 형태이다. 본 명세서에서, 플라스미드가 가장 흔히 이용되는 벡터의 형태이므로 "플라스미드"와 "벡터"는 호환적으로 사용될 수 있다. 하지만, 본 발명은 동등한 기능을 하는 다른 형태의 발현 벡터들을 포함할 것을 의도한다.
본원에서 사용되는 용어 "재조합 숙주 세포"(또는 간단하게 "숙주 세포")는 재조합 발현 벡터가 도입되는 세포를 의미한다. 그러한 용어들은 특정 대상 세포뿐만 아니라 그러한 세포의 후손도 의미하는 것으로 의도됨을 이해해야 한다. 일부 변형들이 돌연변이 또는 환경적 영향으로 인해 후손에서 일어날 수도 있으므로, 그러한 후손은 사실상 부모 세포와 동일하지 않을 수 있으나 여전히 본원에서 사용된 용어 "숙주 세포"의 범위내에 포함된다.
용어 "폴리펩티드"는 자연 발생 및 비-자연 발생 단백질과 폴리펩티드, 폴리펩티드 단편 및 폴리펩티드 돌연변이, 유도체 및 유사체를 포함한다. 본원에서 사용될 때, 폴리펩티드는 적어도 여섯 개의 아미노산, 바람직하게는 적어도 8, 10, 12, 15, 20, 25, 또는 30개의 아미노산을 포함하며, 더욱 바람직하게는 폴리펩티드는 자연 발생 폴리펩티드의 전 길이이다. 폴리펩티드는 단량체일 수도 있고 중합체일 수도 있다. 또한, 폴리펩티드는 단일 폴리펩티드내에 많은 상이한 모듈을 포함할 수 있으며 이 모듈 각각은 하나 이상의 다른 활성을 가질 수 있다. 본 발명에 따른 바람직한 폴리펩티드는 답토마이신 생합성 유전자 클러스터에서 유래한 티오에스테라제와 그 단편, 돌연변이, 유사체 및 유도체를 포함한다.
용어 "분리된 단백질" 또는 "분리된 폴리펩티드"는 그 유래의 기원 또는 공급원에 의해 (1) 그 천연 상태에서 수반되는 자연적으로 연합된 성분들과 연합되어 있지 않거나, (2) 동종으로부터의 다른 단백질이 없거나, (3) 이종으로부터의 세포에 의해 발현되거나, 또는 (4) 자연에서 발생하지 않는 단백질 또는 폴리펩티드이다. 따라서, 화학적으로 합성되거나 또는 자연적으로 기원한 세포와 다른 세포 시스템에서 합성된 폴리펩티드는 그것의 자연적으로 연합된 성분과는 분리된 것일 것이다. 폴리펩티드 또는 단백질은 또한 당업계에 공지된 단백질 정제 기법을 이용하여 분리함으로써 자연에서 연합되는 성분들이 없도록 할 수 있다.
단백질 또는 폴리펩티드는 샘플의 적어도 약 60% 내지 75%가 단일 종의 폴리펩티드를 나타낼 때 "실질적으로 순수"하거나 "실질적으로 균질"하거나 또는 "실질적으로 정제"된 것이다. 폴리펩티드 또는 단백질은 단량체 또는 다량체일 수 있다. 실질적으로 순수한 폴리펩티드 또는 단백질은 일반적으로 약 50%, 60%, 70%, 80%, 또는 90% W/W, 보다 일반적으로는 약 95% 의 단백질 샘플을 포함할 것이며, 바람직하게는 99% 이상 순수할 것이다. 단백질 순도 또는 균질성은 당업계에 공지된 많은 방법에 의해 나타낼 수 있으며, 그 예로는 단백질 샘플을 폴리아크릴아미드 젤 전기영동하고 이어서 공지된 염료로 젤을 염색하여 단일 폴리펩티드 밴드를 가시화하는 것이 있다. 일부 목적을 위해, HPLC 또는 당업계에 공지된 정제 방법을 이용하여 더 높은 해상도를 제공할 수 있다.
본원에서 사용되는 용어 "폴리펩티드 단편"은 전길이 폴리펩티드와 비교하여 아미노-말단 및/또는 카르복시-말단 결실을 갖는 폴리펩티드를 의미한다. 바람직한 구체예에서, 폴리펩티드 단편은 이 단편의 아미노산 서열이 자연 발생 서열의 상응하는 위치와 동일한 연속 서열이다. 단편은 일반적으로 적어도 6, 7, 8, 9, 또는 10 아미노산 길이이고, 바람직하게는 적어도 12, 14, 16 또는 18 아미노산 길이이며, 보다 바람직하게는 적어도 20 아미노산 길이이며, 보다 바람직하게는 적어도 25, 30, 35, 40 또는 45 아미노산, 보다 더 바람직하게는 적어도 50 또는 60 아미노산 길이이며, 더욱 더 바람직하게는 적어도 70 아미노산 길이이다.
"유도체"는 일차 구조 서열은 실질적으로 상동성이나, 예를 들어 생체내 또는 생체외 화학적 및 생화학적 변형을 포함하거나 천연 폴리펩티드에서 발견되지 않는 아미노산을 통합시킨 폴리펩티드 또는 그 단편을 의미한다. 그러한 변형은 예를 들어, 아세틸화, 카르복실화, 인산화, 글리코실화, 유비퀴틴화, 표지화(예, 라디오뉴클라이드 이용), 및 다양한 효소적 변형을 포함하며, 이는 당업자에게 쉽게 이해될 것이다. 다양한 폴리펩티드 표지화 방법 및 그러한 목적을 위해 유용한 다양한 치환체 또는 표지가 당업계에 공지되어 있으며,125I,32P,35S, 및3H와 같은 방사성 동위원소, 표지된 안티리간드에 결합하는 리간드(예, 항체), 플루오로포어, 형광발광제, 효소 및 표지된 리간드를 위한 특이적 결합쌍 일원으로 작용할 수 있는 안티리간드를 포함한다. 표지의 선택은 원하는 민감도, 프라이머와의 결합의 용이성, 안정성 필요성, 및 이용가능한 기구에 의존한다. 폴리펩티드를 표지화하는 방법은 당업계에 공지되어 있다. 예를 들어, Ausubel et al., 1992를 참고하며 본원에 참고로 통합된다.
용어 "융합 단백질"은 이종성 아미노산 서열에 결합된 폴리펩티드 또는 단편을 포함하는 폴리펩티드를 의미한다. 융합 단백질은 둘 이상의 상이한 단백질로부터의 둘 이상의 원하는 기능성 요소를 함유하도록 만들어질 수 있기 때문에 유용하다. 융합 단백질은 관심 폴리펩티드로부터의 적어도 10개의 연속적인 아미노산을 포함하며, 보다 바람직하게는 적어도 20 또는 30 아미노산, 보다 더 바람직하게는 적어도 40, 50, 또는 60 아미노산, 더욱 바람직하게는 적어도 75, 100 또는 125 아미노산을 포함한다. 융합 단백질은 폴리펩티드 또는 그 단편을 코딩하는 핵산 서열을 다른 단백질 또는 펩티드를 코딩하는 핵산 서열과 인 프레임(in frame)으로 만들어 융합 단백질을 발현시킴으로써 재조합적으로 생성될 수 있다. 다르게는, 폴리펩티드 또는 그 단편을 다른 단백질과 가교시켜 화학적으로 융합 단백질을 생성시킬 수 있다.
용어 "비-펩티드 유사체"는 기준 폴리펩티드의 특성과 유사한 특성을 가진 화합물을 의미한다. 비-펩티드 화합물은 또한 "펩티드 모방체" 또는 "펩티도모방체"라고도 부른다. 예를 들어, Fauchere, J.Adv.Drug Res. 15:29(1986); Veber and Freidinger Trends Neurosci.p.392(1985); 및 Evans et al. J.Med.Chem. 30:1229(1987)을 참고하며 이들은 참고로 본원에 통합된다. 이러한 화합물은 종종 컴퓨터화된 분자 모델링의 도움으로 개발된다. 유용한 펩티드와 구조적으로 유사한 펩티드 모방체를 이용하여 동등한 효과를 생성할 수 있다. 일반적으로, 펩티도모방체는 티오에스테라제와 같은 패러다임 폴리펩티드(즉, 원하는 생화학적 특성 또는 약리학적 활성을 갖는 폴리펩티드)와 구조적으로 유사하나, -CH2NH-, CH2S-, -CH2CH2-, -CH=CH-(시스와 트랜스), -COCH2-, -CH(OH)CH2-, 및 -CH2SO-로 이루어진 군 중에서 선택되는 결합에 의해 공지의 방법에 의해 임의로 대체된 하나 이상의 펩티드 결합을 가진다. 컨센서스(consensus) 서열의 하나 이상의 아미노산을 동일한 유형의 D-아미노산(예, L-리신 대신 D-리신)으로 체계적으로 치환시키는 것은 또한 보다 안정한 펩티드를 생성하기 위해 이용될 수 있다. 또한, 컨센서스 서열 또는 실질적으로 동일한 컨센서스 서열 변이를 포함하는 억제된 펩티드를 당업계에 공지된 방법(Rizo and Gierasch, Annu. Rev. Biochem. 61:387(1992), 참고로 본원에 통합됨)을 이용하여, 예를 들어 펩티드를 고리화화는 분자내 디설파이드 가교를 형성시킬 수 있는 내부 시스테인 잔기를 부가함으로써 생성시킬 수 있다.
"폴리펩티드 돌연변이" 또는 "뮤테인"은 그 서열이 천연 또는 야생형 단백질의 아미노산 서열과 비교하여 하나 이상의 아미노산의 치환, 삽입 또는 결실을 함유하는 폴리펩티드를 의미한다. 뮤테인은 한 위치에서의 단일 아미노산이 다른 아미노산으로 바뀐 하나 이상의 아미노산 점 치환, 자연 발생 단백질의 서열에서 하나 이상의 아미노산이 삽입 또는 결실된 하나 이상의 삽입 및/또는 결실, 및/또는 아미노 또는 카르복시 말단의 어느 하나 또는 둘다에서 아미노산 서열의 절단을 가질 수 있다. 또한, 뮤테인은 자연 발생 단백질과 동일하거나 상이한 생물학적 활성을 가질 수도 있다. 예를 들어, 뮤테인은 증가되거나 감소된 생물학적 활성을 가질 수도 있다. 본 발명의 바람직한 구체예에서, 뮤테인은 자연 발생 티오에스테라제와 동일하거나 증가된 티오에스테라제 활성을 갖는다. 뮤테인은 야생형 단백질과 적어도 50%, 60%, 또는 70% 서열 상동성을 가지며, 보다 바람직하게는 뮤테인이 야생형 단백질과 적어도 80%, 85%, 또는 90% 서열 상동성을 가지며, 보다 더 바람직하게는 뮤테인이 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는다. 서열 상동성은 디폴트 파라미터를 이용하여 Gap 또는 Bestfit과 같은 일반적인 서열 분석 알고리즘을 이용함으로써 측정될 수 있다.
바람직한 아미노산 치환은 (1) 단백질 분해에 대한 민감성을 감소시키고, (2) 산화에 대한 민감성을 감소시키고, (3) 단백질 복합체를 형성하기 위한 결합 친화도를 변화시키고, (4) 결합 친화도 또는 효소 활성을 변화시키고, (5) 그러한 유도체, 유사체, 융합 단백질과 뮤테인의 기능적 특성 또는 다른 물리화학적 특성을 부여하거나 변화시키는 것들이다. 단일 또는 다중 아미노산 치환(바람직하게는보존적 아미노산 치환)을 자연 발생 서열에 만들 수도 있다(바람직하게는 분자간 접촉을 형성하는 도메인(s)외의 폴리펩티드의 부분에서). 보존적 아미노산 치환은 모 서열의 구조적 특성을 실질적으로 변화시키지 않는다(예를 들어, 대체 아미노산은 모 서열에서 발생하는 헬릭스를 파괴하거나 모 서열을 특징짓는 다른 유형의 이차 구조를 파괴해서는 안된다). 당업계에서 인식된 폴리펩티드 이차 및 삼차 구조의 예는 Proteins, Structures and Molecular Principles(Creighton, Ed., W.H.Freeman and Company, New York(1984)); Introduction to Protein Structure(C.Branden and J.Tooze, eds., Garland Publishing, New York, N.Y.(1991)); 및 Thornton et al., Nature 354:105(1991)에 개시되어 있으며, 이들은 모두 본원에 참고로 통합된다.
본원에서 이용될 때, 20개의 통상의 아미노산과 그들의 약자는 통상의 용법을 따른다. Immunology-A Synthesis (2nd Edition, E.S.Golub and D.R.Gren, Eds., Sinauer Associates, Sunderland, Mass.(1991), 본원에 참고로 통합됨)을 참고. 20개의 통상의 아미노산의 입체이성질체(예, D-아미노산), α-, α-이치환된 아미노산과 같은 비천연 아미노산, N-알킬 아미노산 및 기타 비통상적인 아미노산 또한 본 발명의 폴리펩티드의 적절한 성분이 될 수 있다. 비통상적인 아미노산의 예는 γ-카르복시글루타메이트, ε-N,N,N-트리메틸리신, ε-N-아세틸리신, O-포스포세린, N-아세틸세린, N-포르밀메티오닌, 3-메틸히스티딘, 5-히드록시리신, s-N-메틸아르기닌, 및 기타 유사한 아미노산과 이미노산(예, 4-하이드록시프롤린)을 포함한다. 본원에서 이용되는 폴리펩티드 표시법에서는, 표준 용법과 규약에 따라 왼쪽방향은 아미노 말단 방향이고 오른쪽 방향은 카르복시-말단 방향이다.
단백질은, 만일 그 단백질의 코딩된 아미노산 서열이 다른 유기체의 단백질의 코딩된 아미노산 서열과 유사한 서열을 가지면 다른 유기체로부터의 단백질과 "상동성"을 갖거나 "상동성"이다. 다르게는, 단백질은, 만일 두 단백질이 유사한 아미노산 서열을 가지면 다른 단백질에 상동성을 갖거나 상동성이다. 두 단백질이 상동성이라고 말해지더라도, 이것이 이들 단백질간에 진화적 관련성이 반드시 존재함을 의미하는 것은 아니다. 대신, 용어 "상동성인"은 두 단백질이 유사한 아미노산 서열을 갖는 것을 의미하는 것으로 정의된다. 바람직한 구체에에서, 상동성 단백질은 야생형 단백질에 대해 적어도 50%, 60%, 또는 70% 서열 동일성을 나타내는 것이며, 보다 바람직하게는 상동성 단백질은 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 나타낸다. 또한, 많은 경우에 유사한 아미노산 서열을 가진 단백질이 유사한 기능을 가짐에도 불구하고, 용어 "상동성인"은 그 단백질들이 서로 기능적으로 유사해야함을 의미하는 것은 아니다.
"상동성인"이 단백질 또는 펩티드에 대해 사용될 경우, 동일하지 않은 잔기 부분은 종종 보존적 아미노산 치환에 의해 상이함이 인식된다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 화학적 특성(예, 전하 또는 소수성)을 가진 측쇄(R 기)를 갖는 다른 아미노산 잔기에 의해 치환된 것이다. 일반적으로, 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 변화시키지는 않을 것이다. 둘 이상의 아미노산 서열이 서로 보존적 치환에 의해 상이한 경우, 퍼센트 서열 동일성 또는 상동성 정도는 치환의 보존적 특성에 대해 교정하기 위해 상향 조정될수 있다. 이러한 조절을 위한 수단은 당업계에 공지되어 있다.(예를 들어 본원에 참고로 통합되는 Pearson et al., 1994 참고)
다음 여섯 개의 그룹은 각각 서로를 위한 보존적 치환인 아미노산을 함유한다:
1. 세린(S), 트레오닌(T);
2. 아스파르트산(D), 글루탐산(E);
3. 아스파라긴(N), 글루타민(Q);
4. 아르기닌(R), 리신(K);
5. 이소루이신(I), 루이신(L), 메티오닌(M), 알라닌(A), 발린(V), 및
6. 페닐알라닌(F), 티로신(Y), 트립토판(W).
서열 동일성이라고도 하는, 폴리펩티드의 서열 상동성은 일반적으로 서열 분석 소프트웨어를 이용하여 측정된다. 에를 들어, 위스콘신 53705 메디슨 910 유니버시티 애브뉴에 소재하는 Genetics Computer Group(GCG)의 Sequence Analysis Software Package가 있다. 단백질 분석 소프트웨어는 지정된 상동성 측정을 이용하여 유사한 서열을 보존적 아미노산 치환을 포함한 다양한 치환, 결실 및 기타 변형에 매치시킨다. 예를 들어, GCG는 "Gap"과 "Bestfit"과 같은 프로그램을 함유하며, 이들은 디폴트 파라미터를 이용하여 유기체의 다른 종들로부터의 상동성 폴리펩티드와 같은 밀접하게 관련된 폴리펩티드간의 또는 야생형 단백질과 그것의 뮤테인간의 서열 상동성 또는 서열 동일성을 결정할 수 있다. 예를 들어 GCG Version 6.1 참고.
폴리펩티드 서열을 다른 유기체로부터의 많은 수의 서열을 함유하는 데이타베이스와 비교할 때 바람직한 알고리즘은 컴퓨터 프로그램 BLAST, 특히 blastp, tblastn 또는 BlastX이다. 본원에 참고로 통합되는 Altschul et al., Nucleic Acids Res.25:33893402(1997) 참고. 번역된 뉴클레오티드 서열을 단백질 데이타베이스와 비교하는 BlastX는 국립 생물공학 정보 센터에 위치한 서브를 통해 온라인으로 수행될 수도 있다. 단백질 서열을 단백질 데이타베이스와 비교하는 blastp를 위해 바람직한 파라미터는 다음과 같다:
기대 값: 10 (디폴트)
필터: seg (디폴트)
갭을 열기 위한 비용: 11(디폴트)
갭을 확장하기 위한 비용: 1(디폴트)
최대 배열: 100(디폴트)
단어 크기: 11(디폴트)
기재의 수: 100(디폴트)
페널티 매트릭스: BLOSUM62.
상동성을 위해 비교되는 폴리펩티드 서열의 길이는 일반적으로 적어도 약 16 아미노산 잔기, 대개 적어도 약 20 잔기, 보다 일반적으로 적어도 약 24 잔기, 통상적으로 적어도 약 28 잔기, 및 바람직하게는 약 35 잔기 이상일 것이다. 많은 수의 다른 유기체로부터의 서열을 함유하는 데이타베이스를 조사할 경우에는 아미노산 서열을 비교하는 것이 바람직하다.
아미노산 서열을 이용하는 데이타베이스 조사는 공지된 blastp외의 알고리즘에 의해 측정될 수 있다. 예를 들어, 폴리펩티드 서열은 GCG Version 6.1내의 프로그램인 FASTA를 이용하여 비교될 수 있다. FASTA는 문제 서열과 조사 서열간의 최상의 겹침의 영역의 배열 및 퍼센트 서열 동일성을 제공한다(Pearson, 1990, 본원에 참고로 통합됨). 예를 들어, 아미노산 서열간의 퍼센트 서열 동일성은 본원에 참고로 통합되는 GCG Version 6.1에 제공되는 대로, 디폴트 파라미터(단어 크기 2와 PAM250 점수매기기 매트릭스)를 가지고 FASTA를 이용하여 결정될 수 있다.
"항체"는 완전한(intact) 면역글로불린, 또는 항원 특이적 결합을 위해 완전한 항체와 경쟁하는 항원 결합 부분을 의미한다. 항원 결합 부분은 재조합 DNA 기법 또는 원래 항체의 효소적 또는 화학적 절단에 의해 생성될 수도 있다. 항원 결합 부분은 특히 Fab, Fab', F(ab')2, Fv, dAb, 및 상보성 결정 영역(CDR) 단편, 단일쇄 항체 (scFv), 키메라 항체, 디이아바디(diabodies), 및 폴리펩티드에의 특이적 항원 결합을 부여하기에 충분한 면역글로불린의 적어도 일부를 함유하는 폴리펩티드를 포함한다. Fab 단편은 VL, VH, CL 및 CH1 도메인으로 이루어진 일가 단편이며; F(ab')2단편은 힌지 영역에서 디설파이드 가교에 의해 연결된 두 개의 Fab 단편을 포함하는 이가 단편이며; Fd 단편은 VH와 CH1 도메인으로 이루어지며; Fv 단편은 항체의 단일 암(arm)의 VL과 VH 도메인으로 이루어지며; dAb 단편(Ward et al., Nature 341:544-546, 1989)은 VH 도메인으로 이루어진다.
단일쇄 항체(scFv)는 VL과 VH 영역이 짝을 이루어 그들이 단일 단백질 쇄로만들어지도록 하는 합성 링커를 통해 일가 분자를 형성하는 항체이다(Bird et al., Science 242:423-426, 1988 and Huston et al., Proc.Natl.Acad.Sci.USA 85:5879-5883, 1988). 다이아바디는 이가의 이특이적 항체로서, VH와 VL 도메인이 단일 폴리펩티드 쇄상에 발현되지만, 동일 쇄 상의 두 도메인간의 짝이루기를 허용하기에는 짧은 링커를 이용하여, 상기 도메인들이 다른 쇄의 상보성 도메인과 짝을 이루어 두 개의 항원 결합 부위를 형성하도록 한다.(예를 들어, Hollinger et al., Proc.Natl.Acad.Sci.USA 90:6444-6448, 1993, 및 Poljak et al., Structure 2:1121-1123, 1994 참고) 하나 이상의 CDR들을 공유적 또는 비공유적으로 분자내에 통합시켜 그 분자를 면역부착소(immunoadhesin)로 만든다. 면역부착소는 더 큰 폴리펩티드쇄의 일부로서 CDR을 통합할 수도 있으며, CDR을 다른 폴리펩티드 쇄에 공유적으로 연결시킬 수도 있으며, 또는 CDR을 비공유적으로 통합시킬 수도 있다. CDR은 면역부착소가 특정 관심 항원에 특이적으로 결합하도록 한다. 키메라 항체는 한 항체로부터의 하나 이상의 영역과 하나 이상의 다른 항체로부터의 하나 이상의 영역을 함유하는 항체이다.
항체는 하나 이상의 결합 부위를 가질 수도 있다. 하나보다 많은 결합 부위가 있으면, 이 결합 부위는 서로 동일할 수도 상이할 수도 있다. 예를 들어, 자연 발생 면역글로불린은 두 개의 동일한 결합 부위를 가지며, 단일쇄 항체 또는 Fab 단편은 하나의 결합 부위를 가지며, 반면 "이특이적" 또는 "이기능적" 항체는 두 개의 다른 결합 부위를 가진다.
"분리된 항체"는 (1) 그것이 천연 상태에서 수반하는, 자연에서 연합되어 있는 기타 항체를 포함한, 자연에서 연합되어 있는 성분과 연합되어 있지 않거나, (2) 동종으로부터의 다른 단백질이 없거나, (3) 이종으로부터의 세포에 의해 발현되거나, 또는 (4) 자연에서 발생하지 않는 항체이다.
"중화 항체" 또는 "억제성 항체"는 폴리펩티드의 활성을 억제하거나, 폴리펩티드가 그것에 정상적으로 결합하는 리간드에 결합하는 것을 차단하는 항체이다. 예를 들어, 중화 항-티오에스테라제 항체는 티오에스테라제의 활성을 차단하는 것일 수도 있다. "활성화 항체"는 폴리펩티드의 활성을 증가시키는 항체이다. 예를 들어, 활성화 항티오에스테라제 항체는 티오에스테라제의 활성을 증가시키는 것이다.
용어 "에피토프"는 면역글로불린 또는 T-세포 수용체에 대한 특이적 결합을 할 수 있는 임의의 단백질 결정 인자를 포함한다. 에피토프성 결정인자는 대개 아미노산 또는 당 측쇄와 같은, 분자의 화학적 활성 표면 그룹핑으로 이루어지고 대개 특이적 전하 특성뿐만 아니라 특이적 삼차원적 구조 특성을 갖는다. 항체는 해리 상수가 1 μM 이하, 바람직하게는 100 nM 이하, 가장 바람직하게는 10 nM 이하일 때 항원과 특이적으로 결합하는 것으로 말한다.
용어 "환자"는 사람과 가축을 포함한다.
본 명세서와 청구범위에 걸쳐, 단어 "포함하다", 또는 "포함하는"과 같은 변형은 기재된 정수 또는 정수의 그룹을 포함함을 의미하며, 임의의 다른 정수 또는 정수의 그룹을 배제하지는 않는다.
핵산 분자, 조절 서열, 벡터, 숙주 세포 및 폴리펩티드를 만드는 재조합 방법
핵산 분자
한 태양에서, 본 발명은 티오에스테라제 또는 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 핵산 분자를 제공한다. 한 구체예에서, 이 핵산 분자는 DptA, DptBC 또는 DptD 중 하나 이상을 코딩한다. 바람직한 구체예에서, 이 핵산 분자는 서열 번호 9, 11 또는 7의 아미노산 서열중 임의의 하나를 포함하는 폴리펩티드를 코딩한다. 다른 바람직한 구체예에서, 핵산 분자는 dptA, dptBC 및/또는 dptD를 포함한다. 추가의 바람직한 구체예에서, 핵산 분자는 서열 번호 10, 12 또는 3중의 어느 하나를 포함하는 핵산 서열을 포함한다.
다른 구체예에서, 이 핵산 분자는 답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제를 코딩한다. 바람직한 구체예에서, 이 핵산 분자는 유리 티오에스테라제이거나 통합 티오에스테라제인, 답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제를 코딩한다. 다른 바람직한 구체예에서, 이 핵산 분자는 DptH 또는 DptD의 티오에스테라제 도메인을 코딩한다. 보다 바람직한 구체예에서, 핵산 분자는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 포함하거나 서열 번호 8의 아미노산 서열을 갖는 폴리펩티드를 코딩한다. 다른 구체예에서, 핵산 분자는 답토마이신 생합성 유전자 클러스터로부터의 dptD의 티오에스테라제-코딩 도메인 또는 dptH를 포함한다. 다른 바람직한 구체예에서, 핵산 분자는 서열 번호 6 또는 서열 번호 3의 핵산 서열 또는 그것의 티오에스테라제-코딩 부분을 포함하는 영역을 포함한다. 다른 구체예에서, 핵산 분자는 또한 답토마이신 NRPS또는 그 서브유닛을 코딩한다. dptA, dptBC, dptD 및 dptH와 답토마이신 생합성 유전자 클러스터의 다른 유전자들의 분리와 동정에 관한 실시예 1-6을 참고.
다른 구체예에서, 핵산 분자는 아실 CoA 리가제를 코딩한다. 바람직한 구체예에서, 핵산 분자는 DptE를 코딩하며, 바람직하게는 핵산 분자는 서열 번호 15를 코딩한다. 보다 바람직한 구체예에서, 핵산 분자는 dptE를 포함한다. 더욱 바람직한 구체예에서, 핵산 분자는 서열 번호 16을 포함한다. 다른 구체예에서, 핵산 분자는 아실 트랜스퍼라제를 코딩한다. 바람직한 구체예에서, 핵산 분자는 DptF를 코딩하며, 바람직하게는 핵산 분자는 서열 번호 17을 코딩한다. 보다 바람직한 구체예에서, 핵산 분자는 dptF를 포함한다. 더욱 바람직한 구체예에서, 핵산 분자는 서열 번호 18을 포함한다.
본 발명의 다른 구체예는 에스. 로제오스포루스로부터의 핵산 서열을 포함하는 박테리아 인공 염색체(BAC)로부터의 DNA 서열을 포함하는 핵산 분자를 제공한다. 바람직한 구체예에서, 핵산 분자는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함한다. 바람직한 구체예에서, 이 핵산 분자는 B12:03A05(ATCC 기탁번호 PTA-3140으로서 2001년 3월 1일에 기탁되었음)로부터의 에스. 로제오스포루스 핵산 서열을 포함한다. 핵산 분자는 BAC 클론 내의 전체 에스. 로제오스포루스 핵산 서열을 포함할 수도 있고 또는 그 일부를 포함할 수도 있다. 바람직한 구체예에서, 그 일부는 폴리펩티드, 바람직하게는 전길이 폴리펩티드를 코딩할 수 있는 핵산 서열 하나 이상을 포함하는 핵산 분자, 즉 그 개시 코돈부터 종결 코돈까지 폴리펩티드를 코딩하는 핵산 분자이다. 한 바람직한 구체예에서, 그 일부는 제한없이 dptA, dptBC, dptD, dptE, dptF, 또는 dptH와 같은 답토마이신 생합성에 관련된 폴리펩티드를 코딩하는 핵산 분자를 포함한다.
다른 구체예에서, BAC 클론으로부터의 일부는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136으로부터 선택된 폴리펩티드를 코딩하는 핵산 서열을 포함하는 핵산 분자이다. 다른 구체예에서, BAC 클론으로부터의 일부는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135로부터 선택된 핵산 서열을 포함하는 핵산 분자이다.
서열 번호 110과 112의 아미노산 서열을 갖는 폴리펩티드는 답토마이신 생합성의 조절자이다. 스트렙토마이세스에서 생합성 경로의 기능을 위해서는 다수의 조절자가 필요하다(Bate et al., Chem.Biol., 6, 617-624, 1999; Baltz, Bioprocess Technol.22, 308-381, 1995). 예를 들어, 에스.하이그로스코피쿠스에서 바이아라포스를 위한 생합성 경로는 항생제 생산에 있어 긍정적 조절 역할을 가진 유전자 bprA를 함유한다(Raibaud et al., J.Bacteriol. 173, 4454-4463, 1991). 또한, 다양한 생산 균주에서 긍정적 조절인자 유전자의 카피 수를 증가시킴으로써 항생제생산의 증가가 얻어질 수 있음이 보여졌다(예, S.lividans, Vogtli et al., Mol.Microbiol. 14, 643-653, 1994; in S.argillaceus, Lombo et al., J.Bacteriol. 181, 642-647, 1999 및 in S.peucetius, Otten et al., Microbiology 146, 1457-1468, 2000). 서열 번호 109의 뉴클레오티드 서열을 갖는 핵산 분자에 의해 코딩되는, 서열 번호 110의 조절성 활성 인자 폴리펩티드는 brpA 및 스트렙토마이세스에서 발견되는 다른 조절 단백질뿐만 아니라 정족수 감지(quorum sensing) 에 관련된 luxR-패밀리 단백질과도 동일성과 유사성을 공유한다. 이들 모두는 2-성분 전사 활성인자의 패밀리내의 DNA-결합 단백질이다(Kenney, Curr.Opin.Microbiol.5, 135-141, 2002). 따라서, 서열 번호 110의 조절 활성 인자 폴리펩티드는 에스. 로제오스포루스에서 답토마이신의 수율을 증대시키기 위해 이용될 수 있다. 조절 활성 인자 유전자 또는 그들의 생물학적 활성 부분은 통합성 또는 자가 복제 발현 벡터내로 클론되어, 하나 이상의 카피로 에스. 로제오스포루스내의 하나 이상의 중성 부위에 재도입될 수 있다. 트랜스제닉 균주는 실시예 9에 개시된 대로 발효되고 답토마이신 생산에 대해 분석될 수 있으며 야생형 균주보다 더 많은 양의 답토마이신을 생산하기 위해 이용될 수 있다.
서열 번호 111의 뉴클레오티드 서열에 의해 코딩되는 서열 번호 112의 아미노산 서열을 갖는 폴리펩티드는 다양한 대사물 억제제(LacI, rbsR, malR, REG1)뿐만 아니라 스트렙토마이세스 코엘리컬러로부터의 추정적 DeoR-패밀리 전사 조절인자와 상당한 양의 동일성 및 유사성을 공유한다. 이들 단백질은 프로모터 영역에 결합하여 전사를 막는다(Zeng and Saxlid, J.Bacteriol. 181, 1719-1729, 1999;Oskouian and Stewart, J.Bacteriol. 172, 3804-3812, 1990). 따라서, 이 유전자는 답토마이신 생합성의 부정적 조절인자이다. 따라서, 이 부정적 조절 인자 유전자의 파괴 또는 결실, 또는 그 단백질 생성물의 억제는 답토마이신의 구성적 발현 및/또는 증가된 수율을 야기할 것이다. 다른 구체예에서는, 부정적 조절 유전자를 결실시키고 여러 카피의 긍정적 조절 유전자를 삽입하여 답토마이신 생성을 더욱 증가시킬 수 있다.
서열 번호 19, 21, 29, 45, 47, 49, 63, 67, 75, 및 77의 아미노산 서열(서열 번호 20, 22, 30, 46, 48, 50, 64, 68, 76, 또는 78의 핵산 서열)을 갖는 폴리펩티드는 ABC 수송자이다. 이 폴리펩티드들 중 일부는 워커 모티프를 가진 펌프형 폴리펩티드인 반면, 다른 것들은 금속 제거(예, 철 또는 망간 수송(표 6과 7 참고))에서 역할을 하는 폴리펩티드이다. 서열 번호 76을 포함하는 핵산 분자는, 에스. 로체이의 (AAD44229.1)의 ORF 1과 에스.퓨세티스 DrrA(P32010) 유전자에 대한 서열 유사성에 의해 결정된 대로, ABC 수송자 시스템의 ATP-결합 성분을 코딩한다. 코딩된 폴리펩티드는 워커 A와 워커 B 모티프 둘다 갖는다. 또한, 그것의 합성은, 통합된 막 성분을 코딩하면서, 에스. 퓨티세우스 DrrB 생성물(AAA74718.1)에 대한 그 서열 유사성에 의해 결정된 대로, Drr-B-유사 폴리펩티드를 코딩하는 서열 번호 78을 포함하는 핵산 분자의 합성에 번역이 연결된 것으로 보인다. 서열 번호 21의 아미노산 서열을 갖는 폴리펩티드는 StrV 상동체인 한편, 서열 번호 19의 아미노산 서열을 갖는 폴리펩티드는 StrW 상동체이다. 예를 들어 상기의 Beyer et al., 1996 참고. StrV 상동체는 두 워커 모티프 모두를 갖는 반면, StrW 상동체는단지 워커 B 모티프만을 갖는다. 이 폴리펩티드를 코딩하는 두 핵산 서열 모두 상보성 쇄에 있으며 번역에서 조절되는 것으로 보인다. 그들은 에스. 코엘리컬러 상동체, G8A.01과 G8A.02(emb│ CAB88931, CAB88932)를 갖는다. 표 6과 7 참고.
다른 태양에서, BAC 클론의 일부는 옥시도리덕타제(oxydoreductase); 디하이드로게나제(dehydrogenase); 항생제 내성에 관련된 전사 조절 인자; 항미생물제인 노보비오신의 생합성에 관련된, NovABC-관련 폴리펩티드; 모노옥시게나제(monooxygenase); 아실 CoA 티오에스테라제; DNA 헬리카제(helicase); DNA 리가제(ligase); 하이드롤라제(hydrolase); 열안정성 중성 프로테아제(protease); 답토마이신의 수송에서 유용한 ABC 수송자; 내생 포자 형성에 관련된 spoVK 유사 단백질; 세린 프로테아제; 및 중격화 및 포자 형성동안 DNA 분리에 관련되는 FtsK/SpoIIIE 유사 단백질을 코딩하는 핵산 서열을 포함하는 핵산 분자이다. 이들 핵산 분자와 코딩된 폴리펩티드는 답토마이신 생합성에 유용할 수도 있다; 예를 들어 아실 CoA 티오에스테라제는 티오에스테라제에 대해 전술한 이유때문에 유용할 수도 있고 또한 답토마이신의 펩티드 도메인에 지질 꼬리를 첨가하는 데 중요할 수도 있다. 효소를 코딩하는 이들 핵산 분자는 또한 다른 옥시도리덕타제, 디하이드로게나제, 모노옥시게나제, 하이드롤라제, 세린 또는 중성 프로테아제, DNA 헬리카제 또는 DNA 리가제가 당업계에서 사용되는 것과 동일한 방식으로 사용될 수 있기 때문에 유용하다. 주목할만하게, 전사 조절 인자는 공지 방법을 이용하여 돌연변이되어 답토마이신 또는 다른 항생제 내성을 증가 또는 감소시킬 수 있다. NovABC-관련 폴리펩티드를 코딩하는 핵산 분자는 NovABC가 당업계에서이용되는 것과 동일한 방법으로, 예를 들어 노보비오신 또는 관련 항미생물 제제를 생산하기 위해 이용될 수도 있다. 전술한 활성을 갖는 폴리펩티드는 서열 번호 23, 25, 27, 29, 33, 35, 37, 91, 93, 97, 99, 104, 108, 114, 116, 118, 120, 130, 132, 134, 및 136의 아미노산 서열을 포함하며 서열 번호 24, 26, 28, 30, 34, 36, 38, 92, 94, 98, 100, 105, 107, 113, 115, 117, 119, 129, 131, 133 및 135의 핵산 서열에 의해 코딩된다.
다른 태양에서, BAC 클론의 일부는 일정한 기능을 갖지 않지만 다른 스트렙토마이세스로부터의 핵산 분자와 폴리펩티드에 매우 상동성인 폴리펩티드를 코딩하는 핵산 분자이다. 이들 핵산 분자(서열 번호 62, 66, 70, 80, 82, 84, 86, 88, 96, 102, 121, 123, 125 및 127), 그들이 코딩하는 폴리펩티드(서열 번호 61, 65, 69,79, 81, 83, 85, 87, 95, 101, 122, 124, 126 및 128) 및 이 폴리펩티드에 대한 항체를 이용하여, 예를 들어 미생물학적 시험 또는 법의학에 유용한 표준 분자 생물학 및 단백질 화학 기법을(예, PCR, RT-PCR, 서던 블롯팅, 노던 블롯팅, ELISA, 방사능면역분석 또는 웨스턴 블롯팅)을 이용하여 다른 스트렙토마이세스 종을 동정할 수 있다. 다른 구체예에서, BAC 클론의 일부는 일정한 기능을 갖지 않으며 다른 종으로부터의 핵산 분자와 폴리펩티드에 매우 상동성이 아닌 폴리펩티드를 코딩하는 핵산 분자이다. 그럼에도 불구하고, 이들 핵산 분자(서열 번호 32, 40, 42, 44, 52, 54, 56, 58, 60, 72 및 74)는 답토마이신 생합성 유전자 클러스터에 밀접하기 때문에 유용하며, 따라서 이들은 답토마이신 생합성 유전자 클러스터의 전부 또는 일부를 코딩하는 핵산 분자를 동정하기 위해 이용될 수 있다. 폴리펩티드를 코딩하지 않는 BAC 클론의 일부들은 동일한 이유로 유용하다. 또한, 서열 번호 31, 39, 41, 43, 51, 53, 55, 57, 59, 71 및 73의 아미노산 서열을 갖는 폴리펩티드는 에스. 로제오스포루스를 동정하기 위해 이용될 수 있는 항체를 만들기 위해 이용될 수 있다. 이 폴리펩티드는 임의의 다른 종에 매우 상동성이 아니므로, 이 항체는 에스. 로제오스포루스에 대해 매우 특이적일 것이다.
다른 태양에서, 본 발명은 전술한 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 바람직한 구체예에서, 본 발명은 DptA, DptBC, DptD 또는 DptH를 코딩하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 9, 11, 7 또는 8을 코딩하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 보다 바람직한 구체예에서, 본 발명은 dptA, dptBC, dptD 또는 dptH의 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 10, 12, 3 또는 6의 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05중 임의의 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116,118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 분자 또는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 제공한다. 전술한 핵산 서열의 임의의 것의 선택적 하이브리드화는 낮은 엄격도 하이브리드화 조건하에서 수행될 수도 있다. 바람직한 구체예에서, 선택적 하이브리드화는 높은 엄격도 하이브리드화 조건에서 수행된다. 본 발명의 바람직한 구체예에서, 하이브리드화하는 핵산 분자는 본 발명의 폴리펩티드를 재조합적으로 발현하기 위해 이용될 수도 있다.
다른 태양에서, 본 발명은 답토마이신 NRPS 또는 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 핵산 분자, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자에 상동성인 핵산 분자를 제공한다. 본 발명은 DptA, DptBC, DptD 또는 DptH를 코딩하는 핵산 분자에 상동성인 핵산 분자를 제공한다. 한 구체예에서, 이 핵산 분자는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산 분자에 상동성이다. 바람직한 구체예에서, 이 핵산 분자는 dptA, dptBC, 또는 dptD 중 어느 하나 이상에 상동성이다. 다른 구체예에서, 이 핵산 분자는 dptD의 티오에스테라제 도메인에 의해 또는 dptH에 의해 코딩되는 티오에스테라제에 상동성이다. 보다 바람직한 구체예에서, 이 핵산 분자는 서열 번호 10, 12, 3 또는 6의 핵산 서열을 갖는 핵산 분자에 상동성이다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 분자 또는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 상동성인 핵산 분자를 제공한다. 바람직한 구체예에서, 상동성 핵산 분자는 본원에서 개시된 핵산 분자와 적어도 60%, 70%, 80%, 또는 85% 서열 동일성을 갖는 것이다. 보다 바람직한 구체예에서, 상동성 핵산 분자는 본원에서 개시된 핵산 분자와 적어도 90%, 95%, 97%, 98% 또는 99% 서열 동일성을 갖는 것이다. 또한, 한 구체예에서, 상동성 핵산 분자는 답토마이신 NRPS 또는 그 서브유닛, 티오에스테라제를 코딩하는 핵산 분자, 또는 본원에 개시된 폴리펩티드를 코딩하는 핵산 분자에 대해 전 길이에 걸쳐 상동성이다. 다른 구체예에서, 상동성 핵산 분자는 본원에서 개시된 핵산 분자에 대해 그 길이의 일부만에 걸쳐 상동성이며, 이때 그 일부는 핵산 분자의 적어도 50 뉴클레오티드, 바람직하게는 적어도 100 뉴클레오티드, 보다 바람직하게는 적어도 200 뉴클레오티드, 보다 더 바람직하게는 적어도 300 뉴클레오티드이다.
다른 구체예에서, 본 발명은 답토마이신 NRPS 또는 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 유전자의 대립유전자 변이체인 핵산, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자를 제공한다. 바람직한 구체예에서, 본 발명은 dptA, dptBC, dptD 또는 dptH의 대립유전자 변이체인 핵산을 제공한다. 보다 더 바람직한 구체예에서, 대립유전자 변이체는 유전자의 변이체이며, 이때 이 유전자는 DptA, DptBC, DptD 또는 DptH를 코딩한다. 다른 바람직한 구체예에서, 대립유전자 변이체는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 유전자의 변이체이다. 또 다른 보다 바람직한 구체예에서, 대립유전자 변이체는 유전자의 변이체로서, 이때 그 유전자는 서열 번호 10, 12, 3 또는 6의 핵산 서열을 갖는다. dptH ,또는 dptD의 티오에스테라제의 대립유전자 변이체는 바람직하게는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖는 폴리펩티드의 활성과 비교하여 동일하거나 유사한 효소 활성을 가진 티오에스테라제를 코딩하거나 또는 서열 번호 8의 아미노산 서열을 갖는다. dptA, dptBC, 또는 dptD의 대립유전자 변이체는 바람직하게는 각각 서열 번호 9, 11 또는 7의 아미노산 서열을 갖는 답토마이신 NRPS와 동일한 활성을 갖는 폴리펩티드를 코딩한다. 다른 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122,124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 분자 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자의 대립유전자 변이체를 제공한다. 바람직한 구체예에서, 대립유전자 변이체는 폴리펩티드의 동일한 생물학적 활성을 갖는 폴리펩티드를 코딩한다; 예를 들어, 이 대립유전자는 ABC-수송자 활성을 갖는 폴리펩티드를 코딩한다.
본 발명의 다른 목적은 본 발명의 핵산 서열의 일부를 포함하는 핵산 분자를 제공하는 것이다. 본 발명은 답토마이신 NRPS, 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 핵산 분자의 일부, 또는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05 중 어느 하나로부터의 에스. 로제오스포루스 핵산 서열을 포함하는 핵산 분자의 일부를 제공한다. 본 발명은 또한 전술한 선택적으로 하이브리드화하거나 또는 상동성인 핵산 분자의 일부를 제공한다. 본 발명은 전술한 핵산 분자의 대립유전자 변이체의 일부를 제공한다. 일부는 적어도 10 뉴클레오티드, 보다 바람직하게는 적어도 15, 20, 25, 30, 35, 40, 50, 100, 150, 200, 250, 또는 300 뉴클레오티드를 포함한다. 핵산 일부의 최대 크기는, 만일 그 핵산 분자가 하나보다 많은 유전자를 코딩한다면 전체 핵산 분자보다 1 뉴클레오티드 짧으며, 만일 그 핵산 분자가 단일 폴리펩티드를 코딩한다면 전길이 단백질을 코딩하는 핵산 분자보다 1 뉴클레오티드 짧다.
다른 태양에서, 하이브리드화하거나 상동성인 핵산 분자, 대립유전자 변이체, 또는 핵산 분자의 일부는 천연(야생형) 폴리펩티드와 동일한 생물학적 활성을 갖는 폴리펩티드를 코딩한다.
다른 태양에서, 본 발명은 하기하는 바와 같은 융합 단백질, 상동성 단백질, 폴리펩티드 단편, 뮤테인 또는 폴리펩티드 유사체를 코딩하는 핵산 분자를 제공한다.
본 발명의 핵산 분자는 단일 폴리펩티드 또는 다중 폴리펩티드를 코딩할 수 있다. 한 구체예에서, 본 발명은 다수의, 번역에서 연결된 폴리펩티드들을 코딩하는 핵산 분자, 예를 들어 DptA, DptBC, 및 DptD를 코딩하는 핵산 분자를 제공한다. 본 발명은 또한 에스. 로제오스포루스로부터 유래된 단일 폴리펩티드, 예를 들어, DptA, DptBC, 또는 DptD, 또는 그것의 폴리펩티드 단편, 뮤테인, 융합 단백질, 폴리펩티드 유사체 또는 상동성 단백질을 코딩하는 핵산 분자를 제공한다. 본 발명은 또한 발현 조절 서열과 같은, 다른 에스. 로제오스포루스 서열과 연합되어 있지 않은 핵산 서열을 제공한다.
일부 구체예에서, 본 발명의 핵산 분자는 플라스미드, 지정된 코스미드, pRHB153, pRHB157, pRHB159, pRHB160, pRHB161, pRHB162, pRHB166, pRHB168, pRHB169, pRHB170, pRHB172, pRHB173, pRHB174, pRHB599, pRHB602, pRHB603, pRHB613, pRHB614, pRHB680, pRHB678 또는 pRHB588(McHenney et al., J.Bacteriol.180:143-151(1998), 본원에 참고로 통합되며 이들 플라스미드 또는 코스미드중 임의의 것은 공지 기술의 일부이며 본 출원의 범위내에 속함)중 임의의 하나 이상을 포함하지 않을 수도 있다. 수행된 추가의 분석은 상기 McHenney et al.에서 언급된 플라스미드 또는 코스미드내의 답토마이신 삽입체의 일부의 위치와 배향이 정확하지 않음을 나타내었다.
발현 조절 서열
다른 구체예에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 또는 답토마이신 NRPS를 코딩하는 핵산 서열을 포함하는 유전자로부터의 발현 조절 서열 하나 이상을 포함하는 핵산 분자를 제공한다. 바람직한 구체예에서, 이 핵산 분자는 답토마이신 NRPS 또는 dptH의 발현 조절 서열의 일부 또는 전부를 포함한다. 또 다른 보다 바람직한 구체예에서, 이 핵산 분자는 서열 번호 2 또는 5의 전부 또는 일부를 포함한다. 다른 바람직한 구체예에서, 이 핵산 분자는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05 중 어느 하나로부터의 에스. 로제오스포루스 핵산 서열로부터의 발현 조절 서열을 포함한다. 이론에 얽매임없이, 답토마이신 생합성 유전자 클러스터내의 dptA의 상부의 핵산 서열(서열 번호 2)은 dptA, dptBC, 및 dptD를 위한 천연 발현 조절 서열을 포함하는 것으로 생각된다. 또한, dptA, dptBC, 및 dptD를 위한 단일 전사물이 생성되고 DptA, DptBC, 및 DptD의 발현이 번역에서 연결되어 있는 것으로 생각된다.
바람직한 구체예에서, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 및/또는 답토마이신 NRPS를 코딩하는 핵산 서열을 포함하는 유전자의 전체발현 조절 서열은 전사를 조절하기 위해 이용된다. 다른 구체예에서, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 및/또는 답토마이신 NRPS를 코딩하는 핵산 서열을 포함하는 유전자의 전체 발현 조절 서열의 일부만이 전사를 조절하기 위해 이용된다. 당업자는 공지 방법을 이용하여 전사를 조절하기 위해 유전자의 어느 부분을 사용할 것인지를 결정할 수 있다. 예를 들어, 답토마이신 NRPS 및/또는 티오에스테라제 유전자의 발현 조절 서열의 전부 또는 일부를 포함하는 핵산 서열을 리포터 유전자를 포함하는 벡터내로 연결시킬 수 있다. 그러한 리포터 유전자의 예는 제한없이 클로람페니콜 아세틸트랜스퍼라제(CAT), 루시퍼라제, 녹색 형광 단백질, β-갈락토시다제 등을 포함한다. 발현 조절 서열을 포함하는 핵산 분자는 그것이 리포터 유전자의 프로모터 또는 인핸서로 작용할 수 있도록 벡터내로 연결된다. 이 벡터는 숙주 세포내로 도입되고 발현이 유도된다. 이어서, 이 발현 조절 서열의 일부가 전사를 활성화시키거나 조절하기에 충분한지를 결정하기 위하여 리포터 유전자 생성물의 생산을 분석할 수 있다. 핵산 서열이 전사를 조절하기에 충분한지를 결정하는 방법은 일상적이며 당업계에 공지되어 있다. 예를 들어, 상기한 Ausubel et al.,을 참고.
본원에서 개시된 발현 조절 서열의 전부 또는 일부, 또는 이들 발현 조절 서열 또는 그 일부 다수 카피를 포함하는 핵산 분자는 두번째 핵산 분자에 작동적으로 연결되어 두번째 핵산 분자의 전사를 조절할 수도 있다. 한 구체예에서, 본 발명은 일반적으로 에스. 로제오스포루스에 의해 발현되지 않는 폴리펩티드를 코딩하는 핵산 분자와 같은 이종성 핵산 분자에 작동적으로 연결된 발현 조절 서열을 포함하는 핵산 분자를 제공한다. 다른 바람직한 구체예에서, 발현 조절 서열을 포함하는 핵산 분자는 벡터, 바람직하게는 박테리아 벡터내로 삽입된다. 보다 바람직한 구체예에서, 이 벡터는 박테리아 숙주 세포, 보다 바람직하게는 스트렙토마이세스 또는 이. 콜라이내로, 보다 더 바람직하게는 에스. 로제오스포루스, 에스. 리비단스 또는 에스. 프라디에 숙주 세포내로 도입된다.
본 발명은 또한 답토마이신 NRPS에 관련된 폴리펩티드와 답토마이신 생합성 유전자 클러스터로부터 유래된 티오에스테라제를 코딩하는 핵산 서열 또는 본원에 개시된 BAC 클론 또는 그 일부로부터의 핵산 분자와 작동적으로 연결된 본원에 개시된 에스. 로제오스포루스로부터의 발현 조절 서열을 포함하는 핵산 서열을 제공한다. 이 발현 조절 서열은 DptA, DptBC, DptD 또는 DptH를 코딩하는 핵산 분자, 또는 본 발명의 BAC 클론, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 서열에서 유래한 폴리펩티드를 코딩하는 핵산 분자, 또는 그 단편, 상동성 단백질, 뮤테인, 유사체, 유도체 또는 융합 단백질을 코딩하는 핵산 분자에 작동적으로 연결될 수 있다. 발현 조절 서열은 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 핵산 서열 또는 그 단편에 작동적으로 연결될 수도 있다. 바람직하게는, 발현 조절 서열은 dptA, dptBC, dptD 또는 dptH 중 하나 이상의 코딩 영역에 작동적으로 연결된다. 보다 바람직한 구체예에서, 발현 조절 서열은 서열 번호 10, 12, 3 또는 6에서 선택된 핵산 서열 또는 그 일부에 작동적으로 연결된다. 본 발명은 또한 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75,77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산을 포함하는 폴리펩티드의 코딩 영역 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 작동적으로 연결된 발현 조절 서열을 제공한다.
다른 구체예에서, 본 발명은 답토마이신 NRPS, 그 서브유닛, 모듈 또는 도메인, 티오에스테라제를 코딩하는 핵산 분자, 또는 본 발명의 BAC 클론으로부터의 에스. 로제오스포루스 서열에서 유래한 폴리펩티드를 코딩하는 핵산 분자의 전사를 지시하는 발현 조절 서열 하나 이상을 포함하는 핵산 분자를 제공하며, 이때 이 발현 조절 서열은 답토마이신 생합성 유전자 클러스터에서 유래한 것이 아니다. 적합한 발현 조절 서열의 예는 하기에서 개시된다.
발현 벡터, 숙주 세포 및 폴리펩티드를 생성하는 재조합 방법
핵산 서열은 그들을 적절한 발현 벡터내의 발현 조절 서열에 작동적으로 연결시키고 이 발현 벡터를 이용하여 적절한 단세포 숙주를 형질전환시킴으로써 발현될 수도 있다. 발현 조절 서열은 핵산 서열의 전사, 전사후 사건들 및 번역을 조절하는 서열이다. 본 발명의 핵산 서열을 발현 조절 서열에 작동적으로 연결시키는 것은 물론 이미 그 핵산 서열의 일부가 아니라면, 번역 개시 코돈, ATG 또는 GTG를 그 핵산 서열의 상부에 정확한 리딩 프레임으로 제공하는 것을 포함한다.
광범위한 숙주/발현 벡터 조합을 이용하여 본 발명의 핵산 서열을 발현시킬 수 있다. 예를 들어, 유용한 발현 벡터는 염색체, 비염색체 및 합성 핵산 서열의 단편으로 구성될 수도 있다.
바람직한 구체예에서, 본 발명의 핵산 분자를 발현시키기 위하여 박테리아 숙주 세포가 이용된다. 박테리아 숙주를 위한 유용한 발현 벡터는 pBluescript, pGEX-2T, pUC 벡터, col E1, pCR1, pBR322, pMB9 및 그 유도체를 포함한, 이. 콜라이 또는 스트렙토마이세스로부터의 플라스미드와 같은 박테리아 플라스미드, 예를 들어 파아지 람다의 많은 유도체(예, NM989, λGT10 및 λGT11)와 같은 파아지 DNA와 RP4와 같은 더 광범위한 숙주 범위 플라스미드, 및 기타 파아지(예, M13과 방사상 단일 쇄 파아지 DNA)를 포함한다. 바람직한 벡터는 박테리아 인공 염색체(BAC)이다. 보다 바람직한 벡터는 실시예 2에 개시된 pStreptoBAC이다.
다른 구체예에서, 효모, 곤충 또는 포유류 세포와 같은 진핵 숙주 세포가 이용될 수도 있다. 효모 벡터는 효모 통합 플라스미드(예, YIp5) 및 효모 복제 플라스미드(YRp와 YEp 시리즈 플라스미드), 효모 센트로미어 플라스미드(YCp 시리즈 플라스미드), pGPD-2, 2μ 플라스미드와 그 유도체, 및 Gietz and Sugino, Gene, 74, pp.527-34(1988)에 개시된 것들과 같은 개량된 셔틀 벡터(YIplac, YEplac 및 YCplac)를 포함한다. 포유류 세포에서의 발현은 pSV2, pBC12BI, 및 p91023를 포함한 다양한 벡터와 용균성 바이러스 벡터(예, 백시니아 바이러스, 아데노 바이러스, 및 배큘로바이러스), 에피좀 바이러스 벡터(예, 보바인 파필로마바이러스), 및 레트로바이러스 벡터(예, 쥐과 레트로바이러스)를 이용하여 이룰 수 있다. 곤충 세포를 위한 유용한 벡터는 배큘로바이러스 벡터와 pVL 941을 포함한다.
또한, 광범위한 발현 조절 서열의 어느 하나를 이들 벡터에서 이용하여 본 발명의 DNA 서열을 발현시킬 수 있다. 그러한 유용한 발현 조절 서열은 전술한 발현 벡터들의 구조 유전자와 연합된 발현 조절 서열을 포함한다. 전사를 조절하는 발현 조절 서열은 예를 들어 프로모터, 인핸서, 및 전사 종결 부위를 포함한다. 전사후 사건들을 조절하는 진핵 세포내의 발현 조절 서열은 스플라이스 공여자 부위와 수용자 부위 및 전사된 RNA의 반감기를 변형시키는 서열(예, 폴리(A) 첨가를 지시하는 서열 또는 RNA-결합 단백질을 위한 결합 부위)을 포함한다. 번역을 조절하는 발현 조절 서열은 리보솜 결합 부위, 폴리펩티드의 표적화된 발현을 특정 세포 부위로 지시하는 서열, 및 번역의 속도 또는 효율을 변형시키는 5' 및 3' 비번역 영역내의 서열을 포함한다.
유용한 발현 조절 서열의 예는 예를 들어, SV40 또는 아데노바이러스의 초기 및 후기 프로모터, lac 시스템, trp 시스템, TAC 또는 TRC 시스템, T3 및 T7 프로모터, 파아지 람다의 주요 오퍼레이터 및 프로모터 영역, fd 피막 단백질의 조절 영역, 3-포스포글리서레이트 키나제 또는 다른 당분해 효소를 위한 프로모터, 산 포스파타제의 프로모터(예, Pho5), 효모 α-접합 시스템의 프로모터들, GAL1 또는 GAL10 프로모터, 및 원핵 또는 진핵 세포 또는 그들의 바이러스의 유전자의 발현을 조절하는 것으로 알려진 다른 구성적 및 유도성 프로모터 서열, 및 그들의 다양한 조합을 포함한다. 다른 발현 조절 서열은 상기에서 개시된 것과 같은, 답토마이신 생합성 유전자 클러스터로부터의 것들을 포함한다.
바람직한 핵산 벡터는 또한 선별가능한 또는 증폭가능한 마커 유전자 및 관심 유전자의 카피수를 증폭시키기 위한 수단을 포함한다. 그러한 마커 유전자는 공지되어 있다. 핵산 벡터는 또한 안정화 서열(예, ori- 또는 ARS-유사 서열 및 텔로미어-유사 서열)을 포함할 수도 있으며, 또는 다르게는 숙주 세포 게놈내로의 지시되거나 지시되지 않은 통합을 선호하도록 고안될 수도 있다. 바람직한 마커 유전자와 안정화 서열은 pStreptoBAC에 개시되며, 이는 실시예 2에 개시된다. 바람직한 구체예에서, 본 발명의 핵산 서열은 원하는 코딩된 핵산 서열을 포함하는 단백질을 코딩하는 RNA의 고농도 발현을 허용하는 발현 벡터내로 인프레임으로 삽입된다. 핵산 클로닝과 서열화 방법은 공지되어 있으며 Sambrook et al., supra 1989; 및 Ausubel et al.을 포함한 실험 매뉴얼에 개시되어 있다. 생물학적, 화학적 및 면역학적 시약의 제조자로부터의 제품 정보 또한 유용한 정보를 제공한다. 실시예 2는 바람직한 핵산 클로닝과 서열 결정 방법을 제공한다.
물론, 모든 벡터와 발현 조절 서열이 본 발명의 핵산 서열을 발현하기 위해 똑같이 잘 작용하지는 않을 것이다. 모든 숙주 또한 동일한 발현 시스템으로 똑같이 잘 작용하지는 않을 것이다. 하지만, 당업자는 과도한 실험없이 그리고 본 발명의 범위를 벗어남 없이, 이들 벡터, 발현 조절 서열 및 숙주중에서 선택할 수 있을 것이다. 예를 들어, 벡터를 선택함에 있어, 벡터는 숙주 세포내에서 복제되어야 하므로 숙주가 고려되어야 한다. 벡터의 카피수, 그 카피수를 조절하는 능력, 통합을 조절하는 능력, 및 항생제 또는 기타 선별 마커와 같은, 그 벡터에 의해 코딩되는 임의의 다른 단백질의 발현 또한 고려되어야 한다.
발현 조절 서열을 선택함에 있어서, 다양한 인자가 또한 고려되어야 한다. 이들은 예를 들어, 서열의 상대적 강도, 그것의 조절성, 및 본 발명의 핵산 서열과의 양립성, 특히 가능한 2차 구조에 관한 양립성을 포함한다. 단세포 숙주는 선택된 벡터와의 그들의 양립성, 본 발명의 핵산 서열에 의해 코딩되는 생성물의 독성, 그들의 분비 특성, 그들이 폴리펩티드를 정확하게 접는 능력, 그들의 발효 또는 배양 요건, 및 그들로부터 본 발명의 핵산 서열에 의해 코딩되는 생성물의 정제의 용이성을 고려하여 선택되어야 한다.
재조합 핵산 분자 및 특히, 본 발명의 발현 벡터는 본 발명의 폴리펩티드를 이종성 숙주 세포에서 재조합 폴리펩티드로 발현시키기 위해 이용될 수도 있다. 본 발명의 폴리펩티드는 전길이 일수도 있고, 또는 본 발명에 따른 핵산 서열로부터 재조합적으로 발현된 전길이 폴리펩티드 단편보다 짧을 수도 있다. 그러한 폴리펩티드는 생물학적 활성을 가질 수도 갖지 않을 수도 있는, 유사체, 유도체 및 뮤테인을 포함한다. 바람직한 구체예에서, 이 폴리펩티드는 이종성 박테리아 숙주 세포에서 발현된다. 보다 바람직한 구체예에서, 폴리펩티드는 이종성 스트렙토마이세스 숙주 세포에서 발현되며, 보다 더 바람직하게는 에스. 리비단스 또는 에스. 프라디에 숙주 세포에서 발현된다. 예를 들어 하기의 실시예 7을 참고하라.
형질전환 및 핵산을 숙주 세포내로 도입하는 다른 방법들(예, 접합, 원형질 형질전환 또는 융합, 형질감염, 전기천공, 리포좀 전달, 막융합 기법, 고속 DNA-피복 펠릿, 바이러스 감염 및 원형질체 융합)은 공지된 다양한 방법들에 의해 이루어질 수 있다(예를 들어, Ausubel, supra and Sambrook et al., supra 참고). 박테리아, 효모, 식물, 또는 포유류 세포는 플라스미드, 코스미드, 등과 같은 발현 벡터로 형질전환 또는 형질감염되며, 이때 발현 벡터는 관심 핵산을 포함한다. 다르게는, 이들 세포는 관심 핵산을 포함하는 바이러스 발현 벡터에 의해 감염될 수도 있다. 숙주 세포, 벡터, 및 이용되는 형질전환 방법에 의존하면서, 일시적 또는 안정한 폴리펩티드 발현은 구성적이거나 유도성일 것이다. 당업자는 폴리펩티드를 일시적으로 발현시킬 것인지 또는 안정한 방식으로 발현시킬 것인지, 그리고 단백질을 구성적으로 또는 유도성으로 발현시킬 것인지를 결정할 수 있을 것이다.
광범위한 단세포 숙주 세포가 본 발명의 DNA 서열을 발현시키는 데 유용하다. 이들 숙주는 이. 콜라이, 슈도모나스, 바실러스, 스트렙토마이세스, 진균류, 효모, 곤충 세포(예, 스포돕테라 프루지페르다(SF9)), 동물 세포(예, CHO, BHK, MDCK) 및 다양한 쥐과 세포(예, 3T3과 WEHI 세포), 아프리카 녹색 원숭이 세포(예, COS1, COS7, BSC1, BSC 40, 및 BMT10), 및 인간 세포(VERO, WI38 및 HeLa 세포) 및 조직 배양한 식물 세포와 같은 공지된 진핵 및 원핵 숙주를 포함할 수 있다. 바람직한 구체예에서, 숙주 세포는 스트렙토마이세스이다. 보다 바람직한 구체예에서, 숙주 세포는 에스. 로제오스포루스, 에스. 리비단스 또는 에스. 프라디에이다.
형질감염, 재조합 단백질의 발현과 정제의 세부적 사항은 문헌에 잘 기재되어 있으며 당업자가 이해한다. 박테리아 세포 발현 시스템에서 외래 유전자를 재조합 생산하는 데 이용되는 각 단계의 다양한 기술적 태양의 상세 사항은 당업계의 많은 교과서와 실험 매뉴얼에서 발견될 수 있다. 예를 들어, Ausubel et al., supra, and Sambrook et al., supra, and Kieser et al., supra를 참고하며 이들은참고로 본원에 통합된다.
폴리펩티드
티오에스테라제와 그 단편
본 발명의 다른 목적은 답토마이신 합성에 관련된 티오에스테라제로부터 유래된 폴리펩티드를 제공하는 것이다. 한 구체예에서, 이 폴리펩티드는 답토마이신 생합성 유전자 클러스터로부터 유래된다. 바람직한 구체예에서, 이 폴리펩티드는 통합 또는 유리 티오에스테라제로부터 유래된다. 보다 바람직한 구체예에서, 이 폴리펩티드는 DptD의 티오에스테라제 도메인 또는 DptH의 아미노산 서열을 포함한다. 보다 더 바람직한 구체예에서, 이 폴리펩티드는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열 또는 서열 번호 8의 아미노산 서열을 포함한다. 티오에스테라제로부터 유래된 폴리펩티드는 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 클론, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩될 수도 있다. 본원에서 개시된 폴리펩티드는 전술한 바대로 재조합적으로 생성될 수도 있고, 자연적으로 그 단백질을 발현하는 세포로부터 분리될 수도 있고, 또는 명세서의 기재에 따라 공지된 방법을 이용하여 화학적으로 합성될 수도 있다. 예를 들어 실시예 3-6을 참고.
이 폴리펩티드는 본원에서 정의된 티오에스테라제의 단편을 포함할 수도 있다. 전체 티오에스테라제의 단편 또는 일부만을 포함하는 폴리펩티드는 티오에스테라제 활성을 갖는 폴리펩티드를 코딩할 수도 코딩하지 않을 수도 있다. 티오에스테라제 활성을 갖지 않는 폴리펩티드는, 그것이 단편, 유사체, 뮤테인, 상동성 단백질 또는 유도체인지 여부에 관계없이 유용하며, 특히 항-티오에스테라제 항체를 제조하기 위해 동물을 면역시킬때 유용하다. 하지만, 바람직한 구체예에서, 일부 또는 단편은 티오에스테라제 활성을 갖는 폴리펩티드를 코딩한다. 폴리펩티드가 티오에스테라제 활성을 갖는 지 여부를 결정하는 방법은 하기에 개시된다. 또한, 바람직한 구체예에서, 이 단편은 GXSXG 티오에스테라제 모티프를 포함하는 아미노산 서열을 포함한다(실시예 3 참고). 보다 바람직한 구체예에서, 단편은 티오에스테라제 모티프 GWSFG 또는 GTSLG를 포함하는 아미노산 서열을 포함하며, 이들 모티프는 각각 서열 번호 7의 티오에스테라제 도메인 또는 서열 번호 8의 아미노산 서열로부터 유래한다.
티오에스테라제를 코딩하는 DNA를 절단시키고 이어서 그것을 재조합적으로 발현시킴으로써 티오에스테라제를 코딩하는 폴리펩티드의 단편을 생산할 수 있다. 다르게는, 전길이 폴리펩티드의 일부를 화학적으로 합성함으로써 단편을 생산할 수 있다. 또한 재조합 폴리펩티드 또는 분리된 자연 발생 폴리펩티드를 효소로 절단함으로써 단편을 생산할 수 있다. 폴리펩티드 단편을 생산하는 방법은 공지되어 있다(예를 들어 Ausubel et al., supra, and Sambrook et al., supra, 참고). 한 구체예에서, 티오에스테라제의 단지 일부 또는 단편만을 포함하는 폴리펩티드는 티오에스테라제를 화학적으로 또는 효소를 이용하여 절단하여 생성할 수도 있다. 바람직한 구체예에서, 폴리펩티드 단편은 티오에스테라제의 단편을 코딩하는 핵산 분자를 숙주 세포에서 발현시켜 생산할 수 있다.
답토마이신 NRPS 폴리펩티드, 및 그 서브유닛과 단편
본 발명의 다른 목적은 답토마이신 NRPS 또는 그 서브유닛에서 유래된 폴리펩티드를 제공하는 것이다. 답토마이신 NRPS는 서브유닛 DptA, DptBC, 및 DptD를 포함한다. 하기의 실시예 3-6에서 보다 상세하게 개시되는 바와 같이, 각 서브유닛은 특이적 빌딩 블록 기질에 결합하여 활성화시키고 펩티드 쇄 형성과 연장을 촉매하는 많은 모듈을 포함한다. 또한, 각 모듈은 축합, 아데닐화 및 티올화에 참여하는 많은 도메인을 포함한다. 또한, 실시예 6에서 보다 상세하게 개시되는 바와 같이, 일부 모듈은 에피머화 도메인을 포함한다. DptD는 또한 실시예 5와 상기에서 개시되는 바처럼 티오에스테라제 도메인을 포함한다.
한 구체예에서, 이 폴리펩티드는 DptA, DptBC, 및/또는 DptD로부터의 아미노산 서열을 포함한다. 보다 더 바람직한 구체예에서, 폴리펩티드는 서열 번호 9, 11 또는 7의 아미노산 서열을 포함한다. 답토마이신 NRPS 폴리펩티드는 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 임의의 클론, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩될 수도 있다. 본원에 개시된 폴리펩티드는 전술한 대로 재조합적으로 생산될 수도 있고, 자연적으로 그 단백질을 발현하는 세포로부터 분리될 수도 있고, 또는 명세서의 기재에 따라 공지된 방법을 이용하여 화학적으로 합성될 수도 있다. 예를 들어, DptA, DptBC, 및 DptD의 모듈과 도메인뿐만 아니라 아미노산 서열에 관해서는 실시예 3-6을 참고.
폴리펩티드는 본원에서 정의한 답토마이신 NRPS의 단편을 포함할 수도 있다. 한 구체예에서, 이 단편은 답토마이신 NRPS 서브유닛의 하나 이상의 완전한 모듈을포함한다. 다른 구체예에서, 단편은 답토마이신 NRPS 서브유닛의 도메인 하나 이상을 포함한다. 또 다른 구체예에서, 단편은 완전한 도메인 또는 모듈을 포함하지 않을 수도 있으나, 하나 이상의 도메인 또는 모듈의 일부만을 포함할 수도 있다. 답토마이신 NRPS의 전체 도메인 또는 모듈을 포함하지 않는 폴리펩티드는 그것이 단편, 유사체, 뮤테인, 상동성 단백질 또는 유도체인지 여부에 관계없이 유용하며, 특히 항-티오에스테라제 항체를 제조하기 위해 동물을 면역시킬 때 유용하다. 보다 바람직한 구체예에서, 이 단편은 아미노산에 결합하는 데 필요한 아데닐화 도메인의 적어도 일부를 포함하는 아미노산 서열을 포함한다. 도메인의 이 일부는 하기 실시예 5에서 개시되는 바와 같이, 특정 아데닐화 도메인의 아미노산 포켓 코드에 의해 범위가 정해진다.
전술한 대로, 본 발명의 폴리펩티드의 단편을 재조합적으로, 화학적 합성에 의해, 또는 효소 절단에 의해 생산할 수 있다.
에스. 로제오스포루스 BAC 클론으로부터의 폴리펩티드
본 발명의 다른 목적은 본 발명의 에스. 로제오스포루스 BAC 클론으로부터의 핵산 또는 그 일부에 의해 코딩되는 폴리펩티드를 제공하는 것이다. 한 구체예에서, 본 발명은 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05로부터의 핵산 분자 또는 그 일부에 의해 코딩되는 폴리펩티드를 제공한다. 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104,108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드를 제공한다. 다른 바람직한 구체예에서, 본 발명은 DptE 또는 DptF인 폴리펩티드, 서열 번호 15 또는 17의 아미노산 서열을 갖는 폴리펩티드, 또는 dptE 또는 dptF에 의해 코딩되거나 서열 번호 16 또는 18의 핵산 서열에 의해 코딩되는 폴리펩티드를 제공한다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 29, 45, 47, 49, 63, 67, 75, 및 77의 아미노산 서열을 포함하거나 서열 번호 20, 22, 30, 46, 48, 50, 64, 68, 76, 또는 78의 핵산 서열에 의해 코딩되는 ABC 수송자를 제공한다. 다른 바람직한 구체예에서, 본 발명은 디하이드로게나제와 같은 옥시도리덕타제; 항생제 내성에 관련된 전사 조절 인자; 항미생물제인 노보비오신의 생합성에 관련된, NovABC-관련 폴리펩티드; 모노옥시게나제; 아실 CoA 티오에스테라제; DNA 헬리카제; 또는 DNA 리가제인 폴리펩티드를 제공하며, 그 예로는 서열 번호 23, 25, 27, 29, 33, 35, 37, 91, 93, 97 및 99로부터 선택된 아미노산 서열을 갖는 폴리펩티드에 의해 제공되는 것들이 있다. 다른 바람직한 구체예에서, 본 발명은 서열 번호 61, 65, 69, 79, 81, 83, 85, 87, 95, 및 101로부터 선택된 아미노산 서열을 갖는 폴리펩티드에 의해 제공되는 것과 같은, 스트렙토마이세스 폴리펩티드에 매우 상동성인 폴리펩티드를 제공한다. 본원에서 정의된 폴리펩티드는 전술한 대로 재조합적으로 생산될 수도 있고, 자연적으로 그 단백질을 발현하는 세포로부터 분리될 수도 있고, 또는 명세서의 기재에 따라 공지된 방법을 이용하여 화학적으로 합성될 수도 있다. 본 발명은 또한 본원에서 정의된 BAC 클론으로부터의 폴리펩티드를 코딩하는 핵산 분자의 단편을 포함하는 폴리펩티드를 제공한다. 전술한 대로, 본 발명의 폴리펩티드의 단편을 재조합적으로, 화학적 합성에 의해 또는 효소 절단에 의해 생성할 수 있다.
뮤테인, 상동성 단백질, 대립유전자 변이체, 유사체 및 유도체
본 발명의 다른 목적은 답토마이신 NRPS, 그 서브유닛, 또는 티오에스테라제또는 에스. 로제오스포루스 BAC 핵산 분자 또는 그 일부에 의해 코딩되는 폴리펩티드 또는 그 일부의 돌연변이 단백질(뮤테인), 융합 단백질, 상동성 단백질 또는 대립유전자 변이체인 폴리펩티드를 제공하는 것이다. 돌연변이 티오에스테라제는 자연발생 티오에스테라제와 비교하여 동일하거나 상이한 효소 활성을 가질 수도 있고 천연 단백질의 아미노산 서열과 비교하여 적어도 하나의 아미노산 삽입, 중복, 결실, 재배열 또는 치환을 포함한다. 한 구체예에서, 뮤테인은 자연 발생 티오에스테라제와 비교하여 동일하거나 감소된 티오에스테라제 활성을 갖는다. 다른 구체예에서, 돌연변이 티오에스테라제는 자연 발생 티오에스테라제와 비교하여 증가된 티오에스테라제 활성을 갖는다. 바람직한 구체예에서, 답토마이신 생합성 유전자 클러스터의 티오에스테라제의 뮤테인은 티오에스테라제 활성을 변화시키기 위해 이용될 수 있다. 예를 들어 실시예 12와 13을 참고. 다른 구체예에서, 돌연변이 답토마이신 NRPS 또는 그 서브유닛은 자연 발생 답토마이신 NRPS와 동일하거나 상이한 아미노산 특이성, 티올화 활성, 축합 활성, 또는 존재한다면 에피머화 활성을 가질 수도 있다. 답토마이신 NRPS 뮤테인은 NRPS의 아미노산 인식, 결합, 에피머화 또는 다른 촉매적 특성을 바꾸기 위해 이용될 수도 있다. 예를 들어 실시예 12와 16 참고. 유사하게, 본 발명의 에스. 로제오스포루스 BAC 핵산 분자에 의해 코딩되는 폴리펩티드의 뮤테인은 유사한 생물학적 활성 또는 상이한 활성을 가질 수도 있으나, 바람직하게는 유사한 생물학적 활성을 갖는다.
본 발명의 뮤테인은 자연 발생 돌연변이 미생물로부터 또는 실험적으로 돌연변이 유발된 미생물로부터 분리하여 얻을 수도 있으며, 폴리펩티드를 화학적으로 조작하여 생산할 수도 있고, 또는 변화된 핵산 분자를 포함하는 숙주 세포로부터 생산될 수도 있다. 바람직한 구체예에서, 뮤테인은 바뀐 핵산 분자를 포함하는 숙주 세포로부터 생산된다. 뮤테인은 또한 합성 또는 반-합성 화학 기법을 이용하여 아미노산 잔기를 다른 아미노산 잔기로 바꿈으로써 화학적으로 생산될 수도 있다. 답토마이신 NRPS, 그 서브유닛 또는 티오에스테라제를 코딩하는 핵산 서열내로 또는 에스. 로제오스포루스 BAC 핵산 분자내로 돌연변이를 도입하고 이어서 그것을 재조합적으로 발현하여 폴리펩티드의 뮤테인을 생산할 수도 있다. 이들 돌연변이는 특정 코딩된 아미노산이 바뀌도록 표적화될 수도 있고, 또는 폴리펩티드내의 임의의 코딩된 아미노산이 바뀌도록 비표적화될 수도 있다. 임의의 아미노산 변화를 가진 뮤테인은 하기하는 바처럼, 티오에스테라제 활성, 아미노산 특이성, 티올화 활성, 에피머화 활성, 또는 축합 활성과 같은 특정 생물학적 활성에 대해 검사될 수있다. 뮤테인은 또한 공지의 방법을 이용하여, 예를 들어 옥시도리덕타제 활성, ABC 수송자 활성, 모노옥시게나제 활성, 또는 DNA 리가제 또는 헬리카제 활성에 대해 검사될 수 있다. 다수의 임의 돌연변이는 예를 들어 에러-프론 PCR, 셔플링, 올리고뉴클레오티드-지시된 돌연변이 유발, 어셈블리 PCR, 성적 PCR 돌연변이 유발, 생체내 돌연변이 유발, 카세트 돌연변이 유발, 순환적 앙상블 돌연변이 유발, 지수적 앙상블 돌연변이 유발 및 부위-특이적 돌연변이 유발에 의해 유전자내로 도입될 수 있다. 표적화된 또는 임의 아미노산 변화를 가진 뮤테인을 생성하는 방법은 공지되어 있다. 예를 들어 Sambrook et al., supra, Ausubel et al., supra, 미국 특허 제5,223,408호 및 전술한 참고문헌들을 참고할 수 있으며 이들은 모두 참고로 본원에 통합된다.
본 발명은 또한 답토마이신 NRPS, 그 서브유닛, 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제, 또는 본원에 개시된 에스. 로제오스포루스 BAC 핵산 분자에 의해 코딩되는 폴리펩티드에 상동성인 폴리펩티드를 제공한다. 한 구체예에서, 이 폴리펩티드는 DptD의 티오에스테라제 도메인에 또는 DptH에, 또는 dptD의 티오에스테라제 도메인 또는 dptH에 의해 코딩된 폴리펩티드에 상동성이다. 바람직한 구체예에서, 폴리펩티드는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖거나 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제에 상동성이다. 다른 구체예에서, 이 폴리펩티드는 DptA, DptBC, 또는 DptD에 상동성이거나 dptA, dptBC, 또는 dptD에 의해 코딩되는 폴리펩티드에 상동성이다. 바람직한 구체예에서, 이 폴리펩티드는 서열 번호 9, 11 또는 3의 아미노산 서열을 갖는 폴리펩티드에 상동성이다. 본 발명은 또한 본원에 개시된 에스. 로제오스포루스 BAC 클론, 예를 들어 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 바람직하게는 B12:03A05로부터의 핵산 분자에 의해 코딩되는 폴리펩티드에 상동성인 폴리펩티드를 제공한다. 바람직한 구체예에서, 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135에서 선택된 핵산 서열을 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드에 상동성인 폴리펩티드를 제공한다.
바람직한 구체예에서, 상동성 폴리펩티드는 본 발명의 폴리펩티드에 상당한 서열 동일성을 나타내는 것이다. 보다 바람직한 구체예에서, 상동성 폴리펩티드는 서열 번호 9, 11, 7 또는 8 또는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드와 적어도 50%, 60%, 70% 또는 80% 서열 동일성을 나타내는 것이다. 보다 더 바람직한 구체예에서, 상동성 폴리펩티드는 서열 번호 9, 11, 7, 또는 8의 아미노산 서열 또는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81,83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 포함하는 폴리펩티드에 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 나타내는 것이다.
상동성 단백질은 다른 종으로부터 유래된 자연 발생 단백질, 특히 다른 스트렙토마이세스 종에서 유래된 단백질, 또는 다른 스트렙토마이세스 로제오스포루스 균주에서 유래된 단백질일 수 있으며, 이때 상동성 단백질은 서열 번호 9, 11, 7 또는 8의 아미노산 서열 또는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열에 상당한 서열 동일성을 나타내는 아미노산 서열을 포함한다. 자연 발생 상동성 단백질은 다른 종 또는 균주로부터 직접 분리될 수도 있다. 다르게는, 자연 발생 상동성 단백질을 코딩하는 핵산 분자는 분리되어 상동성 단백질을 재조합적으로 발현하기 위해 이용될 수도 있다. 다른 구체예에서, 상동성 단백질은 핵산 분자를 임의로 돌연변이시키고 이어서 그 핵산 분자를 발현시켜 실험적으로 생성된 것일 수도 있다. 다른 구체예에서, 상동성 단백질은 코딩된 폴리펩티드의 아미노산을 바꾸기 위해 하나 이상의 코돈을 지시 돌연변이시켜 실험적으로 생성된 것일 수도 있다.
다른 구체예에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 또는 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 유전자의 대립유전자 변이체에 의해 코딩되는 폴리펩티드를 제공한다. 바람직한 구체예에서, 본 발명은 dptA, dptBC, dptD 또는 dtpH의 대립유전자 변이체에 의해 코딩되는 폴리펩티드를 제공한다. 보다 더 바람직한 구체예에서, 폴리펩티드는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 유전자의 대립유전자 변이체에 의해 코딩된다. 다른 보다 바람직한 구체예에서, 폴리펩티드는 서열 번호 10, 12, 3 또는 6의 핵산 서열을 갖는 유전자의 대립유전자 변이체에 의해 코딩된다. 대립유전자 변이체는 본원에서 개시된 티오에스테라제, 답토마이신 NRPS 또는 그 서브유닛과 동일하거나 상이한 생물학적 활성을 가질 수 있다. 바람직한 구체예에서, 대립유전자 변이체는 다른 종의 스트렙토마이세스에서 유래되며, 보다 바람직하게는 스트렙토마이세스 로제오스포루스의 균주로부터 유래된다. 다른 구체예에서, 본 발명은 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는B12:03A05 중 어느 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열의 대립유전자 변이체에 의해 코딩되는 폴리펩티드를 제공한다. 바람직한 구체예에서, 폴리펩티드는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 유전자의 대립유전자 변이체, 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 유전자의 대립유전자 변이체에 의해 코딩된다.
다른 구체예에서, 본 발명은 본 발명의 폴리펩티드의 유도체를 제공한다. 바람직한 구체예에서, 유도체는 아세틸화되거나, 카르복실화되거나, 인산화되거나, 글리코실화되거나 또는 유비퀴틴화되었다. 다른 바람직한 구체예에서, 유도체는125I,32P,35S, 및3H와 같은 방사성 동위원소로 표지되었다. 다른 바람직한 구체예에서, 유도체는 플루오로포어, 화학발광 제제, 효소 및 표지된 리간드를 위한 특이적 결합쌍 일원으로 작용할 수 있는 항리간드로 표지되었다. 바람직한 구체예에서, 폴리펩티드는 답토마이신의 생합성에 관련된 티오에스테라제이다. 보다 더 바람직한 구체예에서, 이 폴리펩티드는 DptD의 티오에스테라제 도메인을 포함하거나 또는 DptH의 아미노산 서열을 포함하거나, 또는 dptD의 티오에스테라제 코딩 도메인 또는 dptH에 의해 코딩되는 티오에스테라제이다. 다른 바람직한 구체예에서, 이 폴리펩티드는 답토마이신 NRPS 또는 그 서브유닛이며, 보다 바람직하게는 DptA, DptBC, 또는 DptD이거나, 보다 더 바람직하게는 dptA, dptBC, 또는 dptD에 의해 코딩되는 폴리펩티드이다. 다른 보다 바람직한 구체예에서, 폴리펩티드는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖거나, 또는 그것의 뮤테인, 대립유전자 변이체, 상동성 단백질 또는 단편이다. 바람직하게는, 티오에스테라제 유도체는 답토마이신 생합성에 관련된 티오에스테라제와 동일하거나 유사한 티오에스테라제 활성을 가지며, 보다 바람직하게는, 그 유도체는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖거나 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제와 동일하거나 유사한 티오에스테라제 활성을 갖는다. 다른 바람직한 구체예에서, 답토마이신 NRPS 또는 NRPS 서브유닛 유도체는 자연 발생 답토마이신 NRPS 또는 그 서브유닛과 동일하거나 유사한 활성을 가진다. 다른 구체예에서, 유도체는 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는, 바람직하게는 B12:03A05 중 하나로부터의 에스. 로제오스포루스 핵산 서열로부터의 핵산 분자에 의해 코딩되는 폴리펩티드로부터 유도된다. 바람직한 구체예에서, 유도체는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖는 폴리펩티드 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 유전자에 의해 코딩되는 폴리펩티드로부터 유래된다.
본 발명은 또한 비-펩티드 유사체를 제공한다. 바람직한 구체예에서, 비-펩티드 유사체는 답토마이신 합성에 관련된 티오에스테라제, 답토마이신 NRPS 또는 그 서브유닛 또는 에스. 로제오스포루스 BAC 클론으로부터의 핵산 분자에 의해 코딩되는 폴리펩티드와 구조적으로 유사하나, 하나 이상의 펩티드 결합이 --CH2NH--, --CH2S--, --CH2-CH2--, --CH=CH--(시스와 트랜스), --COCH2--, --CH(OH)CH2--, 및 --CH2SO--로 이루어진 군 중에서 선택되는 결합에 의해 치환된다. 다른 구체예에서, 비-펩티드 유사체는 티오에스테라제, 답토마이신 NRPS 또는 그 서브유닛의 아미노산 하나 이상이 동일한 유형의 D-아미노산으로 치환되어 보다 안정한 펩티드를 형성하는 것을 포함한다. 바람직하게는, 비-펩티드 유사체와 펩티드 유사체 둘다 답토마이신의 생합성에 관련된 자연 발생 폴리펩티드와 동일하거나 유사한 생물학적 활성을 가지며, 보다 바람직하게는 이 유사체는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드와 동일하거나 유사한 생물학적 활성을 갖는다. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는 B12:03A05 중 어느 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩되는 폴리펩티드의 유사체를 제공한다. 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖거나 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62,64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 유전자에 의해 코딩되는 폴리펩티드의 유사체를 제공한다.
융합 단백질
본 발명의 폴리펩티드는 유전적, 효소적 또는 화학적 또는 면역학적 마커(예, 에피토프 태그)와 같은 다른 분자들에 융합될 수도 있다. 융합 파트너는 특히, myc, 헤마글루티닌(HA), GST, 면역글로불린, β-갈락토시다제, 비오틴 trpE, 단백질 A, β-락타마제, α-아밀라제, 말토즈 결합 단백질, 알콜 디하이드로게나제, 폴리히스티딘(예를 들어, 폴리펩티드의 아미노 및/또는 카르복실 말단에서의 6 히스티딘), lacZ, 녹색 형광 단백질(GFP), 효모 α접합 인자, GAL4 전사 활성화 또는 DNA 결합 도메인, 루시퍼라제, 및 혈청 단백질(예, 오브알부민, 알부민 및 IgG의 불변 도메인)을 포함한다. 예를 들어, Godowski et al., 1988, 및 Ausubel et al., supra 참고. 융합 단백질은 또한 인자 XIII, 트립신, 펩신 또는 공지된 임의의 효소와 같은 효소에 의해 인지되는 부위와 같은 특이적 효소 절단 부위를 함유할 수도 있다. 융합 단백질은 일반적으로 전술한 대로 재조합 핵산 기법에 의해, 또는 본원에 참고로 통합되는 Merrifield, 1963에 개시된 것과 같은 기법을 이용하여 화학적으로 합성되거나, 또는 화학적 가교에 의해 생성될 수도 있다.
태그가 붙여진 융합 단백질은 용이한 국소화, 스크리닝 및 에피토프 또는 효소 태그를 통한 특이적 결합을 가능하게 한다. Ausubel, 1991, 16장 참고. 일부 태그는 대상 단백질이 M13과 같은 파아지미드의 표면에 나타나게 하며, 이는 원하는 단백질 표적에 결합할 수도 있는 패닝 제제(panning agent)로 유용하다. 융합 단백질의 다른 잇점은 에피토프 또는 효소 태그가 정제를 단순화시킬 수 있다는 것이다. 이들 융합 단백질은 종종 친화도 크로마토그래피에 의해 한 단계로 정제될 수도 있다. 예를 들어, His6태그된 단백질은 Ni 친화성 컬럼상에서 정제될 수 있고 GST 융합 단백질은 글루타치온 친화성 컬럼상에서 정제될 수 있다. 유사하게, IgG의 Fc 도메인을 포함하는 융합 단백질은 단백질 A 또는 단백질 G 컬럼상에서 정제될 수 있고, myc와 같은 에피토프 태그를 포함하는 융합 단백질은 항-c-myc 항체를 함유한 면역친화성 컬럼을 이용하여 정제될 수 있다. 정제 후 절단될 수 있는 효소 절단 부위에 의해, 본 발명의 핵산 분자에 의해 코딩된 단백질로부터 에피토프 태그를 분리시키는 것이 바람직하다.
융합 단백질의 두번째 잇점은 스크리닝 표적에 대한 친화성 결합을 통해 융합 단백질을 플레이트 또는 컬럼에 결합시키기 위해 에피토프 태그를 이용할 수 있다는 것이다.
따라서, 다른 태양에서, 본 발명은 답토마이신 생합성 유전자 클러스터로부터 유래한 티오에스테라제의 전부 또는 일부를 포함하는 융합 단백질을 제공하며, 그러한 융합 단백질을 코딩하는 핵산 분자를 제공한다. 다른 태양은 답토마이신 NRPS 또는 그 서브유닛의 전부 또는 일부를 포함하는 융합 단백질을 제공하며, 그러한 단백질을 코딩하는 핵산 분자를 제공한다. 에를 들어 실시예 11-16을 참고. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09또는B12:03A05, 바람직하게는 B12:03A05로부터의 핵산 분자에 의해 코딩되는 폴리펩티드의 전부 또는 일부를 포함하는 융합 단백질을 제공한다. 바람직한 구체예에서, 융합 단백질은 dptA, dptBC, dptD, 또는 dptH 중 하나 이상에 의해 코딩되는 폴리펩티드의 전부 또는 일부를 포함한다. 다른 바람직한 구체예에서, 융합 단백질은 dptA, dptBC, dptD, 또는 dptH 에 선택적으로 하이브리드화하는 핵산 분자에 의해 코딩되는 폴리펩티드를 포함한다. 보다 바람직한 구체예에서, 융합 단백질은 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 포함하거나, 또는 그 단편, 뮤테인, 상동성 단백질, 유도체 또는 유사체인 폴리펩티드를 포함한다. 보다 더 바람직한 구체예에서, 융합 단백질을 코딩하는 핵산 분자는 서열 번호 10, 12, 3 또는 6의 핵산 서열의 전부 또는 일부를 포함하거나, 또는 상기 핵산 서열을 포함하는 핵산 서열에 상동성이거나 선택적으로 하이브리드화하는 핵산 서열의 전부 또는 일부를 포함한다. 본 발명은 또한 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04, B12:20C09 또는B12:03A05, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩되는 폴리펩티드 서열을 포함하는 융합 단백질을 제공한다. 본 발명은 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136의 아미노산 서열을 갖는 폴리펩티드를 포함하거나, 또는 그 단편, 뮤테인, 상동성 단백질, 유도체 또는 유사체인 폴리펩티드를 포함하는 융합 단백질을 제공한다. 본 발명은 또한서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135에 의해 코딩되는 폴리펩티드를 포함하거나, 또는 상기 핵산 서열을 포함하는 핵산 분자에 선택적으로 하이브리드화하거나 상동성인 핵산 서열의 전부 또는 일부를 포함하는 융합 단백질을 제공한다.
본 발명의 한 태양에서, 답토마이신 생합성 유전자 클러스터로부터 유래한 티오에스테라제의 전부 또는 일부를 포함하는 융합 단백질은 비리보솜 단백질 합성에 관련된 폴리펩티드로부터의 다른 모듈(이종성 또는 하이브리드 모듈 포함)을 포함한다. 예를 들어, 실시예 12E, G 및 H와 실시예 13 참고. 다른 바람직한 구체예에서, 융합 단백질은 티오에스테라제를 코딩하는 아미노산 서열 하나 이상을 포함하며, 이때 티오에스테라제는 서로 동일하거나 상이할 수도 있다. 예를 들어, 실시예 11E-G(답토마이신 티오에스테라제 유전자의 중복), 실시예 12(변형된 NRPS 티오에스테라제 융합 단백질 생성), 및 실시예 13(유리 티오에스테라제 융합 단백질 생성)을 참고.
다른 구체예에서, 본 발명은 둘 이상의 다른 티오에스테라제로부터의 아미노산 서열의 하이브리드인 융합 단백질과 그러한 융합 단백질을 코딩하는 핵산 분자를 제공한다. 하이브리드 융합 단백질은 상이한 티오에스테라제들의 둘, 셋, 또는 그 이상의 부분으로 구성될 수 있다. 하이브리드 티오에스테라제는 상이하거나 동일한 특이성을 가질 수 있다.
티오에스테라제와 답토마이신 NRPS 활성을 분석하는 방법
티오에스테라제의 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질이 야생형 티오에스테라제 폴리펩티드와 동일하거나, 증가되거나 감소된 생물학적 활성을 갖는지를 결정하는 많은 방법이 당업계에 공지되어 있다. 한 구체예에서, 적절한 티오에스테르 결합의 절단 및/또는 상응하는 생성물의 방출을 모니터하는 티오에스테라제 분석이 생체외에서 수행된다. 광- 또는 방사성-표지된 기질을 이용하는 방법을 포함한 공지된 많은 티오에스테라제 분석이 이용될 수 있다.
바람직한 구체예에서, NRPS에 의한 펩티드 합성과 관련된 티오에스테라제 활성은 세포 분석을 이용하여 결정된다. 예를 들어, 단편, 뮤테인, 상동성 단백질 또는 융합 단백질을 코딩하는 핵산 분자를, dptD의 티오에스테라제 도메인중 하나 또는 둘다 또는 dptH가 없는 답토마이신 생합성 유전자 클러스터를 포함하는 박테리아 세포내로 도입할 수 있다. 다르게는, 핵산 분자를 다른 화합물(예, 다른 리포펩티드)을 생산하는 다른 생합성 유전자 클러스터를 포함하는 박테리아 세포내로 도입할 수 있다. 바람직한 구체예에서, 박테리아 세포는 에스. 리비단스일 수 있다. 핵산 분자는 접합, 형질전환, 전기천공, 원형질체 융합 등을 포함하는 공지 방법에 의해 박테리아 세포내로 도입될 수 있다. 이 핵산 분자를 포함하는 박테리아 세포는 그 핵산 분자에 의해 코딩되는 폴리펩티드가 발현되는 조건하에서 배양된다. 배양 후, HPLC 및/또는 LC/MS에 의해 박테리아 세포를 분석하여 박테리아 세포가 원하는 리포펩티드를 생산하는 지를 결정할 수 있다. 예를 들어 하기의 실시예 7-9에 개시된 답토마이신 발현 방법 참고. 티오에스테라제 활성이 항-세포 성장 특성을갖는 펩티드(예, 항생제, 항진균제, 항바이러스제 또는 항유사분열 제제)의 합성과 관련될 때, 공지된 원하는 분석법을 이용할 수 있다.
다르게는, 티오에스테라제의 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질을 dptD의 티오에스테라제 도메인중 하나 또는 둘다 또는 dptH가 없는 답토마이신 생합성 유전자 클러스터를 포함하는 세포, 특히 박테리아 세포내로 도입할 수 있다. 배양 후, 실시예 7에 개시된 대로, HPLC 및/또는 LC/MS에 의해 박테리아 세포를 분석하여 박테리아 세포가 원하는 리포펩티드를 생산하는 지를 결정할 수 있다. 다른 화합물(예, 다른 리포펩티드)을 생산하는 다른 생합성 유전자 클러스터를 포함하는 세포로 동일한 방법을 이용할 수 있다.
바람직한 구체예에서, 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질은 GXSXG 티오에스테라제 모티프를 포함하는 아미노산 서열을 포함한다(실시예 3 참고). 보다 바람직한 구체예에서, 단편, 뮤테인, 상동성 단백질, 유사체, 또는 유도체는 각각 서열 번호 7과 8에서 유래하는 티오에스테라제 모티프 GWSFG 또는 GTSLG를 포함하는 아미노산 서열을 포함한다.
유사한 공지의 방법을 이용하여, 답토마이신 NRPS 또는 그 서브유닛의 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는 융합 단백질이 야생형 NRPS 또는 그 서브유닛과 동일하거나 상이한 생물학적 활성을 갖는 지를 결정할 수 있다.
항체
본 발명의 유전자에 의해 코딩되는 폴리펩티드는 다양한 공지 기법을 이용하여 본 발명의 폴리펩티드와 그 단편, 뮤테인, 상동성 단백질, 유사체, 유도체 또는융합 단백질에 결합하는 폴리클로날 또는 모노클로날 항체를 유도하는 데 이용될 수 있다. 본 발명의 폴리펩티드에 대해 형성된 항체는 본 발명의 폴리펩티드와 면역학적으로 반응하는 면역글로불린 분자 또는 그 일부이다.
본 발명의 폴리펩티드에 대해 형성된 항체는 포유류 숙주의 면역화에 의해 생성될 수 있다. 그러한 항체는 폴리클로날 또는 모노클로날일 수 있다. 바람직하게는 그들은 모노클로날이다. 폴리클로날 및 모노클로날 항체를 생성하는 방법은 공지이다. 그러한 방법을 살펴보기 위해서는 본원에 참고로 통합되는 Harlow and Lane, Antibodies:A Laboratory Manual (1988) and Ausubel et al., supra를 참고. 본 발명의 폴리펩티드와의 면역반응성의 결정은 면역블롯 분석과 ELISA를 포함한 공지 방법에 의해 가능하다.
10-8M-1또는 바람직하게는 10-9내지 10-10M-1또는 그 이상의 친화성을 갖는 모노클로날 항체는 일반적으로 예를 들어 Harlow and Lane, 1988에 개시된 표준 과정에 의해 만들어진다. 요약하면, 적절한 동물을 선발하여 원하는 면역화 프로토콜을 따른다. 적당한 시간 후, 그러한 동물의 비장을 잘라내어 개별 비장 세포를 적절한 선별 조건하에서 대개 불멸화된 골수종 세포에 융합시킨다. 그후, 세포를 클론들을 분리시키고, 원하는 항원 영역에 대해 특이적인 적절한 항체를 생성하는 지 여부에 대해 각 클론의 상등액을 시험한다.
다른 적합한 기법은 림프구를 항원성 폴리펩티드에 생체외 노출시키는 것에 관련되거나, 또는 다르게는 파아지 또는 유사한 벡터내의 항체의 라이브러리를 선별하는 것에 관련된다. Huse et al., 1989 참고. 본 발명의 폴리펩티드와 항체는변형되거나 변형되지 않고 이용될 수 있다. 빈번하게, 폴리펩티드와 항체는 검출가능한 시그날을 제공하는 물질을 공유적으로 또는 비공유적으로 연결시킴으로써 표지될 것이다. 광범위한 표지와 접합 기법이 공지되어 있으며 과학 문헌 및 특허 문헌에 보고되어 있다. 적절한 표지는 라디오뉴클라이드, 효소, 기질, 보조인자, 억제제, 형광제제, 화학발광 제제, 자기 입자 등을 포함한다. 그러한 표지의 이용을 개시하는 특허는 미국 특허 제3,817,837호, 3,850,752호, 3,939,350호, 3,996,345호, 4,277,437호, 4,275,149호 및 4,366,241호를 포함하며 이들은 참고로 본원에 통합된다. 또한, 재조합 면역글로불린이 생성될 수도 있다(참고로 본원에 통합되는 미국 특허 제4,816,567호 참고).
본 발명의 항체는 또한 다른 종들(예, 마우스와 사람)로부터의 면역글로불린 서열로부터 또는 동종으로부터의 면역글로불린 경쇄와 중쇄 서열의 부분으로부터 형성되는 하이브리드 분자일 수 있다. 항체는 단일쇄 항체 또는 인간화 항체일 수 있다. 하이브리드 하이브리도마의 생산, 디설파이드 교환, 화학적 가교, 두 개의 모노클로날 항체간의 펩티드 링커 부가, 특정 세포주내로 두 세트의 면역글로불린 중쇄와 경쇄의 도입 등을 포함하는 공지의 많은 기법 중 임의의 것에 의해 제조된 2 기능성 항체와 같은, 다중 결합 특이성을 갖는 분자일 수 있다.
본 발명의 항체는 또한 인간 모노클로날 항체일 수 있으며, 예를 들어 불멸화된 인간 세포에 의해 생산되거나, SCID-hu 마우스 또는 "인간" 항체를 생산할 수 있는 다른 인간을 제외한 동물에 의해 생산되거나, 클론된 인간 면역글로불린 유전자의 발현에 의해 생산된 항체들일 수 있다. 인간화된 항체의 제조는 참고로 본원에 통합되는 미국 특허 제5,777,085호와 5,789,554호에 개시된다.
요약하면, 본 발명의 개시를 보는 당업자는 주어진 항체 분자의 안정성 또는 반감기, 면역원성, 독성, 친화성 또는 수율을 증가시키거나 감소시키는 방법을 포함한, 본 발명의 항체의 생물학적 특성을 변화시키기 위해, 또는 특정 분야에 보다 적합하도록 임의의 다른 방법으로 변화시키기 위해 이용될 수 있는 많은 다양한 방법을 갖는다.
바람직한 구체예에서, 본 발명의 항체는 답토마이신 합성에 관련된 티오에스테라제 또는 답토마이신 NRPS 또는 그 서브유닛에 결합한다. 보다 바람직한 구체예에서, 이 항체는 dptA, dptBC, dptD, 또는 dptH에 의해 코딩되는 폴리펩티드 또는 그 단편에 결합한다. 다른 바람직한 구체예에서, 항체는 dptA, dptBC, dptD, 또는 dptH 에 선택적으로 하이브리드화하는 핵산 분자에 의해 코딩되는 폴리펩티드에 결합한다. 보다 바람직한 구체예에서, 항체는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드에 결합하거나, 또는 그 단편, 뮤테인, 상동성 단백질, 유도체, 유사체 또는 융합 단백질인 폴리펩티드에 결합한다. 보다 더 바람직한 구체예에서, 항체는 서열 번호 10, 12, 3, 또는 6의 핵산 서열의 전부 또는 일부를 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드에 결합한다. 다른 구체예에서, 항체는 서열 번호 10, 12, 3, 또는 6의 핵산 서열을 포함하는 핵산 분자에 상동성이거나 선택적으로 하이브리드화하는 핵산 서열의 전부 또는 일부를 포함하는 핵산 분자에 의해 코딩되는 폴리펩티드에 결합한다.
본 발명은 BAC 클론 B12:01G05, B12:06A12, B12:12F06, B12:18H04,B12:20C09 또는 B12:03A05 중 어느 하나, 바람직하게는 B12:03A05로부터의 에스. 로제오스포루스 핵산 서열에 의해 코딩되는 폴리펩티드에 선택적으로 결합하는 항체를 제공한다. 폴리펩티드는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136에서 선택되는 아미노산 서열을 포함하거나 또는 서열 번호 20, 22, 24, 26,28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열에 의해 코딩된다. 바람직하게는, 항체는 서열 번호 23, 25, 27, 29, 33, 35, 37, 91, 93, 97, 99, 110 또는 112로부터 선택되거나 서열 번호 61, 65, 69, 79, 81, 83, 85, 87, 95 및 101로부터 선택되는 아미노산 서열을 포함하는 폴리펩티드에 선택적으로 결합한다. 본 발명은 또한 그 단편, 뮤테인, 상동성 단백질, 유도체, 유사체 또는 융합 단백질에 선택적으로 결합하는 항체를 제공한다.
컴퓨터 판독 수단
본 발명의 추가 태양은 본 발명의 핵산과 아미노산 서열을 저장하기 위한 컴퓨터 판독 수단이다. 바람직한 구체예에서, 본 발명은 본원에서 개시된 핵산과 아미노산 서열 모두를 완전한 서열 세트로서 또는 임의의 조합으로 저장하기 위한 컴퓨터 판독 수단을 제공한다. 컴퓨터 판독 수단의 기록은 판독과 전시, 및 어떤 기준을 만족하는 데이터에 대한 질의시 데이터의 국소화, 서열의 비교, 기준을 만족하는 서열의 배열 또는 순서화 등을 허용하는 프로그램의 적용을 위한 컴퓨터 시스템과의 인터페이스를 위해 접근될 수 있다.
본 발명의 핵산과 아미노산 서열은 특히 서열 분석 알고리즘에서뿐만 아니라 서치 분석에 유용한 데이터베이스의 성분으로 유용하다. 본원에서 사용될 때, 용어 "본 발명의 핵산 서열"과 "본 발명의 아미노산 서열"은 컴퓨터 판독 형태로 환원되거나 저장될 수 있는 본 발명의 폴리뉴클레오티드 또는 폴리펩티드의 임의의 검출가능한 화학적 또는 물리적 특성을 의미한다. 이들은 제한없이 크로마토그래피 스캔 데이터 또는 피크 데이터, 사진 데이터 또는 그로부터의 스캔 데이터, 및 질량 스펙트럼 데이터를 포함한다.
본 발명은 본 발명의 서열을 저장하고 있는 컴퓨터 판독 매체를 제공한다. 컴퓨터 판독 매체는 하기 중 하나 이상을 포함할 수도 있다: 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열; 본 발명의 아미노산 서열을 포함하는 아미노산 서열; 적어도 하나의 서열이 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열 세트; 적어도 하나의 서열이 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열 세트; 본 발명의 핵산 서열 하나 이상의 서열을 포함하는 핵산 서열을 나타내는 데이터 세트; 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 나타내는 데이터 세트; 적어도 하나의 서열이 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열 세트; 적어도 하나의 서열이 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열 세트; 본 발명의 핵산 서열의 서열을 포함하는 핵산 서열을 나타내는 데이터 세트; 본 발명의 아미노산 서열의 서열을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 나타내는 데이터 세트. 컴퓨터 판독 매체는 예를 들어, 시판되는 플로피 디스크, 테잎, 하드 드라이버, 컴팩트 디스크 및 비디오 디스크를 포함한, 정보, 또는 데이터를 저장하기 위해 이용되는 물질의 임의의 조성일 수 있다.
또한 본 발명은 특성 서열의 분석, 특히 유전자 서열의 분석을 위한 방법을 제공한다. 바람직한 서열 분석 방법은 예를 들어, 서열 상동성 분석(예, 동일성 및 유사성 분석), RNA 구조 분석, 서열 조립, 분기학적 분석, 서열 모티프 분석, 오픈 리딩 프레임 결정, 핵산 염기 콜링(calling), 및 서열결정 크로마토그램 피크 분석의 방법들을 포함한다.
컴퓨터에 기초한 방법이 핵산 상동성 확인을 수행하기 위해 제공된다. 이 방법은 컴퓨터 판독 매체중의 본 발명의 핵산 서열을 포함하는 핵산 서열을 제공하는 단계; 및 상기 핵산 서열을 적어도 하나의 핵산 또는 아미노산 서열과 비교하여 상동성을 확인하는 단계를 포함한다.
컴퓨터에 기초한 방법은 또한 아미노산 상동성 확인을 수행하기 위해 제공되며, 상기 방법은 컴퓨터 판독 매체중의 본 발명의 아미노산 서열을 포함하는 아미노산 서열을 제공하는 단계; 및 상기 아미노산 서열을 적어도 하나의 핵산 또는 아미노산 서열과 비교하여 상동성을 확인하는 단계를 포함한다.
컴퓨터에 기초한 방법은 추가로 겹치는 핵산 서열을 하나의 핵산 서열로 조립하기 위해 제공되며, 이 방법은 컴퓨터 판독 매체중의 본 발명의 핵산 서열을 포함하는 제1 핵산 서열을 제공하는 단계; 및 제1 핵산 서열과 제2 핵산 서열간의 적어도 하나의 겹치는 영역에 대해 스크리닝하는 단계를 포함한다.
핵산 분자를 프로브와 프라이머로서 이용하는 방법
한 구체예에서, 본 발명의 핵산 분자는 이 핵산 분자에 선택적으로 하이브리드화하는 핵산 분자를 동정하거나 증폭시키기 위한 프로브 또는 프라이머로 이용될 수 있다. 바람직한 구체예에서, 프로브 또는 프라이머는 답토마이신 NRPS, 그 서브유닛 또는 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제를 코딩하는 핵산 분자로부터 유래된다. 이 프로브 또는 프라이머는 또한 답토마이신 NRPS, 또는 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제 유전자로부터 유래된 발현 조절 서열로부터 유래될 수도 있다. 바람직한 구체예에서, 프로브 또는 프라이머는 dptA, dptBC, dptD, 또는 dptH로부터 유래된다. 보다 바람직한 구체예에서, 프로브 또는 프라이머는 서열 번호 9, 11, 7 또는 8의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산 분자로부터 유래된다. 다른 바람직한 구체예에서, 프로브 또는 프라이머는 서열 번호 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 또는 135의 핵산 서열을 갖는 핵산 분자로부터 유래된다. 다른 구체예에서, 프로브 또는 프라이머는 서열 번호 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93,95, 97, 99, 101, 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 또는 136을 코딩하는 핵산 서열로부터 유래된다.
일반적으로, 프로브 또는 프라이머는 적어도 10 뉴클레오티드 길이이며, 보다 바람직하게는 적어도 12, 보다 바람직하게는 적어도 14 그리고 보다 더 바람직하게는 적어도 16 뉴클레오티드 길이이다. 보다 더 바람직한 구체예에서, 프로브 또는 프라이머는 적어도 18 뉴클레오티드 길이이고, 보다 바람직하게는 적어도 20, 보다 바람직하게는 적어도 22 뉴클레오티드 길이이다. 프라이머와 프로브는 또한 더 긴 길이로 이용될 수도 있다. 예를 들어, 프로브 또는 프라이머는 25 뉴클레오티드 길이이거나, 또는 30, 40, 또는 50 뉴클레오티드 길이일 수 있다. 올리고뉴클레오티드 프로브를 이용하여 핵산 하이브리드화를 수행하는 방법은 공지되어 있다. 예를 들어, Sambrook et al., supra 참고. 예를 들어, 짧은 프로브의 방사성표지화를 개시하는 11장과 페이지 11.31-11.32와 11.40-11.44, 및 프로브 하이브리드화를 위한 특이적 조건(페이지 11.50-11.51)을 포함한 올리고뉴클레오티드 프로브를 위한 하이브리드화 조건을 개시한 페이지 11.45-11.53을 참고. 프라이머를 이용하여 PCR을 수행하는 방법은 공지되어 있다. 예를 들어, Sambrook et al., supra 및 Ausubel et al., supra 참고. PCR 방법은 본 발명의 핵산 분자의 대립유전자 변이체와 단편을 동정하고/하거나 분리하기 위해 이용될 수 있으며; PCR은 또한 프라이머에 하이브리드하고 증폭될 수 있는 핵산 분자를 동정하고/하거나 분리하기 위해 이용될 수 있으며, 그리고 본 발명의 상동성 단백질, 유사체, 융합 단백질 또는 뮤테인을 코딩하는 핵산 분자를 분리하기 위해 이용될 수 있다.
화합물의 생합성을 위해 티오에스테라제를 이용하는 방법- Dpt 유전자들의 조작
본 발명의 답토마이신 생합성 유전자 클러스터의 유전자들은 다양한 방식으로 조작되어 새로운 생합성 펩티드 생성물을 생산하거나 이 유전자 클러스터로부터 발현된 하나 이상의 유전자의 조절을 변화시킬 수 있다. 예를 들어 도 1 참고.
티오에스테라제를 코딩하는 유전자의 파괴
한 태양에서, 본 발명은 박테리아 세포에서 NRPS 또는 PKS 경로에 관련되는 티오에스테라제를 코딩하는 유전자를 파괴하거나 결실시키는 방법을 제공한다. 바람직하게는, 이 방법은 답토마이신 생합성 유전자 클러스터의 티오에스테라제를 코딩하는 유전자 또는 그 일부를 파괴하거나 결실시키는 단계를 포함한다. 통합 티오에스테라제를 코딩하는 유전자의 파괴 또는 결실은 최종 생성물로 가는 중간체인 화합물의 생성을 야기할 것이다. 한 태양에서, 통합 티오에스테라제를 코딩하는 유전자 또는 그 일부가 파괴되거나 결실될 수 있다. 바람직한 구체예에서, 에스. 로제오스포루스의 답토마이신 생합성 유전자 클러스터의 통합 티오에스테라제를 코딩하는 유전자의 파괴 또는 결실은 선형의 리포펩티드 화합물을 생성할 것이다. 만일 NRPS로부터 그것의 방출이 숙주 세포내의 다른 내인성 또는 외인성 티오에스테라제 활성에 의해 촉매된다면, 이 선형 리포펩티드 화합물은 직접 이용될 것이다. 만일 내인성 티오에스테라제 활성에 의해 NRPS로부터 방출되지 않는다면, 그러한 선형 리포펩티드 화합물은 가능하지만 아직 확인되지 않은 티오에스테라제 폴리펩티드를 시험하기 위해 또는 티오에스테라제 융합, 단편, 뮤테인, 유도체, 유사체 또는 상동체 폴리펩티드를 활성에 대해 시험하기 위해 유용한 중간체일 것이다. 선형 리포펩티드 화합물은 다르게는 신규의 리포펩티드의 생산을 위한 중간체로 이용될 수도 있다.
다른 태양에서, 유리 티오에스테라제를 코딩하는 유전자는 NRPS를 포함하는 박테리아 세포에서 파괴되거나 결실될 수 있다. 유리 티오에스테라제는 NRPS에서 생산된 펩티드 화합물의 교정에 관련되는 것으로 생각되므로, 유리 티오에스테라제를 코딩하는 유전자의 파괴 또는 결실은 유리 티오에스테라제의 존재하에서 생산된 화합물과 비교하여 돌연변이를 갖는 화합물의 생산을 야기할 것이다. 이들 돌연변이된 화합물들은 신규의 리포펩티드를 생성하기 위해 이용될 수 있다. 예를 들어 실시예 13 참고.
바람직한 구체예에서, 이 방법은 dptD의 티오에스테라제 코딩 부분을 파괴하거나 결실시키거나 답토마이신 생합성 유전자 클러스터의 dptH를 결실시키거나 파괴하는 단계를 포함한다. 보다 더 바람직한 구체예에서, 이 방법은 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열을 갖거나 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제를 코딩하는 유전자를 파괴하거나 결실시키는 단계를 포함한다. 본 발명은 또한 티오에스테라제를 코딩하는 유전자를 파괴하거나 결실시키는 방법을 포함하며, 이때 이 유전자는 서열 번호 7의 티오에스테라제 도메인의 아미노산 서열 또는 서열 번호 8의 아미노산 서열을 갖는 티오에스테라제를 코딩하는 유전자와 상동성이거나 선택적으로 하이브리드화한다. 다른 바람직한 구체예에서, 티오에스테라제의 파괴 또는 결실은 하기하는 바와 같은 비리보솜 펩티드 합성에관련된 유전자 클러스터를 변화시키는 방법과 결합될 수도 있다.
티오에스테라제를 코딩하는 유전자의 파괴는 본 명세서의 개시를 따라 당업자에게 알려진 임의의 방법에 의해 이루어질 수 있다. 바람직한 구체예에서, 티오에스테라제를 코딩하는 유전자의 파괴는 예를 들어 각각 본원에 참고로 통합되는 Hosted and Baltz, J.Bacteriol., 179, pp.180-186(1997); Butler et al., Chem.Biol.,6, pp.287-292(1999); 및 Xue et al., Proc.Natl.Acad.Sci. USA, 95, pp.12111-12116(1998)에 개시된 방법을 이용하여 표적화된 유전자 파괴에 의해 이루어질 수 있다. 예를 들어 실시예 11 참고.
고리화 부위의 변화 및 티오에스테라제를 이용하여 생산된 고리형 펩티드
NRPS에 관련된 자연 발생 폴리펩티드에서, 통합 티오에스테라제는 폴리펩티드의 카르복시 말단에 위치하여, 여기서 생성물 고리화에 관여한다. 한 태양에서, 본 발명은 티오에스테라제를 코딩하는 모듈의 위치를 바꿈으로써 고리형 펩티드의 고리화 부위(또는 선형 펩티드의 방출)를 바꾸는 방법을 제공한다. 한 구체예에서, 고리화 부위는 티오에스테라제를 코딩하는 모듈을, NRPS에 관련된 폴리펩티드를 코딩하는 유전자내로, 티오에스테라제 모듈이 자연적으로 발생하는 영역의 상부인 영역에 삽입함으로써 변화될 수 있다. 이 구체예에서, 생산되는 고리형 펩티드는 자연 발생 고리형 펩티드보다 작을 것이다. 예를 들어 실시예 12 참고.
바람직한 구체예에서, 모듈은 답토마이신 생합성 유전자 클러스터로부터의 통합 티오에스테라제를 코딩한다. 보다 바람직한 구체예에서, 모듈은 DptD의 티오에스테라제 도메인을 포함한다. 보다 더 바람직한 구체예에서, 모듈은 서열 번호 7의 아미노산 서열의 전부 또는 일부, 바람직하게는 티오에스테라제 도메인을 포함하는 서열 번호 7의 부분을 갖는 폴리펩티드를 코딩한다. 다른 바람직한 구체예에서, 모듈은 서열 번호 7의 티오에스테라제 도메인의 전부 또는 일부를 코딩하는 핵산 분자 또는 서열 번호 3의 핵산 서열 전부 또는 일부를 포함하는 티오에스테라제 도메인을 코딩하는 핵산 분자에 선택적으로 하이브리드화하거나 상동성인 핵산 모듈을 포함한다.
다르게는, 펩티드에 아미노산을 첨가하는 데(또는 그렇지 않으면 펩티드 내의 아미노산을 변형시키는 데) 관여하는 다른 모듈들이 티오에스테라제를 코딩하는 모듈의 상부에 도입될 수 있다. 예를 들어, 실시예 12 참고. 그러한 모듈은 적어도 아데닐화 도메인과 티올화 또는 아실 운반자 도메인을 포함하는 최소 모듈을 포함한다. 바람직한 구체예에서, 삽입된 모듈은 또한 축합 도메인을 포함할 것이다. M 도메인, E 도메인 및/또는 Cy 도메인을 포함한 부가의 도메인이 또한 티오에스테라제 모듈의 상부에 삽입될 수도 있다. 티오에스테라제 도메인의 상부에 삽입될 모듈의 유형은 원하는 아미노산 잔기의 유형에 의존할 것이다. 특정 아미노산을 첨가하고/하거나 변형시킬 모듈을 삽입하는 방법은 공지되어 있다. 예를 들어, 본원에 참고로 통합되는 Mootz et al., Curr.Opin.Biotechnol., 10, pp.341-348(1999) 참고. 티오에스테라제의 상부에 하나 이상의 모듈을 참가하면 더 크고 자연 발생 고리형 펩티드와 다른 아미노산 잔기를 함유할 수 있는 고리형 펩티드를 합성할 수 있는, NRPS에 관련된 폴리펩티드를 생산할 것이다.
티오에스테라제의 생체내 용도
본 발명의 유전자의 다른 용도는 NRPS를 발현하는 세포에서 생성물의 수율을 개선하는 것이다. 예를 들어, 실시예 11 참고. 수율 증가를 위해 이용될 수 있는 핵산 분자는 긍정적 조절 인자, 아실 CoA 티오에스테라제, ABC 수송자, NovABC-관련 폴리펩티드, DptA, DptBC, DptD, DptD와 DptH를 포함한 답토마이신 내성 및 답토마이신 티오에스테라제를 코딩하는 폴리펩티드를 코딩하는 핵산 분자를 포함한다. 완전한 답토마이신 생합성 유전자 클러스터, 답토마이신 NRPS 또는 그것의 임의 도메인 또는 서브유닛은 또한 복사될 수도 있다. 바람직한 구체예에서, 유리 및/또는 답토마이신 생합성 유전자 클러스터로부터의 통합 티오에스테라제는 세포내로 도입되어 답토마이신의 생산을 개선한다. 다른 바람직한 구체예에서, 티오에스테라제의 부가의 카피들이 전술한 대로 변화된 NRPS 폴리펩티드를 포함하는 세포내로 도입될 수도 있다. 이론에 얽매임없이, 유리 및/또는 통합 티오에스테라제의 부가의 카피들은, 박테리아 세포의 교정 능력(예, 유리 티오에스테라제) 또는 고리화 및/또는 펩티드 방출 능력(예, 통합 티오에스테라제)을 증가시켜 펩티드의 NRPS 프로세싱을 개선시킬 수도 있다.
바람직한 구체예에서, 티오에스테라제를 코딩하는 핵산 분자의 부가 카피가 세포내로 도입될 수도 있다. 예를 들어, 실시예 11 참고. 티오에스테라제의 도입은 임의의 공지 방법에 의해 이루어질 수 있다. 보다 바람직한 구체예에서, 이 유전자의 부가의 카피는 강한 발현 조절 서열의 조절성 조절하에 있다. 이들 서열은 상기한 대로 다른 티오에스테라제 유전자로부터 유래될 수도 있고 또는 이종성 서열로부터 유래할 수도 있다. 또한, 티오에스테라제를 코딩하는 핵산 분자는 세포내로도입되어 별도의 폴리펩티드로 발현될 수도 있다. 이것은 유리 티오에스테라제에게 특히 유용하다. 다르게는, 티오에스테라제를 코딩하는 핵산 분자는 세포내로 도입되어 다수-도메인 단백질의 일부를 형성할 수도 있다. 이는 NRPS를 형성하거나 NRPS와 상호작용하는 폴리펩티드내로의 상동성 재조합에 의해 이루어질 수 있다. 이는 필요한 것은 아니지만, 통합 티오에스테라제에 특히 유용하다.
다른 구체예에서, 유리 및/또는 통합 티오에스테라제의 카피들은 답토마이신 생합성 유전자 클러스터 외의 NRPS 복합체를 발현하는 세포내로 도입될 수도 있다. 예를 들어 실시예 13 참고. 한 바람직한 구체예에서, 이 복합체는 NRPS 복합체이다. 다른 바람직한 구체예에서, 이 복합체는 PKS 복합체 또는 혼합된 PKS/NRPS 복합체이다. 많은 PKS 및 NPRS 복합체가 공지되어 있다. 예를 들어, 반코마이신, 블레오마이신, A54145, CDA, 암포마이신, 에치노칸딘, 사이클로스포린, 에리스로마이신, 티로신, 모넨신, 아베르멕틴, 페니실린, 세팔로스포린, 프리스티나마이신, 에리스로마이신, 라파마이신, 스피노신, 디뎀닌, 디스코바하미안, 및 에포티론을 생성하는 복합체가 있다. 전술한 대로, 유리 및/또는 통합 티오에스테라제의 부가는 박테리아 세포의 교정 능력(예, 유리 티오에스테라제) 또는 고리화 및/또는 펩티드 방출 능력(예, 통합 티오에스테라제)을 증가시켜 펩티드의 NRPS 또는 PKS 프로세싱을 개선시킬 수도 있다. 유리 및/또는 통합 티오에스테라제의 부가는 전술한 방법에 의해 이루어질 수 있다.
바람직한 구체예에서, 세포 내로 도입되는 티오에스테라제를 코딩하는 핵산 분자는 답토마이신 생합성 유전자 클러스터로부터의 티오에스테라제이다. 바람직한구체예에서, 이 유전자는 dptD의 티오에스테라제-코딩 도메인이거나 또는 dptH이다. 보다 바람직하게는, 이 핵산 분자는 서열 번호 7 또는 8의 티오에스테라제 도메인의 아미노산 서열을 갖는 티오에스테라제 또는 티오에스테라제 활성을 갖는 그들의 상동성 단백질, 융합 단백질, 뮤테인, 유도체, 유사체 또는 단편을 코딩한다.
NPRS에 의해 신규의 화합물을 생산하기 위해 유전자 클러스터를 바꾸는 방법
NRPS 폴리펩티드 모듈과 도메인의 변화
다른 태양에서, 본 발명은 NRPS 내의 모듈의 수 또는 위치를 바꾸는 방법을 제공한다. 한 구체예에서, 하나 이상의 모듈을 NRPS로부터 제거할 수 있다. 이들 결실은 NRPS에 의해 자연 발생 펩티드보다 짧은 펩티드 생성물이 합성되도록 할 것이다. 다른 구체예에서, 하나 이상의 도메인을 NRPS로부터 제거할 수 있다. 이 경우, NRPS에 의해 생성되는 생성물은 예를 들어 에피머화 및/또는 메틸화 도메인이 결실되면 결실없이 생성된 펩티드와 비교하여 화학적 변화를 가질 것이다.
다른 구체예에서, 하나 이상의 모듈 또는 도메인이 NRPS에 첨가될 수 있다. 이 경우, NRPS에 의해 합성되는 펩티드는 자연 발생 펩티드보다 길거나 또는 부가의 화학적 변화를 가질 것이다. 예를 들어, 만일 에피머화 도메인 또는 메틸화 도메인이 부가되면, 생성되는 펩티드는 여분의 D-아미노산을 함유하거나 또는 메틸화된 아미노산을 함유할 것이다. 또 다른 구체예에서, 하나 이상의 모듈이 돌연변이 될 수 있으며, 예를 들어 아데닐화 도메인이 돌연변이되어 자연 발생 아데닐화 도메인과는 다른 아미노산 특이성을 가질 수 있다. 어느 아미노산이 모듈 1-13의 각각의 아데닐화 도메인내에 결합할 것인지를 결정하는, 답토마이신 NRPS를 위한 아미노산 포켓 코드는 실시예 5에 개시된다. 표 2 참고. 아미노산 코드를 가지고, 당업자는 다양한 공지 기법에 의해 돌연변이를 수행하여 한 모듈의 코드를 다른 코드로 바꾸어 바뀐 NRPS에 의해 합성된 생성 펩티드의 최종 아미노산 조성 및/또는 서열을 바꿀 것이다. 예를 들어, 실시예 12A 참고. 다른 구체예에서, 하나 이상의 서브유닛을 NRPS에 첨가하거나 결실시킬 수 있다.
또 다른 구체예에서, 하나 이상의 도메인, 모듈, 또는 서브유닛을 다른 도메인, 모듈, 또는 서브유닛으로 치환하여 보충성에 의한 신규 펩티드를 생산할 수도 있다. 이 경우, 바뀐 NRPS에 의해 생산되는 펩티드는 예를 들어 자연 발생 펩티드와 비교하여 하나 이상의 다른 아미노산을 가질 것이다. 또한, 도메인, 모듈 또는 서브유닛의 삽입, 결실, 치환 및 돌연변이의 다른 조합들을 이용하여 관심 펩티드를 생성할 수도 있다. 예를 들어, 자연 발생의 것을 변형된 모듈, 도메인 또는 서브유닛으로 대체할 수도 있으며, 또는 한 유기체로부터의 NRPS로부터의 자연 발생 모듈, 도메인 또는 서브유닛을 다른 유기체로부터의 NRPS의 모듈, 도메인 또는 서브유닛으로 대체할 수도 있다. 예를 들어, 실시예 12C 참고. 모듈, 도메인 및 서브유닛의 변화는 부위-지시된 돌연변이, 도메인 교환(모듈 또는 서브유닛 변형을 위해), 모듈 또는 서브유닛내의 도메인의 결실, 삽입 또는 치환, 또는 서브유닛내의 모듈의 결실, 삽입 또는 치환에 의해 수행될 수 있다. 추가로, 임의의 공지 방법을 이용하여 도메인, 모듈 또는 서브유닛을 파괴하여 그것이 작용하지 않도록 할 수 있다. 이러한 파괴는 예를 들어 다른 유전자(예, 선별 또는 스크리닝을 허용하는 유전자)에 의한 상동성 재조합을 통한 단일 크로스오버 파괴자 또는 치환과 같은기법을 포함한다.
변형된 NRPS 복합체에 의해 생산되는 생성물은 상이한 통합된 아미노산, 아미노산의 상이한 화학적 변화(예, 메틸화와 에피머화)를 가질 것이며, 천연 리포펩티드보다 짧거나 길 수 있다. 도메인, 모듈 또는 서브유닛은 2, 3, 또는 4 NRPS를 포함한, 원하는 수의 NRPS로부터 유래될 수 있다. 또한, 본 발명은 통합 티오에스테라제를 갖거나 통합 티오에스테라제가 없는 변화된 NRPS 복합체를 포함한다. 예를 들어, 실시예 12B-J 참고.
모듈, 도메인 및/또는 서브유닛의 공급원은 답토마이신 생합성 유전자 클러스터로부터 유래될 수도 있고 또는 다른 리포펩티드를 코딩하는 NRPS 또는 다른 펩티드 공급원으로부터 유래할 수도 있다. 이들 펩티드 공급원은 글리코펩티드 유전자 클러스터, 혼합된 경로 유전자 클러스터 및 사이드로포어 유전자 클러스터를 포함한다. 추가로, 모듈, 도메인, 및/또는 서브유닛의 공급원은 스트렙토마이세스 및 비-스트렙토마이세스 공급원을 포함한 임의의 적절한 공급원으로부터 얻어질 수 있다. 비-스트렙토마이세스 공급원은 방선균(예, 아미코라톱시스), 원핵 비-방선균(예, 바실러스와 시아노박테리아), 및 비-박테리아 공급원(예, 진균류)를 포함한다.
NRPS 또는 그 일부는 관심의 숙주 세포에 대해 이종성일 수도 있으며 또는 숙주 세포에 내인성일 수도 있다. 한 구체예에서, 답토마이신 NRPS 또는 그 일부(예, 도메인, 모듈 또는 그 서브유닛)은 당업자에게 알려진 임의의 벡터(예, 플라스미드, 코스미드, 박테리오파아지 또는 BAC)상에서 숙주 세포내로 도입된다. 답토마이신 NRPS 또는 그 일부가 도입되는 숙주 세포는 내인성 NRPS 또는 그 일부(예, 도메인, 모듈, 또는 그 서브유닛)를 함유할 수도 있다. 다르게는, 이종성 NRPS 또는 그 일부는 이종성 답토마이신 NRPS 또는 그 일부를 함유하는 숙주 세포내로 도입될 수도 있다. 답토마이신 NRPS, 기타 NRPS, 또는 NRPS의 도메인, 모듈 또는 서브유닛은 자연 발생 서열 또는 변형된 서열을 가질 수도 있다. 다른 구체예에서, 답토마이신 NRPS 또는 그 일부는 숙주 세포에 내인성이며, 예를 들어 숙주 세포는 에스. 로제오스포루스이다. 자연 발생 또는 변형된 NRPS, 또는 그 도메인, 모듈 또는 서브유닛은 답토마이신 NRPS 또는 그 일부를 포함하는 숙주 세포내로 도입될 수도 있다. 이종성 도메인, 모듈, 서브유닛 또는 NRPS는 구성적 또는 조절성 프로모터를 포함할 수 있으며, 이들은 당업계에 공지되어 있다. 프로모터는 세포내로 도입되는 핵산 분자에 대하여 상동성 또는 이종성일 수 있다. 한 구체예에서, 프로모터는 전술한 대로, 답토마이신 생합성 유전자 클러스터로부터 올 수도 있다.
NRPS 또는 그 일부(예, 도메인, 모듈, 서브유닛)를 포함하는 핵산 분자는 에피좀으로 유지될 수도 있고 또는 게놈내로 통합될 수도 있다. 핵산 분자는 예를 들어 파아지 통합 부위에서 게놈내로 도입될 수 있다. 또한, 핵산 분자는 내인성 또는 이종성 NRPS 또는 그 일부의 부위 또는 게놈내의 그 밖의 위치에서 게놈내로 도입될 수 있다. 핵산 분자는 게놈 내에 이미 존재하는 NRPS의 도메인, 모듈 또는 서브유닛의 기능의 전부 또는 일부를 파괴하는 방식으로 도입될 수도 있고 또는 NRPS 또는 그 일부의 기능을 방해하지 않는 방식으로 도입될 수도 있다.
이들 NRPS에 의해 생산되는 펩티드는 새로운 화합물로서 유용할 수 있으며, 또는 새로운 화합물을 생산하는 데 유용할 수 있다. 바람직한 구체예에서, 새로운화합물은 항생제 화합물로서 유용하며 또는 항생제 화합물을 생산하기 위해 이용될 수 있다. 다른 바람직한 구체예에서, 새로운 화합물은 항생제, 항진균, 항바이러스, 항기생충, 항유사분열, 세포증식 억제, 항종양, 면역조절, 항-콜레스테롤, 사이드로포어, 농화학(예, 살곤충제) 또는 물리화학적(예, 계면활성제) 특성을 포함하며 이에 제한되지 않는 유용한 활성을 갖는 다른 펩티드로서 유용하거나 이를 생산하기 위해 이용될 수 있다. 보다 바람직한 구체예에서, 바뀐 NRPS 폴리펩티드를 이용하여 생산된 화합물은 2000년 12월 15일에 출원된 미국 출원 제 09/738,742호, 09/737,908호 및 09/739,535호에 개시된 것을 포함하는 답토마이신 관련 화합물의 합성에 이용될 수 있다.
또한, 숙주 세포 배양동안 이용가능한 기질의 풀을 변화시킴으로써 비리보솜 합성된 펩티드와 폴리케티드의 다양한 변이체를 얻을 수 있다. 예를 들어, 답토마이신의 시판 제품은 최종 생산물의 리포펩티드 프로파일을 바꾸는 데카노산의 존재하에 답토마이신 생산자 스트렙토마이세스 로제오스포루스를 배양한 결과이다. 예를 들어 미국 특허 4,885,243호를 참고. 폴리케티드 중간체의 N-아세틸 시스테아민(SNAC) 유사체를 공급한 결과, 유리 카르복실산 또는 에스테르 유사체와 비교할 때 중간체의 폴리케티드내로의 통합이 상당히 증가하였다. 예를 들어, Yue et al., J.Am.Chem.Soc., 109, pp.1253-1255(1987); Cane and Yang, J.Am.Chem.Soc., 109, pp.1255-1257(1987); Cane et al., J.Am.Chem.Soc., 115, pp.522-526 및 527-535(1993); Cane et al., J.Am.Chem.Soc., 117, pp.633-634(1995); Pieder et al.,J.Am.Chem.Soc., 117, pp.11373-11374(1995)를 참고하며이들 각각은 참고로 본원에 통합된다. 아미노산의 SNAC 유사체가 생체외에서 NRPS내로 통합되었다. Ehmann et al., Chem.Biol.,7, pp.765-772(2000). 따라서, SNAC 또는 다른 판테테인 모방체를 공급하여 비천연 기질을 NRPS-생산된 펩티드내로 통합시키는 것은 가능하다.
비리보솜 합성된 펩티드와 폴리케티드의 추가의 다양성은 또한 하나 이상의 NRPS 및 PKS 유전자(천연, 하이브리드 또는 달리 변형된 모듈 또는 도메인을 코딩함)를 이종성 숙주 세포, 즉, 상기 NRPS와 PKS 유전자 또는 모듈이 기원한 숙주 세포외의 숙주 세포에서 발현시켜 이루어질 수 있다.
또한, 답토마이신 또는 관련 화합물에 대한 박테리아 세포의 내성을 증가시키기 위해 항생제 내성에 관련된 ABC 수송자 또는 다른 폴리펩티드를 발현시킬 수도 있다. ABC 수송자는 자가 조직 세포에서(즉, 그 유전자를 포함하는 세포) 과다발현될 수도 있고, 또는 이종성 세포(즉, 정상적으로는 그 유전자를 갖지 않는 세포)에서 발현될 수도 있다. 추가로, 본 발명의 ABC 수송자 유전자 또는 본원에서 개시된 항생제 내성에 관련된 다른 폴리펩티드를 발현시켜 답토마이신에 내성인 세포를 선별할 수 있다. 이러한 선별은 답토마이신 내성의 기작을 결정하는 데 유용할 수 있으며, 또는 항체 내성이 선별되는 표준 분자 생물학적 기법에 이용될 수도 있다.
본 발명의 화합물, 그것의 약학 조성물, 및 화합물과 조성물을 이용하여 치료하는 방법
본 발명의 다른 목적은 본 발명의 티오에스테라제, NRPS 또는 그 서브유닛을이용하여 생산될 수 있는 펩티드 또는 리포펩티드 및 그들의 염, 에스테르, 아미드, 에테르 및 보호된 형태, 그리고 이들 펩티드, 리포펩티드 또는 그 염을 포함하는 약학 제제를 제공하는 것이다. 바람직한 구체예에서, 리포펩티드는 전술한 답토마이신 또는 답토마이신-관련 리포펩티드이다.
다양한 일상적이고 잘 알려진 프로토콜을 이용하여 본 발명의 펩티드, 리포펩티드 또는 다른 화합물이 항생제 활성을 갖는지를 결정할 수 있다. 분리되거나 정제된 화합물을 이용할 수도 있고 또는 발효 배양액 또는 세포 용균액에 존재하는 미정제 화합물을 이용할 수도 있다. 효능을 결정하기 위해, 그람 양성 또는 그람 음성 박테리아 시험 균주중 하나 또는 둘다를 이용할 수도 있고, 다양한 시험 균주를 이용할 수도 있다. 바람직한 구체예에서, 박테리아 시험 균주는 그람 양성 시험 균주일 것이다. 보다 바람직한 구체예에서, 박테리아 시험 균주는 스타필로코커스, 보다 바람직하게는 에스.아우레우스일 것이다. 항생제 활성을 결정하기 위해 이용될 수 있는 방법의 예는 미국 특허 제4,208,408호와 4,537,717호에 제공된다. 당업자는 다른 가능한 항생제와 다른 시험 균주가 이용될 수 있음을 인지할 것이다.
펩티드, 리포펩티드 또는 그 약학적 허용염은 질병, 특히 박테리아 감염의 치료적 또는 예방적 치료를 위해 경구, 정맥내, 근육내, 피하, 에어로졸, 국소 또는 비경구 투여를 위해 제제화될 수 있다. 바람직한 구체예에서, 리포펩티드는 답토마이신 또는 답토마이신-관련 리포펩티드이다. 본원에서 "답토마이신", "답토마이신-관련 리포펩티드" 또는 "리포펩티드"는 그들의 약학적 허용염을 포함한다. 답토마이신 또는 답토마이신-관련 리포펩티드를 포함한 펩티드는 펩티드 또는 관심리포펩티드와 양립할 수 있는 임의의 약학적 허용 담체 또는 부형제를 이용하여 제제화될 수 있다. 예를 들어 사람의 치료를 위한 다양한 항미생물 제제의 투여를 위한 방법의 일반적인 기재를 위해서는 Handbook of Pharmaceutical Additives:An Internation Guide to More than 6000 Products by Trade Name, Chemical, Function, and Manufacturer, Ashgate Publishing Co., eds., M.Ash and I.Ash, 1996; Merck Index:An Encyclopedia of Chemicals, Drugs and Biologicals, ed.S.Budavari, annual; Remington's Pharmaceutical Sciences Mack Publishing Company, Easton, PA; Martindale:The Complete Drug Reference, ed.K.Parfitt, 1999: and Goodman & Gilman's The Pharmaceutical Basis of Therapeutics, Pergamon Press, New York, NY, ed. L.S.Goodman et al.,를 참고하며 이들은 참고로 본원에 통합된다. 본 발명의 펩티드 또는 리포펩티드는 통상의 약학적 담체 및 부형제와 혼합될 수 있으며 정제, 캡슐, 엘릭시르, 현탁액, 시럽, 웨이퍼, 크림 등의 형태로 이용될 수 있다. 펩티드 또는 리포펩티드는 본원에 개시된 바대로 다른 치료제 및 항생제와 혼합될 수 있다. 본 발명의 화합물을 포함하는 조성물은 약 0.1 내지 약 90중량%의 활성 화합물을 함유할 것이며, 보다 일반적으로는 약 10 내지 약 30 중량%를 함유할 것이다.
본 발명의 조성물은 조절되거나(예, 캡슐) 또는 서방성 전달 시스템(예, 생분해성 매트릭스)를 이용하여 전달될 수 있다. 본 발명의 조성물의 투여에 적합한 약물 전달을 위한 예시적인 서방성 전달 시스템은 미국 특허 제4,452,775호(Kent에게 허여됨), 제5,239,660호(Leonard에게 허여됨), 제3,854,480호(Zaffaroni에게 허여됨)에 개시된다.
이 조성물은 통상의 담체와 부형제를 함유할 수 있으며, 그 예로는 옥수수 전분 또는 젤라틴, 락토스, 슈크로스, 미세결정질 셀룰로스, 카올린, 만니톨, 디칼슘 포스페이트, 소듐 클로라이드 및 알긴산이 있다. 이 조성물은 크로스카멜로스 소듐, 미세결정질 셀룰로스, 옥수수 전분, 소듐 전분 글리콜레이트 및 알긴산을 함유할 수 있다.
포함될 수 있는 정제 결합제는 아카시아, 메틸셀룰로스, 소듐 카르복시메틸셀룰로스, 폴리비닐피롤리돈(포비돈), 하이드록시프로필 메틸셀룰로스, 슈크로스, 전분 및 에틸셀룰로스이다.
사용될 수 있는 윤활제는 마그네슘 스테아레이트 또는 기타 금속 스테아레이트, 스테아르산, 실리콘 플루이드, 탈크, 왁스, 오일 및 콜로이드 실리카를 포함한다.
페퍼민트, 노루발풀의 오일, 체리 향미료 등과 같은 향미료 또한 이용될 수 있다. 또한, 투여 형태를 그 외관을 보다 보기 좋게 하거나 제품의 식별을 돕기 위해 착색제를 첨가하는 것이 바람직할 수도 있다.
경구용으로는, 정제와 캡슐같은 고형 제제가 특히 유용하다. 서방성 제제 또는 장 피복 제제 또한 고안될 수도 있다. 소아용 또는 노인용의 경우, 좌약, 시럽 및 씹을 수 있는 정제가 특히 적합하다. 경구 투여의 경우, 약학 조성물은 예를 들어, 정제, 캡슐, 현탁액 또는 액체 형태일 수 있다. 약학 조성물은 치료적 유효량의 활성 성분을 함유하는 투여 단위의 형태로 만들어지는 것이 바람직하다. 그러한투여 단위의 예는 정제와 캡슐이다. 치료의 목적의 경우, 정제 및 캡슐은 활성 성분에 더하여, 예를 들어 아카시아 검, 젤라틴, 폴리비닐피롤리돈, 소르비톨, 또는 트라가칸트와 같은 결합제; 예를 들어 칼슘 포스페이트, 글리신, 락토스, 옥수수전분, 소르비톨, 또는 수크로스와 같은 충진제; 예를 들어 마그네슘 스테라레이트, 폴리에틸렌 글리콜, 실리카, 또는 탈크와 같은 활택제; 예를 들어, 감자 전분과 같은 붕해제, 향미제 또는 착색제 또는 허용가능한 습윤제와 같은 통상의 담체를 함유할 수 있다. 경구용 액체 제제는 일반적으로 수성 또는 유성 용액, 현탁액, 에멀젼, 시럽 또는 엘릭시르의 형태이며, 이들은 현탁제, 유화제, 비수성 제제, 방부제, 착색제 및 향미제와 같은 통상의 첨가제를 함유할 수 있다. 경구용 액체 제제는 리포펩티드 미셀 또는 리포펩티드의 단량체 형태를 포함할 수도 있다. 액체 제제를 위한 첨가제의 예는 아카시아, 아몬드 오일, 에틸 알콜, 분획화된 코코넛 오일, 젤라틴, 글루코스 시럽, 글리세린, 수소화된 식용 지방, 레시틴, 메틸 셀룰로스, 메틸 또는 프로필 파라-하이드록시벤조에이트, 프로필렌 글리콜, 소르비톨, 또는 소르브산을 포함한다.
정맥내(IV) 사용을 위해서는, 펩티드 또는 리포펩티드의 수용성 형태를 통상적으로 사용되는 정맥내 유체 중 하나에 용해시켜 주사로 투여할 수 있다. 정맥내 제제는 담체, 부형제 또는 안정화제를 포함할 수 있으며, 이들로는 제한없이 칼슘, 인체 혈청 알부민, 시트레이트, 아세테이트, 칼슘 클로라이드, 카보네이트, 및 기타 염을 포함한다. 정맥내 유체는 제한없이 생리 식염수 또는 링거 용액을 포함한다. 펩티드 또는 리포펩티드는 또한 주사기, 캐뉼라, 카테터 및 선에 놓여질 수도있다.
비경구 투여를 위한 제제는 수성 또는 비수성 등장성 멸균 주사 용액 또는 현탁액 형태일 수 있다. 이들 용액 또는 현탁액은 경구 투여용 제제에 사용되는 것으로 언급된 담체 중 하나 이상을 갖는 멸균 파우더 또는 과립으로부터 제조될 수 있다. 리포펩티드 미셀은 특히 비경구 투여에 적합하다. 화합물은 폴리에틸렌 글리콜, 프로필렌 글리콜, 에탄올, 옥수수 오일, 벤질 알콜, 소듐 클로라이드, 및/또는 다양한 완충액에 용해될 수 있다. 근육내 제제의 경우, 리포펩티드 화합물 또는 이 화합물의 적절한 가용성 염 형태(예, 염산염)의 멸균 제제를 주사용 물(WFI), 생리식염수 또는 5% 글루코스와 같은 약학적 희석제에 용해시켜 투여할 수 있다.
주사가능한 디포우(depot) 형태는 폴리락티드-폴리글리콜리드와 같은 생분해성 중합체에 상기 화합물의 미세캡슐화된 매트릭스를 형성시켜 만들 수 있다. 약물 대 중합체의 비율과 이용되는 구체적 중합체의 특성에 의존하면서, 약물 방출의 속도가 조절될 수 있다. 다른 생분해성 중합체의 예는 폴리(오르토에스테르)와 폴리(안하이드라이드)를 포함한다. 주사가능한 디포우 제제는 또한 약물을 신체 조직과 양립할 수 있는 마이크로에멀젼에 포획시켜 제조될 수 있다.
국소적 용도의 경우, 본 발명의 화합물은 또한 피부, 또는 코와 목의 점막에 적용하기에 적합한 형태로 제조될 수 있고, 크림, 연고, 액체 스프레이 또는 흡입제, 로젠지, 또는 목 페인트 형태를 가질 수 있다. 그러한 국소 제제는 추가로 디메틸설폭사이드(DMSO)와 같은 화학적 화합물을 포함하여 활성 성분의 표면 투과를 촉진할 수 있다. 국소 제제의 경우, 답토마이신, 답토마이신-관련 리포펩티드 또는적절한 그들의 염형태의 멸균 제제를 크림, 연고, 스프레이 또는 기타 국소 드레싱으로 투여할 수도 있다. 국소 제제는 또한 답토마이신 또는 답토마이신-관련 리포펩티드 조성물로 함침된 밴드 형태일 수도 있다.
눈 또는 귀에 적용하기 위해서는, 본 발명의 화합물을 연고, 크림, 로션, 페인트 또는 분말로서 소수성 또는 친수성 기제에 조제된 액체 또는 반-액체 형태로 제공할 수 있다.
직장 투여를 위해, 본 발명의 화합물을 코코아 버터, 왁스 또는 기타 글리세라이드와 같은 통상의 담체와 혼합된 좌약의 형태로 투여할 수 있다.
에어로졸 제제의 경우, 펩티드 또는 리포펩티드 또는 화합물의 염 형태의 멸균 제제를 계량된 투여량 흡입기와 같은 흡입기 및 분사기로 이용할 수 있다. 리포펩티드 미셀의 멸균 형태는 또한 에어로졸 제제를 위해 이용될 수 있다. 에어로졸화된 형태는 특히 폐렴 및 굴(sinus)계 감염과 같은 호흡기 감염을 치료하는 데 유용하다.
다르게는, 본 발명의 화합물은 전달시에 적절한 약학적 허용 담체에서 재구성되는 분말 형태일 수 있다. 한 구체예에서, 본 화합물의 단위 투여 형태는 멸균된 밀봉 앰퓰내의 적절한 희석제중의 화합물 또는 그 염의 용액일 수 있다. 단위 투여 형태중의 화합물의 농도는 다양할 수 있으며, 예를 들어, 약 1% 내지 약 50%이며, 이용되는 화합물과 그것의 용해도 및 의사가 원하는 투여량에 의존한다. 만일 조성물이 투여 단위를 함유하면, 각 투여 단위는 활성 물질 50-500 mg을 함유하는 것이 바람직할 것이다. 성인 인간 치료의 경우, 이용되는 투여량은 투여 경로와빈도에 의존하면서, 100 mg 내지 3 g/1일의 범위가 바람직하다.
추가의 태양에서, 본 발명은 사람 및 기타 동물에서의 감염, 특히 그람 양성 박테리아에 의해 야기된 감염을 치료하는 방법을 제공한다. 용어 "치료하다"는 감염의 예방과 숙주 동물이 감염된 후 확립된 감염의 조절 둘다를 의미하기 위해 이용된다. 이미 확립된 감염은 급성 또는 만성일 수 있다. 본 방법은 사람 또는 기타 동물에게 유효 투여량의 본 발명 화합물을 투여하는 것을 포함한다. 답토마이신의 유효 투여량은 예를 들어 일반적으로 약 0.1 내지 약 25 mg/kg 답토마이신, 답토마이신-관련 리포펩티드 또는 약학적 허용염이다. 답토마이신 또는 답토마이신-관련 리포펩티드는 단량체일 수도 있고 또는 리포펩티드 미셀의 일부일 수도 있다. 바람직한 투여량은 약 1 내지 약 25 mg/kg의 답토마이신 또는 답토마이신-관련 리포펩티드 또는 그 약학적 허용염이다. 보다 바람직한 투여량은 약 1 내지 12 mg/kg 답토마이신 또는 그 약학적 허용염이다. 답토마이신을 위한 이들 투여량은 본 발명의 변형된 NRPS 복합체에 의해 생산된 기타 선형 및 고리형 펩티드의 유효 투여량을 결정하고 최적화하기 위해 당업자에 의해 출발점으로 이용될 수 있다.
한 구체예에서, 본 발명은 환자에서 감염, 특히 그람 양성 박테리아에 의해 야기된 감염을 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신 또는 다른 항박테리아성 펩티드 또는 리포펩티드의 치료적 유효량으로 치료하는 방법을 제공한다. 답토마이신 또는 항박테리아성 펩티드 또는 리포펩티드는 단량체일 수도 있고 리포펩티드 미셀내에 있을 수도 있다. 항박테리아 제제를 전달하는 예시적 과정은 Rogers에게 허여된 미국 특허 제5,041,567호와 PCR 특허 출원 제 EP94/02552호(공개 번호 WO95/05384호)에 개시되어 있으며, 이들의 전체 내용은 참고로 본원에 통합된다. 본원에서 사용될 때, 용어 "치료적 유효량"은, 박테리아 감염의 개시를 막거나, 증상을 완화시키거나 또는 진전을 중단시키는, 본 발명에 따른 변형된 NRPS에 의해 생산된 변형된 답토마이신 또는 다른 항박테리아성 펩티드 또는 리포펩티드의 양을 의미한다. 용어 "치료하다"는 감염의 발생을 방지하고 감염을 조절 또는 제거하기 위한 본 발명의 화합물의 치료 유효량을 환자에게 투여하는 것으로 정의된다. 용어 "대상"은 본원에서 개시된 대로, 포유류, 식물 또는 세포 배양물로 정의된다. 바람직한 구체예에서, 대상은 펩티드 또는 리포펩티드 치료를 필요로 하는 사람 또는 기타 동물 환자이다.
펩티드 또는 리포펩티드 항생제 화합물은 하루 한번 투여될 수도 있고 또는 하루에 여러번 투여될 수도 있다. 치료 체제는 예를 들어 몇일 또는 2-4주와 같이 장기간에 걸친 투여를 요구할 수도 있다. 투여되는 투여단위당 양 또는 투여되는 총량은 감염의 특성과 심각성, 환자의 나이 및 일반적인 건강, 항생제에 대한 환자의 내성 및 감염에 관련된 미생물(들)과 같은 인자들에 의존할 것이다. 투여 방법은 본원에 참고로 통합되며 1999년 9월 24일에 출원된 미국 출원 제09/406,568호에 개시되어 있으며, 이 출원은 1999년 3월 24일에 출원된 미국 가출원 제60/125,750호와 1998년 9월 25일에 출원된 미국 가출원 제60/101,828호의 이익을 향유한다.
본 발명의 방법은 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제, 또는 그 약학 조성물을, 그람 양성 박테리아 감염을 감소시키거나 제거하는 데 효과적인 양으로 이들을 필요로 하는 환자에게 투여하는 것을 포함한다. 항생제는 경구, 비경구, 흡입, 국소, 직장, 비강, 볼, 질, 또는 이식 저장소, 외부 펌프 또는 카테터로 투여될 수 있다. 항생제는 눈 또는 에어로졸화된 사용을 위해 제조될 수도 있다. 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 펩티드 또는 리포펩티드 항생제, 또는 그 약학적 조성물은 또한 농양, 심실 또는 관절내로 직접 주사되거나 투여될 수 있다. 비경구 투여는 피하, 정맥내, 근육내, 관절내, 윤활내, 수조내, 경막내, 간내, 병변내 및 두개내 주사 또는 주입을 포함한다. 바람직한 구체예에서, 답토마이신 또는 다른 펩티드 또는 리포펩티드는 정맥내로, 피하로 또는 경구로 투여된다.
본 발명의 방법은 임의 유형의 그람 양성 박테리아에 의해 야기되거나 또는 악화된 박테리아 감염을 갖는 환자를 치료하기 위해 이용될 수 있다. 바람직한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 답토마이신-관련 리포펩티드, 또는 다른 펩티드 또는 리포펩티드 항생제, 또는 그 약학 조성물은 본 발명의 방법에 따라 환자에게 투여된다. 다른 바람직한 구체예에서, 박테리아 감염은 메티실린-민감성 및 메티실린-내성 스타필로코커스(스타필로코커스 아우레우스, 스타필로코커스 에피덜미디스, 스타필로코커스 헤모리티쿠스, 스타필로코커스 호미니스, 스타필로코커스 사프로피티쿠스, 및 코아귤라제-음성 스타필로코커스를 포함), 글리코펩티드 중간체-민감성 스타필로코커스 아우레우스(GISA), 페니실린-민감성 및 페니실린-내성 스트렙토코커스(스트렙토코커스 뉴모니에, 스트렙토코커스 피오게네스, 스트렙토코커스 아가락티에, 스트렙토코커스 아비움, 스트렙토코커스 보비스, 스트렙토코커스 락티스, 스트렙토코커스 산지우스 및 스트렙토코커스 그룹 C, 스트렙토코커스 그룹 G 및 비리단스 스트렙토코커스 포함), 엔테로코커스(엔테로코커스 페칼리스와 엔테로코커스 패시움과 같은 반코마이신-민감성 및 반코마이신-내성 균주 포함), 클로스트리듐 디피시레, 클로스트리듐 클로스트리디포르메, 클로스트리듐 이노쿰, 클로스트리듐 퍼프린젠스, 클로스트리듐 라모숨, 헤모필러스 인플루엔자, 리스테리아 모노사이토젠스, 코리네박테리움 제이케움, 비피도박테리움 종, 유박테리움 아에로파시엔스, 유박테리움 렌튬, 락토바실러스 애시도필러스, 락토바실러스 카제이, 락토바실러스 플란타룸, 락토코커스 종, 류코노스톡 종, 페디오코커스, 펩토스트렙토코커스 언애어로비우스, 펩토스트렙토코커스 아사카로리티쿠스, 펩토스트렙토코커스 매그너스, 펩토스트렙토코커스 미크로스, 펩토스트렙토코커스 프레보티, 펩토스트렙토코커스 프로덕투스, 프로피오니박테리움 애크네스, 및 액티노마이세스 종을 포함하며 이에 제한되지 않는 박테리아에 의해 야기되거나 심해질 수 있다.
고전적으로 "내성"인 균주에 대한 답토마이신의 항박테리아 활성은 생체외 실험에서 고전적으로 "민감성"인 균주에 대한 활성과 비교할 만하다. 또한, 민감성 균주에 대한 답토마이신의 최소 억제 농도(MIC)는 대개 반코마이신의 값보다 4배 낮다. 따라서, 바람직한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 답토마이신-관련 리포펩티드, 또는 다른 펩티드 또는 리포펩티드 항생제 또는 약학 조성물은 본 발명의 방법에 따라 반코마이신을 포함한 다른 항생제에 내성인 박테리아 감염을 나타내는 환자에게 투여된다. 또한, 글리코펩티드 항생제와는 달리, 답토마이신은 그람 양성 유기체에 대하여 신속하고 농도의존성인 박테리아살균 활성을 나타낸다. 따라서, 바람직한 구체예에서, 답토마이신, 리포펩티드 항생제 또는 그 약학 조성물은 신속하게 작용하는 항생제 치료를 필요로 하는 환자에게 본 발명의 방법에 따라 투여된다.
본 발명의 방법은 신체의 임의 기관 또는 조직의 그람 양성 박테리아 감염에 사용될 수 있다. 이들 기관 또는 조직은 제한없이 골격 근육, 피부, 혈류, 신장, 심장, 폐 및 뼈를 포함한다. 본 발명 방법은 제한없이 피부와 연조직 감염, 균혈증 및 요로감염을 치료하기 위해 이용될 수 있다. 본 발명 방법은 중이염, 굴염, 만성 기관지염 및 약물내성 스트렙토코커스 뉴모니에 또는 헤모필루스 인플루엔자에 의해 야기된 폐렴을 포함한 폐렴을 제한없이 포함하는 지역사회 획득 호흡기 감염을 치료하기 위해 이용될 수 있다. 본 발명의 방법은 또한 다른 유형의 그람 양성 박테리아를 포함하거나, 또는 호기성, 카프로필릭(caprophilic), 또는 혐기성 박테리아를 포함한 그람 양성과 그람 음성 박테리아 둘다를 포함하는 혼합 감염을 치료하기 위해 이용될 수 있다. 이러한 유형의 감염은 배안 감염증 및 산과/부인과 감염을 포함한다. 본 발명 방법은 제한없이 폐렴, 복강내 패혈증, 피부 및 연조직 감염 및 뼈와 관절 감염을 포함하는 병원 감염을 위한 스텝 다운 치료에 이용될 수 있다. 본 발명 방법은 또한 제한없이 심장내막염, 신장염, 패혈관절염 및 골수염을 포함하는 감염을 치료하기 위해 이용될 수 있다. 바람직한 구체예에서, 전술한 질병의 임의의 것은 답토마이신, 리포펩티드 항생제 또는 그 약학 조성물을 이용하여 치료할 수 있다. 또한, 이 질병들은 단량체 또는 미셀 형태의 답토마이신 또는 리포펩티드 항생제를 이용하여 치료할 수 있다.
본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 답토마이신-관련 리포펩티드, 또는 다른 펩티드 또는 리포펩티드는 또한 환자 또는 동물의 음식 또는 사료로 투여될 수 있다. 만일 전체 음식 섭취의 일부로 투여되면, 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드의 양은 음식의 1 중량% 미만일 수 있으며 바람직하게는 0.5 중량% 이하이다. 동물을 위한 음식은 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드가 첨가되거나 또는 프리믹스에 첨가될 수 있는 일반 음식물일 수 있다.
본 발명의 방법은 또한 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제외의 항생제 하나 이상 및/또는 항진균제 하나 이상을 동시에 투여하면서 실시될 수 있다. 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제외의 항생제와 항진균제의 동시투여는 다른 유형의 그람 양성 박테리아에 의해 야기되는 감염, 그람 양성과 그람 음성 박테리아 둘다에 의해 야기되는 감염, 또는 박테리아와 진균류 둘다에 의해 야기되는 감염을 포함한 혼합 감염에 유용할 수 있다. 더욱이, 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제는 동시 투여된 하나 이상의 항생제의 독성 프로파일을 개선할 수 있다. 답토마이신과 아미노글리코시드의 투여는 아미노글리코시드에 의해 야기된 신장 독성을 완화시킬 수 있음이 알려졌다. 바람직한 구체예에서, 항생제 및/또는 항진균제는 변형된 답토마이신, 다른 펩티드 또는 리포펩티드 항생제와 동시에, 또는 변형된 답토마이신, 다른 펩티드 또는 리포펩티드 항생제를 포함하는 약학 조성물로 투여될 수 있다.
변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드 항생제와 함께 투여될 수 있는 항박테리아 제제와 그 분류는, 제한없이 페니실린과 관련 약물, 카르바페넴(carbapenems), 세팔로스포린(cephalosporins)과 관련 약물, 아미노글리코시드(aminoglycoside), 바시트라신(bacitracin), 그라미시딘(gramicidin), 뮤피로신(mupirocin), 클로람페니콜(chloramphenicol), 티암페니콜(thiamphenicol), 후시데이트 소듐(fusidate sodium), 린코마이신(lincomycin), 크린다마이신(clindamycin), 마크로라이드(macrolide), 노보비오신(novobiocin), 폴리믹신(polymyxins), 리파마이신(rifamycins), 스펙티노마이신(spectinomycin), 테트라사이클린(tetracyclines), 반코마이신(vancomycin), 테이코프라닌(teicoplanin), 항엽산 제제(스트렙토그라민(streptogramins), 설폰아미드(sulfonamide), 트리메토프림(trimethoprim) 및 그 조합을 포함), 및 피리메타민(pyrimethamine), 합성 항박테리아제(니트로푸란(nitrofurans), 메텐아민 만델레이트(methenamine mandelate) 및 메텐아민 히푸레이트(methenamine hippurate)를 포함), 니트로이미다졸(nitroimidazole), 퀴놀론(quinolones), 플루오로퀴놀론(fluoroquinolones), 이소니아지드(isoniazid), 에탐부톨(ethambutol), 피라진아미드(pyrazinamide), 파라-아미노살리실산(para-aminosalicylic acid)(PAS), 사이클로세린(cycloserine), 카프레오마이신(capreomycin), 에티온아미드(ethionamide), 프로티온아미드(prothionamide), 티아세타존(thiacetazone), 비오마이신(viomycin), 에베미노마이신(eveminomycin), 글리코펩티드, 글리실사이클린(glycylcycline), 케토라이드(ketolides), 옥사졸리디논(oxazolidinone); 이미페넨(imipenen), 아미카신(amikacin), 네틸미신(netilmicin), 포스포마이신(fosfomycin), 젠타마이신(gentamycin), 세프트리악손(ceftriaxone), 지르아신(Ziracin), LY 333328, CL 331002, HMR 3647, 리네조리드(Linezolid), 시네르시드(Synercid), 아즈트레오남(Aztreonam), 및 메트로니다졸(Metronidazole), 에피로프림(Epiroprim), OCA-983, GV-143253, 산페트리넴 소듐(Sanfetrinem sodium), CS-834, 비아페넴(Biaphenem), A-99058.1, A-165600, A-179796, KA 159, 디네미신(Dynemicin) A, DX8739, DU 6681; 세프루프레남(Cefluprenam), ER 35786, 세포세리스(Cefoselis), 산페트리넴 세렉세틸(Sanfetrinem celexetil), HGP-31, 세프피롬(Cefpirome), HMR-3647, RU-59863, 메르사시딘(Mersacidin), KP 736, 리파라질(Rifalazil); 코산(Kosan), AM 1732, MEN 10700, 레나페넴(Lenapenem), BO 2502A, NE-1530, PR 39, K130, OPC 20000, OPC 2045, 베네프림(Veneprim), PD 138312, PD 140248, CP 111905, 수로페넴(Sulopenem), 리티페남 아콕실(ritipenam acoxyl), RO-65-5788, 사이클로티아리딘(Cyclothialidine), Sch-40832, SEP-132613, 미카코시딘(micacocodin) A, SB-275833, SR-15402, SUN A0026, TOC 39, 카루모남(carumonam), 세포조프란(Cefozopran), 세페타메트 피복실(Cefetamet pivoxil), 및 T 3811을 포함한다.
바람직한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 또는 펩티드 또는 리포펩티드 항생제와 함께 투여될 수 있는 항박테리아 제제는 제한없이 이미페넨, 아미카신, 네틸미신, 포스포마이신, 젠타마이신, 세프트리악손, 테이코프라닌, 지라신, LY 333328, CL 331002, HMR 3647, 리네조리드, 시네르시드, 아즈트레오남, 및 메트로니다졸을 포함한다.
변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드 항생제와 함께 투여될 수 있는 항진균 제제는 제한없이 카스포푼젠, 보리코나졸, 세르타코나졸, IB-367, FK-463, LY-303366, Sch-56592, 시타프록사신, DB-289 폴리엔, 예를 들어 암포네리신, 니스타틴, 프리마리신; 아졸, 예를 들어 플루코나졸, 이트라코나졸, 및 케토코나졸; 알릴아민, 예를 들어 나프티핀 및 테르비나핀; 및 플루사이토신과 같은 항-대사물을 포함한다. 다른 항진균제제는 제한없이, 본원에 참고로 통합되는 Fostel et al., Drug Discovery Today 5:25-32(2000)에 개시된 것들을 포함한다. Fostel et al.은 코리네칸딘, Mer-WF3010, 푸사칸딘스, 알트리키틴/LL 15G256Y, 소르다린스, 시스펜타신, 아족시바실린, 아우레오바시딘 및 카프레푼진을 포함하는 항진균 화합물을 개시한다.
답토마이신-관련 리포펩티드를 포함한, 변형된 답토마이신 또는 다른 펩티드 또는 리포펩티드 항생제는 박테리아 감염이 제거되거나 감소될 때까지 이 방법에 따라 투여될 수 있다. 한 구체예에서, 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 3일 내지 6개월의 기간 동안 투여된다. 바람직한 구체예에서, 본 발명의 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 7일 내지 56일 동안 투여된다. 보다 바람직한 구체예에서, 변형된 답토마이신, 또는 펩티드 또는 리포펩티드는 7일 내지 28일 동안 투여된다. 보다 더 바람직한 구체예에서, 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 7일 내지 14일 동안 투여된다. 다른 구체예에서, 항생제는 3 내지 7일 동안투여된다. 본 발명의 변형된 NRPS에 의해 생산된 변형된 답토마이신, 또는 다른 펩티드 또는 리포펩티드는 본 발명에 따라 필요한 경우 더 길거나 더 짧은 기간 동안 투여될 수 있다.
본 발명이 보다 완전하게 이해되도록 하기 위해 하기 실시예가 개시된다. 이들 실시예는 단지 예시의 목적이며 본 발명의 범위를 제한하기 위한 것이 아니다.
실시예 1: 스트렙토마이세스 로제오스포루스 답토마이신 생합성 유전자 클러스터의 초기 서열결정
스트렙토마이세스 로제오스포루스 균주 A21978.6(ATCC 기탁 번호 31568)을 이용하여 코스미드 라이브러리를 구성하였다. 게놈 DNA를 Sau3A1와 알카라인 포스파타제(Boehringer Mannheim Biochemicals)로 부분적으로 분해하였다. 대략 40kb 길이의 DNA를 분리하여 BamHI-분해된 코스미드 pKC1471에 연결시키고 Gigapack 패키징 추출물(Stratagene, Inc.)을 이용하여 Hosted and Baltz, J.Bacteriol., 179, pp.180-186(1997)에 개시된 대로 패키징하였다. 패키징된 DNA를 이. 콜라이 XL1-Blue-MFR'(Stratagene, Inc.)내로 도입하고 코스미드를 함유한 각각의 클론을 96-웰 도트 블롯 장치내에 순서를 갖춘 배열로 저장하였다. 미세적정 웰의 한 열로부터의 12개의 배양물을 모아서 플라스미드 pRHB153으로부터의 DNA의 2.1 kB SphI 단편 및 pRHB157로부터의 5.2 kb DraI-KpnI 단편에 하이브리드화시켜 스크리닝하였으며, 상기 두 단편 모두 에스. 로제오스포루스로부터 클론된 NRPS 서열을 함유하였다.(McHenney et al., supra 참고). 하이브리드화 풀로부터의 각각의 코스미드를동일한 프로브에의 하이브리드화에 의해 동정하였다.
코스미드와 플라스미드 DNA를 유체역학적으로 전단하고 이어서 표준 1% 아가로즈젤상에서 전기영동하여 분리하였다. 분리된 2500-3000 bp 길이의 DNA 단편을 젤로부터 잘라내고 GeneClean(등록상표명) 과정(BIO 101, Inc.)에 의해 정제하였다. 젤-정제된 DNA 단편의 말단을 T4 DNA 폴리머라제를 이용하여 충전시키거나 평말단으로 만들었다. 이 DNA 단편을 독특한 BstXI-링커 어댑터(5'-GTCTTCACCACGGGG-3' - 서열 번호 13 및 5' GTGGTGAAGAC-3' - 서열 번호 14, 100-1000배 과량)에 연결시켰다. 이들 링커는 BstXI-절단 pGTC 벡터(Genome Therapeutics Corp., Waltham, MA)에 상보적인 반면, 오버행은 자가 상보성이 아니다. 따라서, 상기 링커는 연쇄물이 되거나 개방된 벡터가 쉽게 자가 연결되지 않을 것이다. 링커-적용된 삽입체를 1% 아가로즈젤상에서 전기영동하여 통합되지 않은 링커로부터 분리하고 GeneClean(등록상표명)을 이용하여 정제하였다. 정제된 링커-적용된 삽입체를 BstXI-절단 pGTC 벡터에 연결시켜 "샷건" 서브클론 라이브러리를 구성하였다.
이어서 pGTC 라이브러리를 DH5α 수행능력이 있는 세포(Gibco/BRL, DH5α형질전환 프로토콜)내로 형질전환시켰다. 암피실린과 IPTG/Xgal(IPTG=이소프로필-b-D-티오갈락토피라노시드; Xgal=5-브로모-4-클로로-3-인도일-b-D-티오발락토피라노시드)를 함유한 항생제 플레이트상에 도말하여 형질전환을 평가하였다. 플레이트를 37℃에서 밤새 배양하였다. 형질전환체를 플레이트 정제하고 하기 플라스미드를 함유하는 정제된 클론을 추가 분석을 위하여 선택하였다.
에스. 로제오스포루스 DNA의 대략 50 kb의 삽입체를 함유하는 플라스미드pRHB160, 대략 15 kb의 삽입체를 함유하는 플라스미드 pRHB613, 대략 13 kb의 삽입체를 함유하는 플라스미드 pRHB614, 대략 51 kb의 삽입체를 함유하는 플라스미드 pRHB159를 DNA 서열결정을 위해 선택하였다. (McHenney et al., supra 참고).
상기 플라스미드들로 형질전환된 균주의 각각의 배양물을 37℃에서 밤새 성장시켰다. DNA를 실리카 비드 DNA 제조법을 이용하여 정제하였다(Engelstein et al., Microb.Comp.Genomics 394):237-241, 1998). 이 방식으로, 25 mg의 DNA를 클론당 얻었다. 이들 정제된 DNA 샘플을 일차적으로 ABI 염료-종결인자 화학을 이용하여 서열 결정하였다. 모든 후속 단계는 ABI377 또는 제조자의 지시에 따른 Amersham 자동화 DNA 서열 결정 법에 의한 서열 결정에 기초하였다. ABI 염료 종결인자 서열 판독은 ABI377 또는 Amersham MegaBaceTM모세관 기계상에서 수행되었다. 데이터를 젤의 레인 트랙킹을 따르는 UNIX 기계로 옮겼다. 프로그램 PHRED를 이용하여 기본 콜과 품질 점수를 결정하였다(Ewing et al., Genome Res.8:175-185, 1998). 디폴트 프로그램 파라미터와 품질 점수를 가진 PHRAP를 이용하여 판독물을 조합하였다(P.Green, Abstracts of DOE Human Genome Program Contractor-Grantee Workshop V, Jan.1996, p.157). 초기 조립은 6x 커버리지에서 행해졌다.
실시예 2: 스트렙토마이세스 로제오스포루스 생합성 유전자 클러스터의 부가의 DNA 분자의 분리와 분석
30℃에서 F10A 브로스(2% 아가, 25% 가용성 전분, 0.2% 덱스트로스, 0.5% 효모 추출물, 0.5% 펩톤 및 0.3% 칼슘 카보네이트)에서 교반된 스트렙토마이세스 로제오스포루스(NRRL11379)(ATCC No.31568)의 밤새 배양물로부터 메가베이스 DNA의제조를 위한 균사체를 얻었다. 세척된 세포를 SeakemTMGTG 아가로즈(FMC Bioproducts, 1% 최종 농도)에 심고, 37℃에서 3 시간 동안 리소자임(2 mg/ml TE)에서 항온처리하고, 이어서 0.1 x NLS + 0.2 mg/ml 프로테이나제 K에서 50℃에서 밤새 용해시켜 DNA를 젤 매트릭스내로 방출시켰다. DNA를 함유한 아가로즈를 1 mM EDTA(pH8)로 세척하고 이어서 37℃에서 BamHI으로 처리하였다. 부분적으로 분해된 DNA를 6V/cm, 120°각도, 12℃로 맞춰진 CHEF Mapper DRIII(Biorad)를 이용하여 펄스장 전기영동에 의해 0.6% 아가로즈 젤(0.5x TBE)에서 2 단계 크기 선별 과정을 수행하였다. 첫번째 선별은 22-44 sec 선형 경사진 스위치 시간으로 14 시간 수행하는 것으로 이루어졌다. 100-200 kb 람다 연쇄물 크기 마커와 함께 이동하는 DNA를 함유한 젤을 잘라내어 3-5 sec 선형 경사를 가지고 18 시간 두번째 젤에 놓았다. 크기 마커와 비교하여 75-145 kb 로 추정되는 DNA를 TAE에서 전기용출하였다(MiniProtein II Cell model, Biorad).
단일-카피 BAC 라이브러리 클로닝 벡터 pStreptoBAC V는 pBACe3.6에서 유래한다(Frengen et al., A modular, positive selection bacterial artificial chromosome vector with multiple cloning sites, Genomics, 58:250-253(1999)). 스트렙토마이세스에서의 부위 특이적 통합과 접합을 위한 파아지 jC31로부터의 oriT와 attP 서열뿐만 아니라 두 개의 마커, 이. 콜라이에서의 선별을 위한 AmpR과 스트렙토마이세스에서의 선별을 위한 ApraR를 함유하도록 pBACe3.6를 변형시켰다. 도 6 참고. 에스. 로제오스포루스 DNA와의 연결을 위한 pStrestpBAC V 벡터를 제조하기 위해, 벡터를 먼저 BamHI으로 분해하고 그 반응을 열(65℃에서 1 시간)에 의해 불활성화시켰다. 이어서 DNA를 새우 알칼라인 포스파타제로 30분간 탈인산화시켰다. 두 개의 밴드(pUC 단편에 해당하는 13 kb와 3 kb)를 0.6% 아가로즈 젤에서 분리하였으며 13 kb 밴드를 GeneClean 스핀 컬럼을 이용하여 정제하였다.
150 ㎕ 반응물에서 9U의 T4 DNA 리가제(Promega)를 이용하여 에스. 로제오스포루스 DNA 200 ng을 BamHI으로 절단되고 포스파타제로 처리된 pStrestpBAC V 벡터 DNA 75 ng에 연결시켰다. 16℃에서 16 시간 후, 연결 반응물을 65℃에서 30분간 가열하고, 10% 폴리에틸렌 글리콜 8000에 대해 투석하고, 300V와 4kΩ에서 전압 승압기를 가진 세포 천공기(Gibco/BRL)를 이용하여 DH10B 전기수행능력이 있는 세포(Gibco/BRL) 10 ㎕내로 형질전환시켰다. 세포를 100 mg/ml 아프라마이신과 5% 수크로스를 함유한 배지(LB 아가)상에 도말하였다. 샘플 클론의 분석은 39 kb 내지 105 kb 범위의 삽입체를 나타내었다. 평균 삽입체 크기는 71.4 kb였고, 표준 편차는 14.7 kb이다. 대략 2,000 클론을 96-웰 미세적정 플레이트에서 -80℃에서 저장하였다.
하기에서 나타내진 프라이머 쌍 P61/P62, P72/P73 및 P74/P75를 이용하여 폴리머라제 쇄 반응(PCR)을 이용하여 이 BAC 라이브러리를 스크리닝하였다. 뉴클레오티드 위치는 서열 번호 1의 번호매김에 따르며, "C"는 프라이머 서열이 서열 번호1의 상보성 쇄에 해당함을 나타낸다:
PCR을 32 사이클 동안 하기 조건하에서 수행하였다; 94℃, 45초, 54℃, 30초, 72℃, 1분. 부가 시약뿐만 아니라 Taq 폴리머라제는 Gibco BRL(Bethesda)에 의해 공급되었으며, 모든 반응은 5% DMSO를 포함하였다.
클론 B12:03A05를 처음에 프라이머쌍 P61/P62로 검출하고(상기 참고), 이어서 다른 두 개의 프라이머 쌍으로 양성임을 확인하였다. 클론 B12:03A05의 DNA를 표준 알카리 분해 과정에 의해 얻어서 DNA 서열결정에 이용하였다(하기 참고).
답토마이신 유전자 클러스터의 부분들을 포함하는 많은 다른 클론들(dpt-관련 클론들)을 BAC 라이브러리로부터 분리하였다. 이들 클론은 B12:01G05(삽입체 크기 82 kb), B12:06A12(삽입체 크기 85 kb), B12:12F06(삽입체 크기 65 kb), B12:18H04(삽입체 크기 46 kb) 및 B12:20C09(삽입체 크기 65 kb)를 포함한다. 이들 BAC 클론의 HinDIII 분해를 보여주는 도 7 참고. 답토마이신 유전자 클러스터 영역에서 분리된 다른 BAC 들은 B12:09D02, B12:17F08, B12:05D08, B12:15H07, B12:21F10, 및 B12:16D12를 포함한다. 이들 BAC들은 180 내지 200 kb를 커버한다. 도 8은 답토마이신 유전자 클러스터에 대한 BAC 클론의 대략적인 위치를 보여준다.
ABI 프리즘 염료 종결인자 사이클 서열결정 준비 반응 키트(Perkin Elmer),제조자의 추천 반응 혼합물 및 조건, 그리고 하기 프라이머(C는 프라이머 서열이 서열 번호 1의 상보성 쇄에 해당함을 나타냄)를 이용하여 클론 B12:03A05로부터의 BAC DNA 1 ㎍ 분액을 서열결정하여, 실시예 2에서 결정된 답토마이신 생합성 유전자 클러스터 서열을 연장하였다.
일렉트로파네로그램(electrophanerogram)을 검사하여 필요한 대로 교정하고, AssemblyLign Module of MacVectorTM을 이용하여 서열을 배열하였다. 배열된 서열(contig)을 분석과 주석을 위하여 MacVectorTM파일로 저장하였다. MacVectorTM의 오픈 리딩 프레임 옵션을 이용하여 가능한 ORF와 가능한 중지/개시를 동정하였다.
90 kb 서열의 분석은 답토마이신 생합성 유전자 클러스터 영역내에 총 38개의 오픈 리딩 프레임을 보여주었다. 도 2 참고. ORF는 228 염기쌍 내지 22 kb 범위의 크기이다. 세 개의 가장 큰 ORF는 하기하는 바대로 NRPS 유전자들이다. NRPS 유전자들 중 하나는 보존된 모티프, GXSXG의 존재에 기초하여 티오에스테라제 활성을갖는 것으로 예측되었다(실시예 3 참고). 또다른 예측된 오픈 리딩 프레임은 또한 티오에스테라제 활성을 갖는 단백질을 코딩한다(실시예 3 참고). 많은 가능한 ABC 수송자가 또한 동정되었다.
답토마이신 생합성 유전자 클러스터의 서열이 서열 번호 1에 나타난다. 또한 도 2 참고. 답토마이신 비리보솜 펩티드 신세타제(NRPS)를 코딩하는 유전자를 dptA, dptBC, 및 dptD로 표시한다. 상부 ORF의 일부가 아니며 관심 ORF의 시작점으로부터 상부에 있는 모든 서열을 프로모터 영역으로 지정한다. dptA, dptBC, 및 dptD가 겹치는 개시 및 종결 코돈을 가지며 명백히 번역이 연결되어 있으므로(예를 들어, dptBC의 TGA 종결 코돈은 dptD의 ATG 개시 코돈과 겹치며, 이는 아마도 그 자신의 리보솜 결합 부위와 연합되어 있다), 전체 집단(dptE, dptF, dptA, dptBC, 및 dptD를 포함)의 프로모터를 답토마이신 NRPS 프로모터로 나타낸다.
답토마이신 NRPS dptA 유전자의 ORF의 DNA 서열(서열 번호 1의 뉴클레오티드 38555-56047)이 서열 번호 10에 나타난다. 이 ORF는 17493 뉴클레오티드 길이이다. 코딩된 DptA 단백질의 아미노산 서열은 서열 번호 9에 나타난다. 이 단백질은 5830 아미노산 잔기 길이이다.
답토마이신 NRPS dptBC 유전자의 ORF의 DNA 서열(서열 번호 1의 뉴클레오티드 56044-78060)이 서열 번호 12에 나타난다. 이 ORF는 22017뉴클레오티드 길이이다. 코딩된 DptBC 단백질의 아미노산 서열은 서열 번호 11에 나타난다. 이 단백질은 7338 아미노산 잔기 길이이다.
답토마이신 NRPS dptD 유전자의 ORF의 DNA 서열(서열 번호 1의 뉴클레오티드78057-85196)이 서열 번호 3에 나타난다. 이 ORF는 7140 뉴클레오티드 길이이다. dptD 유전자 ORF는 C-말단의 타입 I 티오에스테라제(TE I) 도메인을 코딩한다. 예측된 DptD 단백질의 아미노산 서열은 서열 번호 7에 나타난다. 이 단백질은 2379 아미노산 잔기 길이이다.
dptE와 dptF 유전자는 dptA와 답토마이신 NRPS 프로모터 사이에 위치한다.
dptH 티오에스테라제-코딩 유전자의 DNA 서열은 서열 번호 4에 나타나며(서열 번호 1의 뉴클레오티드 85498-86350); dptH의 프로모터 영역은 서열 번호 5에 나타나며(서열 번호 1의 뉴클레오티드 85498-85534); dptH의 오픈 리딩 프레임은 서열 번호 6에 나타난다(서열 번호 1의 뉴클레오티드 85535-86350). 예측된 DptH 단백질의 아미노산 서열은 서열 번호 8에 나타난다(도 4 참고).
답토마이신 NRPS의 프로모터 영역(서열 번호 1의 뉴클레오티드 36018-36407)은 서열 번호 2에 나타난다.
90kb contig의 하부 DNA의 서열은 GPS-1 게놈 프라이밍 시스템(New England Biolabs)와 같은 시스템을 이용하는 트랜스포존 프라임된 서열결정에 의해 플라스미드 pV107로부터 Genome Therapeutics Corps.에 의해 생성되었다. 플라스미드 pV107은 표준 기법을 이용하여 B12:03A05 게놈으로부터 벡터 pNEB193(EcoRI(New England Biolabs)로 절단됨)내로 서브클론된 대략 28 kb EcoRI 단편을 포함한다. 이 단편은 GTC2라 불린다. 적절한 수의 트랜스포존이 꼬리에 붙은 라이브러리 클론을 서열 결정하여 6-배 여분을 갖는 contig를 생성하였으며, PCR 생성물의 부가적인 국소적 서열 결정을 이용하여 필요한 위치의 서열을 마무리했다. contig의 5'말단과 기존의 90 kb 사이의 겹치는 부분을 contig로부터 제거하여, pV107 유래 서열(GTC2로 칭함)의 시작점은 1로 시작한다. GTC2 단편의 서열은 서열 번호 106에 제공된다.
실시예 3: dptD와 dptH 유전자의 티오에스테라제로서의 동정
dptD와 dptH 유전자와 예측된 그들의 번역 생성물을 검사하여 비리보솜 펩티드 신세타제와 티오에스테라제에 전형적인 아미노산 모티프를 동정하였다. X가 번역단계에서 리보솜에 의해 생성된 단백질에 삽입되는 20개의 L-아미노산 중 임의의 하나인 아미노산 서열 모티프 GXSXG가 티오에스테라제를 나타낸다(Mootz et al., J.Bacteriol. 179:6843-6850, 1997, 본원에 참고로 통합됨). 서열 번호 7-8을 GXSXG 티오에스테라제 모티프에 대해 검사하였다. 서열 번호 7에서, 티오에스테라제 모티프 GWSFG에의 아미노산 서열 매치가, 서열 번호 1의 뉴클레오티드 84654-84668에 의해 코딩되는 좌표(coordinates) 2200-2204에서 발견되었다. 서열 번호 8에서, 티오에스테라제 모티프 GTSLG에의 아미노산 서열 매치가, 서열 번호 1의 뉴클레오티드 85823-85838에 의해 코딩되는 좌표 97-101에서 발견되었다.
서열 번호 7의 DptD 단백질을 스트렙토마이세스 코엘리컬러의 CDA III 단백질에 배열시켰다. 이 배열은 느린 페어방식 배열 모드로 Clustal w(V 1.4) 프로그램을 이용하여 수행되었다. 10.0의 오픈 갭 패널티, 0.1의 연장된 갭 패널티, 및 CDA III 단백질에의 블로섬(blosum) 유사성 매트릭스가 이용되었다. CDA III 단백질은 카르복시-말단 티오에스테라제 도메인을 가진 비리보솜 펩티드 신세타제이다(GENBANK 기탁 번호 AL035707, 버젼 AL035707.1 GI:4490978, 본원에참고로 통합됨). 배열에 이용된 CDA III 아미노산 서열은, 두 개의 GENBANK 코스미드 서열, AL035707과 AL035640으로부터 콘티그(contig)를 생성시키고 이어서 오픈 리딩 프레임을 GENBANK에서 주석된 콘티그에서 번역시켜 MacVector 프로그램을 이용하여 생성되었다. 서열 비교 결과(도 3) 7705와 1223의 보존된 동일성의 배열 점수를 나타냈으며, 이는 두 비교 서열간의 상당한 유사성을 나타낸다. DptD 단백질과 CDA III 단백질의 GXSXG 티오에스테라제 모티프를 이 분석에서 배열하였다.
서열 번호 8의 DptH 단백질의 GXSXG 티오에스테라제 모티프를 스트렙토마이세스 코엘리컬러(CAA71338 단백질, 상기 참고)의 CDA III 단백질의 GXSXG 티오에스테라제 모티프에 배열시켰다. 이 배열은 느린 페어방식 배열 모드로 Clustal W(V 1.4) 프로그램을 이용하여 수행되었다. 10.0의 오픈 갭 페널티, 0.1의 연장된 갭 페널티, 및 GENPEPT 레코드 CAA71338(버젼 CAA71338.1 GI:2647975, 본원에 참고로 통합됨)의 스트렙토마이세스 티오에스테라제 단백질에의 블로섬 유사성 매트릭스가 이용되었다. 이 배열 결과(도 4) 955와 145의 보존된 동일성의 배열 점수를 나타냈으며, 이는 두 비교 서열간의 상당한 유사성을 나타낸다.
이들 분석은 dptD와 dptH가 티오에스테라제 단백질, 구체적으로 서열 번호 7-8의 단백질을 코딩함을 나타낸다.
실시예 4: 답토마이신 NRPS의 동정
답토마이신 NRPS 서브유닛으로서 dptD의 동정
전술한 dptD DNA 서열의 예측된 번역 생성물(실시예 2와 3)을 NRPS 문헌에 개시된 다양한 단백질 모티프가 존재하는 지를 시각적으로 검사하였다. 축합 도메인을 나타내는 dptD 축합("M") 모티프가 서열 번호 1의 뉴클레오티드 78486-78509에서 동정되었다(실시예 4-6에 개시된 모든 뉴클레오티드 위치는 서열 번호 1에 대한 것임). 예를 들어 NRPS내의 다양한 모티프를 위해서는 Kleinkauf et al., Eur.J.Biochem., 236, pp.335-351(1996) 및 Pospiech et al., Microbiology, 142, pp.741-746(1996) 참고. ATP-결합("C") 모티프가 뉴클레오티드 79896-79928에서 동정되었으며, ATP-결합("E") 모티프가 뉴클레오티드 80451-80486에서 동정되었으며, ATPase("F") 모티프가 뉴클레오티드 80556-80579에서 동정되었으며, ATP-결합("G") 모티프가 뉴클레오티드 80652-80675에서 동정되었다. 이들 모티프는 총체적으로 아데닐화 도메인을 나타낸다. 티올화(PCP) 도메인을 나타내는 티올화("J") 모티프는 뉴클레오티드 81048-81062에서 동정되었다. 상기 모티프들, 및 그들이 상징하는 도메인들은 dptD의 모듈 1에 속하며, 답토마이신 신세타제의 관점에서 이는 모듈 12이다.
축합 도메인을 나타내는 다른 dptD 축합("M") 모티프는 뉴클레오티드 81621-81644에서 동정되었다. 다른 ATP-결합 ("C") 모티프는 뉴클레오티드 83114-83147에서 동정되었으며, ATP-결합("E") 모티프가 뉴클레오티드 83667-83702에서 동정되었으며, ATPase("F") 모티프가 뉴클레오티드 83772-83795에서 동정되었으며, ATP-결합("G") 모티프가 뉴클레오티드 83868-83891에서 동정되었다. 이들 모티프는 총체적으로 또 다른 아데닐화 도메인을 나타낸다. 티올화(PCP) 도메인을 나타내는 티올화("J") 모티프는 뉴클레오티드 84255-84269에서 동정되었다. 상기 모티프들, 및 그들이 상징하는 도메인들은 dptD의 모듈 2에 속하며, 답토마이신 신세타제의 관점에서 이는 모듈 13이다.
전술한 예측된 모티프와 도메인에 상응하는 DptD 아미노산 서열이 동정되었다(DptD를 위한 아미노산 위치는 모두 서열 번호 7의 아미노산 위치를 말함). DptD의 모듈 1(답토마이신 신세타제의 모듈 12에 해당)에 속하는 모티프들, 및 그들이 상징하는 도메인은 하기와 같다: DptD 축합("M") 모티프는 좌표 144-151에서 동정되었으며; ATP-결합 ("C") 모티프는 좌표 614-624에서 동정되었으며, ATP-결합("E") 모티프가 좌표 799-810에서 동정되었으며, ATPase("F") 모티프가 좌표 834-841에서 동정되었으며, ATP-결합("G") 모티프가 좌표 866-873에서 동정되었으며, 티올화("J") 모티프는 좌표 998-1002에서 동정되었다.
DptD의 모듈 2(답토마이신 신세타제의 모듈 13에 해당)에 속하는 DptD 모티프들, 및 그들이 상징하는 도메인은 하기와 같다: DptD 축합("M") 모티프는 좌표 1189-1196에서 동정되었으며, ATP-결합 ("C") 모티프는 좌표 1687-1697에서 동정되었으며, ATP-결합("E") 모티프가 좌표 1871-1882에서 동정되었으며, ATPase("F") 모티프가 좌표 1906-1913에서 동정되었으며, ATP-결합("G") 모티프가 좌표 1938-1945에서 동정되었으며, 티올화("J") 모티프는 좌표 2067-2071에서 동정되었다. ATP-결합 모티프는 아데닐화 도메인을 나타낸다.
답토마이신 NRPS 서브유닛으로서 dptA와 dptBC의 동정
일부 M,C,E,F,G 및 J 모티프가 유사한 방식으로 dptA와 dptBC에서 동정되었다. 각 모티프의 서열과 유형, 각 모티프가 발견되는 유전자와 모듈, 및 각 모티프의 아미노산과 뉴클레오티드 좌표가 표 1에서 나타난다:
표 1의 아미노산 좌표는 각 단백질의 아미노산 서열(DptA: 서열 번호 9; DptBC: 서열 번호 11)을 나타낸다. 뉴클레오티드 위치는 서열 번호 1의 뉴클레오티드 위치를 나타낸다.
실시예 5: 아미노산 포켓 코드 주석
아미노산 포켓 코드는 동족 아미노산의 인식 및/또는 결합에 관여하는 것으로 생각되는 아데닐화(A) 도메인의 아미노산 잔기 세트를 말한다. 13개의 답토마이신 신세타제 모듈을 위한 아미노산 포켓 코드가 하기에 나타난다(표 2).
답토마이신 신세타제 모듈을 위한 아미노산 포켓 코드는 Blast 분석 또는 NRPS A 도메인(아미노산 결합 포켓)과 배열된 추정적 Dpt 번역 생성물의 MacVector 7.0을 이용하여 생성된 배열을 가시적으로 검사하여 동정되었다(Stachelhaus et al.(1999), The specificity-conferring code of adenylatin domains in nonribosomal peptide synthetases, Chem.Biol.,6:493-505에 개시됨). 또한 Challis et al., (2000), Predictive, structure-based model of amino acid recognition by nonribosomal peptide synthetase adenylation domains,Chem.Biol.7:211-224 참고.
표 2의 아미노산 좌표는 각 단백질의 아미노산 서열을 나타낸다(DptA:서열 번호 9; DptBC: 서열 번호 11; DptD: 서열 번호 7). 뉴클레오티드 위치는 서열 번호 1의 뉴클레오티드 위치를 나타낸다.
답토마이신 유전자 클러스터의 아스파테이트와 아스파라긴을 위한 전체 아데닐화 도메인과 스트렙토마이세스 코엘리컬러의 CDA III NRPS의 아스파테이트, 아스파라긴 및 트레오닌을 위한 아데닐화 도메인간의 유사성은 도 10에 나타난다. 아미노산을 배열하고 Macvector를 이용하여 계통수를 구성하였다. 명명법은 다음과 같다: 유전자의 이름 -- 그 유전자내의 모듈의 수 -- 활성화된 아미노산(단문자 코드). 이 배열은 답토마이신 유전자 클러스터내의 아스파테이트와 아스파라긴을 위한 아데닐화 도메인이 트레오닌과 같은 무관한 아미노산으로부터의 도메인에 대해서보다 서로간에 더 유사함을 보여준다. 또한, 이 배열은 답토마이신 유전자 클러스터내의 아스파테이트와 아스파라긴을 위한 아데닐화 도메인이 CDA의 아스파테이트와 아스파라긴을 위한 모듈에 대해서보다 서로간에 더 유사함을 보여준다.
실시예 6: 답토마이신 NRPS의 에피머라제 도메인의 동정
DptA, DptBC, 및 DptD의 아미노산 서열을 에피머라제 도메인의 특징부인 서열에 대해 검사하였다. 에피머라제 도메인은 L-아미노산을 D-아미노산으로 전환시키는 역할을 하며 일반적으로 대략 1.4-1.6 kb DNA에 의해 코딩된다.
답토마이신 유전자 클러스터내에 총 2개의 에피머라제 도메인이 있을 것으로 예상되었는데, 이는 답토마이신이 2개의 D-아미노산, D-Ala와 D-Ser을 함유하는 것으로 알려져 있었기 때문이다. 하나의 에피머라제 도메인은 모듈 8(D-Ala)과 모듈 11(D-Ser)의 각각에서 동정되었다. 모듈 8과 11은 에피머라제 도메인을 함유하지 않는 모듈보다 대략 1.4 kb 더 크다(에피머라제 도메인을 함유하지 않는 모듈이 각각 3.2 kb인데 비하여 모듈 8과 11은 각각 대략 4.6 kb임). 또한, 모듈 8과 11은 모티프 K,L,M,N,O,P 및 Q를 포함한, 에피머라제 도메인을 나타내는 모티프들을 함유한다(Kleinkauf and Von Dohren, 236:355-351(1996)). 표 3 참고.
놀랍게도, 에피머라제 도메인은 또한 모듈 2에서 동정되었다. 모듈 2는 예상보다 1.6 kb 더 크다. 또한, 모듈 2는 모티프 K,L,M,N,O,P 및 Q를 포함한, 에피머라제 도메인의 특징인 많은 모티프를 함유한다. 표 3 참고. 이러한 예상치 못한 발견은 답토마이신의 아스파라긴이 D 형태임을 나타낸다.
표 3의 아미노산 좌표는 각 단백질의 아미노산 서열을 나타낸다(DptA:서열 번호 9; DptBC: 서열 번호 11; DptD: 서열 번호 7). 뉴클레오티드 위치는 서열 번호 1에서의 뉴클레오티드 위치를 나타낸다.
답토마이신의 아스파라긴이 D 형태임을 확인하기 위하여, 고압액체크로마토그래피(HPLC)를 수행하였다. 아미노산 오르니틴, 글리신, 트레오닌, 아스파르트산, 아스파라긴, 및 탈아실화된 트립토판을 함유하는 헥사-펩티드(Trp-Asn-Asp-Orn-Gly-Thr)을 분해하여 답토마이신으로부터 분리하였다. 상기 펩티드를 D-Asn 또는 L-Asn을 함유하는 펩티드를 분리시키는 조건하에서 HPLC에 의해 분석하였다. HPLC는 분리된 상기 펩티드에 대하여 단지 하나의 큰 피크만을 나타냈다. 도 11의 왼쪽 패널을 참고. 답토마이신으로부터 분리된 펩티드를 실험실에서 합성되고 D-Asn을 함유한 동일 서열의 펩티드와 혼합하였다. 이 펩티드 혼합물을 전술한 동일 조건하에서 HPLC에 의해 분석하였으며 단일 피크만을 함유하는 것으로 나타났다. 도 11, 중간 패널 참고. 또한, 답토마이신으로부터 분리된 펩티드를 L-Asn을 함유하는 동일 서열의 합성 펩티드와 혼합하였다. HPLC 분석은 두 개의 피크를 나타냈다. 도 11, 오른쪽 패널 참고. 이들 실험은 자연 발생 답토마이신이 L-Asn이 아니라 D-Asn을 함유함을 확인한다.
실시예 2-7에 개시된 실험들로부터, 답토마이신 NRPS의 조직이 결정되었다. 도12는 dptA, dptBC, 및 dptD의 조직을 나타낸다. dptA는 다섯 개의 모듈(모듈 1-5)을 함유하고, dptB는 여섯 개의 모듈(모듈 6-11)을 함유하고, dptD는 두 개의 모듈(모듈 12-13)과 티오에스테라제 도메인을 함유한다. 표 4는 13개 모듈, 그들의 도메인, dpt 유전자, 및 그들의 동족 아미노산간의 상응성을 요약한다. "C"는 촉매 도메인을 나타내고, "A"는 아데닐화 도메인을 나타낸고, "T"는 티올화 도메인을 나타내고, "E"는 에피머라제 도메인을 나타내며, "Te"는 티오에스테라제 도메인을 나타낸다.
실시예 7: 스트렙토마이세스 로제오스포루스로부터의 답토마이신 유전자 클러스터를 이용한 스트렙토마이세스 리비단스의 형질전환
클론 B12:03A05로부터의 BAC DNA를 함유하는 이. 콜라이 세포(실시예 2 참고)를 교반(250 rpm)하면서 37℃에서 밤새 루리아(Luria) 브로스(LB; Difco) 5 ml에서 성장시켰다. BAC DNA를 표준 알카리 용해 기법으로 분리하였다(Sambrook et al., supra, "Small scale preparation of plasmid DNA" 참고).
에스. 리비단스 TK64 포자를 이용하여 25 mL의 YEME + 수크로스 배지를 접종하고 배양물을 30℃에서 40 시간 동안 배양하였다. 이어서 배양물을 수집하고 균사체를 상등액으로부터 침전시키고 P-완충액으로 몇번 세척하였다(Practical Streptomyces Genetics; Tobias Kieser, Mervyn J.Bibb, Mark J.Buttner, KeithF.Chater and David Hopwood(John Innes Foundation, Norwich, 2000)("Practical Streptomyces Genetics"). 새로운 원형질체를 상기의 Practical Streptomyces Genetics(p.56)에 개시된 방법에 따라 제조하고 0.5 ml 분액(대략 108-109원형질체)으로 나누고 3000 rpm에서 7분간 원심분리하여 침전시켰다. 대부분의 상등액을 제거하여 펠렛과 약 50 ㎕의 상등액만 남겼다. 펠렛을 남은 상등액에 재현탁하고, 여기에 클론 B12:03A05로부터의 BAC DNA 5 ㎕(TE중의 50 ng/㎕)를 첨가하였다. 이 현탁액을 P-완충액중의 25% PEG-1000 350 ㎕를 첨가하기 전과 후에 부드럽게 혼합하였다(Practical Streptomyces Genetics).
원형질체 현탁액 혼합물을 동등한 양으로 세 개의 건조된 R5T 플레이트(원래 중량의 약 15%를 손실하도록 건조됨: Practical Streptomyces Genetics 참고)에 도말하였다. 접종된 플레이트를 30℃에서 밤새 배양하였다. 16-18 시간 성장시킨 후, 플레이트에 20% 글리세롤중의 아프라마이신 용액(1 mg/ml) 3 ml를 도말하여 각 플레이트에 약 100 ㎍/ml의 최종 농도를 제공하고 플레이트를 30℃에서 배양하였다. 3일 후, 플레이트를 검사하여 아프라마이신 선별하에서 성장하는 콜로니를 함유하는지를 결정하였다. 2개의 콜로니를 뽑아서, 100 ㎕/ml의 아프라마이신을 함유하는 2개의 F10A 아가 플레이트(2.5% 아가, 0.3% 칼슘 카보네이트, 0.5% 증류기 가용성 물질, 2.5% 가용성 전분, 0.5% 효모 추출물, 0.2% 덱스트로스 및 0.5% 박토펩톤; 1L의 탈이온화되고 오토클레이브된 물에 현탁됨)에 스트리킹하고, 콜로니가 생겨날 때까지 30℃에서 배양하였다. 포자를 Practical Streptomyces Genetics에 개시된 방법에 따라 수집하고 -20℃에서 20% 글리세롤 현탁액으로 저장하였다.
에스. 리비단스를 답토마이신 유전자 클러스터를 함유하는 BAC DNA(B12:03A05, CBUK136742에서 유래)로 형질전환시켜 얻어진 포자를 적절한 배지에서 성장시키고 고압 액체 크로마토그래피(HPLC)와 LC-MS로 분석하여 그들이 야생형 리포펩티드 프로파일을 생산하는 지를 결정하였다(실시예 9 참고).
실시예 8: 답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 발효
답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 포자를 5 ml의 10% 수성 글리세롤(BDH)중의 배지 A(2% 조사된 귀리(Quaker), 0.7% 트립톤(Difco), 0.2% 소야 펩톤(Sigma), 0.5% 염화나트륨(BDH), 0.1% 미량 염 용액, 1.8% 아가 no.2(Lab M), 0.01% 아프라마이신(Sigma))의 10일된 슬랜트 배양물에 현탁시켜 수집하였다. 1.5 ml 동결 바이알내의 이 현탁액 1 ml은 -135℃에 저장되었다 나온 출발 물질을 포함한다. 예비 배양물은 상기 출발 물질 0.3 ml를 배지 A1의 경사면에 무균적으로 놓고 28℃에서 9일간 배양함으로써 생산되었다.
종자 배양물은 예비-배양물을 0.1% Tween 80(Sigma) 용액 4 ml로 무균 처리하고 경사면 표면을 부드럽게 하여 성장력있는 균사체와 포자의 현탁액을 형성함으로써 생성되었다. 이 현탁액의 2 ml 분액을 40 ml의 영양 용액 S(1% D-글루코스(BDH), 1.5% 글리세롤(BDH), 1.5% 소야 펩톤(Sigma), 0.3% 염화나트륨(BDH), 0.5% 맥아 추출물(Oxoid), 0.5% 효모 추출물(Lab M), 0.1% Junlon PW100(Honeywell and Stein Ltd), 0.1% Tween 80(Sigma), 4.6%MOPS(Sigma), pH 7.0으로 조정되며 오토클레이브됨)를 함유하는, 격벽을 갖춘 250 ml 플라스크내로 옮겨서 30℃에서 44 시간 동안 240 rpm에서 교반하였다.
종자 배양물 5%를 50 ml의 배지 P(1% 글루코스(BDH), 2% 가용성 전분(Sigma), 0.5% 효모 추출물(Difco), 0.5% 카제인(Sigma), 4.6% MOPS(Sigma0, pH 7로 조정되고 오토클레이브됨)를 함유하는 격벽을 갖춘 250 ml 플라스크로 옮기고 30℃에서 7일 동안 240 rpm에서 교반하여 생성물 배양물을 생성시켰다.
실시예 9: 답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 발효로부터 얻은 A21978C 리포펩티드의 정제 및 분석
실시예 8에 개시된 생성물 배양물의 전체 배양물 2 ml를 무균적으로 제거하여 10분간 원심분리한 후 분석함으로써, 상기 생성물 배양물을 분석 샘플로 하였다. 최대 부피 50 ㎕의 상등액을 분석하여 스트렙토마이세스 로제오스포루스에 의해 생산된 천연 리포펩티드(A21978C)의 생산을 모니터하였다. 이 분석은 4.6 X 50 mm Symmetry C8 3.5 ㎛ 컬럼과 Phenomenex Security Guard C8 카트리지를 갖춘 996 PDA 검출기와 Waters Alliance 2690 HPLC 시스템을 이용하여 주위 온도에서 수행되었다. 구배는 처음에는 90% 물과 10% 아세토니트릴에서 2.5분간 유지되며, 이어서 6분에 걸쳐 100% 아세토니트릴까지 선형 구배가 뒤따른다. 유속은 분당 1.5 ml이며 구배는 0.01% 트리플루오로아세트산으로 완충된다. 발효 2일째에 천연 리포펩티드 중 세 개, C1, C2, 및 C3의 생산(답토마이신과 동일한 UV/가시광선 스펙트럼을 가짐)이 명백했으며, 도 5A에 나타난 바처럼, 개시된 분석 조건하에서 보유 시간 5.62, 5.77 및 5.90분을 갖는 HPLC 피크(λmax 223.8, 261.5 및 364.5 nm)로 나타났다. 이어서 리포펩티드는 7일 기간 동안 각 샘플 지점에서의 발효에서 명백하게 유지되었다. 리포펩티드 C1, C2, 및 C3의 총 수율은 발효 물질 리터당 10-20 mg 범위였다.
액체 크로마토그래피-질량 스펙트로미트리(LC-MS) 분석은 양성 이온 모드의 일렉트로스프레이 이온화를 이용하여 Finnigan SSQ710c LC-MS 시스템상에서 200-2000 달톤의 스캔 범위와 2초 스캔으로 수행되었다. 크로마토그래피에 의한 분리는 0.01% 포름산을 함유하는 선형 물-아세토니트릴 구배로 용출되는 Waters Symmetry C8 컬럼(2.1 x 50mm, 3.5 ㎛ 입자 크기)상에서 이루어지며, 상기 구배는 0.5분의 초기 지연 후 6분의 기간에 걸쳐 10% 아세토니트릴로부터 100% 아세토니트릴로 증가되며 이어서 재평형화 전에 추가 3.5분간 100% 아세토니트릴에서 유지되었다. 유속은 0.35 ml/분이며 이 방법은 주위 온도에서 수행되었다.
스트렙토마이세스 로제오스포루스에 의해 생산된 주요 A21978C 리포펩티드 대사물 C1, C2, 및 C3에 대해 보고된 질량과 일치하는 1634.7, 1648.7 및 1662.7의 m/z에서의 분자 이온([M+H]+)에 의해 나타내지는 바와 같이, 세 개의 천연 리포펩티드의 동정이 확인되었다.(Debono et al., J.Antibiotics, 40, pp.761-777(1987)).
BAC 클론 01G06, B12:06A12, B12:12F06 및 B12:18H04를 이용하여 유사한 실험을 수행하였다. 이들 BAC 클론중 어느 하나를 함유하는 에스. 리비단스 세포의 어느 것도 답토마이신을 생산할 수 없었다.
실시예 10: 답토마이신의 생산을 위한 답토마이신 유전자 클러스터를 함유하는 스트렙토마이세스 리비단스 TK64 클론의 공급-배치 발효
답토마이신 유전자 클러스터(클론 B12:03A05에서 유래)를 함유한 스트렙토마이세스 리비단스 TK64 클론의 세포를 5 ml의 10% 수성 글리세롤(BDH)중의 배지 A(Practical Streptomyces Genetics 참고: 2% 조사된 귀리(Quaker), 0.7% 트립톤(Difco), 0.2% 소야 펩톤(Sigma), 0.5% 염화나트륨(BDH), 0.1% 미량 염 용액, 1.8% 아가 no.2(Lab M), 0.01% 아프라마이신(Sigma))의 10일된 경사 배양물에 현탁시켜 재생시켰다. -135℃에 저장되었던, 출발 물질 1 ml를 함유하는 1.5 ml 동결 바이알을 꺼내어 신속하게 녹였다. 예비 배양물은 상기 출발 물질 0.3ml를 배지 A의 경사면에 무균적으로 놓고 28℃에서 9일간 배양함으로써 생산되었다. 종자 배양물의 접종을 위한 재료는 예비-배양물을 0.1% Tween 80(Sigma) 용액 4 ml로 무균 처리하고 경사면 표면을 부드럽게 하여 성장력있는 균사체와 포자의 현탁액을 형성함으로써 생성되었다.
종자 배양물은 250 ml의 영양 용액 S(Practical Streptomyces Genetics 참고)를 함유하는 격벽을 갖춘 2 L짜리 Erlenmeyer 플라스크내로 접종 물질 1 ml를 무균적으로 놓음으로써 생산되었으며 30℃에서 2일간 240 rpm에서 교반되었다.
생성물 배양물은 종자 배양물을 영양 용액 P(Practical Streptomyces Genetics 참고) 14 L를 함유하는 20 L 발효기내로 무균적으로 옮김으로써 생성되었다. 생성물 발효기를 350 rpm에서 교반하고, 0.5 vvm에서 통기시키고, 온도를 30℃로 조절하였다. 20 시간 배양한 후, 발효동안 50%(w/v) 글루코스 용액을 상기 배양물에 5 g/hr로 공급하였다.
40 시간 배양 후, 데카노산:메틸 올레이트(각각 Sigma and Acros Organics)의 50:50 혼합물을 발효 나머지 기간 동안 0.5 g/hr로 발효기에 공급하였다. 배양물을 112 시간 후에 수집하고, 볼(bowl) 원심분리기를 통해 배치 가공하여 생물질을 배양물 상등액으로부터 제거하였다.
생물질을 버리고 깨끗해진 발효 브로스를 추출을 위해 보관하였다. 브로스(약 10 L)를, 물로 예비평형화된 HP20 레진의 60 mm(직경) x 300 mm (길이) 컬럼 상에 100 ml/min의 속도로 로딩하였다. 컬럼을 2L의 물 및 이어서 1.5 L의 80% 메탄올(물중의)로 비슷한 유속으로 세척하였다. 마지막으로, 결합된 물질을 2 L 메탄올로 용출하고 이어서 진공하에서 수성 농축물로 만들었다. 이 농축물을 정제수로 1 L로 희석하고 에틸 아세테이트(700 ml)로 세 번 분배시켰다. 에틸 아세테이트 분획을 분석하고 버리고, 수성 층을 분말로 동결건조하였다.
동일한 패킹을 갖춘 2개의 40x100mm Waters NovaPak C18 6㎛ 유닛과 40x10mm Guard-Pak으로 구성된 방사상으로 압축된 카트리지 컬럼을 이용하여 고 성능 액체 크로마토그래피(HPLC)에 의해 답토마이신을 분리하였다. 동결건조된 물질(150 내지 200 mg)을 물에 용해시키고, 초기 조건이 90% 물과 10% 아세토니트릴이고, 이어서 10분에 걸쳐 20% 물과 80% 아세토니트릴로 선형으로 증가되고, 이어서 즉시 추가 1분 동안 100% 아세토니트릴로 증가되는 구배를 이용하여 컬럼상에서 크로마토그래피하였다. 223 nm에서의 UV 흡광도를 답토마이신의 용출에 대해 모니터하였다. 답토마이신 피크는 약 9분에서 용출되어 수집되고 수회 반복된 용출에 걸쳐 합쳐졌다. 이어서 샘플을 진공하에서 증발시키고 진공에서 건조시켜 30 mg의 정제된 화합물을 얻었다. 전체 물질의 단지 일부만을 처리하였다.
정제된 화합물을 먼저 996 PDA 검출기와 Waters Alliance 2690 HPLC 시스템을 이용하여 Phenomenex Security Guard C8 카트리지를 갖춘 4.6 X 50 mm Symmetry C8 3.5 ㎛ 입자 크기 컬럼상에서 주위 온도에서 역상 HPLC에 의해 분석하였다. 컬럼을 물-아세토니트릴 구배로 용출하였으며, 구배는 처음에는 90% 물에서 2.5분간이며, 이어서 6분에 걸쳐 100% 아세토니트릴까지 선형으로 증가되었으며, 유속은 분당 1.5 ml였다. 구배는 0.01% 트리플루오로아세트산으로 완충되었다. 이 크로마토그래피 분석은 보유 시간(5.52분)과 정제된 화합물의 UV 흡수 스펙트럼(λmax 223.8, 261.5, 366.9nm)이 답토마이신의 것들과 일치함을 확인했다. LC-MS(ESI)는 1620.6의 분자 이온 MH+를 확인하였으며,1H NMR(D6-DMSO)는 답토마이신에 대해 기록된 것과의 우수한 가시적 매치를 보여주었다(도 5C).
이 물질이 답토마이신임은13CNMR 실험에 의해 추가로 확인되었다.
공급물-배치 발효는 또한 더 큰 규모, 예를 들어 60,000 리터로 이루어질 수 있다.
실시예 11: 수율 증가를 위한 답토마이신 유전자의 용도
제1장 긍정적 조절 유전자의 복사
스트렙토마이세스 로제오스포루스의 염색체중의 중성 게놈 부위를 TN5097 또는 관련 트랜스포존을 이용한 트랜스포존 돌연변이유발, 및 이어지는 발효 분석에 의해 동정한다. 중성 부위와 트랜스포존의 바깥쪽을 절단하는 제한 엔도뉴클레아제를 이용하여 염색체로부터 이 중성 부위를 잘라내고, 트랜스포존의 항생제 내성 마커(TN5097의 경우에는 하이그로마이신 내성)의 발현에 대해 선별하면서 이. 콜라이에 클로닝하였다. 이러한 접근법의 예는 티로신 생산자인 스트렙토마이세스 프라디에의 중성 부위를 동정하는 데 이용되었다. 본원에 참고로 통합되는 Baltz et al., Antonie van Leeuwenhoek, 71, pp.179-187(1997) 참고. 에스. 로제오스포루스에서 중성 부위를 동정하는 예는 본원에 참고로 통합되는 McHenney et al., J.Bacteriol., 180, pp.143-151(1998)에 개시된다.
답토마이신 유전자 클러스터로부터의 조절 유전자(서열 번호 109)를 중성 부위내에서 플라스미드로 클로닝한다. 적절한 플라스미드는 단일 크로스오버를 함유하는 일차 재조합체의 선별을 위한 항생제 내성 유전자, 야생형 rpsL 유전자와 같은 반대 선별이 가능한 마커, 클론된 조절 유전자와 상부 및 하부 서열을 염색체 중성 부위내로 삽입하고 플라스미드 서열을 제거하는 이중 크로스오버를 함유하는 재조합체의 선별을 위한 스트렙토마이신에 대한 민감성을 부여하는 리보좀 단백질 유전자(Hosted and Baltz, J.Bacteriol., 179, pp.180-186(1997)) 및 플라스미드의 큐어링을 촉진하는 열민감성 레플리콘을 함유하는 것이다. 이중 크로스오버는 rpsL 유전자에 돌연변이를 함유하고 있기 때문에 스트렙토마이신에 대해 정상적으로는 내성인 숙주 균주에서 이루어진다. rpsL의 야생형(스트렙토마이신-민감성) 대립유전자는 스트렙토마이신 내성에 대해 우성이므로, 스트렙토마이신 내성을 발현하는 재조합체는 중성 부위의 두개의 아암(arm)에서의 이중 크로스오버에 의해 플라스미드상의 rpsL 유전자를 제거하고 따라서 클론된 답토마이신 조절 유전자를 염색체내로 삽입했음에 틀림없다. 재조합체는 그들이 클론된 답토마이신 조절 유전자가 없는 모 균주에 비하여 증가된 수율을 가짐을 입증하기 위해 발효된다.
ABC 수송자 유전자의 복제
상부 및 하부 서열을 포함한, 답토마이신 유전자 클러스터로부터의 ABC 수송자 유전자 하나 이상을 전술한 벡터의 중성 부위내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 ACB 수송자 유전자가 없는 모 균주에 비하여 증가된 답토마이신 수율을 가짐을 확인한다.
novA, B, C 상동체의 복제
상부 및 하부 서열을 포함한, 답토마이신 유전자 클러스터로부터의 novA, B, C 상동체를 함유하는 DNA 단편을 벡터의 중성 부위내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 novA, B, C 유전자가 없는 모 균주에 비하여 증가된 답토마이신 수율을 가짐을 확인한다.
답토마이신 생합성 유전자의 복제
지방 아실-CoA 리가제, NRPS의 세개의 서브유닛, dptD의 통합 티오에스테라제 및 dptH의 유리 티오에스테라제를 포함한, 답토마이신 생합성 유전자, dptA, dptBC, dptD, dptE, dptF, dptG, 및 dptH를 phiC31 부착 및 통합 기능(att/int) 및 플라스미드 RK2로부터의 oriT(Baltz, Trends in Microbiol.,6:76-83(1998), 참고로 본원에 통합)를 함유하는 BAC 벡터내로, 이. 콜라이로부터 에스. 로제오스포루스로의 접합을 위해 클로닝시켰다. 답토마이신 유전자를 함유하는 상기 BAC를 이. 콜라이 S17.1, 즉 자가 복제 플라스미드 RK2를 함유하는 균주로부터의 접합에 의해 에스. 로제오스포루스내로 도입하였다. 다르게는, BAC 벡터는 답토마이신 유전자 클러스터내로의 상동성 재조합에 의해 염색체내로 도입된다. 재조합체를 발효시켜 그들이 클론된 답토마이신 유전자가 없는 모 균주에 비하여 증가된 답토마이신 수율을 가짐을 확인한다.
답토마이신 티오에스테라제 유전자의 복제
답토마이신 유전자 클러스터(서열 번호 1)는 티오에스테라제 활성을 갖는 단백질의 특징적인 보존된 서열 모티프를 포함하는 아미노산 서열을 코딩하는 오픈 리딩 프레임을 갖는 적어도 두 개의 유전자(dptD와 dptH) (각각 서열 번호 3과 6) 또는 그 도메인을 함유한다. DptD와 DptH 아미노산 서열 각각을 위해 서열 번호 7과 서열 번호 8 참고. 이들 티오에스테라제 유전자 또는 이들의 티오에스테라제 도메인의 어느 하나(또는 둘다)는 상기 실시예 11A의 과정을 따라 복사될 수 있다.
선택적으로 발현 조절 서열(예를 들어 서열 번호 1 또는 2의 천연 조절 서열)에 작동적으로 연결되고, 선택적으로 상부 및 하부 서열을 포함하는 dptD ORF 서열(예, 서열 번호 1; 서열 번호 3)을 함유하는 DNA의 단편을 중성 부위 벡터내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 dptD 유전자가 없는 모 균주에 비하여 증가된 농도의 답토마이신을 생산함을 확인한다.
유사하게, 선택적으로 발현 조절 서열(예를 들어 서열 번호 1, 4 또는 5의 천연 조절 서열)에 작동적으로 연결되고, 선택적으로 상부 및 하부 서열을 포함하는 dptH ORF 서열(예, 서열 번호 4; 서열 번호 6)을 함유하는 DNA의 단편을 중성 부위 벡터내로 클로닝하고 이중 크로스오버에 의해 실시예 11A에 개시된 대로 에스. 로제오스포루스 염색체내로 삽입한다. 재조합체를 발효시켜 그들이 클론된 dptH 유전자가 없는 모 균주에 비하여 증가된 농도의 답토마이신을 생산함을 확인한다.
다른 적절한 숙주(즉, NRPS 또는 PKS 다효소 복합체를 갖는 것들)를 티오에스테라제 활성을 갖는 답토마이신 유전자 클러스터로부터의 단백질 코딩 DNA의 단편으로 형질전환시켜 펩티드 생산을 개선할 수 있다. 다르게는, 그러한 DNA 단편에 의해 코딩되는 폴리펩티드는 당업계에 공지된 단백질 전이 기법에 의해 에스. 로제오스포루스 또는 상기 다른 적절한 숙주내로 도입될 수도 있다.
답토마이신 내성 유전자의 복제
자연 상태에서 답토마이신에 민감한 적절한 스트렙토마이세트 숙주에서 답토마이신 내성 유전자를 클로닝하고 발현시켜 동정할 수 있다. 클론된 답토마이신 내성 유전자를 중성 부위내에서 중성 부위 백터내로 도입하고, 실시예 11A에 개시된 대로 이중 크로스오버에 의해 에스. 로제오스포루스 염색체내로 도입한다. 재조합체를 발효시켜 그들이 클론된 답토마이신 내성 유전자가 없는 모 균주에 비하여 증가된 농도의 답토마이신을 생산함을 확인한다.
답토마이신 생합성 유전자와 부가 유전자의 복제
Practical Streptomyces Genetics, supra에 개시된 대로 접합에 의하여 BAC 클론 B12:03A05를 야생형 스트렙토마이세스 로제오스포루스 A21978.6(ATCC 기탁 번호 31568, CBUK136737)와 스트렙토마이세스 로제오스포루스 A21978.65(NRRL 기탁 번호 15998, CBUK136879)내로 도입하여 엑스접합체(exconjugants), CBUK 136927과 CBUK 138016을 각각 생성하였다. 각각 필터 멸균된 글루탐산, Na 염(BDH) 오르니틴(Sigma)와 아스파르트산(Sigma) 각각 0.1%가 첨가된 배지 P에서 모 균주와 엑스접합체 균주를 세 벌로 실시예 8에 개시된 대로 발효시켰다.
배양물 샘플을 취하여 10일 실험동안 HPLC로 분석하였다. 5 ㎕의 상등액을 주사한 것을 제외하고는 실시예 9에서 개시된 대로 HPLC를 수행하였다. 발효를 행한 후 40-56 시간째에, 에스. 로제오스포루스 천연 리포펩티드 중 세 개(A21978C1, A21978C2 및 A21978C3)의 생산이 명확히 나타났다. 이들 리포펩티드는 모든 후속 샘플 지점에서의 발효에서 존재하였으며, 실험 시간 과정 끝에서 다른 A21978C 인자들이 나타났다. 세 개의 발효 복제물에 대해 평균된, 엑스접합체 CBUK 136927 및 CBUK138016에 의해 생산된 A21978C 리포펩티드의 최대 수율(각각, 284 mg/L와 1488 mg/L)은 각각 모 균주 CBUK 136737(143 mg/L)와 CBUK 136879(726 mg/L)에 의해 생산된 것의 약 2배였다.
실시예 12: 신규한 생성물을 생산하기 위한 답토마이신 생합성 유전자의 용도
A. 아미노산 특이성 코드의 부위-지시된 돌연변이에 의한 펩티드 구조의 변화: 위치 2 D-Asn의 D-Asp로의 전환
답토마이신내의 13 아미노산을 위한 아미노산 특이성 코드가 표 1에 나타난다(실시예 6 참고). 또한 NRPS의 아데닐화 도메인 아미노산 특이성 코드를 동정하고 변화시키는 것에 대해서는 Stachelhaus et al., Chem.Biol.,6,pp.493-505(1999)를 참고. 답토마이신의 위치 3, 7, 및 9의 모든 세개의 L-asp 잔기를 위한 코드는 동일하다; DLTKLGAV(이때 문자들은 표준 아미노산 약자를 나타냄). 위치 2의 D-Asn을 위한 코드는 DLTKLGDV이며, 이는 하나의 아미노산이 차이가 난다(위치 7에서 A 대신 D임). D-Asn 특이성 코드는 PS I의 모듈 2의 아데닐화 도메인에서 부위 특이적을 변화를 만들어 D-Asp를 특정하는 것으로 변화된다.
모듈 2의 돌연변이 버젼은 유전자 치환에 의해 에스. 로제오스포루스내로 삽입된다. 반대 선별가능한 마커(예, 야생형 rpsL 유전자)가 유전자 치환에 의해 모듈 2의 아데닐화 도메인내로 삽입된다. 적절한 열민감성 플라스미드 상의, D-Asp를 위한 코딩 서열을 함유하며 인접 DNA(특이성 코드의 각 측면상에 약 1 내지 5 kb)를 함유하는 돌연변이 모듈 2 아데닐화 도메인이 답토마이신 생합성이 파괴된 에스. 로제오스포루스 균주내로 도입된다. 플라스미드상의 항생제 내성 마커(예, 하이그로마이신, 아프라마이신, 또는 티오스트렙톤 내성)에 대한 선별에 의해 단일 크로스오버를 함유한 재조합체가 비허용성 온도에서 선별된다. 만일 숙주 균주가 염색체 rpsL 유전자에서의 돌연변이에 의해 스트렙토마이신 내성이면, 유전자 치환을 완결하는 두번째 크로스오버가 스트렙토마이신 내성에 대해 선별될 수 있다. 재조합체는 항생제 생산에 대해 스크리닝된다. 답토마이신의 신규 유도체를 예를 들어 미국 특허 RE 32,333, RE32,455, 4,874,843호, 4,482,487호, 4,537,717호, 및 5,912,226호에 개시된 방법들에 따라 분리하고 분석하여 구조를 확인한다.
B. 상이한 아미노산 특이성중 하나를 위한 아미노산 코딩 모듈의 분자적 교환
답토마이신은 네 개의 아미노산을 갖는다: 위치 3,7,9의 세 개의 L-asp 잔기, 및 위치 12의 3-메틸-Glu(3-MG)(표 1, 실시예 6 참고). 답토마이신의 신규 유도체는 3-MG를 특정하는 아데닐화 도메인을 L-asp를 특정하는 것으로 교환함으로써 생성된다. 3-MG 모듈의 아데닐화 도메인은 분자 유전학적 과정에 의해 제거된 L-asp 아데닐화 도메인에 인접하는 L-asp 모듈의 단편내로 삽입된다. L-asp 모듈로부터의 인접 DNA를 함유하는 하이브리드 3-MG 모듈은 적절하게 구성된 유전자 치환 벡터내로 삽입되며, 이 하이브리드 모듈은 실시예 11A에서처럼 상동성 이중 크로스오버에 의해 L-asp 모듈을 대신한다. 이러한 동일한 과정을 다른 두 L-asp 모듈을 위해서 반복한다. 재조합체는 위치 3, 7, 또는 9의 L-asp를 위해 치환된 3-MG를 함유하는 답토마이신의 세 개의 신규 유도체를 생산하며 분자내에 전체적으로 네 개의 음전하를 유지한다.
C. 다른 아미노산의 통합을 촉매하는 것을 위한 비리보솜 펩티드 신세타제(NRPS)의 교환
답토마이신 NRPS의 세 번째 서브유닛을 코딩하는 유전자는(표 1, 실시예 6 참고) 아미노산 12(3-MG)와 13(L-kyn)의 통합을 위한 특이성을 코딩하는 2개의 모듈을 함유한다. 고리형 리포펩티드 CDA의 생합성을 위한 세 번째 서브유닛을 코딩하는 유전자는(Kempter et al., Angew.Chem.Int.Ed.Engl.,36, pp.498-501(1997); Chong et al., Microbiology, 144, pp.193-199(1998), 각각 참고로 본원에 통합됨) 또한 마지막 두 아미노산(이 경우 아미노산 10(3-MG)와 11(L-trp))을 코딩한다. 위치 13에 L-kyn 대신에 L-trp을 함유하는 답토마이신의 유도체는 유전자 dptD를 파괴하고, 그것을 CDA를 위한 PSIII를 코딩하는 유전자로 치환함으로써 생성된다. 보다 강한 프로모터로부터의 PSIII 유전자의 발현(예, ermEp* 프로모터; Baltz, Trends Microbiolo, 6, pp.76-83(1998), 참고로 본원에 통합됨) 및 실시예 11A에 개시된 대로 에스. 로제오스포루스 게놈의 중성 부위로의 삽입은 CDA PSIII가 dptD 돌연변이를 보충하도록 하여 L-kyn을 대신하는 L-trp을 가진 변형된 답토마이신이 생성되도록 한다. 재조합체를 발효하여 재조합체의 생성물을 실시예 9에 개시된 대로 LC-MS에 의해 분석한다.
다른 서브 유닛을 위한 트랜스-보완을 위해, 즉, 답토마이신 생합성 유전자 클러스터의 서브유닛의 파괴 또는 결실을 생성시키고 이어서 NRPS로부터의 하나 이상의 천연 또는 변형된 서브유닛에 의해 트랜스로 보충시키기 위해 유사한 조작을 수행할 수 있다(후자는 실시예 12, 특히 실시예 12A, 12B 또는 12H, 12J를 통해 개시된 방법을 이용하여 생성될 수 있는 것과 같은, 답토마이신 생합성 유전자 클러스터의 변형된 버젼에 의한 트랜스-보완을 포함할 수 있다). NRPS 서브유닛간의 트랜스-보완은 이어서 이전 실시예들에 개시된 대로 분석될 수 있는 신규의 비리보솜 펩티드가 생성되도록 한다.
답토마이신 생합성 유전자 클러스터와 칼슘 의존성 항생제(CDA) 생합성 유전자 클러스터의 일부를 이용하여 트랜스-보완 실험을 하기 위해, 답토마이신 생합성 유전자 세트 또는 답토마이신 생합성 유전자와 부가 유전자 세트(예, BAC 클론 B12:03A05에 함유된 것)를, 방선균의 다른 천연 또는 조작된 균주 또는 종으로 형질전환 또는 접합에 의해 도입한다. 수용체는 이차 대사물을 생산하는 공지의 균주일 수도 있고 또는 특성이 규명되지 않은 균주일 수도 있으며, 또는 답토마이신의 생합성을 위한 것 외의 생합성 경로를 보유하도록 하는 재조합 기법에 의해 생성될 수도 있다. 형질전환체 또는 엑스접합체는 다양한 배지에서 발효되며 전체 브로스 또는 그 추출물은 신규의 답토마이신-유사 화합물 또는 답토마이신-내성 시험 유기체에 대한 생물학적 활성에 대해 스크리닝된다.
일부 예에서, 보충은 답토마이신 생합성 경로내의 유전자들 중 일부의 불활성화에 의해 촉진된다. BAC B12:03A05의 NRPS의 서브유닛을 코딩하는 서열은 결실되거나 마커 유전자에 의해 대체되어, 이미 하나 이상의 천연 또는 도입된 NRPS 유전자 클러스터를 발현하는 이종성 숙주 내로 도입되기 전에 변형된 B12:03A05를 형성할 수 있다. 변형된 B12:03A05 클론에 의해 그리고 내인성 숙주 NRPS 유전자에 의해 코딩되는 효소 서브유닛은 이어서 세포질에서 연합되어 신규의 펩티드를 생성하는 이종다량체 다효소 복합체를 형성할 수도 있다. 다른 경우에, 답토마이신 NRPS를 포함하는 B12:03A05 또는 그 일부가 이미 하나 이상의 천연 또는 도입된 NRPS 유전자 클러스터를 발현하는 이종성 숙주내로 도입된 후에 결실이 생성될 수도 있다. 예를 들어, dptD-파괴되거나 결실된 B12:03A05 버젼은 B12:03A05가 도입된 에스. 리비단스 균주에서 생성될 수 있다. 에스. 리비단스는 CDA를 위한 유전자 클러스터의 천연 카피를 보유한다. 생성되는 균주를 발효시켜 분석하여 CDA PS III과 변형된 B12:03A05 사이의 보충이 위치 13에서 L-kyn 대신 L-trp을 함유하는 답토마이신 유도체를 생성함을 보여준다. 이 실시예의 한 구체예에서, 실시예 7에 개시된 에스. 리비단스 TK64/B12:03A05 균주를 이용하여 트랜스-보완에 의해 신규 리포펩티드가 생성될 수 있음이 확인되었다.
신규 리포펩티드를 생산하기 위해, 인접 DNA 서열을 가로지르는 상동성 재조합을 이용하여 에스. 리비단스 TK64/B12:03A05의 dptD의 코딩 영역의 한 부분을 이종성 마커 유전자로 교환하였다. 상동성 재조합을 수행하기 위하여, dptD의 바로 상부 영역("5' 단편")과 바로 하부 영역("3' 단편")을 포함하는 두 단편을, 독특한 제한 부위가 도입된(밑줄쳐짐) 5'-말단 연장을 가진 하기의 프라이머 세트를 이용하여 염색체 에스. 로제오스포루스 DNA로부터 증폭시켰다:
5' 단편(1122 bp):
5' GCGAAG CTTCTG GTG GCG CAT CAC CTG G 3' (서열 번호 156)
5' GCT CTA GAT GGA AGT ATG TCC TCC ATC GC 3' (서열 번호 157)
3' 단편(1535 bp):
5' CGG ATC CCG CCG GCA CCT GAC CC 3' (서열 번호 158)
5' CCG AAT TCC GCC TCC GAG TAC ATC GAG G 3' (서열 번호 159)
증폭된 단편을 연속하여 pNEB193(New England Biolabs)의 다중 클로닝 부위내의 상응하는 독특한 부위내로 클로닝시켰다. 생성된 구조체, pSD002를 제한 분해 분석하여 배향에 대해 확인하고, PCR에 의해 생성된 부분에 에러가 없는 지에 대해 서열 결정에 의해 확인하였다. 마커 유전자, ermE(에리스로마이신 내성 유전자, Hopwood, supra)을 함유하는 SpeI 단편을 XbaI 부위에서 pSD002내로 삽입하고, 제한 효소 분해 분석에 의해 확인하였다. 생성된 플라스미드, pSD005는 따라서 dptD의 상부와 하부 DNA 서열에 상동성인 DNA 스트레치에 의해 인접한 ermE로 구성된 카세트를 포함한다. 일단 상동성 재조합에 의해 답토마이신 생합성 유전자 클러스터 경로내로 도입되면, 이 카세트는 처음 31 bp와 마지막 12 bp를 제외하고 모든 dptD를 ermE로 대체할 것이다. 이 치환 카세트를 포함하는 영역은 이어서 온도-민감성 복제 오리진과 rpsL(TK64 배경에서 이용될 수 있는 스트렙토마이신에 대한 민감성을 부여하는 유전자)을 보유하는 벡터(pRHB538의 클로닝 부위-변형된 버젼, Hosted et al., J.Bacteriol.179:180-186, 1997)내로 서브클로닝되어 에스. 리비단스내로 도입하기 위한 시리즈의 최종 플라스미드인 pSD030을 생성하였다.
플라스미드 pSD030를 실시예 7에 개시된 대로 원형질체 형질전환에 의해 에스. 리비단스내로 도입하였다. 원형질체와 세포의 형질전환 혼합물을 R2Ye 플레이트에 부드럽게 도포하고 약 16 시간 동안 30℃에서 배양하였다. 이어서 각 플레이트를 1.25 mg의 에리스로마이신을 함유하는 물 1 ml를 부어 그 액체가 배지내로 흡수되면 최종 농도가 50 ㎍/ml가 되었다. 7일 후 형질전환 플레이트상에서 생겨나는 에리스로마이신-내성 콜로니를 TSB (Hopwood, supra) + 에리스로마이신 25 ml내로 접종하여 48 시간 동안 30℃에서 배양하였다. 균사체를 수집하고, 균사 질량의 10분의 1을 불려서 TSB (Hopwood, supra) + 에리스로마이신의 새로운 25 ml 분액에 옮겼다. 이어서 생성된 용액을 40℃에서 배양하여 pSD030의 온도-민감성 레플리콘에 대해 선별하였다. 48 시간 후, 균사체를 원심분리에 의해 수집하고, 부드럽게 한 후 최종 부피 2 ml의 TSB에 재현탁하였다. 이 현탁액 100 ㎕를 50 ㎍/ml 에리스로마이신과 30 ㎍/ml 스트렙토마이신을 함유하는 SPMR 플레이트상에도말하였다(Babcock et al., J.Bacterio.170:2802-2808, 1988). 생존한 콜로니를 스크리닝한 결과, ermE가 성공적으로 dptD를 대체한 CBUK 137860과 같은 균주를 동정하는 PCR에 의해 정확한 유전형을 갖는 것으로 나타났다.
CBUK 137860의 출발 물질은 실시예 10에 개시된 대로 제조하였으며 종자 배양물을 생산하기 위해 이용되었다. 생성물 배양물은 또한 실시예 10에 개시된 대로 생성되었으나, 통기는 0.7 vvm에서 수행되었다. 발효기의 pH는 14%(v/v) 수산화 암모늄 용액으로 6.50으로 컴퓨터로 조절되었다. 50%(w/v) 글루코스 용액을 발효동안 0.36 g/L/hr로 배양물에 공급하였다.
20 L 발효기로부터의 생물질을 버리고 깨끗해진 액체를 열린 유리 컬럼에 가하였으며, 이때 이 컬럼은 미쯔비시 HP20 수지(60 x 300mm)로 페킹되고 메탄올과 물로 조절된 것이다. 용출에 앞서, 컬럼을 2 L의 물과 2 L의 메탄올/물(1:4)로 세척하였다. 이어서 컬럼을 2 L의 메탄올/물(4:1) 및 이어서 1 L의 메탄올로 용출하고 두 개의 별도의 분획으로 수집하였다.
액체 크로마토그래피-질량 스펙트로스코피(LC-MS) 일렉트로스프레이 이온화(ESI) 분석은 양 분획이 A21978C/CDA 하이브리드 분자를 함유함을 나타냈으며, 덜 복잡한 메탄올/물(4:1) 분획을 추가로 처리하였다. 이것을 진공하에서 수성 잔기로 증발시키고 이어서 물로 500 ml를 만들었다. 이어서 2L 분리 깔때기에서 3 x 500 ml 에틸 아세테이트로 추출하여 수성 및 유기 분획을 얻었다. LC-MS(ESI)는 하이브리드 분자가 유기 상에 존재하지 않음을 나타냈으며 유기상을 버렸다. 수성 분획을 밤새 동결건조시켰다.
하이브리드 분자를 Waters Prep LC 시스템과 Waters 40 x 200 mm Nova-Pak C18 60Å 6 ㎛ 방사상 압축 이중 카트리지(40 x 10 mm 가드를 갖춤)를 이용하는 제조성 고성능 액체 크로마토그래피(HPLC)에 의해 정제하였다. 동결 건조된 물질을 물에 용해시키고 구배 방법을 이용하여 정제하였다. 이 방법은 2분 동안 90% 물과 10% 아세토니트릴에서 유지되고 이어서 13분에 걸쳐 25% 물과 75% 아세토니트릴까지 선형 구배가 뒤따른다. 유속은 분당 55 ml이며 전체 구배는 0.04% 트리플루오로아세트산으로 완충되었다. 분획들을 수집하여, 양성 이온 모드의 일렉트로스프레이 이온화를 이용하여 Finnigan SSQ710c LC-MS 시스템상에서 200-2000 달톤의 스캔 범위와 2초 스캔으로 LC-MS를 수행하여 분석하였다. 이 LC-MS 분석을 위한 크로마토그래피 분리는 0.01% 포름산을 함유하는 선형 물-아세토니트릴 구배로 용출되는 Waters Symmetry C8 컬럼(4.6 x 50 mm, 3.5 ㎛ 입자 크기)상에서 이루어졌으며, 상기 구배는 0.5분의 초기 지연 후 6분의 기간에 걸쳐 10% 아세토니트릴로부터 100% 아세토니트릴로 증가되며 이어서 재평형화 전에 추가 3.5분 동안 100% 아세토니트릴에서 유지되었다. 유속은 1.5 ml/분이며 이 방법은 주위 온도에서 수행되엇다.
상기 분석은 천연 A21978C 리포펩티드 A21978C1(가지친 천연 C11아실쇄를 가짐)과 A21978C2(가지친 C12아실쇄를 가짐)의 예상된 유사체로서 A21978C/CDA 하이브리드를 동정하였으며, 여기서 천연 키누레닌 잔기는 트립토판 잔기로 대체된다. 두 분획 모두 NMR 연구에 앞서 추가 정제를 필요로 하였다. C11하이브리드(A)를, 0.04% 트리플루오로아세트산으로 완충된 60% 물과 40% 아세토니트릴을 이용하는 평등한(isocratic) 방법을 이용하여 정제하였다. 1.8 mg의 물질이 분리되었다. C12하이브리드(B) 최종 정제 단계는 0.04% 트리플루오로아세트산으로 완충된 58% 물과 42% 아세토니트릴을 이용하는 평등한 방법을 이용하였다. 약 1.5 mg의 물질이 분리되었다. 1H NMR 스펙트럼이 도 13에 나타난다. A와 B에 대한 UV 맥시멈과 ESI-MS 분자 이온 정보(음성 이온 모드에서 관찰된 이중-하전된 이온)가 하기에 나타난다:
A | B | |
ESI-MS(m/z) | 814(M-2H)2- | 821(M-2H)2- |
UV-vis λmax /nm | 221, 280 | 221, 280 |
답토마이신 NRPS의 변형된 버젼(예, dptA 결실, dptA + dptD 결실 등)이 에스. 리비단스, 에스. 프라디에, 에스. 비리도크로모젠 및 기타 등과 같은 다른 2차 대사산물 생성 균주내로 도입되는 유사한 실험은 또한 답토마이신 백본에 기초한 유사체 화합물을 생성할 수도 있다. NRPS 서브유닛이 별도로 발현되고 교환될 수 있음을 생각할 때, 에스. 로제오스포루스 또는 다른 발현 숙주에서 모든 서브유닛을 단독으로 또는 조합으로, 천연 또는 변형된 NRPS 서브유닛(전술한 답토마이신 신세타제의 변형된 버젼을 포함) 하나 이상으로 교환하거나 트랜스-보완할 수 있다. 한 예로서, 하기의 변형된 에스. 로제오스포루스 균주가 생성될 수 있다: dptA, dptD가 천연 좌로부터 결실되고 dptBC 발현은 그대로임. 이어서, 이 균주를, 위치 2에서 asn 대신 asp를 통합시키도록 부위-지시된 돌연변이에 의해 변형된 외부 통합된 dptA(실시예 12) 및 kyn-수용 모듈이 CDA PSIII의 trp-수용 모듈로 교환되도록 변형된 외부 통합된 dptD에 의해, 또는 외부 통합된 CDAIII에 의해 보충시킬 수 있다. 동일한 균주를 생성하는 다른 방식은 아스파라긴 대신 아스파테이트를 통합하는 변형된 dptA 서브유닛을 이미 보유한 에스. 리비단스 TK64 유도체내로 dptA, dptD 결실된 BAC B12:03A05를 도입하는 것이다. 그러한 균주는 발효되어 위치 2에 asp와 위치 13에 trp을 갖는 답토마이신 유도체를 회수할 수 있다.
D. 답토마이신 고리의 연장 또는 꼬리의 연장을 야기하기 위한 하나 이상의 모듈의 삽입
간단한 NRPS 연장 모듈은 도메인 "C-A-T"(축합-, 아데닐화-, 및 티올화-도메인)을 포함하는 것으로 정의될 수 있다. 모듈을 연결하고, 부가의 내부 모듈을 삽입하기 위한 답토마이신 NRPS내의 허용 부위를 동정하기 위해, 도메인과 도메인간 영역을 가요성 "링커" 서열을 나타내는 서열에 대해 검사하였다. 예를 들어, 본원에 참고로 통합되는 Mootz et al., Proc.Natl.Acad.Sci.U.S.A., 97, pp.5848-5853(2000) 참고. 부가의 모듈을 코딩하는 서열은 공지의 유전자 재조합 기법(예, 실시예 11A)을 이용하여 상부 T-도메인과 하부 C-도메인간의 링커 서열내에 삽입된다.
모듈 DNA의 분리는 생산자 유기체로부터 추출된 염색체 DNA로부터 얻어진다. 제한 효소로 염색체 DNA를 자르고, 서던 블롯에 의해 동정한 후 관심 모듈을 코딩하는 단편을 분리하거나 또는 적절한 프라이머를 이용한 유전자 증폭(PCR)에 의해 관심 모듈을 분리하는 것과 같은 다양한 분리 기법을 이용할 수 있다. 증폭된 단편의 서열 결정과 특성 규명 및 클로닝은 통상의 방법으로 수행할 수 있다. 새로운모듈은 dptA에서 L-Thr과 Gly을 특정하는 모듈간; dptBC에서 L-Orn과 L-Asp 또는 L-Asp와 D-Ala를 특정하는 모듈간; dptBC에서 L-Asp와 Gly 또는 Gly과 D-Ser 간; 및 dptD에서 3-MG와 L-kyn을 특정하는 모듈간에 삽입되어 답토마이신 고리를 연장시킬 수 있다. 새로운 모듈은 L-Trp과 D-Asn, D-Asn과 L-Asp, 또는 L-Asp와 L-Try을 특정하는 모듈간에 dptA 유전자에 삽입되어 답토마이신 꼬리를 연장시킬 수 있다. 모듈 삽입은 실시예 11A에 개시된 이중 크로스오버 방법을 이용하여 수행될 수 있다.
E. 티오에스테라제 모듈에 이웃하고 그 상부에 있는 부가의 카르복실 말단 모듈의 삽입
다양한 NRPS와 PKS의 카르복시말단 티오에스테라제 도메인("Te-도메인")은 비-천연 펩티드와 폴리케티드 기질을 절단할 수 있다(즉, 쇄 종결을 촉매). Mootz et al., supra; de Ferra et a., J.Biol.Chem., 272, 25304-25309(1997)을 참고하며, 각각은 본원에 참고로 통합된다. Te-도메인은 하이드롤라제로 작용하여 선형 생성물을 방출할 수 있고, 또는 사이클라제로 작용하여 고리형 펩티드를 방출할 수 있다. 증거는 NRPS 또는 PKS내에서 천연 형태에서 사이클라제로 작용하는 Te-도메인이 새로운 모듈의 형태로 조작될 때 하이드롤라제로 작용할 수도 있음을 제안한다. (분리된 C-말단 Te-도메인은 핵심 "인식 아미노산"이 기질의 C-말단과 N-말단에 있는 한 다양한 기질의 고리화를 촉매하는 것으로 나타났다: Trauger et al., Nature, 407, pp.215-218, 2000 참고.
또한, 일부 C-말단 Te 도메인은 이동될 때, 천연 NRPS 또는 PKS 모듈 형태에서 바로 상부에 존재하는 단백질 도메인의 일부와의 연합이 유지됨으로써 최상으로 작용하는 것으로 나타났다. 본원에 참고로 통합되는 Guenzi et al., J.Biol.Chem.,273, pp.14403-14410(1998) 참고. Te 도메인과 바로 상부의 도메인의 일부(N-말단) 사이의 경계를 유지하는 것이 또한 새로운 모듈 형태내에서 Te-도메인의 사이클라제 기능을 보유하는 데 기여할 수도 있다.
따라서, Te-도메인으로부터 상부에 부가 모듈을 삽입하고 그것을 작동적으로 연결시키기 위해, 표준 유전자 조작을 이용하여, 전술한 대로, C-A-T 모듈과 C-말단 Te-도메인간의 링커 서열을 동정하고, 부가 모듈을 코딩하는 서열을 그안에 삽입할 수 있다. 선택적으로, 끝에서 두번째의 티올화(T-) 도메인의 C-말단 부분이 Te-도메인에 연결된 채 있는(또는 그렇지 않으면 이식되어 있는) 새로운 하이브리드 C-말단 Te-도메인("T-/Te- 도메인)을 설계할 수 있다. Guenzi et al., 1998, supra 참고. 이어서 실시예 11A에 개시된 대로, 공지된 유전자 재조합 기법을 이용하여 하이브리드 T-/Te- 도메인으로부터 상부의 동정된 링커 영역내에 부가 모듈을 코딩하는 서열을 삽입한다.
F. 답토마이신 고리의 수축 또는 꼬리의 단축을 야기하기 위한 하나 이상의 모듈의 내부 결실
이중 크로스오버와 항생제 플레이트상에서의 선별에 의해 염색체상의 내부 모듈의 결실을 얻기 위해서는, 결실될 모듈의 하부 단편에 연결에 의해 융합된 결실될 모듈의 상부에 위치한 염색체 DNA 단편을 함유하는 플라스미드를 준비하는 것이 필요하다. 이 플라스미드는 또한 스트렙토마이신-내성 유전자 배경에서 재조합체에 스트렙토마이신 민감성을 부여하기 위한 야생형 rpsL 유전자(실시예 11A 참고), 단일 크로스오버의 선별을 위한 항생제 내성 유전자(예, 아프라마이신 내성, 티오스트렙톤 내성 또는 하이그로마이신 내성), 및 승온에서 큐어될 수 있는 온도 민감성 레플리콘을 보유한다. 교환될 모듈의 상부 DNA 영역내로 상동성 재조합에 의해 플라스미드를 삽입하는 단일 크로스오버는 승온에서 항생제 내성에 대해 선별될 수 있다. 모듈을 결실시키는 두번째 크로스오버는 스트렙토마이신을 함유하는 배지상에서 선별될 수 있다(따라서 모든 플라스미드 서열을 제거함). 적절한 모듈의 결실을 함유하는 재조합체는 적절한 제한 엔도뉴클레아제로 절단된 에스. 로제오스포루스 DNA의 서던 블롯 하이브리드화에 의해 입증될 수 있다. 이 방법은 예를 들어, dptBC로부터 L-Asp 모듈 또는 Gly 모듈을 결실시키기 위해 이용될 수 있다. 또한 L-Asn, L-Asp, 또는 L-Asn와 L-Asp 둘다를 특정하는 dptA 유전자내의 모듈을 결실시키기 위해 이용될 수 있다.
G. 답토마이신 고리의 수축을 야기하기 위한 말단 티오에스테라제의 이전
답토마이신 NRPS(DptD)의 마지막 모듈의 카르복실 말단에 위치하는 티오에스테라제(Te) 영역을 코딩하는 서열은 내부 모듈 코딩 영역의 말단의 상부로 이전될 수 있다. 이러한 이전은 절단된 선형 또는 고리형 펩티드를 생산할 한정된 짧아진 생성물을 방출되도록 할 것이다. Te의 이전은 실시예 12A와 12F에서 전술한 방식과 아주 동일한 이중 크로스오버에 의해 이루어질 수 있다.
답토마이신 NRPS와 다른 NRPS 또는 PKS 유전자간의 분자 교환
a. 다른 NRPS 또는 PKS상의 답토마이신 티오에스테라제
전술한 바와 같은 공지된 분자적 및 유전적 방법을 이용하여, 본 발명의 답토마이신 NRPS의 C-말단 Te-도메인을 코딩하는 서열(예, DptD)을 다양한 다른 숙주로부터의 다른 NRPS 또는 PKS 모듈 유전자를 코딩하는 서열과 연합되도록 이동시켜(단독으로 또는 그들의 하나 이상의 상부 모듈 또는 부분과 함께), 유용한 특성을 갖는 새로운 펩티드 및/또는 하이브리드 펩티드/폴리케티드 생성물을 생성할 수 있는 하이브리드 모듈 신세타제를 생성할 수 있다. 예를 들어, Stachelhaus et al., Science, 269, pp.69-72(1995) 및 Cane and Khosla, Chem.Biol.,6,pp.319-325(1999)를 참조하며, 이들은 각각 참고로 본원에 통합된다. 유사하게, 본 발명의 유리 티오에스테라제를 코딩하는 답토마이신 서열(예, DptH)은 다른 NRPS 또는 PKS 코딩 모듈 유전자와 연합하도록 이동되어 하이브리드 모듈 신세타제를 생성할 수 있다.
b. 답토마이신과 다른 NRPS 및/또는 PKS간의 모듈 및 도메인 교환
본 발명의 답토마이신 생합성 유전자 클러스터로부터 유래된 다양한 서열(도메인과 모듈 구조를 포함하며 이에 한정되지 않음)을 이용하여, 답토마이신 생합성 유전자 클러스터로부터의 서열을 포함하는 하이브리드 NRPS와 하이브리드 NRPS/PKS 모듈 신세타제를 생산하기 위해 상동성 및 이종성 숙주에서의 답토마이신 서열과 천연 또는 합성 NRPS와 PKS 서열간의 유전자 재조합 반응(유전자 중복, 전환, 치환, 등)에 이용하기 위한 플라스미드와 다른 벡터들을 구성할 수 있다. 그러한 하이브리드 신세타제는 새롭고 유용한 특성을 가질 것으로 예상되는 신규의 펩티드와 폴리케티드를 생산할 것이다.
정상적으로는 아실화되지 않는 비리보솜 합성된 펩티드의 리포펩티드 유도체의 생성
답토마이신의 지방산 꼬리는 dptA의 시작점에서 축합 도메인과 함께 작용하는 dptE와 dptF 유전자의 생성물에 의해 부착되는 것으로 생각된다. 이들 유전자와 유전자 단편들은 외래 비리보솜 펩티드 신타제 유전자의 개시 부분으로, 또는 유전자의 시작 부분에서(예, dptBC 또는 dptD의 5') 또는 모듈의 시작 부분의 유전자 내(예, 모듈 2의 5')에서 답토마이신 유전자 클러스터내의 내부 위치로 이전되어, 외래의 비리보솜 합성된 펩티드의 아실화된 버젼을 생성하거나 또는 답토마이신의 아실화되고 절단된 유도체를 생성할 수 있다. 외래 유전자는 다른 천연 유기체, 또는 전술한 대로 펩티드 서열에 치환된 아미노산을 갖도록 재조합 기법에 의해 생성된 유기체(예를 들어, 고리를 연장하거나 수축시키기 위한 변형을 일으킨 답토마이신의 다양한 버젼)로부터 유래될 수도 있다.
펩티드 구조에서 아미노산 입체이성질체의 변형
NRPS에 의해 생산된 아미노산 백본의 입체특이성은 공여 모듈의 에피머라제 도메인과 수용 모듈의 구별되는 축합 도메인의 존재에 의해 결정된다. 아미노산의 입체화학의 변화는 에피머라제 도메인을 공여 모듈에 첨가함으로써, 그리고 적절한 축합 도메인을 수용 모듈에 치환시킴으로써 이루어질 수 있다. 변화는 또한 공여 모듈로부터 에피머라제 도메인을 제거하고 적절한 축합 도메인을 수용 모듈에서 치환시킴으로써 이루어질 수 있으며, 예를 들어, 에피머라제 도메인을 dptA의 모듈 2로부터 잘라내고, dptA의 모듈 3의 축합 도메인을 정상적으로는 D-아미노산을 수용하지 않는 다른 모듈로부터의 축합 도메인으로 교환할 수 있다. 유용한 에피머라제와 축합 도메인은 다른 비리보솜 펩티드 신세타제 유전자에서뿐만 아니라 답토마이신 집단에서 발견될 수 있다.
실시예 13: 유리 티오에스테라제의 용도
A. 모듈 NRPS와 PKS에 의한 생성물 형성의 효율을 증가시키기 위한 상동성 또는 이종성 시스템에서의 dptD 또는 dptH 관련 서열의 발현
티로시딘 신세타제로부터 잘라낸 C-말단 Te-도메인은 핵심 "인지 아미노산"이 기질의 C-말단과 N-말단에 있는 한은 다양한 펩티드 기질상의 고리화를 촉매하는 것으로 나타났다. Trauger et al., Nature, 407, 215-218, 2000 참고. 답토마이신 NRPS의 C-말단 도메인으로부터 유래된 서열(예, dptD)은 유사하게 상동성 또는 이종성 숙주에서(또는 생체외 시스템에서) 분리되고 발현되어(단독으로 또는 적절한 융합 단백질 형태로), 천연적으로(또는 조작되어) 답토마이신 Te-도메인이 기질 말단에 결합하고 연결되는 데 필요한 핵심 기질 인지 아미노산을 보유하는 펩티드와 폴리케티드 생성물의 고리화를 촉매할 수 있다.
독립적인 발현을 위해 답토마이신 신세타제의 C-말단 Te-도메인에서 유래된 서열을 분리할 때, 끝에서 두번째의 아미노산 모듈로부터의 천연 C-말단 서열을 포함하는 것이 바람직할 수 있다. 에를 들어, Guenzi et al., 1998, supra 참고. 다양한 dptD와 상부-유래 서열 조합을 공지된 기법을 이용하여 시험하여, DptA 및/또는 DptBC와 같은 상부 폴리펩티드로부터 독립적으로 발현될 때 답토마이신 NRPS의 C-말단 Te 도메인의 티오에스테라제 활성을 최적화시킬 수 있다. 답토마이신의 C-말단 Te 도메인의 독립적인 발현은 표준 분자 생물학 기법을 이용하여 이루어질 수 있다. 답토마이신 NRPS의 C-말단 Te 도메인의 독립적인 발현은 천연 답토마이신 NRPS 프로모터 서열(서열 번호 2)로부터 하부의 dptD ORF의 티오에스테라제 도메인(서열 번호 3)으로부터 유래된 서열을 적절하게 구성된 발현 벡터내로 삽입함으로써 이루어진다.
다르게는, 답토마이신 NRPS의 C-말단 Te 도메인의 독립적인 발현은, 구성적으로 활성인 이종성 프로모터 또는 조절되는 방식으로 켜지고 꺼질 수 있는 이종성 프로모터로부터 하부에 dptD ORF의 티오에스테라제 도메인(서열 번호 3)을 삽입함으로써 이루어진다. 당업자는 적절한 프로모터와 숙주-의존 방식의 발현 또는 과발현을 위한 벡터를 선택하는 데 있어서 고려해야 할 사항을 인식할 것이다.
본 발명의 답토마이신 생합성 유전자 클러스터의 유리 티오에스테라제 도메인(dptH)로부터 유래된 서열은 유사하게 상동성 또는 이종성 숙주에서 발현되어 신규의 고리형 펩티드 등을 시험하고 개발할 수 있다.
답토마이신의 핵심 인지 아미노산은 답토마이신의 아미노산 잔기의 체계적 돌연변이유발, 및 이어지는 분리된 Te-도메인에 의해 촉매되는 반응에서 각 변형된 답토마이신 기질을 이용하는 고리화 분석에 의해 동정된다. 답토마이신 고리화에 필요한 C- 및 N- 말단 아미노산 잔기를 동정하여, 펩티드와 폴리케티드 빌딩 블록 단위가 삽입될 수 있는 새로운 기질 백본내로 설계한다. 기질 조작은 공지의 기법을 이용하여 핵산 서열 수준 또는 펩티드 수준에서 수행될 수 있다. 바람직한 기질의 길이와 조성은 기질 결합 효율, 촉매 속도, 생성되는 고리형 생성물의 생물학적활성, 및 최종 생성물의 정제의 용이성을 포함(이에 제한되지 않음)하여 당업자에게 공지된 인자들을 고려하여 실험적으로 결정될 수 있다.
B. 교정 기능에 영향을 주기 위한 dptD 또는 dptH의 돌연변이 유발
답토마이신 유전자 클러스터로부터의 dptH 유전자는 일부 펩티드와 폴리케티드 이차 대사산물의 생합성에 참여하는 것으로 알려진 유리 티오에스테라제 효소에 관련된다. 예를 들어, 본원에 참고로 통합되는 Schneider and Marahiel, Arch.Microbiol.,169, pp.404-410(1998), 및 Butler et al., Chem.Biol.,6,pp.87-292(1999) 참고. 효율적인 천연 생성물 합성을 위해서는 종종 티오에스테라제의 편집이 필요한 것으로 제안되어 왔다. Butler et al.은 폴리케티드 티로신 유전자 클러스터에서 발견되는 유리 티오에스테라제가 편집과 교정 기능에 관여할 수 있음을 가정하였으며, 이는 효율적인 생성물 형성에서의 티오에스테라제의 제안된 역할과 일치한다.
답토마이신 dptH(유리 티오에스테라제를 코딩함) 또는 dptD(C-말단 Te를 코딩함)의 티오에스테라제-코딩 도메인의 상동성 또는 이종성 발현은 모듈 NRPS와 PKS에 의한 생성물 형성의 효율에 영향을 줄 수 있다. 답토마이신 티오에스테라제 유형 II 효소(DptH)(및 잠재적으로는 답토마이신 유전자 클러스터의 C-말단으로부터 분리되어 별도로 발현될 경우 유형 I 티오에스테라제 효소)의 제안된 편집 및 교정 기능은 통상의 돌연변이유발 및 다른 재조합 DNA 기법(예, DNA 복제의 신뢰성에 나쁜 영향을 주는 것으로 알려진 것들)을 이용하여 변경될 수 있다. 티오에스테라제 유전자의 변형되고 돌연변이된 형태는, 적절한 발현 시스템에서 발현되어 바뀐 생물학적 특성을 갖는 티오에스테라제 효소를 코딩하는 것들에 대해 스크리닝될 수 있다. 특히 바람직한 것은 아미노산이 잘못 통합되는 비율이 정상보다 높은 티오에스테라제 효소이다. 그러한 돌연변이는 새롭고 유용한 생물학적 특성을 갖는 펩티드 및 펩티드/폴리케티드 하이브리드 생성물의 보다 큰 다양성을 생성하는 데 유용할 것이다.
실시예 14: 답토마이신 생합성 유전자를 이용하여 관련 유전자를 동정하고 분리하기
본 발명의 핵산과 아미노산 서열은 다른 리포펩티드 경로로부터의 상응하는 서열과 비교되어 NRPS 또는 다른 리포펩티드를 코딩하는 NRPS의 성분으로부터의 서열을 동정하기 위해 이용될 수 있는 특성을 동정할 수 있다.
아미노산 3-메틸 글루탐산(3MG)는 흔치 않으나 답토마이신, 에스. 코엘리컬러로부터의 칼슘 의존성 항생제(CDA), 및 에스. 프라디에에 의해 만들어지는 A54145 화합물에서 발견된다. 3MG 아데닐화 도메인을 코딩하는 에스. 로제오스포루스와 에스. 코엘리컬러 핵산 서열 및 다른 아미노산을 아데닐화시키는 유전자로부터의 유사 서열의 비교를 이용하여 프라이머쌍 P140과 P141을 생성하였다:
P140ACSSWSGGSGTSSCCTTCATGAA(서열 번호 160)
P141ATGGTGTTCGAGAACTAYCC(서열 번호 161)
표준 기법을 이용하여 P140과 P141을 이용한 PCR에 의해 에스. 프라디에 코스미드 라이브러리 클론을 스크리닝하였다. PCR 반응은 약 700 bp의 핵산 분자 생성물을 생성하였으며, 이것의 서열은 에스. 로제오스포루스와 에스. 코엘리컬러의3MG 아데닐화 도메인을 코딩하는 영역에 유사함이 입증되었다. 프라이머 워킹에 의한 서열의 연장은 동정된 영역이 A54145의 3MG 모듈임을 확인하였다.
이 방법은 또한 D-아미노산 활성화 모듈의 하부의 축합 도메인을 코딩하는 NRPS 경로의 부분을 동정하는 데 이용되었다. D-아미노산은 비리보솜 합성된 펩티드에서 발견되는 특이 아미노산이며, 그들과 연합된 축합 도메인을 위한 프라이머는 그러한 아미노산을 가진 경로를 동정하는 데 이용될 수 있다. 이들 D-아미노산 축합 도메인을 코딩하는 에스. 로제오스포루스 답토마이신과 에스. 코엘리컬러 CDA 서열의 핵산 서열은 서로 그리고 L-아미노산과 연합된 다른 축합 도메인으로부터의 유사 서열에 비교되어 프라이머쌍 P144와 P145를 생성하였다.
P144 SCSCTSCAGGAGGGSHTSSTSTTCC (서열 번호 162)
P145 CCGAASACSACGTCGTCSCGSCC (서열 번호 163)
표준 기법을 이용하여 P144와 P145를 이용한 PCR에 의해 에스. 프라디에 코스미드 라이브러리 클론을 스크리닝하였다. PCR 반응은 약 800 bp의 핵산 분자 생성물을 생성하였으며, 이것의 서열은 에스. 로제오스포루스와 에스. 코엘리컬러의 D-아미노산을 따르는 축합 도메인에 유사함이 입증되었다. 하나보다 많은 도메인에 상응하는 서열을 얻었으며, 이는 그 경로가 하나 보다 많은 D-아미노산을 가짐을 나타냈다.
답토마이신 경로의 서열을 이해하는 데 기초한 이러한 방법은, DptE와 F와 같은 아실화에 관련된 유전자뿐만 아니라 펩티드에 지방산을 축합시키는 데 관여하는 첫번째 아데닐화 모듈의 축합 도메인 또는 에피머라제 도메인을 코딩하는 영역과 같은, 리포펩티드 경로 유전자 클러스터의 다른 유전적 특성을 위한 특별한 프라이머 세트를 개발하기 위해 이용될 수 있다.
* 90kb 단편의 ORF-1는, 종결 코돈을 포함한 ORF의 3' 말단이 SP6 단편에서 종결되므로 ORF의 부분 서열이다. 종결 코돈을 포함한 ORF-1 서열의 3' 말단의 핵산 서열은 서열 번호 103의 뉴클레오티드 13020-12876에 해당한다. 따라서, 90kb 단편의 ORF-1의 전체 오픈 리딩 프레임은 서열 번호 19(서열 번호 1의 뉴클레오티드 1635-1의 상보성 쇄)와 이어지는 서열 번호 103의 뉴클레오티드 13020-12876의상보성쇄로 이루어진다.
[표 6]
90kb 단편내의 ORF들의 BlastX 결과
Str은 유전자가 DNA 분자상에(서열 번호 1에 대하여) 왼쪽에서 오른쪽으로(+) 또는 그 상보성 쇄상에서 오른쪽에서 왼쪽으로 코딩되어 있는지를의미한다.
BlastX 박스는 각 ORF에 대한 두개의 상위 BlastX 점수(상부 두 라인) 및 데이타베이스 단백질 입력과 데이타베이스 입력에 대한 ORF의 배열에 관한 상세 사항을 함유한다.
[표 7]
SP6 단편의 ORF에 대한 BlastX 결과
Str은 유전자가 DNA 분자상에(서열 번호 1에 대하여) 왼쪽에서 오른쪽으로(+) 또는 그 상보성 쇄상에서 오른쪽에서 왼쪽으로 코딩되어 있는지를 의미한다.
BlastX 박스는 각 ORF에 대한 두개의 상위 BlastX 점수(상부 두 라인) 및 데이타베이스 단백질 입력과 데이타베이스 입력에 대한 ORF의 배열에 관한 상세 사항을 함유한다.
[표 8]
GTC 단편의 ORF에 대한 BlastX 결과
실시예 15: 액티노로딘의 부재하에 스트렙토마이세스 리비단스에서 답토마이신의 이종성 생산
유전적 효과 및 배지 효과는 둘다 이종성 숙주에서 A21978C 리포펩티드의 발현을 개선시키도록 변형되었다. dpt 유전자 클러스터를 함유하는 다양한 균주 BAC를 상기 유전자 클러스터가 없는 대조군 균주와 함께 쉐이크-플라스크 발효로 성장시키고 깨끗해진 브로스를 HPLC에 의해 A21978C 리포펩티드 시리즈의 존재에 대해 분석하였다. BAC 클론 B1203A05상의 dpt 집단을 표준 기법을 이용한 원형질체 생산에 의해 에스. 리비단스내로 도입하였다(Keiser, T., et al., Practical Streptomycete genetics, John Innes Foundation, Norwich, 2000). 검사된 균주는 dpt 유전자 클러스터를 함유하는 에스. 리비단스 TK23과 TK64 균주와 부분적으로 결실된 액티노로딘 경로를 가진 에스. 리비단스 TK23의 유전적으로 변경된 버젼을 포함하였다. 다른 비교가능하고 적절한 act 넉아웃 균주들이 공지되어 있다. TK64는 스트렙토마이신에 대한 내성을 부여하며 또한 액티노로딘의 생산의 증가에도 관여하는(Shima et al., J.Bacteriol, 178(24), 7276-7284(1996)) rpsL(str-6) 돌연변이를 보유하는 점에서 TK23과 다르다. 액티노로딘 군은 많은 발효 조건하에서 에스. 리비단스에 의해 다량으로 생산되며 다른 이차 대사물을 발효로부터 검출하고 정제하는 것을 간섭하는 착색된 폴리케티드이다.
에스. 리비단스로부터 액티노로딘 생산을 제거하기 위해, 그 경로의 일부를 결실시킨 카세트를 구성하였다. 액티노로딘 폴리케티드 신타제 경로를 함유하는 8kb 단편(Malpartida and Hopwood, Mol.Gen.Genet., 205, 66-73(1986))을 pUC19내로 클로닝하고; 1.4kb의 DNA를 이 단편의 중앙으로부터 제거하여 actIorfI의 3' 말단과 actIorfII의 거의 전부를 결실시켰다. 이어서 이 단편을 내성 마커 ermE에 의해 대체시켰다(Bibb et al., Gene, 38(1-3), 15-26(1985)). 이어서 이 결실 카세트를 온도 민감성 플라스미드 pGM160에 옮기고 에스. 리비단스 TK23내로 도입하였다. 이들 재조합 균주를 이어서 40 시간 동안 발효시키고 선택성 배지상에 도말하여 이 선별로부터 몇개의 콜로니가 적절한 표현형을 갖는 것으로 분리되었다. 이들 균주의 유전형을 이어서 서던 블롯으로 확인하였다. BAC 벡터만을 함유하는 TK64와 TK23 둘다의 에스. 리비단스 균주를 또한 대조군 균주로서 검사하였다. 균주 표시법에 대해서는 표 9 참조.
[표 9]
CBUK 균주 번호 | 계통 | act의 존재 | rpsL 상태 | 형질전환 DNA |
136736 | TK64 | + | str-6 | BAC 벡터만 |
136742 | TK64 | + | str-6 | B12:03A05 dpt 유전자 클러스터 |
137028 | TK23 | + | + | BAC 벡터만 |
137027 | TK23 | + | + | B12:03A05 dpt 유전자 클러스터 |
137026 | TK23 (521) | - | + | BAC 벡터만 |
137024 | TK23 (521) | - | + | B12:03A05 dpt 유전자 클러스터 |
rpsL 컬럼의 + 는 야생형 상태를 나타낸다.
많은 다른 배지가 초기에 개발되었음에도 불구하고, 두 개의 다른 배지를 그들이 에스. 리비단스에서 A21978C 리포펩티드의 생산을 지지하는 능력에 대해 보다 자세하게 검사되었다. 이들 배지 둘다 또한 에스. 로제오스포루스에서 A21978C 리포펩티드의 우수한 생산을 지지한다. 배지 A는 1% 글루코스(BDH), 2% 가용성 전분(Sigma), 0.5% 효모 추출물(Difco), 0.5% 카제인(Sigma), 4.6% MOPS(Sigma)로 이루어지는 복합 배지이며 pH 7로 조정되고 오토클레이브되었다. 배지 B는 미량 원소와 비타민과 함께 2% 글리세롤, 0.25% 수크로스, 1.2% 프롤린, 1.5% MOPS, 0.056% K2HPO4, 0.05% NaCl로 이루어지며 pH 7로 조정되고 필터 멸균되었다.
발효는 100 mg/L 아프라마이신을 함유한 풍부한 귀리 슬로프를 -135℃에 저장된 동결바이알로부터의 물질 약 0.25 ml로 접종하여 시작하였다. 28℃에서 7-10일간 배양한 후, 0.1% Tween 80 4 ml를 첨가하여 혼합된 균사체와 포자 현탁액을 생성시키고, 2 ml를 격벽을 갖춘 플라스크내의 25 mg/L 아프라마이신을 함유한 종자 배지 40 ml내로 접종하여 종자 단계를 시작하였다. 종자 플라스크를 30℃에서 24-28 시간 동안 240 rpm에서 교반하고 5%를 배지 A 또는 B 50 ml를 함유하는 생산 플라스크로 옮겼다. 약 1 ml 브로스를 무균적으로 제거하여 생산 발효 기간의 2일부터 6일까지 복제 플라스크를 샘플 채취하고 10,000 rpm에서 10분간 원심분리하고 HPLC에 의하여 상등액을 분석하였다. 분석은 4.6 X 50 mm Symmetry C8 3.5 ㎛ 컬럼과 Phenomenex Security Guard C8 카트리지를 갖춘 996 PDA 검출기와 Waters Alliance 2690 HPLC 시스템을 이용하여 주위 온도에서 수행되었다. 구배는 처음에는 90% 물과 10% 아세토니트릴에서 2.5분간 유지되고, 이어서 6분에 걸쳐 100% 아세토니트릴까지 선형 구배가 뒤따른다. 유속은 분당 1.5 ml이며 구배는 0.01% 트리플루오로아세트산으로 완충된다. 최대 50 ㎕의 상등액을 주입하여 천연 A21978C 리포펩티드의 생산을 모니터하였다.
예상된 분자량의 확인은 200-2000 달톤의 스캔 범위와 2초 스캔으로 양성 이온 모드의 일렉트로스프레이 이온화를 이용하는 Finnigan SSQ710c LC-MS 시스템을 이용하는 LC-MS 분석에 의해 얻어졌다. LC 방법은 Waters Symmetry C8 컬럼(2.1 x 50 mm 3.5 ㎛ 입자 크기)에서 수행되었다. 이 방법은 0.5분 동안 90% 물, 10% 아세토니트릴 및 0.01% 포름산의 초기 조건에서 유지되고 이어서 6분의 기간에 걸쳐100% 아세토니트릴과 0.01% 포름산으로의 선형 구배가 뒤따른다. 이어서 재평형화 전에 추가 3.5분 동안 유지된다. 이 방법은 주위 온도에서 수행되었다.
배지 A중의 에스. 리비단스 TK64에서의 A21978C 리포펩티드 시리즈의 이종성 발현을 HPLC에 의해 분석하였다. 특징적인 UV/가시광 스펙트럼을 갖는 A21978C 리포펩티드 중 세 개의 생산이 명백하였으며, 전술한 분석 조건하에서 그 보유 시간은 5.61, 5.77 및 5.89분(λmax 223.8, 261.5 및 364.5 nm)이었다. LC-MS 분석에서, 이들 세 개의 A21978C 리포펩티드는 스트렙토마이세스 로제오스포루스에 의해 생산된 주요 A21978C 리포펩티드 대사물 C1, C2, 및 C3 각각에 대해 보고된 질량과 일치하는 1634.7, 1648.7 및 1662.7의 m/z에서의 분자 이온([M-H]+)을 나타냈다. (Debono et al., J.Antibiotics, XL(6), pp.761-777(1987)). 유사한 생성물 프로파일이 또한 동일한 조건하에서 에스. 리비단스 TK23(137027)에서 dpt 유전자 클러스터의 이종성 발현에 대해 얻어졌다. 액티노로딘 생산을 증가시키는 것으로 보고된 rpsL 돌연변이의 부재에도 불구하고 액티노로딘의 유사하게 높은 생산 수준이 이 균주에서 관찰되었다. A21978C 리포펩티드는 BAC 벡터만이 통합된 TK64 대조군 균주(136736) 또는 TK23 대조군 균주(137028)의 발효에서는 검출되지 않았다.
이들 균주에 의한 조 브로스에서 생산된 A21978C 리포펩티드의 양은 CDA 복합체의 성분들을 포함한 숙주 피크와의 동시-크로마토그래피로 인해 정확하게 정량될 수 없었다. 하지만, 세 개의 주요 리포펩티드의 총 최대 수율은 약 20 mg/L로 추정되었다. A21978C 리포펩티드는 많은 다른 숙주 대사물과 함께 발효에서 초기에 생산되었다.
A21978C 리포펩티드의 생산의 프로파일은 또한 배지 A에서의 에스. 리비단스 TK23(137024) act 넉아웃 균주의 발효로부터 관찰되었다. 이 균주에서 완전한 act 경로의 부재는 정상적으로는 고농도의 act가 지지되는 특정된 배지 B의 적용을 허용하였다. 특정된 배지의 변화를 평가하였으며, 2-4 g/L 정도의 K2HPO4가 A21978C 리포펩티드의 생산과 숙주 대사물 일부의 억제 둘다에 유익함을 발견하였다. HPLC 분석은 인산염 보충없이 배지 B에서의 A21978C 리포펩티드의 생산과 비교할 때, 50 시간째에 더 높은 인산염으로 보충된 배지에서 성장된 137024의 조 브로스로부터 더 깨끗한 HPLC 프로파일이 얻어짐을 밝혔다. 발효가 진전하고 인산염 탈억제가 발생함에 따라, 배지 A에서 이전에 관찰된 정도까지는 아니지만 숙주 대사물의 농도와 다양성이 증가하였다. 발효 초기에는 많은 숙주 대사물의 생산이 억제되었음에도 불구하고, 리포펩티드의 CDA 시리즈의 생산은 억제되지 않았다. CDA는 인산화되지 않거나 인산화된 형태 둘다로 존재할 수 있다. 이용되는 크로마토그래피 조건하에서, CDA의 인산화되지 않은 형태는 A21978C 리포펩티드와 동일한 영역에서 동시에 크로마토그래피되었고 검출과 정량을 복잡하게 만들었다. 인산염을 발효 배지내로 통합시킨 결과, 적어도 처음에는 생산을 CDA의 인산화된 형태로 치우치게 했으며, 이 형태는 HPLC에 의해 세 개의 A21978C로부터 잘 분리되었다. CDA 생산에 대한 이 효과는 또한 통합된 BAC 플라스미드를 가지지만 dpt 유전자 클러스터(137026)를 함유하지 않는 에스. 리비단스 TK23 act 넉아웃 균주의 대조군 균주의 고 인산염 보충된 배지 B에서의 발효로부터도 명확하게 나타났다.
Claims (73)
- 스트렙토마이세스 로제오스포루스(Streptomyces roseosporus) 유래의 답토마이신 비리보솜 펩티드 신세타제(non-ribosomal peptide synthetase; NRPS) 또는 그 서브유닛을 코딩하는 핵산 서열을 포함하는 분리된 핵산 분자로서, 이 핵산 분자는 DptBC를 코딩하며, pRHB159가 아닌 분리된 핵산 분자.
- 제1항에 있어서, 상기 핵산 분자는 서열 번호 11의 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 것인 핵산 분자.
- 제1항에 있어서, 상기 핵산 분자는 dptBC이거나 또는 서열 번호 12의 핵산 서열을 포함하는 것인 핵산 분자.
- 제1항에 있어서, 상기 핵산 분자는 BAC 클론 B12:03A05 유래의 에스. 로제오스포루스 핵산 서열로부터의 핵산 서열을 포함하는 것인 핵산 분자.
- 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 분리된 핵산 분자로서, 이 분리된 핵산 분자는 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 기준 핵산 분자에 선택적으로 하이브리드화하며, 상기 기준 핵산 분자는a) dptBC의 핵산 서열;b) DptBC의 아미노산 서열을 코딩하는 핵산 서열;c) 서열 번호 11의 아미노산 서열을 코딩하는 핵산 서열; 및d) 서열 번호 12의 핵산 서열로 이루어진 군 중에서 선택되는 핵산 서열을 포함하며,상기 핵산 분자는 pRHB159가 아닌 분리된 핵산 분자.
- 제5항에 있어서, 상기 핵산 분자는 낮은 엄격도 조건, 중간 엄격도 조건 및 높은 엄격도 조건으로 이루어지는 군 중에서 선택되는 조건하에 하이브리드화하는 것인 분리된 핵산 분자.
- 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 분리된 핵산 분자로서, 이 분리된 핵산 분자는a) dptBC의 핵산 서열;b) DptBC의 아미노산 서열을 코딩하는 핵산 서열;c) 서열 번호 11의 아미노산 서열을 코딩하는 핵산 서열; 및d) 서열 번호 12의 핵산 서열로 이루어지는 군 중에서 선택되는 핵산 서열에 적어도 50% 서열 동일성을 갖는 핵산 서열을 포함하며, pRHB159가 아닌 분리된 핵산 분자.
- 제7항에 있어서, 상기 상동성 분자는 (a) 내지 (d) 중 어느 하나의 핵산 서열에 적어도 60% 서열 동일성을 나타내는 것인 핵산 분자.
- 제8항에 있어서, 서열 동일성이 적어도 70%인 핵산 분자.
- 제9항에 있어서, 서열 동일성이 적어도 80%인 핵산 분자.
- 제10항에 있어서, 서열 동일성이 적어도 90%인 핵산 분자.
- 제11항에 있어서, 서열 동일성이 적어도 95%인 핵산 분자.
- 답토마이신 NRPS 또는 그 서브유닛을 코딩하는 분리된 핵산 분자로서, 이 분리된 핵산 분자는a) dptBC의 핵산 서열;b) DptBC의 아미노산 서열을 코딩하는 핵산 서열;c) 서열 번호 11의 아미노산 서열을 코딩하는 핵산 서열; 및d) 서열 번호 12의 핵산 서열로 이루어지는 군 중에서 선택되는 핵산 서열을 포함하는 핵산 분자의 대립유전자 변이체인 분리된 핵산 분자.
- 핵산 서열의 일부를 포함하는 분리된 핵산 분자로서, 상기 일부는(a) 서열 번호 11의 아미노산 5003∼5007을 포함하는 폴리펩티드의 아미노산 서열을 코딩하는 핵산 서열; 및(b) 서열 번호 12의 뉴클레오티드 68350∼68364를 포함하는 핵산 서열로 이루어지는 군 중에서 선택되고, 뉴클레오티드 길이가 적어도 14개이며,상기 핵산 분자는 pRHB159가 아닌 분리된 핵산 분자.
- 제14항에 있어서, 상기 핵산 분자는 답토마이신 NRPS로부터의 도메인 하나 이상을 코딩하는 것인 분리된 핵산 분자.
- 제14항에 있어서, 상기 핵산 분자는 답토마이신 NRPS로부터의 모듈 하나 이상을 코딩하는 것인 분리된 핵산 분자.
- 제14항에 있어서, 상기 일부는 상기 핵산 서열의 적어도 17 뉴클레오티드를 포함하는 것인 핵산 분자.
- 제17항에 있어서, 상기 일부는 상기 핵산 서열의 적어도 20 뉴클레오티드를 포함하는 것인 핵산 분자.
- 제18항에 있어서, 상기 일부는 상기 핵산 서열의 적어도 25 뉴클레오티드를 포함하는 것인 핵산 분자.
- 제19항에 있어서, 상기 일부는 상기 핵산 서열의 적어도 50 뉴클레오티드를 포함하는 것인 핵산 분자.
- 제14항 내지 제20항 중 어느 한 항에 있어서, 길이가 14∼60 뉴클레오티드인 올리고뉴클레오티드인 핵산 분자.
- 제1항 내지 제21항 중 어느 한 항의 핵산 분자를 포함하는 벡터.
- 제22항에 있어서, 상기 벡터는 상기 핵산 분자의 전사를 조절하는 발현 조절 서열을 포함하는 것인 벡터.
- 제23항에 있어서, 상기 발현 조절 서열은 원핵 세포에서 핵산 분자의 발현을 조절하는 것인 벡터.
- 제1항 내지 제21항 중 어느 한 항의 핵산 분자를 포함하는 숙주 세포.
- 제22항 내지 제24항 중 어느 한 항의 벡터를 포함하는 숙주 세포.
- 폴리펩티드가 제조되는 조건하에 제25항 또는 제26항의 숙주 세포를 배양하는 단계, 및 선택적으로 상기 폴리펩티드를 분리하는 단계를 포함하는, DptBC, 또는 그 도메인, 모듈 또는 일부의 제조 방법.
- (a) dptBC의 핵산 서열에 의해 코딩되는 아미노산 서열;(b) DptBC의 아미노산 서열;(c) 서열 번호 11의 아미노산 서열; 및(d) 서열 번호 12의 핵산 서열에 의해 코딩되는 아미노산 서열로 이루어지는 군 중에서 선택되는 아미노산 서열을 포함하는 분리된 폴리펩티드.
- 제1항 내지 제13항 중 어느 한 항의 핵산 분자에 의해 코딩되는 분리된 폴리펩티드.
- 제14항 내지 제21항 중 어느 한 항의 핵산 분자에 의해 코딩되는 분리된 폴리펩티드.
- 제28항 내지 제30항 중 어느 한 항의 폴리펩티드에 선택적으로 결합하는 항체.
- 제31항에 있어서, 완전한(intact) 면역글로불린; Fab, Fab', F(ab')2, Fv,dAb 또는 CDR 단편인, 면역글로불린의 항원 결합 부분; 단일쇄 항체; 키메라 항체; 다이아바디(diabody); 또는 폴리펩티드에 대한 특이적 항원 결합을 부여하기에 충분한 면역글로불린의 적어도 일부를 포함하는 폴리펩티드인 항체.
- 제32항에 있어서, 항체가 중화 항체인 항체.
- 제32항에 있어서, 항체가 활성화 항체인 항체.
- 제32항에 있어서, 항체가 모노클로날 항체 또는 폴리클로날 항체인 항체.
- (a) 제28항 내지 제30항 중 어느 한 항의 폴리펩티드로 인간을 제외한 동물을 면역화시키는 단계; 및(b) 항체를 분리하는 단계를 포함하는, 제28항 내지 제30항 중 어느 한 항의 폴리펩티드에 선택적으로 결합하는 항체의 제조 방법.
- (a) 제1항 내지 제21항 중 어느 한 항의 핵산 분자를 제공하는 단계;(b) 선택적 하이브리드화 조건하에 샘플을 상기 핵산 분자와 접촉시키는 단계; 및(c) 상기 핵산 분자가 샘플내의 핵산 분자에 선택적으로 하이브리드화했는지를 결정하는 단계를 포함하는, 샘플이 답토마이신 NRPS 또는 답토마이신 NRPS 서브유닛을 코딩하는 핵산 분자를 함유하는지를 결정하는 방법.
- (a) 서열 번호 1을 포함하는 핵산 분자를 숙주 세포내로 도입하는 단계; 및(b) 답토마이신이 제조되는 조건하에 숙주 세포를 배양하는 단계를 포함하는, 답토마이신의 제조 방법.
- 제38항에 있어서, 상기 핵산 분자는 스트렙토마이세스로부터 유래된 것인 방법.
- 제38항에 있어서, 상기 핵산 분자는 에스. 로제오스포루스로부터 유래된 것인 방법.
- 제40항에 있어서, 상기 핵산 분자는 전체 답토마이신 생합성 유전자 클러스터를 포함하는 것인 방법.
- 제38항에 있어서, 상기 핵산 분자는 DptA, DptBC 또는 DptD를 포함하는 펩티드를 코딩하는 것인 방법.
- 제42항에 있어서, 상기 핵산 분자는 서열 번호 9, 서열 번호 11 및 서열 번호 7로 이루어진 군 중에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 것인 방법.
- 제38항에 있어서, 상기 핵산 분자는 dptA, dptBC 및 dptD로 이루어진 군 중에서 선택되는 핵산 서열을 포함하거나, 또는 상기 핵산 분자는 서열 번호 10, 서열 번호 12 및 서열 번호 3으로 이루어진 군 중에서 선택되는 핵산 서열을 포함하는 것인 방법.
- 제38항에 있어서, 상기 핵산 분자는 BAC 클론 B12:03A05 유래의 에스. 로제오스포루스 핵산 서열로부터의 핵산 서열을 포함하는 것인 방법.
- 제38항에 있어서, 상기 핵산 분자는 답토마이신 유전자 클러스터 또는 그 일부를 코딩하는 기준 핵산 분자에 선택적으로 하이브리드화하며, 상기 기준 핵산 분자는(a) dptA, dptBC 및 dptD로 이루어진 군 중에서 선택되는 핵산 서열;(b) DptA, DptBC 및 DptD로 이루어진 군 중에서 선택되는 폴리펩티드의 아미노산 서열을 코딩하는 핵산 서열;(c) 서열 번호 9, 서열 번호 11 및 서열 번호 7로 이루어진 군 중에서 선택되는 폴리펩티드의 아미노산 서열을 코딩하는 핵산 서열;(d) 서열 번호 10, 서열 번호 12 및 서열 번호 3으로 이루어진 군 중에서 선택되는 핵산 서열;(e) BAC 클론 B12:03A05 유래의 에스. 로제오스포루스 핵산 서열로부터의 핵산 서열로 이루어지는 군 중에서 선택되는 핵산 서열을 포함하는 것인 방법.
- 제38항에 있어서, 답토마이신을 분리하는 단계를 더 포함하는 것인 방법.
- (a) 답토마이신을 발현하는 숙주 세포를 제공하는 단계;(b) 상기 숙주 세포의 염색체의 중성(neutral) 부위내로 핵산 분자를 도입하는 단계로서, 상기 핵산 분자가 도입되면 상기 핵산 분자가 없는 세포와 비교하여 세포에 의한 답토마이신의 생산량이 증가되는 것인 단계; 및(c) 답토마이신이 제조되는 조건하에 상기 숙주 세포를 배양하는 단계를 포함하는, 세포에 의한 답토마이신의 생산량을 증가시키는 방법으로서, 상기 핵산 분자는(i) dptBC의 핵산 서열;(ii) DptBC의 아미노산 서열을 코딩하는 핵산 서열;(iii) 서열 번호 11의 아미노산 서열을 코딩하는 핵산 서열; 및(iv) 서열 번호 12의 핵산 서열로 이루어진 군 중에서 선택되는 핵산 서열을 포함하는 것인 방법.
- 제48항에 있어서, 상기 숙주 세포는 답토마이신 생합성 유전자 클러스터를 포함하는 에스. 로제오스포루스 또는 에스. 리비단스(S. lividans)인 방법.
- 서열 번호 24, 54, 74, 94, 98 및 100으로 이루어진 군 중에서 선택되는 핵산 서열을 포함하거나, 또는 서열 번호 93, 97 및 99로 이루어진 군 중에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산 분자로서, 이 핵산 분자는 pRHB160, pRHB166, pRHB613, pRHB614 또는 pRHB680이 아닌 핵산 분자.
- 서열 번호 93, 97 및 99로 이루어진 군 중에서 선택되는 아미노산 서열을 포함하거나, 또는 서열 번호 24, 54, 74, 94, 98 및 100으로 이루어진 군 중에서 선택되는 핵산 분자에 의해 코딩되는 폴리펩티드.
- 서열 번호 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 및 135로 이루어진 군 중에서 선택되는 핵산 서열을 포함하거나, 또는 서열 번호 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134 및 136으로 이루어진 군 중에서 선택되는 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산 분자로서, 이 핵산 분자는 pRHB174가 아닌 핵산 분자.
- 서열 번호 104, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128,130, 132, 134 및 136으로 이루어진 군 중에서 선택되는 아미노산 서열을 포함하거나, 또는 서열 번호 102, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133 및 135로 이루어진 군 중에서 선택되는 핵산 분자에 의해 코딩되는 폴리펩티드.
- 제51항 또는 제53항의 폴리펩티드에 결합하는 항체.
- (a) 세포내에 답토마이신 생합성 유전자 클러스터 외의 NRPS 유전자 클러스터를 포함하는 세포를 제공하는 단계;(b) 답토마이신 생합성 유전자 클러스터로부터의 NRPS의 전부 또는 일부를 코딩하는 유전자 하나 이상을 세포내로 도입하는 단계; 및(c) 리포펩티드 또는 그 펩티드 코어가 제조되는 조건하에 세포를 배양하는 단계를 포함하는, 리포펩티드 또는 그 펩티드 코어의 제조 방법.
- (a) 세포내에 답토마이신 생합성 유전자 클러스터를 포함하는 세포를 제공하는 단계;(b) 답토마이신 생합성 유전자 클러스터 외의 NRPS 유전자 클러스터로부터의 NRPS의 전부 또는 일부를 코딩하는 다른 유전자 하나 이상을 세포내로 도입하는 단계;(c) 리포펩티드 또는 그 펩티드 코어가 제조되는 조건하에 세포를 배양하는 단계를 포함하는, 리포펩티드 또는 그 펩티드 코어의 제조 방법.
- 제55항 또는 제56항에 있어서, 상기 답토마이신 생합성 유전자 클러스터는 답토마이신 생합성 유전자 클러스터의 자연 발생 뉴클레오티드 서열을 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 상기 답토마이신 생합성 유전자 클러스터는 답토마이신 생합성 유전자 클러스터의 자연 발생 뉴클레오티드 서열과 비교하여 변형된 뉴클레오티드 서열을 포함하는 것인 방법.
- 제58항에 있어서, 상기 변형된 뉴클레오티드 서열은 자연 발생 답토마이신 생합성 유전자 클러스터의 NRPS에 의해 코딩되는 아미노산과 비교하여, 답토마이신 생합성 유전자 클러스터에 의해 코딩된 NRPS에 의해 통합되는 아미노산 하나 이상을 변경시키는 답토마이신 생합성 유전자 클러스터의 모듈 하나 이상의 변형 또는 치환을 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 답토마이신 생합성 유전자 클러스터 외의 상기 NRPS 유전자 클러스터는 NRPS 유전자 클러스터의 자연 발생 뉴클레오티드 서열을 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 답토마이신 생합성 유전자 클러스터 외의 상기 NRPS 유전자 클러스터는 NRPS 유전자 클러스터의 자연 발생 뉴클레오티드 서열과 비교하여 변형된 뉴클레오티드 서열을 포함하는 것인 방법.
- 제61항에 있어서, 상기 변형된 뉴클레오티드 서열은 자연 발생 NRPS 유전자 클러스터의 NRPS에 의해 코딩되는 아미노산과 비교하여 NRPS 유전자 클러스터에 의해 통합되는 아미노산 하나 이상을 변경시키는 NRPS 유전자 클러스터의 모듈 하나 이상의 변형 또는 치환을 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 상기 답토마이신 생합성 유전자 클러스터는 답토마이신 생합성 유전자 클러스터의 자연 발생 뉴클레오티드 서열을 포함하고, 답토마이신 생합성 유전자 클러스터 외의 상기 NRPS 유전자 클러스터는 NRPS 유전자 클러스터의 자연 발생 뉴클레오티드 서열을 포함하는 것인 방법.
- 제55항 또는 56항에 있어서, 상기 답토마이신 생합성 유전자 클러스터는 답토마이신 생합성 유전자 클러스터의 자연 발생 뉴클레오티드 서열과 비교하여 변형된 뉴클레오티드 서열을 포함하고, 답토마이신 생합성 유전자 클러스터 외의 상기 NRPS 유전자 클러스터는 NRPS 유전자 클러스터의 자연 발생 뉴클레오티드 서열과비교하여 변형된 뉴클레오티드 서열을 포함하는 것인 방법.
- 제64항에 있어서, 상기 답토마이신 생합성 유전자 클러스터와 답토마이신 생합성 유전자 클러스터 외의 상기 NRPS 유전자 클러스터의 상기 변형된 뉴클레오티드 서열은 자연 발생 유전자 클러스터의 NRPS에 의해 코딩되는 아미노산과 비교하여, NRPS 유전자 클러스터에 의해 통합되는 아미노산 하나 이상을 변경시키는 답토마이신 생합성 유전자 클러스터 또는 NRPS 유전자 클러스터의 모듈 하나 이상의 변형 또는 치환을 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 답토마이신 생합성 유전자 클러스터 외의 NRPS 유전자 클러스터로부터의 NRPS의 전부 또는 일부를 코딩하는 유전자 하나 이상을 세포내로 도입하는 단계를 더 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 답토마이신 생합성 유전자 클러스터로부터의 NRPS의 전부 또는 일부를 코딩하는 유전자 하나 이상을 세포내로 도입하는 단계를 더 포함하는 것인 방법.
- 제55항 또는 제56항에 있어서, 리포펩티드 또는 그 펩티드 코어를 분리하는 단계를 더 포함하는 것인 방법.
- 제55항 또는 제56항의 방법에 의해 제조된 세포.
- 제55항 또는 제56항의 방법에 의해 제조된 리포펩티드 또는 그 펩티드 코어.
- (a) 세포내에 답토마이신 생합성 유전자 클러스터를 포함하는 세포를 제공하는 단계;(b) 답토마이신 생합성 유전자 클러스터의 모듈 하나 이상을 변형시키거나 교환하여, 이 유전자 클러스터에 의해 통합이 지시되는 아미노산 하나 이상을 변경시키는 단계;(c) 답토마이신 생합성 유전자 클러스터 또는 다른 NRPS 유전자 클러스터로부터의 NRPS의 전부 또는 일부를 코딩하는 다른 유전자 하나 이상을 세포내로 도입하는 단계; 및(d) 리포펩티드 또는 그 펩티드 코어가 제조되는 조건하에 세포를 배양하는 단계를 포함하는, 리포펩티드 또는 그 펩티드 코어의 제조 방법.
- (a) 세포내에 NRPS 유전자 클러스터를 포함하는 세포를 제공하는 단계;(b) 답토마이신 생합성 유전자 클러스터를 세포내로 도입하는 단계;(c) 답토마이신 생합성 유전자 클러스터의 모듈 하나 이상을 변형시키거나 교환하여, 이 유전자 클러스터에 의해 통합이 지시되는 아미노산 하나 이상을 변경시키는 단계;(d) 리포펩티드 또는 그 펩티드 코어가 제조되는 조건하에 세포를 배양하는 단계를 포함하는, 리포펩티드 또는 그 펩티드 코어의 제조 방법.
- (a) 세포내에 NRPS 유전자 클러스터를 포함하는 세포를 제공하는 단계;(b) 세포내의 답토마이신 생합성 유전자 클러스터를 제공하는 단계;(c) 답토마이신 생합성 유전자 클러스터의 모듈 하나 이상을 변형시키거나 교환하여, 이 유전자 클러스터에 의해 통합이 지시되는 아미노산 하나 이상을 변경시키는 단계;(d) 변형된 답토마이신 생합성 유전자 클러스터를 세포내로 도입하는 단계; 및(e) 리포펩티드 또는 그 펩티드 코어가 제조되는 조건하에서 숙주 세포를 배양하는 단계를 포함하는, 리포펩티드 또는 그 펩티드 코어의 제조 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31038501P | 2001-08-06 | 2001-08-06 | |
US60/310,385 | 2001-08-06 | ||
PCT/US2001/032354 WO2002059322A2 (en) | 2000-10-17 | 2001-10-17 | Compositions and methods relating to the daptomycin biosynthetic gene cluster |
USPCT/US01/32354 | 2001-10-17 | ||
US37986602P | 2002-05-10 | 2002-05-10 | |
US60/379,866 | 2002-05-10 | ||
PCT/US2002/024310 WO2003014297A2 (en) | 2001-08-06 | 2002-07-31 | Compositions and methods relating to the daptomycin biosynthetic gene cluster |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107004815A Division KR20100039443A (ko) | 2001-08-06 | 2002-07-31 | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20040032891A true KR20040032891A (ko) | 2004-04-17 |
Family
ID=34082747
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107004815A KR20100039443A (ko) | 2001-08-06 | 2002-07-31 | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 |
KR10-2004-7001843A KR20040032891A (ko) | 2001-08-06 | 2002-07-31 | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020107004815A KR20100039443A (ko) | 2001-08-06 | 2002-07-31 | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 |
Country Status (6)
Country | Link |
---|---|
US (2) | US20050027113A1 (ko) |
JP (1) | JP2005508622A (ko) |
KR (2) | KR20100039443A (ko) |
AR (1) | AR036202A1 (ko) |
AU (1) | AU2002324580A1 (ko) |
IL (1) | IL160169A0 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100762315B1 (ko) * | 2006-01-24 | 2007-10-04 | 한국생명공학연구원 | 푸자리시딘 생합성 효소 및 이를 코딩하는 유전자 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6696412B1 (en) | 2000-01-20 | 2004-02-24 | Cubist Pharmaceuticals, Inc. | High purity lipopeptides, Lipopeptide micelles and processes for preparing same |
US20060014674A1 (en) | 2000-12-18 | 2006-01-19 | Dennis Keith | Methods for preparing purified lipopeptides |
JP2008534444A (ja) * | 2005-03-10 | 2008-08-28 | スミスクライン・ビーチャム・コーポレイション | 新規な方法 |
DE102007017861A1 (de) * | 2007-04-13 | 2008-10-16 | Philipps-Universität Marburg | Protein zur chemoenzymatischen Herstellung von L-threo-Hydroxyaspartat |
TW201118170A (en) * | 2009-11-20 | 2011-06-01 | Ind Tech Res Inst | Expression vector for expressing recombinant protein in cyanobacterium |
AR079127A1 (es) | 2009-11-23 | 2011-12-28 | Cubist Pharm Inc | Composiciones de daptomicina y metodos relacionados |
CN104024272B (zh) * | 2011-10-12 | 2018-04-20 | 赛诺菲 | 用于浅灰霉素和甲基浅灰霉素的生物合成的基因簇 |
JP6741572B2 (ja) | 2013-03-15 | 2020-08-19 | モジュラー ジェネティクス, インコーポレイテッド | アシルアミノ酸の生成 |
KR101580370B1 (ko) | 2013-12-18 | 2015-12-23 | 동국제약 주식회사 | 신규한 스트렙토마이세스 필라멘토서스 변이주 및 이를 이용한 답토마이신의 생산 방법 |
US11371066B2 (en) | 2015-07-13 | 2022-06-28 | Modular Genetics, Inc. | Generation of acyl alcohols |
EP3630794A4 (en) | 2017-05-27 | 2021-03-03 | The Rockefeller University | MALACIDINS AND METHODS OF USE |
CN109554321B (zh) * | 2018-12-03 | 2021-12-31 | 清华大学 | 一种高产脂肽的基因工程菌及其应用 |
US20220298517A1 (en) * | 2019-06-25 | 2022-09-22 | Novozymes A/S | Counter-selection by inhibition of conditionally essential genes |
CN111139208B (zh) * | 2019-09-04 | 2022-07-26 | 湖南省微生物研究院 | 一种伊短菌素高产工程菌及其制备方法和应用 |
CN113249401B (zh) * | 2020-02-10 | 2022-11-04 | 中国科学院分子植物科学卓越创新中心 | 一种提高链霉菌雷帕霉素产量的方法 |
JP2023517926A (ja) | 2020-03-12 | 2023-04-27 | バクスター・インターナショナル・インコーポレイテッド | ソルビトールとマンニトールの組み合わせを含むダプトマイシン製剤 |
CN111575251B (zh) * | 2020-05-29 | 2022-03-11 | 上海交通大学 | 一种用于达托霉素生物合成的dptC1突变体的构建 |
KR102533566B1 (ko) * | 2020-07-09 | 2023-05-16 | 건국대학교 산학협력단 | 코돈 리프로그래밍화된 답토마이신 생합성 유전자 및 이의 용도 |
CN113045628B (zh) * | 2021-03-23 | 2022-06-14 | 山东大学 | 一种抗菌肽或其变体在制备抗菌产品中的应用 |
CN114921365A (zh) * | 2022-04-16 | 2022-08-19 | 中国农业科学院植物保护研究所 | 一株娄彻氏链霉菌及其应用 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4537717A (en) * | 1982-05-21 | 1985-08-27 | Eli Lilly And Company | Derivatives of A-21978C cyclic peptides |
US4885243A (en) * | 1984-10-09 | 1989-12-05 | Eli Lilly And Company | Process for producing A-21978C derivatives |
IT1264712B1 (it) * | 1993-07-13 | 1996-10-04 | Eniricerche Spa | Metodo di sintesi biologica di peptidi |
IT1277466B1 (it) * | 1995-08-09 | 1997-11-10 | Eniricerche Spa | Peptide sintetasi ingegnerizzate e loro impiego per la produzione via non-ribosomale di peptidi |
US5827689A (en) * | 1996-11-13 | 1998-10-27 | Smithkline Beecham Corporation | FabD polynucleotides |
US6258934B1 (en) * | 1997-01-24 | 2001-07-10 | Smithkline Beecham Corporation | FabD |
US6143526A (en) * | 1998-03-09 | 2000-11-07 | Baltz; Richard H. | Biosynthetic genes for spinosyn insecticide production |
-
2002
- 2002-07-31 AU AU2002324580A patent/AU2002324580A1/en not_active Abandoned
- 2002-07-31 IL IL16016902A patent/IL160169A0/xx unknown
- 2002-07-31 KR KR1020107004815A patent/KR20100039443A/ko not_active Application Discontinuation
- 2002-07-31 US US10/211,028 patent/US20050027113A1/en not_active Abandoned
- 2002-07-31 AR ARP020102905A patent/AR036202A1/es unknown
- 2002-07-31 KR KR10-2004-7001843A patent/KR20040032891A/ko not_active Application Discontinuation
- 2002-07-31 JP JP2003519229A patent/JP2005508622A/ja active Pending
-
2006
- 2006-08-28 US US11/510,972 patent/US20070128694A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100762315B1 (ko) * | 2006-01-24 | 2007-10-04 | 한국생명공학연구원 | 푸자리시딘 생합성 효소 및 이를 코딩하는 유전자 |
Also Published As
Publication number | Publication date |
---|---|
US20050027113A1 (en) | 2005-02-03 |
AU2002324580A1 (en) | 2003-02-24 |
JP2005508622A (ja) | 2005-04-07 |
AR036202A1 (es) | 2004-08-18 |
IL160169A0 (en) | 2004-07-25 |
KR20100039443A (ko) | 2010-04-15 |
US20070128694A1 (en) | 2007-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070128694A1 (en) | Compositions and methods relating to the daptomycin biosynthetic gene cluster | |
Nguyen et al. | Genetically engineered lipopeptide antibiotics related to A54145 and daptomycin with improved properties | |
Baltz et al. | Natural products to drugs: daptomycin and related lipopeptide antibiotics | |
Yin et al. | The enduracidin biosynthetic gene cluster from Streptomyces fungicidicus | |
Miao et al. | The lipopeptide antibiotic A54145 biosynthetic gene cluster from Streptomyces fradiae | |
Magarvey et al. | Biosynthetic pathway for mannopeptimycins, lipoglycopeptide antibiotics active against drug-resistant gram-positive pathogens | |
Spohn et al. | Overproduction of ristomycin A by activation of a silent gene cluster in Amycolatopsis japonicum MG417-CF17 | |
JP5789190B2 (ja) | 新規の遺伝子クラスター | |
Zhang et al. | Structural diversity, biosynthesis, and biological functions of lipopeptides from Streptomyces | |
Nguyen et al. | A glutamic acid 3‐methyltransferase encoded by an accessory gene locus important for daptomycin biosynthesis in Streptomyces roseosporus | |
US20170081690A1 (en) | Moenomycin biosynthesis-related compositions and methods of use thereof | |
JP2006180882A (ja) | ラモプラニン生合成用遺伝子クラスター | |
AU2010212851B2 (en) | Nucleic acid molecule of a biosynthetic cluster encoding non ribosomal peptide synthases and uses thereof | |
WO2003014297A2 (en) | Compositions and methods relating to the daptomycin biosynthetic gene cluster | |
Carnio et al. | Pyridinyl polythiazole class peptide antibiotic micrococcin P1, secreted by foodborne Staphylococcus equorum WS2733, is biosynthesized nonribosomally | |
WO2002059322A2 (en) | Compositions and methods relating to the daptomycin biosynthetic gene cluster | |
CN101189253A (zh) | 抗感染脂肽类 | |
US8188245B2 (en) | Enduracidin biosynthetic gene cluster from streptomyces fungicidicus | |
JP7086984B2 (ja) | Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法 | |
US20080145892A1 (en) | Genes and Proteins For the Biosynthesis of the Glycopeptide Antibiotic A40926 | |
US7235651B2 (en) | Genes and proteins involved in the biosynthesis of lipopeptides | |
Gao et al. | Translocation of subunit PPSE in plipastatin synthase and synthesis of novel lipopeptides | |
KR101748678B1 (ko) | 글라이코펩타이드 화합물 생산증대방법 | |
US10239918B2 (en) | Cahuitamycins and methods of making and using the same | |
JPWO2004001039A1 (ja) | 放線菌由来のプラスミドおよびそれを用いた二次代謝物の製法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
J201 | Request for trial against refusal decision | ||
A107 | Divisional application of patent | ||
B601 | Maintenance of original decision after re-examination before a trial | ||
E801 | Decision on dismissal of amendment | ||
J121 | Written withdrawal of request for trial | ||
WITB | Written withdrawal of application |