KR20080026120A - 비천연적으로 코딩된 아미노산의 단백질로의 도입 - Google Patents

비천연적으로 코딩된 아미노산의 단백질로의 도입 Download PDF

Info

Publication number
KR20080026120A
KR20080026120A KR1020077030326A KR20077030326A KR20080026120A KR 20080026120 A KR20080026120 A KR 20080026120A KR 1020077030326 A KR1020077030326 A KR 1020077030326A KR 20077030326 A KR20077030326 A KR 20077030326A KR 20080026120 A KR20080026120 A KR 20080026120A
Authority
KR
South Korea
Prior art keywords
amino acids
protein
limited
trna
naturally encoded
Prior art date
Application number
KR1020077030326A
Other languages
English (en)
Inventor
호 성 조
Original Assignee
암브룩스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 암브룩스, 인코포레이티드 filed Critical 암브룩스, 인코포레이티드
Publication of KR20080026120A publication Critical patent/KR20080026120A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P5/00Drugs for disorders of the endocrine system
    • A61P5/10Drugs for disorders of the endocrine system of the posterior pituitary hormones, e.g. oxytocin, ADH
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/78Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Endocrinology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Diabetes (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

본 발명은 슈도모나스(Pseudomonas) 종 및 이로부터 유래된 균주에 의한 비천연적으로 코딩된 아미노산의 폴리펩티드로의 생체내 도입을 위한 방법 및 조성물을 제공한다. 또한, 슈도모나스 종 및 이로부터 유래된 균주에 의해 제조된 비천연적으로 코딩된 아미노산을 갖는 단백질을 포함하는 조성물도 또한 제공된다.
슈도모나스, 비천연적으로 코딩된 아미노산, 폴리펩티드, 도입, 단백질

Description

비천연적으로 코딩된 아미노산의 단백질로의 도입{INCORPORATION OF NON-NATURALLY ENCODED AMINO ACIDS INTO PROTEINS}
속달 우편 라벨 번호: EQ 633746410 US
기탁일: 2006년 6월 2일
하기 서명한 본인은 본 국제특허출원 AMBX-0094.00PCT가 상기 기탁일자에 37 CFR 1.10에 의거하여 다음의 주소: [미국 22313-1450 버지니아주 알렉산드리아 우편사서함 1450, 특허청장, Mail Stop PCT, Commissioner for Patents, P.O. Box 1450, Alexandria, Virginia 22313-1450]의 미국 우편국의 속달 우편 우체국(United States Postal Service "Express Mail Post Office to Addressee")에 기탁되었음을 증명한다(서명 쟈넷 콴).
관련 출원에 대한 상호 참조
이 출원은 2005년 6월 3일에 출원된 U.S. 가특허출원 일련 No. 60/687,603을 우선권으로 주장하고, 이의 명세서 내용은 본원에 전체적으로 참고로 인용된다.
- 기술 분야 -
본 발명은 번역 생화학 및 재조합 단백질 발현의 분야에 속한다. 본 발명은 세균 숙주 세포, 및 하나 이상의 비천연적으로 코딩된 아미노산을 함유하는 단백질의 생산 방법에 관한 것이다. 본 발명은 또한 오르소고날(orthogonal) 아미노아실- tRNA 합성효소, 오르소고날 tRNA, 비천연적으로 코딩된 아미노산, 셀렉터 코돈, 및 관련 조성물을 이용한 슈도모나스(Pseudomonas) 종 및 이의 균주의 세균 재조합 숙주 세포에서의 단백질의 생산 방법에 관한 것이다.
최근, 단백질의 부위-특이적 변형과 연관된 많은 제한점들을 극복하도록 기약된 단백질 과학에 있어 전반적으로 새로운 기술이 보고되었다. 구체적으로, 신규 요소가 원핵생물 에스케리치아 콜라이( Escherichia coli )(E. 콜라이 )(예컨대, [L. Wang 등(2001), Science 292:498-500]), 및 진핵생물 사카로마이세스 세리비지아에( Sacchromyces cerevisiae )(S. 세레비지아에 )(예컨대, [J. Chin 등, Science 301:964-7(2003)])의 단백질 생합성 기작에 부가되었으며, 이는 생체내 단백질로의 비유전적으로 코딩된 아미노산의 도입을 가능하게 하였다. 광친화성 표지 및 광이성화가능한 아미노산, 케토 아미노산 및 글리코실화 아미노산을 포함한, 신규 화학적, 물리적 또는 생물학적 성질을 갖는 수많은 새로운 아미노산들이 효율적으로 또한 고신뢰도로, 앰버 코돈, TAG에 대한 반응으로 E. 콜라이 및 효모 내의 단백질로, 상기 방법을 이용하여 도입되었다. 이에 대해 예컨대, [J. W. Chin 등(2002), Journal of the American Chemical Society 124:9026-9027; J. W. Chin, & P. G. Schultz(2002), ChemBioChem 3(11):1135-1137; J. W. Chin 등(2002), PNAS United States of America 99:11020-11024; 및 L. Wang, & P. G. Schultz(2002), Chem . Comm ., 1:1-11]을 참고한다. 이 연구들은, 20개의 통상의 유전적으로 코딩된 아미노산에서 발견되는 작용기 모두에 대해 화학적으로 불활성이고, 효율적으로 또한 선택적으로 반응하기 위해 사용되어, 안정한 공유 연결기를 형성할 수 있는, 단백질 내에 발견되지 않는 화학적 작용기, 예컨대 케톤기, 알킨(alkyne)기 및 아지드 부분을 선택적으로 또한 통상적으로 도입할 수 있음을 입증하였다.
단백질에 비유전적으로 코딩된 아미노산을 도입할 수 있음으로 인해, 리신의 엡실론 -NH2, 시스테인의 술프히드릴 -SH, 히스티딘의 이미노기 등과 같은 천연 발생 작용기에 대한 중요한 대안을 제공할 수 있는 화학적 작용기를 도입할 수 있게 된다. 특정 화학적 작용기들은 20개의 통상의 유전적으로 코딩된 아미노산에서 발견되는 작용기에 대해 불활성이나, 완전히 및 효율적으로 반응하여 안정한 연결기를 형성하는 것으로 알려져 있다.
E. 콜라이 재조합 숙주 세포에서 적당히 발현되지 않을 수 있는 재조합 단백질이 있음이 공지되어 있다. E. 콜라이 외의 재조합 단백질의 발현을 위한 대안적 세균 숙주 세포가 개발되었다. E. 콜라이 재조합 숙주 세포에 대한 그러한 대안에는 슈도모나스 종, 그람 음성 세균, 및 이들로부터 유래된 각종 균주들이 포함된다. 그러므로, 재조합 단백질로의 비천연적으로 코딩된 아미노산의 도입을 위한 E 콜라이 외의 대안적 재조합 숙주 세포에 대한 필요가 있다.
발명의 개요
본 발명은 비천연적으로 코딩된 아미노산을 단백질에 도입할 수 있는 슈도모나스 번역 시스템을 제조하고 이용하기 위한 각종 방법들을 제공한다. 본 발명은 매우 다양한 슈도모나스 종 및 이로부터 유래된 균주, 및 관련 조성물을 포함한다. 슈도모나스 종 및 이로부터 유래된 균주 내에서 슈도모나스 번역 시스템에 의해 제조된 비천연적으로 코딩된 아미노산을 포함하는 단백질도 또한 본 발명의 한 특성이다. 공지 및 신규 비천연적으로 코딩된 아미노산이 본 발명의 슈도모나스 번역 시스템을 이용하여 단백질에 도입될 수 있다.
따라서, 한 측면에서, 본 발명은 슈도모나스 종 및 균주로부터 유래되거나 그것들에 사용하기 위한 슈도모나스 번역 시스템을 포함하는 조성물을 제공한다. 슈도모나스 번역 시스템은 오르소고날 tRNA(O-tRNA) 및 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 포함한다. 전형적으로, O-RS는 우선적으로 O-tRNA를 슈도모나스 번역 시스템 내 1개 이상의 비천연 발생 아미노산으로 아미노아실화하고, O-tRNA는 1개 이상의 셀렉터 코돈을 인식한다. 이에 따라, 슈도모나스 번역 시스템은 셀렉터 코돈에 대한 반응으로 비천연적으로 코딩된 아미노산을 단백질에 삽입한다. 슈도모나스 번역 시스템은 슈도모나스 숙주 세포 내에서, 또는 슈도모나스 세포의 번역 요소를 이용하여 본원에 기재된 바와 같이 기능하여, 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드를 제공할 수 있다.
본 발명의 전형적 슈도모나스 번역 시스템은 P. 플루오레슨스(P. fluorescens), P. 푸티다 (P. putida ), P. 아에루기노사 (P. aeruginosa ) 등, 및 동정하고자 하는 신규 슈도모나스 종을 포함하나 이들에 제한되지 않는 매우 다양한 슈도모나스 종의 세포들을 포함한다. 대안적으로, 슈도모나스 번역 시스템은 시험관내 슈도모나스 번역 시스템, 예를 들어 슈도모나스 숙주 세포로부터의 세포내 번역 요소를 포함하는 추출물을 포함한다.
O-tRNA의 예에는 서열 번호 1, 2 및 3에 기재된 폴리뉴클레오티드 서열, 및/또는 이의 상보적 폴리뉴클레오티드 서열이 포함되나 이들에 제한되지 않는다. 마찬가지로, O-RS의 예에는 서열 번호 35-66에 기재된 아미노산 서열을 포함하는 폴리펩티드, 및 서열 번호 4-34에 기재된 핵산 서열에 의해 코딩되는 폴리펩티드 및 이의 상보적 폴리뉴클레오티드 서열이 포함되나 이들에 제한되지 않는다
본 발명의 슈도모나스 번역 시스템에 사용될 수 있는 비천연적으로 코딩된 아미노산에는 티로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 술포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 히드록실아민, 케토, 또는 아미노 치환된 아미노산, 또는 이들의 임의 조합; 광활성화 가교기를 포함하는 아미노산; 스핀-표지된 아미노산; 형광성 아미노산; 신규 작용기를 갖는 아미노산; 또 다른 분자와 공유 또는 비공유 상호작용하는 아미노산; 금속-결합 아미노산; 금속-함유 아미노산; 방사능 아미노산; 광포집(photocaged) 및/또는 광이성화 아미노산; 비오틴 또는 비오틴 유사체를 함유하는 아미노산; 글리코실화 또는 탄수화물 변형 아미노산; 케토-함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르 포함 아미노산; 중원자-치환된 아미노산; 화학적 절단형 또는 광절단형 아미노산; 연장 측쇄를 갖는 아미노산; 독성 기-함유 아미노산; 당(sugar)-치환된 아미노산, 예컨대 당 치환된 세린 등; 탄소-연결의 당-함유 아미노산; 산화환원-활성 아미노산; α-히드록시-함유 산; 아미노 티오산-함유 아미노산; α,α-이치환된 아미노산; β-아미노산; 및 프롤린 이외의 고리형 아미노산이 포함되나 이들에 제한되지 않는다.
예를 들어, 비천연적으로 코딩된 아미노산은 O-메틸-L-티로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-요오도페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 및 이소프로필-L-페닐알라닌일 수 있다. 한 실시양태에서, 하나 이상의 비천연적으로 코딩된 아미노산은 O-메틸-L-티로신이다. 한 실시양태에서 비천연적으로 코딩된 아미노산은 L-3-(2-나프틸)알라닌이다. 또 다른 구체적 예의 군에서, 비천연적으로 코딩된 아미노산은 아미노-, 이소프로필-, 또는 O-알릴-함유 페닐알라닌 유사체이다.
넌센스 코돈, 앰버 코돈, 오커 코돈 및 오팔 중지 코돈을 포함하나 이들에 제한되지 않는 중지 코돈, 희소 코돈, 4 (또는 그 이상)-염기 코돈, 비천연 뉴클레오시드 기재 코돈 등을 포함하나 이에 제한되지 않는 각종 셀렉터 코돈들 중 임의의 것들이 본 발명에 사용될 수 있다. 예를 들어, 한 실시양태에서, 셀렉터 코돈은 앰버 코돈이다.
본 발명의 슈도모나스 번역 시스템은 슈도모나스 종 세포, 또는 슈도모나스 번역 시스템에 비천연적으로 코딩된 아미노산을 유용하게 적당한 양으로 포함하는 단백질을 합성하는 능력을 제공한다. 예를 들어, 하나 이상의 비천연적으로 코딩된 아미노산을 포함하는 단백질은 적어도 약 1, 5, 10, 50, 100, 500, 1000 mg/l 또는 그 이상의 농도로, 본 발명의 슈도모나스 숙주 세포 또는 번역 시스템에서 생산될 수 있다. 또한, 하나 이상의 비천연적으로 코딩된 아미노산을 포함하는 단백질은 적어도 약 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100 mg/l 또는 그 이상의 농도로 본 발명의 슈도모나스 숙주 세포 또는 번역 시스템에서 생산될 수 있다.
본 발명의 또 다른 측면은 임의의 관심 단백질에 대해 상동성을 갖지만 하나 이상의 비천연적으로 코딩된 아미노산을 포함하는 단백질의 생산을 위해 제공된다. 예를 들어, 하나 이상의 비천연적으로 코딩된 아미노산을 포함하나 하나 이상의 다른 단백질에 대해 상동성이 있는 치료 단백질로 제조될 수 있다. 예를 들어, 한 측면에서, 비천연적으로 코딩된 아미노산을 포함하는 단백질은 치료 단백질 또는 기타 단백질, 예컨대 사이토킨, 성장 인자, 성장 인자 수용체, 인터페론, 인터류킨, 염증성 분자, 발암유전자 산물, 펩티드 호르몬, 신호 전달 분자, 스테로이드 호르몬 수용체, 전사 활성화제, 전사 억제제, 에리트로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GRO, MIP-1α, MIP-1β, MCP-1, 간세포 성장 인자, 인슐린-유사 성장 인자, 백혈병 억제 인자, 온코스타틴(oncostatin) M, PD-ECSF, PDGF, 플레이오트로핀, SCF, c-키트 리간드, VEGF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF(섬유모세포 성장 인자), PDGF, TNF, TGF-α, TGF-β, EGF(상피 성장 인자), KGF(각화세포 성장 인자), SCF/c-키트, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히알루린/CD44, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체, 및/또는 코르티코스테론에 대해 상동성이 있다. 또 다른 실시양태 군에서, 단백질은 치료 단백질 또는 기타 단백질, 예컨대 알파-1 안티트립신, 안지오스타틴, 항용혈성 인자, 항체, 아포지단백질, 아포단백질, 심방 나트륨 이뇨성 인자, 심방 나트륨 이뇨성 폴리펩티드, 심방 펩티드, C-X-C 케모킨, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-IO, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-키트 리간드, 사이토킨, CC 케모킨, 단핵구 화학유인성 단백질-1, 단핵구 화학유인성 단백질-2, 단핵구 화학유인성 단백질-3, 단핵구 염증성 단백질-1 알파, 단핵구 염증성 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, C-키트 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토킨, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GR0, MIP-1α, MIP-1β, MCP-1, 상피 성장 인자(EGF), 상피 호중구 활성화 펩티드, 에리트로포이에틴(EPO), 박리(Exfoliating) 독소, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유모세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 성장 인자 수용체, 헤지호그 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린, 인슐린-유사 성장 인자(IGF), IGF-I, IGF-II, 인터페론, IFN-α, IFN-β, IFN-γ, 인터류킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각화세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴르투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골유도 단백질, 발암유전자 산물, 파라티로이드 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 인간 성장 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B 또는 C, 리랙신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터류킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 초항원(Superantigen), 포도상구균 장독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 수퍼옥시드 디스뮤타제, 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성화제, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피 성장 인자(VEGEF), 유로키나제, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체 및/또는 코르티코스테론에 대해 상동성이 있다. 한 측면에서, 본원의 조성물은 예를 들어 상기 언급된 단백질들 중 임의의 단백질 및 약학적으로 허용가능한 부형제를 포함하여, 비천연적으로 코딩된 아미노산을 포함하는 단백질 및 약학적으로 허용가능한 부형제를 포함한다.
폴리펩티드에 대한 상동성은 예를 들어 디폴트 파라미터에 대한 세트인 BLASTN 또는 BLASTP와 같은 서열 배열을 수행함으로써 추정될 수 있다. 예를 들어, 한 실시양태에서, 단백질은 공지된 치료 단백질(예를 들어, 유전자은행 또는 기타 이용가능한 데이터베이스에 존재하는 단백질)에 대해 적어도 약 50%, 적어도 약 75%, 적어도 약 80%, 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일하다.
관심 단백질은 1, 2, 3, 4, 5, 6, 7, 6, 9, 10, 11, 12, 13, 14, 15개 이상의 비천연적으로 코딩된 아미노산을 함유할 수 있다. 비천연적으로 코딩된 아미노산은 동일하거나 상이할 수 있고, 예를 들어 1, 2, 3, 4, 5, 6, 7, 6, 9, 10, 11, 12, 13, 14, 15개 이상의 상이한 비천연적으로 코딩된 아미노산을 포함하는 단백질에 1, 2, 3, 4, 5, 6, 7, 6, 9, 10, 11, 12, 13, 14, 15개 이상의 상이한 부위들이 있을 수 있다. 예를 들어, 한 실시양태에서, 단백질은 DHFR이고, 하나 이상의 비천연적으로 코딩된 아미노산은 O-메틸-L-티로신 및 L-3-(2-나프틸)알라닌으로 이루어진 군으로부터 선택된다.
본 발명은 또한 슈도모나스 번역 시스템에서 하나 이상의 단백질을 생산하는 방법으로서, 단백질이 하나 이상의 비천연적으로 코딩된 아미노산을 포함하도록 하는 방법을 제공한다. 본 발명의 방법의 한 실시양태에서, 슈도모나스 번역 시스템에는 하나 이상의 셀렉터 코돈을 포함하는 하나 이상의 핵산이 제공되며, 여기에서 핵산은 단백질을 코딩한다. 또한, 슈도모나스 번역 시스템에는 하나 이상의 셀렉터 코돈을 인식하는 오르소고날 tRNA (O-tRNA), 및 슈도모나스 번역 시스템에서 비천연적으로 코딩된 아미노산으로 O-tRNA을 우선적으로 아미노아실화하는 오르소고날 아미노아실 tRNA 합성효소(O-RS)가 제공된다.
한 측면에서, 본 발명의 슈도모나스 번역 시스템에서 생산되는 비천연적으로 코딩된 아미노산을 코딩하는 단백질(들)은 세포 의존적 방식으로 가공되고 변형된다. 이는 안정하게 접히거나, 세포에 의해 다른 방식으로 변형된 단백질의 생산을 제공한다.
비천연적으로 코딩된 아미노산은 임의적으로 슈도모나스 번역 시스템에 대해 외인적으로 제공될 수 있다. 대안적으로, 예를 들어 슈도모나스 번역 시스템이 생세포인 경우, 비천연적으로 코딩된 아미노산은 슈도모나스 세포에 의해 생합성될 수 있다. 예를 들어, 슈도모나스 세포는 세포 내의 하나 이상의 탄소원으로부터, 비천연적으로 코딩된 아미노산, 예를 들어 p-아미노페닐알라닌을 생산하기 위한 생합성 경로를 포함할 수 있다. 일부 실시양태들에서, 생합성 경로는 생리학적 양의 비천연적으로 코딩된 아미노산을 생산할 수 있고, 예를 들어 세포는 천연 아미노산의 농도를 실질적으로 변경하지 않거나, 비천연적으로 코딩된 아미노산의 생산에 있어 세포 자원을 실질적으로 소비하지 않을 수 있는 양인, 단백질 생합성에 충분한 양으로 비천연적으로 코딩된 아미노산을 생산한다.
본 발명의 세포에 의해 임의적으로 생산될 수 있는 다른 비천연적으로 코딩된 아미노산에는 도파, O-메틸-L-티로신, 글리코실화 아미노산, peg화 아미노산, 본원에 언급된 기타 비천연적으로 코딩된 아미노산 등이 포함되나 이들에 제한되지 않는다.
키트는 본 발명의 또 하나의 추가적 특성이다. 예를 들어, 키트는 상기 언급된 바와 같은 하나 이상의 슈도모나스 번역 시스템(예를 들어, 세포, 21개 이상의 아미노산 세포, 세포 추출물 등), 하나 이상의 비천연적으로 코딩된 아미노산을, 예를 들어 적절한 포장 물질, 키트의 요소를 보유하기 위한 용기, 본원의 방법을 수행하기 위한 지시 자료 등과 함께, 포함할 수 있다. 마찬가지로, 슈도모나스 번역 시스템의 산물(예를 들어, 비천연적으로 코딩된 아미노산을 포함하는 EPO 유사체와 같은 단백질)은 키트 형태로, 예를 들어 키트의 요소를 보유하기 위한 용기, 본원의 방법을 수행하기 위한 지시 자료 등과 함께 제공될 수 있다.
정의
본 발명은 본원에 기재된 특별한 방법, 프로토콜, 세포주, 구성체 및 시약에 제한되지 않고, 자체 변형될 수 있음을 이해하도록 한다. 또한, 본원에 사용된 용어들은 특별한 실시양태들을 단지 설명하고자 하는 목적을 위한 것으로서, 본 발명의 범주를 제한하고자 하는 의도는 없으며, 그 범주는 첨부된 특허청구범위에 의해서만 제한될 것임을 이해하도록 한다.
본문 및 첨부된 특허청구범위에 기재된 단수 형태(영문 관사: "a", "an" 및 "the")는 문맥상 달리 명백히 달리 표시되는 것이 아닌 한, 복수 표현을 포함한다. 따라서, 예를 들어 표현 "hGH"는 하나 이상의 그러한 단백질을 가리키고, 이에는 당업자에게 공지된 이의 균등물 등이 포함된다.
달리 정의되지 않는 한, 본원에 기재된 모든 기술 용어 및 과학 용어는 본 발명이 속하는 기술분야의 당업자에게 통상 이해되는 바와 동일한 의미를 갖는다. 본원에 기재된 것들과 유사하거나 균등한 임의의 방법, 장치 및 물질이 본 발명의 수행 또는 시험에 사용될 수 있으나, 이제 바람직한 방법, 장치 및 물질이 설명된다.
본원에 언급된 모든 공보 및 특허는 예를 들어, 본 발명에 사용될 수 있는, 공보들에 기재된 구성체 및 방법을 기재하고 개시하기 위한 목적으로 참고로 본원에 인용된다. 본원에 논의된 공보들은 단지의 본원 출원일 이전의 개시 내용에 대해서만 제공된 것이다. 본원의 그 어느 것도 이전 발명에 의해 또는 임의의 기타 이유로 인해 발명자가 그러한 개시 내용에 선행하도록 하는 권한이 있음을 인정하는 것으로 간주되어서는 안된다.
용어 "실질적으로 정제된"은 천연 발생 환경, 즉 본연의 세포, 또는 재조합으로 생성된 폴리펩티드의 경우에는 숙주 세포에서 발견되는 단백질을 정상적으로 동반하거나 그것과 반응하는 요소가 실질적으로 또는 본질적으로 없을 수 있는 폴리펩티드를 가리킨다. 세포성 물질이 실질적으로 없을 수 있는 폴리펩티드는 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 약 4% 미만, 약 3% 미만, 약 2% 미만, 또는 약 1% 미만(건조 중량 기준)의 오염 단백질을 갖는 단백질의 제제를 포함한다. 폴리펩티드 또는 이의 변종체가 슈도모나스 숙주 세포에 의해 재조합으로 생성될 때, 단백질은 세포의 건조 중량의 약 30% 이상, 약 25%, 약 20%, 약 15%, 약 10%, 약 5%, 약 4%, 약 3%, 약 2% 또는 약 1% 이하로 존재할 수 있다. 폴리펩티드 또는 이의 변종체가 슈도모나스 숙주 세포에 의해 재조합으로 생성될 때, 단백질은 세포의 건조 중량의 약 100 g/L 이상, 약 50 g/L 이상, 약 10 g/L 이상, 약 5 g/L, 약 4 g/L, 약 3 g/L, 약 2 g/L, 약 1 g/L, 약 750 mg/L, 약 500 mg/L, 약 250 mg/L, 약 100 mg/L, 약 50 mg/L, 약 10 mg/L 또는 약 1 mg/L 이하로 배지 내에 존재할 수 있다. 따라서, 본 발명의 방법에 의해 생성된 "실질적으로 정제된" 폴리펩티드는 SDS/PAGE 분석, RP-HPLC, SEC 및/또는 모세관 전기영동과 같은 적당한 방법에 의해 결정될 때, 약 30% 이상, 약 35% 이상, 약 40% 이상, 약 45% 이상, 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 65% 이상, 약 70% 이상의 순도 수준, 구체적으로는 약 75%, 80%, 85% 이상의 순도 수준, 더욱 구체적으로는 약 90% 이상의 순도 수준, 약 95% 이상의 순도 수준, 약 99% 이상의 순도 수준, 또는 그 이상을 가질 수 있다.
"재조합 슈도모나스 숙주 세포" 또는 " 슈도모나스 숙주 세포"는 삽입에 사용되는 방법, 예를 들어 직접적 흡수, 전달(transduction), f-메이팅(f-mating) 또는 재조합 숙주 세포를 생성시키기 위해 당업계에 공지된 기타 방법에 상관없이, 외인성 폴리뉴클레오티드를 포함하는 슈도모나스 종 또는 이로부터 유래된 균주의 세포를 가리킨다. 외인성 폴리뉴클레오티드는 비일체화 벡터, 예를 들어 플라스미드로서 유지되거나, 대안적으로 숙주 게놈에 일체화될 수 있다.
본원에 사용되는 용어 "매질(medium, media)"에는 임의의 슈도모나스 숙주 세포를 지지하거나 함유할 수 있는 임의의 배지, 용액, 고체, 반고체 또는 경질 지지체가 포함된다. 따라서, 그 용어는 슈도모나스 숙주 세포가 성장된 매질, 예컨대 증식 단계 전 또는 후의 매질을 포함한, 폴리펩티드가 분비되어 들어간 매질을 포괄할 수 있다. 그 용어는 또한 예컨대 폴리펩티드가 세포내 생성되고 숙주 세포가 분해되거나 붕괴되어 폴리펩티드를 방출하는 경우에서와 같이, 슈도모나스 숙주 세포 분해물을 함유하는 완충액 또는 시약을 포괄할 수 있다.
단백질 재접힘(refolding)에 대해 본원에 사용되는 "환원제"는 술프히드릴기를 환원 상태로 유지시키고 세포내 또는 세포간 디술피드 결합을 환원시키는 임의의 화합물 또는 물질로 정의된다. 적당한 환원제에는 디티오트레이톨(DTT), 2-메르캅토에탄올, 디티오에리트리톨, 시스테인, 시스테아민(2-아미노에탄티올) 및 환원된 글루타티온이 포함되나 이들에 제한되지 않는다. 매우 다양한 환원제들이 본 발명의 방법 및 조성물에 사용하기에 적당하다는 것이 당업자에게 자명하다.
단백질 재접힘에 대해 본원에 사용되는 "산화제"는 화합물로부터 전자를 제거하여 산화시킬 수 있는 임의의 화합물 또는 물질로 정의된다. 적당한 산화제에는 산화된 글루타티온, 시스틴, 시스타민, 산화된 디티오트레이톨, 산화된 에리트리톨 및 산소가 포함되나 이들에 제한되지 않는다. 매우 다양한 산화제들이 본 발명의 방법에 사용하기에 적당하다는 것이 당업자에게 자명하다.
본원에 사용되는 "변성화제" 또는 "변성제"는 단백질의 가역적 펴짐을 일으키게 되는 임의의 화합물 또는 물질로 정의된다. 변성화제 또는 변성제의 강도는 특별한 변성화제 또는 변성제의 성질 또는 농도 모두에 의해 결정될 것이다. 적당한 변성화제 또는 변성제는 무질서유발제, 세제, 유기 용매, 수혼화성 용매, 인지질, 또는 2종 이상의 그러한 제제들의 조합일 수 있다. 적당한 무질서유발제에는 우레아, 구아니딘 및 나트륨 티오시아네이트가 포함되나 이들에 제한되지 않는다. 유용한 세제에는 강한 세제, 예컨대 나트륨 도데실 술페이트 또는 폴리옥시에틸렌 에테르(예컨대, 트윈(Tween) 또는 트리톤(Triton) 세제), 사르코실(Sarkosyl), 마일드한 비이온성 세제(예컨대, 디기토닌), 마일드한 양이온성 세제, 예컨대 N→2,3-(디올레이옥시)-프로필-N,N,N-트리메틸암모늄, 마일드한 이온성 세제(예컨대, 나트륨 콜레이트 또는 나트륨 데옥시콜레이트) 또는 쯔비터이온성 세제(술포베타인(쯔비터제), 3-(3-클로로아미도프로필)디메틸암모니오-1-프로판 술페이트(CHAPS) 및 3-(3-클로로아미도프로필)디메틸암모니오-2-히드록시-1-프로판 술포네이트(CHAPSO)가 포함될 수 있으나, 이들에 제한되지 않는다. 유기, 수혼화성 용매, 예컨대 아세토니트릴, 저급 알칸올(특히, C2-C4 알칸올, 예컨대 에탄올 또는 이소프로판올), 또는 저급 알칸디올(특히 C2-C4 알칸디올, 예컨대 에틸렌-글리콜)이 변성제로서 사용될 수 있다. 본 발명에 유용한 인지질은 천연 발생 인지질, 예컨대 포스파티딜에탄올아민, 포스파티딜콜린, 포스파티딜세린, 및 포스파티딜이노시톨 또는 합성 인지질 유도체 또는 이의 변종체, 예컨대 디헥사노일포스파티딜콜린 또는 디헵타노일포스파티딜콜린일 수 있다.
본원에 사용되는 "재접힘"은 디술피드 결합을 함유하는 폴리펩티드를 디술피드 결합에 대해 부적절하게 접혀있거나 접히지 않은 상태에서 본연의 구조 또는 적절하게 접힌 구조로 변환시키는 임의의 공정, 반응 또는 방법을 나타낸다.
본원에 사용되는 "동시 접힘(cofolding)"은 상호 반응하여, 접히지 않거나 부적절하게 접힌 폴리펩티드를 본연의 적절하게 접힌 폴리펩티드의 변환시키는 2개 이상의 폴리펩티드를 이용하는 재접힘 공정, 반응 또는 방법을 가리킨다.
"비천연적으로 코딩된 아미노산"은 20개의 통상의 아미노산 또는 파이로리신 또는 셀레노시스테인 중 어느 것도 아닌 아미노산을 가리킨다. 용어 "비천연적으로 코딩된 아미노산"과 동의적으로 사용될 수 있는 다른 용어는 "비천연 아미노산", "비천연적으로 코딩된 아미노산", "비천연적 발생 아미노산" 및 상기 용어들의 다양한, 하이픈으로 연결된 형태 및 하이픈으로 연결되지 않은 형태이다. 용어 "비천연적으로 코딩된 아미노산"에는 또한 천연적으로 코딩된 아미노산(20개의 통상의 아미노산 또는 파이로리신 및 셀레노시스테인을 포함하나 이에 제한되지 않음)의 변형(예컨대, 번역후 변형)에 의해 일어나나, 그 자체로는 번역 복합체에 의해 성장 폴리펩티드 사슬에 천연 도입되지 않는 아미노산이 포함되나 이들에 제한되지 않는다. 그러한 비천연 발생 아미노산의 예에는 N-아세틸글루코사미닐-L-세린, N-아세틸글루코사미닐-L-트레오닌 및 O-포스포티로신이 포함되나 이들에 제한되지 않는다.
"아미노 말단 변형기"는 폴리펩티드의 아미노 말단에 결합될 수 있는 임의의 분자를 가리킨다. 마찬가지로, "카르복시 말단 변형기"는 폴리펩티드의 카르복시 말단에 결합될 수 있는 임의의 분자를 가리킨다. 말단 변형기에는 각종 수용성 중합체, 펩티드 또는 단백질, 예컨대 혈청 알부민, 또는 펩티드의 혈청 반감기를 증가시키는 기타 부분이 포함되나 이들에 제한되지 않는다.
용어 "작용기", "활성 부분", "활성화 기", "이탈기", "반응성 부위", "화학적으로 반응성인 기" 및 "화학적으로 반응성인 부분"이 분자의 구분된 정의가능한 부분 또는 단위를 가리키기 위해 당업계 및 본원에서 사용된다. 그 용어들은 화학적 기술분야에서 다소 동의적이고, 일부 기능 또는 활성을 수행하고 다른 분자와 반응성인 분자의 부분을 가리키기 위해 본원에서 사용된다.
용어 "연결기" 또는 "링커"는, 화학적 반응의 결과로서 정상적으로 형성되고 전형적으로는 공유 연결기인 기 또는 결합을 가리키기 위해 본원에서 사용된다. 가수분해 안정성 연결기는, 연장된 시간 동안, 아마도 심지어는 무한의 시간 동안의 생리학적 조건 하에서(단, 이에 제한되지 않음), 유용한 pH 값에서 물 내에서 실질적으로 안정하고, 물과 반응하지 않는 연결기를 의미한다. 가수분해 불안정성 또는 분해성 연결기는 물, 또는 예를 들어, 혈액을 포함한 수용액 중에서 분해가능한 연결기를 의미한다. 효소 불안정성 또는 분해성 연결기는 하나 이상의 효소에 의해 분해될 수 있는 연결기를 의미한다. 당업계에서 이해되어지는 바와 같이, PEG 및 관련 중합체는 중합체 골격, 또는 중합체 골격과 중합체 분자의 말단 작용기 간의 링커기에서의 분해성 연결기를 포함할 수 있다. 예를 들어, PEG 카르복실산 또는 활성화된 PEG 카르복실산의 생물학적 활성제 상의 알코올기와의 반응에 의해 형성된 에스테르 연결기는 일반적으로 생리학적 조건 하에서 가수분해하여, 생물학적 활성제를 방출한다. 다른 가수분해 분해성 연결기에는 카르보네이트 연결기; 아민과 알데히드의 반응으로부터 수득되는 아민 연결기; 알코올과 인산염 기의 반응에 의해 형성되는 인산염 에스테르 연결기; 히드라지드와 알데히드의 반응 생성물인 히드라존 연결기; 알데히드와 알코올의 반응 생성물인 아세탈 연결기; 포르메이트와 알코올의 반응 생성물인 오르토에스테르 연결기; PEG와 같은 중합체 말단에 있는(단, 이에 제한되지 않음) 아민기와 펩티드의 카르복실기에 의해 형성되는 펩티드 연결기; 및 중합체 말단에 있는(단, 이에 제한되지 않음) 포스포르아미다이트 기와 올리고뉴클레오티드의 5' 히드록실기에 의해 형성되는 올리고뉴클레오티드 연결기가 포함되나 이들에 제한되지 않는다.
본원에 사용되는 용어 "생물학적 활성 분자", "생물학적 활성 부분" 또는 "생물학적 활성제"는 바이러스, 세균, 진균류, 식물, 동물 및 인간을 포함하나 이에 제한되지 않는 유기체의 임의의 물리적 또는 생화학적 성질에 영향을 줄 수 있는 임의의 물질을 의미한다. 특히, 본원에 사용되는 생물학적 활성 분자에는, 인간 또는 기타 동물에서의 질병의 진단, 치유, 경감, 치료 또는 예방을 위해 의도되거나, 그와 다른 방식으로 인간 또는 동물의 신체적 또는 정신적 안녕을 증진시키는 임의의 물질이 포함되나 이들에 제한되지 않는다. 생물학적 활성 분자의 예에는 펩티드, 단백질, 효소, 소분자 약물, 약물, 염료, 지질, 뉴클레오시드, 올리고뉴클레오티드, 세포, 바이러스, 리포좀, 마이크로입자 및 미셀이 포함되나 이들에 제한되지 않는다. 본 발명에 사용하기에 적당한 생물학적 활성제의 부류에는 항생제, 살진균제, 항바이러스제, 항염증제, 항종양제, 심혈관제, 항불안제, 호르몬, 성장 인자, 스테로이드제 등이 포함되나 이들에 제한되지 않는다.
"이작용성 중합체"는 다른 부분(아미노산 측기를 포함하나 이에 제한되지 않음)과 특이적으로 반응하여, 공유 또는 비공유 연결기를 형성할 수 있는 2개의 구별되는 작용기를 포함하는 중합체를 가리킨다. 특별한 생물학적 활성 성분 상의 기와 반응성인 한 작용기와 두 번째 생물학적 성분 상의 기와 반응성을 가지는 또 다른 기를 가지는 이작용성 링커를 사용하여, 첫 번째 생물학적 활성 성분, 이작용성 링커 및 두 번째 생물학적 활성 성분을 포함하는 접합체를 형성할 수 있다. 각종 화합물들을 펩티드에 부착하기 위한 많은 절차 및 링커 분자가 공지되어 있다. 예컨대, 본원에 각기 참고로 인용되는, 유럽 특허 출원 No. 188,256; U.S. 특허 No. 4,671,958, No. 4,659,839, No. 4,414,148, No. 4,699,784; No. 4,680,338; No. 4,569,789; 및 No. 4,589,071을 참고한다. "다작용성 중합체"는 다른 부분(아미노산 측기를 포함하나 이에 제한되지 않음)과 특이적으로 반응하여, 공유 또는 비공유 연결기를 형성할 수 있는 2개 이상의 구별되는 작용기를 포함하는 중합체를 가리킨다.
치환기가 좌측에서 우측으로 쓰여지는 통상적 화학식에 의해 특정화되는 경우, 그것은 우측에서 좌측으로 쓰여지는 구조에서 비롯되는 화학적으로 동일한 치환기를 동등하게 포괄하며, 예를 들어 구조 -CH2O-는 구조 -OCH2-와 동등하다.
용어 "치환기"에는 "비간섭 치환기"가 포함되나, 이에 제한되지 않는다. "비간섭 치환기"는 안정한 화합물을 생성시키는 기이다. 적당한 비간섭 치환기 또는 라디칼에는 할로, C1-C10 알킬, C2-C10 알케닐, C2-C10 알키닐, C1-C10 알콕시, C1-C12 아랄킬, C1-C12 알카릴, C3-C12 시클로알킬, C3-C12 시클로알케닐, 페닐, 치환 페닐, 톨루오일, 자일레닐, 비페닐, C2-C12 알콕시알킬, C2-C12 알콕시아릴, C7-C12 아릴옥시알킬, C7-C12 옥시아릴, C1-C6 알킬술피닐, C1-C10 알킬술포닐, --(CH2)m--O--(C1-C10 알킬)(식 중에서, m은 1 내지 8임), 아릴, 치환 아릴, 치환 알콕시, 플루오로알킬, 헤테로시클릭 라디칼, 치환 헤테로시클릭 라디칼, 니트로알킬, --NO2, --CN, --NRC(O)--(C1-C10 알킬), --C(O)--(C1-C10 알킬), C2-C10 알킬 티오알킬, --C(O)O--(C1-C10 알킬), --OH, --SO2, =S, --COOH, --NR2, 카르보닐, --C(O)--(C1-C10 알킬)-CF3, --C(O)-CF3, --C(O)NR2, --(C1-C10 아릴)-S--(C6-C10 아릴), --C(O)--(C1-C10 아릴), --(CH2)m--O--(--(CH2)m--0--(C1-C10 알킬)(식 중에서, 각 m은 1 내지 8임), --C(O)NR2, --C(S)NR2, --SO2NR2, --NRC(O)NR2, --NRC(S)NR2, 이들의 염 등이 포함되나 이들에 제한되지 않는다. 여기에서 사용되는 각 R은 H, 알킬 또는 치환 알킬, 아릴 또는 치환 아릴, 아랄킬 또는 알카릴이다.
용어 "할로겐"에는 불소, 염소, 옥소 및 브롬이 포함된다.
용어 "알킬"은 단독으로 또는 또 다른 치환기의 일부로서, 달리 명시되지 않는 한, 직쇄형 또는 분지쇄형, 또는 고리형 탄화수소 라디칼, 또는 이들의 조합이 포함되고, 이는 완전 포화, 단일- 또는 다중불포화일 수 있고, 표시된 탄소수를 갖는(즉, C1-C10은 탄소수가 1 내지 10임을 의미함) 이가 및 다가 라디칼일 수 있다. 포화 탄화수소 라디칼의 예에는 메틸, 에틸, n-프로필, 이소프로필, n-부틸, t-부틸, 이소부틸, sec-부틸, 시클로헥실, (시클로헥실)메틸, 시클로프로필메틸, 이들의 동종체 및 이성질체, 예를 들어 n-펜틸, n-헥실, n-헵틸, n-옥틸 등과 같은 기가 포함되나 이들에 제한되지 않는다. 불포화 알킬기는 하나 이상의 이중 결합 또는 삼중 결합을 갖는 알킬기이다. 불포화 알킬기의 예에는 비닐, 2-프로페닐, 크로틸, 2-이소펜테닐, 2-(부타디에닐), 2,4-펜타디에닐, 3-(1,4-펜타디에닐), 에티닐, 1- 및 3-프로피닐, 3-부티닐, 및 고급 동종체 및 이성질체가 포함되나 이들에 제한되지 않는다. 또한, 용어 "알킬"은 달리 명시되지 않는 한, 이하 더욱 상세하게 기재되는 알킬의 유도체, 예컨대 "헤테로알킬"을 포함하는 의미이다. 탄화수소기로 제한되는 알킬기는 "동종알킬"로 칭해진다.
용어 "알킬렌"은 단독으로 또는 또 다른 치환기의 일부로서, 구조 -CH2CH2- 및 -CH2CH2CH2CH2-로 비제한적으로 예시되는 알칸으로부터 유래된 이가 라디칼을 의미하고, 또한 이에는 이하 "헤테로알킬렌"으로 기재되는 기가 포함된다. 전형적으로, 알킬 (또는 알킬렌) 기는 탄소수가 1 내지 24일 것이고, 본 발명에서는 이 기의 탄소수가 10 이하인 것이 바람직하다. "저급 알킬" 또는 "저급 알킬렌"은 일반적으로 탄소수가 8 이하인, 보다 짧은 사슬의 알킬 또는 알킬렌기이다.
용어 "알콕시", "알킬아미노" 및 "알킬티오" (또는 티오알콕시)는 그것들의 통상적 의미로 사용되고, 각기 산소 원자, 아미노기 또는 황 원자를 통해 분자의 나머지에 부착된 알킬기를 가리킨다.
용어 "헤테로알킬"은 단독으로 또는 또 다른 용어와 조합되어, 달리 명시되지 않는 한, 안정한 직쇄형 또는 분지쇄형 또는 고리형 탄화수소 라디칼, 또는 이들의 조합을 의미하고, 이들은 표시된 수의 탄소 원자, 및 0, N, Si 및 S로 이루어진 군으로부터 선택되는 하나 이상의 이종원자로 구성되고, 여기에서 질소 및 황 원자는 임의적으로 산화될 수 있고, 질소 이종원자는 임의적으로 4급화될 수 있다. 이종원자(들) 0, N 및 S, 및 Si는 헤테로알킬기의 임의의 내부 위치, 또는 알킬기가 분자의 나머지에 부착되는 위치에 있을 수 있다. 그 예에는 -CH2-CH2-O-CH3, -CH2-CH2-NH-CH3, -CH2-CH2-N(CH3)-CH3, -CH2-S-CH2-CH3, -CH2-CH2, -S(0)-CH3, -CH2-CH2-S(0)2-CH3, -CH=CH-O-CH3, -Si(CH3)3, -CH2-CH=N-OCH3, 및 -CH=CH-N(CH3)-CH3이 포함되나 이들에 제한되지 않는다. 예를 들어, -CH2-NH-OCH3 및 -CH2-O-Si(CH3)3과 같이 2개 이하의 이종원자가 연속적일 수 있다. 마찬가지로, 용어 "헤테로알킬렌"은 단독으로 또는 또 다른 치환기의 일부로서, -CH2-CH2-S-CH2-CH2- 및 -CH2-S-CH2-CH2-NH-CH2-에 의해 비제한적으로 예시되는 헤테로알킬로부터 유래되는 이가 라디칼을 의미한다. 헤테로알킬기에 있어서, 동일하거나 상이한 이종원자는 또한 사슬 말단(알킬렌옥시, 알킬렌디옥시, 알킬렌아미노, 알킬렌디아미노, 아미노옥시알킬렌 등을 포함하나 이에 제한되지 않음) 중 어느 하나 또는 양자 모두를 차지할 수 있다. 또한, 알킬렌 및 헤테로알킬렌 연결기에 있어서, 연결기의 배향이 연결기의 화학식이 쓰여진 방향에 의해 나타내어지지 않는다. 예를 들어, 화학식 -C(O)2R'-는 -C(O)2R'- 및 -R'C(O)2-를 모두 나타낸다.
용어 "시클로알킬" 및 "헤테로시클로알킬"은 단독으로 또는 또 다른 용어와 조합되어, 달리 명시되지 않는 한, 각기 "알킬" 및 "헤테로알킬"의 고리형 양태를 나타낸다. 따라서, 시클로알킬 또는 헤테로시클로알킬에는 포화 및 불포화 환 연결기가 포함된다. 부가적으로, 헤테로시클로알킬에 있어서, 이종원자는 헤테로사이클이 분자의 나머지에 부착되는 위치를 차지할 수 있다. 시클로알킬의 예에는 시클로펜틸, 시클로헥실, 1-시클로헥세닐, 3-시클로헥세닐, 시클로헵틸 등이 포함되나 이들에 제한되지 않는다. 헤테로시클로알킬의 예에는 1-(1,2,5,6-테트라히드로피리딜), 1-피페리디닐, 2-피페리디닐, 3-피페리디닐, 4-모르폴리닐, 3-모르폴리닐, 테트라히드로푸란-2-일, 테트라히드로푸란-3-일, 테트라히드로티엔-2-일, 테트라히드로티엔-3-일, 1-피레라지닐, 2-피레라지닐 등이 포함되나 이들에 제한되지 않는다. 부가적으로, 그 용어는 이환 및 삼환 구조를 포괄한다. 마찬가지로, 용어 "헤테로시클로알킬렌"은 단독으로 또는 또 다른 치환기의 일부로서, 헤테로시클로알킬로부터 유래된 이가 라디칼을 의미하고, 용어 "시클로알킬렌"은 단독으로 또는 또 다른 치환기의 일부로서, 시클로알킬로부터 유래된 이가 라디칼을 의미한다.
본원에 사용되는 용어 "수용성 중합체"는 수성 용매 중 가용성인 임의의 중합체를 가리킨다. hGH 폴리펩티드로의 수용성 중합체의 연결은, 비변형된 형태 대비의 혈청 반감기의 증가 또는 조절, 또는 치료 반감기의 증가 또는 조절, 조절된 면역원성, 조절된 물리적 연합 특성, 예컨대 응집 및 다량체 형성, 변경된 수용체 결합, 및 변경된 수용체 이량체화 또는 다량체화를 포함하나 이에 제한되지 않는 변화를 초래할 수 있다. 수용성 중합체는 자체의 생물학적 활성을 가지거나 가지지 않을 수 있다. 적당한 중합체에는 폴리에틸렌 글리콜, 폴리에틸렌 글리콜 프로피온알데히드, 모노 C1-C10 알콕시 또는 이의 아릴옥시 유도체(본원에 참고로 인용되는 U.S. 특허 No. 5,252,714에 기재됨), 모노메톡시-폴리에틸렌 글리콜, 폴리비닐 피롤리돈, 폴리비닐 알코올, 폴리아미노산, 디비닐에테르 말레산 무수물, N-(2-히드록시프로필)-메타크릴아미드, 덱스트란, 덱스트란 술페이트를 포함한 덱스트란 유도체, 폴리프로필렌 글리콜, 폴리프로필렌 옥시드/에틸렌 옥시드 공중합체, 폴리옥시에틸화 폴리올, 헤파린, 헤파린 단편, 다당류, 이당류, 글리칸, 셀룰로스, 및 메틸셀룰로스 및 카르복시메틸 셀룰로스를 포함하나 이에 제한되지 않는 셀룰로스 유도체, 전분 및 전분 유도체, 폴리펩티드, 폴리알킬렌 글리콜 및 이의 유도체, 폴리알킬렌 글리콜의 공중합체 및 이의 유도체, 폴리비닐 에틸 에테르, 및 알파-베타-폴리(2-히드록시에틸)-DL-아스파르타미드 등, 또는 이들의 혼합물이 포함되나 이들에 제한되지 않는다. 그러한 수용성 중합체의 예에는 폴리에틸렌 글리콜 및 혈청 알부민이 포함되나 이들에 제한되지 않는다.
본원에 사용되는 용어 "폴리알킬렌 글리콜" 또는 "폴리(알켄 글리콜)"은 폴리에틸렌 글리콜(폴리(에틸렌 글리콜)), 폴리프로필렌 글리콜, 폴리부틸렌 글리콜, 및 이의 유도체를 가리킨다. 용어 "폴리알킬렌 글리콜"은 선형 및 분지형 중합체을 모두 포괄하고, 평균 분자량이 0.1 kDa 내지 100 kDa이다. 다른 예시적 실시양태들이 예를 들어, 상업적 공급업체 카달로그, 예컨대 쉬어워터 코포레이션(Shearwater Corporation)의 카달로그 "Polyethylene Glycol and Derivatives for Biomedical Applications" (2001)]에 열거되어 있다.
용어 "아릴"은 달리 명시되지 않는 한, 함께 융합되거나 공유 연결된 단환 또는 다환(바람직하게는 1 내지 3개 환)일 수 있는 다중 불포화, 방향족, 탄화수소 치환기를 의미한다. 용어 "헤테로아릴"은 N, 0 및 S로부터 선택되는 1 내지 4개 이종원자를 함유하는 아릴기 (또는 환)을 가리키고, 여기에서 질소 및 황 원자는 임의적으로 산화되고, 질소 원자(들)는 임의적으로 4급화된다. 헤테로아릴기는 이종 원자를 통해 분자의 나머지에 부착될 수 있다. 아릴 및 헤테로아릴기의 비제한적 예에는 페닐, 1-나프틸, 2-나프틸, 4-비페닐, 1-피롤릴, 2-피롤릴, 3-피롤릴, 3-피라졸릴, 2-이미다졸릴, 4-이미다졸릴, 피라지닐, 2-옥사졸릴, 4-옥사졸릴, 2-페닐-4-옥사졸릴, 5-옥사졸릴, 3-이속사졸릴, 4-이속사졸릴, 5-이속사졸릴, 2-티아졸릴, 4-티아졸릴, 5-티아졸릴, 2-푸릴, 3-푸릴, 2-티에닐, 3-티에닐, 2-피리딜, 3-피리딜, 4-피리딜, 2-피리미딜, 4-피리미딜, 5-벤조티아졸릴, 푸리닐, 2-벤즈이미다졸릴, 5-인돌릴, 1-이소퀴놀릴, 5-이소퀴놀릴, 2-퀴녹살리닐, 5-퀴녹살리닐, 3-퀴놀릴 및 6-퀴놀릴이 포함된다. 상기 나타낸 아릴 및 헤테로아릴 환계 각각에 대한 치환기는 이하 기재된 허용가능한 치환기들로 구성된 군으로부터 선택된다.
간략히 말해, 다른 용어와 조합되어 사용되는 용어 "아릴"(아릴옥시, 아릴티옥시, 아릴알킬을 포함하나 이에 제한되지 않음)은 상기 정의된 아릴 및 헤테로아릴 환을 모두 포함한다. 따라서, 용어 "아릴알킬"은 탄소 원자(메틸렌기의 것을 포함하나 이에 제한되지 않음)가 예를 들어 산소 원자(페녹시메틸, 2-피리딜옥시메틸, 3-(1-나프틸옥시)프로필 등의 것을 포함하나 이에 제한되지 않음)로 치환된 알킬기를 포함한 알킬기에 아릴기가 부착된 라디칼(벤질, 페네틸, 피리딜메틸 등을 포함하나 이에 제한되지 않음)을 포함하는 의미이다.
상기 용어들의 각각("알킬", "헤테로알킬", "아릴" 및 "헤테로아릴"을 포함하나 이에 제한되지 않음)은 표시된 라디칼의 치환 및 비치환 형태 모두를 포함하는 의미이다. 각 유형의 라디칼에 대한 예시적 치환기들이 이하에 나와 있다.
알킬 및 헤테로알킬 라디칼(알킬렌, 알케닐, 헤테로알킬렌, 헤테로알케닐, 알키닐, 시클로알킬, 헤테로시클로알킬, 시클로알케닐 및 헤테로시클로알케닐로 종종 칭해지는 것들을 포함함)에 대한 치환기는, -OR', =0, =NR', =N-OR', -NR'R", -SR', -할로겐, -SiR'R"R'", -OC(O)R', -C(O)R', -CO2R', -CONR'R", -OC(O)NR'R", -NR"C(O)R', -NR'-C(O)NR"R'", -NR"C(O)2R', -NR-C(NR'R"R"')=NR"", -NR-C(NR'R")=NR"', -S(O)R', -S(O)2R', -S(O)2NR'R", -NRSO2R', -CN 및 -NO2(그 수는 0 내지 (2m'+1)의 범위임)(여기에서, m'은 그러한 라디칼 내의 총 탄소수임)로부터 선택되는 각종 기들 중 하나 이상일 수 있다. R', R", R"' 및 R""은 각기 독립적으로 수소, 치환 또는 비치환 헤테로알킬, 1 내지 3개 할로겐으로 치환된 아릴을 포함하나 이에 제한되지 않는 치환 또는 비치환 아릴, 치환 또는 비치환 알킬, 알콕시 또는 티오알콕시기, 또는 아릴알킬기를 가리킨다. 본 발명의 화합물이 1개 이상의 R 기를 포함할 때, 예를 들어 각각의 R 기는, 이들 R', R", R'" 및 R"" 기가 1개 이상 존재할 때 각각의 R', R", R'" 및 R"" 기처럼 독립적으로 선택된다. R' 및 R"가 동일한 질소 원자에 부착될 때, 그것들은 질소 원자와 함께 조합되어, 5-, 6- 또는 7-원 환을 형성할 수 있다. 예를 들어, -NR'R"은 1-피롤리디닐 및 4-모르폴리닐을 포함하나 이에 제한되지 않는 의미이다. 치환기의 상기 논의로부터, 당업자는 용어 "알킬"은 수소기 외의 기들에 결합된 탄소 원자를 포함하는 기, 예컨대 할로알킬(-CF3 및 -CH2CF3을 포함하나 이에 제한되지 않음) 및 아실(-C(O)CH3, -C(O)CF3, -C(O)CH2OCH3 등을 포함하나 이에 제한되지 않음)를 포함하는 의미임을 이해할 것이다.
알킬 라디칼에 대해 기재된 치환기와 유사하게, 아릴 및 헤테로아릴기에 대한 치환기로 다양하고, 할로겐, -OR', =0, =NR', =N-OR', -NR'R", -SR', -할로겐, -SiR'R"R", -OC(O)R', -C(O)R', -CO2R', -CONR'R", -OC(O)NR'R", -NR"C(O)R', -NR'-C(O)NR"R"', -NR"C(O)2R', -NR-C(NR'R"R")=NR"", -NR-C(NR'R")=NR'", -S(O)R', -S(O)2R', -S(O)2NR'R", -NRSO2R', -CN 및 -NO2, -R', -N3, -CH(Ph)2, 플루오로(C1-C4)알콕시, 및 플루오로(C1-C4)알킬(그 수는 0 내지 방향족 환계 상의 개방 원자가의 총수임)로부터(단, 이에 제한되지 않음) 선택되고; 여기에서 R', R", R"' 및 R""은 수소, 알킬, 헤테로알킬, 아릴 및 헤테로아릴로부터 독립적으로 선택된다. 본 발명의 화합물이 1개 초과의 R 기를 포함할 때, 예를 들어 각각의 R 기는, 각각의 R', R", R'" 및 R"" 기가 1개 초과가 존재할 때의 그것들과 같이 독립적으로 선택된다.
본원에 사용되는 용어 "조절된 혈청 반감기"는 그것의 비변형된 형태와 대비하여 변형된 폴리펩티드의 순환 반감기의 양성 또는 음성 변화를 의미한다. 혈청 반감기는 생물학적 활성 분자의 투여 후 각종 시점들에서 혈액 샘플을 채취하여, 각 샘플 내의 그 분자의 농도를 구함으로써 측정된다. 시간에 대한 혈청 농도의 상관관계에 의해 혈청 반감기가 계산된다. 증가된 혈청 반감기는 바람직하게 약 2배 이상을 가지나, 보다 작은 증가가 예를 들어, 만족스러운 투약 요법을 가능하게 하거나 독성 효과를 피하게 하므로, 유용할 수 있다. 일부 실시양태들에서, 증가는 약 3배 이상, 약 5배 이상, 또는 약 10배 이상이다.
본원에 사용되는 용어 "조절된 치료 반감기"는 생물학적 활성 분자의 비변형된 형태에 대한 치료 유효량의 변형된 생물학적 활성 분자의 반감기의 양성 또는 음성 변화를 의미한다. 치료 반감기는 투여 후 각종 시점에서의 분자의 약물동태학 및/또는 약력학 성질을 측정함으로써 측정된다. 증가된 치료 반감기는 바람직하게 특별한 유익한 투약 요법, 특별한 유익한 총 투약량을 가능하게 하거나, 바람직하지 못한 효과를 피하게 한다. 일부 실시양태들에서, 증가된 치료 반감기는 증가된 효능, 변형된 분자의 그것의 표적으로의 증가 또는 감소된 결합, 또는 비변형된 분자의 작용의 기작 또는 다른 파라미터의 증가 또는 감소로부터 비롯된다.
핵산 또는 단백질에 적용되는 용어 "단리된"은 핵산 또는 단백질이, 그것이 천연 상태에서는 결합되는 다른 세포성 성분이 실질적으로 없음을 나타낸다. 그것은 균질한 상태로 있을 수 있다. 단리된 물질은 건조 또는 반건조 상태로 있을 수 있고, 수용액을 포함하나 이에 제한되지 않는 용액으로 있을 수 있다. 순도 및 균질도는 전형적으로 폴리아크릴아미드 겔 전기영동 또는 고성능 액체 크로마토그래피와 같은 분석적 화학 기법을 이용하여 구해진다. 제제 내에 존재하는 주된 종인 단백질은 실질적으로 정제된다. 특히, 단리된 유전자는 유전자에 측접하는 개방 해독 프레임으로부터 분리되어, 관심 유전자 이외의 단백질을 코딩한다. 용어 "정제된"은, 핵산 또는 단백질이 전기영동 겔에서 실질적으로 하나의 밴드를 발생시킴을 의미한다. 특히, 그것은 핵산 또는 단백질이 순도 85% 이상, 순도 90% 이상, 순도 95% 이상, 순도 99% 이상, 또는 그 이상의 순도를 가짐을 의미한다.
용어 "핵산"은 단일- 또는 이중-나선 형태의, 데옥시리보뉴클레오티드, 데옥시리보뉴클레오시드, 리보뉴클레오시드 또는 리보뉴클레오티드, 및 이의 중합체를 가리킨다. 특별히 제한되지 않는 한, 그 용어는 기준 핵산과 유사한 결합 성질을 가지고, 천연 발생 뉴클레오티드와 유사한 방식으로 대사하는, 천연 뉴클레오티드의 공지 유사체를 함유하는 핵산을 포괄한다. 달리 특별히 제한되지 않는 한, 그 용어는 또한 PNA(펩티도핵산)의 올리고뉴클레오티드 유사체, 안티센스 기술에 사용되는 DNA의 유사체(포스포로티오에이트, 포스포로아미데이트 등)를 가리킨다. 달리 표시되지 않는 한, 특별한 핵산 서열은 또한 그것의 보존적으로(conservatively) 변형된 변종체(퇴화 코돈 치환을 포함하나 이에 제한되지 않음) 및 상보적 서열, 및 명시된 서열을 함축적으로 포괄한다. 구체적으로, 퇴화 코돈 치환은 하나 이상의 선택된 (또는 모든) 코돈의 3번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 발생시킴으로써 달성될 수 있다(Batzer 등, Nucleic Acid Res . 19:5081(1991); Ohtsuka 등, J. Biol . Chem. 260:2605-2608(1985); 및 Cassol 등(1992); Rossolini 등, Mol . Cell . Probes 8:91-98(1994)).
용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 본원에서 상호 혼용된다. 즉, 폴리펩티드에 대한 기재는 펩티드라는 기재 및 단백질이라는 기재와 동등하게 적용되고, 그 역도 성립한다. 그 용어들은 천연 발생 아미노산 중합체, 및 하나 이상의 아미노산 잔기가 비천연적으로 코딩된 아미노산인 아미노산 중합체에 적용된다. 본원에 사용되는 그 용어들은 전장 단백질(즉, 항원)을 포함한 임의의 길이의 아미노산 사슬을 포괄하고, 여기에서 아미노산 잔기는 공유 펩티드 결합에 의해 연결된다.
용어 "아미노산"은 천연 발생 및 비천연 발생 아미노산, 및 천연 발생 아미노산과 유사한 방식으로 기능하는 아미노산 유사체 및 아미노산 모방체를 가리킨다. 천연적으로 코딩된 아미노산은 20개의 통상의 아미노산(알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소루이신, 루이신, 리신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신 및 발린), 및 파이로리신 및 셀레노시스테인이다. 아미노산 유사체는 천연 발생 아미노산과 동일한 기본 화학 구조, 즉 수소, 카르복실기, 아미노기, 및 R 기에 결합된 α-탄소를 가지는 화합물, 예컨대 호모세린, 노르루이신, 메티오닌 술폭시드, 메티오닌 메틸 술포늄을 가리킨다. 그러한 유사체는 변형된 R 기를 가지거나(예컨대, 노르루이신의 경우) 또는 변형된 펩티드 골격을 가지나, 천연 발생 아미노산과 동일한 기본 화학 구조를 가진다.
아미노산은 통상 공지된 3개의 문자 기호에 의해, 또는 [IUPAC-IUB 생화학 명명법 위원회(Biochemical Nomenclature Commission)]가 권장하는 1-문자 기호로 본원에서 칭해질 수 있다. 마찬가지로, 뉴클레오티드는 통상 수용되는 단일 문자 코드에 의해 칭해질 수 있다.
"보존적으로 변형된 변종체"는 아미노산 및 핵산 서열 모두에 대해 적용된다. 특별한 핵산 서열에 있어서, "보수적으로 변형된 변종체"는 동일하거나 본질적으로 동일한 아미노산 서열을 코딩하는 핵산, 또는 핵산이 아미노산 서열을 코딩하지 않는 경우에는 본질적으로 동일한 서열을 가리킨다. 유전 코드의 퇴행으로 인해, 수많은 기능적으로 동일한 핵산이 임의의 소정의 단백질을 코딩한다. 예를 들어, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산 알라닌을 코딩한다. 따라서, 알라닌이 코딘에 의해 특정화되는 모든 위치에서, 코돈은 코딩된 폴리펩티드를 변경하지 않으면서 기재된 상응하는 코돈 중 임의의 것으로 변경될 수 있다. 그러한 핵산 변이는 보존적으로 변형된 변이들 중 한 종인 "침묵 변이"이다. 폴리펩티드를 코딩하는 본원의 모든 핵산 서열은 또한 핵산의 모든 가능한 침묵 변이를 기술한다. 당업자는 핵산 내의 각 코돈(메티오닌에 대한 통상 유일한 코돈인 AUG, 및 트립토판에 대한 통상 유일한 코돈인 TGG 제외)은 변형되어 기능적으로 동일한 분자를 생성시킬 수 있음을 인지할 것이다. 따라서, 폴리펩티드를 코딩하는 핵산의 각 침묵 변이는 각 기재된 서열에 내재한다.
아미노산 서열에 있어서, 당업자는 코딩된 서열 내의 단일 아미노산 또는 낮은백분율의 아미노산을 변경, 부가 또는 결실시키는, 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별 치환, 결실 또는 부가가 "보존적으로 변형된 변종체"임(여기에서, 변경에 대해 아미노산이 화학적으로 유사한 아미노산으로 치환됨)을 인지할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표가 공지되어 있다. 그러한 보존적으로 변형된 변종체는 본 발명의 다형태 변종체, 종간 동종체 및 대립유전자에 부가되는 것으로, 그것을 제외시키지 않는다.
하기 8개 군은 상호 보존적 치환기인 아미노산을 각기 함유한다:
1) 알라닌(A), 글리신(G);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 리신(K);
5) 이소루이신(I), 루이신(L), 메티오닌(M), 발린(V);
6) 페닐알라닌(F), 티로신(Y), 트립토판(W);
7) 세린(S), 트레오닌(T); 및
8) 시스테인(C), 메티오닌(M)
(예컨대, [Creighton(1984) Proteins : Structure and Molecular Properties (W H Freeman & Co.; 제2판(December. 1993))] 참고).
2개 이상의 핵산 또는 폴리펩티드 서열의 영역에 있어 용어 "동일한" 또는 "동일성(%)"은 동일한 2개 이상의 서열 또는 하위서열을 가리킨다. 서열들이, 하기 서열 비교 알고리즘들 중 하나를 이용하거나, 수동 배열 및 가시적 조사에 의해 측정 시에, 비교 창 또는 표시된 영역에서 최대 상응하도록 비교하고 정렬할 때, 동일한(즉, 특정 영역에서 약 60% 동일성, 임의적으로 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90% 또는 약 95%의 동일성을 가지는) 아미노산 잔기 또는 뉴클레오티드의 일정 백분율을 가지는 경우, 그 서열들은 "실질적으로 동일한" 것이 된다. 이 정의는 또한 시험 서열의 보체도 가리킨다. 동일성은 길이가 약 50개 이상의 아미노산 또는 뉴클레오티드인 영역, 길이가 75 내지 100 아미노산 또는 뉴클레오티드인 영역, 또는 구체화되지 않은 경우에는 폴리뉴클레오티드 또는 폴리펩티드의 전체 서열에 걸쳐 존재할 수 있다.
서열 비교를 위해, 전형적으로 하나의 서열이 기준 서열로 작용하고, 그 서열과 시험 서열이 비교된다. 서열 비교 알고리즘을 이용할 때, 시험 및 기준 서열을 컴퓨터에 입력하여, 필요한 경우에는 하위서열 좌표를 표시하고, 또한 서열 알고리즘 프로그램 파라미터를 표시한다. 바람직하게, 디폴트 프로그램 파라미터가 사용될 수 있거나, 대안적 파라미터가 표시될 수 있다. 이어서, 서열 비교 알고리즘은 프로그램 파라미터에 기초하여, 기준 서열에 대한 시험 서열에 대한 서열 동일성(%)을 계산한다.
본원에 사용되는 "비교 창"은 약 20 내지 600, 통상적으로는 약 50 내지 200, 더욱 주로 약 100 내지 150으로 구성되는 군으로부터 선택되는 임의의 한 수의 인접 위치의 세그먼트를 지칭하는 것을 포함하고, 여기에서 서열은 2개 서열이 최적으로 배열된 후, 동일한 수의 인접 위치들의 기준 서열과 비교될 수 있다. 비교용 서열의 배열 방법이 당업계에 공지되어 있다. 비교용 서열의 최적 배열은, 예컨대 [Smith 및 Waterman(1981) Adv . Appl . Math . 2: 482c]의 국소 상동성 알고리즘, [Needleman 및 Wunsch(1970) J. Mol . Biol . 48:443]의 상동성 배열 알고리즘, [Pearson 및 Lipman(1988) Proc . Nat'l . Acad . Sci . USA 85:2444]의 유사도 방법을 위한 연구, 이 알고리즘의 컴퓨터처리 이행([위스콘신 제네틱스 소프트웨어 팩키지(Wisconsin Genetics Software Package), 제네틱스 컴퓨터 그룹(Genetics Computer Group), 575 Science Dr., 미국 위스콘신주 매디슨]에서의 GAP, BESTFIT, FASTA 및 TFASTA), 또는 수동적 배열 및 가시적 검사(예컨대, [Ausubel 등, Current Protocols in Molecular Biology(1995년 추록) 참고)에 의해(단, 이에 제한되지 않음) 수행될 수 있다.
서열 동일성(%) 및 서열 유사성을 결정하는데 적당한 알고리즘의 한 예는 BLAST 및 BLAST 2.0 알고리즘이고, 이는 [Altschul 등(1977) Nuc . Acids Res . 25:3389-3402] 및 [Altschul 등(1990) J. Mol . Biol . 215:403-410]에 각기 기재되어 있다. BLAST 분석을 수행하기 위한 소프트웨어가 [National Center for Biotechnology Information]을 통해 공개 입수가능하다. BLAST 알고리즘 파라미터 W, T 및 X는 배열의 민감도 및 속도를 결정한다. (뉴클레오티드 서열을 위한) BLASTN 프로그램은 디폴트로서 11의 단어 길이(W), 10의 기대치(E), M=5, N=-4 및 양 나선의 비교를 사용한다. 아미노산 서열에 있어서, BLASTP 프로그램은 디폴트로서 3의 단어 길이, 및 10의 기대치(E), 및 50의 BLOSUM62 스코어링 행렬[Henikoff 및 Henikoff(1992) Proc . Natl . Acad . Sci . USA 89:10915 참고) 배열(B), 10의 기대치(E), M=5, N=-4, 및 양 나선의 비교를 사용한다. BLAST 알고리즘은 전형적으로 "저 복잡화" 필터를 작동시키지 않고 수행된다.
BLAST 알고리즘은 또한 두 서열 간의 유사성의 통계학적 분석을 수행한다(예컨대, [Karlin 및 Altschul(1993) Proc . Natl . Acad . Sci . USA 90:5873-5787] 참고). BLAST 알고리즘에 의해 제공된 유사성의 한 척도는 최소 총 확률(P(N))이며, 이는 2개 뉴클레오티드 또는 아미노산 서열 간의 매치가 우연히 일어날 수 있는 확률을 가리킨다. 예를 들어, 핵산은 기준 핵산에 대한 시험 핵산의 비교에서 최소의 합 확률이 약 0.2 미만, 더욱 바람직하게는 약 0.01 미만, 가장 바람직하게는 약 0.001 미만일 경우, 기준 서열과 유사한 것으로 간주된다.
표현 "~에 선택적으로 (또는 특이적으로) 혼성화하다"는, 서열이 착혼합물(예컨대, 총 세포내 또는 라이브러리 DNA 또는 RNA) 내에 존재할 때, 엄격한 혼성화 조건 하에서 한 특별한 뉴클레오티드 서열에 대해서만 분자가 결합하거나 이중화하거나 혼성화함을 가리킨다.
표현 "엄격한(stringent) 혼성화 조건"은 당업계에 공지된 바와 같은 저 이온강도 및 고온의 조건을 가리킨다. 전형적으로, 엄격한(stringent) 조건 하에 프로브는 핵산(총 세포성 또는 라이브러리 DNA 또는 RNA를 포함하나 이에 제한되지 않음)의 착 혼합물 내의 그것의 표적 하위서열에 혼성화하나, 착 혼합물 내의 다른 서열에는 혼성화하지 않는다. 엄격한 조건은 서열-의존적이고, 상이한 환경에서 상이할 것이다. 서열이 길수록, 특이적으로 혼성화하는 온도가 더 높다. 핵산의 혼성화에 대한 광범위한 지침 내용은 [Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays"(1993)]을 참조한다. 일반적으로, 엄격한 조건은 한정된 이온 강도 pH에서 특이적 서열에 대한 열 융점(Tm)보다 약 5 내지 10℃가 더 낮도록 선택된다. Tm은 표적에 대해 상보적인 프로브의 50%가 평형 하에 표적 서열에 혼성화하는 (한정된 이온 강도, pH 및 핵산 농도 하에서의) 온도이다(Tm에서 표적 서열이 과량으로 존재할 때, 프로브의 50%가 평형 하에 놓이게 된다). 엄격한 조건은, 염 농도가 pH 7.0 내지 8.3에서 약 1.0 M 미만의 나트륨 이온, 통상적으로는 약 0.01 내지 1.0 M의 나트륨 (또는 기타 염) 이온 농도이고, 온도는 짧은 프로브(예컨대, 약 10 내지 50개 뉴클레오티드)에서 약 30℃ 이상이고, 긴 프로브(예컨대, 약 50개 초과의 뉴클레오티드)에서 약 60℃ 이상인 조건이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제의 첨가로 달성될 수 있다. 선택적 또는 특이적 혼성화를 위해, 양성 신호는 통상적으로 백그라운드 2배 이상, 임의적으로는 백그라운드 10배 이상 혼성화일 수 있다. 예시적 엄격한 혼성화 조건은 하기와 같을 수 있다: 50% 포름아미드, 5×SSC, 및 1% SDS, 42℃에서의 인큐베이션, 또는 5×SSC, 1% SDS, 65℃에서의 인큐베이션, 이와 동시의 65℃에서의 0.2×SSC 및 0.1% SDS 세정. 상기 세정은 5, 15, 30, 60, 120분 또는 그 이상 동안 수행될 수 있다.
본원에 사용되는 용어 " 슈도모나스의 종" 또는 "슈도모나스 숙주 세포", 또는 "슈도모나스 종 및 이로부터 유래된 균주"는 슈도모나스 플루오레슨스( Pseudomonas fluorescens ), 슈도모나스 아에루기노사( Pseudomonas aeruginosa), 슈도모나스 푸티다 ( Pseudomonas putida ) 등을 포함하나 이에 한정되지 않는 슈도모나스 속의 종, 및 이의 자손, 및 이의 화학적 또는 유전적 변형 형태 및 이의 자손으로 알려지거나 이로 동정된 것들 중 임의의 것을 가리킨다.
본원에 사용되는 용어 "대상"은 처치(치료), 관찰 또는 실험의 객체가 되는 동물, 바람직하게는 포유류, 가장 바람직하게는 인간을 가리킨다.
본원에 사용되는 용어 "유효량"은 처치하는 질병, 상태 또는 장애의 증상들 중 하나 이상을 어느 정도 경감시키기 위해 투여되는 (변형된) 비천연 아미노산 폴리펩티드의 양을 가리킨다. 본원에 기재된 (변형된) 비천연 아미노산 폴리펩티드를 함유하는 조성물은 예방, 증진 및/또는 치료적 처치를 위해 투여될 수 있다.
용어 "증진하다" 또는 "증진시키는"은 원하는 효과를 그 효능 또는 기간에 있어 증가 또는 연장시키는 것을 의미한다. 따라서, 치료제의 효과를 증진시키는 것과 관련하여, 용어 "증진시키는"은 시스템에 대한 다른 치료제의 효과를 그 효능 또는 기간에 있어 증가 또는 연장시키는 능력을 가리킨다. 본원에 사용되는 "증진 유효량"은 원하는 시스템에서 또 다른 치료제의 효과를 증진시키기에 적당한 양을 가리킨다. 환자에게 사용할 때, 이 용도에 효과적인 양은 질병, 장애 또는 상태의 중도 및 과정, 과거 치료, 환자의 건강 상태 및 약물에 대한 반응, 및 치료 의사의 판단에 의존할 것이다.
본원에 사용되는 용어 "변형된"은 폴리펩티드에 대한 번역후 변형의 존재를 가리킨다. 형태 "(변형된)"이란 용어는 논의되는 폴리펩티드가 임의적으로 변형되는 것, 즉 논의되는 폴리펩티드가 변형 또는 비변형될 수 있음을 의미한다.
용어 "번역후 변형된" 및 "변형된"은 폴리펩티드 사슬에 도입된 후 천연 또는 비천연 아미노산에 일어나는 그 아미노산의 임의의 변형을 가리킨다. 그 용어는 단지 예시적으로, 동시 번역 생체내 변형, 번역후 생체내 변형, 및 번역후 시험관내 변형을 포괄한다.
예방적 용도들에서, (변형된) 비천연 아미노산 폴리펩티드를 함유하는 조성물은 특별한 질병, 장애 또는 상태에 처해지기 쉽거나 그와 다른 방식으로 그럴 위험이 있는 환자에게 투여된다. 그러한 양은, "예방 유효량"인 것으로 정의된다. 이러한 사용에서, 정확한 양은 또한 환자의 건강 상태, 체중 등에 의존한다. 통상의 실험(예컨대, 투약량 순차증강(escalation) 임상 실험)에 의해 그러한 예방 유효량을 결정하는 것은 당업계의 기술 내에 족히 속하는 것으로 간주된다.
용어 "보호된"은 특정 반응 조건 하에서 화학적으로 반응성인 작용기의 반응을 방지하는 "보호기" 또는 부분의 존재를 가리킨다. 보호기는 보호되는 화학적으로 반응성인 기의 유형에 따라 다양할 것이다. 예를 들어, 화학적으로 반응성인 기가 아민 또는 히드라지드인 경우, 보호기는 tert-부틸옥시카르보닐(t-Boc) 및 9-플루오레닐메톡시카르보닐(Fmoc)로 이루어진 군으로부터 선택될 수 있다. 화학적으로 반응성인 기가 티올인 경우, 보호기는 오르토피리딜디술피드이다. 화학적으로 반응성인 기가 카르복실산, 예컨대 부탄산 또는 프로피온산, 또는 히드록실기인 경우, 보호기는 벤질 또는 알킬기, 예컨대 메틸, 에틸 또는 tert-부틸일 수 있다. 당업계에 공지된 다른 보호기도 또한 본원에 기재된 방법 및 조성물에서 또는 그와 함께 사용될 수 있다.
단지 예시적으로, 차단/보호기는 하기 것들로부터 선택될 수 있다:
Figure 112007093262665-PCT00001
다른 보호기들이, 전체적으로 본원에 참고로 인용되는 [Greene 및 Wuts, Protective Groups in Organic Synthesis, 제3판, John Wiley & Sons, New York, NY, 1999]에 기재되어 있다.
치료적 용도들에서, (변형된) 비천연 아미노산 폴리펩티드를 함유하는 조성물은 질병, 장애 또는 상태의 증상을 치료하거나 적어도 부분적으로 저항하기에 충분한 양으로, 그러한 질병, 상태 또는 장애를 이미 겪고 있는 환자에게 투여된다. 그러한 양은 "치료 유효량"으로 정의되고, 이는 질병, 장애 또는 상태의 중도 및 과정, 과거 치료법, 환자의 건강 상태 및 약물에 대한 반응, 및 치료 의사의 판단에 의존할 것이다. 통상의 실험(예컨대, 용량 순차증강 임상 실험)에 의해 그러한 치료 유효량을 결정하는 것은 당업계의 기술 내에 족히 속하는 것으로 간주된다.
용어 "처치"는 예방적 및/또는 치료적 처치를 가리키기 위해 사용된다.
본원에 사용되는 용어 "오르소고날"은 관심 시스템(예를 들어, 번역 시스템, 예컨대 세포)에 의해 감소된 효율로 사용되는 분자(예를 들어, 오르소고날 tRNA (O-tRNA) 및/또는 오르소고날 아미노아실 tRNA 합성효소(O-RS))를 가리킨다. 오르소고날은 관심 번역 시스템에서 기능함에 있어 오르소고날 tRNA 및/또는 오르소고날 RS의 불능 또는 감소된 효율, 예를 들어 20% 미만의 효율, 10% 미만의 효율, 5% 미만의 효율, 또는 예를 들어 1% 미만의 효율을 가리킨다. 예를 들어, 관심 번역 시스템에서의 오르소고날 tRNA는, 내인성 RS에 의한 내인성 tRNA의 아미노아실화에 비해, 감소된 효율 또는 심지어는 0인 효율로 관심 번역 시스템에서의 임의의 내인성 RS를 아미노아실화한다. 또 다른 예에서, 오르소고날 RS는 내인성 RS에 의한 내인성 tRNA의 아미노아실화에 비해, 감소된 효율 또는 심지어는 0인 효율로 관심 번역 시스템에서의 임의의 내인성 tRNA를 아미노아실화한다.
우선적으로 아미노아실화하다: 용어 "우선적으로 아미노아실화하다"는 O-tRNA를 생성시키는데 사용되는 천연 발생 tRNA 또는 출발 물질에 비해, O-RS가 비천연 아미노산으로 O-tRNA를 아미노아실화함에 있어서의 효율이 예를 들어, 약 70% 효율, 약 71% 효율, 약 72% 효율, 약 73% 효율, 약 74% 효율 약 75% 효율, 약 76% 효율, 약 77% 효율, 약 78% 효율, 약 79% 효율, 약 80% 효율, 약 85%, 약 90% 효율, 약 95% 효율 또는 약 99% 또는 그 이상임을 가리킨다. 이어서, 비천연 아미노산은 고신뢰도, 예를 들어 소정의 셀렉터 코돈에 대해 약 70% 초과의 효율, 약 71% 효율, 약 72% 효율, 약 73% 효율, 약 74% 효율, 약 75% 초과의 효율, 소정의 셀렉터 코돈에 대해서는 약 85% 초과의 효율, 소정의 셀렉터 코돈에 대해서는 약 90% 초과의 효율, 소정의 셀렉터 코돈에 대해서는 약 99% 초과의 효율, 또는 그 이상의 효율로 성장 폴리펩티드에 도입된다.
셀렉터 코돈: 용어 "셀렉터 코돈"은 번역 공정에 의해 O-tRNA에 의해 인식되나, 내인성 tRNA에 의해서는 우선적으로 인식되지 않는 코돈을 가리킨다. O-tRNA 안티코돈 루프는 mRNA 상의 셀렉터 코돈을 인식하고, 그것의 아미노산, 예를 들어 비천연 아미노산을 폴리펩티드 내의 이 부위에 도입한다. 셀렉터 코돈에는 예를 들어, 넌센스 코돈, 예컨대, 중지 코돈, 예를 들어 앰버, 오커 및 오팔 코돈; 4 이상의 염기 코돈; 천연 또는 비천연 염기 쌍으로부터 유래된 코돈 등이 포함되나 이들에 제한되지 않는다. 소정의 시스템의 경우, 셀렉터 코돈은 또한 천연 3 염기 코돈들 중 하나를 포함할 수 있고, 여기에서 내인성 시스템은 상기 천연 3 염기 코돈을 사용하지 않고, 이에는 예를 들어, 천연 3 염기 코돈을 인식하는 tRNA가 결여된 시스템 또는 천연 3 염기 코돈이 희소 코돈인 시스템이 있다.
서프레서 tRNA: 서프레서 tRNA는 소정의 번역 시스템에서 메신저 RNA(mRNA)의 해독을 변경하는 tRNA이다. 서프레서 tRNA는 예를 들어 중지 코돈, 4 염기 코돈 또는 희소 코돈을 통해 해독할 수 있다.
번역 시스템: 용어 "번역 시스템"은 천연 발생 아미노산을 성장하는 폴리펩티드 사슬(단백질)에 도입하는데 필요한 요소를 가리킨다. 번역 시스템의 요소에는 예를 들어, 리보솜, tRNA, 합성효소, mRNA 등이 포함될 수 있다. 본 발명의 요소는 번역 시스템에 생체내 또는 시험관내 부가될 수 있다. 번역 시스템은 E. 콜라이 세포와 같은 원핵생물 세포, 또는 효소, 포유동물, 식물 또는 곤충 세포와 같은 진핵생물 세포일 수 있다.
달리 표시되지 않는 한, 당업계의 기술 내에 속하는 질량분광법, NMR, HPLC, 단백질 화학, 생화학, 재조합 DNA 기법 및 약리학의 통상적 방법들이 이용된다.
상세한 설명
I. 도입부
슈도모나스 숙주 세포에서 제조된 하나 이상의 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드 분자가 본 발명에 제공된다. 본 발명의 특정 실시양태들에서, 하나 이상의 비천연적으로 코딩되는 아미노산을 갖는 폴리펩티드는 하나 이상의 번역후 변형을 포함한다. 한 실시양태에서, 하나 이상의 번역후 변형은 표지, 염료, 중합체, 수용성 중합체, 폴리에틸렌 글리콜의 유도체, 광가교제, 세포독성 화합물, 약물, 친화성 표지, 광친화성 표지, 반응성 화합물, 수지, 제2 단백질 또는 폴리펩티드 또는 폴리펩티드 유사체, 항체 또는 항체 단편, 금속 킬레이터, 보조인자, 지방산, 탄수화물, 폴리뉴클레오티드, DNA, RNA, 안티센스 폴리뉴클레오티드, 억제성 리보핵산, 바이오물질, 나노입자, 스핀 표지, 형광발색단, 금속-함유 부분, 방사능 부분, 신규 작용기, 다른 분자와 공유 또는 비공유 상호작용하는 기, 광포집(photocaged) 부분, 광이성화 부분, 비오틴, 비오틴의 유도체, 비오틴 유사체, 중원자-도입 부분, 화학적 절단형 기, 광절단형 기, 연신 측쇄, 탄소-연결 당, 산화환원 활성제, 아미노 티오산, 독성 부분, 동위원소 표지된 부분, 생체물리학적 프로브, 인광성 기, 화학발광성 기, 전자 조밀 기, 자기성 기, 개재성(intercalating) 기, 발색단, 에너지 전달제, 생물학적 활성제, 검출가능한 표지, 소분자 또는 상기 것들의 임의 조합물, 또는 특별한 반응성 기에 적당한 것으로 당업자에게 알려져 있는 화학 방법을 이용하는 제1 반응성 기를 포함하는 하나 이상의 비천연적으로 코딩된 아미노산에 대한 제2 반응성 기를 포함하는 임의의 기타 바람직한 화합물 또는 물질을 포함하나 이에 제한되지 않는 분자의 결합을 포함한다. 예를 들어, 제1 반응성 기는 알키닐 부분[비천연적으로 코딩된 아미노산 p-프로파르길옥시페닐알라닌(여기에서, 프로파르길기는 또한 경우에 따라 아세틸렌 부분으로 칭해짐) 내 (단, 이에 제한되지 않음)]이고, 제2 반응성 기는 아지도 부분이며, [3+2] 시클로부가 화학 방법이 이용된다. 또 다른 예에서, 제1 반응성 기는 아지도 부분[비천연 아미노산, p-아지도-L-페닐알라닌 내(단, 이에 제한되지 않음)]이고, 제2 반응성 기는 알키닐 부분이다. 본 발명의 변형된 hGH 폴리펩티드의 특정 실시양태들에서, 하나 이상의 번역후 변형을 포함하는 하나 이상의 비천연적으로 코딩된 아미노산(케토 작용기를 함유하는 비천연적으로 코딩된 아미노산을 포함하나 이에 제한되지 않음)을 이용하고, 여기에서 하나 이상의 번역후 변형은 당 부분을 포함한다. 특정 실시양태들에서, 번역후 변형은 진핵생물 세포 또는 비진핵생물 세포에서 생체내 이루어진다.
특정 실시양태들에서, 단백질은 한 숙주 세포에 의해 생체내 이루어지는 하나 이상의 번역후 변형을 포함하며, 여기에서 번역후 변형은 정상적으로 또 다른 숙주 세포 유형에 의해 이루어지지 않는다. 특정 실시양태들에서, 단백질은 진핵생물 세포에 의해 생체 내에서 이루어지는 하나 이상의 번역 후 변형을 포함하는데, 비진핵생물 세포에서는 번역 후 변형이 정상적으로 이루어지지 않는다. 번역 후 변형에는 아세틸화, 아실화, 지질-변형, 팔미토일화, 팔미테이트 부가, 포스포릴화, 당지질-연결기 변형 등이 포함되나 이들에 제한되지 않는다. 한 실시양태에서, 번역 후 변형은 GlcNAc-아스파라긴 연결기에 의해 아스파라긴에 이당류를 결합시키는 것(여기에서, 이당류는 (GlcNAc-Man)2-Man-GlcNAc-GlcNAc 등을 포함함(단, 이에 제한되지 않음))을 포함한다. 또 다른 실시양태에서, 번역 후 변형은 이당류(Gal-GalNAc, Gal-GlcNAc 등을 포함하나 이에 제한되지 않음)를 GalNAc-세린, GalNAc-트레오닌, GlcNAc-세린 또는 GlcNAc-트레오닌 연결기에 의해 세린 또는 트레오닌에 결합시키는 것을 포함한다. 특정 실시양태들에서, 본 발명의 단백질 또는 폴리펩티드는 분비 또는 국지화 서열, 에피토프 택, FLAG 택, 폴리히스티딘 택, GST 융합 등을 포함할 수 있다.
관심 단백질 또는 폴리펩티드는 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상의 비천연 아미노산을 함유할 수 있다. 비천연적으로 코딩된 아미노산은 동일하거나 상이할 수 있고, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상 개수의 상이한 비천연 아미노산을 포함하는 단백질에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상 개수의 상이한 부위들이 있을 수 있다. 특정 실시양태들에서, 천연 발생 양태의 단백질 내에 존재하는 특별한 아미노산의 하나 이상, 단 전부 미만이 비천연 아미노산으로 치환된다.
본 발명은 표지; 염료; 중합체; 수용성 중합체; 폴리에틸렌 글리콜의 유도체; 광가교제; 세포독성 화합물; 약물; 친화성 표지; 광친화성 표지; 반응성 화합물; 수지; 제2 단백질 또는 폴리펩티드 또는 폴리펩티드 유사체; 항체 또는 항체 단편; 금속 킬레이터; 보조인자; 지방산; 탄수화물; 폴리뉴클레오티드; DNA; RNA; 안티센스 폴리뉴클레오티드; 억제성 리보핵산; 생물질; 나노입자; 스핀 표지; 형광발색단, 금속-함유 부분; 방사능 부분; 신규 작용기; 다른 분자와 공유 또는 비공유 상호작용하는 기; 광포집(photocaged) 부분; 광이성화 부분; 비오틴; 비오틴의 유도체; 비오틴 유사체; 중원자-도입 부분; 화학적 절단형 기; 광절단형 기; 연신 측쇄; 탄소-연결 당; 산화환원 활성제; 아미노 티오산; 독성 부분; 동위원소 표지된 부분; 생물리학적 프로브; 인광성 기; 화학발광성 기; 전자 조밀 기; 자기성 기; 개재성 기; 발색단; 에너지 전달제; 생물학적 활성제; 검출가능 표지; 소분자; 또는 상기 것들의 임의 조합, 또는 임의의 기타 바람직한 화합물 또는 물질)을 포함하나 이에 제한되지 않는 다른 물질과의, 매우 다양한 작용기, 치환기 또는 부분을 갖는 물질의 접합체를 제공한다. 본 발명은 또한 아지드 또는 아세틸렌 부분을 갖는 물질과 상응하는 아세틸렌 또는 아지드 부분을 갖는 PEG 중합체 유도체의 접합체를 포함한다. 예를 들어, 아지드 부분을 함유하는 PEG 중합체는 아세틸렌 작용기를 갖는 비유전적으로 코딩된 아미노산을 함유하는 단백질 내의 위치에 있는 생물학적 활성 분자에 결합된다. PEG 및 생물학적 활성 분자를 결합할 때 이용되는 연결기에는 휘스겐 [3+2] 시클로부가 생성물이 포함되나, 이에 제한되지 않는다.
PEG가 바이오물질의 표면을 변형시키기 위해 사용될 수 있음이 잘 확립되어 있다(예컨대, 본원에 참고로 인용되는, [U.S. 특허 6,610,281; Mehvar, R., J. Pharm Pharm Sci., 3(1):125-136(2000)]를 참고한다). 보다 구체적으로, 하나 이상의 활성 히드록실 부분을 갖는 수용성 중합체를, 더욱 반응성인 부분, 예컨대 메실레이트, 트레실레이트, 토실레이트 또는 할로겐 이탈기를 갖는 치환 중합체를 생성시키도록 반응을 그 이후 더 수행한다. 술포닐산 할로겐화물, 할로겐 원자 및 기타 이탈기를 함유하는 PEG 유도체의 제조 및 용도가 당업자에게 공지되어 있다. 이어서, 수득된 치환 중합체는 중합체의 말단에서 더욱 반응성인 부분으로의 치환 반응을 수행한다. 대안적으로, 하나 이상의 활성 친핵성 또는 친전자성 부분을 갖는 수용성 중합체는 연결제와의 반응을 수행하여, PEG 중합체와 연결제 사이에 공유 결합이 형성되도록 하고, 반응성 기는 중합체의 말단에 위치하게 된다. 아민, 티올, 히드라지드, 히드라진, 알코올, 카르복실레이트, 알데히드, 케톤, 티오에스테르 등을 포함한 친핵성 및 친전자성 부분이 당업자에게 공지되어 있다.
본 발명은 재조합 유전공학의 분야의 통상의 기술을 이용한다. 본 발명에서 사용되는 일반적 방법을 개시한 기본서에는 [Sambrook 등, Molecular Cloning, A Laboratory Manual(제3판 2001); Kriegler, Gene Transfer and expression: A Laboratory Manual(1990); 및 Current Protocols in Molecular Biology(Ausubel 등(편저), 1994))]이 포함된다.
분자생물학적 기술을 기재한 일반 문헌에는 [Berger 및 Kinirnel, Guide to Molecular Cloning Techniques , Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA(Berger); Sambrook 등, Molecular Cloning - A Laboratory Manual (제2판), 제1-3권, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") 및 Current Protocols in Molecular Biology, F.M. Ausubel 등(편저), Current Protocols, a joint venture between Greene Publishing Associates, Inc. 및 John Wiley & Sons, Inc., (supplemented through 1999년 추록)("Ausubel"))]이 포함된다. 이 문헌들은 비천연적으로 코딩된 아미노산, 오르소고날 tRNA, 오르소고날 합성효소 및 이들의 쌍을 포함하는 단백질 생산을 위한 셀렉터 코돈을 포함하는 유전자의 생성 등(단, 이에 제한되지 않음)과 관련된 변이유발, 벡터의 이용, 프로모터 및 많은 기타 관련 주제를 기재하고 있다.
각종 유형의 변이유발이 tRNA의 라이브러리의 생성, 합성효소의 라이브러리의 생성, 셀렉터 코돈의 생성, 관심 단백질 또는 폴리펩티드에서의 비천연 아미노산을 코딩하는 셀렉터 코돈의 삽입을 포함하나 이에 제한되지 않는 각종 목적을 위해 본 발명에 이용된다. 그것들에는 부위-지정, 무작위 점 돌연변이유발, 상동성 재조합, DNA 재혼합(shuffling) 또는 기타 재귀적 변이유발 방법, 키메라 구축, 우라실 함유 주형을 이용한 변이유발, 올리고뉴클레오티드-지정 변이유발, 포스포로티오에이트-변형 DNA 변이유발, 갭 이중체 DNA을 이용한 변이유발 등, 또는 이들의 임의의 조합이 포함되나 이들에 제한되지 않는다. 부가적 적당한 방법에는 점 부정합 수복, 수복-결핍 숙주 균주를 이용한 변이유발, 제한-선택 및 제한-정제, 결실 변이유발, 총체적 유전자 합성에 의한 변이유발, 이중 나선 파괴 수복 등이 포함되나 이들에 제한되지 않는다. 키메라 구성체와 관련된 것을 포함하나 이에 제한되지 않는 변이유발이 또한 본 발명에 포함된다. 한 실시양태에서, 변이유발은 서열, 서열 비교, 물리적 성질, 결정 구조 등을 포함하나 이에 제한되지 않는 천연 발생 분자, 또는 변경되거나 변이된 천연 발생 분자의 기지의 정보에 의해 지시될 수 있다.
본원에 나와 있는 문헌 및 예들은 이러한 절차들을 기재하고 있다. 부가적 정보가 하기 공보들 및 이하에 인용된 참고문헌들에 나와 있다: [Ling 등, Approaches to DNA mutagenesis: an overview, Anal Biochem . 254(2): 157-178(1997); Dale 등, Oligonucleotide - directed random mutagenesis using the phosphorothioate method, Methods Mol . Biol . 57:369-374(1996); Smith, In vitro mutagenesis, Ann . Rev . Genet . 19:423-462(1985); Botstein & Shortle, Strategies and applications of In vitro mutagenesis, Science 229:1193-1201(1985); Carter, Site - directed mutagenesis, Biochem . J. 237:1-7(1986); Kunkel, The efficiency of oligonucleotide directed mutagenesis, Nucleic Acids & Molecular Biology(Eckstein, F. 및 Lilley, D. M.J 편저, Springer Verlag, Berlin)(1987); Kunkel, Rapid and efficient site - specific mutagenesis without phenotypic selection, Proc . Natl . Acad . Sci . USA 82:488-492(1985); Kunkel 등, Rapid and efficient site - specific mutagenesis without phenotypic selection, Methods in Enzymol . 154, 367-382(1987); Bass 등, Mutant Trp repressors with new DNA - binding specificities, Science 242:240-245(1988); Methods in Enzymol. 100:468-500(1983); Methods in Enzymol. 154:329-350(1987); Zoller & Smith, Oligonucleotide - directed mutagenesis using M13 - derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment, Nucleic Acids Res. 10:6487-6500(1982); Zoller & Smith, Oligonucleotide - directed mutagenesis of DNA fragments cloned into M13 vectors, Methods in Enzymol. 100:468-500(1983); Zoller & Smith, Oligonucleotide - directed mutagenesis: a simple method using two oligonucleotide primers and a single - stranded DNA template, Methods in Enzymol . 154:329-350(1987); Taylor 등, The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA, Nucl . Acids Res . 13:8749-8764(1985); Taylor 등, The rapid generation of oligonucleotide - directed mutations at high frequency using phosphorothioate-modified DNA, Nucl . Acids Res . 13:8765-8785(1985); Nakamaye & Eckstein, Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide - directed mutagenesis, Nucl . Acids Res . 14:9679-9698(1986); Sayers 등, Y-T Exonucleases in phosphorothioate - based oligonucleotide - directed mutagenesis, Nucl . Acids Res . 16:791-802(1988); Sayers 등, Strand specific cleavage of phosphorothioate - containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide, (1988) Nucl . Acids Res . 16:803-814; Kramer 등, The gapped duplex DNA approach to oligonucleotide -directed mutation construction, Nucl . Acids Res . 12:9441-9456(1984); Kramer & Fritz Oligonucleotide - directed construction of mutations via gapped duplex DNA, Methods in Enzymol . 154:350-367(1987); Kramer 등, Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations, Nucl . Acids Res . 16:7207(1988); Fritz 등, Oligonucleotide - directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro, Nucl . Acids Res . 16:6987-6999(1988); Kramer 등, Cell 38:879-887(1984); Carter 등, Improved oligonucleotide site - directed mutagenesis using M13 vectors, Nucl . Acids Res . 13:4431-4443(1985); Carter, Improved oligonucleotide-directed mutagenesis using M13 vectors, Methods in Enzymol. 154:382-403(1987); Eghtedarzadeh & Henikoff, Use of oligonucleotides to generate large deletions, Nucl . Acids Res . 14:5115(1986); Wells 등, Importance of hydrogen - bond formation in stabilizing the transition state of subtilisin, Phil . Trans . R. Soc . Loud . A 317:415-423(1986); Nambiar 등, Total synthesis and cloning of a gene coding for the ribonuclease S protein, Science 223:1299-1301(1984); Sakmar 및 Khorana, Total synthesis and expression of a gene for the alpha - subunit of bovine rod outer segment guanine nucleotide - binding protein(transducin), Nucl . Acids Res . 14:6361-6372(1988); Wells 등, Cassette mutagenesis : an efficient method for generation of multiple mutations at defined sites, Gene 34:315-323(1985); Grundstrom 등, Oligonucleotide-directed mutagenesis by microscale ' shot - gun' gene synthesis, Nucl . Acids Res . 13:3305-3316(1985); Mandecki, Oligonucleotide -directed double - strand break repair in plasmids of Escherichia coli: a method for site - specific mutagenesis, Proc . Natl . Acad . Sci . USA, 83:7177-7181(1986); Arnold, Protein engineering for unusual environments, Current Opinion in Biotechnology 4:450-455(1993); Sieber 등, Nature Biotechnology, 19:456-460 (2001); W. P. C. Stemmer, Nature 370, 389-91(1994); 및 I. A. Lorimer, I. Pastan, Nucleic Acids Res . 23, 3067-8(1995)]. 상기 방법들 중 많은 방법들에 대한 부가적 상세 내용을 [Methods in Enzymology 제154권]에서 찾아볼 수 있고, 이 문헌은 또한 각종 변이유발 방법에 있어 품질 관리 문제에 대한 유용한 조절을 또한 기재하고 있다.
본 발명은 또한 오르소고날 tRNA/RS 쌍을 통한 비천연적으로 코딩된 아미노산의 생체 내 도입을 위한 슈도모나스 숙주 세포에 관한 것이다. 슈도모나스 숙주 세포는, 본 발명의 폴리뉴클레오티드, 또는 예를 들어 클로닝 벡터 또는 발현 벡터일 수 있는 본 발명의 벡터를 포함하나 이에 제한되지 않는 본 발명의 폴리뉴클레오티드를 포함하는 구축물을 이용하여 유전적으로 조작(형질변환, 전달 또는 트랜스펙션 등이 포함되나, 이에 제한되지 않음)된다. 벡터는 예를 들어, 플라스미드, 세균, 바이러스, 네이키드 폴리뉴클레오티드 또는 접합 폴리뉴클레오티드의 형태일 수 있다. 벡터는 전기천공[From 등, Proc . Natl . Acad. Sci . USA 82, 5824(1985)], 바이러스 벡터에 의한 감염, 작은 비이드 또는 입자의 기질 내 또는 표면 상 핵산을 이용한 소립자에 의한 고속 충격 천공[Klein 등, Nature 327, 70-73(1987)]을 포함한 표준 방법에 의해 세포 및/또는 미생물에 도입된다.
유전자 조작된 슈도모나스 숙주 세포는 예를 들어, 스크리닝 단계, 프로모터의 활성화 또는 형질전환체의 선택과 같은 활성에 적당하도록 변형된 통상적 영양 배지에서 배양될 수 있다. 세포 단리 및 배양(예컨대, 후속 핵산 단리) 등에 관한(단, 이에 제한되지 않음) 기타 유용한 참고문헌에는 [Freshney(1994) Culture of Animal Cells , a Manual of Basic Technique, 제3판, Wiley-Liss, New York, 및 본 문헌 안에서 인용된 참고문헌들; Payne 등(1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg 및 Phillips(편저)(1995) Plant Cell , Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) 및 Atlas 및 Parks(편저), The Handbook of Microbiological Media(1993) CRC Press, Boca Raton, FL]이 포함된다.
표적 핵산을 세포에 도입하기 위한 수가지 공지 방법이 이용가능하며, 이들 중 임의의 방법이 본 발명에 이용될 수 있다. 이 방법에는 수령자 세포의 DNA 함유 세균 원형질과의 융합, 전기천공, 발사 포격, 및 (이하에 다시 논의되는) 바이러스 벡터의 감염 등이 포함된다. 세균 세포는 본 발명의 DNA 구축물을 포함하는 플라스미드의 수를 증폭시키기 위해 사용될 수 있다. 세균은 로그상으로까지 성장하고, 세균 내의 플라스미드는 당업계에 공지된 각종 방법들에 의해 단리될 수 있다(예를 들어, Sambrook 참고). 또한, 세균으로부터 플라스미드를 정제하기 위한 다양한 키트들이 시중 입수가능하다(예컨대, 이지프레프(EasyPrep)TM, 플렉시프레프(FlexiPrep)TM(양자 모두 파마시아 바이오테크(Pharmacia Biotech) 제품); 스트라타클린(StrataClean)TM(스트라타겐(Stratagene) 제조); 및, 키아프렙(QIAprep)TM(키아겐(Qiagen) 제조). 이어서, 단리되고 정제된 플라스미드를, 세포를 형질감염시키기 위해 사용되거나 관련 벡터에 도입되어 유기체를 감염시키는 다른 플라스미드를 생성하도록 더욱 조작한다. 전형적 벡터는 전사 및 번역 종결자, 전사 및 번역 개시 서열, 및 특별한 표적 핵산의 발현의 제어에 유용한 프로모터를 함유한다. 벡터는 임의적으로 하나 이상의 독립적 종결자 서열을 함유하는 총체적 발현 카세트, (셔틀 벡터를 포함하나 이에 제한되지 않는) 진핵생물 또는 원핵생물, 또는 양자 모두 내의 카세트의 복제를 허용하는 서열, 및 원핵생물 및 진핵생물 시스템 모두를 위한 선택 마커를 포함한다. 벡터는 원핵생물, 진핵생물, 또는 바람직하게는 양자 모두에서의 복제 및 일체화에 적당하다. 이에 대해 [Gillam & Smith, Gene 8:81(1979); Roberts 등, Nature, 328:731(1987); Schneider, B. 등, Protein Expr. Purif . 6435:10(1995); Ausubel, Sambrook, Berger(모두 이하 동일)]를 참고한다. 클로닝에 유용한 세균 및 박테리오파지의 카달로그가 예컨대, ATCC에 의해, 예를 들어 ATCC에 의해 발행되는 [The ATCC Catalogue of Bacteria and Bacteriophage(1992) Gherna 등(편저)]에 나와 있다, 분자 생물학의 시퀀싱, 클로닝 및 기타 측면, 및 기저 이론적 고려사항의 부가적 기본 절차가 또한 [Watson 등(1992) Recombinant DNA 제2판 Scientific American Books, NY]에 나와 있다. 또한, 본질적으로 임의의 핵산 (및 표준 또는 비표준 여부와 상관없이 실질적으로 임의의 표지된 핵산)은 더 미들렌드 서티파이드 리에이전트 컴퍼니(The Midland Certified Reagent Company)(미국 텍사스주 미들랜드 소재, mcrc.com의 웹사이트 상에 이용가능함), 더 그레잇 아메리칸 젠 컴퍼니(The Great American Gene Company)(미국 캘리포니아주 라모나 소재, genco.com의 웹사이트 상에 이용가능함), 엑스프레스젠 인코포레이티드(ExpressGen Inc.)(미국 일리노이즈주 시카고 소재, expressgen.com의 웹사이트 상에 이용가능함), 오페론 테크놀로지즈 인코포레이티드(Operon Technologies Inc.)(미국 캘리포니아주 알라메다 소재), 및 기타 많은 회사들과 같은 각종 상업적 출처들 중 임의의 곳으로부터 주문된 관례 또는 표준일 수 있다.
셀렉터 코돈
본 발명의 셀렉터 코돈은 단백질 생합성 기작의 유전 코돈 작업틀을 확장시킨다. 예를 들어, 셀렉터 코돈에는 특유의 3염기 코돈, 넌센스 코돈, 예컨대 앰버 코돈(UAG), 오팔 코돈(UGA) 또는 오커 코돈(UAA)을 포함하나 이에 제한되지 않는 중지 코돈, 비천연 뉴클레오시드 함유 코돈, 4개 이상의 염기 코돈, 희소 코돈 등이 포함되나 이들에 제한되지 않는다. 폴리펩티드의 적어도 일부분을 코딩하는 단일 폴리뉴클레오티드에 1개 이상, 2개 이상, 3개 초과, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상 개수를 포함하나 이에 제한되지 않는 수의, 매우 폭넓은 범위의 수의, 원하는 유전자에 도입될 수 있는 셀렉터 코돈들이 있음이 당업자에게 자명하다.
한 실시양태에서, 방법은 진핵생물 세포 내의 생체내 비천연적으로 코딩된 아미노산의 도입을 위한 중지 코돈인 셀렉터 코돈의 사용을 포함한다. 예를 들어, UAG를 포함하나 이에 제한되지 않는 중지 코돈을 인식하는 O-tRNA가 생성되어, 원하는 비천연적으로 코딩된 아미노산으로 O-RS에 의해 아미노아실화된다. 이 O-tRNA는 천연 발생 숙주의 아미노아실-tRNA 합성효소에 의해 인식되지 않는다. 통상적 부위-지정 변이유발을 사용하여, 관심 폴리펩티드의 관심 부위에서 TAG을 포함하나 이에 제한되지 않는 중지 코돈을 도입할 수 있다. 이에 대해 예컨대, [Sayers, J. R. 등(1988), 5',3' Exonucleases in phosphorothioate-based oligonucleotide - directed mutagenesis. Nucleic Acids Res. 791-802]을 참고한다. O-RS, O-tRNA, 및 관심 폴리펩티드를 코딩하는 핵산이 생체내 조합될 때, 비천연적으로 코딩된 아미노산이 UAG 코돈에 대한 반응으로 도입되어, 특정화된 위치에 비천연적으로 코딩된 아미노산을 함유하는 폴리펩티드를 제공한다.
생체내 비천연적으로 코딩된 아미노산의 도입은 슈도모나스 숙주 세포의 당한 섭동 없이 행해질 수 있다. 예를 들어, UAG 코돈에 대한 억제 효율이 앰버 서프레서 tRNA를 포함하나 이에 제한되지 않는 O-tRNA, 및 (중지 코돈에 결합하여 리보좀으로부터 성장 펩티드의 방출을 개시하는) 방출 인자 사이의 경쟁에 의존하기 때문에, 억제 효율은 O-tRNA, 및/또는 서프레서 tRNA의 발현 수준을 증가시킴으로써(단, 이에 제한되지 않음) 조절될 수 있다.
셀렉터 코돈은 또한 4개 이상의 염기 코돈, 예컨대 4개, 5개 또는 6개 이상의 염기 코돈을 포함하나 이에 제한되지 않는 연장된 코돈을 포함한다. 4개 염기 코돈의 예는 AGGA, CUAG, UAGA, CCCU 등을 포함하나 이에 제한되지 않는다. 5개 염기 코돈의 예에는 AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC 등이 포함되나 이들에 제한되지 않는다. 본 발명의 한 특성은 격자이동(frameshift) 억제에 기초한 연장된 코돈을 이용하는 것을 포함한다. 4개 이상의 염기 코돈은 1개 또는 다수개의 비천연적으로 코딩된 아미노산을(단, 이에 제한되는 것은 아님) 동일한 단백질에 삽입할 수 있다. 예를 들어, 안티코돈 루프, 예를 들어 적어도 8-10 nt 안티코돈 루프와 함께, 특별한 격자이동 서프레서 tRNA를 포함하나 이에 제한되지 않는 변이된 O-tRNA의 존재 하에, 4개 이상의 염기 코돈은 단일 아미노산으로 해독된다. 다른 실시양태들에서, 적어도 4-염기 코돈, 적어도 5-염기 코돈, 또는 6-염기 코돈, 또는 그 이상을 포함하나 이에 제한되지 않는 안티코돈 루프가 디코딩될 수 있다. 256가지 가능한 4-염기 코돈이 있으므로, 4개 이상의 염기 코돈을 이용하여 수개의 비천연적으로 코딩된 아미노산을 동일한 세포에서 코딩할 수 있다. 이에 대해 [Anderson 등(2002) Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology, 9:237-244; Magliery, (2001) Expanding the Genetic Code : Selection of Efficient Inhibitors of Four - base Codons and Identification of " Shifty " Four - base Codons with a Library Approach in Escherichia coli, J. Mol . Biol . 307:755-769]를 참고한다.
예를 들어, 4-염기 코돈은 시험관내 생합성 방법을 이용하여 단백질에 비천연적으로 코딩된 아미노산을 도입하기 위해 사용되었다. 이에 대해 예컨대, [Ma 등(1993) Biochemistry, 32:7939; 및 Hohsaka 등(1999) J. Am . Chem . Soc ., 121:34]를 참고한다. CGGG 및 AGGU는 2개의 화학적으로 아실화 격자이동 서프레서 tRNA와 함께 스트렙타비딘에 2-나프틸알라닌 및 리신의 NBD 유도체를 동시에 시험관내 도입하기 위해 사용되었다. 이에 대해 예컨대, [Hohsaka 등(1999) J. Am. Chem . Soc ., 121:12194]을 참고한다. 생체 내 연구에서, Moore 등은 NCUA 안티코돈을 갖는 tRNALeu 유도체의 UAGN 코돈을 억제하는 능력을 연구하였고(N은 U, A, G 또는 C일 수 있음), 4중체 UAGA가 0 또는 -1 격자에서의 적은 디코딩으로 13 내지 26%의 효율로 UCUA 안티코돈을 갖는 tRNALeu에 의해 디코딩될 수 있음을 밝혀내었다. 이에 대해 [Moore 등(2000) J. Mol . Biol ., 298:195]를 참고한다. 한 실시양태에서, 희소 코돈 또는 넌센스 코돈 기재의 연장된 코돈이 본 발명에 사용될 수 있고, 이는 다른 원하지 않는 부위에서 미스센스 과번역 및 격자이동 억제를 감소시킬 수 있다.
소정의 시스템의 경우, 셀렉터 코돈은 또한 천연 3개 염기 코돈 중 하나를 포함할 수 있고, 여기에서 내인성 시스템은 천연 염기 코돈을 전혀 (혹은 거의) 사용하지 않는다. 예를 들어, 이는 천연 3개 염기 코돈을 인식하는 tRNA가 결핍된 시스템, 및/또는 3개 염기 코돈이 희소 코돈인 시스템을 포함한다.
셀렉터 코돈은 임의적으로 비천연 염기쌍을 포함한다. 이들 비천연 염기쌍은 현존 유전 알파벳을 더욱 확장시킨다. 한 추가 염기쌍은 삼중체(triplet) 코돈의 수를 64에서 125로 증가시킨다. 세 번째 염기쌍의 성질에는 안정하고 선택적인 염기쌍형성, 중합효소에 의한 고신뢰도의 DNA로의 효율적인 효소에 의한 도입, 및 초기 비천연 염기쌍의 합성 후의 효율적 연속 프라이머 연장이 포함된다. 방법 및 조성물을 위해 적합화될 수 있는 비천연 염기쌍의 기재에는 예컨대, [Hirao 등(2002) An unnatural base pair for incorporating amino acid analogues into protein , Nature Biotechnology, 20:177-182]이 포함된다. 다른 관련 공보들이 이하 열거되어 있다.
생체내 용도에 있어서, 비천연 뉴클레오시드는 막 투과가능하고, 인산화되어, 상응하는 삼인산염을 형성한다. 또한, 증가된 유전 정보는 안정하고, 세포성 효소에 의해 파괴되지 않는다. Benner 등에 의한 과거 노력은 정규(canonical) Watson-Crick 쌍에서의 경우와 상이한 수소 결합 패턴을 이용하였고, 이의 가장 주목할만한 예는 이소-C:이소-G 쌍이다. 이에 대해 예컨대, [Switzer 등(1989) J. Am . Chem . Soc ., 111:8322; 및 Piccirilli 등(1990) Nature, 343:33; Kool(2000) Curr . Opin . Chem . Biol ., 4:602]를 참고한다. 이 염기들은 일반적으로 천연 염기와 어느 정도 잘못 쌍을 이루고, 효소에 의해 복제될 수 없다. Kool 및 그의 동료 연구원들은, 염기들 간의 소수성 팩킹 상호작용은 수소 결합을 대체하여, 염기쌍의 형성을 주도할 수 있음을 입증하였다. 이에 대해 [Kool(2000) Curr . Opin . Chem . Biol ., 4:602; 및 Guckian 및 Kool(1998) Angew . Chem . Int . Ed . Engl ., 36, 2825]를 참고한다. 상기 요건들을 모두 만족하는 비천연 염기쌍을 개발하기 위한 한 노력으로, Schultz, Romesberg 및 동료 연구원들은 일련의 비천연 소수성 염기들을 계통적으로 합성하고 연구하였다. PICS:PICS 자기-쌍은 천연 염기쌍보다 더 안정한 것으로 나타나고, 에스케리치아 콜라이 DNA 중합효소 클레노우(Klenow) 단편 I(KF)에 의해 DNA로 효율적으로 도입될 수 있다. 이에 대해 예컨대, [McMinn 등(1999) J. Am . Chem. Soc ., 121:11585-6; 및 Ogawa 등(2000) J. Am . Chem . Soc ., 122:3274]를 참고한다. 3MN:3MN 자기-쌍은 생물학적 기능을 위해 충분한 효율 및 선택도로 KF에 의해 합성될 수 있다. 이에 대해 예컨대, [Ogawa 등(2000) J. Am . Chem . Soc., 122:8803]을 참고한다. 그러나, 양 염기 모두 추가 복제를 위한 사슬 종결자로서 작용한다. PICS 자기 쌍을 복제하기 위해 사용될 수 있는 변이체 DNA 중합효소가 최근 개발되었다. 또한, 7AI 자기 쌍이 복제될 수 있다. 이에 대해 예컨대, [Tae 등(2001) J. Am . Chem . Soc ., 123:7439]를 참고한다. Cu(II)에 결합할 때 안정한 쌍을 형성하는 신규 금속염기쌍, Dipic:Py이 또한 개발되었다. 이에 대해 [Meggers 등(2000) J. Am . Chem . Soc ., 122:10714]를 참고한다. 연장된 코돈 및 비천연 코돈이 천연 코돈에 대해 본래 오르소고날이기 때문에, 본 발명의 방법은 그 방법을 위한 오르소고날 tRNA를 생성시키는 상기 성질을 이용할 수 있다.
번역 바이패싱(bypassing) 시스템을 또한 사용하여, 요망되는 폴리펩티드에 비천연 아미노산을 도입할 수 있다. 번역 바이패싱 시스템에서, 큰 서열이 유전자에 도입되나, 단백질로 번역되지 않는다. 서열은 리보솜이 삽입의 하류에서 그 서열을 건너뛰어 번역을 재개하도록 유도하는 신호로서 작용하는 구조를 포함한다.
특정 실시양태들에서, 본 발명의 방법 및/또는 조성물에서의 관심 단백질 또는 폴리펩티드(또는 이의 부분)는 핵산에 의해 코딩된다. 전형적으로, 핵산은 1개 이상의 셀렉터 코돈, 2개 이상의 셀렉터 코돈, 3개 이상의 셀렉터 코돈, 4개 이상의 셀렉터 코돈, 5개 이상의 셀렉터 코돈, 6개 이상의 셀렉터 코돈, 7개 이상의 셀렉터 코돈, 8개 이상의 셀렉터 코돈, 9개 이상의 셀렉터 코돈, 10개 이상의 셀렉터 코돈을 포함한다.
관심 단백질 또는 폴리펩티드를 코딩하는 유전자는 당업자에게 공지된 방법을 이용하여 변이유발될 수 있고, 비천연적으로 코딩된 아미노산의 도입을 위한 1개 이상의 셀렉터 코돈을 포함하는 것으로 본원에 기재되어 있다. 예를 들어, 관심 단백질에 대한 핵산을, 1개 이상의 셀렉터 코돈을 포함하도록 변이유발하여, 1개 이상의 비천연적으로 코딩된 아미노산의 도입을 제공한다. 본 발명은 변이체, 예를 들어 1개 이상의 비천연적으로 코딩된 아미노산을 포함하는 임의의 단백질의 양태를 포함하나 이에 제한되지 않는 임의의 그와 같은 변종체를 포함한다. 마찬가지로, 본 발명은 또한 상응하는 핵산, 즉 1개 이상의 비천연 아미노산을 코딩하는 1개 이상의 셀렉터 코돈을 갖는 임의의 핵산을 포함한다.
관심 단백질을 코딩하는 핵산 분자는 폴리펩티드의 임의의 요망되는 위치에 시스테인을 도입하기 위해 용이하게 변이될 수 있다. 시스테인은 반응성 분자, 수용성 중합체, 단백질, 또는 매우 다양한 다른 분자를 관심 단백질에 도입하기 위해 광범위하게 사용된다. 본원에 참고로 인용되는 U.S. 특허 No. 6,608,183에 기재된 방법, 및 표준 변이유발 기법과 같은, 폴리펩티드의 임의의 요망되는 위치에 시스테인을 도입하기 위해 적당한 방법들이 당업계에 공지되어 있다.
IV . 비천연적으로 코딩된 아미노산
매우 다양한 비천연적으로 코딩된 아미노산들이 본 발명에 사용하기에 적당하다. 임의 수의 비천연적으로 코딩된 아미노산이 폴리펩티드에 도입될 수 있다. 일반적으로, 도입된 비천연적으로 코딩된 아미노산은 20개의 통상의 유전적으로 코딩된 아미노산(즉, 알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소루이신, 루이신, 리신, 메티오닌, 페닐알라닌, 프롤린, 세린, 트레오닌, 트립토판, 티로신 및 발린)에 대해 실질적으로 화학적 불활성이다. 일부 실시양태들에서, 비천연적으로 코딩된 아미노산은 (아지도, 케톤, 알데히드 및 아미노옥시기를 포함하나 이에 제한되지 않는) 20개의 통상의 아미노산에서 발견되지 않는 작용기와 효율적으로 또한 선택적으로 반응하여, 안정한 접합체를 형성하는 측쇄 작용기를 포함한다. 예를 들어, 아지도 작용기를 함유하는 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 폴리(에틸렌 글리콜)을 포함하나 이에 제한되지 않는 중합체, 또는 대안적으로 알킨 부분을 함유하는 두 번째 폴리펩티드와 반응하여, 안정한 접합체를 형성하며, 이는 아지드 및 알킨 작용기의 선택적 반응을 통해 휘스겐 [3+2] 시클로부가 생성물이 형성되도록 한다.
알파-아미노산의 포괄적 구조는 하기와 같이 도시된다(화학식 I):
[화학식 I]
Figure 112007093262665-PCT00002
비천연적으로 코딩된 아미노산은 전형적으로 상기 화학식(식 중에서, R 기는 20개 천연 아미노산에 사용되는 것 이외의 임의의 치환기임)을 갖는 임의의 구조이며, 본 발명에 사용하기에 적당할 수 있다. 본 발명의 비천연적으로 코딩된 아미노산은 전형적으로 측쇄의 구조에서만 천연 아미노산과 상이하기 때문에, 비천연적으로 코딩된 아미노산은 천연 발생 폴리펩티드에서 형성되는 방식과 동일한 방식으로, 천연 또는 비천연적으로 코딩된(단, 이에 제한되지 않음) 다른 아미노산과 아미드 결합을 형성한다. 그러나, 비천연적으로 코딩된 아미노산은 천연 아미노산과 그것을 구별되게 하는 측쇄기를 가진다. 예를 들어, R은 임의적으로 알킬-, 아릴-, 아실-, 케토-, 아지도-, 히드록실-, 히드라진, 시아노-, 할로-, 히드라지드, 알케닐, 알키닐, 에테르, 티올, 셀레노-, 술포닐-, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 에스테르, 티오산, 히드록실아민, 아미노기 등, 또는 이들의 임의의 조합을 포함한다. 본 발명에 사용하기에 적당할 수 있는 다른 관심 비천연 발생 아미노산에는 광활성화 가교기를 포함하는 아미노산, 스핀-표지된 아미노산, 형광성 아미노산, 금속-결합 아미노산, 금속-함유 아미노산, 방사능 아미노산, 신규 작용기를 갖는 아미노산, 다른 분자와 공유 또는 비공유 상호작용하는 아미노산, 광포집 및/또는 광이성화 아미노산,비오틴 또는 비오틴 유사체를 함유하는 아미노산, 글리코실화 아미노산, 예컨대 당 치환된 세린, 기타 탄수화물-변형 아미노산, 케토-함유 아미노산, 폴리에틸렌 글리콜 또는 폴리에테르 포함 아미노산, 중원자-치환된 아미노산, 화학적 절단형 또는 광절단형 아미노산, 약 5개 초과 또는 약 10개 초과의 탄소 길이를 갖는(단, 이에 제한되지 않음) 장쇄 탄화수소 또는 폴리에테르를 포함하나 이에 제한되지 않는, 천연 아미노산에 비해 연신 측쇄를 갖는 아미노산, 탄소-연결의 당-함유 아미노산, 산화환원-활성 아미노산, 아미노 티오산 함유의 아미노산, 및 1개 이상의 독성 부분을 포함하는 아미노산이 포함되나 이들에 제한되지 않는다.
본 발명에 사용하기에 적당할 수 있고 수용성 중합체와의 반응에 유용한 예시적 비천연적으로 코딩된 아미노산에는 카르보닐, 아미노옥시, 히드라진, 히드라지드, 세미카르바지드, 아지드 및 알킨 반응성 기를 갖는 것들이 포함되나 이들에 제한되지 않는다. 일부 실시양태들에서, 비천연적으로 코딩된 아미노산은 당 부분을 포함한다. 그러한 아미노산의 예에는 N-아세틸-L-글루코사미닐-L-세린, N-아세틸-L-갈락토아미닐-L-세린, N-아세틸-L-글루코사미닐-L-트레오닌, N-아세틸-L-글루코사미닐-L-아스파라긴 및 O-만노스아미닐-L-세린이 포함된다. 그러한 아미노산의 예에는 또한 아미노산과 당 사이의 천연 발생 N- 또는 O-연결기가 알켄, 옥심, 티오에테르, 아미드 등을 포함하나 이에 제한되지 않는, 천연적으로는 통상 발견되지는 않는 공유 연결기에 의해 치환되는 예들이 포함된다. 그러한 아미노산의 예에는 또한 2-데옥시-포도당, 2-데옥시갈락토스 등과 같은 천연 발생 단백질에서 통상 발견되지 않는 당들이 포함된다.
본원에 제공되는 많은 비천연적으로 코딩된 아미노산들이 예컨대, 시그마-알드리히(Sigma-Aldrich)(미국 미조리주 세인트루이스 소재), 노바바이오켐(Novabiochem)(EMD 바이오사이언스사의 지사, 독일 담슈타트 소재) 또는 펩테크(Peptech)(미국 메사츄세츠주 버링톤 소재)로부터 시중 입수가능하다. 시중 입수가능하지 않은 것들은 임의적으로 본원에 제공된 채로 합성되거나, 당업자에게 공지된 표준 방법을 이용하여 합성된다. 유기 합성 기법에 대해, 예컨대 [Organic Chemistry, Fessendon and Fessendon(1982)(제2판, Willard Grant Press, Boston Mass); Advanced Organic Chemistry, March(제3판, 1985, Wiley and Sons, New York); 및 Advanced Organic Chemistry, Carey 및 Sundberg(제3판, 파트 A 및 B, 1990, Plenum Press, New York)]을 참고한다. 또한 본원에 각기 참고로 인용되는 U.S. 특허 출원 공보 2003/0082575 및 2003/0108885를 참고한다. 신규 측쇄를 포함하는 비천연적으로 코딩된 아미노산에 부가하여, 본 발명에 사용하기에 적당할 수 있는 비천연적으로 코딩된 아미노산은 또한 임의적으로, 하기 화학식 II 및 III의 구조로 도시되는(단, 이에 제한되지 않음) 변형된 골격 구조를 포함한다:
Figure 112007093262665-PCT00003
(식 중에서, Z는 전형적으로 OH, NH2, SH, NH-R' 또는 S-R'를 포함하고; X 및 Y는 동일하거나 상이할 수 있고, 전형적으로 S 또는 0를 포함하며; R 및 R'는 임의적으로 동일하거나 상이하고, 전형적으로 화학식 I을 갖는 비천연적으로 코딩된 아미노산에 대해 상기 R기에 대한 구성성분들의 동일한 목록, 및 수소로부터 선택됨). 예를 들어, 본 발명의 비천연적으로 코딩된 아미노산은 또한 임의적으로 화학식 II 및 III로 도시되는 아미노 또는 카르복실기에서의 치환을 포함한다. 이 유형의 비천연적으로 코딩된 아미노산에는 통상의 20개 천연 아미노산에 상응하는 측쇄 또는 비천연 측쇄를 갖는(단, 이에 제한되지 않음) α-히드록시 산, α-티오산, α-아미노티오카르복실레이트가 포함되나 이들에 제한되지 않는다. 또한, α-탄소에서의 치환에는 임의적으로 L, D, 또는 α-α-이치환 아미노산, 예컨대 D-글루타메이트, D-알라닌, D-메틸-O-티로신, 아미노부티르산 등이 포함되나 이들에 제한되지 않는다. 다른 구조적 대체물에는 고리형 아미노산, 예컨대 프롤린 유사체, 및 3, 4, 6, 7, 8 및 9-원 환 프롤린 유사체, β 및 γ 아미노산, 예컨대 치환 β-알라닌 및 γ-아미노 부티르산이 포함된다.
많은 비천연적으로 코딩된 아미노산은 천연 아미노산, 예컨대 티로신, 글루타민, 페닐알라닌 등을 기재로 하고, 본 발명에 사용하기에 적당하다. 티로신 유사체에는 파라-치환 티로신, 오르토-치환 티로신, 및 메타 치환 티로신이 포함되나 이들에 제한되지 않으며, 여기에서 치환 티로신은 케토기(아세틸기를 포함하나 이에 제한되지 않음), 벤조일기, 아미노기, 히드라진, 히드록시아민, 티올기, 카르복시기, 이소프로필기, 메틸기, C6-C20 직쇄 또는 분지형 탄화수소, 포화 또는 불포화 탄화수소, O-메틸기, 폴리에테르기, 니트로기, 알키닐기 등을 포함하나 이에 제한되지 않는다. 또한, 다중 치환 아릴 환도 또한 구상된다. 본 발명에 사용하기에 적당할 수 있는 글루타민 유사체에는 α-히드록시 유도체, γ-치환 유도체, 고리형 유도체 및 아미드 치환 글루타민 유도체가 포함되나 이들에 제한되지 않는다. 본 발명에 사용하기에 적당할 수 있는 페닐알라닌 유사체의 예에는 파라-치환 페닐알라닌, 오르토-치환 페닐알라닌, 및 메타-치환 페닐알라닌이 포함되나 이들에 제한되지 않으며, 여기에서 치환기는 히드록시기, 메톡시기, 메틸기, 알릴기, 알데히드, 아지도, 요오도, 브로모, 케토기(아세틸기를 포함하나 이에 제한되지 않음), 벤조일, 알키닐기 등을 포함하나 이에 제한되지 않는다. 본 발명에 사용하기에 적당할 수 있는 비천연적으로 코딩된 아미노산의 구체예에는 p-아세틸-L-페닐알라닌, O-메틸-L-티로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, O-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-요오도페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 및 p-프로파르길옥시-페닐알라닌 등이 포함되나 이들에 제한되지 않는다. 본 발명에 사용하기에 적당할 수 있는 각종 비천연적으로 코딩된 아미노산의 구조의 예가 예를 들어, WO 2002/085923, 발명의 명칭: "In vivo incorporation of non-naturally encoded amino acids"에 나와 있다. 또한, 부가적 메티오닌 유사체에 대해 [Kiick 등(2002), Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligation, PNAS 99:19-24]를 참고한다.
한 실시양태에서, 비천연적으로 코딩된 아미노산(예컨대, p-(프로파르길옥시)-페닐알라닌)을 포함하는 폴리펩티드의 조성물이 제공된다. p-(프로파르길옥시)-페닐알라닌을 포함하고, 단백질 및/또는 세포를 포함하나 이에 제한되지 않는 각종 조성물들도 또한 제공된다. 한 측면에서, p-(프로파르길옥시)-페닐알라닌이라는 비천연적으로 코딩된 아미노산을 포함하는 조성물은 오르소고날 tRNA를 추가로 포함한다. 비천연적으로 코딩된 아미노산은 아미노-아실 결합을 통해 오르소고날 tRNA에 공유 결합되거나 오르소고날 tRNA의 말단 리보스 당의 3'OH 또는 2'OH에 공유 결합된(단, 이에 제한되지 않음) 오르소고날 tRNA에 (공유, 단 이에 제한되지 않음) 결합될 수 있다.
단백질에 도입될 수 있는 비천연적으로 코딩된 아미노산을 통한 화학적 부분은 각종 이점들 및 단백질의 조작을 제공한다. 예를 들어, 케토 작용기의 특유의 반응성은 시험관내 및 생체내 수많은 히드라진- 또는 히드록실아민-함유 시약들 중 임의의 것을 이용한 단백질의 선택적 변형을 허용한다. 예를 들어, 중원자 비천연적으로 코딩된 아미노산은 X-선 구조 데이터를 단계화하는데 유용할 수 있다. 비천연적으로 코딩된 아미노산을 이용한 중원자의 부위-특이적 도입은 또한 중원자를 위한 위치를 선택함에 있어 선택성 및 융통성을 제공한다. 예를 들어, 광반응성 비천연적으로 코딩된 아미노산(벤조페논 및 아릴아지드(페닐 아지드를 포함하나 이에 제한되지 않음) 측쇄를 갖는 아미노산을 포함하나 이에 제한되지 않음)은 단백질의 효율적인 생체내 및 시험관내 광가교를 허용한다. 광반응성 비천연적으로 코딩된 아미노산의 예에는 p-아지도-페닐알라닌 및 p-벤조일-페닐알라닌이 포함되나 이들에 제한되지 않는다. 이어서, 광반응성 비천연적으로 코딩된 아미노산을 갖는 단백질이 광반응성 기-제공 임시 조절의 여기에 의해 임의로 가교될 수 있다. 한 예에서, 비천연 아미노의 메틸기는 핵자기 공명 및 진동 분광법을 사용하여(단, 이에 제한되지 않음), 국소 구조 및 동력학의 프로브로서 메틸기로(단, 이에 제한되지 않음) 표지된 동위원소로 치환될 수 있다. 예를 들어, 알키닐 또는 아지도 작용기는 [3+2] 시클로부가 반응을 통해 분자를 이용한 단백질의 선택적 변형을 허용한다.
아미노 말단에서 폴리펩티드에 도입된 비천연 아미노산은 20개 천연 아미노산에 사용되는 것과 이외의 임의의 치환기인 R 기, 및 α-아미노산 내에 정상적으로 존재하는 NH2 기와 상이한 2차 반응성 기로 구성될 수 있다(화학식 I 참고). 유사한 비천연 아미노산은 α-아미노산 내에 정상적으로 존재하는 COOH 기와 상이한 2차 반응성 기와 함께 카르복실 말단에 도입될 수 있다(화학식 1 참고).
비천연적으로 코딩된 아미노산의 화학적 합성
시중 입수가능하지 않은, 본 발명에 사용하기에 적당한 많은 비천연적으로 코딩된 아미노산들은 임의적으로 본원 또는 각종 발행물에 제시되는 바와 같이 합성되거나, 당업자에게 공지된 표준 방법을 이용하여 합성된다. 유기 합성 기법에 대해, 예컨대 [Organic Chemistry, Fessendon and Fessendon(1982)(제2판, Willard Grant Press, Boston Mass); Advanced Organic Chemistry, March(제3판, 1985, Wiley and Sons, New York); 및 Advanced Organic Chemistry, Carey 및 Sundberg(제3판, 파트 A 및 B, 1990, Plenum Press, New York)]을 참고한다. 비천연적으로 코딩된 아미노산의 합성을 기재하고 있는 부가적 공보에는 WO 2002/085923, 발명의 명칭: "In vivo incorporation of unnatural amino acids"; Matsoukas 등(1995) J. Med . Chem ., 38, 4660-4669; King, F.E. & Kidd, D.A.A.(1949) A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthylated Intermediates. J. Chem . Soc ., 3315-3319; Friedman, O.M. & Chatterrji, R.(1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti - Tumor Agents. J. Am . Chem . Soc . 81, 3750-3752; Craig, J.C. 등(1988) Absolute Configuration of the Enantiomers of 7- Chloro -4 [[4-( diethylamino )-1- methylbutyl ] amino ] quinoline(Chloroquine). J. Chem . Soc . 53, 1167-1170; Azoulay, M., Vilmont, M. & Frappier, F.(1991) Glutamine analogues as Potential Antimalarials, Eur. J. Med . Chem . 26, 201-5; Koskinen, A.M.P. & Rapoport, H.(1989) Synthesis of 4- Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org . Chem . 54, 1859-1866; Christie, B.D. & Rapoport, H.(1985) Synthesis of Optically Pure Pipecolates from L- Asparagine . Application to the Total Synthesis of (+)- Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org . Chem . 1989:18559-1866; Barton 등(1987) Synthesis of Novel alpha - Amino - Acids and Derivatives Using Radical Chemistry : Synthesis of L- and D- alpha - Amino - Adipic Acids , L-alpha-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett . 43:4297-4308; 및 Subasinghe 등(1992) Quisqualic acid analogues: synthesis of beta - heterocyclic 2- aminopropanoic acid derivatives and their activity at a novel quisqualate - sensitized site. J. Med. Chem . 35:4602-7]이 포함된다. 또한 발명의 명칭: "Protein Arrays", 출원일: 2003년 12월 22일의 특허출원, 일련 번호 10/744,899 및 일련 번호 60/435,821(출원일: 2002년 12월 22일)]을 참고한다.
A. 카르보닐 반응성 기
카르보닐 반응성 기를 갖는 아미노산은 특히 친핵성 부가 또는 알돌 축합 반응을 통해 각종 반응들이 분자(PEG 또는 기타 수용성 분자를 포함하나 이에 제한되지 않음)를 연결시키도록 한다.
예시적 카르보닐-함유 아미노산은 다음과 같이 나타내어질 수 있다:
Figure 112007093262665-PCT00004
(식 중에서, n은 0 내지 10이고; R1은 알킬, 아릴, 치환 알킬 또는 치환 아릴이며; R2는 H, 알킬, 아릴, 치환 알킬 및 치환 아릴이고; R3은 H, 아미노산, 폴리펩티드 또는 아미노 말단 변형기이고; R4는 H, 아미노산, 폴리펩티드 또는 카르복시 말단 변형기임). 일부 실시양태들에서, n은 1이고, R1은 페닐이며, R2는 단순 알킬(즉, 메틸, 에틸 또는 프로필)이고, 케톤 부분은 알킬 측쇄에 대해 파라 위치에 위치한다. 일부 실시양태들에서, n은 1이고, R1은 페닐이며, R2는 단순 알킬(즉, 메틸, 에틸 또는 프로필)이고, 케톤 부분은 알킬 측쇄에 대해 메타 위치에 위치한다.
p-아세틸-(+/-)-페닐알라닌 및 m-아세틸-(+/-)-페닐알라닌의 합성이 본원에 참고로 인용되는 [Zhang, Z. 등, Biochemistry 42:6735-6746(2003)]에 기재되어 있다. 다른 카르보닐-함유 아미노산은 유사하게 당업자에 의해 제조될 수 있다.
일부 실시양태들에서, 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 반응성 카르보닐 작용기를 발생시키도록 화학적으로 변형된다. 예를 들어, 접합 반응에 유용한 알데히드 작용기가 인접 아미노 및 히드록실기를 갖는 작용기로부터 발생될 수 있다. 생물학적 활성 분자가 예를 들어 폴리펩티드인 경우, N-말단 세린 또는 트레오닌(이는 정상적으로 존재하거나 화학적 또는 효소적 소화를 통해 노출될 수 있음)이 사용되어, 과요오드산염을 사용하여 마일드한 산화 절단 조건 하에서 알데히드 작용기를 발생시킬 수 있다. 이에 대해 예컨대, [Gaertner 등, Bioconjug . Chem . 3:262-268(1992); Geoghegan, K. & Stroh, J., Bioconjug . Chem . 3:138-146(1992); Gaertner 등, J. Biol . Chem . 269:7224-7230(1994)]를 참고한다. 그러나, 당업계에 공지된 방법은 펩티드 또는 단백질의 N-말단에 있는 아미노산에 제한된다.
본 발명에서, 인접 히드록실기 및 아미노기를 갖는 비천연적으로 코딩된 아미노산이 "마스킹된" 알데히드 작용기로서 폴리펩티드에 도입될 수 있다. 예를 들어, 5-히드록시리신은 엡실론 아민에 인접한 히드록실기를 가진다. 알데히드를 발생시키기 위한 반응 조건은 전형적으로 마일드한 조건 하에서 몰 과량의 메타과요오드산나트륨을 첨가하여, 폴리펩티드 내의 다른 부위에서의 산화를 피하는 것을 포함한다. 산화 반응의 pH는 전형적으로 약 7.0이다. 전형적 반응은 약 1.5 몰 과량의 메타과요오드산나트륨을 폴리펩티드의 완충 용액에 첨가한 후, 암 상태에서 약 10분 동안 인큐베이션하는 것을 포함한다. 예컨대, 본원에 참고로 인용되는 U.S. 특허 No. 6,423,685를 참고한다.
카르보닐 작용기는 수용액 중 마일드한 조건 하에서 히드라진-, 히드라지드-, 히드록실아민- 또는 세미카르바지드-함유 시약과 선택적으로 반응하여, 생리학적 조건 하에서 안정한, 상응하는 히드라존, 옥심 또는 세미카르바존 연결기를 각기 형성시킬 수 있다. 이에 대해 예컨대, [Jencks, W. P., J. Am . Chem . Soc. 81, 475-481(1959); Shao, J. 및 Tam, J. P., J. Am . Chem . Soc . 117:3893-3899(1995)]를 참고한다. 또한, 카르보닐기의 특유의 반응성은 다른 아미노산 측쇄의 존재 하에서의 선택적 변형을 허용한다. 이에 대해 예컨대, [Cornish, V. W. 등, J. Am . Chem . Soc . 118:8150-8151(1996); Geoghegan, K. F. & Stroh, J. G., Bioconjug . Chem . 3:138-146(1992); Mahal, L. K. 등, Science 276:1125-1128(1997)]를 참고한다.
B. 히드라진, 히드라지드 또는 세미카르바지드 반응성 기
친핵성 기, 예컨대 히드라진, 히드라지드 또는 세미카르바지드를 함유하는 비천연적으로 코딩된 아미노산은 각종 친핵성기와의 반응에 의해, [PEG 또는 기타 수용성 중합체와의(단, 이에 제한되지 않음)] 접합체가 형성되도록 한다.
예시적 히드라진, 히드라지드 또는 세미카르바지드-함유 아미노산은 하기와 같이 표시될 수 있다:
Figure 112007093262665-PCT00005
(식 중에서, n은 0 내지 10이고; R1은 알킬, 아릴, 치환 알킬, 또는 치환 아릴이거나 존재하지 않으며; X는 0, N 또는 S이거나 존재하지 않고; R2는 H, 아미노산, 폴리펩티드 또는 아미노 말단 변형기이고, R3은 H, 아미노산, 폴리펩티드 또는 카르복시 말단 변형기임).
일부 실시양태들에서, n은 4이고, R1은 존재하지 않으며, X는 N이다. 일부 실시양태들에서, n은 2이고, R1은 존재하지 않으며, X도 존재하지 않는다. 일부 실시양태들에서, n은 1이고, R1은 페닐이며, X는 O이고, 산소 원자는 아릴 환 상의 지방족기에 대해 파라 위치에 위치한다.
히드라지드-, 히드라진- 및 세미카르바지드-함유 아미노산은 상업용 출처로부터 입수가능하다. 예를 들어, L-글루타메이트-γ-히드라지드는 시그마 케미칼(미국 미조리주 세인트루이스 소재)로부터 입수가능하다. 시중 입수가능하지 않은 다른 아미노산은 당업자에 의해 제조될 수 있다. 예컨대, 본원에 참고로 인용되는 U.S. 특허 No. 6,281,211을 참고한다.
히드라지드, 히드라진 또는 세미카르바지드 작용기를 갖는 비천연적으로 코딩된 아미노산을 함유하는 폴리펩티드는, 알데히드 또는 유사한 화학적 반응성을 갖는 기타 작용기를 함유하는 각종 분자와 효율적으로 또한 선택적으로 반응할 수 있다. 이에 대해 예컨대, [Shao, J. 및 Tam, J., J. Am . Chem . Soc . 117:3893-3899(1995)]를 참고한다. 히드라지드, 히드라진 및 세미카르바지드 작용기의 특유의 반응성은, 그것들을 20개의 통상의 아미노산에 존재하는 친핵성 기(세린 또는 트레오닌의 히드록실기, 또는 리신의 아미노기, 및 N-말단을 포함하나 이에 제한되지 않음)에 비해, 알데히드, 케톤 및 기타 친전자성 기에 대해 상당히 더 반응성이도록 만든다.
C. 아미노옥시 -함유 아미노산
아미노옥시(이는 히드록실아민으로도 불림) 기를 함유하는 비천연적으로 코딩된 아미노산은 각종 친전자성 기와의 반응에 의해, (PEG 또는 기타 수용성 중합체와의(단, 이에 제한되지 않음) 접합체가 형성되도록 한다. 히드라진, 히드라지드 및 세미카르바지드와 같이, 아미노옥시기의 증진된 친핵성은 그것이 알데히드 또는 유사한 화학적 반응성을 갖는 기타 작용기를 함유하는 각종 분자와 효율적으로 또한 선택적으로 반응하도록 한다. 이에 대해 예컨대, [Shao, J. 및 Tam, J., J. Am . Chem . Soc . 117:3893-3899(1995); H. Hang 및 C. Bertozzi, Acc. Chem . Res . 34:727-736(2001)]를 참고한다. 히드라진기와의 반응 결과물이 상응하는 히드라존인 반면, 옥심은 일반적으로 아미노옥시기와 카르보닐-함유 기, 예컨대 케톤과의 반응으로부터 비롯된다.
아미노옥시기를 함유하는 예시적 아미노산은 하기와 같이 표시될 수 있다:
Figure 112007093262665-PCT00006
(식 중에서, n은 0 내지 10이고; R1은 알킬, 아릴, 치환 알킬, 또는 치환 아릴이거나 존재하지 않으며; X은 O, N, S이거나 존재하지 않고; m은 0 내지 10이며; Y=C(O)이거나 존재하지 않고; R2는 H, 아미노산, 폴리펩티드 또는 아미노 말단 변형기이고, R3은 H, 아미노산, 폴리펩티드 또는 카르복시 말단 변형기임). 일부 실시양태들에서, n은 1이고, R1은 페닐이며, X는 O이고, m은 1이며, Y는 존재한다. 일부 실시양태들에서, n은 2이고, R1 및 X는 존재하지 않으며, m은 0이고, Y는 존재하지 않는다.
아미노옥시-함유 아미노산은 용이하게 입수가능한 아미노산 전구체(호모세린, 세린 및 트레오닌)로부터 제조될 수 있다. 이에 대해 예컨대, [M. Carrasco 및 R. Brown, J. Org . Chem . 68:8853-8858(2003)]를 참고한다. 특정 아미노옥시-함유 아미노산, 예컨대 L-2-아미노-4-(아미노옥시)부티르산은 천연원으로부터 단리되었다[Rosenthal, G. 등, Life Sci. 60:1635-1641(1997)]. 다른 아미노옥시-함유 아미노산이 당업자에 의해 제조될 수 있다.
D. 아지드 알킨 반응성 기
아지드 및 알킨 작용기의 특유의 반응성은 그것들을 폴리펩티드 및 기타 생물학적 분자의 선택적 변형에 특히 유용하도록 만든다. 유기 아지드, 특히 지방족 아지드 및 알킨은 일반적으로 통상의 반응성 화학적 조건에 대해 안정하다. 특히, 아지드 및 알킨 작용기는 모두 천연 발생 폴리펩티드에서 발견되는 20개의 통상의 아미노산의 측쇄(즉, R 기)에 대해 불활성이다. 그러나 가까이 근접하면, 아지드 및 알킨기의 "스프링-부하(spring-loaded)" 성질이 나타나고, 그것들은 휘스겐 [3+2] 시클로부가 반응을 통해 선택적으로 또한 효율적으로 반응하여, 상응하는 트리아졸을 발생시킨다. 이에 대해 예컨대, [Chin J. 등, Science 301:964-7(2003); Wang, Q. 등, J. Am . Chem . Soc . 125, 3192-3193(2003); Chin, J. W. 등, J. Am . Chem . Soc . 124:9026-9027(2002)]을 참고한다.
휘스겐 시클로부가 반응이 친핵성 치환보다는 선택적 시클로부가 반응(예컨대, [Padwa, A., COMPREHENSIVE ORGANIC SYNTHESIS, 제4권, (편저 Trost, B. M., 1991), p. 1069-1109; Huisgen, R. 1,3-DIPOLAR CYCLOADDITION CHEMISTRY(편저 Padwa, A., 1984), p. 1-176)] 참고)과 관련되기 때문에, 아지드 및 알킨-함유 측쇄를 갖는 비천연적으로 코딩된 아미노산의 도입은 수득되는 폴리펩티드가 비천연적으로 코딩된 아미노산의 위치에서 선택적으로 변형되도록 한다. 아지드 또는 알킨-함유의 hGH 폴리펩티드와 관련된 시클로부가 반응은, Cu(II)를 Cu(I)로 인시츄 환원시키기 위한 환원제의 존재 하에, (촉매량의 CuS04의 형태의 것을 포함하나 이에 제한되지 않는) 촉매량으로 Cu(II)을 첨가함으로써 수성 조건 하에서 실온에서 수행될 수 있다. 이에 대해 예컨대, [Wang, Q. 등, J. Am . Chem . Soc . 125, 3192-3193(2003); Tornoe, C. W. 등, J. Org . Chem. 67:3057-3064(2002); Rostovtsev 등, Angew . Chem . Int . Ed . 41:2596-2599(2002)]를 참고한다. 예시적 환원제에는 아스코르베이트, 금속성 구리, 퀴닌, 히드로퀴논, 비타민 K, 글루타티온, 시스테인, Fe2 +, Co2 +, 및 인가 전위가 포함되나, 이에 제한되지 않는다.
일부 경우들에서, 아지드와 알킨 사이의 휘스겐 [3+2] 시클로부가 반응이 요망되는 경우, 폴리펩티드는 알킨 부분을 포함하는 비천연적으로 코딩된 아미노산을 포함하고, 아미노산에 부착되게 되는 수용성 중합체는 아지드 부분을 포함한다. 대안적으로, 역반응(즉, 수용성 중합체 상에 존재하는 아미노산 및 알킨 부분 상의 아지드 부분의 반응)도 또한 수행될 수 있다.
아지드 작용기는 또한 아릴 에스테르를 함유하는 수용성 중합체와 선택적으로 반응하고, 아릴 포스핀 부분으로 적절히 작용화되어, 아미드 연결기를 발생시킬 수 있다. 아릴 포스핀기는 아지드를 인시츄 환원시키고, 이어서 수득된 아민은 인접 에스테르 연결기와 효율적으로 반응하여, 상응하는 아미드를 발생시킨다. 이에 대해 예컨대, [E. Saxon 및 C. Bertozzi, Science 287, 2007-2010(2000)]를 참고한다. 아지드-함유 아미노산은 알킬 아지드(2-아미노-6-아지도-1-헥산산을 포함하나 이에 제한되지 않음) 또는 아릴 아지드(p-아지도-페닐알라닌을 포함하나 이에 제한되지 않음)일 수 있다.
아릴 에스테르 및 포스핀 부분을 함유하는 예시적 수용성 중합체는 하기와 같이 표시될 수 있다:
Figure 112007093262665-PCT00007
(식 중에서, X는 O, N, S이거나 존재하지 않을 수 있고, Ph는 페닐이며, W는 수용성 중합체이고, R은 H, 알킬, 아릴, 치환 알킬 및 치환 아릴기일 수 있음). 예시적 R 기에는 -CH2, -C(CH3)3, -OR', -NR'R", -SR', -할로겐, -C(O)R', -CONR'R", -S(O)2R', -S(O)2NR'R", -CN 및 -NO2가 포함되나 이들에 제한되지 않는다. R', R", R"' 및 R""는 각기 독립적으로 수소, 치환 또는 비치환 헤테로알킬, 1 내지 3개 할로겐으로 치환된 아릴을 포함하나 이에 제한되지 않는 치환 또는 비치환 아릴, 치환 또는 비치환 알킬, 알콕시 또는 티오알콕시기, 또는 아릴알킬기를 가리킨다. 예를 들어, 본 발명의 화합물이 1개 초과의 R 기를 포함할 때, 예를 들어 각각의 R 기는, 각각의 R', R", R'" 및 R"" 기가 1개 초과가 존재할 때의 그것들과 같이 독립적으로 선택된다. R' 및 R"기가 동일한 질소 원자에 결합하는 경우, 그것은 질소 원자와 함께 조합되어, 5-, 6- 또는 7-원 환을 형성할 수 있다. 예를 들어, -NR'R"는 1-피롤리디닐 및 4-모르폴리닐을 포함하나 이에 제한되지 않음을 의미한다. 치환기에 대한 상기 논의로부터, 당업자는 용어 "알킬"이 수소 이외의 기에 결합된 탄소 원자를 포함하는 기, 예컨대 할로알킬(-CF3 및 -CH2CF3을 포함하나 이에 제한되지 않음) 및 아실(-C(O)CH3, -C(O)CF3, -C(O)CH2OCH3 등을 포함하나 이에 제한되지 않음)를 포함하는 것을 의미함을 이해할 것이다.
아지드 작용기는 또한 티오 에스테르를 함유하는 수용성 중합체와 선택적으로 반응하고, 아릴 포스핀 부분으로 적절히 작용화되어, 아미드 연결기를 발생시킬 수 있다. 아릴 포스핀기는 아지드를 인시츄 환원시키고, 이어서 수득된 아민은 티오에스테르 연결기와 효율적으로 반응하여, 상응하는 아미드를 발생시킨다. 티오에스테르 및 포스핀 부분을 함유하는 예시적 수용성 중합체는 하기와 같이 표시될 수 있다:
Figure 112007093262665-PCT00008
(식 중에서, n은 1 내지 10이고; X는 O, N, S이거나 존재하지 않을 수 있으며, Ph는 페닐이고, W는 수용성 중합체임).
예시적 알킨-함유 아미노산은 하기와 같이 표시될 수 있다:
Figure 112007093262665-PCT00009
(식 중에서, n은 0 내지 10이고; R1은 알킬, 아릴, 치환 알킬, 또는 치환 아릴이거나 존재하지 않으며; X은 O, N, S이거나 존재하지 않고; m은 0 내지 10이며, R2는 H, 아미노산, 폴리펩티드 또는 아미노 말단 변형기이고, R3은 H, 아미노산, 폴리펩티드 또는 카르복시 말단 변형기임). 일부 실시양태들에서, n은 1이고, R1은 페닐이며, X는 존재하지 않고, m은 0이며, 아세틸렌 부분은 알킬 측쇄에 대해 파라 위치에 위치한다. 일부 실시양태들에서, n은 1이고, R1은 페닐이며, X는 0이고, m은 1이고, 프로파르길옥시기는 알킬 측쇄에 대해 파라 위치에 위치한다(즉, O-프로파르길-티로신). 일부 실시양태들에서, n은 1이고, R1 및 X는 존재하지 않으며, m은 0이다(즉, 프로파르길글리신).
알킨-함유 아미노산은 시중 입수가능하다. 예를 들어, 프로파르길글리신은 펩테크(미국 메사츄세츠주 버링톤 소재)로부터 시중 입수가능하다. 대안적으로, 알킨-함유 아미노산은 표준 방법에 따라 제조될 수 있다. 예를 들어, p-프로파르길옥시페닐알라닌은 예를 들어 [Deiters, A. 등, J. Am . Chem . Soc . 125:11782-11783(2003)]에 기재된 바대로 합성될 수 있고, 4-알키닐-L-페닐알라닌은 [Kayser, B. 등, Tetrahedron 53(7):2475-2484(1997)]에 기재된 바대로 합성될 수 있다. 기타 알킨-함유 아미노산은 당업자에 의해 제조될 수 있다.
예시적 아지드-함유 아미노산 하기와 같이 표시될 수 있다:
Figure 112007093262665-PCT00010
(식 중에서, n은 0 내지 10이고; R1은 알킬, 아릴, 치환 알킬, 치환 아릴이거나 존재하지 않으며; X은 O, N, S이거나 존재하지 않고; m은 0 내지 10이며; R2는 H, 아미노산, 폴리펩티드 또는 아미노 말단 변형기이고, R3은 H, 아미노산, 폴리펩티드 또는 카르복시 말단 변형기임). 일부 실시양태들에서, n은 1이고, R1은 페닐이며, X는 존재하지 않고, m은 0이며, 아지드 부분은 알킬 측쇄에 대해 파라 위치에 위치한다. 일부 실시양태들에서, n은 0 내지 4이고, R1 및 X는 존재하지 않으며, m=0이다. 일부 실시양태들에서, n은 1이고, R1은 페닐이며, X는 O이고, m은 2이며, β-아지도에톡시 부분은 알킬 측쇄에 대해 파라 위치에 위치한다.
아지드-함유 아미노산은 상업용 출처로부터 입수가능하다. 예를 들어, 4-아지도페닐알라닌은 켐-임펙스 인터내셔널 인코포레이티드(Chem-Impex International, Inc.)(미국 일리노이즈주 우드데일 소재)로부터 수득될 수 있다. 시중 입수가능하지 않은 아지드-함유 아미노산에 대해, 아지드기는 적당한 이탈기(할라이드, 메실레이트, 토실레이트를 포함하나 이에 제한되지 않음)의 치환, 또는 적당히 보호된 락톤의 개방(opening)을 통해(단, 이에 제한되지 않음), 당업자에게 공지된 표준 방법을 이용하여 비교적 용이하게 제조될 수 있다. 이에 대해 예컨대, [Advanced Organic Chemistry, March(제3판, 1985, Wiley and Sons, New York)]을 참고한다.
E. 아미노티올 반응성 기
베타-치환 아미노티올 작용기의 특유의 반응성은 티아졸리딘의 형성을 통해, 그 반응성 기가 폴리펩티드, 및 알데히드기를 함유하는 기타 생물학적 분자의 선택적 변형에 매우 유용하도록 만든다. 이에 대해 예컨대, [J. Shao 및 J. Tam, J. Am . Chem . Soc . 1995, 117(14) 3893-3899]를 참고한다. 일부 실시양태들에서, 베타-치환 아미노티올 아미노산은 폴리펩티드에 도입된 후, 알데히드 작용기를 함유하는 수용성 중합체와 반응할 수 있다. 일부 실시양태들에서, 수용성 중합체, 약물 접합체 또는 기타 탑재체(payload)를 티아졸리딘의 형성을 통해 베타-치환 아미노티올 아미노산을 포함하는 폴리펩티드에 결합될 수 있다.
비천연적으로 코딩된 아미노산의 세포내 흡수
세포에 의한 비천연적으로 코딩된 아미노산 흡수는 단백질로의 도입을 위해(단, 이에 제한되지 않음) 비천연적으로 코딩된 아미노산을 설계하고 선택할 때 전형적으로 고려되는 한 관건이다. 예를 들어, α-아미노산의 고전하 밀도는 이 화합물이 세포 투과가 어려울 수 있음을 제시한다. 천연 아미노산은 단백질-기재 수송 시스템의 수집을 통해 세포로 흡수될 수 있다. 비천연적으로 코딩된 아미노산이 있는 경우, 그 아미노산이 세포에 의해 흡수되는지를 평가하는 급속 스크린이 행해질 수 있다. 예를 들어, [발명의 명칭: "단백질 어레이(Protein Arrays)", 출원일: 2003년 12월 22일의 특허출원, 일련 번호 10/744,899 및 일련 번호 60/435,821(출원일: 2002년 12월 22일); 및 Liu, D.R. & Schultz, P.G.(1999) Progress toward the evolution of an organism with an expanded genetic code . PNAS United States 96:4780-4785]에 나와 있는 독성 검정을 참고한다. 흡수가 각종 검정을 이용하여 용이하게 분석되나, 세포내 흡수 경로에 순응적인 비천연적으로 코딩된 아미노산을 설계하는 것의 대안법은, 생체내 아미노산을 생성시키는 생합성 경로를 제공하는 것이다.
비천연적으로 코딩된 아미노산의 생합성
많은 생합성 경로가 이미 아미노산 및 기타 화합물의 제조를 위해 세포 내에 존재한다. 특별한 비천연적으로 코딩된 아미노산을 위한 생합성 방법이 진핵생물 세포 내를 포함하나 이에 제한되지 않는 자연에 존재하지 않을 수 있으나, 본 발명은 그러한 방법을 제공한다. 예를 들어, 비천연적으로 코딩된 아미노산을 위한 생합성 경로는 새 효소를 첨가하거나, 현존 숙주 세포 경로를 변형시킴으로써 숙주 세포 내에 임의적으로 발생된다. 부가적 새 효소는 임의적으로 천연 발생 효소 또는 인공 진화된 효소이다. 예를 들어, p-아미노페닐알라닌의 생합성(발명의 명칭이 "비천연적으로 코딩된 아미노산의 생체내 도입(In vivo incorporation of non-naturally encoded amino acids)"의 WO 2002/085923에서 한 예로서 제시됨)은 다른 유기체로부터의 공지된 효소들의 조합을 첨가하는 것에 의존한다. 이 효소들을 위한 유전자는 유전자를 포함하는 플라스미드를 이용하여 세포를 형질변환시킴으로써 진핵생물 세포에 도입될 수 있다. 유전자는 세포 내에 발현될 때, 요망되는 화합물을 합성하기 위한 효소 경로를 제공한다. 임의적으로 첨가되는 효소의 유형의 예가 이하의 예들에서 제공된다. 부가적 효소 서열이 예를 들어, 유전자은행에 나와 있다. 인공 진화된 효소는 또한 동일한 방식으로 세포에 임의적으로 첨가된다. 이 방식으로, 세포내 기작 및 세포의 리소스를 조작하여, 비천연적으로 코딩된 아미노산을 생성시킨다.
생합성 경로에 사용하기 위한, 또는 현존 경로를 진화하기 위한 신규 효소를 생성시키기 위해 각종 방법들이 이용가능하다. 예를 들어, 맥시젠 인코포레이티드(Maxygen, Inc.)(웹사이트 maxygen. com에서 이용가능함)에 의해 개발된(단, 이에 제한되지 않음) 재귀적 재조합을 임의적으로 이용하여, 신규 효소 및 경로를 개발한다. 이에 대해 예컨대, [Stemmer(1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370(4):389-391; 및 Stemmer(1994), DNA shuffling by random fragmentation and reassembly : In vitro recombination for molecular evolution, Proc . Natl . Acad . Sci . USA ., 91:10747-10751]를 참고한다. 마찬가지로, 지넨코어(Genencor)(웹사이트 genencor.com에서 이용가능함)에 의해 개발된 디자인패쓰(DesignPath)TM를 임의적으로 이용하여, 세포 내 O-메틸-L-티로신을 생성시키기 위한 경로의 유전자 조작을 포함하나 이에 제한되지 않는 대사 경로로 유전자 조작한다. 이 기술은 기능적 유전체학, 및 분자 진화 및 설계를 통해 확인되는(단, 이에 제한되지 않음) 새 유전자들의 조합을 이용하는 숙주 유기체 내의 현존 경로를 재구축한다. 디벌사 코포레이션(Diversa Corporation)(웹사이트 diversa.com에서 이용가능함)은 또한 새 경로의 생성을 포함하나 이에 제한되지 않는 유전자의 라이브러리 및 유전자 경로의 급속 스크리닝 기술을 제공한다.
전형적으로, 본 발명의 유전자 조작된 생합성 경로를 이용하여 생성된 비천연적으로 코딩된 아미노산은, 천연 세포내 양을 포함하나 이에 제한되지 않는 효율적인 단백질 생합성을 위해 충분한 농도로, 다만 다른 아미노산의 농도에 영향을 주거나 세포 리소스를 소진하는 정도가 아닌 농도로 생성된다. 이러한 식으로 생체내 생성되는 전형적 농도는 약 10 mM 내지 약 0.05 mM이다. 일단 세포가 특정 경로에 요망되는 효소를 생성시키기 위해 사용되는 유전자를 포함하는 플라스미드를 이용하여 형질전환되고, 비천연적으로 코딩된 아미노산이 생성되면, 생체내 선택을 임의적으로 사용하여, 리보솜내 단백질 합성 및 세포 성장 모두를 위한 비천연적으로 코딩된 아미노산의 생성을 더욱 최적화한다.
비천연적으로 코딩된 아미노산을 갖는 폴리펩티드
비천연적으로 코딩된 아미노산의 도입은 단백질 구조 및/또는 기능 변화의 조정, 크기, 산도, 친핵도, 수소 결합, 소수도, 프로테아제 표적 부위의 접근성, (단백질 어레이를 위한(단, 이에 제한되지 않음)) 부분에 대한 표적화의 변화 등을 포함하나 이에 제한되지 않는 각종 목적들을 위해 행해질 수 있다. 비천연적으로 코딩된 아미노산을 포함하는 단백질은 증진되거나 심지어 전적으로 새로운 촉매적 또는 생물물리학적 성질을 가질 수 있다. 예를 들어, 비천연적으로 코딩된 아미노산을 단백질에 포함시킴으로써, 하기 성질들이 임의적으로 변형된다: 독성, 생체분포, 구조적 성질, 분광 성질, 화학적 및/또는 광화학적 성질, 촉매 능력, 반감기(혈청 반감기를 포함하나 이에 제한되지 않음), 공유 또는 비공유적으로(단, 이에 제한되지 않음) 다른 분자와 반응하는 능력 등. 1개 이상의 비천연적으로 코딩된 아미노산을 포함하는 단백질이 포함된 조성물은, 신규 치료제, 진단제, 촉매 효소, 산업용 효소, 결합 단백질(항체를 포함하나 이에 제한되지 않음), 및 단백질 구조 및 기능의 연구를 위해(단, 이에 제한되지 않음) 유용하다. 이에 대해 예컨대, [Dougherty(2000) Non - naturally encoded Amino Acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4:645-652]를 참고한다.
본 발명의 한 측면에서, 조성물은 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 또는 10개 이상, 또는 그 이상 개수를 포함하나 이에 제한되지 않는 1개 이상의 비천연적으로 코딩된 아미노산을 갖는 1개 이상의 단백질을 포함한다. 비천연적으로 코딩된 아미노산은 동일하거나 상이할 수 있고, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개, 또는 그 이상 개수의 상이한 비천연적으로 코딩된 아미노산을 포함하는 단백질 내의 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개, 또는 그 이상 개수의 상이한 부위가 있을 수 있으나, 이를 포함하나 이에 제한되지 않는다. 또 다른 측면에서, 조성물은 단백질 내에 존재하는 특별한 아미노산의 1개 이상, 단 전부보다는 적은 아미노산이 비천연적으로 코딩된 아미노산으로 치환된 단백질을 포함한다. 1개 초과의 비천연적으로 코딩된 아미노산을 갖는 소정의 단백질의 경우, 비천연적으로 코딩된 아미노산은 동일하거나 상이할 수 있다(단백질은 2개 이상의 상이한 유형의 비천연적으로 코딩된 아미노산을 포함하거나, 동일한 비천연적으로 코딩된 아미노산 2개를 포함할 수 있으나, 이에 제한되지 않음). 2개 초과의 비천연적으로 코딩된 아미노산을 갖는 소정의 단백질의 경우, 비천연적으로 코딩된 아미노산은 동일하거나 상이하거나, 혹은 1개 이상의 상이한 비천연적으로 코딩된 아미노산을 갖는 동일 종류의 다수 비천연적으로 코딩된 아미노산의 조합물일 수 있다.
1개 이상의 비천연적으로 코딩된 아미노산을 갖는 관심 단백질 또는 폴리펩티드는 본 발명의 한 특징이다. 본 발명은 또한 본 발명의 조성물 및 방법을 이용하여 생성된 1개 이상의 비천연적으로 코딩된 아미노산을 갖는 폴리펩티드 또는 단백질을 포함한다. 부형제(약제학적으로 허용가능한 부형제를 포함하나 이에 제한되지 않는)도 또한 단백질에 존재할 수 있다.
특정 실시양태들에서, 단백질은 1개 이상의 비천연적으로 코딩된 아미노산 및 1개 이상의 번역후 변형을 포함한다. 예를 들어, 번역후 변형에는 아세틸화, 아실화, 지질-변형, 팔미토일화, 팔미테이트 부가, 포스포릴화, 당지질-연결기 변형, 글리코실화 등이 포함되나, 이에 제한되지 않는다. 한 측면에서, 번역후 변형에는 GlcNAC-아스파라긴 연결기에 의한 이당류의 아스파라긴에의 결합((GlcNAc-Man)2-Man-GlcNAC-GlcNAc)를 포함하나 이에 제한되지 않음)이 포함된다. 진핵생물 단백질의 N-연결 이당류의 몇가지 예를 열거하고 있는 표 1을 참고한다(부가적 잔기가 또한 존재할 수 있으나, 이는 나와 있지 않음). 또 다른 측면에서, 번역후 변형에는 GalNAc-세린 또는 GalNAc-트레오닌 연결기 또는 GlcNAc-세린 또는 GlcNAC-트레오닌 연결기에 의한 이당류의 세린 또는 트레오닌에의 결합(Gal-GalNAc, Gal-GlcNAc 등을 포함하나 이에 제한되지 않음)이 포함된다.
GlcNac - 연결기를 통한 이당류의 예
Figure 112007093262665-PCT00011
또 다른 측면에서, 번역후 변형에는 전구체(칼시토닌 전구체, 칼시토닌 유전자-관련 펩티드 전구체, 프리프로파라티로이드 호르몬, 프리프로인슐린, 프로인슐린, 프리프로-오피도멜라노코르틴, 프로오피도멜라노코르틴 등을 포함하나 이에 제한되지 않음)의 단백질분해 가공, 다중 서브유니트 단백질로의 어셈블리, 또는 거대분자 어셈블리, 세포내 또 다른 부위로의(세포소기관, 예컨대 소포체, 골지체, 핵, 리소좀, 퍼옥시좀, 미토콘드리아, 엽록체, 액포 등으로(단, 이에 제한되지 않음), 또는 분비 경로를 통해), 번역이 포함된다. 특정 실시양태들에서, 단백질은 분비 또는 국지화 서열, 에피토프 택, FLAG 택, 폴리히스티딘 택, GST 융합 등을 포함한다. 본원에 각기 참고로 인용되는 U.S 특허 No. 4,963,495 및 6,436,674는 폴리펩티드의 분비를 향상시키기 위해 설계된 구축물을 상세히 설명한다.
비천연적으로 코딩된 아미노산의 한 이점은, 그것이 부가적 분자를 부가하는데 사용될 수 있는 부가적 화학적 부분을 제공한다는 것이다. 이 변형들은 진핵생물 또는 비진핵생물 세포에서 생체내, 또는 시험관내 행해질 수 있다. 따라서, 특정 실시양태들에서, 번역후 변형은 비천연적으로 코딩된 아미노산을 통해 이루어진다. 예를 들어, 번역후 변형은 친핵성-친전자성 반응을 통해 이루어질 수 있다. 단백질의 선택적 변형을 위해 현재 이용되는 대부분의 반응들은 α-할로케톤과 히스티딘 또는 시스테인 측쇄와의 반응을 포함하나 이에 제한되지 않는, 친핵성 및 친전자성 반응 상대 사이의 공유 결합 형성을 포함한다. 이들 경우에서의 선택도는 단백질 내의 친핵성 잔기의 수 및 접근성에 의해 구해진다. 본 발명의 단백질에서, 시험관내 및 생체내 비천연 케토-아미노산과 히드라지드 또는 아미노옥시 화합물의 반응과 같은 다른 더욱 선택적인 반응이 사용될 수 있다. 이에 대해 예컨대, [Comish 등(1996) J. Am . Chem . Soc ., 118:8150-8151; Mahal 등(1997) Science, 276:1125-1128; Wang 등(2001) Science 292:498-500; Chin 등(2002) J. Am . Chem . Soc . 124:9026-9027; Chin 등(2002) Proc. Natl . Acad . Sci ., 99:11020-11024; Wang 등(2003) Proc . Natl . Acad . Sci., 100:56-61; Zhang 등(2003) Biochemistry, 42:6735-6746; 및 Chin 등(2003) Science, 301:964-7]를 참고한다. 이는 형광발색단, 가교제, 당 유도체 및 세포독성 분자를 포함한 수 많은 시약들로 실질적으로 임의의 단백질을 선택적으로 표지할 수 있도록 한다. 또한 본원에 각기 참고로 인용되는, U.S. 특허 출원 일련 No. 10/686,944(발명의 명칭: "Glycoprotein synthesis", 2003년 10월 16일 출원)을 참고한다. 아지도 아미노산을 통한(단, 이에 제한되지 않음) 번역후 변형은 또한 (트리아릴포스핀 시약을 이용하여(단, 이에 제한되지 않음)) 스타우딘거 결찰을 통해 행해질 수 있다. 이에 대해 예컨대, [Kiick 등(2002) Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligation, PNAS 99:19-24]를 참고한다.
본 발명은 아지드 또는 알키닐 부분을 함유하는(단, 이에 제한되지 않음) 비천연적으로 코딩된 아미노산을 셀렉터 코돈에 대한 반응으로 단백질에 유전적으로 도입하는 것을 포함하는, 단백질의 선택적 변형을 위한 또 다른 매우 효율적인 방법을 제공한다. 이어서, 이 아미노산 측쇄들을, 각기 알키닐 또는 아지드 유도체를 이용하여(단, 이에 제한되지 않음), 휘스겐 [3+2] 시클로부가 반응에 의해(단, 이에 제한되지 않음) 변형시킬 수 있다(예컨대, [Padwa, A. Comprehensive Organic Synthesis , 제4권(1991) 편저: Trost, B. M., Pergamon, Oxford, p. 1069-1109; 및 Huisgen, R. 1,3- Dipolar Cycloaddition Chemistry(1984) Ed. Padwa, A., Wiley, New York, p. 1-17)]를 참고한다). 이 방법은 친핵성 치환보다는 시클로부가를 포함하기 때문에, 단백질은 극히 높은 선택도로 변형될 수 있다. 이 반응은, 촉매량의 Cu(I) 염을 반응 혼합물에 첨가함으로써, 우수한 위치선택도(1,4>1,5)로 수성 조건 하에서 실온에서 수행될 수 있다. 이에 대해 예컨대, [Tornoe 등(2002) J. Org. Chem. 67:3057-3064; 및 Rostovtsev 등(2002) Angew . Chem . Int . Ed . 41:2596-2599]를 참고한다. 사용될 수 있는 또 다른 방법은 테트라시스테인 모티프를 갖는 비스-비소형 화합물에서의 리간드 교환이며, 이에 대해 예컨대, [Griffin 등(1998) Science 281:269-272]를 참고한다.
본 발명의 단백질에 첨가될 수 있는 분자에는 염료, 형광발색단, 가교제, 당 유도체, 중합체(폴리에틸렌 글리콜의 유도체를 포함하나 이에 제한되지 않음), 광가교제, 세포독성 화합물, 친화성 표지, 비오틴의 유도체, 수지, 비이드, 제2 단백질 또는 폴리펩티드(또는 그 이상), 폴리뉴클레오티드(들)(DNA, RNA 등을 포함하나 이에 제한되지 않음), 금속 킬레이터, 보조인자, 지방산, 탄수화물 등이 포함되나, 이에 제한되지 않는다. 이 분자들은 p-프로파르길옥시페닐알라닌을 포함하나 이에 제한되지 않는 알키닐기, 또는 p-아지도-페닐알라닌을 포함하나 이에 제한되지 않는 아지도기를 갖는 비천연적으로 코딩된 아미노산에 각기 부가될 수 있다.
본 발명의 폴리펩티드는 변형된 tRNA 및 tRNA 합성효소를 이용하여 생체내 슈도모나스 숙주 세포에 의해 발생되어, 천연 발생 시스템에서 코딩되지 않는 아미노산에 부가되거나 그 아미노산을 치환할 수 있다.
천연 발생 시스템에서 코딩되지 않는 아미노산을 사용하는 tRNA 및 tRNA 합성효소의 발생 방법이 예컨대, 본원에 각기 참고로 인용되는, [U.S. 특허 출원 공보 2003/0082575(일련 No. 10/126,927) 및 2003/0108885(일련 No. 10/126,931)]에 기재되어 있다. 이 방법들은 슈도모나스 번역 시스템에 대해 내인성인 tRNA 및 합성효소와 무관하게 기능하는 번역 기작을 발생시키는 것(이에 따라, 이는 경우에 따라 "오르소고날"으로 칭해진다)을 포함한다. 전형적으로, 슈도모나스 번역 시스템은 오르소고날 tRNA(O-tRNA) 및 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 포함한다. 전형적으로, O-RS는 우선적으로 O-tRNA를 슈도모나스 번역 시스템 내 1개 이상의 비천연 발생 아미노산으로 아미노아실화하고, O-tRNA는 시스템 내 다른 tRNA에 의해 인식되지 않는 1개 이상의 셀렉터 코돈을 인식한다. 이에 따라, 슈도모나스 번역 시스템은 코딩된 셀렉터 코돈에 대한 반응으로 시스템 내 생성된 단백질에 비천연적으로 코딩된 아미노산을 삽입함으로써, 아미노산을 코딩된 폴리펩티드 내의 위치로 "치환"시킨다.
특별한 합성 아미노산을 폴리펩티드에 삽입하기 위한 매우 다양한 오르소고날 tRNA 및 아미노아실 tRNA 합성효소가 당업계에 기재되었고, 이는 일반적으로 본 발명에 사용하기에 적당하다. 예를 들어, 케토-특이적 O-tRNA/아미노아실-tRNA 합성효소가 [Wang, L. 등, Proc . Natl . Acad . Sci . USA 100:56-61(2003) 및 Zhang, Z. 등, Biochem . 42(22):6735-6746(2003)]에 기재되어 있다. 예시적 O-RS, 또는 이의 부분은 폴리뉴클레오티드 서열에 의해 코딩되며, 이는 본원에 각기 참고로 인용되는, U.S. 특허 출원 공보 2003/0082575 및 2003/0108885에 개시된 아미노산 서열을 포함한다. O-RS와 함께 사용하기 위한 상응하는 O-tRNA 분자가 또한 본원에 각기 참고로 인용되는, U.S. 특허 출원 공보 2003/0082575(일련 No. 10/126,927) 및 2003/0108885(일련 No. 10/126,931)에 기재되어 있다.
아지드-특이적 O-tRNA/아미노아실-tRNA 합성효소 시스템의 한 예가 [Chin, J. W. 등, J. Am . Chem . Soc . 124:9026-9027(2002)]에 기재되어 있다. p-아지도-L-Phe을 위한 예시적 O-RS 서열에는, 본원에 참고로 인용되는 U.S. 특허 출원 공보 2003/0108885(일련 No. 10/126,931)에 개시된 바와 같은 뉴클레오티드 서열인 서열 번호 14-16 및 29-32, 및 아미노산 서열인 서열 번호 46-48 및 61-64가 포함되나 이들에 제한되지 않는다. 본 발명에 사용하기에 적당한 예시적 O-tRNA 서열에는 본원에 참고로 인용되는 U.S. 특허 출원 공보 2003/0108885(일련 No. 10/126,931)에 개시된 뉴클레오티드 서열인 서열 번호 1-3가 포함되나 이들에 제한되지 않는다. 특별한 비천연적으로 코딩된 아미노산에 특이적인 O-tRNA/아미노아실-tRNA 합성효소 쌍의 다른 예가 본원에 참고로 인용되는 U.S. 특허 출원 공보 2003/0082575(일련 No. 10/126,927)에 기재되어 있다. S. 세레비지아에(S. cerevisiae ) 내에 케토- 및 아지드-함유 아미노산이 모두 도입된 O-RS 및 O-tRNA가 [Chin, J. W. 등, Science 301:964-967(2003)]에 기재되어 있다.
O-tRNA/아미노아실-tRNA 합성효소의 사용은 비천연적으로 코딩된 아미노산을 코딩하는 특정 코돈을 선택하는 것을 포함한다. 임의의 코돈이 사용될 수 있으나, 일반적으로 O-tRNA/아미노아실-tRNA 합성효소가 발현되는 세포에 거의 사용되지 않거나 절대 사용되지 않는 코돈을 선택하는 것이 바람직하다. 예를 들어, 예시적 코돈에는 넌센스 코돈, 예컨대 중지 코돈(앰버, 오커 및 오팔), 4개 이상의 염기 코돈, 및 거의 사용되지 않거나 결코 사용되지 않는 기타 천연 3-염기 코돈이 포함된다.
특정 셀렉터 코돈(들)은 당업계에 공지된 변이유발 방법(부위-특이적 변이유발, 카세트 변이유발, 제한 선택 변이유발 등을 포함하나 이에 제한되지 않음)을 이용하여 폴리뉴클레오티드 코딩 서열 내의 적당한 위치에 도입될 수 있다.
비천연적으로 코딩된 아미노산을 도입시키는데 사용될 수 있는, 단백질 생합성 기작의 성분, 예컨대 O-RS, O-tRNA 및 오르소고날 O-tRNA/O-RS 쌍을 발생시키는 방법이 [Wang, L. 등, Science 292:498-500(2001); Chin, J. W. 등, J. Am . Chem . Soc . 124:9026-9027(2002); Zhang, Z. 등, Biochemistry 42:6735-6746(2003)]에 기재되어 있다. 비천연적으로 코딩된 아미노산의 생체내 도입을 위한 방법 및 조성물이 본원에 참고로 인용되는 U.S. 특허 출원 공보 2003/0082575(일련 No. 10/126,927)에 기재되어 있다. 유기체의 생체내 슈도모나스 번역 시스템에 사용하기 위한 오르소고날 tRNA-tRNA 합성효소 쌍을 선택하는 방법이 또한 본원에 참고로 인용되는 U.S. 특허 출원 공보 2003/0082575(일련 No. 10/126,927) 및 2003/0108885(일련 No. 10/126,931)에 기재되어 있다.
1개 이상의 재조합 오르소고날 아미노아실-tRNA 합성효소(O-RS)를 생성시키는 방법은 (a) 원핵생물 유기체, 예컨대 메타노코커스 자나쉬이( Methanococcus jannaschii ), 메타노박테리움 써모오토트로피쿰( Methanobacterium thermoautotrophicum ), 할로박테리움 ( Halobacterium), 에스케리치아 콜라이 , A. 풀기더스 (A. fulgidus ), P. 푸리오서스 (P. furiosus ), P. 호리코쉬이(P. horikoshii ), A. 퍼닉스 (A. pernix ), T. 써모필러스(T. thermophilus) 등을 포함하나 이에 제한되지 않는 제1 유기체로부터의 1개 이상의 아미노아실-tRNA 합성효소(RS)에서 유래된 (임의 변이체인) RS의 라이브러리를 발생시키고(시키거나); (b) 비천연적으로 코딩된 아미노산 및 천연 아미노산의 존재 하에 오르소고날 tRNA(O-tRNA)를 아미노아실화하는 구성원에 대한 RS(임의적으로는 변이체 RS)의 라이브러리의 선택(및/또는 스크리닝)함으로써 활성 (임의적으로 변이체인) RS의 풀을 제공하고(하거나); (c) 비천연적으로 코딩된 아미노산의 부재 하에 O-tRNA를 우선적으로 아미노아실화하는 활성 RS(변이체 RS를 포함하나 이에 제한되지 않음)에 대한 풀을 선택(임의적으로는 음성 선택을 통해)함으로써, 1개 이상의 재조합 O-RS를 제공하는 것(여기에서, 1개 이상의 재조합 O-RS는 O-tRNA를 비천연적으로 코딩된 아미노산으로 우선적으로 아미노아실화함)을 포함한다.
한 실시양태에서, RS는 불활성 RS이다. 불활성 RS는 활성 RS를 변이유발함으로써 발생될 수 있다. 예를 들어, 불활성 RS는 약 1개 이상, 약 2개 이상, 약 3개 이상, 약 4개 이상, 약 5개 이상, 약 6개 이상 또는 약 10개 이상, 또는 그 이상 개수의 아미노산을 알라닌을 포함하나 이에 제한되지 않는 다른 아미노산으로 변이유발함으로써 발생될 수 있다.
변이체 RS의 라이브러리는 단백질 3차원 RS 구조에 기초한 합리적 설계, 또는 무작위 또는 합리적 설계 기법에서의 RS 뉴클레오티드의 변이유발을 포함하나 이에 제한되지 않는, 당업계에 공지된 각종 기법들을 이용하여 발생될 수 있다. 예를 들어, 변이체 RS는 부위-특이적 변이, 무작위 변이, 다양성 발생 재조합 변이, 키메라 구성체, 합리적 설계에 의해, 또한 본원에 기재되거나 당업계에 공지된 다른 방법에 의해 발생될 수 있다.
한 실시양태에서, 비천연적으로 코딩된 아미노산 및 천연 아미노산의 존재 하에 오르소고날 tRNA(O-tRNA)를 아미노아실화하는(단, 이에 제한되지 않음) 활성인 구성원에 대한 RS(임의적으로는 변이체 RS)의 라이브러리의 선택 (및/또는 스크리닝)은, 항생제 내성 유전자 등을 포함하나 이에 제한되지 않는 양성 선택 또는 스크리닝 마커, 및 (임의적으로 변이체인) RS의 라이브러리를 복수개의 세포에 도입하고(여기에서, 양성 선택 및/또는 스크리닝 마커는, 앰버, 오커 또는 오팔 코돈을 포함하나 이에 제한되지 않는 1개 이상의 셀렉터 코돈을 포함함); 선택제의 존재 하에 복수개의 세포를 성장시키며; 양성 선택 또는 스크리닝 마커의 존재 하에 1개 이상의 셀렉터 코돈을 억제함으로써 선택 및/또는 스크리닝제의 존재 하에 생존하는 (또는 특정 반응을 나타내는) 세포를 동정하고, 이로써 활성 (임의 변이체인) RS의 풀을 갖는 양성 선택 세포의 서브세트를 제공하는 것을 포함한다. 임의로 선택 및/또는 스크리닝제 농도를 변화시킬 수 있다.
한 측면에서, 양성 선택 마커는 클로르암페니콜 아세틸트랜스퍼라제(CAT) 유전자이고, 셀렉터 코돈은 CAT 유전자 내의 앰버 중지 코돈이다. 임의적으로, 양성 선택 마커는 β-락타마제 유전자이고, 셀렉터 코돈은 β-락타마제 유전자 내의 앰버 중지 코돈이다. 또 다른 측면에서, 양성 스크리닝 마커는 형광 또는 발광 스크리닝 마커, 또는 친화도 기재 스크리닝 마커(세포 표면 마커를 포함하나 이에 제한되지 않음)이다.
한 실시양태에서, 비천연적으로 코딩된 아미노산의 부재 하에 O-tRNA를 우선적으로 아미노아실화하는 활성 RS(임의적으로 변이체)에 대한 풀을 음성적으로 선택 또는 스크리닝하는 것은, 양성 선택 또는 스크리닝으로부터의 활성 (임의적으로 변이체인) RS의 풀을 갖는 음성 선택 또는 스크리닝 마커를 제2 유기체의 복수개의 세포에 도입하고(여기에서, 음성 선택 또는 스크리닝 마커는 1개 이상의 셀렉터 코돈(클로르암페니콜 아세틸트랜스퍼라제(CAT) 유전자를 포함하나 이에 제한되지 않는 항생제 내성 유전자를 포함하나 이에 제한되지 않음)을 포함함); 비천연적으로 코딩된 아미노산 및 스크리닝 또는 선택제로 보충된 제1 배지에서의 특정 스크리닝 반응을 나타내거나 생존하나, 비천연적으로 코딩된 아미노산 및 선택 또는 스크리닝제로 보충되지 않은 제2 배지에서 특정 반응을 나타내거나 생존하지 못하는 세포를 동정함으로써, 생존 세포 또는 스크리닝된 세포에 1개 이상의 재조합 O-RS를 제공하는 것을 포함한다. 예를 들어, CAT 동정 프로토콜은 임의적으로 적절한 O-RS 재조합을 결정함에 있어 양성 선택 및/또는 음성 스크리닝으로서 작용한다. 예를 들어, 클론의 풀은 임의적으로 1개 이상의 비천연적으로 코딩된 아미노산이 있거나 없는 (1개 이상의 셀렉터 코돈을 포함하는) CAT 함유 성장판에서 복제된다. 이에 따라, 비천연적으로 코딩된 아미노산을 함유하는 판에서만 단지 성장하는 콜로니는 재조합 O-RS를 함유하는 것으로 간주된다. 한 측면에서, 선택 (및/또는 스크리닝) 제의 농도는 변화된다. 일부 측면들에서, 제1 및 제2 유기체는 상이하다. 따라서, 제1 및/또는 제2 유기체는 임의적으로 원핵생물, 진핵생물, 포유류, 에스케리치아 콜라이, 진균류, 효모, 고세균, 혐기세균, 식물, 곤충, 원생생물 등을 포함한다. 다른 실시양태들에서, 스크리닝 마커는 형광 또는 발광 스크리닝 마커, 또는 친화도 기재의 스크리닝 마커를 포함한다.
또 다른 실시양태에서, 활성 (임의 변이체인) RS를 위한 풀을 스크리닝 또는 선택하는 것(음으로 선택하는 것을 포함하나 이에 제한되지 않음)은, 양성 선택 단계 (b)로부터 활성 변이체 RS의 풀을 단리하고; 음성 선택 또는 스크리닝 마커[여기에서, 음성 선택 또는 스크리닝 마커는 1개 이상의 셀렉터 코돈(1개 이상의 셀렉터 코돈을 포함하는, 리보뉴클레아제 바나제 유전자를 포함하나 이에 제한되지 않는 독성 마커 유전자를 포함하나 이에 제한되지 않음)를 포함함], 및 활성 (임의적으로 변이체인) RS의 풀을 제2 유기체의 복수개의 세포에 도입하고; 비천연적으로 코딩된 아미노산으로 보충되지 않은 제1 배지에서의 특정 스크리닝 반응을 나타내거나 생존하나, 비천연적으로 코딩된 아미노산으로 보충된 제2 배지에서 특정 반응을 나타내거나 생존하지 못하는 세포를 동정함으로써, 생존 세포 또는 스크리닝된 세포에 1개 이상의 재조합 O-RS(여기에서, 1개 이상의 재조합 O-RS는 비천연적으로 코딩된 아미노산에 대해 특이적임)을 제공하는 것을 포함한다. 한 측면에서, 1개 이상의 셀렉터 코돈은 약 2개 이상의 셀렉터 코돈을 포함한다. 그러한 실시양태들은 임의적으로 1개 이상의 셀렉터 코돈이 2개 이상의 셀렉터 코돈을 포함하는 경우, 및 제1 및 제2 유기체가 상이한 경우(각 유기체는 임의적으로 비제한적 예로서 원핵생물, 진핵생물, 포유류, 에스케리치아 콜라이, 진균류, 효모, 고세균, 진정세균, 식물, 곤충, 원생생물 등임)를 포함할 수 있다. 또한, 일부 측면들은 음성 선택 마커가 (1개 이상의 셀렉터 코돈을 포함하는) 리보뉴클레아제 바나제 유전자를 포함하는 경우를 포함한다. 다른 측면들은 스크리닝 마커가 임의적으로 형광 또는 발광 스크리닝 마커 또는 친화도 기재의 스크리닝 마커를 포함하는 경우를 포함한다. 여기에서의 실시양태들에서, 스크리닝 및/또는 선택은 임의적으로 스크리닝 및/또는 선택 엄격성의 변화를 포함한다.
한 실시양태에서, 1개 이상의 재조합 오르소고날 아미노아실-tRNA 합성효소(O-RS)의 제조 방법은, (d) 1개 이상의 재조합 O-RS를 단리하고; (e) 1개 이상의 재조합 O-RS로부터 유래된 (임의적으로 변이된) O-RS의 제2 세트를 발생시키며; (f) 우선적으로 O-tRNA를 아미노아실화하는 능력을 가지는 변이된 O-RS가 수득될 때까지 단계 (b) 및 (c)를 반복하는 단계들을 추가로 포함할 수 있다. 임의적으로, 약 2회 이상(단, 이에 제한되지 않음)으로 단계 (d) 내지 (f)를 반복한다. 한 측면에서, 1개 이상의 재조합 O-RS로부터 유래된 변이된 O-RS의 제2 세트를, 무작위 변이유발, 부위-특이적 변이유발, 재조합 또는 이들의 조합법을 포함하나 이에 제한되지 않는 변이유발에 의해 발생시킬 수 있다.
상기 방법들에 있어 양성 선택/스크리닝 단계 (b), 음성 선택/스크리닝 단계 (c) 또는 양성 및 음성 선택/스크리닝 단계 (b) 및 (c) 모두를 포함하나 이에 제한되지 않는 선택/스크리닝 단계의 엄격성은 선택/스크리닝 엄격성을 변화시키는 것을 임의적으로 포함한다. 또 다른 실시양태에서, 양성 선택/스크리닝 단계 (b), 음성 선택/스크리닝 단계 (c), 또는 양성 및 음성 선택/스크리닝 단계 (b) 및 (c) 모두는 리포터의 사용을 포함하고, 여기에서 리포터는 형광-활성화된 세포 분류(FACS)에 의해 검출되거나, 리포터는 발광에 의해 검출된다. 임의적으로, 리포터는 세포 표면, 파지 디스플레이 등에서 표시되고, 비천연적으로 코딩된 아미노산 또는 유사체와 관련된 친화도 또는 촉매 활성에 기초하여 선택된다. 한 실시양태에서, 변이된 합성효소는 세포 표면, 파지 디스플레이 등에서 표시된다.
재조합 오르소고날 tRNA(O-tRNA)의 제조 방법은 (a) 제1 유기체로부터의 서프레서 tRNA를 포함하나 이에 제한되지 않는 1개 이상의 tRNA로부터 유래된 변이체 tRNA의 라이브러리를 발생시키고; (b) 제1 유기체로부터의 PS의 부재 하에 제2 유기체로부터의 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 (임의적으로 변이체인) tRNA에 대한 라이브러리를 선택(음의 선택을 포함하나 이에 제한되지 않음) 또는 스크리닝함으로써, (임의적으로 변이체인) tRNA의 풀을 제공하며; (c) 도입된 오르소고날 RS(O-RS)에 의해 아미노아실화되는 구성원에 대한 (임의적으로 변이체인) tRNA의 풀을 선택 또는 스크리닝함으로써, 1개 이상의 재조합 O-tRNA를 제공하는 것(여기에서, 1개 이상의 재조합 O-tRNA는 셀렉터 코돈을 인식하고, 제2 유기체로부터의 RS에 의해 효율적으로 인식되지 않고, O-RS에 의해 우선적으로 아미노아실화됨)을 포함한다. 일부 실시양태들에서, 1개 이상의 tRNA는 서프레서 tRNA이고/이거나, 천연 및/또는 비천연 염기의 특유의 3개 염기 코돈을 포함하거나, 넌센스 코돈, 희소 코돈, 비천연 코돈, 4개 이상의 염기를 포함하는 코돈, 앰버 코돈, 오커 코돈 또는 오팔 중지 코돈이다. 한 실시양태에서, 재조합 O-tRNA는 오르소고날성의 향상을 가진다. 일부 실시양태들에서, O-tRNA가 임의적으로 변형의 필요 없이 제2 유기체에서 제1 유기체로 이송되어짐이 인지될 것이다. 각종 실시양태들에서, 제1 및 제2 유기체는 동일하거나 상이하고, 원핵생물(메타노코커스 자나쉬이 , 메타노박테리움 써모오토트로피쿰 , 에스케리치아 콜라이 , 할로박테리움 등을 포함하나 이에 제한되지 않음), 진핵생물, 포유류, 진균류, 효모, 고세균, 진정세균, 식물, 곤충, 원생생물으로부터(단, 이에 제한되지 않음) 임의적으로 선택된다. 부가적으로, 재조합 tRNA는 임의적으로 비천연적으로 코딩된 아미노산에 의해 아미노아실화되고, 여기에서 비천연적으로 코딩된 아미노산은 천연적으로 또는 유전 조작을 통해 생체내 생합성된다. 비천연적으로 코딩된 아미노산은 임의적으로 적어도 제1 또는 제2 유기체를 위한 성장 배지에 첨가된다.
한 측면에서, 아미노아실-tRNA 합성효소에 의해 아미노아실화되는 (임의적으로 변이체인) tRNA에 대한 라이브러리를 선택(음의 선택을 포함하나 이에 제한되지 않음)하거나 스크리닝하는 것(단계 (b))은, 독성 마커 유전자(여기에서, 독성 마커 유전자는 셀렉터 코돈 (또는 독성 또는 정적 제제의 생산을 초래하는 유전자 또는 유기체에 필수적인 유전자를 포함함)(여기에서, 상기 마커 유전자는 1개 이상의 셀렉터 코돈을 포함함), 및 (임의적으로 변이체인) tRNA의 라이브러리를 제2 유기체로부터의 복수개의 세포에 도입하고; 생존 세포를 선택하는 것(여기에서, 생존 세포는 1개 이상의 오르소고날 tRNA 또는 비기능적 tRNA를 포함하는 (임의적으로 변이체인) tRNA의 풀을 함유함)을 포함한다. 예를 들어, 생존 세포는 비교 비율 세포 밀도 검정을 이용함으로써 선택될 수 있다.
또 다른 측면에서, 독성 마커 유전자는 2개 이상의 셀렉터 코돈을 포함할 수 있다. 방법의 또 다른 실시양태에서, 독성 마커 유전자는 리보뉴클레아제 바나제 유전자이고, 여기에서 리보뉴클레아제 바나제 유전자는 1개 이상의 앰버 코돈을 포함한다. 임의적으로, 리보뉴클레아제 바나제 유전자는 2개 이상의 앰버 코돈을 포함할 수 있다.
한 실시양태에서, 도입된 오르소고날 RS(O-RS)에 의해 아미노아실화되는 구성원에 대한 (임의적으로 변이체인) tRNA의 풀을 선택 또는 스크리닝하는 것은, 양성 선택 또는 스크리닝 마커 유전자(여기에서, 양성 마커 유전자는 약물 내성 유전자(1개 이상의 셀렉터 코돈, 예컨대 1개 이상의 앰버 중지 코돈을 포함하는 β-락타마제 유전자를 포함하나 이에 제한되지 않음) 또는 유기체에 필수적인 유전자 또는 독성제의 탈독성화를 초래하는 유전자를, O-RS와 함께 포함함), 및 (임의적으로 변이체인) tRNA의 풀을 제2 유기체로부터의 복수개의 세포에 도입하고; 항생제를 포함하나 이에 제한되지 않는 선택 또는 스크리닝제의 존재 하에 성장하는 생존 또는 스크리닝된 세포를 동정함으로써, 1개 이상의 재조합 tRNA를 갖는 세포의 풀을 제공하는 것(여기에서, 1개 이상의 재조합 tRNA는 O-RS에 의해 아미노아실화되고, 아미노산을 1개 이상의 셀렉터 코돈에 대한 반응으로 양성 마커 유전자에 의해 코딩된 번역 생성물에 삽입함)을 포함할 수 있다. 또 다른 실시양태에서, 선택 및/또는 스크리닝제의 농도가 변화된다.
특정 O-tRNA/O-RS 쌍을 발생시키는 방법이 제공된다. 방법은 (a) 제1 유기체로부터 1개 이상의 tRNA로부터 유래된 변이체 tRNA의 라이브러리를 발생시키고; (b) 제1 유기체로부터의 RS의 부재 하에 제2 유기체로부터의 아미노아실-tRNA 합성효소(RS)에 의해 아미노아실화되는 (임의적으로 변이체인) tRNA에 대한 라이브러리를 음성 선택 또는 스크리닝함으로써, (임의적으로 변이체인) tRNA의 풀을 제공하며; (c) 도입된 오르소고날 RS(O-RS)에 의해 아미노아실화되는 구성원에 대한 (임의적으로 변이체인) tRNA의 풀을 선택 또는 스크리닝함으로써, 1개 이상의 재조합 O-tRNA를 제공하는 단계들을 포함한다. 하나 이상의 재조합 O-tRNA는 셀렉터 코돈을 인식하고, 제2 유기체로부터의 RS에 의해 효율적으로 인식되지 않고, O-RS에 의해 우선적으로 아미노아실화된다. 방법은 또한 (d) 제3 유기체로부터 1개 이상의 아미노아실-tRNA 합성효소(RS)로부터 유래된 (임의적으로 변이체인) rs의 라이브러리를 발생시키고; (e) 비천연적으로 코딩된 아미노산 및 천연 아미노산의 존재 하에 1개 이상의 재조합 O-tRNA을 우선적으로 아미노아실화하는 구성원에 대한 변이체 RS의 라이브러리를 선택 또는 스크리닝하며; (f) 비천연적으로 코딩된 아미노산의 부재 하에 하나 이상의 재조합 O-tRNA를 우세하게 아미노실화하는 활성 (임의적으로 변이체인) RS에 대한 풀을 음성 선택 또는 스크리닝함으로써, 1개 이상의 특정 O-tRNA/O-RS 쌍을 제공하는 것(여기에서, 1개 이상의 특정 O-tRNA/O-RS 쌍은 비천연적으로 코딩된 아미노산에 대해 특이적인 1개 이상의 재조합 O-RS 및 1개 이상의 재조합 O-tRNA를 포함함)을 포함한다. 방법에 의해 생성되는 특정 O-tRNA/O-RS 쌍이 포함된다. 예를 들어, 특정 O-tRNA/O-RS 쌍에는 mutRNATyr-mutTyrRS 쌍, 예컨대 mutRNATyr-SS12TyrRS 쌍, mutRNALeu-mutLeuRS 쌍, mutRNAThr-mutThrRS 쌍, mutRNAGlu-mutGluRS 쌍 등이 포함될 수 있으나, 이에 제한되지 않는다. 부가적으로, 상기 방법으로서 제1 유기체와 제3 유기체가 동일한(단, 메타노코커스 자나쉬이를 포함하나 이에 제한되지 않음) 방법을 포함한다.
제2 유기체의 생체내 번역 시스템에 사용하기 위한 오르소고날 tRNA-tRNA 합성효소 쌍을 선택하기 위한 방법이 본 발명에 포함된다. 방법은, 제1 유기체로부터 단리되거나 유도된 마커 유전자, tRNA 및 아미노아실-tRNA 합성효소(RS)를 제2 유기체로부터의 세포의 제1 세트에 도입하고; 마커 유전자 또는 tRNA를 제2 유기체로부터의 중복체 세포 세트에 도입하며; 중복체 세포 세트 내에 생존하지 못하는 제1 세트 내의 생존 세포에 대해 선택하거나, 중복체 세포 세트 내에서는 당해 반응을 나타내지 못하는 특정 스크리닝 반응을 나타내는 세포에 대해 스크리닝하는 것(여기에서, 제1 세트 및 중복체 세포 세트는 선택 또는 스크리닝제의 존재 하에 성장하고, 생존 또는 스크리닝된 세포는 제2 유기체의 생체내 번역 시스템에서 사용하기 위한 오르소고날 tRNA-tRNA 합성효소 쌍을 포함함)을 포함한다. 한 실시양태에서, 비교, 및 선택 또는 스크리닝은 생체내 상보 검정을 포함한다. 선택 또는 스크리닝제의 농도는 변화할 수 있다.
본 발명의 유기체는 각종 유기체 및 각종 조합을 포함한다. 예를 들어, 본 발명의 방법의 제1 및 제2 유기체는 동일하거나 상이할 수 있다. 한 실시양태에서, 유기체는 임의적으로 메타노코커스 자나쉬이 , 메타노박테리움 써모오토트로피쿰 , 할로박테리움 , 에스케리치아 콜라이 , A. 풀기더스 , P. 푸리오서스 , P. 호리코쉬이 , A. 퍼닉스 , T. 써모필러스 등을 포함하나 이에 제한되지 않는 원핵생물 유기체이다. 대안적으로, 유기체는 임의적으로 식물 (고등 식물, 예컨대 단자엽 또는 쌍자엽 식물을 포함하나 이에 제한되지 않음), 조류, 원생생물, 진균류 (효모 등을 포함하나 이에 제한되지 않음), 동물(곤충, 절지동물 등을 포함하나 이에 제한되지 않음) 등을 포함하나 이에 제한되지 않는 진핵생물 유기체를 포함한다. 또 다른 실시양태에서, 제2 유기체는 메타노코커스 자나쉬이 , 메타노박테리움 써모오토트로피쿰 , 할로박테리움 , 에스케리치아 콜라이 , A. 풀기더스 , 할로박테리움 , P. 푸리오서스 , P. 호리코쉬이 , A. 퍼닉스 , T. 써모필러스 등을 포함하나 이에 제한되지 않는 원핵생물 유기체이다. 대안적으로, 제2 유기체는 효모, 동물 세포, 식물 세포, 진균류, 포유동물의 세포 등을 포함하나 이에 제한되지 않는 진핵생물 유기체일 수 있다. 각종 실시양태들에서, 제1 및 제2 유기체는 상이하다.
매우 다양한 비천연적으로 코딩된 아미노산이 폴리펩티드의 소정의 위치에 대해 치환되거나, 그 위치에 도입될 수 있다. 일반적으로, 한 특별한 비천연적으로 코딩된 아미노산은, 적절한 경우 그것의 수용체 또는 결합 상대를 가지는 것을 포함하는 폴리펩티드의 3차원 결정 구조의 연구, 보존적 치환(즉, Phe, Tyr 또는 Trp에 대한 아릴계 비천연적으로 코딩된 아미노산, 예컨대 p-아세틸페닐알라닌 또는 O-프로파르길티로신 치환)에 대한 선호, 및 폴리펩티드로 도입하고자 하는 특정 접합 화학작용(예컨대, 알킨 부분을 갖는 수용성 중합체와의 휘스겐 [3+2] 시클로부가를 행하고자 하는 경우의 4-아지도페닐알라닌의 도입, 또는 아릴 에스테르를 가짐에 따라 포스핀 부분이 도입되어 있는 수용성 중합체를 이용한 아미드 결합 형성)에 기초하여, 도입을 위해 선택된다.
한 실시양태에서, 방법은 단백질에 비천연적으로 코딩된 아미노산을 도입시키고(여기에서, 비천연적으로 코딩된 아미노산은 제1 반응성 기를 포함함); 단백질을, 제2 반응성 기를 포함하는 분자(이를 표지, 염료, 중합체, 수용성 중합체, 폴리에틸렌 글리콜의 유도체, 광가교제, 세포독성 화합물, 약물, 친화성 표지, 광친화성 표지, 반응성 화합물, 수지, 제2 단백질 또는 폴리펩티드 또는 폴리펩티드 유사체, 항체 또는 항체 단편, 금속 킬레이터, 보조인자, 지방산, 탄수화물, 폴리뉴클레오티드, DNA, RNA, 안티센스 폴리뉴클레오티드, 억제성 리보핵산, 바이오물질, 나노입자, 스핀 표지, 형광발색단, 금속-함유 부분, 방사능 부분, 신규 작용기, 다른 분자와 공유 또는 비공유 상호작용하는 기, 광포집 부분, 광이성화가능한 부분, 비오틴, 비오틴의 유도체, 비오틴 유사체, 중원자가 도입된 부분, 화학적으로 절단가능한 기, 광절단가능한 기, 연신 측쇄, 탄소-연결 당, 산화환원 활성제, 아미노 티오산, 독성 부분, 동위원소 표지된 부분, 생물리학적 프로브, 인광성 기, 화학발광성 기, 전자 조밀 기, 자기성 기, 개재성 기, 발색단, 에너지 전달제, 생물학적 활성제, 검출가능한 표지, 소분자 또는 상기 것들의 임의의 조합물, 또는 임의의 기타 바람직한 화합물 또는 물질을 포함하나 이에 제한되지 않음)와 접촉시키는 것을 추가로 포함한다. 제1 반응성 기는 제2 반응성 기와 반응하여, [3+2] 시클로부가를 통해 분자를 비천연적으로 코딩된 아미노산에 결합시킨다. 한 실시양태에서, 제1 반응성 기는 알키닐 또는 아지도 부분이고, 제2 반응성 기는 아지도 또는 알키닐 부분이다. 예를 들어, 제1 반응성 기는 알키닐 부분(비천연적으로 코딩된 아미노산 p-프로파르길옥시페닐알라닌 내(단, 이에 제한되지 않음))이고, 제2 반응성 기는 아지도 부분이다. 또 다른 예에서, 제1 반응성 기는 아지도 부분(비천연적으로 코딩된 아미노산 p-아지도-L-페닐알라닌(단, 이에 제한되지 않음))이고, 제2 반응성 기는 알키닐 부분이다.
일부 경우들에서, 비천연적으로 코딩된 아미노산 치환(들)은 폴리펩티드 내의 다른 부가, 치환 또는 결실과 조합되어, 폴리펩티드의 다른 생물학적 성질에 영향을 주게 된다. 일부 경우들에서, 다른 부가, 치환 또는 결실은 폴리펩티드의 안정성(단백질 분해에 대한 내성을 포함하나 이에 제한되지 않음)을 증가시키거나, 그것의 수용체 또는 결합 상대에 대한 폴리펩티드 친화성을 증가시킬 수 있다. 일부 경우들에서, 다른 부가, 치환 또는 결실은 폴리펩티드의 (슈도모나스 숙주 세포 내 발현될 때의(단, 이에 제한되지 않음)) 용해도를 증가시킬 수 있다. 일부 실시양태들에서, 부가, 치환 또는 결실은 슈도모나스 재조합 숙주 세포에서의 발현 후, 폴리펩티드 용해도를 증가시킬 수 있다. 일부 실시양태들에서, 슈도모나스 재조합 숙주 세포에서의 발현 후, 폴리펩티드 용해도를 증가시키게 되는, 비천연 아미노산의 도입을 위한 또 다른 부위에 부가하여, 천연적으로 코딩된 아미노산 또는 비천연 아미노산으로 치환하기 위한 부위가 선택된다. 일부 실시양태들에서, 폴리펩티드는 폴리펩티드 수용체에 대한 친화도를 조절하거나, 수용체 이량체화를 조절(증가 또는 감소를 포함하나 이에 제한되지 않음)하거나, 수용체 이량체를 안정화하거나, 순환 반감기를 조절하거나, 방출 또는 생체유용성을 조절하거나, 정제를 용이하게 하거나, 특별한 투여 경로를 향상 또는 변경시키는 또 다른 부가, 치환 또는 결실을 포함한다. 마찬가지로, 폴리펩티드는 프로테아제 절단 서열, 반응성 기, 항체-결합 도메인(FLAG 또는 폴리-His를 포함하나 이에 제한되지 않음) 또는 기타 친화도 기재의 서열(FLAG, 폴리-His, GST 등을 포함하나 이에 제한되지 않음), 또는 검출(GFP를 포함하나 이에 제한되지 않음), 정제, 또는 폴리펩티드의 기타 성질을 향상시키기 위한 연결 분자(비오틴을 포함하나 이에 제한되지 않음)를 포함할 수 있다.
VII . 슈도모나스 종 및 이의 균주에서의 발현
클로닝된 폴리뉴클레오티드의 높은 수준의 발현을 수득하기 위해, 전형적으로 폴리펩티드를 코딩하는 폴리뉴클레오티드를, 전사를 지정하는 강한 프로모터, 전사/번역 종결자, 및 단백질을 코딩하는 핵산의 경우에는 번역 개시를 위한 리보솜 결합 부위를 함유하는 발현 벡터로 서브클로닝한다. 적당한 세균 프로모터가 당업계에 공지되어 있고, 예컨대 [Sambrook 등, 및 Ausubel 등]에 기재되어 있다.
본 발명의 폴리펩티드를 발현하기 위한 세균 발현 시스템은 슈도모나스 플루오레슨스, 슈도모나스 아에루기노사 , 슈도모나스 푸티다 , 슈도모나스 시린가에, 슈도모나스 디미누타 , 슈도모나스 올레오보란스, 및 기타 슈도모나스 종 및 이로부터 유래된 균주에서 이용가능하다. 본원에 기재된 바와 같이 O-tRNA/O-RS 쌍을 포함하는 슈도모나스 세포를 사용할 수 있다.
본 발명의 슈도모나스 숙주 세포는 배양 중 슈도모나스 세포로부터 큰 유용한 양으로 비천연 아미노산을 포함하는 단백질을 합성하는 능력을 제공한다. 한 측면에서, 조성물은 임의적으로 10 마이크로그램 이상, 50 마이크로그램 이상, 75 마이크로그램 이상, 100 마이크로그램 이상, 200 마이크로그램 이상, 250 마이크로그램 이상, 500 마이크로그램 이상, 1 밀리그램 이상, 10 밀리그램 이상, 100 밀리그램 이상, 1 그램 이상, 10 그램 이상, 50 그램 이상, 또는 그 이상(단, 이에 제한되지 않음)의, 비천연 아미노산 함유 단백질, 또는 생체내 단백질 생산 방법으로 대규모로 달성될 수 있는 킬로그램 규모의 양(재조합 단백질 생산 및 정제에 대한 상세 내용이 본원에 제공됨)을 포함한다. 또 다른 측면에서, 단백질은 임의적으로 조성물 내에, 예를 들어 세포 분해물, 완충액, 약제학적 완충액, 배지, 또는 기타 액체 현탁액에서, 리터 당 10 마이크로그램 이상의 단백질, 리터당 50 마이크로그램 이상의 단백질, 리터 당 75 마이크로그램 이상의 단백질, 리터 당 100 마이크로그램 이상, 리터 당 200 마이크로그램 이상의 단백질, 리터 당 250 마이크로그램 이상의 단백질, 리터 당 500 마이크로그램 이상의 단백질, 리터 당 1 밀리그램 이상의 단백질, 또는 리터 당 10 밀리그램 이상의 단백질, 리터 당 50 밀리그램 이상의 단백질, 리터 당 100 밀리그램 이상의 단백질, 리터 당 500 밀리그램 이상의 단백질, 리터 당 1000 밀리그램 이상의 단백질, 리터 당 1 그램 이상의 단백질, 리터 당 5 그램 이상의 단백질, 리터 당 10 그램 이상의 단백질, 또는 리터 당 20 그램 이상의 단백질, 그 이상(단, 이에 제한되지 않음)의 농도로 존재한다.
본 발명의 슈도모나스 숙주 세포는 비천연적으로 코딩된 아미노산을 큰 유용한 양으로 포함하는 단백질을 생합성하는 능력을 제공한다. 예를 들어, 비천연적으로 코딩된 아미노산을 포함하는 단백질은 세포 추출물, 세포분해물, 배지, 완충액 등에서, 10 μg/리터 이상, 50 μg/리터 이상, 75 μg/리터 이상, 100 μg/리터 이상, 200 μg/리터 이상, 250 μg/리터 이상, 500 μg/리터 이상, 1 mg/리터 이상, 2 mg/리터 이상, 3 mg/리터 이상, 4 mg/리터 이상, 5 mg/리터 이상, 6 mg/리터 이상, 7 mg/리터 이상, 8 mg/리터 이상, 9 mg/리터 이상, 10 mg/리터 이상, 적어도 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 mg/리터, 1 g/리터, 5 g/리터, 10 g/리터, 또는 그 이상(이를 포함하나 이에 제한되지 않음)의 단백질 농도로 생성될 수 있다.
세균 발현 기법이 당업계에 공지되어 있다. 매우 다양한 벡터들이 슈도모나스 숙주에서 사용하기 위해 이용가능하다. 벡터는 단일 복사체, 또는 저 또는 고 다중복사체 벡터일 수 있다. 벡터는 클로닝 및/또는 발현을 위해 작용할 수 있다. 벡터에 관한 충분한 문헌, 많은 벡터들의 시중 입수가능성, 및 심지어는 벡터 및 그것의 제한 맵 및 특성을 설명하는 매뉴얼이 있음을 볼 때, 심의 논의가 여기서 필요하지 않다. 공지되어 있는 바와 같이, 벡터는 정상적으로 선택을 허용하는 마커를 포함하고, 이 마커는 세포독성제 내성, 야생형 또는 면역을 제공할 수 있다. 빈번하게, 복수개의 마커가 존재하고, 이들은 상이한 특성들을 제공한다.
세균 프로모터는 세균 RNA 중합효소에 결합하여, 코딩 서열(예컨대, 구조 유전자)의 mRNA로의 하류(3') 전사를 개시할 수 있는 임의의 DNA 서열이다. 프로모터는 통상 코딩 서열의 5' 말단에 인접하게 위치하는 전사 개시 영역을 가질 것이다. 이 전사 개시 영역은 전형적으로 RNA 중합효소 결합 부위 및 전사 개시 부위를 포함한다. 세균 프로모터는 또한 RNA 합성이 시작되는 곳인 인접 RNA 중합효소 결합 부위와 중첩될 수 있는 오퍼레이터(operator)로 불리는 제2 도메인을 가질 것이다. 유전자 리프레서 단백질이 오퍼레이터에 결합함으로써 특정 유전자의 전사를 억제함에 따라, 오퍼레이터는 음성 제어 (유도성) 전사를 허용한다. 지속적 발현이 음성 제어 요소, 예컨대 오퍼레이터의 부재 하에 일어날 수 있다. 또한, 양성 제어는 존재하는 경우, 통상 RNA 중합효소 결합 서열에 대해 (5')에 인접하는 유전자 활성화제 단백질 결합 서열에 의해 달성될 수 있다. 유전자 활성화제 단백질의 한 예는 이화 생성물 활성화제 단백질(CAP)이고, 이는 에스케리치아 콜라이 내의 lac 오페론의 전사 개시를 돕는다[Raibaud 등, ANNU. REV. GENET.(1984) 18:173]. 그러므로 제어된 발현은 양성 또는 음성의 것일 수 있어, 전사를 증진 또는 감소시킬 수 있다.
대사 경로 효소를 코딩하는 서열은 특히 유용한 프로모터 서열을 제공한다. 예에는 갈락토스, 락토스(lac)[Chang 등, NATURE(1977) 198:1056] 및 말토스와 같은 당 대사작용 효소로부터 유래된 프로모터 서열이 포함된다. 부가적 예에는 트립토판(trp)과 같은 생합성 효소로부터 유래된 프로모터 서열[본원에 각기 참고로 인용되는, Goeddel 등, NUC. ACIDS RES.(1980) 8:4057; Yelverton 등, NUCL. ACIDS RE.(1981) 9:731; U.S. 특허 No. 4, 738,921; EP 공보 No. 036 776 및 121 775]가 포함된다. β-갈락토시다제(bla) 프로모터 시스템[Weissmann(1981) "The cloning of interferon and other mistakes" In Interferon 3(편저 I. Gresser)], 박테리오파지 람다 PL[본원에 각기 참고로 인용되는, Shimatake 등, NATURE(1981) 292:128] 및 T5 U.S. 특허 No. 4,689,406] 프로모터 시스템은 또한 유용한 프로모터 서열을 제공한다. 본 발명의 바람직한 방법은 강한 프로모터, 예컨대 높은 수준으로 hGH 폴리펩티드를 유도하는 T7 프로모터를 이용한다. 그러한 벡터의 예가 당업계에 공지되어 있고, 이에는 노바겐(Novagen)의 pET29 계열, 및 본원에 참고로 인용되는 WO 99/05297에 기재된 pPOP 벡터가 포함된다. 그러한 발현 시스템은 숙주 세포 생존력 또는 성장 파라미터와 타협하지 않고 숙주 내의 높은 수준의 폴리펩티드를 생성시킨다.
또한, 천연 발생되지 않는 합성 프로모터가 또한 세균 프로모터로 기능한다. 예를 들어, 하나의 세균 또는 박테리오파지 프로모터의 전사 활성화 서열이 또 다른 세균 또는 박테리오파지 프로모터의 오페론 서열과 결합되어, 합성 혼성체 프로모터를 발생시킬 수 있다[본원에 참고로 인용되는 U.S. 특허 No. 4,551,433]. 예를 들어, tac 프로모터는 lac 리프레서에 의해 제어되는 lac 오페론 서열 및 trp 프로모터 모두로 구성되는 혼성체 trp-lac 프로모터이다[Amann 등, GENE(1983) 25:167; de Boer 등, PROC. NATL. ACAD. SCI.(1983) 80:21]. 또한, 세균 프로모터에는 세균 RNA 중합효소에 결합하여 전사를 개시할 수 있는 능력을 가진 비세균 기원의 천연 발생 프로모터가 포함될 수 있다. 비세균 기원의 천연 발생 프로모터는 또한 상용적(compatible) RNA 중합효소에 결합하여, 원핵생물 내 일부 유전자의 높은 수준의 발현을 생성시킬 수 있다. 박테리오파지 T7 RNA 중합효소/프로모터 시스템은 결합된 프로모터 시스템의 한 예이다[Studier 등, J. MOL. BI0L.(1986) 189:113; Tabor 등, Proc. Natl. Acad. Sci.(1985) 82:1074]]. 또한, 혼성체 프로모터는 또한 박테리오파지 프로모터 및 E. 콜라이 오퍼레이터 영역으로 구성될 수 있다(EP 공개 No. 267 851).
기능하는 프로모터 서열에 부가하여, 효율적 리보솜 결합 부위가 또한 원핵생물 내 외래 유전자의 발현에 유용하다. 세균에서, 리보솜 결합 부위는 샤인-달가르노(Shine-Dalgarno)(SD) 서열로 불리고, 이에는 개시 코돈의 3-11 뉴클레오티드 상류에 위치하는 길이상 3-9 뉴클레오티드의 서열 및 개시 코돈(ATG)를 포함한다[Shine 등, NATURE(1975) 254:34]. SD 서열은 E. 콜라이 16S rRNA의 3' 말단과 SD 서열 사이의 염기 쌍형성에 의해 리보솜으로의 mRNA의 결합을 촉진하는 것으로 사료된다[Steitz 등, "Genetic signals and nucleotide sequences in messenger RNA", In Biological Regulation and Development: Gene Expression(편저 R. F. Goldberger, 1979)]. 약한 리보솜-결합 부위를 갖는 원핵생물 유전자 및 진핵생물 유전자를 발현함에 대해, [Sambrook 등, "Expression of cloned genes in Escherichia coli", Molecular Cloning: A Laboratory Manual, 1989]를 참고한다.
용어 "슈도모나스 숙주" 또는 "슈도모나스 숙주 세포"는 재조합 벡터 또는 기타 전달 DNA용 수령자로서 사용될 수 있거나 사용되었던 슈도모나스 종 또는 이로부터 유래된 균주를 가리킨다. 그 용어에는 트랙스펙션된 원래의 세균 숙주 세포의 후대가 포함된다. 단일 모 세포의 후대는 반드시 우발적 또는 고의적 변이로 인해, 원래의 모에 대해, 형태 또는 게놈 또는 총 DNA 상보에 있어 완전히 동일할 필요가 없는 것으로 이해된다. 관련 성질, 예컨대 폴리펩티드를 코딩하는 뉴클레오티드 서열의 존재를 특징으로 하는 모에 대해 충분히 유사한 모 세포의 후대가 이 정의에 의해 의도되는 후대에 포함된다.
폴리펩티드의 발현을 위한 적당한 슈도모나스 숙주 세포의 선택은 당업계의 숙련가에게 공지되어 있다. 발현을 위한 슈도모나스 숙주를 선택할 때, 적당한 숙주에는 특히 양호한 봉입체 형성, 낮은 단백질분해 활성, 및 전반적 강인도를 가지는 것으로 나타난 것들이 포함될 수 있다. 슈도모나스 숙주는 일반적으로 캘리포니아 대학 내 생체물리학 및 의료물리학 부의 세균 유전학 스톡 센터(미국 캘리포니아주 버클리 소재), 및 미국 미생물 보존 센터("ATCC")(미국 버지니아주 마나사스 소재)를 포함하나 이에 제한되지 않는 각종 출처들로부터 입수가능하다. 본 발명의 방법의 또 다른 실시양태에서, 숙주 세포 균주는 슈도모나스 플루오레슨스 , 슈도모나스 아에루기노사슈도모나스 푸디다를 포함하나 이에 제한되지 않는 슈도모나스의 종이다. 균주 MB101로 표시되는 슈도모나스 플루오레슨스 생물형 1은 단백질 생산을 위해 이용가능하다. 특정 슈도모나스 플루오레슨스 균주는 더 다우 케미칼 컴퍼니(The Dow Chemical Company)(미국 미시간주 미들랜드 소재, 웹사이트 dow.com에서 이용가능함)에 의해 숙주 균주로서 기재되어 있다. 본원에 각기 참고로 인용되는, U.S. 특허 No. 4,755,465 및 4,859,600는 폴리펩티드 생성을 위한 숙주 세포로서의 슈도모나스 균주를 용도를 기재하고 있다.
일단 슈도모나스 숙주 세포 균주가 확립되면(즉, 발현 구축물이 숙주 세포에 도입되고, 적절한 발현 구축물을 갖는 숙주 세포가 단리되면), 재조합 숙주 세포 균주가 폴리펩티드의 생성에 적절한 조건 하에서 배양된다. 당업자에게 자명한 바와 같이, 재조합 숙주 세포 균주의 배양 방법은 이용되는 발현 구축물의 성질 및 숙주 세포의 실체에 의존할 것이다. 재조합 숙주 균주는 정상적으로 당업계에 공지된 방법을 이용하여 배양된다. 재조합 숙주 세포는 전형적으로 탄소, 질소 및 무기 염의 동화성 원, 및 임의적으로는 비타민, 아미노산, 성장 인자, 및 당업계에 공지된 기타 단백질성 배양 보충물을 함유하는 액체 배지 내에서 배양된다. 숙주 세포의 배양을 위한 액체 배지는 임의적으로 바람직하지 않은 미생물의 성장을 방지하기 위한 항생제 또는 항진균제, 및/또는 발현 벡터를 함유하는 숙주 세포를 위해 선택하는 항생제를 포함하나 이에 제한되지 않는 화합물을 함유할 수 있다.
재조합 숙주 세포는, 세포를 수집하거나(폴리펩티드가 세포내 축적되는 경우), 또는 배치 또는 연속 형태로 배양 상등액을 수집하면서, 배치 또는 연속 형태로 배양될 수 있다. 원핵생물 숙주 세포 내에 생성시키기 위해서는, 배치 배양 및 세포 수집이 바람직하다.
재조합 폴리펩티드는 정상적으로 재조합 시스템에서 발현된 후 정제된다. 폴리펩티드는 당업계에 공지된 각종 방법들에 의해 숙주 세포로부터 정제될 수 있다. 경우에 따라, 슈도모나스 숙주 세포에서 생성된 폴리펩티드는 (봉입체의 형태로) 난용성 또는 불용성이다. 불용성 단백질의 경우, 단백질은 원심분리에 의해 숙주 세포의 분해물로부터 수집될 수 있고, 그 후 세포의 균질화가 이어질 수 있다. 난용성 단백질의 경우, 폴리에틸렌 이민(PEI)을 포함하나 이에 제한되지 않는 화합물을 첨가하여, 부분적으로 가용성인 단백질의 제조를 유도할 수 있다. 석출된 단백질은 이어서 원심분리에 의해 수집될 수 있다. 재조합 숙주 세포를 파열 또는 균질화시켜, 당업계의 숙련가에게 공지된 각종 방법들을 이용하여 세포 내에서 봉입체를 방출시킬 수 있다. 숙주 세포 파열 또는 균질화는 효소에 의한 세포 파열, 음파처리, 다운스 균질화, 또는 고압 방출 파열을 포함하나 이에 제한되지 않는 공지된 기법을 이용하여 수행될 수 있다. 본 발명의 방법의 한 실시양태에서, 고압 방출 기법을 사용하여, 슈도모나스 숙주 세포를 파열시켜, 폴리펩티드의 봉입체를 방출시킨다.
불용성이거나 석출된 폴리펩티드는 이어서 당업계에 공지되어 있는 수많은 적당한 가용화제를 이용하여 가용화될 수 있다. 바람직하게, 폴리펩티드는 우레아 또는 구아니딘 히드로클로라이드를 이용하여 가용화된다. 가용화된 폴리펩티드의 부피는, 편리하게 조작할 수 있는 배치 크기를 이용하여 큰 배치가 생성될 수 있도록 최소화되어야 한다. 이 인자는 재조합 숙주가 부피가 수천 리터인 배치에서 성장할 수 있게 하는 대규모 상업용 세팅에서 중요할 수 있다. 또한, 대규모 상업용 세팅에서 폴리펩티드를, 특히 인간 약제학적 용도에 대해, 제조할 때, 기작 및 용기 또는 단백질 산물 자체에 손상을 줄 수 있는 거친 화학물질을 가능한 한, 피해야 한다.
폴리펩티드가 융합 단백질로서 생성될 때, 융합 서열이 바람직하게 제거된다. 융합 서열의 제거는, 효소적 절단 또는 화학적 절단에 의해, 바람직하게는 효소적 절단에 의해 달성될 수 있다. 융합 서열의 효소적 제거는 당업자에게 공지된 방법을 이용하여 달성될 수 있다. 융합 서열의 제거를 위한 효소의 선택은 융합의 실체에 의해 결정될 것이고, 반응 조건은 당업자에게 명백한 바와 같이 효소의 선택에 의해 구체화될 것이다. 절단된 폴리펩티드는 바람직하게 공지된 방법에 의해 절단된 융합 서열로부터 정제된다. 그러한 방법은 당업자에게 명백한 바와 같이, 융합 서열 및 폴리펩티드의 실체 및 성질에 의해 결정될 것이다. 정제 방법에는 크기-배제 크로마토그래피, 소수성 상호작용 크로마토그래피, 이온 교환 크로마토그래피 또는 투석, 또는 이들의 임의의 조합이 포함되나 이들에 제한되지 않는다.
단백질 용액으로부터 DNA를 제거하기 위해, 폴리펩티드를 정제하는 것이 또한 바람직하다. DNA는 당업계에 공지된 임의의 적당한 방법, 예컨대 석출 또는 이온 교환 크로마토그래피에 의해 제거될 수 있으나, 바람직하게는 핵산 석출제, 예컨대 비제한적 예로서 프로타민 술페이트를 이용한 석출에 의해 제거된다. 폴리펩티드는 원심분리 또는 여과를 포함하나 이에 제한되지 않는 표준 공지 방법을 이용하여 석출된 DNA로부터 분리될 수 있다. 숙주 핵산 분자의 제거는 폴리펩티드가 인간을 치료하기 위해 사용되는 세팅에 있어 중요한 인자이고, 본 발명의 방법은 숙주 세포 DNA를 약제학적으로 허용가능한 수준으로 감소시킨다.
또한, 발효기, 진탕 플라스크, 유동층 바이오리액터, 중공 섬유 바이오리액터, 롤러 병 배양 시스템 및 교반 탱크 바이오리액터 시스템을 포함하나 이에 제한되지 않는, 소규모 또는 대규모 발효를 위한 방법이 단백질 발현에 사용될 수 있다. 이 방법들은 각기 배치, 피딩-배치, 또는 연속 방식의 공정으로 수행될 수 있다.
하기 예시적 절차들 중 임의의 절차를 본 발명의 폴리펩티드의 정제를 위해 이용할 수 있다: 친화도 크로마토그래피; 음이온- 또는 양이온-교환 크로마토그래피 (DEAE 세파로스(SEPHAROSE)(단, 이 제한되지 않음)의 이용); 실리카 상의 크로마토그래피; 역상 HPLC; 겔 여과(스파덱스(SEPHADEX) G-75(단, 이에 제한되지 않음)의 이용); 소수성 상호작용 크로마토그래피; 크기-배제 크로마토그래피, 금속-킬레이트 크로마토그래피; 초여과/투석여과; 에탄올 석출; 암모늄 술페이트 석출; 크로마토포커싱; 치환 크로마토그래피; 전기영동 절차(분취 등전점 포커싱을 포함하나 이에 제한되지 않음), 시차 가용화(암모늄 술페이트 석출을 포함하나 이에 제한되지 않음), SDS-PAGE 또는 추출.
비천연적으로 코딩된 아미노산을 포함하는 단백질을 포함하나 이에 제한되지 않는 본 발명의 단백질, 비천연적으로 코딩된 아미노산을 포함하는 단백질에 대한 항체, 비천연 아미노산을 포함하는 단백질에 대한 결합 상대 등이, 당업자에게 공지되어 있고 당업자가 사용하는 표준 절차에 따라, 부분적으로 또는 실질적으로 균질하게 정제될 수 있다. 따라서, 본 발명의 폴리펩티드는 암모늄 술페이트 또는 에탄올 석출, 산 또는 염기 추출, 칼럼 크로마토그래피, 친화도 칼럼 크로마토그래피, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 히드록실아파이트 크로마토그래피, 렉틴 크로마토그래피, 겔 전기영동 등을 포함하나 이에 제한되지 않는, 당업계에 공지된 수많은 방법들 중 임의의 방법에 의해 회수 및 정제될 수 있다. 올바르게 접힌 성숙 단백질을 제조할 때, 원하는 경우, 단백질 재접힘 단계가 사용될 수 있다. 고성능 액체 크로마토그래피(HPLC), 친화도 크로마토그래피 또는 기타 적당한 방법을, 고순도가 요망되는 최종 정제 단계에서 이용할 수 있다. 한 실시양태에서, 비천연적으로 코딩된 아미노산(또는 비천연적으로 코딩된 아미노산을 포함하는 단백질)에 대해 제조된 항체를, 1개 이상의 비천연적으로 코딩된 아미노산(들)을 포함하는 단백질 또는 펩티드의 친화도-기재 정제를 위한(단, 이에 제한되지 않음) 정제 시약으로 사용한다. 일단 원하는 대로 부분적으로 또는 균질하게 정제되면, 폴리펩티드를 임의적으로 검정 성분, 치료제, 예방제, 진단제, 연구 시약, 및/또는 항체 생성을 위한 면역원을 포함하나 이에 제한되지 않는 매우 다양한 용도들을 위해 사용한다.
본원에 언급된 다른 참고문헌에 부가하여, [R. Scopes, Protein Purification, Springer-Verlag, N.Y.(1982); Deutscher, Methods in Enzymology 제182권: Guide to Protein Purification, Academic Press, Inc. N.Y.(1990); Sandana(1997) Bioseparation of Proteins, Academic Press, Inc.; Bollag 등(1996) Protein Methods, 제2판 Wiley-Liss, NY; Walker(1996) The Protein Protocols Handbook Humana Press, NJ, Harris and Angal(1990) Protein Applications : A Practical Approach IRL Press at Oxford, Oxford, England; Harris and Angal, Protein Methods : A Practical Approach IRL Press at Oxford, Oxford, England; Scopes(1993) Protein Purification: Principles and Practice 제3판 Springer Verlag, NY; Janson 및 Ryden(1998) Protein Purification: Principles , High Resolution Methods and Applications , 제2판 Wiley-VCH, NY; 및 Walker(1998), Protein Protocols on CD - ROM Humana Press, NJ; 및 여기에 언급된 참고문헌들]에 나와 있는 세트들을 포함하나 이에 제한되지 않는 각종 정제/단백질 접힘 방법들이 당업계에 공지되어 있다.
당업자는 합성, 발현 및/또는 정제 후에, 단백질은 관련 폴리펩티드의 요망되는 형태와 상이한 형태를 가질 수 있음을 인식할 것이다. 본 발명의 한 측면에서, 발현된 단백질은 임의로 변성된 후, 재변성된다. 이는, 샤페로닌을 관심 단백질 또는 폴리펩티드에 첨가하는 것, 구아니딘 HCl과 같은 무질서 유발제 내에 단백질을 가용화하는 것, 단백질 디술피드 이성체화효소를 이용하는 것 등을 포함하나 이에 제한되지 않는, 당업계에 공지된 방법을 이용하여 달성된다.
일반적으로, 발현된 폴리펩티드를 변성하고 환원시킨 후, 폴리펩티드를 바람직한 형태로 재접힘시키는 것이 경우에 따라 바람직하다. 예를 들어, 구아니딘, 우레아, DTT, DTE 및/또는 샤페로닌은 관심 번역 생성물에 첨가될 수 있다. 단백질의 환원, 변성 및 재변성 방법이 당업자에게 공지되어 있다(상기 문헌들, 및 [Debinski 등(1993) J. Biol . Chem ., 268:14065-14070; Kreitman 및 Pastan(1993) Bioconjug . Chem ., 4:581-585; 및 Buchner 등(1992) Anal . Biochem., 205:263-270]를 참고한다. 예를 들어, Debinski 등은 구아니딘-DTE에서의 봉입체 단백질의 변성 및 환원을 기재하고 있다. 단백질은 산화된 글루타티온 및 L-아르기닌을 함유하는(단, 이에 제한되지 않음) 산화환원 완충액 내에서 재접힘될 수 있다. 재접힘 시약은 1개 이상의 폴리펩티드 또는 다른 발현 생성물과 접촉하도록 유동하거나 기타 방식으로 이동할 수 있으며, 그 역도 성립한다.
일반적 정제 방법 각종 단리 단계들 중 임의의 단계를, 친화도 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피, 겔 여과 크로마토그래피, 고성능 액체 크로마토그래피("HPLC"), 역상 HPLC("RP-HPLC"), 발포층 흡수, 또는 이들의 임의의 순서로의 임의의 조합 및/또는 반복을 포함하나 이에 제한되지 않는 임의의 단리 단계로부터 수득되는 임의의 폴리펩티드 혼합물 또는 폴리펩티드 함유 세포 분해물에 대해 수행할 수 있다.
본원에 기재된 기법을 수행하는데 사용되는 장비 및 기타 필요 물질이 시중 입수가능하다. 펌프, 분획 분취기(fraction collector), 모니터, 리코더, 및 전반 시스템은 예를 들어, [어플라이드 바이오시스템즈(Applied Biosystems(미국 캘리포니아주 포스터 시티 소재), 바이오-래드 라보라토리즈 인코포레이티드(미국 캘리포니아주 헤르큘레스 소재), 및 아머샴 바이오사이언스 인코포레이티드(Amersham Biosciences, Inc.)(미국 뉴저지주 피스캐터웨이 소재)]로부터 입수가능하다. 교환 매트릭스 물질, 매질 및 완충액을 포함하나 이에 제한되지 않는 크로마토그래피 물질도 또한 상기 회사들로부터 입수가능하다.
세정 및 용리와 같은, 본원에 기재된 칼럼 크로마토그래피 공정에서의 평형화 및 기타 단계는 펌프와 같은 특수화 장비를 이용하여 더 급속히 달성될 수 있다. 시중 입수가능한 펌프에는 하이로드(HILOAD)
Figure 112007093262665-PCT00012
펌프 P-50, 튜브연동식 펌프 P-1, 펌프 P-901 및 펌프 P-903(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)이 포함되나 이들에 제한되지 않는다.
분획 분취기의 예에는 레디플락(RediFrac) 분획 분취기, FRAC-100 및 FRAC-200 분획 분취기, 및 수퍼프랙(SUPERFRAC)
Figure 112007093262665-PCT00013
분획 분취기(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)가 포함된다. 또한 pH 및 선형 농도 구배를 형성하기 위해 믹서가 이용가능하다. 시중 입수가능한 믹서에는 구배 믹서 GM-1 및 인-라인 믹서스(In-Line Mixers)(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)가 포함된다.
크로마토그래피 공정은 임의의 시중 입수가능한 모니터를 이용하여 모니터될 수 있다. 그러한 모니터를 사용하여, UV, pH 및 전도도와 같은 정보를 수집할 수 있다. 검출기의 예에는 모니터 UV-1, 우비코드(UVICORD)
Figure 112007093262665-PCT00014
S II, 모니터 UV-M II, 모니터 UV-900, 모니터 UPC-900, 모니터 pH/C-900, 및 전도도 모니터(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)가 포함된다. 실제로, 아머샴 바이오사이언시스(미국 뉴저지주 피스캐터웨이 소재)로부터의 각종 아크타(AKTA)
Figure 112007093262665-PCT00015
시스템을 포함한 전반 시스템이 시중 입수가능하다.
본 발명의 한 실시양태에서, 예를 들어 폴리펩티드를, 먼저 우레아 내에서 수득되는 정제된 폴리펩티드를 변성시킨 후, 적당한 pH에서 환원제(예컨대, DTT)를 함유하는 트리스 완충액으로 희석함으로써, 환원 및 변성시킬 수 있다. 또 다른 실시양태에서, 폴리펩티드를 약 2 M 내지 약 9 M의 농도 범위에서 우레아 내에서 변성시킨 후, 약 5.0 내지 약 8.0 범위의 pH에서 트리스 완충액 내에 희석시킨다. 이어서, 이 실시양태의 재접힘 혼합물을 인큐베이션할 수 있다. 한 실시양태에서, 재접힘 혼합물을 4시간 내지 24시간 동안 실온에서 인큐베이션한다. 이어서, 환원 및 변성된 폴리펩티드 혼합물을 추가로 단리 및 정제할 수 있다.
여기에 언급된 바와 같이, 첫 번째 폴리펩티드 혼합물의 pH를 임의의 후속 단리 단계를 수행하기 전에 조정할 수 있다. 또한, 첫 번째 폴리펩티드 혼합물 또는 이의 임의의 후속 혼합물을 당업계에 공지된 기법을 이용하여 농축시킬 수 있다. 또한, 첫 번째 폴리펩티드 혼합물 또는 이의 임의의 후속 혼합물을 포함하는 용리 완충액을 당업계의 숙련가에게 공지된 기법을 이용하여 다음의 단리 단계에 적당한 완충액으로 교환될 수 있다.
이온 교환 크로마토그래피 한 실시양태에서, 또한 한 임의적인 부가적 단계로서, 이온 교환 크로마토그래피를 첫 번째 hGH 폴리펩티드 혼합물에 대해 수행할 수 있다. 일반적으로 [ION EXCHANGE CHROMATOGRAPHY: PRINCIPLES AND METHODS(카달로그 No. 18-1114-21, 아머샴 바이오사이언시스(미국 뉴저지주 피스캐터웨이 소재)]를 참고한다. 시중 입수가능한 이온 교환 칼럼에는 하이트랩(HITRAP)
Figure 112007093262665-PCT00016
, 하이프렙(HIPREP)
Figure 112007093262665-PCT00017
및 하이로드(HILOAD)
Figure 112007093262665-PCT00018
칼럼(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)이 포함된다. 그러한 칼럼들은 Q 세파로스
Figure 112007093262665-PCT00019
패스트 플로우(Fast Flow), Q 세파로스
Figure 112007093262665-PCT00020
하이 퍼포먼스(High Performance), 및 Q 세파로스
Figure 112007093262665-PCT00021
XL와 같은 이온 교환기; SP 세파로스
Figure 112007093262665-PCT00022
하이 퍼포먼스, SP 세파로스
Figure 112007093262665-PCT00023
패스트 플로우, 및 SP 세파로스
Figure 112007093262665-PCT00024
XL와 같은 강한 양이온 교환; DEAE 세파로스
Figure 112007093262665-PCT00025
패스트 플로우와 같은 약한 음이온 교환기; 및 CM 세파로스
Figure 112007093262665-PCT00026
패스트 플로우(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)와 같은 약한 양이온 교환기를 이용한다. 양이온 교환 칼럼 크로마토그래피를 정제 공정의 임의의 단계에서 폴리펩티드에 대해 수행하여, 실질적으로 정제된 폴리펩티드를 단리할 수 있다. 양이온 교환 크로마토그래피 단계를 임의의 적당한 양이온 교환 매트릭스를 이용하여 수행할 수 있다. 유용한 양이온 교환 매트릭스에는 섬유성, 다공성, 비다공성, 미세과립성, 비이드형 또는 가교 양이온 교환 매트릭스 물질이 포함되나 이들에 제한되지 않는다. 그러한 양이온 교환 매트릭스 물질에는 셀룰로스, 아가로스, 덱스트란, 폴리아크릴레이트, 폴리비닐, 폴리스티렌, 실리카, 폴리에테르, 또는 임의의 상기 것들의 복합물이 포함되나 이들에 제한되지 않는다. 양이온 교환기 매트릭스로의 폴리펩티드의 흡착 후, 매트릭스를 충분히 높은 pH 또는 이온 강도를 갖는 완충액와 접촉시켜, 매트릭스로부터 폴리펩티드를 이탈시킴으로써, 실질적으로 정제된 폴리펩티드를 용리할 수 있다. 실질적으로 정제된 폴리펩티드의 높은 pH 용리에서 사용하기에 적당한 완충액에는 시트레이트, 포스페이트, 포르메이트, 아세테이트, HEPES, 및 MES 완충액(농도 범위가 약 5 mM 이상 내지 약 100 mM 이상임)이 포함되나 이들에 제한되지 않는다.
역상 크로마토그래피 RP-HPLC를 수행하여, 당업계의 숙련가에게 공지된 적당한 프로토콜에 따라 단백질을 정제할 수 있다. 이에 대해 예컨대, [Pearson 등, ANAL BIOCHEM.(1982) 124:217-230(1982); Rivier 등, J. CHROM.(1983) 268:112-119; Kunitani 등, J. CHR0M.(1986) 359:391-402]를 참고한다. RP-HPLC를 hGH 폴리펩티드에 대해 수행하여, 실질적으로 정제된 hGH 폴리펩티드를 단리할 수 있다. 이와 관련하여, 약 C3 이상 내지 약 C30 이상, 약 C3 이상 내지 약 C20 이상, 또는 약 C3 이상 내지 약 C18 이상의 수지를 포함하나 이에 제한되지 않는 매우 다양한 길이를 갖는, 알킬 작용기를 갖는 실리카 유도체화 수지를 사용할 수 있다. 대안적으로, 중합체성 수지를 사용할 수 있다. 예를 들어, 스티렌 중합체 수지인 토소하스 앰버크롬(TosoHaas Amberchrome) CGl000sd 수지를 사용할 수 있다. 매우 다양한 알킬 사슬 길이를 갖는 시아노 또는 중합체성 수지를 또한 사용할 수 있다. 또한, RP-HPLC 칼럼을 에탄올과 같은 용매로 세정할 수 있다. 이온 쌍형성제 및 유기 개질제, 예컨대 메탄올, 이소프로판올, 테트라히드로푸란, 아세토니트릴 또는 에탄올을 함유하는 적당한 용리 완충액을 사용하여, RP-HPLC 칼럼으로부터 폴리펩티드를 용리할 수 있다. 가장 통상적으로 사용되는 이온 쌍형성제에는 아세트산, 포름산, 과염소산, 인산, 트리플루오로아세트산, 헵타플루오로부티르산, 트리에틸아민, 테트라메틸암모늄, 테트라부틸암모늄, 트리에틸암모늄 아세테이트가 포함되나 이들에 제한되지 않는다. 분리 시간을 감소시키고 피크 폭을 감소시키기 위해 바람직한 구배 조건 하에서 1개 이상의 구배 또는 등용매 조건을 이용하여 용리를 수행할 수 있다. 또 다른 방법은 상이한 용매 농도 범위를 갖는 2개 구배의 사용을 포함한다. 본원에 사용하기에 적당한 용리 완충액의 예에는 암모늄 아세테이트 및 아세토니트릴 용액이 포함되나 이들에 제한되지 않는다.
소수성 상호작용 크로마토그래피 정제 기법 소수성 상호작용 크로마토그래피(HIC)를 폴리펩티드에 대해 수행할 수 있다. 일반적으로, 본원에 참고로 인용되는 [HYDROPHOBIC INTERACTION CHROMATOGRAPHY HANDBOOK: PRINCIPLES AND METHODS(카달로그 No. 18-1020-90, 아머샴 바이오사이언시스(미국 뉴저지주 피스캐터웨이 소재)]를 참고한다. 적당한 HIC 매트릭스에는 알킬- 또는 아릴-치환 매트릭스, 예컨대 부틸-, 헥실-, 옥틸- 또는 페닐-치환 매트릭스, 예를 들어 아가로스, 가교 아가로스, 세파로스, 셀룰로스, 실리카, 덱스트란, 폴리스티렌, 폴리(메타크릴레이트) 매트릭스, 및 폴리에틸렌아민 수지를 포함하나 이에 제한되지 않는 혼합식 수지, 또는 부틸- 또는 페닐-치환 폴리(메타크릴레이트) 매트릭스가 포함될 수 있으나, 이들에 제한되지 않는다. 소수성 상호작용 칼럼 크로마토그래피를 위한 시중 입수가능한 출처에는 하이트랩
Figure 112007093262665-PCT00027
, 하이프렙
Figure 112007093262665-PCT00028
및 하이로드
Figure 112007093262665-PCT00029
칼럼(아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)이 포함되나 이들에 제한되지 않는다. 간략히, 로딩 전에, HIC 칼럼을 당업계의 숙련가에 공지된 표준 완충액, 예컨대 아세트산/염화나트륨 용액, 또는 암모늄 술페이트 함유의 HEPES를 이용하여 평형화할 수 있다. 폴리펩티드의 로딩 후, 이어서 칼럼을 표준 완충액, 및 원하지 않는 물질은 제거하면서도, 다만 HIC 칼럼 상에는 폴리펩티드를 보유시키는 조건을 이용하여 세정할 수 있다. 무엇보다 약 3 내지 약 10 칼럼 체적의 표준 완충액, 예컨대 EDTA 및 평형화 완충액보다 낮은 저급 암모늄 술페이트 농도를 갖는 HEPES 완충액, 또는 아세트산/염화나트륨 완충액을 이용하여 폴리펩티드를 용리할 수 있다. 예를 들어, 인산칼륨의 구배를 이용한 감소하는 선형 염 구배를 또한 사용하여 분자를 용리할 수 있다. 이어서, 용리제를 예를 들어, 투석여과 또는 초여과와 같은 여과에 의해 농축할 수 있다. 투석여과를 이용하여, hGH 폴리펩티드를 용리하기 위해 사용되는 염을 제거할 수 있다.
기타 정제 기법 예를 들어, 겔 여과(본원에 참고로 인용되는, GEL FILTRATION: PRINCIPLES AND METHODS(카달로그 No. 18-1022-18, 아머샴 바이오사이언시스)(미국 뉴저지주 피스캐터웨이 소재)], HPLC, 발포층 흡수, 초여과, 투석여과, 동결건조 등을 이용하는 또 다른 단리 단계를 첫 번째 hGH 폴리펩티드 혼합물 또는 이의 임의의 후속 혼합물에 수행하여, 과량의 염을 제거하고, 완충액을 후속 단리 단계 또는 심지어 최종 약물 생성물의 제형을 위한 적당한 완충액으로 대체할 수 있다. 실질적으로 정제된 폴리펩티드를 포함한 폴리펩티드의 수율을 당업계의 숙련가에게 공지된 기법을 이용하여 본원에 기재된 각 단계에서 모니터할 수 있다. 그러한 기법들을 사용하여, 마지막 단리 단계 후에 실질적으로 정제된 폴리펩티드의 수율을 평가할 수 있다. 예를 들어, 폴리펩티드의 수율을 시아노 RP-HPLC, C18RP-HPLC와 같은 각종 알킬 사슬 길이를 갖는 수개의 역상 고압 액체 크로마토그래피 칼럼; 및 양이온 교환 HPLC 및 겔 여과 HPLC 중 임의의 것을 이용하여 모니터할 수 있다.
표준 기법, 예컨대 SDS-PAGE를 이용하거나, 또는 웨스턴 블롯 및 ELISA 검정을 이용하여 폴리펩티드를 측정함으로써 순도를 결정할 수 있다. 예를 들어, 음성 대조군 효모 발효 및 양이온 교환 회수로부터 단리된 단백질에 대한 다클론성 항체를 발생시킬 수 있다. 항체를 또한 오염 숙주 세포 단백질의 존재를 탐침하기 위해 사용할 수 있다.
RP-HPLC 물질 Vydac C4(Vydac)는 C4-알킬 사슬을 표면에 가지고 있는 실리카 겔 입자로 구성된다. 단백질성 불순물로부터의 폴리펩티드의 분리는 소수성 상호작용의 강도의 차이에 기초한다. 희석된 트리플루오로아세트산에서 아세토니트릴 구배를 이용하여 용리를 수행한다. 스테인레스 스틸 칼럼(2.8 내지 3.2 리터의 Vydac C4 실리카 겔 충전)을 이용하여 분취 HPLC를 수행한다. 히드록시아파이트 울트로겔 용리물을 트리플루오로아세트산의 첨가에 의해 산성화하고, Vydac C4 칼럼 상에 로딩한다. 세정 및 용리를 위해, 희석된 트리플루오로아세트산 중 아세토니트릴 구배를 사용한다. 분획물을 수집한 직후, 인산염 완충액으로 중성화한다. IPC 한도 내의 폴리펩티드 분획물을 풀링한다.
DEAE 세파로스(파마시아(Pharmacia)) 물질은 세파로스 비이드의 표면에 공유 결합된 디에틸아미노에틸(DEAE)-기들로 구성된다. DEAE 기에 대한 폴리펩티드의 결합은 이온성 상호작용에 의해 매개된다. 아세토니트릴 및 트리플루오로아세트산을 칼럼에 통과시켜, 칼럼 상에 보유시키지 않는다. 이 물질들을 세정 제거한 후, 낮은 pH에서 아세테이트 완충액으로 칼럼을 세정함으로써, 미량의 불순물을 제거한다. 이어서, 칼럼을 중성 인산염 완충액으로 세정하고, 폴리펩티드는 증가된 이온 강도를 갖는 완충액으로 용리한다. 칼럼을 DEAE 세파로스 패스트 플로우로 충전한다. 칼럼 체적을 3-10 mg 폴리펩티드/ml 겔 범위의 폴리펩티드 부하량이 되도록 조정한다. 칼럼을 물 및 평형화 완충액(인산나트륨/인산칼륨)으로 세정한다. HPLC 용리물의 풀링된 분획물을 로딩하고, 칼럼을 평형화 완충액으로 세정한다. 이어서, 칼럼을 세정 완충액(아세트산나트륨 완충액)으로 세정한 후, 평형화 완충액으로 세정한다. 후속하여, 폴리펩티드를 용리 완충액(염화나트륨, 인산나트륨/인산칼륨)을 이용하여 칼럼으로부터 용리하고, 마스터 용리 프로파일에 따라 단일 분획으로 수집한다. DEAE 세파로스 칼럼의 용리물을 특정 전도도로 조정한다. 수득된 약물 물질을 테플론(Teflon) 병에 무균 여과 주입하고, -70℃에 저장한다.
브래드포드(Bradford) 검정, SDS-PAGE, 은 염색 SDS-PAGE, 쿠마시 염색 SDS-PAGE, 질량 분광법(MALDI-TOF를 포함하나 이에 제한되지 않음), 및 당업자에게 공지된 기타 단백질의 특징화 방법을 포함하나 이에 제한되지 않는 매우 다양한 방법 및 절차를 사용하여, 1개 이상의 비천연적으로 코딩된 아미노산을 포함하는 단백질의 수율 및 순도를 평가할 수 있다.
VIII . 대체 시스템에서의 발현
E. 콜라이에서의 재조합 단백질 발현을 위한, 본원에 개시된 것들을 포함하나 이에 제한되지 않는, 각종 대체 발현 시스템들이 기재되었고, 이 시스템들은 유사한 방식으로 본원의 슈도모나스 번역 시스템에 이용될 수 있다. 야생형 합성효소의 난교(promiscuity)를 이용하기 위해, 선택적 압력 도입으로도 칭해지는 생체내 방법이 개발되었다. 이에 대해 예컨대, [N. Budisa, C. Minks, S. Alefelder, W. Wenger, F. M. Dong, L. Moroder 및 R. Huber, FASEB J., 13:41(1999)]를 참고한다. 세포에 특별한 천연 아미노산을 공급하는 관련 대사 경로가 차단되는 영양요구 균주를 제한된 농도의 천연 아미노산이 함유된 최소 배지에서 성장시키고, 한편 표적 유전자의 전사는 억제된다. 정지 성장 상태가 개시될 때, 천연 아미노산이 고갈되고, 비천연적으로 코딩된 아미노산 유사체로 치환된다. 재조합 단백질의 발현의 도입은 비천연 유사체를 함유하는 단백질의 축적을 초래한다. 예를 들어, 이 전략법을 이용하여, o, m 및 p-플루오로페닐알라닌이 단백질에 도입되었고, 용이하게 확인될 수 있는 UV 스펙트럼에서 2개의 특정 쇼율더를 나타내고, 이에 대해 예컨대, [C. Minks, R. Huber, L. Moroder 및 N. Budisa, Anal . Biochem ., 284:29(2000)]을 참고하고; 박테리오파지 T4 라이소좀 내의 메티오닌을 치환하기 위해 트리플루오로메티오닌을 사용하여, 그것의 키토 이당류 리간드와의 상호작용을 19F NMR을 이용하여 연구하였으며, 이에 대해 예컨대, [H. Duewel, B. Daub, V. Robinson 및 J. F. Honek, Biochemistry, 36:3404(1997)]을 참고하며; 트리플루오로루이신을 루이신 대신에 도입하여, 루이신-지퍼 단백질의 증가된 열적 및 화학적 안정성을 초래하였다. 이에 대해 예컨대, [Y. Tang, G. Ghirlanda, W. A. Petka, T. Nakajima, W. F. DeGrado 및 D. A. Tirrell, Angew. Chem. Int. Ed. Engl., 40: 1494(2001)]을 참고한다. 또한, 셀레노메티오닌 및 텔루로메티오닌을 각종 재조합 단백질에 도입하여, 결정학 X-선에서의 상용해를 용이하게 한다. 이에 대해 예컨대, [W. A. Hendrickson, J. R. Horton 및 D. M. Lemaster, EMIBO J., 9:1665(1990); J. 0. Boles, K. Lewinski, M. Kunkle, J. D. Odom, B. Dunlap, L. Lebioda 및 M. Hatada, Nat . Struct . Biol ., 1:283(1994); N. Budisa, B. Steipe, P. Demange, C. Eckerskorn, J. Kellermann 및 R. Huber, Eur . J. Biochem ., 230:788(1995); 및 N. Budisa, W. Karnbrock, S. Steinbacher, A. Humm, L. Prade, T. Neuefeind, L. Moroder 및 R. Huber, J. Mol . Biol ., 270:616(1997)]을 참고한다. 알켄 또는 알킨 작용기를 갖는 메티오닌 유사체도 또한 효율적으로 도입되어, 화학적 수단에 의해 단백질의 부가적 변형을 허용한다. 이에 대해 예컨대, [J. C. M. van Hest 및 D. A. Tirrell, FEBS Lett ., 428:68(1998); J. C. M. van Hest, K. L. Kiick 및 D. A. Tirrell, J. Am . Chem . Soc ., 122:1282(2000); 및, K. L. Kiick 및 D. A. Tirrell, Tetrahedron, 56:9487(2000); U.S. 특허 No. 6,586,207; U.S. 특허 공보 2002/0042097(각기 본원에 각기 참고로 인용됨)]를 참고한다.
이 방법의 성공은 일반적으로 단백질 번역의 신뢰도를 보증하기 위해 높은 선택도를 요구하는, 아미노아실-tRNA 합성효소에 의한 비천연적으로 코딩된 아미노산 유사체의 인식에 의존한다. 이 방법의 범주를 확장시키는 한 방법은 아미노아실-tRNA 합성효소의 기질 특이성을 이완시키는 것으로서, 이는 제한된 수의 경우들에서 달성되었다. 예를 들어, 에스케리치아 콜라이 페닐알라닐-tRNA 합성효소(PheRS)에서의 Gly에 의한 Ala294의 치환은 기질 결합 포켓의 크기를 증가시키고, p-Cl-페닐알라닌(p-Cl-Phe)에 의한 tRNAPhe의 아실화를 초래한다. 이에 대해 [M. Ibba, P. Kast 및 H. Hennecke, Biochemistry, 33:7107(1994)]를 참고한다. 이 변이체 PheRS를 함유하는 에스케리치아 콜라이 균주는 페닐알라닌 대신에 p-Cl-페닐알라닌 또는 p-Br-페닐알라닌이 도입되도록 한다. 이에 대해 예컨대, [M. Ibba 및 H. Hennecke, FEBS Lett ., 364:272(1995); 및, N. Sharma, R. Furter, P. Kast 및 D. A. Tirrell, FEBS Lett ., 467:37(2000)]를 참고한다. 마찬가지로, 에스케리치아 콜라이 티로실-tRNA 합성효소의 아미노산 결합 부위 부근의 점 돌연변이 Phe13OSer는 아자티로신이 티로신보다 더 효율적으로 도입되도록 하는 것으로 나타났다. 이에 대해 [F. Hamano-Takaku, T. Iwama, S. Saito-Yano, K. Takaku, Y. Monden, M. Kitabatake, D. Soil 및 S. Nishimura, J. Biol . Chem ., 275:40324(2000)]를 참고한다.
비천연적으로 코딩된 아미노산을 단백질로 생체내 도입하는 또 다른 전략법은 교정(proofreading) 기작을 갖는 합성효소를 변형시키는 것이다. 이 합성효소는 차별화할 수 없어, 동질 천연 아미노산과 구조적으로 유사한 아미노산을 활성화한다. 이 에러는 분리된 부위에서 수정되고, 이는 tRNA로부터 잘못 방출된 아미노산을 탈아실화하여, 단백질 번역의 신뢰도를 유지한다. 합성효소의 교정 활성이 불능으로 될 경우, 잘못 활성화된 구조적 유사체는 편집 기능에서 벗어나 도입될 수 있다. 이 접근법은 발릴-tRNA 합성효소(ValRS)를 이용하여 최근 입증되었다. 이에 대해 [V. Doring, H. D. Mootz, L. A. Nangle, T. L. Hendrickson, V. de Crecy-Lagard, P. Schimmel 및 P. Marliere, Science, 292:501(2001)]를 참고한다. ValRS는 tRNAVal을 Cys, Thr, 또는 아미노부티레이트(Abu)로 잘못 아미노아실화할 수 있고; 이 비동질 아미노산들은 후속하여 편집 도메인에 의해 가수분해된다. 에스케리치아 콜라이 염색체의 무작위 변이유발 후에, ValRS의 편집 부위에서의 돌연변이를 갖는 변이체 에스케리치아 콜라이 균주가 선택되었다. 이 편집-결핍 ValRS는 tRNAVal을 Cys로 잘못 충전한다. Abu가 입체적으로 Cys와 유사하기 때문에(Cys의 -SH 기는 Abu에서 -CH3로 치환됨), 이 변이체 에스케리치아 콜라이 균주가 Abu의 존재 하에 성장될 때, 변이체 ValRS는 또한 Abu를 단백질에 도입한다. 질량 분광 분석은 발린의 약 24%가 본연의 단백질 내의 각 발린 위치에서 Abu에 의해 치환됨을 나타낸다.
과거, 비천연적으로 코딩된 아미노산은 요망되는 앰버 넌센스 변이를 갖는 유전자를 이용하여 프로그래밍된 단백질 합성 반응에 화학적으로 아미노아실화된 서프레서 tRNA를 부가함으로써 시험관내 단백질에 부위-특이적으로 도입될 수 있는 것으로 나타났다. 이 접근법들을 이용함으로써, 특별한 아미노산에 대한 영양요구성인 균주를 이용하여, 수많은 통상의 20개 아미노산을 근접 구조적 동종체로 치환할 수 있는 바, 예컨대 플루오로페닐알라닌을 갖는 페닐알라닌으로 치환할 수 있다. 이에 대해 예컨대, [Noren, C.J., Anthony-Cahill, Griffith, M.C., Schultz, P.G. A general method for site - specific incorporation of unnaturally encoded amino acids into proteins, Science , 244:182-188(1989); M.W. Nowak 등, Science 268:439-42(1995); Bain, J.D., Glabe, C. G., Dix, T.A., Chamberlin, A.R., Diala, E.S. Biosynthetic site -specific Incorporation of a non - natural amino acid into a polypeptide , J. Am. Chem . Soc ., 111:8013-8014(1989); N. Budisa 등, FASEB J. 13:41-51(1999); Ellman, J.A., Mendel, D., Anthony-Cahill, S., Noren, C.J., Schultz, P.G. Biosynthetic method for introducing Non - naturally encoded amino acids site - specifically into proteins. Methods in Enz ., vol. 202, 301-336(1992); 및 Mendel, D., Cornish, V.W. & Schultz, P.G. Site - Directed Mutagenesis with an Expanded Genetic Code, Annu Rev Biophys . Biomol Struct. 24, 435-62(1995)]를 참고한다.
예를 들어, 중지 코돈 UAG을 인식하고, 비천연적으로 코딩된 아미노산으로 화학적으로 아미노아실화된 서프레서 tRNA를 제조하였다. 통상적 부위-지정 변이유발을 사용하여, 단백질 유전자 내 관심 부위에 중지 코돈 TAG을 도입하였다. 이에 대해 예컨대, [Sayers, J. R., Schmidt, W. Eckstein, F. 5',3' Exonucleases in phosphorothioate - based oligonucleotide - directed mutagensis, Nucleic Acids Res, 16(3):791-802(1988)]을 참고한다. 아실화 서프레서 tRNA 및 변이체 유전자를 시험관내 전사/번역 시스템에서 조합할 때, 비천연적으로 코딩된 아미노산을, 특정화 위치에서 상기 아미노산을 갖는 단백질을 제공하는 UAG 코돈에 대한 반응으로 도입하였다. [3H]-Phe을 이용한 실험, 및 α-히드록시 산을 이용한 실험은, 단지 요망되는 아미노산이 UAG 코돈에 의해 특정화된 위치에서만 도입되고, 이 아미노산이 단백질 내 임의의 기타 부위에서는 도입되지 않음을 입증하였다. 이에 대해 예컨대, [Noren 등, 이하 동일; Kobayashi 등(2003) Nature Structural Biology 10(6):425-432; 및 Ellman, J.A., Mendel, D., Schultz, P.G. Site - specific incorporation of novel backbone structures into proteins, Science, 255(5041):197-200(1992)]을 참고한다.
비천연적으로 코딩된 아미노산을 생체내 단백질에 직접적으로 도입하는 능력은, 변이체 단백질의 고수율, 기술적 용이성, 세포, 또는 가능하게는 생물 유기체에서의 변이체 단백질의 연구 가능성, 및 치료적 처치에서의 상기 변이체 단백질의 사용의 이점들을 제공한다. 각종 크기, 산도, 친핵도, 소수도 및 기타 성질을 갖는 비천연적으로 코딩된 아미노산을 단백질에 포함시키는 능력은, 단백질 기능을 탐침함과 동시에 신규 성질을 갖는 새로운 단백질 또는 유기체를 창출하도록 하기 위한, 단백질의 구조를 합리적으로 또는 계통적으로 조작할 수 있는 능력을 크게 확장시킬 수 있다. 그러나, 그 공정은, 단백질 번역에서의 고도의 신뢰도를 달성하기 위해 tRNA-합성효소 상호작용의 복잡한 성질이 필요하기 때문에, 용이하기 않다.
파라-F-Phe를 부위-특이적으로 도입하기 위한 한 시도로서, 효모 앰버 서프레서 tRNAPheCUA/페닐알라닐-tRNA 합성효소 쌍을 p-F-Phe 내성의 Phe 영양요구 에스케리치아 콜라이 균주에서 사용하였다. 이에 대해 예컨대, [R. Furter, Protein Sci ., 7:419(1998)]을 참고한다.
또한, 무세포(생체외) 번역 시스템을 이용하여 본 발명의 폴리뉴클레오티드의 발현을 수득하는 것도 가능할 수 있다. 주형으로서 mRNA를 포함하거나(시험관내 번역), 주형으로서 DNA를 포함할 수 있는(시험관내 전사 및 번역과의 조합) 상기 시스템들에서, 시험관내 합성은 리보좀에 의해 지정된다. 무세포 단백질 발현 시스템의 개발을 위해 상당한 노력이 가해졌다. 이에 대해 예컨대, [Kim, D. M. 및 J. R. Swartz, Biotechnology and Bioengineering, 74:309-316(2001); Kim, D. M. 및 J. R. Swartz, Biotechnology Letters, 22, 1537-1542(2000); Kim, D. M., 및 J. R. Swartz, Biotechnology Progress, 16, 385-390(2000); Kim, D. M., 및 J. R. Swartz, Biotechnology and Bioengineering, 66, 180-188(1999); 및 Patnaik, R. 및 J. R. Swartz, Biotechniques 24, 862-868(1998); U.S. 특허 No. 6,337,191; U.S. 특허 공보 No. 2002/0081660; WO 00/55353; WO 90/05785(각기 본원에 각기 참고로 인용됨)]를 참고한다. 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드의 발현에 적용될 수 있는 또 다른 접근법에는 mRNA-펩티드 융합 기법이 포함된다. 이에 대해 예컨대, [R. Roberts 및 J. Szostak, Proc . Natl Acad . Sci . (USA) 94:12297-12302(1997); A. Frankel 등, Chemistry & Biology 10:1043-1050(2003)]를 참고한다. 이 접근법에서, 푸로마이신에 연결된 mRNA 주형은 리보솜 상에서 펩티드로 번역된다. 1개 이상의 tRNA 분자가 변형된 경우, 비천연 아미노산도 또한 펩티드에 도입될 수 있다. 마지막 mRNA 코돈이 해독된 후, 푸로마이신은 펩티드의 C-말단을 포획한다. 수득된 mRNA-펩티드 접합체가 시험관내 검정에서 유익한 성질을 가지는 것으로 나타나는 경우, 그것의 실체는 mRNA 서열로부터 용이하게 나타내어질 수 있다. 이러한 식으로, 1개 이상의 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드의 라이브러리를 스크리닝하여, 요망되는 성질을 갖는 폴리펩티드를 동정할 수 있다. 더욱 최근, 정제된 요소를 갖는 시험관내 리보솜 번역이 펩티드 비천연적으로 코딩된 아미노산으로 치환된 펩티드의 합성을 허용한다는 것이 보고되었다. 이에 대해 예컨대, [A. Forster 등, Proc . Natl . Acad . Sci . (USA) 100:6353(2003)]을 참고한다.
IX . 폴리펩티드에 결합된 거대분자 중합체
본원에 기재된 비천연 아미노산 폴리펩티드에 대한 각종 변형들은, 본원에 기재된 조성물, 방법, 기법 및 전략법을 이용하여 행해질 수 있다. 이 변형들에는, 표지; 염료; 중합체; 수용성 중합체; 폴리에틸렌 글리콜의 유도체; 광가교제; 세포독성 화합물; 약물; 친화성 표지; 광친화성 표지; 반응성 화합물; 수지; 제2 단백질 또는 폴리펩티드 또는 폴리펩티드 유사체; 항체 또는 항체 단편; 금속 킬레이터; 보조인자; 지방산; 탄수화물; 폴리뉴클레오티드; DNA; RNA; 안티센스 폴리뉴클레오티드; 억제성 리보핵산; 바이오물질; 나노입자; 스핀 표지; 형광발색단, 금속-함유 부분; 방사능 부분; 신규 작용기; 다른 분자와 공유 또는 비공유 상호작용하는 기; 광포집 부분; 광이성화 부분; 비오틴; 비오틴의 유도체; 비오틴 유사체; 중원자가 도입된 부분; 화학적 절단형 기; 광절단형 기; 연신 측쇄; 탄소-연결 당; 산화환원 활성제; 아미노 티오산; 독성 부분; 동위원소 표지된 부분; 생물리학적 프로브; 인광성 기; 화학발광성 기; 전자 조밀 기; 자기성 기; 개재성 기; 발색단; 에너지 전달제; 생물학적 활성제; 검출가능 표지; 소분자; 또는 상기 것들의 임의 조합, 또는 임의 기타 바람직한 화합물 또는 물질을 포함하나 이에 제한되지 않는, 폴리펩티드의 비천연 아미노산 성분에의 추가적 작용기의 도입이 포함된다. 본원에 기재된 조성물, 방법, 기법 및 전략법의 예시적인, 비제한적 예를 예시함에 있어, 하기 설명은 여기에 기재된 조성물, 방법, 기법 및 전략법이 상기 열거된 작용기들을 포함하나 이에 제한되지 않는 다른 작용기들을 부가하는 것에도 또한 적용가능하다는 것(필요한 경우, 당업자가 본 개시 내용에 대해 가할 수 있는 적절한 변형도 가능함)을 이해하면서, 비천연 아미노산 폴리펩티드에 거대분자 중합체를 부가하는 것에 초점을 둘 것이다.
매우 다양한 거대분자 중합체 및 기타 분자가 본 발명의 폴리펩티드에 연결되어, 폴리펩티드의 생물학적 성질을 조절하고/하거나, 분자에 새로운 생물학적 성질을 제공할 수 있다. 이 거대분자 중합체는 천연적으로 코딩된 아미노산, 비천연적으로 코딩된 아미노산, 또는 천연 또는 비천연 아미노산의 임의의 작용성 치환기, 또는 천연 또는 비천연 아미노산에 부가된 임의의 치환기 또는 작용기를 통해 폴리펩티드에 연결될 수 있다.
본 발명은 중합체:단백질 접합체의 실질적으로 동질성인 제제를 제공한다. 본원에 사용되는 "실질적으로 동질성인"은 중합체:단백질 접합체 분자가 총 단백질의 절반보다 더 많은 것으로 관찰됨을 의미한다. 중합체:단백질 접합체는 생물학적 활성을 가지고, 본원에 제공되는 당해 "실질적으로 동질성인" PEG화 폴리펩티드 제제는, 동질성 제제의 이점들, 예컨대 로트 대 로트 약물동태학의 예측가능성에 있어서 임상적 적용의 용이성을 나타내기에 충분히 동질성인 것들이다.
중합체:단백질 접합체 분자의 혼합물을 제조하는 것을 선택할 수 있고, 여기에서 제공되는 이점은, 혼합물 내 포함되는 모노-중합체:단백질 접합체의 분율을 선택할 수 있다는 것이다. 따라서, 요망되는 경우, 각종 수의 중합체 부분들(즉, 디-, 트리-, 테트라- 등)이 결합된 각종 단백질들의 혼합물을 제조하고, 상기 접합체를 본 발명의 방법을 이용하여 제조된 모노-중합체:단백질 접합체와 조합하며, 소정의 분율의 모노-중합체:단백질 접합체를 갖는 혼합물을 가질 수 있다.
선택되는 중합체는 그것이 결합된 단백질이 수성 환경, 예컨대 생리학적 환경에서 석출하지 않도록 하기 위해 수용성일 수 있다. 중합체는 분지형 또는 비분지형일 수 있다. 바람직하게, 최종 생성물 제제의 치료 용도를 위해, 중합체는 약제학적으로 허용가능할 것이다.
단백질 분자에 대한 폴리에틸렌 글리콜 분자의 분율은, 반응 혼합물 내 그것의 농도에 따라 다양할 것이다. 일반적으로, (최소의 과잉 미반응 단백질 또는 중합체가 있도록 하는 반응 효율성 측면에서의) 최적 비는 선택된 폴리에틸렌 글리콜의 분자량 및 이용가능한 반응성 기의 수에 의해 결정될 수 있다. 분자량에 관한 경우, 전형적으로 중합체의 분자량이 클수록, 단백질에 결합될 수 있는 중합체 분자의 수가 더 적다. 마찬가지로, 중합체의 분지화는 이들 파라미터들을 최적화할 때 고려되어야 한다. 일반적으로, 분자량이 클수록 (또는 분지도가 클수록), 중합체:단백질 비가 더 크다.
수용성 중합체는 선형, 포크형 또는 분지형을 포함하나 이에 제한되지 않는 임의의 구조적 형태일 수 있다. 전형적으로, 수용성 중합체는 폴리(알킬렌 글리콜), 예컨대 폴리(에틸렌 글리콜)(PEG)이나, 다른 수용성 중합체도 또한 이용될 수 있다. 예로서, 본 발명의 특정 실시양태들을 설명하기 위해 PEG를 사용한다.
PEG는 시중 입수가능하거나 당업계에 공지된 방법에 따라 에틸렌 글리콜의 개환 중합에 의해 제조될 수 있는 공지된 수용성 중합체이다(Sandler 및 Karo, Polymer Synthesis, Academic Press, New York, 제3권, p. 138-161). 용어 "PEG"는 크기 또는 PEG의 말단에서의 변형과 상관없이, 임의의 폴리에틸렌 글리콜 분자들을 포괄하기 위해 광범위하게 사용되고, 화학식:
XO-(CH2CH2O)n-CH2CH2-Y
(식 중에서, n은 2 내지 10,000이고, X는 H, 또는 C1 -4 알킬을 포함하나 이에 제한되지 않는 말단 변형기임)에 의해 hGH 폴리펩티드에 연결되는 것으로 표시될 수 있다.
일부 경우들에서, 본 발명에 사용되는 PEG는 히드록시 또는 메톡시로 한 말단이 종결되는 것이고, 즉 X는 H 또는 CH3인 것(즉, "메톡시 PEG")이다. 대안적으로, PEG는 반응성 기로 종결됨으로써 이작용성 중합체를 형성할 수 있다. 전형적 반응성 기에는, 20개의 통상의 아미노산에서 발견되는 작용기와 반응하기 위해 통상 사용되는 반응성 기들(말레이미드기, 활성화된 카르보네이트(p-니트로페닐 에스테르를 포함하나 이에 제한되지 않음), 활성화된 에스테르(N-히드록시숙신이미드, p-니트로페닐 에스테르를 포함하나 이에 제한되지 않음) 및 알데히드를 포함하나 이에 제한되지 않음), 및 20개의 통상의 아미노산에 대해 불활성이나 비천연적으로 코딩된 아미노산 내에 존재하는 상보적 작용기와 특이적으로 반응하는 작용기들(아지드기, 알킨기를 포함하나 이에 제한되지 않음)이 포함된다. 상기 화학식에서 Y로 표시되는, PEG의 다른 한 말단은 천연 발생 또는 비천연적으로 코딩된 아미노산을 통해 폴리펩티드에 직접적으로 또는 간접적으로 결합할 것임을 주목한다. 예를 들어, Y는 폴리펩티드의 아민기(리신의 엡실론 아민 또는 N-말단을 포함하나 이에 제한되지 않음)에 대한 아미드, 카르바메이트 또는 우레아 연결기일 수 있다. 대안적으로, Y는 티올기(시스테인의 티올기를 포함하나 이에 제한되지 않음)에 대한 말레이미드 연결기일 수 있다. 대안적으로, Y는 20개의 통상의 아미노산을 통해 통상 접근가능하지 않은 잔기에 대한 연결기일 수 있다. 예를 들어, PEG 상의 아지드기는 폴리펩티드 상의 알킨기와 반응하여, 휘스겐 [3+2] 시클로부가 생성물을 형성할 수 있다. 대안적으로, PEG 상의 알킨기는 비천연적으로 코딩된 아미노산 내에 존재하는 아지드기와 반응하여, 유사한 생성물을 형성할 수 있다. 일부 실시양태들에서, 강한 친핵체(히드라진, 히드라지드, 히드록실아민, 세미카르바지드를 포함하나 이에 제한되지 않음)는 비천연적으로 코딩된 아미노산 내에 존재하는 알데히드 또는 케톤기와 반응하여, 히드라존, 옥심 또는 세미카르바존을 형성할 수 있고, 적용가능한 경우 이는 일부 경우들에서 적절한 환원제를 이용한 처리에 의해 추가 환원될 수 있다. 대안적으로, 강한 친핵체는 비천연적으로 코딩된 아미노산을 통해 폴리펩티드에 도입되어, 수용성 중합체 내에 존재하는 케톤 또는 알데히드기와 우선적으로 반응하기 위해 사용될 수 있다.
PEG에 대한 임의의 분자 질량은 실질적으로 원하는 대로 사용될 수 있고, 이는 원하는 대로 약 100 달톤(Da) 내지 100,000 Da 이상(경우에 따라, 0.1 내지 50 kDa 또는 10 내지 40 kDa를 포함하나 이에 제한되지 않음)을 포함하나 이에 제한되지 않는다. MW가 1 내지 100 kDa 범위 내(1 내지 50 kDa 또는 5 내지 20 kDa를 포함하나 이에 제한되지 않음)인 각 사슬을 갖는 PEG 분자를 포함하나 이에 제한되지 않는 분지형 사슬 PEG도 또한 사용될 수 있다. 광범위한 PEG 분자들이 본원에 참고로 인용되는, [쉐어워터 폴리머스 인코포레이티드(Shearwater Polymers, Inc). 카달로그, 넥타르 써레포틱스(Nektar Therapeutics) 카달로그](단, 이에 제한되지 않음)에 기재되어 있다.
일반적으로, PEG 분자의 1개 이상의 말단은 비천연적으로 코딩된 아미노산과의 반응을 위해 이용가능하다. 예를 들어, 아미노산 측쇄와의 반응을 위한 알킨 및 아지드 부분을 갖는 PEG 유도체를 사용하여, PEG를 본원에 기재된 바와 같이 비천연적으로 코딩된 아미노산에 결합시킬 수 있다. 비천연적으로 코딩된 아미노산이 아지드를 포함하는 경우, PEG는 전형적으로 [3+2] 시클로부가 생성물을 형성하기 위한 알킬 부분, 또는 아미드 연결기를 형성하기 위한 포스핀기를 갖는 활성화된 PEG 종(즉, 에스테르, 카르보네이트)을 함유할 것이다. 대안적으로, 비천연적으로 코딩된 아미노산이 알킨을 포함하는 경우, PEG는 전형적으로 [3+2] 휘스겐 시클로부가 생성물을 형성하기 위한 아지드 부분을 함유할 것이다. 비천연적으로 코딩된 아미노산이 카르보닐기를 포함하는 경우, PEG는 전형적으로 상응하는 히드라존, 옥심 및 세미카르바존 연결기를 각기 형성시키기 위한 강한 친핵체(히드라지드, 히드라진, 히드록실아민 또는 세미카르바지드 작용기를 포함하나 이에 제한되지 않음)를 포함할 것이다. 다른 대안예로서, 상기 기재된 반응성 기의 배향의 역이 사용될 수 있는데, 즉 비천연적으로 코딩된 아미노산 내의 아지드 부분은 알킨 함유의 PEG 유도체와 반응할 수 있다.
일부 실시양태들에서, PEG 유도체를 갖는 폴리펩티드는 비천연적으로 코딩된 아미노산의 측쇄 상에 존재하는 화학적 작용기와 반응성인 화학적 작용기를 함유한다.
본 발명은 일부 실시양태들에서 평균 분자량이 약 800 Da 내지 약 100,000 Da인 수용성 중합체 골격을 포함하는 아지드- 및 아세틸렌-함유 중합체 유도체를 제공한다. 수용성 중합체의 중합체 골격은 폴리(에틸렌 글리콜)일 수 있다. 그러나, 폴리(에틸렌)글리콜 및 기타 관련 중합체(이는 폴리(덱스트란) 및 폴리프로필렌 글리콜을 포함함)를 포함하나 이에 제한되지 않는 매우 다양한 수용성 중합체들도 또한 본 발명의 수행에 사용하기에 적당하고, 용어 PEG 또는 폴리(에틸렌 글리콜)의 사용은 그러한 모든 분자들을 포괄하고 포함하도록 의도되어짐을 이해해야 한다. 용어 PEG에는 이작용성 PEG, 다수 팔을 가지는 PEG, 유도체화 PEG, 포크형 PEG, 분지형 PEG, 펜던트 PEG(즉, PEG, 또는 중합체 골격에 걸려 있는 1개 이상의 작용기를 갖는 관련 중합체), 또는 분해가능한 연결기가 안에 있는 PEG를 포함한 임의의 형태의 폴리(에틸렌 글리콜)이 포함되나 이들에 제한되지 않는다.
PEG는 전형적으로 투명, 무색, 무취, 수용성, 열 안정성, 많은 약품에 대한 불활성의 성질들을 가지고, 가수분해 또는 열화되지 않으며, 일반적으로 비독성이다. 폴리(에틸렌 글리콜)은 생체적합성인 것으로 간주되며, 이는 PEG가 유해를 유발하지 않으면서 생 조직 또는 유기체와 공존할 수 있음을 가리킨다. 보다 구체적으로, PEG는 실질적으로 비면역원성이고, 이는 PEG는 생체 내에서 면역 반응을 발생시키는 경향이 있지 않음을 가리킨다. PEG는 신체 내 일부 바람직한 기능을 갖는 분자, 예컨대 생물학적 활성제에 결합할 때, 그 생물학적 활성제를 마스킹하는 경향이 있고, 유기체가 생물학적 활성제의 존재를 견딜 수 있도록 임의의 면역 반응을 감소시키거나 제거할 수 있다. PEG 접합체는 실질적 면역 반응을 생성시키지 않거나, 응고 또는 기타 바람직하지 않은 효과를 일으키지 않는 경향이 있다. 화학식 --CH2CH2O--(CH2CH2O)n--CH2CH2--(식 중에서, n은 약 3 내지 약 4000, 전형적으로는 약 20 내지 약 2000임)을 갖는 PEG가 본 발명에 사용하기에 적당하다. 분자량이 약 800 Da 내지 약 100,000 Da인 PEG가 본 발명의 일부 실시양태들에서 중합체 골격으로서 특히 유용하다.
중합체 골격은 선형 또는 분지형일 수 있다. 분지형 중합체 골격은 일반적으로 당업계에 공지되어 있다. 전형적으로, 분지형 중합체는 중심 분지 코어 부분, 및 중심 분지 코어에 연결된 복수개의 선형 중합체 사슬을 가진다. PEG는 에틸렌 옥시드를 각종 폴리올, 예컨대 글리세롤, 글리세롤 올리고머, 펜타에리트리톨 및 소르비톨에 첨가함으로써 제조될 수 있는 분지형 형태로 통상 사용된다. 중심 분지 부분은 또한 수개의 아미노산, 예컨대 리신으로부터 유래될 수 있다. 분지형 폴리(에틸렌 글리콜)은 화학식 R(PEG-OH)m(식 중에서, R은 코어 부분, 예컨대 글리세롤, 글리세롤 올리고머 또는 펜타에리트리톨로부터 유래되고, m은 팔의 수를 나타냄)로서의 일반 형태로 표시될 수 있다. 다수 팔을 갖는 PEG 분자, 예컨대 본원에 각기 참고로 전체적으로 인용되는, U.S. 특허 No. 5,932,462 5,643,575; 5,229,490; 4,289,872; U.S. 특허출원 2003/0143596; WO 96/21469; 및 WO 93/21259에 기재된 것들이 또한 중합체 골격으로 사용될 수 있다.
분지형 PEG는 또한 PEG(--YCHZ2)n(식 중에서, Y는 연결기이고, Z는 한정된 길이의 원자의 사슬에 의해 CH에 연결된 활성화된 말단기임)의 포크형 PEG의 형태일 수 있다.
또 다른 분지형 형태인 펜던트 PEG는 PEG 사슬의 말단에서가 아니라, PEG 골격을 따라 반응성 기, 예컨대 카르복실을 가진다.
이 형태들의 PEG에 부가하여, 중합체는 또한 골격 내의 약하거나 분해가능한 연결기로 제조될 수 있다. 예를 들어, PEG는 가수분해되는 중합체 골격 내의 에스테르 연결기를 이용하여 제조될 수 있다. 이하 나와 있는 바와 같이, 이 가수분해는 중합체가 보다 낮은 분자량의 단편들로 절단되도록 한다:
-PEG-C02-PEG-+H20 → PEG-CO2H+HO-PEG-
용어 폴리(에틸렌 글리콜) 또는 PEG는 본원에 개시된 것들을 포함하나 이에 제한되지 않는, 당업계에 공지된 모든 것들을 나타내거나 포함한다는 것을 당업계의 숙련가에 의해 이해되어 진다.
많은 다른 중합체들도 또한 본 발명에 사용하기에 적당하다. 일부 실시양태들에서, 2 내지 약 300개 말단을 갖는, 수용성인 중합체 골격이 본 발명에서 특히 유용하다. 적당한 중합체의 예에는 다른 폴리(알킬렌 글리콜), 예컨대 폴리(프로필렌 글리콜)("PPG"), 그것의 공중합체(에틸렌 글리콜 및 프로필렌 글리콜의 공중합체를 포함하나 이에 제한되지 않음), 그것의 삼원중합체, 그것의 혼합물 등이 포함되나 이들에 제한되지 않는다. 중합체 골격의 각 사슬의 분자량은 다양할 수 있으나, 전형적으로는 약 800 Da 내지 약 100,000 Da, 종종 약 6,000 Da 내지 약 80,000 Da의 범위 내이다.
당업자는 실질적으로 수용성인 골격에 대한 상기 목록이 결코 모든 예들을 반영하는 것이 아니라 단지 예시적이라는 것과, 상기 기재된 특성들을 갖는 모든 중합체성 물질이 본 발명에 사용하기에 적당한 것으로 구상됨을 인식할 것이다.
본 발명의 일부 실시양태들에서, 중합체 유도체는 "다작용성"이며, 이는 중합체 골격이 작용기로 작용화 또는 활성화된 2개 이상의 말단, 또한 가능하게는 약 300개 정도로 많은 말단을 가짐을 의미한다. 다작용성 중합체 유도체에는 각 말단이 동일하거나 상이할 수 있는 작용기에 결합된, 2개의 말단을 갖는 선형 중합체가 포함되나 이들에 제한되지 않는다.
한 실시양태에서, 중합체 유도체는 구조:
X-A-폴리-B-N=N=N
(식 중에서,
N=N=N는 아지드 부분이고;
B는 연결부이며, 이는 존재 또는 부재할 수 있고;
폴리는 수용성의 비항원성 중합체이며;
A는 연결부이고, 이는 존재 또는 부재할 수 있으며, B와 동일하거나 상이할 수 있고;
X는 제2 작용기임)를 가진다.
A 및 B에 대한 연결부의 예에는 탄소수 18 이하, 더욱 바람직하게는 1 내지 10인 다작용화 알킬기가 포함되나 이들에 제한되지 않는다. 질소, 산소 또는 황과 같은 이종원자가 알킬 사슬에 포함될 수 있다. 알킬 사슬은 또한 이종 원자에서 분지화될 수 있다. A 및 B에 대한 연결부의 다른 예에는 탄소수 10 이하, 더욱 바람직하게는 5 내지 6인 다작용화 알릴기가 포함되나 이들에 제한되지 않는다. 그 아릴기는 하나 이상의 탄소 원자, 질소, 산소 또는 황 원자로 치환될 수 있다. 적당한 연결기의 다른 예에는 본원에 각기 참고로 인용되는 U.S. 특허 No. 5,932,462; 5,643,575; 및 U.S. 특허출원 공보 2003/0143596에 기재된 연결기들이 포함된다. 당업자는 연결부에 대한 상기 목록이 결코 모든 예들을 반영하는 것이 아니라 단지 예시적이라는 것과, 상기 기재된 특성들을 갖는 모든 연결부들이 본 발명에 사용하기에 적당한 것으로 구상됨을 인식할 것이다.
X로서 사용하기에 적당한 작용기의 예에는 히드록실, 보호된 히드록실, 알콕실, 활성 에스테르, 예컨대 N-히드록시숙신이미딜 에스테르 및 1-벤조트리아졸릴 에스테르, 활성 카르보네이트, 예컨대 N-히드록시숙신이미딜 카르보네이트 및 1-벤조트리아졸릴 카르보네이트, 아세탈, 알데히드, 알데히드 수화물, 알케닐, 아크릴레이트, 메타크릴레이트, 아크릴아미드, 활성 술폰, 아민, 아미노옥시, 보호된 아민, 히드라지드, 보호된 히드라지드, 보호된 티올, 카르복실산, 보호된 카르복실산, 이소시아네이트, 이소티오시아네이트, 말레이미드, 비닐술폰, 디티오피리딘, 비닐피리딘, 요오도아세트아미드, 에폭시드, 글리옥살, 디온, 메실레이트, 토실레이트, 트레실레이트, 알켄, 케톤 및 아지드가 포함되나 이들에 제한되지 않는다. 당업계의 숙련가에 의해 이해되어지는 바와 같이, 선택된 X 부분은 아지드와의 반응이 일어나지 않도록, 아지드기와 상용적이어야 한다. 아지드-함유 중합체 유도체는 동종이작용성(이는 제2 작용기(즉, X)가 또한 아지드 부분임을 의미함), 또는 이종이작용성(이는 제2 작용기가 상이한 작용기임을 의미함)일 수 있다.
용어 "보호된"은, 특정 반응 조건 하에서 화학적으로 반응성인 작용기의 반응을 예방하는 보호기 또는 보호 부분의 존재를 가리킨다. 보호기는 보호되는 화학적으로 반응성인 기의 유형에 따라 다양하다. 예를 들어, 화학적으로 반응성인 기가 아민 또는 히드라지드인 경우, 보호기가 tert-부틸옥시카르보닐(t-Boc) 및 9-플루오레닐메톡시카르보닐(Fmoc)의 군으로부터 선택될 수 있다. 화학적으로 반응성인 기가 티올인 경우, 보호기는 오르토피리딜디술피드일 수 있다. 화학적으로 반응성인 기가 카르복실산, 예컨대 부탄산 또는 프로피온산, 또는 히드록실기인 경우, 보호기는 벤질 또는 알킬기, 예컨대 메틸, 에틸 또는 tert-부틸일 수 있다. 당업계에 공지된 다른 보호기가 또한 본 발명에 사용될 수 있다.
문헌에서의 말단 작용기의 구체예에는 N-숙신이미딜 카르보네이트(예컨대, U.S. 특허 No. 5,281,698, No. 5,468,478 참고), 아민(예컨대, [Buckmann 등, Makromol. Chem. 182:1379(1981), Zalipsky 등, Eur. Polym. J. 19:1177(1983)] 참고), 히드라지드(예컨대, [Andresz 등, Makromol. Chem. 179:301(1978)] 참고), 숙신이미딜 프로피오네이트 및 숙신이미딜 부타노에이트(예컨대, [Olson 등, Poly(ethylene glycol) Chemistry & Biological Applications, pp 170-181, Harris & Zalipsky 편저, ACS, Washington, D. C., 1997]; 및 U.S. 특허 No. 5,672,662 참고), 숙신이미딜 숙시네이트(예컨대, [Abuchowski 등, Cancer Biochem. Biophys. 7:175(1984) 및 Joppich 등, Makrolol. Chem. 180:1381(1979)] 참고), 숙신이미딜 에스테르(예컨대, U.S. 특허 No. 4,670,417 참고), 벤조트리아졸 카르보네이트(예컨대, U.S. 특허 No. 5,650,234 참고), 글리시딜 에테르(예컨대, [Pitha 등, Eur. J Biochem. 94:11(1979), Elling 등, Biotech. Appl. Biochem. 13:354(1991)] 참고), 옥시카르보닐이미다졸(예컨대, [Beauchamp 등, Anal. Biochem. 131:25(1983), Tondelli 등, J. Controlled Release 1:251(1985)] 참고), p-니트로페닐 카르보네이트(예컨대, [Veronese 등, Appl. Biochem. Biotech., 11:141(1985)]; 및 [Sartore 등, Appi. Biochem. Biotech., 27:45(1991)] 참고), 알데히드(예컨대, [Harris 등, J. Polym. Sci. Chem. Ed. 22:341(1984)], U.S. 특허 No. 5,824,784, U.S. 특허 No. 5,252,714 참고), 말레이미드(예컨대, [Goodson 등, Bio/Technology 8:343(1990), Romani 등, Chemistry of Peptides and Proteins 2:29(1984)), 및 Kogan, Synthetic Comm. 22:2417(1992)] 참고), 오르토피리딜-디술피드(예컨대, [Woghiren 등, Bioconj. Chem. 4:314(1993)] 참고), 아크릴올(예컨대, [Sawhney 등, Macromolecules, 26:581(1993)] 참고), 비닐술폰(예컨대, U.S. 특허 No. 5,900,461 참고)가 포함되나 이들에 제한되지 않는다. 상기 참고문헌 및 특허 모두는 본원에 참고로 인용된다.
본 발명의 특정 실시양태들에서, 본 발명의 중합체 유도체는 구조:
X-CH2CH2O--(CH2CH2O)n--CH2CH2-N=N=N
(식 중에서,
X는 상기와 같은 작용기이고;
n은 약 20 내지 약 4000임)를 갖는 중합체 골격을 포함한다.
또 다른 실시양태에서, 본 발명의 중합체 유도체는 구조:
X-CH2CH2O--(CH2CH2O)n-CH2CH2-0-(CH2)m-W-N=N=N
(식 중에서,
W는 탄소수 1 내지 10의 지방족 또는 방향족 링커 부분이고;
n은 약 20 내지 약 4000이며;
X는 상기와 같은 작용기이고;
m은 1 내지 10임)를 갖는 중합체 골격을 포함한다.
본 발명의 아지드-함유 PEG 유도체는 당업계에 공지되고/되거나 본원에 개시된 각종 방법에 의해 제조될 수 있다. 하기 나와 있는 한 방법에서, 평균 분자량이 약 800 Da 내지 약 100,000 Da인 수용성 중합체 골격, 제1 말단이 제1 작용기에 결합되고 제2 말단이 적당한 이탈기에 결합된 중합체 골격은 아지드 음이온(이는 나트륨, 칼륨, tert-부틸암모늄 등을 포함한 수많은 적당한 짝이온들 중 임의의 것과 쌍을 이룰 수 있음)과 반응한다. 이탈기는 친핵성 치환을 겪고, 아지드 부분에 의해 치환되어, 요망되는 아지드-함유 PEG 중합체를 제공한다.
X-PEG-L+N3 - → X-PEG-N3
나와 있는 바와 같이, 본 발명에 사용하기에 적당한 중합체 골격은 화학식 X-PEG-L(식 중에서, PEG는 폴리(에틸렌 글리콜)이고, X는 아지드기와 반응하지 않는 작용기이며, L은 적당한 이탈기임)를 가진다. 적당한 작용기의 예에는 히드록실, 보호된 히드록실, 아세탈, 알케닐, 아민, 아미노옥시, 보호된 아민, 보호된 히드라지드, 보호된 티올, 카르복실산, 보호된 카르복실산, 말레이미드, 디티오피리딘, 및 비닐피리딘 및 케톤이 포함되나 이들에 제한되지 않는다. 적당한 이탈기의 예에는 클로라이드, 브로마이드, 요오다이드, 메실레이트, 트레실레이트 및 토실레이트가 포함되나 이들에 제한되지 않는다.
본 발명의 아지드-함유 중합체 유도체의 또 다른 제조 방법에서, 아지드 작용기를 갖는 연결제는 평균 분자량이 약 800 Da 내지 약 100,000 Da인 수용성 중합체 골격와 접촉되고, 여기에서 연결제는 PEG 중합체 상의 화학적 작용기와 선택적으로 반응하여, 아지드-함유 중합체 유도체 생성물을 형성하는 화학적 작용기를 가지고, 여기에서 아지드는 연결기에 의해 중합체 골격으로부터 분리된다.
한 예시적 반응식이 하기 나와 있다:
X-PEG-M + N-링커-N=N=N → PG-X-PEG-링커-N=N=N
(여기에서,
PEG는 폴리(에틸렌 글리콜)이고;
X는 캡핑기, 예컨대 알콕시 또는 상기와 같은 작용기이며;
M은 아지드 작용기와 반응성이지 않으나, N 작용기와는 효율적으로 또한 선택적으로 반응하는 작용기임).
적당한 작용기의 예에는, N이 아민인 경우, M이 카르복실산, 카르보네이트 또는 활성 에스테르이고; N이 히드라지드 또는 아미노옥시 부분인 경우, M이 케톤이며; N이 친핵체인 경우, M은 이탈기인 것들이 포함되나 이들에 제한되지 않는다.
조생성물의 정제는 생성물의 석출, 및 이어서 필요한 경우에 따라, 크로마토그래피를 포함하나 이에 제한되지 않는 공지 방법을 이용하여 달성될 수 있다.
보다 구체적인 예가 PEG 디아민의 경우에 하기 나와 있고, 여기에서 아민들 중 하나는 tert-부틸-Boc와 같은 보호기 부분에 의해 보호되고, 수득된 단일-보호된 PEG 디아민은 아지드 작용기를 갖는 연결 부분과 반응한다:
BocHN-PEG-NH2+HO2C-(CH2)3-N=N=N
이 예에서, 아민기는 티오닐 클로라이드 또는 카르보디이미드 시약 및 N-히드록시숙신이미드 또는 N-히드록시벤조트리아졸과 같은 각종 활성화제를 이용하여 카르복실산기에 결합되어, 모노아민 PEG 유도체와 아지드-함유 링커 부분 사이에 아미드 결합을 발생시킬 수 있다. 아미드 결합을 연속적으로 형성한 후에, 수득된 N-tert-부틸-Boc-보호 아지드-함유 유도체를 직접적으로 사용하여 생활성 분자를 변형시킬 수 있거나, 다른 유용한 작용기를 장착시키는 것을 추가로 구상할 수 있다. 예를 들어, N-t-Boc기는 강산과의 처리에 의해 가수분해되어, 오메가-아미노-PEG-아지드를 발생시킬 수 있다. 수득된 아민은 합성 핸들로 사용되어, 중요한 이종이작용성 시약을 발생시키기 위한 말레이미드기, 활성화된 디술피드, 활성화된 에스테르 등과 같은 다른 유용한 작용기를 장착시킬 수 있다.
상이한 분자를 중합체의 각 말단에 결합시키는 것이 요망되는 경우, 이종이작용성 유도체가 특히 유용하다. 예를 들어, 오메가-N-아미노-N-아지도 PEG는, 활성화된 친전자성 기를 갖는 분자, 예컨대 알데히드, 케톤, 활성화된 에스테르, 활성화된 카르보네이트 등을 PEG의 한 말단에 결합시키고, 아세틸렌기를 갖는 분자를 PEG의 다른 말단에 결합시키는 것을 허용할 것이다.
본 발명의 또 다른 실시양태에서, 중합체 유도체는 구조:
X-A-폴리-B-C≡C-R
(식 중에서,
R은 H 또는 알킬, 알켄, 알콕시, 또는 아릴 또는 치환 아릴기이고;
B는 연결부이며, 이는 존재 또는 부재할 수 있고;
폴리는 수용성의 비항원성 중합체이며;
A는 연결부이고, 이는 존재 또는 부재할 수 있고, B와 동일하거나 상이할 수 있으며; X는 제2 작용기임)를 가진다.
A 및 B에 대한 연결부의 예에는 탄소수 18 이하, 더욱 바람직하게는 1 내지 10인 다작용화 알킬기가 포함되나 이들에 제한되지 않는다. 질소, 산소 또는 황과 같은 이종원자가 알킬 사슬에 포함될 수 있다. 알킬 사슬은 또한 이종 원자에서 분지화될 수 있다. A 및 B에 대한 연결부의 다른 예에는 탄소수 10 이하, 더욱 바람직하게는 5 내지 6인 다작용화 알킬기가 포함되나 이들에 제한되지 않는다. 아릴기는 하나 이상의 탄소 원자, 질소, 산소 또는 황 원자로 치환될 수 있다. 적당한 연결기의 다른 예에는 본원에 각기 참고로 인용되는 U.S. 특허 No. 5,932,462; 5,643,575; 및 U.S. 특허출원 공보 2003/0143596에 기재된 연결기들이 포함된다. 당업자는 연결부에 대한 상기 목록이 결코 모든 예들을 반영하는 것이 아니라 단지 예시적이라는 것과, 상기 기재된 특성들을 갖는 매우 다양한 연결부들이 본 발명에 유용한 것으로 구상됨을 인식할 것이다.
X로서 사용하기에 적당한 작용기의 예에는 히드록실, 보호된 히드록실, 알콕실, 활성 에스테르, 예컨대 N-히드록시숙신이미딜 에스테르 및 1-벤조트리아졸릴 에스테르, 활성 카르보네이트, 예컨대 N-히드록시숙신이미딜 카르보네이트 및 1-벤조트리아졸릴 카르보네이트, 아세탈, 알데히드, 알데히드 수화물, 알케닐, 아크릴레이트, 메타크릴레이트, 아크릴아미드, 활성 술폰, 아민, 아미노옥시, 보호된 아민, 히드라지드, 보호된 히드라지드, 보호된 티올, 카르복실산, 보호된 카르복실산, 이소시아네이트, 이소티오시아네이트, 말레이미드, 비닐술폰, 디티오피리딘, 비닐피리딘, 요오도아세트아미드, 에폭시드, 글리옥살, 디온, 메실레이트, 토실레이트, 및 트레실레이트, 알켄, 케톤, 및 아세틸렌이 포함된다. 이해되어지는 바와 같이, 선택된 X 부분은 아세틸렌기와의 반응이 일어나지 않도록, 아세틸렌기와 상용적이어야 한다. 아세틸렌-함유 중합체 유도체는 동종이작용성(이는 제2 작용기(즉, X)가 또한 아세틸렌 부분임을 의미함), 또는 이종이작용성(이는 제2 작용기가 상이한 작용기임을 의미함)일 수 있다.
본 발명의 또 다른 실시양태에서, 중합체 유도체는 구조:
X-CH2CH2O--(CH2CH2O)n--CH2CH2-O-(CH2)m-C≡CH
(식 중에서,
X는 상기와 같은 작용기이고;
n은 약 2O 내지 약 4000이며;
m은 1 내지 10임)를 갖는 중합체 골격을 포함한다.
각 이종이작용성 PEG 중합체의 구체예가 이하에 나와 있다.
본 발명의 아세틸렌-함유 PEG 유도체는 당업계에 공지되고/되거나 본원에 개시된 각종 방법에 의해 제조될 수 있다. 한 방법에서, 평균 분자량이 약 800 Da 내지 약 100,000 Da인 수용성 중합체 골격, 제1 말단이 제1 작용기에 결합되고 제2 말단이 적당한 친핵성 기에 결합된 중합체 골격은 아세틸렌 작용기, PEG 상의 친핵성 기와 반응하기에 적당한 이탈기를 모두 갖는 화합물과 반응한다. 친핵성 부분 및 이탈기 함유 이탈기를 갖는 PEG 중합체가 조합될 때, 이탈기는 친핵성 치환을 겪고, 친핵성 부분에 의해 치환되어, 요망되는 아세틸렌-함유 PEG 중합체를 제공한다.
X-PEG-Nu + L-A-C → X-PEG-Nu-A-C≡CR'
나와 있는 바와 같이, 반응에 사용하기에 바람직한 중합체 골격은 식 X-PEG-Nu(식 중에서, PEG는 폴리(에틸렌 글리콜)이고, Nu는 친핵성 부분이며, X는 Nu, L 또는 아세틸렌 작용기와 반응하지 않는 작용기임)를 가진다
Nu의 예에는 SN2-형 기작을 통해 주로 반응하게 되는, 아민, 알콕시, 아릴옥시, 술프히드릴, 이미노, 카르복실레이트, 히드라지드, 아미노옥시기가 포함되나 이들에 제한되지 않는다. Nu 기의 부가적 예에는 친핵성 첨가 반응을 통해 주로 반응하게 되는 작용기들이 포함된다. L 기의 예에는 클로라이드, 브로마이드, 요오다이드, 메실레이트, 트레실레이트, 및 토실레이트, 및 친핵성 치환을 겪는 것으로 예상되는 기타 기, 및 케톤, 알데히드, 티오에스테르, 올레핀, 알파-베타 불포화 카르보닐기, 카르보네이트, 및 친핵체에 의해 부가를 겪는 것으로 예상되는 기타 친전자성 기가 포함된다.
본 발명의 또 다른 실시양태에서, A는 탄소수 1 내지 10의 지방족 링커, 또는 탄소수 6 내지 14의 치환된 아릴환이다. X는 아지드기와 반응하지 않는 작용기이고, L은 적당한 이탈기이다.
본 발명의 아세틸렌-함유 중합체 유도체의 제조를 위한 또 다른 방법에서, 평균 분자량이 약 800 Da 내지 약 100,000 Da이고, 보호된 작용기 또는 캡핑제를 한 말단에 가지고, 적당한 이탈기를 다른 말단에 가지는 PEG 중합체가 아세틸렌 음이온에 의해 접촉된다.
한 예시적 반응식이 하기 나와 있다:
X-PEG-L + -C≡CR' → X-PEG-C≡CR'
(식 중에서,
PEG는 폴리(에틸렌 글리콜)이고;
X는 캡핑기, 예컨대 알콕시 또는 상기와 같은 작용기이며;
R'은 H, 알킬, 알콕시, 아릴 또는 아릴옥시기, 또는 치환 알킬, 알콕실, 아릴 또는 아릴옥시기임).
상기 예에서, 이탈기 L은 충분한 농도의 아세틸렌 음이온과 접촉 시에 SN2-형 치환을 겪기 위해 충분히 반응성이어야 한다. 아세틸렌 음이온에 의한 이탈기의 SN2 치환을 달성하는데 필요한 반응 조건이 당업계에 공지되어 있다.
조생성물의 정제는 생성물의 석출, 및 그에 이어 필요한 경우, 크로마토그래피를 포함하나 이에 제한되지 않는 당업계에 공지된 방법에 의해 달성될 수 있다.
변경(증가 또는 감소를 포함하나 이에 제한되지 않음)된 약리학, 약물동태학 또는 약력학 특성들, 예컨대 생체내 반감기를 제공하기 위해, 본 발명의 폴리펩티드에 연결된 수용성 중합체의 폴리펩티드 사슬의 수 및 위치(즉, PEG화 또는 글리코실화 정도)가 조정될 수 있다. 일부 실시양태들에서, 폴리펩티드의 반감기는 비변형된 폴리펩티드에 비해, 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90%, 2배, 5배, 10배, 50배, 또는 약 100배 이상 증가된다.
강친핵성 기(즉, 히드라지드 , 히드라진, 히드록실아민 또는 세미카르바지드 )를 갖는 PEG 유도체
본 발명의 한 실시양태에서, 카르보닐-함유의 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 PEG 골격에 직접적으로 연결된 말단 히드라진, 히드록실아민, 히드라지드 또는 세미카르바지드 부분을 함유하는 PEG 유도체를 이용하여 변형된다.
일부 실시양태들에서, 히드록실아민-말단 PEG 유도체는 구조:
RO-(CH2CH2O)n-O-(CH2)m-O-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000(즉, 평균 분자량은 5 내지 40 kDa임)임)를 가질 것이다.
일부 실시양태들에서, 히드라진- 또는 히드라지드-함유 PEG 유도체는 구조:
RO-(CH2CH2O)n-O-(CH2)m-X-NH-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000이며, X는 임의적으로, 존재 또는 부재할 수 있는 카르보닐기(C=O)임)를 가질 것이다.
일부 실시양태들에서, 세미카르바지드-함유 PEG 유도체는 구조:
RO-(CH2CH2O)n-O-(CH2)m-NH-C(O)-NH-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000임)를 가질 것이다.
본 발명의 또 다른 실시양태에서, 카르보닐-함유 아미노산을 포함하는 폴리펩티드는 아미드 연결기에 의해 PEG 골격에 연결된 말단 히드록실아민, 히드라지드, 히드라진 또는 세미카르바지드 부분을 함유하는 PEG 유도체를 이용하여 변형된다.
일부 실시양태들에서, 히드록실아민-말단 PEG 유도체는 구조:
RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)(CH2)m-O-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000(즉, 평균 분자량은 5 내지 40 kDa임)임)를 가질 것이다.
일부 실시양태들에서, 히드라진- 또는 히드라지드-함유 PEG 유도체는 구조:
RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)(CH2)m-X-NH-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000이며, X는 임의적으로, 존재 또는 부재할 수 있는 카르보닐기(C=O)임)를 가진다.
일부 실시양태들에서, 세미카르바지드-함유 PEG 유도체는 구조:
RO-(CH2CH2O)n-0-(CH2)2-NH-C(O)(CH2)m-NH-C(O)-NH-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000임)를 가진다.
본 발명의 또 다른 실시양태에서, 카르보닐-함유 아미노산을 포함하는 폴리펩티드는 말단 히드라진, 히드록실아민, 히드라지드 또는 세미카르바지드 부분을 함유하는 분지형 PEG 유도체(분지형 PEG의 각 사슬은 MW가 10 내지 40 kDa, 더욱 바람직하게는 5 내지 20 kDa의 범위 내임)를 이용하여 변형된다.
본 발명의 또 다른 실시양태에서, 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 분지형 구조를 갖는 PEG 유도체를 이용하여 변형된다. 예를 들어, 일부 실시양태들에서, 히드라진- 또는 히드라지드-말단 PEG 유도체는 하기 구조:
[RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)]2CH(CH2)m-X-NH-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000이며, X는 임의적으로, 존재 또는 부재할 수 있는 카르보닐기(C=O)임)를 가질 것이다.
일부 실시양태들에서, 세미카르바지드기를 함유하는 PEG 유도체는 구조:
[RO-(CH2CH2O)n-O-(CH2)2-C(O)-NH-CH2-CH2]2CH-X-(CH2)m-NH-C(O)-NH-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, X는 임의적으로 NH, 0, S, C(O)이거나, 존재하지 않으며, m은 2 내지 10이며, n은 100 내지 1,000임)를 가질 것이다.
일부 실시양태들에서, 히드록실아민기를 함유하는 PEG 유도체는 구조:
[RO-(CH2CH2O)n-O-(CH2)2-C(0)-NH-CH2-CH2]2CH-X-(CH2)m-O-NH2
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, X는 임의적으로 NH, 0, S, C(O)이거나, 존재하지 않으며, m은 2 내지 10이며, n은 100 내지 1,000임)를 가질 것이다.
중합체의 활성화 및 펩티드의 접합을 위한 방법 및 화학작용이 문헌에 기재되어 있고, 당업계에 공지되어 있다. 중합체의 활성화를 위해 통상 이용되는 방법에는 시아노겐 브로마이드, 과요오드산염, 글루타르알데히드, 비에폭시드, 에피클로로히드린, 디비닐술폰, 카르보디이미드, 술포닐 할라이드, 트리클로로트리아진 등을 이용한 작용기의 활성화가 포함되나 이들에 제한되지 않는다([R. F. Taylor(1991), PROTEIN IMMOBILISATION. FUNDAMENTAL AND APPLICATIONS, Marcel Dekker, N. Y.; S. S. Wong, (1992), CHEMISTRY OF PROTEIN CONJUGATION AND CROSSLINKING, CRC Press, Boca Raton; G. T. Hermanson 등(1993), IMMOBILIZED AFFINITY LIGAND TECHNIQUES, Academic Press, N. Y.; Dunn, R.L. 등 편저, POLYMERIC DRUGS AND DRUG DELIVERY SYSTEMS, ACS Symposium Series 제469권, American Chemical Society, Washington, D. C. 1991)] 참고).
PEG의 작용화 및 접합에 대한 몇가지 평론 및 특수 논문들이 이용가능하다. 예를 들어, [Harris, Macromol . Chem . Phys . C25:325-373(1985); Scouten, Methods in Enzymology 135:30-65(1987); Wong 등, Enzyme Microb . Technol. 14:866-874(1992); Delgado 등, Critical Reviews in Therapeutic Drug Carrier Systems 9:249-304(1992); Zalipsky, Bioconjugate Chem . 6:150-165(1995)]를 참고한다.
중합체의 활성화 방법도 또한 [WO 94/17039, U.S. 특허 No. 5,324,844, WO 94/18247, WO 94/04193, U.S. 특허 No. 5,219,564, U.S. 특허 No. 5,122,614, WO 90/13540, U.S. 특허 No. 5,281,698 및 WO 93/15189]에서, 또한 활성화 중합체와 효소로서의 응고 인자 VIII 간의 접합 방법은 WO 94/15625에서, 활성화 중합체와 효소로서의 헤모글로빈 간의 접합 방법은 WO 94/09027에서, 활성화 중합체와 효소로서의 산소 담지 분자 간의 접합 방법은 U.S. 특허 No. 4,412,989에서, 활성화 중합체와 효소로서의 리보뉴클레아제 및 수퍼옥시드 디스뮤타제 간의 접합 방법은 [Veronese 등, App . Biochem . Biotech . 11:141-52(1985)]에서 찾아볼 수 있으며, 효소는 이들에 제한되지 않는다. 상기 언급된 모든 참고문헌 및 특허는 본원에 참고로 인용된다.
비천연적으로 코딩된 아미노산, 예컨대 p-아지도-L-페닐알라닌을 함유하는 폴리펩티드의 PEG화(즉, 임의의 수용성 중합체의 첨가)는 임의의 편의적 방법에 의해 수행된다. 예를 들어, 폴리펩티드는 알킨-말단 mPEG 유도체에 의해 PEG화된다. 간략히 말해, 과량의 고체 mPEG(5000)-O-CH2-C≡CH가 실온에서 교반 하에 p-아지도-L-Phe-함유 폴리펩티드의 수용액에 첨가된다. 전형적으로, 수용액은 반응이 수행되는 pH 부근(일반적으로 약 pH 4-10)에 pKa를 가지는 완충액으로 완충된다. pH 7.5에서 PEG화를 위해 적당한 완충액의 예에는 예를 들어, HEPES, 포스페이트, 보레이트, TRTS-HCl, EPPS 및 TES가 포함되나 이들에 제한되지 않는다. pH를 필요한 경우에는 연속적으로 모니터하여 조정한다. 반응은 전형적으로 약 1 내지 48시간 동안 계속되도록 한다.
반응 생성물을 후속하여 소수성 상호작용 크로마토그래피에 적용하여, 유리 mPEG(5000)-O-CH2-C≡CH, 및 비블록 PEG가 분자의 양 말단에서 활성화됨으로써 hGH 폴리펩티드 변종체 분자를 가교할 때 형성될 수 있는 PEG화 hGH 폴리펩티드의 임의의 고분자량 착체로부터 PEG화 폴리펩티드 변종체를 분리한다. 소수성 상호작용 크로마토그래피 동안의 조건은, 유리 mPEG(50O0)-O-CH2-C≡CH가 칼럼을 통해 흐르고, 한편 임의의 가교된 PEG화 hGH 폴리펩티드 변종체 착체가 1개 이상의 PEG 기에 접합된 1개의 hGH 폴리펩티드 변종체 분자를 함유하는 원하는 형태를 따라 용리되도록 하는 조건이다. 적당한 조건은 원하는 접합체 대비, 가교된 착체의 상대 크기에 따라 다양하고, 이는 당업계의 숙련가에 의해 용이하게 결정된다. 원하는 접합체를 함유하는 용리액은 초여과에 의해 농축되고, 투석여과에 의해 탈염된다.
필요한 경우, 소수성 크로마토그래피로부터 수득된 PEG화 폴리펩티드는, 친화도 크로마토그래피; 음이온- 또는 양이온-교환 크로마토그래피(DEAE 세파로스(단, 이에 제한되지 않음)의 이용); 실리카 상의 크로마토그래피; 역상 HPLC; 겔 여과(세파덱스 G-75(단, 이에 제한되지 않음)의 이용); 소수성 상호작용 크로마토그래피; 크기-배제 크로마토그래피, 금속-킬레이트 크로마토그래피; 초여과/투석여과; 에탄올 석출; 암모늄 술페이트 석출; 크로마토포커싱; 치환 크로마토그래피; 전기영동 절차(분취 등전점 포커싱을 포함하나 이에 제한되지 않음), 시차 용해도(암모늄 술페이트 석출을 포함하나 이에 제한되지 않음), 또는 추출을 포함하나 이에 제한되지 않는 당업계의 숙련가에게 공지된 1개 이상의 절차에 의해 추가 정제될 수 있다. 겉보기 분자량을 구형 단백질 표준물질과 비교함으로써 GPC에 의해 평가될 수 있다(PROTEIN PURIFICATION METHODS, A PRACTICAL APPROACH (Harris & Angal 편저) IRL Press 1989, 293-306). hGH-PEG 접합물의 순도는 단백질 분해(트립신 절단을 포함하나 이에 제한되지 않음), 및 그에 이은 질량 분광법 분석에 의해 평가될 수 있다[Pepinsky RB. 등, J. Pharmcol. & Exp . Ther . 297(3):1059-66(2001)].
본 발명의 폴리펩티드의 아미노산에 연결된 수용성 중합체는 추가로 비제한적으로 유도체화되거나 치환될 수 있다.
아지드 -함유 PEG 유도체
본 발명의 또 다른 실시양태에서, 폴리펩티드는 비천연적으로 코딩된 아미노산의 측쇄 상에 존재하는 알킨 부분과 반응하게 될 아지드 부분을 함유하는 PEG 유도체로 변형된다. 일반적으로, PEG 유도체는 평균 분자량이 1 내지 100 kDa 범위 내, 일부 실시양태들에서는 10 내지 40 kDa 범위 내일 것이다.
일부 실시양태들에서, 아지드-말단 PEG 유도체는 구조:
RO-(CH2CH2O)n-O-(CH2)m-N3
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000(즉, 평균 분자량은 5 내지 40 kDa임)임)를 가질 것이다.
또 다른 실시양태에서, 아지드-말단 PEG 유도체는 구조:
RO-(CH2CH2O)n-0-(CH2)m-NH-C(O)-(CH2)p-N3
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, p는 2 내지 10이고, n은 100 내지 1,000(즉, 평균 분자량은 5 내지 40 kDa임)임)를 가질 것이다.
본 발명의 또 다른 실시양태에서, 알킨-함유 아미노산을 포함하는 폴리펩티드는 말단 아지드 부분을 함유하는 분지형 PEG 유도체(분지형 PEG의 각 사슬은 MW가 10 내지 40 kDa, 더욱 바람직하게는 5 내지 20 kDa의 범위 내임)를 이용하여 변형된다. 예를 들어, 일부 실시양태들에서, 아지드-말단 PEG 유도체는 하기 구조:
[RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)]2CH(CH2)m-X-(CH2)pN3
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, p는 2 내지 10이고, n은 100 내지 1,000이며, X는 임의적으로, 각 경우에 존재 또는 부재할 수 있는 O, N, S 또는 카르보닐기(C=O)임)를 가질 것이다.
알킨 -함유 PEG 유도체
본 발명의 또 다른 실시양태에서, 폴리펩티드는 비천연적으로 코딩된 아미노산의 측쇄 상에 존재하는 아지드 부분과 반응하게 될 알킨 부분을 함유하는 PEG 유도체로 변형된다.
일부 실시양태들에서, 알킨-말단 PEG 유도체는 하기 구조:
R0-(CH2CH20)n-0-(CH2)m-C≡CH
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, n은 100 내지 1,000(즉, 평균 분자량은 5 내지 40 kDa임)임)를 가질 것이다.
본 발명의 또 다른 실시양태에서, 알킨-함유 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 아미드 연결기에 의해 PEG 골격에 연결된 말단 아지드 또는 말단 알킨 부분을 함유하는 PEG 유도체를 이용하여 변형된다.
일부 실시양태들에서, 알킨-말단 PEG 유도체는 하기 구조:
R0-(CH2CH20)n-0(CH2)m-NH-C(0)-(CH2)p-C≡CH
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, p는 2 내지 10이고, n은 100 내지 1,000임)를 가질 것이다.
본 발명의 또 다른 실시양태에서, 아지드-함유 아미노산을 포함하는 hGH 폴리펩티드는 말단 알킨 부분을 함유하는 분지형 PEG 유도체(분지형 PEG의 각 사슬은 MW가 10 내지 40 kDa, 더욱 바람직하게는 5 내지 20 kDa의 범위 내임)를 이용하여 변형된다. 예를 들어, 일부 실시양태들에서, 알킨-말단 PEG 유도체는 하기 구조:
[R0-(CH2CH2O)n-O-(CH2)2-NH-C(O)]2CH(CH2)m-X-(CH2)pC≡CH
(식 중에서, R은 단순 알킬(메틸, 에틸, 프로필 등)이고, m은 2 내지 10이며, p는 2 내지 10이고, n은 100 내지 1,000이며, X는 임의적으로 O, N, S 또는 카르보닐기(C=O)이거나 부재할 수 있음)를 가질 것이다.
포스핀-함유 PEG 유도체
본 발명의 또 다른 실시양태에서, 폴리펩티드는 비천연적으로 코딩된 아미노산의 측쇄 상에 존재하는 아지드 부분과 반응하게 될 아릴 포스핀기를 추가로 포함하는, 활성화된 작용기(에스테르, 카르보네이트를 포함하나 이에 제한되지 않음)를 함유하는 PEG 유도체를 이용하여 변형된다. 일반적으로, PEG 유도체는 평균 분자량이 1 내지 100 kDa 범위 내, 일부 실시양태들에서는 10 내지 40 kDa 범위 내일 것이다.
일부 실시양태들에서, PEG 유도체는 구조:
Figure 112007093262665-PCT00030
(식 중에서, n은 1 내지 10이고; X는 O, N, S이거나 존재하지 않을 수 있으며; Ph는 페닐이고; W는 수용성 중합체임)를 가질 것이다.
일부 실시양태들에서, PEG 유도체는 구조:
Figure 112007093262665-PCT00031
(식 중에서, X는 O, N, S이거나 존재하지 않을 수 있으며; Ph는 페닐이고; W는 수용성 중합체이며; R은 H, 알킬, 아릴, 치환 알킬 및 치환 아릴기일 수 있음)를 가질 것이다. 예시적 R 기에는 -CH2, -C(CH3)3, -OR', -NR'R", -SR', -할로겐, -C(O)R', -CONR'R", -S(O)2R', -S(O)2NR'R", -CN 및 -NO2가 포함되나 이에 제한되지 않는다. R', R", R"' 및 R""는 각기 독립적으로 수소, 치환 또는 비치환 헤테로알킬, 치환 또는 비치환 아릴(1-3 할로겐으로의 아릴 치환을 포함하나 이에 제한되지 않음), 치환 또는 비치환 알킬, 알콕시 또는 티오알콕시기, 또는 아릴알킬기를 가리킨다. 본 발명의 화합물이 1개 초과의 R 기를 포함할 때, 예를 들어 각 R 기는, 각 R', R", R" 및 R" 기들이 1개로 초과될 때 그 각각의 기와 마찬가지로, 독립적으로 선택된다. R' 및 R"가 동일한 질소 원자에 결합할 때, 그것들은 질소 원자와 함께 조합되어 5-, 6- 또는 7-원 환을 형성할 수 있다. 예를 들어, -NR'R"은 1-피롤리디닐 및 4-모르폴리닐을 포함하나 이에 제한되지 않는 의미이다. 치환기의 상기 논의로부터, 당업자는 용어 "알킬"은 수소기 외의 기에 결합된 탄소 원자를 포함하는 기, 예컨대 할로알킬(-CF3 및 -CH2CF3을 포함하나 이에 제한되지 않음), 및 아실(-C(O)CH3, -C(O)CF3, -C(O)CH2OCH3 등을 포함하나 이에 제한되지 않음)을 포함하는 의미임을 이해할 것이다.
기타 PEG 유도체 및 일반적 PEG 화 기법
폴리펩티드에 연결될 수 있는 다른 예시적 PEG 분자, 및 PEG화 방법에는 예컨대, 본원에 각기 참고로 인용되는, U.S. 특허 공보 No. 2004/0001838; 2002/0052009; 2003/0162949; 2004/0013637; 2003/0228274; 2003/0220447; 2003/0158333; 2003/0143596; 2003/0114647; 2003/0105275; 2003/0105224; 2003/0023023; 2002/0156047; 2002/0099133; 2002/0086939; 2002/0082345; 2002/0072573; 2002/0052430; 2002/0040076; 2002/0037949; 2002/0002250; 2001/0056171; 2001/0044526; 2001/0027217; 2001/0021763; U.S. 특허 No. 6,646,110; 5,824,778; 5,476,653; 5,219,564; 5,629,384; 5,736,625; 4,902,502; 5,281,698; 5,122,614; 5,473,034; 5,516,673; 5,382,657; 6,552,167; 6,610,281; 6,515,100; 6,461,603; 6,436,386; 6,214,966; 5,990,237; 5,900,461; 5,739,208; 5,672,662; 5,446,090; 5,808,096; 5,612,460; 5,324,844; 5,252,714; 6,420,339; 6,201,072; 6,451,346; 6,306,821; 5,559,213; 5,612,460; 5,747,646; 5,834,594; 5,849,860; 5,980,948; 6,004,573; 6,129,912; WO 97/32607, EP 229,108, EP 402,378, WO 92/16555, WO 94/04193, WO 94/14758, WO 94/17039, WO 94/18247, WO 94/28024, WO 95/00162, WO 95/11924, WO 95/13090, WO 95/33490, WO 96/00080, WO 97/18832, WO 98/41562, WO 98/48837, WO 99/32134, WO 99/32139, WO 99/32140, WO 96/40791, WO 98/32466, WO 95/06058, EP 439 508, WO 97/03106, WO 96/21469, WO 95/13312, EP 921 131, WO 98/05363, EP 809 996, WO 96/41813, WO 96/07670, EP 605 963, EP 510 356, EP 400 472, EP 183 503 및 EP 154 316에 기재된 것들이 포함된다. 본원에 기재된 임의의 PEG 분자는 단일 사슬, 분지형 사슬, 다수 팔 사슬, 단작용성, 이작용성, 다작용성 또는 이들의 임의의 조합을 포함하나 이에 제한되지 않는 임의의 형태로 사용될 수 있다.
X. 폴리펩티드의 글리코실화
본 발명은 당 잔기를 갖는 1개 이상의 비천연적으로 코딩된 아미노산이 도입된 폴리펩티드를 포함한다. 당 잔기는 천연(N-아세틸글루코사민을 포함하나 이에 제한되지 않음) 또는 비천연(3-플루오로갈락토스를 포함하나 이에 제한되지 않음)일 수 있다. 당이 N- 또는 0-연결 글리코시딕 연결기(N-아세틸갈락토스-L-세린을 포함하나 이에 제한되지 않음) 또는 비천연 연결기(옥심 또는 상응하는 C- 또는 S-연결 글리코시드를 포함하나 이에 제한되지 않음)을 통해 비천연적으로 코딩된 아미노산에 연결될 수 있다.
당(글리코실을 포함하나 이에 제한되지 않음) 부분은 생체내 또는 시험관내 폴리펩티드에 첨가될 수 있다. 본 발명의 일부 실시양태들에서, 카르보닐-함유 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 아미노옥시기로 유도체화된 당으로 변형되어, 옥심 연결기를 통해 연결된 상응하는 글리코실화 폴리펩티드를 발생시킨다. 당은 일단 비천연적으로 코딩된 아미노산에 결합되면, 당은 글리코실트랜스퍼라제 및 기타 효소를 이용한 처리로써 폴리펩티드에 결합된 이당류를 발생시키기 위해 구상될 수 있다. 이에 대해 예컨대, [H. Liu 등, J. Am . Chem . Soc . 125:1702-1703(2003)]을 참고한다.
본 발명의 일부 실시양태들에서, 카르보닐-함유 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 아미노옥시 유도체로서 제조된 한정된 구조를 갖는 글리칸을 이용하여 직접적으로 변형된다. 당업자는 아지드, 알킨, 히드라지드, 히드라진 및 세미카르바지드를 포함한 다른 작용기들을 사용하여 당을 비천연적으로 코딩된 아미노산에 연결할 수 있음을 인식할 것이다.
본 발명의 일부 실시양태들에서, 아지드 또는 알키닐-함유 비천연적으로 코딩된 아미노산을 포함하는 폴리펩티드는 이어서, 알키닐 또는 아지드 유도체(단, 이에 제한되지 않음)와의 휘스겐 [3+2] 시클로부가 반응(단, 이에 제한되지 않음)에 의해 변형될 수 있다. 이 방법은 단백질이 극히 높은 선택도로 변형되도록 한다.
XIV . 투여 및 약제학적 조성물
본 발명의 폴리펩티드 또는 단백질(1개 이상의 비천연 아미노산을 포함하는 단백질 등을 포함하나 이에 제한되지 않음)은, 적당한 약제학적 담체와 조합하여(단, 이에 제한되지 않음), 치료 용도를 위해 임의적으로 이용된다. 그러한 조성물은, 예를 들어 치료 유효량의 화합물, 및 약제학적으로 허용가능한 담체 또는 부형제를 포함한다. 그러한 담체 또는 부형제에는 식염수, 완충 식염수, 덱스트로스, 물, 글리세롤, 에탄올, 및/또는 이들의 조합이 포함되나 이들에 제한되지 않는다. 제형물은 투여 방식에 적합하게 제조된다. 일반적으로, 단백질 투여 방법은 당업계에 공지되어 있고, 이는 본 발명의 폴리펩티드의 투여에 적용될 수 있다.
본 발명의 1개 이상의 폴리펩티드를 포함하는 치료 조성물은 임의적으로 질병의 1개 이상의 적절한 시험관내 및/또는 생체내 동물 모델에서 시험되어, 당업계에 공지된 방법에 따라, 효능, 조직 대사가 확인되고 투약량이 평가된다. 특히, 투약량은 천연 아미노산 동종체에 대한 비천연 아미노산의 활성, 안정성 또는 기타 적당한 척도(천연 아미노산 폴리펩티드 대비, 1개 이상의 비천연적으로 코딩된 아미노산을 포함하도록 변형된 폴리펩티드의 비교를 포함하나 이에 제한되지 않음)에 의해, 즉 적절한 검정으로 초기에 구해질 수 있다.
투여는 혈액 또는 조직 세포와 궁극적으로 접촉되는 분자를 도입하는데 정상적으로 사용되는 경로들 중 임의의 경로에 의해 행해진다. 본 발명의 비천연적으로 코딩된 아미노산 폴리펩티드는, 임의적으로 1개 이상의 약제학적으로 허용가능한 담체와 함께, 임의의 적당한 방식으로 투여된다. 환자에게 본 발명의 영역 내에서의 상기 폴리펩티드의 적당한 투여 방법이 이용가능하고, 1개 초과의 경로를 사용하여 특별한 조성물을 투여할 수 있으나, 특별한 경로는 종종 다른 경로보다 더욱 즉각적이고 더욱 효과적인 작용 또는 반응을 제공할 수 있다.
약제학적으로 허용가능한 담체는 부분적으로는, 투여되는 특별한 조성물에 의해, 또한 조성물을 투여하는데 사용되는 특별한 방법에 의해 결정된다. 따라서, 본 발명의 약제학적 조성물의 매우 다양한 적당한 제형들이 있다.
폴리펩티드 조성물은 경구, 정맥내, 복강내, 근육내, 경피, 피하, 국소, 설하 또는 직장 수단을 포함하나 이에 제한되지 않는 수많은 경로들에 의해 투여될 수 있다. 변형 또는 비변형된 비천연 아미노산 폴리펩티드를 포함하는 조성물은 또한 리포좀을 통해 투여될 수 있다. 그러한 투여 경로 및 적절한 제형은 일반적으로 당업자에게 공지되어 있다.
단독 또는 다른 적당한 성분과 조합되는, 비천연 아미노산을 포함하는 폴리펩티드는 또한 에어로졸 제형물로 제조되어(즉, "분무될(nebulized)" 수 있음), 흡입을 통해 투여될 수 있다. 에어로졸 제형물은 가압된 허용가능한 추진제, 예컨대 디클로로디플루오로메탄, 프로판, 질소 등에 놓일 수 있다.
예를 들어 관절내(관절 내부), 정맥내, 근육내, 피내, 복강내, 및 피하 경로와 같은 비경구 투여에 적당한 제형물에는 산화방지제, 완충액, 제균제 및, 제형물이 의도된 수령자의 혈액과 등장성이 되도록 하는 용매화물을 함유할 수 있는 수성 및 비수성의 등장성 무균 주사 용액, 및 현탁화제, 가용화제, 증점제, 안정화제, 및 보존제를 포함할 수 있는 수성 및 비수성 무균 현탁액이 포함된다. 팩키징된 핵산의 제형물은 단일 투약 또는 다중 투약 봉지 용기, 예컨대 앰퓰 및 바이얼 내에 제공될 수 있다.
비경구 투여 및 정맥내 투여가 바람직한 투여 방법이다. 특히, 현 사용 중인 제형물과 함께, 천연 아미노산 동종체 치료제를 위해 이미 사용되는 투여 경로(전형적으로 EPO, GH, G-CSF, GM-CSF, IFN, 인터류킨, 항체, 및/또는 임의의 기타 약제학적으로 전달되는 단백질을 위해 사용되는 것들을 포함하나 이에 제한되지 않음)는 본 발명의 폴리펩티드의 바람직한 투여 경로 및 제형을 제공한다.
본 발명의 영역 내에서 환자에게 투여되는 용량은, 경시적으로 환자에게 있어 유익한 치료 반응을 가지게 하기에, 또는 병원체에 의한 감염을 억제하기에(단, 이에 제한되지 않음), 또는 용량에 따라 기타 적절한 활성을 가지도록 하기에 충분한 양이다. 용량은 특별한 벡터 또는 제형물의 효능, 및 이용되는 비천연적으로 코딩된 아미노산 폴리펩티드의 활성, 안정성 또는 혈청 반감기, 및 환자의 상태, 또한 피처리 환자의 체중 또는 표면적에 의해 결정된다. 용량의 크기도 또한 특별한 환자에게 있어서의 특별한 벡터, 제형물 등의 투여를 동반하는 임의의 부정적 부작용의 존재, 성질 및 정도에 의해 결정된다.
질병(암, 유전 질병, 당뇨, AIDS 등을 포함하나 이에 제한되지 않음)의 치료 또는 예방 시에 투여되는 벡터 또는 제형물의 유효량을 결정할 때, 의사는 순환 혈장 수준, 제형물 독성, 질병의 진척도, 및/또는 적절한 경우, 항-비천연적으로 코딩된 아미노산 폴리펩티드 항체의 생산을 평가한다.
예를 들어 70 킬로그램 환자에게 투여되는 용량은 전형적으로 관련 조성물의 변경된 활성 또는 혈청 반감기를 위해 조정되는 현재 사용되는 치료적 단백질의 투약량과 동등한 범위 내이다. 본 발명의 벡터는 항체 투여, 백신 투여, 세포독성제, 천연 아미노산 폴리펩티드, 핵산, 뉴클레오티드 유사체, 생물학적 반응 개질제 등의 투여를 포함한, 임의의 공지된 통상적 치료법에 의해 처치 상태를 보충할 수 있다.
투여를 위해, 본 발명의 제형물은 관련 제형물의 LD-50 또는 ED-50, 및/또는 환자의 체중 및 전반적 건강에 대해 적용되는(단, 이에 제한되지 않음) 각종 농도에서의 비천연적으로 코딩된 아미노산의 임의의 부작용의 관찰에 의해 결정되는 속도로 투여된다. 투여는 단일 또는 분할 용량을 통해 달성될 수 있다.
제형물을 주입받는 환자가 고열, 오한 또는 근육통을 나타내는 경우, 환자는 적절한 용량의 아스피린, 이부프로펜, 아세트아미노펜 또는 기타 통증/고열 억제 약물을 섭취한다. 고열, 근육통 및 오한과 같은, 주입에 대한 반응을 겪는 환자는 이후에 아스피린, 아스테아미노펜, 또는 비제한적 예로서의 디페닐히드라민을 주입하기 30분 전에 예비 약제처리된다. 진통제 및 항히스타민제에 급속히 반응하지 않는 보다 심각한 오한 및 근육통에 대해 메페리딘을 사용한다. 세포 주입은 반응의 심각도에 따라 속도가 완화되거나 중단된다.
본 발명의 폴리펩티드는 포유동물 대상에게 직접적으로 투여될 수 있다. 투여는 대상에게 폴리펩티드를 도입하는데 정상적으로 사용되는 경로들 중 임의의 것에 의해 행해진다. 본 발명의 실시양태들에 따른 폴리펩티드 조성물에는 경구, 직장, 국소, 흡입(에어로졸을 통한 흡입을 포함하나 이에 제한되지 않음), 협측(설하를 포함하나 이에 제한되지 않음), 질내, 비경구(피하, 근육내, 피내, 관절내, 흉막내, 복강내, 뇌내, 동맥내 또는 정맥내를 포함하나 이에 제한되지 않음), 국소(즉, 기도 표면을 포함한, 피부 및 근육 표면을 모두 포함함), 및 경피 투여에 적당한 것들이 포함되나, 임의의 소정의 경우에서 가장 적당한 경로는 피처리 상태의 성질 및 심각도에 의존할 것이다. 투여는 국소적 또는 전신적일 수 있다. 화합물의 제형물은 단일 투약 또는 다중 투약 용기, 예컨대 앰퓰 및 바이얼 내에 제공될 수 있다. 본 발명의 폴리펩티드는 약제학적으로 허용가능한 담체와 함께 단위 투약 주사가능한 형태(현탁액 또는 유화액을 포함하나 이에 제한되지 않음)의 혼합물 내 제공될 수 있다. 본 발명의 폴리펩티드는 또한 연속적 주입(삼투압 펌프와 같은 미니펌프를 포함하나 이에 제한되지 않음), 단일 볼루스 또는 서방성 데포 제형물에 의해 투여될 수 있다.
투여에 적당한 제형물에는, 산화방지제, 완충액, 제균제, 및 제형물을 등장성으로 만드는 용매화물을 함유할 수 있는, 수성 및 비수성 용액의 등장성 무균 용액, 및 현탁화제, 가용화제, 증점제, 안정화제 및 보존제를 포함할 수 있는 수성 및 비수성 무균 현탁액이 포함될 수 있다. 용액 및 현탁액은 상기 기술된 종류의 무균 분말, 과립 및 정제로부터 제조될 수 있다.
본 발명의 약제학적 조성물은 약제학적으로 허용가능한 담체를 포함할 수 있다. 약제학적으로 허용가능한 담체는 부분적으로는 투여되는 특별한 조성에 의해, 또한 조성물을 투여하는데 사용되는 특별한 방법에 의해 결정된다. 따라서, 본 발명의 약제학적 조성물(임의적 약제학적으로 허용가능한 담체, 부형제 또는 안정화제를 포함함)의 매우 다양한 적당한 제형들이 있다(예컨대, [Remington's Pharmaceutical Sciences, 제17판, 1985)] 참고).
적당한 담체에는 포스페이트, 보레이트, HEPES, 시트레이트, 및 기타 유기산을 함유하는 완충액; 아스코르브산을 포함하는 산화방지제; (약 10개 미만의 잔기의) 저분자량인 폴리펩티드; 단백질, 예컨대 혈청 알부민, 젤라틴 또는 면역글로불린; 친수성 중합체, 예컨대 폴리비닐피롤리돈; 아미노산, 예컨대 글리신, 글루타민, 아스파라긴, 아르기닌 또는 리신; 단당류, 이당류, 및 포도당, 만노스 또는 덱스트린을 포함한 기타 탄수화물; EDTA와 같은 킬레이트화제; 아연, 코발트 또는 구리와 같은 이가 금속 이온; 만니톨 또는 소르비톨과 같은 당 알코올; 나트륨과 같은 염-형성 짝이온; 및/또는 트윈(Tween)TM, 플루로닉스(Pluronics)TM, 또는 PEG와 같은 비이온성 계면활성제를 함유하는 완충액이 포함된다.
PEG와 같은 수용성 중합체에 연결된 것들을 포함한 본 발명의 폴리펩티드는 또한 지연 방출성 시스템에 의해, 또는 그 시스템의 일부로서 투여될 수 있다. 지연 방출성 조성물에는 필름 또는 마이크로캡슐을 포함하나 이에 제한되지 않는 성형품의 형태의 반투과성 중합체 매트릭스를 포함하나 이에 제한되지 않는다. 지연 방출성 매트릭스에는, 폴리(2-히드록시에틸 메타크릴레이트)(Langer 등, J. Biomed . Mater . Res., 15:267-277(1981); Langer, Chem . Tech ., 12:98-105(1982)), 에틸렌 비닐 아세테이트(Langer 등, 이하 동일) 또는 폴리-D-(-)-3-히드록시부티르산(EP 133,988), 폴리락티드(폴리락트산)(U.S. 특허 No. 3,773,919; EP 58,481), 폴리글리콜리드(글리콜산의 중합체), 폴리락티드 코-글리콜리드(락트산 및 글리콜산의 공중합체) 폴리무수물, L-글루탐산 및 감마-에틸-L-글루타메이트의 공중합체(Sidman 등, Biopolymers, 22, 547-556(1983)), 폴리(오르토)에스테르, 폴리펩티드, 히알루론산, 콜라겐, 콘드로이틴 술페이트, 카르복실산, 지방산, 인지질, 다당류, 핵산, 폴리아미노산, 아미노산, 예컨대 페닐알라닌, 티로신, 이소루이신, 폴리뉴클레오티드, 폴리비닐 프로필렌, 폴리비닐피롤리돈 및 실리콘과 같은 생체적합성 물질로부터의 것들이 포함된다. 지연 방출성 조성물에는 리포좀내 포획된 화합물이 포함된다. 화합물을 포함하는 리포좀은 지금까지 공지된 방법, 예컨대 DE 3,218,121; Eppstein 등, Proc . Natl. Acad . Sci . U.S.A., 82:3688-3692(1985); Hwang 등, Proc . Natl . Acad . Sci. U.S.A., 77:4030-4034(1980); EP 52, 322; EP 36,676; EP 88,046; EP 143,949; EP 142,641; 일본 특허 출원 83-118008; U.S. 특허 No. 4,485,045 및 4,544,545; 및 EP 102,324에 기재된 방법에 의해 제조된다. 상기 언급된 모든 참고문헌 및 특허는 본원에 참고로 인용된다.
리포좀내 포획된 폴리펩티드는 예컨대, [DE 3,218,121; Epstein 등, Proc. Natl . Acad . Sci . U.S.A., 82:3688-3692(1985); Hwang 등, Proc . Natl . Acad. Sci . U.S.A., 77:4030-4034(1980); EP 52,322; EP 36,676; EP 88,046; EP 143,949; EP 142,641; 일본 특허 출원 83-118008; U.S. 특허 No. 4,485,045 및 4,544,545; 및 EP 102,324]에 기재된 방법에 의해 제조될 수 있다. 리포좀의 조성 및 크기는 당업자에게 공지되어 있거나, 당업자에 의해 실험적으로 용이하게 결정될 수 있다. 리포좀의 일부 예들에는 예컨대, [Park JW 등, Proc . Natl . Acad. Sci . USA 92:1327-1331(1995); Lasic D 및 Papahadjopoulos D(편저): MEDICAL APPLICATIONS OF LIPOSOME(1998); Drunimond DC 등, Liposomal drug delivery systems for cancer therapy, Teicher B(편저): CANCER DRUG DISCOVERY AND DEVELOPMENT(2002); Park JW 등, Glin . Cancer Res . 8:1172-1181(2002); Nielsen UB 등, Biochim . Biophys . Acta 1591(1-3):109-118(2002); Mamot C 등, Cancer Res . 63:3154-3161(2003)]에 기재된 것들이 포함된다. 상기 언급된 모든 참고문헌 및 특허는 본원에 참고로 인용된다.
본 발명의 영역 내에서의 환자에게 투여되는 용량은 경시적으로 대상에게 유익한 반응을 유발하기에 충분해야 한다. 일반적으로, 투약 당 비경구 투여된 본 발명의 폴리펩티드의 총 약제학적으로 유효량은 치료별로 다르나, 약 0.01 μg/환자 체중 kg/일 내지 약 100 μg/환자 체중 kg, 또는 약 0.05 mg/환자 체중 kg 내지 약 1 mg/환자 체중 kg이다. 또한, 투약 빈도도 또한 치료별에 따라 따르며, 인간에게 사용하도록 승인된 시중 입수가능한 폴리펩티드 제품보다 더 빈번하거나 덜 빈번할 수 있다. 일반적으로, 본 발명의 PEG화 폴리펩티드는 상기 기재된 투여 경로들 중 임의의 것에 의해 투여될 수 있다.
하기 실시예들은 청구된 발명을 설명하기 위해 제공된 것으로, 본 발명을 제한하지 않는다.
실시예 1
오르소고날 tRNA (O-tRNA) 및 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 포함하는 슈도모나스 종 숙주 세포 번역 시스템을 사용하여, 비천연적으로 코딩된 아미노산을 함유하는 hGH를 발현한다. O-RS는 비천연적으로 코딩된 아미노산으로 O-tRNA를 우선적으로 아미노아실화한다. 이에, 슈도모나스 번역 시스템은 코딩된 셀렉터 코돈에 대한 반응으로, 비천연적으로 코딩된 아미노산을 hGH에 삽입한다. 슈도모나스 종에 대한 폴리펩티드 발현 시스템은 당업계에 기재된 바대로 구축된다([Production of Recombinant Proteins: Novel Microbial and Eukaryotic Expression Systems, Gellissen(편저), John Wiley & Sons, Inc. publisher, 2005] 참고). 슈도모나스 플루오레슨스 Biovar I 균주 MB101이 이용된다.
O- RS 및 O- tRNA 서열
Figure 112007093262665-PCT00032
Figure 112007093262665-PCT00033
Figure 112007093262665-PCT00034
변형된 hGH 유전자 및 오르소고날 아미노아실 tRNA 합성효소/tRNA 쌍(원하는 비천연적으로 코딩된 아미노산에 대해 특이적임)을 함유하는 플라스미드를 이용한 P. 플루오레슨스의 형질전환은, 비천연적으로 코딩된 아미노산이 hGH 폴리펩티드로 부위-특이적으로 도입되도록 한다. 0.01 내지 100 mM의 특별한 비천연적으로 코딩된 아미노산을 함유하는 배지에서 37℃에서 성장한 형질전환된 P. 플루오레슨스는 매우 신뢰도있게 또한 효율적으로 변형된 hGH를 발현한다. 비천연적으로 코딩된 아미노산을 함유하는 His-택이 있는 hGH는 가용성 단백질, 봉입체 또는 응집체로서 슈도모나스 숙주 세포에 의해 생성된다. hGH의 정제 방법이 당업계에 공지되어 있고, SDS-PAGE, 웨스턴 블롯 분석 또는 전기분무-이온화 이온 포획 질량 분광법 등에 의해 확인된다.
His-택이 있는 hGH 단백질을 제조업자에 의해 제공되는 표준 His-택이 있는 단백질 정제 절차를 통해 프로본드 니켈-킬레이트화 수지(ProBond Nickel-Chelating Resin(인비트로겐(Invitrogen), 미국 캘리포니아주 칼스배드 소재))를 이용하여 정제하고, 그에 이어 음이온 교환 칼럼을 행한 후, 겔에 로딩한다.
변형된 hGH 폴리펩티드의 생물학적 활성을 추가로 평가하기 위해, hGH의 다운스트림 마커의 그것의 수용체와의 상호작용을 측정하는 검정을 이용한다. hGH의 그것의 내인 생산 수용체와의 상호작용으로, 인간 IM-9 임파구 세포주에서 전사 계열 구성원 STAT5의 신호 전달자 및 활성자의 티로신 포스포릴화가 초래된다.
IM-9 세포를 본 발명의 hGH 폴리펩티드로 자극한다. 인간 IM-9 임파구를 ATCC(미국 버지니아주 마나사스 소재)에서 구매하여, 피루브산나트륨, 페니실린, 스트렙토마이신(인비트로겐, 미국 샌디에고주 칼스배드 소재) 및 10% 열 불활성화 우태 혈청(하이클론(Hyclone), 미국 유타주 로간 소재)로 보충된 RPMI 1640에서 성장시킬 수 있다. IM-9 세포를 검정 배지(페놀-레드 불포함 RPMI, 1O mM 헤페스(Hepes), 1% 열 불활성화 차콜/덱스트란 처리 FBS, 피루브산나트륨, 페니실린 및 스트렙토마이신)에서 하룻밤 동안 기아시킨 후, 12-점 투여량 범위의 hGH 폴리펩티드로 10분간 37℃에서 투여하여 자극한다. 자극된 세포를 1% 포름알데히드로 고정한 후, 얼음 위에서 1시간 동안 90% 빙냉 메탄올로 투과화한다. STAT5 포스포릴화 수준을 실온에서 30분 동안 일차 포스포-STAT5 항체(셀 시그널링 테크놀로지(Cell Signaling Technology), 미국 메사추세츠주 비벌리 소재)), 및 그에 이어 PE-접합 2차 항체로 세포내 염색에 의해 검출한다. 샘플 습득을 플로우조(Flowjo) 소프트웨어(트리 스타 인코포레이티드(Tree Star Inc.), 미국 오레곤주 애쉬랜드 소재))에서 분석된 습득된 데이터를 이용하여 FACS 어레이로 수행한다. EC50 값은 시그마플롯(SigmaPlot)을 이용하여 단백질 농도에 대해 평균 형광 강도(MFI)를 플로팅한 투여량 반응 곡선으로부터 유래된다.
실시예 2
이 실시예는 카르보닐-함유 아미노산의 도입, 및 아미노옥시-함유 PEG와의 후속 반응을 상세히 설명한다.
이 실시예는 후속하여 대략 5,000 MW의 아미노옥시-함유 PEG와 반응하게 되는 케톤-함유의 비천연적으로 코딩된 아미노산이 도입된 폴리펩티드의 발생 방법을 입증한다. 선택된 아미노산 위치는 하기 구조를 갖는 비천연적으로 코딩된 아미노산으로 분리하여 치환될 수 있다:
Figure 112007093262665-PCT00035
카르보닐-함유 아미노산을 포함하는 hGH 폴리펩티드 변종체는 일단 변형되면, 형태:
R-PEG(N)-O-(CH2)n-O-NH2
(식 중에서, R은 메틸이고, n은 3이며, N은 대략 5,000 MW임)의 아미노옥시-함유 PEG 유도체와 반응한다. 이어서, PEG-hGH를 적절한 완충액에 희석하여, 즉시 정제 및 분석을 행한다.
실시예 3
아미드 연결기를 통해 PEG에 연결된 히드록실아민기로 구성된 PEG와의 접합
실시예 3에 기재된 절차를 이용하여 하기 구조를 갖는 PEG 시약을 케톤-함유의 비천연적으로 코딩된 아미노산에 결합시킨다:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-O-NH2
(식 중에서, R은 메틸이고, n은 4이며, N은 대략 20,000 MW임). 반응, 정제 및 분석 조건은 실시예 3에 기재된 바와 같다.
실시예 4
이 실시예는 2개의 별개의 비천연적으로 코딩된 아미노산의 hGH 폴리펩티드로의 도입을 상세히 설명한다.
이 실시예는 2개 위치에 케톤 작용기를 포함하는 비천연적으로 코딩된 아미노산이 도입된 hGH 폴리펩티드의 발생 방법을 입증한다. 서프레서 코돈을 핵산 내의 2개의 별개의 부위에서 도입함을 제외하고는, 본원에 기재된 방식대로 hGH 폴리펩티드를 제조한다.
실시예 5
이 실시예는 hGH 폴리펩티드의 히드라지드-함유 PEG로의 접합, 및 후속되는 인시츄 환원을 상세히 설명한다.
카르보닐-함유 아미노산이 도입된 hGH 폴리펩티드를 실시예 2 및 3에 기재된 절차에 따라 제조한다. 하기 구조를 갖는 히드라지드-함유 PEG는 일단 변형되면, hGH 폴리펩티드에 접합된다:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-X-NH-NH2
(식 중에서, R은 메틸이고, n은 2이며, N은 10,000 MW이고, X는 카르보닐 (C=O)기임). p-아세틸페닐알라닌을 함유하는 정제된 hGH를, 25 mM MES(시그마 케미칼, 미국 미조리주 세인트루이스 소재)(pH 6.0), 25 mM 헤페스(시그마 케미칼, 미국 미조리주 세인트루이스 소재)(pH 7.0), 또는 10 mM 아세트산나트륨(시그마 케미칼, 미국 미조리주 세인트루이스 소재)(pH 4.5) 중, 0.1 내지 10 mg/mL로 용해시키고, 1 내지 100배 과량의 히드라지드-함유 PEG와 반응시키며, 상응하는 히드라존을 최종 농도가 10 내지 50 mM가 되도록, H2O 중에 용해된 원액 1 M NaCNBH3(시그마 케미칼, 미국 미조리주 세인트루이스 소재)를 첨가함으로써, 인시츄 환원시킨다. 반응을 암상태에서 4℃ 내지 실온에서 18 내지 24시간 동안 수행한다. 약 pH 7.6의 1 M 트리스(시그마 케미칼, 미국 미조리주 세인트루이스 소재)를 첨가함으로써 반응을 중단하여 최종 트리스 농도가 50 mM이 되도록 하거나, 적당한 완충액으로 희석하여, 즉각적으로 정제한다.
실시예 6
이 실시예는 알킨-함유 아미노산의 hGH 폴리펩티드로의 도입, 및 mPEG-아지드를 이용한 유도체화를 상세히 설명한다.
선택된 잔기는 각기 하기 비천연적으로 코딩된 아미노산으로 치환된다:
Figure 112007093262665-PCT00036
프로파르길 티로신을 함유하는 hGH 폴리펩티드는 P. 플루오레슨스에서 발현되고, 본원에 기재된 조건을 이용하여 정제된다.
프로파르길 티로신을 함유하는 정제된 hGH를 PB 완충액(100 mM 인산나트륨, 0.15 M NaCl, pH 8)을 0.1-10 mg/mL로 용해시키고, 10 내지 1000배 과량의 아지드-함유 PEG를 반응 혼합물에 첨가한다. 이어서, 촉매량의 CuSO4 및 Cu 와이어를 반응 혼합물에 첨가한다. 혼합물을 인큐베이션(실온 또는 37℃에서 약 4시간, 또는 4℃에서 하룻밤 동안의 인큐베이션을 포함하나 이에 제한되지 않음)한 후, H2O를 첨가하고, 혼합물을 투석 막을 통해 여과한다. 샘플을 본원에 기재된 절차와 유사한 절차에 의해(단, 이에 제한되지 않음), PEG의 첨가에 대해 분석할 수 있다.
이 실시예에서, PEG는 하기 구조를 가질 것이다:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-N3
(식 중에서, R은 메틸이고, n은 4이며, N은 10,000 MW임).
실시예 7
이 실시예는 hGH 폴리펩티드 내의 큰 소수성 아미노산의 프로파르길 티로신으로의 치환을 상세히 설명한다.
hGH의 1-5(N-말단), 6-33(A 나선), 34-74(A 나선과 B 나선 사이의 영역, A-B 루프), 75-96(B 나선), 97-105(B 나선과 C 나선 사이의 영역, B-C 루프), 106-129(C 나선), 130-153(C 나선과 D 나선 사이의 영역, C-D 루프), 154-183(D 나선), 184-191(C-말단)의 한 영역 내에 존재하는 Phe, Trp 또는 Tyr 잔기는 실시예 7에 기재된 바와 같이 하기 비천연적으로 코딩된 아미노산으로 치환된다:
Figure 112007093262665-PCT00037
PEG는 일단 변형되면, 알킨-함유 아미노산을 포함하는 hGH 폴리펩티드 변종체에 결합된다. PEG는 하기 구조를 가질 것이고:
Me-PEG(N)-O-(CH2)2-N3
결합 절차는 실시예 7에서의 절차를 따를 것이다. 이는 천연 발생의 큰 소수성 아미노산들 중 하나의 대략 아형입체형이고 폴리펩티드 내의 별개의 부위에서 PEG 유도체를 이용하여 변형되는 비천연적으로 코딩된 아미노산을 포함하는 hGH 폴리펩티드 변종체를 발생시킬 것이다.
실시예 8
이 실시예는 1개 이상의 PEG 링커에 의해 분리되는 hGH 폴리펩티드 동종이량체, 이종이량체, 동종다량체 또는 이종다량체의 발생을 상세히 설명한다.
실시예 7에서 생성된 알킨-함유의 hGH 폴리펩티드 변종체는 형태:
N3-(CH2)n-C(O)-NH-(CH2)2-O-PEG(N)-O-(CH2)2-NH-C(O)-(CH2)n-N3
(식 중에서, n은 4이고, PEG는 평균 MW가 대략 5,000임)의 이작용성 PEG 유도체와 반응하여, 2개의 hGH 폴리펩티드 분자가 PEG에 의해 물리적으로 분리된 상응하는 hGH 폴리펩티드 동종이량체를 발생시킨다. 유사 방식으로, hGH 폴리펩티드가 1개 이상의 다른 폴리펩티드에 결합되어, 이종이량체, 동종다량체 또는 이종다량체를 형성할 수 있다. 실시예 7 및 3에서와 같이 결합, 정제 및 분석을 수행할 것이다.
실시예 9
이 실시예는 당 부분의 hGH 폴리펩티드로의 결합을 상세히 설명한다.
hGH의 하나의 잔기는 실시예 3에 기재된 바와 같이 이하의 비천연적으로 코딩된 아미노산으로 치환된다:
Figure 112007093262665-PCT00038
카르보닐-함유 아미노산을 포함하는 hGH 폴리펩티드 변종체는 일단 변형되면 N-아세틸글루코사민(GlcNAc)의 β-연결 아미노옥시 유사체와 반응한다. hGH 폴리펩티드 변종체(10 mg/mL) 및 아미노옥시 당(21 mM)을 수성 100 mM 아세트산나트륨 완충액(pH 5.5)에서 혼합하여, 7 내지 26시간 동안 37℃에서 인큐베이션한다. 두 번째 당을, 주변 온도에서 48시간 동안 150 mM 헤페스 완충액(pH 7.4) 내에서 UDP-갈락토스(16 mM) 및 β-1,4-갈락토실트랜스퍼라제(0.4 단위/mL)와 함께 당-접합 hGH 폴리펩티드(5 mg/mL)를 인큐베이션함으로써 효소에 의해 첫 번째 당에 결합시킨다(Schanbacher 등, J. Biol . Chem . 1970, 245, 5057-5061).
실시예 10
hGH 분자가 직접적으로 연결된, hGH 폴리펩티드 동종이량체, 이종이량체, 동종다량체 또는 이종다량체의 발생
알킨-함유 아미노산을 포함하는 hGH 폴리펩티드 변종체는 아지도-함유 아미노산을 포함하는 또 다른 hGH 폴리펩티드 변종체에 직접적으로 결합될 수 있고, 이들 각각은 실시예 10에 기재된(단, 이에 제한되지 않음) 부위에 비천연적으로 코딩된 아미노산 치환을 포함한다. 이는 2개의 hGH 폴리펩티드 변종체가 부위 II 결합 계면에 물리적으로 연합된 상응하는 hGH 폴리펩티드 동종이량체를 발생시킬 것이다. 유사한 방식으로, hGH 폴리펩티드는 1개 이상의 다른 폴리펩티드에 결합되어, 이종이량체, 동종다량체 또는 이종다량체를 형성할 수 있다. 결합, 정제 및 분석은 실시예 3, 6 및 7에서와 같이 수행된다.
실시예 11
PEG-OH + Br-(CH2)n-C≡CR' → PEG-O-(CH2)n-C≡CR'
A B
폴리알킬렌 글리콜(P-OH)은 알킬 할라이드(A)와 반응하여, 에테르(B)를 형성한다. 이 화합물에서, n은 1 내지 9의 정수이고, R'은 직쇄형 또는 분지쇄형의 포화 또는 불포화 C1-C20 알킬 또는 헤테로알킬기일 수 있다. R'은 또한 C3-C7 포화 또는 불포화 고리형 알킬 또는 고리형 헤테로알킬, 치환 또는 비치환 아릴 또는 헤테로아릴기, 또는 치환 또는 비치환 알카릴(알킬은 C1-C20 포화 또는 불포화 알킬임) 또는 헤테로알카릴기일 수 있다. 전형적으로, PEG-OH는 분자량이 800 내지 40,000 달톤(Da)인 폴리에틸렌 글리콜(PEG) 또는 모노메톡시 폴리에틸렌 글리콜(mPEG)이다.
실시예 12
mPEG-OH + Br-CH2-C≡CH → mPEG-O-CH2-C≡CH
분자량이 20,000 Da인 mPEG-OH(mPEG-OH 20 kDa; 2.0 g, 0.1 mmol, 선바이오(Sunbio))를 THF(35 mL) 중 NaH(12 mg, 0.5 mmol)로 처리하였다. 이어서, 자일렌 중 80 중량% 용액(0.56 mL, 5 mmol, 50 당량, 알드리히(Aldrich)) 형태로 용해된 브롬화프로파르길의 용액, 및 촉매량의 KI를 용액에 첨가하였고, 수득된 혼합물을 2시간 동안 가열 환류시켰다. 이어서, 물(1 mL)을 첨가하였고, 용매를 진공 하에 제거하였다. 잔류물에 CH2Cl2(25 mL)을 첨가하였고, 유기층을 분리시켜, 무수 Na2SO4로 건조시켰으며, 체적을 대략 2 mL로 감소시켰다. 이 CH2Cl2 용액을 디에틸 에테르(150 mL)에 적가하였다. 수득된 석출물을 수집하여, 수회 분량의 냉 디에틸 에테르로 세정하였으며, 건조시켜 프로파르길-O-PEG를 제공하였다.
실시예 13
mPEG-OH + Br-(CH2)3-C≡CH → mPEG-O-(CH2)3-C≡CH
분자량이 20,000 Da인 mPEG-OH(mPEG-OH 20 kDa; 2.0 g, 0.1 mmol, 선바이오)를 THF(35 mL) 중 NaH(12 mg, 0.5 mmol)로 처리하였다. 이어서, 50 당량의 5-브로모-1-펜틴(0.53 mL, 5 mmol, 알드리히), 및 그에 이어 촉매량의 KI를 혼합물에 첨가하였다. 수득된 혼합물을 16시간 동안 가열 환류시켰다. 이어서, 물(1 mL)을 첨가하였고, 용매를 진공 하에 제거하였다. 잔류물에 CH2Cl2(25 mL)을 첨가하였고, 유기층을 분리시켜, 무수 Na2SO4로 건조시켰으며, 체적을 대략 2 mL로 감소시켰다. 이 CH2Cl2 용액을 디에틸 에테르(150 mL)에 적가하였다. 수득된 석출물을 수집하여, 수회 분량의 냉 디에틸 에테르로 세정하였으며, 건조시켜 상응하는 알킨을 제공하였다. 유사한 반응에 5-클로로-1-펜틴을 사용할 수 있다.
실시예 14
(1) m-HOCH2C6H4OH + NaOH + Br-CH2-C≡CH → m-HOCH2C6H4O-CH2-C≡CH
(2) m-HOCH2C6H4O-CH2-C≡CH + MsCl + N(Et)3 → m-MsOCH2C6H4O-CH2-C≡CH
(3) m-MsOCH2C6H4O-CH2-C≡CH + LiBr → m-Br-CH2C6H4O-CH2-C≡CH
(4) mPEG-OH + m-Br-CH2C6H4O-CH2-C≡CH → mPEG-O-CH2-C6H4O-CH2-C≡CH
THF(50 mL) 및 물(2.5 mL) 중 3-히드록시벤질알코올(2.4 g, 20 mmol)의 용액에 먼저 분말형 수산화나트륨(1.5 g, 37.5 mmol), 및 그에 이어 자일렌 (3.36 mL, 30 mmol) 중 80 중량% 용액으로서 용해된 브롬화프로파르길의 용액을 첨가하였다. 반응 혼합물을 6시간 동안 가열 환류하였다. 혼합물에 10% 시트르산(2.5 mL)을 첨가하였고, 용매를 진공 제거하였다. 잔류물을 에틸 아세테이트로 추출하였고(3 x 15 mL), 조합된 유기층을 포화 NaCl 용액(10 mL)으로 세정하였으며, MgSO4로 건조시키고 농축시켜, 3-프로파르길옥시벤질 알코올을 수득하였다.
메탄술포닐 클로라이드(2.5 g, 15.7 mmol) 및 트리에틸아민(2.8 mL, 20 mmol)을 0℃에서 CH2Cl2 중 화합물 3(2.0 g, 11.0 mmol)의 용액에 첨가하였고, 반응물을 16시간 동안 냉장고에 두었다. 통상의 워크업으로, 담황색 오일로서의 메실레이트를 제공하였다. 이 오일(2.4 g, 9.2 mmol)을 THF(20 mL)에 용해시키고, LiBr(2.0 g, 23.0 mmol)을 첨가하였다. 반응 혼합물을 1시간 동안 가열 환류시킨 후, 실온으로 냉각시켰다. 혼합물에 물(2.5 mL)을 첨가하였고, 용매를 진공 제거하였다. 잔류물을 에틸 아세테이트로 추출하였고(3 x 15 mL), 조합된 유기층을 포화 NaCl 용액(10 mL)으로 세정하였으며, 무수 Na2SO4로 건조시키고 농축시켜, 원하는 브로마이드를 수득하였다.
mPEG-OH 20 kDa(1.0 g, 0.05 mmol, 선바이오)를 THF(20 mL) 중에 용해시켰고, 용액을 빙조에서 냉각시켰다. NaH(6 mg, 0. 25 mmol)를 수분간 격렬한 교반 하에 첨가한 후, 상기로부터 수득된 브로마이드(2.55 g, 11.4 mmol) 및 촉매량의 KI를 첨가하였다. 냉각조를 제거하고, 수득된 혼합물을 12시간 동안 가열 환류시켰다. 물(1.0 mL)을 혼합물에 첨가하였고, 용매를 진공 제거하였다. 잔류물에 CH2Cl2(25 mL)을 첨가하였고, 유기층을 분리하였으며, 무수 Na2SO4로 건조시키고, 체적을 대략 2 mL로 감소시켰다. 에테르 용액(150 mL)에 대한 적가로써 백색 석출물을 수득하였고, 이를 수집하여 PEG 유도체가 생성되었다.
실시예 15
mPEG-NH2 + X-C(O)-(CH2)n-C≡CR' → mPEG-NH-C(O)-(CH2)n-C≡CR'
상기 나와 있는 바와 같이 알킨 작용기를 함유하는 반응성 분자에 말단 작용기를 함유하는 폴리(에틸렌 글리콜) 중합체를 결합시킴으로써, 말단 알킨-함유 폴리(에틸렌 글리콜) 중합체가 또한 수득될 수 있다. n은 1 내지 10이고, R'은 H, 또는 C1-C4의 저급 알킬기일 수 있다.
실시예 16
(1) HO2C-(CH2)2-C≡CH + NHS + DCC → NHSO-C(O)-(CH2)2-C≡CH
(2) mPEG-NH2 + NHSO-C(O)-(CH2)2-C≡CH → mPEG-NH-C(O)-(CH2)2-C≡CH
4-펜틴산(2.943 g, 3.0 mmol)을 CH2Cl2(25 mL) 중에 용해시켰다. N-히드록시숙신이미드(3.80 g, 3.3 mmol) 및 DCC(4.66 g, 3.0 mmol)를 첨가하였고, 용액을 실온에서 하룻밤 동안 교반하였다. 수득된 조 NHS 에스테르 7를 추가 정제없이 후속 반응에 사용하였다.
분자량이 5,000 Da인 mPEG-NH2(mPEG-NH2, 1 g, 선바이오)를 THF(50 mL) 중 용해시켰고. 혼합물을 4℃로 냉각시켰다. NHS 에스테르 7(400 mg, 0.4 mmol)를 격렬한 교반 하에 적가하였다. 혼합물을 3시간 동안 교반하면서, 실온으로 가온하였다. 이어서, 물(2 mL)을 첨가하였고, 용매를 진공 제거하였다. 잔류물에 CH2Cl2(50 mL)을 첨가하였고, 유기층을 분리하였으며, 무수 Na2SO4로 건조시켰고, 체적을 대략 2 mL로 감소시켰다. 이 CH2Cl2 용액을 에테르(150 mL)에 적가하였다. 수득된 석출물을 수집하고, 진공 건조시켰다.
실시예 17
이 실시예는 폴리(에틸렌 글리콜)의 메탄술포네이트 또는 메실레이트로도 칭해질 수 있는, 폴리(에틸렌 글리콜)의 메탄 술포닐 에스테르의 제조를 나타낸다. 유사한 절차에 의해 상응하는 토실레이트 및 할라이드가 제조될 수 있다.
mPEG-OH + CH3SO2Cl + N(Et)3 → mPEG-O-SO2CH3 → mPEG-N3
150 mL의 톨루엔 중 mPEG-OH(MW=3,400, 25 g, 10 mmol)을 질소 하에 2시간 동안 공비 증류시켰고, 용액을 실온으로 냉각시켰다. 40 mL의 건조 CH2Cl2 및 2.1 mL의 건조 트리에틸아민(15 mmol)을 용액에 첨가하였다. 용액을 빙조에서 냉각시켰고, 1.2 mL의 증류 메탄술포닐 클로라이드(15 mmol)를 적가하였다. 용액을 질소 하에 실온에서 하룻밤 동안 교반하였고, 2 mL의 무수 에탄올을 첨가함으로써 반응물을 급냉시켰다. 혼합물을 진공 하에 증발시켜, 용매, 주로 톨루엔을 제외한 용매를 제거하고, 여과하였으며, 다시 진공 하에 농축한 후, 100 mL의 디에틸 에테르로 석출 주입하였다. 여과물을 수회 분량의 냉 디에틸 에테르로 세정하고, 진공 하에 건조시켜, 메실레이트를 제공하였다.
메실레이트(20 g, 8 mmol)를 75 ml의 THF 중에 용해시키고, 용액을 4℃로 냉각시켰다. 냉각된 용액에 나트륨 아지드(1.56 g, 24 mmol)를 첨가하였다. 반응물을 2시간 동안 질소 하에서 가열 환류시켰다. 이어서, 용매를 증발시키고, 잔류물을 CH2Cl2(50 mL)로 희석하였다. 유기 분획을 NaCl 용액으로 세정하고, 무수 MgSO4로 건조시켰다. 체적을 20 ml로 감소시키고, 150 ml의 냉 건조 에테르를 첨가함으로써 생성물을 석출시켰다.
실시예 18
(1) N3-C6H4-CO2H → N3-C6H4CH2OH
(2) N3-C6H4CH2OH → Br-CH2-C6H4-N3
(3) mPEG-OH + Br-CH2-C6H4-N3 → mPEG-O-CH2-C6H4-N3
본원에 참고로 인용되는 U.S. 특허 5,998,595에 기재된 방법을 이용하여 4-아지도벤질 알코올을 생성시킬 수 있다. 메탄술포닐 클로라이드(2.5 g, 15.7 mmol) 및 트리에틸아민(2.8 mL, 20 mmol)을 0℃에서 CH2Cl2 중 4-아지도벤질 알코올(1.75 g, 11.0 mmol)의 용액에 첨가하였고, 반응물을 16시간 동안 냉장고에 두었다. 통상의 워크업으로 메실레이트를 담황색 오일로서 제공하였다. 이 오일(9.2 mmol)을 THF(20 mL)에 용해시키고, LiBr(2.0 g, 23.0 mmol)을 첨가하였다. 반응 혼합물을 1시간 동안 가열 환류시킨 후, 실온으로 냉각시켰다. 혼합물에 물(2.5 mL)을 첨가하였고, 용매를 진공 제거하였다. 잔류물을 에틸 아세테이트로 추출하였고(3 x 15 mL), 조합된 유기층을 포화 NaCl 용액(10 mL)으로 세정하였으며, 무수 Na2SO4로 건조시키고 농축시켜, 원하는 브로마이드를 수득하였다.
mPEG-OH 20 kDa(2.0 g, 0.1 mmol, 선바이오)를 THF(35 mL) 중 NaH(12 mg, 0.5 mmol)로 처리하였고, 그 브로마이드(3.32 g, 15 mmol)를 촉매량의 KI와 함께 혼합물에 첨가하였다. 수득된 혼합물을 12시간 동안 가열 환류시켰다. 물(1.0 mL)을 혼합물에 첨가하였고, 용매를 진공 제거하였다. 잔류물에 CH2Cl2(25 mL)을 첨가하였고, 유기층을 분리하였으며, 무수 Na2SO4로 건조시키고, 체적을 대략 2 mL로 감소시켰다. 에테르 용액(150 mL)으로의 적가로써 백색 석출물을 수득하였고, 이를 수집하여 mPEG-O-CH2-C6H4-N3이 생성되었다.
실시예 19
NH2-PEG-O-CH2CH2CO2H + N3-CH2CH2CO2-NHS → N3-CH2CH2-C(O)NH-PEG-O-CH2CH2CO2H
NH2-PEG-O-CH2CH2CO2H(MW 3,400 Da, 2.0 g)을 NaHCO3의 포화 수용액(10 mL)에 용해시키고, 용액을 0℃로 냉각시켰다. 3-아지도-1-N-히드록시숙신이미도프로피오네이트(5 당량)를 격렬한 교반 하에 첨가하였다. 3시간 후에, 20 mL의 H20을 첨가하였고, 혼합물을 실온에서 부가적 45분 동안 교반하였다. 0.5 N H2S04를 첨가함으로써 pH를 3으로 조정하였고, NaCl을 첨가하여, 대략 15 wt%의 농도로 만들었다. 반응 혼합물을 CH2Cl2(100 mL x 3)로 추출하고, Na2SO4로 건조시켜, 농축하였다. 냉 디에틸 에테르를 이용하여 석출한 후, 생성물을 여과에 의해 수집하고, 진공 하게 건조시켜, 오메가-카르복시-아지드 PEG 유도체를 생성시켰다.
실시예 20
mPEG-OMs + HC≡CLi → mPEG-O-CH2-CH2-C≡C-H
당업계에 공지된 바에 따라 제조되고 THF 중에서 -78℃로 냉각된 리튬 아세틸리드(4 당량)의 용액에, THF 중에 용해된 mPEG-OMs의 용액을 격렬한 교반 하에 적가하였다. 3시간 후, 반응물을 실온으로 가온하고, 1 mL의 부탄올을 첨가함으로써 급냉시켰다. 이어서, 20 mL의 H20를 첨가하고, 혼합물을 실온에서 부가적 45분 동안 교반하였다. 0.5 N H2S04를 첨가함으로써 pH를 3으로 조정하였고, NaCl을 첨가하여, 대략 15 wt%의 농도로 만들었다. 반응 혼합물을 CH2Cl2(100 mL x 3)로 추출하고, Na2SO4로 건조시켜, 농축하였다. 냉 디에틸 에테르를 이용하여 석출한 후, 생성물을 여과에 의해 수집하고, 진공 하게 건조시켜, 1-(부트-3-이닐옥시)-메톡시폴리에틸렌 글리콜(mPEG)을 생성시켰다.
실시예 21
[L. Wang 등(2001), Science 292:498-500, J.W. Chin 등, Science 301:964-7(2003)), J. W. Chin 등(2002), Journal of the American Chemical Society 124:9026-9027; J. W. Chin, & P. G. Schultz(2002), Chem Bio Chem 3(1l):1135-1137; J. W. Chin 등(2002), PNAS United States of America 99:11020-11024; 및 L. Wang, & P. G. Schultz(2002), Chem . Comm ., 1:1-10]에 기재된 방법을 이용하여 단백질에 아지드- 및 아세틸렌-함유 아미노산을 부위-선택적으로 도입시켰다. 일단 아미노산이 도입되면, 2 mM PEG 유도체, 1 mM CuSO4, 및 ~1 mg Cu-와이어의 존재 하에, 37℃에서 4시간 동안 인산염 완충액(PB)(pH 8) 중 0.01 mM 단백질을 이용하여 시클로부가 반응을 수행하였다.
실시예 22
이 실시예는 p-아세틸-D,L-페닐알라닌(pAF) 및 m-PEG-히드록실아민 유도체의 합성을 기술한다.
라세믹 pAF를 [Zhang, Z., Smith, B. A. C, Wang, L., Brock, A., Cho, C. & Schultz, P. G., Biochemistry, (2003) 42, 6735-6746]에서 이미 기재된 절차를 이용하여 합성하였다. m-PEG-히드록실아민 유도체를 합성하기 위해, 하기 절차를 완료하였다. 실온(RT)에서 1시간 동안 교반된, 디클로로메탄(DCM, 70 mL) 중의 (N-t-Boc-아미노옥시)아세트산(0.382 g, 2.0 mmol) 및 1,3-디이소프로필카르보디이미드(0.16 mL, 1.0 mmol)의 용액에 메톡시-폴리에틸렌 글리콜 아민(m-PEG-NH2, 7.5 g, 0.25 mmol, Mt. 30 K, 바이오벡트라(BioVectra) 제품) 및 디이소프로필에틸아민(0.1 mL, 0.5 mmol)을 첨가하였다. 반응물을 실온에서 48시간 동안 교반한 후, 약 100 mL로 농축하였다. 혼합물을 냉 에테르(800 mL)에 적가하였다. t-Boc-보호 생성물이 석출하였고, 이를 여과에 의해 수집하고, 에테르로 세정하였다(3x100 mL). 그것을 DCM(100 mL) 중에 재용해하고 에테르(800 mL)에서 2회 석출함으로써 추가 정제하였다. 생성물을 진공 건조시켜, NMR 및 니히드린(Nihydrin) 시험에 의해 확인되는 7.2 g(96%)을 수득하였다. 상기 수득된 보호된 생성물(7.0 g)의 deBoc를 1시간 동안 0℃에서, 그 후 1.5시간 동안 실온에서 50% TFA/DCM(40 mL) 중에서 수행하였다. 대부분의 TFA를 진공 제거한 후, 히드록실아민 유도체의 TFA 염을 디옥산(1 mL) 중 4 N HCl를 잔류물에 첨가함으로써 HCl 염으로 전환시켰다. 석출물을 DCM(50 mL)에 용해시키고, 에테르(800 mL) 중에 재석출시켰다. 최종 생성물(6.8 g, 97%)을 여과에 의해 수집하고, 에테르로 세정하였으며(3x100 mL), 진공 건조시키고, 질소 하에 저장하였다. 다른 PEG(5K, 20K) 히드록실아민 유도체를 동일한 절차를 이용하여 합성하였다.
실시예 23
이 실시예는 비천연 아미노산을 포함하는 hGH 폴리펩티드를 위해 사용되는 발현 및 정제 방법을 기술한다. 숙주 세포를 오르소고날 tRNA, 오르소고날 아미노아실 tRNA 합성효소, 및 hGH 구축물을 이용하여 형질전환하였다.
형질전환된 DH10B(fis3) 세포의 냉동 글리세롤 스톡으로부터의 작은 천자(stab)를 먼저, 100 μg/ml 암피실린을 포함한 2 ml 한정 배지(류신, 이소류신, 미량 금속 및 비타민으로 보충된 글루코스 최소 배지)에서 37℃에서 성장시켰다. OD60O가 2-5에 도달했을 때, 60 μl를 100 μg/ml 암피실린을 포함한 60 ml 프레쉬 한정 배지에 옮겨서, 다시 37℃에서 2-5의 OD60O가 되도록 성장시켰다. 50 ml의 배양물을 5 리터 발효기(사르토리우스(Sartorius) BBI)에서 100 μg/ml 암피실린을 포함한 2 리터의 한정 배지로 옮겼다. 발효기 pH를 탄산칼륨을 이용하여 pH 6.9로 조절하고, 온도를 37℃로 조절하였으며, 공기 유속을 5 lpm로 조절하고, 발포체를 폴리알킬렌 소포제 KFO F119(루브리졸(Lubrizol))로 조절하였다. 교반기 속도를 용존 산소 수준이 ≥30%로 유지되도록 자동 조정하였고, 교반기 속도가 최대 값에 도달하는 경우 순수 산소를 사용하여 공기 스파징을 보충하였다. 37℃에서 8시간 후, 배양물을 0.15 hr-1의 특정 성장 속도를 유지하도록 지수적으로 증가하는 속도로 한정 배지의 50× 농축물에 공급하였다. OD600이 대략 100에 도달할 때, 파라-아세틸-페닐알라닌의 라세믹 혼합물을 최종 농도 3.3 mM가 되도록 첨가하였고, 온도를 28℃로 저하시켰다. 0.75시간 후, 이소프로필-b-D-티오갈락토피라노시드를 최종 농도 0.25 mM가 되도록 첨가하였다. 세포를 28℃에서 부가적 8시간 동안 성장시키고, 추가 가공 시까지 -80℃에서 냉동시켰다.
His-택이 있는 변이체 hGH 단백질을 인비트로겐 사용설명서 매뉴얼에 의해 제공되는 표준 His-택이 있는 단백질 정제 절차를 통해 프로본드 니켈-킬레이트화 수지(인비트로겐, 미국 캘리포니아주 칼스배드 소재)를 이용하여 정제한 후, 음이온 교환 칼럼을 수행하였다.
정제된 hGH를 8 mg/ml로 농축하고, 완충액을 반응 완충액(20 mM 아세트산나트륨, 150 mM NaCl, 1 mM EDTA, pH 4.0)으로 교환하였다. MPEG-옥시아민 분말을 20:1 몰비의 PEG:hGH로 hGH 용액에 첨가하였다. 반응을 완만히 교반하면서 2일 동안 28℃에서 수행하였다. PEG-hGH를 음이온 교환 칼럼을 통해 미반응 PEG 및 hGH로부터 정제하였다.
각 PEG화된 변이체 hGH의 품질을 3가지 검정에 의해 평가한 후, 동물 실험에 착수하였다. PEG-hGH의 순도를 비환원 조건 하에서 MES SDS 수행 완충액(인비트로겐)을 이용하여 4-12% 아크릴아미드 NuPAGE 비스-트리스 겔을 수행함으로써 조사하였다. 겔을 쿠마시 블루로 염색하였다. PEG-hGH 밴드는 밀도측정 스캔에 기초할 때 95% 초과의 순도였다. 각 PEG-hGH에서의 내독소 수준을 찰스 리버 라보라토리즈(Charles River Laboratories, 미국 매사추세츠주 윌밍턴 소재) 제품의 KTA2 키트를 이용하여 역학 LAL 검정에 의해 시험하였고, 그것은 5 EU/투여량 미만이었다. PEG-hGH의 생물학적 활성을 (실시예 2에서 언급된) IM-9 pSTAT5 바이오검정을 이용하여 평가하였고, EC50 값이 15 nM 미만이었다.
실시예 24
이 실시예는 PEG화 hGH의 시험관내 및 생체내 활성을 측정하기 위한 방법을 기재하고 있다.
세포 결합 검정
각종 농도(체적: 10 μl)의 비표지 GH, hGH 또는 GM-CSF의 부재 또는 존재 하에, 또한 125I-GH(대략 100,000 cpm 또는 1 ng)의 존재 하에, 세포(3 x 106)을 PBS/1% BSA(100 μl) 중에 0℃에서 90분 동안 이벌로 인큐베이션한다(총 체적: 120 μl). 이어서, 세포를 350 μL 플라스틱 원심분리관 내에서 200 μl 빙냉 FCS 상에서 재현탁시키고 층상화하고, 원심분리하였다(1000 g; 1 분). 관의 말단을 절단함으로써 펠렛을 수집하고, 펠렛 및 상등액을 감마계수기(팩커드(Packard))에서 분리하여 계수한다.
특이적 결합(cpm)은, 컴패티터의 부재 하에서의 총 결합(이벌값의 평균)에서 100배 과량의 비표지 GH(비특이적 결합)의 존재 하에서의 결합(cpm)을 뺀 것으로 구해진다. 사용된 각 세포 유형에 대해 비특이적 결합을 측정한다. 125I-GH의 동일한 제조를 이용하여 실험들을 분리된 날들에 수행하고, 내부 일관성을 나타내야 한다. 125I-GH은 GH 수용체-생성 세포에 대한 결합을 나타낸다. 결합은 비표지 천연 GH 또는 hGH에 의해 용량 의존적 방식으로 억제되나, GM-CSF 또는 기타 음성 대조군에 의해서는 그러하지 않다. 천연 GH와 유사한 천연 125I-GH의 결합에 대해 경쟁하는 hGH의 능력은, 수용체가 양 형태 모두를 동등하게 잘 인식함을 제시한다.
서열
Figure 112007093262665-PCT00039
Figure 112007093262665-PCT00040
Figure 112007093262665-PCT00041
Figure 112007093262665-PCT00042
Figure 112007093262665-PCT00043
Figure 112007093262665-PCT00044
Figure 112007093262665-PCT00045
Figure 112007093262665-PCT00046
Figure 112007093262665-PCT00047
Figure 112007093262665-PCT00048
Figure 112007093262665-PCT00049
Figure 112007093262665-PCT00050
Figure 112007093262665-PCT00051
Figure 112007093262665-PCT00052
Figure 112007093262665-PCT00053
Figure 112007093262665-PCT00054
Figure 112007093262665-PCT00055
Figure 112007093262665-PCT00056
SEQUENCE LISTING <110> Cho, Ho Sung <120> Incorporation of Non-Naturally Encoded Amino Acids into Proteins <130> AMBX-0094.00PCT <140> PCT/US2006/021463 <141> 2006-06-02 <150> US 60/687,603 <151> 2005-06-03 <160> 85 <170> PatentIn version 3.3 <210> 1 <211> 77 <212> DNA <213> Methanococcus jannaschii <400> 1 ccggcggtag ttcagcaggg cagaacggcg gactctaaat ccgcatggcg ctggttcaaa 60 tccggcccgc cggacca 77 <210> 2 <211> 88 <212> DNA <213> Halobacterium sp. NRC-1 <400> 2 cccagggtag ccaagctcgg ccaacggcga cggactctaa atccgttctc gtaggagttc 60 gagggttcga atcccttccc tgggacca 88 <210> 3 <211> 89 <212> DNA <213> Halobacterium sp. NRC-1 <400> 3 gcgagggtag ccaagctcgg ccaacggcga cggacttcct aatccgttct cgtaggagtt 60 cgagggttcg aatccctccc ctcgcacca 89 <210> 4 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 4 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcagatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtac tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgcaattcat 480 tatcctggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggga agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt tagtagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 5 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 5 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctgggatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatgtgctt atggaagtcc tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat ggttatcatt 480 atcttggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 6 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 6 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcagatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtcc tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat tgttctcatt 480 attatggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 7 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 7 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctactatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtac gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat ccgttgcatt 480 atgctggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 8 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 8 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcatatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat cggccgcatt 480 atcctggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 9 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 9 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttatatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtcc tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat cagagtcatt 480 atgatggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 10 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 10 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttcgatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtac gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat acgtatcatt 480 atgctggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 11 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 11 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcctatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtat gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat aatacgcatt 480 atgggggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 12 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 12 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctacgatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtca tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat cagactcatt 480 atgagggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 13 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 13 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcatatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtaa gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat ccgtgtcatt 480 atcatggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 14 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 14 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctgctatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtcg gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat gtgattcatt 480 atgatggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 15 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 15 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctgggatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtac tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat acgtattatt 480 atgctggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 16 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 16 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctctgatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtcc gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat cagattcatt 480 ctagtggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 17 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 17 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctgacatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tggaatgcat 480 tatcaaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 18 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 18 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttacatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtct attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatacaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 19 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 19 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctctaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttgac agatttaaac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 20 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 20 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctctaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttgac agatttaaaa gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgtcagttaa tgtaattcat 480 tatttaggcg ttgatgttgt agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 21 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 21 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctctaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttgcc agatttatca gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 22 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 22 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctacaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatgcaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 23 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 23 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctacaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttgtc cgatttacca gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 24 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 24 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctacaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtat gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa ttcatcacat 480 tatgacggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 25 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 25 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcaaatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttgcc agatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtga attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tgatattcat 480 tatttaggcg ttgatgttga cgttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 26 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 26 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcacatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtgc attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa tggacaccat 480 tatataggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 27 <211> 921 <212> DNA <213> Methanococcus jannaschii <400> 27 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gcttacatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtgc attccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agcaagagag 420 gatgaaaatc caaaggttgc tgaagttatc tatccaataa tgcaggttaa ttgcgcacat 480 tatttaggcg ttgatgttgc agttggaggg atggagcaga gaaaaataca catgttagca 540 agggagcttt taccaaaaaa ggttgtttgt attcacaacc ctgtcttaac gggtttggat 600 ggagaaggaa agatgagttc ttcaaaaggg aattttatag ctgttgatga ctctccagaa 660 gagattaggg ctaagataaa gaaagcatac tgcccagctg gagttgttga aggaaatcca 720 ataatggaga tagctaaata cttccttgaa tatcctttaa ccataaaaag gccagaaaaa 780 tttggtggag atttgacagt taatagctat gaggagttag agagtttatt taaaaataag 840 gaattgcatc caatggattt aaaaaatgct gtagctgaag aacttataaa gattttagag 900 ccaattagaa agagattata a 921 <210> 28 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 28 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctggtatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagttc cttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat acgagtcatt 480 atctgggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 29 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 29 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctacgatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtaa tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat ccgcttcatt 480 atcagggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 30 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 30 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctacgatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtct gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat cctcttcatt 480 atgagggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 31 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 31 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctcttatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagtac tttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat ccggttcatt 480 atcagggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 32 <211> 917 <212> DNA <213> Methanococcus jannaschii <400> 32 atggacgaat ttgaaatgat aaagagaaac acatctgaaa ttatcagcga ggaagagtta 60 agagaggttt taaaaaaaga tgaaaaatct gctactatag gttttgaacc aagtggtaaa 120 atacatttag ggcattatct ccaaataaaa aagatgattg atttacaaaa tgctggattt 180 gatataatta tattgttggc tgatttacac gcctatttaa accagaaagg agagttggat 240 gagattagaa aaataggaga ttataacaaa aaagtttttg aagcaatggg gttaaaggca 300 aaatatgttt atggaagttc gttccagctt gataaggatt atacactgaa tgtctataga 360 ttggctttaa aaactacctt aaaaagagca agaaggagta tggaacttat agaagagagg 420 atgaaaatcc aaaggttgct gaagttatct atccaataat gcaggttaat ccactgcatt 480 atcagggcgt tgatgttgca gttggaggga tggagcagag aaaaatacac atgttagcaa 540 gggagctttt accaaaaaag gttgtttgta ttcacaaccc tgtcttaacg ggtttggatg 600 gagaaggaaa gatgagttct tcaaaaggga attttatagc tgttgatgac tctccagaag 660 agattagggc taagataaag aaagcatact gcccagctgg agttgttgaa ggaaatccaa 720 taatggagat agctaaatac ttccttgaat atcctttaac cataaaaagg ccagaaaaat 780 ttggtggaga tttgacagtt aatagctatg aggagttaga gagtttattt aaaaataagg 840 aattgcatcc aatggattta aaaaatgctg tagctgaaga acttataaag attttagagc 900 caattagaaa gagatta 917 <210> 33 <211> 2799 <212> DNA <213> Archaeoglobus fulgidus <400> 33 atgagcgatt tcaggataat tgaggagaag tggcagaagg cgtgggagaa ggacagaatt 60 tttgagtccg atcctaatga gaaggagaag ttttttctca caattcccta tccttacctt 120 aatggaaatc ttcacgcagg tcacacgaga accttcacaa ttggcgatgc cttcgccaga 180 tacatgagaa tgaagggcta caacgttctc tttcccctcg gctttcatgt tacgggcacc 240 ccaatcattg gccttgcgga gctcatagcc aagagggacg agaggacgat agaggtttac 300 accaaatacc atgacgttcc gctggaggac ttgcttcagc tcacaactcc agagaaaatc 360 gttgagtact tctcaaggga ggcgctgcag gctttgaaga gcataggcta ctccattgac 420 tggaggaggg ttttcaccac aaccgatgaa gagtatcaga gattcatcga gtggcagtac 480 tggaagctca aggagcttgg cctgattgtg aagggcaccc accccgtcag atactgcccc 540 cacgaccaga atcctgttga agaccacgac cttctcgctg gggaggaggc aactattgtt 600 gaatttaccg ttataaagtt caggcttgaa gatggagacc tcattttccc ctgtgcaact 660 ctccgtcccg aaaccgtgtt tggcgtcacg aacatctggg taaagccgac aacctacgta 720 attgccgagg tggatgggga aaagtggttt gtgagcaaag aggcttacga gaagctcacc 780 tacacggaga aaaaagtcag gctgctggag gaggttgatg cgtcgcagtt cttcggcaag 840 tacgtcatag tcccgctggt aaacagaaaa gtgccaattc tgcctgcaga gtttgttgac 900 accgacaacg caacaggagt tgtgatgagc gttcccgcac acgctccttt tgacctggct 960 gccattgagg acttgaagag agacgaggaa acgctggcga agtacggaat tgacaaaagc 1020 gttgtagaga gcataaagcc aatagttctg attaagacgg acattgaagg tgttcctgct 1080 gagaagctaa taagagagct tggagtgaag agccagaagg acaaggagct gctggataag 1140 gcaaccaaga ccctctacaa gaaggagtac cacacgggaa tcatgctgga caacacgatg 1200 aactatgctg gaatgaaagt ttctgaggcg aaggagagag ttcatgagga tttggttaag 1260 cttggcttgg gggatgtttt ctacgagttc agcgagaagc ccgtaatctg caggtgcgga 1320 acgaagtgcg ttgttaaggt tgttagggac cagtggttcc tgaactactc caacagagag 1380 tggaaggaga aggttctgaa tcaccttgaa aagatgcgaa tcatccccga ctactacaag 1440 gaggagttca ggaacaagat tgagtggctc agggacaagg cttgtgccag aaggaagggg 1500 cttggaacga gaattccgtg ggataaggag tggctcatcg agagcctttc agactcaaca 1560 atctacatgg cctactacat ccttgccaag tacatcaacg caggattgct caaggccgag 1620 aacatgactc ccgagttcct cgactacgtg ctgctgggca aaggtgaggt tgggaaagtt 1680 gcggaagctt caaaactcag cgtggagtta atccagcaga tcagggacga cttcgagtac 1740 tggtatcccg ttgacctaag aagcagtggc aaggacttgg ttgcaaacca cctgctcttc 1800 tacctcttcc accacgtcgc cattttcccg ccagataagt ggccgagggc aattgccgta 1860 aacggatacg tcagccttga gggcaagaag atgagcaaga gcaaagggcc cttgctaacg 1920 atgaagaggg cggtgcagca gtatggtgcg gatgtgacga ggctctacat cctccacgct 1980 gcagagtacg acagcgatgc ggactggaag agcagagagg ttgaagggct tgcaaaccac 2040 ctcaggaggt tctacaacct cgtgaaggag aactacctga aagaggtggg agagctaaca 2100 accctcgacc gctggcttgt gagcaggatg cagagggcaa taaaggaagt gagggaggct 2160 atggacaacc tgcagacgag gagggccgtg aatgccgcct tcttcgagct catgaacgac 2220 gtgagatggt atctgaggag aggaggtgag aacctcgcta taatactgga cgactggatc 2280 aagctcctcg ccccctttgc tccgcacatt tgcgaggagc tgtggcactt gaagcatgac 2340 agctacgtca gcctcgaaag ctacccagaa tacgacgaaa ccagggttga cgaggaggcg 2400 gagagaattg aggaatacct ccgaaacctt gttgaggaca ttcaggaaat caagaagttt 2460 gttagcgatg cgaaggaggt ttacattgct cccgccgaag actggaaggt taaggcagca 2520 aaggtcgttg ctgaaagcgg ggatgttggg gaggcgatga agcagcttat gcaggacgag 2580 gagcttagga agctcggcaa agaagtgtca aatttcgtca agaagatttt caaagacaga 2640 aagaagctga tgctagttaa ggagtgggaa gttctgcagc agaacctgaa atttattgag 2700 aatgagaccg gactgaaggt tattcttgat actcagagag ttcctgagga gaagaggagg 2760 caggcagttc cgggcaagcc cgcgatttat gttgcttaa 2799 <210> 34 <211> 2814 <212> DNA <213> Methanobacterium thermoautotrophicum <400> 34 gtggatattg aaagaaaatg gcgtgataga tggagagatg ctggcatatt tcaggctgac 60 cctgatgaca gagaaaagat attcctcaca gtcgcttacc cctaccccag tggtgcgatg 120 cacataggac acgggaggac ctacactgtc cctgatgtct atgcacggtt caagaggatg 180 cagggctaca acgtcctgtt tcccatggcc tggcatgtca caggggcccc tgtcataggg 240 atagcgcgga ggattcagag gaaggatccc tggaccctca aaatctacag ggaggtccac 300 agggtccccg aggatgagct tgaacgtttc agtgaccctg agtacatagt tgaatacttc 360 agcagggaat accggtctgt tatggaggat atgggctact ccatcgactg gaggcgtgaa 420 ttcaaaacca cggatcccac ctacagcagg ttcatacagt ggcagataag gaagctgagg 480 gaccttggcc tcgtaaggaa gggcgcccat cctgttaagt actgccctga atgtgaaaac 540 cctgtgggtg accatgacct ccttgagggt gagggggttg ccataaacca gctcacactc 600 ctcaaattca aacttggaga ctcatacctg gtcgcagcca ccttcaggcc cgagacaatc 660 tatggggcca ccaacctctg gctgaaccct gatgaggatt atgtgagggt tgaaacaggt 720 ggtgaggagt ggataataag cagggctgcc gtggataatc tttcacacca gaaactggac 780 ctcaaggttt ccggtgacgt caaccccggg gacctgatag ggatgtgcgt ggagaatcct 840 gtgacgggcc aggaacaccc catactcccg gcttccttcg ttgaccctga atatgccaca 900 ggtgttgtgt tctctgtccc tgcacatgcc cctgcagact tcatagccct tgaggacctc 960 aggacagacc atgaactcct tgaaaggtac ggtcttgagg atgtggttgc tgatattgag 1020 cccgtgaatg tcatagcagt ggatggctac ggtgagttcc cggcggccga ggttatagag 1080 aaatttggtg tcagaaacca ggaggacccc cgccttgagg atgccaccgg ggagctatac 1140 aagatcgagc atgcgagggg tgttatgagc agccacatcc ctgtctatgg tggtatgaag 1200 gtctctgagg cccgtgaggt catcgctgat gaactgaagg accagggcct tgcagatgag 1260 atgtatgaat tcgctgagcg acctgttata tgccgctgcg gtggcaggtg cgttgtgagg 1320 gtcatggagg accagtggtt catgaagtac tctgatgacg cctggaagga cctcgcccac 1380 aggtgcctcg atggcatgaa gataataccc gaggaggtcc gggccaactt tgaatactac 1440 atcgactggc tcaatgactg ggcatgttca aggaggatag gccttggaac aaggctgccc 1500 tgggatgaga ggtggatcat cgaacccctc acagactcaa caatctacat ggcatattac 1560 accatcgcac accgcctcag ggagatggat gccggggaga tggacgatga gttctttgat 1620 gccatattcc tagatgattc aggaaccttt gaggatctca gggaggaatt ccggtactgg 1680 tacccccttg actggaggct ctctgcaaag gacctcatag gcaatcacct gacattccat 1740 atattccacc actcagccat attccctgag tcagggtggc cccggggggc tgtggtcttt 1800 ggtatgggcc ttcttgaggg caacaagatg tcatcctcca agggcaacgt catactcctg 1860 agggatgcca tcgagaagca cggtgcagac gtggtgcggc tcttcctcat gtcctcagca 1920 gagccatggc aggactttga ctggagggag agtgaggtca tcgggacccg caggaggatt 1980 gaatggttca gggaattcgg agagagggtc tcaggtatcc tggatggtag gccagtcctc 2040 agtgaggtta ctccagctga acctgaaagc ttcattggaa ggtggatgat gggtcagctg 2100 aaccagagga tacgtgaagc cacaagggcc cttgaatcat tccagacaag aaaggcagtt 2160 caggaggcac tctatctcct taaaaaggat gttgaccact accttaagcg tgttgagggt 2220 agagttgatg atgaggttaa atctgtcctt gcaaacgttc tgcacgcctg gataaggctc 2280 atggctccat tcatacccta cactgctgag gagatgtggg agaggtatgg tggtgagggt 2340 tttgtagcag aagctccatg gcctgacttc tcagatgatg cagagagcag ggatgtgcag 2400 gttgcagagg agatggtcca gaataccgtt agagacattc aggaaatcat gaagatcctt 2460 ggatccaccc cggagagggt ccacatatac acctcaccaa aatggaaatg ggatgtgcta 2520 agggtcgcag cagaggtagg aaaactagat atgggctcca taatgggaag ggtttcagct 2580 gagggcatcc atgataacat gaaggaggtt gctgaatttg taaggaggat catcagggac 2640 cttggtaaat cagaggttac ggtgatagac gagtacagcg tactcatgga tgcatctgat 2700 tacattgaat cagaggttgg agccagggtt gtgatacaca gcaaaccaga ctatgaccct 2760 gaaaacaagg ctgtgaatgc cgttcccctg aagccagcca tataccttga atga 2814 <210> 35 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 35 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gln 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Ala Ile His 145 150 155 160 Tyr Pro Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Ser Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 36 <211> 255 <212> PRT <213> Methanococcus jannaschii <400> 36 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Ala His 145 150 155 160 Tyr Gln Gly Val Asp Val Val Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile 245 250 255 <210> 37 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 37 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gly 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Cys Ala Tyr Gly Ser Pro Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Tyr His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 38 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 38 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gln 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Pro Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Cys Ser His 145 150 155 160 Tyr Tyr Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 39 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 39 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Leu His 145 150 155 160 Tyr Ala Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 40 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 40 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala His 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Arg Pro His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 41 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 41 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gln 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Pro Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gln Ser His 145 150 155 160 Tyr Asp Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 42 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 42 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ser 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Thr Tyr His 145 150 155 160 Tyr Ala Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 43 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 43 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Pro 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Met Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asn Thr His 145 150 155 160 Tyr Gly Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 44 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 44 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser His Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gln Thr His 145 150 155 160 Tyr Glu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 45 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 45 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala His 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Lys Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Cys His 145 150 155 160 Tyr His Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 46 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 46 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ala 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Arg Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Val Tyr His 145 150 155 160 Tyr Asp Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 47 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 47 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gly 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Thr Tyr Tyr 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 48 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 48 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Pro Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gln Ile His 145 150 155 160 Ser Ser Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 49 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 49 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Asp 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Met His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 50 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 50 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Tyr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Leu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Thr Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 51 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 51 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Thr Asp Leu Asn Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 52 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 52 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Thr Asp Leu Lys Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Ser Val Asn Val Ile His 145 150 155 160 Tyr Leu Gly Val Asp Val Val Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 53 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 53 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Pro Asp Leu Ser Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 54 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 54 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Ala Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 55 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 55 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ser Asp Leu Pro Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 56 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 56 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Met Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Ser Ser His 145 150 155 160 Tyr Asp Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 57 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 57 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gln 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Pro Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Asp Ile His 145 150 155 160 Tyr Leu Gly Val Asp Val Asp Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 58 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 58 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala His 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ala Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly His His 145 150 155 160 Tyr Ile Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 59 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 59 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Tyr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ala Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Cys Ala His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 60 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 60 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gly 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ser Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Thr Ser His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 61 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 61 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Asn Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Leu His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 62 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 62 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ser Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Leu His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 63 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 63 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Val His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 64 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 64 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ser Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Ser His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 65 <211> 932 <212> PRT <213> Archaeoglobus fulgidus <400> 65 Met Ser Asp Phe Arg Ile Ile Glu Glu Lys Trp Gln Lys Ala Trp Glu 1 5 10 15 Lys Asp Arg Ile Phe Glu Ser Asp Pro Asn Glu Lys Glu Lys Phe Phe 20 25 30 Leu Thr Ile Pro Tyr Pro Tyr Leu Asn Gly Asn Leu His Ala Gly His 35 40 45 Thr Arg Thr Phe Thr Ile Gly Asp Ala Phe Ala Arg Tyr Met Arg Met 50 55 60 Lys Gly Tyr Asn Val Leu Phe Pro Leu Gly Phe His Val Thr Gly Thr 65 70 75 80 Pro Ile Ile Gly Leu Ala Glu Leu Ile Ala Lys Arg Asp Glu Arg Thr 85 90 95 Ile Glu Val Tyr Thr Lys Tyr His Asp Val Pro Leu Glu Asp Leu Leu 100 105 110 Gln Leu Thr Thr Pro Glu Lys Ile Val Glu Tyr Phe Ser Arg Glu Ala 115 120 125 Leu Gln Ala Leu Lys Ser Ile Gly Tyr Ser Ile Asp Trp Arg Arg Val 130 135 140 Phe Thr Thr Thr Asp Glu Glu Tyr Gln Arg Phe Ile Glu Trp Gln Tyr 145 150 155 160 Trp Lys Leu Lys Glu Leu Gly Leu Ile Val Lys Gly Thr His Pro Val 165 170 175 Arg Tyr Cys Pro His Asp Gln Asn Pro Val Glu Asp His Asp Leu Leu 180 185 190 Ala Gly Glu Glu Ala Thr Ile Val Glu Phe Thr Val Ile Lys Phe Arg 195 200 205 Leu Glu Asp Gly Asp Leu Ile Phe Pro Cys Ala Thr Leu Arg Pro Glu 210 215 220 Thr Val Phe Gly Val Thr Asn Ile Trp Val Lys Pro Thr Thr Tyr Val 225 230 235 240 Ile Ala Glu Val Asp Gly Glu Lys Trp Phe Val Ser Lys Glu Ala Tyr 245 250 255 Glu Lys Leu Thr Tyr Thr Glu Lys Lys Val Arg Leu Leu Glu Glu Val 260 265 270 Asp Ala Ser Gln Phe Phe Gly Lys Tyr Val Ile Val Pro Leu Val Asn 275 280 285 Arg Lys Val Pro Ile Leu Pro Ala Glu Phe Val Asp Thr Asp Asn Ala 290 295 300 Thr Gly Val Val Met Ser Val Pro Ala His Ala Pro Phe Asp Leu Ala 305 310 315 320 Ala Ile Glu Asp Leu Lys Arg Asp Glu Glu Thr Leu Ala Lys Tyr Gly 325 330 335 Ile Asp Lys Ser Val Val Glu Ser Ile Lys Pro Ile Val Leu Ile Lys 340 345 350 Thr Asp Ile Glu Gly Val Pro Ala Glu Lys Leu Ile Arg Glu Leu Gly 355 360 365 Val Lys Ser Gln Lys Asp Lys Glu Leu Leu Asp Lys Ala Thr Lys Thr 370 375 380 Leu Tyr Lys Lys Glu Tyr His Thr Gly Ile Met Leu Asp Asn Thr Met 385 390 395 400 Asn Tyr Ala Gly Met Lys Val Ser Glu Ala Lys Glu Arg Val His Glu 405 410 415 Asp Leu Val Lys Leu Gly Leu Gly Asp Val Phe Tyr Glu Phe Ser Glu 420 425 430 Lys Pro Val Ile Cys Arg Cys Gly Thr Lys Cys Val Val Lys Val Val 435 440 445 Arg Asp Gln Trp Phe Leu Asn Tyr Ser Asn Arg Glu Trp Lys Glu Lys 450 455 460 Val Leu Asn His Leu Glu Lys Met Arg Ile Ile Pro Asp Tyr Tyr Lys 465 470 475 480 Glu Glu Phe Arg Asn Lys Ile Glu Trp Leu Arg Asp Lys Ala Cys Ala 485 490 495 Arg Arg Lys Gly Leu Gly Thr Arg Ile Pro Trp Asp Lys Glu Trp Leu 500 505 510 Ile Glu Ser Leu Ser Asp Ser Thr Ile Tyr Met Ala Tyr Tyr Ile Leu 515 520 525 Ala Lys Tyr Ile Asn Ala Gly Leu Leu Lys Ala Glu Asn Met Thr Pro 530 535 540 Glu Phe Leu Asp Tyr Val Leu Leu Gly Lys Gly Glu Val Gly Lys Val 545 550 555 560 Ala Glu Ala Ser Lys Leu Ser Val Glu Leu Ile Gln Gln Ile Arg Asp 565 570 575 Asp Phe Glu Tyr Trp Tyr Pro Val Asp Leu Arg Ser Ser Gly Lys Asp 580 585 590 Leu Val Ala Asn His Leu Leu Phe Tyr Leu Phe His His Val Ala Ile 595 600 605 Phe Pro Pro Asp Lys Trp Pro Arg Ala Ile Ala Val Asn Gly Tyr Val 610 615 620 Ser Leu Glu Gly Lys Lys Met Ser Lys Ser Lys Gly Pro Leu Leu Thr 625 630 635 640 Met Lys Arg Ala Val Gln Gln Tyr Gly Ala Asp Val Thr Arg Leu Tyr 645 650 655 Ile Leu His Ala Ala Glu Tyr Asp Ser Asp Ala Asp Trp Lys Ser Arg 660 665 670 Glu Val Glu Gly Leu Ala Asn His Leu Arg Arg Phe Tyr Asn Leu Val 675 680 685 Lys Glu Asn Tyr Leu Lys Glu Val Gly Glu Leu Thr Thr Leu Asp Arg 690 695 700 Trp Leu Val Ser Arg Met Gln Arg Ala Ile Lys Glu Val Arg Glu Ala 705 710 715 720 Met Asp Asn Leu Gln Thr Arg Arg Ala Val Asn Ala Ala Phe Phe Glu 725 730 735 Leu Met Asn Asp Val Arg Trp Tyr Leu Arg Arg Gly Gly Glu Asn Leu 740 745 750 Ala Ile Ile Leu Asp Asp Trp Ile Lys Leu Leu Ala Pro Phe Ala Pro 755 760 765 His Ile Cys Glu Glu Leu Trp His Leu Lys His Asp Ser Tyr Val Ser 770 775 780 Leu Glu Ser Tyr Pro Glu Tyr Asp Glu Thr Arg Val Asp Glu Glu Ala 785 790 795 800 Glu Arg Ile Glu Glu Tyr Leu Arg Asn Leu Val Glu Asp Ile Gln Glu 805 810 815 Ile Lys Lys Phe Val Ser Asp Ala Lys Glu Val Tyr Ile Ala Pro Ala 820 825 830 Glu Asp Trp Lys Val Lys Ala Ala Lys Val Val Ala Glu Ser Gly Asp 835 840 845 Val Gly Glu Ala Met Lys Gln Leu Met Gln Asp Glu Glu Leu Arg Lys 850 855 860 Leu Gly Lys Glu Val Ser Asn Phe Val Lys Lys Ile Phe Lys Asp Arg 865 870 875 880 Lys Lys Leu Met Leu Val Lys Glu Trp Glu Val Leu Gln Gln Asn Leu 885 890 895 Lys Phe Ile Glu Asn Glu Thr Gly Leu Lys Val Ile Leu Asp Thr Gln 900 905 910 Arg Val Pro Glu Glu Lys Arg Arg Gln Ala Val Pro Gly Lys Pro Ala 915 920 925 Ile Tyr Val Ala 930 <210> 66 <211> 937 <212> PRT <213> Methanobacterium thermoautotrophicum <400> 66 Val Asp Ile Glu Arg Lys Trp Arg Asp Arg Trp Arg Asp Ala Gly Ile 1 5 10 15 Phe Gln Ala Asp Pro Asp Asp Arg Glu Lys Ile Phe Leu Thr Val Ala 20 25 30 Tyr Pro Tyr Pro Ser Gly Ala Met His Ile Gly His Gly Arg Thr Tyr 35 40 45 Thr Val Pro Asp Val Tyr Ala Arg Phe Lys Arg Met Gln Gly Tyr Asn 50 55 60 Val Leu Phe Pro Met Ala Trp His Val Thr Gly Ala Pro Val Ile Gly 65 70 75 80 Ile Ala Arg Arg Ile Gln Arg Lys Asp Pro Trp Thr Leu Lys Ile Tyr 85 90 95 Arg Glu Val His Arg Val Pro Glu Asp Glu Leu Glu Arg Phe Ser Asp 100 105 110 Pro Glu Tyr Ile Val Glu Tyr Phe Ser Arg Glu Tyr Arg Ser Val Met 115 120 125 Glu Asp Met Gly Tyr Ser Ile Asp Trp Arg Arg Glu Phe Lys Thr Thr 130 135 140 Asp Pro Thr Tyr Ser Arg Phe Ile Gln Trp Gln Ile Arg Lys Leu Arg 145 150 155 160 Asp Leu Gly Leu Val Arg Lys Gly Ala His Pro Val Lys Tyr Cys Pro 165 170 175 Glu Cys Glu Asn Pro Val Gly Asp His Asp Leu Leu Glu Gly Glu Gly 180 185 190 Val Ala Ile Asn Gln Leu Thr Leu Leu Lys Phe Lys Leu Gly Asp Ser 195 200 205 Tyr Leu Val Ala Ala Thr Phe Arg Pro Glu Thr Ile Tyr Gly Ala Thr 210 215 220 Asn Leu Trp Leu Asn Pro Asp Glu Asp Tyr Val Arg Val Glu Thr Gly 225 230 235 240 Gly Glu Glu Trp Ile Ile Ser Arg Ala Ala Val Asp Asn Leu Ser His 245 250 255 Gln Lys Leu Asp Leu Lys Val Ser Gly Asp Val Asn Pro Gly Asp Leu 260 265 270 Ile Gly Met Cys Val Glu Asn Pro Val Thr Gly Gln Glu His Pro Ile 275 280 285 Leu Pro Ala Ser Phe Val Asp Pro Glu Tyr Ala Thr Gly Val Val Phe 290 295 300 Ser Val Pro Ala His Ala Pro Ala Asp Phe Ile Ala Leu Glu Asp Leu 305 310 315 320 Arg Thr Asp His Glu Leu Leu Glu Arg Tyr Gly Leu Glu Asp Val Val 325 330 335 Ala Asp Ile Glu Pro Val Asn Val Ile Ala Val Asp Gly Tyr Gly Glu 340 345 350 Phe Pro Ala Ala Glu Val Ile Glu Lys Phe Gly Val Arg Asn Gln Glu 355 360 365 Asp Pro Arg Leu Glu Asp Ala Thr Gly Glu Leu Tyr Lys Ile Glu His 370 375 380 Ala Arg Gly Val Met Ser Ser His Ile Pro Val Tyr Gly Gly Met Lys 385 390 395 400 Val Ser Glu Ala Arg Glu Val Ile Ala Asp Glu Leu Lys Asp Gln Gly 405 410 415 Leu Ala Asp Glu Met Tyr Glu Phe Ala Glu Arg Pro Val Ile Cys Arg 420 425 430 Cys Gly Gly Arg Cys Val Val Arg Val Met Glu Asp Gln Trp Phe Met 435 440 445 Lys Tyr Ser Asp Asp Ala Trp Lys Asp Leu Ala His Arg Cys Leu Asp 450 455 460 Gly Met Lys Ile Ile Pro Glu Glu Val Arg Ala Asn Phe Glu Tyr Tyr 465 470 475 480 Ile Asp Trp Leu Asn Asp Trp Ala Cys Ser Arg Arg Ile Gly Leu Gly 485 490 495 Thr Arg Leu Pro Trp Asp Glu Arg Trp Ile Ile Glu Pro Leu Thr Asp 500 505 510 Ser Thr Ile Tyr Met Ala Tyr Tyr Thr Ile Ala His Arg Leu Arg Glu 515 520 525 Met Asp Ala Gly Glu Met Asp Asp Glu Phe Phe Asp Ala Ile Phe Leu 530 535 540 Asp Asp Ser Gly Thr Phe Glu Asp Leu Arg Glu Glu Phe Arg Tyr Trp 545 550 555 560 Tyr Pro Leu Asp Trp Arg Leu Ser Ala Lys Asp Leu Ile Gly Asn His 565 570 575 Leu Thr Phe His Ile Phe His His Ser Ala Ile Phe Pro Glu Ser Gly 580 585 590 Trp Pro Arg Gly Ala Val Val Phe Gly Met Gly Leu Leu Glu Gly Asn 595 600 605 Lys Met Ser Ser Ser Lys Gly Asn Val Ile Leu Leu Arg Asp Ala Ile 610 615 620 Glu Lys His Gly Ala Asp Val Val Arg Leu Phe Leu Met Ser Ser Ala 625 630 635 640 Glu Pro Trp Gln Asp Phe Asp Trp Arg Glu Ser Glu Val Ile Gly Thr 645 650 655 Arg Arg Arg Ile Glu Trp Phe Arg Glu Phe Gly Glu Arg Val Ser Gly 660 665 670 Ile Leu Asp Gly Arg Pro Val Leu Ser Glu Val Thr Pro Ala Glu Pro 675 680 685 Glu Ser Phe Ile Gly Arg Trp Met Met Gly Gln Leu Asn Gln Arg Ile 690 695 700 Arg Glu Ala Thr Arg Ala Leu Glu Ser Phe Gln Thr Arg Lys Ala Val 705 710 715 720 Gln Glu Ala Leu Tyr Leu Leu Lys Lys Asp Val Asp His Tyr Leu Lys 725 730 735 Arg Val Glu Gly Arg Val Asp Asp Glu Val Lys Ser Val Leu Ala Asn 740 745 750 Val Leu His Ala Trp Ile Arg Leu Met Ala Pro Phe Ile Pro Tyr Thr 755 760 765 Ala Glu Glu Met Trp Glu Arg Tyr Gly Gly Glu Gly Phe Val Ala Glu 770 775 780 Ala Pro Trp Pro Asp Phe Ser Asp Asp Ala Glu Ser Arg Asp Val Gln 785 790 795 800 Val Ala Glu Glu Met Val Gln Asn Thr Val Arg Asp Ile Gln Glu Ile 805 810 815 Met Lys Ile Leu Gly Ser Thr Pro Glu Arg Val His Ile Tyr Thr Ser 820 825 830 Pro Lys Trp Lys Trp Asp Val Leu Arg Val Ala Ala Glu Val Gly Lys 835 840 845 Leu Asp Met Gly Ser Ile Met Gly Arg Val Ser Ala Glu Gly Ile His 850 855 860 Asp Asn Met Lys Glu Val Ala Glu Phe Val Arg Arg Ile Ile Arg Asp 865 870 875 880 Leu Gly Lys Ser Glu Val Thr Val Ile Asp Glu Tyr Ser Val Leu Met 885 890 895 Asp Ala Ser Asp Tyr Ile Glu Ser Glu Val Gly Ala Arg Val Val Ile 900 905 910 His Ser Lys Pro Asp Tyr Asp Pro Glu Asn Lys Ala Val Asn Ala Val 915 920 925 Pro Leu Lys Pro Ala Ile Tyr Leu Glu 930 935 <210> 67 <211> 12391 <212> DNA <213> Artificial <220> <223> pSC101-derived plasmid pLASC containing Streptomycese venezuelae papABC <400> 67 gaattcacac acaggaaaca gctatgcgca cgcttctgat cgacaactac gactcgttca 60 cccagaacct gttccagtac atcggcgagg ccaccgggca gccccccgtc gtgcccaacg 120 acgccgactg gtcgcggctg cccctcgagg acttcgacgc gatcgtcgtg tccccgggcc 180 ccggcagccc cgaccgggaa cgggacttcg ggatcagccg ccgggcgatc accgacagcg 240 gcctgcccgt cctcggcgtc tgcctcggcc accagggcat cgcccagctc tcggcggaac 300 ccatgcacgg ccgggtctcc gaggtgcggc acaccggcga ggacgtcttc cggggcctcc 360 cctcgccgtt caccgccgtg cgctaccact ccctggccgc caccgacctc cccgacgagc 420 tcgaacccct cgcctggagc gacgacggcg tcgtcatggg cctgcggcac cgcgagaagc 480 cgctgatggg cgtccagttc ccaccggagt ccatcggcag cgacttcggc cgggagatca 540 tggccaactt ccgcgacctc gccctcgccc accaccgggc acgtcgcgac gcggccgact 600 ggggctacga actccacgtg cgccgcgtcg acgtgctgcc ggacgccgaa gaggtacgcc 660 gcgctgcctg cccggccgag ggcgccacgt tctggctgga cagcagctcc gtcctcgaag 720 gcgcctcgcc gttctccttc ctcggcgacg accgcggccc gctcgccgag tacctcacct 780 accgcgtcgc cgacggcgtc gtctccgtcc gcggctccga cggcaccacg acccgggacg 840 cggcgaccct cttcagctac ctggaggagc agctcgaacc gccggcgggt cccgtcgccc 900 ccgacctgcc cttcgagttc aacctcggct acgtcggcta cctcggctac gagctgaagg 960 cggagaccac cggcgacccc gcagtaccgg ccccgcaccc cgacgccgcg ttcctcttcg 1020 ccgaccgcgc catcgccctc gaccaccagg aaggctgctg ctacctgctg gccctcgacc 1080 gccggggcca cgacgacggc gcccgcgcct ggctgcggga gacggccgag accctcaccg 1140 gcctggccgt ccgcgtccgg ccgaggccga cccccgccat ggtcttcggg gtccccgagg 1200 cggcggccgg cttcggcccc ctggctcgcg cacgccacga caaggacgcc tcggcgctcc 1260 gcaacggcga gtcgtacgag atctgcctga ccaacatggt caccgcgccg accgaggcga 1320 cggccctgcc gctctactcc gcgctgcgcc gcatcagccc cgtcccgtct ggcgccctgc 1380 tcgagttccc cgagctgtcg gtgctcagcg cctcgcccga gcggttcctc acgatcggcg 1440 ccgacggcgg cgtcgagtcc aagcccatca aggggacccg cccccggggc gcaccggcgg 1500 aggaggacga gcggctccgc gccgacctgg ccggccggga gaaggaccgg gccgagaacc 1560 tgatgatcgt cgacctggtc cgcaacgacc tcaacagcgt ctgcgcgatc ggctccgtcc 1620 acgtgccccg gctcttcgag gtgggagacc tcgcgcccgt gcaccagctg gtgtcgacca 1680 tccggggacg gctgcggccc ggcaccagca ccgccgcctg cgtacgcgcc gccttccccg 1740 gcggctccat gaccggcgcg cccaagaagc gacccatgga gatcatcgac cgcctggagg 1800 aaggcccccg gggcgtctta cccggggcgc tcggatggtt cgccctcagc ggcgccgccg 1860 acctcagcat cgtcatccgc accatcgtgc tggccgacgg ccgggccgag ttcggcgtcg 1920 gcggggcgat cgtgtccctc tccgaccagg aggaggagtt caggcagacc gtggtcaagg 1980 cccgcgccat ggtcaccgcc ctcgacggca gcgcagtggc gggcgcacga tgacaccaac 2040 aaggaccata gcatatgacc gagcagaacg agctgcaggt tgcggctgcg cgcggagctc 2100 gacgccctcg acgggacgct tctggacacg gtgcggcgcc gcatcgacct cggtgtccgc 2160 atcgcgcggt acaagtcccg gcacggcgtc ccgatgatgc agcccggccg ggtcagcctg 2220 gtcaaggaca gggccgcccg ctacgccgcc gaccacggcc tcgacgaatc gttcctggtg 2280 aacctctacg acgtgatcat cacggagatg tgccgcgtcg aggacctggt gatgagcccg 2340 tcatgtacta aggaggttgt atgagtggct tcccccggag cgtcgtcgtc ggcggcagcg 2400 gagcggtggg cggcatgttc gccgggctgc tgcgggaggc gggcagccgc acgctcgtcg 2460 tcgacctcgt accgccgccg ggacggccgg acgcctgcct ggtgggcgac gtcaccgcgc 2520 cggggcccga gctcgcggcc gccctccggg acgcggacct cgtcctgctc gccgtacacg 2580 aggacgtggc cctcaaggcc gtggcgcccg tgacccggct catgcgaccg ggcgcgctgc 2640 tcgccgacac cctgtccgtc cggacgggca tggccgcgga gctcgcggcc cacgcccccg 2700 gcgtccagca cgtgggcctc aacccgatgt tcgcccccgc cgccggcatg accggccggc 2760 ccgtggccgc cgtggtcacc agggacgggc cgggcgtcac ggccctgctg cggctcgtcg 2820 agggcggcgg cggcaggccc gtacggctca cggcggagga gcacgaccgg acgacggcgg 2880 cgacccaggc cctgacgcac gccgtgatcc tctccttcgg gctcgccctc gcccgcctcg 2940 gcgtcgacgt ccgggccctg gcggcgacgg caccgccgcc ccaccaggtg ctgctcgccc 3000 tcctggcccg tgtgctcggc ggcagccccg aggtgtacgg ggacatccag cggtccaacc 3060 cccgggcggc gtccgcgcgc cgggcgctcg ccgaggccct gcgctccttc gccgcgctga 3120 tcggcgacga cccggaccgc gccgaggacc cggaccgcgc cgacgacccc gaccgcaccg 3180 acaaccccgg ccatcccggg ggatgcgacg gcgccgggaa cctcgacggc gtcttcgagg 3240 aactccgccg gctcatggga ccggagctcg cggcgggcca ggaccactgc caggagctgt 3300 tccgcaccct ccaccgcacc gacgacgaag gcgagaagga ccgatgaatt taggtgacac 3360 tatagggatc ctctacgccg gacgcatcgt ggccggcatc accggcgcca caggtgcggt 3420 tgctggcgcc tatatcgccg acatcaccga tggggaagat cgggctcgcc acttcgggct 3480 catgagcgct tgtttcggcg tgggtatggt ggcaggcccc gtggccgggg gactgttggg 3540 cgccatctcc ttgcatgcac cattccttgc ggcggcggtg ctcaacggcc tcaacctact 3600 actgggctgc ttcctaatgc aggagtcgca taagggagag cgtcgaccga tgcccttgag 3660 agccttcaac ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact 3720 tatgactgtc ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tctgggtcat 3780 tttcggcgag gaccgctttc gctggagcgc gacgatgatc ggcctgtcgc ttgcggtatt 3840 cggaatcttg cacgccctcg ctcaagcctt cgtcactggt cccgccacca aacgtttcgg 3900 cgagaagcag gccattatcg ccggcatggc ggccgacgcg ctgggctacg tcttgctggc 3960 gttcgcgacg cgaggctgga tggccttccc cattatgatt cttctcgctt ccggcggcat 4020 cgggatgccc gcgttgcagg ccatgctgtc caggcaggta gatgacgacc atcagggaca 4080 gcttcaagga tcgctcgcgg ctcttaccag cctaacttcg atcactggac cgctgatcgt 4140 cacggcgatt tatgccgcct cggcgagcac atggaacggg ttggcatgga ttgtaggcgc 4200 cgccctatac cttgtctgcc tccccgcgtt gcgtcgcggt gcatggagcc gggccacctc 4260 gacctgaatg gaagccggcg gcacctcgct aacggattca ccactccaag aattggagcc 4320 aatcaattct tgcggagaac tgtgaatgcg caaaccaacc cttggcagaa catatccatc 4380 gcgtccgcca tctccagcag ccgcacgcgg cgcatctcgg gcagcgttgg gtcctggcca 4440 cgggtgcgca tgatcgtgct cctgtcgttg aggacccggc taggctggcg gggttgcctt 4500 actggttagc agaatgaatc accgatacgc gagcgaacgt gaagcgactg ctgctgcaaa 4560 acgtctgcga cctgagcaac aacatgaatg gtcttcggtt tccgtgtttc gtaaagtctg 4620 gaaacgcgga agtcccctac gtgctgctga agttgcccgc aacagagagt ggaaccaacc 4680 ggtgatacca cgatactatg actgagagtc aacgccatga gcggcctcat ttcttattct 4740 gagttacaac agtccgcacc gctgccggta gctacttgac tatccggctg cactagccct 4800 gcgtcagatg gctctgatcc aaggcaaact gccaaaatat ctgctggcac cggaagtcag 4860 cgccctgcac cattatgttc cggatctgca tcgcaggatg ctgctggcta ccctgtggaa 4920 cacctacatc tgtattaacg aagcgctggc attgaccctg agtgattttt ctctggtgcc 4980 gccctatccc tttgtgcagc ttgccacgct caaaggggtt tgaggtccaa ccgtacgaaa 5040 acgtacggta agaggaaaat tatcgtctga aaaatcgatt agtagacaag aaagtccgtt 5100 aagtgccaat tttcgattaa aaagacaccg ttttgatggc gttttccaat gtacattatg 5160 tttcgatata tcagacagtt acttcactaa cgtacgtttt cgttctattg gccttcagac 5220 cccatatcct taatgtcctt tatttgctgg ggttatcaga tccccccgac acgtttaatt 5280 aatgctttct ccgccggaga tcgacgcaca ggcttctgtg tctatgatgt tatttcttaa 5340 taatcatcca ggtattctct ttatcaccat acgtagtgcg agtgtccacc ttaacgcagg 5400 gctttccgtc acagcgcgat atgtcagcca gcggggcttt cttttgccag accgcttcca 5460 tcctctgcat ttcagcaatc tggctatacc cgtcattcat aaaccacgta aatgccgtca 5520 cgcaggaagc caggacgaag aatatcgtca gtacaagata aatcgcggat ttccacgtat 5580 agcgtgacat ctcacgacgc atttcatgga tcatcgcttt cgccgtatcg gcagcctgat 5640 tcagcgcttc tgtcgccggt ttctgctgtg ctaatccggc ttgtttcagt tctttctcaa 5700 cctgagtgag cgcggaactc accgatttcc tgacggtgtc agtcatatta ccggacgcgc 5760 tgtccagctc acgaatgacc ctgctcagcg tttcactttg ctgctgtaat tgtgatgagg 5820 cggcctgaaa ctgttctgtc agagaagtaa cacgcttttc cagcgcctga tgatgcccga 5880 taagggcggc aatttgttta atttcgtcgc tcatacaaaa tcctgcctat cgtgagaatg 5940 accagccttt atccggcttc tgtcgtatct gttcggcgag tcgctgtcgt tctttctcct 6000 gctgacgctg tttttccgcc agacgttcgc gctctctctg cctttccatc tcctgatgta 6060 tcccctggaa ctccgccatc gcatcgttaa caagggactg aagatcgatt tcttcctgta 6120 tatccttcat ggcatcactg accagtgcgt tcagcttgtc aggctctttt tcaaaatcaa 6180 acgttctgcc ggaatgggat tcctgctcag gctctgactt cagctcctgt tttagcgtca 6240 gagtatccct ctcgctgagg gcttcccgta acgaggtagt cacgtcaatt acgctgtcac 6300 gttcatcacg ggactgctgc acctgccttt cagcctccct gcgctcaaga atggcctgta 6360 gctgctcagt atcgaatcgc tgaacctgac ccgcgcccag atgccgctca ggctcacggt 6420 caatgccctg cgccttcagg gaacgggaat caacccggtc agcgtgctga taccgttcaa 6480 ggtgcttatt ctggaggtca gcccagcgtc tccctctggg caacaaggta ttctttgcgt 6540 tcggtcggtg tttccccgaa acgtgccttt tttgcgccac cgcgtccggc tctttggtgt 6600 tagcccgttt aaaatactgc tcagggtcac ggtgaatacc gtcattaatg cgttcagaga 6660 acatgatatg ggcgtggggc tgctcgccac cggctatcgc tgctttcgga ttatggatag 6720 cgaactgata ggcatggcgg tcgccaattt cctgttggac aaaatcgcgg acaagctcaa 6780 gacgttgttc gggttttaac tcacgcggca gggcaatctc gatttcacgg taggtacagc 6840 cgttggcacg ttcagacgtg tcagcggctt tccagaactc ggacggttta tgcgctgccc 6900 acgccggcat attgccggac tccttgtgct caaggtcgga gtctttttca cgggcatact 6960 ttccctcacg cgcaatataa tcggcatgag gagaggcact gccttttccg ccggttttta 7020 cgctgagatg ataggatgcc atcgtgtttt atcccgctga agggcgcacg tttctgaacg 7080 aagtgaagaa agtctaagtg cgccctgata aataaaagag ttatcaggga ttgtagtggg 7140 atttgacctc ctctgccatc atgagcgtaa tcattccgtt agcattcagg aggtaaacag 7200 catgaataaa agcgaaaaaa caggaacaat gggcagcaga aagagtgcag tatattcgcg 7260 gcttaaagtc gccgaatgag caacagaaac ttatgctgat actgacggat aaagcagata 7320 aaacagcaca ggatatcaaa acgctgtccc tgctgatgaa ggctgaacag gcagcagaga 7380 aagcgcagga agccagagcg aaagtcatga acctgataca ggcagaaaag cgagccgaag 7440 ccagagccgc ccgtaaagcc cgtgaccatg ctctgtacca gtctgccgga ttgcttatcc 7500 tggcgggtct ggttgacagt aagacgggta agcctgttga tgataccgct gccttactgg 7560 gtgcattagc cagtctgaat gacctgtcac gggataatcc gaagtggtca gactggaaaa 7620 tcagagggca ggaactgctg aacagcaaaa agtcagatag caccacatag cagacccgcc 7680 ataaaacgcc ctgagaagcc cgtgacgggc ttttcttgta ttatgggtag tttccttgca 7740 tgaatccata aaaggcgcct gtagtgccat ttacccccat tcactgccag agccgtgagc 7800 gcagcgaact gaatgtcacg aaaaagacag cgactcaggt gcctgatggt cggagacaaa 7860 aggaatattc agcgatttgc ccgagcttgc gagggtgcta cttaagcctt tagggtttta 7920 aggtctgttt tgtagaggag caaacagcgt ttgcgacatc cttttgtaat actgcggaac 7980 tgactaaagt agtgagttat acacagggct gggatctatt ctttttatct ttttttattc 8040 tttctttatt ctataaatta taaccacttg aatataaaca aaaaaaacac acaaaggtct 8100 agcggaattt acagagggtc tagcagaatt tacaagtttt ccagcaaagg tctagcagaa 8160 tttacagata cccacaactc aaaggaaaag gactagtaat tatcattgac tagcccatct 8220 caattggtat agtgattaaa atcacctaga ccaattgaga tgtatgtctg aattagttgt 8280 tttcaaagca aatgaactag cgattagtcg ctatgactta acggagcatg aaaccaagct 8340 aattttatgc tgtgtggcac tactcaaccc cacgattgaa aaccctacaa ggaaagaacg 8400 gacggtatcg ttcacttata accaatacgc tcagatgatg aacatcagta gggaaaatgc 8460 ttatggtgta ttagctaaag caaccagaga gctgatgacg agaactgtgg aaatcaggaa 8520 tcctttggtt aaaggctttg agattttcca gtggacaaac tatgccaagt tctcaagcga 8580 aaaattagaa ttagttttta gtgaagagat attgccttat cttttccagt taaaaaaatt 8640 cataaaatat aatctggaac atgttaagtc ttttgaaaac aaatactcta tgaggattta 8700 tgagtggtta ttaaaagaac taacacaaaa gaaaactcac aaggcaaata tagagattag 8760 ccttgatgaa tttaagttca tgttaatgct tgaaaataac taccatgagt ttaaaaggct 8820 taaccaatgg gttttgaaac caataagtaa agatttaaac acttacagca atatgaaatt 8880 ggtggttgat aagcgaggcc gcccgactga tacgttgatt ttccaagttg aactagatag 8940 acaaatggat ctcgtaaccg aacttgagaa caaccagata aaaatgaatg gtgacaaaat 9000 accaacaacc attacatcag attcctacct acgtaacgga ctaagaaaaa cactacacga 9060 tgctttaact gcaaaaattc agctcaccag ttttgaggca aaatttttga gtgacatgca 9120 aagtaagcat gatctcaatg gttcgttctc atggctcacg caaaaacaac gaaccacact 9180 agagaacata ctggctaaat acggaaggat ctgaggttct tatggctctt gtatctatca 9240 gtgaagcatc aagactaaca aacaaaagta gaacaactgt tcaccgttag atatcaaagg 9300 gaaaactgtc catatgcaca gatgaaaacg gtgtaaaaaa gatagataca tcagagcttt 9360 tacgagtttt tggtgcattt aaagctgttc accatgaaca gatcgacaat gtaacagatg 9420 aacagcatgt aacacctaat agaacaggtg aaaccagtaa aacaaagcaa ctagaacatg 9480 aaattgaaca cctgagacaa cttgttacag ctcaacagtc acacatagac agcctgaaac 9540 aggcgatgct gcttatcgaa tcaaagctgc cgacaacacg ggagccagtg acgcctcccg 9600 tggggaaaaa atcatggcaa ttctggaaga aatagcgctt tcagccggca aacctgaagc 9660 cggatctgcg attctgataa caaactagca acaccagaac agcccgtttg cgggcagcaa 9720 aacccgtact tttggacgtt ccggcggttt tttgtggcga gtggtgttcg ggcggtgcgc 9780 gcaagatcca ttatgttaaa cgggcgagtt tacatctcaa aaccgcccgc ttaacaccat 9840 cagaaatcct cagcgcgatt ttaagcacca accccccccc gtaacaccca aatccatact 9900 gaaagtggct ttgttgaata aatcgaactt ttgctgagtt gaaggatcag atcacgcatc 9960 ctcccgacaa cacagaccat tccgtggcaa agcaaaagtt cagaatcacc aactggtcca 10020 cctacaacaa agctctcatc aaccgtggct ccctcacttt ctggctggat gatgaggcga 10080 ttcaggcctg gtatgagtcg gcaacacctt catcacgagg aaggccccag cgctattctg 10140 atctcgccat caccaccgtt ctggtgatta aacgcgtatt ccggctgacc ctgcgggctg 10200 cgcagggttt tattgattcc atttttgccc tgatgaacgt tccgttgcgc tgcccggatt 10260 acaccagtgt cagtaagcgg gcaaagtcgg ttaatgtcag tttcaaaacg tccacccggg 10320 gtgaaatcgc acacctggtg attgattcca ccgggctgaa ggtctttggt gaaggcgaat 10380 ggaaagtcag aaagcacggc aaagagcgcc gtcgtatctg gcgaaagttg catcttgctg 10440 ttgacagcaa cacacatgaa gttgtctgtg cagacctgtc gctgaataac gtcacggact 10500 cagaagcctt cccgggcctt atccggcaga ctcacagaaa aatcagggca gccgcggcag 10560 acggggctta cgatacccgg ctctgtcacg atgaactgcg ccgcaaaaaa atcagcgcgc 10620 ttattcctcc ccgaaaaggt gcgggttact ggcccggtga atatgcagac cgtaaccgtg 10680 cagtggctaa tcagcgaatg accgggagta atgcgcggtg gaaatggaca acagattaca 10740 accgtcgctc gatagcggaa acggcgatgt accgggtaaa acagctgttc gggggttcac 10800 tgacgctgcg tgactacgat ggtcaggttg cggaggctat ggccctggta cgagcgctga 10860 acaaaatgac gaaagcaggt atgcctgaaa gcgtgcgtat tgcctgaaaa cacaacccgc 10920 tacgggggag acttacccga aatctgattt attcaacaaa gccgggtgtg gtgaactaca 10980 aagcagaccc gttgaggtta tcagttcgat gcacaatcag cagcgcataa aatatgcaca 11040 agaacaggag cacccttcgc attaagctgt ggtggtaaca agtagtgccg ggctaccatc 11100 agcgagcatg atgcgctccc acagcattcg ccttggcagt atggaagttc ctcgctccag 11160 ttcgggccgg tatccacctc gagaggtggc acttttcggg gaaatgtgcg cggaacccct 11220 atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 11280 taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 11340 cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 11400 aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 11460 aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 11520 tttaaagttc tgctatgtgg cgcggtatta tcccgtgttg acgccgggca agagcaactc 11580 ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 11640 catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 11700 aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 11760 ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 11820 gccataccaa acgacgagcg tgacaccacg atgcctgcag caatggcaac aacgttgcgc 11880 aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 11940 gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 12000 gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca 12060 gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 12120 gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaacccggg 12180 accaagttta ctcatatata cggacagcgg tgcggactgt tgtaactcag aataagaaat 12240 gaggccgctc atggcgttct gttgcccgtc tcactggtga aaagaaaaac aaccctggcg 12300 ccgcttcttt gagcgaacga tcaaaaataa gtggcgcccc atcaaaaaaa tattctcaac 12360 ataaaaaact ttgtgtaata cttgtaacgc t 12391 <210> 68 <211> 3305 <212> DNA <213> Streptomyces venezuelae <400> 68 atgcgcacgc ttctgatcga caactacgac tcgttcaccc agaacctgtt ccagtacatc 60 ggcgaggcca ccgggcagcc ccccgtcgtg cccaacgacg ccgactggtc gcggctgccc 120 ctcgaggact tcgacgcgat cgtcgtgtcc ccgggccccg gcagccccga ccgggaacgg 180 gacttcggga tcagccgccg ggcgatcacc gacagcggcc tgcccgtcct cggcgtctgc 240 ctcggccacc agggcatcgc ccagctctcg gcggaaccca tgcacggccg ggtctccgag 300 gtgcggcaca ccggcgagga cgtcttccgg ggcctcccct cgccgttcac cgccgtgcgc 360 taccactccc tggccgccac cgacctcccc gacgagctcg aacccctcgc ctggagcgac 420 gacggcgtcg tcatgggcct gcggcaccgc gagaagccgc tgatgggcgt ccagttccca 480 ccggagtcca tcggcagcga cttcggccgg gagatcatgg ccaacttccg cgacctcgcc 540 ctcgcccacc accgggcacg tcgcgacgcg gccgactggg gctacgaact ccacgtgcgc 600 cgcgtcgacg tgctgccgga cgccgaagag gtacgccgcg ctgcctgccc ggccgagggc 660 gccacgttct ggctggacag cagctccgtc ctcgaaggcg cctcgccgtt ctccttcctc 720 ggcgacgacc gcggcccgct cgccgagtac ctcacctacc gcgtcgccga cggcgtcgtc 780 tccgtccgcg gctccgacgg caccacgacc cgggacgcgg cgaccctctt cagctacctg 840 gaggagcagc tcgaaccgcc ggcgggtccc gtcgcccccg acctgccctt cgagttcaac 900 ctcggctacg tcggctacct cggctacgag ctgaaggcgg agaccaccgg cgaccccgca 960 gtaccggccc cgcaccccga cgccgcgttc ctcttcgccg accgcgccat cgccctcgac 1020 caccaggaag gctgctgcta cctgctggcc ctcgaccgcc ggggccacga cgacggcgcc 1080 cgcgcctggc tgcgggagac ggccgagacc ctcaccggcc tggccgtccg cgtccggccg 1140 aggccgaccc ccgccatggt cttcggggtc cccgaggcgg cggccggctt cggccccctg 1200 gctcgcgcac gccacgacaa ggacgcctcg gcgctccgca acggcgagtc gtacgagatc 1260 tgcctgacca acatggtcac cgcgccgacc gaggcgacgg ccctgccgct ctactccgcg 1320 ctgcgccgca tcagccccgt cccgtctggc gccctgctcg agttccccga gctgtcggtg 1380 ctcagcgcct cgcccgagcg gttcctcacg atcggcgccg acggcggcgt cgagtccaag 1440 cccatcaagg ggacccgccc ccggggcgca ccggcggagg aggacgagcg gctccgcgcc 1500 gacctggccg gccgggagaa ggaccgggcc gagaacctga tgatcgtcga cctggtccgc 1560 aacgacctca acagcgtctg cgcgatcggc tccgtccacg tgccccggct cttcgaggtg 1620 ggagacctcg cgcccgtgca ccagctggtg tcgaccatcc ggggacggct gcggcccggc 1680 accagcaccg ccgcctgcgt acgcgccgcc ttccccggcg gctccatgac cggcgcgccc 1740 aagaagcgac ccatggagat catcgaccgc ctggaggaag gcccccgggg cgtcttaccc 1800 ggggcgctcg gatggttcgc cctcagcggc gccgccgacc tcagcatcgt catccgcacc 1860 atcgtgctgg ccgacggccg ggccgagttc ggcgtcggcg gggcgatcgt gtccctctcc 1920 gaccaggagg aggagttcag gcagaccgtg gtcaaggccc gcgccatggt caccgccctc 1980 gacggcagcg cagtggcggg cgcccgatga gcggcttccc ccggagcgtc gtcgtcggcg 2040 gcagcggagc ggtgggcggc atgttcgccg ggctgctgcg ggaggcgggc agccgcacgc 2100 tcgtcgtcga cctcgtaccg ccgccgggac ggccggacgc ctgcctggtg ggcgacgtca 2160 ccgcgccggg gcccgagctc gcggccgccc tccgggacgc ggacctcgtc ctgctcgccg 2220 tacacgagga cgtggccctc aaggccgtgg cgcccgtgac ccggctcatg cgaccgggcg 2280 cgctgctcgc cgacaccctg tccgtccgga cgggcatggc cgcggagctc gcggcccacg 2340 cccccggcgt ccagcacgtg ggcctcaacc cgatgttcgc ccccgccgcc ggcatgaccg 2400 gccggcccgt ggccgccgtg gtcaccaggg acgggccggg cgtcacggcc ctgctgcggc 2460 tcgtcgaggg cggcggcggc aggcccgtac ggctcacggc ggaggagcac gaccggacga 2520 cggcggcgac ccaggccctg acgcacgccg tgatcctctc cttcgggctc gccctcgccc 2580 gcctcggcgt cgacgtccgg gccctggcgg cgacggcacc gccgccccac caggtgctgc 2640 tcgccctcct ggcccgtgtg ctcggcggca gccccgaggt gtacggggac atccagcggt 2700 ccaacccccg ggcggcgtcc gcgcgccggg cgctcgccga ggccctgcgc tccttcgccg 2760 cgctgatcgg cgacgacccg gaccgcgccg aggacccgga ccgcgccgac gaccccgacc 2820 gcaccgacaa ccccggccat cccgggggat gcgacggcgc cgggaacctc gacggcgtct 2880 tcgaggaact ccgccggctc atgggaccgg agctcgcggc gggccaggac cactgccagg 2940 agctgttccg caccctccac cgcaccgacg acgaaggcga gaaggaccga tgaccgagca 3000 gaacgagctg caggttgcgg ctgcgcgcgg agctcgacgc cctcgacggg acgcttctgg 3060 acacggtgcg gcgccgcatc gacctcggtg tccgcatcgc gcggtacaag tcccggcacg 3120 gcgtcccgat gatgcagccc ggccgggtca gcctggtcaa ggacagggcc gcccgctacg 3180 ccgccgacca cggcctcgac gaatcgttcc tggtgaacct ctacgacgtg atcatcacgg 3240 agatgtgccg cgtcgaggac ctggtgatga gccgggagag cctgacggcc gaggaccggc 3300 ggtga 3305 <210> 69 <211> 77 <212> DNA <213> Methanococcus jannaschii <400> 69 ccggcggtag ttcagcaggg cagaacggcg gactctaaat ccgcatggcg ctggttcaaa 60 tccggcccgc cggacca 77 <210> 70 <211> 88 <212> DNA <213> Halobacterium sp. NRC-1 <400> 70 cccagggtag ccaagctcgg ccaacggcga cggactctaa atccgttctc gtaggagttc 60 gagggttcga atcccttccc tgggacca 88 <210> 71 <211> 89 <212> DNA <213> Halobacterium sp. NRC-1 <400> 71 gcgagggtag ccaagctcgg ccaacggcga cggacttcct aatccgttct cgtaggagtt 60 cgagggttcg aatccctccc ctcgcacca 89 <210> 72 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 72 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gly 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Thr Tyr Tyr 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 73 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 73 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gly 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ser Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Thr Ser His 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 74 <211> 305 <212> PRT <213> Methanococcus jannaschii <400> 74 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ala 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Pro Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Ala Ile Tyr 145 150 155 160 Leu Ala Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile His 165 170 175 Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His Asn 180 185 190 Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser Lys 195 200 205 Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala Lys 210 215 220 Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro Ile 225 230 235 240 Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys Arg 245 250 255 Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu Leu 260 265 270 Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys Asn 275 280 285 Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys Arg 290 295 300 Leu 305 <210> 75 <211> 305 <212> PRT <213> Methanococcus jannaschii <400> 75 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ala 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Pro Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Ile Pro Tyr 145 150 155 160 Leu Pro Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile His 165 170 175 Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His Asn 180 185 190 Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser Lys 195 200 205 Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala Lys 210 215 220 Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro Ile 225 230 235 240 Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys Arg 245 250 255 Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu Leu 260 265 270 Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys Asn 275 280 285 Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys Arg 290 295 300 Leu 305 <210> 76 <211> 305 <212> PRT <213> Methanococcus jannaschii <400> 76 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ala 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Lys Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Ala Ile Tyr 145 150 155 160 Leu Ala Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile His 165 170 175 Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His Asn 180 185 190 Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser Lys 195 200 205 Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala Lys 210 215 220 Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro Ile 225 230 235 240 Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys Arg 245 250 255 Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu Leu 260 265 270 Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys Asn 275 280 285 Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys Arg 290 295 300 Leu 305 <210> 77 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 77 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Asn Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Leu His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 78 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 78 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ser Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Leu His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 79 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 79 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Val His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 80 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 80 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Thr 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Ser Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Pro Ser His 145 150 155 160 Tyr Gln Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 81 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 81 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Cys His 145 150 155 160 Tyr Arg Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 82 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 82 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Leu 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Thr His 145 150 155 160 Tyr Arg Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 83 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 83 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ala 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Glu Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Gly Gly His 145 150 155 160 Tyr Leu Gly Val Asp Val Ile Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 84 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 84 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Ala 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Arg Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Val Ile His 145 150 155 160 Tyr Asp Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305 <210> 85 <211> 306 <212> PRT <213> Methanococcus jannaschii <400> 85 Met Asp Glu Phe Glu Met Ile Lys Arg Asn Thr Ser Glu Ile Ile Ser 1 5 10 15 Glu Glu Glu Leu Arg Glu Val Leu Lys Lys Asp Glu Lys Ser Ala Gly 20 25 30 Ile Gly Phe Glu Pro Ser Gly Lys Ile His Leu Gly His Tyr Leu Gln 35 40 45 Ile Lys Lys Met Ile Asp Leu Gln Asn Ala Gly Phe Asp Ile Ile Ile 50 55 60 Leu Leu Ala Asp Leu His Ala Tyr Leu Asn Gln Lys Gly Glu Leu Asp 65 70 75 80 Glu Ile Arg Lys Ile Gly Asp Tyr Asn Lys Lys Val Phe Glu Ala Met 85 90 95 Gly Leu Lys Ala Lys Tyr Val Tyr Gly Ser Thr Phe Gln Leu Asp Lys 100 105 110 Asp Tyr Thr Leu Asn Val Tyr Arg Leu Ala Leu Lys Thr Thr Leu Lys 115 120 125 Arg Ala Arg Arg Ser Met Glu Leu Ile Ala Arg Glu Asp Glu Asn Pro 130 135 140 Lys Val Ala Glu Val Ile Tyr Pro Ile Met Gln Val Asn Thr Tyr Tyr 145 150 155 160 Tyr Leu Gly Val Asp Val Ala Val Gly Gly Met Glu Gln Arg Lys Ile 165 170 175 His Met Leu Ala Arg Glu Leu Leu Pro Lys Lys Val Val Cys Ile His 180 185 190 Asn Pro Val Leu Thr Gly Leu Asp Gly Glu Gly Lys Met Ser Ser Ser 195 200 205 Lys Gly Asn Phe Ile Ala Val Asp Asp Ser Pro Glu Glu Ile Arg Ala 210 215 220 Lys Ile Lys Lys Ala Tyr Cys Pro Ala Gly Val Val Glu Gly Asn Pro 225 230 235 240 Ile Met Glu Ile Ala Lys Tyr Phe Leu Glu Tyr Pro Leu Thr Ile Lys 245 250 255 Arg Pro Glu Lys Phe Gly Gly Asp Leu Thr Val Asn Ser Tyr Glu Glu 260 265 270 Leu Glu Ser Leu Phe Lys Asn Lys Glu Leu His Pro Met Asp Leu Lys 275 280 285 Asn Ala Val Ala Glu Glu Leu Ile Lys Ile Leu Glu Pro Ile Arg Lys 290 295 300 Arg Leu 305

Claims (15)

  1. 슈도모나스(Pseudomonas) 종 또는 이로부터 유래한 균주의 번역 시스템을 포함하는 조성물로서, 상기 번역 시스템은 오르소고날(orthogonal) tRNA(O-tRNA) 및 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 포함하며, 여기서 O-RS는 번역 시스템 내에서 하나 이상의 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하고 O-tRNA는 하나 이상의 셀렉터 코돈을 인식하는 조성물.
  2. 제1항에 있어서, 번역 시스템은 슈도모나스 종 또는 이의 균주로부터 유래하는 시험관 내 번역 시스템을 포함하는 것인 조성물.
  3. 제1항에 있어서, 번역 시스템은 슈도모나스 종 또는 이의 균주의 세포 추출물을 포함하는 조성물.
  4. 제1항에 있어서, O-tRNA는 서열 번호 1∼3으로 이루어진 군으로부터 선택된 폴리뉴클레오티드 서열 및 이의 상보적 폴리뉴클레오티드 서열을 포함하는 핵산을 포함하는 것인 조성물.
  5. 제1항에 있어서, O-RS는
    서열 번호 4∼34로 이루어진 군으로부터 선택되는 아미노산 서열을 포함하는 폴리펩티드, 및
    서열 번호 35∼66으로 이루어진 군으로부터 선택된 폴리뉴클레오티드 서열 및 이의 상보적 폴리뉴클레오티드 서열을 포함하는 핵산에 의해 코딩되는 폴리펩티드
    로 이루어진 군으로부터 선택되는 폴리펩티드를 포함하는 것인 조성물.
  6. 제1항에 있어서, 하나 이상의 비천연 아미노산은 0-메틸-L-티로신, L-3-(2-나프틸)알라닌, 3-메틸-페닐알라닌, 0-4-알릴-L-티로신, 4-프로필-L-티로신, 트리-O-아세틸-GlcNAcβ-세린, L-도파, 플루오르화 페닐알라닌, 이소프로필-L-페닐알라닌, p-아지도-L-페닐알라닌, p-아실-L-페닐알라닌, p-벤조일-L-페닐알라닌, L-포스포세린, 포스포노세린, 포스포노티로신, p-요오도-페닐알라닌, p-브로모페닐알라닌, p-아미노-L-페닐알라닌, 이소프로필-L-페닐알라닌, 티로신 아미노산의 비천연 유사체; 글루타민 아미노산의 비천연 유사체; 페닐알라닌 아미노산의 비천연 유사체; 세린 아미노산의 비천연 유사체; 트레오닌 아미노산의 비천연 유사체; 알킬, 아릴, 아실, 아지도, 시아노, 할로, 히드라진, 히드라지드, 히드록실, 알케닐, 알키닐, 에테르, 티올, 술포닐, 셀레노, 에스테르, 티오산, 보레이트, 보로네이트, 포스포, 포스포노, 포스핀, 헤테로시클릭, 에논, 이민, 알데히드, 히드록실아민, 케토, 또는 아미노 치환된 아미노산, 또는 이들의 임의 조합; 광활성화 가교기를 갖는 아미노산; 스핀-표지된 아미노산; 형광성 아미노산; 신규 작용기를 갖는 아미노산; 다른 분자와 공유 또는 비공유 상호작용하는 아미노산; 금속-결합 아미노산; 금속-함유 아미노산; 방사성 아미노산; 광포집(photocaged) 및/또는 광이성화 아미노산; 비오틴 또는 비오틴 유사체 함유 아미노산; 글리코실화 또는 탄수화물 변형 아미노산; 케토-함유 아미노산; 폴리에틸렌 글리콜 또는 폴리에테르 포함 아미노산; 중원자-치환된 아미노산; 화학적 절단형 또는 광절단형 아미노산; 연장 측쇄를 갖는 아미노산; 독성기 함유 아미노산; 당 치환된 아미노산, 예컨대 당 치환된 세린 등; 탄소-연결 당-함유 아미노산; 산화환원-활성 아미노산; α-히드록시 함유 아미노산; 아미노 티오산 함유 아미노산; α,α-이치환된 아미노산; β-아미노산; 및 프롤린 이외의 환형 아미노산으로 이루어진 군으로부터 선택되는 것인 조성물.
  7. 제1항에 있어서, 하나 이상의 셀렉터 코돈은 넌센스 코돈, 희소 코돈 또는 4 염기 코돈인 조성물.
  8. 제1항에 있어서, 하나 이상의 셀렉터 코돈은 앰버 코돈인 조성물.
  9. 슈도모나스 번역 시스템에서 하나 이상의 비천연 아미노산을 포함하는 하나 이상의 단백질을 생산하는 방법으로서,
    상기 번역 시스템에 하나 이상의 셀렉터 코돈을 포함하는 하나 이상의 핵산을 제공하는 단계로서, 여기서 핵산은 하나 이상의 단백질을 코딩하는 것인 단계;
    상기 번역 시스템에 오르소고날 tRNA (O-tRNA)을 제공하는 단계로서, 여기서 O-tRNA는 상기 번역 시스템 내에서 작용하고, 하나 이상의 셀렉터 코돈을 인식하는 것인 단계;
    상기 번역 시스템에 오르소고날 아미노아실 tRNA 합성효소(O-RS)를 제공하는 단계로서, 여기서 O-RS는 번역 시스템에서 하나 이상의 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하는 것인 단계; 및
    상기 번역 시스템에 하나 이상의 비천연 아미노산을 제공하여, 이 번역 시스템 내에서 하나 이상의 비천연 아미노산을 포함하는 하나 이상의 단백질을 생산하는 단계
    를 포함하는 방법.
  10. 제9항의 방법을 통해 생산된 하나 이상의 비천연 아미노산을 포함하는 단백질로서, 세포-의존적 방식으로 처리되고 변형되는 단백질.
  11. 제10항에 있어서, 사이토킨, 성장 인자, 성장 인자 수용체, 인터페론, 인터류킨, 염증성 분자, 발암유전자 산물, 펩티드 호르몬, 신호 전달 분자, 스테로이드 호르몬 수용체, 전사 활성화제, 전사 억제제, 에리트로포이에틴(EPO), 인슐린, 인간 성장 호르몬, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GRO, MIP-1α, MIP-1β, MCP-1, 간세포 성장 인자, 인슐린-유사 성장 인자, 백혈병 억제 인자, 온코스타틴(oncostatin) M, PD-ECSF, PDGF, 플레이오트로핀, SCF, c-키트 리간드, VEGF, G-CSF, IL-1, IL-2, IL-8, IGF-I, IGF-II, FGF(섬유모세포 성장 인자), PDGF, TNF, TGF-α, TGF-β, EGF(상피 성장 인자), KGF(각화세포 성장 인자), SCF/c-키트, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1, 히알루린/CD44, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체 및 코르티코스테론으로 이루어진 군으로부터 선택되는 치료 단백질과 상동성인 단백질.
  12. 제10항에 있어서, 알파-1 안티트립신, 안지오스타틴, 항용혈성 인자, 항체, 아포지단백질, 아포단백질, 심방 나트륨 이뇨성 인자, 심방 나트륨 이뇨성 폴리펩티드, 심방 펩티드, C-X-C 케모킨, T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG, 칼시토닌, c-키트 리간드, 사이토킨, CC 케모킨, 단핵구 화학유인성 단백질-1, 단핵구 화학유인성 단백질-2, 단핵구 화학유인성 단백질-3, 단핵구 염증성 단백질-1 알파, 단핵구 염증성 단백질-1 베타, RANTES, I309, R83915, R91733, HCC1, T58847, D31065, T64262, CD40, CD40 리간드, C-키트 리간드, 콜라겐, 콜로니 자극 인자(CSF), 보체 인자 5a, 보체 억제제, 보체 수용체 1, 사이토킨, 상피 호중구 활성화 펩티드-78, GROα/MGSA, GROβ, GR0, MIP-1α, MIP-1β, MCP-1, 상피 성장 인자(EGF), 상피 호중구 활성화 펩티드, 에리트로포이에틴 (EPO), 박리(Exfoliating) 독소, 인자 IX, 인자 VII, 인자 VIII, 인자 X, 섬유모세포 성장 인자(FGF), 피브리노겐, 피브로넥틴, G-CSF, GM-CSF, 글루코세레브로시다제, 고나도트로핀, 성장 인자, 성장 인자 수용체, 헤지호그 단백질, 헤모글로빈, 간세포 성장 인자(HGF), 히루딘, 인간 혈청 알부민, ICAM-1, ICAM-1 수용체, LFA-1, LFA-1 수용체, 인슐린, 인슐린-유사 성장 인자(IGF), IGF- I, IGF-II, 인터페론, IFN-α, IFN-β, IFN-γ, 인터류킨, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, 각화세포 성장 인자(KGF), 락토페린, 백혈병 억제 인자, 루시퍼라제, 뉴르투린, 호중구 억제 인자(NIF), 온코스타틴 M, 골형성 단백질, 발암유전자 산물, 파라티로이드 호르몬, PD-ECSF, PDGF, 펩티드 호르몬, 인간 성장 호르몬, 플레이오트로핀, 단백질 A, 단백질 G, 발열성 외독소 A, B 또는 C, 리랙신, 레닌, SCF, 가용성 보체 수용체 I, 가용성 I-CAM 1, 가용성 인터류킨 수용체, 가용성 TNF 수용체, 소마토메딘, 소마토스타틴, 소마토트로핀, 스트렙토키나제, 초항원, 포도상구균(Staphylococcal) 장독소, SEA, SEB, SEC1, SEC2, SEC3, SED, SEE, 스테로이드 호르몬 수용체, 수퍼옥시드 디스뮤타제, 독성 쇼크 증후군 독소, 티모신 알파 1, 조직 플라스미노겐 활성화제, 종양 성장 인자(TGF), TGF-α, TGF-β, 종양 괴사 인자, 종양 괴사 인자 알파, 종양 괴사 인자 베타, 종양 괴사 인자 수용체(TNFR), VLA-4 단백질, VCAM-1 단백질, 혈관 내피 성장 인자(VEGF), 유로키나제, Mos, Ras, Raf, Met; p53, Tat, Fos, Myc, Jun, Myb, Rel, 에스트로겐 수용체, 프로게스테론 수용체, 테스토스테론 수용체, 알도스테론 수용체, LDL 수용체 및 코르티코스테론으로 이루어진 군으로부터 선택되는 치료 단백질과 상동성인 단백질.
  13. (a) 세포 내에서 하나 이상의 탄소 공급원으로부터 비천연 아미노산을 생성하기 위한 생합성 경로 시스템; 및
    (b) 오르소고날 tRNA(O-tRNA) 및 오르소고날 아미노아실 tRNA 합성효소(O- RS)를 포함하는 번역 시스템으로서, 여기서 O-RS는 비천연 아미노산으로 O-tRNA를 우선적으로 아미노아실화하고, O-tRNA는 셀렉터 코돈에 대응하는 비천연 아미노산을 단백질에 도입하는 것인 번역 시스템
    을 포함하는 슈도모나스 세포.
  14. 제13항에 있어서, 셀렉터 코돈은 넌센스 코돈, 4 염기 코돈, 오커 코돈, 오팔 코돈 또는 앰버 코돈을 포함하는 것인 세포.
  15. 제13항에 있어서, 생합성 경로 시스템은 폴리펩티드에 도입하기에 충분한 양으로 비천연적으로 코딩된 아미노산을 생성시키는 것인 세포.
KR1020077030326A 2005-06-03 2006-06-02 비천연적으로 코딩된 아미노산의 단백질로의 도입 KR20080026120A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US68760305P 2005-06-03 2005-06-03
US60/687,603 2005-06-03

Publications (1)

Publication Number Publication Date
KR20080026120A true KR20080026120A (ko) 2008-03-24

Family

ID=37498945

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077030326A KR20080026120A (ko) 2005-06-03 2006-06-02 비천연적으로 코딩된 아미노산의 단백질로의 도입

Country Status (11)

Country Link
US (1) US20080227205A1 (ko)
EP (1) EP1891092A4 (ko)
JP (1) JP2008541766A (ko)
KR (1) KR20080026120A (ko)
CN (1) CN101238143A (ko)
AU (1) AU2006255280A1 (ko)
CA (1) CA2608192A1 (ko)
IL (1) IL187191A0 (ko)
MX (1) MX2007015106A (ko)
SG (1) SG165339A1 (ko)
WO (1) WO2006132969A2 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050287639A1 (en) 2004-05-17 2005-12-29 California Institute Of Technology Methods of incorporating amino acid analogs into proteins
US20090240029A1 (en) * 2005-12-30 2009-09-24 Ambrx, Inc. Compositions Containing, Methods Involving, and Uses of Non-Natural Amino Acids and Polypeptides
WO2007103307A2 (en) 2006-03-03 2007-09-13 California Institute Of Technology Site-specific incorporation of amino acids into molecules
CN104163864B (zh) * 2007-03-30 2017-08-01 Ambrx公司 经修饰fgf‑21多肽和其用途
JP5547083B2 (ja) 2007-11-20 2014-07-09 アンブルックス,インコーポレイテッド 修飾されたインスリンポリペプチドおよびそれらの使用
WO2009075788A1 (en) * 2007-12-05 2009-06-18 Semprus Biociences Corporation Synthetic non-fouling amino acids
WO2010096394A2 (en) 2009-02-17 2010-08-26 Redwood Biosciences, Inc. Aldehyde-tagged protein-based drug carriers and methods of use
JP5751641B2 (ja) 2009-05-06 2015-07-22 ヤンセン バイオテツク,インコーポレーテツド メラノコルチン受容体結合コンジュゲート
WO2011079293A1 (en) * 2009-12-23 2011-06-30 Ambrx, Inc Tumor necrosis factor-related apoptosis inducing ligand polypeptides and their uses
CN103044539B (zh) * 2010-04-09 2014-10-22 苏州元基生物技术有限公司 重组促红细胞生成素及制备方法
US9567386B2 (en) 2010-08-17 2017-02-14 Ambrx, Inc. Therapeutic uses of modified relaxin polypeptides
MX346786B (es) 2010-08-17 2017-03-31 Ambrx Inc Polipeptidos de relaxina modificados y sus usos.
JP6162606B2 (ja) 2011-01-14 2017-07-12 レッドウッド バイオサイエンス, インコーポレイテッド アルデヒド−タグ付き免疫グロブリンポリペプチド及びその使用方法
EP2804631B1 (en) 2012-01-20 2021-03-17 i2 Pharmaceuticals, Inc. Surrobody conjugates
CN105420203B (zh) * 2014-09-03 2018-11-16 中国科学院生物物理研究所 酪氨酸类似物翻译系统和基因编码的蛋白质光致电子转移荧光传感器蛋白家族
PL3412302T3 (pl) * 2014-10-24 2021-11-02 Bristol-Myers Squibb Company Zmodyfikowane polipeptydy fgf-21 i ich zastosowania
WO2017189432A1 (en) 2016-04-26 2017-11-02 R.P. Scherer Technologies, Llc Antibody conjugates and methods of making and using the same
JP7527537B2 (ja) * 2016-05-10 2024-08-05 ソニーグループ株式会社 ペプチド骨格を有する超明色ポリマー染料
CN110637027B (zh) 2017-02-08 2024-08-30 百时美施贵宝公司 包含药代动力学增强子的修饰的松弛素多肽及其用途
EP3381932A1 (en) 2017-03-28 2018-10-03 Technische Universität Berlin Modified mussel proteins, uses thereof and related compounds
CN112375774A (zh) * 2020-10-26 2021-02-19 浙江新码生物医药有限公司 一种重组蛋白表达用工程菌株的构建方法
CN112279906B (zh) * 2020-10-30 2022-09-20 浙江新码生物医药有限公司 人白细胞介素2-聚乙二醇偶联物及其制备方法与应用
AU2023218678A1 (en) 2022-02-09 2024-08-01 Daiichi Sankyo Company, Limited Environmentally responsive masked antibody and use thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6586207B2 (en) * 2000-05-26 2003-07-01 California Institute Of Technology Overexpression of aminoacyl-tRNA synthetases for efficient production of engineered proteins containing amino acid analogues
AU2002303431C1 (en) * 2001-04-19 2008-03-06 The Regents Of The University Of California Methods and composition for the production of orthoganal tRNA-aminoacyltRNA synthetase pairs
US8906676B2 (en) * 2004-02-02 2014-12-09 Ambrx, Inc. Modified human four helical bundle polypeptides and their uses
CA2590429C (en) * 2004-12-22 2014-10-07 Ambrx, Inc. Compositions of aminoacyl-trna synthetase and uses thereof

Also Published As

Publication number Publication date
MX2007015106A (es) 2008-02-15
WO2006132969A3 (en) 2007-11-22
CN101238143A (zh) 2008-08-06
EP1891092A4 (en) 2011-12-21
SG165339A1 (en) 2010-10-28
US20080227205A1 (en) 2008-09-18
JP2008541766A (ja) 2008-11-27
CA2608192A1 (en) 2006-12-14
EP1891092A2 (en) 2008-02-27
WO2006132969A2 (en) 2006-12-14
AU2006255280A1 (en) 2006-12-14
IL187191A0 (en) 2008-02-09

Similar Documents

Publication Publication Date Title
US20080227205A1 (en) Incorporation on Non-Naturally Encoded Amino Acids Into Proteins
AU2005323106B2 (en) Methods for expression and purification of recombinant human growth hormone
KR101207123B1 (ko) 변형된 인간 성장 호르몬 폴리펩티드 및 이의 용도
EP2342223B1 (en) Modified animal erythropoietin polypeptides and their uses
JP5840345B2 (ja) 修飾ヒト血漿ポリペプチドまたは修飾ヒトFc足場タンパク質ならびにこれらの利用
KR20080108416A (ko) 조절된 면역원성을 갖는 비천연 아미노산 폴리펩티드
AU2010341516B2 (en) Modified bovine somatotropin polypeptides and their uses
KR20120123365A (ko) 변형된 돼지 소마토트로핀 폴리펩티드 및 이의 용도
JP2009514533A (ja) 生合成ポリペプチド融合阻害剤
AU2014202108A1 (en) Modified bovine somatotropin polypeptides and their uses
MX2008009224A (es) Polipeptidos de aminoacidos no naturales, que tienen inmunogenicidad modulada

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application