KR20220125293A - 생물학적 활성 대사물질의 발견 및 진화 - Google Patents

생물학적 활성 대사물질의 발견 및 진화 Download PDF

Info

Publication number
KR20220125293A
KR20220125293A KR1020227026953A KR20227026953A KR20220125293A KR 20220125293 A KR20220125293 A KR 20220125293A KR 1020227026953 A KR1020227026953 A KR 1020227026953A KR 20227026953 A KR20227026953 A KR 20227026953A KR 20220125293 A KR20220125293 A KR 20220125293A
Authority
KR
South Korea
Prior art keywords
protein
pathway
glu
produces
leu
Prior art date
Application number
KR1020227026953A
Other languages
English (en)
Inventor
제롬 폭스
안쿠르 사카르
Original Assignee
더 리전츠 오브 더 유니버시티 오브 콜로라도, 어 바디 코퍼레이트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 리전츠 오브 더 유니버시티 오브 콜로라도, 어 바디 코퍼레이트 filed Critical 더 리전츠 오브 더 유니버시티 오브 콜로라도, 어 바디 코퍼레이트
Publication of KR20220125293A publication Critical patent/KR20220125293A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0026Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5)
    • C12N9/0032Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5) with oxygen as acceptor (1.5.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01029Geranylgeranyl diphosphate synthase (2.5.1.29)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03017Taxadiene synthase (4.2.3.17)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03018Abieta-7,13-diene synthase (4.2.3.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03038Alpha-bisabolene synthase (4.2.3.38)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 개시내용은 효소 기능을 조절하는 소분자를 생성하는 대사 경로의 발견 및 진화를 위한 시스템, 방법, 시약, 장치, 벡터 및 숙주 세포를 제공한다.

Description

생물학적 활성 대사물질의 발견 및 진화
관련 출원
본원은 전체적으로 본원에 참고로 포함되는, 2020년 1월 8일자로 출원된 미국 가출원 제62/958,368호의 이익을 35 U.S.C. § 119(e) 하에 주장한다.
정부 지원
본 발명은 미국 과학 재단에 의해 부여된 승인 1750244 하에 미국 정부 지원으로 만들어졌다. 정부는 본 발명에 대한 일부 권리를 가진다.
분야
본원은 효소 기능을 조절하는 소분자를 생성하는 대사 경로의 발견 및 진화를 위한 시스템, 방법, 시약, 장치, 벡터 및 숙주 세포를 개시한다.
천연 생성물 및 이의 유도체는 약품 및 의약 제제의 오랜 공급원을 대표한다1-3. 이 분자들은 -아마도 이들의 생물학적 기원의 결과로서- 유리한 약리학적 성질(예를 들어, 생체이용률 및 "대사물질 유사성")을 나타내는 경향이 있고1,4 놀라운 다양한 치료 효과(예를 들어, 진통, 항바이러스성, 항신생물성, 소염성, 세포독성, 면역억제성 및 면역조절성)를 발휘할 수 있다5-10. 합성 생물학 및 대사 공학의 최근 발전은 알려진 약학적 관련 천연 생성물의 효율적인 생합성 및 작용화를 위한 새로운 접근법을 제공하였으나11-13; 특정 치료적 관련 활성을 가진 신규 생성물의 발견 및 최적화를 위한 보완적 방법은 아직 개발되지 않은 상태로 남아 있다14.
천연 생성물 발견을 위한 기존 전략은 대체로 방향이 없고/없거나 범위가 제한된다. 예를 들어, -경우에 따라, 조합 (생)화학15-17-으로 보강된 큰 천연 생성물 라이브러리의 스크린은 중요한 의약 성질을 가진 분자를 발견하였으나18, 이 스크린은 자원 집약적이고 대체로 뜻밖의 발견이기 쉽다19. 대조적으로, 생물정보학적 수단은 생합성 유전자 클러스터의 식별을 가능하게 하고20,21, 이때 공-국소화된 내성 유전자들은 존재하는 경우 그들의 생성물의 생화학적 기능을 보여줄 수 있다22. 그러나, 많은 약학적 관련 대사물질들의 치료 활성은 그들의 천연 기능과 상이하고23, 대부분의 생합성 경로는 적절하게 재구성될 때 완전히 새로운 -그리고 아마도 더 효과적인- 치료 분자를 생성할 수 있다12,24.
미생물 시스템은 배양될 수 없거나 수율이 낮은 유기체로부터 천연 생성물을 생합성하기 위한 강력한 플랫폼으로서 등장하였다25,26. 최근 연구는 이러한 시스템이 특정 치료 관련 활성을 가진 대사 경로의 발견 및 진화를 허용할 수도 있음을 보여주었다(PCT/US2019 /40896).
본원은 효소 기능을 조절하는 소분자를 생성하는 대사 경로의 발견 및 진화를 위한 시스템, 방법, 시약, 장치, 벡터 및 숙주 세포를 개시한다. 예를 들어, 제1 유전적으로 코딩된 시스템이 세포 생장을 표적 효소의 활성과 연관시키고 -발견되거나 진화될- 제2 유전적으로 코딩된 시스템이 표적 효소의 활성을 조절하는 대사물질을 생성하는 미생물이 제공된다. 본 개시내용은 이 접근법을, 단백질을 번역 후 변형시키는 표적 효소의 서브세트, 페닐프로파노이드 또는 비리보좀 펩타이드를 생성하는 대사 경로, 및 숨은 대사 경로의 발견에 적용한다. 본 개시내용의 일부 측면은 효소 활성의 특정 조절제를 생성하고/하거나, (출발 경로에 비해) 이러한 조절제의 개선된 역가를 제공하고/하거나, (출발 경로에 비해) 감소된 숙주 독성을 나타내는 특정 재구성된 또는 진화된 경로를 제공한다. 특정 억제 효과를 가진 대사 생성물도 개시된다.
한 측면에 따르면, 단백질 기능을 조절하는 분자를 생성하는 대사 경로의 발견 및 진화 방법이 제공된다. 이 방법은 관심 대상의 단백질, 예컨대, 관심 대상의 효소를 포함하는 숙주 세포 집단을, 상이한 대사 경로를 포함하는 발현 벡터 집단과 접촉시키는 단계로서, 상기 숙주 세포가 상기 발현 벡터 집단의 전달을 잘 받아들이는 것인 단계; 숙주 세포 집단에서 대사 경로를 발현시키는 단계로서, 상기 세포 또는 숙주 세포 집단 내의 대사 경로가 관심 대상의 단백질, 예컨대, 관심 대상의 효소를 조절하는 생성물을 생성할 때 숙주 세포 집단의 세포 또는 서브세트가 검출 가능한 아웃풋(output)을 생성하는 것인 단계; 숙주 세포 집단의 세포 또는 서브세트에서 검출 가능한 아웃풋을 측정할 수 있게 하는 조건 하에 숙주 세포 집단을 스크리닝하는 단계; 검출 가능한 아웃풋을 생성하는 숙주 세포 집단의 세포 또는 서브세트를 단리하는 단계; 기준 경로를 보유하는 기준 벡터, 예를 들어, 숙주 세포 집단의 세포 또는 서브세트에서 관심 대상의 단백질, 예컨대, 관심 대상의 효소의 활성을 조절하기에 충분한 농도 및/또는 효능을 가진 분자를 생성하지 않는 경로를 코딩하는 벡터의 아웃풋보다 더 높은(p < 0.05) 검출 가능한 아웃풋을 생성하는 발현 벡터를 단리하는 단계; 및 숙주 세포 집단의 세포 또는 서브세트에서 상기 기준 벡터의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 발현 벡터에 의해 코딩된 대사 경로의 생성물을 특징규명하는 단계를 포함한다.
일부 실시양태에서, 숙주 세포는 관심 대상의 단백질, 예컨대, 관심 대상의 효소의 활성이 복합체의 2개 이상의 성분들 중 어느 하나에 의해 보유되지 않은 활성으로 단백질 복합체의 어셈블리를 제어함으로써, 형성된 복합체의 양에 비례하여 검출 가능한 아웃풋을 생성하는 유전적으로 코딩된 시스템을 포함한다.
일부 실시양태에서, 관심 대상의 단백질은 초기에 해리된 2개의 단백질이 공유결합되게 하거나 비공유 복합체를 형성하게 하는 번역 후 변형을 추가하는 효소이다.
일부 실시양태에서, 복합체는 SH2 도메인과 이의 인산화된 기질 사이에 형성된 복합체의 해리 상수(Kd) 이하의 Kd를 가진 2개의 단백질에 의해 형성된다.
일부 실시양태에서, 관심 대상의 효소는 포스페이트의 추가 또는 제거 이외의 번역 후 변형을 추가하는 효소이고, 그 변형은 세포 내부에서 초기에 해리된 2개의 단백질들이 공유결합되게 하거나 SH2 도메인과 인산화된 SH2-기질 도메인 사이에 형성된 복합체의 해리 상수(Kd) 이하의 Kd를 가진 복합체를 형성하게 한다(예를 들어, 도 1A에 도시됨).
일부 실시양태에서, 대사 경로는 페닐프로파노이드 또는 비리보좀 펩타이드를 생성한다.
일부 실시양태에서, 상이한 대사 경로를 포함하는 발현 벡터는 출발 대사 경로 내의 하나 이상의 유전자를 돌연변이시킴으로써 생성된 경로의 라이브러리를 포함한다.
일부 실시양태에서, 대사 경로 중 하나 이상은 생합성 능력이 알려지지 않은 유전자 세트를 포함한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로의 생성물과 상이한 생성물을 생성한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로에 의해 생성된 생성물의 양보다 더 많은 양의 생성물을 생성한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로보다 더 낮은 세포 독성을 나타낸다.
일부 실시양태에서, 대사 경로의 생성물은 표준 분석 방법, 바람직하게는 기체 크로마토그래피-질량 분광측정(GC/MS), 액체 크로마토그래피-질량 분광측정(LC/MS) 및/또는 핵 자기 공명(NMR) 분광법에 의해 특징규명된다.
일부 실시양태에서, 상기 방법은 생성물을 단리하는 단계를 추가로 포함한다.
일부 실시양태에서, 상기 방법은 바람직하게는 회전 증발기를 이용하여 생성물을 농축하는 단계를 추가로 포함한다.
일부 실시양태에서, 상기 방법은 관심 대상의 단백질, 예컨대, 관심 대상의 효소에 대한 생성물의 효과를 시험하는 단계도 포함한다.
일부 실시양태에서, 관심 대상의 단백질, 예컨대, 관심 대상의 효소는 유비퀴틴 리가제(ligase), SUMO 트랜스퍼라제(transferase), 메틸트랜스퍼라제(methyltransferase), 데메틸라제(demethylase), 아세틸트랜스퍼라제(acetyltransferase), 글리코실트랜스퍼라제(glycosyltransferase), 팔미토일트랜스퍼라제(palmitoyltransferase), 또는 관련 하이드롤라제(hydrolase)이다.
일부 실시양태에서, 확인된 생성물 또는 분자(예를 들어, 아모르파디엔(amorphadiene) 및 유도체, 탁사디엔(taxadiene) 및 유도체, β-비사볼렌(bisabolene) 및 유도체, α-비사볼렌 및 유도체, 및 α-롱기피넨(longipinene) 및 유도체)는 PTP가 기여하는 질환, 예를 들어, 2형 당뇨병, HER2 양성 유방암 또는 레트(Rett) 증후군의 치료를 위한 약물 또는 약물 선도물질(lead)로서 제공되고, 유효량의 상기 분자(들)를 이러한 치료를 필요로 하는 대상체에게 투여함으로써 이러한 질환을 치료하는 방법도 마찬가지로 제공된다.
또 다른 측면에 따르면, 관심 대상의 단백질을 포함하는 숙주 세포 집단 및 상이한 대사 경로를 포함하는 발현 벡터 집단을 포함하는 조성물 또는 시스템이 제공되고, 이때 상기 숙주 세포 집단의 세포 또는 서브세트는 대사 경로가 관심 대상의 단백질을 조절하는 생성물을 생성할 때 검출 가능한 아웃풋을 생성하고, 임의로 상기 발현 벡터는 기준 경로를 보유하는 기준 벡터, 예를 들어, 숙주 세포 집단의 세포 또는 서브세트에서 관심 대상의 단백질의 활성을 조절하기에 충분한 농도 및/또는 효능을 가진 분자를 생성하지 않는 경로를 코딩하는 벡터의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성한다.
일부 실시양태에서, 숙주 세포는 관심 대상의 단백질의 활성이 복합체의 2개 이상의 성분 중 어느 하나에 의해 보유되지 않은 활성으로 단백질 복합체의 어셈블리를 제어함으로써, 형성된 복합체의 양에 비례하여 검출 가능한 아웃풋을 생성하는 유전적으로 코딩된 시스템을 포함한다.
일부 실시양태에서, 관심 대상의 단백질은 초기에 해리된 2개의 단백질이 공유결합되게 하거나 비공유 복합체를 형성하게 하는 번역 후 변형을 추가하는 효소이다.
일부 실시양태에서, 복합체는 SH2 도메인과 이의 인산화된 기질 사이에 형성된 복합체의 해리 상수(Kd) 이하의 Kd를 가진 2개의 단백질들에 의해 형성된다.
일부 실시양태에서, 대사 경로는 페닐프로파노이드 또는 비리보좀 펩타이드를 생성한다.
일부 실시양태에서, 상이한 대사 경로를 포함하는 발현 벡터는 출발 대사 경로 내의 하나 이상의 유전자를 돌연변이시킴으로써 생성된 경로의 라이브러리를 포함한다.
일부 실시양태에서, 대사 경로 중 하나 이상은 생합성 능력이 알려지지 않은 유전자 세트를 포함한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로의 생성물과 상이한 생성물을 생성한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로에 의해 생성된 생성물의 양보다 더 많은 양의 생성물을 생성한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로보다 더 낮은 세포 독성을 나타낸다.
일부 실시양태에서, 관심 대상의 단백질은 유비퀴틴 리가제, SUMO 트랜스퍼라제, 메틸트랜스퍼라제, 데메틸라제, 아세틸트랜스퍼라제, 글리코실트랜스퍼라제, 팔미토일트랜스퍼라제 또는 관련 하이드롤라제이다.
또 다른 측면에 따르면, 본원에 기재된 바와 같은 발현 벡터 집단을 포함하는 키트가 제공된다. 일부 실시양태에서, 상기 키트는 본원에 기재된 바와 같이 관심 대상의 단백질을 포함하는 숙주 세포 집단도 포함한다.
본 발명의 각각의 제한은 본 발명의 다양한 실시양태를 포괄할 수 있다. 따라서, 어느 한 요소 또는 요소들의 조합을 포함하는 본 발명의 각각의 제한은 본 발명의 각각의 측면에 포함될 수 있음이 예상된다. 본 발명은 하기 설명에 기재되어 있거나 도면에 예시되어 있는 구성요소의 구축 및 배열의 세부사항에의 그의 적용에 있어서 제한되지 않는다. 본 발명은 다른 실시양태가 가능하고 다양한 방식으로 실시될 수 있거나 수행될 수 있다.
도 1A 내지 1E. PTP1B의 억제와 항생제 내성을 연관시키는 세균 투-하이브리드 시스템의 개발. 도 1A, 인산화 의존성 단백질-단백질 상호작용을 검출하는 세균 투-하이브리드(B2H) 시스템. 주 구성요소는 (i) RNA 중합효소의 오메가 서브유닛에 융합된 기질 도메인(황색), (ii) 434 파지 cI 리프레서(repressor)에 융합된 SH2 도메인(연한 청색), (iii) 434cI에 대한 오퍼레이터(진한 녹색), (iv) RNA 중합효소에 대한 결합 부위(보라색), (v) Src 키나제, 및 (vi) PTP1B를 포함한다. 기질 도메인의 Src 촉진 인산화는 관심 대상의 유전자(GOI, 흑색)의 전사를 활성화시키는 기질-SH2 상호작용을 가능하게 한다. 기질 도메인의 PTP1B 촉진 탈인산화는 그 상호작용을 방해하고; PTP1B의 억제는 이를 다시 가능하게 한다. 도 1B, (i) PTP1B를 결여하고 (ii) 기질 도메인으로서 p130cas를 함유하고 GOI로서 luxAB를 함유하는 B2H 시스템 버전. 대장균에서 특정 성분의 발현을 증가시키기 위해 유도성 플라스미드를 사용하였고; 이러한 플라스미드로부터의 Src의 2차 유도는 발광을 향상시켰다. 도 1C, (i) PTP1B 및 Src를 결여하고 (ii) 포스포펩타이드에 대한 향상된 친화성을 가진 SH2 도메인(SH2*), 가변 기질 도메인, 및 GOI로서 LuxAB를 포함하는 B2H 시스템 버전. 대장균에서 Src의 발현을 증가시키기 위해 유도성 플라스미드를 사용하였다. 기질 p130cas(서열번호 24), MidT(서열번호 25), EGFR(서열번호 27), 및 ShcA(서열번호 26)에 대한 서열이 제시되어 있다. 도 1D, p130cas 또는 MidT를 기질로서 사용하는 c의 B2H 시스템. 대장균에서 (i) Src 및 PTP1B 또는 (ii) Src 및 PTP1B의 불활성 변이체(C215S)를 과다발현시키기 위해 제2 플라스미드를 사용하였다. 오른쪽: 2개의 단일 플라스미드 B2H 시스템. 도 1E, 최적화된 시스템은 SH2*, midT 기질, 최적화된 프로모터 및 리보좀 결합 부위(도 1D의 bb034), 및 GOI로서 SpecR을 포함한다. PTP1B의 불활성화는 이 플라스미드 매개 시스템을 보유하는 대장균 균주가 고농도의 스펙티노마이신(> 250 ㎍/㎖)에서 생존할 수 있게 하였다. 도 1B 내지 도 1D의 오차 막대는 n = 3 반복실험의 표준 오차를 나타낸다.
도 2A 내지 2C. PTP1B 억제 테르페노이드의 생합성은 세포 생존을 가능하게 한다. 도 2A, 테르페노이드 생합성을 위한 플라스미드 매개 경로: (i) 사카로마이세스 세레비지애(S. cerevisiae)의 메발로네이트 의존성 이소프레노이드 경로를 보유하는 pMBIS는 메발로네이트를 이소펜틸 피로포스페이트(IPP) 및 파르네실 피로포스페이트(FPP)로 전환시킨다. (ii) 테르펜 합성효소(TS) 및 필요한 경우 게라닐게라닐 디포스페이트 합성효소(GGPPS)를 코딩하는 pTS는 IPP 및 FPP를 세스퀴테르펜 또는 디테르펜으로 전환시킨다. 도 2B, 4종의 테르펜 합성효소: 아모르파디엔 합성효소(ADS), γ-후물렌 합성효소(GHS), 아비에타디엔 합성효소(ABS) 및 탁사디엔 합성효소(TXS). 도 2C, (i) 세균 투-하이브리드(B2H) 시스템 및 (ii) TS 특이적 테르페노이드 경로(pTS는 ABS 또는 TXS가 존재할 때만 GGPPS를 포함함) 둘 다를 보유하는 대장균 균주의 스펙티노마이신 내성. ADS는 고농도의 스펙티노마이신의 존재 하에 생존을 가능하게 하였다. 참고: ABSD404A/D621A는 촉매 불활성 상태이다. B2H*는 불활성 PTP1BC215S를 함유한다.
도 3A 내지 3G. 미생물 보조 유도 진화(MADE)를 위한 전략. 도 3A, 대사 경로 내의 유전자의 서브세트의 오류 유발 PCR 및/또는 부위 포화 돌연변이유발은 대사 경로의 라이브러리를 생성한다. 도 3B, (i) B2H 시스템 및 (ii) 경로 라이브러리의 구성원 둘 다를 각각 보유하고 있는 미생물은 액체 배양에서 생장된다. 참고: 표시된 시스템은 (i) B2H 시스템 및 (ii) 돌연변이된 테르페노이드 경로(즉, 돌연변이를 가진 pMBIS + pTS; 도 2A 참조) 둘 다를 보유하는 대장균 숙주이다. 도 3C, 액체 배양 후, 형질전환체는 상이한 농도의 항생제를 가진 고체 배지 상에 플레이팅되고; 히트는 야생형 경로가 생장을 허용하지 않는 항생제 농도에서 생장하는 콜로니를 포함한다. 도 3D, 히트의 경로는 시퀀싱되고; 이들의 돌연변이는 야생형 경로 내로 재도입되고; 이 재구성된 경로 변이체는 상이한 농도의 항생제를 가진 고체 배지 상에서 액적(drop) 기반 플레이팅(10 ㎕)에 의해 재스크리닝된다. 이 단계는 거짓 양성(예를 들어, 표적 유전자의 외부에 위치한 돌연변이 때문에 생존한 콜로니)을 제거한다. 도 3E, 확인된 히트는 액체 배양에서 생장되고; 이들의 생성물은 필요에 따라 헥산 오버레이(overlay)에 의해 추출되고 회전 증발기에서 농축된다. 도 3F, GC/MS는 돌연변이체 생성물의 식별 및 정량을 가능하게 하고; NMR은 식별에 도움이 될 수 있다. 도 3G, 흥미로운 대사물질(구입되거나 배양 추출물로부터 정제됨)은 시험관내 동역학 측정 또는 표적 조절의 세포 연구 및/또는 표적-대사물질 결합의 ITC 분석에 의해 특징규명된다.
도 4A 내지 4D. 번역 후 변형(PTM) 효소의 대사물질 매개 조절을 검출하는 유전적으로 코딩된 시스템. 도 4A, 효소 E1 및/또는 E2의 대사물질 매개 활성화를 검출하는 유전적으로 코딩된 시스템. E1은 PTM을 단백질 P1에 추가하여, 이 단백질이 P2에 결합할 수 있게 하고; 새로 형성된 P1-P2 복합체는 관심 대상의 유전자(GOI, 흑색)의 전사를 활성화시킨다. E2는 P1로부터 PTM을 제거함으로써, 복합체 형성을 방해한다. GOI가 적합도(fitness) 이점을 부여할 때, E2의 억제제 또는 E1의 활성화제는 세포 생존을 향상시킨다. GOI가 독성을 띨 때, E1의 억제제 또는 E2의 활성화제는 세포 생존을 향상시킨다. 도 4B, 대안적 검출 시스템. E1은 PTM을 단백질 P1에 추가하여, 이 단백질이 P2에 결합할 수 있게 하고; 새로 형성된 P1-P2 복합체는 분할 단백질(예를 들어, 형광 단백질, 루시퍼라제, 또는 항생제 내성을 부여하는 효소)을 어셈블링한다. E2는 P1로부터 PTM을 제거함으로써 복합체 형성을 방해한다. 재구성된 분할 단백질이 적합도 이점을 부여할 때, E2의 억제제 또는 E1의 활성화제는 세포 생존을 향상시킨다. 대조적으로, 재구성된 단백질이 독성을 띨 때, E1의 억제제 또는 E2의 활성화제는 세포 생존을 향상시킨다. 도 4C, 단백질 라이게이션을 제어하는 PTM 효소(예를 들어, SUMO 트랜스퍼라제, 유비퀴틴 리가제 또는 관련 펩티다제)의 대사물질 매개 활성화를 검출하는 유전적으로 코딩된 시스템. E1은 P1을 P2의 라이신 잔기(K)에 부착시키고, 새로 형성된 P1-P2 복합체는 GOI의 전사를 활성화시킨다. E2는 이 복합체를 분해한다. 도 4D, 대안적 시스템. E1은 P1을 P2에 부착시키고, 새로 형성된 P1-P2 복합체는 분할 단백질의 어셈블리를 허용한다. E2 매개 단백질분해는 이 복합체를 분해한다.
도 5A 내지 5C. 대안적 대사 경로. 도 5A, 홍영수와 동료들45에 의해 개발된 페닐프로파노이드 경로. 약어: TAL, 사카로트릭스 에스파나엔시스(S. espanaensis)로부터의 암모니아-리아제; Sam5, 사카로트릭스 에스파나엔시스로부터의 4-쿠마레이트 3-하이드록실라제; COM, 아라비돕시스 탈리아나(A. thaliana)로부터의 O-메틸트랜스퍼라제; ScCCL, 스트렙토마이세스 코엘리칼러(Streptomyces coelicolor)로부터의 신나메이트/4-쿠마레이트:CoA 리가제; CHS, 아라비돕시스 탈리아나로부터의 칼콘 합성효소; STS, 아라키스 하이포가에아(Arachis hypogaea)로부터의 스틸벤 합성효소. 도 5B, 도 5A의 플라스미드에 의해 코딩된 경로. 도 5C, 코슬라(Khosla)와 동료들46에 의해 기재된 유전적으로 코딩 가능한 예르시니아박틴(yersiniabactin)(Ybt) 합성효소. Ybt는 폴리케타이드-비리보좀 펩타이드이다. Ybt 생성에 필요한 기질은 청색으로 나타난다. 약어: ArCP, 아릴 담체 단백질; A, 아데닐화; PCP, 펩티딜 담체 단백질; Cy, 고리화; KS, 케토합성효소; ACP, 아실 담체 단백질; AT, 아실트랜스퍼라제; KR, NADPH 의존성 케토환원효소; MT, 메틸트랜스퍼라제; SAM, S-아데노실메티오닌; TE, 티오에스테라제. 생합성에 대한 자세한 내용은 본문을 참조한다.
도 6A 및 6B. 숨은 대사 경로의 발견을 위한 접근법. 도 6A, 다단계 경로의 돌연변이유발 및/또는 재조직화는 생합성 유전자를 불활성화시킴으로써, 대사 중간체의 축적을 허용한다. 도 6B, 다단계 경로의 돌연변이유발 및/또는 재조직화는 리프레서 유전자를 불활성화시킴으로써, 경로 유전자의 발현을 허용한다.
도 7A 내지 7I. 테르페노이드 억제제의 미생물 진화. 도 7A 및 도 7B, (도 7A) ADS 및 (도 7B) GHS에 대한 상동성 모델은 부위 포화 돌연변이유발(SSM)을 위해 표적화된 잔기의 위치를 보여준다. 5-epi-아리스톨로켄(aristolochene) 합성효소(pdb 항목 5eat)의 정렬된 구조로부터의 기질 유사체는 청색으로 나타난다. 도 7C 및 도 7D, (도 7C) ADS(LB 플레이트) 및 (도 7D) GHS(TB 플레이트)의 돌연변이체에 의해 부여된 스펙티노마이신 내성의 측정. ALP는 주 생성물로서 α-롱기피넨을 생성하는 GHS의 5중 돌연변이체(A336C/T445C/S484C/I562L/M565L)에 상응한다. 음영은 콜로니 밀도를 나타낸다: 확산(≥ 10 콜로니, 연한 회색), 원형 확산(회색) 및 원형 잔디(흑색). 도 7E, 야생형 효소보다 더 높은 항생제 농도에서 생장을 가능하게 하는 ADS 돌연변이체의 생성물 프로파일. 도 7F, ADSG43S/K51N 및 ADS는 액체 배양에서 유사한 아모르파디엔 역가를 제공한다. 도 7G, ADSG43S/K51N은 불활성 B2H 시스템(B2Hx)의 존재 하에 야생형 효소보다 더 높은 콜로니 밀도를 제공하고; 이 밀도는 ADSG43S/K51N이 ADS보다 더 낮은 독성을 가짐을 암시한다. 도 7H, 야생형 GHS 및 향상된 항생제 내성을 제공하는 여러 GHS 돌연변이체의 생성물 프로파일; 이 돌연변이체들의 프로파일 사이의 불일치는 향상된 항생제 내성을 유발할 세포내 테르페노이드의 조성 차이를 암시한다. 도 7I, GHSA319Q는 GHS보다 더 높은 테르페노이드 역가를 제공한다. 도 7F 및 도 7I에서 오차 막대는 n = 3 생물학적 반복실험의 표준 편차를 나타낸다.
도 8A 내지 8D. 진화된 돌연변이체의 분석. 도 8A, ADS의 돌연변이체에 의해 부여된 항생제 내성의 분석. 영상은 액체 배양의 액적(10 ㎕)으로부터 시딩된 LB 플레이트 상에서의 대장균의 생장을 보여준다. 각각의 돌연변이체는 선택 실험에서 확인된 돌연변이(즉, 히트)를 출발 ADS 플라스미드 내로 도입하기 위해 부위 지정 돌연변이유발을 이용함으로써 제조되었다. 음영은 콜로니 밀도를 표시한다: 확산(≥ 10 콜로니, 연한 회색), 원형 확산(회색) 및 원형 잔디(흑색). 도 8B, 도 8A에 기재된 실험의 반복실험. 도 8C, GHS의 돌연변이체에 의해 부여된 항생제 내성의 분석. 영상은 액체 배양의 액적(10 ㎕)으로부터 시딩된 TB 플레이트 상에서의 대장균의 생장을 보여준다. 도 8D, 도 8C에 기재된 실험의 반복실험. 도 8A 내지 8D에서, 청색 강조표시는 2회 생물학적 반복실험에서 야생형 효소보다 더 높은 농도의 스펙티노마이신에서 생장을 가능하게 한 돌연변이체들을 나타낸다(즉, 이 돌연변이체들은 도 3C 및 3D에 나타남).
도 9A 내지 9C. 상이한 테르펜 합성효소의 생성물의 분석. 도 9A, B2H 시스템의 부재(상단) 및 존재(하단) 하에 각각의 TS 특이적 균주에 의해 생성된 우세한 테르페노이드(즉, 아모르파디엔, γ-후물렌, 탁사디엔 또는 아비에타디엔)의 역가. 유사한 역가는 B2H 시스템이 테르페노이드 생합성을 방해하지 않음을 표시한다. 도 9B, B2H 시스템의 부재(상단) 및 존재(하단) 하에 각각의 균주에 의해 생성된 테르페노이드의 GC/MS 크로마토그램(m/z=204). 유사한 프로파일은 B2H 시스템이 생성물 분포를 변경시키지 않음을 표시한다. 도 9C, 다양한 균주들의 사멸 및 생존에 대한 (i) TS 활성 또는 (ii) B2H 기능의 기여 분석. GHS의 불활성화는 GHS 균주의 생존을 향상시키지 않고, 이것은 이 효소가 생장 억제 테르페노이드를 생성하지 않음을 표시한다. 대조적으로, ADS 또는 B2H 시스템의 불활성화는 ADS 균주의 항생제 내성을 약화시키고, 이것은 최대 내성이 테르페노이드 생성 및 B2H 활성화 둘 다를 요구함을 표시한다. 표지는 하기 대조군을 나타낸다:. GHSD/A, 불활성 GHS; ADSD/A, 불활성 ADS; B2H*, 항시적 활성 B2H; B2Hx, 불활성 B2H. 참고: 왼쪽 및 오른쪽 영상은 2회 생물학적 반복실험으로부터 액체 배양의 액적(10 ㎕)으로 시딩된 LB 플레이트를 보여준다. 도 9A의 오차 막대는 n ≥ 3 생물학적 반복실험에 대한 표준 오차를 나타낸다.
도 10A 내지 10E. 다양한 테르페노이드의 생성물의 분석. 도 10A, 크로마토그램은 도 2C로부터 각각의 TS 특이적 균주에 대해 예상된 우세한 생성물(*)을 보여준다(B2H 시스템이 존재함). 도 10B, ADS 및 TXS에 의해 생성된 주 생성물의 역가. 도 10C, 증가하는 농도의 아모르파디엔 및 탁사디엔의 존재 하에 pNPP의 PTP1B 촉진 가수분해의 초기 속도. 선은 비경쟁적 억제(아모르파디엔) 및 혼합된 억제(탁사디엔)의 증거를 제공하는 미카엘리스-멘텐(Michaelis-Menten) 모델에의 피팅을 보여준다. 도 10D, HEK293T/17 세포의 묘사. 인슐린은 막 결합 인슐린 수용체(IR)의 인산화를 자극하고; PTP1B는 IR을 탈인산화하고, PTP1B의 억제는 인산화를 회복시킨다. 도 10E, 10분 동안 3% 디메틸 설폭사이드(DMSO, n = 2), 930 μM 아모르파디엔(AD, 3% DMSO, n = 3) 및 405 μM α-비사볼렌(Abis, 3% DMSO, n = 1)에 노출된 굶주린 야생형 HEK293T/17 세포에서 IR 인산화의 ELISA 기반 측정. 결과는 아모르파디엔과 α-비사볼렌 둘 다가 세포막을 횡단할 수 있고 세포내 PTP1B를 억제하여 IR 인산화를 증가시킬 수 있음을 표시한다. 도 10B의 오차 막대는 n = 3 생물학적 반복실험의 표준 오차를 나타낸다. 도 10C의 오차 막대는 n ≥ 3 측정의 표준 오차를 나타낸다. 도 10E의 오차 막대는 n 값이 표시된 표준 오차를 나타낸다(참고: 이 측정을 위해, 본 발명자들은 용해 완충제 단독에 의해 생성된 기준 신호를 차감하였음, n = 3).
도 11A 내지 11D. 대안적 테르펜 합성효소의 분석. 도 11A 및 도 11B, (i) 활성 또는 불활성 세균 투-하이브리드 시스템(도 1, 2 및 7 내지 9에서와 같이 각각 B2H 및 B2Hx) 및 (ii) 하기 테르펜 합성효소 각각을 가진 도 2의 테르페노이드 경로를 보유하는 대장균 균주의 스펙티노마이신 내성: 아비에스 그란디스(Abies grandis)로부터의 γ-후물렌 합성효소(GHS), 징기베르 오피시날레(Zingiber officinale)로부터의 β-비사볼렌 합성효소(ZoBBA), 산탈룸 알붐(Santalum album)으로부터의 β-비사볼렌 합성효소(SaBBA), 및 아비에스 그란디스(ABS)로부터의 α-비사볼렌 합성효소(ABB). SaBBA 및 가장 현저하게 ABB는 고농도의 스펙티노마이신에서 생존을 가능하게 한다. 도 11C, β-비사볼렌 및 α-비사볼렌의 화학 구조. 도 11D, 배양 추출물로부터 정제된 증가하는 농도의 α-비사볼렌(아모르파디엔 당량으로서 측정됨)의 존재 하에 p-니트로페닐 포스페이트(pNPP)에 대한 PTP1B 활성의 분석. 선은 미카엘리스-멘텐 모델에의 피팅을 보여준다.
도 12A 내지 12G. PTP1B의 선택적 억제제의 분석. 도 12A, 증가하는 농도의 아모르파디엔의 존재 하에 PTP1B321, TCPTP292 및 PTP1B282에 의한 pNPP 가수분해의 초기 속도. 선은 억제 모델에의 피팅을 보여준다. 제1 플롯과 제2 플롯(또는 보다 구체적으로 작도된 데이터로부터 유도된 IC50)의 비교는 아모르파디엔이 (서열 동일성에 의해) 인간 게놈에서 가장 밀접하게 관련된 PTP인 TCPTP292보다 약 5배 더 강력한 PTP1B321 억제제임을 표시하고; 이 선택성은 아모르파디엔이 PTP1B의 활성 부위의 외부에 결합함을 시사한다. 이어서, 제2 플롯과 제3 플롯의 비교는 아모르파디엔이 PTP1B282를 PTP1B321보다 약 4배 덜 강력하게 억제함을 표시하고; 이 불일치는 PTP1B321에는 존재하나 PTP1B282에는 누락되어 있는(그리고 PTP1B의 알려진 알로스테릭 결합 부위에 인접한) α7 나선이 PTP1b321-아모르파디엔 상호작용에 관여함을 암시한다. 도 12B, 아모르파디엔의 화학 구조. 도 12C, 아모르파디엔에 결합된 PTP1B의 예비 결정 구조. 도 12D, 도 12c의 구조를 풀기 위해 사용된 데이터는 PTP1B의 알로스테릭 부위 근처의 전자 밀도를 보여주고(F280은 이 영상의 왼쪽에 나타남); 이 밀도는 아모르파디엔의 구조와 일치한다. 도 12E, α-비사볼렌의 구조적 유사체인 α-비사볼롤의 화학 구조. 도 12F, α-비사볼롤에 결합된 PTP1B의 예비 결정 구조. 도 12G, 도 12F의 구조를 풀기 위해 사용된 데이터는 PTP1B의 알로스테릭 부위 근처의 전자 밀도를 보여주고(F280은 이 영상의 상단 왼쪽에 나타남); 이 밀도는 α-비사볼롤의 구조와 일치한다.
도 13. 세균 투-하이브리드(B2H) 시스템의 최적화. 도 13, 본 발명자들은 다양한 유전 요소들의 강도를 조절함으로써 B2H 시스템의 전사 반응을 최적화하였다. 3개의 순차적 단계에서, 본 발명자들은 (1) Src/CDC37에 대한 프로모터, (2) Src/CDC37에 대한 리보좀 결합 부위(RBS), 및 (3) PTP1B에 대한 RBS를 변화시켰다. 단계 1 및 2에서, 본 발명자들은 야생형(WT, EPQ Y EEIPYL(서열번호 1)) 또는 비-인산화성(Mut, EPQ F EEIPYL(서열번호 2)) 기질 도메인을 가진 PTP1B 결핍 시스템을 사용하였다. 여기서, "없음"은 추가 프로모터의 부재를 표시하고; 표지된 "Pro1"은 그의 왼쪽에 있는 모든 5개의 유전자들의 전사를 제어한다. 단계 3에서, 본 발명자들은 PTP1B의 야생형(WT) 또는 촉매 불활성(C215S, Mut) 변이체를 가진 완전한 B2H 시스템을 사용하였다. 각각의 단계의 나머지 B2H 성분은 표 2에 상세히 설명되어 있다. 오차 막대는 n ≥ 3 생물학적 반복실험의 표준 오차를 나타낸다.
도 14. 상이한 선택 조건의 분석. 도 14, PTP1B에 대한 상이한 RBS를 가진 B2H 시스템에 의해 부여된 항생제 내성의 비교(각각의 시스템의 나머지 성분에 대해서는 표 2 참조). 영상은 각각의 조건에 대한 2회 생물학적 반복실험 시 액체 배양의 액적(10 ㎕)으로부터 시딩된 한천 플레이트(LB) 상에서의 대장균의 생장을 보여준다. RBS bb034는 한천 플레이트에서 스펙티노마이신에 대한 더 큰 민감성을 부여하고; 대조적으로, 액체 배양에서 스펙티노마이신의 농도는 세균 생장에 강한 영향을 미치지 않는다. 본 발명자들은 이 분석을 통해 bb034를 본 발명자들의 "최적화된" B2H 시스템에 혼입하고 액체 배양에의 스펙티노마이신의 첨가를 중단하였다.
도 15A 및 15B. 도 15A, 순수한 아모르파디엔(암비드(Ambeed)로부터 구입됨)의 GC 크로마토그램. 도 15B, 도 15A로부터 표시된 피크의 질량 스펙트럼.
도 16A 및 16B. γ-후물렌 생성의 GC/MS 분석. 도 16A, GC 크로마토그램은 γ-후물렌을 생성하도록 조작된 대장균 균주에 의한 γ-후물렌의 생성을 보여준다(즉, pMBIS + pGHS). 도 16B, 도 16A로부터 표시된 피크의 질량 스펙트럼.
도 17A 및 17B. 보충 도 4 | 아비에타디엔 생성의 GC/MS 분석. 도 17A, GC 크로마토그램은 아비에타디엔을 생성하도록 조작된 대장균 균주에 의한 아비에타디엔의 생성을 보여준다(즉, pMBIS + pABS). 도 17B, 도 17A로부터 표시된 피크의 질량 스펙트럼.
도 18A 및 18B. 탁사디엔 생성의 GC/MS 분석. 도 18A, GC 크로마토그램은 순수한 탁사디엔의 생성을 보여준다(필 바란(Phil Baran))으로부터의 친절한 선물). 도 18B, 도 18A로부터 표시된 피크의 질량 스펙트럼.
도 19A 및 19B. β-비사볼렌 생성의 GC/MS 분석. 도 19A, GC 크로마토그램은 β-비사볼렌을 생성하도록 조작된 대장균 균주에 의한 β-비사볼렌의 생성을 보여준다(즉, pMBIS + pGHSL450G). 도 19B, 도 19A로부터 표시된 피크의 질량 스펙트럼.
도 20. pNPP 어세이에 대한 표준 곡선. 이 표준 곡선은 다양한 농도의 p-니트로페놀(p-NP)을 100 ㎕ 물에 용해시키고 플레이트 판독기로 이들의 흡광도를 측정함으로써 생성되었다. 이 곡선을 이용하여 본 발명자들의 pNPP 동역학 분석에서 수집된 흡광도 측정치를 농도로 전환시켰다.
도 21A 내지 21E. PTP1B의 억제와 항생제 내성을 연관시키는 세균 투-하이브리드 시스템의 개발. 이 도면은 유전자의 배향을 포함함으로써 도 1을 상세히 설명한다. 도 21A, 인산화 의존성 단백질-단백질 상호작용이 관심 대상의 유전자(GOI, 흑색)의 전사를 조절하는 세균 투-하이브리드(B2H) 시스템. 주 성분은 (i) RNA 중합효소의 오메가 서브유닛에 융합된 기질 도메인(황색), (ii) 434 파지 cI 리프레서에 융합된 SH2 도메인(연한 청색), (iii) Src 키나제 및 PTP1B, (iv) 434cI에 대한 오퍼레이터(진한 녹색), (v) RNA 중합효소에 대한 결합 부위(보라색) 및 (vi) 관심 대상의 유전자(GOI, 흑색)를 포함한다. 도 21B, p130cas 기질, 및 GOI로서의 LuxAB를 갖고 PTP1B를 결여하는 B2H 시스템에 의해 생성된 발광. 본 발명자들은 특정 성분의 발현을 증가시키기 위해 유도성 플라스미드를 사용하였다. 도 21C, 4개의 기질 도메인 중 하나인 포스포펩타이드(SH2*)에 대해 향상된 친화성을 나타내는 SH2 도메인, 및 GOI로서의 LuxAB를 갖고 Src 또는 PTP1B를 결여하는 B2H 시스템에 의해 생성된 발광. 본 발명자들은 Src의 발현을 조절하기 위해 유도성 플라스미드를 사용하였다. 기질 p130cas(서열번호 24), MidT(서열번호 25), EGFR(서열번호 27) 및 ShcA(서열번호 26)에 대한 서열이 제시되어 있다. 도 21D, p130cas 또는 MidT 기질을 가진 c의 B2H 시스템. 본 발명자들은 Src 및 PTP1B의 활성 또는 불활성(C215) 변이체의 발현을 제어하기 위해 제2 플라스미드를 사용하였다. 오른쪽: 2개의 최적화된 단일 플라스미드 시스템. 도 21E, 최종 B2H 시스템. PTP1B의 불활성화는 이 시스템을 보유하는 대장균 균주가 고농도의 스펙티노마이신(> 250 ㎍/㎖)에서 생존할 수 있게 하였다. 도 21B 내지 21D의 오차 막대는 n = 3 생물학적 반복실험의 표준 오차를 나타낸다.
도 22A 내지 22G. PTP1B 억제 테르페노이드의 생합성은 세포 생존을 가능하게 한다. 이 도면은 도 2 및 10을 상세히 설명한다. 도 22A, 테르페노이드 생합성을 위한 플라스미드 매개 경로: (i) 사카로마이세스 세레비지애의 메발로네이트 의존성 이소프레노이드 경로를 보유하는 pMBISCmR은 메발로네이트를 이소펜틸 피로포스페이트(IPP) 및 파르네실 피로포스페이트(FPP)로 전환시킨다. (ii) 테르펜 합성효소(TS) 및 필요한 경우 게라닐게라닐 디포스페이트 합성효소(GGPPS)를 코딩하는 pTS는 IPP 및 FPP를 세스퀴테르펜 또는 디테르펜으로 전환시킨다. 도 22B, 이 연구에서 조사된 5종의 테르펜 합성효소: 아모르파디엔 합성효소(ADS), γ-후물렌 합성효소(GHS), α-비사볼렌 합성효소(ABA), 아비에타디엔 합성효소(ABS) 및 탁사디엔 합성효소(TXS). 도 22C, (i) 세균 투-하이브리드(B2H) 시스템 및 (ii) TS 특이적 테르페노이드 경로 둘 다를 보유하는 대장균 균주의 스펙티노마이신 내성. 참고: 양성 대조군인 ABS*는 항시적 활성 B2H를 가진다(즉, PTP1BC215S를 포함한다). 도 22D, 크로마토그램은 B2H 시스템의 존재 하에 c의 각각의 TS 특이적 균주에 대해 예상된 주 생성물(즉, 동명; *)을 보여준다. 값은 주어진 샘플 내에서 가장 큰 피크로 정규화된다. 도 22E, 증가하는 농도의 (AD) 아모르파디엔 또는 (AB) α-비사볼렌의 존재 하에 pNPP의 PTP1B 촉진 가수분해의 초기 속도. 선은 억제의 최적 동역학 모델을 보여준다(표 12). 도 22F, 추정된 IC50. 도 22G, ADS 및 ABA에 의해 생성된 주 생성물의 역가. 오차 막대는 n ≥ 3 독립적 측정에 대한 (도 22E) 표준 오차 및 (도 22F) 95% 신뢰 구간, 및 n = 3 생물학적 반복실험에 대한 (도 22G) 표준 편차를 나타낸다.
도 23A 내지 23H. 테르페노이드 매개 억제의 생물물리학적 분석. 이 도면은 추가 동역학 측정을 포함함으로써 도 12를 상세히 설명한다. 도 23A. 경쟁적 억제제인 TCS401(황색 단백질, 주황색 강조표시 및 녹색 구체; pdb 항목 5k9w) 및 알로스테릭 억제제인 BBR(회색 단백질, 청색 강조표시 및 연한 청색 구체; pdb 항목 1t4j)에 결합된 PTP1B의 정렬된 X-선 결정 구조. 도 23B, BBR(백색 단백질 및 연한 청색 리간드) 및 아모르파디엔(청록색 단백질 및 암청색 리간드, pdb 항목 6W30)에 결합된 PTP1B의 정렬된 구조. 도 23C, 소수성 틈에의 결합을 파괴할 가능성이 높은 카르복실 기를 가진 아모르파디엔의 구조적 유사체인 디하이드로아르테미신산(DHA). 도 23D, DHA는 아모르파디엔보다 8배 덜 강력하다. 선은 억제의 최적 동역학 모델을 보여준다(표 12). 오차 막대는 IC50에 대한 95% 신뢰 구간과 함께 n = 3 독립적 측정에 대한 표준 오차를 나타낸다. 도 23E, 다양한 농도의 AD(흑색, 청색, 보라색 마커)에서 Vo -1 대 [TCS401]을 보여주는 딕손(Dixon) 플롯. 평행선은 TCS401과 AD가 동시에 결합할 수 없음을 표시한다. 도 23F, 다양한 농도의 AD(흑색, 청색, 보라색 마커)에서 Vo -1 대 [오르토바나데이트]를 보여주는 딕손 플롯. 교차 선은 오르토바나데이트와 AD가 동시에 결합할 수 있음을 표시한다. 도 23G, 아모르파디엔 및 α-비사볼렌 둘 다가 TC-PTP보다 훨씬 더 강력하게 PTP1B를 억제하고; 두 효소로부터의 α7 나선(또는 등가물)의 제거는 AD의 선택성을 감소시키나, AB의 선택성을 감소시키지는 않는다. 오차 막대는 각각의 조건에서 n ≥ 3 독립적 측정으로부터 추정된 누적 95% 신뢰 구간을 보여준다. 도 23H, 아모르파디엔(930 μM) 및 α-비사볼렌(405 μM)은 HEK293T/17 세포에서 IR 인산화를 자극하고; 동일한 농도에서, 디하이드로아르테미신산(DHA) 및 α-비사볼롤(ABOL)은 이들의 감소된 효능과 일치하는 감소된 신호를 나타낸다(#: p<0.05, 음성 대조군과 비교됨,*: p<0.05). 모든 억제제들은 3% DMSO(v/v, 음성 대조군)에 용해된다. 도 23D 내지 23F의 오차 막대는 n=3 내지 12 생물학적 반복실험에 대한 표준 오차를 나타낸다. 도 23G의 오차 막대는 n ≥ 3 독립적 측정에 대해 누적 95% 신뢰 구간을 나타낸다. 도 23H의 오차 막대는 완충제 단독 대조군(n = 3 생물학적 반복실험)으로부터 누적된 표준 오차를 나타낸다.
도 24A 내지 24E. 특징규명되지 않은 테르펜 합성효소 유전자의 분석. 도 24A, 테르펜 합성효소의 생물정보학적 분석. 본 발명자들은 가장 큰 테르펜 합성 효소 계열(PF03936)의 4,464개 구성원의 계통도를 어셈블링하고 기능적 데이터로 이에 주석을 달았다. 본 발명자들은 8개의 계통군(곡선 상자) 각각으로부터 3개의 유전자를 선택하였다: 특징규명된 유전자(즉, 기능이 알려진 유전자)를 갖지 않은 6개 및 특징규명된 유전자를 갖지 않은 2개. 도 24B, pMBISCmR 및 pB2Hopt와 함께 선택된 유전자에 의해 부여된 스펙티노마이신 내성. 400 ㎍/㎖ 스펙티노마이신을 초과하는 농도에서 강력한 생장을 가진 히트는 청색으로 나타난다. "n.m."은 조건이 측정되지 않았음을 표시한다. 도 24C, A0A0C9VSL7은 우세한 생성물로서 (+)-1(10),4-카디나디엔을 생성한다(m/z=204). 도 24D, (+)-1(10),4-카디나디엔의 구조. 도 24E, (+)-1(10),4-카디나디엔(85% 순도, 10% DMSO)에 의한 PTP1B의 억제. 선은 억제의 최적 동역학 모델을 보여준다(표 12).
도 25A 내지 C.| 다른 질환 관련 PTP로의 확장. 도 25A, 상이한 질환 관련 PTP의 불활성화를 검출하도록 변형된 B2H 시스템을 보유하는 균주의 스펙티노마이신 내성. 불활성화 돌연변이86-88는 고농도의 항생제에서 생존을 부여한다. 도 25B, 아모르파디엔 및 α-비사볼렌에 대한 대사 경로(즉, pMBISCmR + ADS 또는 ABA)의 존재 하에 PTP1B 및 TC-PTP 특이적 B2H 시스템에 의해 부여된 내성의 비교. PTP1B 특이적 시스템은 현저한 생존 이점을 나타내고, 이것은 이 효소에 대한 두 테르페노이드의 선택성과 일치하는 발견이다. 도 25C, B2H 시스템 및 관련 대사 경로 둘 다를 보유하는 균주에서 AD 및 AB의 역가는 균주 사이에 구별될 수 없다.
도 26A 내지 26D. 상이한 테르펜 합성효소들의 생성물의 분석. 이 도면은 추가 측정을 포함함으로써 도 9를 상세히 설명한다. 도 26A, B2H 시스템의 부재(적색) 및 존재(청색) 하에 각각의 TS 특이적 균주에 의해 생성된 총 테르펜 역가. 이 결과는 B2H 시스템이 테르페노이드 생합성을 파괴하지 않음을 표시한다. 도 26B, B2H 시스템의 부재(상단) 및 존재(하단) 하에 디테르펜 합성효소에 의해 생성된 테르페노이드의 GC/MS 크로마토그램(m/z=272). 도 26C, B2H 시스템의 부재(상단) 및 존재(하단) 하에 세스퀴테르펜 합성효소에 의해 생성된 테르페노이드의 GC/MS 크로마토그램(m/z=204). 도 26B와 도 26c의 유사한 프로파일은 B2H 시스템이 생성물 분포를 변경시키지 않음을 표시한다. 도 26D, GHS, ADS 및 ABA 균주의 사멸 및 생존에 대한 (i) TS 활성 또는 (ii) B2H 기능의 기여 분석. GHS의 불활성화는 생존을 향상시키지 않는데, 이것은 이 효소가 생장 억제 테르페노이드를 생성하지 않음을 표시한다. 대조적으로, ADS, ABA 또는 B2H 시스템의 불활성화는 ADS 및 ABA 균주의 항생제 내성을 약화시키므로; 최대 내성은 테르페노이드 생성 및 B2H 활성화 둘 다를 요구한다. 표지는 하기 대조군을 나타낸다: D/A, 불활성 테르펜 합성효소(촉매 아스파르트산에서 D/A 돌연변이를 함유하여, 테르펜 고리화에서 초기 금속 결합 단계를 방해함); *, 항시적 활성 B2H(PTP1BC215S를 함유하여, 탈인산화를 방해함); X, 불활성 B2H(Y/F 돌연변이를 가진 기질 도메인을 함유하여, 인산화를 억제함으로써 SH2 도메인과 결합함). 영상은 2회 생물학적 반복실험으로부터 액체 배양의 액적(10 ㎕)으로 시딩된 LB 플레이트를 보여준다. 표 2는 이 분석에 사용된 B2H 시스템을 상세히 설명한다. 도 26A의 오차 막대는 n ≥ 3 생물학적 반복실험에 대한 표준 편차를 나타낸다.
도 27. 주석이 달린 테르펜 합성효소 계통도. PF03936 계열의 이 계통도는 Uniprot 데이터베이스로부터 형태 4.2.3.#(테르펜 고리화 반응을 포함함)의 알려진 EC 번호의 존재/부재를 보여주는 히트맵으로 둘러싸여 있다. 본 발명자들은 8개의 계통군 각각으로부터 3개의 유전자를 선택하였다: 특징규명된 유전자를 갖지 않은 6개(적색) 및 특징규명된 유전자를 가진 2개(청색). 표 1은 상기 유전자를 요약한다.
도 28. 선택된 유전자의 분석. 본 발명자들은 FPP 경로(즉, pMBIS)와 함께 특징규명되지 않은 24개의 유전자 각각을 스크리닝함으로써 PTP1B의 세스퀴테르펜 억제제를 검색하였다. 이 사진들은 각각의 유전자에 의해 부여된 항생제 내성을 보여준다. 본 발명자들은 400 ㎍/㎖를 초과하는 항생제 내성을 가진 균주를 히트(청색)로서 선택하였다. 중요하게도, 이 유전자들의 경우, B2Hx 대조군의 감소된 생존은 향상된 내성이 B2H 시스템의 활성화를 요구함을 표시한다. 상단 도표에서, n.m.은 측정되지 않은 조건을 표시한다.
도 29. 선택된 히트의 생성물 프로파일. 선택된 히트의 생성물 프로파일(추출된 이온 크로마토그램, m/z=204). 간단히 말해서, 본 발명자들은 72시간 동안 액체 배양에서 히트(즉, pB2Hopt, pMBISCmR 및 pTS)를 생장시켰다. A0A0G2ZSL3을 제외한 모든 히트는 10 ㎖의 2% TB에서 생장하였고; A0A0G2ZSL3은 2% TB의 4 ㎖ 배양에서 생장하였다. 특히, A0A0C9VSL7 및 A0A2H3DKU3 둘 다가 하나의 우세한 생성물, 즉 각각 (+)-1(10),4-카디나디엔 및 β-파르네센을 생성한다. 본 발명자들은 (+)-1(10),4-카디나디엔이 본 발명자들의 초기 스크린에서 확인된 억제제인 아모르파디엔의 구조적 유사체이기 때문에 A0A0C9VSL7에 초점을 맞추었다.
도 30. AD에 결합된 PTP1B의 결정학적 분석. AD의 (왼쪽) 존재 또는 (오른쪽) 부재 하에 수집된 PTP1B의 결정 구조. 해상도: 2.10 Å(PTP1B-AD) 및 1.94 Å(PTP1B). 본 발명자들은 (상단) PTP1B-AD 복합체 또는 (하단) apo 형태 PTP1B를 모델링함으로써 이 구조를 개선하였다. AD로 침지시킨 PTP1B의 경우(왼쪽), 1.0 σ 2Fo-Fc 전자 밀도는 AD의 모델링된 위치를 뒷받침하나, 다수의 입체구조를 암시하고; 이 밀도는 AD가 모델로부터 제외된 경우에도 나타난다. apo PTP1B(오른쪽)의 경우, 1.0 σ 2Fo-Fc 전자는 결합된 AD 분자를 뒷받침하지 않고; 설명되지 않는 밀도의 작은 영역은 물 분자 또는 α7 나선의 부분적 점유를 반영할 수 있다15.
도 31. ABol에 결합된 PTP1B의 결정학적 분석. ABol의 (왼쪽) 존재 또는 (오른쪽) 부재 하에 수집된 PTP1B의 결정 구조. 해상도: 2.11 Å(PTP1B-ABol) 및 1.94 Å(PTP1B). 본 발명자들은 (상단) PTP1B-ABol 복합체 또는 (중간/하단) apo 형태 PTP1B를 모델링함으로써 이 구조를 개선하였다. ABol로 침지시킨 PTP1B(왼쪽)의 경우, 0.90 σ 2Fo-Fc 전자 밀도는 ABol의 모델링된 위치와 일치하나, ABol이 모델로부터 제외될 때 덜 두드러지게 된다. PTP1B의 apo 형태(오른쪽)는 두 모델에 대해 유사한 밀도를 보여주고; 데이터세트 사이의 0.90 σ 2Fo-Fc 전자 밀도 모양의 작은 차이는 이 밀도가 상이한 기원을 가질 수 있음을 시사한다(예를 들어, 리간드 대 α7 나선의 부분 점유). α-비사볼롤에 대한 결합 부위의 명확한 결정은 추가 데이터를 필요로 한다.
도 32A 내지 32C. 다수의 결합된 입체구조의 증거. 도 32A, 아모르파디엔(AD)에 결합된 PTP1B의 분자 역학(MD) 시뮬레이션으로부터의 스냅샷. 화살표는 리간드의 클러스터를 표시한다. 도 32B, AD에 결합된 PTP1B의 결정 구조는 고주파수 접촉을 겪는 잔기를 강조한다. 여기서, 접촉은 4 Å 미만의 잔기-리간드 거리를 갖고, 고주파수는 MD 시뮬레이션에서 모든 스냅샷의 10%를 초과한다. 도 32C, MD 시뮬레이션에 대한 완전한 시스템(PL), 단백질(P), 단백질 코어(Pcore; 잔기 1 내지 287), 단백질의 무질서한 영역(Ptail; 잔기 288 내지 321) 및 리간드(L)의 평균 평균제곱근편차(RMSD)의 추정치는 AD 및 단백질의 무질서한 영역 둘 다가 이동성을 갖는 반면(후자가 전자보다 더 많은 이동성을 가짐), 단백질 코어가 고정된 상태로 유지됨을 표시한다. (i) 회전 및 진동 변동에 대한 메트릭인 재중심화된 리간드(Int) 및 (ii) 그의 위치 편차에 대한 메트릭인 리간드의 질량 중심(COM) 둘 다의 평균 RMSD는 크고, 이것은 리간드가 다수의 결합된 입체구조 및/또는 위치를 채택할 수 있음을 표시한다.
도 33A 내지 33N. 동역학 분석의 요약. 도 33A, PTP1B(회색, pdb 항목 5k9w) 및 TC-PTP(청색, pdb 항목 1l8k)의 정렬된 결정 구조. PTP1B에 대한 강조표시: 경쟁적 억제제(주황색), α7 나선(적색), 및 동역학 연구에 사용된 절단점(281 및 283, TC-PTP의 281 등가물). 도 33B, PTP1B(서열번호 140) 및 TC-PTP(서열번호 141)의 α6/7 영역의 서열 정렬. 본 발명자들의 동역학 분석에 사용된 절단점. 도 33C, BBR(회색, pdb 항목 1t4j) 및 아모르파디엔(청색)의 결합 부위의 정렬된 구조. 도 33D 내지 도 33M, 증가하는 농도의 (도 33D 내지 도 33G) 아모르파디엔, (도 33H 내지 도 33K) α-비사볼렌, (도 33L) 디하이드로아르테미신산, 및 (도 33M) α-비사볼롤 억제의 존재 하에 다양한 PTP에 의한 pNPP 가수분해의 초기 속도. 모든 도면에서, 선은 억제의 최적 모델을 보여준다(표 12). 도 33D 내지 도 33M의 오차 막대는 적어도 3회 측정의 표준 오차를 나타낸다. IC50의 오차는 억제 모델에의 피팅으로부터 결정된 95% 신뢰 구간을 나타낸다(표 12).
도 34A 내지 34D. 선택성의 확장된 분석. 도 34A, SHP1의 AD 억제에 대한 초기 속도 데이터. 하단 패널은 동일한 데이터를 두 가지 상이한 기질 농도(개방된 원 대 폐쇄된 원)에서 점의 서브세트에 대한 % 억제로서 보여준다. 도 34B, SHP2의 AD 억제에 대한 초기 속도 데이터. 하단 패널은 동일한 데이터를 두 가지 상이한 기질 농도(개방된 원 대 폐쇄된 원)에서 점의 서브세트에 대한 % 억제로서 보여준다. 도 34C, SHP1의 AB 억제에 대한 초기 속도 데이터. 하단 패널은 동일한 데이터를 두 가지 상이한 기질 농도(개방된 원 대 폐쇄된 원)에서 점의 서브세트에 대한 % 억제로서 보여준다. 도 34D, SHP2의 AB 억제에 대한 초기 속도 데이터. 하단 패널은 동일한 데이터를 두 가지 상이한 기질 농도(개방된 원 대 폐쇄된 원)에서 점의 서브세트에 대한 % 억제로서 보여준다. 도 34A, 도 34C 및 도 34D에서, 본 발명자들이 4-메틸움벨리페릴 포스페이트(4-MUP)에 대한 높은 K m 과 함께 AD의 용해도 한계에서 억제 >25%(하단 패널)를 측정할 수 없는 것은 정확한 억제 모델 피팅, K I 및 IC50 측정을 불가능하게 하였다. 그러나, 관찰된 약한 억제는 AD/AB가 PTP1B보다 이 효소들의 덜 강력한 억제제임을 암시한다. 모든 패널에서, 오차 막대는 n=3 생물학적 반복실험의 표준 오차를 나타내고 선은 비경쟁적 억제 모델에의 피팅을 보여준다.
도 35A 내지 35C. PTP1B 매개 IR 탈인산화의 분석. 도 35A, HEK293T/17 세포에서 인슐린 신호전달의 묘사. 세포외 인슐린은 막횡단 인슐린 수용체(IR)에 결합하여, 그의 세포내 도메인의 인산화를 유발한다. 포유동물 세포의 소포체(ER)에 국소화되는 PTP1B는 이 도메인을 탈인산화하여 다운스트림 신호전달 경로를 조절한다. 굶주린 세포에서, 외부로부터 공급된 억제제는 세포막을 투과하여 IR의 PTP1B 매개 탈인산화를 억제할 수 있다. 도 35B, 효소 결합 면역흡착 어세이(ELISA)를 위한 억제제 농도의 스크린. 다양한 농도의 아모르파디엔, α-비사볼렌 및 이들의 구조적 유사체와 함께 인큐베이션된 HEK293T/17 세포에서 IR 인산화의 효소 결합 면역흡착 어세이(ELISA). 본 발명자들은 아모르파디엔 및 α-비사볼렌의 생물학적 활성 농도를 확인하여 더 연구하기 위해 이 스크린을 이용하였다. 도 35C, 아모르파디엔(AD), α-비사볼렌(AB), 디하이드로아르테미신산(DHA) 및 α-비사볼롤(ABOL)과 함께 인큐베이션된 HEK293T/17 세포에서 IR 인산화의 ELISA 기반 측정. 곡선은 4-파라미터 로지스틱 방정식에의 피팅을 나타낸다: y = d+(a-d)/(1+(x/c)^b), 이때 y는 450 nm에서의 흡광도이고, x는 샘플 희석률(예를 들어, 1은 희석 없음을 나타내고, 0.5는 2배 희석을 나타냄)이다. 이 신호는 아모르파디엔 및 α-비사볼렌이 음성 대조군(3% DMSO) 및 억제성이 덜한 이들의 유사체에 비해 IR 인산화를 증가시킬 수 있음을 표시한다. 오차 막대는 n ≥ 3 생물학적 반복실험의 표준 오차를 나타낸다.
도 36A 내지 36C. B2H 매개 항생제 내성에 대한 전체 데이터세트. 도 36A, 도 22c에 대한 생물학적 반복실험. 도 36B, 도 25A에 대한 생물학적 반복실험. 도 36C, 도 25B에 대한 생물학적 반복실험. 주황색 강조표시는 도 2C, 5A 및 5B에 표시된 데이터에 상응한다.
도 37A 및 37B. α-비사볼렌 생성의 GC/MS 분석. 도 37A, GC/MS 크로마토그램은 α-비사볼렌을 생성하도록 조작된 대장균 균주(즉, pMBIS + pABA)에 의한 α-비사볼렌의 생성을 보여준다. 도 37B, 도 37A로부터 표시된 피크의 질량 스펙트럼.
도 38A 및 38B. 보충 도 20 | (+)-1(10),4-카디나디엔의 GC/MS 분석. 도 38A, GC/MS 크로마토그램은 (+)-1(10),4-카디나디엔을 생성하도록 조작된 대장균 균주(즉, pMBIS + pA0A0C9VSL7)에 의한 (+)-1(10),4-카디나디엔의 생성을 보여준다. 도 38B, 38A로부터 표시된 피크의 질량 스펙트럼.
도 39A 내지 39B. p -니트로페놀( p -NP)에 대한 표준 곡선. 이 도면은 추가 측정을 포함함으로써 도 20을 상세히 설명한다. 도 39A, 본 발명자들은 상이한 양의 p-니트로페놀(p-NP)을 100 ㎕ 완충제(50 mM HEPES, pH=7.3)에 용해시키고 생성된 용액의 흡광도를 스펙트라맥스(SpectraMax) M2 플레이트 판독기로 측정하였다. 이 곡선에의 선형 피팅은 본 발명자들로 하여금 동역학 어세이 동안 수득된 흡광도 측정치(pNPP)를 p-NP 농도로 전환시킬 수 있게 하였다. 도 39B, 본 발명자들은 상이한 양의 4-메틸 움벨리페론(4-MU)을 100 ㎕ 완충제(50 mM HEPES, pH=7.3)에 용해시키고 생성된 용액의 형광도를 스펙트라맥스 M2 플레이트 판독기로 측정하였다. 이 곡선에의 선형 피팅은 본 발명자들로 하여금 동역학 어세이 동안 수득된 흡광도 측정치(4-MUP)를 4-MU 농도로 전환시킬 수 있게 하였다.
대장균은 테르페노이드의 생성을 위한 귀중한 플랫폼이다27-29. 본 발명자들은 인간 약물 표적의 불활성화를 검출하도록 프로그래밍된 대장균 균주가 그 표적을 억제하는 테르페노이드의 신속한 발견 및 생합성을 가능하게 한다는 가설을 세웠다. 이러한 균주를 프로그래밍하기 위해, 호모 사피엔스(H. sapiens)로부터의 단백질 티로신 키나제(PTK) 및 단백질 티로신 포스파타제(PTP)가 유전자 발현을 제어하는 세균 투-하이브리드(B2H) 시스템을 어셈블링하였다. PTK는 30종 이상의 FDA 승인 약물의 표적이고30; PTP는 임상적으로 승인된 억제제를 결여하나, 엄청난 수의 질환에 기여한다31,32. 제1 개념 증명 시스템은 2형 당뇨병, 비만 및 유방암의 치료를 위한 애매한 치료 표적인 단백질 티로신 포스파타제 1B(PTP1B)의 억제제를 검출하도록 특별히 설계되었다(도 1A)31-35. 이 시스템에서, Src 키나제는 기질 도메인을 인산화하여, 관심 대상의 유전자(GOI)의 전사를 활성화시키는 단백질-단백질 상호작용을 가능하게 한다. PTP1B는 기질 도메인을 탈인산화하여, 그 상호작용을 방해하고, PTP1B의 불활성화는 이를 다시 가능하게 한다. 대장균은 그의 프로테옴이 호모 사피엔스의 프로테옴에 충분히 직교하여, Src 및 PTP1B의 조절 활성으로부터 비롯될 수 있는 오프-표적 생장 결함을 최소화하기 때문에 이 검출 시스템에 특히 좋은 숙주이다36.
B2H 개발은 여러 단계로 수행되었다. 시작하기 위해, Src가 기질 도메인과 기질 상동성 2(SH2) 도메인의 결합을 조절하는 발광 "기본" 시스템을 어셈블링하였고; 이 시스템은 단백질-단백질 결합이 GOI 발현을 제어하는 선행 설계에 기반하였다37. 그러나, 초기 시스템은 인산화 의존성 전사 반응을 제공하지 않았므로, 준최적 활성을 나타낼 수 있는 단백질을 식별하기 위해 -상이한 시스템 성분을 각각 보유하는- 유도성 플라스미드로 보완되었다. 특히, Src의 2차 유도는 발광을 증가시켰는데, 이것은 불충분한 기질 인산화가 기본 시스템에서 GOI 발현을 억제하였다는 표시이다(도 1B). 따라서, 상이한 기질 도메인을 교환하고, 포스포펩타이드에 대한 그의 친화성을 향상시키는 돌연변이를 SH2 도메인에 추가하고38, Src에 대한 유전자를 제거함으로써, 이 시스템을 변형시켰다. 이 구성을 이용할 때, 제2 플라스미드로부터의 Src의 유도는 MidT 기질에 대해 발광을 가장 현저하게 증가시켰고(도 1C); 이어서, Src 및 PTP1B 둘 다의 동시 유도는 그 증가를 방해하였다(도 1D). Src 및 PTP1B에 대한 유전자를 통합시키고, 프로모터 및 리보좀 결합 부위를 조절하여 그의 전사 반응을 더 증폭하고(도 1D, 13 및 14) GOI로서 스펙티노마이신 내성에 대한 유전자(SpecR)를 추가함으로써 MidT 시스템을 완성하였다. 최종 플라스미드 매개 검출 시스템은 높은 항생제 농도에서 생장을 허용하기 위해 PTP1B의 불활성화를 요구하였다(도 1E).
B2H 시스템은 이를, 대장균에서 PTP1B의 새로운 억제제를 생성할 수 있는 대사 경로와 커플링함으로써 이러한 분자를 식별하는 데 사용되었다. 식물 추출물의 선행 스크린은 PTP1B를 억제하는 구조적으로 복잡한 테르페노이드를 식별하였으므로39; 확립된 억제 효과를 결여하는 여러 더 간단한 테르페노이드 스캐폴드인 아모르파디엔, γ-후물렌, 아비에타디엔 및 탁사디엔에 대한 경로를 구축하였다. 아비에타디엔은 PTP1B의 약한 억제제에 대한 대사 전구체이고40; 나머지 3개의 테르페노이드는 구조적으로 다양한 분자 세트를 대표한다. 각각의 경로는 2개의 플라스미드 매개 모듈로 구성되었다(도 2A): (i) 사카로마이세스 세레비지애로부터의 메발로네이트 의존성 이소프레노이드 경로41 및 (ii) -디테르페노이드 생성에 필요할 때- 게라닐게라닐 디포스페이트 합성효소로 보충된 테르펜 합성효소. 이 모듈들은 대장균에서 0.5 내지 100 μM의 테르페노이드 역가를 가능하게 하였다(도 9).
관심 대상의 경로 및 B2H 시스템 둘 다를 보유하는 플라스미드로 대장균을 형질전환시킴으로써 PTP1B의 억제제를 생성하는 능력에 대해 각각의 경로를 스크리닝하였다. GC-MS 기록선은 모든 경로가 B2H 시스템의 존재 하에 테르페노이드를 생성하였음을 확인시켜주었다(도 2D). 놀랍게도, 아모르파디엔 경로는 고농도의 항생제에서 생존을 허용하였고; 중요하게는, 최대 내성은 기능적 B2H 시스템을 요구하였다(도 9C). 이 결과는 아모르파디엔 경로가 PTP1B의 억제제를 생성함을 암시한다.
미생물 보조 유도 진화(MADE)는 미생물 시스템을 사용하여 치료적 관련 효소 표적의 억제제 또는 활성화제를 생성하는 대사 경로를 발견하고 진화시키는, 본원에 기재된 접근법을 의미하고, 이때 대사 경로 및 표적 효소 둘 다가 숙주 세포, 예를 들어, 대장균 세포 내에 존재한다(도 3). 이 접근법의 일부 측면은 숙주 세포 내에서 표적 효소의 활성을 검출하는 유전적으로 코딩된 시스템, 예를 들어, 표적 효소의 활성 변화를 숙주 세포의 항생제 내성 변화와 연관시키는 시스템을 구축하는 방법을 제공한다(도 1).
종래 작업은 (i) 단백질 키나제 및 단백질 포스파타제의 활성을 항생제 내성과 연관시키는 검출 시스템의 어셈블리(도 1) 및 (ii) 단백질 포스파타제의 억제제를 발견하기 위해 MADE와 함께 그 시스템의 사용(도 2)을 입증하였다. 이 결과는 국제 특허출원 제PCT/US2019/40896호에 상세히 설명되어 있다.
MADE의 능력의 범위를 확장하고 이전에 기재된 진화 실험의 요구를 해결하기 위한 전략, 시스템, 방법 및 시약이 본원에 기재되어 있다. 본원에서 MADE 방법은 1) 포스페이트 기를 추가하거나 제거하는 것 이외의 방식으로 단백질(PTM 효소)을 번역 후 변형시키는 표적 효소; 2) 페닐프로파노이드 또는 비리보좀 펩타이드를 생성하는 대사 경로; 3) 잠정적 천연 생성물을 코딩하는 숨은 유전자 클러스터; 및 4) 특정 억제 효과를 가진 천연 생성물 중 하나 이상을 사용한다.
일부 실시양태에서, MADE를 이용하여 PTM 효소의 억제제 또는 활성화제를 생성하는 대사 경로를 발견하고 진화시키는 방법이 제공되고(도 3), 이때 상기 PTM 효소는 검출 가능한 아웃풋을 제어하는 단백질-단백질 상호작용을 조절하고, PTM 효소 및 검출 가능한 아웃풋은 둘 다 적어도 하나의 플라스미드 또는 하나의 게놈에 의해 코딩되고, 천연 생성물을 생성하는 대사 경로는 적어도 하나의 플라스미드 또는 하나의 게놈에 의해 코딩되고, 상기 플라스미드 및 게놈은 동일한 숙주 세포 내에 존재한다. 일부 실시양태에서, 상이한 대사 경로를 각각 함유하는 상기 숙주 세포의 풀을 검출 가능한 아웃풋에 대해 스크리닝하고, 가장 높은 검출 가능한 아웃풋을 생성하는 세포를 히트로서 선택한다. 이 히트들을 하기 단계로 분석한다: 1) 출발 경로로부터 그들의 대사 경로를 재어셈블링하는 단계; 2) 재어셈블링된 경로를 숙주 세포에서 재스크리닝하는 단계(확인 단계); 3) 가장 높은 검출 가능한 아웃풋을 생성하는 세포를 다시 한 번 히트로서 선택하는 단계; 4) 이 선택된 세포들을 액체 배양에서 생장시키는 단계; 5) 상기 액체 배양에서 생성된 생성물을 표준 분석 방법, 예를 들어, 기체 크로마토그래피-질량 분광측정(GC/MS)으로 식별하고 정량하는 단계; 6) 액체 배양에서 생성된 생성물을 회전 증발기로 농축하는 단계; 및 7) 정제된 PTM 효소에 대한 농축된 생성물의 조절 효과를 시험하는 단계(도 3).
일부 실시양태에서, 표적 PTM 효소는 숙주 세포, 예를 들어, 이종 발현된 키나제가 세포 생장을 늦추는 사카로마이세스 세레비지애 세포의 생장을 천연적으로 억제한다.
일부 실시양태에서, PTM 효소는 유비퀴틴 리가제, SUMO 트랜스퍼라제, 메틸트랜스퍼라제, 데메틸라제, 아세틸트랜스퍼라제, 글리코실트랜스퍼라제, 팔미토일트랜스퍼라제 및/또는 관련 하이드롤라제이다. 일부 실시양태에서, 세균 투-하이브리드(B2H) 시스템은 하나 이상의 PTM 효소의 활성을 관심 대상의 유전자(GOI; 도 4A)의 전사와 연관시킨다. 일부 실시양태에서, PTM 효소는 분할 단백질, 예를 들어, 형광 단백질, 루시퍼라제, 또는 항생제 내성을 부여하는 효소의 어셈블리를 조절한다(도 4B). 일부 실시양태에서, 표적 효소는 2개의 단백질을 공유결합시키거나 단백질분해하고, 이때 이 단백질들의 어셈블리는 관심 대상의 유전자의 전사를 활성화시키거나(도 4C) 분할 단백질을 재어셈블링한다(도 4D).
일부 실시양태에서, 표적 효소를 억제하거나 활성화시키는 페닐프로파노이드 또는 비리보좀 펩타이드의 발견 및 진화 방법이 제공되고, 이때 페닐프로파노이드 또는 비리보좀 펩타이드를 생성하는 대사 경로는 적어도 하나의 플라스미드 또는 하나의 게놈에 의해 코딩되고(도 5), 이때 상기 플라스미드 및 상기 게놈은 숙주 세포 내에 존재하고, 상기 대사 경로의 돌연변이유발 및/또는 조절은 표적 효소의 억제제 또는 활성화제의 생성을 허용하고, MADE는 이로써 돌연변이되고/되거나 재구성된 경로의 식별을 가능하게 한다.
일부 실시양태에서, 표적 효소의 억제제 또는 활성화제를 생성하는 숨은 대사 경로의 발견 및 진화 방법이 제공되고, 이때 상기 숨은 대사 경로는 알려지지 않았거나 제대로 특징규명되지 않은 생성물을 가진 유전자 세트를 포함하거나, 상기 숨은 대사 경로는 하나의 유전자가 중요한 생성물의 생합성을 방해하는 유전자 세트를 포함하고, 상기 경로의 후속 돌연변이유발 및/또는 재구성은 이 경로가 그 생성물을 더 많이 생성하게 만들고, MADE는 이로써 돌연변이되고/되거나 재구성된 경로의 발견을 가능하게 한다. 예를 들어, 생합성 유전자의 제거는 표적 효소의 활성을 조절하는 대사 중간체의 축적을 가능하게 할 수 있고(도 6A); 대안적으로, 전사 리프레서에 대한 유전자의 제거는 전체 대사 경로의 활성화를 허용할 수 있다(도 6B).
일부 실시양태에서, 더 높은 역가 및/또는 더 낮은 독성을 가진 대사 경로의 발견 및 진화 방법이 제공되고, 이때 출발 경로는 경로의 라이브러리를 생성하도록 돌연변이되고/되거나 재구성되고, 상기 경로의 라이브러리는 MADE를 이용하여 (i) 출발 경로보다 더 많은 양의 억제제 또는 활성화제를 생성하고/하거나 (ii) 출발 경로보다 더 낮은 독성을 나타내는 경로를 식별함으로써 스크리닝된다(도 7). 예를 들어, 돌연변이되고/되거나 재구성된 경로는 야생형 효소보다 더 높은 활성을 나타내는 돌연변이체 효소, 예를 들어, 테르펜 합성효소에 대한 유전자를 함유할 수 있고; 대안적으로, 돌연변이되고/되거나 재구성된 경로는 야생형 효소보다 더 잘 용해되거나 더 낮은 독성을 나타내는 돌연변이체 테르펜 합성효소에 대한 유전자를 함유할 수 있다.
본 개시내용의 일부 측면은 단백질 티로신 포스파타제(PTP), 예를 들어, 단백질 티로신 포스파타제 1B(PTP1B; 도 9 및 10)를 억제하는 분자를 제공한다. 그 예는 아모르파디엔 및 유도체, 탁사디엔 및 유도체, β-비사볼렌 및 유도체, α-비사볼렌 및 유도체, 및 α-롱기피넨 및 유도체를 포함한다. 일부 실시양태에서, 이 분자들은 PTP가 기여하는 질환, 예를 들어, 2형 당뇨병42, HER2 양성 유방암43 또는 레트 증후군44의 치료를 위한 약물 또는 약물 선도물질로서 제공되고, 유효량의 상기 분자(들)를 이러한 치료를 필요로 하는 대상체에게 투여함으로써 이러한 질환을 치료하는 방법도 마찬가지로 제공된다.
관심 대상의 단백질을 포함하는 숙주 세포 집단 및 상이한 대사 경로를 포함하는 발현 벡터 집단을 포함하는 조성물 또는 시스템도 제공되고, 이때 숙주 세포 집단의 세포 또는 서브세트는 대사 경로가 관심 대상의 단백질을 조절하는 생성물을 생성할 때 검출 가능한 아웃풋을 생성하고, 임의로 상기 발현 벡터는 기준 경로를 보유하는 기준 벡터, 예를 들어, 숙주 세포 집단의 세포 또는 서브세트에서 관심 대상의 단백질의 활성을 조절하기에 충분한 농도 및/또는 효능을 가진 분자를 생성하지 않는 경로를 코딩하는 벡터의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성한다.
일부 실시양태에서, 숙주 세포는 관심 대상의 단백질의 활성이 복합체의 2개 이상의 성분 중 어느 하나에 의해 보유되지 않은 활성으로 단백질 복합체의 어셈블리를 제어함으로써, 형성된 복합체의 양에 비례하여 검출 가능한 아웃풋을 생성하는 유전적으로 코딩된 시스템을 포함한다. 일부 실시양태에서, 관심 대상의 단백질은 초기에 해리된 2개의 단백질이 공유결합되게 하거나 비공유 복합체를 형성하게 하는 번역 후 변형을 추가하는 효소이다. 일부 실시양태에서, 복합체는 SH2 도메인과 이의 인산화된 기질 사이에 형성된 복합체의 해리 상수(Kd) 이하의 Kd를 가진 2개의 단백질에 의해 형성된다.
일부 실시양태에서, 발현 벡터에 의해 코딩된 대사 경로는 페닐프로파노이드 또는 비리보좀 펩타이드를 생성한다. 일부 실시양태에서, 상이한 대사 경로를 포함하는 발현 벡터는 출발 대사 경로 내의 하나 이상의 유전자를 돌연변이시킴으로써 생성된 경로의 라이브러리를 포함한다. 일부 실시양태에서, 대사 경로 중 하나 이상은 생합성 능력이 알려지지 않은 유전자 세트를 포함한다.
일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로의 생성물과 상이한 생성물을 생성한다. 일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로에 의해 생성된 생성물의 양보다 더 많은 양의 생성물을 생성한다. 일부 실시양태에서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로보다 더 낮은 세포 독성을 나타낸다.
일부 실시양태에서, 관심 대상의 단백질은 유비퀴틴 리가제, SUMO 트랜스퍼라제, 메틸트랜스퍼라제, 데메틸라제, 아세틸트랜스퍼라제, 글리코실트랜스퍼라제, 팔미토일트랜스퍼라제 또는 관련 하이드롤라제이다.
또한, 본원은 본원에 기재된 바와 같은 발현 벡터 집단을 포함하는 키트를 제공한다. 일부 실시양태에서, 상기 키트는 본원에 기재된 바와 같은 관심 대상의 단백질을 포함하는 숙주 세포 집단도 포함한다.
상기 요약은 본원에 기재된 기술의 실시양태, 이점, 특징 및 용도의 일부를 비제한적 방식으로 예시하기 위한 것이다. 본원에 개시된 기술의 다른 실시양태, 이점, 특징 및 용도는 상세한 설명, 도면, 실시예 및 청구범위로부터 명백할 것이다.
정의
본원에서 사용된 용어 "대사 경로"는 대사물질의 합성을 가능하게 하는 유전자의 집합을 지칭한다.
본원에서 사용된 용어 "대사물질"은 살아있는 시스템 내에서 어셈블링된 유기 분자를 지칭한다.
본원에서 사용된 용어 "소분자"는 900 달톤 미만의 분자량을 가진 분자를 지칭한다.
본원에서 사용된 용어 "페닐프로파노이드"는 아미노산 페닐알라닌 및/또는 티로신으로부터 합성된 유기 화합물을 지칭한다.
본원에서 사용된 용어 "비리보좀 펩타이드"는 메신저 RNA 없이 합성된 펩타이드, 예를 들어, 비리보좀 펩타이드 합성효소로부터 합성된 펩타이드를 지칭한다.
본원에서 사용된 용어 "조절제"는 또 다른 분자, 펩타이드, 단백질, 폴리뉴클레오타이드 또는 독립체의 활성을 변화시키는 분자, 펩타이드, 단백질, 폴리뉴클레오타이드 또는 독립체를 지칭한다.
본원에서 사용된 용어 "억제제"는 효소의 활성을 감소시키는 소분자를 지칭한다.
본원에서 사용된 용어 "활성화제"는 효소의 활성을 증가시키는 소분자를 지칭한다.
본원에서 사용된 용어 "천연 생성물"은 살아있는 유기체에 의해 생성된 화학적 화합물 또는 물질을 지칭한다.
본원에서 사용된 용어 "검출 시스템"은 표적 효소의 활성을 검출 가능한 아웃풋에 연관시키는 시스템을 지칭한다.
본원에서 사용된 용어 "세균 투-하이브리드(B2H) 시스템"은 단백질-단백질 상호작용을 검출 가능한 아웃풋에 연관시키는 유전적으로 코딩된 시스템을 지칭한다.
본원에서 사용된 용어 "검출 가능한 아웃풋"은 표준 분석 기기에 의해 검출될 수 있는 아웃풋을 지칭한다. 예는 형광, 발광, 항생제 내성 또는 미생물 생장을 포함한다.
본원에서 사용된 용어 "분할 단백질"은 재어셈블링 시 단백질의 기능을 회복하는 2개의 분리된 절반으로서 존재하는 단백질을 지칭한다.
본원에서 사용된 용어 "기질 도메인"은 관심 대상의 단백질이 작용하는 펩타이드 단편 또는 단백질 성분을 포함하는 단백질을 지칭한다. 예를 들어, 기질 도메인은 관심 대상의 키나제 또는 포스파타제에 의해 표적화된 수용체 단백질의 펩타이드 단편을 포함할 수 있다.
본원에서 사용된 용어 "벡터"는 외래 유전 물질을 세포 내로 인위적으로 운반하기 위한 비히클로서 사용되는 데옥시리보핵산(DNA) 분자를 지칭한다.
본원에서 사용된 용어 "숙주 세포"는 MADE에 필요한 유전적으로 코딩된 시스템을 벡터 또는 게놈 상에 호스팅할 수 있는 세포를 지칭한다. 예를 들어, 숙주 세포는 (i) 표적 효소의 활성을 검출 가능한 아웃풋에 연관시키는 유전적으로 코딩된 검출 시스템 및 (ii) 상기 표적 효소를 억제할 수 있거나 억제하지 않을 수 있는 분자를 합성할 수 있는 대사 경로 둘 다를 코딩하는 플라스미드를 함유할 수 있다.
실시예
실시예 1
선행 연구에서, 2개의 유전적으로 코딩된 모듈-PTP1B 억제를 항생제 내성에 대한 유전자의 발현과 연관시키는 B2H 시스템, 및 아모르파디엔의 생성을 위한 대사 경로-을 이용함으로써 생성된 대장균 균주는 상이한 대사 경로를 가진 유사한 균주보다 더 큰 항생제 내성을 나타내었다(도 2). 최근 작업에서, 이 결과를 더 자세히 조사하였다. 첫째, 최대 내성은 활성 아모르파디엔 합성효소(ADS) 및 기능적 B2H 시스템 둘 다를 필요로 한다는 것이 밝혀졌다(도 9). 둘째, ADS의 우세한 생성물인 아모르파디엔의 억제 효과는 p-니트로페닐 포스페이트(pNPP; 도 10C)의 PTP1B 촉진 가수분해에 미치는 그의 영향을 측정함으로써 확인되었다. 초기 속도는 비경쟁적 또는 무경쟁적 억제의 포화 거동 특성을 나타내었고; 가장 중요하게는, 아모르파디엔에 대한 IC50은 액체 배양에서 생성된 72 μM보다 더 낮은 농도인 약 53 μM이었다. 비교를 위해, 탁사디엔에 대한 IC50은 액체 배양에서의 그의 역가보다 훨씬 더 낮은 농도인 119 μM이었다. 따라서, 시험관내 연구의 결과는 아모르파디엔이 PTP1B를 억제함으로써 항생제 내성을 부여함을 표시한다. 마지막으로, 효소 결합 면역흡착 어세이(ELISA)를 이용하여 HEK293T/17 세포의 내부에서 PTP1B를 억제하는 아모르파디엔의 능력을 입증하였다(도 10D 및 10E).
미생물 시스템은 기능적 분자를 생성하기 위해 대사 경로가 어떻게 진화하는지를 탐구하는 흥미로운 기회를 제공한다. PTP1B의 억제제를 생성하는 그의 능력을 개선하는, ADS 및 GHS의 진화적으로 접근 가능한 활성 변화를 찾기 위해, 두 효소들의 돌연변이체를 제조하였다. ADS의 경우, 잘 보존되지 않은 잔기의 오류 유발 PCR 및 부위 포화 돌연변이유발을 이용하였고; GHS의 경우, 야생형 효소의 부위 포화 돌연변이유발을, 상이한 생성물 프로파일을 가진 여러 이전에 개발된 돌연변이체들의 스크린과 페어링하였다47(도 7A, 7B). 각각의 라이브러리로부터의 적어도 하나의 돌연변이체는 야생형 효소보다 더 높은 항생제 농도에서 일관되게 생존을 부여하였다(도 7C, 7D).
다른 돌연변이체보다 항생제 내성을 더 많이 개선하는 ADS의 G34S/K51N 돌연변이체는 그의 돌연변이된 잔기가 활성 부위의 외부에 위치하고 생성물 프로파일 및 역가 중 어느 것도 변경시키지 않기 때문에 특히 흥미로웠다(도 7E, 7F). 이 돌연변이들은 이종 ADS 발현에 의해 야기된 경미한 생장 결핍을 감소시킬 수 있다고 가정하였다(예를 들어, 봉입체의 형성을 감소시킬 수 있음). 이 가설을 검정하기 위해, 불활성 B2H 시스템의 존재 하에 야생형 및 돌연변이체 균주에 의해 부여된 생존을 비교하였고; 돌연변이체 균주는 고농도의 항생제에서 더 강력한 생장을 보였다(도 7G). 이 결과는 조작된 균주가 다른 스트레스의 존재 하에 억제 대사물질의 생성을 개선할 수 있는, 독성이 덜한 효소 돌연변이체에 대해 선택될 수 있음을 암시한다.
흥미롭게도, (야생형 효소에 비해) 향상된 항생제 내성을 부여하는 GHS의 돌연변이체는 생성물 프로파일 및/또는 역가를 변경시켰다(도 7H 및 7I). 두 가지 예는 주로 α-롱기피넨을 생성하는 GHSA336C/T445C/S484C/I562L/M565L(또는 ALP), 및 테르페노이드 역가를 약 10배까지 향상시키는 GHSA319Q를 포함한다. 따라서, GHS 돌연변이체는 조작된 균주가 출발 야생형 효소와 상이한 생성물 및/또는 더 높은 역가를 생성하는 효소 돌연변이체에 대해 선택될 수 있음을 시사한다.
연구를 확장하기 위해, 주로 β-비사볼렌 및 α-비사볼렌을 생성하는 테르펜 합성효소에 의해 부여된 생존도 조사하였다. 이 효소들 둘 다가 항생제 내성을 향상시켰고; 놀랍게도, 배양 상청액으로부터 정제된 α-비사볼렌의 동역학 연구는 이 분자가 특히 강력함을 시사한다(즉, 10% DMSO에서 IC50 약 20 μM, 도 11).
테르펜 합성효소의 분석 결과는 아모르파디엔 및 유도체, 탁사디엔 및 유도체, α-롱기피넨 및 유도체, β-비사볼렌 및 유도체, 및 α-비사볼렌 및 유도체가 약학적 관련 PTP 억제제의 중요한 공급원을 제공할 수 있음을 암시한다.
방법
세균 균주. 대장균 DH10B, 화학적 적격 NEB Turbo 또는 전기적격 One Shot Top10(Invitrogen)은 분자 클로닝을 수행하고 테르페노이드 생성의 예비 분석을 수행하는 데 사용되었고; 대장균 BL2-DE31은 시험관내 연구용 단백질을 발현시키는 데 사용되었고; 대장균 s103048은 발광 연구 및 테르페노이드 매개 생장을 수반하는 모든 실험(즉, 진화 연구)에 사용되었다.
모든 균주에 대해, 하기 단계를 수행하여 화학적 적격 세포를 생성하였다: (i) 각각의 균주를, 요구된 항생제를 가진 LB 한천 플레이트 상에 플레이팅하였다. (ii) 각각의 균주의 하나의 콜로니를 사용하여 1 ㎖의 LB 배지(표 2에 나열된 적절한 항생제를 가진 25 g/ℓ LB)를 유리 배양 튜브 내에 접종하였고, 이 배양물을 하룻밤 동안(37℃, 225 RPM) 생장시켰다. (iii) 1 ㎖ 배양물을 사용하여 100 내지 300 ㎖의 LB 배지(전술된 바와 같음)를 유리 진탕 플라스크 내에 접종하였고, 이 배양물을 몇 시간 동안(37℃, 225 RPM) 생장시켰다. (iv) 배양물이 0.3 내지 0.6의 OD에 도달하였을 때, 세포를 원심분리하고(4℃에서 10분 동안 4,000 x g), 상청액을 제거하고, 세포를 30 ㎖의 빙냉 TFB1 완충제(30 mM 아세트산칼륨, 10 mM CaCl2, 50 mM MnCl2, 100 mM RbCl, 15% v/v 글리세롤, 200 ㎖까지 물, pH=5.8, 멸균 여과)에 재현탁하고, 현탁액을 4℃에서 90분 동안 인큐베이션하였다. (v) 단계 iv를 반복하되, 4 ㎖의 빙냉 TFB2 완충제(10 mM MOPS, 75 mM CaCl2, 10 mM RbCl2, 15% 글리세롤, 50 ㎖까지 물, pH=6.5, 멸균 여과)에 재현탁하였다. (iv) 최종 현탁액을 100 ㎕ 분취액으로 분할하고 추가 사용까지 -80℃에서 냉동시켰다.
전술된 접근법과 유사한 접근법에 따라 전기적격 세포를 생성하였다. 그러나, 단계 iv에서 세포를 50 ㎖의 빙냉 MilliQ 물에 재현탁하고 이 단계를 두 번 반복하였다 - 먼저 50 ㎖의 20% 멸균 글리세롤(빙냉)을 사용한 후, 1 ㎖의 20% 멸균 글리세롤(빙냉)을 사용하였다. 펠렛을 전술된 바와 같이 냉동시켰다.
재료. 메틸 아비에테이트는 산타 크루즈 바이오테크놀로지(Santa Cruz Biotechnology)로부터 구입되었고; 트랜스-카리오필렌, 파르네솔, 트리스(2-카르복시에틸)포스핀(TCEP), 소 혈청 알부민(BSA), M9 최소 염, 페닐메틸설포닐 플루오라이드(PMSF) 및 DMSO(디메틸 설폭사이드)는 밀리포어 시그마(Millipore Sigma)로부터 구입되었고; 글리세롤, 세균 단백질 추출 시약 II(B-PERII) 및 라이소자임은 VWR로부터 구입되었고; 클로닝 시약은 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터 구입되었고; 아모르파디엔은 암비드 인코포레이티드(Ambeed, Inc.)로부터 구입되었고; 모든 다른 시약들(예를 들어, 항생제 및 배지 성분)은 써모 피셔(Thermo Fisher)로부터 구입되었다. 탁사디엔은 스크립스 연구소(Scripps Research Institute)의 필 바란(Phil Baran)의 친절한 선물이었다. 메발로네이트는 1 부피의 2 M DL-메발라놀락톤을 1.05 부피의 2 M KOH과 혼합하고 이 혼합물을 37℃에서 30분 동안 인큐베이션함으로써 제조되었다.
클로닝 및 분자생물학. 모든 플라스미드는 표준 방법(즉, 제한 분해 및 라이게이션, 골든 게이트(Golden Gate) 및 깁슨(Gibson) 어셈블리, 퀵체인지(Quikchange) 돌연변이유발 및 원형 중합효소 연장 클로닝)을 이용함으로써 구축되었다. 표 1에는 각각의 유전자의 공급원이 기재되어 있다. 표 2 및 3에는 모든 최종 플라스미드들의 조성이 기재되어 있다.
pAB094a로부터의 HA4-rpoZ에 대한 유전자를 pAB078d에 통합하고 pAB078d의 암피실린 내성 마커를 카나마이신 내성 마커로 대체함으로써 B2H 시스템의 구축을 시작하였다(깁슨 어셈블리). 그 다음, HA4 및 SH2 도메인을 각각 키나제 기질 및 기질 인식(즉, SH2) 도메인으로 대체하고(깁슨 어셈블리) 다양한 조합으로 Src 키나제, CDC37 및 PTP1B에 대한 유전자를 통합함으로써(깁슨 어셈블리), 생성된 "조합된" 플라스미드를 변형시켰다. 포스포펩타이드에 대한 그의 친화성을 향상시키는 것으로 알려진 여러 돌연변이들(K15L, T8V 및 C10A, 문헌[Kaneko et. al.]40에서와 같이 넘버링됨)로 SH2 도메인을 변형시키고, 발광을 위한 GOI(LuxAB)를 스펙티노마이신 내성을 위한 GOI(SpecR)로 교체하고, 프로모터와 리보좀 결합 부위를 토글링하여 전사 반응을 향상시킴으로써 기능적 B2H 시스템을 완성하였다(깁슨 어셈블리 및 퀵체인지 돌연변이유발, 아질런트 인코포레이티드(Agilent Inc.)). 참고: 마지막 단계를 위해, 퀵체인지 프로토콜을 이용하여 Pro1을 ProD로 전환시켰다. 필요한 경우, B2H 시스템으로부터의 단일 성분을 pBAD(골든 게이트 어셈블리) 내로 클로닝함으로써 아라비노스 유도성 성분을 가진 플라스미드를 구축하였다. 표 4 및 5는 각각의 플라스미드를 구축하는 데 사용된 프라이머 및 DNA 단편을 나열한다.
애드진(Addgene)으로부터 제1 모듈(pMBIS) 및 세스퀴테르펜 합성효소(pTRC99a의 ADS 또는 GHS)를 코딩하는 플라스미드를 구입하고 나머지 플라스미드를 구축함으로써 테르페노이드 생합성 경로를 어셈블링하였다. ABS, TXS 및 GGPPS에 대한 유전자를 pTRC99t(즉, BsaI 부위가 없는 pTRC99a)에 통합하였고, 아모르파디엔의 에폭시화를 가능하게 하는 3개의 돌연변이(F87A, R47L 및 Y51F; P450G3; 깁슨 어셈블리 및 퀵체인지 돌연변이유발)49를 가진 P450BM3에 대한 유전자를 추가함으로써 pADS의 버전을 변형시켰다. 표 6은 각각의 플라스미드를 구축하는 데 사용된 프라이머 및 DNA 단편을 나열한다.
발광 어세이. 예비 B2H 시스템(GOI로서 LuxAB를 함유함)을 발광 어세이로 특징규명하였다. 요약하건대, 필요한 플라스미드를 대장균 s1030(표 2) 내로 형질전환시키고, 형질전환된 세포를 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨 및 표 2에 기재된 항생제를 가진 5 g/ℓ 효모 추출물) 상에 플레이팅하고, 모든 플레이트를 37℃에서 하룻밤 동안 인큐베이션하였다. 개별 콜로니를 사용하여 1 ㎖의 테리픽 보스(terrific both)(2% 또는 12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, pH = 7.0 및 표 2에 기재된 항생제를 함유하는 TB)를 접종하였고, 본 발명자들은 이 배양물을 하룻밤 동안(37℃ 및 225 RPM) 인큐베이션하였다. 다음날 아침, 각각의 배양물을 1 ㎖의 TB 배지(전술된 바와 같음)로 100배 희석하였고, 이 배양물을 깊은 96웰 플레이트의 개별 웰에서 5.5시간(37℃, 225 RPM) 동안 인큐베이션하였다. (참고: pBAD가 존재하였을 때, TB 배지를 0 내지 0.02 w/v% 아라비노스로 보충하였다). 100 ㎕ 양의 각각의 배양물을 표준 96웰 플레이트의 단일 웰 내로 옮기고 바이오텍 시너지(Biotek Synergy) 플레이트 판독기 상에서 OD600 및 발광도(획득: 135, 통합 시간: 1초, 판독 높이: 1 mm) 둘 다를 측정하였다. 무세포 배지의 유사한 측정을 수행하여, OD-정규화된 발광도(즉, Lum/OD600)를 계산하기 전에 각각의 측정치로부터 차감된 배경 신호를 측정하였다.
항생제 내성의 분석. 하기 단계를 수행함으로써, 테르페노이드 경로의 부재 하에 다양한 B2H 시스템들에 의해 부여된 스펙티노마이신 내성을 평가하였다: (i) 대장균을 필요한 플라스미드(표 2)로 형질전환시키고 형질전환된 세포를 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨, 5 g/ℓ 효모 추출물, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린) 상에 플레이팅하였다. (ii) 개별 콜로니를 사용하여 1 내지 2 ㎖의 TB 배지(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, pH = 7.0)를 접종하였고, 이 배양물을 하룻밤 동안(37℃, 225 RPM) 인큐베이션하였다. 아침에, 각각의 배양물을 0 내지 500 ㎍/㎖ 스펙티노마이신(스펙티노마이신은 도 14에 도시된 결과에 대해서만 사용됨)을 가진 4 ㎖의 TB 배지(전술된 바와 같음)로 100배 희석하였고, 0 ㎍/㎖ 스펙티노마이신을 함유하는 웰이 0.9 내지 1.1의 OD600에 도달할 때까지 이 배양물을 깊은 24웰 플레이트에서 인큐베이션하였다. (iv) 각각의 4 ㎖ 배양물을 항생제가 없는 TB 배지로 10배 희석하고 10 ㎕의 희석액 액적을, 다양한 농도의 스펙티노마이신을 가진 한천 플레이트 상에 플레이팅하였다. (v) 플레이트를 하룻밤 동안(37℃) 인큐베이션하고 다음날 사진을 촬영하였다.
테르페노이드 매개 내성을 조사하기 위해, 34 ㎍/㎖ 클로람페니콜 및 50 ㎍/㎖ 카르베니실린을 모든 액체/고체 배지에 첨가함으로써 전술된 바와 같이 단계 i 및 ii를 수행하였다. 그 다음, 하기 단계로 실험을 진행시켰다: (iii) 깊은 24웰 플레이트(37℃, 225 RPM)에서 인큐베이션된 4.5 ㎖의 TB 배지(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜 및 50 ㎍/㎖ 카르베니실린으로 보충됨)로 샘플을 1 ㎖ 배양물로부터 0.05의 OD600까지 희석하였다. (iv) 0.3 내지 0.6의 OD600에서, 각각의 배양물 4 ㎖를 깊은 24웰 플레이트의 새로운 웰로 옮기고 500 μM의 이소프로필 β-D-1-티오갈락토피라노사이드(IPTG) 및 20 mM의 메발로네이트를 첨가하고, 20시간 동안 인큐베이션하였다(22℃, 225 RPM). (v) 각각의 4 ㎖ 배양물을 TB 배지로 0.1의 OD600까지 희석하고 10 ㎕의 희석액을 500 μM IPTG, 20 mM 메발로네이트, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜, 50 ㎍/㎖ 카르베니실린, 및 0 내지 1200 ㎍/㎖ 스펙티노마이신으로 보충된 LB 또는 TB 플레이트 상에 플레이팅하였다(두 플레이트의 경우, 20 g/ℓ 한천을 앞서 기재된 배지 및 완충제 성분과 함께 사용하였음). 참고: 항생제 내성의 범위를 제어하기 위해, ADS 및 이의 돌연변이체를 위해 LB 플레이트를 사용하였고, GHS 및 이의 돌연변이체를 위해 테르페노이드 역가를 개선하는 TB 플레이트를 사용하였다. (iv) 모든 플레이트를 30℃에서 인큐베이션하였고 2일 후에 사진을 촬영하였다.
테르페노이드 생합성. 필수 경로 성분을 보유하는 플라스미드로 세포를 형질전환시키고(표 2) 이를 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨, 및 표 2에 기재된 항생제를 가진 5 g/ℓ 효모 추출물) 상에 플레이팅함으로써 테르페노이드 생성용 대장균을 준비하였다. 각각의 균주로부터의 하나의 콜로니를 사용하여 2 ㎖ TB(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, pH = 7.0, 및 표 2에 기재된 항생제)를 유리 배양 튜브 내에 약 16시간 동안(37℃ 및 225 RPM) 접종하였다. 이 배양물을 10 ㎖의 TB 배지로 75배 희석하고, 새로운 배양물을 125 ㎖ 유리 진탕 플라스크에서 인큐베이션하였다(37℃ 및 225 RPM). 0.3 내지 0.6의 OD600에서, 500 μM IPTG 및 20 mM 메발로네이트를 첨가하였다. 72시간 내지 88시간의 생장(22℃ 및 225 RPM) 후, 각각의 배양물로부터 테르페노이드를 추출하였다.
시간 경과에 따른 테르페노이드 생성을 측정하기 위해, 전술된 접근법을 하기 변형과 함께 이용하였다: (i) 하룻밤 배양물을 유리 배양 튜브 내의 항생제로 보충된 4.5 ㎖ TB에서 1:75 ㎖로 희석하였다. (ii) 배양물이 0.3 내지 0.6의 OD600에 도달하였을 때, 4 ㎖의 각각의 배양물을 새로운 배양 튜브로 옮기고 (테르페노이드를 추출하기 위해) 500 μM IPTG, 20 mM 메발로네이트, 0 내지 800 ㎍/㎖ 스펙티노마이신 및 1 ㎖ 도데칸을 첨가하였다. GC/MS 분석을 위해 4시간마다 100 ㎕의 도데칸 샘플을 회수하였다.
단백질 발현 및 정제. 이전에 기재된 바와 같이42 PTP를 발현시키고 정제하였다. 요약하건대, 대장균 BL21(DE3) 세포를 pET21b 벡터로 형질전환시키고, 22℃에서 20시간 동안 500 μM IPTG로 유도하였다. 탈염, 니켈 친화성 및 음이온 교환 크로마토그래피(각각 HiPrep 26/10, HisTrap HP 및 HiPrep Q HP; GE Healthcare)를 이용함으로써 세포 용해물로부터 PTP를 정제하였다. 최종 단백질(30 내지 50 μM)을 -80℃에서 20% 글리세롤 중의 HEPES 완충제(50 mM, pH 7.5, 0.5 mM TCEP)에 저장하였다.
테르페노이드의 추출 및 정제. 헥산을 사용하여 액체 배양에서 생성된 테르페노이드를 추출하였다. 10 ㎖ 배양물의 경우, 14 ㎖의 헥산을 125 ㎖ 유리 진탕 플라스크 내의 배양 브로쓰 10 ㎖에 첨가하고, 혼합물을 30분 동안 진탕하고(100 RPM) 원심분리하고(4000 x g), 추가 분석을 위해 10 ㎖의 헥산 층을 회수하였다. 4 ㎖ 배양물의 경우, 600 ㎕ 헥산을 미세원심분리 튜브 내의 배양 브로쓰 1 ㎖에 첨가하고, 튜브를 3분 동안 볼텍싱하고, 튜브를 1분 동안 원심분리하고(17000 x g), 추가 분석을 위해 300 내지 400 ㎕의 헥산 층을 남겨두었다.
아모르파디엔을 정제하기 위해, 500 내지 1000 ㎖ 배양 브로쓰를 헥산(16.7% v/v)으로 보충하고, 혼합물을 30분 동안 진탕하고(100 RPM), 헥산 층을 분별 깔때기로 단리하고, 단리된 유기 층을 원심분리하고(4000 x g), 헥산 층을 회수하였다. 테르페노이드 생성물을 농축하기 위해, 회전 증발기에서 과량의 헥산을 증발시켜 최종 부피가 500 ㎕가 되도록 하였고, 생성된 혼합물을 실리카 겔에 1회 또는 2회 통과시켰다(Sigma-Aldrich; 고순도 등급, 60 Å 공극 크기, 230 내지 400 메쉬 입자 크기). 용출 분획(100% 헥산)을 GC/MS에서 분석하고 관심 대상의 화합물(아모르파디엔)을 가진 분획을 풀링하였다. 일단 정제되면, 풀링된 분획을 약한 공기 스트림 하에 건조시켰고, 테르페노이드 고체를 DMSO에 재현탁하고, 최종 샘플을 아래에 요약된 바와 같이 정량하였다.
테르페노이드의 GC-MS 분석. 액체 배양에서 생성된 테르페노이드를 기체 크로마토그래피/질량 분광측정기(GC-MS; TG5-SilMS 컬럼 및 ISQ 7000 MS가 장착된 Trace 1310 GC, Thermo Fisher Scientific)로 측정하였다. 내부 표준물로서 20 ㎍/㎖의 카리오필렌 또는 메틸 아비에테이트를 가진 헥산(직접적으로 또는 DMSO의 1:100 희석을 통해)으로 모든 샘플들을 제조하였다. 내부 표준물의 피크 면적이 표준물만을 함유하는 헥산 샘플의 평균 면적의 ±30%를 초과하는 경우, 상응하는 샘플을 재분석하였다. 모든 실행을 위해, 하기 GC 방법을 이용하였다: 80℃에서 유지(3분), 250℃까지 증가(15℃/분), 250℃에서 유지(6분), 280℃까지 증가(30℃/분), 및 280℃에서 유지(3분). 다양한 피분석물들을 식별하기 위해, m/z 비를 50부터 550까지 스캐닝하였다.
분자 이온(m/z=204)에 대해 스캐닝하기 위해 선택 이온 모드(SIM)를 이용하여 ADS의 변이체에 의해 생성된 세스퀴테르펜을 조사하였다. 정량을 위해, 본 발명자들은 방정식 1을 이용하였다:
Figure pct00001
상기 식에서, Ai는 피분석물 i에 의해 생성된 피크의 면적이고, Astd는 샘플에서 카리오필렌의 Cstd에 의해 생성된 피크의 면적이고, R은 기준 샘플에서 카리오필렌 및 아모르파디엔에 대한 반응 계수의 비이다.
몇 가지 변형과 함께 앞서 언급된 절차를 이용하여 GHS의 변이체에 의해 생성된 세스퀴테르펜을 정량하였다: 메틸 아비에테이트를 내부 표준물로서 사용하였다(GHS의 여러 돌연변이체는 생성물로서 카리오필렌을 생성함); 세스퀴테르펜과 메틸 아비에테이트 사이의 공통 이온인 m/z=204 및 m/z=121 둘 다에 대해 스캐닝하였다; R에 대해 m/z=121에서 아모르파디엔 및 메틸 아비에테이트에 대한 반응 계수의 비를 사용하였고; 피크 면적을 m/z=121에서 계산하였다. 모든 분석을 위해, 분석은 m/z=204에서 모든 피크의 총 면적의 1%를 초과하는 면적을 가진 피크에 집중되었다.
여러 변형과 함께 일반적인 절차를 다시 한 번 이용함으로써 디테르페노이드를 정량하였다: 상이한 분자 이온(m/z=272) 및 디테르페노이드와 카리오필렌 둘 다에 공통된 이온(m/z=93)에 대해 스캐닝하였고; m/z=93에서 순수 탁사디엔(필 바란의 친절한 선물) 및 카리오필렌에 대한 반응 계수의 비를 사용하였고; 피크 면적 m/z=93을 계산하였다. 모든 분석을 위해, m/z=272에서 모든 피크의 총 면적의 1%를 초과하는 면적을 가진 피크만을 조사하였다.
NIST MS 라이브러리를 사용하여 분자를 식별하였고, 필요한 경우 문헌에 보고된 분석 표준 또는 질량 스펙트럼을 사용하여 이 식별을 확인하였다. 참고: 상이한 테르페노이드에 대한 일정 반응 계수의 가정(예를 들어, 모든 세스퀴테르펜 및 디테르펜은 각각 아모르파디엔 및 탁사디엔처럼 이온화함)은 이들의 농도 추정치에 있어서 분명히 오류를 유발할 수 있고; 따라서, 미생물 시스템에서의 테르페노이드 생성에 대한 다른 연구50,51의 분석과 일치하는, 본원에 기재된 분석은 아모르파디엔 및 탁사디엔(분석 표준물을 가짐)을 제외한 모든 화합물들에 대한 대략적인 농도 추정치를 제공한다.
ADS 및 GHS의 상동성 모델링. 주형으로서 각각 α-비사볼롤 합성효소(pdb 항목 4gax) 및 α-비사볼렌 합성효소(pdb 항목 3sae)에 대한 구조를 가진 SWISS-MODEL을 사용함으로써 ADS 및 GHS의 상동성 모델을 구축하였다52. 이 소프트웨어 팩키지는 보존된 영역의 구조를 보존하고 단편 라이브러리로 삽입 및 결실을 리모델링하는 표적-주형 정렬로부터 모델을 구축하기 위해 ProMod3을 사용한다53,54.
돌연변이체 라이브러리의 제조. 부위 포화 돌연변이유발(SSM) 및 오류 유발 PCR(ePCR)을 이용하여 효소 돌연변이체의 라이브러리를 제조하였다. SSM의 경우, 하기 단계를 수행하였다: (i) 선택 부위를 표적화하는 NNK 프라이머로 유전자를 증폭하였다. (ii) 증폭된 유전자를 DpnI로 분해하고, 겔 전기영동으로 정제하고, 깁슨 어셈블리 또는 원형 중합효소 연장 클로닝(CPEC)55을 이용하여 이 유전자를 플라스미드(pTS xx)에 통합하였다. (iii) 열 충격을 이용하여 완전히 어셈블링된 플라스미드를 화학적 적격 NEB Turbo 세포 내로 형질전환시켰다. (iv) 형질전환 반응의 희석액을 여러 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨, 5 g/ℓ 효모 추출물, 50 ㎍/㎖ 카르베니실린) 상에 플레이팅함으로써 라이브러리 크기를 확인하였고, 후속 분석을 위해 모든 남은 세포를 9개 또는 10개의 플레이트 상에 플레이팅하였다. (v) 6개의 형질전환체 중 적어도 5개의 형질전환체가 돌연변이된 유전자를 함유한다는 것을 입증하기 위해 콜로니를 시퀀싱하였다. (vi) 플레이트를 LB 배지(25 g/ℓ LB 브로쓰 혼합물, 항생제 없음) 내로 긁어내었고 최종 형질전환체를 미니프렙하여 DNA 라이브러리를 회수하였다. (vii) 모든 최종 라이브러리를 -20℃의 MilliQ 물에서 냉동시켰다.
ePCR의 경우, 진모르프(Genemorph) II 키트(Agilent)를 약 0.5개 내지 2.5개 돌연변이/kb로 사용하였다. 최종 플라스미드를 투석하고 One Shot 전기적격 Top 10 세포 내로 전기천공하였고, 최종 플라스미드를 전술된 바와 같이 시퀀싱하고 추출하고 저장하였다.
돌연변이체 라이브러리의 분석. 하기 단계를 수행하여 각각의 돌연변이체 라이브러리를 스크리닝하였다: (i) 주어진 테르펜 합성효소에 대한 100 ng의 각각의 부위 특이적 SSM 라이브러리를 풀링하였다. (ii) 각각의 완전한 라이브러리(즉, ePCR 또는 풀링된 SSM)를 2시간 동안 투석하였다. (iii) 각각의 라이브러리의 최대 10 ㎕(< 1 ㎍)를, pMBIS 경로 및 B2H 시스템 둘 다를 보유하는 대장균 균주 내로 전기천공하였다. (iv) 1 ㎖의 SOC를 형질전환된 세포에 첨가하고 1시간 동안 인큐베이션하였다(37℃ 및 225 RPM). (v) 100 ㎕의 SOC 결과물을 연속 희석하고 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨, 5 g/ℓ 효모 추출물, 50 ㎍/㎖ 카르베니실린, 10 ㎍/㎖ 테트라사이클린, 50 ㎍/㎖ 카나마이신 및 34 ㎍/㎖ 클로람페니콜) 상에 플레이팅하였고, 플레이트를 하룻밤 동안 인큐베이션하였다(37℃). 이 단계는 스크리닝된 형질전환체의 수(즉, 콜로니의 카운팅에 의해 결정된 수)의 정량을 허용하였다. (vi) 남은 900 ㎕의 형질전환된 세포를 500 ㎖ 삼각 플라스크 내의 100 ㎖ TB(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, 50 ㎍/㎖ 카르베니실린, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜, 50 ㎍/㎖ 카나마이신, pH = 7.0)에 첨가하였고, 이 플라스크를 하룻밤 동안 인큐베이션하였다(37℃ 및 225 RPM). (vii) 아침에, 각각의 배양물의 분취액을 4 ㎖의 TB로 0.05의 OD600까지 희석하고 유리 배양 튜브에서 인큐베이션하였다(37℃ 및 225 RPM). (viii) 0.3 내지 0.6의 OD600에서, 5 내지 20 mM 메발로네이트 및 500 μM IPTG를 첨가하여 테르페노이드 생성을 유도하였고, 생성된 배양물을 20시간 동안 인큐베이션하였다(22℃, 225 RPM). (ix) 각각의 배양물을 0.001의 OD600까지 희석하고 100 ㎕의 희석액을, 500 μM IPTG, 5 내지 20 mM 메발로네이트, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜, 50 ㎍/㎖ 카르베니실린 및 0 내지 1000 ㎍/㎖ 스펙티노마이신을 함유하는 한천 플레이트 상에 플레이팅하였다. (x) 고농도의 스펙티노마이신에서 생존한 콜로니를 사용하여 4 ㎖의 LB 배지(25 g/ℓ LB 브로쓰 혼합물, 50 ㎍/㎖ 카르베니실린, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜, 50 ㎍/㎖ 카나마이신)을 접종하였고, 이를 하룻밤 동안 인큐베이션하였다(37℃, 225 RPM). (xi) 생거 시퀀싱을 위해 하룻밤 배양물로부터 플라스미드 DNA를 추출하였다.
흥미로운 돌연변이들의 영향 및 거짓 양성에 대한 확인은 이들을 새로 제조된 돌연변이체에서 재스크리닝함으로써 확인되었다. 부위 지정 돌연변이유발을 이용하여 히트에서 발견된 돌연변이를 도입한 후, 전술된 액적 기반 플레이팅 방법을 이용하여 이들의 항생제 내성을 분석하였다.
효소 동역학. 테르페노이드 매개 억제를 조사하기 위해, 다양한 농도의 테르페노이드의 존재 하에 p-니트로페닐 포스페이트(pNPP)의 PTP1B 촉진 가수분해를 측정하였다. 각각의 반응은 PTP1B(0.05 μM), pNPP(0.33, 0.67, 2, 5, 10 및 15 mM), 억제제(아모르파디엔의 경우 110 μM, 50 μM 및 15 μM; 탁사디엔의 경우 100 μM, 50 μM 및 16 μM) 및 완충제(50 mM HEPES pH=7.5, 0.5 mM TCEP, 50 ㎍/㎖ BSA, 10% DMSO)를 포함하였다. 스펙트라맥스 M2 플레이트 판독기에서 5분 동안 10초마다 405 nm에서 흡광도를 측정함으로써 p-니트로페놀의 형성을 모니터링하였다.
동역학 모델을 3개의 단계로 평가하였다: (i) 억제제의 부재 및 존재 하에 수집된 초기 속도 측정치를 각각 미카엘리스-멘텐 및 억제 모델에 피팅하였다(여기서, MATLAB로부터의 nlinfitfminsearch 함수가 사용됨). (ii) F-검정은 혼합 모델과 단일 파라미터 모델을 최소 합 제곱 오차로 비교하는 데 사용되었고(여기서, MATLAB로부터의 fcdf 함수는 p-값을 할당하는 데 사용됨), 혼합 모델은 p < 0.05일 때 허용되었다. (iii) 아카이케(Akaike)의 정보 기준(AIC)은 최적 단일 파라미터 모델을 각각의 대안적 단일 파라미터 모델과 비교하는 데 사용되었고, "최적" 모델은 AIC의 차이(Δi)가 모든 비교에 대해 10을 초과할 때 허용되었다56. 참고: 아모르파디엔의 경우, 이 기준이 충족되지 않았으나; 비경쟁적 모델 및 무경쟁적 모델 둘 다가 구별 불가능한 IC50을 제공하였다.
최적 동역학 모델을 사용하여 15 mM pNPP의 PTP 촉진 가수분해의 초기 속도를 50%까지 감소시키는 데 요구된 억제제의 농도를 측정함으로써 억제제의 절반 최대 억제 농도(IC50)를 추정하였다. MATLAB 함수 "nlparci"를 이용하여 동역학 파라미터의 신뢰 구간을 확인하였고, 이 구간을 누적하여 IC50에 대한 상응하는 신뢰도를 추정하였다.
실시예 1에 대한 참고자료
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
실시예 2
질환 관련 단백질을 억제하는 소분자의 설계는 의약 화학의 오랜 과제를 대표한다. 여기서, 본 발명자들은 이 과제-인간 약물 표적의 억제-를 미생물 숙주에 코딩하고 이를 사용하여 표적화된 생물학적 활성 천연 생성물의 발견 및 생합성을 안내하는 접근법을 기술한다. 이 접근법은 당뇨병 및 암의 치료를 위해 파악하기 어려운 치료 표적인 단백질 티로신 포스파타제 1B(PTP1B)의 2개의 이전에 알려지지 않은 테르페노이드 억제제를 확인하였다. 적어도 하나의 억제제는 비정상적인 선택성을 부여하는 알로스테릭 부위를 표적화하고; 이들 둘 다가 살아있는 세포에서 PTP1B를 억제할 수 있다. 4,464개 유전자의 풀로부터 24개의 특징규명되지 않은 테르펜 합성효소의 스크린은 추가 히트를 발견하여, 확장 가능한 발견 접근법을 입증하였고, 미생물 숙주 내로의 상이한 PTP의 혼입은 PTP 특이적 검출 시스템을 제공하였다. 이 발견은 정확하게 정의된 생화학적 활성을 나타내면서도 예상치 못한 구조 및/또는 결합 부위를 보유하는 천연 생성물을 발견하고 구축하기 위해 미생물을 사용할 수 있는 가능성을 보여준다.
구조 생물학 및 컴퓨터 화학의 발전에도 불구하고, 질환 관련 단백질에 단단히 선택적으로 결합하는 소분자의 설계는 여전히 매우 어렵다1. 결합 파트너를 용매화하는 물 분자의 재배열의 자유 에너지 기여 및 결합 파트너 자체의 구조적 변화는 특히 예측하기 어려우므로, 분자 설계에 혼입하기 어렵다2,3. 결과적으로, 약물 개발은 종종 큰 화합물 라이브러리의 스크린으로 시작된다4.
자연은 살아있는 시스템에 촉매 기구를 부여하여, 엄청나게 다양한 생물학적 활성 분자들, 즉 다양한 천연 라이브러리를 구축하였다5. 이 분자들은 중요한 대사적 및 생태학적 기능(예를 들어, 초식 곤충의 포식자의 식물화학적 동원6)을 수행하도록 진화하였으나, 종종 유용한 의약 성질도 나타낸다. 수년에 걸쳐, 환경 추출물 및 천연 생성물 라이브러리의 스크린-종종 조합 (생)화학7-9에 의해 보강됨-은 아스피린부터 파클리탁셀에 이르기까지 다양한 치료제 세트를 발견하였다10. 불행하게도, 이 스크린은 자원 집약적 경향을 나타내고11 낮은 천연 역가에 의해 제한되고12 대체로 뜻밖의 발견이기 쉽다13. 결과적으로, 생물정보학적 수단은 생합성 유전자 클러스터의 식별을 가능하게 하였고14,15, 이때 공-국소화된 내성 유전자들은 그들의 생성물의 생화학적 기능을 보여줄 수 있다16,17. 그러나, 많은 천연 생성물의 치료적 적용은 그들의 천연 기능과 상이하고18, 많은 생합성 경로는 적절하게 재구성될 때 완전히 새롭고 아마도 더 효과적인 치료 분자를 생성할 수 있다19,20. 특정 질환 관련 단백질을 억제하는 천연 생성물을 효율적으로 식별하고 구축하는 방법은 거의 개발되지 않은 상태로 남아 있다.
단백질 티로신 포스파타제(PTP)는 억제제 발견에 대한 새로운 접근법으로부터 이익을 얻을 수 있는 중요한 부류의 약물 표적이다. 이 효소들은 티로신 잔기의 가수분해적 탈인산화를 촉진하고, 단백질 티로신 키나제(PTK)와 함께 수많은 질환들(예를 들어, 몇몇을 나열하자면 암, 자가면역 장애 및 심질환)에 기여한다21,22. 지난 수십 년 동안 30종 이상의 승인된 약물23에 대한 표적인 PTK의 많은 강력한 억제제가 구축되는 것을 목격하였다. 대조적으로, PTP의 치료 억제제는 개발하기 어려운 것으로 입증되었다. 이 효소들은 이들을 선택적 막 투과성 분자로 억제하기 어렵게 만드는 잘 보존된, 양으로 하전된 활성 부위를 갖고24; 이들은 임의의 종류의 표적화된 치료제를 결여한다.
이 연구에서, 본 발명자들은 미생물 시스템을 사용하여 투약하기 어려운 단백질을 억제하는 천연 생성물을 찾는 접근법을 기술한다. 본 발명자들은 2형 당뇨병, 비만 및 HER2 양성 유방암의 치료를 위한 치료 표적인 단백질 티로신 포스파타제 1B(PTP1B)에 초점을 맞추었다25. PTP1B는 일반적으로 PTP 계열26을 대표하는 구조적 특성을 갖고 다양한 세트의 생리학적 과정(예를 들어, 에너지 소비27, 염증28, 및 배아 줄기 세포의 신경 특정29)을 조절한다. 요약하건대, 본 발명자들은 2개의 유전 모듈-(i) 세포 생존을 PTP1B의 억제와 연관시키는 모듈 및 (ii) 구조적으로 다양한 테르페노이드의 생합성을 가능하게 하는 모듈로 대장균 균주를 어셈블링하였다. 잘 특징규명된 5개의 테르펜 합성효소의 연구에서, 이 균주는 PTP1B의 2개의 이전에 알려지지 않은 테르페노이드 억제제를 확인하였다. 두 억제제가 PTP1B에 대해 선택적이었고, 상이한 결합 기작을 나타내었고, 포유동물 세포에서 인슐린 수용체 인산화를 증가시켰다. 8개의 계통발생학적으로 다양한 계통군으로부터 24개의 특징규명되지 않은 테르펜 합성효소의 스크린은 추가 히트를 발견하여, 억제제 합성 유전자를 찾는 확장 가능한 접근법을 입증하였다. 결과적으로, PTP 유전자의 간단한 교환은 본 발명자들의 유전적으로 코딩된 검출 시스템을 새로운 표적으로 쉽게 확장할 수 있게 하였다. 본 발명자들의 발견은 미생물 시스템을 이용하여 질환 관련 효소의 표적화된 쉽게 합성 가능한 억제제를 찾는 다목적 접근법을 보여준다.
유전적으로 코딩된 목표의 개발
대장균은 배양될 수 없거나 수율이 낮은 유기체로부터 천연 생성물을 구축하기 위한 다목적 플랫폼이다30,31. 본 발명자들은 PTP1B(즉, 유전적으로 코딩된 목표)의 불활성화를 검출하도록 프로그래밍된 대장균 균주가 이를 억제하는 천연 생성물(즉, 목표에 대한 분자 해법)의 발견을 가능하게 할 수 있다고 가정하였다. 이러한 균주를 프로그래밍하기 위해, 본 발명자들은 PTP1B 및 Src 키나제가 유전자 발현을 제어하는 세균 투-하이브리드(B2H) 시스템을 어셈블링하였다(도 21A). 이 시스템에서, Src는 기질 도메인을 인산화하여, 관심 대상의 유전자(GOI)의 전사를 활성화시키는 단백질-단백질 상호작용을 가능하게 한다. PTP1B는 기질 도메인을 탈인산화하여, 그 상호작용을 방해하고, PTP1B의 불활성화는 이를 다시 가능하게 한다. 대장균은 그의 프로테옴이 호모 사피엔스의 프로테옴에 충분히 직교하여, Src 및 PTP1B의 조절 활성으로부터 비롯될 수 있는 오프-표적 생장 결함을 최소화하기 때문에 이 검출 시스템에 특히 좋은 숙주이다(참고 1)32.
본 발명자들은 여러 단계로 B2H 개발을 수행하였다. 시작하기 위해, 본 발명자들은 Src가 기질 도메인과 Src 상동성 2(SH2) 도메인의 결합을 조절하는 발광 "기본" 시스템을 어셈블링하였고(도 21B); Src가 접히는 데 도움이 되는 샤페론을 포함하는 이 시스템(Cdc37)33은 단백질-단백질 결합을 검출하는 다른 B2H 설계34와 유사하다. 불행하게도, 본 발명자들의 초기 시스템은 인산화 의존성 전사 반응을 일으키지 않았기 때문에, 본 발명자들은 준최적 발현 수준을 가진 단백질을 확인하기 위해 -상이한 시스템 성분을 각각 보유하는- 유도성 플라스미드로 이를 보완하였다(도 21B). 흥미롭게도, Src의 2차 유도는 발광을 증가시켰는데, 이것은 불충분한 기질 인산화 및/또는 약한 기질-SH2 결합이 본 발명자들의 기본 시스템에서 GOI 발현을 억제하였다는 표시이다. 본 발명자들은 상이한 기질 도메인을 교환하고, 포스포펩타이드에 대한 그의 친화성을 향상시키는 돌연변이를 SH2 도메인에 추가하고35, Src에 대한 유전자를 제거함으로써, 이 시스템을 변형시켰다 - 본 발명자들로 하여금 제2 플라스미드로부터의 발현만을 제어할 수 있게 하는 변형. 이 구성을 이용할 때, Src의 유도는 MidT 기질에 대해 가장 현저하게 발광을 증가시켰고(도 1C), Src 및 PTP1B 둘 다의 동시 유도는 그 증가를 방해하였다 - 세포내 PTP1B 활성의 표시(도 21D). 본 발명자들은 PTP1B 및 Src에 대한 유전자를 혼입하고, 프로모터 및 리보좀 결합 부위를 조절하여 그의 전사 반응을 추가로 증폭하고(도 21D, 도 13 및 도 14), GOI로서 스펙티노마이신 내성에 대한 유전자(SpecR)를 추가함으로써 MidT 시스템을 완성하였다. 최종 플라스미드 매개 검출 시스템은 고농도의 항생제에서 생장을 허용하기 위해 PTP1B의 불활성화를 필요로 하였다(도 21E).
PTP1B 억제제의 생합성
활성 부위의 외부에 결합하는 PTP1B의 억제제를 검색하기 위해, 본 발명자들은 B2H 시스템을 테르페노이드에 대한 대사 경로와 커플링하였는데, 이 테르페노이드는 주로 비극성 구조를 가진 구조적으로 다양한 부류의 2차 대사물질이고(도 22A), 이들 중 일부는 PTP1B를 억제하는 것으로 알려져 있다36,37. 테르페노이드는 80,000개 이상의 알려진 화합물을 포함하고 모든 특징규명된 천연 생성물의 거의 1/3을 차지한다38(임상적으로 승인된 약물의 약 50% 기준39). 시작하기 위해, 본 발명자들은 확립된 억제 효과가 없는 소수의 구조적으로 다양한 테르페노이드(도 22B)에 집중하였다: 아모르파디엔(AD), γ-후물렌, α-비사볼렌(AB), 아비에타디엔 및 탁사디엔. 각각의 테르페노이드 경로는 2개의 플라스미드 매개 모듈로 구성되었다: (i) 사카로마이세스 세레비지애로부터의 메발로네이트 의존성 이소프레노이드 경로(대장균에서의 발현을 위해 최적화됨40) 및 (ii) 대장균에서 5개의 선택된 테르페노이드 중 하나를 발현하고 생성하는 것으로 이전에 입증된 테르펜 합성효소40-44. 테르펜 합성효소는 디테르페노이드 생성에 필요한 경우 게라닐게라닐 디포스페이트 합성효소로 보충되었다. 이 모듈들은 대장균에서 0.3 내지 18 mg/ℓ의 역가로 테르페노이드를 생성하였다(도 26).
본 발명자들은 관심 대상의 경로 및 B2H 시스템 둘 다를 보유하는 플라스미드로 대장균을 형질전환시킴으로써 PTP1B의 억제제를 생성하는 그의 능력에 대해 각각의 경로를 스크리닝하였다(도 22C). 놀랍게도, AD 및 AB에 대한 경로는 고농도의 항생제에서 생존을 허용하였다. 결정적으로, GC-MS 기록선은 모든 경로가 B2H 시스템의 존재 하에 테르페노이드를 생성하고(도 22D, 도 26) AD 및 AB 생성 균주의 최대 내성이 활성 테르펜 합성효소 및 기능적 B2H 시스템 둘 다를 요구함(도 26d)을 확인시켜주었다.
본 발명자들은 p-니트로페닐 포스페이트(pNPP; 도 22E, 표 12)의 PTP1B 촉진 가수분해에 대한 테르페노이드의 영향을 조사함으로써 정제된 테르페노이드의 억제 효과를 확인하였다. AD 및 AB에 대한 IC50은 10% DMSO에서 각각 53 ± 8 μM 및 13 ± 2 μM이었다(도 22F). 이 IC50은 작은 비작용화된 탄화수소에 대해 놀라울 정도로 강력하고; 두 억제제들의 리간드 효율은 높고(표 15), 이들의 효능은 PTP1B와의 수소 결합 및 다른 안정화 상호작용을 형성하는 더 큰 분자의 효능과 유사하다21,45. 두 IC50은 액체 배양에서 각각의 테르페노이드 농도와도 유사하고(도 22G), 이것은 생체내 억제와 일치하는 발견이다(테르페노이드는 세포 내에서 축적되는 경향이 있으므로46, 생체내 농도는 훨씬 더 높을 수 있음). 본 발명자들의 생장 커플링 어세이, 동역학 어세이 및 생성 측정은 함께 AD와 AB가 세포 내부에서 PTP1B를 억제함으로써 B2H 시스템을 활성화시킴을 시사한다.
PTP1B 억제제의 생물물리학적 분석
PTP의 알로스테릭 억제제는 약물 개발의 중요한 출발점이다. 이 분자는 PTP의 잘 보존된, 양으로 하전된 활성 부위의 외부에 결합하고 기질 유사체에 비해 개선된 선택성 및 막 투과성을 갖는 경향이 있다21. 이 고려사항에 의해 동기를 부여받아, 초기 스크린은 기질과 경쟁하지 않으면서 PTP1B를 약하게 억제하는 벤즈브로마론 유도체(IC50 = 350 μM)를 확인하였고; 이 화합물의 후속 최적화는 알로스테릭 부위에 결합하는 2개의 개선된 억제제(IC50 = 8 및 22 μM)로 이어졌다45(도 23A). 향후 15년에 걸쳐, 촉매 도메인 상의 이 영역 또는 다른 알로스테릭 영역에 결합하는 새로운 억제제를 찾으려는 노력은 크게 성공하지 못하였다47. 벤즈브로마론 유도체는 결정학적으로 검증된 결합 부위를 가진 유일한 알로스테릭 억제제이다. (전체 길이 단백질의 무질서한 영역에 결합하는 알로스테릭 억제제가 NMR에 의해 특징규명되었지만25) 알로스테릭 억제제를 찾기 위한 새로운 접근법은 분명히 필요하다.
본 발명자들의 미생물 시스템은 예상치 못한 방식으로 결합하는 새로운 화합물에의 접근을 허용할 수 있다. AD 및 AB는 예를 제공한다. 이들은 매우 비극성이므로, 대다수의 다른 PTP 억제제가 의존하는 수소 결합 및 정전기 상호작용에 참여할 수 없다21,45. 이들의 결합 기작을 자세히 조사하기 위해, 본 발명자들은 AD, 및 AB의 가용성 유사체인 α-비사볼롤(좋지 않은 용해도가 침지 실험을 방해하는 리간드)에 결합된 PTP1B의 X-선 결정 구조를 수집하고자 하였다. 불행하게도, AD에 결합된 PTP1B의 구조만이 결합 부위의 명확한 확인에 충분하였다(도 30 및 도 31). 이 억제제는 벤즈브로마론 유도체에 의해 표적화되는 알로스테릭 부위와 동일한 알로스테릭 부위에 결합한다. 그러나, 그의 결합 방식은 상이하다: (i) AD는 PTP1B의 α7 나선이 재구성되어 소수성 틈을 생성하게 하고(도 23B); 이 유형의 재구성은 전형적으로 느리고(마이크로초 내지 밀리초)48 컴퓨터 리간드 설계에 혼입하기 어렵기49 때문에 흥미롭다. (ii) 이것은 다수의 결합 입체구조를 채택할 가능성이 있다(즉, 전자 밀도는 무질서한 영역을 표시함; 도 30). 분자 역학 시뮬레이션에 의해 뒷받침되는 이 거동은 단백질과, 이의 결합 포켓에서 "이동성"을 띠는 경향이 있는 탄화수소 모이어티의 결합에 대한 선행 작업과 일치한다.
본 발명자들은 몇 가지 추가 분석으로 AD 및 AB의 결합을 더 조사하였다. 첫째, 본 발명자들은 디하이드로아르테미신산에 의한 PTP1B의 억제를 조사하였다. AD의 이 구조적 유사체는 본 발명자들의 결정 구조에 따라 α7 나선에 의해 생성된 소수성 틈에의 결합을 방해할 카르복실 기를 가진다(도 23C). 이 분자의 IC50은 AD의 IC50보다 8배 더 높았고, 이것은 그의 결정학적 자세와 일치하는 효능의 감소이었다(도 23D 및 도 33). 둘째, 본 발명자들은 AD와 활성 부위에 결합하는 2개의 억제제 사이의 경쟁을 연구하였다: (i) WPD 루프가 폐쇄된 입체구조를 채택하게 하는 TCS401, 및 (ii) 그렇지 않은 오르토바나데이트. 배경의 경우, 벤조브로마론은 C-말단 알로스테릭 부위에 결합할 때 TCS401의 결합과 양립할 수 없으나 오르토바나데이트의 결합과는 양립할 수 있는 개방된 입체구조로 WPD 루프를 안정화시킨다. 본 발명자들의 동역학 데이터는 AD가 유사하게 거동함을 암시하고(도 23E 및 도 23F), 이것은 공유된 결합 부위 및 조절 기작과 일치하는 발견이다. 마지막으로, 본 발명자들은 PTP1B의 가장 가까운 상동체인 TC-PTP에 대한 AD 및 AB의 억제 효과를 평가하였다. 흥미롭게도, 두 분자들은 TC-PTP를 PTP1B보다 5배 내지 6배 덜 강력하게 억제하였다(도 23G 및 도 33). 이 발견은 잘 보존되지 않은 알로스테릭 부위에의 결합과 일치한다. 중요하게는, 이 선택성은 약해 보일 수 있으나, 대다수의 사전 최적화된 억제제(벤조브로마론 유도체를 포함함)의 선택성과 일치하거나 이를 초과하고 비작용화된 탄화수소의 경우 매우 드물다50. 그 다음, 본 발명자들은 PTP1B 및 TC-PTP로부터 동등한 영역을 제거함으로써 선택성에의 α7 나선의 기여를 평가하였다(도 23G). 이 변형은 AD의 선택성의 4배 감소를 야기하였고, 이것은 그의 결합에의 α7 나선의 관여와 일치한다. 흥미롭게도, AB의 선택성은 이 변형에 민감하지 않았고; 이 리간드의 결합 부위의 명확한 확인은 추가 데이터를 요구한다.
AD 및 AB는 포유동물 세포의 막을 통과하는 그들의 능력 때문에 귀중할 수 있는 친유성 분자들이다. 이 분자들의 생물학적 활성을 조사하기 위해, 본 발명자들은 이들을 HEK293T/17 세포와 함께 인큐베이션하고 효소 결합 면역흡착 어세이를 이용하여 인슐린 수용체(IR) 인산화의 변화를 측정하였다. IR은 원형질막의 세포질 측으로부터 PTP1B 매개 탈인산화를 겪는 수용체 티로신 키나제이다(그 다음, PTP1B는 세포의 소포체에 국소화됨). 두 분자들은 음성 대조군에 비해 IR 인산화를 증가시켰다(도 23H 및 도 35). 이어서, 본 발명자들은 동등한 농도의 디하이드로아르테미신산 및 α-비사볼롤로 ELISA를 반복함으로써 이 신호에의 오프-표적 기여를 확인하였다. 만족스럽게도, 두 분자들은 그들의 감소된 효능과 일치하는 신호 감소를 유발하였다.
다른 PTP는 IR 탈인산화를 촉진할 수 있고; SHP1 및 SHP2는 두 가지 예를 제공한다51-53. 본 발명자들의 ELISA에서 관찰된 IR 인산화의 증가에 대한 이 효소들의 잠재적 기여를 조사하기 위해, 본 발명자들은 AD 및 AB에 의한 그들의 억제를 측정하였다. 요약하건대, AD는 PTP1B보다 3배 덜 강력하게 SHP2를 억제하였고, 그의 SHP1 억제는 측정하기에 너무 약하였다(도 34A 및 34B). SHP1 및 SHP2에 대한 AB의 낮은 효능도 실험적 측정을 방해하였다(도 34C 및 34D). 이 효능은, 앞서 언급된 약한 억제 구조 유사체의 분석과 함께, AD 및 AB에 의한 PTP1B의 억제가 본 발명자들의 ELISA 실험에서 관찰된 IR 인산화 증가의 주요 원인임을 암시한다.
분자 발견에 대한 확장 가능한 접근법
본 발명자들의 미생물 균주는 신규 PTP1B 억제제를 생성하는 능력에 대해 유전자를 스크리닝하는 강력한 수단을 제공한다. 사례 연구로서 대다수의 테르페노이드는 상업적으로 입수 가능하지 않으며, 그들의 대사 경로가 알려져 있을 때조차도 그들의 생합성, 정제 및 시험관내 분석은 기존 방법과 병행하기 어려운 자원 집약적 공정이다54. 본 발명자들의 B2H 시스템은 잠재적인 해법을 제공한다: 이것은 간단한 생장 커플링 어세이로 억제제 합성 유전자를 식별할 수 있다. 본 발명자들은 이를 이용하여 다양한 세트의 특징규명되지 않은 생합성 유전자를 스크리닝함으로써 발견 노력에의 그의 적용을 조사하였다. 요약하건대, 본 발명자들은 4,464개의 구성 구성원의 계통도를 구축하고 주석을 달아 가장 큰 테르펜 합성효소 계열(PF03936)의 생물정보학적 분석을 수행하였고(도 27); 여기부터, 본 발명자들은 8개의 계통군 각각으로부터 3개의 특징규명되지 않은 유전자를 합성하였다: 특징규명된 유전자를 갖지 않는 6개 및 일부 특징규명된 유전자를 가진 2개(도 24A). 본 발명자들은 이 24개의 계통발생학적으로 다양한 유전자들(진균으로부터 8개, 식물로부터 13개, 세균으로부터 3개)이 특징규명되지 않은 계통군을 포함함으로써 상이한 생성물 프로파일을 가진 효소 및 잠재적으로 새로운 세스퀴테르펜 스캐폴드를 코딩할 수 있다고 추론하였다.
본 발명자들의 초기 스크린에 의해 안내된 바에 따라, 본 발명자들은 특징규명되지 않은 유전자 각각을 FPP 경로와 페어링함으로써 세스퀴테르펜 억제제를 검색하였다. 놀랍게도, 6개의 유전자들은 상당한 생존 이점을 부여하였고(도 24B), 최대 내성은 활성 B2H 시스템을 필요로 하였다(도 28). 각각의 히트는 상이한 생성물 프로파일을 생성하였고(도 29); 본 발명자들은 주 생성물로서 주로 (+)-1(10),4-카디나디엔을 생성하는 A0A0C9VSL7에 대한 본 발명자들의 분석에 초점을 맞추었다(도 24C 및 24D). 이 테르페노이드는 AD의 구조적 유사체이지만 더 약한 효능을 갖고(IC50 = 165±33 μM; 도 24E); 33±18 μM의 역가는 세포내 축적이 이로 하여금 세포 내부에서 PTP1B를 억제할 수 있게 함을 시사한다. 약한 억제제를 검출하는 본 발명자들의 능력은 B2H 시스템이 분자 발견 노력에서 광범위한 세트의 스캐폴드를 포획할 수 있음을 암시한다. 추가 히트의 정제 및 분석, (게라닐 디포스페이트 합성효소 또는 게라닐 게라닐 디포스페이트 합성효소의 사용을 통해) 상이한 크기의 이소프레노이드 기질의 혼입, 및 더 많은 특징규명되지 않은 유전자의 포함은 이러한 노력의 범위를 확장할 수 있다.
대안적 PTP 특이적 목표의 설계
본 발명자들은 여러 다른 질환 관련 PTP의 불활성화를 검출하는 능력을 평가함으로써 본 발명자들의 B2H 시스템의 다목적성을 조사하였다. 간단히 말해서, 본 발명자들은 PTP1B에 대한 유전자를 PTPN2, PTPN6 또는 PTPN12에 대한 유전자로 교체하였고; 이 효소들은 각각 면역치료 강화55, 난소암 치료56 및 급성 심근경색증57에 대한 표적이다. 이들의 촉매 도메인은 PTP1B의 촉매 도메인과 31% 내지 65% 서열 동일성을 공유한다. 흥미롭게도, 새로운 B2H 시스템은 즉시 작용하였고; PTP 불활성화는 고농도의 스펙티노마이신에서 생장을 허용하였다(도 25A). 이 발견은 본 발명자들의 검출 시스템이 PTP 계열의 다른 구성원으로 용이하게 확장될 수 있음을 시사한다.
PTP 특이적 B2H 시스템은 하나의 PTP를 또 다른 PTP보다 선택적으로 억제하는 천연 생성물의 식별을 용이하게 할 수 있다. 본 발명자들은 AD 및 α-비사볼렌에 대한 대사 경로에 대한 반응으로 PTP1B 및 TC-PTP 특이적 시스템에 의해 부여된 항생제 내성을 비교함으로써 이 적용을 조사하였다(도 25B). 예상된 바와 같이, PTP1B 특이적 시스템은 더 높은 농도의 항생제에서 생장을 허용하였고, 이것은 PTP1B에 대한 두 테르페노이드의 선택성과 일치하는 결과이다. 두 균주 사이의 구별 불가능한 테르페노이드 역가는 이 생존 이점이 세포내 농도의 차이로부터 비롯된 것이 아님을 암시한다(도 25C). 따라서, 이 발견은 B2H 시스템의 간단한 비교-잠재적인 2차 스크린-가 선택성 PTP 억제 유전자 생성물을 평가하는 간단한 접근법을 제공함을 시사한다. 특히, 두 균주에서 고농도의 억제제는 선택적 효과를 압도할 수 있고; 이러한 경우, 테르페노이드 수준은 더 낮은 메발로네이트 농도에 의해 감소될 수 있다.
이 연구는 원하는 생화학적 활성(즉, 목적)을, 분자 생합성을 안내하는 유전적으로 코딩된 제약조건으로서 사용함으로써 의약 화학의 중요한 과제-질환 관련 효소를 억제하는 분자 구조의 설계-를 해결한다. 이 접근법은 파악하기 어려운 약물 표적인 PTP1B의 두 가지 선택적 생물학적 활성 억제제를 식별할 수 있게 하였다58. 이 분자들은 약물이 아니나, 선도물질 개발을 위한 유망한 스캐폴드이다. 알로스테릭 입체구조적 변화를 유발하지만, 느슨하고 입체구조적으로 유연한 결합에 의존하는 것으로 보이는 이들의 조절 기작은 특이하고(그리고 컴퓨터로 파악하기 어려움59), 미생물 시스템이 분자 설계의 어려운 과제에 대한 새로운 해법을 찾는 능력을 입증한다. 결국, 상대적으로 작은 라이브러리에서 본 발명자들의 특이한 억제제의 식별은 미생물 시스템이 분자 발견에 대한 기존 접근법에 의해 효율적으로 조사되지 않는 풍부한 분자 환경에 접근할 수 있음을 암시한다.
본 발명자들의 접근법의 핵심에 있는 B2H 시스템은 구조적으로 복잡하고 합성하기 어렵고 종종 숨은 유전자 클러스터에 숨은 생물학적 활성 천연 생성물을 식별하는 귀중한 수단이다60. 이것은 억제제 발견에 대한 현대적 접근법에 비해 몇 가지 핵심 이점을 가진다: (i) 이것은 합성 가능성을 검색 기준-선도물질 약물의 중요한 속성-으로서 혼입한다61. (ii) 이것은 확장 가능하다. 본 발명자들은 생장 커플링 어세이를 이용하여 24개의 특징규명되지 않은 테르펜 합성효소를 스크리닝하였고; 이 유형의 어세이는 매우 큰 돌연변이유발 라이브러리(예를 들어, 1010)와도 양립 가능하다62. (iii) 이것은 세포 기구를 이용하여 단백질을 안정화시킬 수 있고(예를 들어, Src의 경우 CDC37); 이 능력은 불안정하고/하거나 무질서한 표적의 통합을 용이하게 할 수 있다. 돌연변이되고/되거나 재구성된 경로의 큰 라이브러리, 대안적 생합성 효소(예를 들어, 사이토크롬 P450, 할로게나제 및 메틸트랜스퍼라제) 또는 새로운 부류의 질환 관련 효소를 혼입함으로써 이 이점들을 활용하려는 미래의 노력은 유익할 것이다.
B2H 시스템은 중요한 한계도 가진다. 이것은 대사 경로와 함께 사용될 때 생존을 대사물질의 효능뿐만 아니라 이의 역가, 오프-표적 효과 및 경로 독성과도 연관시킨다. 이 한계들은 유리할 수 있고; 이들은 발견 과정을, 용이하게 합성될 수 있는 강력한 억제제 쪽으로 편향시킴으로써, 흥미로운 분자의 역가를 개선하기 위한 발견 후 노력을 용이하게 할 수 있다63. 그럼에도 불구하고, 이들은 대장균에서 합성하기 어려운 일부 유형의 구조적으로 복잡한 분자들을 배제할 것이다. 다른 유기체(예를 들어, 스트렙토마이세스)에서 유사한 활성 기반 스크린을 이용하는 것은 흥미로울 수 있다.
본 발명자들의 발견 접근법과 다양한 PTP들의 양립 가능성은 새로운 치료 표적의 풍부한 -그리고 본질적으로 미개척된- 공급원으로서 그들의 점차적으로 잘 검증된 잠재력에 비추어 볼 때 가치가 있다64. 본 발명자들은 일부 PTP가 B2H 시스템에 혼입되기 위해 샤페론 및/또는 전사 조절의 사용을 요구할 것임을 예상한다. 본 발명자들의 PTP1B 기반 시스템의 체계적인 최적화는 이 변형을 조사하기 위한 실험적 프레임워크를 제공한다. 결과적으로, B2H 시스템을 나란히 비교하는 것은 2차 스크린에서 억제제 선택성을 평가하는 유망한 전략을 제공한다. 향후 연구에서, 새로운 다양한 목표(예를 들어, 또 다른 PTP에 비해 하나의 PTP의 선택적 억제-또는 아마도 활성화-를 검출하는 B2H 시스템 또는 유전 회로)는 1차 스크린에서 정교한 조절 기작을 가진 분자의 발견을 용이하게 할 수 있다. 유전적으로 코딩된 목표의 다목적성은 미생물 시스템을 사용하여 표적화된 생물학적 활성 분자를 찾는 능력을 강조한다.
참고 1: 프로테옴의 직교성. 대장균 및 사카로마이세스 세레비지애는 둘 다 약학적 관련 천연 생성물의 생성을 위한 잘 개발된 플랫폼이다20,65,66. 본 발명자들은 이 연구를 위해 대장균을 사용하기로 결정하였는데, 그 이유는 단백질을 인산화하는 그의 기구가 진핵 세포의 기구와 유사하지 않으므로 PTP1B의 억제를 세포 생장과 연관시키는 유전적으로 코딩된 시스템의 기능을 방해할 가능성이 보다 적기 때문이다67. 대조적으로, 사카로마이세스 세레비지애에서 Src 키나제의 과다발현은 치명적이고 PTP1B68에 의해 완화되고68; 이 효과는 본 발명자들의 생화학적 목표와 일치하지 않는다. 보다 광범위하게는, 사카로마이세스 세레비지애 및 인간은 약 10억 년 전에 공통 조상으로부터 진화하였음에도 불구하고69 많은 기능적으로 동등한 단백질을 공유하고; 실제로 이종상동성 유전자는 효모 게놈의 3분의 1 이상을 차지한다70. 가장 놀랍게도, 최근 연구는 사카로마이세스 세레비지애로부터의 414개 필수 유전자들 중 거의 절반(47%)이 생장 결함을 갖지 않은 인간 이종상동체로 대체될 수 있음을 발견하였다71. 이 발견은 효모가 인간 조절 효소의 활성의 임의 변화를 적합도 이점과 연관시키는 유전적으로 코딩된 시스템을 위한 특히 제한적인 숙주임을 암시한다.
방법
세균 균주. 본 발명자들은 대장균 DH10B, 화학적 적격 NEB Turbo 또는 전기적격 One Shot Top10(Invitrogen)을 사용하여 분자 클로닝을 수행하고 테르페노이드 생성의 예비 분석을 수행하였고; 본 발명자들은 대장균 BL2-DE31을 사용하여 시험관내 연구용 단백질을 발현시켰고; 본 발명자들은 대장균 s103072을 본 발명자들의 발광 연구 및 테르페노이드 매개 생장을 수반하는 모든 실험(즉, 진화 연구)에 사용하였다.
모든 균주에 대해, 본 발명자들은 하기 단계를 수행함으로써 화학적 적격 세포를 생성하였다: (i) 본 발명자들은 각각의 균주를, 요구된 항생제를 가진 LB 한천 플레이트 상에 플레이팅하였다. (ii) 본 발명자들은 각각의 균주의 하나의 콜로니를 사용하여 1 ㎖의 LB 배지(표 8에 나열된 적절한 항생제를 가진 25 g/ℓ LB)를 유리 배양 튜브 내에 접종하였고, 본 발명자들은 이 배양물을 하룻밤 동안(37℃, 225 RPM) 생장시켰다. (iii) 본 발명자들은 1 ㎖ 배양물을 사용하여 100 내지 300 ㎖의 LB 배지(전술된 바와 같음)를 유리 진탕 플라스크 내에 접종하였고, 본 발명자들은 이 배양물을 몇 시간 동안(37℃, 225 RPM) 생장시켰다. (iv) 배양물이 0.3 내지 0.6의 OD에 도달하였을 때, 본 발명자들은 세포를 원심분리하고(4℃에서 10분 동안 4,000 x g), 상청액을 제거하고, 세포를 30 ㎖의 빙냉 TFB1 완충제(30 mM 아세트산칼륨, 10 mM CaCl2, 50 mM MnCl2, 100 mM RbCl, 15% v/v 글리세롤, 200 ㎖까지 물, pH=5.8, 멸균 여과)에 재현탁하고, 현탁액을 4℃에서 90분 동안 인큐베이션하였다. (v) 본 발명자들은 단계 iv를 반복하되, 4 ㎖의 빙냉 TFB2 완충제(10 mM MOPS, 75 mM CaCl2, 10 mM RbCl2, 15% 글리세롤, 50 ㎖까지 물, pH=6.5, 멸균 여과)에 재현탁하였다. (iv) 본 발명자들은 최종 현탁액을 100 ㎕ 분취액으로 분할하고 추가 사용까지 -80℃에서 냉동시켰다.
본 발명자들은 전술된 접근법과 유사한 접근법에 따라 전기적격 세포를 생성하였다. 그러나, 본 발명자들은 단계 iv에서 세포를 50 ㎖의 빙냉 MilliQ 물에 재현탁하고 이 단계를 두 번 반복하였다 - 먼저 50 ㎖의 20% 멸균 글리세롤(빙냉)을 사용한 후 1 ㎖의 20% 멸균 글리세롤(빙냉)을 사용하였다. 본 발명자들은 펠렛을 전술된 바와 같이 냉동시켰다.
재료. 본 발명자들은 산타 크루즈 바이오테크놀로지로부터 메틸 아비에테이트를 구입하였고; 밀리포어 시그마로부터 트랜스-카리오필렌, 트리스(2-카르복시에틸)포스핀(TCEP), 소 혈청 알부민(BSA), M9 최소 염, 페닐메틸설포닐 플루오라이드(PMSF) 및 DMSO(디메틸 설폭사이드)를 구입하였고; VWR로부터 글리세롤, 세균 단백질 추출 시약 II(B-PERII) 및 라이소자임을 구입하였고; 뉴 잉글랜드 바이오랩스로부터 클로닝 시약을 구입하였고; 암비드 인코포레이티드로부터 AD를 구입하였고; 써모 피셔로부터 모든 다른 시약들(예를 들어, 항생제 및 배지 성분)을 구입하였다. 탁사디엔은 스크립스 연구소의 필 바란의 친절한 선물이었다. 본 발명자들은 1 부피의 2 M DL-메발라놀락톤을 1.05 부피의 2 M KOH과 혼합하고 이 혼합물을 37℃에서 30분 동안 인큐베이션함으로써 메발로네이트를 제조하였다.
클로닝 및 분자생물학. 본 발명자들은 표준 방법(즉, 제한 분해 및 라이게이션, 골든 게이트 및 깁슨 어셈블리, 퀵체인지 돌연변이유발 및 원형 중합효소 연장 클로닝)을 이용함으로써 모든 플라스미드를 구축하였다. 표 7에는 각각의 유전자의 공급원이 기재되어 있고; 표 8 및 표 3에는 모든 최종 플라스미드들의 조성이 기재되어 있다.
본 발명자들은 pAB094a로부터의 HA4-rpoZ에 대한 유전자를 pAB078d에 통합하고 pAB078d의 암피실린 내성 마커를 카나마이신 내성 마커로 대체함으로써 B2H 시스템의 구축을 시작하였다(깁슨 어셈블리). 그 다음, 본 발명자들은 HA4 및 SH2 도메인을 각각 키나제 기질 및 기질 인식(즉, SH2) 도메인으로 대체하고(깁슨 어셈블리) 다양한 조합으로 Src 키나제, CDC37 및 PTP1B에 대한 유전자를 통합함으로써(깁슨 어셈블리), 생성된 "조합된" 플라스미드를 변형시켰다. 본 발명자들은 포스포펩타이드에 대한 그의 친화성을 향상시키는 것으로 알려진 여러 돌연변이들(K15L, T8V 및 C10A, 문헌[Kaneko et. al.]35에서와 같이 넘버링됨)로 SH2 도메인을 변형시키고, 발광을 위한 GOI(LuxAB)를 스펙티노마이신 내성을 위한 GOI(SpecR)로 교체하고, 프로모터와 리보좀 결합 부위를 토글링하여 전사 반응을 향상시킴으로써 기능적 B2H 시스템을 완성하였다(깁슨 어셈블리 및 퀵체인지 돌연변이유발, Agilent Inc.). 참고: 마지막 단계를 위해, 본 발명자들은 또한 퀵체인지 프로토콜을 이용하여 Pro1을 ProD로 전환시켰다. 필요한 경우, 본 발명자들은 B2H 시스템으로부터의 단일 성분을 pBAD 내로 클로닝함으로써 아라비노스 유도성 성분을 가진 플라스미드를 구축하였다(골든 게이트 어셈블리). 표 4, 표 9 및 표 10은 각각의 플라스미드를 구축하는 데 사용된 프라이머 및 DNA 단편을 나열한다.
본 발명자들은 애드진으로부터 제1 모듈(pMBIS) 및 다양한 세스퀴테르펜 합성효소(pTRC99a의 ADS 또는 GHS)를 코딩하는 플라스미드를 구입하고 나머지 플라스미드를 구축함으로써 테르페노이드 생합성 경로를 어셈블링하였다. 본 발명자들은 pMBIS의 테트라사이클린 내성을 클로람페니콜 내성에 대한 유전자로 대체하여 pMBISCmR을 생성하였다. 본 발명자들은 ABS, TXS, ABA 및 GGPPS에 대한 유전자를 pTRC99t(즉, BsaI 부위가 없는 pTRC99a)에 통합하였다. 표 4, 표 9 및 표 10은 각각의 플라스미드를 구축하는 데 사용된 프라이머 및 DNA 단편을 나열한다.
발광 어세이. 본 발명자들은 예비 B2H 시스템(GOI로서 LuxAB를 함유함)을 발광 어세이로 특징규명하였다. 요약하건대, 본 발명자들은 필요한 플라스미드를 대장균 s1030(표 8) 내로 형질전환시키고, 형질전환된 세포를 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨 및 표 8에 기재된 항생제를 가진 5 g/ℓ 효모 추출물) 상에 플레이팅하고, 모든 플레이트를 37℃에서 하룻밤 동안 인큐베이션하였다. 본 발명자들은 개별 콜로니를 사용하여 1 ㎖의 테리픽 보스(2% 또는 12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, pH = 7.3 및 표 8에 기재된 항생제를 함유하는 TB)를 접종하였고, 본 발명자들은 이 배양물을 하룻밤 동안(37℃ 및 225 RPM) 인큐베이션하였다. 다음날 아침, 본 발명자들은 각각의 배양물을 1 ㎖의 TB 배지(전술된 바와 같음)로 100배 희석하였고, 본 발명자들은 이 배양물을 깊은 96웰 플레이트의 개별 웰에서 5.5시간(37℃, 225 RPM) 동안 인큐베이션하였다. (참고: 본 발명자들은 pBAD가 존재하였을 때 TB 배지를 0 내지 0.02 w/v% 아라비노스로 보충하였다). 본 발명자들은 100 ㎕의 각각의 배양물을 표준 96웰 플레이트의 단일 웰 내로 옮기고 바이오텍 시너지 플레이트 판독기 상에서 OD600 및 발광도(획득: 135, 통합 시간: 1초, 판독 높이: 1 mm) 둘 다를 측정하였다. 무세포 배지의 유사한 측정은 본 발명자들로 하여금 OD-정규화된 발광도(즉, Lum/OD600)를 계산하기 전에 각각의 측정치로부터 차감된 배경 신호를 측정할 수 있게 하였다.
항생제 내성의 분석. 본 발명자들은 하기 단계를 수행함으로써, 테르페노이드 경로의 부재 하에 다양한 B2H 시스템들에 의해 부여된 스펙티노마이신 내성을 평가하였다: (i) 본 발명자들은 대장균을 필요한 플라스미드(표 8)로 형질전환시키고 형질전환된 세포를 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨, 5 g/ℓ 효모 추출물, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린) 상에 플레이팅하였다. (ii) 본 발명자들은 개별 콜로니를 사용하여 1 내지 2 ㎖의 TB 배지(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, pH = 7.3)를 접종하였고, 본 발명자들은 이 배양물을 하룻밤 동안(37℃, 225 RPM) 인큐베이션하였다. 아침에, 본 발명자들은 각각의 배양물을 0 내지 500 ㎍/㎖ 스펙티노마이신(본 발명자들은 도 14의 경우에만 액체 배양에서 스펙티노마이신을 사용하였음)을 가진 4 ㎖의 TB 배지(전술된 바와 같음)로 100배 희석하였고, 본 발명자들은 0 ㎍/㎖ 스펙티노마이신을 함유하는 웰이 0.9 내지 1.1의 OD600에 도달할 때까지 이 배양물을 깊은 24웰 플레이트에서 인큐베이션하였다. (iv) 본 발명자들은 각각의 4 ㎖ 배양물을 항생제가 없는 TB 배지로 10배 희석하고 10 ㎕의 희석액 액적을, 다양한 농도의 스펙티노마이신을 가진 한천 플레이트 상에 플레이팅하였다. (v) 본 발명자들은 플레이트를 하룻밤 동안(37℃) 인큐베이션하고 다음날 사진을 촬영하였다.
테르페노이드 매개 내성을 조사하기 위해, 본 발명자들은 34 ㎍/㎖ 클로람페니콜 및 50 ㎍/㎖ 카르베니실린을 모든 액체/고체 배지에 첨가함으로써 전술된 바와 같이 단계 i 및 ii로 시작하였다. 그 다음, 본 발명자들은 하기 단계를 진행시켰다: (iii) 본 발명자들은 깊은 24웰 플레이트(37℃, 225 RPM)에서 인큐베이션된 4.5 ㎖의 TB 배지(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜 및 50 ㎍/㎖ 카르베니실린으로 보충됨)로 샘플을 1 ㎖ 배양물로부터 0.05의 OD600까지 희석하였다. (iv) 본 발명자들은 0.3 내지 0.6의 OD600에서 각각의 배양물 4 ㎖를 깊은 24웰 플레이트의 새로운 웰로 옮기고 500 μM의 이소프로필 β-D-1-티오갈락토피라노사이드(IPTG) 및 20 mM의 메발로네이트를 첨가하고, 20시간 동안(22℃, 225 RPM) 인큐베이션하였다. (v) 본 발명자들은 각각의 4 ㎖ 배양물을 TB 배지로 0.1의 OD600까지 희석하고 10 ㎕의 희석액을 500 μM IPTG, 20 mM 메발로네이트, 50 ㎍/㎖ 카나마이신, 10 ㎍/㎖ 테트라사이클린, 34 ㎍/㎖ 클로람페니콜, 50 ㎍/㎖ 카르베니실린, 및 0 내지 1200 ㎍/㎖ 스펙티노마이신으로 보충된 LB 또는 TB 플레이트 상에 플레이팅하였다(두 플레이트의 경우, 본 발명자들은 앞서 기재된 배지 및 완충제 성분과 함께 20 g/ℓ 한천을 사용하였음).
테르페노이드 생합성. 본 발명자들은 필수 경로 성분을 보유하는 플라스미드로 세포를 형질전환시키고(표 8) 이를 LB 한천 플레이트(20 g/ℓ 한천, 10 g/ℓ 트립톤, 10 g/ℓ 염화나트륨, 및 표 8에 기재된 항생제를 가진 5 g/ℓ 효모 추출물) 상에 플레이팅함으로써 테르페노이드 생성용 대장균을 준비하였다. 본 발명자들은 각각의 균주로부터의 하나의 콜로니를 사용하여 2 ㎖ TB(12 g/ℓ 트립톤, 24 g/ℓ 효모 추출물, 12 ㎖/ℓ 100% 글리세롤, 2.28 g/ℓ KH2PO4, 12.53 g/ℓ K2HPO4, pH = 7.0, 및 표 8에 기재된 항생제)를 유리 배양 튜브 내에 약 16시간 동안(37℃ 및 225 RPM) 접종하였다. 본 발명자들은 이 배양물을 10 ㎖의 TB 배지로 75배 희석하고, 새로운 배양물을 125 ㎖ 유리 진탕 플라스크에서 인큐베이션하였다(37℃ 및 225 RPM). 본 발명자들은 0.3 내지 0.6의 OD600에서 500 μM IPTG 및 20 mM 메발로네이트를 첨가하였다. 72시간 내지 88시간의 생장(22℃ 및 225 RPM) 후, 본 발명자들은 이하에 요약된 바와 같이 각각의 배양물로부터 테르페노이드를 추출하였다.
단백질 발현 및 정제. 본 발명자들은 이전에 기재된 바와 같이73 PTP를 발현시키고 정제하였다. 요약하건대, 본 발명자들은 대장균 BL21(DE3) 세포를 pET16b 또는 pET21b 벡터로 형질전환시켰고(세부사항에 대해서는 표 8 참조), 본 발명자들은 22℃에서 20시간 동안 500 μM IPTG로 유도하였다. 본 발명자들은 탈염, 니켈 친화성 및 음이온 교환 크로마토그래피(각각 HiPrep 26/10, HisTrap HP 및 HiPrep Q HP; GE Healthcare)를 이용함으로써 세포 용해물로부터 PTP를 정제하였다. 본 발명자들은 최종 단백질(30 내지 50 μM)을 -80℃에서 20% 글리세롤 중의 HEPES 완충제(50 mM, pH 7.5, 0.5 mM TCEP)에 저장하였다.
테르페노이드의 추출 및 정제. 본 발명자들은 헥산을 사용하여 액체 배양에서 생성된 테르페노이드를 추출하였다. 10 ㎖ 배양물의 경우, 본 발명자들은 14 ㎖의 헥산을 125 ㎖ 유리 진탕 플라스크 내의 배양 브로쓰 10 ㎖에 첨가하고, 혼합물을 30분 동안 진탕하고(100 RPM) 원심분리하고(4000 x g), 추가 분석을 위해 10 ㎖의 헥산 층을 회수하였다. 4 ㎖ 배양물의 경우, 본 발명자들은 600 ㎕ 헥산을 미세원심분리 튜브 내의 배양 브로쓰 1 ㎖에 첨가하고, 튜브를 3분 동안 볼텍싱하고, 튜브를 1분 동안 원심분리하고(17000 x g), 추가 분석을 위해 300 내지 400 ㎕의 헥산 층을 남겨두었다.
AD, AB 및 (+)-1(10),4-카디나디엔을 정제하기 위해, 본 발명자들은 500 내지 1000 ㎖ 배양 브로쓰를 헥산(16.7% v/v)으로 보충하고, 혼합물을 30분 동안 진탕하고(100 RPM), 헥산 층을 분별 깔때기로 단리하고, 단리된 유기 층을 원심분리하고(4000 x g), 헥산 층을 회수하였다. 테르페노이드 생성물을 농축하기 위해, 본 발명자들은 회전 증발기에서 과량의 헥산을 증발시켜 최종 부피가 500 ㎕가 되도록 하였고, 본 발명자들은 생성된 혼합물을 실리카 겔에 1회 내지 3회 통과시켰다(Sigma-Aldrich; 고순도 등급, 60 Å 공극 크기, 230 내지 400 메쉬 입자 크기). 본 발명자들은 용출 분획(100% 헥산)을 GC/MS에서 분석하고 관심 대상의 화합물(AD)을 가진 분획을 풀링하였다. 일단 정제되면, 본 발명자들은 풀링된 분획을 약한 공기 스트림 하에 건조시키고, 농축된 테르페노이드를 DMSO에 재현탁하고, 최종 샘플을 아래에 요약된 바와 같이 정량하였다. 달리 명시되지 않는 한, 본 발명자들은 (DMSO 중의) 샘플이 GC/MS에 의해 >95% 순도를 가질 때까지 정제 공정을 반복하였다.
테르페노이드의 GC-MS 분석. 본 발명자들은 액체 배양에서 생성된 테르페노이드를 기체 크로마토그래피/질량 분광측정기(GC-MS; TG5-SilMS 컬럼 및 ISQ 7000 MS가 장착된 Trace 1310 GC; Thermo Fisher Scientific)로 측정하였다. 본 발명자들은 내부 표준물로서 20 ㎍/㎖의 카리오필렌을 가진 헥산(직접적으로 또는 DMSO의 1:100 희석을 통해)으로 모든 샘플들을 제조하였다. 농도가 MS 검출 한계 내에 있게 하기 위해 제조 전에 고농축 샘플을 10배 내지 20배 희석하였다. 내부 표준물의 피크 면적이 그 표준물을 함유하는 모든 샘플의 평균 면적의 ±40%를 초과할 때, 본 발명자들은 상응하는 샘플을 재분석하였다. 모든 실행을 위해, 본 발명자들은 하기 GC 방법을 이용하였다: 80℃에서 유지(3분), 250℃까지 증가(15℃/분), 250℃에서 유지(6분), 280℃까지 증가(30℃/분), 및 280℃에서 유지(3분). 다양한 피분석물들을 식별하기 위해, 본 발명자들은 m/z 비를 50부터 550까지 스캐닝하였다.
본 발명자들은 분자 이온(m/z=204)에 대해 스캐닝하기 위해 선택 이온 모드(SIM)를 이용하여 ADS의 변이체에 의해 생성된 세스퀴테르펜을 조사하였다. 정량을 위해, 본 발명자들은 방정식 1을 이용하였다:
Figure pct00007
상기 식에서, Ai는 피분석물 i에 의해 생성된 피크의 면적이고, Astd는 샘플에서 카리오필렌의 Cstd에 의해 생성된 피크의 면적이고, R은 기준 샘플에서 카리오필렌 및 AD에 대한 반응 계수의 비이다. 표 11은 이 분석에 사용된 모든 표준물들 및 기준 화합물들의 농도를 제공한다.
본 발명자들은 여러 변형과 함께 본 발명자들의 일반적인 절차를 이용하여 디테르페노이드를 다시 한 번 정량하였다: 본 발명자들은 상이한 분자 이온(m/z=272) 및 디테르페노이드와 카리오필렌 둘 다에 공통된 이온(m/z=93)에 대해 스캐닝하였고; 본 발명자들은 m/z=93에서 순수한 탁사디엔(필 바란의 친절한 선물) 및 카리오필렌에 대한 반응 계수의 비를 사용하였고; 본 발명자들은 피크 면적 m/z=93을 계산하였다. 모든 분석을 위해, 본 발명자들은 m/z=272에서 모든 피크의 총 면적의 1%를 초과하는 면적을 가진 피크만을 조사하였다.
본 발명자들은 NIST MS 라이브러리를 사용하여 분자를 식별하였고, 필요한 경우 문헌에 보고된 분석 표준물 또는 질량 스펙트럼을 사용하여 이 식별을 확인하였다. 참고: 상이한 테르페노이드에 대한 일정 반응 계수의 가정(즉, 모든 세스퀴테르펜 및 디테르펜이 각각 AD 및 탁사디엔처럼 이온화한다는 가정)은 이들의 농도 추정치에 있어서 분명히 오류를 유발할 수 있고; 미생물 시스템에서의 테르페노이드 생성의 다른 연구74,75의 분석과 일치하는 본 발명자들의 분석은 AD 및 탁사디엔(분석 표준물을 가짐)을 제외한 모든 화합물들에 대한 대략적인 농도 추정치를 제공한다.
생물정보학. 본 발명자들은 생물정보학적 분석을 이용하여 계통발생학적으로 다양한 세트의 테르펜 합성효소를 식별하였다. 요약하건대, 본 발명자들은 (i) PFAM 데이터베이스로부터 PF03936의 모든 구성 유전자들(C-말단 도메인에 의해 분류된 가장 큰 테르펜 합성효소 계열)을 다운로딩하였고 (ii) Uniprot 데이터베이스로부터 효소 협회(Enzyme Commission)(EC) 번호가 4.2.3.#인 모든 효소들을 다운로딩하였고; 포스페이트에 작용하는 탄소 산소 분해효소를 정의하는 이 문자열은 테르펜 합성효소를 포함한다. 본 발명자들은 엑셀로 두 데이터세트를 정리하였고(즉, 본 발명자들은 모든 식별자가 하나의 행만을 갖게 하였음), 본 발명자들은 사용자지정 R 스크립트를 사용하여 각각의 PF03936 구성원을 특징규명된 것(즉, Uniprot 기반 EC 번호 보유) 또는 특징규명되지 않은 것으로서 지정하였다. 마지막으로, 본 발명자들은 디폴트 설정으로 FastTree76를 사용하여 PF03936 계열의 계통발생적 트리를 생성하고 R-팩키지 ggtree77를 사용하여 생성된 트리 및 함수 데이터를 계통도 및 히트맵으로서 시각화하였다.
손으로 계통도에 주석을 달은 후, 본 발명자들은 6개의 계통군 각각으로부터 3개의 유전자를 선택하였다: 특징규명된 유전자를 갖지 않은 6개 및 일부 특징규명된 유전자를 가진 2개. 본 발명자들은 본 발명자들의 시스템에 없는 GGPP 이성질체(예를 들어, 엔트-코팔릴 디포스페이트)에 작용하는 것으로 알려진 공지된 모노테르펜 합성효소 또는 디테르펜 합성효소에 근접한 계통군을 피하였고; 이 효소들은 pMBISCmR의 주 생성물인 FPP에 작용하지 않을 것이다. 계통군 내에서 효소를 선택할 때, 본 발명자들은 본 발명자들의 선택을 세균/진균 종 쪽으로 편향시켰고 계통군 내에서 최소 수의 공통 조상을 가진 유전자를 선택하였다. 선택된 유전자는 트위스트 바이오사이언시스(Twist Biosciences)에 의해 합성되고 pTrc99a 벡터 내로 클로닝되었고, 전술된 바와 같이 항생제 내성에 대해 어세이되었다.
효소 동역학. 테르페노이드 매개 억제를 조사하기 위해, 본 발명자들은 다양한 농도의 테르페노이드의 존재 하에 p-니트로페닐 포스페이트(pNPP) 또는 4-메틸움벨리페릴 포스페이트(4-MUP, pNPP에 대한 K M 이 클 때 사용됨)의 PTP 촉진 가수분해를 측정하였다. 각각의 반응은 PTP(50 mM HEPES 중의 0.05 μM PTP1B/TCPTP 또는 0.1 μM SHP1/SHP2, 0.5 mM TCEP, 50 ㎍/㎖ BSA), pNPP(0.33, 0.67, 2, 5, 10 및 15 mM) 또는 4-MUP(0.13, 0.27, 0.8, 2.27, 2.93, 4.53, 7.07 및 8 mM), 억제제(도면에 나열된 농도를 가짐), 완충제(50 mM HEPES pH=7.3, 50 ㎍/㎖ BSA) 및 10% v/v의 DMSO를 포함하였다. 본 발명자들은 스펙트라맥스 M2 플레이트 판독기에서 5분 동안 10초마다 405 nm에서 흡광도를 측정함으로써 p-니트로페놀의 형성을 모니터링하였고 450 nm에서 형광도를 측정함으로써 4-메틸움벨리페릴의 형성을 모니터링하였다(370 nm ex, 435 nm 컷오프, 중간 획득).
본 발명자들은 사용자지정 MATLAB 스크립트를 사용하여 모든 원시 동역학 데이터를 처리하였다. 이 스크립트는 (i) 본 발명자들의 표준 곡선의 범위(흡광도/형광도 대 μM, 도 39) 또는 (ii) 초기 속도 영역(어세이에 사용된 pNPP 또는 4-MUP의 >10%)을 벗어나는 모든 농도 값을 제거하였다. 이 단계가 동역학 데이터세트를 10점 미만으로 감소시켰을 때, 본 발명자들은 그 데이터세트를 재측정하여 적어도 10점을 수집하였다. 이어서, 본 발명자들은 선형 회귀 모델(Matlab의 백슬래시(backslash) 연산자를 사용함)로 최종 데이터세트를 피팅하였다.
본 발명자들은 동역학 모델을 3개의 단계로 평가하였다: (i) 본 발명자들은 억제제의 부재 및 존재 하에 수집된 초기 속도 측정치를 각각 미카엘리스-멘텐 및 억제 모델에 피팅하였다(여기서, 본 발명자들은 MATLAB로부터의 nlinfitfminsearch 함수를 사용하였음; 표 12). (ii) 본 발명자들은 F-검정을 이용하여 혼합 모델과 단일 파라미터 모델을 최소 합 제곱 오차로 비교하였고(여기서, 본 발명자들은 MATLAB로부터의 fcdf 함수를 사용하여 p-값을 할당하였음), 본 발명자들은 p < 0.05일 때 혼합 모델을 허용하였다. (iii) 본 발명자들은 아카이케의 정보 기준(AIC)을 이용하여 최적 단일 파라미터 모델을 각각의 대안적 단일 파라미터 모델과 비교하였고, 본 발명자들은 AIC의 차이(Δi)가 모든 비교에 대해 5를 초과할 때 "최적" 모델을 허용하였다78. 참고: AD, AB 및 (+)1-(10),4-카디나디엔의 경우, 이 기준이 충족되지 않았으나; 비경쟁적 모델 및 무경쟁적 모델 둘 다가 구별 불가능한 IC50을 제공하였다.
본 발명자들은 최적 동역학 모델을 사용하여 15 mM pNPP의 PTP 촉진 가수분해의 초기 속도를 50%까지 감소시키는 데 요구된 억제제의 농도를 측정함으로써 억제제의 절반 최대 억제 농도(IC50)를 추정하였다. 본 발명자들은 MATLAB 함수 "nlparci"를 이용하여 동역학 파라미터의 신뢰 구간을 확인하였고, 본 발명자들은 이 구간을 누적하여 각각의 IC50에 대한 상응하는 신뢰 구간을 추정하였다.
X-선 결정학. 본 발명자들은 현적 증기 확산(hanging drop vapor diffusion)을 이용하여 PTP1B의 결정을 제조하였다. 요약하건대, 본 발명자들은 2 ㎕의 PTP1B(약 600 μM PTP1B, 50 mM HEPES, pH 7.3)를 6 ㎕의 결정화 용액(100 mM HEPES, 200 mM 아세트산마그네슘 및 14% 폴리에틸렌 글리콜 8000, pH 7.5)에 첨가하고, 생성된 액적을 4℃에서 일주일 동안 결정화 용액 상에서 인큐베이션하였다(EasyXtal CrystalSupport, Qiagen). 본 발명자들은 결정을, 6 ㎕의 결정화 용액 및 1 ㎕의 리간드 용액(DMSO 중의 10 mM)에 의해 형성된 액적으로 옮김으로써 결정을 리간드로 침지시켰고 4℃에서 2일 내지 5일 동안 인큐베이션하였다. 본 발명자들은 모든 리간드들을 완충제(100 mM HEPES, 200 mM 아세트산마그네슘 및 25% 폴리에틸렌 글리콜 8000, pH 7.5)와 글리세롤의 70/30(v/v) 혼합물로부터 형성된 냉동보호제에 침지시켜 냉동하기 위해 모든 리간드들을 준비하였다.
본 발명자들은 로렌스 버클리 국립 연구소(Lawrence Berkeley National Lab)에서 공동 결정학 프로그램을 통해 X-선 회절 데이터를 수집하였다(ALS ENABLE, 빔라인 8.2.1, 100K, 1.00003 Å). 본 발명자들은 xia2 소프트웨어 팩키지79를 사용하여 X-선 회절 데이터의 통합, 스케일링 및 병합을 수행하였고, 본 발명자들은 COOT81 및 한 라운드의 PDB-REDO82(후자는 PTP1B-AD 복합체의 경우에만)에서 수동 모델 조정으로 보충된 PHENIX 그래픽 인터페이스80를 이용하여 분자 교체 및 구조 개선을 수행하였다.
분자 역학(MD) 시뮬레이션. 전체 길이 PTP1B는 α7 나선(즉, 299 내지 435)을 넘어 걸쳐 있는 무질서한 영역을 함유한다. 이 연구에서, 본 발명자들은 무질서한 영역으로부터의 잔기를 포함하는 잘 연구된 절단 변이체(즉, PTP1B1-321)를 사용하였다. PTP1B를 모델링하기 위해, 본 발명자들은 CAMPARI v.283를 사용하여 무질서한 꼬리를 갖지 않는 결정 구조로부터 각각의 복합체의 무질서한 영역(즉, PTP1B-AD의 경우 잔기 288 내지 321)의 구조를 생성하였다. 꼬리 구조를 신속하게 열화하기 위해, 본 발명자들은 ABSINTH 내재적 용매 힘 필드(implicit-solvent force field)84,85를 사용하여 짧은 몬테 카를로(Monte Carlo)(MC) 시뮬레이션을 실행하여, 리간드 및 단백질 코어에서 원자의 좌표를 고정하였다.
본 발명자들은 GROMACS 202086을 사용하여 MD 시뮬레이션을 수행하였다. 요약하건대, 본 발명자들은 CHARMM36m 단백질 힘 필드87, CHARMM 변형된 TIP3P 물 모델88, 및 CGenFF89,90에 의해 생성된 리간드 파라미터를 사용하였다. 본 발명자들은 복합체의 표면으로부터 ≥ 10 Å에 위치된 모서리를 가진 12면체 상자 내에서 각각의 PTP1B-리간드 복합체(상응하는 결정 구조로부터 초기화됨)를 용매화하였고, 본 발명자들은 6개의 나트륨 이온을 첨가하여 각각의 시스템을 중화하였다. 본 발명자들은 LINCS 알고리즘91을 사용하여 수소 원자를 수반하는 모든 결합을 제한하고, Verlet 도약 알고리즘을 사용하여 2-fs 시간 단계로 운동 방정식을 수치적으로 통합하고, 입자-메쉬 Ewald 합산92(격자 간격이 0.16 nm인 3차 보간)을 사용하여 긴 범위 정전기 상호작용을 계산하였고; 이어서, 본 발명자들은 짧은 범위 정전기적 상호작용 및 레나르드-존스(Lennard-Jones) 상호작용을 위해 1.2 nm의 컷오프를 사용하였다. 본 발명자들은 이완 시간이 0.1 ps인 변형된 베렌드센(Berendsen) 온도조절기93를 이용하여 단백질-리간드 복합체 및 용매 분자를 온도 배쓰(300K)에 독립적으로 커플링시켰고, 본 발명자들은 이완 시간이 2 ps이고 등온 압축률이 4.5 X 10-5 bar-1인 파리넬로-라만(Parrinello-Rahman) 알고리즘94을 사용하여 압력 커플링을 1 bar에 고정시켰다.
각각의 시스템에 대해, 본 발명자들은 30회의 독립적인 MD 시뮬레이션을 수행하여 샘플링 편향을 감소시켰다. 각각의 MD 궤적에 대해, 본 발명자들은 급속 하강 방법에 이어 NVT 앙상블에서의 100 ps 용매 이완 및 NPT 앙상블에서의 100 ps 용매 이완을 이용하여 에너지를 최소화하였다. 추가 5 ns NPT 평형화 후, 본 발명자들은 NPT 앙상블에서 5 ns 동안 생성 실행을 수행하고 10 ps마다 좌표 데이터를 등록하였다.
HEK293T 세포에서 PTP1B 억제의 분석. 본 발명자들은 10% FBS, 100 유닛/㎖ 페니실린 및 100 유닛/㎖ 스트렙토마이신으로 보충된 DMEM 배지를 가진 75 cm2 배양 플라스크(Corning)에서 HEK293T/17 세포를 생장시킴으로써 효소 결합 면역흡착 어세이(ELISA)용 HEK293T/17 세포를 준비하였다. 본 발명자들은 세포가 80% 내지 100% 전면생장률(confluency)에 도달할 때까지 3일 내지 5일 동안 매일 배지를 교체하였다.
본 발명자들은 IR 특이적 ELISA를 이용하여 인슐린 수용체(IR) 인산화에 대한 억제제의 영향을 측정하였다(도 35). 요약하건대, 본 발명자들은 FBS 무함유 배지에서 48시간 동안 세포를 굶기고 10분 동안 억제제(모두 3% DMSO에서)와 함께 인큐베이션하였다. 인큐베이션 후, 본 발명자들은 1X 정지 포스파타제 억제제 칵테일 및 1X 정지 프로테아제 억제제 칵테일(Thermo Fisher Scientific)로 보충된 용해 완충제(9803, Cell Signaling Technology)로 10분 동안 세포를 용해시키고, 세포 파편을 펠렛화하고, 용해 완충제를 사용하여 각각의 샘플을 60 mg/㎖ 총 단백질까지 희석하였다. 본 발명자들은 PathScan® 인-인슐린 수용체 β(panTyr) 샌드위치 ELISA 키트(Cell Signaling Technology, #7082)를 사용하여 60 mg/㎖ 샘플의 후속 희석액에서 IR 인산화를 측정하였다. 참고: AB 및 AD의 생물학적 활성 농도를 확인하기 위해, 본 발명자들은 여러 농도를 스크리닝하고 가장 높은 신호를 제공하는 농도를 선택하였고(AB의 경우 405 μM 및 AD의 경우 930 μM); 유사한 농도의 약한 억제제는 검출 가능한 신호를 제공하지 않았다(도 35B 및 35C).
통계적 분석 및 재현 가능성. 본 발명자들은 양측 스튜던트 t-검정(표 14의 세부사항)으로 통계적 유의도(도 23H)를 측정하였고, 본 발명자들은 F-검정을 이용하여 억제의 1 파라미터 모델과 2 파라미터 모델을 비교하였다(표 12).
실시예 2에 대한 참고자료
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
[표 1]
Figure pct00015
[표 2]
Figure pct00016
Figure pct00017
Figure pct00018
[표 3]
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
[표 4]
Figure pct00024
Figure pct00025
[표 5]
Figure pct00026
[표 6]
Figure pct00027
Figure pct00028
[표 7]
Figure pct00029
Figure pct00030
[표 8]
Figure pct00031
Figure pct00032
Figure pct00033
[표 9]
Figure pct00034
[표 10]
Figure pct00035
[표 11a
Figure pct00036
[표 11b]
Figure pct00037
[표 11c]
Figure pct00038
[표 12a]
Figure pct00039
[표 12b]
Figure pct00040
[표 12c]
Figure pct00041
[표 12d]
Figure pct00042
[표 12e]
Figure pct00043
[표 12f]
Figure pct00044
[표 12g]
Figure pct00045
[표 12h]
Figure pct00046
[표 12i]
Figure pct00047
[표 12j]
Figure pct00048
[표 12k]
Figure pct00049
[표 12l]
Figure pct00050
[표 13]
Figure pct00051
[표 14]
Figure pct00052
[표 15]
Figure pct00053
다른 실시양태
본 명세서에 개시된 모든 특징은 임의의 조합으로 조합될 수 있다. 본 명세서에 개시된 각각의 특징은 동일하거나 동등하거나 유사한 목적을 제공하는 대안적 특징으로 대체될 수 있다. 따라서, 달리 명시적으로 언급되지 않는 한, 개시된 각각의 특징은 일반적인 일련의 동등하거나 유사한 특징의 일례일 뿐이다.
상기 설명으로부터, 당분야에서 숙련된 자는 본 개시내용의 본질적인 특성을 용이하게 확인할 수 있고, 그의 사상 및 범위를 벗어나지 않으면서 본 개시내용의 다양한 변화 및 변형을 만들어 이를 다양한 용도 및 조건에 적응시킬 수 있다. 따라서, 다른 실시양태도 청구범위 내에 있다.
등가물 및 범위
몇몇 발명적 실시양태가 본원에 기재되고 예시되어 있지만, 당분야에서 통상의 기술을 가진 자는 기능을 수행하고/하거나 결과 및/또는 본원에 기재된 이점들 중 하나 이상을 얻기 위해 다양한 다른 수단 및/또는 구조를 용이하게 생각할 것이고, 각각의 이러한 변경 및/또는 변형은 본원에 기재된 발명적 실시양태의 범위 내에 있는 것으로 간주된다. 보다 일반적으로, 당분야에서 숙련된 자는 본원에 기재된 모든 파라미터, 치수, 재료 및 구성이 예시하기 위한 것이고 실제 파라미터, 치수, 재료 및/또는 구성이 발명적 교시를 이용하는 특정 적용 또는 적용들에 의해 좌우될 것임을 용이하게 인식할 것이다. 당분야에서 숙련된 자는 관용적인 실험만을 이용하여 본원에 기재된 특정 발명적 실시양태의 많은 등가물들을 인식할 것이거나 확인할 수 있을 것이다. 따라서, 상기 실시양태는 단지 예로서 제시되고 첨부된 청구범위 및 이의 등가물의 범위 내에서 발명적 실시양태를 구체적으로 기재되고 청구된 방식과 다른 방식으로 실시할 수 있음을 이해해야 한다. 본 개시내용의 발명적 실시양태는 본원에 기재된 각각의 개별 특징, 시스템, 제품, 재료, 키트 및/또는 방법에 관한 것이다. 또한, 이러한 특징, 시스템, 제품, 재료, 키트 및/또는 방법이 서로 일치하지 않는 경우, 2개 이상의 이러한 특징, 시스템, 제품, 재료, 키트 및/또는 방법의 임의의 조합은 본 개시내용의 발명적 범위 내에 포함된다.
본원에서 정의되고 사용된 모든 정의는 사전적 정의, 참고로 포함된 문헌에서의 정의, 및/또는 정의된 용어의 통상적인 의미보다 우선하는 것으로 이해되어야 한다.
본원에 개시된 모든 참고자료, 특허 및 특허 출원은 일부 경우 문헌 전체를 포괄할 수 있는, 각각이 인용된 보호대상과 관련하여 참고로 포함된다.
명확히 반대로 표시되지 않은 한, 본원의 명세서 및 청구범위에서 사용된 단수형 용어는 "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본원의 명세서 및 청구범위에서 사용된 어구 "및/또는"은 연합된 요소들 중 "어느 하나 또는 둘 다", 즉 일부 경우 공동으로 존재하고 다른 경우 따로 존재하는 요소를 의미하는 것으로 이해되어야 한다. "및/또는"으로 나열된 다수의 요소들은 동일한 방식으로, 즉 연합된 요소들 중 "하나 이상"으로 해석되어야 한다. 구체적으로 확인된 요소와 관련되어 있든 아니면 관련되어 있지 않든, "및/또는" 절에 의해 구체적으로 확인된 요소 이외의 다른 요소가 임의로 존재할 수 있다. 따라서, 비제한적 예로서, "포함하는"과 같은 개방형 언어와 함께 사용될 때 "A 및/또는 B"의 언급은 한 실시양태에서 A만을 언급할 수 있고(임의로 B 이외의 요소를 포함함); 또 다른 실시양태에서 B만을 언급할 수 있고(임의로 A 이외의 요소를 포함함); 또 다른 실시양태에서 A 및 B 둘 다(임의로 다른 요소를 포함함)를 언급할 수 있다.
본원의 명세서 및 청구범위에서 사용된 바와 같이, 하나 이상의 요소의 목록의 언급에서 어구 "적어도 하나"는 요소 목록의 요소들 중 어느 하나 이상의 요소로부터 선택된 적어도 하나의 요소를 의미하는 것으로 이해되어야 하나, 요소 목록 내에 구체적으로 나열된 각각의 모든 요소 중 적어도 하나를 반드시 포함하지는 않고 요소 목록의 요소들의 임의의 조합을 배제하지 않는다. 이 정의는 또한 어구 "적어도 하나"가 언급하는 요소의 목록 내에서 구체적으로 확인된 요소와 관련되어 있든 아니면 관련되어 있지 않든, 상기 구체적으로 확인된 요소 이외의 요소가 임의로 존재할 수 있음을 허용한다. 따라서, 비제한적 예로서, "A 및 B 중 적어도 하나"(또는 동등하게 "A 또는 B 중 적어도 하나" 또는 동등하게 "A 및/또는 B 중 적어도 하나")는 한 실시양태에서 B가 존재하지 않는 (그리고 임의로 B 이외의 요소를 포함하는), 임의로 하나 초과를 포함하는 적어도 하나의 A를 지칭할 수 있고; 또 다른 실시양태에서 A가 존재하지 않는(그리고 임의로 A 이외의 요소를 포함하는), 임의로 하나 초과를 포함하는 적어도 하나의 B를 지칭할 수 있고; 또 다른 실시양태에서 임의로 하나 초과를 포함하는 적어도 하나의 A, 및 임의로 하나 초과를 포함하는 적어도 하나의 B(그리고 임의로 다른 요소를 포함함)를 지칭할 수 있다.
명확히 반대로 표시되어 있지 않은 한, 하나 초과의 단계 또는 행위를 포함하는 본원에 청구된 임의의 방법에서, 방법의 단계 또는 행위의 순서는 반드시 방법의 단계 또는 행위가 언급되는 순서로 제한되지 않는다는 것도 이해해야 한다.
청구범위 및 상기 명세서에서, "포함하는", "비롯한", "운반하는", "가진", "함유하는", "수반하는", "보유하는", "구성된" 등과 같은 모든 전환 어구는 개방형, 즉 포함하나 제한되지 않음을 의미하는 것으로 이해되어야 한다. 미국 특허청 특허 심사 절차 매뉴얼, 단락 2111.03에 기재된 바와 같이, "로 구성된" 및 "본질적으로 구성된"이라는 전환 어구만이 폐쇄형 또는 반폐쇄형 전환 어구일 것이다.
SEQUENCE LISTING <110> The Regents of the University of Colorado, a Body Corporate <120> DISCOVERY AND EVOLUTION OF BIOLOGICALLY ACTIVE METABOLITES <130> C1102.70039WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 62/958,368 <151> 2020-01-08 <160> 141 <170> PatentIn version 3.5 <210> 1 <211> 10 <212> PRT <213> Homo sapiens <400> 1 Glu Pro Gln Tyr Glu Glu Ile Pro Tyr Leu 1 5 10 <210> 2 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 2 Glu Pro Gln Phe Glu Glu Ile Pro Tyr Leu 1 5 10 <210> 3 <211> 867 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 atgggctcca agccgcagac tcagggcctg gccaaggatg cctgggagat ccctcgggag 60 tcgctgcggc tggaggtcaa gctgggccag ggctgctttg gcgaggtgtg gatggggacc 120 tggaacggta ccaccagggt ggccatcaaa accctgaagc ctggcacgat gtctccagag 180 gccttcctgc aggaggccca ggtcatgaag aagctgaggc atgagaagct ggtgcagttg 240 tatgctgtgg tttcagagga gcccatttac atcgtcacgg agtacatgag caaggggagt 300 ttgctggact ttctcaaggg ggagacaggc aagtacctgc ggctgcctca gctggtggac 360 atggctgctc agatcgcctc aggcatggcg tacgtggagc ggatgaacta cgtccaccgg 420 gaccttcgtg cagccaacat cctggtggga gagaacctgg tgtgcaaagt ggccgacttt 480 gggctggctc ggctcattga agacaatgag tacacggcgc ggcaaggtgc caaattcccc 540 atcaagtgga cggctccaga agctgccctc tatggccgct tcaccatcaa gtcggacgtg 600 tggtccttcg ggatcctgct gactgagctc accacaaagg gacgggtgcc ctaccctggg 660 atggtgaacc gcgaggtgct ggaccaggtg gagcggggct accggatgcc ctgcccgccg 720 gagtgtcccg agtccctgca cgacctcatg tgccagtgct ggcggaagga gcctgaggag 780 cggcccacct tcgagtacct gcaggccttc ctggaggact acttcacgtc caccgagccc 840 cagtaccagc ccggggagaa cctctaa 867 <210> 4 <211> 1137 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 atggtggact acagcgtgtg ggaccacatt gaggtgtctg atgatgaaga cgagacgcac 60 cccaacatcg acacggccag tctcttccgc tggcggcatc aggcccgggt ggaacgcatg 120 gagcagttcc agaaggagaa ggaggaactg gacaggggct gccgcgagtg caagcgcaag 180 gtggccgagt gccagaggaa actgaaggag ctggaggtgg ccgagggcgg caaggcagag 240 ctggagcgcc tgcaggccga ggcacagcag ctgcgcaagg aggagcggag ctgggagcag 300 aagctggagg agatgcgcaa gaaggagaag agcatgccct ggaacgtgga cacgctcagc 360 aaagacggct tcagcaagag catggtaaat accaagcccg agaagacgga ggaggactca 420 gaggaggtga gggagcagaa acacaagacc ttcgtggaaa aatacgagaa acagatcaag 480 cactttggca tgcttcgccg ctgggatgac agccaaaagt acctgtcaga caacgtccac 540 ctggtgtgcg aggagacagc caattacctg gtcatttggt gcattgacct agaggtggag 600 gagaaatgtg cactcatgga gcaggtggcc caccagacaa tcgtcatgca atttatcctg 660 gagctggcca agagcctaaa ggtggacccc cgggcctgct tccggcagtt cttcactaag 720 attaagacag ccgatcgcca gtacatggag ggcttcaacg acgagctgga agccttcaag 780 gagcgtgtgc ggggccgtgc caagctgcgc atcgagaagg ccatgaagga gtacgaggag 840 gaggagcgca agaagcggct cggccccggc ggcctggacc ccgtcgaggt ctacgagtcc 900 ctccctgagg aactccagaa gtgcttcgat gtgaaggacg tgcagatgct gcaggacgcc 960 atcagcaaga tggaccccac cgacgcaaag taccacatgc agcgctgcat tgactctggc 1020 ctctgggtcc ccaactctaa ggccagcgag gccaaggagg gagaggaggc aggtcctggg 1080 gacccattac tggaagctgt tcccaagacg ggcgatgaga aggatgtcag tgtgtaa 1137 <210> 5 <211> 966 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 atggagatgg aaaaggagtt cgagcagatc gacaagtccg ggagctgggc ggccatttac 60 caggatatcc gacatgaagc cagtgacttc ccatgtagag tggccaagct tcctaagaac 120 aaaaaccgaa ataggtacag agacgtcagt ccctttgacc atagtcggat taaactacat 180 caagaagata atgactatat caacgctagt ttgataaaaa tggaagaagc ccaaaggagt 240 tacattctta cccagggccc tttgcctaac acatgcggtc acttttggga gatggtgtgg 300 gagcagaaaa gcaggggtgt cgtcatgctc aacagagtga tggagaaagg ttcgttaaaa 360 tgcgcacaat actggccaca aaaagaagaa aaagagatga tctttgaaga cacaaatttg 420 aaattaacat tgatctctga agatatcaag tcatattata cagtgcgaca gctagaattg 480 gaaaacctta caacccaaga aactcgagag atcttacatt tccactatac cacatggcct 540 gactttggag tccctgaatc accagcctca ttcttgaact ttcttttcaa agtccgagag 600 tcagggtcac tcagcccgga gcacgggccc gttgtggtgc actgcagtgc aggcatcggc 660 aggtctggaa ccttctgtct ggctgatacc tgcctcttgc tgatggacaa gaggaaagac 720 ccttcttccg ttgatatcaa gaaagtgctg ttagaaatga ggaagtttcg gatggggctg 780 atccagacag ccgaccagct gcgcttctcc tacctggctg tgatcgaagg tgccaaattc 840 atcatggggg actcttccgt gcaggatcag tggaaggagc tttcccacga ggacctggag 900 cccccacccg agcatatccc cccacctccc cggccaccca aacgaatcct ggagccacac 960 aattga 966 <210> 6 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 tggatggagg actatgacta cgtccaccta cagggg 36 <210> 7 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 gaaccgcagt atgaagaaat tccgatttat ctg 33 <210> 8 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 gatcatcagt attataacga ttttccgggc 30 <210> 9 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 ccgcagcgct atctggtgat tcagggcgat 30 <210> 10 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 tggatggagg actttgactt cgtccaccta cagggg 36 <210> 11 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 gaaccgcagt ttgaagaaat tccgatttat ctg 33 <210> 12 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 agaaaccaat tgtccatatt gcatcagaca ttgccgtcac tgcgtctttt actggctctt 60 ctcgctaacc aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa 120 agccatgaca aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga 180 ttatttgcac ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcg 238 <210> 13 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 ttctagagca cagctaacac cacgtcgtcc ctatctgctg ccctaggtct atgagtggtt 60 gctggataac tttacgggca tgcataaggc tcggtatcta tattcaggga gaccacaacg 120 gtttccctct acaaataatt ttgtttaact tttactagag 160 <210> 14 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 cattaggcac cccgggcttt actcgtaaag cttccggcgc gtatgttgtg tcgaccg 57 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 gtgcagttaa agaggagaaa ggtc 24 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 cgaaaaaaag taaggcggta atcc 24 <210> 17 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 tctagagatt aaagaggaga aatactag 28 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 tctagaaaag aggagaaata ctag 24 <210> 19 <211> 2124 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 atgaaatttg gaaacttttt gcttacatac caacctcccc aattttccca aacagaggta 60 atgaaacgtt tggttaaatt aggtcgcatc tctgaggagt gtggttttga taccgtatgg 120 ttactggagc atcatttcac ggagtttggt ttgcttggta acccttatgt cgctgctgca 180 tatttacttg gcgcgactaa aaaattgaat gtaggaactg ccgctattgt tcttcccaca 240 gcccatccag tacgccaact tgaagatgtg aatttattgg atcaaatgtc aaaaggacga 300 tttcggtttg gtatttgccg agggctttac aacaaggact ttcgcgtatt cggcacagat 360 atgaataaca gtcgcgcctt agcggaatgc tggtacgggc tgataaagaa tggcatgaca 420 gagggatata tggaagctga taatgaacat atcaagttcc ataaggtaaa agtaaacccc 480 gcggcgtata gcagaggtgg cgcaccggtt tatgtggtgg ctgaatcagc ttcgacgact 540 gagtgggctg ctcaatttgg cctaccgatg atattaagtt ggattataaa tactaacgaa 600 aagaaagcac aacttgagct ttataatgaa gtggctcaag aatatgggca cgatattcat 660 aatatcgacc attgcttatc atatataaca tctgtagatc atgactcaat taaagcgaaa 720 gagatttgcc ggaaatttct ggggcattgg tatgattctt atgtgaatgc tacgactatt 780 tttgatgatt cagaccaaac aagaggttat gatttcaata aagggcagtg gcgtgacttt 840 gtattaaaag gacataaaga tactaatcgc cgtattgatt acagttacga aatcaatccc 900 gtgggaacgc cgcaggaatg tattgacata attcaaaaag acattgatgc tacaggaata 960 tcaaatattt gttgtggatt tgaagctaat ggaacagtag acgaaattat tgcttccatg 1020 aagctcttcc agtctgatgt catgccattt cttaaagaaa aacaacgttc gctattatat 1080 tatggcggtg gcggtagcgg cggtggcggt agcggcggtg gcggtagcgg cggtggcggt 1140 agcaaatttg gattgttctt ccttaacttc atcaattcaa caactgttca agaacagagt 1200 atagttcgca tgcaggaaat aacggagtat gttgataagt tgaattttga acagatttta 1260 gtgtatgaaa atcatttttc agataatggt gttgtcggcg ctcctctgac tgtttctggt 1320 tttctgctcg gtttaacaga gaaaattaaa attggttcat taaatcacat cattacaact 1380 catcatcctg tccgcatagc ggaggaagct tgcttattgg atcagttaag tgaagggaga 1440 tttattttag ggtttagtga ttgcgaaaaa aaagatgaaa tgcatttttt taatcgcccg 1500 gttgaatatc aacagcaact atttgaagag tgttatgaaa tcattaacga tgctttaaca 1560 acaggctatt gtaatccaga taacgatttt tatagcttcc ctaaaatatc tgtaaatccc 1620 catgcttata cgccaggcgg acctcggaaa tatgtaacag caaccagtca tcatattgtt 1680 gagtgggcgg ccaaaaaagg tattcctctc atctttaagt gggatgattc taatgatgtt 1740 agatatgaat atgctgaaag atataaagcc gttgcggata aatatgacgt tgacctatca 1800 gagatagacc atcagttaat gatattagtt aactataacg aagatagtaa taaagctaaa 1860 caagagacgc gtgcatttat tagtgattat gttcttgaaa tgcaccctaa tgaaaatttc 1920 gaaaataaac ttgaagaaat aattgcagaa aacgctgtcg gaaattatac ggagtgtata 1980 actgcggcta agttggcaat tgaaaagtgt ggtgcgaaaa gtgtattgct gtcctttgaa 2040 ccaatgaatg atttgatgag ccaaaaaaat gtaatcaata ttgttgatga taatattaag 2100 aagtaccaca cggaatatac ctaa 2124 <210> 20 <211> 792 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 atgagggaag cggtgatcgc cgaagtatcg actcaactat cagaggtagt tggcgtcatc 60 gagcgccatc tcgaaccgac gttgctggcc gtacatttgt acggctccgc agtggatggc 120 ggcctgaagc cacacagtga tattgatttg ctggttacgg tgaccgtaag gcttgatgaa 180 acaacgcggc gagctttgat caacgacctt ttggaaactt cggcttcccc tggagagagc 240 gagattctcc gcgctgtaga agtcaccatt gttgtgcacg acgacatcat tccgtggcgt 300 tatccagcta agcgcgaact gcaatttgga gaatggcagc gcaatgacat tcttgcaggt 360 atcttcgagc cagccacgat cgacattgat ctggctatct tgctgacaaa agcaagagaa 420 catagcgttg ccttggtagg tccagcggcg gaggaactct ttgatccggt tcctgaacag 480 gatctatttg aggcgctaaa tgaaacctta acgctatgga actcgccgcc cgactgggct 540 ggcgatgagc gaaatgtagt gcttacgttg tcccgcattt ggtacagcgc agtaaccggc 600 aaaatcgcgc cgaaggatgt cgctgccgac tgggcaatgg agcgcctgcc ggcccagtat 660 cagcccgtca tacttgaagc tagacaggct tatcttggac aagaagaaga tcgcttggcc 720 tcgcgcgcag atcagttgga agaatttgtc cactacgtga aaggcgagat caccaaggta 780 gtcggcaaat ga 792 <210> 21 <211> 288 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 21 Met Gly Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp Ala Trp Glu 1 5 10 15 Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly Gln Gly Cys 20 25 30 Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr Arg Val Ala 35 40 45 Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala Phe Leu Gln 50 55 60 Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu Val Gln Leu 65 70 75 80 Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr Glu Tyr Met 85 90 95 Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr Gly Lys Tyr 100 105 110 Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile Ala Ser Gly 115 120 125 Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp Leu Arg Ala 130 135 140 Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val Ala Asp Phe 145 150 155 160 Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala Arg Gln Gly 165 170 175 Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala Leu Tyr Gly 180 185 190 Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile Leu Leu Thr 195 200 205 Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met Val Asn Arg 210 215 220 Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro Cys Pro Pro 225 230 235 240 Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys Trp Arg Lys 245 250 255 Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala Phe Leu Glu 260 265 270 Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly Glu Asn Leu 275 280 285 <210> 22 <211> 378 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 22 Met Val Asp Tyr Ser Val Trp Asp His Ile Glu Val Ser Asp Asp Glu 1 5 10 15 Asp Glu Thr His Pro Asn Ile Asp Thr Ala Ser Leu Phe Arg Trp Arg 20 25 30 His Gln Ala Arg Val Glu Arg Met Glu Gln Phe Gln Lys Glu Lys Glu 35 40 45 Glu Leu Asp Arg Gly Cys Arg Glu Cys Lys Arg Lys Val Ala Glu Cys 50 55 60 Gln Arg Lys Leu Lys Glu Leu Glu Val Ala Glu Gly Gly Lys Ala Glu 65 70 75 80 Leu Glu Arg Leu Gln Ala Glu Ala Gln Gln Leu Arg Lys Glu Glu Arg 85 90 95 Ser Trp Glu Gln Lys Leu Glu Glu Met Arg Lys Lys Glu Lys Ser Met 100 105 110 Pro Trp Asn Val Asp Thr Leu Ser Lys Asp Gly Phe Ser Lys Ser Met 115 120 125 Val Asn Thr Lys Pro Glu Lys Thr Glu Glu Asp Ser Glu Glu Val Arg 130 135 140 Glu Gln Lys His Lys Thr Phe Val Glu Lys Tyr Glu Lys Gln Ile Lys 145 150 155 160 His Phe Gly Met Leu Arg Arg Trp Asp Asp Ser Gln Lys Tyr Leu Ser 165 170 175 Asp Asn Val His Leu Val Cys Glu Glu Thr Ala Asn Tyr Leu Val Ile 180 185 190 Trp Cys Ile Asp Leu Glu Val Glu Glu Lys Cys Ala Leu Met Glu Gln 195 200 205 Val Ala His Gln Thr Ile Val Met Gln Phe Ile Leu Glu Leu Ala Lys 210 215 220 Ser Leu Lys Val Asp Pro Arg Ala Cys Phe Arg Gln Phe Phe Thr Lys 225 230 235 240 Ile Lys Thr Ala Asp Arg Gln Tyr Met Glu Gly Phe Asn Asp Glu Leu 245 250 255 Glu Ala Phe Lys Glu Arg Val Arg Gly Arg Ala Lys Leu Arg Ile Glu 260 265 270 Lys Ala Met Lys Glu Tyr Glu Glu Glu Glu Arg Lys Lys Arg Leu Gly 275 280 285 Pro Gly Gly Leu Asp Pro Val Glu Val Tyr Glu Ser Leu Pro Glu Glu 290 295 300 Leu Gln Lys Cys Phe Asp Val Lys Asp Val Gln Met Leu Gln Asp Ala 305 310 315 320 Ile Ser Lys Met Asp Pro Thr Asp Ala Lys Tyr His Met Gln Arg Cys 325 330 335 Ile Asp Ser Gly Leu Trp Val Pro Asn Ser Lys Ala Ser Glu Ala Lys 340 345 350 Glu Gly Glu Glu Ala Gly Pro Gly Asp Pro Leu Leu Glu Ala Val Pro 355 360 365 Lys Thr Gly Asp Glu Lys Asp Val Ser Val 370 375 <210> 23 <211> 321 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 23 Met Glu Met Glu Lys Glu Phe Glu Gln Ile Asp Lys Ser Gly Ser Trp 1 5 10 15 Ala Ala Ile Tyr Gln Asp Ile Arg His Glu Ala Ser Asp Phe Pro Cys 20 25 30 Arg Val Ala Lys Leu Pro Lys Asn Lys Asn Arg Asn Arg Tyr Arg Asp 35 40 45 Val Ser Pro Phe Asp His Ser Arg Ile Lys Leu His Gln Glu Asp Asn 50 55 60 Asp Tyr Ile Asn Ala Ser Leu Ile Lys Met Glu Glu Ala Gln Arg Ser 65 70 75 80 Tyr Ile Leu Thr Gln Gly Pro Leu Pro Asn Thr Cys Gly His Phe Trp 85 90 95 Glu Met Val Trp Glu Gln Lys Ser Arg Gly Val Val Met Leu Asn Arg 100 105 110 Val Met Glu Lys Gly Ser Leu Lys Cys Ala Gln Tyr Trp Pro Gln Lys 115 120 125 Glu Glu Lys Glu Met Ile Phe Glu Asp Thr Asn Leu Lys Leu Thr Leu 130 135 140 Ile Ser Glu Asp Ile Lys Ser Tyr Tyr Thr Val Arg Gln Leu Glu Leu 145 150 155 160 Glu Asn Leu Thr Thr Gln Glu Thr Arg Glu Ile Leu His Phe His Tyr 165 170 175 Thr Thr Trp Pro Asp Phe Gly Val Pro Glu Ser Pro Ala Ser Phe Leu 180 185 190 Asn Phe Leu Phe Lys Val Arg Glu Ser Gly Ser Leu Ser Pro Glu His 195 200 205 Gly Pro Val Val Val His Cys Ser Ala Gly Ile Gly Arg Ser Gly Thr 210 215 220 Phe Cys Leu Ala Asp Thr Cys Leu Leu Leu Met Asp Lys Arg Lys Asp 225 230 235 240 Pro Ser Ser Val Asp Ile Lys Lys Val Leu Leu Glu Met Arg Lys Phe 245 250 255 Arg Met Gly Leu Ile Gln Thr Ala Asp Gln Leu Arg Phe Ser Tyr Leu 260 265 270 Ala Val Ile Glu Gly Ala Lys Phe Ile Met Gly Asp Ser Ser Val Gln 275 280 285 Asp Gln Trp Lys Glu Leu Ser His Glu Asp Leu Glu Pro Pro Pro Glu 290 295 300 His Ile Pro Pro Pro Pro Arg Pro Pro Lys Arg Ile Leu Glu Pro His 305 310 315 320 Asn <210> 24 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 24 Trp Met Glu Asp Tyr Asp Tyr Val His Leu Gln Gly 1 5 10 <210> 25 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 25 Glu Pro Gln Tyr Glu Glu Ile Pro Ile Tyr Leu 1 5 10 <210> 26 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 26 Asp His Gln Tyr Tyr Asn Asp Phe Pro Gly 1 5 10 <210> 27 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 27 Pro Gln Arg Tyr Leu Val Ile Gln Gly Asp 1 5 10 <210> 28 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 28 Trp Met Glu Asp Phe Asp Phe Val His Leu Gln Gly 1 5 10 <210> 29 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 29 Glu Pro Gln Phe Glu Glu Ile Pro Ile Tyr Leu 1 5 10 <210> 30 <211> 707 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 30 Met Lys Phe Gly Asn Phe Leu Leu Thr Tyr Gln Pro Pro Gln Phe Ser 1 5 10 15 Gln Thr Glu Val Met Lys Arg Leu Val Lys Leu Gly Arg Ile Ser Glu 20 25 30 Glu Cys Gly Phe Asp Thr Val Trp Leu Leu Glu His His Phe Thr Glu 35 40 45 Phe Gly Leu Leu Gly Asn Pro Tyr Val Ala Ala Ala Tyr Leu Leu Gly 50 55 60 Ala Thr Lys Lys Leu Asn Val Gly Thr Ala Ala Ile Val Leu Pro Thr 65 70 75 80 Ala His Pro Val Arg Gln Leu Glu Asp Val Asn Leu Leu Asp Gln Met 85 90 95 Ser Lys Gly Arg Phe Arg Phe Gly Ile Cys Arg Gly Leu Tyr Asn Lys 100 105 110 Asp Phe Arg Val Phe Gly Thr Asp Met Asn Asn Ser Arg Ala Leu Ala 115 120 125 Glu Cys Trp Tyr Gly Leu Ile Lys Asn Gly Met Thr Glu Gly Tyr Met 130 135 140 Glu Ala Asp Asn Glu His Ile Lys Phe His Lys Val Lys Val Asn Pro 145 150 155 160 Ala Ala Tyr Ser Arg Gly Gly Ala Pro Val Tyr Val Val Ala Glu Ser 165 170 175 Ala Ser Thr Thr Glu Trp Ala Ala Gln Phe Gly Leu Pro Met Ile Leu 180 185 190 Ser Trp Ile Ile Asn Thr Asn Glu Lys Lys Ala Gln Leu Glu Leu Tyr 195 200 205 Asn Glu Val Ala Gln Glu Tyr Gly His Asp Ile His Asn Ile Asp His 210 215 220 Cys Leu Ser Tyr Ile Thr Ser Val Asp His Asp Ser Ile Lys Ala Lys 225 230 235 240 Glu Ile Cys Arg Lys Phe Leu Gly His Trp Tyr Asp Ser Tyr Val Asn 245 250 255 Ala Thr Thr Ile Phe Asp Asp Ser Asp Gln Thr Arg Gly Tyr Asp Phe 260 265 270 Asn Lys Gly Gln Trp Arg Asp Phe Val Leu Lys Gly His Lys Asp Thr 275 280 285 Asn Arg Arg Ile Asp Tyr Ser Tyr Glu Ile Asn Pro Val Gly Thr Pro 290 295 300 Gln Glu Cys Ile Asp Ile Ile Gln Lys Asp Ile Asp Ala Thr Gly Ile 305 310 315 320 Ser Asn Ile Cys Cys Gly Phe Glu Ala Asn Gly Thr Val Asp Glu Ile 325 330 335 Ile Ala Ser Met Lys Leu Phe Gln Ser Asp Val Met Pro Phe Leu Lys 340 345 350 Glu Lys Gln Arg Ser Leu Leu Tyr Tyr Gly Gly Gly Gly Ser Gly Gly 355 360 365 Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Lys Phe Gly 370 375 380 Leu Phe Phe Leu Asn Phe Ile Asn Ser Thr Thr Val Gln Glu Gln Ser 385 390 395 400 Ile Val Arg Met Gln Glu Ile Thr Glu Tyr Val Asp Lys Leu Asn Phe 405 410 415 Glu Gln Ile Leu Val Tyr Glu Asn His Phe Ser Asp Asn Gly Val Val 420 425 430 Gly Ala Pro Leu Thr Val Ser Gly Phe Leu Leu Gly Leu Thr Glu Lys 435 440 445 Ile Lys Ile Gly Ser Leu Asn His Ile Ile Thr Thr His His Pro Val 450 455 460 Arg Ile Ala Glu Glu Ala Cys Leu Leu Asp Gln Leu Ser Glu Gly Arg 465 470 475 480 Phe Ile Leu Gly Phe Ser Asp Cys Glu Lys Lys Asp Glu Met His Phe 485 490 495 Phe Asn Arg Pro Val Glu Tyr Gln Gln Gln Leu Phe Glu Glu Cys Tyr 500 505 510 Glu Ile Ile Asn Asp Ala Leu Thr Thr Gly Tyr Cys Asn Pro Asp Asn 515 520 525 Asp Phe Tyr Ser Phe Pro Lys Ile Ser Val Asn Pro His Ala Tyr Thr 530 535 540 Pro Gly Gly Pro Arg Lys Tyr Val Thr Ala Thr Ser His His Ile Val 545 550 555 560 Glu Trp Ala Ala Lys Lys Gly Ile Pro Leu Ile Phe Lys Trp Asp Asp 565 570 575 Ser Asn Asp Val Arg Tyr Glu Tyr Ala Glu Arg Tyr Lys Ala Val Ala 580 585 590 Asp Lys Tyr Asp Val Asp Leu Ser Glu Ile Asp His Gln Leu Met Ile 595 600 605 Leu Val Asn Tyr Asn Glu Asp Ser Asn Lys Ala Lys Gln Glu Thr Arg 610 615 620 Ala Phe Ile Ser Asp Tyr Val Leu Glu Met His Pro Asn Glu Asn Phe 625 630 635 640 Glu Asn Lys Leu Glu Glu Ile Ile Ala Glu Asn Ala Val Gly Asn Tyr 645 650 655 Thr Glu Cys Ile Thr Ala Ala Lys Leu Ala Ile Glu Lys Cys Gly Ala 660 665 670 Lys Ser Val Leu Leu Ser Phe Glu Pro Met Asn Asp Leu Met Ser Gln 675 680 685 Lys Asn Val Ile Asn Ile Val Asp Asp Asn Ile Lys Lys Tyr His Thr 690 695 700 Glu Tyr Thr 705 <210> 31 <211> 263 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 31 Met Arg Glu Ala Val Ile Ala Glu Val Ser Thr Gln Leu Ser Glu Val 1 5 10 15 Val Gly Val Ile Glu Arg His Leu Glu Pro Thr Leu Leu Ala Val His 20 25 30 Leu Tyr Gly Ser Ala Val Asp Gly Gly Leu Lys Pro His Ser Asp Ile 35 40 45 Asp Leu Leu Val Thr Val Thr Val Arg Leu Asp Glu Thr Thr Arg Arg 50 55 60 Ala Leu Ile Asn Asp Leu Leu Glu Thr Ser Ala Ser Pro Gly Glu Ser 65 70 75 80 Glu Ile Leu Arg Ala Val Glu Val Thr Ile Val Val His Asp Asp Ile 85 90 95 Ile Pro Trp Arg Tyr Pro Ala Lys Arg Glu Leu Gln Phe Gly Glu Trp 100 105 110 Gln Arg Asn Asp Ile Leu Ala Gly Ile Phe Glu Pro Ala Thr Ile Asp 115 120 125 Ile Asp Leu Ala Ile Leu Leu Thr Lys Ala Arg Glu His Ser Val Ala 130 135 140 Leu Val Gly Pro Ala Ala Glu Glu Leu Phe Asp Pro Val Pro Glu Gln 145 150 155 160 Asp Leu Phe Glu Ala Leu Asn Glu Thr Leu Thr Leu Trp Asn Ser Pro 165 170 175 Pro Asp Trp Ala Gly Asp Glu Arg Asn Val Val Leu Thr Leu Ser Arg 180 185 190 Ile Trp Tyr Ser Ala Val Thr Gly Lys Ile Ala Pro Lys Asp Val Ala 195 200 205 Ala Asp Trp Ala Met Glu Arg Leu Pro Ala Gln Tyr Gln Pro Val Ile 210 215 220 Leu Glu Ala Arg Gln Ala Tyr Leu Gly Gln Glu Glu Asp Arg Leu Ala 225 230 235 240 Ser Arg Ala Asp Gln Leu Glu Glu Phe Val His Tyr Val Lys Gly Glu 245 250 255 Ile Thr Lys Val Val Gly Lys 260 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 gtgcagtaag gaggaaaaaa 20 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 cagtcagtag ggccctaaaa 20 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 tagctaaagc aaccagagag 20 <210> 35 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 caattcccct ctagaaataa ttttg 25 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 cgctgtagag aaaattggta 20 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 gacgcggaat ggtactgggg 20 <210> 38 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 atatggtctc acatgtccaa gccgcagact cag 33 <210> 39 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 atatggtctc acatggcacg cgtaactgtt c 31 <210> 40 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 atatggtctc acatgagtat cagcagcagg gtaaaaag 38 <210> 41 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 atgactacgt ccacctacag gggtaataac aattcccctc tagaaataat tttgtttaac 60 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 tgagttatac acagggctgg 20 <210> 43 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 gtgcagtaag gaggaaaaaa aaatggc 27 <210> 44 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 taaaattcgt agactacaag gacgacgatg acaagtggta ttttgggaag atcactcgt 59 <210> 45 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 taataacaat tcccctctag aaataatttt gtttaacttt aag 43 <210> 46 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 gtcagtgtgt aagtgcagaa agaggagaaa tactagatgg agatggaaaa ggagttcgag 60 <210> 47 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 taatctagag aaagaggaga aatactagat gtccaagccg cagactc 47 <210> 48 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 ctctagtaaa agttaaacaa aattatttgt agaggg 36 <210> 49 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 aacttttact agaggaattc gagctcttaa agaggagaaa ggtcatgggc tccaagccgc 60 <210> 50 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 aacttttact agagcgaaaa aaagtaaggc ggtaatccat gggctccaag ccgc 54 <210> 51 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 agtgtgtaag tgcagattaa agaggagaaa tactagatgg agatggaaaa ggagttcgag 60 <210> 52 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 tcagtgtgta agtgcagtca cacaggaaag tactagatgg agatggaaaa ggagttcgag 60 <210> 53 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 gcgtacattg gctccgttca tttgccgact accttggtga tc 42 <210> 54 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 gtcaggggcg gggttttttt ttagggccct actgactgtt agcaggtgcg gtaattga 58 <210> 55 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 cacagttctc gtcatcagct ctctggttgc tttagctaat acaccataag cattttcc 58 <210> 56 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 cagttacgcg tgccattttt ttttcctcct tactgcactt agcgtttcgg cgccggat 58 <210> 57 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 gtcaggggcg gggttttttt ttagggccct actgactgtt acacactgac atccttctca 60 tcg 63 <210> 58 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 caggggcggg gttttttttt agggccctac tgactgttat tagccaagat ccatcttca 59 <210> 59 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 gttacgcgtg ccattttttt ttcctcctta ctgcacttat tacgaaaccg gatacaaca 59 <210> 60 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 atatggtctc atttacacac tgacatcctt ctcatcg 37 <210> 61 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 atatggtctc atttacccct gtaggtggac g 31 <210> 62 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 atatggtctc atttagcaga cgttggtcag gc 32 <210> 63 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 aagataaaaa gaatagatcc cagccctgtg tataactcac tactttagtc agttccgca 59 <210> 64 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 cccctgtagg tggacgtagt catagtcctc catccacgca gctgcacgac ga 52 <210> 65 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 gcccatggta tatctccttc ttaaagt 27 <210> 66 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 acagttacgc gtgccatttt tttttcctcc ttactgcact tagcagacgt tggtcaggc 59 <210> 67 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 gggaattgtt attagcccgg aaaatcgtta taatactgat gatccgcagc tgcacgacg 59 <210> 68 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 gggaattgtt attaatcgcc ctgaatcacc agatagcgct gcggcgcagc tgcacgacg 59 <210> 69 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 gaattgttat tacagataaa tcggaatttc ttcatactgc ggttccgcag ctgcacgacg 60 <210> 70 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 ctcatccgcc aaaacagcct caattgtgtg gctccaggat tcg 43 <210> 71 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 ttacacactg acatccttct catcg 25 <210> 72 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 ttctagagca cagctaacac cac 23 <210> 73 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 gaaccaatga atgatttgat gagc 24 <210> 74 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 gttttttttt agggccctac tgactgtcaa ttgtgtggct ccaggattc 49 <210> 75 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 gacctgcaga ttaaagagga gaaaatgagg gaagcggtga tcg 43 <210> 76 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 tattgagctc caccgcggag gaggaatg 28 <210> 77 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 tattggtctc ccatgagcag cagcactggc ac 32 <210> 78 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 ataaaggtct cccatggtga aacgagaatt tcctccag 38 <210> 79 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 agatcactac cgggcgtatt ttttgagtta tcgagatttt caggagctaa ggaagctaaa 60 atggagaaaa aaatcactgg atataccac 89 <210> 80 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 tattgtcgac ttatttatta cgctggatga tgtagtc 37 <210> 81 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 tattggtctc cgtccttcca acgcattcaa catgttg 37 <210> 82 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 tattaggtct cgagctctta ggcaactggt tggaagaggc 40 <210> 83 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 gccgccggct tccatttatt acgccccgcc ctg 33 <210> 84 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 gtccagtact ttattggggt tcaggcggat ggaactgagc atgtccgaga t 51 <210> 85 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 gagagagaat cctgttcctg atattgcgga tacagccatg ggccttc 47 <210> 86 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 acaaaaactt ccaatttcac tgttatttta gcggatcttt atgacgccca tgg 53 <210> 87 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 cgtaagcatc gtaagtgtcc gcgatcaggg tgataacagc 40 <210> 88 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 cccatgcgtg tcgtataagt ccgctaacat tgtcatcaag atcg 44 <210> 89 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, or t <400> 89 caatggcacc cccaacnnkg gtatgtgtgt acttaatctg atcccg 46 <210> 90 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (20)..(21) <223> n is a, c, g, or t <400> 90 caacaccggt atgtgtgtan nkaatctgat cccgttgctg cttatg 46 <210> 91 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, or t <400> 91 aaacgcttgg gaacgcnnkc tggaagcgta tttgcaggat g 41 <210> 92 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (17)..(18) <223> n is a, c, g, or t <400> 92 cttctggatg gccgcgnnka tttcagaacc agaatttagt ggctc 45 <210> 93 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (21)..(22) <223> n is a, c, g, or t <400> 93 accatctgat tgaactggct nnkcgactgg tcgatgatgc gag 43 <210> 94 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (14)..(15) <223> n is a, c, g, or t <400> 94 cgtcctggcg cggnnkattc agtttatgta taaccagggg gac 43 <210> 95 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (29)..(30) <223> n is a, c, g, or t <400> 95 caactgcggt aaagagtttg ttaaagaann kgtacgtaac ctgatggttg aagc 54 <210> 96 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (25)..(26) <223> n is a, c, g, or t <400> 96 catgacccgg ttgttatcat caccnnkggt gcaaacctgc tgaccac 47 <210> 97 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (18)..(19) <223> n is a, c, g, or t <400> 97 ccggcggtgc aaacctgnnk accaccactt gctatctggg 40 <210> 98 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (25)..(26) <223> n is a, c, g, or t <400> 98 ctgttccgtt actccggtat tctgnnkcgt cgtctgaacg acctgatg 48 <210> 99 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (23)..(24) <223> n is a, c, g, or t <400> 99 ggcagtaatc tacctgtgcc agnnkctgga agtacagtac gctggtaaag 50 <210> 100 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 100 cagctgcgga accgcagttt gaagaaattc cgat 34 <210> 101 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 101 tggatggagg actttgactt cgtccaccta caggggtaat aacaattc 48 <210> 102 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 102 ctctccgttt ctgactttga caacgccaag gggctcaatg tgctgcacta caagatccgc 60 aagctg 66 <210> 103 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 103 aaacactacc tgatccgcaa gctggacagc 30 <210> 104 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 104 tattggtctc tcgcggtatc attgcagcac 30 <210> 105 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 105 tattggtctc atcaccccat gcgagagtag g 31 <210> 106 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 106 aacaatttca cacaggaaac agacc 25 <210> 107 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 107 atctcggaca tgctcagttc catccgcctg aaccccaata aagtactgga c 51 <210> 108 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 108 gaaggcccat ggctgtatcc gcaatatcag gaacaggatt ctctctc 47 <210> 109 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 109 ccatgggcgt cataaagatc cgctaaaata acagtgaaat tggaagtttt tgt 53 <210> 110 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 110 gctgttatca ccctgatcgc ggacacttac gatgcttacg 40 <210> 111 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 111 cgatcttgat gacaatgtta gcggacttat acgacacgca tggg 44 <210> 112 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 112 gttgggggtg ccattgttc 19 <210> 113 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 113 tacacacata ccggtgttgg g 21 <210> 114 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 114 gcgttcccaa gcgtttttg 19 <210> 115 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 115 cgcggccatc cagaagt 17 <210> 116 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 116 agccagttca atcagatggt gg 22 <210> 117 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 117 ccgcgccagg acgtg 15 <210> 118 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 118 ttctttaaca aactctttac cgcagttg 28 <210> 119 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 119 ggtgatgata acaaccgggt catg 24 <210> 120 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 120 caggtttgca ccgccgg 17 <210> 121 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 121 cagaataccg gagtaacgga acag 24 <210> 122 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 122 ctggcacagg tagattactg cc 22 <210> 123 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 123 atcggaattt cttcaaactg cggttccgca gctg 34 <210> 124 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 124 gtcaaagtcc tccatccacg cagctgcacg acg 33 <210> 125 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 125 aagtcagaaa cggagagggc ataggcacct tttaccgtct cgctctcccg 50 <210> 126 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 126 gctgtccagc ttgcggatca ggtagtgttt cacattgagc cccttggc 48 <210> 127 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 127 tattggtctc agtgacccca cactaccatc gg 32 <210> 128 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 128 tattggtctc acgcgtgacc cacgctcacc g 31 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 129 gcctgcaggt cgactctaga 20 <210> 130 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 130 aacaatttca cacaggaaac agaccatggc gggtgtttct gcg 43 <210> 131 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 131 gcctgcaggt cgactctaga ttacagcggc agcggttc 38 <210> 132 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 132 cagagagaag gtgccagaca tcccaatgcc tgcactaca 39 <210> 133 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 133 caatgatggt gcctgtcatg ccgatgccgg cgctg 35 <210> 134 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 134 gctgtgatca aatggcagta tgtccttcgc tctgttcttt ttaacatttt cttctttttc 60 <210> 135 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 135 aggtgtcgta catgtccgcc agaacggtct gcag 34 <210> 136 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 136 tgtagtgcag gcattgggat gtctggcacc ttctctctg 39 <210> 137 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 137 cagcgccggc atcggcatga caggcaccat cattg 35 <210> 138 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 138 gaaaaagaag aaaatgttaa aaagaacaga gcgaaggaca tactgccatt tgatcacagc 60 <210> 139 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 139 ctgcagaccg ttctggcgga catgtacgac acct 34 <210> 140 <211> 34 <212> PRT <213> Homo sapiens <400> 140 Ile Gln Thr Ala Asp Gln Leu Arg Phe Ser Tyr Leu Ala Val Ile Glu 1 5 10 15 Gly Ala Lys Phe Ile Met Gly Asp Ser Ser Val Gln Asp Gln Trp Lys 20 25 30 Glu Leu <210> 141 <211> 34 <212> PRT <213> Homo sapiens <400> 141 Ile Gln Thr Pro Asp Gln Leu Arg Phe Ser Tyr Met Ala Ile Ile Glu 1 5 10 15 Gly Ala Lys Tyr Thr Lys Gly Asp Ser Asn Ile Gln Lys Arg Trp Lys 20 25 30 Glu Leu

Claims (28)

  1. 단백질 기능을 조절하는 분자를 생성하는 대사 경로의 발견 및 진화 방법으로서,
    관심 대상의 단백질을 포함하는 숙주 세포 집단을, 상이한 대사 경로를 포함하는 발현 벡터 집단과 접촉시키는 단계로서, 숙주 세포가 발현 벡터 집단의 전달을 잘 받아들이는 것인 단계;
    숙주 세포 집단에서 대사 경로를 발현시키는 단계로서, 대사 경로가 관심 대상의 단백질을 조절하는 생성물을 생성하는 경우 숙주 세포 집단의 세포 또는 서브세트가 검출 가능한 아웃풋(output)을 생성하는 것인 단계;
    숙주 세포 집단의 세포 또는 서브세트에서 검출 가능한 아웃풋을 측정할 수 있게 하는 조건 하에 숙주 세포 집단을 스크리닝하는 단계;
    검출 가능한 아웃풋을 생성하는 숙주 세포 집단의 세포 또는 서브세트를 단리하는 단계;
    기준 경로를 보유하는 기준 벡터, 예를 들어, 숙주 세포 집단의 세포 또는 서브세트에서 관심 대상의 단백질의 활성을 조절하기에 충분한 농도 및/또는 효능을 가진 분자를 생성하지 않는 경로를 코딩하는 벡터의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 발현 벡터를 단리하는 단계; 및
    숙주 세포 집단의 세포 또는 서브세트에서 상기 기준 벡터의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 발현 벡터에 의해 코딩된 대사 경로의 생성물을 특징규명하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 숙주 세포는 관심 대상의 단백질의 활성이 복합체의 2개 이상의 성분들 중 어느 하나에 의해 보유되지 않은 활성으로 단백질 복합체의 어셈블리를 제어함으로써, 형성된 복합체의 양에 비례하여 검출 가능한 아웃풋을 생성하는 유전적으로 코딩된 시스템을 포함하는 것인 방법.
  3. 제1항 또는 제2항에 있어서, 관심 대상의 단백질은 초기에 해리된 2개의 단백질들이 공유결합되게 하거나 비공유 복합체를 형성하게 하는 번역 후 변형을 추가하는 효소인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 복합체는 SH2 도메인과 이의 인산화된 기질 사이에 형성된 복합체의 해리 상수(Kd) 이하의 Kd를 가진 2개의 단백질들에 의해 형성되는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 대사 경로는 페닐프로파노이드 또는 비리보좀 펩타이드를 생성하는 것인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상이한 대사 경로를 포함하는 발현 벡터는 출발 대사 경로 내의 하나 이상의 유전자를 돌연변이시킴으로써 생성된 경로의 라이브러리를 포함하는 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 대사 경로 중 하나 이상은 생합성 능력이 알려지지 않은 유전자 세트를 포함하는 것인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로의 생성물과 상이한 생성물을 생성하는 것인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로에 의해 생성된 생성물의 양보다 더 많은 양의 생성물을 생성하는 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로보다 더 낮은 세포 독성을 나타내는 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 대사 경로의 생성물은 표준 분석 방법, 바람직하게는 기체 크로마토그래피-질량 분광측정(GC/MS), 액체 크로마토그래피-질량 분광측정(LC/MS) 및/또는 핵 자기 공명(NMR) 분광법에 의해 특징규명되는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 생성물을 단리하는 단계를 추가로 포함하는 방법.
  13. 제12항에 있어서, 바람직하게는 회전 증발기를 이용하여 생성물을 농축하는 단계를 추가로 포함하는 방법.
  14. 제12항 또는 제13항에 있어서, 관심 대상의 단백질에 대한 생성물의 효과를 시험하는 단계를 추가로 포함하는 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 관심 대상의 단백질은 유비퀴틴 리가제(ligase), SUMO 트랜스퍼라제(transferase), 메틸트랜스퍼라제(methyltransferase), 데메틸라제(demethylase), 아세틸트랜스퍼라제(acetyltransferase), 글리코실트랜스퍼라제(glycosyltransferase), 팔미토일트랜스퍼라제(palmitoyltransferase), 또는 관련 하이드롤라제(hydrolase)인 방법.
  16. 관심 대상의 단백질을 포함하는 숙주 세포 집단 및 상이한 대사 경로를 포함하는 발현 벡터 집단을 포함하는 조성물 또는 시스템으로서,
    대사 경로가 관심 대상의 단백질을 조절하는 생성물을 생성하는 경우 숙주 세포 집단의 세포 또는 서브세트가 검출 가능한 아웃풋을 생성하고,
    임의로 상기 발현 벡터가 기준 경로를 보유하는 기준 벡터, 예를 들어, 숙주 세포 집단의 세포 또는 서브세트에서 관심 대상의 단백질의 활성을 조절하기에 충분한 농도 및/또는 효능을 가진 분자를 생성하지 않는 경로를 코딩하는 벡터의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 것인 조성물 또는 시스템.
  17. 제16항에 있어서, 숙주 세포는 관심 대상의 단백질의 활성이 복합체의 2개 이상의 성분들 중 어느 하나에 의해 보유되지 않은 활성으로 단백질 복합체의 어셈블리를 제어하므로, 형성된 복합체의 양에 비례하여 검출 가능한 아웃풋을 생성하는 유전적으로 코딩된 시스템을 포함하는 것인 조성물 또는 시스템.
  18. 제16항 또는 제17항에 있어서, 관심 대상의 단백질은 초기에 해리된 2개의 단백질들이 공유결합되게 하거나 비공유 복합체를 형성하게 하는 번역 후 변형을 추가하는 효소인 조성물 또는 시스템.
  19. 제16항 내지 제18항 중 어느 한 항에 있어서, 복합체는 SH2 도메인과 이의 인산화된 기질 사이에 형성된 복합체의 해리 상수(Kd) 이하의 Kd를 가진 2개의 단백질들에 의해 형성되는 것인 조성물 또는 시스템.
  20. 제16항 내지 제19항 중 어느 한 항에 있어서, 대사 경로는 페닐프로파노이드 또는 비리보좀 펩타이드를 생성하는 것인 조성물 또는 시스템.
  21. 제16항 내지 제20항 중 어느 한 항에 있어서, 상이한 대사 경로를 포함하는 발현 벡터는 출발 대사 경로 내의 하나 이상의 유전자를 돌연변이시킴으로써 생성된 경로의 라이브러리를 포함하는 것인 조성물 또는 시스템.
  22. 제16항 내지 제21항 중 어느 한 항에 있어서, 대사 경로 중 하나 이상은 생합성 능력이 알려지지 않은 유전자 세트를 포함하는 것인 조성물 또는 시스템.
  23. 제16항 내지 제22항 중 어느 한 항에 있어서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로의 생성물과 상이한 생성물을 생성하는 것인 조성물 또는 시스템.
  24. 제16항 내지 제23항 중 어느 한 항에 있어서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로에 의해 생성된 생성물의 양보다 더 많은 양의 생성물을 생성하는 것인 조성물 또는 시스템.
  25. 제16항 내지 제24항 중 어느 한 항에 있어서, 기준 경로의 아웃풋보다 더 높은 검출 가능한 아웃풋을 생성하는 대사 경로 중 하나 이상은 다른 대사 경로보다 더 낮은 세포 독성을 나타내는 것인 조성물 또는 시스템.
  26. 제16항 내지 제25항 중 어느 한 항에 있어서, 관심 대상의 단백질은 유비퀴틴 리가제, SUMO 트랜스퍼라제, 메틸트랜스퍼라제, 데메틸라제, 아세틸트랜스퍼라제, 글리코실트랜스퍼라제, 팔미토일트랜스퍼라제, 또는 관련 하이드롤라제인 조성물 또는 시스템.
  27. 제16항 내지 제26항 중 어느 한 항의 발현 벡터 집단을 포함하는 키트.
  28. 제27항에 있어서, 제16항 내지 제26항 중 어느 한 항의 숙주 세포 집단을 추가로 포함하는 키트.
KR1020227026953A 2020-01-08 2021-01-08 생물학적 활성 대사물질의 발견 및 진화 KR20220125293A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062958368P 2020-01-08 2020-01-08
US62/958,368 2020-01-08
PCT/US2021/012621 WO2021142207A1 (en) 2020-01-08 2021-01-08 Discovery and evolution of biologically active metabolites

Publications (1)

Publication Number Publication Date
KR20220125293A true KR20220125293A (ko) 2022-09-14

Family

ID=76788380

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227026953A KR20220125293A (ko) 2020-01-08 2021-01-08 생물학적 활성 대사물질의 발견 및 진화

Country Status (9)

Country Link
US (1) US20230151354A1 (ko)
EP (1) EP4087830A4 (ko)
JP (1) JP2023522289A (ko)
KR (1) KR20220125293A (ko)
CN (1) CN115279716A (ko)
AU (1) AU2021206705A1 (ko)
CA (1) CA3167048A1 (ko)
IL (1) IL294584A (ko)
WO (1) WO2021142207A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3105747A1 (en) 2018-07-06 2020-01-09 The Regents Of The University Of Colorado, A Body Corporate Genetically encoded system for constructing and detecting biologically active agents
EP4426882A1 (en) * 2021-11-03 2024-09-11 Think Bioscience, Inc. Methods and systems for high-throughput biochemical screens

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6057103A (en) * 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US20030215798A1 (en) * 1997-06-16 2003-11-20 Diversa Corporation High throughput fluorescence-based screening for novel enzymes
AU2053197A (en) * 1996-02-23 1997-09-10 Ariad Pharmaceuticals, Inc. Cell-based assay
US7083918B2 (en) * 2002-04-24 2006-08-01 The Trustees Of Columbia University In The City Of New York Bacterial small-molecule three-hybrid system
CA3105747A1 (en) * 2018-07-06 2020-01-09 The Regents Of The University Of Colorado, A Body Corporate Genetically encoded system for constructing and detecting biologically active agents

Also Published As

Publication number Publication date
EP4087830A1 (en) 2022-11-16
JP2023522289A (ja) 2023-05-30
CA3167048A1 (en) 2021-07-15
AU2021206705A1 (en) 2022-08-18
IL294584A (en) 2022-09-01
CN115279716A (zh) 2022-11-01
WO2021142207A1 (en) 2021-07-15
EP4087830A4 (en) 2024-04-17
US20230151354A1 (en) 2023-05-18

Similar Documents

Publication Publication Date Title
Kirby et al. Engineering a functional 1-deoxy-D-xylulose 5-phosphate (DXP) pathway in Saccharomyces cerevisiae
US20230151354A1 (en) Discovery and evolution of biologically active metabolites
Bauman et al. Enzymatic assembly of the salinosporamide γ-lactam-β-lactone anticancer warhead
US20170233749A1 (en) Site-specific incorporation of phosphoserine into proteins in escherichia coli
US20210024971A1 (en) Methods for producing, discovering, and optimizing lasso peptides
Drake et al. Three-dimensional structures of Pseudomonas aeruginosa PvcA and PvcB, two proteins involved in the synthesis of 2-isocyano-6, 7-dihydroxycoumarin
Graille et al. Methylation of class I translation termination factors: structural and functional aspects
Wang et al. Crystal structure of the condensation domain from lovastatin polyketide synthase
Collin et al. Decrypting the programming of β-methylation in virginiamycin M biosynthesis
Prætorius-Ibba et al. Association between archaeal prolyl-and leucyl-tRNA synthetases enhances tRNAPro aminoacylation
Zhao et al. O-methyltransferase-like enzyme catalyzed diazo installation in polyketide biosynthesis
CA3237159A1 (en) Methods and systems for high-throughput biochemical screens
Pérez-Gil et al. Cloning and functional characterization of an enzyme from Helicobacter pylori that catalyzes two steps of the methylerythritol phosphate pathway for isoprenoid biosynthesis
Tong et al. Functional characterization and substrate promiscuity of sesquiterpene synthases from Tripterygium wilfordii
Samai et al. Functional dissection of the DNA interface of the nucleotidyltransferase domain of Chlorella virus DNA ligase
Li et al. Phylogenetic analysis and functional characterization of norcoclaurine synthase involved in benzylisoquinoline alkaloids biosynthesis in Stephania tetrandra
WO2015030681A1 (en) In vitro synthetic multi-biocatalytic system for the synthesis of isoprenoids and isoprenoid precursors
Sarkar Genetically Encoded Tools for the Discovery and Biosynthesis of Bioactive Small Molecules in Escherichia Coli
US20230272439A1 (en) Method for producing olivetolic acid in an amoebozoa host species
van Wolferen et al. OPEN ACCESS EDITED BY
Zhang et al. Characterization of a group of germacrene A synthases involved in the biosynthesis of β-elemene from Atractylodis macrocephala
Todd et al. Mechanistic insight into DsyB/DSYB, key enzymes in marine dimethylsulfoniopropionate synthesis
Chen et al. Genetic analysis reveals the inconsistency of amorpha-4, 11-diene synthase, a key enzyme in the artemisinin synthesis pathway, in asteraceae
KR20220079579A (ko) 사카로마이세스 세레비지애를 사용한 단순 전구체 공급 원료로부터의 칸나비노이드의 지속 가능한 생성
Wang et al. The human DNA topoisomerase I mutant Gly717Asp: Higher religation rate is not always associated with camptothecin resistance