KR20160134669A - 시클로프로펜 아미노산 및 방법 - Google Patents

시클로프로펜 아미노산 및 방법 Download PDF

Info

Publication number
KR20160134669A
KR20160134669A KR1020167025032A KR20167025032A KR20160134669A KR 20160134669 A KR20160134669 A KR 20160134669A KR 1020167025032 A KR1020167025032 A KR 1020167025032A KR 20167025032 A KR20167025032 A KR 20167025032A KR 20160134669 A KR20160134669 A KR 20160134669A
Authority
KR
South Korea
Prior art keywords
leu
ser
lys
glu
arg
Prior art date
Application number
KR1020167025032A
Other languages
English (en)
Inventor
토마스 엘리엇
Original Assignee
메디칼 리서취 카운실
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메디칼 리서취 카운실 filed Critical 메디칼 리서취 카운실
Publication of KR20160134669A publication Critical patent/KR20160134669A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C271/00Derivatives of carbamic acids, i.e. compounds containing any of the groups, the nitrogen atom not being part of nitro or nitroso groups
    • C07C271/06Esters of carbamic acids
    • C07C271/08Esters of carbamic acids having oxygen atoms of carbamate groups bound to acyclic carbon atoms
    • C07C271/10Esters of carbamic acids having oxygen atoms of carbamate groups bound to acyclic carbon atoms with the nitrogen atoms of the carbamate groups bound to hydrogen atoms or to acyclic carbon atoms
    • C07C271/22Esters of carbamic acids having oxygen atoms of carbamate groups bound to acyclic carbon atoms with the nitrogen atoms of the carbamate groups bound to hydrogen atoms or to acyclic carbon atoms to carbon atoms of hydrocarbon radicals substituted by carboxyl groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/13Labelling of peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C269/00Preparation of derivatives of carbamic acid, i.e. compounds containing any of the groups, the nitrogen atom not being part of nitro or nitroso groups
    • C07C269/06Preparation of derivatives of carbamic acid, i.e. compounds containing any of the groups, the nitrogen atom not being part of nitro or nitroso groups by reactions not involving the formation of carbamate groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • C07K1/1072General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43595Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2462Lysozyme (3.2.1.17)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C2601/00Systems containing only non-condensed rings
    • C07C2601/02Systems containing only non-condensed rings with a three-membered ring

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Biomedical Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

본 발명은 시클로프로펜 기가 있는 아미노산을 포함하고, 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산에 연결된 폴리펩티드에 관한 것이다. 적절하게는, 시클로프로펜 기는 1,3-이치환 시클로프로펜 예컨대 1,3-디메틸시클로프로펜이다. 적절하게는, 시클로프로펜 기는 리신 아미노산의 잔기로서 존재한다. 또한 본 발명은 이러한 폴리펩티드의 제조 방법에 관한 것이다. 또한 본 발명은 시클로프로펜을 포함하고, 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산 모이어티에 연결된 아미노산에 관한 것이다.

Description

시클로프로펜 아미노산 및 방법{CYCLOPROPENE AMINO ACIDS AND METHODS}
발명의 분야
본 발명은 (확장된) 유전자 코드를 통한 생물-직교성(bio-orthogonal) 기의 부위-특이적 혼입에 관한 것이다. 특히 본 발명은 유전적으로 혼입된 아미노산 예컨대 리신을 통한 폴리펩티드 내로의 카르바메이트-결합 시클로프로펜의 혼입에 관한 것이다. 이같은 시클로프로펜 기는 추가적인 화학 기 예컨대 테트라진의 부가에 유용하다.
발명의 배경
유전자 코드 확장을 통한 생물-직교성 기의 부위-특이적 혼입은 단백질을 임의의 프로브로 부위 특이적으로 표지화하기 위한 강력한 일반적인 전략을 제공한다. 그러나, 유전적으로 코딩될 수 있는 생물-직교성 관능기의 느린 반응성, 및/또는 이들이 광활성화를 필요로 하는 것이 이러한 전략의 유용성을 제한하였다.
다양한 프로브로 단백질을 신속하게 부위-특이적으로 표지하는 것은 여전히 화학 생물학자의 해결되지 않은 난제이다: 효소-매개 표지화 접근법이 신속할 수 있지만, 이는 연구 중인 단백질에 교란을 도입하는 단백질 또는 펩티드 융합물을 사용하고, 표지될 수 있는 부위를 제한할 수 있는 한편, 성분이 유전적으로 코딩될 수 있는 다수의 '생물-직교성' 반응은 다수의 생물학적 프로세스를 연구하는데 유용한 시간 규모로 단백질을 정량적 및 부위 특이적으로 표지화하기에는 너무 느리다.
다양한 정황에서 사용자-정의 프로브로 단백질을 부위-특이적으로 표지하는 일반적인 방법이 시급하게 요구된다.
테트라진을 수반하는 역 전자 요구 딜스-알더(Diels-Alder) 반응이 신속한 생물-직교성 반응의 중요한 클래스로서 나타났다. 이러한 반응 중 일부에 대해 보고된 속도는 매우 빠르다.
문헌 [Yu et al., 2012, Angew. Chem. Int. Ed. Volume 51, pages 10600-10604]에서, 유전적으로 코딩된 시클로프로펜이 포유동물 세포에서 신속한 포토클릭(photoclick) 화학-매개 단백질 표지화를 지시한다는 것이 개시되었다. 저자들은 안정적인 시클로프로펜 아미노산의 합성, 2개의 테트라졸과의 광-유도 고리화첨가 반응에서의 이의 반응성의 특성화, 이. 콜라이(E. coli) 및 포유동물 세포 양쪽 모두에서의 단백질 내로의 이의 부위-특이적 혼입, 및 시험관 내 및 생체 내 양쪽 모두에서의 단백질의 생물직교성 표지화를 지시하는 것에서의 이의 용도를 보고하였다. 시클로프로펜 함유 아미노산을 단백질 내로 혼입시키기 위해, 저자들은 TAG 앰버(amber) 코돈에 반응하여 시클로프로펜 리신 아미노산을 선택적으로 장전시키는 직교성 tRNA/tRNA 신테타제 쌍을 진화시켜야 했다. 이는, 5회 이상의 라운드의 양성 및 음성 선별 스크리닝과 함께, 신테타제 라이브러리가 구축되어야 하고, 이러한 신테타제 내의 5개의 위치가 무작위되어야 하는 것을 필요로 하였다. 이러한 작업의 단점은 생산된 특정 돌연변이체 신테타제에 의존한다는 것이다. 테트라졸 화합물을 변형된 아미노산 내의 시클로프로펜 모이어티(moiety)에 연결하는 것에서, 유(Yu) 등은 광 활성화를 사용한다. 302 나노미터 또는 365 나노미터에서 광 활성화가 수행된다. 테트라졸을 유 등의 아미노산에 연결시키데 광 활성화가 요구되는 것은 관련 기술 분야의 단점이다. 이는 접합 화학에서의 곤란한 추가 단계이다. 또한 UV는 세포에 해롭고, 따라서 생체내/세포 환경에서 불리하다.
캠버(Kamber) 등은 독특한 생물직교성 반응성을 나타내는 이성질체성 시클로프로펜을 개시하였다 (2013 JACS Volume 135, pages 13680-13683). 저자들은 복합적인 환경 내의 생체분자에 태그(tag)를 부착하는데 사용될 수 있는 2가지 반응을 논의하였다: 테트라진과 1,3-이치환 시클로프로펜의 역 전자 요구 딜스-알더 반응, 및 니트릴 이민과 3,3-이치환 시클로프로펜의 1,3-이극성 고리화첨가. 저자들은 안정적인 시클로 부가물을 생성시키는데 사용된 다양한 화학 반응 설계를 논의하였다. 캠버 등에 의해 논의된 분자는 아미노산이 아니다. 기술된 바와 같은 화합물이 아미노산 내로 혼입될 수 있다고 짐작할 이유가 없다. 임의의 이같은 혼입이 시도되었더라도, 이같은 화합물이 폴리펩티드 내로 혼입되게 할 수 있는 제안 또는 지침이 전혀 없다. 기술된 화학 기 중 임의의 것을 포함하는 아미노산의 합성을 위한 설계가 캠버 등에 의해 제시되지 않았다. 이러한 문서의 어느 곳에서도 단백질 내로의 혼입을 위한 생화학적 도구가 언급되지 않았다. 캠버 등은 단지 시클로프로펜 상에서의 치환 패턴을 시험하는 것만 관여하였고, 한 이같은 패턴은 테트라진과의 반응을 허용하고, 한 이같은 패턴은 테트라진과의 반응을 허용하지 않는다.
본 발명은 종래 기술과 연관된 문제점(들)을 극복하려 한다.
발명의 개요
한 측면에서, 본 발명은 시클로프로펜 기가 있는 아미노산을 포함하고, 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산에 연결된 폴리펩티드를 제공한다.
적절하게는, 상기 시클로프로펜 기는 1,3-이치환 시클로프로펜이다. 적절하게는, 상기 시클로프로펜은 1,3-디메틸시클로프로펜이다. 적절하게는, 상기 시클로프로펜 기는 리신 아미노산의 잔기로서 존재한다. 적절하게는, 상기 폴리펩티드는 상기 시클로프로펜 기에 연결된 테트라진 화합물을 추가로 포함한다.
또 다른 측면에서, 본 발명은 시클로프로펜을 포함하고, 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산 모이어티에 연결된 아미노산에 관한 것이다.
적절하게는, 상기 시클로프로펜은 1,3-이치환 시클로프로펜이다. 적절하게는, 상기 시클로프로펜은 1,3-디메틸시클로프로펜이다. 적절하게는, 상기 아미노산은 리신 아미노산이다. 적절하게는, 상기 아미노산은 N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신을 포함한다.
적절하게는, 상기 아미노산은 하기를 포함하거나, 또는 더욱 적절하게는 하기로 이루어진다:
Figure pct00001
또 다른 측면에서, 본 발명은 시클로프로펜 기를 포함하고, 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산 모이어티에 연결된 폴리펩티드를 제조하는 방법으로, 카르바메이트 기를 통해 아미노산 모이어티에 연결된 시클로프로펜 기를 포함하는 아미노산을 폴리펩티드 내로 유전적으로 혼입시키는 것을 포함하는 방법에 관한 것이다.
적절하게는, 폴리펩티드의 제조는
(i) 시클로프로펜 기가 있는 아미노산을 코딩하는 직교성(orthogonal) 코돈을 포함하는, 폴리펩티드를 코딩하는 핵산을 제공하고;
(ii) 상기 핵산을, 상기 직교성 코돈을 인식할 수 있고 시클로프로펜 기가 있는 상기 아미노산을 폴리펩티드 사슬 내로 혼입시킬 수 있는 직교성 tRNA 신테타제/tRNA 쌍의 존재 하에 번역하는 것을 포함한다.
적절하게는, 상기 직교성 코돈은 앰버 코돈 (TAG)을 포함하고, 상기 tRNA는 MbtRNACUA를 포함하며, 상기 tRNA 신테타제는 MbPylRS를 포함한다.
적절하게는, 상기 직교성 코돈은 앰버 코돈 (TAG)을 포함하고, 상기 tRNA는 MmtRNACUA를 포함하며, 상기 tRNA 신테타제는 MmPylRS를 포함한다.
또 다른 측면에서, 본 발명은 시클로프로펜 기를 포함하는 상기 아미노산이 상기 기술된 바와 같은 아미노산인 상기 기술된 바와 같은 방법에 관한 것이다.
또 다른 측면에서, 본 발명은 상기 기술된 바와 같은 시클로프로펜 기를 포함하는 폴리펩티드를 제공하고, 상기 폴리펩티드를 테트라진 화합물과 접촉시키고, 역 전자 요구 딜스-알더 고리화첨가 반응에 의해 테트라진이 시클로프로펜 기에 연결되게 하도록 인큐베이션하는 것을 포함하는, 테트라진 기를 포함하는 폴리펩티드를 제조하는 방법에 관한 것이다.
적절하게는, 상기 반응은 10분 이하, 바람직하게는 1분 이하, 바람직하게는 30초 이하 동안 진행되도록 허용된다. 생체 내 또는 진핵생물 배양 조건 예컨대 조직 배양 배지 또는 기타 적절한 진핵생물 세포용 배지에서의 반응은 최대 표지화를 달성하기 위해 30초보다 길게 수행되는 것을 필요로 할 수 있다. 숙련된 작업자는 본원에서 제공된 지침을 기초로 시행 착오에 의해 최적의 반응 시간을 결정할 수 있다.
또 다른 측면에서, 본 발명은 상기 폴리펩티드가 각각 시클로프로펜 기가 있는 2개 이상의 아미노산을 포함하고, 각각의 상기 시클로프로펜 기가 카르바메이트 기를 통해 각각의 상기 아미노산에 연결된, 상기 기술된 바와 같은 폴리펩티드에 관한 것이다. 폴리펩티드 상에 2개 이상의 시클로프로펜 기가 제공되는 것은 2개 이상의 접합된 기 (관능기)가 폴리펩티드에 연결되는 것을 유리하게 허용한다. 이는 접합된 기 (관능기)가 항체-약물-접합체에서와 같이 약물 분자 예컨대 세포독성 분자를 포함하는 경우에 특히 도움이 된다.
적절하게는, 상기 폴리펩티드는 각각 시클로프로펜 기가 있는 4개의 아미노산을 포함한다.
적절하게는, 상기 기술된 바와 같은 폴리펩티드를 포함하는 항체 약물 접합체 (ADC)는 각각 시클로프로펜 기가 있는 4개의 아미노산을 포함한다. 이는 4개의 세포독성 분자를 관심 ADC에 연결시키는데 특히 유리하다.
또 다른 측면에서, 본 발명은 상기 기술된 바와 같은 폴리펩티드를 포함하는 항체 약물 접합체 (ADC)에 관한 것이다. 적절하게는, 폴리펩티드는 항체 폴리펩티드 예컨대 전체 항체 (예를 들어, 모노클로날 항체 (mAb))이거나, 또는 항체 단편 (예를 들어 단일쇄 가변 단편 [scFv]), 적절하게는 CDR 아미노산 서열을 포함하는 항체 단편이다.
적절하게는, 항체 폴리펩티드 (또는 단편)는 키메라 항체 폴리펩티드(들)의 제작에 의해 유리하게 인간화될 수 있다; 적절하게는, 항체 폴리펩티드 (또는 단편)는 유리하게 CDR-그래프팅(grafting)될 수 있다; 적절하게는, 항체 폴리펩티드 (또는 단편)는 기술이 허용하는 정도까지 유리하게 충분히 인간화될 수 있다.
적절하게는, 항체 폴리펩티드 (또는 단편)가 또 다른 관심 폴리펩티드 예컨대 트랜스페린 수용체에 대한 리간드, 예를 들어 트랜스페린 또는 이의 일부분에 융합되어, ADC의 운반 및/또는 표적화를 보조할 수 있다.
또 다른 측면에서, 본 발명은 상기 테트라진 기가 추가로 형광단에 연결된 상기 기술된 바와 같은 폴리펩티드에 관한 것이다.
적절하게는, 상기 형광단은 플루오레세인, 테트라메틸 로다민 (TAMRA) 또는 보론-디피로메텐 (BODIPY)을 포함한다.
적절하게는, 상기 형광단은 하나 이상의 알렉사(Alexa) 형광단(들)을 포함할 수 있다. 적절하게는, 상기 형광단은 하나 이상의 시아닌(Cyanine)-기반 형광단(들)을 포함할 수 있다.
상세한 설명
유전자 코드 확장 방법은 화학 구조가 다양하고 다양한 관능기를 보유하는 비천연 아미노산의 정량적이고, 부위-특이적이며, 유전적으로 지시된 혼입을 허용한다. 이는 관심 유전자 내로 도입된 앰버 정지 코돈에 반응하여 비천연 아미노산을 삽입하는 것에 의해 가장 통상적으로 달성된다.12 , 13 유전자 코드 확장은 세포 내로의 직교성 아미노아실-tRNA 신테타제/tRNACUA 쌍의 도입을 통해 달성된다. 피롤리실-tRNA 신테타제/tRNACUA 쌍은 유전자 코드 확장을 위한 가장 유용한 쌍 중 하나인데,13 1) 광범위한 유용한 비천연 아미노산을 특이적으로 인식할 수 있고, 2) 연장된 범위의 화학 구조를 인식하도록 진화될 수 있으며, 3) 이. 콜라이14, 효모15, 포유동물 세포16 -18, 씨. 엘레강스(C. elegans)19 및 디. 멜라노가스터(D. melanogaster)20에서의 유전자 코드 확장을 위한 직교성 쌍으로서 사용될 수 있기 때문이다.
본 발명가들은 화학선택적 역 전자 요구 딜스-알더 반응을 통해 도입된 테트라진 프로브로 표지될 수 있는 시클로프로펜 기가 있는 새롭게 합성된 단백질의 제조를 실연한다.
또 다른 측면에서, 본 발명은 상기 기술된 바와 같은 균질한 재조합 폴리펩티드에 관한 것이다. 적절하게는, 상기 폴리펩티드는 상기 기술된 바와 같은 방법에 의해 제조된다.
본원에 기술된 방법(들)에 따라 제조된 폴리펩티드가 또한 개시된다. 이러한 새로운 방법의 생성물일 뿐만 아니라, 이같은 폴리펩티드는 적절하게 카르바메이트-연결된 시클로프로펜을 포함하는 기술적 특색이 있다.
돌연변이는 관련 기술 분야에서의 이의 일반적인 의미를 지니고, 지칭된 잔기, 모티프 또는 도메인의 치환 또는 말단절단 또는 결실을 지칭할 수 있다. 돌연변이는 폴리펩티드 수준에서, 예를 들어 서열이 돌연변이된 폴리펩티드의 합성에 의해 달성될 수 있거나, 또는 뉴클레오티드 수준에서, 예를 들어 돌연변이된 서열을 코딩하는 핵산을 제조하는 것에 의해 달성될 수 있고, 이어서 이러한 핵산이 번역되어, 돌연변이된 폴리펩티드가 생산될 수 있다. 소정의 돌연변이 부위에 대해 교체 아미노산으로서 아미노산이 특정되지 않은 경우, 적절하게는 상기 부위의 무작위화가 사용된다. 디폴트 돌연변이로서, 알라닌 (A)이 사용될 수 있다. 적절하게는, 특정 부위(들)에서 사용된 돌연변이는 본원에서 기재된 바와 같다.
단편은 적절하게는 적어도 10개의 아미노산의 길이, 적절하게는 적어도 25개의 아미노산, 적절하게는 적어도 50개의 아미노산, 적절하게는 적어도 100개의 아미노산, 적절하게는 적어도 200개의 아미노산, 적절하게는 적어도 250개의 아미노산, 적절하게는 적어도 300개의 아미노산, 적절하게는 적어도 313개의 아미노산, 또는 적절하게는 관심 폴리펩티드의 대부분이다.
본 발명의 방법은 생체 내에서 또는 시험관 내에서 실행될 수 있다.
한 실시양태에서, 적절하게는 본 발명의 방법은 인간 또는 동물의 신체에 적용되지 않는다. 적절하게는, 본 발명의 방법은 시험관내 방법이다. 적절하게는, 방법은 인간 또는 동물의 신체의 존재를 필요로 하지 않는다. 적절하게는, 방법은 인간 또는 동물의 신체의 진단 또는 수술 또는 치료 방법이 아니다.
'포함하다' (포함하는)라는 용어는 관련 기술 분야에서의 이의 일반적인 의미를 지니는 것으로, 즉 언급된 특색 또는 특색들의 군이 포함되지만, 이러한 용어가 임의의 다른 언급된 특색 또는 특색들의 군이 또한 존재하는 것을 제외하지 않는 것으로 이해되어야 한다.
장점
시클로프로펜은 공지된 단백질 표지화 기보다 탄소가 덜 풍부한 기이다.
본 발명의 시클로프로펜 아미노산은 종래 기술의 기법보다 더욱 신속한 단백질 표지화에 이른다.
본 발명의 시클로프로펜 아미노산을 사용하는 것은 종래 기술의 표지된 아미노산보다 더욱 효율적인 혼입에 이른다.
노르보르넨 기를 보유하는 아미노산을 단백질 내로 혼입시키는 것이 공지되어 있다. 본 발명은 노르보르넨 기를 수반하는 종래 기술의 방법에 비해 특정한 장점을 제공한다. 예를 들어, 본 발명의 시클로프로펜 아미노산에 대한 접합 화학이 노르보르넨 함유 아미노산의 것과 유사하지만, 시클로프로펜 아미노산으로의 접합이 더욱 빠를 수 있다.
본 발명에 따른 시클로프로펜 아미노산의 혼입은 종래 기술의 비천연 아미노산의 혼입보다 더욱 효율적일 수 있다. 본 발명에 따른 시클로프로펜 아미노산의 혼입은 종래 기술의 비천연 아미노산보다 더 높은 수준의 혼입에 이를 수 있다.
본 발명의 장점은 교시된 시클로프로펜 아미노산이 야생형 tRNA 신테타제를 사용하여 혼입될 수 있다는 것이다. 종래 기술의 비천연 아미노산, 예를 들어, BCN 기가 혼입된 아미노산은 이의 혼입을 위해 돌연변이체 tRNA 신테타제를 필요로 하는 경향이 있었다.
폴리펩티드 내로 혼입된 비천연 아미노산에 대한 신속한 접합 반응이 종래 기술에서 언급되었다. 예를 들어, TCO/BCN 아미노산이 신속한 반응 시간을 제공하고, 이는 노르보르넨 반응 시간보다 더 빠를 수 있다. 그러나, 시클로프로펜 아미노산의 장점은 매우 신속한 반응 시간이 제공된다는 것이다.
특정한 공지된 비천연 아미노산이 야생형 tRNA 신테타제를 이용할 수 있다. 예를 들어, 노르보르넨 기를 포함하는 아미노산이 야생형 tRNA 신테타제를 이용하여 혼입될 수 있다. 그러나, 본 발명의 시클로프로펜 함유 아미노산을 이용함으로써, 더 높은 혼입 수준이 달성된다. 달리 말하면, 비천연 아미노산을 포함하는 생산된 물질의 양이 종래 기술의 비천연 아미노산 예컨대 노르보르넨을 포함하는 것을 사용할 때보다 본 발명의 시클로프로펜 함유 아미노산을 사용할 때 더 크다.
본 발명의 장점은 시클로프로펜 아미노산이 본원에서 언급된 tRNA 신테타제, 가장 적절하게는 본원에서 언급된 야생형 tRNA 신테타제에 대한 우수한 기질을 형성한다는 것이다.
본 발명의 장점은 시클로프로펜 함유 아미노산이 우수한 링커 화학, 예를 들어 테트라진 함유 화합물과의 신속하고 특이적인 반응을 지지한다는 것이다.
본 발명의 장점은 시클로프로펜 함유 아미노산이 크기 면에서 기존에 단백질을 표지하는데 사용된 공지된 비천연 아미노산보다 더 작다는 것이다. 예를 들어, 노르보르넨을 포함하는 공지된 비천연 아미노산이 폴리펩티드 내로 혼입될 수 있지만, 본 발명의 시클로프로펜 함유 아미노산이 종래 기술의 노르보르넨 함유 아미노산보다 유리하게 크기가 더 작다.
본 발명의 장점은 폴리펩티드 내로 혼입되었을 때 시클로프로펜 아미노산이 단백질 구조를 교란시킬 가능성이 더 낮다는 것이다. 이러한 유리한 효과의 적어도 일부분은 시클로프로펜 분자 기의 작은 크기에 기인할 수 있다.
시클로프로펜 기의 혼입의 핵심적인 장점은 광범위한 매우 유용한 추가적인 화합물 예컨대 표지가 시클로프로펜 기에 용이하게, 그리고 특이적으로 부착되는 것을 허용한다는 것이다.
또 다른 측면에서, 본 발명은 상기 시클로프로펜 기가 테트라진 기에 연결된 상기 기술된 바와 같은 폴리펩티드에 관한 것이다.
시클로프로펜 - 카르바메이트 연결
아미드 결합된 시클로프로펜을 포함하는 비천연 아미노산이 종래 기술에서 기술되었다 (Yu et al., 2012). 이러한 아미노산은 3,3 이치환된다. 이러한 아미노산은 하기와 같다:
Figure pct00002
이러한 아미노산을 폴리펩티드 내로 혼입시키기 위해, 돌연변이체 tRNA 신테타제를 사용하는 것이 필수적이다.
대조적으로, 본 발명의 시클로프로펜을 포함하는 아미노산은 (아미드 기 대신) 카르바메이트 기를 함유한다. 따라서, 본 발명의 시클로프로펜 함유 아미노산은 관련 기술 분야의 아미드 결합 시클로프로펜 아미노산과 화학적으로 다르다.
예시적인 본 발명의 아미노산은 1,3 이치환된다. 예시적인 본 발명의 아미노산은 하기와 같다:
Figure pct00003
본 발명의 카르바메이트 - 시클로프로펜 아미노산의 장점은 야생형 tRNA 신테타제에 의해 잘 혼입된다는 것이다. 이는 양호한 혼입을 수득하기 위해 생물학적 조작을 덜 요구한다는 장점이 있다. 이는 강화 또는 증가된 혼입의 장점을 또한 제공한다. 달리 말하면, 본 발명의 시클로프로펜 - 카르바메이트 아미노산은 공지된 비천연 아미노산보다 더 높은 수준으로 및/또는 더욱 효율적으로 혼입된다.
본 발명의 시클로프로펜 아미노산을 사용하는 것은 테트라진 화합물과의 우수한 반응 속도를 제공할 수 있다.
본 발명의 카르바메이트 화학은 혼입된 아미노산의 화학 구조에서의 더 큰 자유도의 장점을 제공한다. 특히, 본 발명의 카르바메이트 시클로프로펜은 관련 기술 분야에 공지된 아미드 시클로프로펜과 비교하여 자유도가 더 크다. 유사하게, 본 발명의 카르바메이트 시클로프로펜은 폴리펩티드 사슬 내에 존재할 때 접근하기가 더 쉽다.
관련 기술 분야에 공지된 아미드 결합 시클로프펜과 비교하여, 본 발명의 카르바메이트 시클로프로펜은 약간 "더 긴" 아미노산이다. 이는 아미노산 골격으로부터 돌출된 아미노산의 기에 대한 더 양호한 "도달"의 장점을 제공한다. 또 다시, 이는 이러한 기들을 추가적인 표지화 또는 접합 반응을 위해 접근하기 더 쉽게 할 수 있다.
본 발명의 카르바메이트 시클로프로펜의 화학 구조는 더 큰 입체형상 자유도를 유리하게 제공한다. 달리 말하면, 본 발명의 카르바메이트 시클로프로펜 기는 종래 기술의 아미드 결합 시클로프로펜 아미노산보다 단백질 구조물 내에서 더 많은 입체형상을 채택할 수 있다.
더욱 상세하게, 이는 시클로프로펜 기와 아미노산 기 사이의 결합의 성질로부터 발생할 수 있다. 종래 기술의 아미드 배열에서는, 중요한 결합이 SP2 혼성화된다. 본 발명에서의 중요한 결합이 SP3 혼성화되고, 이는 더욱 가요성인 결합 배열이다.
또한, 본 발명의 시클로프로펜 카르바메이트 배열은 카르바메이트와 시클로프로펜 기 사이에 메틸렌 기를 포함한다. 첫째, 이는 더 긴 분자를 제공한다. 종래 기술의 아미드 결합 버전은 덜 유리한 더 짧은 분자이다. 더욱 구체적으로, 본 발명의 아미노산 내의 메틸렌 탄소는 본 발명의 유리한 메틸렌 탄소를 대신하는 이중 결합 산소 기 (=o)에 상응한다. 종래 기술의 아미드 아미노산 내의 이중 결합 버전은 본 발명의 아미노산 내의 메틸렌 탄소 결합 기처럼 자유롭게 회전할 수 없다.
본 발명의 아미노산이 종래 기술의 노르보르넨 함유 아미노산보다 더 작지만 유리한 카르바메이트 화학을 여전히 유지한다는 사실은 본 발명의 이점이다. 이러한 이점은, 특히, 폴리펩티드 사슬 내로의 아미노산의 더 양호한 혼입을 제공한다.
추가적으로, 테트라진 화합물에 대한 연결 (테트라진 접합)이 본 발명의 아미노산에서의 카르바메이트 시클로프로펜 배열에 의해 유리하게 촉진된다.
적절하게는, 상기 테트라진 기가 추가로 형광단에 연결된다.
적절하게는, 상기 테트라진 기가 추가로 폴리에틸렌 글리콜 (PEG) 기에 연결된다.
적절하게는, 상기 형광단은 플루오레세인, 테트라메틸 로다민 (TAMRA) 또는 보론-디피로메텐 (BODIPY)을 포함한다.
혼입
적절하게는, 본 발명의 시클로프로펜 아미노산은 야생형 tRNA 신테타제를 사용하여 폴리펩티드 내로 혼입된다.
적절하게는, 시클로프로펜 기가 있는 아미노산은 야생형 폴리펩티드 내의 리신 잔기에 상응하는 위치에서 혼입된다. 이는 자신이 유래된 야생형 폴리펩티드에 대한 시클로프로펜 함유 폴리펩티드의 가능한 가장 가까운 구조적 관계를 유지하는 장점이 있다.
적절하게는, 폴리펩티드는 단일 시클로프로펜 기를 포함한다. 이는 시클로프로펜 기에서 지시될 수 있는 임의의 추가적인 화학적 변형에 대한 특이성을 유지하는 장점이 있다. 예를 들어, 관심 폴리펩티드 내에 단일한 시클로프로펜 기만 있으면, 가능한 부분적인 변형의 문제 (예를 들어, 이후에 폴리펩티드 내의 시클로프로펜 기 들 중 일부만 변형되는 경우), 또는 동일한 폴리펩티드 내의 대안적인 시클로프로펜 기들 사이에서 변하는 반응 미세환경의 문제 (이는 폴리펩티드 내의 상이한 위치에 있는 상이한 시클로프로펜 기(들) 사이에서의 동등하지 않은 반응성에 이를 수 있다)가 유리하게 방지된다.
적절하게는, 폴리펩티드는 2개의 시클로프로펜 기를 포함한다; 적절하게는, 폴리펩티드는 3개의 시클로프로펜 기를 포함한다; 적절하게는, 폴리펩티드는 4개의 시클로프로펜 기를 포함한다; 적절하게는, 폴리펩티드는 5개의 시클로프로펜 기를 포함한다; 적절하게는, 폴리펩티드는 10개 이상의 시클로프로펜 기를 포함한다.
원칙적으로, 다중 시클로프로펜 함유 아미노산이 동일한 직교성 코돈/직교성 tRNA 쌍에 의해 또는 상이한 직교성 코돈/직교성 tRNA 쌍에 의해 혼입될 수 있다. 적절하게는, 다중 시클로프로펜 함유 아미노산은 (본원에 기술된 바와 같은 적절한 직교성 tRNA 신테타제와 함께) 다중 앰버 코돈의 삽입에 의해 혼입된다.
적절하게는, 시클로프로펜을 포함하는 아미노산은 리신 아미노산이다. 한 실시양태에서, tRNA는 한 종 예컨대 메타노사르시나 바르케리(Methanosarcina barkeri)로부터의 것일 수 있고, tRNA 신테타제는 또 다른 종 예컨대 메타노사르시나 마제이(Methanosarcina mazei)로부터의 것일 수 있다. 또 다른 실시양태에서, tRNA는 제1종 예컨대 메타노사르시나 마제이로부터의 것일 수 있고, tRNA 신테타제는 제2종 예컨대 메타노사르시나 바르케리로부터의 것일 수 있다. 직교성 쌍이 상이한 종들로부터의 tRNA 및 tRNA 신테타제를 포함하는 경우, 이는 직교성 쌍이 함께 효과적으로 작용한다는 것을, 즉 tRNA 신테타제가 관심 아미노산의 tRNA를 효과적으로 아미노 아실화시킬 것임을 항상 조건으로 한다. 마찬가지로, 돌연변이체 tRNA 또는 돌연변이체 tRNA 신테타제가 사용될 수 있고, 단 이들은 정확한 아미노 아실화 활성을 지닌다. 본 발명의 시클로프로펜 함유 아미노산이 야생형 PylRS 신테타제를 사용하여 tRNA 상에 효과적으로 장전된다는 것이 본 발명의 장점이지만, 돌연변이체 PylRS 신테타제를 사용하는 것이 동등하게 가능한데, 단 이는 tRNA에 본 발명의 시클로프로펜 함유 아미노산을 장전시키는데 효과적이다. 가장 적절하게는, 직교성 쌍은 동일한 종으로부터의 tRNA 및 tRNA 신테타제를 포함한다.
물론, 야생형 신테타제 (또는 적절한 신테타제의 또 다른 변이체)를 진화시켜 증가된 효율을 지닐 수 있는 본 발명의 시클로프로펜 아미노산의 혼입을 위한 씬쎄타제를 제조하는 것이 가능하다. 원칙적으로, Pyl 유래 tRNA 신테타제가 유용할 수 있다. 키메라 tRNA 신테타제가 생산될 수 있고, 단 tRNA 신테타제 분자의 장전/아세틸화 부분은 Pyl tRNA 신테타제를 기초로 하거나 이로부터 유래된다. 달리 말하면, 예를 들어 대안적인 코돈 예컨대 센스 코돈, 4벌식 코돈, 앰버 코돈 또는 또 다른 "정지" 코돈을 인식하는 것에서 tRNA를 지시하기 위해, tRNA 분자의 안티-코돈 부분은 작업자의 선택에 따라 변할 수 있다. 그러나, 시클로프로펜 장전 활성을 유지하기 위해 tRNA 분자의 기능성 아실화/장전 부분은 보존되어야 한다.
메타노사르시나 바르케리 및 메타노사르시나 마제이 종 중 하나의 피롤리신 tRNA 신테타제가 적절하다.
메타노사르시나 바르케리 및 메타노사르시나 마제이 tRNA 양쪽 모두가 적절하다. 어떠한 경우든, 이러한 tRNA들은 오직 1개의 뉴클레오티드만 상이하다. 이러한 1개의 뉴클레오티드 차이는 시클로프로펜 함유 아미노산과 관련하여 이들의 활성에 영향이 없다. 따라서, 양쪽 tRNA가 본 발명에서 동등하게 적용가능하다.
사용된 tRNA는 변할 수 있고, 예컨대 돌연변이될 수 있다. 모든 경우에, Pyl tRNA의 임의의 이같은 변이체 또는 돌연변이체는 tRNA에 시클로프로펜 함유 아미노산을 장전시키는데 사용된 tRNA 신테타제와 생산적으로 상호작용하는 능력을 항상 유지한다.
유전적 혼입 및 폴리펩티드 생산
본 발명에 따른 방법에서, 바람직하게는 상기 유전적 혼입은 하나 이상의 특정 직교성 코돈이 시클로프로펜 기가 있는 특정 아미노산 잔기를 코딩하도록 할당되어, 이러한 잔기가 직교성 tRNA 신테타제/tRNA 쌍을 사용하는 것에 의해 유전적으로 혼입될 수 있는 직교성 유전자 코드 또는 확장된 유전자 코드를 사용한다. 원칙적으로 직교성 tRNA 신테타제/tRNA 쌍은 tRNA에 시클로프로펜 기를 포함하는 아미노산을 장전시킬 수 있고 시클로프로펜 기를 포함하는 이러한 아미노산을 직교성 코돈에 반응하여 폴리펩티드 사슬 내로 혼입시킬 수 있는 임의의 쌍일 수 있다.
직교성 코돈은 직교성 코돈 앰버, 오커(ochre), 오팔(opal) 또는 4벌식 코돈일 수 있다. 단순하게 코돈은 시클로프로펜 기를 포함하는 아미노산을 운반하는데 사용될 직교성 tRNA에 상응하여야 한다. 바람직하게는, 직교성 코돈은 앰버이다.
본원에서 제시된 구체적인 예 중 다수가 앰버 코돈 및 상응하는 tRNA/tRNA 신테타제를 사용하였음을 주지하여야 한다. 상기 언급된 바와 같이, 이들은 변할 수 있다. 대안적으로, 시클로프로펜 기를 포함하는 아미노산과 함께 일할 수 있는 대안적인 tRNA/tRNA 신테타제 쌍을 사용 또는 선택하는 노고 없이 다른 코돈을 사용하기 위해, tRNA의 안티코돈 영역이 선택된 코돈에 대한 원하는 안티코돈 영역으로 간단히 스와핑(swapping)될 수 있다. 안티코돈 영역은 tRNA의 장전 또는 혼입 기능 또는 tRNA 신테타제에 의한 인식에서 수반되지 않고, 따라서 이같은 스와핑은 전적으로 숙련된 작업자의 영역 내이다. 따라서, 일부 실시양태에서, 본 발명에서 사용된 tRNA의 안티코돈 영역 예컨대 MbtRNACUA 또는 MmtRNACUA가 교환될 수 있고, 즉 안티코돈 영역이 스와핑되어 대안적인 코돈을 인식하도록 키메라 tRNACUA가 사용될 수 있어, 오커, 오팔 또는 4벌식 코돈을 포함하는 본원에서 논의된 바와 같은 상이한 직교성 코돈에 반응하여 시클로프로펜 함유 아미노산이 혼입될 수 있고, 시클로프로펜 아미노산이 혼입될 폴리펩티드를 코딩하는 핵산이 시클로프로펜 아미노산의 혼입 지점에 동족 코돈을 도입하도록 상응하여 돌연변이된다. 가장 적절하게는, 직교성 코돈은 앰버이다.
따라서, 원한다면 대안적인 직교성 tRNA 신테타제/tRNA 쌍이 사용될 수 있다.
바람직하게는, 직교성 신테타제/tRNA 쌍은 메타노사르시나 바르케리 MS 피롤리신 tRNA 신테타제 (MbPylRS) 및 이의 동족 앰버 억제인자 tRNA (MbtRNACUA)이다.
메타노사르시나 바르케리 PylT 유전자는 MbtRNACUA tRNA를 코딩한다.
메타노사르시나 바르케리 PylS 유전자는 MbPylRS tRNA 신테타제 단백질을 코딩한다. 숫자 주소를 사용하여 특정 아미노산 잔기가 지칭되는 경우, MbPylRS (메타노사르시나 바르케리 피롤리실-tRNA 신테타제) 아미노산 서열을 기준 서열로 사용하여 (즉, 공개적으로 입수가능한 야생형 메타노사르시나 바르케리 PylS 유전자 접속 번호 Q46E77에 의해 코딩되는 바와 같이) 번호가 매겨진다:
Figure pct00004
필요하다면, 관련 기술 분야의 숙련자는 사용될 시클로프로펜 아미노산에 대해 최적화되도록 돌연변이시킴으로써 MbPylRS tRNA 신테타제 단백질을 개조할 수 있다. 돌연변이 (존재하는 경우)에 대한 필요성은 사용된 시클로프로펜 아미노산에 좌우된다. MbPylRS tRNA 신테타제가 돌연변이될 필요가 있을 수 있는 경우의 예는 시클로프로펜 아미노산이 MbPylRS tRNA 신테타제 단백질에 의해 프로세싱되지 않는 경우이다.
이같은 돌연변이 (원하는 경우)는, 예를 들어 MbPylRS tRNA 신테타제 내의 M241, A267, Y271, L274 및 C313 위치 중 하나 이상에서, MbPylRS tRNA 신테타제 내로 돌연변이를 도입하는 것에 의해 수행될 수 있다.
tRNA 신테타제
본 발명의 tRNA 신테타제는 변할 수 있다. 특정 tRNA 신테타제 서열이 실시예에서 사용되었을 수 있지만, 본 발명은 이러한 예에만 국한되도록 의도되지 않는다.
원칙적으로, 동일한 tRNA 장전 (아미노아실화) 기능을 제공하는 임의의 tRNA 신테타제가 본 발명에서 사용될 수 있다.
예를 들어, tRNA 신테타제는 임의의 적절한 종 예컨대 고세균, 예를 들어, 메타노사르시나 바르케리 MS; 메타노사르시나 바르케리 변종 푸사로(Methanosarcina barkeri str. Fusaro); 메타노사르시나 마제이 Go1; 메타노사르시나 아세티보란스(Methanosarcina acetivorans ) C2A; 메타노사르시나 써모필라(Methanosarcina thermophila); 또는 메타노코코이데스 부르토니이(Methanococcoides burtonii)로부터의 것일 수 있다. 대안적으로, tRNA 신테타제는 세균, 예를 들어 데술피토박테리움 하프니엔세(Desulfitobacterium hafniense) DCB-2; 데술피토박테리움 하프니엔세 Y51; 데술피토박테리움 하프니엔세 PCP1; 데술포토마쿨룸 아세톡시단스(Desulfotomaculum acetoxidans ) DSM 771로부터의 것일 수 있다.
이러한 생물들로부터의 예시적인 서열은 공개적으로 입수가능한 서열이다. 피롤리신 tRNA 신테타제에 대한 예시적인 서열로서 하기의 예가 제공된다:
>엠. 바르케리MS/1-419/
메타노사르시나 바르케리 MS
버전 Q6WRH6.1 GI:74501411
Figure pct00005
>엠. 바르케리F/1-419/
메타노사르시나 바르케리 변종 푸사로
버전 YP_304395.1 GI:73668380
Figure pct00006
>엠. 마제이/1-454
메타노사르시나 마제이 Go1
버전 NP_633469.1 GI:21227547
Figure pct00007
>엠. 아세티보란스/1-443
메타노사르시나 아세티보란스 C2A
버전 NP_615128.2 GI:161484944
Figure pct00008
>엠. 써모필라/1-478
메타노사르시나 써모필라, 버전 DQ017250.1 GI:67773308
Figure pct00009
>엠. 부르토니이/1-416
메타노코코이데스 부르토니이 DSM 6242, 버전 YP_566710.1 GI:91774018
Figure pct00010
>디. 하프니엔세_DCB-2/1-279
데술피토박테리움 하프니엔세 DCB-2
버전 YP_002461289.1 GI:219670854
Figure pct00011
>디. 하프니엔세_Y51/1-312
데술피토박테리움 하프니엔세 Y51
버전 YP_521192.1 GI:89897705
Figure pct00012
>디. 하프니엔세PCP1/1-288
데술피토박테리움 하프니엔세
버전 AY692340.1 GI:53771772
Figure pct00013
>디. 아세톡시단스/1-277
데술포토마쿨룸 아세톡시단스 DSM 771
버전 YP_003189614.1 GI:258513392
Figure pct00014
tRNA 신테타제를 돌연변이시키는 것에 의해 특정 tRNA 장전 (아미노아실화) 기능이 제공되었으면, 단순히 또 다른 야생형 tRNA 서열, 예를 들어 상기로부터 선택된 것을 사용하는 것이 적합하지 않을 수 있다. 이러한 시나리오에서, 동일한 tRNA 장전 (아미노아실화) 기능을 보존하는 것이 중요할 것이다. 이는 예시적인 tRNA 신테타제 내의 돌연변이(들)를 대안적인 tRNA 신테타제 골격, 예컨대 상기로부터 선택된 것 내로 전달함으로써 달성된다.
이러한 방식으로, 선택된 돌연변이를 상응하는 tRNA 신테타제 서열 예컨대 예시적인 엠. 바르케리 및/또는 엠. 마제이 서열을 넘어서는 다른 생물로부터의 상응하는 pylS 서열에 전달하는 것이 가능하여야 한다.
표적 tRNA 신테타제 단백질/골격은 공지된 tRNA 신테타제 예컨대 예시적인 엠. 바르케리 및/또는 엠. 마제이 서열에 대한 정렬에 의해 선택될 수 있다.
이러한 주제가 이제 pylS (피롤리신 tRNA 신테타제) 서열을 참조로 설명되지만, 관심 대상인 특정 tRNA 신테타제들에 동등하게 원리가 적용된다.
예를 들어, 모든 PylS 서열의 정렬이 제조될 수 있다. 이들은 전체적인 % 서열 동일성이 낮을 수 있다. 따라서, 사용 중인 서열이 실제로 tRNA 신테타제임을 확실히 하도록 (단순히 낮은 서열 동일성 점수를 사용하기보다는) 공지된 tRNA 신테타제에 대해 서열을 정렬하는 것에 의해서와 같이 서열을 연구하는 것이 중요하다.
따라서, 적절하게는, 서열 동일성을 고려 중일 때, 상기와 같은 tRNA 신테타제의 예의 서열에 걸쳐 적절하게 고려된다. 적절하게는, % 동일성은 상기 서열들의 정렬로부터 정의된 바와 같을 수 있다.
촉매 영역에 초점을 맞추는 것이 유용할 수 있다. 이의 목적은 동일한 tRNA 장전 (아미노아실화) 기능, 예를 들어 새로운 아미노산 또는 비천연 아미노산 인식을 야기하기 위해 이식된 돌연변이를 수용하는데 적절한 골격 스캐폴드를 포착/확인하도록 높은 % 동일성이 이로부터 정의될 수 있는 tRNA 촉매 영역을 제공하는 것이다.
따라서, 적절하게는, 서열 동일성을 고려 중일 때, 촉매 영역에 걸쳐 적절하게 고려된다. 적절하게는, % 동일성은 촉매 영역으로부터 정의된 바와 같을 수 있다.
대안적인 tRNA 신테타제 골격 상에 돌연변이를 '전달' 또는 '이식'하는 것은 tRNA 신테타제 골격을 코딩하는 뉴클레오티드 서열의 부위 지정 돌연변이유발에 의해 달성될 수 있다. 이러한 기술은 관련 기술 분야에 널리 공지되어 있다. 본질적으로, 골격 pylS 서열이 선택되고 (예를 들어, 상기 논의된 활성 부위 정렬을 사용함), 선택된 돌연변이가 상응하는/상동성 위치로 전달된다 (즉, 상응하는/상동성 위치에서 이루어진다).
숫자 주소를 사용하여 특정 아미노산 잔기가 지칭되는 경우, 달리 명백하지 않는 한, MbPylRS (메타노사르시나 바르케리 피롤리실-tRNA 신테타제) 아미노산 서열을 기준 서열로 사용하여 (즉, 공개적으로 입수가능한 야생형 메타노사르시나 바르케리 PylS 유전자 접속 번호 Q46E77에 의해 코딩되는 바와 같이) 번호가 매겨진다:
Figure pct00015
이는 관련 기술 분야에서 충분히 이해되는 바와 같이 관심 잔기의 위치를 정하도록 사용된다. 이는 항상 엄격한 카운팅 행위가 아니다 - 정황 또는 정렬에 주의하여야 한다. 예를 들어, 관심 단백질의 길이가 약간 상이하면, (예를 들어) L266에 상응하는 이러한 서열 내에서의 정확한 잔기의 위치는, 단순히 관심 서열의 266번째 잔기를 취하기보다는, 서열들을 정렬하고 등가이거나 상응하는 잔기를 선별하는 것을 필요로 할 수 있다. 이는 숙련된 독자의 영역 내에 속한다.
본원에서 사용된 돌연변이에 대한 표기법은 관련 기술 분야의 표준이다. 예를 들어 L266M은 야생형 서열의 위치 266의 L에 상응하는 아미노산이 M으로 교체된 것을 의미한다.
대안적인 tRNA 골격들 사이에서의 돌연변이의 이식이 이제 예시적인 엠. 바르케리 및 엠. 마제이 서열을 참조로 설명되지만, 동일한 원리가 다른 골격 상으로의 이식 또는 다른 골격으로부터의 이식에 동등하게 적용된다.
예를 들어 Mb AcKRS는 AcK의 혼입을 위한 조작된 신테타제이다.
모 단백질/골격: 엠. 바르케리 PylS
돌연변이: L266V, L270I, Y271F, L274A, C317F
Mb PCKRS: PCK의 혼입을 위한 조작된 신테타제
모 단백질/골격: 엠. 바르케리 PylS
돌연변이: M241F, A267S, Y271C, L274M
이러한 돌연변이들을 엠. 마제이 PylS 내로 이식함으로써 기질 특이성이 동일한 신테타제를 수득할 수 있다. 따라서, Mb 골격으로부터의 Mm tRNA 골격 상으로의 돌연변이 이식에 의해 하기의 신테타제가 생성될 수 있다:
엠. 마제이 PylS 내로 돌연변이 L301V, L305I, Y306F, L309A, C348F가 도입된 Mm AcKRS, 및
엠. 마제이 PylS 내로 돌연변이 M276F, A302S, Y306C, L309M이 도입된 Mm PCKRS.
이러한 예시적인 이식된 돌연변이 신테타제들의 전장 서열이 하기에서 제공된다.
Figure pct00016
Figure pct00017
동일한 원리가 기타 돌연변이 및/또는 기타 골격에 동등하게 적용된다.
유리하게는, 이러한 방식으로 생산된 이식된 폴리펩티드를 테스트하여, 원하는 기능/기질 특이성이 보존되었음을 확실히 하여야 한다.
상기 기술된 방법을 위한 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드를 복제가능한 재조합 벡터 내로 혼입시킬 수 있다. 이러한 벡터는 상용성 숙주 세포 내에서 핵산을 복제하는데 사용될 수 있다. 따라서, 추가적인 실시양태에서, 본 발명은 본 발명의 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고, 벡터를 상용성 숙주 세포 내로 도입하고, 숙주 세포를 벡터 복제를 일으키는 조건 하에 성장시킴으로써 본 발명의 폴리뉴클레오티드를 제조하는 방법을 제공한다. 숙주 세포로부터 벡터를 회수할 수 있다. 적절한 숙주 세포는 세균 예컨대 이. 콜라이를 포함한다.
바람직하게는, 벡터 내의 본 발명의 폴리뉴클레오티드는 숙주 세포에 의한 코딩 서열의 발현을 제공할 수 있는 제어 서열에 작동가능하게 연결되고, 즉 벡터는 발현 벡터이다. "작동가능하게 연결된"이라는 용어는 기술된 성분들이 이들이 이들의 의도된 방식으로 기능하게 허용하는 관계에 있다는 것을 의미한다. 코딩 서열에 "작동가능하게 연결된" 조절 서열은 제어 서열과 상용성인 조건 하에 코딩 서열의 발현이 달성되는 방식으로 결찰된다.
본 발명의 벡터는 본 발명의 단백질을 발현을 제공하도록 기술된 바와 같은 적절한 숙주 세포 내로 형질전환 또는 형질감염될 수 있다. 이러한 프로세스는 상기 기술된 바와 같은 발현 벡터로 형질전환된 숙주 세포를 단백질을 코딩하는 코딩 서열의 벡터에 의한 발현을 제공하는 조건 하에 배양하고, 임의적으로, 발현된 단백질을 회수하는 것을 포함할 수 있다.
예를 들어, 벡터는 복제 기원, 임의적인, 상기 폴리뉴클레오티드의 발현을 위한 프로모터, 및 임의적인, 프로모터의 조절인자가 제공된 플라스미드 또는 바이러스 벡터일 수 있다. 벡터는 하나 이상의 선별성 마커 유전자를 함유할 수 있고, 예를 들어 세균 플라스미드의 경우 앰피실린 저항성 유전자를 함유할 수 있다. 벡터는 예를 들어 숙주 세포를 형질감염 또는 형질전환시키는데 사용될 수 있다.
본 발명의 단백질을 코딩하는 서열에 작동가능하게 연결된 제어 서열은 프로모터/인핸서 및 기타 발현 조절 신호를 포함한다. 이러한 제어 서열은 발현 벡터가 이의 내부에서 사용되도록 디자인된 숙주 세포와 상용성이도록 선택될 수 있다. 프로모터라는 용어는 관련 기술 분야에 널리 공지되어 있고, 크기 및 복합성 면에서 최소 프로모터에서 상류 요소 및 인핸서를 포함하는 프로모터까지의 범위에 이르는 핵산 영역을 포함한다.
본 발명의 또 다른 측면은, 적절하게는 진핵생물 세포에서, 시클로프로펜 함유 아미노산(들)을 선택된 단백질 내로 유전적 및 부위-특이적으로 혼입시키는 방법, 예컨대 시험관내 방법이다. 상기 방법에 의해 유전적으로 혼입시키는 것의 한가지 장점은 일단 형성되면 시클로프로펜 아미노산을 포함하는 단백질을 세포 내로 전달할 필요가 없게 한다는 것인데, 이러한 실시양태에서 이들이 표적 세포 내에서 직접적으로 합성될 수 있기 때문이다. 이러한 방법은 하기의 단계들을 포함한다:
i) 단백질을 코딩하는 뉴클레오티드 서열 내의 원하는 위치에서 직교성 코돈 예컨대 앰버 코돈을 도입하거나 또는 특정 코돈을 직교성 코돈 예컨대 앰버 코돈으로 교체하는 단계
ii) 세포 내에 직교성 tRNA 신테타제/tRNA 쌍, 예컨대 피롤리실-tRNA 신테타제/tRNA 쌍의 발현 시스템을 도입하는 단계
iii) 세포를 본 발명에 따른 시클로프로펜 함유 아미노산이 있는 배지에서 성장시키는 단계.
단계 (i)은 단백질의 유전자 서열 내의 원하는 위치에서 직교성 코돈 예컨대 앰버 코돈을 부과하거나 또는 이러한 코돈으로 특정 코돈을 교체한다. 이는 시클로프로펜 함유 아미노산이 도입/교체되기를 원하는 부위가 직교성 코돈 예컨대 앰버 코돈을 포함하도록 변경된, 단백질을 코딩하는 뉴클레오티드 서열이 있는 구축물, 예컨대 플라스미드를 간단하게 도입하는 것에 의해 달성될 수 있다. 이는 충분히 관련 기술 분야의 숙련자의 능력 내에 속하고, 이의 예가 하기에서 제공된다.
단계 (ii)는 시클로프로펜 함유 아미노산을 원하는 위치 (예를 들어, 앰버 코돈)에서 특이적으로 혼입하는 직교성 발현 시스템을 필요로 한다. 따라서, 특정한 직교성 tRNA 신테타제 예컨대 직교성 피롤리실-tRNA 신테타제 및 특정한 상응하는 직교성 tRNA 쌍으로, 함께 상기 tRNA에 시클로프로펜 함유 아미노산을 장전시킬 수 있는 쌍이 필요하다. 이들의 예가 본원에서 제공된다.
단백질 발현 및 정제
본 발명의 폴리뉴클레오티드를 포함하는 숙주 세포를 사용하여 본 발명의 단백질을 발현시킬 수 있다. 숙주 세포를 본 발명의 단백질의 발현을 허용하는 적절한 조건 하에 배양할 수 있다. 본 발명의 단백질의 발현은 단백질이 계속 생산되도록 구성적일 수 있거나, 또는 유도성이어서 발현을 개시하기 위한 자극을 필요로 할 수 있다. 유도성 발현의 경우, 예를 들어, 유도 인자 물질, 예를 들어 덱사메타손 또는 IPTG를 배양 배지에 첨가하는 것에 의해, 필요할 때 단백질 생산이 개시될 수 있다.
본 발명의 단백질을 효소에 의한 용해, 화학적 용해 및/또는 삼투압 용해 및 물리적 파열을 포함하는 관련 기술 분야에 공지된 다양한 기술에 의해 숙주 세포로부터 추출할 수 있다.
본 발명의 단백질을 관련 기술 분야에 공지된 표준 기술 예컨대 분취용 크로마토그래피, 친화력 정제 또는 임의의 기타 적절한 기술에 의해 정제할 수 있다.
추가적인 장점
유 등은 테트라졸을 폴리펩티드 내의 시클로프로펜 아미노산에 연결시킨다. 유 등은 접합 기를 광활성화시키기 위해 자외선 조사를 사용하는 것을 필요로 한다. 이들의 최상의 반응 속도는 302 나노미터 UV 조사로 달성되었다. 그러나, 이러한 유형의 UV 조사는 이온화 전위가 높다. 이는 복사가 지시되는 분자 및/또는 세포가 이러한 UV 에너지에 의해 손상될 가능성이 있다는 것을 의미한다. 대조적으로, 본 발명의 접합은 광활성화를 위한 어떠한 UV 단계도 필요로 하지 않는다. 심지어 유 등이 덜 손상시키는 UV 조사원 (예를 들어, 365 나노미터 UV 조사)를 사용한 경우에는, 관찰된 반응 속도가 본 발명이 제공한 것보다 상당히 더 느리다. 따라서, UV 처리와 연관된 단점 중 일부를 방지하거나 감소시키려 노력하는 시도로 유 등에서 UV 조사가 조정되더라도, 동일한 곤란한 조사 단계가 여전히 수행되어야 하고, 더 느린 반응 속도가 달성된다. 본 발명의 장점은 UV 조사가 생략될 수 있다는 것과 광활성화 없이도 우수한 반응 속도가 수득된다는 것이다.
본 발명의 시클로프로펜 아미노산의 장점은 조작하기가 쉽다는 것이다. 예를 들어, 합성 경로에서의 단계의 수가 유리하게 소수이다.
유 등의 종래 기술의 시클로프로펜 아미노산은 아미드 기를 함유한다는 것을 주지하여야 한다. 이러한 아미드 결합은 펩티다제에 대한 잠재적인 기질이다. 종래 기술의 시클로프로펜 아미노산의 아미드 결합 상에서의 펩티다제 작용은 분자의 시클로프로펜 부분을 폴리펩티드에서 절단시킬 것이다. 이는 명백하게 결점이다. 대조적으로, 본 발명의 카르바메이트 연결 시클로프로펜 기의 장점은 카르바메이트 결합 시클로프로펜이 펩티다제에 대한 표적이 아니라는 것이다.
종래 기술을 기초로 하는 기법은 접합을 위해 테트라졸 화학에 의존한다. 대조적으로, 본 발명은 유리한 테트라진 화학을 사용하는 것을 교시한다.
본 발명의 카르바메이트 결합 시클로프로펜 아미노산의 장점은 야생형 PylRS 신테타제를 사용할 수 있게 한다는 것이다. 야생형 신테타제를 사용하는 것은 돌연변이체 신테타제를 제조할 필요를 경감시킴으로써 더 적은 작업을 수반하기 때문에 유리하다. 추가적으로, 돌연변이체 신테타제는 항상 야생형 tRNA 신테타제와 동일한 수준으로 tRNA를 아미노 아실화시키지 않는다. 달리 말하면, 종래 기술의 시클로프로펜이 아미드 결합된 아미노산을 취급하기 위해 신테타제를 제조하는데 요구되는 돌연변이는 아미노 아실화 효율의 손실을 야기할 수 있다. 대조적으로, 본 발명의 아미노산과 함께 야생형 신테타제를 사용하는 아미노 아실화는 매우 효율적인 프로세스임이 본원에서 실연되고, 이는 종래 기술의 기법에 비해 추가적인 장점이다.
추가적인 특정한 바람직한 측면이 첨부된 독립항 및 종속항에서 기재된다. 종속항의 특색들은 적합하게, 그리고 특허청구범위에 명시적으로 기재된 것들 이외의 조합으로 독립항의 특색들과 조합될 수 있다.
장치 특색이 기능을 제공하도록 작동가능한 것으로 기술된 경우에, 이는 이러한 기능을 제공하거나 또는 이러한 기능을 제공하도록 개조 또는 구성된 장치 특색을 포함하는 것으로 이해될 것이다.
도면의 간단한 설명
첨부된 도면을 참조로 이제 본 발명의 실시양태들이 추가로 기술될 것이다.
1 SORT-M은 다양한 코돈에서, 다양한 화학물질로, 그리고 유전적으로 표적화된 세포 및 조직에서 프로테옴 태그부착 및 표지화를 가능하게 한다. ( a) SORT (번역의 확률적 직교성 리코딩(stochastic orthogonal recoding of translation)를 통한 프로테옴 표지부착은 직교성 아미노아실-tRNA 신테타제/tRNA 쌍을 사용한다. 피롤리실-tRNA 신테타제/tRNA 쌍이 이러한 연구에서 사용된다. 이러한 신테타제 (및 이의 이전에 진화된 활성-부위 변이체)는 광범위한 비천연 아미노산 (황색 별, 및 황색 육각형)을 인식하고, 내인성 tRNA는 아미노아실화시키지 않지만, 이의 동족 tRNA는 - 안티코돈 신원과 관계 없이- 효율적으로 아미노아실화시킨다; PyltRNA는 내인성 아미노아실-tRNA 신테타제에 대한 기질이 아니다. 안티코돈이 변경된 직교성 피롤리실-tRNA 신테타제/tRNAXXX 쌍 (XXX는 선택된 안티코돈을 가리킨다, 황색)은 천연 아미노산을 지시하도록 천연 신테타제 및 tRNA (진청색 및 분홍색)가 사용하는 것에 대해 직교성인 경로를 통해 센스 코돈 (진청색 및 분홍색)의 디코딩에 대해 경쟁한다. SORT는 다양한 코돈에 반응하여 프로테옴 내로 다양한 화학 기가 혼입되게 한다. 직교성 신테타제의 활성 부위에서의 경쟁이 없기 때문에, 고갈 및 최소 배지가 필요하지 않다. 추가적으로, 직교성 프로테옴 태그부착 시스템의 발현 패턴이 유전적으로 지시되어 조직 특이적 프로테옴 표지화를 허용할 수 있다. 선택 압력 혼입 접근법이 SORT와의 비교를 위해 보충 도 1에서 제시된다. ( b) SORT를 통해 프로테옴에 걸쳐 아미노산 (1-3)을 코딩하는 것과 테트라진 프로브 (4a-g, 5, 67)로의 3의 화학선택적 변형을 조합하는 것은 표지된 단백질을 SORT-M (번역의 확률적 직교성 리코딩 & 화학선택적 변형(stochastic orthogonal recoding of translation and chemoselective modification))을 통해 검출하는 것을 허용한다. 아미노산 구조: N ε-((tert-부톡시)카르보닐)-L-리신 1, N ε-(1-프로피닐옥시)카르보닐)-L-리신 2N ε-(((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐)-L-리신.
도 2 ( 보충 도 2)는 이. 콜라이에서 발현된 단백질 내로의 3의 정량적, 부위-특이적 혼입, 및 테트라진 프로브로의 이의 신속하고 정량적인 표지화를 나타낸다.
A. PylRS/tRNACUA 쌍이 위치 150에서의 앰버 정지 코돈을 보유하는 sfGFP 내로의 3의 효율적이고 부위-특이적인 혼입을 지시한다. 3의 혼입은 PylRS/tRNACUA 쌍에 대한 확립된 우수한 기질인 1보다 더 효율적이다.
B. 3을 보유하는 2 nmol sfGFP의 10 당량의 테트라진 형광단 4a로의 특이적이고 정량적인 표지화. PylRS/tRNACUA 쌍 및 SfGFP150TAG를 보유하는 1 mM 3과 함께 성장된 이. 콜라이로부터 정제된 sfGFP-3의 ESI-MS 분석에서 3의 혼입이 확인된다. sfGFP150-3: 예상 질량: 27951.5 Da, 측정 질량: 27950 ± 1.0 Da, N-말단 메티오닌의 상실에 상응하는 마이너 피크 27820. sfGFP150-34a로 표지하는 것은 표지화 반응의 ESI-MS에 의해 판단된 바와 같이 정량적이다. 예상 질량: 28758.4 Da, 측정 질량: 28758 ± 1.0 Da, 마이너 피크 28627은 N-말단 메티오닌의 상실에 상응함.
C. sfGFP-3 (10.6 μM, 위치 150에서 3이 혼입된 sfGFP)을 10 당량의 4a로 표지하는 것에 대한 속도 상수의 결정. 2 nmol의 정제된 sfGFP-3 (20 mM 트리스(Tris)-HCl, 100 mM NaCl, 2 mM EDTA, pH 7.4 내의 10.6 μM)을 20 nmol의 테트라진-염료 접합체 4a (DMSO 내의 2 mM 용액 10 ㎕)와 함께 인큐베이션하였다. 상이한 시점들에, 8 ㎕ 분취량을 용액으로부터 취하고, 700배 과량의 BCN으로 켄칭(quenching)시키고, 액체 질소 내로 플런징(plunging)하였다. 샘플을 5% β-메르캅토에탄올이 보충된 NuPAGE LDS 샘플 완충제와 혼합하고, 10분 동안 90℃로 가열하고, 4-12% SDS PAGE로 분석하였다. 표지된 단백질의 양을 형광 밴드를 타이푼 트리오(Typhoon Trio) 포스포이미저(phosphoimager) (지이 라이프 사이언시즈(GE Life Sciences))로 스캐닝하여 정량하였다. 고무 밴드 배경 차감을 사용하여 이미지퀀트(ImageQuant)™ TL 소프트웨어 (지이 라이프 사이언시즈)로 밴드를 정량하였다. 데이터를 단일-지수 방정식에 피팅하여 속도 상수를 결정하였다. 계산된 관측 속도 k'를 4a의 농도로 나눠서 반응에 대한 속도 상수 k를 수득하였다. 3중으로 측정하였다. 모든 데이터 프로세싱은 칼레이다그래프(Kaleidagraph) 소프트웨어 (시너지 소프트웨어(Synergy Software), 영국 레딩)를 사용하여 수행하였다. 비교를 위해, PylRS에 대한 공지된 기질인 Nε-5-노르보르넨-2-일옥시카르보닐-L-리신 (NorK)을 보유하는 sfGFP를 표지하는 것의 속도를 11.25 μM의 위치 150에 NorK를 보유하는 sfGFP (SfGFP-NorK) 및 20 당량의 4a를 사용하여 유사한 방식으로 결정하였다.
도 3은 보충 표 1 - 프라이머를 나타낸다.
도 4 ( 보충 도 3)는 SORT-M이 이. 콜라이에서 코돈 특이적 프로테옴 태그부착 및 표지화를 가능하게 한다는 것을 나타낸다.
A. 지시된 PylRS/tRNAXXX 쌍을 통한 3으로의 프로테옴 표지화. 세포는 1개는 MbPylRS를 코딩하고 다른 1개는 T4 리소자임 및 지시된 tRNAXXX를 코딩하는 2개의 플라스미드를 함유하였다. 세포를 OD600=0.2로부터 0.1 mM 3의 존재 하에 성장시키고, 1시간 후에 0.2 mM 아라비노스 첨가로 T4 리소자임 발현을 유도하였다. 추가적인 3시간 후, 세포를 수확하였다. 용해물 내의 태그가 부착된 단백질을 혼입된 3과 테트라진 형광단 4a (20 mM, 1시간, 실온) 사이의 역 전자 요구 딜스-알더 반응을 통해 검출하였다. 괄호 안의 아미노산은 상응하는 안티-코돈을 보유하는 내인성 tRNA에 의해 코딩된 천연 아미노산이다. B. 각각의 코돈에 대한 레인 프로필 분석.
도 5 ( 보충 도 4)는 ESI -MS에 의해 실연된 SORT에서의 특이적 아미노산 교체를 나타낸다.
1 mM 3의 존재 하에서의 UUU(Lys)로의 SORT 후에 단리된 T4 리소자임. 예상 질량 WT T4 리소자임: 19512.2 Da, 측정 질량: 19510 ± 2.0 Da. 예상 질량 WT T4 리소자임 Lys→3 단일 돌연변이: 19622.3 Da, 측정 질량: 19620 ± 2.0 Da.
도 6 ( 보충 도 5)은 SORT-M을 통한 3 (0.1 mM )의 혼입이 세포에 독성이지 않다는 것을 나타낸다.
화학적으로 수용성인 DH10B 세포를 2개의 플라스미드로 형질전환시켰다: PylRS의 발현에 필요한 pBKwtPylRS, 및 PyltRNAXXX의 발현에 요구되고 아라비노스 제어 하에 리소자임을 발현하는 pBAD_wtT4L_MbPylTXXX 플라스미드. 세포를 37℃에서 1시간 동안 1 ml SOB 배지에서 회수한 후, 10 ml LB-KT (LB 배지 + 50 ㎍/ml 카나마이신, 및 25 ㎍/ml 테트라사이클린)로 분취하고, 철야로 인큐베이션하였다 (37℃, 250 rpm, 12시간). 철야 배양물 (OD600
Figure pct00018
3)을 0, 0.1, 0.5 mM의 상이한 농도의 3이 보충된 10 mL LB-KT1/2 (LB 배지 + 25 ㎍/ml 카나마이신, 및 12.5 ㎍/ml 테트라사이클린)에서 OD600 ~0.3으로 희석하였다. 이러한 배양물의 200 ㎕ 분취량을 96-웰 플레이트 내로 옮기고, 마이크로플레이트 판독기인 인피니트 200 프로(Infinite 200 Pro) (테칸(TECAN))를 사용하여 OD600을 측정하였다. 측정들 사이에 1 mm 선형으로 진탕시키면서 10분 마다 각각의 샘플에 대해 OD600 을 측정하였다.
도 7 ( 보충 도 6)은 AAA 코돈에 반응하여 3의 상이한 농도들에서 SORT-M을 통해 프로테옴 내에 3이 혼입되는 것의 시간-의존적 변동의 측정을 나타낸다.
화학적으로 수용성인 DH10B 세포를 2개의 플라스미드로 형질전환시켰다: PylRS의 발현에 필요한 pBKwtPylRS, 및 PyltRNAUUU의 발현에 요구되는 pBAD_wtT4L_MbPylTUUU 플라스미드. pBAD_wtT4L_MbPylTUUU 플라스미드는 아라비노스-유도성 프로모터의 하류인 T4 리소자임의 발현을 위한 유전자를 또한 함유한다. 형질전환 후, 세포를 37℃에서 1시간 동안 1 ml SOB 배지에서 회수한 후, 10 ml LB-KT (LB 배지 + 50 ㎍/ml 카나마이신, 및 25 ㎍/ml 테트라사이클린)에 접종하였다. 배양물을 철야로 인큐베이션하고 (37℃, 250 rpm, 12시간), 이어서 0, 0.1, 0.5 mM의 상이한 농도의 3이 보충된 30 mL LB-KT1/2 (LB 배지 + 25 ㎍/ml 카나마이신, 및 12.5 ㎍/ml 테트라사이클린)에서 OD600 ~0.3으로 희석하였다. 배양물을 1시간 동안 인큐베이션하였고 (37°C, 250 rpm), 이때 OD600이 약 0.6에 도달하였다. 3가지 배양물 각각에 대해 2 ml 배양 분취물을 별도의 튜브에서 수집하였다. 이는 유도-전 배양물 (겔 영상에서 1로 표지된 레인)이다. 이어서, 아라비노스를 0.2% (v/v)의 최종 농도로 첨가하여 T4 리소자임의 발현을 유도하고, 2 mL의 배양 분취물을 매 시간마다 수집하였다 (유도 후 1, 2 및 3시간 배양 수집물에 상응하는 2, 3 및 4로 표지된 레인). 수집된 배양물 각각에 대해, 세균 세포를 4℃에서 원심분리로 펠릿화시키고, 빙냉 PBS (3 x 1 mL)로 세정하고, 이어서 펠릿을 냉동시키고, -20℃에서 보관하였다. 그 후, 펠릿을 200 ㎕의 빙냉 PBS에서 해동시키고, 초음파처리로 용해시켰다 (9 × 10초 온(ON)/20초 오프(OFF), 70% 파워).  용해물을 30분 동안 15,000 RPM, 4℃에서의 원심분리로 정화하였다. 상청액을 신선한 1.5 mL 튜브로 옮겼다. 50 ㎕의 상청액을 표지화 반응을 위해 새로운 튜브로 옮기고, 나머지는 액체 질소에서 냉동시키고, -80℃에서 보관하였다.  50 ㎕의 상청액에, 0.5 ㎕의 2 mM 4a를 첨가하고, 용해물을 25℃에서 1시간 동안 인큐베이션하였다. 1시간 후, 17 ㎕의 보충 (6 mM BCN 및 5% BME)된 4× LDS 샘플 완충제를 첨가하고, 부드럽게 와동시켜 혼합하였다. 샘플을 10분 동안 인큐베이션한 후, 90℃에서 10분 동안 비등시켰다. 샘플을 4-12% SDS-PAGE로 분석하고, 타이푼 트리오 포스포이미저 (지이 라이프 사이언시즈)를 사용하여 형광 영상을 취득하였다.
도 8은 인간 세포에서의 다양한 코돈에서의 단백질 내로의 3의 부위-특이적 혼입 및 SORT-M을 사용한 특이적 프로테옴 표지화를 나타낸다. ( a) 웨스턴 블롯 분석이 HEK293T 세포에서의 C-말단 HA-태그를 보유하는 앰버 정지 코돈에 의해 분리된 mCherry-EGFP 융합 단백질 (mCh-TAG-EGFP-HA)의 효율적인 아미노산 의존적 발현을 실연한다. 항-FLAG로 태그가 부착된 PylRS가 검출되었다. ( b) mCh-TAG-EGFP-HA (106 개의 세포로부터 면역침전됨)의 4a (50 ㎕ PBS 내의 20 μM, 1시간, 실온)로의 특이적 표지화로 HEK293 세포에서의 단백질 내로의 3의 혼입이 확인된다. ( c) 0.5 mM 3을 사용하여 6개의 상이한 PylRS/PyltRNAXXX 돌연변이체에 의해 지시된 포유동물 세포의 전체 프로테옴에 걸쳐 새롭게 합성된 단백질 내로 통계적으로 혼입된 3의 SORT-M 표지화. 4g (PBS 내의 20 μM, 1시간, 실온, 상기와 같음)로의 표지화. 괄호 안의 아미노산은 상응하는 안티-코돈을 보유하는 내인성 tRNA에 의해 코딩된 천연 아미노산이다.
도 9 ( 보충 도 11)는 하기를 나타낸다
A. 도 8로부터의 전체 블롯.
B. 도 10으로부터의 전체 블롯.
도 10은 드로소필라 멜라노가스터(Drosophila melanogaster)에서 생산된 단백질 내로의 아미노산 3의 부위-특이적 혼입을 나타낸다. ( a) 이중 루시페라제 리포터에 의해 실연된 3의 혼입. 10 mM 1 또는 10 mM 3의 존재 또는 부재 하의 삼중-Rep-L을 발현하는 10마리의 암컷 파리로부터의 난소 추출물 상에서의 이중 루시페라제 검정법. 데이터는 3개의 생물학적 반복물 중 1개로부터의 대표적인 예를 나타낸다. 오차 막대는 1개의 생물학적 반복물로부터의 3개의 기술적 반복물의 표준 편차를 나타낸다. ( b) PylRS/PyltRNACUA를 발현하는 파리에서의 GFP_TAG_mCherry-HA 내로의 3 (또는 1)의 부위-특이적 혼입. 비천연 아미노산 혼입으로부터 생성된 전장 단백질이 항-HA 웨스턴 블롯에 의해 검출된다. ( c) 코딩된 3의 테트라진 프로브로의 특이적 표지화. 파리에 아미노산이 급식되지 않거나, 아미노산 1 (500마리의 파리) 또는 아미노산 3 (100마리의 파리)이 급식되었다. 필적하는 양의 리포터 단백질을 생성시키기 위해 5배 더 많은 파리에 1이 급식되었다. 비천연 아미노산을 함유하는 전장 단백질을 용해된 난소로부터 항-GFP 비드로 면역침전시켰다. 비드를 표지시키고 (4g, 4 μM, 200 ㎕ PBS, 실온, 2시간), 세정하였다. 전장 단백질을 항-HA 블롯으로 검출하였고, 형광 스캐너 상에서 영상화된 동일한 겔은 3이 혼입된 단백질의 특이적 형광 표지화를 나타내지만, 1은 그렇지 않아, 혼입된 아미노산의 신원이 확인된다.
도 11 ( 실시예 6) 유전적으로 코딩된 비천연 아미노산 12에서의 특이적 단백질 표지화. (a) 칼모듈린 내의 유전적으로 코딩된 1이 프로브 3으로 특이적으로 표지되지만, 2는 그렇지 않다. 쿠마시 및 형광 영상은 표지화의 특이성을 실연하고, 표지화 전 (흑색, 예상 질량: 17875, 측정 질량: 17874) 및 표지화 후 (적색, 예상 질량: 18553, 측정 질량: 18552)의 ESI MS는 반응이 정량적이라는 것을 실연한다. (b) 칼모듈린 내의 유전적으로 코딩된 2가 프로브 4로 특이적으로 표지되지만, 1은 그렇지 않다. 쿠마시 및 형광 영상은 표지화의 특이성을 실연하고, 표지화 전 (흑색, 예상 질량: 17930, 측정 질량: 17930) 및 표지화 후 (녹색, 예상 질량: 18484, 측정 질량: 18485)의 ESI MS는 반응이 정량적이라는 것을 실연한다.미가공 (디컨볼루션(deconvolution) 전) ESI-MS 스펙트럼은 제시되지 않는다.
도 12 ( 실시예 6) 칼모듈린의 위치 1 및 40에서의 12의 혼입 및 특이적 표지화의 동역학. (a) ribo-Q1, O-gst - cam 1TAG - 40AGTA , PylRS/tRNAUACU 쌍 및 MjPrpRS/tRNACUA 쌍을 보유하는 이. 콜라이에서 발현이 수행되었다. 아미노산 12는 각각 4 및 1 mM로 사용되었다. (b) CaM1 1 2 4034의 반응에 대한 표지화 시간 과정. 겔-내 형광 및 이동성 시프트에 의해 각각의 반응을 2시간 동안 추적하였다.
도 13 ( 실시예 6) 30분 내의 칼모듈린의 협동적이고 정량적인 단일 용기에서의 이중 표지화. (a) CaM1 1 2 40의 염료 의존적 표지화; 레인 4 - 순차적 표지화 & 1차 표지화 후의 정제, 레인 5 - 정제 없이 순차적 표지화, 레인 6 - 단일 용기에서의 이중 표지화. (b) 표지화 전 (흑색, 예상 질량: 18000 측정 질량: 18000), 표지화 후 (금색, 예상 질량: 19233 측정 질량: 19234)의 단일 용기에서의 단백질 표지화의 ESI-MS. 미가공 (디컨볼루션 전) ESI-MS 스펙트럼은 제시되지 않는다.
도 14는 설계 A를 나타낸다
도 15 ( 보충 도 15)는 드로소필라(Drosophila) GFP-앰버-mCherry-HA의 아미노산 및 DNA 서열을 나타낸다.
GFP (아미노산 잔기 1-238), 위치 248의 앰버 코돈, mCherry (아미노산 잔기 255-489), HA 태그 (아미노산 잔기 491-499), Myc 태그 (아미노산 잔기 500-509), His 태그 (아미노산 잔기 510-515) 및 SV40 NLS (아미노산 잔기 523-528).
도 16은 예시적인 아미노산 N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신의 구조를 나타낸다.
실시예 - 실시양태의 설명
첨부된 도면을 참조로 본 발명의 예시적인 실시양태들이 본원에서 상세하게 개시되었지만, 본 발명이 정확한 실시양태에 한정되지 않고, 첨부된 특허청구범위 및 이의 등가물에서 정의된 바와 같은 본 발명의 범주를 벗어나지 않으면서 관련 기술 분야의 숙련자에 의해 본 발명에서 다양한 변화 및 변형이 초래될 수 있는 것으로 이해된다.
화학적 합성 -일반적인 방법
모든 화학물질 및 용매는 시그마-알드리치(Sigma-Alrich), 알파 에이사(Alfa Aesar) 또는 피셔 사이언티픽(Fisher Scientific)으로부터 구입하였고, 달리 언급되지 않는 한 추가적인 정제 없이 사용하였다. 실리카 (머크(Merck) TLC 60F-254)로 코팅된 알루미늄 시트 상에서 박층 크로마토그래피 (TLC)에 의한 정성적 분석을 수행하였다. 스팟(spot)을 단파장 자외선 램프 (254 nm) 하에서 가시화하거나, 또는 염기성, 수성 과망간산칼륨, 에탄올성 닌히드린 또는 바닐린으로 염색하였다. 실리카 겔 60 (메시 230-400) 상에서 특정 용매 시스템으로 플래시 칼럼 크로마토그래피를 수행하였다.
애질런트(Agilent) 1200 기계 상에서 LC-MS 분석을 수행하였다. 사용된 용매는 물 내의 0.2% 포름산 (완충제 A) 및 아세토니트릴 내의 0.2% 포름산 (완충제 B)로 이루어졌다. 페노메넥스 주피터(Phenomenex Jupiter) C18 칼럼 (150 × 2 mm, 5 ㎛)을 사용하여 LC를 수행하였고, 다양한 파장을 사용하여 모니터링하였다. 체류 시간 (Rt)은 최근접 0.1분으로, m/z 비는 최근접 0.01 질량 단위로 기록된다. 하기의 프로그램이 소형 분자 LC 구배에 사용되었다: 0-1분 (A:B 10:90-10:90, 0.3 mL/분), 1-8분 (A:B 10:90-90:10, 0.3 mL/분), 8-10분 (A:B 90:10-90:10, 0.3 mL/분), 10-12 (A:B 90:10-10:90, 0.3 mL/분).
6130 사중극자(Quadrupole) 분광계 상에서 ESI 모드로 LC 후의 질량 분광법 분석을 수행하였고, 양이온 및 음이온 모드 양쪽 모두로 기록하였다. 브루커(Bruker) 400MHz 기구 상에서 NMR 분석을 수행하였다. TMS에 대해 상대적인 모든 기록된 화학적 시프트 (δ)는 사용된 중수소화 용매 내의 잔류 양성자를 기준으로 하였다: d 1 - 클로로포름 (1H δ = 7.26 ppm, 13C δ = 77.16 ppm), d 6 - 디메틸 술폭시드 (1H δ = 2.49 ppm, 13C δ = 39.52 ppm), D2O (1H δ = 4.70). 필요한 경우 분석에 사용된 추가적인 정보를 제공하기 위해 APT 또는 2차원 실험 (COSY, HSQC)을 항상 수행하였다. 커플링 상수는 Hz로 제공되고 하기와 같이 기술된다: 단일선 - s, 이중선 - d, 삼중선 - t, 사중선 - q, 광폭 단일선 - br, 다중선 - m, 이중 이중선 - dd 등, 및 이들의 조합.
이. 콜라이에서의 단백질 발현, 정제, 및 부위-특이적으로 혼입된 3의 표지화
이. 콜라이로부터의 sfGFP - 3 의 발현 및 정제 전기수용성(electrocompetent) 이. 콜라이 DH10B 세포를 pBK-MbPylRS 및 psfGFP150TAG PylT로 형질전환시켰다14 , 26. 형질전환된 세포를 37℃에서 1시간 동안 S.O.B. (1 mL, 0.2% 글루코스가 보충됨)에서 회수하고, 50 ㎍/mL 카나마이신 및 25 ㎍/mL 테트라사이클린을 함유하는 LB (LB-KT)에 접종하는데 사용하였다. 37℃, 250 r.p.m에서 철야로 진탕하면서 세포를 인큐베이션하였다. 1 mL의 철야 배양물을 사용하여 100 mL의 LB-KT½에 접종한 후, 주간 배양물을 인큐베이션하였다 (37℃, 250 r.p.m). O.D.600 ~0.3에서, 배양물을 균등하게 나누고, 3 (1 mM) 또는 H2O (500 ㎕)를 보충하고, 추가로 인큐베이션하였다 (37℃, 250 r.p.m). O.D.600 ~0.6에서, 아라비노스 (0.2%)를 첨가하여 단백질 발현을 유도하고, 4시간 후, 원심분리 (4000 r.p.m, 20분)로 세포를 수확하고, 추가로 사용할 때까지 펠릿을 냉동시켰다.
냉동된 세균 펠릿을 얼음 상에서 행동시키고, 2.5 mL 용해 완충제 (버그부스터(Bugbuster)®, 노바겐(Novagen)®, 50 ㎍/mL DNAse 1, 로슈(Roche) 억제제 칵테일 및 20 mM 이미다졸)에 재현탁시켰다. 세포를 인큐베이션한 후 (4℃, 30분), 원심분리 (16000 g, 4℃, 30분)로 정화하였다. 정화된 용해물을 신선한 튜브로 옮기고, 100 ㎕ Ni-NTA 슬러리를 첨가하였다. 혼합물을 진탕하면서 인큐베이션한 후 (4℃, 1시간), 원심분리 (1000 g, 4℃, 5분)로 수집하였다. 비드를 500 ㎕ 세정 완충제 (10 mM 트리스-HCL, 40 mM 이미다졸, 200 mM NaCl, pH 8)에 3회 재현탁시키고, 원심분리 (1000 g, 4℃, 5분)로 수집하였다. 마지막으로, 비드를 100 ㎕ 용출 완충제 (10 mM 트리스-HCL, 300 mM 이미다졸, 200 mM NaCl, pH 8)에 재현탁시키고, 원심분리 (1000 g, 4℃, 5분)로 펠릿화시키고, 상청액을 신선한 튜브 내로 수집하였다. 100 ㎕의 용출 완충제로 용출을 3회 반복하였다. 정제된 단백질을 4-12% SDS-PAGE 및 LC-MS로 분석하였다.
단백질 질량 분광법
애질런트 1200 LC-MS 시스템을 사용하여, 6130 사중극자 분광계로 ESI-MS를 추가적으로 수행하였다. 용매 시스템은 완충제 A로서의 H2O 내의 0.1% 포름산 및 완충제 B로서의 아세토니트릴 (MeCN) 내의 0.1% 포름산으로 이루어졌다. 단백질 UV 흡광도를 214 및 280 nm에서 모니터링하였다. 양이온 모드로 단백질 MS 획득을 수행하고, 총 단백질 질량을 MS 케모스테이션(Chemstation) 소프트웨어 (애질런트 테크놀러지즈(Agilent Technologies))에서의 디컨볼루션에 의해 계산하였다.
정제된 sfGFP150 - 3 시험관내 표지화
정제된 sfGFP150-1 또는 sfGFP150-3 단백질 (~30 μM, 용출 완충제 내)에 4a (DMSO 내의 2 mM 모액으로부터의 10 몰 당량)를 첨가하였다. 여러 번 흡인하여 반응물들을 혼합한 후, 혼합물을 실온에서 2시간 동안 인큐베이션하고, 샘플을 ESI-MS로 분석하였다. 인큐베이션 후, 단백질을 4-12% SDS-PAGE로 분리하고, 타이푼 트리오 포스포이미저 (지이 라이프 사이언시즈)를 사용하여 분석하였다.
sfGFP150 - 3 sfGFP150 - NorK 표지화의 시간 과정 및 속도 상수 결정
20 nmol의 테트라진-염료 접합체 4a (DMSO 내의 2 mM 용액 10 ㎕)를 첨가함으로써 2 nmol sfGFP-3 (10.6 μM)을 실온에서 표지시켰다. 여러 번 흡인하여 샘플을 혼합하였다. 상이한 시점들에, 8 ㎕ 분취량을 용액으로부터 취하고, 700배 과량의 비시클로[6.1.0]논-4-인-9-일메탄올 (BCN)로 켄칭시키고, 액체 질소 내로 플런징하였다. 샘플을 5% β-메르캅토에탄올이 보충된 NuPAGE LDS 샘플 완충제와 혼합하고, 10분 동안 90℃로 가열하고, 4-12% SDS PAGE로 분석하였다. 표지된 단백질의 양을 형광 밴드를 타이푼 트리오 포스포이미저 (지이 라이프 사이언시즈)로 스캐닝하여 정량하였다. 고무 밴드 배경 차감을 사용하여 이미지퀀트™ TL 소프트웨어 (지이 라이프 사이언시즈)로 밴드를 정량하였다. 데이터를 단일-지수 방정식에 피팅하여 속도 상수를 결정하였다. 계산된 관측 속도 k'를 4a의 농도로 나눠서 반응에 대한 속도 상수 k를 수득하였다. 3중으로 측정하였다. 모든 데이터 프로세싱은 칼레이다그래프 소프트웨어 (시너지 소프트웨어, 영국 레딩)를 사용하여 수행하였다. 비교를 위해, PylRS에 대한 공지된 기질인 Ne-5-노르보르넨-2-일옥시카르보닐-L-리신 (NorK)을 보유하는 sfGFP를 표지하는 것의 속도를 11.25 mM의 위치 150에 NorK를 보유하는 sfGFP (SfGFP-NorK) 및 20 당량의 4a를 사용하여 유사한 방식으로 결정하였다.
pBAD _ wtT4L _ MbPylT XXX 대한 플라스미드 구축
pBAD_T4L83TAG_MbPylTCUANcoI KpnI 제한 효소로 소화시켰다. 동일한 제한 효소를 또한 사용하여 야생형 T4 리소자임을 (D67) pBAD_wtT4L로부터 소화시켰다. 삽입물 및 골격을 T4 DNA 리가제를 사용하여 3:1 비로 결찰시키고 (실온, 2시간), 화학적으로 수용성인 DH10B 세포 내로 형질전환시키고, 테트라사이클린 한천 플레이트에서 성장시켰다 (37°C, 18시간). 단일 콜로니를 채집하고, 정확한 서열을 DNA 시퀀싱 (GATC 게엠베하(GATC Gmbh.))로 확인하였으며, 이러한 단계로 pBAD_wtT4L_MbPylTCUA가 생성되었다. 모든 최종 구축물을 DNA 시퀀싱에 의해 확인하였다.
T4 리소자임을 발현하는 이. 콜라이에서의 SORT를 통한 3 의 프로테옴 혼입
전기수용성 이. 콜라이 DH10B 세포 (50 ㎕)를 pBAD_wtT4L_MbPylTXXX 플라스미드 (2 ㎕, PyltRNAXXX의 발현에 필요하고 아라비노스 제어 하에 T4 리소자임을 발현함) 및 pBKwtPylS 플라스미드 (2 ㎕, PylRS의 발현에 필요함)로 이중으로 형질전환시키거나, 또는 pBAD_wtT4L_MbPylTXXX 단독으로 단일하게 형질전환시켰다. 형질전환된 세포를 37℃에서 1시간 동안 1 mL S.O.B. (0.2% 글루코스가 보충됨)에서 회수하였다. 100 ㎕의 회수물을 사용하여 5 mL LB-KT (50 ㎍/mL 카나마이신 및 25 ㎍/mL 테트라사이클린) 또는 LB-T (25 ㎍/mL 테트라사이클린)에 접종하였다. 배양물을 철야로 인큐베이션하였다 (37℃, 250 r.p.m.). 1 mL의 각각의 철야 배양물을 사용하여, 15 mL의 ½ 강도의 항생제를 함유하는 배지 LB-T 또는 LB-KT에 접종하였다. O.D.600 ~0.3에 도달할 때까지 배양물을 37°C에서 인큐베이션하고, 이러한 시점에 각각의 배양물을 5 mL 분취량으로 나누고, 3 (0.1 mM 최종 농도) 또는 H2O (50 ㎕)를 보충하였다. 그 후, 배양물을 인큐베이션하였다 (37℃, 250 r.p.m.). O.D.600 0.6에서, 아라비노스 (0.2% 최종 농도)를 첨가하여 T4 리소자임 발현을 개시시키고, 배양물을 추가로 4시간 동안 인큐베이션하였다. 세포를 원심분리 (4000 rpm, 4℃, 20분)로 수확한 후, 1 mL의 빙냉 PBS에 3회 재현탁시키고, 원심분리 (4000 rpm, 4℃, 20분)로 수집하였다. 최종 세균 펠릿을 보관을 위해 즉각적으로 냉동시켰다.
이. 콜라이 : 3 으로 태그가 부착된 프로테옴의 테트라진 -염료 접합체로의 화학선택적 표지화
냉동된 세균 펠릿을 500 ㎕ PBS에 재현탁시키고, 배스(bath) 초음파처리기 (에너지 출력 7.0, 90초의 총 초음파처리 시간, 10초 블라스트(blast) 및 20초 중단, 미소닉스 소니케이터(Misonix Sonicator) 3000)를 사용하여 용해시켰다. 용해물을 원심분리 (4℃, 14000 r.p.m., 30분)로 정화하고, 상청액을 신선한 튜브로 흡인하였다. 50 ㎕의 정화된 세포 용해물에 4a (2 mM, DMSO 내의 모액, 최종 농도 - 20 μM)를 첨가하였다. 여러번 흡인하여 반응물을 혼합한 후, 샘플을 암실에서 인큐베이션하였다 (실온, 1 h). 이러한 시간 후, 17 ㎕의 보충 (6 mM BCN 및 5% BME)된 4× LDS 샘플 완충제를 첨가하고, 부드럽게 와동시켜 혼합하였다. 샘플을 10분 동안 인큐베이션한 후, 90℃에서 10분 동안 비등시켰다. 샘플을 4-12% SDS-PAGE로 분석하고, 타이푼 트리오 포스포이미저 (지이 라이프 사이언시즈)를 사용하여 형광 영상을 취득하였다.
이. 콜라이 단백질의 형광 표지화를 위한 동일한 프로토콜을 모든 테트라진-염료 접합체에 적용하였다.
HEK293 세포에서의 3의 부위-특이적 혼입 및 테트라진 프로브로의 화학선택적 표지화
HEK 세포에서의 3 의 부위-특이적 혼입
HEK293 세포 (ATCC CRL-1573)를 24웰 플레이트 상에 플레이팅하고, 전면성장에 가깝게 성장시켰다. 리포펙타민(Lipofectamine) 2000 (인비트젠(Invitrogen))을 사용하여 세포를 pMmPylS-mCherry-TAG-EGFP-HA 구축물 및 p4CMVE-U6-PylT 구축물로 형질감염시켰다.18 1 mM 3의 존재 또는 부재 또는 1 mM 1의 존재 하에 16시간 동안 성장시킨 후, RIPA 완충제 (시그마(Sigma))를 사용하여 세포를 얼음 상에서 용해시켰다. 용해물을 스피닝(spinning)으로 침강시키고, 상청액을 4× LDS 샘플 완충제 (라이프 테크놀러지즈(Life technologies))에 첨가하였다. 샘플을 SDS-PAGE로 러닝시키고, 니트로셀룰로스 막으로 옮기고, 1차 래트 항--HA (클론 3F10, 로슈(Roche), No. 1 867 423) 및 마우스 항-FLAG (클론 G191, 앱노바(Abnova), 카탈로그 MAB8183)를 사용하여 블롯팅(blotting)하였으며, 2차 항체는 항-래트 (인비트로젠, A11077) 및 항-마우스 (셀 시그널링 테크놀러지즈(Cell Signaling Technologies), No. 7076S)였다.
HEK 293 세포로부터의 부위-특이적으로 혼입된 3 의 표지화
부착성 HEK293T 세포 (ATCC CRL-11268; 4×106개/면역침전)를 트랜스잇(TransIT)-293 형질감염 시약을 사용하여 제조사의 프로토콜에 따라 7.5 ㎍ p4CMVE-U6-PylT 및 7.5 ㎍ pPylRS-mCherry-TAG-EFGP-HA18로 형질감염시키고, 지시된 경우 0.5 mM 1 또는 2 mM 3이 보충된 DMEM/10%FBS에서 48시간 동안 배양하였다. 세포를 PBS로 2회 세정하고, 얼음 상에서 30분 동안 1 mL 용해 완충제 (150 mM NaCl, 1% 트리톤(Triton) X-100, 50 mM Tris HCl (pH 8.0))에서 용해시켰다. 원심분리 (16000g에서 10분)에 의해 용해물을 정화한 후, HA-태그 단백질을 형질감염 당 50 ㎕ μMACS HA-태그 마이크로비즈(MicroBeads) (밀테니 바이오텍(Miltenyl Biotec))를 사용하여 포착하고, 0.5 mL RIPA (150 mM NaCl, 1% Igepal CA-630, 0.5% 소듐 데옥시콜레이트, 0.1% SDS, 50 mM 트리스 HCl (pH 8.0)) 및 0.5 mL PBS (pH 7.4)로 세정하였다. 마이크로비즈의 현탁액을 50 ㎕ PBS (pH 7.4), 20 μM 4a와 함께 1시간 동안 인큐베이션하고, 이어서 0.5 mL RIPA로 세정하여 과량의 염료를 제거하였다. SDS 샘플 완충제를 사용하여 비드로부터 HA-태그 단백질을 용출시키고, 4-12% 비스-트리스 PAGE 겔 (인비트로젠) 상에서 분리하고, 타이푼 이미저 (지이 헬스케어(GE Healthcare))를 사용하여 영상화하고, 이어서 디렉트블루(DirectBlue)로 염색하거나 또는 항-HA-태그 pAb-HRP-DirecT (MBL)로의 웨스턴 블롯팅을 위해 옮겼다.
포유동물 세포로부터의 SfGFP의 발현 및 정제
HEK293T를 10 cm 조직 배양 접시에서 PEI를 사용하여 15 ug DNA로 형질감염시키고, 72시간 동안 3 (0.5 μM)과 함께 인큐베이션하였다. 세포를 PBS로 2회 세정하고, 1 mL RIPA 완충제에서 용해시켰다. 정화된 용해물을 50 ㎕ GFP-트랩(Trap)® M (크로모텍(ChromoTek))에 첨가하고, 4시간 동안 인큐베이션하였다. 비드를 1 mL RIPA, 1 mL PBS, 1 mL PBS + 500 mM NaCl, 1 mL ddH2O로 세정하고, 1% 아세트산/ddH2O 내에 용출시켰다. 정제된 단백질을 4시간 동안 2 μM 4a로 표지하고, 4-12% 비스-트리스 PAGE 겔 상에 로딩하였다. 4a-표지 sfGFP의 형광을 타이푼 이미저 상에서 검출하고, 이어서 겔을 디렉트블루로 염색하였다.
파리 플라스미드, 트랜스제닉 파리 및 배양
모든 파리 실험에 대해, 무작위화 또는 맹검이 이러한 연구에서 사용되지 않았다.
트랜스제닉 파리 라인의 생성을 위한 플라스미드 구축
퀵체인지(QuikChange) 돌연변이유발 키트 및 주형으로서의 pSG108 (pJet 1.2-U6-PylT, 에스. 그레이스(S. Greiss)의 증정물)을 사용하여 PyltRNACUA 안티코돈을 돌연변이시켰다. 이는 드로소필라 U6-b 프로모터에 융합된, 3' 말단 CCA가 없는 PylT 유전자를 함유한다. 프라이머 FMT19 및 FMT20을 사용하여, 알라닌 코돈을 디코딩하도록 PyltRNATGC을 생성시켰고 (pFT18이 생성됨); 프라이머 FMT23 및 FMT24를 사용하여, 세린 코돈을 디코딩하도록 PyltRNAGCT를 생성시켰고 (pFT20이 생성됨); 프라이머 FMT27 및 FMT28을 사용하여, 류신 코돈을 디코딩하도록 PyltRNACAG를 생성시켰으며 (pFT22가 생성됨), 프라이머 FMT29 및 FMT30을 사용하여, 메티오닌 코돈을 디코딩하도록 PyltRNACAT를 생성시켰다 (pFT23이 생성됨). 돌연변이된 tRNA 발현 카세트를 EcoRI 및 HinDIII를 사용하여 pFT18, pFT20, pFT22 및 pFT23으로부터 pUC18 내로 서브클로닝한 후, AsiSI, BamHI 및 BglII를 사용하여 다량체화하여, tRNA의 2개, 그 후 4개의 카피를 생성시켰다. 4-카피 버전의 tRNA 카세트를 AsiSI 및 MluI을 사용하여 pSG118 내로 서브클로닝하여 pFT58 (Ala), pFT60 (Ser), pFT62 (Leu) 및 pFT63 (Met)을 생성시켰다. pSG118은 엠. 마제이 PylRS 유전자를 함유한다.20
파리 라인 및 배양 조건
드로소필라 배아 주입 서비스 (베스트진 인크(BestGene Inc.))를 사용하여 P 요소에 의해 트랜스제닉 라인을 생성시켰다. 하기의 플라스미드를 사용하여 라인들이 생성되었다: pFT58 (Ala), pFT60 (Ser), pFT62 (Leu) 및 pFT63 (Met). nos-Gal4-VP16 (블루밍톤(Bloomington) 4937) 및 MS1096-Gal4 (블루밍톤 8860)를 Gal4 구동제로 사용하였다. 모든 파리를 25℃에서 표준 이베리안(Iberian) 배지에서 성장시켰다. 건조 효모를 dH2O에 희석된 적합한 농도의 아미노산 (일반적으로 10 mM)과 혼합하여 페이스트를 제조함으로써 파리에 비천연 아미노산을 급식하였다. 최소 48시간 동안 아미노산이 있는 효모 페이스트 또는 아미노산이 없는 효모 페이스트가 보충된 이베리안 파리 먹이에서 성장된 암컷으로부터 난소를 준비하였다. 프로테옴 표지화 실험을 위해, 구축물 FT58, FT60, FT62 및 FT63의 트랜스제닉 수컷 파리를 nos-vp16-GAL4 버진과 교배하여, FT58/nos-vp16-GAL4, FT60/nos-vp16-GAL4, FT62/nos-vp16-GAL4 및 FT63/nos-vp16-GAL4를 각각 생성시켰다.
디. 멜라노가스터에서의 3의 부위-특이적 혼입
루시페라제 검정법
3 또는 1이 급식되었거나 아미노산이 급식되지 않은 nos-Gal4-VP16과 재조합된 삼중 Rep-L 파리 중 10마리의 암컷으로부터의 난소를 100 ㎕ 1× 패시브(Passive) 용해 완충제에서 해부하고, 이전에 기술된 바와 같이 루시페라제 검정법용으로 프로세싱하였다20.
부위 특이적으로 혼입된 3 의 면역침전 및 표지화
100마리 (대조군 및 3의 경우) 또는 500마리 (1의 경우)의 암컷으로부터의 난소를 PBS에서 해부한 후, 1× 완전 프로테아제 억제제 칵테일 (로슈)을 함유하는 300 또는 1500 ㎕ RIPA 완충제에서 용해시켰다. 총 용해물 대조군으로서 4× LDS 내로 샘플을 취한 후, 나머지를 제조사의 지침에 따라 GFP-TRAP 아가로스 비드 (크로모텍)로의 면역침전에 사용하였다. IP의 총 부피는 3 ml였다. 철야 인큐베이션 후, 비드를 RIPA 완충제로 2× 세정하고 나서, PBS로 2× 세정하였다. 테트라진 표지화를 위해, 비드를 200 ㎕ PBS + 4 μM 4g에 재현탁시키고, 실온에서 2시간 동안 롤러 상에서 인큐베이션하였다. 비드를 500 ㎕의 세정 완충제로 3회 세정한 후, 4× LDS 샘플 완충제에 재현탁시켰다.
실시예 1 - N ε -[((2- 메틸시클로프로프 -2-엔-1-일) 메톡시 )카르보닐]-L-리신 3의 합성
단백질 표지화에서 유용한 일군의 반응은 스트레인(strained) 알켄 (또는 알킨)과 테트라진 사이의 매우 신속하고 특이적인 역 전자 요구 딜스-알더 반응이다.21-25
본 발명가들 및 다른 이들이 이전에 유전자 코드 확장을 통해 스트레인 알켄, 알킨 및 테트라진을 보유하는 비천연 아미노산을 코딩하였고, 역 전자 요구 딜스-알더 반응을 통한 부위-특이적 단백질 표지화를 위한 이들의 용도를 실연하였지만,26-30 현재까지 사용된 모든 분자는 크기가 꽤 크다. 본 발명가들은 리신의 다양한 카르바메이트 유도체가 PylRS에 대한 양호한 기질이라는 것을 이전에 나타냈고,31 1,3 이치환 시클로프로펜이, 3,3 이치환 시클로프로펜과 달리,32 ,24 테트라진과 효율적으로 반응한다는 것이 실연되었다.22 따라서 본 발명가들은 1,3 이치환 시클로프로펜을 보유하는, 리신의 카르바메이트 유도체 (N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-L-리신 3, 도 1b)을 단백질 내로의 혼입 및 테트라진으로의 표지화를 위해 디자인하고 합성하였다.
메틸시클로프로프 -2-엔-1-일} 메톡시 )카르보닐]-L-리신 ( 3)의 합성
Figure pct00019

설계 1. N ε-[({2-메틸시클로프로프-2-엔-1-일}메톡시)카르보닐]-L-리신 3의 합성. 시약 및 조건: i. Rh2(OAc)4, 프로핀, CH2Cl2, 4℃ 내지 실온, 75% 수율; ii. DIBAL-H, CH2Cl2, 0℃ 내지 실온; iii. 4-니트로페닐 클로로포르메이트, 후니그(Huenig) 염기, CH2Cl2, 실온, 73% 수율; iv. Fmoc-Lys-OH, 후니그 염기, THF/DMF, 4℃ 내지 실온, 82% 수율; v. NaOH, THF/H2O, 실온, 68% 수율.
i. 에틸 2- 메틸실르포르포르 -2-엔-1- 카르복실레이트 S1
100 mL 2목 둥근바닥 플라스크에 CH2Cl2 (2 mL) 및 아세트산로듐 (442 mg, 1 mmol, 0.05 eq)을 채우고, 드라이 아이스 콘덴서를 장착하였다. 프로핀 (약 10 mL)을 아세트산로듐 현탁액 내로 응축시키고, 플라스크를 수조 (20℃) 내로 내리고, 프로핀의 안정적인 환류를 수득하였다. 주사기 펌프를 사용하여 에틸 디아조아세테이트 (2.1 mL, 20 mmol, 1 eq)를 교반된 프로핀 용액에 1시간에 걸쳐 적가하였다. 반응물을 추가로 10분 동안 실온에서 교반하였고, TLC 분석은 이러한 시간 후까지 반응이 완료되었음을 나타냈다. 그 후, 시클로프로펜 생성물을 실리카 겔 플래시 칼럼 크로마토그래피에 의해 정제하고, 펜탄 및 디에틸 에테르 (90:10)로 용출시켰다. 이에 의해 목적 생성물 S1이 무색의 휘발성 액체로서 제공되었다 (1.9 g, 75% 수율). 1H NMR 분석 δH (400 MHz, CDCl3) 6.35 (1H, t, J 1.4), 4.18-4.09 (2H, m), 2.16 (3H, d, J 1.3), 2.12 (1H, d, J 1.6), 1.26 (3H, t, J 7.1); LRMS m/z (ES+) 127.2 [M+H]+.
이러한 값들은 문헌과 잘 일치한다. {Liao, 2004 #1}
ii.iii. (2- 메틸시클로프로프 -2-엔-1-일) 메틸 (4- 니트로페닐 ) 카르보네이트 S3
DIBAL-H (CH2Cl2 내의 1 M 용액 22.5 mL, 22.5 mmol, 1.5 eq)를 -10℃에서 CH2Cl2 (15 mL) 내의 시클로프로펜 에스테르 S1 (1.9 g, 15 mmol, 1 eq)의 교반 용액에 적가하였다. 반응물을 -10℃에서 20분 동안 교반한 후, H2O (1 mL)에 이어서 NaOH (H2O 내의 1 M 용액 1 mL) 및 H2O (2.3 mL)를 조심스럽게 첨가하여 켄칭시켰다. 혼합물을 추가로 2시간 동안 실온에서 교반한 후, 건조시키고 (Na2SO4), 여과하였다. 후니그 염기 (3.9 mL, 22.5 mmol, 1.5 eq)를 여과액 (미정제 시클로프로펜 알콜 S2를 함유함)에 첨가한 후, 4-니트로페닐 클로로포르메이트 (3.3 g, 16.5 mmol, 1.1 eq)를 첨가하였다. 실온에서 18시간 동안 교반한 후, 상당한 무색 침전물이 형성되었고, TLC 분석은 미정제 시클로프로펜 알콜 S2의 완전한 소비를 나타냈다. 반응물을 CH2Cl2로 희석한 후, 실리카 겔 상에 건식으로 로딩하였고, 이에 의해 활성화된 카르보네이트 S3을 실리카 겔 칼럼 크로마토그래피로 정제하고, 에틸 아세테이트 및 헥산 (20:80)으로 용출시켰다. 이에 의해 목적한 시클로프로펜 카르보네이트 S3이 무색 오일로서 제공되었다 (2.7 g, 2단계에 걸쳐 73% 수율). 1H NMR 분석 δH (400 MHz, CDCl3) 8.28 (2H, d, J 9.2), 7.39 (2H, d, J 9.2), 6.62 (1H, s), 4.21 (1H, dd, J 10.9, 5.3), 4.14 (1H, dd, J 10.9, 5.3), 2.18 (3H, d, J 1.3), 1.78 (1H, td, J 5.3, 1.3).
iv. N α -( Fmoc )- N ε -(((2- 메틸시클로프로프 -2-엔-1-일) 메톡시 )카르보닐)-L-리신 S4
Fmoc-Lys-OHㆍHCl (6.7 g, 16.5 mmol, 1.5 eq)을 THF (30 mL) 및 DMF (10 mL)에 용해시키고, 이러한 용액에 후니그 염기 (9.0 mL, 55.0 mmol, 5 eq)에 이어서 시클로프로펜 카르보네이트 S3 (2.7 g, 11.0 mmol, 1 eq)을 첨가하였고, 카르보네이트 첨가 시 즉각적인 황색 착색이 관찰되었다. 반응물을 실온에서 6시간 동안 교반하였고, TLC 분석에 의해 나타난 바와 같이 이러한 시간 후에 출발 물질의 소비에 의해 반응이 완료된 것으로 판단되었다. 미정제 반응 혼합물을 실리카 겔 상에 건식으로 로딩하고, 주요 생성물을 실리카 겔 칼럼 크로마토그래피로 정제하고, 에틸 아세테이트, 헥산 및 아세트산 (50:49:1에 이어서 99:0:1)으로 용출시켰다. 이에 의해 목적 생성물 S4가 무색 검(gum)으로서 제공되었다 (4.3 g, 82% 수율). 1H NMR 분석 δH (400 MHz, CDCl3) 7.77 (2H, t, J 7.6), 7.65-7.55 (2H, m), 7.39 (2H, t, J 7.6), 7.31 (2H, t, J 7.3), 6.54 (1H, s), 5.68-5.57 (1H, m), 4.84 (1H, br-s), 4.44-4.32 (2H, m), 4.22 (1H, t, J 7.0), 3.98-3.87 (1H, m), 3.17-3.09 (2H, m), 2.15-2.06 (6H, m), 1.99-1.86 (1H, m), 1.84-1.70 (1H, m), 1.68-1.59 (1H, m), 1.58-1.34 (2H, m); LRMS m/z (ES+) 479.3 [M+H]+, 501.3 [M+Na]+, m/z (ES-) 477.2 [M-H]-.
v. N ε -[({2- 메틸시클로프로프 -2-엔-1-일} 메톡시 )카르보닐]-L-리신 3
N α-(Fmoc)-N ε-(((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐)-L-리신 S4 (3.5 g, 7.0 mmol, 1 eq)를 THF 및 H2O (3:1 40 mL)에 용해시키고, 이러한 용액에 수산화나트륨 (0.9 g, 22.6 mmol, 3.1 eq)을 첨가하였다. 반응물을 실온에서 8시간 동안 교반하였고, 이러한 시간 후 LC-MS 분석에 의해 반응이 완료된 것으로 판단되었다. 반응 혼합물을 H2O (100 mL)로 희석하고, HCl (1 M)을 첨가하여 pH를 ∼5로 조정하였다. 수용액을 Et2O (5× 100 mL)로 세정한 후, 건조 상태로 농축하여, 무색 고체가 산출되었다. 고체를 분취용 HPLC로 정제하고, 생성물 분획을 합치고, 냉동-건조에 의해 용매를 제거하였다. 이에 의해 N ε-[({2-메틸시클로프로프-2-엔-1-일}메톡시)카르보닐]-L-리신 3이 무색 고체로서 제공되었다. δH (400 MHz, D2O) 6.45 (1H, s), 3.90-3.61 (2H, m), 3.09 (1H, t, J 6.4), 2.98-2.86 (2H, m), 1.92 (3H, s), 1.52-1.37 (2H, m), 1.37-1.22 (2H, m), 1.21-1.08 (2H, m), 0.83 (1H, d, J 5.2). LRMS m/z (ES+) 257.2 [M+H]+, m/z (ES-) 255.2 [M-H]-. δC (100 MHz, D2O) 101.1 (CH), 72.3 (CH2), 55.9 (CH), 40.2 (CH2), 34.3 (CH2), 28.9 (CH2), 20.3 (CH2), 16.6 (CH3), 10.8 (CH) HRMS (ES+) 측정치: (M+Na)+ 279.1302. C12H20O4N2Na는 M+, 279.1315를 필요로 하였다.
실시예 2 - 이. 콜라이에서의 3의 부위-특이적 혼입의 코딩
본 발명가들은 PylRS/tRNACUA 쌍 및 위치 150에 앰버 코돈을 보유하는 SfGFP 유전자를 사용하여 3이 앰버 코돈에 반응하여 재조합 단백질 내로 효율적으로, 그리고 부위-특이적으로 혼입된다는 것을 실연하였다 (보충 도 2a). 단백질의 수율은 배양물 1 리터 당 8 mg이었고, 이는 PylRS에 대한 확립된 효율적인 기질인 N ε-[(tert-부톡시)카르보닐]-L-리신 1에 대해 수득된 것 (배양물 1 리터 당 4 mg)33보다 더 크다. 위치 150에 3을 보유하는 SfGFP (SfGFP-3)의 전기분무 이온화 질량 분광법에서 비천연 아미노산의 혼입이 확인된다 (보충 도 2b). SfGFP-3은 형광성 테트라진 프로브 4a로 특이적으로 표지된 반면, SfGFP-1은 표지되지 않았다 (보충 2b). 형광 영상화 및 질량 분광법 양쪽 모두로 판단된 바와 같이, 2 nmol의 SfGFP-3이 30분 내에 10 당량의 4a로 정량적으로 표지되었다 (보충 도 2b). SfGFP-34a로 표지하는 것에 대한 2차 속도 상수는 27 ± 1.8 M-1s-1였다 (보충 도 2c).26
PylRS는 이의 동족 tRNA의 안티코돈을 인식하지 않기 때문에34, 이러한 tRNA의 안티코돈을 별개의 코돈을 디코딩하도록 변경시킬 수 있다. 본 발명가들은 리신 코돈들의 세트를 디코딩하도록 PyltRNACUA의 안티코돈이 CUA에서 UUU로 변환된 새로운 tRNA를 생성시켰다 (보충 표 1). 0.1 mM 3을 PylRS, PyltRNAUUU, 및 T4 리소자임에 대한 유전자를 함유하는 세포에 첨가하였다. T4 리소자임의 발현 후에, 3을 보유하는 용해물 내의 단백질을 테트라진 프로브 4a (20 μM 1h, 보충 도 3)로 검출하였다. 대조군 실험은 관찰된 표지화가 신테타제 및 tRNA의 존재를 필요로 한다는 것을 나타내고, 전기분무 이온화 질량 분광법은 T4 리소자임에서의 리신을 대신하는 3의 혼입을 실연한다 (보충 도 4). 3 (0.1 또는 0.5 mM)의 첨가는 세포 성장에 대한 효과가 거의 없거나 없고 (보충 도 5), 이는 이러한 아미노산이 사용된 농도에서 독성이지 않다는 것을 시사하며, 아미노산 첨가로부터 1시간 이내에 실질적으로 표지된다 (보충 6).
실시예 3 - 인간 세포에서의 3의 유전적 코딩
PylRS/tRNACUA 쌍 및 mCherry-TAG-EGFP-HA (앰버 정지 코돈 (TAG)에 의해 분리된, mCherry 유전자와 C-말단 HA 태그가 있는 EGFP 유전자 사이의 융합물)를 보유하는 HEK293 세포에서 전장 mCherry-3-GFP-HA를 발현시켰다.18 3의 존재 하에서만 전장 단백질이 검출되었다 (도 8a, 보충 도 11의 전체 겔). mCherry-3-EGFP-HA는 4a로 선택적으로 표지된 반면, mCherry-1-EGFP-HA는 표지되지 않았고 (도 8b)18, 이는 인간 세포에서의 PylRS/tRNACUA 쌍으로의 3의 부위-특이적 혼입을 실연한다.
실시예 4 - 디. 멜라노가스터에서의 3의 유전적 코딩
본 발명가들은 디. 멜라노가스터에서 3이 부위 특이적으로 단백질 내로 혼입될 수 있다는 것을 실연하였다. 이를 달성하기 위해, PylRS/tRNACUA 쌍 (tRNA는 U6 프로모터로부터 편재성으로 발현되고, UAS-PylRS 발현은 nos-vp16-GAL4 구동제를 사용하여 난소에 지시됨), 및 반딧불이 루시페라제와 레닐라 루시페라제 사이에 앰버 코돈을 보유하는 이중 루시페라제 리포터를 함유하는 파리를 사용하였다.20 1 또는 3의 첨가에 의존적인 강한 루시페라제 신호가 관찰되었고, 이중 루시페라제 신호가 3으로 더 강하였다. 이러한 실험은 3이 파리에 의해 채택되고 PylRS에 대한 공지된 우수한 기질인 1보다 더욱 효율적으로 생체 내에서 앰버 코돈에 반응하여 혼입된다는 것을 실연한다 ( 10a). 10 mM의 아미노산 3이 보충된 먹이를 급식함으로써 3이 공급될 수 있다. 추가적인 실험에서, 본 발명가들은 웨스턴 블롯에 의해 난소20에서 발현된 GFP-TAG-mCherry-HA 구축물 (보충 도 15) 내로의 3의 효율적인 혼입 (도 10b), 및 혼입된 아미노산의 4g로의 특이적인 형광 표지화 (도 10c)를 실연하였다.
실시예 5 - 테트라진 - BODIPY FL 4d의 합성
Figure pct00020

설계 3. 테트라진-비오틴 4d의 합성. 시약 및 조건: i. HCl 디옥산, 실온, 100% 수율; ii. Bodipy-FL-NHS 에스테르, 후니그 염기, DMF, 실온.
i. S6
Boc-보호 테트라진 S6을 기존에 보고된 절차를 사용하여 합성하였다6. 디옥산 내의 4 M HCl (500 ㎕, 2.0 mmol)을 DCM (500 ㎕) 내의 테트라진 S5 (8 mg, 0.02 mmol)의 교반 용액에 첨가하였다. 2시간 동안 실온에서 반응을 수행하고, 이어서 감압 하에 용매를 제거하여, 1차 아민 히드로클로라이드 S6이 분홍색 고체로서 산출되었다 (6 mg, 0.02 mmol, 100%). 화합물을 어떠한 추가 정제도 없이 다음 단계에서 직접 사용하였다.
ii. 4d
BODIPY FL 숙신이미딜 에스테르 (5 mg, 0.013 mmol, 라이프 테크놀러지즈) 및 후니그 염기 (50 ㎕, 2.8 mmol)를 건조 DMF (1 mL) 내의 테트라진-아민 S2 (6 mg, 0.02 mmol)의 용액에 첨가하였다. 반응 혼합물을 실온에서 16시간 동안 교반하였다. 반응 혼합물을 4 ml의 물로 희석하고, 생성물을 완충제 A 내의 완충제 B의 10% → 90%의 구배를 사용하여 준-분취용 역상 HPLC에 의해 정제하였다 (완충제 A: H2O; 완충제 B: 아세토니트릴). 테트라진-BODIPY FL 접합체 4d의 신원 및 순도를 LC-MS로 확인하였다. ESI-MS: [M-H]-, 계산치. 581.38, 측정치 581.2.
실시예 1 내지 5의 요약
본 발명가들은 시클로프로펜 함유 아미노산 3의 합성, 및 이의 유전적으로 코딩된 부위-특이적 혼입을 특성화하였고, 이. 콜라이, 포유동물 세포 및 디. 멜라노가가스터에서 발현된 단백질에서 테트라진 프로브로의 3의 정량적 표지화를 실연하였으며, 이에 의해 본 발명의 광범위한 유용성 및 산업적 용도를 나타낸다.
실시예 1 내지 5에 대한 보충 참고문헌
Figure pct00021

실시예 6 - 단백질의 이중 표지화
2개의 별개의 분자를 단백질 내의 프로그래밍된 부위에 부착하는 능력은 단백질 구조, 형상 및 역학을 연구하기 위한 FRET1 ,2를 포함하는 다양한 용도를 용이하게 할 것이다. 단백질을 이중으로 표지하기 위한 여러 접근법이 보고되어 있다. 한 접근법은 시스테인 티올 표지화와 조합된 특이적으로 표지된 1개의 비천연 아미노산의 설치에 의존하지만, 일반적으로 이러한 접근법은 유리 티올을 함유하지 않는 단백질에 제한된다.3 , 4 화학적 결찰 접근법이 단백질 표지화를 위해 단일 비천연 아미노산의 유전적 코딩과 조합될 수 있지만,5 이는 표지될 수 있는 크기 및/또는 부위를 제한할 수 있다. 아마도 단백질의 이중 표지화를 위한 가장 일반적으로 적용가능한 접근법은 관심 유전자 내의 사용자에 의해 정의된 부위에서 도입된 2개의 별개의 코돈에 반응한 2개의 별개의 아미노산의 유전적 혼입을 기초로 할 것이다.
이중 표지화를 위한 이상적인 전략은 i) 상호 직교성인 반응에서 표지될 수 있는 단백질 내로의 2개의 별개의 비천연 아미노산의 효율적인 세포성 혼입, 및 ii) 생리학적 pH, 온도 및 압력의 수성 매질에서의 단백질의 신속하고 정량적인 표지화를 위해 2개의 분자를 단백질에 동시에 부가하는 것을 허용하는 상호 직교성인 반응의 개발을 필요로 한다.
설계 A (도 14)는 생리학적 pH 및 온도의 수성 매질에서의 단백질의 협동적이고 신속한 단일 용기에서의 정량적 이중 표지화를 나타낸다. (a) 이러한 예에서 사용된 비천연 아미노산 및 형광단. (b) 상호 직교성인 고리화첨가를 통한 코딩된 말단 알킨 및 코딩된 시클로프로펜에서의 협동적 표지화.
단백질 내로의 2개의 비천연 아미노산의 유전적으로 지시된 세포성 혼입이 앰버 및 4벌식 코돈6, 2개의 별개의 정지 코돈7 ,8, 또는 2개의 별개의 4벌식 코돈9에 반응하여 실연되었다. 본 발명가들은 동족의 확장된 안티코돈 tRNA 또는 앰버 억제인자를 각각 사용하여 직교성 mRNA 상의 4벌식 코돈 및 앰버 코돈을 효율적으로 판독하는 직교성 리보솜 (ribo-Q1)의 진화를 기존에 실연하였다.6 본 발명가들은 피롤리실-tRNA 신테타제/tRNA 쌍 및 MjTyrRS/tRNA 쌍의 합성에 의해 진화된 유도체가 이들의 아미노아실화 특이성 면에서 상호 직교성이고, 앰버 및 4벌식 코돈에 반응하여 비천연 아미노산의 쌍들의 혼입을 지시하는데 사용될 수 있다는 것을 실연하였다.6 최근 본 발명가들은 진화된 직교성 번역 기구를 사용하여 4벌식 코돈에 반응하여 비천연 아미노산의 혼입을 효율적으로 지시하는 피롤리실-tRNA 신테타제 (PylRS)/tRNA 쌍을 기초로 하는 일련의 4벌식 디코딩 tRNA의 진화를 포함하여, 이러한 시스템에서의 여러 주요 진전을 기술하였다.9 본 발명가들은 진화된 PylRS/tRNAUACU 쌍 및 MjTyrRS/tRNACUA 쌍의 유도체를 TAG 및 AGTA 코돈을 보유하는 직교성 메시지 및 ribo-Q1과 함께 사용하여 비천연 아미노산의 쌍들의 매트릭스의 매우 효율적인 혼입을 실연하였다.9
제한된 범위의 화학물질이 비천연 아미노산의 쌍들을 함유하는 단백질의 이중 표지화를 위해 연구되었다. 아지드- 및 알킨-함유 아미노산의 혼입, 및 알킨 및 아지드 기반 형광단으로의 이들의 비-정량적 표지화가 보고되었지만7, 이는 단백질의 이중 표지화에 이상적이지 않다; 코딩된 아지드 및 알킨이 근접하면, 이들이 반응하여 단백질 내에 트리아졸이 형성될 수 있고, 이러한 전략은 유전적으로 지시된 단백질 스테이플링을 허용하지만,6 프로브로의 표지화를 방해한다. 또한, 아지드-보유 프로브와 알킨-보유 프로브가 서로 반응하는 것으로 인해 효율적인 단일-용기 반응이 실현가능하지 않다. 케톤 및 아지드 함유 아미노산의 혼입이 보고되었고,8,10 이는 코딩된 케톤과 알파 효과 친핵체 및 아지드와 알킨 프로브의 단일-용기 반응을 허용한다.10 그러나, 이러한 접근법은 이. 콜라이에서 발현된 경우 다수의 단백질에서 코딩된 아지드가 환원 대상이기 때문에 문제가 있고,8 ,11 이는 정량적 표지화를 방지할 것이다. 또한, 알파 효과 친핵체로의 케톤 표지화는 매우 느리고 (속도 상수 약 10-4 M-1s-1), 반응이 pH 4-5.5에서 최적이며,12 이는 산성 조건 하에서 장기간 동안 유지되는 경우 변성 또는 침전되는 다수의 단백질에 대한 이의 유용성을 제한한다. 최근 본 발명가들은 본 발명가들의 최적화된 직교성 번역 시스템을 사용하여 탈활성화된 테트라진 함유 아미노산13 및 노르보르넨 함유 아미노산14-16을 단백질 내로 유전적으로 설치하였다.9 탈활성화된 테트라진과 노르보르넨 사이의 역 전자 요구 딜스 알더 반응의 속도는 매우 느리지만, 테트라진은 비시클로노닌 기반 프로브와 반응할 수 있고 노르보르넨은 활성화된 테트라진 프로브와 반응할 수 있기 때문에, 본 발명가들은 이러한 접근법을 사용하여 특이적 및 정량적으로 단백질을 이중으로 표지할 수 있었다.9 이러한 접근법은 생리학적 pH, 온도 및 압력의 수성 매질에서 진행되는 장점이 있지만, 각각의 단계가 수시간이 걸리는 순차적인 표지화 단계 (프로브들 사이의 역 전자 요구 반응을 방지하기 위해)와 단계들 사이의 정제를 필요로 한다. 유전적으로 코딩된 비천연 아미노산에서 단백질을 이중으로 표지하기 위해 현재까지 보고된 모든 접근법은 완료에 도달하는데 수십 시간 내지 수일이 걸린다.
단백질을 이중으로 표지하는 이상적인 접근법은 유전적으로 설치된 생물-직교성 관능기의 신속한 단일-용기 표지화를 허용하고, 생리학적 pH, 온도 및 압력의 수성 매질에서 신속하게 진행되며, 부위 특이적으로 혼입된 생물직교성 기를 보유하는 재조합 단백질에 표지화 시약을 첨가하는 것에 의해 간단하게 실행될 것이다. 생리학적 pH의 수성 조건 하에서의 단일-용기 표지화를 위한 상호 직교성인 반응의 유망한 쌍은 아지드와 말단 알킨 사이의 Cu(I)-촉매 3+2 고리화첨가17 및 스트레인 알켄 및 테트라진의 역 전자 요구 딜스 알더 반응18 -23이다 (도 11). 스트레인 알킨 및 아지드의 반응은 스트레인 알켄 테트라진 반응에 대해 또한 직교성일 수 있지만, 테트라진이 스트레인 알킨과 반응하기 때문에, 이러한 반응은 각각의 반응에 대한 속도 상수를 주의깊게 조율하는 것을 필요로 한다.24 3+2 고리화첨가와 역 전자 요구 딜스 알더 반응의 조합은 단백질 표지화에 대해 실연된 적이 없었다.
본 발명가들은 실시예 1 내지 5에서 1,3 이치환 시클로프로펜 함유 아미노산 2 (실시예 1 내지 5 및 본 문서의 다른 곳에서 3으로 지칭됨)가 PylRS/tRNACUA 쌍을 사용하여 단백질 내로 효율적 및 부위 특이적으로 혼입될 수 있다는 것을 실연하였다.25 이러한 아미노산은, 포토클릭 반응을 위해 혼입된 3,3 이치환 시클로프로펜과 달리,26 27 M-1s-1의 온(on)-단백질 속도 상수로 테트라진19 ,27과 반응한다.25 본원에서, 본 발명가들은 말단 알킨 함유 아미노산 1 및 시클로프로펜 함유 아미노산 2의 단일 단백질 내로의 효율적인 유전적 코딩, 및 아지드 및 테트라진 프로브로의 이들의 신속하고 정량적인 단일-용기 표지화를 실연한다 ( 11). 이러한 작업은 생리학적 pH의 수성 조건 하에서의 단일-용기 공정에서의 단백질의 협동적인 이중 표지화에 대한 최초의 접근법을 제공하고, 기존 작업에서의 수일에서 본원에서 보고된 접근법에서의 30분으로의 이중 표지화의 속도의 큰 변화를 제공한다.
제안된 표지화 반응의 직교성의 특이성을 시험하기 위해 1 또는 2를 함유하는 단백질을 과발현시켰다. 칼모듈린의 위치 1에 아미노산 1이 있는 글루타티온-S-트랜스퍼라제 및 칼모듈린의 융합 단백질 (GST-CaM)을 1 (4 mM)의 존재 하에 성장된, ribo-Q1 (진화된 직교성 리보솜6 ,28,29), O-gst - cam 1TAG (칼모듈린 (cam)의 제1 코돈이 TAG 코돈으로 교체된 직교성 메시지30 상의 글루타티온-S- 트랜스퍼라제 (gst)와 cam 사이의 융합 유전자), 및 MjPrpRS/tRNACUA (TAG 코돈에 반응하여 1을 혼입시키기 위해 개발된 신테타제/tRNA 쌍)31을 함유하는 세포로부터 발현시켰다. 이어서 GST와 CaM 사이의 조작된 트롬빈-절단 부위에서의 트롬빈을 사용한 절단에 의해 GST 태그를 제거하였다. CaM1 1 (위치 1에 1을 함유하는 CaM, ~100 pmol)을 Cu (I)-촉매 클릭 반응에서 아지드 함유 형광단 3 (2 nmol)으로 표지하였다. SDS-PAGE에 의한 형광 표지 단백질의 정량적 시프트 및 전기분무 이온화 질량 분광법 (ESI-MS) 양쪽 모두에 의해 판단된 바와 같이 반응이 정량적이었다 (도 11a).
시클로프로펜 함유 아미노산 2는 칼모듈린의 위치 40에서 부위 특이적으로 혼입되었다. 변형된 단백질을 2 (1 mM)의 존재 하에 성장된, PylRS/tRNACUA (2의 부위 특이적 혼입을 효율적으로 지시함),25 ribo-Q1, 및 O-gst - cam 40TAG 를 보유하는 세포에서 발현시켰다. CaM2 40 (~100 pmol) (GST 태그의 트롬빈 절단 후에 수득됨)을 테트라진 함유 형광단 4 (2 nmol)로 표지하였다. SDS-PAGE에 의한 형광 표지 단백질의 정량적 시프트 및 전기분무 이온화 질량 분광법 (ESI-MS) 양쪽 모두에 의해 판단된 바와 같이 반응이 정량적이었다 ( 11b). CaM2 40은 CaM1 13으로 정량적으로 표지되는 조건 하에 3으로 표지되지 않았다 (도 11a). 유사하게, CaM2 404로 정량적으로 표지된 조건 하에 CaM1 14로 표지되지 않았다. 이러한 실험들은 2개의 표지화 시약이 이들의 표적 아미노산과 정량적으로 반응하지만 단백질 내의 표적화되지 않은 비천연 아미노산과는 반응하지 않는다는 것을 실연한다.
다음으로, 본 발명가들은 동일한 단백질 내의 12를 표지하는 것을 연구하였다. 칼모듈린의 위치 1 및 40에서 12를 부위-특이적으로 혼입하여 CaM1 1 2 40을 생산하였다 ( 12). MjPrpRS/tRNACUA 쌍으로 아미노산 1의 혼입을 지시하였고, ribo-Q1을 사용하여 직교성 메시지 상의 4벌식 AGTA 코돈을 효율적으로 디코딩하는 진화된 PylRS/tRNAUACU 쌍을 사용하여 아미노산 2의 혼입을 지시하였다.9 직교성 메시지 (O-gst - cam 1TAG - 40AGTA ) 상의 GST-칼모듈린 유전자 내의 칼모듈린의 위치 1 및 40에서의 UAG 및 AGTA 코돈에 반응하여 비천연 아미노산이 혼입되었다. 전장 GST-CaM1 1 2 40의 발현은 이. 콜라이에 아미노산 12를 첨가하는 것에 의존적이었고, ESI-MS는 아미노산 12의 유전적으로 지시된 혼입을 실연하였다 (도 12c). 전장 GST-CaM1 1 2 40의 수율은 배양물 L 당 ~2 mg이었다.
CaM1 1 2 40을 아지드 3 또는 테트라진 4로 정량적으로 표지하는데 요구되는 시간을 결정하기 위해, 본 발명가들은 100 pmol의 CaM1 1 2 40을 2 nmol의 3 또는 4와 함께 인큐베이션하고, 표지화 시의 SDS-PAGE 상에서의 이동성 시프트 및 형광 영상화 양쪽 모두에 의해 각각의 반응을 추적하였다 ( 12b). 이러한 실험은 형광단 표지화가 30분 내에 완료된다는 것을 실연하였다.
다음으로, 본 발명가들은 34 양쪽 모두로 CaM1 1 2 40을 표지하는 것을 연구하였다 (도 13). 먼저, 4 (2 nmol)를 CaM1 1 2 40 (100 pmol)에 첨가한 후 정제하여 유리 4를 제거하고, 이어서 3 (2 nmol)으로 표지하는 것을 테스트하였다 (도 13a 레인 4). 이는 SDS-PAGE 이동성 시프트 및 형광 영상화에 의해 판단된 바와 같이 효율적인 이중 표지화에 이르렀다. 다음으로, CaM1 1 2 404와 함께 30분 동안 인큐베이션한 후, 3 및 클릭 시약을 첨가하고, 추가로 30분 동안 인큐베이션함으로써, 정제 없이 순차적 표지화를 수행하였다 (도 13a 레인 5). 이 또한 SDS-PAGE 이동성 시프트 및 형광 영상화에 의해 판단된 바와 같이 효율적인 이중 표지화에 이르렀다. 마지막으로, 동시에 4 (2 nmol), 3 (2 nmol) 및 클릭 시약을 CaM1 1 2 40 (100 pmol)에 첨가하고, 30분 동안 인큐베이션하였다. (도 13a 레인 6). 이번에도 SDS-PAGE 이동성 시프트 및 형광 영상화에 의해 판단된 바와 같이 효율적인 이중 표지화에 이르렀다. 모든 이중 표지 단백질에서, 488 nm 에서의 여기 시 단일 표지 대조군과 비교하여 BODIPY-FL 형광의 감소가 관찰되었고 (도 13a의 레인 4, 5, 및 6을 레인 3에 비교함), 이는 BODIPY-FL과 BODIPY-TMR-X 사이의 겔-내 포스터(Foerster) 공명 에너지 전달 (FRET)과 일관된다. ESI-MS에서, 이러한 협동적, 단일-용기 프로토콜이 단백질의 유전적으로 지시된 효율적이고, 신속하며 정량적인 이중 표지화에 이른다는 것이 추가로 실연된다.
요약하면, 이러한 실시예에서, 본 발명가들은 부위 특이적으로 혼입된 알킨 및 부위 특이적으로 혼입된 시클로프로펜을 보유하는 재조합 단백질을 발현시키기 위한 효율적이고 신속한 프로토콜을 나타낸다. 본 발명가들은 코딩된 1,3 이치환 시클로프로펜과 테트라진 프로브의 역 전자 요구 딜스 알더 반응, 및 코딩된 알킨과 아지드 프로브의 3+2 고리화첨가 반응이 서로에 대해, 그리고 단백질 내의 관능기에 대해 상호 직교성이라는 것을 실연한다. 알킨 및 시클로프로펜을 단일 단백질 내에 유전적으로 코딩하는 것 및 상호 직교성인 반응으로 표지하는 것을 조합합으로서, 본 발명가들은 생리학적 pH 및 온도의 수성 매질에서의 단백질의 단일-용기에서의 협동적인 신속한 이중 표지화를 실연한다. 이러한 전략은 다양한 연구 및 용도를 위해 단백질을 이중으로 표지하는데 유용하고, 다양한 세포 및 생물 내의 다양한 분자의 이중 표지화로 확장될 수 있다.
실시예 6에 대한 주석: 실시예 6 및 실시예 6에서 논의된 상응하는 도 (도면)에서의 화학적 명칭은 자립적이고, 실시예 6에만 적용된다. 본 문서의 나머지 부분에서의 화학적 명칭의 논의는 실시예 6을 제외하고는 일관적이다. 예를 들어, 숙련된 독자는 실시예 6의 화합물 2가 본 문서의 나머지 부분에서의 화합물 3 (즉, 본 발명의 예시적인 시클로프로펜 아미노산)에 상응한다는 것을 바로 이해할 것이다. 실시예 6의 화합물 34는 테트라진 화합물이다.
실시예 6에 대한 참고문헌
Figure pct00022
SEQUENCE LISTING <110> MEDICAL RESEARCH COUNCIL <120> CYCLOPROPENE AMINO ACIDS AND METHODS <130> 2016X9583SC <140> PCT/GB2015/050694 <141> 2015-03-10 <150> GB1404569.4 <151> 2014-03-14 <160> 47 <170> PatentIn version 3.5 <210> 1 <211> 419 <212> PRT <213> Methanosarcina barkeri <400> 1 Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser 100 105 110 Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr 115 120 125 Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser 130 135 140 Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu 145 150 155 160 Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn 165 170 175 Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg 180 185 190 Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu 195 200 205 Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe 210 215 220 Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg 225 230 235 240 Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val 245 250 255 Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn 260 265 270 Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe 275 280 285 Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu 290 295 300 Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr 305 310 315 320 Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu 325 330 335 Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr 340 345 350 Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly 355 360 365 Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly 370 375 380 Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys 385 390 395 400 Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser 405 410 415 Thr Asn Leu <210> 2 <211> 419 <212> PRT <213> Methanosarcina barkeri MS <400> 2 Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg 85 90 95 Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser 100 105 110 Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr 115 120 125 Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser 130 135 140 Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu 145 150 155 160 Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn 165 170 175 Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg 180 185 190 Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu 195 200 205 Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe 210 215 220 Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg 225 230 235 240 Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val 245 250 255 Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn 260 265 270 Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe 275 280 285 Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu 290 295 300 Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr 305 310 315 320 Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu 325 330 335 Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr 340 345 350 Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly 355 360 365 Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly 370 375 380 Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys 385 390 395 400 Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser 405 410 415 Thr Asn Leu <210> 3 <211> 419 <212> PRT <213> Methanosarcina barkeri str. Fusaro <400> 3 Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser 100 105 110 Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr 115 120 125 Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser 130 135 140 Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu 145 150 155 160 Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn 165 170 175 Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg 180 185 190 Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu 195 200 205 Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe 210 215 220 Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg 225 230 235 240 Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val 245 250 255 Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn 260 265 270 Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe 275 280 285 Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu 290 295 300 Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr 305 310 315 320 Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu 325 330 335 Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr 340 345 350 Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly 355 360 365 Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly 370 375 380 Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys 385 390 395 400 Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser 405 410 415 Thr Asn Leu <210> 4 <211> 454 <212> PRT <213> Methanosarcina mazei Go1 <400> 4 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val 100 105 110 Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln 115 120 125 Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu 130 135 140 Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser 145 150 155 160 Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile 165 170 175 Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys 180 185 190 Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile 195 200 205 Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu 210 215 220 Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu 225 230 235 240 Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp 245 250 255 Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr 260 265 270 Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile 275 280 285 Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn 290 295 300 Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile 305 310 315 320 Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys 325 330 335 Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser 340 345 350 Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn 355 360 365 His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr 370 375 380 Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala 385 390 395 400 Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro 405 410 415 Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His 420 425 430 Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn 435 440 445 Gly Ile Ser Thr Asn Leu 450 <210> 5 <211> 443 <212> PRT <213> Methanosarcina acetivorans C2A <400> 5 Met Asp Lys Lys Pro Leu Asp Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Met Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Glu Arg Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Arg His Cys Arg Val Ser Asp Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Lys Thr Ser Glu Glu Lys Thr Thr Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Arg Val Arg Lys Ala Met Pro Lys Ser Val Ala 100 105 110 Arg Ala Pro Lys Pro Leu Glu Ala Thr Ala Gln Val Pro Leu Ser Gly 115 120 125 Ser Lys Pro Ala Pro Ala Thr Pro Val Ser Ala Pro Ala Gln Ala Pro 130 135 140 Ala Pro Ser Thr Gly Ser Ala Ser Ala Thr Ser Ala Ser Ala Gln Arg 145 150 155 160 Met Ala Asn Ser Ala Ala Ala Pro Ala Ala Pro Val Pro Thr Ser Ala 165 170 175 Pro Ala Leu Thr Lys Gly Gln Leu Asp Arg Leu Glu Gly Leu Leu Ser 180 185 190 Pro Lys Asp Glu Ile Ser Leu Asp Ser Glu Lys Pro Phe Arg Glu Leu 195 200 205 Glu Ser Glu Leu Leu Ser Arg Arg Lys Lys Asp Leu Lys Arg Ile Tyr 210 215 220 Ala Glu Glu Arg Glu Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr 225 230 235 240 Lys Phe Phe Val Asp Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu 245 250 255 Ile Pro Ala Glu Tyr Val Glu Arg Met Gly Ile Asn Ser Asp Thr Glu 260 265 270 Leu Ser Lys Gln Val Phe Arg Ile Asp Lys Asn Phe Cys Leu Arg Pro 275 280 285 Met Leu Ala Pro Asn Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala 290 295 300 Leu Pro Asp Pro Ile Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys 305 310 315 320 Glu Ser Asp Gly Lys Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe 325 330 335 Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn Leu Glu Ala Ile Ile 340 345 350 Thr Glu Phe Leu Asn His Leu Gly Ile Asp Phe Glu Ile Ile Gly Asp 355 360 365 Ser Cys Met Val Tyr Gly Asn Thr Leu Asp Val Met His Asp Asp Leu 370 375 380 Glu Leu Ser Ser Ala Val Val Gly Pro Val Pro Leu Asp Arg Glu Trp 385 390 395 400 Gly Ile Asp Lys Pro Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu 405 410 415 Leu Lys Val Met His Gly Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser 420 425 430 Glu Ser Tyr Tyr Asn Gly Ile Ser Thr Asn Leu 435 440 <210> 6 <211> 478 <212> PRT <213> Methanosarcina thermophila <400> 6 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Lys Leu His Lys Ile Arg His His Glu Val Ser 20 25 30 Lys Arg Lys Ile Tyr Ile Glu Met Glu Cys Gly Glu Arg Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Ala Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Ile Cys Lys His Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Arg Thr Asn Glu Asp Lys Ser Asn Ala Lys Val Thr 85 90 95 Val Val Ser Ala Pro Lys Ile Arg Lys Val Met Pro Lys Ser Val Ala 100 105 110 Arg Thr Pro Lys Pro Leu Glu Asn Thr Ala Pro Val Gln Thr Leu Pro 115 120 125 Ser Glu Ser Gln Pro Ala Pro Thr Thr Pro Ile Ser Ala Ser Thr Thr 130 135 140 Ala Pro Ala Ser Thr Ser Thr Thr Ala Pro Ala Pro Ala Ser Thr Thr 145 150 155 160 Ala Pro Ala Pro Ala Ser Thr Thr Ala Pro Ala Ser Ala Ser Thr Thr 165 170 175 Ile Ser Thr Ser Ala Met Pro Ala Ser Thr Ser Ala Gln Gly Thr Thr 180 185 190 Lys Phe Asn Tyr Ile Ser Gly Gly Phe Pro Arg Pro Ile Pro Val Gln 195 200 205 Ala Ser Ala Pro Ala Leu Thr Lys Ser Gln Ile Asp Arg Leu Gln Gly 210 215 220 Leu Leu Ser Pro Lys Asp Glu Ile Ser Leu Asp Ser Gly Thr Pro Phe 225 230 235 240 Arg Lys Leu Glu Ser Glu Leu Leu Ser Arg Arg Arg Lys Asp Leu Lys 245 250 255 Gln Ile Tyr Ala Glu Glu Arg Glu His Tyr Leu Gly Lys Leu Glu Arg 260 265 270 Glu Ile Thr Lys Phe Phe Val Asp Arg Gly Phe Leu Glu Ile Lys Ser 275 280 285 Pro Ile Leu Ile Pro Met Glu Tyr Ile Glu Arg Met Gly Ile Asp Asn 290 295 300 Asp Lys Glu Leu Ser Lys Gln Ile Phe Arg Val Asp Asn Asn Phe Cys 305 310 315 320 Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Asn Tyr Leu Arg Lys Leu 325 330 335 Asn Arg Ala Leu Pro Asp Pro Ile Lys Ile Phe Glu Ile Gly Pro Cys 340 345 350 Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu Glu Glu Phe Thr Met 355 360 365 Leu Asn Phe Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn Leu Glu 370 375 380 Ala Ile Ile Lys Asp Phe Leu Asp Tyr Leu Gly Ile Asp Phe Glu Ile 385 390 395 400 Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr Leu Asp Val Met His 405 410 415 Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly Pro Val Pro Met Asp 420 425 430 Arg Asp Trp Gly Ile Asn Lys Pro Trp Ile Gly Ala Gly Phe Gly Leu 435 440 445 Glu Arg Leu Leu Lys Val Met His Asn Phe Lys Asn Ile Lys Arg Ala 450 455 460 Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser Thr Asn Leu 465 470 475 <210> 7 <211> 416 <212> PRT <213> Methanococcoides burtonii DSM 6242 <400> 7 Met Glu Lys Gln Leu Leu Asp Val Leu Val Glu Leu Asn Gly Val Trp 1 5 10 15 Leu Ser Arg Ser Gly Leu Leu His Gly Ile Arg Asn Phe Glu Ile Thr 20 25 30 Thr Lys His Ile His Ile Glu Thr Asp Cys Gly Ala Arg Phe Thr Val 35 40 45 Arg Asn Ser Arg Ser Ser Arg Ser Ala Arg Ser Leu Arg His Asn Lys 50 55 60 Tyr Arg Lys Pro Cys Lys Arg Cys Arg Pro Ala Asp Glu Gln Ile Asp 65 70 75 80 Arg Phe Val Lys Lys Thr Phe Lys Glu Lys Arg Gln Thr Val Ser Val 85 90 95 Phe Ser Ser Pro Lys Lys His Val Pro Lys Lys Pro Lys Val Ala Val 100 105 110 Ile Lys Ser Phe Ser Ile Ser Thr Pro Ser Pro Lys Glu Ala Ser Val 115 120 125 Ser Asn Ser Ile Pro Thr Pro Ser Ile Ser Val Val Lys Asp Glu Val 130 135 140 Lys Val Pro Glu Val Lys Tyr Thr Pro Ser Gln Ile Glu Arg Leu Lys 145 150 155 160 Thr Leu Met Ser Pro Asp Asp Lys Ile Pro Ile Gln Asp Glu Leu Pro 165 170 175 Glu Phe Lys Val Leu Glu Lys Glu Leu Ile Gln Arg Arg Arg Asp Asp 180 185 190 Leu Lys Lys Met Tyr Glu Glu Asp Arg Glu Asp Arg Leu Gly Lys Leu 195 200 205 Glu Arg Asp Ile Thr Glu Phe Phe Val Asp Arg Gly Phe Leu Glu Ile 210 215 220 Lys Ser Pro Ile Met Ile Pro Phe Glu Tyr Ile Glu Arg Met Gly Ile 225 230 235 240 Asp Lys Asp Asp His Leu Asn Lys Gln Ile Phe Arg Val Asp Glu Ser 245 250 255 Met Cys Leu Arg Pro Met Leu Ala Pro Cys Leu Tyr Asn Tyr Leu Arg 260 265 270 Lys Leu Asp Lys Val Leu Pro Asp Pro Ile Arg Ile Phe Glu Ile Gly 275 280 285 Pro Cys Tyr Arg Lys Glu Ser Asp Gly Ser Ser His Leu Glu Glu Phe 290 295 300 Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn 305 310 315 320 Met Glu Ala Leu Ile Asp Glu Phe Leu Glu His Leu Gly Ile Glu Tyr 325 330 335 Glu Ile Glu Ala Asp Asn Cys Met Val Tyr Gly Asp Thr Ile Asp Ile 340 345 350 Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly Pro Ile Pro 355 360 365 Leu Asp Arg Glu Trp Gly Val Asn Lys Pro Trp Met Gly Ala Gly Phe 370 375 380 Gly Leu Glu Arg Leu Leu Lys Val Arg His Asn Tyr Thr Asn Ile Arg 385 390 395 400 Arg Ala Ser Arg Ser Glu Leu Tyr Tyr Asn Gly Ile Asn Thr Asn Leu 405 410 415 <210> 8 <211> 279 <212> PRT <213> Desulfitobacterium hafniense DCB-2 <400> 8 Met Ser Ser Phe Trp Thr Lys Val Gln Tyr Gln Arg Leu Lys Glu Leu 1 5 10 15 Asn Ala Ser Gly Glu Gln Leu Glu Met Gly Phe Ser Asp Ala Leu Ser 20 25 30 Arg Asp Arg Ala Phe Gln Gly Ile Glu His Gln Leu Met Ser Gln Gly 35 40 45 Lys Arg His Leu Glu Gln Leu Arg Thr Val Lys His Arg Pro Ala Leu 50 55 60 Leu Glu Leu Glu Glu Gly Leu Ala Lys Ala Leu His Gln Gln Gly Phe 65 70 75 80 Val Gln Val Val Thr Pro Thr Ile Ile Thr Lys Ser Ala Leu Ala Lys 85 90 95 Met Thr Ile Gly Glu Asp His Pro Leu Phe Ser Gln Val Phe Trp Leu 100 105 110 Asp Gly Lys Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Thr 115 120 125 Leu Trp Arg Glu Leu Glu Arg Leu Trp Asp Lys Pro Ile Arg Ile Phe 130 135 140 Glu Ile Gly Thr Cys Tyr Arg Lys Glu Ser Gln Gly Ala Gln His Leu 145 150 155 160 Asn Glu Phe Thr Met Leu Asn Leu Thr Glu Leu Gly Thr Pro Leu Glu 165 170 175 Glu Arg His Gln Arg Leu Glu Asp Met Ala Arg Trp Val Leu Glu Ala 180 185 190 Ala Gly Ile Arg Glu Phe Glu Leu Val Thr Glu Ser Ser Val Val Tyr 195 200 205 Gly Asp Thr Val Asp Val Met Lys Gly Asp Leu Glu Leu Ala Ser Gly 210 215 220 Ala Met Gly Pro His Phe Leu Asp Glu Lys Trp Glu Ile Val Asp Pro 225 230 235 240 Trp Val Gly Leu Gly Phe Gly Leu Glu Arg Leu Leu Met Ile Arg Glu 245 250 255 Gly Thr Gln His Val Gln Ser Met Ala Arg Ser Leu Ser Tyr Leu Asp 260 265 270 Gly Val Arg Leu Asn Ile Asn 275 <210> 9 <211> 312 <212> PRT <213> Desulfitobacterium hafniense Y51 <400> 9 Met Asp Arg Ile Asp His Thr Asp Ser Lys Phe Val Gln Ala Gly Glu 1 5 10 15 Thr Pro Val Leu Pro Ala Thr Phe Met Phe Leu Thr Arg Arg Asp Pro 20 25 30 Pro Leu Ser Ser Phe Trp Thr Lys Val Gln Tyr Gln Arg Leu Lys Glu 35 40 45 Leu Asn Ala Ser Gly Glu Gln Leu Glu Met Gly Phe Ser Asp Ala Leu 50 55 60 Ser Arg Asp Arg Ala Phe Gln Gly Ile Glu His Gln Leu Met Ser Gln 65 70 75 80 Gly Lys Arg His Leu Glu Gln Leu Arg Thr Val Lys His Arg Pro Ala 85 90 95 Leu Leu Glu Leu Glu Glu Gly Leu Ala Lys Ala Leu His Gln Gln Gly 100 105 110 Phe Val Gln Val Val Thr Pro Thr Ile Ile Thr Lys Ser Ala Leu Ala 115 120 125 Lys Met Thr Ile Gly Glu Asp His Pro Leu Phe Ser Gln Val Phe Trp 130 135 140 Leu Asp Gly Lys Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr 145 150 155 160 Thr Leu Trp Arg Glu Leu Glu Arg Leu Trp Asp Lys Pro Ile Arg Ile 165 170 175 Phe Glu Ile Gly Thr Cys Tyr Arg Lys Glu Ser Gln Gly Ala Gln His 180 185 190 Leu Asn Glu Phe Thr Met Leu Asn Leu Thr Glu Leu Gly Thr Pro Leu 195 200 205 Glu Glu Arg His Gln Arg Leu Glu Asp Met Ala Arg Trp Val Leu Glu 210 215 220 Ala Ala Gly Ile Arg Glu Phe Glu Leu Val Thr Glu Ser Ser Val Val 225 230 235 240 Tyr Gly Asp Thr Val Asp Val Met Lys Gly Asp Leu Glu Leu Ala Ser 245 250 255 Gly Ala Met Gly Pro His Phe Leu Asp Glu Lys Trp Glu Ile Val Asp 260 265 270 Pro Trp Val Gly Leu Gly Phe Gly Leu Glu Arg Leu Leu Met Ile Arg 275 280 285 Glu Gly Thr Gln His Val Gln Ser Met Ala Arg Ser Leu Ser Tyr Leu 290 295 300 Asp Gly Val Arg Leu Asn Ile Asn 305 310 <210> 10 <211> 288 <212> PRT <213> Desulfitobacterium hafniense <400> 10 Met Phe Leu Thr Arg Arg Asp Pro Pro Leu Ser Ser Phe Trp Thr Lys 1 5 10 15 Val Gln Tyr Gln Arg Leu Lys Glu Leu Asn Ala Ser Gly Glu Gln Leu 20 25 30 Glu Met Gly Phe Ser Asp Ala Leu Ser Arg Asp Arg Ala Phe Gln Gly 35 40 45 Ile Glu His Gln Leu Met Ser Gln Gly Lys Arg His Leu Glu Gln Leu 50 55 60 Arg Thr Val Lys His Arg Pro Ala Leu Leu Glu Leu Glu Glu Lys Leu 65 70 75 80 Ala Lys Ala Leu His Gln Gln Gly Phe Val Gln Val Val Thr Pro Thr 85 90 95 Ile Ile Thr Lys Ser Ala Leu Ala Lys Met Thr Ile Gly Glu Asp His 100 105 110 Pro Leu Phe Ser Gln Val Phe Trp Leu Asp Gly Lys Lys Cys Leu Arg 115 120 125 Pro Met Leu Ala Pro Asn Leu Tyr Thr Leu Trp Arg Glu Leu Glu Arg 130 135 140 Leu Trp Asp Lys Pro Ile Arg Ile Phe Glu Ile Gly Thr Cys Tyr Arg 145 150 155 160 Lys Glu Ser Gln Gly Ala Gln His Leu Asn Glu Phe Thr Met Leu Asn 165 170 175 Leu Thr Glu Leu Gly Thr Pro Leu Glu Glu Arg His Gln Arg Leu Glu 180 185 190 Asp Met Ala Arg Trp Val Leu Glu Ala Ala Gly Ile Arg Glu Phe Glu 195 200 205 Leu Val Thr Glu Ser Ser Val Val Tyr Gly Asp Thr Val Asp Val Met 210 215 220 Lys Gly Asp Leu Glu Leu Ala Ser Gly Ala Met Gly Pro His Phe Leu 225 230 235 240 Asp Glu Lys Trp Glu Ile Phe Asp Pro Trp Val Gly Leu Gly Phe Gly 245 250 255 Leu Glu Arg Leu Leu Met Ile Arg Glu Gly Thr Gln His Val Gln Ser 260 265 270 Met Ala Arg Ser Leu Ser Tyr Leu Asp Gly Val Arg Leu Asn Ile Asn 275 280 285 <210> 11 <211> 277 <212> PRT <213> Desulfotomaculum acetoxidans DSM 771 <400> 11 Met Ser Phe Leu Trp Thr Val Ser Gln Gln Lys Arg Leu Ser Glu Leu 1 5 10 15 Asn Ala Ser Glu Glu Glu Lys Asn Met Ser Phe Ser Ser Thr Ser Asp 20 25 30 Arg Glu Ala Ala Tyr Lys Arg Val Glu Met Arg Leu Ile Asn Glu Ser 35 40 45 Lys Gln Arg Leu Asn Lys Leu Arg His Glu Thr Arg Pro Ala Ile Cys 50 55 60 Ala Leu Glu Asn Arg Leu Ala Ala Ala Leu Arg Gly Ala Gly Phe Val 65 70 75 80 Gln Val Ala Thr Pro Val Ile Leu Ser Lys Lys Leu Leu Gly Lys Met 85 90 95 Thr Ile Thr Asp Glu His Ala Leu Phe Ser Gln Val Phe Trp Ile Glu 100 105 110 Glu Asn Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Tyr Ile 115 120 125 Leu Lys Asp Leu Leu Arg Leu Trp Glu Lys Pro Val Arg Ile Phe Glu 130 135 140 Ile Gly Ser Cys Phe Arg Lys Glu Ser Gln Gly Ser Asn His Leu Asn 145 150 155 160 Glu Phe Thr Met Leu Asn Leu Val Glu Trp Gly Leu Pro Glu Glu Gln 165 170 175 Arg Gln Lys Arg Ile Ser Glu Leu Ala Lys Leu Val Met Asp Glu Thr 180 185 190 Gly Ile Asp Glu Tyr His Leu Glu His Ala Glu Ser Val Val Tyr Gly 195 200 205 Glu Thr Val Asp Val Met His Arg Asp Ile Glu Leu Gly Ser Gly Ala 210 215 220 Leu Gly Pro His Phe Leu Asp Gly Arg Trp Gly Val Val Gly Pro Trp 225 230 235 240 Val Gly Ile Gly Phe Gly Leu Glu Arg Leu Leu Met Val Glu Gln Gly 245 250 255 Gly Gln Asn Val Arg Ser Met Gly Lys Ser Leu Thr Tyr Leu Asp Gly 260 265 270 Val Arg Leu Asn Ile 275 <210> 12 <211> 419 <212> PRT <213> Methanosarcina barkeri <400> 12 Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg 85 90 95 Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser 100 105 110 Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr 115 120 125 Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser 130 135 140 Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu 145 150 155 160 Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn 165 170 175 Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg 180 185 190 Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu 195 200 205 Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe 210 215 220 Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg 225 230 235 240 Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val 245 250 255 Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn 260 265 270 Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe 275 280 285 Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu 290 295 300 Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr 305 310 315 320 Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu 325 330 335 Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr 340 345 350 Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly 355 360 365 Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly 370 375 380 Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys 385 390 395 400 Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser 405 410 415 Thr Asn Leu <210> 13 <211> 419 <212> PRT <213> Methanosarcina barkeri <400> 13 Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Gly Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg 85 90 95 Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser 100 105 110 Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr 115 120 125 Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser 130 135 140 Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu 145 150 155 160 Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn 165 170 175 Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg 180 185 190 Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu 195 200 205 Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe 210 215 220 Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg 225 230 235 240 Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val 245 250 255 Asp Lys Asn Leu Cys Leu Arg Pro Met Val Ala Pro Thr Ile Phe Asn 260 265 270 Tyr Ala Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe 275 280 285 Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu 290 295 300 Glu Glu Phe Thr Met Val Asn Phe Phe Gln Met Gly Ser Gly Cys Thr 305 310 315 320 Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu 325 330 335 Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr 340 345 350 Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly 355 360 365 Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly 370 375 380 Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys 385 390 395 400 Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser 405 410 415 Thr Asn Leu <210> 14 <211> 419 <212> PRT <213> Methanosarcina barkeri <400> 14 Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn 65 70 75 80 Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg 85 90 95 Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser 100 105 110 Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr 115 120 125 Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser 130 135 140 Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu 145 150 155 160 Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn 165 170 175 Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg 180 185 190 Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu 195 200 205 Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe 210 215 220 Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg 225 230 235 240 Phe Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val 245 250 255 Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ser Pro Thr Leu Cys Asn 260 265 270 Tyr Met Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe 275 280 285 Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu 290 295 300 Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr 305 310 315 320 Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu 325 330 335 Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr 340 345 350 Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly 355 360 365 Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly 370 375 380 Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys 385 390 395 400 Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser 405 410 415 Thr Asn Leu <210> 15 <211> 454 <212> PRT <213> Methanosarcina mazei <400> 15 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val 100 105 110 Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln 115 120 125 Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu 130 135 140 Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser 145 150 155 160 Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile 165 170 175 Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys 180 185 190 Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile 195 200 205 Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu 210 215 220 Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu 225 230 235 240 Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp 245 250 255 Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr 260 265 270 Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile 275 280 285 Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn 290 295 300 Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile 305 310 315 320 Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys 325 330 335 Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser 340 345 350 Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn 355 360 365 His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr 370 375 380 Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala 385 390 395 400 Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro 405 410 415 Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His 420 425 430 Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn 435 440 445 Gly Ile Ser Thr Asn Leu 450 <210> 16 <211> 454 <212> PRT <213> Methanosarcina mazei <400> 16 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val 100 105 110 Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln 115 120 125 Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu 130 135 140 Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser 145 150 155 160 Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile 165 170 175 Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys 180 185 190 Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile 195 200 205 Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu 210 215 220 Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu 225 230 235 240 Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp 245 250 255 Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr 260 265 270 Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile 275 280 285 Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Val Ala Pro Asn 290 295 300 Ile Phe Asn Tyr Ala Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile 305 310 315 320 Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys 325 330 335 Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Phe Gln Met Gly Ser 340 345 350 Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn 355 360 365 His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr 370 375 380 Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala 385 390 395 400 Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro 405 410 415 Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His 420 425 430 Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn 435 440 445 Gly Ile Ser Thr Asn Leu 450 <210> 17 <211> 454 <212> PRT <213> Methanosarcina mazei <400> 17 Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp 1 5 10 15 Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser 20 25 30 Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val 35 40 45 Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys 50 55 60 Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn 65 70 75 80 Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys 85 90 95 Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val 100 105 110 Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln 115 120 125 Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu 130 135 140 Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser 145 150 155 160 Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile 165 170 175 Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys 180 185 190 Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile 195 200 205 Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu 210 215 220 Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu 225 230 235 240 Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp 245 250 255 Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr 260 265 270 Ile Glu Arg Phe Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile 275 280 285 Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ser Pro Asn 290 295 300 Leu Cys Asn Tyr Met Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile 305 310 315 320 Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys 325 330 335 Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser 340 345 350 Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn 355 360 365 His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr 370 375 380 Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala 385 390 395 400 Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro 405 410 415 Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His 420 425 430 Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn 435 440 445 Gly Ile Ser Thr Asn Leu 450 <210> 18 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> FMT17 <400> 18 catgtagatc gaatggacta taaatccgtt cagccggg 38 <210> 19 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> FMT18 <400> 19 cccggctgaa cggatttata gtccattcga tctacatg 38 <210> 20 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> FMT19 <400> 20 catgtagatc gaatggactt gcaatccgtt cagccgggtt ag 42 <210> 21 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> FMT20 <400> 21 ctaacccggc tgaacggatt gcaagtccat tcgatctaca tg 42 <210> 22 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT21 <400> 22 gtagatcgaa tggactagaa atccgttcag ccggg 35 <210> 23 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT22 <400> 23 cccggctgaa cggatttcta gtccattcga tctac 35 <210> 24 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> FMT23 <400> 24 catgtagatc gaatggactg ctaatccgtt cagccgggtt ag 42 <210> 25 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> FMT24 <400> 25 ctaacccggc tgaacggatt agcagtccat tcgatctaca tg 42 <210> 26 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT25 <400> 26 gtagatcgaa tggacttaaa atccgttcag ccggg 35 <210> 27 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT26 <400> 27 cccggctgaa cggattttaa gtccattcga tctac 35 <210> 28 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT27 <400> 28 gtagatcgaa tggactcaga atccgttcag ccggg 35 <210> 29 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT28 <400> 29 cccggctgaa cggattctga gtccattcga tctac 35 <210> 30 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT29 <400> 30 gtagatcgaa tggactcata atccgttcag ccggg 35 <210> 31 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> FMT30 <400> 31 cccggctgaa cggattatga gtccattcga tctac 35 <210> 32 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> FMT31 <400> 32 catgtagatc gaatggactt ttaatccgtt cagccgggtt ag 42 <210> 33 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> FMT32 <400> 33 ctaacccggc tgaacggatt aaaagtccat tcgatctaca tg 42 <210> 34 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> MAM01 <400> 34 gtagatcgaa tggactcata atccgttcag ccggg 35 <210> 35 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> MAM02 <400> 35 cccggctgaa cggattatga gtccattcga tctac 35 <210> 36 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> MAM03 <400> 36 gatcgaatgg actcacaatc cgttcagccg g 31 <210> 37 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> MAM04 <400> 37 ccggctgaac ggattgtgag tccattcgat c 31 <210> 38 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> MAM05 <400> 38 gatcgaatgg actcttaatc cgttcagccg 30 <210> 39 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> MAM06 <400> 39 cggctgaacg gattaagagt ccattcgatc 30 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> MAM07 <400> 40 gatcgaatgg actctcaatc cgttcagccg 30 <210> 41 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> MAM08 <400> 41 cggctgaacg gattgagagt ccattcgatc 30 <210> 42 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> MAM09 <400> 42 gtagatcgaa tggactgtaa atccgttcag ccg 33 <210> 43 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> MAM10 <400> 43 cggctgaacg gatttacagt ccattcgatc tac 33 <210> 44 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> MAM11 <400> 44 gatcgaatgg actccaaatc cgttcagccg 30 <210> 45 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> MAM12 <400> 45 cggctgaacg gatttggagt ccattcgatc 30 <210> 46 <211> 1587 <212> DNA <213> Artificial Sequence <220> <223> Drosophila GFP-amber-mCherry-HA <400> 46 atggtgtcca agggcgagga gctgtttacc ggcgtggtgc ccattctggt ggagctggat 60 ggcgacgtga acggccacaa gttcagcgtg tccggcgagg gcgagggcga cgccacctat 120 ggaaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc atggccaacc 180 ctcgtgacca ccctgaccta tggcgtgcag tgcttcagcc gctaccccga tcacatgaag 240 cagcacgatt tcttcaagag cgccatgccc gagggctacg tgcaggagcg caccatcttt 300 ttcaaggatg acggcaacta caagacccgc gccgaagtga agttcgaggg cgataccctc 360 gtgaaccgca tcgagctgaa gggcatcgat ttcaaggagg atggaaacat cctgggccac 420 aagctggagt acaactacaa cagccacaac gtgtacatca tggccgacaa gcagaagaac 480 ggcatcaaag tgaacttcaa gatccgccac aacatcgagg atggcagcgt gcagctggcc 540 gatcactacc agcagaacac cccaatcggc gacggcccag tgctgctgcc cgataaccat 600 tacctgagca cccagagcgc cctgagcaag gaccccaacg agaagcgcga ccacatggtg 660 ctgctggagt ttgtgaccgc cgccggcatt accctgggca tggatgagct gtacaagcgc 720 gcccagatcc acgatctggt gtaggtggga ggatcgaccc gcgtgtcgaa gggcgaggag 780 gataacatgg ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg 840 aatggacacg agttcgagat tgagggcgag ggcgagggac gcccatatga gggaacccag 900 accgccaagc tgaaagtgac caagggcgga cccctgccct tcgcctggga tattctgagc 960 ccccagttta tgtacggcag caaggcctac gtgaagcacc ccgccgatat ccccgattac 1020 ctgaagctga gcttcccaga gggcttcaag tgggagcgcg tgatgaattt cgaggacggc 1080 ggagtcgtga ccgtgaccca ggatagcagt ttgcaggatg gcgagttcat ctacaaagtg 1140 aagctgcgcg gcaccaactt cccgtccgat ggcccagtga tgcagaagaa gaccatgggc 1200 tgggaggcca gcagcgagcg catgtatcca gaggatggcg ccctgaaggg cgagatcaag 1260 cagcgcctga agctgaagga tggcggccac tacgatgccg aagtgaagac cacctacaag 1320 gccaagaagc cggtgcagct gccaggcgcc tacaatgtga acatcaagct ggatatcacc 1380 tcccacaacg aggactacac catcgtggag cagtatgagc gcgccgaggg ccgccatagt 1440 accggcggaa tggacgagct gtataagatg tacccctacg atgtgcccga ttacgccgag 1500 cagaagctga tctccgagga ggacctgcac catcaccacc accacggaag tggcagcggc 1560 tccccaaaga agaagcgcaa ggtgtaa 1587 <210> 47 <211> 527 <212> PRT <213> Artificial Sequence <220> <223> Drosophila GFP-amber-mCherry-HA <400> 47 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Arg 225 230 235 240 Ala Gln Ile His Asp Leu Val Val Gly Gly Ser Thr Arg Val Ser Lys 245 250 255 Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe Met Arg Phe Lys 260 265 270 Val His Met Glu Gly Ser Val Asn Gly His Glu Phe Glu Ile Glu Gly 275 280 285 Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala Lys Leu Lys 290 295 300 Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro 305 310 315 320 Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro Ala Asp Ile 325 330 335 Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg 340 345 350 Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Ser 355 360 365 Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu Arg Gly Thr 370 375 380 Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp 385 390 395 400 Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala Leu Lys Gly 405 410 415 Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His Tyr Asp Ala 420 425 430 Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln Leu Pro Gly 435 440 445 Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser His Asn Glu Asp 450 455 460 Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg His Ser Thr 465 470 475 480 Gly Gly Met Asp Glu Leu Tyr Lys Met Tyr Pro Tyr Asp Val Pro Asp 485 490 495 Tyr Ala Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu His His His His 500 505 510 His His Gly Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val 515 520 525

Claims (22)

  1. 시클로프로펜 기가 있는 아미노산을 포함하는 폴리펩티드이며, 여기서 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산에 연결된 것인 폴리펩티드.
  2. 제1항에 있어서, 상기 시클로프로펜 기가 1,3-이치환 시클로프로펜인 폴리펩티드.
  3. 제2항에 있어서, 상기 시클로프로펜이 1,3-디메틸시클로프로펜인 폴리펩티드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 시클로프로펜 기가 리신 아미노산의 잔기로서 존재하는 것인 폴리펩티드.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 시클로프로펜 기에 연결된 테트라진 화합물을 추가로 포함하는 폴리펩티드.
  6. 시클로프로펜을 포함하는 아미노산이며, 여기서 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산 모이어티(moiety)에 연결된 것인 아미노산.
  7. 제6항에 있어서, 상기 시클로프로펜이 1,3-이치환 시클로프로펜인 아미노산.
  8. 제7항에 있어서, 상기 시클로프로펜이 1,3-디메틸시클로프로펜인 아미노산.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서, 리신 아미노산인 아미노산.
  10. 제9항에 있어서, N ε-[((2-메틸시클로프로프-2-엔-1-일)메톡시)카르보닐]-l-리신을 포함하는 아미노산.
  11. 제10항에 있어서, 하기로 이루어진 아미노산.
    Figure pct00023
  12. 시클로프로펜 기를 포함하고, 상기 시클로프로펜 기가 카르바메이트 기를 통해 아미노산 모이어티에 연결된 폴리펩티드를 제조하는 방법이며, 카르바메이트 기를 통해 아미노산 모이어티에 연결된 시클로프로펜 기를 포함하는 아미노산을 폴리펩티드 내로 유전적으로 혼입시키는 것을 포함하는 방법.
  13. 제12항에 있어서, 폴리펩티드의 제조가
    (i) 시클로프로펜 기가 있는 아미노산을 코딩하는 직교성(orthogonal) 코돈을 포함하는, 폴리펩티드를 코딩하는 핵산을 제공하고;
    (ii) 상기 핵산을, 상기 직교성 코돈을 인식할 수 있고 시클로프로펜 기가 있는 상기 아미노산을 폴리펩티드 사슬 내로 혼입시킬 수 있는 직교성 tRNA 신테타제/tRNA 쌍의 존재 하에 번역하는 것을 포함하는 것인 방법.
  14. 제12항 또는 제13항에 있어서, 상기 직교성 코돈이 앰버(amber) 코돈 (TAG)을 포함하고, 상기 tRNA가 MbtRNACUA를 포함하며, 상기 tRNA 신테타제가 MbPylRS를 포함하거나; 또는 상기 직교성 코돈이 앰버 코돈 (TAG)을 포함하고, 상기 tRNA가 MmtRNACUA를 포함하며, 상기 tRNA 신테타제가 MmPylRS를 포함하는 것인 방법.
  15. 제12항 내지 제14항 중 어느 한 항에 있어서, 시클로프로펜 기를 포함하는 상기 아미노산이 제6항 내지 제11항 중 어느 한 항에 따른 아미노산인 방법.
  16. 제1항 내지 제4항 중 어느 한 항에 따른 폴리펩티드를 제공하고, 상기 폴리펩티드를 테트라진 화합물과 접촉시키고, 역 전자 요구 딜스-알더(Diels-Alder) 고리화첨가 반응에 의해 테트라진이 시클로프로펜 기에 연결되게 하도록 인큐베이션하는 것을 포함하는, 테트라진 기를 포함하는 폴리펩티드를 제조하는 방법.
  17. 제16항에 있어서, 상기 반응이 10분 이하, 바람직하게는 1분 이하, 바람직하게는 30초 이하 동안 진행되도록 허용되는 것인 방법.
  18. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 폴리펩티드가 각각 시클로프로펜 기가 있는 2개 이상의 아미노산을 포함하고, 각각의 상기 시클로프로펜 기가 카르바메이트 기를 통해 각각의 상기 아미노산에 연결된 것인 폴리펩티드.
  19. 제18항에 있어서, 각각 시클로프로펜 기가 있는 4개의 아미노산을 포함하는 폴리펩티드.
  20. 제1항 내지 제5항, 제18항 또는 제19항 중 어느 한 항에 따른 폴리펩티드를 포함하는 항체 약물 접합체 (ADC).
  21. 실질적으로 본원에 기술된 바와 같은 화합물, 폴리펩티드 또는 방법.
  22. 실질적으로 첨부된 도면을 참조로 본원에서 기술된 바와 같은 화합물, 폴리펩티드 또는 방법.
KR1020167025032A 2014-03-14 2015-03-10 시클로프로펜 아미노산 및 방법 KR20160134669A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1404569.4 2014-03-14
GB1404569.4A GB2528227A (en) 2014-03-14 2014-03-14 Cyclopropene amino acids and methods
PCT/GB2015/050694 WO2015136265A1 (en) 2014-03-14 2015-03-10 Cyclopropene amino acids and methods

Publications (1)

Publication Number Publication Date
KR20160134669A true KR20160134669A (ko) 2016-11-23

Family

ID=50634774

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167025032A KR20160134669A (ko) 2014-03-14 2015-03-10 시클로프로펜 아미노산 및 방법

Country Status (10)

Country Link
US (1) US10774039B2 (ko)
EP (1) EP3116993B1 (ko)
JP (1) JP6503370B2 (ko)
KR (1) KR20160134669A (ko)
CN (1) CN106164263B (ko)
BR (1) BR112016019179A2 (ko)
CA (1) CA2941069A1 (ko)
GB (1) GB2528227A (ko)
HK (1) HK1231504A1 (ko)
WO (1) WO2015136265A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200015344A (ko) 2018-08-03 2020-02-12 (주)엠티에이 대면적의 탄소체 성장용 플랫폼 및 이를 이용한 탄소체 성장방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014028588B1 (pt) 2012-05-18 2023-03-21 United Kingdom Research And Innovation Polipeptídeo, método de produzir um polipeptídeo que compreende o grupo bcn, método de produzir um polipeptídeo que compreende um grupo tetrazina, aminoácido e bcn lisina
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
CN112094205B (zh) * 2019-06-18 2022-06-21 成都郑源生化科技有限公司 一种制备Fmoc-Ser(tBu)-OH的方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3228347B2 (ja) * 1991-06-25 2001-11-12 三菱化学株式会社 シクロプロペノン誘導体
EP2410331B1 (en) 2003-06-18 2015-09-23 The Scripps Research Institute Aminoacyl-tRNA synthetase for aminoacylation tRNA with unnatural amino acids
MXPA06006868A (es) 2003-12-18 2007-03-21 Scripps Research Inst Incorporacion selectiva de 5-hiroxitriptofano en proteinas de celulas de mamiferos.
ES2519444T3 (es) 2004-09-21 2014-11-07 The Scripps Research Institute Incorporación in vivo de alquinil aminoácidos a proteínas en eubacterias
CN101048506B (zh) 2004-10-27 2013-06-26 斯克利普斯研究院 体内掺入非天然氨基酸的正交翻译组分
JP2007037445A (ja) 2005-08-02 2007-02-15 Institute Of Physical & Chemical Research tRNA合成方法、核酸、アミノアシルtRNA合成方法及び非天然型アミノ酸組み込み蛋白質の製造方法
WO2007090198A2 (en) 2006-02-01 2007-08-09 Encode Bio, Inc. Fluorescent assays using orthogonal trna - aminoacyl synthetase pairs
US20080096819A1 (en) 2006-05-02 2008-04-24 Allozyne, Inc. Amino acid substituted molecules
JP2010526091A (ja) 2007-04-30 2010-07-29 インテザイン テクノロジーズ, インコーポレイテッド 癌の処置のための生物学的な標的基の改変
AU2008301614A1 (en) 2007-09-20 2009-03-26 Riken Mutant pyrrolysyl-TRNA synthetase, and method for production of protein having non-natural amino acid integrated therein by using the same
GB0721291D0 (en) 2007-10-30 2007-12-12 Medical Res Council Methods and compositions
GB2470770A (en) 2009-06-04 2010-12-08 Medical Res Council Incorporation of unnatural amino acids having an orthogonal functional group into polypeptides using orthogonal tRNA/tRNA synthetase pairs
GB0917242D0 (en) 2009-10-01 2009-11-18 Medical Res Council Acetyl lysine incorporation with tRNA synthetase
GB0917240D0 (en) 2009-10-01 2009-11-18 Medical Res Council Incorporation of methyl lysine into poiypeptide
EP2558475A1 (en) * 2010-04-15 2013-02-20 Spirogen Sàrl Pyrrolobenzodiazepines used to treat proliferative diseases
WO2011136645A1 (en) 2010-04-27 2011-11-03 Stichting Katholieke Universiteit, More Particularly Radboud University Nijmegen Fused cyclooctyne compounds and their use in metal-free click reactions
US20120077186A1 (en) 2010-05-07 2012-03-29 Oregon Health & Science University Use of cysteine-derived suppressor trnas for non-native amino acid incorporation
WO2011156686A2 (en) 2010-06-11 2011-12-15 The Regents Of The University Of Colorado, A Body Corporate Method for synthesizing a cyclic multivalent peptide using a thiol-mediated reaction
DK2670767T3 (en) 2011-02-03 2018-03-26 European Molecular Biology Laboratory Non-naturally occurring amino acids comprising a cyclooctynyl or transcyclooctynyl analog group and uses thereof
GB201110815D0 (en) 2011-06-24 2011-08-10 Medical Res Council Incorporation of subtituted lysines into polypeptides
EP2753607B1 (en) 2011-09-09 2016-04-13 Berry And Associates, Inc. Bicyclo[6.1.0]non-4-yne reagents for chemical modification of oligonucleotides
GB201201100D0 (en) * 2012-01-20 2012-03-07 Medical Res Council Polypeptides and methods
BR112014028588B1 (pt) 2012-05-18 2023-03-21 United Kingdom Research And Innovation Polipeptídeo, método de produzir um polipeptídeo que compreende o grupo bcn, método de produzir um polipeptídeo que compreende um grupo tetrazina, aminoácido e bcn lisina
KR102155389B1 (ko) * 2012-09-24 2020-09-11 메디뮨 리미티드 세포주
GB2528227A (en) 2014-03-14 2016-01-20 Medical Res Council Cyclopropene amino acids and methods
GB201419109D0 (en) 2014-10-27 2014-12-10 Medical Res Council Incorporation of unnatural amino acids into proteins

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200015344A (ko) 2018-08-03 2020-02-12 (주)엠티에이 대면적의 탄소체 성장용 플랫폼 및 이를 이용한 탄소체 성장방법
KR20200015343A (ko) 2018-08-03 2020-02-12 (주)엠티에이 다양한 형상의 탄소체 성장용 금형 및 이를 이용한 탄소체 성장방법

Also Published As

Publication number Publication date
JP2017510259A (ja) 2017-04-13
CA2941069A1 (en) 2015-09-17
EP3116993B1 (en) 2019-11-13
CN106164263A (zh) 2016-11-23
HK1231504A1 (zh) 2017-12-22
JP6503370B2 (ja) 2019-04-17
BR112016019179A2 (pt) 2017-10-10
GB2528227A (en) 2016-01-20
GB201404569D0 (en) 2014-04-30
US10774039B2 (en) 2020-09-15
EP3116993A1 (en) 2017-01-18
WO2015136265A1 (en) 2015-09-17
CN106164263B (zh) 2022-02-11
US20170015623A1 (en) 2017-01-19

Similar Documents

Publication Publication Date Title
EP2438174B1 (en) METHOD FOR INCORPORATING ALIPHATIC AMINO ACIDS COMPRISING ALKYNE, AZIDE OR ALIPHATIC KETONE FUNCTIONAL GROUPS USING APPROPRIATE tRNA/tRNA SYNTHASE PAIRS
EP2804872B1 (en) Norbornene modified peptides and their labelling with tetrazine compounds
Camarero et al. Biosynthesis of a fully functional cyclotide inside living bacterial cells
CN108410827B (zh) 整合包含bcn基团的氨基酸到多肽中的方法
CN107002088B (zh) 将非天然氨基酸掺入蛋白质中
CN111747869B (zh) 一种遗传编码的甲醛反应性非天然氨基酸、制备方法及其应用
KR20160134669A (ko) 시클로프로펜 아미노산 및 방법
JP5306995B2 (ja) 標的物質の検出方法、並びに、これに用いるタグ、dna、ベクター、プローブ及び検出キット
Mitra Incorporating unnatural amino acids into recombinant proteins in living cells
WO2011024887A1 (ja) 環状ペプチドを含む結合体およびその作製方法
CN113651756A (zh) 一种遗传编码的光交联非天然氨基酸盐及其制备方法与应用
Wu Techniques for labelling biological macromolecules for spectroscopic studies
WO2022090520A1 (en) Site-selective modification of proteins
Chen Adding new chemistry to proteins via genetic incorporation
WO2023069816A2 (en) Compositions and methods for multiplex decoding of quadruplet codons
Truong Expanding Protein Sequence Space through Incorporation of Non-Canonical Amino Acids
Warner Multifunctionalization of proteins: Strategies for combining semi-synthetic and bioorthogonal techniques
Abdeljabbar The Incorporation of Azide-bearing Unnatural Amino Acids into Proteins for Bio-orthogonal Reactions
Periasamy In Vivo Labeling Of A Model β-Clam Protein With A Fluorescent Amino Acid
JP2013107842A (ja) 新規な非天然型アミノ酸、及びその利用