KR20200005640A

KR20200005640A - 광-전환성 폴리펩타이드 및 이의 용도

Info

Publication number: KR20200005640A
Application number: KR1020197036429A
Authority: KR
Inventors: 아르네 스케라; 안드레아스 라이헤르트; 마틴 다우너
Original assignee: 테크니쉐 우니베르지테트 뮌헨
Priority date: 2017-05-10
Filing date: 2018-05-09
Publication date: 2020-01-15
Also published as: US20210079037A1; JP7221537B2; JP2020520348A; EP3621983A1; CN110637026A; CA3060339A1; WO2018206738A1

Abstract

본 발명은 광-전환성 폴리펩타이드에 관한 것이다. 보다 상세하게는, 본 발명은 광-반응성 요소를 포함하는 폴리펩타이드에 관한 것으로, 광-반응성 요소의 배열(즉, 배열 상태)는 특정 파장(들)의 광으로 폴리펩타이드를 조사하여 트랜스 및 시스 이성질체 사이에서 전환될 수 있고, 상기 배열의 전환은 상기 폴리펩타이드의 리간드(예를 들어, 목적 분자)에 대한 형태 및 결합 활성을 바꾼다. 또한, 본 발명은 목적 분자의 분리 및/또는 정제를 위해 상기 광-전환성 폴리펩타이드를 이용하는 것을 포함한다. 본 발명은 또한 본 발명의 광-전환성 폴리펩타이드를 포함하는 친화성 매트릭스, 친화성 크로마토그래피 컬럼 및 친화성 크로마토그래피 기기를 제공한다.

Description

광-전환성 폴리펩타이드 및 이의 용도

본 발명은 광-전환성 폴리펩타이드에 관한 것이다. 특히, 본 발명은 광-반응성 요소를 포함하는 폴리펩타이드에 관한 것으로, 광-반응성 요소의 배열(configuration)(즉, 배열 상태)는 특정 파장(들)의 광으로 폴리펩타이드를 조사하여 트랜스 및 시스 이성질체 사이에서 전환될 수 있고, 상기 배열의 전환은 상기 폴리펩타이드의 리간드(예를 들어, 목적 분자)에 대한 형태(conformation) 및 결합 활성을 바꾼다. 또한, 본 발명은 목적 분자의 분리 및/또는 정제를 위해 상기 광-전환성 폴리펩타이드를 이용하는 것을 포함한다. 본 발명은 또한 본 발명의 광-전환성 폴리펩타이드를 포함하는 친화성 매트릭스, 친화성 크로마토그래피 컬럼 및 친화성 크로마토그래피 기기를 제공한다.

친화성 크로마토그래피는 단백질 및 다른 생물학적 분자의 분리 및 정제에 점점 중요해지고 있는 고해상도 및 고용량 분리 방법이다. 50년 전에 친화성 크로마토그래피가 시작된 이후(Cuatrecasas et al. 1968 Proc. Natl. Acad. Sci. U S A 61: 636-643), pH, 이온 강도 또는 온도에 기초한 전통적인 정제 기술이 많은 경우에 이 기술로 대체되었다.

오늘날, 친화성 크로마토그래피는 생물학적 활성 화합물의 정제에 이용할 수 있는 가장 강력한 기술 중 하나이다. 이 방법은 또한 무엇보다도 효소 활성, 호르몬에 의한 생리적 조절, 단백질-단백질 또는 세포-세포 상호작용과 같은 다양한 생물학적 공정을 연구하는데 유용한 도구이다(Wilchek 2004 Protein Sci. 13: 3066-3070). 친화성 크로마토그래피의 광범위한 적용 가능성은 두 분자(친화성 분자 및 목적 분자(즉, 타겟 분자 또는 리간드)) 간의 매우 특이적이고 가역적인 생물학적 상호작용을 기반으로 한다. 친화성 분자는 고체상 매트릭스, 소위 고체상 또는 정지상(또한 친화성 지지체로 불림)에 부착된다. 정제되는 목적 분자는 액체상(또한 이동상으로 불림)에 존재한다(Hage 2012 J. Pharm. Biomed. Anal. 69: 93-105).

일반적으로, 친화성 정제는 3 단계를 포함한다: (i) 액체상 미정제 시료를 친화성 지지체와 인큐베이션하여 시료 내 타겟 목적 분자(리간드)가 고정된 친화성 분자에 결합하도록 하는 단계, (ii) 크로마토그래피 매트릭스로부터 결합하지 않은 시료 성분들을 세척하는 단계 및 (iii) 친화성 분자 및 리간드 간의 결합 상호작용이 더 이상 일어나지 않도록 완충액 조건을 변경하여 친화성 지지체로부터 타겟 목적 분자의 해리 및 회수 단계(즉, 용출)(Magdeldin & Moser 2012 Affinity chromatography: Principles and applications, In: Affinity Chromatography, Ed. S. Magdeldin, InTech, pp. 1-28). 많은 친화성 분자의 매우 선택적인 결합 기능 때문에, 이 방법은 그들이 복잡한 생물학적 시료 내에 및/또는 미세한 양으로 존재하는 경우에도 특정 목적 분자를 분리, 측정 또는 연구하는데 사용될 수 있다(Hage 2012 J. Pharm. Biomed. Anal. 69: 93-105).

특히, 재조합 단백질의 정제는 타겟 목적 단백질과 통상 친화성 태그로 지칭되는 별개의 아미노산 서열의 융합에 의해 간소화될 수 있다. 이 태그는 짧은 아미노산 서열에서 도메인 또는 심지어 전체 단백질까지 다양할 수 있다(Terpe 2003 Appl. Microbiol. Biotechnol. 60: 523-533). 또한, 일부 태그는 단백질 용해도를 증가시키고, 따라서, 수율을 향상시키며, 정제를 촉진한다. 친화성 크로마토그래피에 사용되는 몇몇 일반적인 태그의 개요는 아래 표 1에 도시된다.

매우 유용한 친화성 태그의 일례로 재조합 단백질의 정제 및 검출을 위한 일반적인 도구로서 개발된 Strep-tag가 있다. 이 친화성 태그는 스트렙타비딘에 특이적이고 가역적으로 결합하는 9개의 아미노산 펩타이드(AWRHPQFGG, SEQ ID NO: 13)로서 유전자 무작위 라이브러리로부터 초기에 선발되었다(Schmidt & Skerra 1993 Protein Eng. 6: 109-122). 그리하여, Strep-tag는 스트렙타비딘 친화성 컬럼에서 상응하는 융합 단백질의 효율적인 정제를 제공할 수 있다. 결합된 재조합 단백질의 용출은 D-비오틴 또는 D-데스티오비오틴과 같이 천연 스트렙타비딘 리간드와 경쟁하여 생화학적 활성 상태로 약한(mild) 완충액 조건하에서 수행된다. Strep-tag는 이의 cDNA 또는 유전자의 서브클로닝 동안 재조합 폴리펩타이드에 직접적으로 융합될 수 있으며, 보통 단백질 기능, 폴딩 또는 분비를 방해하지 않는다.

Strep-tag/스트렙타비딘 시스템은 구조적으로 구동되는 결합 메커니즘을 나타내면서 스트렙타비딘 자체의 가공(결과적으로 "Strep-Tactin"로도 알려진 스트렙타비딘 돌연변이체 1을 생성함) 및 스트렙타비딘-펩타이드 복합체의 X-선 결정학적 분석을 포함하여 수년에 걸쳐 체계적으로 최적화되었다(Schmidt & Skerra 1994 J. Chromatogr. A 676: 337-345; Schmidt & Skerra 1996 J. Mol. Biol. 255: 753-766; Voss & Skerra 1997 Protein Eng. 10: 975-982.; Korndoerfer & Skerra 2002 Protein Sci. 11: 883-893; Schmidt & Skerra 2007 Nat. Protoc. 2: 1528-1535). 결과적으로, Strep-tag 또는 이의 개선된 버전 Strep-tag II는 바이오의약품 약물 개발, 산업적 생명공학 및 단백질/프로테옴 연구에서 복수의 유전자 산물의 동시 분리 및 기능 분석을 위한 신뢰할 수 있는 도구를 제공한다.

가장 중요한 것으로, Strep-tag 리간드 및 스트렙타비딘 친화성 분자 간의 잘-특성화된 상호작용은 태그된 목적 단백질의 1단계 정제를 가능케 하여, 이러한 종류의 친화성 크로마토그래피를 우수한 정제 기술로 만든다는 것이다. 젤 여과 또는 이온-교환 크로마토그래피와 같은 종래의 크로마토그래피 절차와는 달리, 친화성 크로마토그래피는 한 번에 하나의 목적 분자를 선택적으로 분리할 수 있으나, 이러한 종래의 방법들은 보통 유사한 생물리학적 특성(크기, 형상, 전하, 소수성 등)을 갖는 분자를 강화한다(Bruemmer 1979 J. Solid-Phase Biochem. 4: 171-187).

그러나, 당업계에 공지된 친화성 크로마토그래피 절차에는 또한 단점들이 있다. 목적 분자의 강한 결합, 그리고 추후 숙주 세포 성분들의 고갈을 허용하는 조건 하에서 친화성 컬럼에 샘플을 로딩한 후, 마지막 단계에서 친화성 매트릭스/지지체로부터 타겟 분자(리간드)를 해리하기 위해 용출 완충액이 필요하다. 종종 친화성 크로마토그래피 프로토콜의 가장 섬세한 단계로 간주되는 이 용출은 이상적으로는 컬럼의 재생 및 다중 사용을 허용하면서 친화성 매트릭스를 그대로 유지하는 방식으로 수행되어야 한다(Firer 2001 J. Biochem. Biophys. Methods 49: 433-442). 타겟 분자의 친화성 분자와의 결합은 pH 및 이온 강도와 관련하여 고유의 환경을 모방하는 조건 하에서 일어나지만, 용출 단계는 종종 예를 들어, pH, 극성 또는 이온 강도를 강하게 바꿈으로써 이동상의 극적인 변화를 요구한다(Hage 2012 J. Pharm. Biomed. Anal. 69: 93-105).

대안으로, 컬럼 상에 고정된 친화성 분자에 결합된 타겟 분자를 대체하기 위해 이동상에 경쟁자, 예를 들어, Strep-tag의 경우에는 D-데스티오비오틴(Schmidt & Skerra 2007 Nat. Protoc. 2: 1528-1535) 또는 His(6)-tag의 경우에는 이미다졸(Skerra et al. 1991 Biotechnology (N Y) 9: 273-278)을 첨가할 수 있다(Hage 2012 J. Pharm. Biomed. Anal. 69: 93-105). 명백하게, 용출을 위한 경쟁제로서 그러한 저분자를 이용함으로써 정제된 목적 분자를 포함하는 용액의 오염을 유발한다. 결과적으로, 이들 시약이 후속 실험 또는 적용에 적합하지 않는 경우, 시간-소모적인 추가 정제 단계, 예를 들어, 투석 또는 젤 여과에 의해 제거되어야 한다. 반면에, 변경된 pH, 고농도의 염, 유기 공용매, 세정제, 금속 이온, 킬레이터 또는 환원제와 같은 비특이적인 용출 조건은 종종 타겟 분자에 해롭다. 특히, 타겟 분자가 단백질인 경우, 그러한 용출 조건은 변성, 응집 또는 화학적 변형, 예를 들어, 탈아미드화를 유발하고, 따라서 기능적 활성을 방해할 수 있다.

또한, 타겟 분자의 용출 후, 친화성 컬럼은 다음 라운드의 샘플 적용 전에 시간-소모적인 절차로 재생되어야 한다. Strep-tag 친화성 크로마토그래피의 경우에, 이 단계는 HABA(4'-hydroxyazobenzene-2-carboxylic acid)로 컬럼을 세척하여 경쟁제 D-데스티오비오틴을 고정된 친화성 분자(예를 들어, 스트렙타비딘 또는 이의 돌연변이체)로부터 효과적으로 제거하고, 이어서 완충액으로 막대한 세척에 의해 HABA를 고갈시킨다.

따라서, 본 발명의 근원적인 기술적 문제는 목적 분자의 빠른 분리 및/또는 정제를 가능하게 하는 수단 및 방법을 제공하고, 용출된 목적 분자의 오염 및 생화학적 변형은 감소되는 것이다.

이 기술적 문제는 본 명세서에 정의된 바와 같이 및 청구항에서 특징지어지는 바와 같이 구체예의 제공을 통해 해결된다.

따라서, 본 발명은 광-반응성 요소(예를 들어, 광-반응기 또는 광-반응성 아미노산 사슬)를 포함하는 폴리펩타이드에 관한 것으로, 광-반응성 요소의 배열은 특정 파장(들)의 광으로 폴리펩타이드를 조사하여 전환될 수 있고, 상기 배열의 전환은 폴리펩타이드의 리간드에 대한 결합 활성을 바꾼다.

따라서, 본 발명은 또한 본 명세서에서 "광-전환성 폴리펩타이드"로 지칭되는 광-반응성 요소를 포함하는 폴리펩타이드를 제공한다. 이 광-전환성 폴리펩타이드는 통상적인 정제 방법과 비교하여 용출된 목적 분자의 오염을 줄이면서 빠르고 경제적인 분리 및 정제 방법을 위한 방식을 제공한다.

특히, 본 발명의 광-전환성 폴리펩타이드(친화성 펩타이드)는 친화성 크로마토그래피 컬럼의 매트릭스 내에 포함될 수 있다. 기저 상태에서(어둠 속에서) 또는 본 발명의 광-전환성 폴리펩타이드가 특정 파장의 광(예를 들어, 약 400 내지 530 nm, 예를 들어 400 내지 500 nm의 가시광선)으로 조사되고 나면, 광-전환성 폴리펩타이드는 리간드, 예컨대 목적 분자에 대해 결합 활성을 갖는 배열을 갖는다(일 구체예에서, 목적 분자에 융합된 친화성 태그와의 결합을 통해). 만약 광-반응성 요소가 이 배열을 가진다면, 광-전환성 폴리펩타이드는 혼합물(예를 들어, 세포 추출물 또는 배양 상등액 또는 다른 종류의 혼합물)로부터 목적 분자(예를 들어, 재조합 단백질)를 특이적으로 포획한다. 이어서, 혼합물의 원치 않는 성분(예컨대, 세포 추출물 또는 배양 상등액의 원치 않는 생체분자)은 예를 들어, 컬럼을 완충용액으로 세척하여 제거될 수 있다. 이어서 목적 분자를 용출하기 위해, 광-전환성 폴리펩타이드는 특정(상이한) 파장의 광(예를 들어, 300 내지 390 nm의 파장을 갖는 자외선(UV))으로 바로 조사된다. 결과적으로, 광-전환성 폴리펩타이드는 목적 분자에 대해 결합 활성을 갖지 않는 형태로 전환된다. 따라서, 목적 분자는 임의의 바람직한 완충액 또는 용액으로 용출될 수 있고, 용출된 목적 분자는 임의의 공격적인 화학물질로 오염되지 않을 것이다.

따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 목적 분자의 광-전환성 폴리펩타이드와의 결합(예를 들어, 친화성 크로마토그래피 컬럼의 매트릭스 내에서), 및 목적 분자의 용출은 특정 파장의 광으로 광-전환성 폴리펩타이드를 조사함으로써 쉽고 저렴하게 달성될 수 있다는 이점을 갖는다. 또한, 광-전환성 폴리펩타이드는 생리학적 정제 조건 하에서 친화성 크로마토그래피 절차를 가능케하며, 특수한 용출 완충액은 필요하지 않다. 그러므로, 본 명세서에서 제공된 광-전환성(친화성) 폴리펩타이드를 이용하면 목적하는 생활성 재조합 단백질의 정제가 가능하다. 따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 예를 들어 생리학적 정제 조건 하에서 목적 단백질의 정제에 사용될 수 있는 친화성 폴리펩타이드이다. 또한, 본 발명의 광-전환성 폴리펩타이드를 이용하면, 목적 분자의 예리하고 쉽게 제어할 수 있는 용출이 가능하며 저분자 또는 용매 오염 없이 순수한 샘플이 생성된다. 특히, 목적 분자가 치료 목적으로 사용되는 경우, 오염 방지는 매우 중요하다. 특히, 용출된 치료 분자를 포함하는 용액 내 오염 감소는 치료 분자의 내약성을 개선하고 부작용을 피할 수 있다. 또한, 오염은 기초 연구에서 목적하는 생체분자의 많은 분석 또는 측정을 방해한다. 더욱이, 본 명세서에서 제공된 광-전환성 폴리펩타이드로 기능화된 친화성 크로마토그래피 컬럼은 짧은 재생 시간을 가지며, 하나 또는 다수의 타겟 분자(들)의 정제를 유의하게 집중시킬 수 있다. 이는 예를 들어, 원하는 치료 단백질의 스크리닝에서 목적 분자의 자동화된 대용량 분리 및/또는 정제에 특히 중요하다. .

따라서, 본 명세서에서 제공된 수단 및 방법의 장점은 예를 들어, (a) 타겟 분자의 용출을 달성하기 위해 통상적으로 사용되는 약제에 의한 오염 없이 후속 사용에 적합한 바람직한 완충액에서 목적 분자의 용출, (b) 빠르고 선택적으로 자동화된 크로마토그래피 사이클; 및 (c) 매우 날카로운 용출 피크로 인한 용출 분획 내 고농도의 목적 분자(본 명세서에서 제공된 광-전환성 폴리펩타이드의 광-전환은 액체 흐름을 통한 친화성 컬럼의 전통적인 재-완충보다 더 효율적이고 훨씬 빠르기 때문)가 있다.

본 발명의 광-전환성 폴리펩타이드의 추가적인 장점은 그들이 자연에서 광활성 단백질 또는 광-감지 도메인으로 발견될 때 공유적으로 또는 비-공유적으로 결합된 보철기(보조인자 또는 조효소), 예를 들어, 플라빈 모노뉴클레오타이드(FMN) 또는 레티날이 없다는 것이다.

본 발명의 일 양태는 목적 분자의 분리 및/또는 정제를 위한 본 명세서에서 제공된 광-전환성 폴리펩타이드(즉, 광-반응성 요소를 포함하는 폴리펩타이드)의 용도에 관한 것이다.

용어 "목적 분자의 분리" 및 "목적 분자의 정제" 그리고 이의 문법적 변형은 본 명세서에서 상호교환적으로 사용되며, 목적 분자 이외의 분자들의 함량은 감소됨을 의미한다. 이들 용어는 목적 분자 이외의 많은, 대부분 또는 모든 물질이 감소, 최소화 또는 제거됨을 포함한다. 아래에 보다 구체적으로 설명되는 바와 같이, 목적 분자는 임의의 분자일 수 있다. 예를 들어, 목적 분자는 펩타이드, 올리고펩타이드, 폴리펩타이드, 단백질, 항체 또는 이의 단편, 면역글로불린 또는 이의 단편, 효소, 호르몬, 사이토카인, 복합체, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 핵산, 탄수화물, 리포좀, 나노입자, 세포, 생체거대분자, 생체분자 및 저분자로 이루어진 군에서 선택될 수 있다. 본 명세서에서 용어 "목적 분자의 분리", "목적 분자의 격리" 및 "목적 분자의 정제"는 목적 분자 이외의 세포성 물질, 예를 들어, 세포 추출물 또는 세포 배지의 성분들이 감소, 최소화 또는 제거됨을 포함한다. 따라서, 용어 "목적 분자의 분리/정제"는 또한 목적 분자가 그것의 자연 환경의 성분(들)(예를 들어, 다른 단백질, 핵산, 탄수화물, 지질, 보조인자, 대사물질 등을 포함)로부터 구분됨을 포함한다. 본 발명에 따르면, 목적 분자는 예를 들어, 전기영동(예를 들어, 아가로스 젤 전기영동, 스타치 젤 전기영동, 폴리아크릴아마이드 젤 전기영동, SDS-PAGE, 등전집중법(isoelectric focusing, IEF), 모세관 전기영동), 크로마토그래피(예를 들어, 이온 교환, 크기 배제 또는 역상 HPLC) 또는 다른 방법(예를 들어, 질량 분광학(MS), enzyme-linked immunosorbent assay(ELISA), FACS 같은 플로우 사이토메트리)에 의해 측정될 때, 적어도 70%, 보다 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90% 순도로 정제될 수 있다. 목적 분자의 순도를 측정하기 위한 그러한 방법은 당업계에 일반적으로 공지되어 있다. 바람직하게는, 주어진 목적 분자의 분리/정제는 목적 분자를 실질적으로 순수하게 하는 것을 의미한다.

본 명세서에서 제공된 광-전환성 폴리펩타이드는 고체상의 일부일 수 있다(즉, 포함될 수 있다). 예를 들어, 광-전환성 폴리펩타이드는 친화성 크로마토그래피 시스템의 고체상의 일부이고, 목적 분자는 상응하는 액체상의 일부일 수 있다.

따라서, 본 발명의 추가 양태는 목적 분자의 분리 및/또는 정제 방법에 관한 것으로, 그 방법은

(i) 목적 분자를 포함하는 액체상을 본 발명의 광-전환성 폴리펩타이드와 접촉시키는 단계로,

광-전환성 폴리펩타이드는 고체상의 일부이고(즉, 포함되고), 광-반응성 요소는 제1 배열로 존재하여 폴리펩타이드(즉, 광-전환성 폴리펩타이드)가 목적 분자에 대해 높은 친화성을 갖게 하며; 및

(ii) 광-반응성 요소를 제2 배열로 변화시켜 폴리펩타이드(즉, 광-전환성 폴리펩타이드)가 단계 (i)의 친화성과 비교하여 목적 분자에 대해 감소된 친화성을 갖게 하는 파장(들)로 광-전환성 폴리펩타이드를 조사하고, 목적 분자를 용출하는 단계를 포함한다.

상기 기술된 방법의 단계 (ii)에서, 목적 분자의 용출은 바람직하게는 특정 파장(들)의 광으로 광-전환성 폴리펩타이드를 조사하면서 수행된다. 그러나, 광-반응성 요소의 느린 이완으로 인해, 단계 (ii)는 또한 점진적인 방식으로 수행될 수 있으며, 즉, 보다 상세하게는, 광-전환성 폴리펩타이드가 제1 단계에서 조사될 수 있고; 목적 분자의 용출은 제2 단계, 예를 들어, 어둠 속에서 수행될 수 있다.

본 발명의 맥락에서, 공지의 스트렙타비딘 뮤테인(특히 Strep-Tactin)의 광-전환성 변이체가 설계되고 재조합 단백질로 제조되었다. 그러므로, 본 발명의 광-전환성 폴리펩타이드는 광-반응성 요소를 포함하는 스트펩타비딘 또는 광-반응성 요소를 포함하는 스트렙타비딘의 변이체 또는 뮤테인일 수 있다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-전환성 폴리펩타이드는 광-반응성 요소를 포함하는 스트렙타비딘 또는 광-반응성 요소를 포함하는 스트렙타비딘의 변이체 또는 뮤테인이다.

본 명세서에서 제공된 광-제어성 스트렙타비딘 뮤테인은 또한 다른 단백질 기반의 친화성 분자와 함께 광-제어된 크로마토그래피를 위한 길을 연다. 따라서, 본 발명의 맥락에서, 정의된 리간드(목적 분자, 예를 들어, 단백질 또는 면역글로불린)에 결합할 수 있는 다른 단백질, 예컨대 단백질 A, 단백질 G, 단백질 L 또는 항-myc-tag 항체(예를 들어, 항체 단편 Fab 9E10)에 광-반응성 요소(예를 들어, 광-반응 아미노산 사이드 체인)를 융합시키는 것이 예상된다. 따라서, 본 발명의 광-전환성 폴리펩타이드는

(i) 광-반응성 요소를 포함하는 스트렙타비딘 또는 이의 변이체 또는 뮤테인;

(ii) 광-반응성 요소를 포함하는 단백질 A 또는 이의 단편, 변이체 또는 뮤테인;

(iii) 광-반응성 요소를 포함하는 단백질 G 또는 이의 단편, 변이체 또는 뮤테인;

(iv) 광-반응성 요소를 포함하는 단백질 L 또는 이의 단편, 변이체 또는 뮤테인; 또는

(v) 광-반응성 요소를 포함하는 항-myc-tag 항체 또는 이의 단편, 변이체 또는 뮤테인으로부터 선택되는 임의의 폴리펩타이드일 수 있다.

스트렙타비딘은 D-비오틴과 단단히 결합하는 스트렙토마이세스 아비디니(Streptomyces avidinii)에 의해 생산된 세포외 단백질이다. 가공되지 않은 단백질은 159개의 아미노산으로 구성되며, 분자량은 약 16 kDa이다. 가공된 단백질(즉, 코어 스트렙타비딘)은 약 127개의 아미노산으로 구성된다. 기능성 스트렙타비딘은 4개의 스트렙타비딘 서브유닛을 포함하는 테트라머 형태를 갖는다. 비오틴에 대한 스트렙타비딘의 높은 친화성은 생물학적 및 생명공학적 표지화 및 결합 실험을 위한 기초가 된다. 게다가, 10^-14 mol/l의 K_d 값을 갖는 비오틴에 대한 스트렙타비딘의 결합은 공지의 가장 강한 비-공유적 친화도 중 하나를 나타낸다(Green 1975 Adv. Protein Chem. 29: 85-133). 용어 "K_d" ("K_D"로도 지칭됨)는 평형 해리 상수(평형 결합 상수의 역수)를 지칭하고 당업계에 제공된 정의에 따라 본 명세서에서 사용된다.

Strep-tag 및 Strep-tag II는 스트렙타비딘의 인공 펩타이드 리간드이다(Schmidt & Skerra 1993 Protein Eng. 6: 109-122). Strep-tag 및 Strep-tag II는 스트렙타비딘에 대해 비오틴과 경쟁적으로 결합한다. 스트렙타비딘 및 이의 변이체 및 뮤테인은 일반적으로 Strep-tag, Strep-tag II 또는 비오틴을 포함하는 분자의 분리 및/또는 정제에 사용된다. 스트렙타비딘의 공지의 뮤테인은 Strep-Tactin이다. 코어 스트렙타비딘 및 Strep-Tactin의 아미노산 서열은 본 명세서에서 각각 SEQ ID NOs: 10 및 8로 제공된다.

단백질 G, 단백질 A 및 단백질 L은 면역글로불린 또는 항체를 분리 및/또는 정제하는데 사용될 수 있는 면역글로불린과 결합하는 세균성 단백질이다.

단백질 A는 원래 스타필로코커스 아우레우스(Staphylococcus aureus)의 세포벽에서 발견되는 42 kDa 표면 단백질이다. 단백질 A는 항체(단클론 항체 MAb와 같은) 및 이의 단편을 포함하여 면역글로불린(Ig)에 결합하는 능력을 갖는다. 단백질 A는 각각 3-나선 다발로 접히는 5개의 상동성 Ig-결합 도메인을 포함한다. 이들 5개의 도메인 각각은 많은 포유동물 종, 가장 주목할 것은 면역글로불린 G(IgG) 부류에 속하는 것들에서 유래한 항체들과 결합할 수 있다. 친화성 정제 목적을 위해 종종 단백질 A의 잔기 212 내지 269를 포함하는 재조합 단편(UniProt database entry P38507)이 사용된다. 이 단편은 단백질 A의 도메인 B를 포함하거나 이로 구성된다. 보다 상세하게는, 단백질 A는 대부분의 면역글로불린의 Fc 영역 내에, 특히 인간 VH3 패밀리의 경우 Fab 영역 내 중쇄에 결합한다. 하이드록실아민을 이용한 융합 단백질의 부위-특이적인 화학적 절단에 대한 도메인 B의 내성을 증가시키기 위해, 이의 잔기 28-29에서의 민감한 Asn-Gly 디펩타이드는 부위-지정 돌연변이유발에 의해 Asn-Ala로 변화되어 소위 가공된 Z 도메인이 된다(Hober 2008 J. Chromatogr. B 848: 40-47). 크로마토그래피 지지체에 결합된 단백질 A의 이 Z 도메인은 항체의 친화성 정제에 사용될 수 있다. 단백질 A의 도메인 Z의 아미노산 서열은 본 명세서에서 SEQ ID NO: 16으로 제공된다. 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌의 통합에 적당한 이 서열 내 아미노산 위치는 SEQ ID NO: 16의 Phe5, Gln9, Phe13, Tyr14, Glu25, Gln26, Arg27, Asn28 Ala29, Phe30, Ile31, Gln32, Lys35, Asp36, Asp37, Gln40, Asn43, Leu45, Glu47, Leu51 및/또는 Asn52이다(각각 UniProt database entry P38507에서 216, 220, 224, 225, 236, 237, 238, 239, 240, 241, 242, 243, 246, 247, 248, 251, 254, 256, 258, 262 및 263번 위치에 상응함). 광-반응성 요소는 하나 이상의 이들 아미노산 위치에서 단백질 A에 통합될 수 있다. Ala29는 단백질 A의 야생형 B 도메인에서 Gly29에 상응한다.

따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 단백질 A(또는 특히 Z 도메인을 포함하는 이의 변이체, 뮤테인, 융합 단백질 또는 단편)이면, 목적 분자(리간드)는 바람직하게는 항체 또는 이의 단편, 보다 바람직하게는 IgG(예를 들어, 인간 IgG1, IgG2 또는 IgG4와 같은 인간 IgG; 또는 쥐의 IgG2a, IgG2 또는 IgG3과 같은 쥐의 IgG) 또는 이의 단편이다. 그런 경우 목적 분자(리간드)는 또한 인간 IgG3 또는 쥐의 IgG1; 또는 이의 단편일 수 있다. 따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 단백질 A(또는 이의 변이체, 뮤테인, 융합 단백질 또는 단편, 바람직하게는 Z 도메인을 포함하는 단편)라면, 목적 분자(리간드)는 바람직하게는 항체 또는 이의 단편, 보다 바람직하게는 IgG(예를 들어, 인간 IgG1, IgG2, IgG3 또는 IgG4같은 인간 IgG; 또는 쥐의 IgG1, IgG2a, IgG2 또는 IgG3같은 쥐의 IgG) 또는 이의 단편이다. 이와 관련하여, 목적 분자가 IgG 항체의 단편이면, 단편은 바람직하게는 Fc 영역 및/또는 Fab 영역을 포함한다. 또한, 이와 관련하여, 목적 분자가 인간 VH3 패밀리에 속하는 항체의 단편이라면, 그것은 바람직하게는 Fab 영역을 포함한다.

단백질 G는 그룹 G 스트렙토코커스(group G Streptococci)에서 발견되는 다른 면역글로불린-결합 단백질이다. 그것은 3개의 Fc-결합 도메인(C1, C2 및 C3) 그리고 알부민-결합 부분으로 구성되며, 항체, 특히 IgG의 Fc 영역뿐만 아니라(Cao 2013 Biotechnol. Lett. 35: 1441-1447) Fab 단편에도 결합한다. 천연 단백질 G는 또한 알부민과 결합하지만 혈청 알부민이 항체 공급원의 주요 오염원이므로, 알부민-결합 부위는 단백질 G의 몇몇 재조합 형태로부터 제거되었다. 단백질 G의 도메인 C1, C2 및 C3의 아미노산 서열은 본 명세서에서 각각 SEQ ID NOs: 17, 18 및 19로 제공된다. SEQ ID NOs: 17, 18 및 19의 서열은 UniProt database entry P19909에서 각각 위치 223-357, 373-427 및 443-497에 상응한다. 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌의 통합에 적당한 각 도메인 C1, C2 및 C3의 서열 내 아미노산 위치는 SEQ ID NO: 18의 Lys3, Val5 또는 Ile5, Thr10, Thr16, Val28 또는 Ala28, Tyr32 및/또는 Asp35이다(UniProt database entry P19909에서 각각 375, 377, 382, 388, 400, 404 및 407번 위치에 상응한다). 광-반응성 요소는 하나 이상의 이들 아미노산 위치에서 단백질 G에 통합될 수 있다.

따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 단백질 G(또는 이의 변이체, 뮤테인, 융합 단백질 또는 단편)라면, 목적 분자는 바람직하게는 항체 또는 이의 단편, 예를 들어, Fc의 Fab이고, 보다 바람직하게는 IgG 또는 이의 단편이다. 이와 관련하여, 목적 분자가 IgG 항체의 단편이라면, 단편은 바람직하게는 Fc 및/또는 Fab 영역을 포함한다.

단백질 L은 펩토스트렙토코커스 마그너스(Peptostreptococcus magnus)의 표면에서 발현되며, 면역글로불린 경쇄에 결합하는 것으로 밝혀졌다. 전장 단백질 L은 719개의 아미노산으로 구성된다. 단백질 L의 유전자는 5개의 영역을 암호화한다: 18개의 아미노산을 갖는 신호 서열; 79개의 잔기들을 갖는 아미노말단 영역 "A"; 각각 72-76개의 아미노산을 갖는 5개의 상동성 "B" 리피트; 각각 52개의 아미노산의 2개의 부가적인 "C" 리피트를 갖는 카르복시말단 영역; 친수성, 프롤린-리치 추정 세포벽-스패닝 영역 "W"; 소수성 막 앵커 "M". B 리피트 영역(36 kDa)은 Ig 경쇄와의 상호작용을 담당한다. 항체 정제를 위해 사용되는 단백질 L의 단편은 도메인 B1으로 표시되며 78개의 아미노산 잔기를 포함한다(Wikstroem 1995 J. Mol. Biol. 250: 128-133). 도메인 B1의 78개의 아미노산은 UniProt database entry Q51918에서 위치 324-389에 상응한다. 면역글로불린 중쇄의 어느 부분도 결합 상호작용에 관여하지 않으므로, 단백질 L은 IgG, IgM, IgA, IgE 및 IgD를 포함하여 단백질 A 또는 G 및 그들의 서브클래스보다 더 광범위한 범위의 항체 부류와 결합한다. 단백질 L은 또한 항체의 단일쇄 가변 단편(scFv) 및 Fab 단편과 결합한다. 특히, 단백질 L은 카파 경쇄를 포함하는 항체에 결합한다. 단백질 L의 도메인 B1의 아미노산 서열은 본 명세서에서 SEQ ID NO: 20으로 제공된다. 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌의 통합에 적당한 도메인 B1의 서열 내 아미노산 위치는 SEQ ID NO: 20의 Thr5, Asn9, Ile11, Phe12, Lys16, Phe26, Lys32, Ala35, Glu43 및/또는 Tyr47이다(UniProt database entry Q51918에서 각각 330, 334, 336, 337, 341, 351, 357, 360, 368 및 372번 위치에 상응함). 추가 위치로 SEQ ID NO: 20의 Phe22, Leu39 및/또는 Asn44가 있다(각각 UniProt database entry Q51918에서 347, 364 및 369번 위치에 상응함). 추가 위치로 SEQ ID NO: 20의 Phe22, Leu39 및/또는 Asn44이 있다(UniProt database entry Q51918에서 각각 347, 364 및 369번 위치에 상응함). 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌의 통합에 적당한 도메인 B1의 서열 내 추가적인 아미노산 위치는 SEQ ID NO: 20의 Phe22, Leu39 및/또는 Asn44이다(UniProt database entry Q51918에서 각각 347, 364 및 369번 위치에 상응함). 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌(Caf)의 단백질 L의 도메인 B1으로의 도입에 고려되는 이들 위치 중 Phe22, Ala35, Leu39, Glu43 및 Asn44는 덜 바람직하다.

광-반응성 요소는 하나 이상의 이들 아미노산 위치에서 단백질 L에 통합될 수 있다. 바람직하게는, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 단백질 L의 도메인 B1(SEQ ID NO: 20)을 포함하고, 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌(Caf)이 SEQ ID NO: 20의 위치 Phe12에 해당하는 위치에서 통합된다. 그러한 광-전환성 폴리펩타이드는 또한 SEQ ID NO: 20의 36번 위치에서 돌연변이 및 SEQ ID NO: 20의 40번 위치에서 추가 돌연변이를 가질 수 있다. 예를 들어, SEQ ID NO: 20의 Tyr36이 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp 또는 Val로 돌연변이될 수 있다. 바람직하게는, SEQ ID NO: 20의 Tyr36이 Asn으로 돌연변이된다. SEQ ID NO: 20의 Leu40이 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr 또는 Val로 돌연변이될 수 있다. 바람직하게는, SEQ ID NO: 20의 Leu40이 Ser로 돌연변이된다.

그러므로, 본 명세서에서 제공된 광-전환성 폴리펩타이드가 단백질 L 또는 이의 변이체 또는 뮤테인 또는 단편 또는 융합 단백질이면, 목적 분자는 바람직하게는 항체 또는 이의 단편, 보다 바람직하게는 인간 또는 마우스의 항체 또는 이의 단편, 훨씬 더 바람직하게는, IgG, 훨씬 더 바람직하게는 카파 경쇄를 포함하는 항체 또는 이의 단편(예를 들어, Fab 또는 scFv), 훨씬 더 바람직하게는 인간 VkI, VkIII 및/또는 VkIV 경쇄 및/또는 마우스 VkI 경쇄를 포함하는 항체 또는 이의 단편이다.

상기에서 언급된 바와 같이, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 단백질 L의 융합 단백질 또는 이의 단편일 수 있다. 예를 들어, 융합 단백질은 짧은 링커 서열을 통해 인간 알부민-결합 도메인(ABD; SEQ ID NO: 59)에 융합되는 코돈 최적화된 단백질 L 도메인 B1(본 명세서에서 ProtL로 지칭; SEQ ID NO: 20)을 포함할 수 있다. 그러한 단백질 L-ABD 융합 단백질은 본 명세서에서 SEQ ID NO: 61 로 도시된다(및 본 명세서에서 ProtL-ABD로도 지칭됨). 바람직하게는, 그러한 융합 단백질은 SEQ ID NO: 61의 13번 위치에 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌, 바람직하게는 4'-카르복시페닐아조페닐알라닌(Caf)를 가지고 있다. 그러한 융합 단백질은 또한 SEQ ID NO: 61의 37번 위치에 돌연변이를 가질 수 있고, SEQ ID NO: 61의 41번 위치에 추가적인 돌연변이를 가질 수 있다. 예를 들어, SEQ ID NO: 61의 Tyr37은 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp 또는 Val로 돌연변이될 수 있다. 바람직하게는, SEQ ID NO: 61의 Tyr37은 Asn으로 돌연변이된다. SEQ ID NO: 61의 Leu41은 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr 또는 Val로 돌연변이될 수 있다. 바람직하게는, SEQ ID NO: 61의 Leu41은 Ser로 돌연변이된다. 예를 들어, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 SEQ ID NO: 86의 아미노산 서열을 포함하거나 이로 구성될 수 있다.

단백질 A, 단백질 G 및 단백질 L 또는 이의 단편 또는 융합 단백질은 그들이 인간 및 동물 유래 항체의 많은 하위부류에 결합하므로, 생명공학을 통해 생산된 항체들이 상응하는 친화성 매트릭스상에 포획되게 하는, 항체 정제를 위한 대중적인 도구이다(예를 들어, Nilsson et al. 1997 Protein Expr. Purif. 11: 1-16를 볼 것). 그러나, 카오트로픽(chaotropic)염 또는 낮은 pH 조건에 의한 일반적인 용출은 타겟 단백질의 화학적 변형 또는 변성을 초래하여 기능성에 영향을 줄 수 있다. 항체에 대한 광-감응성 결합 활성을 보이기 위해 단백질 A, 단백질 G 또는 단백질 L을 변형시키고, 친화성 매트릭스의 생성에 이들을 적용하면 이 전통적인 정제 기술의 단점을 줄일 수 있다.

항-myc-tag 항체들은 일반적으로 당업계에 공지되어 있다. 예를 들어, 항-MYC 항체 클론 9E10(DrMAB-150)은 myc-tag, 즉 인간 c-MYC의 C-말단 영역에서 아미노산의 스트레치에 해당하는 펩타이드(SEQ ID NO: 15)에 선택적으로 결합하는 단클론 마우스 항체이다(Schiweck et al. 1997 FEBS Lett. 414: 33-38). 그러므로, 이 항체는 분자, 특히 myc-tag를 포함하는 재조합 단백질의 분리 및/또는 정제에 사용된다. 9E10 항체의 재조합 Fab 단편은 대장균(Escherichia coli)에서 쉽게 생산될 수 있다. 그러나, 친화성 크로마토그래피에서 고체 지지체에 고정된 전통적인 항-myc-tag 항체 또는 이의 Fab 또는 이의 변이체 또는 뮤테인을 이용하여 친화성 매트릭스로부터 낮은 pH 조건에 의해 목적 분자가 용출될 때 타겟 분자의 특성들에 영향을 줄 수 있다. 이 단점은 본 발명에 따른 광-전환성 항-myc-tag 항체(또는 항-myc-tag 항체 단편, 예컨대 Fab 9E10)를 생산함으로써 극복될 수 있다. 광-전환성 항-myc-tag 항체 또는 항-myc-tag Fab 단편의 크로마토그래피 매트릭스와의 화학적 커플링은 myc-tag를 보유한 분자의 광-제어된 용출을 가능케 한다. 항-MYC 항체 클론 9E10 그리고 이의 Fab 단편(Fab 9E10)은 예를 들어, Krauss에 기술된다(2008 Proteins 73: 552-565). 쥐의 IgG1/κ 항체 9E10의 성숙한(신호 서열이 없는) 중쇄 및 경쇄의 아미노산 서열은 본 명세서에서 각각 SEQ ID NOs: 21 및 22로 제공된다. 항체 9E10의 Fab 단편은 동일한 경쇄 및 중쇄의 아미노말단 영역, 즉, SEQ ID NO: 21에서 잔기 19-228을 포함한다(선택적으로 His₆-tag가 장착됨). 본 발명의 광-전환성 폴리펩타이드가 광-전환성 항-myc-tag 항체(또는 이의 변이체, 예를 들어, 광-전환성 Fab 9E10)라면, 광-반응성 요소는 바람직하게는 적어도 하나의 상보성-결정 영역(CDRs) 내 한 위치에 도입된다. 광-반응성 요소, 예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌의 통합에 적당한 9E10 중쇄의 서열 내 아미노산 위치는 SEQ ID NO: 21의 Tyr76, Phe121, Tyr122, Tyr123, Tyr124, Tyr128 및/또는 Tyr129이다. 추가 위치로 SEQ ID NO: 21의 Tyr130이 있다. 광-반응성 요소는 하나 이상의 이들 아미노산 위치에서 9E10 중쇄의 서열에 통합될 수 있다.

상기 기술된 바와 같이, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 광-반응성 요소를 포함하는 스트렙타비딘, 광-반응성 요소를 포함하는 단백질 A, 광-반응성 요소를 포함하는 단백질 G, 광-반응성 요소를 포함하는 단백질 L 또는 광-반응성 요소를 포함하는 항-myc-tag 항체 또는 Fab 9E10일 수 있다. 그러나, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 또한 상기 언급된 폴리펩타이드의 임의의 "변이체"(예를 들어, 단편) 또는 "뮤테인" 또는 "융합 단백질"일 수 있다. 본 명세서에서, 주어진 폴리펩타이드의 변이체 또는 뮤테인은 폴리펩타이드가 여전히 기능적이라면 폴리펩타이드의 임의의 변형된 버전(단편과 같은)이다. 바람직하게는, 광-전환성 폴리펩타이드의 그러한 뮤테인은 상기 폴리펩타이드의 리간드에 대한 형태 및 결합 활성에 대한 광-전환성 배열의 효과를 변형 또는 향상시키는 광-반응성 요소를 보유한 위치와는 상이한 위치에서 하나 이상의 아미노산 치환(들)을 포함할 수 있다.

예를 들어, SEQ ID NO: 61의 13번 아미노산 위치에서 광-반응성 요소로 Caf를 보유한 단백질 L의 광-전환성 도메인 B1에서, SEQ ID NO: 61의 37번 위치에서 Tyr의 Asn로의 돌연변이 및 SEQ ID NO: 61의 41번 위치에서 Leu의 Ser로의 돌연변이는 면역글로불린 리간드에 대한 상기 폴리펩타이드의 형태 및 결합 활성에서의 Caf의 광-전환성 배열의 효과를 향상시킨다. 따라서, 본 발명의 광-전환성 폴리펩타이드는 (광-반응성 요소에 더하여) 리간드(예를 들어, 목적 분자)에 대한 광-전환성 폴리펩타이드의 결합 활성에서의 광의 효과를 향상시키는 하나, 둘 이상의 추가 돌연변이(예를 들어, 1 내지 10, 1 내지 5, 바람직하게는 2)를 포함할 수 있다.

예를 들어, 기저 상태에서(예를 들어, 어둠 속에서 또는 약 400 내지 530 nm의 파장을 갖는 가시광선 하에서), 광-전환성 폴리펩타이드는 목적 분자에 대한 특정 결합 활성을 가질 수 있다. 상이한 파장(들)(예를 들어, 300 내지 390 nm의 파장을 갖는 자외선)을 갖는 광으로 상기 광-전환성 폴리펩타이드를 조사함으로써 상기 목적 분자에 대한 상기 광-전환성 폴리펩타이드의 감소 또는 증가된(바람직하게는 감소된) 결합 활성을 초래할 수 있다. 광-전환성 폴리펩타이드의 결합 활성에 대한 상기 상이한 파장(들)을 갖는 광의 효과는 광-전환성 폴리펩타이드 내 돌연변이에 의해 향상될 수 있다. 그러므로, 본 발명의 광-전환성 폴리펩타이드는 광-반응성 요소에 더하여 광-전환성 폴리펩타이드가 광에 의해 제어될 수 있는 정도를 향상시키는 돌연변이를 포함할 수 있다.

따라서, 본 발명은 본 발명의 광-전환성 폴리펩타이드가 광에 의해 제어될 수 있는 정도를 향상시키는 돌연변이를 확인하는 방법을 제공하며, 그 방법은

(a) 광-전환성 폴리펩타이드의 3차원(3D) 구조 또는 4차 구조 또는 형태를 분석하는 단계(예를 들어, 당업계에 공지된 그래픽 디스플레이용 컴퓨터 프로그램, 예를 들어, PyMOL 또는 Chimera를 이용하여; Jarasch 2016 Protein Eng. Des. Sel. 29: 263-270 참조); 및

(b) 리간드에 대해 높은 결합 친화성으로 결합된 광-전환성 폴리펩타이드의 형태에 상응하는 광-반응성 요소(예를 들어, Caf)의 배열 상태(예를 들어, 트랜스 배열)와 입체적으로 중첩된(예를 들어, 그들의 반데르바알스 반경의 합보다 더 가까운 거리로 적어도 한쌍의 원자를 공유하면서) 광-반응성 요소의 부근에서(예를 들어, 이로부터 15Å, 바람직하게는 10Å, 보다 바람직하게는 5Å 이내의 거리) 아미노산 사이드 체인을 선별하는 단계; 및

(c) 선별된 아미노산 사이드 체인에 상응하는 아미노산을 다른 아미노산으로 대체하여 돌연변이된 광-전환성 폴리펩타이드를 제조하는 단계; 및

(d) 광-반응성 요소의 모든 가능한 배열(예를 들어, 시스 및 트랜스 배열)에서 돌연변이된 광-전환성 단백질의 결합 활성을 분석하는 단계를 포함한다.

상기 단계 (c)에서, 선별된 아미노산 사이드 체인에 상응하는 아미노산은 바람직하게는 광-반응성 요소와의 입체적 중첩을 줄이는 아미노산(예를 들어, 더 작은 사이드 체인을 갖는 아미노산) 또는 우호적인 상호작용을 유발하는 아미노산(예를 들어, 하나 이상의 수소결합(들), 염 브릿지 또는 반데르바알스 접촉을 유발하는 아미노산)으로 치환된다.

예를 들어, 광-전환성 폴리펩타이드가 광에 의해 제어될 수 있는 정도를 향상시키는 돌연변이는,

(i) 돌연변이되지 않은 광-전환성 폴리펩타이드의 상응하는 결합 활성과 비교하여 (예를 들어, 어둠 속에서 또는 약 400 내지 530 nm의 파장을 갖는 가시광선 하에서) 결합 형태에서 리간드에 대한 돌연변이된 광-전환성 폴리펩타이드의 증가된 결합 활성;

(ii) 돌연변이되지 않은 광-전환성 폴리펩타이드의 상응하는 결합 활성과 비교하여 (예를 들어, 300 내지 390 nm의 파장을 갖는 자외선에서) 비-결합 형태에 서 리간드에 대한 돌연변이된 광-전환성 폴리펩타이드의 감소된 결합 활성; 또는

(iii) (i) 및 (ii)의 조합을 유발하는 돌연변이에 의해서일 수 있다:

따라서, 상기 언급된 바와 같이, 본 발명의 광-전환성 폴리펩타이드 내 부가적인 돌연변이의 향상은 예를 들어, 당업계에 공지된 그래픽 디스플레이용 컴퓨터 프로그램을 이용하여 광-전환성 폴리펩타이드(예를 들어, 트랜스 배열)의 높은 친화성 형태에 상응하는 광-반응성 요소(예를 들어, Caf)의 배열 상태와 입체적으로 중첩될 수 있는 광-반응성 요소의 부근에서(예를 들어, 이로부터 15Å, 바람직하게는 10Å, 보다 바람직하게는 5Å 이내의 거리) 아미노산 사이드 체인을 검색하여 확인될 수 있다(예를 들어, PyMOL 또는 Chimera, 참조: Jarasch et al. 2016 Protein Eng. Des. Sel. 29: 263-270). 이어서, 아미노산 대체는 입체적 중첩이 회피되거나(예를 들어, 더 작은 사이드 체인을 이용하여) 또는 심지어 유리한 상호작용(하나 이상의 수소결합(들), 염 브릿지 또는 반데르바알스 접촉과 같은)이 일어날 수 있는 그러한 위치에서 선택된다.

본 명세서에서 제공된 광-전환성 폴리펩타이드는 이의 광-반응성 요소의 배열이 특정 파장(들)의 광으로 폴리펩타이드를 조사하여 전환될 수 있고, 상기 배열의 전환이 폴리펩타이드의 리간드(예를 들어, 목적 분자)에 대한 결합 활성(바람직하게는 친화성)을 바꾼다면 기능적이다. 주어진 폴리펩타이드의 변이체 또는 뮤테인은 하나 내지 몇 개의 아미노산이 치환, 부가 또는 결실되고, 폴리펩타이드가 여전히 기능적인 주어진 폴리펩타이드일 수 있다. 예를 들어, 주어진 폴리펩타이드의 변이체 또는 뮤테인은 변이체 또는 뮤테인이 기능적이라면 주어진 폴리펩타이드와 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 보다 더 바람직하게는 적어도 95%, 보다 더 바람직하게는 적어도 96%, 보다 더 바람직하게는 적어도 97%, 보다 더 바람직하게는 적어도 98% 또는 가장 바람직하게는 적어도 99% 동일성을 갖는 폴리펩타이드일 수 있다. 본 발명의 맥락에서 바람직하게 적용되는 공지의 스트렙타비딘의 뮤테인은 Strep-Tactin이다.

주어진 폴리펩타이드의 변이체는 또한 단편이 여전히 기능적이라면 폴리펩타이드의 단편일 수 있다. 예를 들어, 항-myc-tag 항체 클론 9E10의 변이체는 본 명세서에서 기술된 Fab 9E10이다.

주어진 폴리펩타이드의 변이체는 또한 주어진 폴리펩타이드 및 다른 단백질을 포함하는 융합 단백질일 수 있다. 다른 단백질은 예를 들어, 녹색형광단백질(GFP), 강화된 GFP(eGFP) 또는 황색형광단백질(YFP)과 같은 마커 단백질일 수 있다. 본 명세서에서 제공된 광-전환성 폴리펩타이드를 위한 다른 융합 파트너는 효소, 용해도를 향상시키는 단백질, 올리고머화 도메인 또는 ABD와 같은 다른 결합 기능을 갖는 단백질을 포함할 수 있다. 주어진 폴리펩타이드의 변이체는 또한 주어진 폴리펩타이드 및 비-단백질성 화합물, 예를 들어, DNA을 포함하는 컨쥬게이트일 수 있다.

따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-전환성 폴리펩타이드는

(i) SEQ ID NO: 2의 아미노산 서열;

(ii) SEQ ID NO:4의 아미노산 서열;

(iii) SEQ ID NO: 6의 아미노산 서열; 또는

(iv) (i)-(iii) 중 어느 하나에 따른 아미노산 서열과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 적어도 95%, 훨씬 더 바람직하게는 적어도 96%, 훨씬 더 바람직하게는 적어도 97%, 훨씬 더 바람직하게는 적어도 98% 또는 가장 바람직하게는 적어도 99% 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성되며,

폴리펩타이드는 광-반응성 요소를 포함하고, 광-반응성 요소의 배열은 특정 파장(들)의 광으로 폴리펩타이드를 조사하여 전환될 수 있으며, 상기 배열의 전환은 리간드에 대한 폴리펩타이드의 결합 활성(바람직하게는 친화성)을 바꾼다.

본 발명의 다른 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-전환성 폴리펩타이드는

(i) SEQ ID NO: 20의 아미노산 서열로, SEQ ID NO: 20의 12번 위치의 잔기가 광-반응성 요소로 대체되며;

(ii) SEQ ID NO: 86의 아미노산 서열;

(iii) SEQ ID NO: 61의 아미노산 서열로, SEQ ID NO: 61의 13번 위치의 잔기가 광-반응성 요소로 대체되며; 또는

폴리펩타이드는 광-반응성 요소를 포함하고, 광-반응성 요소의 배열은 특정 파장들의 광으로 폴리펩타이드를 조사하여 전환될 수 있으며, 상기 배열의 전환은 리간드에 대한 폴리펩타이드의 결합 활성을 바꾼다.

상기 (i)에서 정의된 광-전환성 폴리펩타이드는 또한 SEQ ID NO: 20의 36번 위치에서의 돌연변이 및 SEQ ID NO: 20의 40번 위치에서의 돌연변이를 가질 수 있다. 예를 들어, SEQ ID NO: 20의 Tyr36이 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp 또는 Val으로 돌연변이될 수 있다. 바람직하게는, SEQ ID NO: 20의 Tyr36은 Asn으로 돌연변이된다. SEQ ID NO: 20의 Leu40은 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr 또는 Val으로 돌연변이될 수 있다. 바람직하게는, SEQ ID NO: 20의 Leu40은 Ser로 돌연변이된다.

상기 (iii)에서 정의된 광-전환성 폴리펩타이드는 또한 SEQ ID NO: 61의 37번 위치에서의 돌연변이 및 SEQ ID NO: 61의 41번 위치에서의 돌연변이를 가질 수 있다. 예를 들어, SEQ ID NO: 61의 Tyr37은 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp 또는 Val으로 돌연변이될 수 있다. 바람직하게는 SEQ ID NO: 61의 Tyr37은 Asn으로 돌연변이 된다. SEQ ID NO: 61의 Leu41은 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr 또는 Val으로 돌연변이될 수 있다. 바람직하게는 SEQ ID NO: 61의 Leu41은 Ser로 돌연변이 된다. 예를 들어, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 SEQ ID NO: 86의 아미노산 서열을 포함하거나 이로 구성될 수 있다.

(i)에 따른 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 (iv)에서 정의된 광-전환성 폴리펩타이드는 또한 SEQ ID NO: 20의 36번 위치와 상동인(즉, 상응하는) 위치에서의 돌연변이 및 SEQ ID NO: 20의 40번 위치와 상동인(즉, 상응하는) 위치에서의 돌연변이를 가질 수 있다. 예를 들어, SEQ ID NO: 20의 36번 위치와 상동인(즉, 상응하는) 위치는 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp 또는 Val으로, 바람직하게는 Asn으로 돌연변이될 수 있다. SEQ ID NO: 20의 40번 위치와 상동인(즉, 상응하는) 위치는 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr 또는 Val로, 바람직하게는 Ser로 돌연변이될 수 있다.

(iii)에 따른 아미노산 서열과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 (iv)에서 정의된 광-전환성 폴리펩타이드는 또한 SEQ ID NO: 61의 37번 위치와 상동인(즉, 상응하는) 위치에서의 돌연변이 및 SEQ ID NO: 61의 41번 위치와 상동인(즉, 상응하는) 위치에서의 돌연변이를 가질 수 있다. 예를 들어, SEQ ID NO: 61의 37번 위치와 상동인(즉, 상응하는) 위치는 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Ser, Thr, Trp 또는 Val으로, 바람직하게는 Asn으로 돌연변이될 수 있다. SEQ ID NO: 61의 41번 위치와 상동인(즉, 상응하는) 위치는 Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Lys, Met, Phe, Pro, Ser, Thr, Trp, Tyr 또는 Val로, 바람직하게는 Ser로 돌연변이될 수 있다.

따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 단백질 L의 도메인 B1 및 ABD를 포함하는 예를 들어, SEQ ID NO: 86의 아미노산 서열; 또는 SEQ ID NO: 86과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 가지며 예를 들어, SEQ ID NO: 86의 13번 위치와 상동인 위치에서 광-반응성 요소를 포함하는 융합 단백질을 포함하거나 이로 구성될 수 있다. 그러나, 아래 또한 기술되는 바와 같이, 친화성 매트릭스에 적용하기 위해, 단백질 L의 광-전환성 도메인 B1은 바람직하게는 ABD 융합 파트너 없이 적용되며, 특히 알부민의 공동-정제를 피해야하는 경우에 그러하다. 따라서, 바람직한 구체예에서, 본 명세서에서 제공된 광-전환성 폴리펩타이드는 예를 들어, SEQ ID NO: 20의 아미노산 서열을 가지며, 12번 잔기가 Caf와 같은 광-반응성 요소로 대체되고; 또는 SEQ ID NO: 20과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 아미노산 서열을 가지며, SEQ ID NO: 12의 12번 잔기와 상동인 잔기가 Caf와 같은 광-반응성 요소로 대체된 단백질 L의 도메인 B1을 포함하거나 이로 구성된다.

상기 언급된 바와 같이, 본 발명의 광-전환성 폴리펩타이드는 광-반응성 요소를 포함하는 단백질 A(또는 이의 변이체, 뮤테인, 융합 단백질 또는 단편), 광-반응성 요소를 포함하는 단백질 G(또는 이의 변이체, 뮤테인, 융합 단백질 또는 단편), 광-반응성 요소를 포함하는 단백질 L(또는 이의 변이체, 뮤테인, 융합 단백질 또는 단편) 또는 광-반응성 요소를 포함하는 항-myc-tag 항체(또는 이의 변이체, 뮤테인, 융합 단백질 또는 단편)인 것이 또한 예상된다. 단백질 A, 단백질 G, 단백질 L 및 항-myc-tag 항체의 아미노산 서열, 뿐만 아니라 광-반응성 요소(예를 들어, 4'-카르복시페닐아조페닐알라닌 또는 3'-카르복시페닐아조페닐알라닌)의 통합에 적합한 이들 서열 내 아미노산 위치들은 본 명세서의 상기 및 아래에 제공된다.

첨부된 실시예에서, 광-반응성 요소(즉, 광-반응성 아미노산 사이드 체인)는 스트렙타비딘의 뮤테인에 예시적으로 도입된다. 따라서, 본 발명의 일 양태에서, 광-전환성 폴리펩타이드는

(i) SEQ ID NO: 2의 아미노산 서열;

(ii) SEQ ID NO: 4의 아미노산 서열; 또는

(iii) SEQ ID NO: 6의 아미노산 서열을 포함하거나 이로 구성된다.

본 발명의 일 특정 예시에서, 광-전환성 폴리펩타이드는 SEQ ID NO: 2의 아미노산 서열을 포함하거나 이로 구성된다.

첨부된 실시예에서, 광-반응성 요소(즉, 광-반응성 아미노산 사이드 체인)은 또한 알부민-결합 도메인(ABD)에 융합되는 단백질 L의 코돈 최적화된 도메인 B1을 포함하는 융합 단백질에 도입된다. 따라서, 본 발명의 일 양태에서, 광-전환성 폴리펩타이드는 SEQ ID NO: 61의 아미노산 서열을 포함하거나 이로 구성되며, SEQ ID NO: 61의 13번 위치의 잔기는 광-반응성 요소, 예컨대 Caf로 대체된다. 그러한 융합 단백질은 또한 SEQ ID NO: 61의 37번 위치에서 돌연변이(예를 들어, Tyr의 Asn으로의 돌연변이) 및 SEQ ID NO: 61의 41번 위치에서 돌연변이(예를 들어, Leu의 Ser로의 돌연변이)를 가질 수 있다. 예를 들어, 본 발명의 광-전환성 폴리펩타이드는 SEQ ID NO: 86의 아미노산 서열을 포함하거나 이로 구성될 수 있다.

그러나, 본 명세서에서 제공된 원리는 친화성 크로마토그래피에서 친화성 분자로 사용되는 임의의 단백질에 적용될 수 있다. 일반적으로 사용되는 태그 및 상응하는 친화성 분자에 대한 개요는 아래 표 1에서 제공된다. 본 발명에 따르면, 본 명세서에 기술된 임의의 친화성 분자는 광-제어 가능하도록 변형될 수 있다. 예를 들어, 광-전환성 항-HA 항체, 항-FLAG-tag 항체 또는 항-T7-tag 항체의 생산 및 용도 또한 본 발명에 의해 포함된다.

일부 일반적으로 사용되는 친화성 크로마토그래피용 태그의 개요

TAG	친화성 매트릭스	용출	의견	참고
Strep-tag	Strep-Tactin (변형된 스트렙타비딘)	비오틴 또는 데스티오비오틴	짧은 선형의 인식 모티프; 재생가능한 매트릭스; 스트렙타비딘-코팅된 표면(예를 들어, SPR 칩)에 대한 고정화, 원핵 및 진핵세포 표면 표출에 사용되는 상대적으로 순수한 단백질의 1단계 정제; 특이 결합 조건이 일부 융합에 적당하지 않을 수 있음	Schmidt & Skerra 2007 Nat. Protoc. 2: 1528-1535; Schmidt & Skerra 1994 J. Chromatogr. A 676: 337-345
HA-tag	mAb 기반 친화성 매트릭스	합성 HA 펩타이드 또는 낮은 pH	항-HA 항체 특이적; 포유동물 발현 시스템에서 유용함; 낮은 pH 용출은 비가역적으로 단백질 특성에 영향을 미칠 수 있음; 매트릭스는 재사용에 제한이 있음	Hage 1999 Clin. Chem. 45: 593-615
FLAG-tag	mAb 기반 친화성 매트릭스	합성 FLAG 펩타이드 또는 낮은 pH, EDTA	짧은 선형의 인식 모티프; 1단계에서 적당히 순수한 단백질; 융합의 제1아미노산의 동일성에 따라 C-말단 라이시스 후 엔테로키나아제가 절단하여 태그를 완전히 제거함; M1 항체는 N-말단에서 태그에만 결합할 수 있음; 낮은 pH 용출은 비가역적으로 단백질 특성에 영향을 미칠 수 있음; 매트릭스는 재사용에 제한이 있음	Einhauer & Jungbauer 2001 J. Biochem. Biophys. Methods 49: 455-465; Knappik 1994 Biotechniques 17: 754-761
myc-tag	mAb 기반 친화성 매트릭스	합성 myc 펩타이드 또는 낮은 pH	짧은 선형의 인식 모티프; 항-myc 항체는 다소 난잡함; 낮은 pH 용출은 비가역적으로 단백질 특성에 영향을 미칠 수 있음; 매트릭스는 재사용에 제한이 있음	Kolodziej & Young 1991 Methods Enzymol. 194: 508-519; Terpe 2003 Appl. Microbiol. Biotechnol. 60: 523-533
T7-tag	mAb 기반 친화성 매트릭스	합성 T7 펩타이드 또는 낮은 pH	융합 단백질의 발현을 증가시킬 수 있음; 낮은 pH 용출은 비가역적으로 단백질 특성에 영향을 미칠 수 있음; 매트릭스는 재사용에 제한이 있음	Chatterjee & Esposito 2006 Protein Expr. Purif. 46: 122-129

본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응 요소의 한 배열(즉, 배열 상태)의 다른 배열(배열 상태)로의 전환은 폴리펩타이드(즉, 광-전환성 폴리펩타이드)의 리간드-결합 포켓 또는 부위의 형태 또는 형상을 변화시킨다. 본 명세서에서, 용어 "형태를 변화시키는 것" 또는 이의 문법적 변형은 용어 "형상을 변화시키는 것" 또는 이의 문법적 변형과 동의어로 사용된다. 특히, 본 명세서에서 리간드-결합 포켓의 형태적 변화는 리간드-결합 포켓 또는 리간드-결합 부위의 형상에서의 변화이다.

본 명세서에서 정의된 바와 같이, 리간드-결합 포켓의 각 가능한 형상은 리간드-결합 포켓의 "형태"이다. 본 명세서에서, 다른 형태 간의 변이는 형태적 변화이다.

본 발명에 따르면, 본 명세서에서 제공된 광-전환성 폴리펩타이드의 광-반응성 요소의 배열은 리간드에 대한 광-전환성 폴리펩타이드의 결합 활성을 바꾼다. 또는, 다른 말로, 광-반응성 요소의 배열은 본 명세서에서 제공된 광-전환성 폴리펩타이드가 이의 리간드에 대한 결합 활성을 가지는지를 결정한다. 광-반응성 요소는 광-전환성 폴리펩타이드의 리간드-결합 포켓 또는 부위의 형상에 기여하는 것으로 예상된다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응성 요소는 폴리펩타이드의 리간드-결합 포켓 또는 부위의 안에 또는 주변에 있다. 리간드가 본 발명의 광-전환성 폴리펩타이드에 결합되면, 광-반응성 요소는 바람직하게는 상기 리간드까지의 거리가 25Å 미만, 보다 바람직하게는 20 Å 미만, 훨씬 더 바람직하게는 15Å 미만, 훨씬 더 바람직하게는 10Å 미만, 및 가장 바람직하게는 5Å 미만이다. 또한, 광-반응성 요소는 리간드의 친화성 분자(즉, 광-전환성 폴리펩타이드)에 대한 결합에 관여할 수 있다.

성숙한(신호 서열이 없는) 야생형 스트렙타비딘(UniProt Entry: P22629)의 아미노산 서열에서 Strep-Tactin의 위치 Trp108는 Strep-Tactin의 결합 공동 아래쪽에 위치한다. Trp108은 아미노말단의 신호 서열(SEQ ID NO: 12)과 함께 전장 스트렙타비딘을 포함하는 전-스트렙타비딘의 132번 위치 및 재조합 코어 스트렙타비딘(SEQ ID NO: 10)에서 96번 위치에 상응한다. 이의 뮤테인 및 변이체(SEQ ID NOs: 2, 4, 8 및 10)를 포함하는 재조합 코어 스트렙타비딘은 신호 서열이 없고 카르복시말단뿐만 아니라 아미노말단에서 절단되고, 선택적으로 공개된 바와 같이 부가적인 시작-메티오닌 잔기를 보유한다(Schmidt & Skerra 1994 J. Chromatogr. A 676: 337-345). 본 발명의 맥락에서, 놀랍게도 이 위치에 도입된 광-반응성 요소의 배열 상태의 변화는 이의 리간드(즉, Strep-tag 또는 Strep-tag II)에 대한 Strep-Tactin의 친화성에 영향을 줌이 밝혀졌다. 따라서, 이 위치는 본 발명의 광-전환성 폴리펩타이드 내 광-반응성 요소를 위한 위치로서 특히 적당하다. 그리하여, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응성 요소는

(i) SEQ ID NOs: 2, 4, 8 및 10 중 어느 하나의 96번 아미노산 위치;

(ii) SEQ ID NOs: 6 및 12 중 어느 하나의 132번 아미노산 위치;

(iii) SEQ ID NOs: 2, 4, 8 및 10 중 어느 하나의 아미노산 서열과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 95%, 훨씬 더 바람직하게는 96%, 훨씬 더 바람직하게는 97%, 훨씬 더 바람직하게는 98% 또는 가장 바람직하게는 적어도 99% 동일성을 갖는 아미노산 서열에서, 각각 SEQ ID NO: 2, 4, 8 또는 10의 96번 아미노산 위치와 상동인 아미노산 위치; 또는

(iv) SEQ ID NOs: 6 및 12 중 어느 하나의 아미노산 서열과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 95%, 훨씬 더 바람직하게는 96%, 훨씬 더 바람직하게는 97%, 훨씬 더 바람직하게는 98% 또는 가장 바람직하게는 적어도 99% 동일성을 갖는 아미노산 서열에서, 각각 SEQ ID NO: 6 또는 12의 132번 아미노산 위치와 상동인 아미노산 위치에 있다.

본 발명의 맥락에서, SEQ ID NO: 20의 위치 Phe12에 상응하는 위치에서 단백질 L의 도메인 B1에 광-반응성 요소가 도입되면, 이의 리간드(면역글로불린 또는 항체와 같은)에 대한 친화성은 광 조사에 의해 조절될 수 있다. 보다 상세하게는, 본 발명의 맥락에서, 단백질 L 도메인 B1 및 알부민-결합 도메인을 포함하는 융합 단백질이 제조되었고, 광-반응성 요소는 SEQ ID NO: 61의 13번 위치에 상응하는 위치에서 이 융합 단백질에 통합되었다. 이 리간드에 대한 생성된 단백질 L 도메인 B1 융합 단백질의 친화성은 광 조사에 의해 조절될 수 있다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응성 요소는

(i) SEQ ID NO: 20의 12번 위치;

(ii) SEQ ID NOs: 61 및 86 중 어느 하나의 13번 위치;

(iii) SEQ ID NO: 20의 아미노산 서열과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 95%, 훨씬 더 바람직하게는 96%, 훨씬 더 바람직하게는 97%, 훨씬 더 바람직하게는 98% 또는 가장 바람직하게는 적어도 99% 동일성을 갖는 아미노산 서열에서, SEQ ID NO: 20의 12번 아미노산 위치와 상동인 아미노산 위치; 또는

(iv) SEQ ID NOs: 61 및 86 중 어느 하나의 아미노산 서열과 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 95%, 훨씬 더 바람직하게는 96%, 훨씬 더 바람직하게는 97%, 훨씬 더 바람직하게는 98% 또는 가장 바람직하게는 적어도 99% 동일성을 갖는 아미노산 서열에서, SEQ ID NO: 61의 13번 아미노산 위치와 상동인 아미노산 위치에 있다.

(i)에 따른 광-전환성 폴리펩타이드는 상기 정의된 바와 같이 SEQ ID NO: 20의 36번 위치에서 돌연변이(예를 들어, Tyr이 Asn으로), 및/또는 상기 정의된 바와 같이 SEQ ID NO: 20의 40번 위치에서 돌연변이(예를 들어, Leu가 Ser로)를 가질 수 있다; 바람직하게는, 광-전환성 폴리펩타이드는 돌연변이 둘 다를 가진다. (ii)에 따른 광-전환성 폴리펩타이드는 상기 정의된 바와 같이 SEQ ID NO: 61의 37번 위치에서 돌연변이(예를 들어, Tyr이 Asn으로) 및/또는 상기 정의된 바와 같이 SEQ ID NO: 61의 41번 위치에서 돌연변이(예를 들어, Leu가 Ser로)를 가질 수 있다; 바람직하게는 광-전환성 폴리펩타이드는 돌연변이 둘 다를 가진다. 일 구체예에서, (iii)에 따른 광-전환성 폴리펩타이드는 상기 정의된 바와 같이 SEQ ID NO: 20의 36번 위치와 상동인(즉, 상응하는) 위치에서 돌연변이(예를 들어, Tyr이 Asn으로), 및/또는 상기 정의된 바와 같이 SEQ ID NO: 20의 40번 위치와 상동인(즉, 상응하는) 위치에서 돌연변이(예를 들어, Leu가 Ser로)를 가진다; 바람직하게는 광-전환성 폴리펩타이드는 돌연변이 둘 다를 가진다. 다른 구체예에서, (iii)에 따른 광-전환성 폴리펩타이드는 상기 정의된 바와 같이 SEQ ID NO: 61의 37번 위치와 상동인(즉, 상응하는) 위치에서 돌연변이(예를 들어, Tyr이 Asn으로), 및/또는 상기 정의된 바와 같이 SEQ ID NO: 61의 41번 위치와 상동인(즉, 상응하는) 위치에서 돌연변이(예를 들어, Leu가 Ser로)를 가진다; 바람직하게는 광-전환성 폴리펩타이드는 돌연변이 둘 다를 가진다.

당업자는 SEQ ID NO: 2, 4, 6, 8, 10, 12, 20 또는 61의 아미노산 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일성을 갖는 주어진 서열의 특정 아미노산 위치가 각각 SEQ ID NO: 2, 4, 6, 8, 10, 12, 20 또는 61의 아미노산 서열의 96, 132, 12 또는 13번 아미노산 위치와 상동인지(즉, 상응하거나 등가인지) 쉽게 평가할 수 있다. 예를 들어, 그러한 상동의 위치는 주어진 서열과 SEQ ID NO: 2, 4, 6, 8, 10, 12, 20 또는 61의 아미노산 서열 간의 서열 정렬을 수행하여 쉽게 확인될 수 있다. 정렬된 아미노산 서열은 전형적으로 매트릭스 내 열(row)로 나타낸다. 이들 열에서, 상동의(즉, 상응하는) 아미노산은 서로 아래에 놓인다. 잔기들 사이에 갭이 삽입되어 동일 또는 유사한 문자가 차례로 세로행에 정렬된다. 다른 서열의 아미노산 위치와 상동인 아미노산 위치를 확인하기 위해 서열 정렬을 수행하는데 사용될 수 있는 다양한 계산 알고리즘이 존재한다. 예를 들어, NCBI BLAST 알고리즘(Altschul et al. 1997 Nucleic Acids Res. 25: 3389-3402) 또는 CLUSTALW 소프트웨어(Sievers & Higgins 2014 Methods Mol. Biol. 1079: 105-116)를 이용하여 서열 정렬을 수행할 수 있다. 그러나, 서열은 또한 수동으로 정렬될 수 있다.

본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응성 요소의 제1 배열을 포함하는 폴리펩타이드는 광-반응성 요소의 제2 배열을 포함하는 폴리펩타이드와 비교하여 리간드에 대해 더 높은 친화성을 갖는다. 바람직하게는, 광-반응성 요소의 제1 배열을 포함하는 폴리펩타이드는 리간드에 대해 높은 친화성을 가지며 광-반응성 요소의 제2 배열을 포함하는 폴리펩타이드는 상기 리간드에 대해 낮은 친화성을 갖는다.

용어 "친화성"은 당업계에 일반적으로 공지되어 있으며, 한 분자의 다른 분자에 대한 고유한 결합 강도를 지칭한다. 또는, 다른 말로, 친화성은 한 분자가 다른 분자와 결합하는 경향이다. 특히, 본 명세서에서 폴리펩타이드가 친화성 크로마토그래피 컬럼 내에서 목적 분자의 적어도 60%, 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90%를 보유할 수 있다면 폴리펩타이드는 리간드에 대해 "높은 친화성"을 갖는다. 친화성 크로마토그래피 컬럼이 인산염-완충 식염수(PBS) 또는 트리스-완충 식염수(TBS)와 같은 적당한 완충액으로 세척되더라도 리간드에 대해 "높은 친화성"을 갖는 폴리펩타이드는 친화성 크로마토그래피 컬럼 내에서 목적 분자의 적어도 60%, 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90%를 보유할 수 있을 것으로 예상된다.

반면에, 본 명세서에서 적당한 용출 완충액(예를 들어, PBS 또는 TBS)을 이용하여, 친화성 크로마토그래피 컬럼으로부터 목적 분자의 적어도 60%, 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80% 및 가장 바람직하게는 적어도 90%가 용출된다면 폴리펩타이드는 리간드에 대해 "낮은 친화성"을 갖는다.

예를 들어, 본 명세서에서 "높은 친화성"은 <10 μM, 바람직하게는 ≤1 μM, 보다 바람직하게는 ≤100 nM, 훨씬 더 바람직하게는 ≤10 nM, 및 가장 바람직하게는 ≤1 nM의 해리 상수(K_d) 값을 갖는 친화성을 포함한다. 반면에, 본 명세서에서 "낮은 친화성"은 >10 μM, 바람직하게는 ≥100 μM, 보다 바람직하게는 ≥1 mM, 훨씬 더 바람직하게는 ≥10 mM, 및 가장 바람직하게는 ≥100 mM의 K_d 값을 갖는 친화성을 포함한다.

따라서, 본 발명의 맥락에서, 리간드에 대해 "낮은 친화성"을 갖는 폴리펩타이드는 리간드에 대해 "높은 친화성"을 갖는 폴리펩타이드의 K_d 값보다 ≥10배, 바람직하게는 ≥100 배, 보다 바람직하게는 ≥1000 배 및 가장 바람직하게는 ≥10000 배 더 큰 K_d 값을 갖는 친화성을 갖는 폴리펩타이드를 포함한다. 또는, 다른 말로, 본 명세서에서 광-반응성 요소의 제2 배열을 포함하는 광-전환성 폴리펩타이드는 광-반응성 요소의 제1 배열을 포함하는 광-전환성 폴리펩타이드의 K_d 값보다 ≥10배, 바람직하게는 ≥100 배, 보다 바람직하게는 ≥1000 배 및 가장 바람직하게는 ≥10000 배 더 큰 K_d 값을 갖는 친화성을 갖는다.

폴리펩타이드가 주어진 리간드에 결합하는 K_d 값은 형광 적정, ELISA 또는 경쟁적 ELISA, 등온적정방법(isothermal titration calorimetry, ITC)과 같은 열분석학적 방법, 플로우 사이토메트리 적정 분석(FACS 적정) 및 표면 플라즈마 공명(BIAcore)을 포함하나 이에 제한되지 않는 잘 알려진 방법들에 의해 측정될 수 있다. 바람직하게는 폴리펩타이드가 주어진 리간드에 결합하는 K_d 값은 ELISA로 측정된다. 그러한 방법들은 당업계에 잘 알려져 있으며, 예를 들어, De Jong 2005 J. Chromatogr. B 829: 1-25; Heinrich 2010 J. Immunol. Methods 352: 13-22; Williams & Daviter (Eds.) 2013 Protein-Ligand Interactions, Methods and Applications, Springer, New York, NY에 기술되어 있다.

첨부된 실시예에서 기술된 바와 같이, 광-전환성 폴리펩타이드는 광-이성질화성 기를 친화성 분자(예를 들어, 스트렙타비딘, 단백질 A, 단백질 G, 단백질 L, 항-myc-tag 항체 또는 이의 변이체, 융합 단백질, 뮤테인 또는 이의 단편)에 통합시켜 얻을 수 있다. 예를 들어, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응성 요소는 친수성 화합물 또는 아조(azo)기를 포함하는 분자 모이어티를 포함한다. 따라서, 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법의 광-반응성 요소는 아조기를 포함할 수 있다. 용어 "아조기"는 당업계에 일반적으로 공지되어 있으며 N=N 기를 지칭한다. 본 발명에 따르면, 광-반응성 요소는 아조 화합물을 포함할 수 있다. 아조 화합물은 디아젠(디이미드), HN=NH의 임의의 유도체이며, 수소 둘 다 하이드로카바일기, 예를 들어, 그 자체가 치환기를 보유할 수 있는 PhN=NPh 아조벤젠 또는 디페닐디아젠으로 치환된다. 따라서, 본 명세서에서 아조 화합물은 기능기 R-N=N-R'(R 및 R'는 아릴 또는 알킬일 수 있음)를 보유하는 임의의 화합물이다. 친수성 또는 극성 치환기, 예를 들어, -COOH, -SO₃H, -B(OH)₂, -CONH₂, -CONR''R''', -NH₂, -NR''R'''(R'' 및 R'''은 아릴 또는 알킬 중 하나임)를 보유한 그러한 하이드로카바일기가 바람직하다.

아조벤젠과 같은 광활성 리간드를 갖는 단백질의 화학적 변형은 당업계에 기술되어 있다(Kramer et al. 2005 Nat. Chem. Biol. 1: 360-365). 아조벤젠의 광변색 특성들은 광원에 의해 쉽게 유발되는 N=N 이중 결합의 입체화학적 시스/트랜스 이성질체화로 인해 큰 관심을 끌었다(Merino & Ribagorda 2012 Beilstein J. Org. Chem. 8: 1071-1090). 기저 상태에서 에너지적으로 유리한 트랜스-아조벤젠은 300 내지 390 nm의 파장으로 조사하여 시스 이성질체로 이성질체화된다. 이 광반응은 가역적이며, 트랜스 이성질체는 시스 이성질체가 400 내지 530 nm의 광으로 조사될 때, 또는 열 이완에 의해 회복된다.

많은 아조벤젠의 경우, 광화학적 전환의 두 유형(트랜스가 시스로 및 시스가 트랜스로)은 피코초 이내에 일어나지만 시스 이성질체의 트랜스 이성질체로의 열 이완(기저 상태)은 훨씬 느리다(주변 온도에서 밀리초에서 수일까지 또는 가열되는 경우 더 빠름). 아조벤젠의 광-유도된 이성질체화는 그들의 물리적 특성들, 특히 분자 기하학, 쌍극자 모멘트 및 광 흡수에서의 변화를 유도한다(Henzl et al. 2006 Angew. Chem. Int. Ed. Engl. 45: 603-606). 아조벤젠 및 이의 유도체들에서, 이성질체화 공정은 아조기의 양측에 있는 방향족 고리의 2개의 파라 탄소 원자들 사이의 거리가 트랜스 형태에서 9.0Å이 시스 형태에서 5.5Å로 현저하게 감소하는 것을 포함한다(Koshima et al. 2009 J. Am. Chem. Soc. 131: 6890-6891).

아조벤젠 모이어티를 단백질에 생합성적으로 통합하기 위해, AzoPhe로 불리는 비천연 아미노산이 종래기술로 생성되었고, 앰버 억제 기술에 의한 재조합 단백질로의 이의 유전적 통합이 기술되어 있다(Bose et al. 2006 J. Am. Chem. Soc. 128: 388-389). 그러나, 이 광-반응성 아미노산은 배양 배지뿐만 아니라 물에서 용해도가 극히 열악하여 생합성 목적으로는 사용이 제한된다. 나중에, 테트라-o-플루오로-치환된 아조벤젠에 기초한 광-전환성 아미노산이 또한 조사되었으나(John et al. 2015 Org. Lett. 17: 6258-6261), 시스 광-전환성 특성에 비해 열등한 트랜스를 보여주었다.

아조벤젠의 다른 유도체로 비-천연 아미노산 4'-카르복시페닐아조페닐알라닌(즉, 4-[(4-카르복시페닐)아조]-L-페닐알라닌(4-[(4-carboxyphenyl)azo]-L-phenylalanine)) 및 3'-카르복시페닐아조페닐알라닌(즉, 4-[(3-카르복시페닐)아조]-L-페닐알라닌(4-[(3-Carboxyphenyl)azo]-L-phenylalanine))이 있다. 이들 비-천연 아미노산은 여전히 시스 및 트랜스 배열 이성질체가 특정 파장의 광에 의해 전환될 수 있는 능력을 가지고 있다. 또한, 이들 인공 아미노산은 폴리펩타이드에 통합될 수 있어 광-전환성 폴리펩타이드를 생성한다. 놀랍게도, 본 발명의 맥락에서, 4'-카르복시페닐아조페닐알라닌 및 3'-카르복시페닐아조페닐알라닌은 생리적 pH에서 물 및 LB 배양 배지에서 우수한 용해도를 가지며, 이는 상당한 이점을 구성하는 것으로 밝혀졌다. 더욱이, 이들 화합물은 그들이 생리학적 구조(불소 원자 대신에 생화학적 카르복실레이트 모이어티)를 가짐으로써 독성 및 면역원성의 위험을 감소시킨다는 추가 이점을 갖는다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 광-반응성 요소는

(i) 3'-카르복시페닐아조페닐알라닌 또는 이의 유도체; 또는

(ii) 4'-카르복시페닐아조페닐알라닌 또는 이의 유도체를 포함한다.

3'-카르복시페닐아조페닐알라닌 및 4'-카르복시페닐아조페닐알라닌의 화학식은 본 명세서에서 도 3 및 도 2에 각각 도시된다.

본 발명의 광-전환성 폴리펩타이드의 광-반응성 요소는 4'-카르복시페닐아조페닐알라닌(약어: Caf)를 포함하는 것이 가장 바람직하다.

첨부된 실시예에서 입증된 바와 같이, 본 발명의 광-전환성 폴리펩타이드의 결합 특성들의 광-유도된 변형은 예를 들어, 비-천연(특히, 비-단백질성(proteinogenic)) 광-전환성 아미노산의 부위-지정 통합에 의해 달성될 수 있다. 이 비-천연 아미노산은 광-전환성 사이드 체인을 가진다. 또는, 다른 말로, 비-천연 아미노산의 사이드 체인의 배열은 특정 파장(들)의 광으로 그것을 조사하여 변화될 수 있다. 이 배열 변화는 유리하게는 상응하는 폴리펩타이드(친화성 분자)의 형태 및/또는 결합 활성의 변화를 초래한다. 따라서, 본 발명에 따르면, 광-반응성 요소는 광-전환성 아미노산 사이드 체인을 포함할 수 있다. 예를 들어, 광-반응성 요소는 비-천연(즉, 비-단백질성) 아미노산을 포함하거나 이로 구성될 수 있고, 비-천연 아미노산의 두 가지 배열의 이성질체는 특정 파장(들)의 광을 적용하여 전환될 수 있다.

비-천연(즉, 비-단백질성) 아미노산을 갖는 단백질의 생합성은 몇년동안 구축되었으며, 생물리, 구조 및 생화학적 접근 그리고 생명공학 및 바이오의약품 적용을 위한 신규한 생체분자 시약으로의 길을 열었다(Wals & Ovaa 2014 Front. Chem. 2: 15). 비-천연(즉, 비-단백질성) 아미노산의 부위-특이적인 통합을 위한 다양한 방법은 숙주 세포의 유전자 코드에 의해 적극적으로 사용되지 않는 핵산 코돈을 이용한다. 따라서, 앰버 종결 코돈(UAG)은 또한 천연의 넌센스 억제 메커니즘에 종속되어 있으며, 재조합 단백질에서 새로운 사이드 체인 화학을 제공하기 위해 신규한 아미노산을 위한 추가적인 코딩 삼중항으로서 보충되었다. 합성 아미노아실-tRNA를 사용하는 인 비트로 번역 시스템을 위해 초기에 개발된 이 일반적인 접근은 원하는 아미노산 기질 특이성을 갖는 인공 아미노아실-tRNA 합성효소(aaRS)를 이용하여 살아있는 세포에서 단백질의 이종의 과발현에 적용되었다(Young & Schultz 2010 J. Biol. Chem. 285: 11039-11044). 중요하게는, 이러한 aaRS는 임의의 내재된 세포성 tRNA를 아미노아실화하지 않아야 하나, 생체 내에서 동시에 과발현되는 동족 서프레서 tRNA는 임의의 내인성 아미노아실-tRNA 합성효소에 의해 천연 아미노산으로 아미노아실화되지 않아야 한다. 다른 말로, 서프레서 tRNA 및 외래의 또는 가공된 aaRS는 선택된 숙주 세포에서 그들의 내인성 대응물에 직교해야 한다.

대장균(E. coli)에서 인 비보 번역에 적당한 tRNA 및 aaRS의 첫 번째 효율적인 직교쌍은 고세균 메타노코커스 잔나스키이(Methanococcus jannaschii)(Mj) 유래의 티로실-tRNA 합성효소(TyrRS) 및 이의 동족 tRNA^Tyr에서 발견되었으며, 앰버 종결 코돈을 특이적으로 인식하고 억제하도록 돌연변이되었다(Wang & Schultz 2001 Chem. Biol. 8: 883-890). 나중에, 비-천연 아미노산의 통합을 위한 툴박스는 피롤라이실-tRNA 합성효소(PylRS)과 이의 동족 천연 서프레서 tRNA^Pyl의 작용에 의해 앰버 종결 코돈에 반응하여 번역되는 22nd 단백질성 아미노산 L-피롤라이신(Pyl)에 기초한 시스템에 의해 확장되었다(Fekner & Chan 2011 Curr. Opin. Chem. Biol. 15: 387-391). 이 시스템은 원래 메탄발생 고세균 메타노사르시나 바르케리(Methanosarcina barkeri)(Mb) 및 메타노사르시나 마제이(Methanosarcina mazei)에서 발견되었고(James et al. 2001 J. Biol. Chem. 276: 34252-34258), 현재는 유전자 코드 확장 툴로서 점차 사용되고 있다(Wan at al. 2014 Biochem. Biophys. Acta 1844: 1059-1070). 천연 기질 Pyl에 대한 이의 오히려 낮은 선택성으로 인해, PylRS는 (단백질 공학 이후 일부에서) 100개 이상의 비-천연 아미노산의 유전적 통합을 허용하였다(Wan et al. 2014 Biochem. Biophys. Acta 1844: 1059-1070).

따라서, 비-단백질성 아미노산을 갖는 단백질의 생합성을 실현하기 위한 몇몇 잘-확립된 시스템이 존재한다. 첨부된 실시예에서 기록된 바와 같이, 이들 방법은 본 명세서에서 제공된 광-전환성 폴리펩타이드의 생산을 명확하게 가능케한다. 보다 상세하게는, 본 발명의 광-전환성 폴리펩타이드는 광-이성질화성 아미노산을 단백질(스트렙타비딘, 단백질 A, 단백질 G, 단백질 L, 항-myc-tag 항체 또는 이의 변이체, 융합 단백질, 뮤테인 또는 이의 단편)에 통합하여 제조될 수 있으며, 차례로 친화성 크로마토그래피에서 친화성 분자로 사용된다.

새롭게 설계된 폴리펩타이드가 리간드에 대한 친화성의 광-유도된 변화를 보여주는지 시험하기 위해(즉, 그것이 본 발명에 따른 광-전환성 폴리펩타이드인지를 시험하기 위해), ELISA(enzyme-linked immunosorbent assay)를 수행할 수 있다. 이와 관련하여 사용될 수 있는 ELISA는 도 7(A)에 예시된다. 보다 상세하게는, 도 7(A)는 리간드(예를 들어, 적당한 친화성 태그를 포함하는 목적 단백질)와 주어진 폴리펩타이드(친화성 분자) 간의 상호작용을 검출하기 위해 사용될 수 있는 ELISA의 개략도를 도시한다. 이러한 ELISA 셋업은 원칙적으로 친화성 크로마토그래피 절차의 단순 버전에 해당한다. 이와 관련하여 바람직하게 사용될 수 있는 다른 ELISA는 도 11에 예시된다.

특히, 이러한 ELISA는 다음과 같이 수행될 수 있다. 플레이트(예를 들어, 마이크로타이터 플레이트)에 잠재적 광-전환성 폴리펩타이드를 코팅할 수 있다. 이어서, 잠재적 광-전환성 폴리펩타이드의 펩타이드 리간드(예를 들어, Strep-tag 또는 Strep-tag II와 같은 친화성 태그)와 융합되는 리포터 효소(예를 들어, 알칼라인 포스파타아제)를 첨가할 수 있다. 이어서, 특정 파장(들)을 갖는 광(예를 들어, 300 내지 390 nm의 파장을 갖는 자외선)에 노출되거나 노출되지 않고 세척 단계를 수행할 수 있다. 이후, 남아있는 결합된 효소를 발색 기질(예를 들어, p-니트로페닐포스페이트)의 생촉매적 전환에 의해 검출하고 예를 들어, 광도계에서 흡광도로 정량화할 수 있다.

이 ELISA에서, 잠재적 광-전환성 폴리펩타이드는

(1) 특정 파장(들)을 갖는 광(예를 들어, 300 내지 390 nm의 파장을 갖는 자외선)에 잠재적 광-전환성 폴리펩타이드가 노출될 때 남아있는 효소 활성의 감소가 검출되는 경우; 및

(2) 잠재적 광-전환성 폴리펩타이드가 다른 특정 파장(들)을 갖는 광(예를 들어, 약 400 내지 530 nm, 예를 들어 400 내지 500 nm의 파장을 갖는 가시광선)에 노출될 때 또는 어둠 속에서 유지될 때 남아있는 효소 활성의 감소가 검출되지 않는(또는 거의 없는) 경우

본 발명에 따른 광-전환성 폴리펩타이드인 것으로 간주될 수 있다.

상기 언급된 바와 같이, 본 발명은 광-반응성 요소(예를 들어, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌)을 포함하는 폴리펩타이드를 제공하며, 광-반응성 요소의 배열은 폴리펩타이드의 리간드에 대한 결합 활성을 바꾼다. 일반적으로 당업계에 공지된 바와 같이, "이성질체"는 동일한 분자식 또는 조성을 갖지만 상이한 구조를 갖는 화합물이다. "입체이성질체"는 그들의 성분 원자들의 공간적 배향만 다르다. 따라서, 입체이성질체는 그들의 공간 배향을 나타내기 위해 IUPAC 이름에 추가적인 명명 접두사를 추가할 필요가 있다. 입체이성질체를 구별하는데 사용되는 일반적으로 사용되는 접두사는 시스(라틴어로 "이쪽"을 의미) 및 트랜스(라틴어로 "반대쪽"를 의미)이다. 보다 상세하게는, 유기 화학에서 "시스"는 치환기가 예컨대 아조 화합물의 경우, 회전할 수 없는 결합, 예컨대 이중결합에 의해 연결된 한쌍의 원자, 종종 탄소뿐만 아니라 질소와 같은 쪽에 있음을 의미한 반면, "트랜스"는 치환기(예를 들어, 기능기)가 상기 원자쌍의 반대쪽에 있음을 의미한다. 그러한 이성질체 상태는 일반적으로 배열 또는 배열적 이성질체 또는 상태로 지칭된다.

일부 화합물의 경우, 어떤 이성질체가 시스 및 트랜스로 명명되어야 하는지 명백하지는 않다. 따라서, 그러한 입체이성질체를 정의하기 위한 규칙의 명확한 시스템이 순수 및 응용 화학 국제 연합(IUPAC)에 의해 제안되었다. 이 시스템은 입체이성질체를 지정하기 위해 Z(독일어로 "함께"에 대해 "zusammen") 또는 E(독일어로 "반대"에 대해 "entgegen")를 배당하는 치환기에 대한 그룹 우선 규칙 세트(Cahn-Ingold-Prelog 또는 CIP 규칙으로 알려짐)를 기반으로 한다. 종종 Z는 시스와 등가이며, E는 시스-트랜스 표기법이 적당한 이성질체에 대해 트랜스와 등가이다.

본 발명에 따르면, 광-반응성 요소의 이성질체는 트랜스 이성질체 및 시스 이성질체일 수 있다. 추가로 또는 대안으로, 광-반응성 요소의 이성질체는 E 이성질체 및 Z 이성질체일 수 있다. 따라서, 본 명세서에서, 광-반응성 요소의 배열의 전환은 광-반응성 요소의 트랜스(또는 E) 이성질체로부터 상응하는 시스(또는 Z) 이성질체로의 전환일 수 있고, 그 역일 수 있다. 3'-카르복시페닐아조페닐알라닌 및 4'-카르복시페닐아조페닐알라닌의 시스 및 트랜스 이성질체는 본 명세서에서 각각 도 3 및 2에 도시된다.

본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 트랜스 이성질체를 포함하는 폴리펩타이드는 각각 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 시스 이성질체를 포함하는 폴리펩타이드와 비교하여 리간드에 대한 증가된 친화성을 갖는다. 예를 들어, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 트랜스 이성질체를 포함하는 폴리펩타이드는 리간드에 대해 "높은 친화성"을 가질 수 있고, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 시스 이성질체를 포함하는 폴리펩타이드는 같은 리간드에 대해 "낮은 친화성"을 가질 수 있다. 용어 "높은 친화성" 및 "낮은 친화성"은 본 명세서에서 상기에 정의된다.

그러나, 본 발명의 광-전환성 폴리펩타이드는 또한 이의 시스 이성질체가 트랜스 이성질체와 비교하여 리간드에 대해 더 높은 친화성을 가지는 방식으로 구축될 수 있다. 따라서, 본 발명의 일 구체예는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 시스 이성질체를 포함하는 폴리펩타이드는 각각 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 트랜스 이성질체를 포함하는 폴리펩타이드와 비교하여 리간드에 대해 증가된 친화성을 갖는다. 이 구체예에서, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 시스 이성질체를 포함하는 폴리펩타이드는 리간드에 대해 "높은 친화성"을 가질 수 있고, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 트랜스 이성질체를 포함하는 폴리펩타이드는 같은 리간드에 대해 "낮은 친화성"을 가질 수 있다. 언급된 바와 같이, 용어 "높은 친화성" 및 "낮은 친화성"의 명백한 정의는 본 명세서에서 상기에 제공된다.

잠재적 광-전환성 폴리펩타이드에 대한 예시로서, 광-전환성 스트렙타비딘 돌연변이체가 제조되고, 첨부된 실시예에서 특성화된다. 약 400 내지 530 nm 파장(들)을 갖는 가시광선에서, 이 광-전환성 스트렙타비딘 돌연변이체의 80-90%는 광-반응성 요소의 트랜스 이성질체(예를 들어, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 트랜스 이성질체)를 포함한다. 약 300 내지 390 nm 파장을 갖는 자외선에서, 예시적 광-전환성 스트렙타비딘 돌연변이체의 80-90%는 광-반응성 요소의 시스 이성질체(즉, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 시스 이성질체)를 포함한다.

일반적으로, 가시광선은 400 내지 780 nm의 파장을 포함한다. 이 광은 또한 일반적으로 일광으로 지칭된다.

첨부된 실시예는, 본 발명의 광-전환성 폴리펩타이드가 친화성 크로마토그래피 절차에 적용되면 목적 분자의 최고 결합도 및 최고 용출도는 각각 약 430 nm 및 약 330 nm에서 일어남을 입증한다. 따라서, 약 430 nm(가시광선) 및 330 nm(자외선) 파장(들)을 갖는 광이 본 발명의 맥락에서 적용될 수 있다. 그러나, 종래의 광원은 보통 약 530 nm(가시광선) 및 365 nm(자외선)인 파장을 갖는 광을 제공한다. 따라서, 이들 파장(즉, 약 530 nm 및/또는 약 365 nm)을 제공하는 광 또한 본 발명에 따라 사용될 수 있다.

따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 약 400 내지 530 nm, 예를 들어, 400 내지 500 nm, 바람직하게는 405 내지 470 nm, 보다 바람직하게는 410 내지 450 nm 및 가장 바람직하게는 약 430 nm를 갖는 가시광선에서, 광-전환성 폴리펩타이드의 적어도 60%, 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 훨씬 더 바람직하게는 적어도 80%, 훨씬 더 바람직하게는 적어도 90%, 및 가장 바람직하게는 적어도 95%는 광-반응성 요소의 트랜스 이성질체를 포함한다.

본 발명의 다른 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 300 내지 390 nm, 바람직하게는 310 내지 370 nm, 훨씬 더 바람직하게는 320 내지 350 nm 및 가장 바람직하게는 약 330 nm를 갖는 자외선에서, 광-전환성 폴리펩타이드의 적어도 60%, 바람직하게는 적어도 70%, 훨씬 더 바람직하게는 적어도 80%, 훨씬 더 바람직하게는 적어도 90%, 및 가장 바람직하게는 적어도 95%는 광-반응성 요소의 시스 이성질체를 포함한다. 상기 언급된 바와 같이, 종래의 광원은 보통 약 365 nm의 파장을 갖는 자외선을 제공한다. 따라서, 본 발명의 다른 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 약 365 nm를 갖는 자외선에서 광-전환성 폴리펩타이드의 적어도 60%, 바람직하게는 적어도 70%, 훨씬 더 바람직하게는 적어도 80%, 훨씬 더 바람직하게는 적어도 90%, 및 가장 바람직하게는 적어도 95%는 광-반응성 요소의 시스 이성질체를 포함한다.

광-반응성 요소의 이성질체화의 정도(예를 들어, 비율, 분획 또는 수율) 또는 배열적 전환은 파장뿐만 아니라 조사에 사용된 광의 강도에 의존한다는 것이 당업자에게 공지되어 있다. 본 발명에 따른 유용한 광 강도는 LED 또는 적어도 0.1 mW, 바람직하게는 적어도 1 mW, 보다 바람직하게는 적어도 10 mW, 보다 바람직하게는 적어도 100 mW, 가장 바람직하게는 적어도 1000 mW의 통합 전력을 갖는 몇몇 LED와 같은 종래의 광원이 광-전환성 폴리펩타이드(친화성 분자)를 보유한 친화성 매트릭스 또는 크로마토그래피 매트릭스의 1 mL (wet) volume을 조사하기 위해 적용되고, 상기 매트릭스까지 1 m 미만, 바람직하게는 10 cm 미만, 보다 바람직하게는 2 cm 미만, 및 가장 바람직하게는 1 cm 미만의 거리에 위치할 때 달성된다. 더 큰 부피의 친화성 매트릭스 또는 크로마토그래피 매트릭스를 위해 비례적으로 더 큰 값의 전력이 적용된다. 대신에, 상기 LED와 유사한 광 강도 및 파장을 제공하는 다른 광원, 예를 들어, 튜브형 형광 램프(들)이 사용될 수 있다. 더 큰 부피의 친화성 매트릭스를 위해 광원은 또한 예를 들어 광섬유를 이용하여 크로마토그래피 컬럼의 베드 내에 위치할 수 있다.

본 발명에 따른 자외선은 일반적으로 근자외선(UV)으로 지칭되는 전자기 방사선의 스펙트럼 영역에 속한다. 본 발명에 따른 자외선의 파장은 단백질, 핵산 및 탄수화물을 포함하여 많은 목적 생체분자에 의해 본질적으로 흡수되지 않는다. 따라서, 상기 자외선은 예를 들어 더 짧은 파장 및 더 높은 에너지를 갖는 원자외선의 사용에 비해 방사선 손상의 위험이 낮아 온화한 것으로 간주될 수 있다.

상기 기술된 바와 같이, 본 발명의 광-전환성 폴리펩타이드는 예를 들어 친화성 크로마토그래피 절차 동안 목적 분자의 분리 및/또는 정제에 사용될 수 있다. 따라서, 광-전환성 폴리펩타이드는 바람직하게는 고체상에 포함된다(예컨대, 고체상 담체 또는 고체 표면에 또는 팽창된 고분자 젤에 흡수됨).

상기 고체상은 바람직하게는 친수성이다. 용어 "고체상" 및 "액체상"은 일반적으로 당업계에 공지되어 있으며, 각각 고체 물질 및 액체 물질로 지칭된다. 액체상은 임의의 용액, 용액의 혼합물 또는 현탁액일 수 있다. 예를 들어, 액체상은 선택적으로 완충용액과 혼합된 세포 추출물 또는 배양 상등액을 포함할 수 있다. 본 발명에 따르면, 고체상은 임의의 적당한 담체일 수 있다. 예를 들어, 고체상은 매트릭스(예를 들어, 가교-결합을 포함하는 잠재적으로 유기 또는 생체분자 물질의 고분자), 하이드로젤(보통 수성 미세환경 내 친수성 고분자 체인의 가교결합을 통해 형성된), 비드, 자성 비드, 칩, 유리 표면, 플라스틱 표면, 금 표면, 은 표면 또는 플레이트일 수 있다. 매트릭스, 하이드로젤, 비드, 칩, 유리 표면, 플라스틱 표면 또는 플레이트는 바람직하게는 광-투과성이다. 매트릭스, 하이드로젤 또는 비드는 친화성 크로마토그래피 컬럼의 고체상일 수 있다. 매트릭스는 예를 들어 N-하이드록시석신이미딜(N-hydroxysuccinimidyl, NHS) 활성화된 CH-세파로스일 수 있다. 플레이트는 마이크로타이터 웰 플레이트일 수 있다. 본 발명의 광-전환성 폴리펩타이드의 커플링에 적당한 일부 활성화된 크로마토그래피 물질의 개요는 아래 표 2에 제공된다.

광-전환성 폴리펩타이드의 커플링에 적당한 일부 활성화된 크로마토그래피 물질의 개요

물질	판매자	비고
NHS-Activated Sepharose 4 Fast Flow	GE Healthcare Life Sciences	공정-스케일 적용에서 아미노-함유 소단백질 및 펩타이드의 커플링을 위한 NHS 미리-활성화된 매질
NHS-ACT Sepharose High Performance	GE Healthcare Life Sciences	NHS-활성화된 세파로스 고성능
Activated Thiol Sepharose 4B	GE Healthcare Life Sciences	활성화된 티올 세파로스 4B 매질은 온화한 조건에서 티올기를 함유하는 분자의 가역적 고정화에 사용되는 매질임. 큰 분자의 고정화를 위해 최적화됨
CNBr-Activated Sepharose 4 Fast Flow	GE Healthcare Life Sciences	CNBr-활성화된 세파로스 4 패스트 플로우는 큰 아미노-함유 리간드의 커플링을 위해 잘 확립된 미리-활성화된 크로마토그래피 매질임
CNBr-Activated Sepharose 4B	GE Healthcare Life Sciences	CNBr-활성화 세파로스 4B는 중간 스페이서 암이 없이 시아노겐 브로마이드 방법에 의해 항체 또는 -NH₂ 기를 포함하는 다른 큰 단백질을 세파로스 매질에 커플링하기 위해 사용되는 미리-활성화된 매질임
EAH Sepharose 4B	GE Healthcare Life Sciences	EAH 세파로스 미리-활성화된 매질은 11-암 스페이서 암에 의한 카보디이미드-기반 커플링을 통해 카르복실기를 포함하는 화합물을 세파로스 4B에 커플링하는데 사용됨
Epoxy-Activated Sepharose 6B	GE Healthcare Life Sciences	Epoxy-활성화 세파로스 6B는 12-암 친수성 스페이서 암에 의한 리간드의 하이드록시, 아미노 또는 티올기의 세파로스 6B와의 커플링을 통해 당을 포함하는 다양한 리간드의 고정화를 위한 미리-활성화된 매질임
NHS Mag Sepharose	GE Healthcare Life Sciences	NHS 매그 세파로스는 풀-다운 기술을 위해 설계된 자성 비드로 친화성에 기초한 선별된 단백질의 빠른 포획 및 강화에 이용할 수 있음
Aldehyde Agarose	Sigma-Aldrich	알데히드 아가로스는 친화성 크로마토그래피에 사용됨. 효소의 고정화 및 안정화를 위한 연구에 사용되어 옴
Cyanogen bromide-activated Agarose	Sigma-Aldrich	시아노겐 브로마이드-활성화 아가로스는 친화성 크로마토그래피, 단백질 크로마토그래피, 단백질 상호작용, 항체 표지화, 항체 변형 및 아가로스 비드로의 항체 부착에 사용되는 락토오스로 안정화된 동결건조 분말임
Epoxy-activated-Agarose	Sigma-Aldrich	에폭시-활성화 아가로스는 락토오스로 안정화된 동결건조 분말로, 친화성 크로마토그래피, 단백질 크로마토그래피 및 활성화/기능화된 매트릭스에 사용됨. 에폭시-활성화된 아가로스는 암 예방뿐만 아니라 인간-유래 암세포에 대한 항-증식 활성을 나타내는 연구에 사용되어 옴
TOYOPEARL® AF-Amino-650Mamine-activated	Sigma-Aldrich	Toyopearl AF-Amino-650 수지는 친화성 크로마토그래용 특이 리간드의 커플링에 사용되는 반응성 수지임. 리간드는 그들 각각의 카르복실레이트 또는 알데히드기를 통해 펩타이드 결합 형성 또는 환원성 아민화에 의해 고정됨
TOYOPEARL® AF-Epoxy-650M expoxy-activated	Sigma-Aldrich	Toyopearl AF-Epoxy-650 수지는 친화성 크로마토그래피용 단백질 리간드의 고정화를 위해 건조 형태로 제공되는 활성화 수지임. 고밀도의 저분자량의 분자를 부착할 때 사용됨. 또한, 리간드 고정 전에 다른 특정 기능기로 전환이 필요할 때 유용함. 예를 들어, 이의 하이드라자이드 형태는 탄수화물 또는 당단백질 리간드에 매우 유용함
TOYOPEARL® AF-Tresyl-650M tresyl-activated	Sigma-Aldrich	Toyopearl AF-Tresyl-650 수지는 아민 및 티올기에 쉽게 결합하는 활성화 수지임
Pierce NHS-Activated Agarose	Thermo Scientific	1차 아민에 의해 단백질, 펩타이드 및 다른 리간드의 빠르고 안정한 고정화를 위한 아민-반응성의 비드형 아가로스 수지
AminoLink Coupling Resin	Thermo Scientific	1차 아민을 통해 항체 및 다른 단백질의 공유적 고정화를 가능케 하기 위해 알데히드기로 활성화된 가교결합된 4% 비드형 아가로스
AminoLink Plus Coupling Resin	Thermo Scientific	친화성 정제용 컬럼을 제조하기 위해 1차 아민에 의한 항체(단백질)의 고수율의 공유적 커플링을 위한 알데히드-활성화 아가로스 비드
SulfoLink Coupling Resin	Thermo Scientific	시스테인-펩타이드 및 다른 설프하이드릴 분자의 공유적 고정화를 위해 아이오도아세틸기로 활성화된 가교결합된 6% 비드형 아가로스
CarboxyLink Coupling	Thermo Scientific	친화성 정제 절차에 사용하는 극성의 비드형 수지에 펩타이드 또는 다른 카르복실-함유(-COOH) 분자를 공유적으로 고정화하기 위함

본 발명에 따르면, 광-전환성 폴리펩타이드는 고체상에 공유적으로 또는 비-공유적으로 부착될 수 있다. 광-전환성 폴리펩타이드는 고체상에 공유적으로 부착되는 것이 가장 바람직하다. 이는 광-전환성 폴리펩타이드가 고체상에 고정되어 목적 분자와 함께 용출되지 않도록 하는 이점을 갖는다. 따라서, 광-전환성 폴리펩타이드를 고체상(예를 들어, 친화성 크로마토그래피 매트릭스)에 공유적으로 부착함으로써, 용출된 목적 분자의 오염을 피한다.

그러나, 본 발명은 또한 고체상으로의 광-전환성 폴리펩타이드의 비-공유 결합을 포함한다. 예를 들어, 광-전환성 폴리펩타이드는 융합 단백질의 일부일 수 있다. 융합 단백질의 다른 부분은 공유적으로 또는 비-공유적으로 고체상(예를 들어, 친화성 크로마토그래피 컬럼의 매트릭스)에 결합할 수 있다.

본 발명의 일 구체예에서, 담체는 비오틴, 비오틴화된 단백질 또는 분자 및/또는 광-전환성 폴리펩타이드의 펩타이드 리간드(예를 들어, Step-tag)에 공유적으로 또는 비-공유적으로 부착된다. 이 구체예에서, 광-전환성 폴리펩타이드는 비오틴, 비오틴화된 단백질 또는 분자 및/또는 폴리펩타이드의 펩타이드 리간드와의 비-공유 결합에 의해 담체에 부착될 수 있다. 본 발명의 다른 구체예에서, 담체는 알부민, 예를 들어, 인간 혈청 알부민(HSA)에 공유적으로 또는 비-공유적으로 부착된다. 이 구체예에서, 광-전환성 폴리펩타이드는 HSA와의 비-공유 결합에 의해 예를 들어 ABD와의 융합 단백질의 일부로서 담체에 부착될 수 있다. 예를 들어, 광-반응성 요소를 보유한 단백질 L의 광-전환성 도메인 B1은 ABD와의 융합 단백질로서 쉽게 생산될 수 있으며, 첨부된 실시예에서 입증된 바와 같이, ELISA에서 면역글로불린에 대해 광-제어성 친화성에 대해 시험된다. 그러나, 본 명세서에 정의된 광-전환성 폴리펩타이드를 포함하는 친화성 매트릭스에 적용하기 위해, 광-반응성 요소를 보유한 단백질 L의 광-전환성 도메인 B1은 바람직하게는 ABD 융합 파트너없이 적용되며, 특히, 예를 들어, 세포 배양 배지로부터 알부민이 함께 정제되는 경우에 피해야 된다.

본 명세서에서 제공된 광-전환성 폴리펩타이드는 이의 결합 활성이 특정 파장(들)의 광으로 광-전환성 폴리펩타이드를 조사하여 간단히 제어될 수 있는 이점을 갖는다. 따라서, 본 발명의 맥락에서 사용된 고체상(예를 들어, 담체)은 내광성인 것이 바람직하다. 바람직하게는, 담체는 300 nm 내지 500 nm, 바람직하게는 330 nm 내지 450 nm의 파장 범위에서 적어도 내광성이다.

광-반응성 요소의 배열의 전환은 광-전환성 폴리펩타이드의 리간드에 대한 결합 활성을 바꾼다. 본 명세서에서, "리간드"는 이의 배열 상태 중 하나(예를 들어, 트랜스 기저 상태)에서 본 명세서에서 제공된 광-전환성 폴리펩타이드에 대해 친화성을 가지는 임의의 분자일 수 있다. 목적 분자가 광-전환성 폴리펩타이드 그 자체에 친화성을 가진다면, 리간드는 즉, 추가의 변형 없이 목적 분자 자체일 수 있다. 예를 들어, 광-전환성 폴리펩타이드가 광-전환성 단백질 A, 단백질 G 또는 단백질 L(또는 이의 광-전환성 변이체, 뮤테인, 융합 단백질 또는 단편)이라면, 면역글로불린, 항체 또는 항체의 단편이 리간드 및 목적 분자일 수 있다. 그러나, 목적 분자가 광-전환성 폴리펩타이드 그 자체에 친화성을 가지지 않는다면, 리간드는 바람직하게는 목적 분자와 친화성 태그를 포함하는 융합 분자이다. 예를 들어, 광-전환성 폴리펩타이드가 광-전환성 스트렙타비딘 또는 항-myc-tag 항체(또는 이의 광-전환성 변이체, 뮤테인, 융합 단백질 또는 단편)이라면, 리간드는 바람직하게는 각각 Strep-tag/Strep-tag II 또는 myc-tag과 융합된 목적 분자이다.

바람직하게는, 리간드는 펩타이드, 올리고펩타이드, 폴리펩타이드, 단백질, 항체 또는 이의 단편, 면역글로불린 또는 이의 단편, 효소, 호르몬, 사이토카인, 복합체, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 핵산, 탄수화물, 리포좀, 나노입자, 세포, 생체거대분자, 생체분자 및 저분자로 구성된 군에서 선택된 분자를 포함하는 생체분자성 리간드이다. 예를 들어, 리간드는 폴리펩타이드, 복합체, 폴리뉴클레오타이드, 핵산, 탄수화물, 리포좀, 나노입자, 세포 또는 저분자일 수 있다. 상기 언급된 바와 같이, 리간드는 또한 상기 언급된 분자 중 어느 하나(목적 분자) 및 친화성 태그(에컨대, Strep-tag, Strep-tag II 또는 myc-tag)를 포함하는 융합 분자일 수 있다. 리간드는 단백질 또는 펩타이드인 것이 가장 바람직하다. 광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 스트렙타비딘(또는 이의 뮤테인 또는 변이체, 예컨대 Strep-Tactin)이라면, 리간드는 Strep-tag(즉 Strep-tag 또는 Strep-tag II) 또는 비오틴, 바람직하게는 Strep-tag일 수 있다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드, 용도 또는 방법에 관한 것으로, 펩타이드 리간드는

(i) SEQ ID NO: 13의 아미노산 서열[Strep-tag];

(ii) SEQ ID NO: 14의 아미노산 서열[Strep-tag II]; 또는

(iii) SEQ ID NO: 13 또는 14와 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 적어도 95%, 훨씬 더 바람직하게는 적어도 96%, 훨씬 더 바람직하게는 적어도 97%, 훨씬 더 바람직하게는 적어도 98% 또는 가장 바람직하게는 적어도 99% 동일성을 가지며, 스트렙타비딘 또는 이의 돌연변이체 또는 변이체에 대해 친화성을 갖는 아미노산 서열을 포함하거나 이로 구성된다. 상기 언급된 바와 같이, 연구 및 산업에 널리 사용되는 스트렙타비딘의 공지의 돌연변이체는 Strep-Tactin이다. 따라서, 본 발명의 맥락에서, 스트렙타비딘 돌연변이체는 SEQ ID NO: 7의 아미노산 서열을 갖는 단백질의 테트라머일 수 있다.

광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 항-myc-tag 항체(예를 들어, 클론 9E10) 또는 이의 단편, 뮤테인 또는 변이체(예를 들어, Fab 9E10)라면, 리간드는 myc-tag일 수 있다. myc-tag의 아미노산 서열은 본 명세서에서 SEQ ID NO: 15에 도시된다.

상기 언급된 바와 같이, 단백질 A 그리고 단백질 G는 항체, 특히 인간 및 마우스 IgG 그리고 다른 종의 Igs를 포함하여 IgGs의 Fc 영역에 결합한다. 단백질 L은 Ig 또는 항체 외에도 예를 들어 카파 경쇄를 포함하는 항체 또는 이의 단편에 결합한다. 따라서, 광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 단백질 A 또는 광-반응성 요소를 포함하는 단백질 G라면, 리간드는 바람직하게는 항체 또는 이의 단편, 바람직하게는 IgG 또는 이의 변이체, 뮤테인 또는 단편이며, 상기 변이체, 뮤테인 또는 단편은 IgG 항체의 Fc 영역 및/또는 IgG 항체의 Fab 영역을 포함한다. 광-전환성 폴리펩타이드가 광-반응성 요소를 포함하는 단백질 L이라면, 리간드는 바람직하게는 카파 경쇄, 예컨대 인간 VkI, VkIII 및/또는 VkIV 경쇄; 및/또는 마우스 VkI 경쇄를 포함하는 항체(또는 Fab 단편, Fv 단편, scFv 단편 또는 단일 도메인 단편과 같은 이의 단편)이다. 따라서, 다양한 상이한 항체들을 본 발명에 따른 광-전환성 단백질 A, 단백질 G 또는 단백질 L을 이용하여 정제할 수 있다. 예를 들어, 다른 것 보다도, Reichert 2017 mAbs 9: 167-181에 기술된 치료 항체들을 본 명세서에서 기술된 수단 및 방법을 적용하여 분리 또는 정제할 수 있다.

본 발명에 따르면, 용어 "% 서열 동일성" 또는 "% 동일성"은 아미노산 서열의 전체 길이(또는 비교를 위해 사용되는 이의 전체 부분)을 구성하는 아미노산 잔기의 수와 비교하여 둘 이상의 정렬된 아미노산 서열의 동일한 아미노산의 일치하는 수("히트")를 기술한다. 퍼센트 동일성은 동일한 잔기의 수를 비교에 사용된 가장 긴 서열의 잔기의 총 수로 나누고 그 생성물에 100을 곱해 결정된다. 다른 말로, 정렬을 이용하여, 동일한 아미노산 잔기의 비율(예를 들어, 80% 동일성)은 이들 (서브)서열을 비교하고 비교에 사용된 서열창에 걸쳐 또는 당업계에 공지된 서열 비교 알고리즘을 이용하여 측정할 때 지정된 영역에 걸쳐 최대 상응성을 위해 정렬될 때 또는 수동으로 정렬되고 육안으로 검사될 때, 둘 이상의 서열 또는 서브-서열에 대해 측정될 수 있다.

당업자는 예를 들어, NCBI BLAST 알고리즘(Altschul 1997 Nucleic Acids Res. 25: 3389-3402), CLUSTALW 컴퓨터 프로그램(Tompson 1994 Nucleic Acids Res. 22: 4673-4680) 또는 FASTA(Pearson 1988 Proc. Natl. Acad. Sci. U.S.A. 85: 2444-2448)에 기초한 것들과 같은 알고리즘을 이용하여 서열 사이/중에 퍼센트 서열 동일성을 측정하는 방법을 알고 있다. NCBI BLAST 알고리즘은 바람직하게는 본 발명에 따라 사용된다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 단어 길이(W) 3과 기대값(E) 10을 사용한다. 따라서, NCBI BLAST 또는 BLASTP 프로그램으로 측정될 때 적어도 80%, 바람직하게는 적어도 85%, 보다 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 적어도 95%, 훨씬 더 바람직하게는 적어도 96%, 훨씬 더 바람직하게는 적어도 97%, 훨씬 더 바람직하게는 적어도 98% 또는 가장 바람직하게는 적어도 99% 동일성의 서열 동일성을 갖는 모든 (폴리)펩타이드는 본 발명의 범위 내에 포함된다.

상기 기술된 바와 같이, 본 발명의 일 구체예는 본 명세서에서 제공된 광-전환성 폴리펩타이드를 적용하여 목적 분자를 분리 및/또는 정제하는 방법에 관한 것이다. 이 방법의 단계 (i)에서, 목적 분자는 본 발명의 광-전환성 폴리펩타이드에 결합한다. 따라서, 이 단계 동안 광-반응성 요소(예를 들어, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌)는 목적 분자에 대한 높은 결합 친화성을 갖는 폴리펩타이드를 생성하는 배열로 존재한다. 이는 특정 파장(들)의 광으로 광-전환성 폴리펩타이드를 조사하여 달성될 수 있다. 예를 들어, 본 명세서에서 제공된 방법에서, 단계 (i) 전 및/또는 동안 광-전환성 폴리펩타이드는 약 400 내지 530 nm, 예를 들어, 400 내지 500 nm, 바람직하게는 405 내지 470 nm, 보다 바람직하게는 410 내지 450 nm 및 가장 바람직하게는 약 430 nm를 갖는 가시광선으로 조사될 수 있다.

목적 분자의 광-전환성 폴리펩타이드와의 결합 후, 고체상(예를 들어, 친화성 크로마토그래피 매트릭스)은 컬럼으로부터 결합하지 않은 물질을 제거하기 위해 세척될 수 있다. 따라서, 본 발명의 일 양태에서 본 명세서에서 제공된 방법은

(i') 적당한 완충액으로 고체상을 세척하는 단계를 포함한다.

이 세척 단계 동안 목적 분자가 컬럼 내에 머물러 있거나 고체상에 결합되어 있는 것으로 예상된다. 따라서, 이 세척 단계 동안 본 명세서에서 제공된 광-전환성 폴리펩타이드의 광-반응성 요소는 바람직하게는 광-전환성 폴리펩타이드의 목적 분자와의 결합 활성을 생성하는 배열로 존재한다. 본 명세서에서 제공된 방법의 단계 (i') 동안(즉, 세척 단계 동안) 광-전환성 폴리펩타이드는 약 400 내지 530 nm, 예를 들어, 400 내지 500 nm, 바람직하게는 405 내지 470 nm, 보다 바람직하게는 410 내지 450 nm 및 가장 바람직하게는 약 430 nm를 갖는 가시광선으로 조사될 수 있다.

첨부된 실시예에서 생성된 예시적인 광-전환성 Strep-Tactin은 광-반응성 요소, 즉, 트랜스-3'-카르복시페닐아조페닐알라닌 또는 트랜스-4'-카르복시페닐아조페닐알라닌의 트랜스 배열에서 이의 리간드에 대한 결합 활성을 갖는다. 이 광-반응성 요소의 경우, 트랜스 배열은 가장 우호적인(즉, 최하의) 에너지를 갖는 상태이다. 따라서, 이 예시적인 광-전환성 Strep-Tactin은 심지어 어둠 속에서 또는 500 nm보다 더 긴 파장으로 조사 하에서 이의 리간드에 결합한다. 그러므로, 본 명세서에서 제공된 광-전환성 폴리펩타이드가 최하의 에너지를 갖는 형태 또는 배열에서 이의 리간드에 결합한다면, 단계 (i)(예를 들어, 컬럼의 로딩) 및 (i')(예를 들어, 컬럼의 세척)는 또한 어둠 속에서 또는 500 nm보다 더 긴 파장으로 조사 하에서 수행될 수 있다.

목적 분자를 용출하기 위해, 광-전환성 폴리펩타이드는 목적 분자에 대해 더 낮은 결합 활성을 갖는 형태로 전환되어야 한다. 본 명세서에서 예시적으로 설계된 광-전환성 Strep-Tactin은 이의 광-반응성 요소(즉, 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌)이 시스 배열로 존재할 때 낮은 결합 활성을 갖는다. 이 광-반응성 요소의 시스 배열(즉, 시스-3'-카르복시페닐아조페닐알라닌 또는 시스-4'-카르복시페닐아조페닐알라닌)은 자외선으로 조사하여 얻을 수 있다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 방법에 관한 것으로, 단계 (ii)(즉, 용출 단계) 동안 광-전환성 폴리펩타이드는 300 내지 390 nm, 바람직하게는 310 내지 370 nm, 보다 바람직하게는 320 내지 350 nm 또는 가장 바람직하게는 약 330 nm를 갖는 자외선으로 조사된다. 또는, 광-전환성 폴리펩타이드는 이 단계 동안 약 365 nm를 갖는 자외선으로 조사될 수 있다.

그러나, 원하는 경우, 또한 광-반응성 요소의 트랜스 배열(예를 들어, 트랜스-3'-카르복시페닐아조페닐알라닌 또는 트랜스-4'-카르복시페닐아조페닐알라닌)을 시스 배열로 전환하기 위해 근자외선보다 낮은 파장을 갖는 광이 사용될 수 있다. 따라서, 본 명세서에서 제공된 방법의 단계 (ii)(즉, 용출 단계) 동안 광-전환성 폴리펩타이드는 또한 300 nm보다 짧은 파장을 갖는 광, 예를 들어 300 내지 200 nm 사이의 파장(들)을 갖는 광으로 조사될 수 있다. 그러나, 상기 기술된 바와 같이, 본 발명의 맥락에서 300 내지 390 nm의 파장(들)을 갖는 약한 자외선을 사용하는 것이 바람직하다.

용출 후, 광-전환성 폴리펩타이드는 보통 리간드에 대한 결합 활성을 갖는 형태로 되돌아간다. 따라서, 본 발명의 일 양태는 본 명세서에서 제공된 방법에 관한 것으로, 방법은

(iii) 광-전환성 폴리펩타이드를 목적 분자에 대해 친화성을 갖는 제1 형태로 재생하는 단계를 더 포함한다.

이 단계 (iii) 동안, 광-반응성 요소는 약 400 내지 530 nm, 예를 들어, 400 내지 500 nm, 바람직하게는 405 내지 470 nm, 보다 바람직하게는 410 내지 450 nm 및 가장 바람직하게는 약 430 nm를 갖는 가시광선으로 광-전환성 폴리펩타이드를 조사하여 재생될 수 있다. 또한, 단계 (iii) 동안, 고체상은 적당한 완충액, 예를 들어, PBS 또는 TBS로 세척될 수 있다.

본 명세서에서 제공된 방법에서, 목적 분자를 포함하는 액체상은 세포 추출물 또는 배양 상등액일 수 있다. 예를 들어, 세포 추출물은 주변세포질(periplasm)의 추출물 또는 전체 세포 추출물일 수 있다. 목적 분자를 포함하는 액체상이 광-전환성 폴리펩타이드와 접촉하기 전에, 액체상은 완충액으로 투석 또는 희석될 수 있다.

본 발명에 따르면, 임의의 목적 분자는 본 명세서에서 제공된 광-전환성 폴리펩타이드를 이용하여 분리(및/또는 격리 또는 정제)될 수 있다. 바람직하게는, 목적 분자는 펩타이드, 올리고펩타이드, 폴리펩타이드, 단백질, 항체 또는 이의 단편, 면역글로불린 또는 이의 단편, 효소, 호르몬, 사이토카인, 복합체, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 핵산, 탄수화물, 리포좀, 나노입자 세포, 생체거대분자, 생체분자 및 저분자로 구성된 군에서 선택된 분자이다. 예를 들어, 목적 분자는 폴리펩타이드, 복합체, 폴리뉴클레오타이드, 탄수화물, 리포좀, 나노입자, 세포 또는 저분자일 수 있다. 목적 분자는 천연(즉 원천/내인성) 단백질 또는 재조합으로 생산된 단백질이 바람직하다. 예를 들어, 목적 분자는 치료 단백질일 수 있다.

특히 바람직한 목적 분자는 예를 들어 본 발명의 광-전환성 폴리펩타이드가 단백질 A, 단백질 G 또는 단백질 L의 광-전환성 버전인 경우 항체 또는 항체 단편이다. 항체는 단클론 항체 또는 다클론 항체일 수 있다. 항체 단편은 예를 들어, 나노바디, Fab 단편, Fab' 단편, Fab'-SH 단편, F(ab')2 단편, Fd 단편, Fv 단편, scFv 단편, 단일 도메인 항체 또는 분리된 상보성 결정 영역(CDR)일 수 있다. 바람직하게는, 항체 단편은 Fab 단편, F(ab')2 단편, Fd 단편, Fv 단편, scFv 단편 또는 단일 도메인 항체이다. 항체 또는 항체 단편은 인간 또는 마우스, 래트, 토끼, 햄스터, 염소, 기니아피그, 흰족제비, 고양이, 개, 닭, 양, 염소, 소, 말, 낙타, 라마 또는 원숭이와 같은 다른 종에서 유래할 수 있다. 항체 또는 항체 단편은 인간화되거나 전적으로 인간인 것이 우선한다. 항체는 또한 키메릭 및/또는 이중특이적인 항체일 수 있다. 항체는 예를 들어 트라스투주맙일 수 있다.

본 명세서에서, 용어 "폴리펩타이드", "펩타이드", "올리고펩타이드" 및 "단백질"은 상호교환적으로 사용되며, 아미노산의 적어도 하나의 체인을 포함하는 분자와 관련되며, 아미노산 잔기는 펩타이드(아미드) 결합에 의해 연결된다. 본 명세서에서 용어 "펩타이드", "올리고펩타이드", "폴리펩타이드" 및 "단백질"은 또한 변형, 예컨대, 인산화, 유비퀴틴화, 수몰리에이션(sumolyation), 아미드화, 아세틸화, 아실화, 지방산의 공유적 부착(예를 들어, C6-C18), 알부민같은 단백질의 부착, 글리코실화, 비오틴화, 페길화, 아세토미도메틸(Acm)기의 부가, ADP-리보실화, 알킬화, 카바모일화(carbamoylation), 카르복시에틸화(carboxyethylation), 에스테르화(esterification), 플라빈의 공유적 부착, 헴 모이어티의 공유적 부착, 뉴클레오타이드 또는 뉴클레오타이드 유도체의 공유적 부착, 약물 또는 독소의 공유적 부착, 마커의 공유적 부착(예를 들어, 형광 또는 방사성 마커)의 공유적 부착, 지질 또는 지질 유도체의 공유적 부착, 포스파티딜이노시톨의 공유적 부착, 디메틸화(demethylation), 공유적 가교결합의 형성, 시스틴(cystine)의 형성, 이황화 결합의 형성, 파이로글루타메이트의 형성, 포밀화(formylation), 감마-카르복실화(gamma-carboxylation), GPI 앵커 형성, 하이드록시화(hydroxylation), 요오드화(iodination), 메틸화, 미리스토일화(myristoylation), 산화, 단백질 분해 공정(proteolytic processing), 프레닐화(prenylation), 라세미화(racemization), 셀레노일화(selenoylation) 또는 황산화(sulfation)를 갖는 분자를 포함한다.

본 명세서에서, 용어 "펩타이드", "올리고펩타이드", "폴리펩타이드" 및 "단백질"은 또한 "펩타이드 유사체"("펩티도미메틱스" 또는 "펩타이드 미메틱스"로도 불림)를 포함한다. 펩타이드 유사체/펩티도미메틱스는 생물학적으로 활성이 있는 펩타이드의 골격 기하학 및 물리-화학적 특성들을 복제한다. 일반적으로, 펩타이드 유사체는 주형 펩타이드, 즉 생물학적 또는 약리학적 활성을 가지며 자연적으로 발생하는 아미노산을 포함하지만, -CH₂NH-, -CH₂S-, -CH₂-CH₂-, -CH=CH- (시스 및 트랜스), -CH₂SO-, -CH(OH)CH₂-, -COCH₂- 등과 같은 결합에 의해 선택적으로 대체되는 하나 이상의 펩타이드 결합을 갖는 펩타이드와 구조적으로 유사하다. 그러한 펩타이드 유사체는 당업계에 잘 알려진 방법들에 의해 제조될 수 있다.

본 명세서에서 사용된 용어 "아미노산" 또는 "잔기"는 핵산 서열에 의해 암호화된 자연적으로 발생하는 아미노산 그리고 다른 아미노산(예를 들어, 비-천연적으로 발생하는 아미노산, 핵산 서열에 의해 암호화되지 않는 아미노산, 합성 아미노산, 비-단백질성 아미노산 등)의 L- 및 D-이성질체를 둘 다 포함한다. 자연적으로 발생하는 아미노산의 예시로 알라닌(Ala; A), 아르기닌(Arg; R), 아스파라긴(Asn; N), 아스파르트산(Asp; D), 시스테인(Cys; C), 글루타민(Gln; Q), 글루탐산(Glu; E), 글리신(Gly; G), 히스티딘(His; H), 이소루신(Ile; I), 루신(Leu; L), 라이신(Lys; K), 메티오닌(Met; M), 페닐알라닌(Phe; F), 프롤린(Pro; P), 세린(Ser; S), 트레오닌(Thr; T), 트립토판(Trp; W), 티로신(Tyr; Y) 및 발린(Val; V)이 있다. 자연적으로 발생하는 비-유전적으로 암호화되는 아미노산 및 합성 아미노산은 예를 들어, 셀레노시스테인, 3'-카르복시페닐아조페닐알라닌, 4'-카르복시페닐아조페닐알라닌, β-알라닌, 3-아미노프로피온산, 2,3-디아미노 프로피온산, α-아미노이소부티르산(Aib), 4-아미노-부티르산, N-메틸글리신(사르코신), 하이드록시프롤린, 오르니틴, 시트룰린, t-부틸알라닌, t-부틸글리신, N-메틸이소루신, 페닐글리신, 시클로헥실알라닌, 노르루신(Nie), 노르발린, 2-나프틸알라닌, 피리딜알라닌, 3-벤조티에닐 알라닌, 4-클로로페닐알라닌, 2-플루오로페닐알라닌, 3-플루오로페닐알라닌, 4-플루오로페닐알라닌, 페니실라민, 1,2,3,4-테트라하이드로-이소퀴놀린-3-카르복실릭산(1,2,3,4-tetrahydro-isoquinoline-3-carboxylix acid), β-2-티에닐알라닌, 메티오닌 설폭사이드, L-호모아르기닌(Harg), N-아세틸 리신, 2-아미노 부티르산, 2-아미노 부티르산, 2,4-디아미노부티르산, p-아미노페닐알라닌, p-아세틸페닐알라닌, N-메틸발린, 호모시스테인, 호모세린, 시스테인산, ε-아미노 헥사노산(ε-amino hexanoic acid), δ-아미노 발레산, 2,3-디아미노부티르산 등을 포함한다. 추가의 비-천연 아미노산은 β-아미노산(β3 및 β2), 호모-아미노산, 3β-치환된 알라닌 유도체, 고리-치환된 페닐알라닌 및 티로신 유도체, 선형 코어 아미노산 및 N-메틸 아미노산이다.

본 발명에 따르면, 용어 "핵산 분자", "올리고뉴클레오타이드" 및 "폴리뉴클레오타이드"는 상호교환적으로 사용되며, 예컨대, cDNA, 게놈 DNA, 플라스미드 DNA, 바이러스 DNA, 제한 효소 절단에 의해 제조된 DNA의 단편, 예를 들어 자동화 DNA 합성 또는 중합효소 연쇄 반응(PCR)에 의한 증폭에 의해 제조된 합성 DNA와 같은 DNA 및 RNA를 포함한다. 본 명세서에서 사용된 용어 "RNA"는 mRNA, rRNA, tRNA, siRNA, muRNA, 바이러스 RNA, 합성 RNA 등을 포함하는 RNA의 모든 형태를 포함하는 것으로 이해된다. 단일-가닥 그리고 이중-가닥 핵산 분자 둘 다 용어 "핵산 분자", "올리고뉴클레오타이드" 및 "폴리뉴클레오타이드"에 포함된다. 추가로 DNA 또는 RNA의 합성 또는 반-합성 유도체와 같은 당업계에 공지된 핵산 모방 분자 및 혼합된 고분자가 포함된다. 본 발명에 따른 그러한 핵산 모방 분자 또는 핵산 유도체는 포스포로티오에이트 핵산, 포스포아미데이트 핵산, 2'-O-메톡시에틸 리보핵산, 모르포리노 핵산, 헥시톨 핵산(HNA), 펩타이드 핵산(PNA) 및 LNA(locked nucleic acid)를 포함한다.

본 명세서에서, 용어 "저분자"는 2000 달톤 이하, 바람직하게는 900 달톤 이하, 보다 바람직하게는 500 달톤 이하의 분자량을 갖는 임의의 분자에 관한 것이다. 본 명세서에서, 저분자는 유기 또는 무기, 바람직하게는 유기일 수 있다. 저분자는 세포막을 관통하여 확산할 수 있어 세포내 작용 부위에 도달할 수 있는 것이 또한 바람직하다. 이외에, 본 명세서에서 정의된 저분자는 경구 생체이용율을 가질 수 있다.

용어 "복합체"는 일반적으로 생화학 분야에서 공지되어 있으며, 성분들이 그들의 화학적 정체성을 대부분 유지하는 분자들로 구성된 실체에 관한 것이다. 예를 들어, 전형적인 복합체는 항체/항원 복합체, 수용체/호르몬 복합체, 수용체/사이토카인 복합체, 효소/기질 복합체, 금속/킬레이트 복합체, 스트렙타비딘/비오틴 복합체 또는 Strep-Tactin/Strep-tag 복합체이다.

본 발명에 따르면, 목적 분자가 면역글로불린(즉, 항체) 또는 이의 단편이라면, 그것은 단백질 A, 단백질 G 또는 단백질 L의 광-전환성 버전을 이용하여 간단히 분리 및/또는 정제될 수 있다. 그러나, 목적 분자의 광-전환성 폴리펩타이드와의 결합은 또한 친화성 태그와 목적 분자의 융합에 의해 달성될 수 있다. 예를 들어, 목적 분자는 Strep-tag, Strep-tag II 및/또는 myc-tag와 융합될 수 있다.

본 발명의 추가 양태는 본 명세서에서 제공된 광-전환성 폴리펩타이드를 포함하는 친화성 매트릭스에 관한 것이다. 예를 들어, 본 발명의 친화성 크로마토그래피 매트릭스는 본 명세서에서 제공된 광-전환성 폴리펩타이드를 종래의 친화성 크로마토그래피 매트릭스(예를 들어, NHS-활성화된 세파로스 4B)에 커플링하여 제조될 수 있다. 예를 들어, 팽창된 젤 1mL 당 0.1 내지 50 mg, 바람직하게는 0.5 내지 40 mg, 보다 바람직하게는 1 내지 25 mg, 훨씬 더 바람직하게는 2.5 내지 10 mg 및 가장 바람직하게는 약 5 mg 또는 약 10 mg의 광-전환성 폴리펩타이드가 적용될 수 있다. 종래의 친화성 크로마토그래피 매트릭스를 제조하는 것은 당업계에 일반적으로 공지되어 있으며, 예를 들어, Schmidt & Skerra 1994 J. hromatogr. A 676: 337-345에 기술되어 있다.

본 발명의 다른 양태는 본 발명의 친화성 매트릭스를 포함하는 친화성 크로마토그래피 컬럼에 관한 것이다. 이 친화성 크로마토그래피 컬럼에서, 매트릭스는 광-투과성 튜브 또는 용기; 및/또는 적어도 하나의 광섬유를 포함하는 튜브 또는 용기에 포함될 수 있다. 따라서, 광은 광-투과성 튜브 또는 용기의 벽을 통과하거나 적어도 하나의 광섬유에 의해 매트릭스에 도달할 수 있다. 광-투과성 튜브 또는 용기는 유리 또는 플라스틱으로 제조될 수 있다. 본 발명의 친화성 크로마토그래피 컬럼은 예를 들어 UV-투명 컬럼을 선택적으로 프릿 유리 또는 플라스틱 베이스가 한쪽 또는 양쪽끝에 장착된 유리 모세관(예를 들어, 0.7 mm 내경)에 크로마토그래피 매트릭스(예를 들어, 20 ㎕)와 함께 패킹하여 제조될 수 있다. 또한, 본 발명의 친화성 크로마토그래피 컬럼은 UV-투명 컬럼을 예를 들어, 5 mm 내지 50 mm(예컨대, 7 mm 또는 약 10 mm 또는 약 25 mm) 내경을 갖는 더 큰 유리 또는 플라스틱 튜브에 패킹하여 제조될 수 있다.

본 발명의 광-전환성 폴리펩타이드를 포함하는 본 명세서에서 제공된 친화성 크로마토그래피 컬럼은 친화성 크로마토그래피 기기의 일부를 형성할 수 있다. 따라서, 본 발명의 추가 양태는

(i) 본 발명의 친화성 크로마토그래피 컬럼;

(ii) 광원;

(iii) 하우징; 및

(iv) 전기 인터페이스(electronic interface)를 포함하는 친화성 크로마토그래피 기기에 관한 것이다.

또한, 친화성 크로마토그래피 기기는 제어가능한 펌프, 튜브 및 선택적으로, UV 검출기(또는 예를 들어, 광 산란 검출기 또는 굴절률 검출기) 및 분획 수집기와 같은 상업적 크로마토그래피 시스템에서 일반적으로 발견되는 요소들을 포함한다.

친화성 크로마토그래피 기기는 실험실 규모로 사용하거나 원하는 목적 분자의 자동화된 대용량의 분리 및/또는 정제를 위해 구성될 수 있다. 예를 들어, 그러한 자동화된 대용량 공정은 재조합으로 생산된 생물학적 약물 후보 또는 치료 단백질의 분리와 특히 관련이 있다. 또한, 연구 또는 생의학 적용을 위한 생체분자, 특히 단백질, 핵산, 탄수화물 및 살아있는 세포의 분리가 예상된다.

본 명세서에서 제공된 친화성 크로마토그래피 기기의 광원은 원하는 파장(들)의 광으로 광-전환성 폴리펩타이드를 조사할 수 있게 한다. 예를 들어, 광원은 하나, 둘 이상의 발광 다이오드(들), LED, 형광 튜브(들) 및/또는 레이저(들)을 포함하거나 이로 구성될 수 있다. 광원에 의해 방출되는 광의 파장은 전자적으로 제어될 수 있다. 본 발명의 친화성 크로마토그래피 기기의 맥락에서 광원에 의해 방출되는 광의 파장(들)은 전환가능한 것으로 예상된다. 예를 들어, 파장(들)은 동일하거나 제2 세트의 LED, 형광 튜브(들) 및/또는 레이저(들)에 의해 쉽게 변화될 수 있다.

본 발명의 일 양태는 본 명세서에서 제공된 친화성 크로마토그래피 기기에 관한 것으로, 하나, 둘 이상의 광원(들)에 의해 방출되는 광의 파장(들)은 가시광선(약 400 내지 530 nm, 예를 들어, 400 내지 500 nm, 바람직하게는 405 내지 470 nm, 보다 바람직하게는 410 내지 450 nm 및 가장 바람직하게는 약 430 nm)에서 자외선(300 내지 390 nm, 바람직하게는 310 내지 370 nm, 보다 바람직하게는 320 내지 350 nm 및 가장 바람직하게는 약 330 nm; 또는 대안으로 약 365 nm)까지 및 그 반대의 경우에도 전환 가능하다.

본 발명에 따른 친화성 크로마토그래피 절차는 예를 들어 다음과 같이 수행될 수 있다. 먼저, 컬럼을 자외선 조사(예를 들어, 300 내지 390 nm, 예컨대 약 365 nm) 하에서 한 번(선택적으로, 이전 적용으로부터 남아있는 결합된 리간드를 용출하기 위해) 및 가시광선(예를 들어, 트랜스 배열을 유발하기 위해 400 내지 500 nm 또는 >500 nm 또는 일광)으로 조사 하에서 한 번 러닝 완충액, 예를 들어, PBS 또는 TBS(100 mM Tris-HCl pH 8.0, 100 mM NaCl)로 평형화시킬 수 있다. 이어서, 목적 분자를 포함하는 액체상(예를 들어, 세포 추출물 또는 배양 상등액)을 컬럼에 적용하고 컬럼은 러닝 완충액으로 세척할 수 있다. 샘플(즉, 액체상) 적용 및 세척 단계는 바람직하게는 가시광선(예를 들어, 400 내지 500 nm 또는 >500 nm 또는 일광) 조사 하에서 수행된다. 결합된 목적 분자의 용출은 바람직하게는 자외선(시스 배열을 유발하기 위해, 예를 들어, 300 내지 390 nm, 예컨대 약 365 nm)으로 조사하여 유발된다. 이를 위해, 완충액 흐름을 자외선 조사 동안 특정 시간 시기(예를 들어, 0 내지 60분) 동안 멈출 수 있으며, 이어서 목적 분자를 러닝 완충액으로 용출시킬 수 있다. 또는, 목적 분자는 연속적으로 자외선을 조사하면서 러닝 완충액으로 용출될 수 있다.

본 발명의 다른 양태에서, 친화성 크로마토그래피 절차는 다음과 같이 수행될 수 있다. 먼저, 컬럼을 가시광선(예를 들어, 400 내지 500 nm 또는 >500 nm 또는 일광)으로 조사 하에서 한 번(선택적으로, 이전 적용으로부터 남아있는 결합된 리간드를 용출하기 위해) 및 자외선 조사(시스 배열을 유발하기 위해 예를 들어, 300 내지 390 nm, 예컨대 약 365 nm) 하에서 한 번 러닝 완충액, 예를 들어, PBS 또는 TBS로 평형화시킬 수 있다. 이어서, 목적 분자를 포함하는 액체상(예를 들어, 세포 추출물 또는 배양 상등액)을 컬럼에 적용하고 컬럼은 러닝 완충액으로 세척할 수 있다. 샘플(즉, 액체상) 적용 및 세척 단계는 자외선(예를 들어, 300 내지 390 nm, 예컨대 약 365 nm)으로 조사 하에서 수행된다. 결합된 목적 분자의 용출은 바람직하게는 가시광선(트랜스 배열을 유발하기 위해, 예를 들어, 400 내지 500 nm 또는 >500 nm 또는 일광)으로 조사하여 유발될 수 있다. 이를 위해, 완충액 흐름을 가시광선 조사 동안 특정 시간 시기(예를 들어, 0 내지 60분) 동안 멈출 수 있으며; 이어서 목적 분자를 러닝 완충액(가시광선 하에서 또는 어두운 상태에서)으로 용출시킬 수 있다. 대안으로, 목적 분자는 러닝 완충액으로 용출될 수 있다. 이와 관련하여, 용출은 연속적으로 가시광선을 조사하여 수행하거나; 또는 용출은 가시광선(트랜스 배열을 유발하기 위해) 하에서 시작하고 이어서 어둠 속에서 수행될 수 있다.

본 명세서에서 상기 및 아래 첨부된 실시예에서 기술된 바와 같이, 친화성 크로마토그래피를 위해 본 명세서에서 제공된 광-전환성 폴리펩타이드를 이용함으로써 비용과 시간을 감소시킴과 동시에 분리된 목적 분자의 순도를 증가시키므로 다양한 이점을 수반한다.

그러나, 또한 본 발명의 광-전환성 폴리펩타이드의 다른 적용 분야가 있다. 예를 들어, 광-전환성 폴리펩타이드는 분석 시험, 예를 들어, ELISA에서 또는 광-전환성 폴리펩타이드가 코팅된 (파라)자성 비드 또는 플라스틱 입자와 연계하여 사용될 수 있다. 또한, 본 발명의 광-전환성 폴리펩타이드는 목적 화합물(예를 들어, 새롭게 설계된 약물)의 이의 타겟(또는 그 역으로)에 대한 결합 특성들을 시험하기 위해 표면 플라즈몬 공명(SPR)에서 사용될 수 있다. 그러므로, 광-전환성 폴리펩타이드(예를 들어, 매트릭스 내)를 포함하는 SPR 칩이 사용될 수 있다. 그러한 SPR 칩은 몇 번 사용될 수 있고, 목적 화합물 및/또는 타겟의 탈착을 위해 자외선을 이용할 때 짧은 재생 시간을 갖는다.

모든 과학 및 특허 문헌을 포함하여 본 명세서에서 인용된 모든 간행물은 그들의 전문이 참조로 포함된다.

본 발명은 다음의 비-제한적인 도면 및 실시예를 참조하여 추가로 기술된다.

도면은 다음과 같다:
도 1: 단백질 정제를 위한 광-제어된 친화성 크로마토그래피의 원리.
친화성 컬럼은 광-전환성 결합 단백질(친화성 분자)가 고정된 크로마토그래피 매트릭스를 포함한다. 단백질 용액(예를 들어, 세포 추출물)을 컬럼에 적용하고, 목적 단백질(예를 들어, Strep-tag II와 같은 친화성 태그를 보유한)이 친화성 매트릭스에 결합하면, 오염된 단백질 및 생체분자(아마도 숙주 세포 및/또는 임의의 종류의 완충액 성분들을 포함하는)를 세척한다. 365 nm에서 약한 자외선을 조사함으로써, 친화성 매트릭스 내 결합 단백질의 형태가 목적 단백질 및/또는 친화성 태그에 대한 결합 활성을 상실하는 방식으로 변경되므로, 즉각적인 용출(일정한 완충액 흐름 하에서)에 영향을 미친다. 이후에 컬럼을 재사용하기 위해, >530 nm의 녹색광을 적용하여 친화성 매트릭스를 기저 상태로 이완시킨다.
도 2: 아조-벤젠에 기반한 광-전환성 비-천연 아미노산 4'-카르복시페닐아조페닐알라닌, 별칭 4-[(4-카르복시페닐)아조]-l-페닐알라닌(4-[(4-carboxyphenyl)azo]-l-phenylalanine)의 합성.
(A) Boc- 또는 Fmoc-보호된 중간체에 의한 4-[(4-카르복시페닐)아조]-l-페닐알라닌(Caf; 7)의 제조, 또한 다른 파장의 광에 의해 유발되는 트랜스에서 시스 배열로의 가역적 이성질체화를 설명한다. (B) D₂O에서 4-[(4-카르복시페닐)아조]-l-페닐알라닌(7)의 ¹H-NMR 스펙트럼. (C) D₂O에서 4-[(4-카르복시페닐)아조]-l-페닐알라닌(7)의 ¹³C-NMR 스펙트럼.
도 3: 아조-벤젠에 기반한 광-전환성 비-천연 아미노산 3'-카르복시페닐아조페닐알라닌, 별칭 4-[(3-카르복시페닐)아조]-l-페닐알라닌(4-[(3-carboxyphenyl)azo]-l-phenylalanine)의 합성.
(A) 4-[(3-카르복시페닐)아조]-l-페닐알라닌(11)의 제조, 또한, 다른 파장의 광에 의해 유발된 트랜스에서 시스 배열로의 가역적 이성질체화를 설명한다. (B) D₂O에서 4-[(3-카르복시페닐)아조]-l-페닐알라닌(11)의 ¹H-NMR 스펙트럼. (C) D₂O에서 4-[(3-카르복시페닐)아조]-l-페닐알라닌의 ¹³C-NMR 스펙트럼.
도 4: 365 nm(UV) 대 530 nm(녹색) LED 광-조사 사이클이 교대로 있는 Caf의 가역적 광-전환(이성질체화)
(A) 물에서 비-천연 아미노산 Caf의 UV 스펙트럼(실선: 트랜스 이성질체; 점선: 시스 이성질체). (B) 3 사이클에 걸쳐 대략 340 nm(전이 π→π*)의 흡광도에서 변화에 의해 가시적으로 보이는 트랜스 및 시스 배열 간의 가역적 광-전환. 335 nm에서 높은 흡광도는 Caf의 트랜스 배열을 나타내고 335 nm에서 낮은 흡광도는 시스 배열을 나타낸다. 패널 (A) 참조. (C-D) 7의 HPLC 크로마토그램, 자외선 조사 전(C), 조사 후(D) 및 녹색광 조사 후(E) λ=286 nm에서 흡광도. 패널 (C)의 크로마토그램은 본질적으로 순수 트랜스 이성질체를 나타내고; 패널 (D)의 크로마토그래핌은 소수 종으로서 트랜스 이성질체가 있고 대부분 시스 이성질체를 나타내며; 패널 (E)의 크로마토그램은 소수 종으로 시스 이성질체가 있고, 대부분 트랜스 이성질체를 나타낸다.
도 5: SAm1^Caf 변이체들의 구조 및 서열 개요.
(A) 스트렙타비딘 돌연변이체 1(SAm1, Strep-Tactin) 및 잔기 V44, W108 및 W120이 강조된 Strep-tag II(PDB entry 1KL3) 간 복합체의 결정 구조. Caf로 치환된 모든 위치는 비-천연 아미노산 Caf의 시스 배열에서 Strep-tag II의 결합을 방해하지만(친화성 감소) 이의 (트랜스) 기저 상태에서의 결합을 보존하는 그들의 잠재력에 대해 조사되었다. 광-반응성 요소로서 Caf의 도입에 대해 조사된 이들 위치 중 V44 및 W120은 덜 바람직하다. (B) Caf 통합을 위한 위치를 갖는 SAm1의 핵산 및 아미노산 서열(앰버 종결 코돈의 번역/억제에서)이 강조되어 있다.
도 6: SAm1^Caf108의 발현, 정제 및 리폴딩.
(A) pSBX8.CafRS#30d53(SEQ ID NO: 55)의 플라스미드 지도. (B) 108번 위치에서 Caf를 보유한 재조합 코어 스트렙타비딘 돌연변이체 SAm1의 정제 및 리폴딩. 쿠마시 브릴리안트 블루로 염색된 SDS-PAGE(15%) 젤은 재조합 단백질의 제조 동안 시기별로 얻은 샘플로 도시된다. 레인: 1, 유전자 발현 유도 전 대장균(E. coli)의 총 단백질; 2, 유도 후 12시간 시점에서 총 세포 단백질; 3, 봉입체의 복원 및 CEX 정제 후 단백질 용액; 4, 3과 같지만 SDS-PAGE 전에 열 처리 없는 샘플. 이들 조건 하에서, 코어 스트렙타비딘 테트라머는 손상되지 않은채 남아있다(Bayer et al. 1990 Methods Enzymol. 184: 80-89). 따라서, 최종 제제에서 재조합 돌연변이체 스트렙타비딘의 올바르게 접힌 상태가 확인되는 반면, 소량의 단량체(비-기능적일 수 있는) 스트렙타비딘은 리폴딩 후 여전히 존재하였다(레인 4). 레인 5는 레인 4와 같으나 농도가 더 낮은 샘플을 보여준다.
도 7: ELISA에서 PhoA/Strep-tag II 융합 단백질의 광-전환성 폴리펩타이드로 변형된 스트렙타비딘 돌연변이체/변이체에 대한 가역적 결합.
(A) 자외선에 반응하여 Strep-tag II 펩타이드에 대해 가역적 결합 활성을 갖는 스트렙타비딘 돌연변이체를 스크리닝하기 위한 ELISA 설정. (B) SAm1 및 이의 변이체 Caf44, Caf108, Caf120로부터 정제된 PhoA/Strep-tag II의 광-유도된 탈착에 대한 스크리닝. 모든 시험된 스트렙타비딘 돌연변이체는 PhoA/Strep-tag II 융합 단백질에 대해 좋은 친화성을 보여 가시광선으로 조명된 그들 샘플에 대해 SAm1으로 얻은 것에 필적할만한 신호를 발생시켰다. 대조적으로, 남아있는 효소 활성의 명백한 감소가 스트렙타비딘 변이체 SAm1^Caf108에 대해 365 nm에서 자외선으로 조사한 후 관찰되었다. 이는 시스 배열로의 Caf의 광-유도된 전환 시 Strep-tag II를 보유한 PhoA에 대한 스트렙타비딘 변이체 SAm1^Caf108의 감소된 친화성을 의미한다.
도 8: 기능화된 친화성 매트릭스로부터 PhoA/Strep-tag II의 광-유도된 탈착.
(A) 고정된 SAm1^Caf108과 함께 20 ㎕ 세파로스를 포함하는 크로마토그래피 컬럼에 대해 관찰된 흐름(flow) 프로파일. 녹색 LED 광(530 nm) 또는 약한 자외선(365 nm) 조사를 지시된 바와 같이 수행하였다. (B) SAm1^Caf108 컬럼에서 수집된 각 분획(10㎕) 샘플을 SDS-PAGE에 의해 분석하였다. 레인: M, 표준 분자 크기; L, 로딩된 샘플; FT(flow-through), 통과; W, 세척; E1-E3, 용출 분획. (C) SAm1 컬럼으로부터의 샘플의 15% SDS-PAGE. (D) PhoA 효소 분석에 의해 수집된 분획(로딩된 샘플, 통과, 세척, 용출 1-3)에서 PhoA/Strep-tag II 융합 단백질의 정량. 변형되지 않은 스트렙타비딘 뮤테인(SAm1)과는 대조적으로, SAm1^Caf108를 포함하는 친화성 컬럼은 결합된 PhoA/Strep-tag II 융합 단백질의 광-의존성 용출을 나타낸다.
도 9: ProtL^Caf 변이체의 구조 및 서열 개요
(A) 트라스투주맙 Fab 단편과, Caf337 그리고 막대로 보여주는 돌연변이된 잔기 Asn361 및 Ser365(UniProt accession code Q51918; 이는 PDB entry 4HKZ에서 29, 53 및 57번 위치에 상응한다)을 갖는 단백질 L의 B1 도메인 간의 복합체의 결정 구조. 337번 위치는 광-반응성 비-천연 아미노산의 시스 또는 트랜스 배열에 따라 면역글로불린에 대해 상이한 친화성을 달성하는 것을 목표로 하여 Caf로의 치환에 적당한다. (B) Caf 통합(앰버 종결 코돈의 번역/억제에서)을 위한 337번 위치를 갖는 ProtL^Caf-ABD 융합 단백질의 핵산 및 아미노산 서열이 강조되어 있다. 메티오틴(밑줄로 표시)을 SEQ ID NO: 20과 비교하여 개시 코돈으로 추가하였다.
도 10: ProtL^Caf337-ABD 융합 단백질의 발현 및 정제
쿠마시 브릴리안트 블루로 염색된 SDS-PAGE(15%) 젤은 재조합 단백질의 제조 동안 시기별로 얻은 샘플을 보여준다. 레인: 1, 유전자 발현 유도 전 대장균(E. coli)의 총 단백질; 2, 유도 후 12시간 시점의 총 세포 단백질; 3, 전체 세포 추출물의 불용성 분획; 4, 전체 세포 추출물의 용해성 상등액; 5, HSA 친화성 크로마토그래피로부터의 용출 분획; 6, CEX 정제 후 ProtL^Caf ³³⁷ -ABD.
도 11: ELISA에서 면역글로불린의 광-전환성 아미노산으로 변형된 ProtL^Caf-ABD 융합 단백질에 대한 가역적 결합.
(A) 자외선에 반응하여 면역글로불린에 대해 가역적 결합 활성을 갖는 ProtL^Caf 변이체의 스크리닝을 위한 개략적인 ELISA 셋업. (B) 단백질 L 도메인 B1 및 이의 변이체 Caf337(둘 다 ABD와 융합되어 있으며, HSA-코팅된 마이크로타이터 플레이트에 흡착됨)로부터 알칼라인 포스파타아제(AP)와 컨쥬게이트된 마우스 항-6xHis 항체(면역글로불린)의 광-유도된 탈착을 위한 예시적인 분석. 이의 기저 상태에서, 시험된 Caf337 변이체는 변형되지 않은 단백질 L 도메인(왼쪽, 속이 비어있는 원)에 대해 관찰된 것 보다 신호가 낮더라도 IgG(오른쪽, 속이 비어있는 원)에 대해 높은 친화성을 보였다. 대조적으로, 365 nm에서 자외선을 조사한 후 ProtL^Caf337 변이체에 대해서만 결합된 Ig-AP 컨쥬게이트의 남아있는 활성에서의 명백한 감소가 관찰되어(속이 채워진 원), Caf의 시스 이성질체의 광-유도된 형성은 광-전환성 단백질 L 도메인 및 면역글로불린(Ig) 간의 특이적인 해리를 유도함을 나타낸다.
오차 막대는 3회 측정의 표준편차를 나타낸다. 이의 기저 상태에서 ProtL^Caf337에 대한 ELISA 데이터의 곡선 피트(Voss & Skerra 1997 Protein Eng 10:975-82)는 항-6xHis 항체와 복합체에 대해 약 140 nM의 해리 상수를 나타내며 이는 높은 친화성에 해당한다. 자외선 조사 후 신호 강도는 해리 상수를 추론하기에는 너무 낮았으며, 이는 광-전환성 폴리펩타이드의 친화성에서의 강한 손실을 나타낸다(따라서, 이들 데이터는 직선으로 맞춰졌다).

실시예는 본 발명을 예시한다.

실시예 1: 4-[(4-카르복시페닐)아조]-l-페닐알라닌(Caf)의 합성

4-[(4-카르복시페닐)아조]-l-페닐알라닌(Caf; 7)(본 명세서에서 4'-카르복시페닐아조페닐알라틴으로도 불림)의 제조는 이미 보고되어 있다(Nakayama et al. 2005 Bioconjug. Chem. 16: 1360-1366). 그러나, 여기에 도 2A에 도시된 Caf의 합성을 위한 훨씬 편리한 프로토콜이 제공된다. 시판되는 Fmoc- 또는 Boc-보호된 4-아미노-l-페닐알라닌(3 및 4)을 옥손으로 산화시켜(2 KHSO₅ + KHSO₄ + K₂SO₄) 4-아미노벤조산(1)으로부터 제조된 4-니트로소벤조산(2)과 반응시켰다. 생성된 디아조 중간체 5는 피페리딘으로 탈보호되는 반면, 다른 중간체 6은 디옥산 중의 HCl로 탈보호되며, 두 경우에서 원하는 아미노산 7을 생성하였다.

단계 1: 4-니트로소벤조산(2)의 합성

화합물 2는 공개된 절차에 따라 제조하였다(Priewisch & Ruck-Braun 2005 J. Org. Chem. 70: 2350-2352). 4-아미노벤조산(15 g, 109 mmol)을 180 mL의 디클로로메탄에 현탁하였다. 675 mL H₂O 중의 옥손 용액(134.5 g, 219 mmol)을 첨가하고, 혼합물은 실온에서 1.5h 동안 교반하였다. 침전물을 여과하여 버리고, H₂O로 철저히 세척하고, 공기중 및 이어서 P₂O₅에서 건조시켰다. 4-니트로소벤조산(2)은 소량의 4-니트로벤조산을 함유한 황색 고체(16 g, 106 mmol)로 얻었고, 추가의 정제 없이 사용하였다.

¹H NMR (400 MHz, DMSO-d6) δ = 13.50 (s, 1H, COOH), 8.29 - 8.22 (m, 2H, aromat.), 8.05 - 8.00 (m, 2H, aromat.).

¹³C NMR (101 MHz, DMSO) δ = 166.19 (CO), 165.00 (C aromat.), 136.53 (C aromat.), 131.02 (2x C aromat.), 120.62 (2x C aromat.).

분석적 HPLC: Column Purospher RP-8e 250x3 mm (Merck KgaA, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분, 유속 0.6 mL/min; t_R = 14.43 분.

단계 2a: N-Fmoc-4[(4-카르복시페닐)아조]-l-페닐알라닌(5)의 합성

화합물 5는 공개된 절차와 유사하게 제조되었다(Priewisch & Ruck-Braun 2005 J. Org. Chem. 70: 2350-2352). 4-니트로소벤조산(2)(3 g, 19.9 mmol)을 320 mL의 DMSO/AcOH 1:1 (v/v)에서 초음파로 현탁시킨 후, Fmoc-Phe(4-NH₂)-OH(3)(4 g, 9.94 mmol; Iris Biotech, Marktredwitz, Germany)를 첨가하였다. 혼합물을 실온에서 2일 동안 교반하였다. 이어서 700 mL의 H₂O를 첨가하고, 생성된 침전물을 여과하고, H₂O로 세척하고, 공기중 및 이어서 P₂O₅에서 건조하였다. 원하는 산물 5는 갈색 고체로 얻었고, 추가의 정제 없이 사용하였다.

¹H NMR (400 MHz, DMSO-d6) δ = 13.16 (s, 2H, 2x COOH), 8.17 - 8.13 (m, 2H, aromat.), 7.97 - 7.90 (m, 2H, aromat.), 7.88 - 7.81 (m, 5H, aromat., NH), 7.68 - 7.58 (m, 2H, aromat.), 7.56 - 7.48 (m, 2H, aromat.), 7.42 - 7.33 (m, 2H, aromat.), 7.33 - 7.23 (m, 2H, aromat.), 4.30 (ddd, J = 10.6, 8.5, 4.5 Hz, 1H, C^αH), 4.25 - 4.19 (m, 2H, Fmoc-CH₂), 4.19 - 4.12 (m, 1H, Fmoc-CH), 3.23 (dd, J = 13.9, 4.4 Hz, 1H, C^βH), 3.01 (dd, J = 13.8, 10.7 Hz, 1H, C^βH).

¹³C NMR (101 MHz, DMSO) δ = 173.14 (CO), 166.75 (CO), 155.99 (CO), 154.37 (C aromat.), 150.69 (C aromat.), 143.78 (C aromat.), 143.73 (C aromat.), 142.83 (C aromat.), 140.71 (C aromat.), 140.69 (C aromat.), 132.71 (C aromat.), 131.03 (2xC aromat.), 130.66 (2xC aromat.), 130.35 (2xC aromat.), 127.61 (2xC aromat.), 127.05 (2xC aromat.), 122.79 (2xC aromat.), 122.47 (2xC aromat.), 120.09 (2xC aromat.), 65.64 (Fmoc-CH₂), 55.19 (C^α), 46.61 (Fmoc-CH), 36.42 (C^β).

MS 분석: calc. [M-H⁺]^- = 534.16706; found [M-H⁺]^- = 534.15320.

분석 HPLC: Column Purospher RP-8e 250x3 mm (Merck KgaA, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분 이상, 유속 0.6 mL/min; t_R = 21.16 분.

단계 2b: N-Boc-4-[(4-카르복시페닐)아조]-l-페닐알라닌(6)의 합성

화합물 6은 공개된 절차에 따라 제조되었다(Bose et al. 2006 J. Am. Chem. Soc. 128: 388-389). Boc-Phe(4-NH₂)-OH(4)(1 g, 3.6 mmol; Bachem, Bubendorf, Switzerland)를 50 mL의 AcOH에 녹였다. 4-니트로소벤조산(2)(0.8 g, 5.4 mmol)을 첨가한 후, 혼합물을 24h 동안 교반하였다. 감압에서 용매를 제거하고 남아있는 물질은 각각 100 mL의 1 M HCl(aq.) 및 에틸 아세테이트에 녹였다. 수상을 50 mL의 에틸 아세테이트로 4회 추출하였다. 혼합된 유기상은 브린으로 1회 세척하고, MgSO₄에서 건조시켰다. 용매 증발 후 6을 갈색 고체(638 mg, 1.54 mmol, 43%)로 얻었고, 추가의 정제 없이 사용하였다.

¹H NMR (500 MHz, DMSO-d6) δ = 8.14 (d, J = 8.3 Hz, 2H, aromat.), 7.94 (d, J = 8.4 Hz, 2H, aromat.), 7.85 (d, J = 7.9 Hz, 2H, aromat.), 7.49 (d, J = 8.1 Hz, 2H, aromat.), 7.11 (d, J = 8.4 Hz, 1H, NH), 4.22 - 4.13 (m, 1H, C^aH), 3.15 (dd, J = 13.9, 4.6 Hz, 1H, C^βH), 2.95 (dd, J = 13.8, 10.2 Hz, 1H, C^βH), 1.31 (s, 9H, C(CH₃)₃).

분석 HPLC: Column Purospher RP-8e 250x3 mm (Merck KgaA, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분 이상, 유속 0.6 mL/min; t_R = 18.33 분.

단계 3a: 4-[(4-카르복시페닐)아조]-l-페닐알라닌(7)의 합성(Fmoc 절단)

화합물 5(5 g, 9,34 mmol)를 40 mL의 DMF에 녹이고 나서, 10 mL의 피페리딘을 한방울씩 첨가하고 혼합물을 실온에서 30분간 교반하였다. 450 mL의 0.5 M NaHCO₃ (aq.)를 첨가하면 무색의 침전물이 형성되며, 여과에 의해 제거하였다. 여과물에 6 M HCl (aq.)를 첨가하여 pH 1-2로 산성화시켰다. 침전물을 여과하여 버리고, 공기중, 이어서 P₂O₅에서 건조시켰다. 화합물 7은 갈색 고체(2.42 g, 7.72 mmol, 2단계에 걸쳐 98%)로 얻었으며, 추가의 정제 없이 실시예 3 및 6에 기술된 생물리 및 생화학 실험에 사용하였다.

¹H NMR (400 MHz, D₂O) δ = 7.86 - 7.80 (m, 2H, aromat.), 7.59 - 7.53 (m, 2H, aromat.), 7.53 - 7.47 (m, 2H, aromat.), 7.24 - 7.18 (m, 2H, aromat.), 3.42 (dd, J = 7.5, 5.6 Hz, 1H, C^αH), 2.90 (dd, J = 13.5, 5.6 Hz, 1H, C^βH), 2.73 (dd, J = 13.4, 7.6 Hz, 1H, C^βH).

¹³C NMR (101 MHz, D₂O) δ = 181.94 (CO), 174.43 (CO), 153.16 (C aromat.), 150.42 (C aromat.), 142.79 (C aromat.), 138.45 (C aromat.), 130.23 (2xC aromat.), 129.81 (2x C aromat.), 122.55 (2x C aromat.), 121.93 (2x C aromat.), 57.28 (C^α), 40.80 (C^β).

MS 분석: calc.[M-H⁺]^- = 312.09898; found [M-H⁺]^- = 312.09380.

분석 HPLC: Column Purospher RP-8e 250x3 mm (Merck KgaA, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분 이상, 유속 0.6 mL/min; t_R = 10.7 분.

단계 3b: 4-[(4-카르복시페닐)아조]-l-페닐알라닌(7)의 합성(Boc 절단)

화합물 6(638 mg, 1.5 mmol)을 디옥산 중의 약 2 M HCl 20 mL에서 녹이고, 실온에서 밤새도록 교반하였다. 침전물을 여과하여 버리고, 디에틸 에테르로 세척하고, 진공 건조시켰다. 화합물 7은 갈색 고체(236 mg, 0.67 mmol, 44%)로 얻었으며, 추가의 정제 없이 실시예 3 및 6에 기술된 생물리 및 생화학 실험에 사용하였다. 분석 데이터는 단계 3a에 기술된 것들과 일치하였다.

실시예 2: 4-[(3-카르복시페닐)아조]-l-페닐알라닌(11)의 합성

4-[(3-카르복시페닐)아조]-l-페닐알라닌(11)(본 명세서에서 3'-카르복시페닐아조페닐알라닌으로도 불림)은 도 3A에 도시된 바와 같이 3 단계로 합성되었다. Fmoc-보호된 4-아미노페닐알라닌(3)을 옥손으로 산화시켜 3-아미노벤조산(8)로부터 제조된 3-니트로소벤조산(9)과 반응시켰다. 중간체 10은 피페리딘으로 탈보호되어 4-[(3-카르복시페닐)아조]-l-페닐알라닌(11)을 생성하였다.

단계 1: 3-니트로소벤조산(9)의 합성

화합물 9를 공개된 절차에 따라 제조하였다(Priewisch & Ruck-Braun 2005 J. Org. Chem. 70: 2350-2352). 3-아미노벤조산(8)(5 g, 36.5 mmol)을 100 mL의 DCM에서 현탁시켰다. 400 mL H₂O 중의 옥손(44.9 g, 73 mmol) 용액을 첨가한 후, 혼합물은 실온에서 1h 동안 교반하였다. 침전물은 여과하여 버리고, H₂O로 철저하게 세척하고, P₂O₅에서 건조시켰다. 3-니트로소벤조산(9)은 소량의 3-니트로벤조산을 포함하는 갈색 고체(4.1 g, 27 mmol, 76%)로 얻었고, 추가의 정제 없이 사용하였다.

¹H NMR (400 MHz, DMSO-d6) δ = 13.52 (s, 1H, COOH), 8.41 - 8.35 (m, 1H, aromat.), 8.35 - 8.33 (m, 1H, aromat.), 8.19 - 8.11 (m, 1H, aromat.), 7.91 - 7.84 (m, 1H, aromat.).

¹³C NMR (101 MHz, DMSO) δ = 166.08, 165.19, 136.26, 132.45, 130.47, 124.25, 120.98.

분석 HPLC: Column Purospher RP-8e 250x3 mm (Merck KgaA, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분 이상, 유속 0.6 mL/min; t_R = 14.05 분.

단계 2: N-Fmoc-4-[(3-카르복시페닐)아조]-l-페닐알라닌(10)의 합성

화합물 10은 공개된 절차와 유사하게 제조되었다(Priewisch & Ruck-Braun 2005 J. Org. Chem. 70: 2350-2352). 3-니트로소벤조산(9)(378 mg, 2.5 mmol)을 40 mL DMSO/AcOH 1:1에서 초음파로 현탁하고 나서 Fmoc-Phe(4-NH₂)-OH (3)(500 mg, 1.24 mmol)를 첨가하였다. 혼합물을 실온에서 2일 동안 교반하고 나서, 200 mL의 H₂O를 첨가하였다. 생성된 침전물을 여과하고, H₂O로 세척하고, P₂O₅에서 건조시켰다. Fmoc-보호된 아미노산 10은 갈색 고체로 얻었고 추가의 정제 없이 사용하였다.

¹H NMR (400 MHz, DMSO-d6) δ = 13.15 (s, 2H, 2x COOH), 8.38 - 8.33 (m, 1H, aromat.), 8.11 (dd, J = 7.8, 1.8 Hz, 2H, aromat.), 7.93 - 7.79 (m, 5H, aromat., NH), 7.77 - 7.69 (m, 1H, aromat.), 7.63 (t, 2H, aromat.), 7.54 - 7.48 (m, 2H, aromat.), 7.43 - 7.33 (m, 2H, aromat.), 7.33 - 7.22 (m, 2H, aromat.), 4.28 (ddd, J = 10.8, 8.5, 4.5 Hz, 1H, C^αH), 4.24 - 4.10 (m, 3H, Fmoc-CH, CH₂), 3.26 - 3.17 (m, 1H, C^βH), 3.00 (dd, J = 13.8, 10.7 Hz, 1H, C^βH).

¹³C NMR (101 MHz, DMSO) δ = 173.11 (CO), 166.72 (CO), 155.96 (C aromat.), 151.94 (CO), 150.55 (C aromat.), 143.77 (2x C aromat.), 143.71 (2x C aromat.), 142.51 (C aromat.), 140.67 (C aromat.), 136.26 (C aromat.), 132.15 (C aromat.), 130.48 (C aromat.), 130.30 (2x C aromat.), 129.95 (C aromat.), 127.59 (C aromat.), 127.04 (2x C aromat.), 125.23 (C aromat.), 125.18 (C aromat.), 122.67 (2x C aromat.), 122.22 (C aromat.), 120.08 (2x C aromat.), 65.62 (Fmoc-CH2), 55.18 (Fmoc-CH), 46.57 (C^α), 36.36 (C^β).

MS 분석: calc. [M-H⁺]^- = 534.16706; found [M-H⁺]^- = 534.15493.

분석 HPLC: Column Purospher RP-8e 250x3 mm (Merck KgaA, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분 이상, 유속 0.6 mL/min; t_R = 21.6 분.

단계 3: 4-[(3-카르복시페닐)아조]-l-페닐알라닌(11)의 합성

Fmoc-보호된 아미노산 10(650 mg, 1.21 mmol)을 12 mL의 DMF에 녹였다. 3 mL의 피페리딘을 한방울씩 첨가한 후, 혼합물을 실온에서 30분 동안 교반하였다. 5 mL 0.5 M NaOH를 첨가하여 무색의 침전물이 형성되고, 여과를 통해 제거하였다. 여과물은 6 M HCl (aq.)를 사용하여 pH 1-2로 산성화하였다. 생성된 침전물은 여과하여 제거하고 공기중에 이어서 P₂O₅에서 건조시켰다. 아미노산 11은 갈색 고체(361 mg, 1.15 mmol, 2 단계에 걸쳐 83%)로 얻었고, 추가의 정제 없이 실시예 3에 기술된 생물리 실험에 사용하였다.

¹H NMR (400 MHz, D₂O) δ = 8.14 - 8.08 (m, 1H, aromat.), 7.94 - 7.89 (m, 1H, aromat.), 7.76 - 7.70 (m, 1H, aromat.), 7.67 - 7.60 (m, 2H, aromat.), 7.55 - 7.47 (m, 1H, aromat.), 7.34 - 7.27 (m, 2H, aromat.), 3.48 (dd, J = 7.4, 5.6 Hz, 1H, C^αH), 2.97 (dd, J = 13.5, 5.6 Hz, 1H, C^βH₂), 2.81 (dd, J = 13.5, 7.5 Hz, 1H, C^βH₂).

¹³C NMR (101 MHz, D₂O) δ = 182.01 (CO), 174.34 (CO), 151.76 (C aromat.), 150.50 (C aromat.), 142.60 (C aromat.), 137.59 (C aromat.), 131.49 (C aromat.), 130.28 (2x C aromat.), 129.26 (C aromat.), 123.84 (C aromat.), 123.29 (C aromat.), 122.52 (2x C aromat.), 57.32 (C^α), 40.78 (C^β).

MS 분석: calc. [M-H⁺]^- = 312.09898; found [M-H⁺]^- = 312.09760.

분석 HPLC: Column Purospher RP-8e 250x3 mm (Merck, Darmstadt, Germany), 물+0.1% TFA 중의 10-100% ACN 구배, 30분 이상, 유속 0.6 mL/min; t_R = 11.3 분.

실시예 3: 4-[(4-카르복시페닐)아조]-l-페닐알라닌(Caf)의 광-유도된 이성질체화

분광법에 의한 분석

아조벤젠의 UV-VIS 흡수 스펙트럼은 π→π* 및 n→π* 전자 전이에 해당하는 두 가지 특징적인 흡수 밴드를 나타내며, 이들은 트랜스 및 시스 배열에 대한 흡수 최대(λ)의 진폭 및 정확한 위치가 다르다. 전자 전이 π→π*는 보통 340 nm 부근의 근자외선 영역에 있는 반면(Sension et al. 1993 J. Chem. Phys. 98: 6291-6315), 전자 전이 n→π*는 보통 420 nm 부근의 가시광선(VIS) 영역에 위치하며, 이는 질소 원자의 비공유 전자쌍이 존재하기 때문이다(Naegele et al. 1997 Chem. Phys. Lett. 272: 489-495). 합성된 비-천연 아미노산 Caf(7)가 자외선에 의해 유도된 광전환에 반응할 수 있는 지를 시험하기 위해, 교대 조사 사이클을 화합물에 적용하였다. 전형적인 실험에서, 0.5 mL의 30 μM 수용액을 1 cm 광학 경로를 갖는 쿼츠 큐벳에 넣었다. 이어서, 353 nm의 UV LED(NS355L-5RLO; Nitride Semiconductors, Tokushima, Japan) 및 520 nm 방출 파장을 갖는 녹색 LED(LL-504PGC2E-G5-2CC; Lucky Light Electronics, Hongkong, China)를 이용하여 위에서 샘플에 30분 동안 조사하였다. 트랜스/시스 이성질체화에 해당하는 340 nm 부근에서 π→π* 밴드의 강도 변화는 컴퓨터 제어 광도계(Ultrospec 2100 pro, Amersham Biosciences)로 모니터링하였다(도 4A). 더 자세한 실험 결과 3 사이클에 걸쳐 약 340 nm에서의 흡광도에서 재현가능한 변화를 나타내며, 아조 화합물의 트랜스(340 nm에서 높은 흡광도) 및 시스(340 nm에서 낮은 흡광도) 배열 간의 가역적 광전환과 일치한다(도 4B).

HPLC에 의한 분석

물 중의 60 μM Caf (7) 용액 500 ㎕를 1.5 mL HPLC 바이알(Screw neck vial N9, amber glass, 11.6x32 mm; Macherey Nagel, Duren, Germany)에 넣고, UV LED (λ=353 nm, NS355L-5RLO; Nitride Semiconductors, Tokushima, Japan)로 30분 동안 직접 상단에서 조사하였다. 조사 전 및 후에, 20 ㎕의 용액 샘플을 회수하고 10분에 걸쳐 50 mM NH₄OAc 완충액 pH 8에서 10-12% 아세토나이트릴(ACN)의 농도 구배(유속 0.6 mL/min)를 적용하면서 Purospher RP-8e 250x3 mm 컬럼(Merck)에서 HPLC로 분석하였다. 다른 샘플은 녹색 LED 광(λ=520 nm, LL-504PGC2E-G5-2CC, Lucky Light Electronics, Hongkong, China)을 조사한 후 같은 방식으로 분석하였다. 도 4는 λ=286 nm(트랜스-(7) 및 시스-(7)은 동일한 몰 흡광 계수를 보여주어 피크 적분의 직접 비교가 가능한 파장)에서 흡광도를 갖는 해당 크로마토그램을 도시한다. 크로마토그램은 (7)의 시스 및 트랜스 이성질체가 HPLC(시스-(7) t_R = 3.6 분, 트랜스-(7) t_R = 4.6 분)에서 분리될 수 있음을 나타낸다. 기저 상태에서 조사하기 전에, 에너지적으로 우호적인 트랜스-(7)만 발생한다(도 4C). 자외선(365 nm) 조사는 시스-(7)의 생산을 86%까지 증가시키며(도 4D), 녹색광(λ=520 nm)으로 조사하여 반전시킬 수 있으므로, 광화학적 재이성질체화에 의해 기저 상태를 회복한다. 그러나, 또한 HPLC 분석 동안 시스-(7)의 트랜스-(7)로의 재이성질체화가 일어나므로 자외선 조사 후 시스-(7)의 비율은 실제로 HPLC 크로마토그램에 의해 표시된 것 보다 높을 수 있음을 고려해야 한다. 따라서, 본 발명의 광-전환성 폴리펩타이드가 친화성 크로마토그래피 절차에 적용되고, 트랜스 배열은 높은 친화성 상태에 해당하나 시스 배열은 낮은 친화성 형태에 해당하는 경우, 목적 분자의 최고 결합도 및 최고 용출도는 각각 430 nm 및 330 nm에서 일어난다. 그러나, 종래의 광원은 보통 530 nm(가시광선) 및 365 nm(자외선) 부근의 파장을 갖는 광을 제공한다. 따라서, 또한 이들 파장(즉, 530 nm 부근 및/또는 365 nm 부근)을 제공하는 광이 본 발명에 따라 사용될 수 있다.

실시예 4: 4-[(4-카르복시페닐)아조]-l-페닐알라닌(Caf)에 특이적인 PylRS 변이체의 선별

4-[(4-카르복시페닐)아조]-l-페닐알라닌(Caf)와 같은 광-전환성 비-천연 아미노산을 함유하는 단백질의 생합성은 생물리학, 구조 또는 생화학적 연구 그리고 생명공학 및 바이오의약품 적용을 위한 신규한 광-제어성 생체분자 시약에 대한 길을 열어준다. 대장균(E. coli)에서 생산된 재조합 단백질에서 Caf의 공동-번역 부위-특이적인 통합을 위한 서프레서 tRNA 및 아미노-아실 tRNA 합성효소(aaRS)의 직교쌍을 개발하기 위해, 메탄생성 고세균 메타노사르시나 바르케리(Methanosarcina barkeri (Mb))의 피롤라이실-tRNA 합성효소(PylRS)(James et al. 2001 J. Biol. Chem. 276: 34252-34258) 및 앰버 종결 코돈을 특이적으로 인식 및 억제하는 이의 동족체 tRNA^Pyl(Fekner & Chan 2011 Curr. Opin. Chem. Biol. 15:387-91)를 사용하였다.

비-천연 아미노산 기질 Caf에 특이적인 돌연변이체 aaRS를 선별하기 위해, aaRS 및 동족체 tRNA 둘 다를 암호화하는 이전에 기술된 원-플라스미드 시스템(one-plasmid system)(Kuhn et al. 2010 J. Mol. Biol. 404: 70-87)을 PylRS에 적용하였다. 변형된 플라스미드 pSBX8.101d58 (SEQ ID NO: 23)는 Mb에서 유래한 PylRS 및 그 동족체 서프레서 tRNA^Pyl를 암호화한다(도 5A). 동일한 플라스미드 상에 클로닝된 고도로 활성적인 aaRS 변이체(Cam 내성을 부여함)를 선별하기 위해 제공된 앰버 종결 코돈(cat^UAG112; SEQ ID NO: 24)이 장착된 클로람페니콜-내성 리포터 유전자 및 다른 앰버 종결 코돈(eGFP^UAG39; SEQ ID NO: 25)이 장착된 형광 리포터 유전자를 형광-활성화 세포 소팅(FACS)과 함께 접목하여 원하는 아미노산 특이성을 나타내는 변이체를 선별하는데 사용하였다. 외래 아미노산의 존재 또는 부재 시 각각 Cam이 보충된 LB 아가 플레이트상에서 사멸/생존 선별과 함께 양성 및 음성 FACS의 교대 사이클을 적용하여, Caf 통합에 대해 높은 특이성을 갖는 돌연변이된 aaRS(CafRS로 불림)를 선별하였다.

돌연변이 Tyr349F는 비-천연 아미노산에 대해 Mb PylRS의 인 비보 억제 활성을 증가시키는 것으로 기술되어 있고(Yanagisawa et al. 2008 Chem. Biol. 15: 1187-1197), 따라서, 이 위치는 모든 라이브러리에서 Phe에 고정되었다. 돌연변이는 적당한 PCR 프라이머 한쌍(SEQ ID NO: 27 및 28)과 함께 QuikChange 부위-지정 돌연변이유발 키트(Agilent, Waldbronn, Germany)를 사용하여 PylRS 야생형 유전자(SEQ ID NO: 26)에 도입되어 변이체 PylRS#1(SEQ ID NO: 29)를 생성하였다.

비-천연 아미노산 Caf에 특이적인 돌연변이체 합성효소를 진화시키기 위해, PylRS#1에 기초한 제1 합성효소 라이브러리(CafRS#0-R5)를 2-단계 어셈블리 PCR 접근법으로 NNS 축퇴 프라이머를 이용하여 활성 부위에서 5개의 위치(M309, Asn311, Cys313, Met315 및 Trp382)를 완전히 무작위화하여 생성하였다. 주형으로 PylRS#1 유전자(SEQ ID NO: 29)를 사용하고 Q5 DNA 중합효소 PCR 키트(New England Biolabs, Ipswich, MA, USA)를 사용하여 부위-지정 포화 돌연변이유발을 수행하였다. 먼저, 각각 한쌍의 정방향 및 역방향 프라이머(정방향 프라이머 1: SEQ ID NO: 30; 정방향 프라이머 2: SEQ ID NO: 31; 역방향 프라이머 1: SEQ ID NO: 32; 역방향 프라이머 2: SEQ ID NO: 33)를 이용하여 2개의 중첩 PCR 단편을 제조하였다. 모든 프라이머는 MWG Eurofins(Ebersberg, Germany)에 의해 공급되었다.

2개의 무작위화 반응을 1x Q5 완충액, 200 μM의 각 dNTP 및 0.5 U Q5 DNA 중합효소를 포함하는 50 ㎕의 반응 혼합물로 동일한 조건 하에서 수행하였다. 혼합물을 98℃에서 10초 동안 변성시키고, 64℃에서 30초 동안 어닐링시키며, 이어서 72℃에서 30초 동안 선형 중합효소 반응을 수행하였다. 35 사이클 후, DpnI을 이용한 효소적 분해를 37℃에서 2h 동안 수행하여 박테리아 주형을 제거하였다. 증폭된 DNA 단편 둘 다를 젤 추출 키트(Qiagen, Hilden, Germany)를 이용한 아가로스 젤 정제에 의해 정제하고, 2차 PCR 반응에서 조립하였다. 이를 위해, 200 ng의 두 단편을 1x Q5 완충액, 200 μM의 각 dNTP 및 0.5 U Q5 DNA 중합효소를 포함하는 50㎕의 Q5 DNA 중합효소 반응 혼합물에서 혼합하였다. 혼합물을 98℃에서 10초 동안 변성시키고, 64℃에서 30초 동안 어닐링시키며, 이어서 72℃에서 30초 동안 선형 중합효소 반응을 수행하였다. 10 사이클 후, 플랭킹 프라이머(SEQ ID NOs: 30 및 34)를 첨가하고, 이어서 98℃에서 10초, 64℃에서 30초 및 72℃에서 30초의 30 써모사이클과 함께 72℃에서 5분 동안 마지막 인큐베이션을 하였다.

Qiagen 젤 추출 키트를 이용한 PCR 산물의 아가로스 젤 정제 후, 상기 기술된 써모사이클을 적용하여 프라이머 SEQ ID NOs: 30 및 34를 이용한 100 ㎕의 Q5 DNA 중합효소 반응 혼합물에서 재-증폭을 수행하였다. 선행 어셈블리 단계에서 사용된 플랭킹 프라이머(SEQ ID NOs: 30 및 34)에서 한쌍의 상호호환되지 않는 유형 IIS 제한 부위(BsaI)는 중앙 코딩 영역의 pSBX8.101d58(SEQ ID NO: 23)로의 일방향 삽입을 가능케 하였다. Qiagen PCR 정제 키트 적용 후, 타겟 영역에서 무작위 돌연변이를 갖는 최종 DNA 단편을 BsaI으로 이중절단하고, 다시 Qiagen PCR 정제 키트를 사용하여 정제하고, 플라스미드 pSBX8.101d58에 클로닝하였다. 일렉트로컴피턴트 대장균(E. coli) NEB10beta 세포(New England Biolabs)의 형질전환(Dower et al. 1988 Nucleic Acids Res. 16: 6127-6145)을 통해 3×10⁹ 형질전환체의 라이브러리(샘플 분획의 콜로니 수에 따라)를 산출하였고, 100 mg/L의 앰피실린이 보충된 10 제곱 LB 아가 플레이트(114 cm²)에 플레이팅하였다.

콜로니를 플레이트로부터 긁어내고, 각 5 mL의 LB 배지에서 재현탁하고 나서(Sambrook & Russell 2001 Molecular Cloning: A Laboratory Manual, 3rd Ed. Cold Spring Harbor Laboratory Press, New York, NY), 신선 배지를 사용하여 1 L의 부피로 혼합 및 조정하였다. 30분 동안 진탕하면서 30℃에서 인큐베이션한 후, Qiagen Plasmid Midi Kit를 사용하여 이러한 모은 배양액으로부터 플라스미드 DNA를 제조하고, 이어서 일렉트로컴피턴트 대장균(E. coli) BL21의 형질전환에 사용하였다(Studier & Moffatt 1986 J. Mol. Biol. 189: 113-130). pSBX8.101d58 상에서 클로닝된 PylRS#1 유전자에서 타겟 위치의 무작위화는 DNA 시퀀싱에 의해 확인하였다.

상기 제조된 CafRS#0-R5 라이브러리를 이용한 일렉트로컴피턴트 대장균(E. coli) BL21의 형질전환 직후(Dower et al. 1988 Nucleic Acids Res. 16: 6127-6145), 4 mL의 형질감염된 세포 현탁액을 포스페이트 완충액(17 mM KH₂PO₄, 72 mM K₂HPO₄) 및 1 mM Caf(300 mM NaOH 중의 100 mM 스톡 용액)가 보충된 50 mL LB 배지로 희석하였다. 37℃에서 2h 동안 인큐베이션 후, 세포를 원심분리에 의해 침전시키고, 첨가물 없이 10 mL의 신선한 LB 배지로 세척하였다. 다른 원심분리 단계 후, 세포를 2 mL의 LB 배지로 재현탁하고, 100 mg/L 앰피실린, 60 mg/L 클로람페니콜 및 1 mM Caf가 보충된 4개의 사각 LB 아가 플레이트(114 cm²)에 플레이팅하였다. 37℃에서 48h 동안 인큐베이션 후 얻은 콜로니를 플레이트로부터 긁어내고, 각각 5 mL LB 배지에서 재현탁하고 나서, 100 mg/L 앰피실린을 함유한 1 L의 LB 배지로 혼합 및 희석하고, 3 L 진탕 플라스크에서 37℃에서 OD₅₅₀ = 0.4까지 성장시켰다. 이 배양으로부터, 2 mL 배양물의 3배를 플라스틱 튜브로 옮기고, 1 mM Caf가 있거나 없이 동시에 보충하고, 300 mM NaOH 중의 100 mM 용액으로서 신선하게 용해시켰다. 37℃에서 30분 동안 진탕하면서 박테리아를 성장시키고 나서, DMF에서 2 mg/mL로 용해된 무수테트라사이클린(aTc; Acros Organics, Geel, Belgium) 200 ng/mL을 첨가하여 eGFP의 발현을 유도하고, 이어서, 37℃에서 9-12h 동안 추가로 진탕하였다. 각 배양물 1 mL을 1.5 mL 에펜도르프 튜브에서 3분 동안 원심분리하고, 박테리아 펠렛을 필터-멸균된 PBS(4 mM KH₂PO₄, 16 mM Na₂HPO₄, 115 mM NaCl) 1 mL로 반복된 파이펫팅에 의해 조심스럽게 재현탁하였다. 이 절차에 따라 2회 세척 후, 마지막으로 같은 부피의 PBS로 박테리아를 재현탁하였다.

eGFP 형광의 특이적인 검출을 위해 여기를 위한 488 nm LASER 및 530/30 밴드-패스 필터가 있는 502 nm 롱-패스 필터를 이용하여 시스 유체(sheath fluid)로서 필터-멸균된 PBS로 작동되는 FACSAria 기구(BD Biosciences, Heidelberg, Germany)에서 플로우 사이토플루오리메트리 분석 그리고 박테리아 세포 소팅을 수행하였다. 적당한 FSC/SSC 게이트에 의해 온전한 박테리아 세포를 선별한 후, 각 집단에 대한 최종 소트 게이트를 극적으로 설정하여 "양성 선별" 사이클을 위해 Caf의 존재에서 최상의 eGFP 신호 강도를 갖는 1 내지 5%의 총 세포의 분획에 속하는 이들 세포를 선별하였다. "음성 선별"을 위해, 유도되지 않은 박테리아에 필적할만한 낮은 eGFP 신호를 갖는 세포를 소팅하였다. 박테리아는 100 mg/L 앰피실린이 보충된 LB 배지에서 직접 수집하였다. 재증폭을 위해, 소팅된 세포를 100 mg/L 앰피실린을 함유한 LB 아가에 플레이팅하고, 37℃에서 밤새도록 인큐베이션 하였다. 콜로니 밭은 상기에 추가로 기술된 바와 같이 LB 배지에서 집합적으로 재현탁되었다. 이 조밀한 박테리아 세포 현탁액 2 mL 앨리쿼트를 100 mg/L 앰피실린이 보충된 신선하게 제조된 LB 배지 100 mL에 접종하여 다음 선별 사이클에 직접 사용하였다.

높은 충실도를 갖는 CafRS 변이체를 강화하고 임의의 천연 아미노산을 수용하는 것들을 제거하기 위해, 2회 연속적인 음성 FACS 선별 단계를 초기에 수행하였다. 양성(즉, 1 mM Caf의 첨가) 및 음성 선별(즉, Caf의 부재)의 5회 교대 FACS 선별 라운드 후에, 리포터 단백질 eGFP로의 Caf의 특이적인 통합을 나타내는 형광 반응이 명백하게 발생하였다. 최종 양성 선별 사이클 후, 박테리아를 LB 아가에 플레이팅하고 플라스미드 DNA는 Qiagen 플라스미드 미디 키트에 의해 회수된 세포로부터 제조하였다. 칼슘 컴피턴트 대장균(E. coli) BL21 세포의 형질전환 후, 직사각형 플라스틱 접시(Nunc, Langenselbold, Germany)에서 100 mg/L 앰피실린이 보충된 LB 아가 상에 플레이팅하고, 이전에 상세하게 설명한 로봇 플랫폼을 이용하여(Reichert et al. 2015 Protein Eng. Des. Sel. 28: 553-565), 생성된 박테리아 집단을 96-웰 미세배양에서 단일-클론 분석에 적용하였다. 이 분석에서, 190개의 무작위로 선택된 콜로니를 번식시키고 eGFP 형광에 대해 개별적으로 분석하였다.

37℃에서 밤새도록 인큐베이션한 후, 콜로니를 자동으로 채취하고, 96-웰 둥근 바닥의 마이크로타이터 플레이트(Sarstedt, Nurnbrecht, Germany)에서 100 mg/L 앰피실린이 보충된 100 ㎕의 TB 배지에 접종하는데 사용하였다(Sambrook & Russell 2001 Molecular Cloning: A Laboratory Manual, 3rd Ed. Cold Spring Harbor Laboratory Press, New York, NY). 마이크로타이터 플레이트를 통기성 Breathseal 80/140 mm 멤브레인(Greiner Bio-One, Frickenhausen, Germany)으로 밀봉하고, 25 mm 진폭을 갖는 오비탈 쉐이킹 미니트론 인큐베이터(Infors, Eisenbach, Germany)을 이용하여 300 rpm 교반 하에서 37℃에서 밤새도록 정지상까지 인큐베이션하였다. 이어서, 100 mg/L 앰피실린을 포함하는 TB 배지에서 신선한 1 mL 배양물을 각각 전-배양물 20 ㎕을 갖는 마스터블록 2 mL V-형 딥 웰 마이크로타이터 플레이트(Greiner Bio-One)에 접종하고, 시너지 2 SLFA 마이크로플레이트 리더(BioTek Instruments, Bad Friedrichshall, Germany)를 사용하여 모니터링하였을 때 OD₅₅₀　

0.5에 도달하기까지 37℃에서 약 2h 동안 인큐베이션하였다. 이 접종 단계는 2개의 등가의 96-딥 웰 플레이트를 이용하여 2회 수행하였으며, 한 번은 1 mM Caf를 보충하여 수행하고, 다른 한 번은 비-천연 아미노산 없이 수행하였다. 30분 동안 추가 진탕 후, 200 ng/mL aTc(LB 배지 중 10 ㎍/mL 스톡 용액의 20 ㎕를 첨가하여)로 세포를 유도하였다. 박테리아 성장은 37℃에서 12h 동안 계속하였다; 이어서, 배양물을 원심분리하고(3857×g; 15 분), 로봇 플랫폼 상에서 반복된 파이펫팅에 의해 1 mL의 PBS에서 재현탁하였다. PBS에서의 세척은 1회 반복하였다. 마지막으로, 100 ㎕의 앨리쿼트의 eGFP ^Caf39형광은 맥시소브 블랙 96-웰 어세이 플레이트(Nunc)를 이용하여 495 nm에서 컷오프를 갖는 510 nm에서 방출을 검출하면서 395 nm에서의 여기 하에서 세포 현탁액에서 측정하였다. 각 웰의 형광 판독은 96-웰 마이크로테스트 플레이트 F(Sarstedt)에서 1:5로 희석된(20 ㎕ 앨리쿼트+80 ㎕ PBS) 동일한 세포 현탁액의 OD₅₅₀로 정규화하였다. 빈 pSBX8.100d 백본(eGFP를 코딩하지 않는)만을 보유한 세포를 이용한 2개 웰의 정규화된 배경 형광을 평균화하고, 모든 다른 형광 판독값에서 뺀다. 최종 값은 각 클론에 대해 형광비 aaRS^+Caf/aaRS^-Caf로 결정하였다.

효율 및 충실도의 측면에서 CafRS#7(SEQ ID NO: 35)로 명명된 최고의 클론은 이미 평균 eGFP 형광에서의 일부 증가를 나타냈고, 이는 추가 위치의 무작위화가 필요함을 나타낸다. CafRS#7의 서열 분석은 PylRS#1과 비교하여 3개의 아미노산 치환을 나타냈다(Met309Gln, Asn311Ser 및 Cys313Gly).

CafRS#7(SEQ ID NO: 35)는 6개의 완전히 무작위화된 위치(Ala267, Leu270, Tyr271, Leu274, Ile285 및 Ile287)를 갖는 두 번째 집중된 aaRS 라이브러리(CafRS#7-R6; SEQ ID NO: 36)의 출발점으로 사용되었다. 두 세트의 축퇴 NNS-프라이머를 이용하여 2개의 PCR 단편을 생성하고 조립하였다. 제1 PCR 단편은 정방향 프라이머(SEQ ID NO: 30) 및 NNS 역방향 프라이머(SEQ ID NO: 37)로 생성하여 목적 잔기에 대한 변이체를 도입하여 유전자의 업스트림 부분을 생성시켰다. 제2 PCR 단편은 제1 PCR 산물의 3' 말단에 대해 정방향 프라이머의 중첩을 가지며, 유전자의 다운스트림 부분을 제공하는 다른 NNS-축퇴 정방향 프라이머(SEQ ID NO: 38) 및 역방향 프라이머(SEQ ID NO: 34)로 생성되었다. 이들 PCR 단편은 주형으로 제공하는 CafRS#7 유전자를 사용하여 상기 기술된 실험 절차에 따라 생성되었다. 아가로스 젤 정제 후, 200 ng의 각 단편은 또한 BsaI 제한 부위를 포함하는 유전자의 5'(SEQ ID NO: 30) 및 3' 말단(SEQ ID NO: 34)에 대한 프라이머를 사용한 어셈블리 PCR 반응에 사용되었다. 라이브러리는 pSBX8.101.d58에서 클로닝되어 1×10¹⁰ 형질전환체를 생성하고, 100 mg/mL 앰피실린, 30 mg/mL 클로람페니콜 및 1 mM Caf가 보충된 LB 아가 플레이트상에서 살아있는 콜로니에 대해 초기 사멸/생존 선별을 수행하고, 이어서 FACS를 이용하여 2개의 음성 선별 라운드를 수행하였다. 5회 교대 FACS 선별(3회 양성 및 2회 음성) 후, 박테리아 세포를 100 mg/L 앰피실린이 보충된 LB 아가 상에서 회수하고, 이어서, 상기 기술된 바와 같이 96-웰 미세배양 포맷에서 189개의 콜로니의 단일-클론 분석을 수행하였다. 돌연변이된 aaRS 유전자 카세트의 서열 분석 결과 CafRS#29(SEQ ID NO: 39)로 명명된 최상의 특이적인 형광비를 갖는 클론은 CafRS#7과 비교하여 4개의 추가적인 아미노산 치환(Ala267Thr, Leu274Ala, Ile285Asn, Ile287Ser)을 가지고 있었다.

메타노사르시나 마제이(Methanosarcina mazei(Mz)) PylRS(PBD entry 2ZCE) 의 결정 구조 및 2개의 이전 라이브러리 스크리닝의 결과로부터 보건대, 이미 제1 라이브러리에서 타겟팅된 엔트리에 위치한 2개의 잔기(Gln309 및 Ser311) 및 제2 라이브러리에서 타겟팅된 활성 부위의 후방 부분에 위치한 3개의 잔기(Ala274, Asn285 및 Ser287)는 제3 CafRS 라이브러리를 구축하기 위한 유망한 후보로 보였다. CafRS#29에 기초한 라이브러리 CafRS#29-R5(SEQ ID NO: 40)는 축퇴 NNS 프라이머를 이용한 어셈블리 PCR에 의해 다시 생성되었다.

정방향 및 역방향 프라이머 세트를 이용하여 3개의 PCR 단편이 생성되고 조립되었다. 제1 PCR 단편은 정방향 프라이머(SEQ ID NO: 30) 및 NNS-축퇴 역방향 프라이머(SEQ ID NO: 41)를 사용하여 생성되며, 유전자의 무작위화된 업스트림 부분을 생성한다. 유전자의 중간 부분을 제공하는 제2 PCR 단편은 제1 PCR 단편의 3' 말단 및 제3 PCR 단편의 5' 말단과의 중첩을 갖는 2개의 NNS-프라이머 세트(SEQ ID NO: 38 및 SEQ ID NO: 42)를 이용하여 생성되었다. 유전자의 다운스트림 부분을 제공하는 제3 PCR 단편은 NNS 정방향 프라이머(SEQ ID NO: 31) 및 역방향 프라이머(SEQ ID NO: 34)를 사용하여 생성되었다. PCR 단편은 주형으로 제공하는 CafRS#29 유전자를 사용하여 상기 기술된 실험 절차에 따라 생성 및 조립되었다. 유전자 라이브러리는 제한효소 BsaI를 사용하여 분해되며, 젤 정제되고, BsaI 분해 후, pSBX8.101d58 벡터로 라이게이션되어 CafRS#29-R5 라이브러리(SEQ ID NO: 40)를 생성하였다. 이어서, 10 ㎍의 라이게이션 산물을 대장균(E. coli) NEB10beta 세포에 전기천공하였다. 전기천공된 세포를 회수하고, 100 mg/mL 앰피실린이 첨가된 LB 아가 플레이트 상에 플레이팅하여 1×10¹⁰ 독립적인 형질전환체를 생성하였다. CafRS#20-R5 라이브러리에서 선별은 제1 및 제2 CafRS-라이브러리에서의 선별에 대해 기술된 절차를 따랐다. 마지막으로 선별된 돌연변이체 합성효소, CafRS#30(SEQ ID NO: 43)는 야생형 Mb PylRS와 비교하여 총 7개의 아미노산 치환을 보유한다(Ala276Thr, Leu274Ser, Ile285Ser, Ille287Val, Asn311Val, Met315Gly 및 Tyr349Phe).

실시예 5: SAm1 ^Caf 변이체의 생성

개념 증명을 위해, 스트렙타비딘 돌연변이체 1, SAm1("Strep-Tactin"로도 불림)(Voss & Skerra 1997 Protein Eng. 10:975-82)(SEQ ID NOs: 7 및 8)는 V44, W108 또는 W120 위치 중 어느 하나에서 Caf로 변형되었다. 이를 위해, QuikChange 부위-지정 돌연변이유발 키트 및 적당한 정방향 및 역방향 PCR 프라이머 세트와 함께 주형으로 플라스미드 pSAm1(SEQ ID NO: 44)를 이용하여 부위-지정 돌연변이유발에 의해 이들 서열 위치 각각에서 코딩 영역으로 앰버 종결 코돈(TAG)을 도입하였다: SEQ ID NO: 45 및 46은 SAm1^UAG44(SEQ ID NO: 47)를 생성, SEQ ID NO: 48 및 49는 SAm1^UAG108(SEQ ID NOs: 1 및 2)를 생성 및 SEQ ID NO: 50 및 51은 SAm1^UAG120(SEQ ID NO: 52)를 생성(도 5B). 칼슘-컴피턴트 대장균(E. coli) XL1-blue 세포의 형질전환, 플라스미드 제조(Plasmid Miniprep Kit, Qiagen) 및 시퀀싱(Mix2Seq, MWG Eurofins, Ebersberg, Germany) 후, SAm1 변이체는 벡터 pSBX8.CafRS#30d58(SEQ ID NO: 53) 상에 XbaI 및 HindIII에 의해 서브클로닝되어 각각 pSBX8.CafRS#30d47(V44TAG; SEQ ID NO: 54), pSBX8.CafRS#30d53(W108TAG; SEQ ID NO: 55) 및 pSBX8.CafRS#30d51(W120TAG; SEQ ID NO: 56)를 생성하였다.

Caf로 치환된 모든 위치는 사이드 체인이 시스 배열(즉, 340 또는 365 nm에서 조명 후)을 채택하지만 트랜스 배열에서 결합 활성을 보존하는 경우 Strep-tag II의 결합을 방해하도록 의도되었다(도 5A). 위치 Val44는 44-53 위치를 포함하는 가요성 루프 영역의 N-말단 측에 위치한다. Caf 이성질체화는 루프 형태를 변화시키는 것으로 생각되었다. 위치 Trp108는 비오틴에 대한 결합 포켓의 아래쪽에 위치하므로, 시스-Caf는 이웃하는 사이드 체인과 충돌하는 것으로 생각되었다. 위치 Trp120는 이웃하는 테트라머 서브유닛으로부터 연장되는 결합 부위의 상단에 위치하므로, Caf의 시스 상태로의 이성질체화 시 전체 기하학을 변화시킨다.

실시예 6: SAm1 변이체의 발현 및 정제

SAm1(SEQ ID NOs: 7 및 8) 및 SAm1^Caf 변이체 둘 다 대장균(E. coli)에서 세포질성 봉입체로서 생산되며, 용해되고, 리폴딩되며, 음이온-교환 크로마토그래피(AEX)에 의해 정제되고 SDS-PAGE에 의해 분석되었다. SAm1^Caf108(SEQ ID NOs: 1 및 2)를 암호화하는 플라스미드 pSBX8.CafRS#30d53로 형질전환된 대장균(E. coli) BL21의 단일 콜로니를 100 mg/L 앰피실린이 보충된 50 mL의 LB 배지를 접종하는데 사용하였다(도 6A). 30℃에서 밤새도록 인큐베이션 후, 배플드 쉐이크 플라스크 내 100 mg/L 앰피실린, 포스페이트 완충액(17 mM KH₂PO₄, 72 mM K₂HPO₄) 및 1 mM Caf(300 mM NaOH 중 100 mM 스톡용액으로부터)이 보충된 2 L LB 배지로 20 mL 배양물을 옮겼다. 배양물을 37℃에서 OD₅₅₀=0.5까지 인큐베이션하였다. 이어서, SAm1^Caf108 유전자 발현(tet ^p/o의 조절 하에서; Skerra 1994 Gene 151: 131-135)을 200 ng/mL aTc로 유도하였고, 37℃에서 12h 동안 성장시켰다. CafRS 유전자는 대장균(E. coli) proS 프로모터 및 proM 터미네이터의 조절 하에서 있었다. 원심분리(10,000×g, 20분, 4℃)하여 세포를 수확하고, 100 mL 100 mM Na-borate pH 9.0, 150 mM NaCl로 2회 세척하여 침전된 Caf를 제거하였다. 박테리아는 차가운 100 mM Tris-HCl pH 8.0, 150 mM NaCl, 1 mM EDTA의 mg 습윤중량(wet weight) 당 3mL로 재현탁하고, 프렌치 프레셔 호모게나이저(SLM Aminco, Urbana, IL, USA)를 이용하여 3회 실행으로 파괴하였다. 균질물을 원심분리(20,000 g, 30분, 4℃)하여 스트렙타비딘 봉입체를 침전시켰다. 50 mM Tris-HCl pH 8.0, 2 M 우레아, 2 % v/v Triton X-100(3 mL/g cell wet weight)로 단백질 펠렛을 2회 세척하여 불순물을 제거한 후, 50 mM Tris-HCl를 이용한 세척 단계로 잔류하는 트리톤 X-100을 고갈시켰다. 봉입체는 8 M 우레아 pH 2.5(3 mL/g cell wet weight)에서 용해되었다. 원심분리(20,000 g, 30분, 4℃)후, 정화된 상등액을 리폴딩하였으며, 이는 빠른 희석에 의해 달성되었다. 폴딩되지 않은 단백질은 파스테르 파이펫을 사용하여 4℃에서 25배 부피의 50 mM Tris-HCl pH 8.0에 방울씩 파이펫팅하였다. 혼합물을 4℃에서 밤새도록 인큐베이션하고, 원심분리(10,000×g, 20분, 4℃)에 의해 제거하고, 20 mM Tris-HCl pH 8.0로 평형화된 6 mL 리소스 Q 컬럼(GE Healthcare, Freiburg, Germany) 상에서 AEX에 의해 정제되었다. 쿠마시 브릴리안트 블루 R-250 염색을 이용하여 SDS-PAGE(Fling & Gregerson 1986 Anal. Biochem. 155: 83-88)에 의해 분석된 바와 같이 순수한 상태에서 ~80 mM NaCl에서 0-500 mM NaCl의 선형 염 농도 구배로 용출되었다(도 6B).

실시예 7: 알칼라인 포스파타아제/ Strep -tag II 융합 단백질의 제조

플라스미드 pASK75-PhoA-strepII(SEQ ID NO: 57)로 형질전환된 대장균(E. coli) JM83을 이용한 PhoA/Strep-tag II 융합 단백질의 제조는 Voss & Skerra 1997 Protein Eng. 10: 975-982에 의해 기술된 바와 같이 본질적으로 100 mg/mL 앰피실린이 보충된 2 L의 LB 배지에서 달성되었다. 배양물은 22℃에서 OD₅₅₀= 0.5까지 성장되었고, phoA 유전자 발현은 200 ng/mL의 aTc의 첨가에 의해 유도되었다. 인큐베이션은 22℃에서 4h 동안 진행되었다. 원심분리에 의해 세포를 수확하고, 100 ㎍/mL의 라이소자임을 함유한 20 mL의 아이스-콜드 주변세포질성 분획 완충액(0.5 M 수크로스, 2 mg/mL의 폴리믹신 B 설페이트 및 100 mM Tris-HCl, pH 8.0)에서 재현탁시키고, 얼음 위에서 30분 동안 인큐베이션하였다. 효소의 활성 부위에서 금속 이온의 존재로 인해, 주변세포질성 단백질 제조는 EDTA 대신에 2 mg/mL의 폴리믹신 B 설페이트의 존재에서 수행되었다. 반복된 원심분리에 의해 스페로블라스트를 제거하고(Skerra & Schmidt 2000 Methods Enzymol. 326: 271-304), 상등액은 주변세포질성 세포 분획으로서 회수하였다. 공개된 절차(Schmidt & Skerra 2007 Nat. Protoc. 2: 1528-1535)에 따라 용출을 위해 StrepTactin 세파로스(IBA, G

ttingen, Germany) 및 D-데스티오비오틴을 사용하여 스트렙타비딘 친화성 크로마토그래피에 의해 주변세포질성 세포 분획으로부터 PhoA/Strep-tag II 융합 단백질을 정제하였다. PhoA의 활성 부위 내 금속 이온의 손실을 피하기 위해, 크로마토그래피 완충액(150 mM NaCl, 100 mM Tris-HCl pH 8.0)에서 EDTA를 생략하였다. 마지막으로, PhoA/Strep-tag II 융합 단백질은 2 L의 완충액(1 mM ZnSO₄, 5 mM MgCl₂, 100 mM Tris-HCl, pH 8.0)으로 2회 투석하여 ELISA 측정 또는 크로마토그래피 매트릭스 상에 고정된 Caf-변형된 스트렙타비딘 변이체를 이용한 결합 실험 전에 D-데스티오비오틴을 제거하였다.

실시예 8: ELISA에서 PhoA/ Strep -tag II 융합 단백질에 대한 가역적 결합의 검출

특정 위치에서 광-전환성 아미노산 Caf를 보유한 스트렙타비딘 돌연변이체의 광-유도된 가역적 결합은 모델 리간드로서 정제된 PhoA/Strep-tag II 융합 효소를 사용하여 ELISA에서 시험하였다(도 7). ELISA는 96-웰 마이크로타이터 플레이트(Nunc, Langenselbold, Germany)에서 주위 온도에서 수행되었다. 각 웰은 PBS(4 mM KH₂PO₄, 16 mM Na₂HPO₄, 115 mM NaCl) 중의 100 ㎕의 비오틴화된 우태아혈청 알부민(BSA)으로 1 mg/mL의 농도에서 밤새도록 코팅되었다(도 7A). 2 mL의 BSA(PBS 중의 10 mg/mL)의 비오틴화는 20×몰 초과의 비오틴 NHS 에스테르를 사용하여 수행되었다. 실온에서 2h 동안 인큐베이션 후, 2 mL의 100 mM NaCl, 100 mM Tris-HCl pH 8.0를 첨가하여 반응을 멈추고, 동일한 완충액으로 평형화된 PD-10 탈염 컬럼(GE Healthcare)을 사용하여 정제하였다. 웰을 PBS 중 3 % w/v BSA, 0.5 % v/v Tween로 2.5h 동안 블록하고, PBS-Tween으로 3회 세척하였다. 100 ㎕의 SAm1 또는 이의 Caf-변이체를 PBS에서 100 ㎍/mL로 적용하여 미리-흡착된 비오틴-BSA의 복합체 형성에 의한 고정화를 수행하였다. 1h 동안 인큐베이션 후, 웰을 PBS-Tween으로 3회 세척하였다. 이어서, 1 mM ZnSO₄, 5 mM MgCl₂, 100 mM Tris-HCl pH 8.0 내 100 ㎕의 PhoA/Strep-tag II를 각 웰에 적용하였다. 1h 동안 인큐베이션 후, 액체를 제거하고, PBS-Tween으로 2회 및 PBS로 2회 웰을 세척하였다. 이들 세척 단계 각각 사이에서, 마이크로타이터 플레이트는 365 nm의 파장에서 자외선(UV 핸드 램프, NU-6 KL, Benda Laborger

te, Wiesloch, Germany; 도 7A, 하단 패널)으로 2 mm 거리에서, 또는 가시광선(일광; 도 7A, 상단 패널)으로 5분 동안 조명되는 한편, 완충액 교환은 어둠 속에서 수행되었다. 마지막으로, 1 mM ZnSO₄, 5 mM MgCl₂, 1 M Tris-HCl, pH 8.0 중의 0.5 mg/mL p-니트로페닐 포스페이트 100 ㎕을 각 웰에 첨가하고, 남아있는 효소적 PhoA 활성은 시너지 2 SLFA 마이크로플레이트 리더를 사용하여 410 nm에서 광 흡수에서의 변화로 측정하였다.

결과적으로, 모든 시험된 스트렙타비딘 돌연변이체들은 PhoA/Strep-tag II 융합 단백질에 대해 우수한 친화성을 보여, 가시광선으로 조명된 샘플들에 대해 SAm1으로 얻은 것에 필적할만한 신호를 발생시켰다(도 7B). 대조적으로, 스트렙타비딘 변이체 SAm1^Caf108에 대해 365 nm에서의 자외선 조사 후 남아있는 효소 활성에서의 명백한 감소가 관찰되었다. SAm1 그리고 돌연변이체 SAm1^Caf44 및 SAm1^Caf120는 이들 상황 하에서 각각 신호 감소가 없거나 훨씬 적었다. 따라서, 스트렙타비딘 돌연변이체 SAm1^Caf108는 친화성 태그가 장착된 타겟 단백질의 광-유도성(광-전환성) 가역적 결합을 보인다.

실시예 9: 광-제어성 친화성 매트릭스의 시험

벡터 pSBX8CAFRS#30(실시예 4 및 5 참조)의 해당 유도체에서 암호화된 정제된 SAm1 또는 이의 Caf-변이체는 기술된 바와 같이(Schmidt & Skerra 1994 J. Chromatogr. A 676: 337-345) 팽창된 젤의 mL 당 5 mg 단백질로 NHS-활성화된 세파로스 4B(Pharmacia, Stockholm, Sweden)에 커플링되었다. 이를 위해, NHS-활성화된 CH-세파로스 4B를 팽창시키고, 제조업체의 권장에 따라 아이스-콜드 1 mM HCl로 세척하였다. 상등액을 배출시키고, 젤을 100 mM NaHCO₃ pH 8.0, 500 mM NaCl에 대해 투석된 스트렙타비딘 변이체의 2.5 mg/mL 용액의 2배 부피와 혼합하였다. 실온에서 부드럽게 2h 동안 진탕시킨 후, 상등액을 따라내고, 젤을 100 mM Tris-HCl pH 8.0의 5배 부피와 혼합하여 잔류 활성화 기의 블록킹을 달성한 후 4℃에서 밤새도록 진탕하였다.

UV-투명 컬럼을 유리 모세관(내경이 0.7 mm)에 Sam1^Caf44, SAm1^Caf108, SAm1^Caf120 및 SAm1에 대해 각각 상기로부터 20 ㎕의 크로마토그래피 매트릭스와 함께 패킹하였다. 처음에, 365 nm에서 자외선 조사 하에서 1회(UV hand lamp, NU-6 KL, Benda Laborgerate, Wiesloch, Germany) 및 >530 nm의 방출 파장으로 LED 광 테이블(FG-08, Nippon Genetics, Duren, Germany)을 이용한 조사 하에서 1회, 시린지 펌프(kdScientific, Holliston, MA, USA)를 사용하여 2 mL 러닝 완충액(100 mM Tris-HCl pH 8.0, 100 mM NaCl)으로 12 mL/h의 일정한 유속으로 컬럼을 2회 평형화시켰다(도 8A). 이어서, 100 mM Tris-HCl pH 8.0, 100 mM NaCl에서 0.1 mg/mL의 농도로 정제된 PhoA/Strep-tag II 융합 단백질 25 ㎕를 적용하고, 컬럼을 2 mL의 러닝 완충액으로 세척하는 한편, 결합하지 않은 단백질은 분획을 통과하는 흐름에서 수집하였다. 샘플 적용 및 세척 단계는 LED 광 테이블을 이용한 가시광선 조사 하에서 수행하였다. 이어서, 결합된 단백질의 용출은 UV 핸드 램프를 이용하여 365 nm에서 자외선으로 조사하여 유발시켰다. 처음에, 자외선을 적용하면서 완충액 흐름을 10분 동안 정지시켰다. 이어서, 유속을 12 mL/h로 다시 설정하고, 세개의 용출 분획(각각 25 ㎕)을 수집하였다. SAm1^Caf108에 기초한 크로마토그래피 매트릭스의 용출 분획에서 PhoA/Strep-tag II 융합 단백질에 해당하는 쿠마시-염색된 젤 상에서 보이는 단백질 밴드는 그 단백질이 365 nm에서 조사에 의해 특이적으로 용출되었음을 나타낸다(도 8B). 스트렙타비딘(도 8C) 또는 이의 변이체 SAm1^Caf44 및 SAm1^Caf120(미도시됨)의 경우에는 밴드가 관찰되지 않았다.

용출 분획에서 친화성-정제된 단백질의 검출 한계를 증가시키기 위해, PhoA 효소 활성을 측정하였다. 따라서, 각각의 분획 10 ㎕(로딩된 샘플, 관통, 세척 및 용출 분획 1-3)을 96-웰 플레이트(Nunc)의 단일 웰에 적용하였다. 1 mM ZnSO₄, 5 mM MgCl₂, 1 M Tris-HCl, pH 8.0에서 0.5 mg/mL p-니트로페닐 포스페이트 90 ㎕을 첨가하였다. 실온에서 30분 동안 인큐베이션 후, 시너지 2 SLFA 마이크로플레이트 리더를 사용하여 410 nm에서 시간-의존적 흡광도를 측정하여 효소 활성을 측정하였다. SDS-PAGE 분석과 관련하여, SAm1^Caf108에 기초한 크로마토그래피 매트릭스의 용출 분획은 자외선 조사 하에서 용출된 가장 높은 단백질 농도(효소 활성)를 나타냈다(도 8D).

실시예 10: ProtL ^Caf -ABD 변이체의 생성

단백질 L은 원래는 피네골디아 마그나(Finegoldia magna)(이전에는 펩토스트렙토코커스 마그너스(Peptostreptococcus magnus)로 알려짐)의 세포벽에서 발견되는 표면 단백질이며, 많은 포유동물 종 유래의 면역글로불린(Igs), 특히 IgGs에 대해 높은 친화성 및 특이성을 가지고 있어 항체 정제에 사용되었다(Rodrigo et al., 2015 Antibodies 4:259-277). 스타필로코커스 아우레우스(Staphylococcus aureus) 및 그룹 G 스트렙토코커스(Streptococci) 유래의 단백질 A 및 단백질 G와 같은 다른 IgG 결합 단백질은 Igs의 Fc 영역에 결합하나, 단백질 L은 항원 결합 부위를 방해하지 않고 카파 경쇄 가변 영역에 결합한다. 천연 단백질 L(UniProt accession number Q51918)은 본질적으로 다음의 도메인을 포함한다(Kaster et al. 1992 J. Biol. Chem. 267: 12820-12825와 유사함): 신호 펩타이드(1-26); 3개의 단백질 G-관련 알부민-결합 도메인(77-116; 129-177; 190-238); 4개의 상동의 B1 도메인(254-317; 326-389; 399-436; 474-538); 2개의 C-리피트(610-660; 668-722) 및 트랜스멤브레인 영역(969-991).

항체 그리고 단편 또는 관련된 포맷(항체 융합 단백질, 이중특이적인 항체 등과 같은)을 정제하기 위한 광-전환성 매트릭스를 가공하기 위해, 비-필수 도메인이 없이 단일 도메인을 포함하는 재조합 단백질 L을 설계하였다. 코돈 최적화된 단백질 L 도메인 B1(본 명세서에서 ProtL로 언급됨; SEQ ID NO: 20)은 짧은 링커 서열에 의해 단백질 G에서 유래된 인간 알부민-결합 도메인(ABD; SEQ ID NO: 59)에 융합되었다. 단백질 L-ABD 융합 단백질(ProtL-ABD; SEQ ID NO: 61)은 337, 347, 360, 364, 368 또는 369번 위치 중 하나에서 Caf로 변형되었다(UniProt accession number Q51918에서 번호 체계 참조). 337, 347, 360, 364, 368 및 369번 위치는 각각 SEQ ID NO: 61의 13, 23, 36, 40, 44 및 45번 위치에 상응한다.

이를 위해, QuikChange 부위-지정 돌연변이유발 키트와 적당한 정방향 및 역방향 프라이머 세트(ProtL^UAG337-ABD(SEQ ID NO: 67)에 대해 SEQ ID NO: 63 및 66, ProtL^UAG347-ABD(SEQ ID NO: 72)에 대해 SEQ ID NO: 68 및 69, ProtL^UAG360-ABD(SEQ ID NO: 75)에 대해 SEQ ID NO: 73 및 74, ProtL^UAG364-ABD(SEQ ID NO: 78)에 대해 SEQ ID NO: 76 및 77, ProtL^UAG368-ABD(SEQ ID NO: 81)에 대해 SEQ ID NO: 79 및 80, 및 ProtL^UAG369-ABD(SEQ ID NO: 84)에 대해 SEQ ID NO: 82 및 83(도 9))의 도움으로 주형으로 플라스미드 pASK75-ProtL-ABD(SEQ ID NO: 62)를 사용하여, 부위-지정 돌연변이유발에 의해 이들 서열 각각에서 코딩 영역에 앰버 종결 코돈(TAG)을 도입하였다(원래의 아미노산 코돈의 치환에 의해).

칼슘-컴피턴트 대장균(E. coli) XL1-blue(Bullock et al., 1987 Biotechniques 5:376-378) 세포의 형질전환, 플라스미드 제조 및 시퀀싱 후, 변형되지 않은 ProtL-ABD 및 ProtL^UAG-ABD 변이체는 벡터 pSBX8.CafRS#30d58(SEQ ID NO: 53) 상에서 XbaI 및 HindIII 제한 부위에 의해 서브클로닝되어 각각 플라스미드 pSBX8.CafRS#30d70(앰버-종결 코돈이 없음), pSBX8.CafRS#30d71(337TAG), pSBX8.CafRS#30d72(347TAG), pSBX8.CafRS#30d73(360TAG), pSBX8.CafRS#30d74(364TAG), pSBX8.CafRS#30d75(368TAG) 및 pSBX8.CafRS#30d76(369TAG)를 생성하였다.

Caf로 치환된 337 및 347번 위치는 사이드 체인이 시스 배열(즉, 약 340 또는 약 365 nm에서 조명 후)을 채택하지만 트랜스 배열에서 결합 활성을 유지하는 경우 Ig의 결합을 방해하도록 의도되었다. Caf로 치환된 360, 364, 368 및 369번 위치는 사이드 체인이 트랜스 배열(즉, >420 nm 조명 후)을 채택하지만 시스 배열에서 결합 활성을 유지하는 경우 Ig 결합을 방해하도록 의도되었다. 이성질체화 후, Caf 사이드 체인은 단백질 L(이의 결합 부위의 형태를 바꿈) 및/또는 Ig 리간드(단백질/단백질 계면의 기하학을 변화시킴) 내 이웃하는 사이드 체인과 충돌하여 결합을 방해하는 것으로 추정되었다.

단백질 L의 결합 계면 내에서 입체적 중첩 없이 큰 Caf 사이드 체인을 위한 충분한 공간을 제공하고 IgG 결합 활성을 보존하기 위해, 추가적인 아미노산 교환을 돌연변이된 ProtL-ABD에 적절히 도입하였다. 예를 들어, 돌연변이 Tyr361Ala는 QuikChange 부위-지정 돌연변이유발 키트 및 정방향과 역방향 프라이머 SEQ ID NO: 70 및 73을 사용하여 ProtL^Caf347-ABD의 코딩 영역에 도입되었다. 두 개의 추가적인 돌연변이 Tyr361Asn 및 Leu365Ser은 프라이머 SEQ ID NO: 65 및 68을 사용하여 ProtL^Caf337-ABD에 동시에 도입되었다. 이들 361 및 365번 위치는 각각 SEQ ID NO: 61 및 86의 37 및 41번 위치에 상응한다.

실시예 11: ProtL ^Caf -ABD 변이체의 발현 및 정제

ProtL(SEQ ID NO: 60) 및 ProtL^Caf 변이체(SEQ ID NOs: 69, 74, 77, 80, 83 및 86)는 대장균(E. coli)의 세포질에서 ABD-융합 단백질로서 생산되며, 인간 혈청 알부민(HSA) 친화성 크로마토그래피 및 음이온-교환 크로마토그래피(AEX)에 의해 정제되었다. 예를 들어, ProtL^Caf337-ABD(SEQ ID NO: 85)를 암호화하는 플라스미드 pSBX8.CafRS#30d71로 형질전환된 대장균(E. coli) MG1655의 단일 콜로니(Guyer et al., 1981 Cold Spring Harb Symp Quant Biol 45:135-40)를 100 mg/L 앰피실린이 보충된 50 mL LB 배지에 접종하는데 사용하였다. 30℃에서 밤새도록 인큐베이션 후, 20 mL의 배양물을 배플드 쉐이크 플라스크에서 100 mg/L 앰피실린, 포스페이트 완충액(17 mM KH₂PO₄, 72 mM K₂HPO₄) 및 1 mM Caf(300 mM NaOH 중 100 mM 스톡용액으로부터)이 보충된 2 L LB 배지로 옮겼다. 배양물을 37℃에서 OD₅₅₀= 0.5까지 교반 하에서 인큐베이션하였다. 이어서, ProtL^Caf337-ABD 유전자 발현(tet ^p/o의 조절 하에서)은 200 ng/mL aTc으로 유도하였고, 37℃에서 12-16h 동안 성장시켰다. CafRS 유전자는 proM 터미네이터와 조합하여 대장균(E. coli) proS 프로모터의 구성적 조절 하에 있었다. 원심분리(10,000×g, 20분, 4℃)에 의해 세포를 수확하고, 콜드 50 mM Tris-HCl pH 8.0, 100 mM NaCl, 5 mM EDTA의 g 습윤중량(wet weight) 당 3 mL로 재현탁하고, 프렌치 프레셔 호모게나이저를 사용하여 파괴시켰다. 균질물을 원심분리(20,000 g, 30분, 4℃)하여 세포 잔해물을 침전시키고, 맑은 상등액을 HSA 친화성 컬럼을 사용하여 친화성 크로마토그래피에 적용하였다.

HSA 친화성 매트릭스는 공개된 프로토콜(Schmidt & Skerra 1994 J. Chromatogr. A 676: 337-345)에 따라 NHS-활성화된 세파로스 4B(GE Healthcare, Freiburg, Germany)를 이용하여 제조하였다. 이를 위해, NHS-활성화된 CH-세파로스 4B를 우선 팽창시키고, 제조업체의 권장에 따라 아이스-콜드 1 mM HCl에서 세척하였다. 상등액을 배출시키고, 젤을 100 mM NaHCO₃ pH 8.0, 500 mM NaCl에서 쌀에서 생산된 재조합 HSA(Sigma-Aldrich, St. Louis, MO, USA)의 5 mg/mL의 2배 부피와 혼합하였다. 실온에서 2h 동안 부드럽게 진탕한 후, 상등액을 따라 내고, 젤을 100 mM Tris-HCl pH 8.0의 5배 부피와 혼합한 후 잔류 활성화기를 차단하기 위해 4℃에서 밤새도록 진탕하였다. HSA 친화성 매트릭스는 AKTA 퓨리파이어 크로마토그래피 시스템에 연결된 2 mL 컬럼 하우징에 패킹하였다.

러닝 완충액(50 mM Tris-HCl pH 8.0, 100 mM NaCl)으로 HSA 컬럼을 평형화 시킨 후, ProtL^Caf337-ABD를 포함하는 대장균(E. coli)으로부터 얻은 상등액을 컬럼에 로딩하였다. 이어서, 러닝 완충액의 5배 부피(10 mL)로 컬럼을 세척하고, 결합된 단백질은 150 mM glycine-HCl pH 2.8, 100 mM NaCl로 용출하였다. 피크 분획은 중화 완충액(분획 1 mL 당 1 M Tris-HCl pH 9.0 100 ㎕)으로 수집되어 분획의 최종 pH는 대략 중성이 되도록 하였다. 풀링된 분획은 4℃에서 밤새도록 20 mM Tris-HCl pH 8.0에 대해 즉시 투석되었다. ProtL^Caf337-ABD는 20 mM Tris-HCl pH 8.0로 평형화된 1 mL 리소스 Q 컬럼(GE Healthcare) 상에서 AEX에 의해 추가로 정제되었다. 단백질 분획은 쿠마시 브릴리안트 블루 R-250로 염색하여 가시화되는 바와 같이 SDS-PAGE에 의해 분석될 때(Fling & Gregerson 1986 Anal. Biochem. 155: 83-88) ~100 mM NaCl에서 0-200 mM NaCl의 선형 염 농도 구배에서 순수한 상태로 용출되었다(도 10). 다른 Caf 변이체 뿐만 아니라 변형되지 않은 ProtL-ABD 융합 단백질을 동일한 방식으로 제조하였다.

실시예 12: ELISA에서 ProtL ^Caf -ABD 융합 단백질에 대한 가역적 결합의 검출

특정 위치에 광-전환성 아미노산 Caf를 보유한 ProtL^Caf-ABD 돌연변이체의 광-유도된 가역적 결합은 모델 Ig 리간드로서 마우스 항-6xHis 항체 알칼라인 포스파타아제(AP) 컨쥬게이트(Arigo Biolaboratories, Hsinchu City, Taiwan)를 사용하여 ELISA에서 시험하였다(도 11A). ELISA는 96-웰 Maxisorb 마이크로타이터 플레이트(Nunc, Langenselbold, Germany)에서 주위의 온도에서 수행되었다.

이를 위해, 먼저 각 웰을 실온에서 1h 동안 PBS(4 mM KH₂PO₄, 16 mM Na₂HPO₄, 115 mM NaCl) 중의 10 ㎍/mL의 농도에서 쌀에서 생산된 재조합 HSA 50 ㎕로 코팅하였다. 이어서, 웰을 ddH₂O에서 1:10으로 희석된 200 mL Roti-Block(Carl Roth, Karlsruhe, Germany)로 1h 동안 차단하고 0.1% v/v Tween 20을 함유한 PBS(PBS/T)로 3회 세척하였다. 그 후, 실시예 11에서 정제된 ProtL^Caf-ABD 융합 단백질을 PBS/T에서 희석 시리즈에 적용하고, 1h 동안 인큐베이션하여 ABD 모이어티와 미리-흡착된 HSA 간의 복합체 형성을 수행하였다. 그리고 나서 웰을 PBS/T로 3회 세척하고, 상기 언급된 마우스 항-6xHis Ig-AP 컨쥬게이트의 PBS/T에서 1:1000 희석의 50 ㎕와 인큐베이션하였다.

1h 후 마이크로타이터 플레이트를 일광으로부터 보호하고, 2 mm 거리에서 365 nm의 파장에서 자외선으로 5분 동안 조명하였다(UV 핸드 램프 NU-6 KL). 모든 후속 세척 단계는 어둠 속에서 수행하였다. 마이크로타이터 플레이트는 PBS/T로 2회 및 PBS로 2회 세척하고 나서, 남아있는 결합된 포스파타아제 리포터 효소를 정량하기 위해 발색 기질로 p-니트로페닐 포스페이트(5 mM MgCl₂, 1 M Tris-HCl pH 8.0 중의 0.5 mg/mL)를 사용하여 검출하였다. 25℃에서 5분 후, SpectraMax 250 마이크로타이터 플레이트 리더(Molecular Devices, Sunnyvale, CA, USA)를 사용하여 405 nm에서의 흡광도를 측정하였다.

결과적으로, 가시광선이 조명된 ProtL^Caf337 변이체(SEQ ID NO: 86)는 Caf가 없는 ProtL에서 관찰되는 신호보다 더 낮긴 하나 Igg에 대해 친화성을 나타냈다(도 11B). 대조적으로, ProtL^Caf337 변이체에 대해 365 nm에서 자외선 조사 후 효소 활성에서의 명백한 감소가 관찰되나, 변형되지 않은 ProtL-ABD 융합 단백질은 다른 조명 조건 하에서 결합 활성에서의 어떠한 변화도 나타내지 않았다. 돌연변이체 ProtL^Caf347, ProtL^Caf360, ProtL^Caf364, ProtL^Caf368 및 ProtL^Caf369는 이들 상황에서 훨씬 적은 신호 감소를 보였다. 따라서, ProtL^Caf337는 IgG의 광-전환성 가역적 결합을 나타낸다.

이들 실험은 폴리펩타이드 서열에서 적당한 위치에서 통합된 비-천연 아미노산 Caf와 함께 고정된 결합 단백질(가공된 스트렙타비딘 또는 단백질 L)을 보유한 크로마토그래피 매트릭스는 경쟁 리간드 또는 완충액 이동을 적용할 필요없이 친화성 크로마토그래피의 전형적인 조건 하에서 타겟 단백질(여기서는 친화성 태그가 장착되거나 없이)의 가역적 결합 및 광-구동 용출에 사용될 수 있음을 입증한다.

본 발명은 다음의 뉴클레오타이드 및 아미노산 서열을 언급한다:
SEQ ID NO: 1: Caf를 포함하는 Strep -Tactin의 핵산 서열. Caf의 코돈은 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 2: Caf를 포함하는 Strep -Tactin의 아미노산 서열. Caf의 위치는 볼드체 및 밑줄로 표시된다.

하기에서, 예시 목적을 위해, Caf를 포함하는 Strep-Tactin의 아미노산 서열(SEQ ID NO: 2)은 상응하는 핵산 서열(SEQ ID NO: 1) 아래에 도시된다. Caf의 위치는 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 3: Caf를 포함하는 코어 스트렙타비딘의 핵산 서열. Caf의 코돈은 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 4: Caf를 포함하는 코어 스트렙타비딘의 아미노산 서열. Caf의 위치는 볼드체 및 밑줄로 표시된다.

하기에서, 예시 목적을 위해, Caf를 포함하는 코어 스트렙타비딘의 아미노산 서열(SEQ ID NO: 4)은 상응하는 핵산 서열(SEQ ID NO: 3) 아래에 도시된다. Caf의 위치는 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 5: Caf를 포함하는 가공되지 않은 스트렙타비딘(즉, 전-스트렙타비딘)의 핵산 서열. Caf의 코돈은 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 6: Caf를 포함하는 가공되지 않은 스트렙타비딘(즉, 전-스트렙타비딘)의 아미노산 서열. 스트렙타비딘의 분비를 지시하는 신호 서열은 밑줄로 표시된다. Caf의 위치는 볼드체 및 밑줄로 표시된다.

하기에서, 예시 목적을 위해, Caf를 포함하는 가공되지 않은 스트렙타비딘(즉, 전-스트렙타비딘)의 아미노산 서열(SEQ ID NO: 6)은 상응하는 핵산 서열(SEQ ID NO: 5) 아래에 도시된다. 스트렙타비딘의 분비를 지시하는 신호 서열은 밑줄로 표시된다. Caf의 위치는 볼드체 및 밑줄로 표시된다. 코어 스트렙타비딘의 서열은 Glu²⁵로 시작하여 Ser¹⁶³로 끝난다.

SEQ ID NO: 7: Strep-Tactin의 핵산 서열

SEQ ID NO: 8: Strep-Tactin의 아미노산 서열. Trp96는 볼드체 및 밑줄로 표시된다.

하기에서, 예시 목적을 위해, Strep-Tactin의 아미노산 서열(SEQ ID NO: 8)은 상응하는 핵산 서열(SEQ ID NO: 7) 아래에 도시된다. Trp의 위치는 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 9: 코어 스트렙타비딘의 핵산 서열

SEQ ID NO: 10: 코어 스트렙타비딘의 아미노산 서열(잔기 2-127은 UniProt database entry P22629에서 잔기 38-163에 상응함; 잔기 1은 시작 메티오닌임). Trp96는 볼드체 및 밑줄로 표시된다.

하기에서, 예시 목적을 위해, 코어 스트렙타비딘의 아미노산 서열(SEQ ID NO: 10)은 상응하는 핵산 서열(SEQ ID NO: 9) 아래에 도시된다. Trp96의 위치는 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 11: 가공되지 않은 스트렙타비딘(전-스트렙타비딘)의 핵산 서열.

SEQ ID NO: 12: 전-스트렙타비딘의 아미노산 서열. Trp132는 볼드체 및 밑줄로 표시된다.

하기에서, 예시 목적을 위해, 전-스트렙타비딘의 아미노산 서열(SEQ ID NO: 12)은 상응하는 핵산 서열(SEQ ID NO: 11) 아래에 도시된다. Trp132의 위치는 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 13: trep -tag의 아미노산 서열
AWRHPQFGG
SEQ ID NO: 14: Strep -tag II의 아미노산 서열
WSHPQFEK
SEQ ID NO: 15: myc-tag의 아미노산 서열(UniProt database entry P01106에서 잔기 410-419에 상응함)
EQKLISEEDL
SEQ ID NO: 16: 단백질 A의 도메인 Z의 아미노산 서열(UniProt database entry P38507에서 잔기 212-269에 해당). Caf 통합에 적당한 위치 Phe5, Gln9, Phe13, Tyr14, Glu25, Gln26, Arg27, Asn28 Ala29, Phe30, Ile31, Gln32, Lys35, Asp36, Asp37, Gln40, Asn43, Leu45, Glu47, Leu51, Asn52는 볼드체 및 밑줄로 표시된다.
VDNK F NKE Q QNA FY EILHLPNLNE EQRNAFIQ SL KDD PS Q SA N L L A E AKK LN DAQAPK
SEQ ID NO: 단백질 G의 C1 도메인의 아미노산 서열(UniProt database entry P19909에서 잔기 303-357에 해당). Caf 통합에 적당한 위치 Lys3, Ile5, Thr10, Thr16, Val28, Tyr32, Asp35는 볼드체 및 밑줄로 표시된다.
TY K L I LNGK T LKGET T TEAVDAATAEK V FKQ Y AN D NGVDGEWTYDDATKTFTVTE
SEQ ID NO: 18: 단백질 G의 C2 도메인의 아미노산 서열(UniProt database entry P19909에서 잔기 373-427에 해당). Caf 통합에 적당한 위치 Lys3, Val5, Thr10, Thr16, Val28, Tyr32, Asp35는 볼드체 및 밑줄로 표시된다.
TY K L V INGK T LKGET T TEAVDAATAEK V FKQ Y AN D NGVDGEWTYDDATKTFTVTE
SEQ ID NO: 19: 단백질 G의 C3 도메인의 아미노산 서열(UniProt database entry P19909에서 잔기 443-497에 해당). Caf 통합에 적당한 위치 Lys3, Val5, Thr10, Thr16, Ala28, Tyr32, Asp35는 볼드체 및 밑줄로 표시된다.
TY K L V INGK T LKGET T TKAVDAETAEK A FKQ Y AN D NGVDGVWTYDDATKTFTVTE
SEQ ID NO: 20: 단백질 L의 도메인 B1의 아미노산 서열(UniProt database entry Q51918에서 잔기 326-389에 해당). Caf 통합에 적당한 위치는 Thr5 (330), Asn9 (334), Ile11 (336), Phe12 (337), Lys16 (341), Phe 22 (347), Phe26 (351), Lys32 (357), Ala35 (360), Leu39 (364), Glu43 (368), Asn44 (369), Tyr47 (372)이고, 볼드체 및 밑줄로 표시된다.
KEEV T IKV N L IF ADG K TQTAE F KGT F EEATA K AY A YAD L LAK EN GE Y TADLEDGGNTINIKFAG
SEQ ID NO: 21:항-myc-tag 단클론 항체 클론 9E10의 중쇄의 아미노산 서열(GenBank database entry CAN87018에서 잔기 20-470에 해당). Caf 통합에 적당한 위치는 GenBank database entry CAN87018의 Tyr76, Phe121, Tyr122, Tyr123, Tyr124, Tyr128, Tyr129 및 Tyr130에 상응하는 잔기이고, 볼드체 및 밑줄로 표시된다. 보다 상세하게는, 아래 서열은 GenBank database entry CAN87018의 잔기 20으로 시작하므로, GenBank database entry CAN87018의 Tyr76, Phe121, Tyr122, Tyr123, Tyr124, Tyr128, Tyr129 및 Tyr130에 상응하는 위치는 아래 서열에서 각각 위치 Tyr57, Phe102, Tyr103, Tyr104, Tyr105, Tyr109, Tyr110 및 Tyr111이다.

SEQ ID NO: 22: 항-myc-tag 단클론 항체 클론 9E10의 경쇄의 아미노산 서열(GenBank database entry CAN87019에서 잔기 22-238에 상응함)

SEQ ID NO: 23: pSBX8.101d58의 핵산 서열

SEQ ID NO: 24: cat ^UAG119 의 핵산 서열

SEQ ID NO: 25: eGFP ^UAG39 의 핵산 서열

SEQ ID NO: 26: Nwt PylRS의 핵산 서열

SEQ ID NO: 27:
TAGCTGCATGGTTTTTGGTGATACCCTGG
SEQ ID NO: 28:
CCAGGGTATCACCAAAAACCATGCAGCTA
SEQ ID NO: 29: PylRS#1(Y349F)의 핵산 서열

SEQ ID NO: 30:
GAGCTTAACCCGGTCTCAGTTAGATCG
SEQ ID NO: 31:
GGTAGCGGTTGTACCCGTG
SEQ ID NO: 32:
GGGTACAACCGCTACCSNNCTGSNNAAASNNCACSNNTGTAAATTCTTCCAGGTGTT
SEQ ID NO: 33:
CTTTCAGCAGACGTTCGAGACCAAAACCTGCACCAATSNNGGGTTTATCAATACCCCATTC
SEQ ID NO: 34:
CTTTCAGCAGACGTTCGAGAC
SEQ ID NO: 35: CafRS#7의 핵산 서열

SEQ ID NO: 36: CafRS#7-R6의 핵산 서열

SEQ ID NO: 37:
GGCAGAATACGATCCAGTTTCCGSNNGTAGTTSNNSNNTGTCGGSNNCAGCATAGGACGCAGACAC
SEQ ID NO: 38:
CGGAAACTGGATCGTATTCTGCCTGGTCCTNNSAAANNSTTTGAAGTTGGTCCGTGCTATCGT
SEQ ID NO: 39: CafRS#29의 핵산 서열

SEQ ID NO: 40: CafRS#29-R5의 핵산 서열

SEQ ID NO: 41:
CAGAATACGATCCAGTTTCCGSNNGTAGTTATACAGTGTCGG
SEQ ID NO: 42:
GGGTACAACCGCTACCCATCTGGCCAAASNNCACSNNTGTAAATTCTTCCAGGTGTT
SEQ ID NO: 43: CafRS#30의 핵산 서열

SEQ ID NO: 44: pSAm1의 핵산 서열

SEQ ID NO: 45:
GCAGACGGaGCCCTGACCGGtACCTACTAGacggcgcgtG
SEQ ID NO: 46:
CacgcgccgtCTAGTAGGTaCCGGTCAGGGCtCCGTCTGC
SEQ ID NO: 47: SAm1 ^UAG44 의 핵산 서열

SEQ ID NO: 48:
GATCAACACCCAGTAGCTGCTGACCTCC
SEQ ID NO: 49:
GGAGGTCAGCAGCTACTGGGTGTTGATC
SEQ ID NO: 50:
GAGGCCAACGCCTAGAAGTCCACGCTGG
SEQ ID NO: 51:
CCAGCGTGGACTTCTAGGCGTTGGCCTC
SEQ ID NO: 52: SAm1 ^UAG120 의 핵산 서열

SEQ ID NO: 53: pSBX8.CafRS#30.d58의 핵산 서열

SEQ ID NO: 54: NpSBX8.CafRS#30.d47의 핵산 서열

SEQ ID NO: 55: pSBX8.CafRS#30.d53의 핵산 서열

SEQ ID NO: 56: pSBX8.CafRS#30.d51의 핵산 서열

SEQ ID NO: 57: pASK75-PhoA-strepII의 핵산 서열

SEQ ID NO: 58: 인간 알부민 결합 도메인(ABD)의 핵산 서열

SEQ ID NO: 59: 인간 알부민 결합 도메인(ABD)의 아미노산 서열
LAEAKVLANRELDKYGVSDYYKNLINNAKTVEGVKALIDEILAALP
SEQ ID NO: 60: ProtL-ABD 융합 단백질의 핵산 서열

SEQ ID NO: 61: ProtL-ABD 융합 단백질의 아미노산 서열. 메티오닌(밑줄)이 개시 코돈으로 첨가되었다.

하기에서, 예시 목적을 위해, ProtL-ABD의 아미노산 서열(SEQ ID NO: 61)은 상응하는 핵산 서열(SEQ ID NO: 60) 아래에 도시된다. 단백질 L 도메인 B1의 서열은 Lys³²⁶로 시작하고 Gly³⁸⁹로 끝난다(UniProt Q51918). 337, 347, 360, 364, 368 및 369 위치는 볼드체 및 밑줄로 표시된다.

SEQ ID NO: 62: pASK75-ProtL-ABD의 핵산 서열

SEQ ID NO: 63: AJR_ProtL_PHE337TAG_fw의 핵산 서열
CATTAAAGTTAATCTGATTTAGGCCGATGGTAAAAC
SEQ ID NO: 64: AJR_ProtL_PHE337TAG_rv의 핵산 서열
GTTTTACCATCGGCCTAAATCAGATTAACTTTAATG
SEQ ID NO: 65: AJR_ProtL_Y361N_L365S_fw의 핵산 서열
CAAAAGCCTATGCCAACGCCGATCTGAGCGCAAAAGAAAATGGTG
SEQ ID NO: 66: AJR_ProtL_Y361N_L365S_rv의 핵산 서열
CACCATTTTCTTTTGCGCTCAGATCGGCGTTGGCATAGGCTTTTG
SEQ ID NO: 67: ProtL ^UAG337 -ABD의 핵산 서열

SEQ ID NO: 68: AJR_ProtL_PHE347TAG_fw의 핵산 서열
CAGACCGCAGAATAGAAAGGCACCTTTG
SEQ ID NO: 69: AJR_ProtL_PHE347TAG_rv의 핵산 서열
CAAAGGTGCCTTTCTATTCTGCGGTCTG
SEQ ID NO: 70: AJR_ProtL_TYR361ALA_fw의 핵산 서열
CCGCAAAAGCCTATGCCGCGGCCGATCTGCTGGC
SEQ ID NO: 71: AJR_ProtL_TYR361ALA_rv의 핵산 서열
GCCAGCAGATCGGCCGCGGCATAGGCTTTTGCGG
SEQ ID NO: 72: ProtL ^UAG347 -ABD의 핵산 서열

SEQ ID NO: 73: AJR_ProtL_ALA360TAG_fw의 핵산 서열
CCGCAAAAGCCTATTAGTATGCCGATCTGC
SEQ ID NO: 74: AJR_ProtL_ALA360TAG_rv의 핵산 서열
GCAGATCGGCATACTAATAGGCTTTTGCGG
SEQ ID NO: 75: ProtL ^UAG360 -ABD의 핵산 서열

SEQ ID NO: 76: AJR_ProtL_LEU364TAG_fw의 핵산 서열
CTATGCCTATGCCGATTAGCTGGCAAAAGAAAATGG
SEQ ID NO: 77: AJR_ProtL_LEU364TAG_rv의 핵산 서열
CCATTTTCTTTTGCCAGCTAATCGGCATAGGCATAG
SEQ ID NO: 78: ProtL ^UAG364 -ABD의 핵산 서열

SEQ ID NO: 79: AJR_ProtL_GLU368TAG_fw의 핵산 서열
GATCTGCTGGCAAAATAGAATGGTGAATATACCG
SEQ ID NO: 80: AJR_ProtL_GLU368TAG_rv의 핵산 서열
CGGTATATTCACCATTCTATTTTGCCAGCAGATC
SEQ ID NO: 81: ProtL ^UAG368 -ABD의 핵산 서열

SEQ ID NO: 82: AJR_ProtL_ASN369TAG_fw의 핵산 서열
CTGCTGGCAAAAGAATAGGGTGAATATACCGC
SEQ ID NO: 83: AJR_ProtL_ASN369TAG_rv의 핵산 서열
GCGGTATATTCACCCTATTCTTTTGCCAGCAG
SEQ ID NO: 84: ProtL ^UAG369 -ABD의 핵산 서열

SEQ ID NO: 85: pSBX8.CafRS#30d71의 핵산 서열

SEQ ID NO: 86: ProtL ^UAG337 -ABD의 아미노산 서열. Caf의 위치는 볼드체 및 밑줄로 표시된다.

<110> Technische Universitaet Muenchen <120> Light-switchable polypeptide and uses thereof <130> I19O10C0125P/DE <150> EP 17 17 0516.3 <151> 2017-05-10 <160> 86 <170> KoPatentIn 3.0 <210> 1 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> Strep-Tactin comprising Caf <400> 1 atggaagcag gtatcaccgg cacctggtac aaccagctcg gctcgacctt catcgtgacc 60 gcgggtgcag acggagctct gaccggtacc tacgtcacgg cgcgtggcaa cgccgagagc 120 cgctacgtcc tgaccggtcg ttacgacagc gccccggcca ccgacggcag cggcaccgcc 180 ctcggttgga cggtggcctg gaagaataac taccgcaacg cccactccgc gaccacgtgg 240 agcggccagt acgtcggcgg cgccgaggcg aggatcaaca cccagtagct gctgacctcc 300 ggcaccaccg aggccaacgc ctggaagtcc acgctggtcg gccacgacac cttcaccaag 360 gtgaagccgt ccgccgcctc ctaa 384 <210> 2 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> Strep-Tactin comprising Caf <220> <221> UNSURE <222> (96) <223> modified amino acid Caf <400> 2 Met Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln Leu Gly Ser Thr 1 5 10 15 Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr Gly Thr Tyr Val 20 25 30 Thr Ala Arg Gly Asn Ala Glu Ser Arg Tyr Val Leu Thr Gly Arg Tyr 35 40 45 Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala Leu Gly Trp Thr 50 55 60 Val Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser Ala Thr Thr Trp 65 70 75 80 Ser Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile Asn Thr Gln Xaa 85 90 95 Leu Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp Lys Ser Thr Leu 100 105 110 Val Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser Ala Ala Ser 115 120 125 <210> 3 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> Core streptavidin comprising Caf <400> 3 atggaagcag gtatcaccgg cacctggtac aaccagctcg gctcgacctt catcgtgacc 60 gcgggcgccg acggcgccct gaccggaacc tacgagtcgg ccgtcggcaa cgccgagagc 120 cgctacgtcc tgaccggtcg ttacgacagc gccccggcca ccgacggcag cggcaccgcc 180 ctcggttgga cggtggcctg gaagaataac taccgcaacg cccactccgc gaccacgtgg 240 agcggccagt acgtcggcgg cgccgaggcg aggatcaaca cccagtagct gctgacctcc 300 ggcaccaccg aggccaacgc ctggaagtcc acgctggtcg gccacgacac cttcaccaag 360 gtgaagccgt ccgccgcctc ctaa 384 <210> 4 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> Core streptavidin comprising Caf <220> <221> UNSURE <222> (96) <223> modified amino acid Caf <400> 4 Met Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln Leu Gly Ser Thr 1 5 10 15 Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr Gly Thr Tyr Glu 20 25 30 Ser Ala Val Gly Asn Ala Glu Ser Arg Tyr Val Leu Thr Gly Arg Tyr 35 40 45 Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala Leu Gly Trp Thr 50 55 60 Val Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser Ala Thr Thr Trp 65 70 75 80 Ser Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile Asn Thr Gln Xaa 85 90 95 Leu Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp Lys Ser Thr Leu 100 105 110 Val Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser Ala Ala Ser 115 120 125 <210> 5 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> Unprocessed streptavidin (i.e. pre-streptavidin) comprising Caf <400> 5 atgcgcaaga tcgtcgttgc agccatcgcc gtttccctga ccacggtctc gattacggcc 60 agcgcttcgg cagacccctc caaggactcg aaggcccagg tctcggccgc cgaggccggc 120 atcaccggca cctggtacaa ccagctcggc tcgaccttca tcgtgaccgc gggcgccgac 180 ggcgccctga ccggaaccta cgagtcggcc gtcggcaacg ccgagagccg ctacgtcctg 240 accggtcgtt acgacagcgc cccggccacc gacggcagcg gcaccgccct cggttggacg 300 gtggcctgga agaataacta ccgcaacgcc cactccgcga ccacgtggag cggccagtac 360 gtcggcggcg ccgaggcgag gatcaacacc cagtagctgc tgacctccgg caccaccgag 420 gccaacgcct ggaagtccac gctggtcggc cacgacacct tcaccaaggt gaagccgtcc 480 gccgcctcca tcgacgcggc gaagaaggcc ggcgtcaaca acggcaaccc gctcgacgcc 540 gttcagcagt ag 552 <210> 6 <211> 183 <212> PRT <213> Artificial Sequence <220> <223> Unprocessed streptavidin (i.e. pre-streptavidin) comprising Caf <220> <221> UNSURE <222> (132) <223> modified amino acid Caf <400> 6 Met Arg Lys Ile Val Val Ala Ala Ile Ala Val Ser Leu Thr Thr Val 1 5 10 15 Ser Ile Thr Ala Ser Ala Ser Ala Asp Pro Ser Lys Asp Ser Lys Ala 20 25 30 Gln Val Ser Ala Ala Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln 35 40 45 Leu Gly Ser Thr Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr 50 55 60 Gly Thr Tyr Glu Ser Ala Val Gly Asn Ala Glu Ser Arg Tyr Val Leu 65 70 75 80 Thr Gly Arg Tyr Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala 85 90 95 Leu Gly Trp Thr Val Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser 100 105 110 Ala Thr Thr Trp Ser Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile 115 120 125 Asn Thr Gln Xaa Leu Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp 130 135 140 Lys Ser Thr Leu Val Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser 145 150 155 160 Ala Ala Ser Ile Asp Ala Ala Lys Lys Ala Gly Val Asn Asn Gly Asn 165 170 175 Pro Leu Asp Ala Val Gln Gln 180 <210> 7 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> Strep-Tactin <400> 7 atggaagcag gtatcaccgg cacctggtac aaccagctcg gctcgacctt catcgtgacc 60 gcgggtgcag acggagctct gaccggtacc tacgtcacgg cgcgtggcaa cgccgagagc 120 cgctacgtcc tgaccggtcg ttacgacagc gccccggcca ccgacggcag cggcaccgcc 180 ctcggttgga cggtggcctg gaagaataac taccgcaacg cccactccgc gaccacgtgg 240 agcggccagt acgtcggcgg cgccgaggcg aggatcaaca cccagtggct gctgacctcc 300 ggcaccaccg aggccaacgc ctggaagtcc acgctggtcg gccacgacac cttcaccaag 360 gtgaagccgt ccgccgcctc ctaa 384 <210> 8 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> Strep-Tactin <400> 8 Met Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln Leu Gly Ser Thr 1 5 10 15 Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr Gly Thr Tyr Val 20 25 30 Thr Ala Arg Gly Asn Ala Glu Ser Arg Tyr Val Leu Thr Gly Arg Tyr 35 40 45 Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala Leu Gly Trp Thr 50 55 60 Val Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser Ala Thr Thr Trp 65 70 75 80 Ser Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile Asn Thr Gln Trp 85 90 95 Leu Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp Lys Ser Thr Leu 100 105 110 Val Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser Ala Ala Ser 115 120 125 <210> 9 <211> 384 <212> DNA <213> Streptomyces avidinii <400> 9 atggaagcag gtatcaccgg cacctggtac aaccagctcg gctcgacctt catcgtgacc 60 gcgggcgccg acggcgccct gaccggaacc tacgagtcgg ccgtcggcaa cgccgagagc 120 cgctacgtcc tgaccggtcg ttacgacagc gccccggcca ccgacggcag cggcaccgcc 180 ctcggttgga cggtggcctg gaagaataac taccgcaacg cccactccgc gaccacgtgg 240 agcggccagt acgtcggcgg cgccgaggcg aggatcaaca cccagtggct gctgacctcc 300 ggcaccaccg aggccaacgc ctggaagtcc acgctggtcg gccacgacac cttcaccaag 360 gtgaagccgt ccgccgcctc ctaa 384 <210> 10 <211> 127 <212> PRT <213> Streptomyces avidinii <400> 10 Met Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln Leu Gly Ser Thr 1 5 10 15 Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr Gly Thr Tyr Glu 20 25 30 Ser Ala Val Gly Asn Ala Glu Ser Arg Tyr Val Leu Thr Gly Arg Tyr 35 40 45 Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala Leu Gly Trp Thr 50 55 60 Val Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser Ala Thr Thr Trp 65 70 75 80 Ser Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile Asn Thr Gln Trp 85 90 95 Leu Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp Lys Ser Thr Leu 100 105 110 Val Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser Ala Ala Ser 115 120 125 <210> 11 <211> 552 <212> DNA <213> Streptomyces avidinii <400> 11 atgcgcaaga tcgtcgttgc agccatcgcc gtttccctga ccacggtctc gattacggcc 60 agcgcttcgg cagacccctc caaggactcg aaggcccagg tctcggccgc cgaggccggc 120 atcaccggca cctggtacaa ccagctcggc tcgaccttca tcgtgaccgc gggcgccgac 180 ggcgccctga ccggaaccta cgagtcggcc gtcggcaacg ccgagagccg ctacgtcctg 240 accggtcgtt acgacagcgc cccggccacc gacggcagcg gcaccgccct cggttggacg 300 gtggcctgga agaataacta ccgcaacgcc cactccgcga ccacgtggag cggccagtac 360 gtcggcggcg ccgaggcgag gatcaacacc cagtggctgc tgacctccgg caccaccgag 420 gccaacgcct ggaagtccac gctggtcggc cacgacacct tcaccaaggt gaagccgtcc 480 gccgcctcca tcgacgcggc gaagaaggcc ggcgtcaaca acggcaaccc gctcgacgcc 540 gttcagcagt ag 552 <210> 12 <211> 183 <212> PRT <213> Streptomyces avidinii <400> 12 Met Arg Lys Ile Val Val Ala Ala Ile Ala Val Ser Leu Thr Thr Val 1 5 10 15 Ser Ile Thr Ala Ser Ala Ser Ala Asp Pro Ser Lys Asp Ser Lys Ala 20 25 30 Gln Val Ser Ala Ala Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln 35 40 45 Leu Gly Ser Thr Phe Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr 50 55 60 Gly Thr Tyr Glu Ser Ala Val Gly Asn Ala Glu Ser Arg Tyr Val Leu 65 70 75 80 Thr Gly Arg Tyr Asp Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala 85 90 95 Leu Gly Trp Thr Val Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser 100 105 110 Ala Thr Thr Trp Ser Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile 115 120 125 Asn Thr Gln Trp Leu Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp 130 135 140 Lys Ser Thr Leu Val Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser 145 150 155 160 Ala Ala Ser Ile Asp Ala Ala Lys Lys Ala Gly Val Asn Asn Gly Asn 165 170 175 Pro Leu Asp Ala Val Gln Gln 180 <210> 13 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Strep-tag <400> 13 Ala Trp Arg His Pro Gln Phe Gly Gly 1 5 <210> 14 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Strep-tag II <400> 14 Trp Ser His Pro Gln Phe Glu Lys 1 5 <210> 15 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> myc-tag <400> 15 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 16 <211> 58 <212> PRT <213> Artificial Sequence <220> <223> Domain Z of protein A <220> <221> VARIANT <222> (5) <223> Caf <220> <221> VARIANT <222> (9) <223> Caf <220> <221> VARIANT <222> (13) <223> Caf <220> <221> VARIANT <222> (14) <223> Caf <220> <221> VARIANT <222> (25) <223> Caf <220> <221> VARIANT <222> (26) <223> Caf <220> <221> VARIANT <222> (27) <223> Caf <220> <221> VARIANT <222> (28) <223> Caf <220> <221> VARIANT <222> (29) <223> Caf <220> <221> VARIANT <222> (30) <223> Caf <220> <221> VARIANT <222> (31) <223> Caf <220> <221> VARIANT <222> (32) <223> Caf <220> <221> VARIANT <222> (35) <223> Caf <220> <221> VARIANT <222> (36) <223> Caf <220> <221> VARIANT <222> (37) <223> Caf <220> <221> VARIANT <222> (40) <223> Caf <220> <221> VARIANT <222> (43) <223> Caf <220> <221> VARIANT <222> (45) <223> Caf <220> <221> VARIANT <222> (47) <223> Caf <220> <221> VARIANT <222> (51) <223> Caf <220> <221> VARIANT <222> (52) <223> Caf <400> 16 Val Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile 1 5 10 15 Leu His Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile Gln 20 25 30 Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala 35 40 45 Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys 50 55 <210> 17 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> C1 domain of protein G <220> <221> VARIANT <222> (3) <223> Caf <220> <221> VARIANT <222> (5) <223> Caf <220> <221> VARIANT <222> (10) <223> Caf <220> <221> VARIANT <222> (16) <223> Caf <220> <221> VARIANT <222> (28) <223> Caf <220> <221> VARIANT <222> (32) <223> Caf <220> <221> VARIANT <222> (35) <223> Caf <400> 17 Thr Tyr Lys Leu Ile Leu Asn Gly Lys Thr Leu Lys Gly Glu Thr Thr 1 5 10 15 Thr Glu Ala Val Asp Ala Ala Thr Ala Glu Lys Val Phe Lys Gln Tyr 20 25 30 Ala Asn Asp Asn Gly Val Asp Gly Glu Trp Thr Tyr Asp Asp Ala Thr 35 40 45 Lys Thr Phe Thr Val Thr Glu 50 55 <210> 18 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> C2 domain of protein G <220> <221> VARIANT <222> (3) <223> Caf <220> <221> VARIANT <222> (5) <223> Caf <220> <221> VARIANT <222> (10) <223> Caf <220> <221> VARIANT <222> (16) <223> Caf <220> <221> VARIANT <222> (28) <223> Caf <220> <221> VARIANT <222> (32) <223> Caf <220> <221> VARIANT <222> (35) <223> Caf <400> 18 Thr Tyr Lys Leu Val Ile Asn Gly Lys Thr Leu Lys Gly Glu Thr Thr 1 5 10 15 Thr Glu Ala Val Asp Ala Ala Thr Ala Glu Lys Val Phe Lys Gln Tyr 20 25 30 Ala Asn Asp Asn Gly Val Asp Gly Glu Trp Thr Tyr Asp Asp Ala Thr 35 40 45 Lys Thr Phe Thr Val Thr Glu 50 55 <210> 19 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> C3 domain of protein G <220> <221> VARIANT <222> (3) <223> Caf <220> <221> VARIANT <222> (5) <223> Caf <220> <221> VARIANT <222> (10) <223> Caf <220> <221> VARIANT <222> (16) <223> Caf <220> <221> VARIANT <222> (28) <223> Caf <220> <221> VARIANT <222> (32) <223> Caf <220> <221> VARIANT <222> (35) <223> Caf <400> 19 Thr Tyr Lys Leu Val Ile Asn Gly Lys Thr Leu Lys Gly Glu Thr Thr 1 5 10 15 Thr Lys Ala Val Asp Ala Glu Thr Ala Glu Lys Ala Phe Lys Gln Tyr 20 25 30 Ala Asn Asp Asn Gly Val Asp Gly Val Trp Thr Tyr Asp Asp Ala Thr 35 40 45 Lys Thr Phe Thr Val Thr Glu 50 55 <210> 20 <211> 64 <212> PRT <213> Artificial Sequence <220> <223> Domain B1 of protein L <220> <221> VARIANT <222> (5) <223> Caf <220> <221> VARIANT <222> (9) <223> Caf <220> <221> VARIANT <222> (11) <223> Caf <220> <221> VARIANT <222> (12) <223> Caf <220> <221> VARIANT <222> (16) <223> Caf <220> <221> VARIANT <222> (22) <223> Caf <220> <221> VARIANT <222> (26) <223> Caf <220> <221> VARIANT <222> (32) <223> Caf <220> <221> VARIANT <222> (35) <223> Caf <220> <221> VARIANT <222> (39) <223> Caf <220> <221> VARIANT <222> (43) <223> Caf <220> <221> VARIANT <222> (44) <223> Caf <220> <221> VARIANT <222> (47) <223> Caf <400> 20 Lys Glu Glu Val Thr Ile Lys Val Asn Leu Ile Phe Ala Asp Gly Lys 1 5 10 15 Thr Gln Thr Ala Glu Phe Lys Gly Thr Phe Glu Glu Ala Thr Ala Lys 20 25 30 Ala Tyr Ala Tyr Ala Asp Leu Leu Ala Lys Glu Asn Gly Glu Tyr Thr 35 40 45 Ala Asp Leu Glu Asp Gly Gly Asn Thr Ile Asn Ile Lys Phe Ala Gly 50 55 60 <210> 21 <211> 451 <212> PRT <213> Artificial Sequence <220> <223> Heavy chain of the anti-myc-tag monoclonal antibody clone 9E10 <220> <221> VARIANT <222> (57) <223> Caf <220> <221> VARIANT <222> (102) <223> Caf <220> <221> VARIANT <222> (103) <223> Caf <220> <221> VARIANT <222> (104) <223> Caf <220> <221> VARIANT <222> (105) <223> Caf <220> <221> VARIANT <222> (109) <223> Caf <220> <221> VARIANT <222> (110) <223> Caf <220> <221> VARIANT <222> (111) <223> Caf <400> 21 Glu Val His Leu Val Glu Ser Gly Gly Asp Leu Val Lys Pro Gly Gly 1 5 10 15 Ser Leu Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser His Tyr 20 25 30 Gly Met Ser Trp Val Arg Gln Thr Pro Asp Lys Arg Leu Glu Trp Val 35 40 45 Ala Thr Ile Gly Ser Arg Gly Thr Tyr Thr His Tyr Pro Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Asp Lys Asn Ala Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Lys Ser Glu Asp Thr Ala Met Tyr Tyr Cys 85 90 95 Ala Arg Arg Ser Glu Phe Tyr Tyr Tyr Gly Asn Thr Tyr Tyr Tyr Ser 100 105 110 Ala Met Asp Tyr Trp Gly Gln Gly Ala Ser Val Thr Val Ser Ser Ala 115 120 125 Lys Thr Thr Pro Pro Ser Val Tyr Pro Leu Ala Pro Gly Ser Ala Ala 130 135 140 Gln Thr Asn Ser Met Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe 145 150 155 160 Pro Glu Pro Val Thr Val Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly 165 170 175 Val His Thr Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu Ser 180 185 190 Ser Ser Val Thr Val Pro Ser Ser Thr Trp Pro Ser Glu Thr Val Thr 195 200 205 Cys Asn Val Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile 210 215 220 Val Pro Arg Asp Cys Gly Cys Lys Pro Cys Ile Cys Thr Val Pro Glu 225 230 235 240 Val Ser Ser Val Phe Ile Phe Pro Pro Lys Pro Lys Asp Val Leu Thr 245 250 255 Ile Thr Leu Thr Pro Lys Val Thr Cys Val Val Val Asp Ile Ser Lys 260 265 270 Asp Asp Pro Glu Val Gln Phe Ser Trp Phe Val Asp Asp Val Glu Val 275 280 285 His Thr Ala Gln Thr Gln Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe 290 295 300 Arg Ser Val Ser Glu Leu Pro Ile Met His Gln Asp Trp Pro Asn Gly 305 310 315 320 Lys Glu Phe Lys Cys Arg Val Asn Ser Ala Ala Phe Pro Ala Pro Ile 325 330 335 Glu Lys Thr Ile Ser Lys Thr Lys Gly Arg Pro Lys Ala Pro Gln Val 340 345 350 Tyr Thr Ile Pro Pro Pro Lys Glu Gln Met Ala Lys Asp Lys Val Ser 355 360 365 Leu Thr Cys Met Ile Thr Asp Phe Phe Pro Glu Asp Ile Thr Val Glu 370 375 380 Trp Gln Trp Asn Gly Gln Pro Ala Glu Asn Tyr Lys Asn Thr Gln Pro 385 390 395 400 Ile Met Asn Thr Asn Gly Ser Tyr Phe Val Tyr Ser Lys Leu Asn Val 405 410 415 Gln Lys Ser Asn Trp Glu Ala Gly Asn Thr Phe Thr Cys Ser Val Leu 420 425 430 His Glu Gly Leu His Asn His His Thr Glu Lys Ser Leu Ser His Ser 435 440 445 Pro Gly Lys 450 <210> 22 <211> 218 <212> PRT <213> Artificial Sequence <220> <223> Light chain of the anti-myc-tag monoclonal antibody clone 9E10 <400> 22 Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Leu Gly 1 5 10 15 Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Glu Ser Val Asp Asn Tyr 20 25 30 Gly Phe Ser Phe Met Asn Trp Phe Gln Gln Lys Pro Gly Gln Pro Pro 35 40 45 Lys Leu Leu Ile Tyr Ala Ile Ser Asn Arg Gly Ser Gly Val Pro Ala 50 55 60 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Ser Leu Asn Ile His 65 70 75 80 Pro Val Glu Glu Asp Asp Pro Ala Met Tyr Phe Cys Gln Gln Thr Lys 85 90 95 Glu Val Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg 100 105 110 Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Pro Ser Ser Glu Gln 115 120 125 Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe Leu Asn Asn Leu Tyr 130 135 140 Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp Gly Ser Glu Arg Gln 145 150 155 160 Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp Ser Lys Asp Ser Thr 165 170 175 Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys Asp Glu Tyr Glu Arg 180 185 190 His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys Thr Ser Thr Ser Pro 195 200 205 Ile Val Lys Ser Phe Asn Arg Asn Glu Cys 210 215 <210> 23 <211> 5798 <212> DNA <213> Artificial Sequence <220> <223> pSBX8.101d58 <400> 23 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgacccgaca ccataacgct 60 cggttgccgc cgggcgtttt ttattggcca gatgattaat tcctaatttt tgttgacact 120 ctatcattga tagagttatt ttaccactcc ctatcagtga tagagaaaag tgaaatgaat 180 agttcgacaa aatctagata acgagggcaa aaaatgtcta aaggtgaaga acttttcact 240 ggagttgtcc caattcttgt tgaattagat ggtgatgtta atgggcacaa attttctgtc 300 agtggagagg gtgaaggtga tgcaacatag ggaaaactta cccttaaatt tatttgcact 360 actggaaaac tacctgttcc atggccaaca cttgtcacta ctttgactta tggtgttcaa 420 tgcttttcaa gatacccgga tcatatgaaa cggcatgact ttttcaagag tgccatgccc 480 gaaggttatg tacaggaaag aactatattt ttcaaagatg acgggaacta caagacacgt 540 gctgaagtca agtttgaagg tgataccctt gttaatagaa tcgagttaaa aggtattgat 600 tttaaagaag atggaaacat tcttggacac aaattggaat acaactataa ctcacacaat 660 gtatacatca tggcagacaa acaaaagaat ggaatcaaag ttaacttcaa aattagacac 720 aacattgaag atggaagcgt tcaactagca gaccattatc aacaaaatac tccaattggc 780 gatggccctg tccttttacc agacaaccat tacctgtcca cacaatctgc cctttcgaaa 840 gatcccaacg aaaagaggga ccacatggtc cttcttgagt ttgtaacagc tgctgggatt 900 acacatggca tggatgaact gtaccaaagc gcttggagcc acccgcagtt cgaaaaataa 960 taagcttgac ctgtgaagtg aaaaatggcg cacattgtgc gacatttttt ttgtctgccg 1020 tttaccgcta ctgcgcggca gtacgccttt ggtttatcca ttttatacaa tccatgtaaa 1080 aaagggccct gaaattcagg accctttctg agctcattac aggttggtgc taataccatt 1140 atagtagctc tcggaacggc ttgcacgttt aatgtttttg aaaccgtgca ttactttcag 1200 cagacgttcg agaccaaaac ctgcaccaat ccagggttta tcaatacccc attcacgatc 1260 caggctaacc ggaccaacaa ctgcgctact cagttccaga tcaccgtgca taatatccag 1320 ggtatcacca taaaccatgc agctatcacc aacaatttca aagtcgattt ccaggtaatc 1380 cagaaactct ttaatcagtg cttccagatt ttcacgggta caaccgctac ccatctgaca 1440 aaagttcacc attgtaaatt cttccaggtg ttctttacca tcactttctt tacgatagca 1500 cggaccaact tcaaagattt tgataggacc aggcagaata cgatccagtt tccgcaggta 1560 gttatacagt gtcggtgcca gcataggacg cagacacagg tttttatcaa cgcgaaagat 1620 ttgtttgctc agttcggtat cattgttaat gcccatacgt tcaacatatt ctgccggaat 1680 cagaatcggg cttttgattt ccagaaaacc gcgatccacg aaaaatttgg taatatcacg 1740 ttccagttta cccagataat cttcgcggtc gttggtatat aagcgttgaa aatcattttt 1800 acgacgagta accagttccg gttccagttc acgaaacggt tttgccatat tcaggctgat 1860 tttatcttca ggactcagca gtgcttcaac acgatctaac tgagaccggg ttaagctcgg 1920 tgccggtgcg cttgccggaa cgctgctatt cggggtgctt tttgccggac tcggaacgct 1980 acggctggta ttggtgcttg cttttgcgct aacgctattt tccagaggtt tcggtgcgcg 2040 actaacgctt ttcggcattg cttttttaac tttaggtgcg ctcacaacac gaactttaac 2100 tgaatttttg ctttcggtgc tgcgtgtcag aaaattgtta atatcttcat cactcacacg 2160 gcagcgttta caggttttac gatatttgtg atgacgaaat gcgcgtgcgg tacgacagct 2220 acggctatta ttcacaacca gatgatcgcc acaggccatt tcaatataga ttttgctgcg 2280 gctaacttcg tgatgtttga ttttatgcag ggtgccggta cggctcatcc acagacctgt 2340 tgcgctaatc agaacatcca gcggtttttt atccatatcg tacctcctta aatttctagg 2400 ttgtgaccta ggtgatttag tttaccagtg caaaagaaat gtcaaaagag aagggcgtga 2460 atttaacgcg gttccagcgc aaagacttca aaacctgcgt cggtgccgat ttcggcctat 2520 tggttaaaaa atgagctgag ttctagtaaa aaaaatcctt agctttcgct aaggatctgc 2580 agtggcggaa accccgggaa tctaacccgg ctgaacggat ttagagtcca ttcgatctac 2640 atgatcaggt ttccgaattc agcgttacaa gtattacaca aagtttttta tgttgagaat 2700 atttttttga tggggcatgg cgcaaaacct ttcgcggtat ggcatgcagg tggcactttt 2760 cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 2820 ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 2880 agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 2940 tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3000 gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3060 gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3120 attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3180 gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3240 agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3300 ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3360 cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3420 gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 3480 cggcaacaat tgatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 3540 gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tggctctcgc 3600 ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 3660 acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 3720 ctgattaagc attggtaaga attaatgatg tctcgtttag ataaaagtaa agtgattaac 3780 agcgcattag agctgcttaa tgaggtcgga atcgaaggtt taacaacccg taaactcgcc 3840 cagaagctag gtgtagagca gcctacattg tattggcatg taaaaaataa gcgggctttg 3900 ctcgacgcct tagccattga gatgttagat aggcaccata ctcacttttg ccctttagaa 3960 ggggaaagct ggcaagattt tttacgtaat aacgctaaaa gttttagatg tgctttacta 4020 agtcatcgcg atggagcaaa agtacattta ggtacacggc ctacagaaaa acagtatgaa 4080 actctcgaaa atcaattagc ctttttatgc caacaaggtt tttcactaga gaatgcatta 4140 tatgcactca gcgcagtggg gcattttact ttaggttgcg tattggaaga tcaagagcat 4200 caagtcgcta aagaagaaag ggaaacacct actactgata gtatgccgcc attattacga 4260 caagctatcg aattatttga tcaccaaggt gcagagccag ccttcttatt cggccttgaa 4320 ttgatcatat gcggattaga aaaacaactt aaatgtgaaa gtgggtctta atgagaatat 4380 tcgttttcac ccaaggaata gaggatatgg agaaaaaaat cactggatat accaccgttg 4440 atatatccca atggcatcgt aaagaacatt ttgaggcatt tcagtcagtt gctcaatgta 4500 cctataacca gaccgttcag ctggatatta cggccttttt aaagaccgta aagaaaaata 4560 agcacaagtt ttatccggcc tttattcaca ttcttgcccg cctgatgaat gctcatccgg 4620 agttccgtat ggcaatgaaa gacggtgagc tggtgatatg ggatagtgtt cacccttgtt 4680 acaccgtttt ccatgagcaa actgaaacgt tttcatcgct ctggagtgaa taccacgact 4740 agttccggca gtttctacac atatattcgc aagatgtggc gtgttacggt gaaaacctgg 4800 cctatttccc taaagggttt attgagaata tgtttttcgt ctcagccaat ccctgggtga 4860 gtttcaccag ttttgattta aacgtggcca atatggacaa cttcttcgcc cccgttttca 4920 ctatgggcaa atattatacg caaggcgaca aggtgctgat gccgctggcg attcaggttc 4980 atcatgccgt ttgtgatggc ttccatgtcg gcagaatgct taatgaatta caacagtact 5040 gcgatgagtg gcagggcggg gcgtaatagc ttcactagtt taaaaggatc taggtgaaga 5100 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5160 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5220 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5280 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 5340 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5400 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5460 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5520 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 5580 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 5640 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 5700 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 5760 gggggcggag cctatggaaa aacgccagca acgcggcc 5798 <210> 24 <211> 660 <212> DNA <213> Artificial Sequence <220> <223> CatUAG119 <400> 24 atggagaaaa aaatcactgg atataccacc gttgatatat cccaatggca tcgtaaagaa 60 cattttgagg catttcagtc agttgctcaa tgtacctata accagaccgt tcagctggat 120 attacggcct ttttaaagac cgtaaagaaa aataagcaca agttttatcc ggcctttatt 180 cacattcttg cccgcctgat gaatgctcat ccggagttcc gtatggcaat gaaagacggt 240 gagctggtga tatgggatag tgttcaccct tgttacaccg ttttccatga gcaaactgaa 300 acgttttcat cgctctggag tgaataccac gactagttcc ggcagtttct acacatatat 360 tcgcaagatg tggcgtgtta cggtgaaaac ctggcctatt tccctaaagg gtttattgag 420 aatatgtttt tcgtctcagc caatccctgg gtgagtttca ccagttttga tttaaacgtg 480 gccaatatgg acaacttctt cgcccccgtt ttcactatgg gcaaatatta tacgcaaggc 540 gacaaggtgc tgatgccgct ggcgattcag gttcatcatg ccgtttgtga tggcttccat 600 gtcggcagaa tgcttaatga attacaacag tactgcgatg agtggcaggg cggggcgtaa 660 660 <210> 25 <211> 714 <212> DNA <213> Artificial Sequence <220> <223> eGFPUAG39 <400> 25 atgtctaaag gtgaagaact tttcactgga gttgtcccaa ttcttgttga attagatggt 60 gatgttaatg ggcacaaatt ttctgtcagt ggagagggtg aaggtgatgc aacataggga 120 aaacttaccc ttaaatttat ttgcactact ggaaaactac ctgttccatg gccaacactt 180 gtcactactt tgacttatgg tgttcaatgc ttttcaagat acccggatca tatgaaacgg 240 catgactttt tcaagagtgc catgcccgaa ggttatgtac aggaaagaac tatatttttc 300 aaagatgacg ggaactacaa gacacgtgct gaagtcaagt ttgaaggtga tacccttgtt 360 aatagaatcg agttaaaagg tattgatttt aaagaagatg gaaacattct tggacacaaa 420 ttggaataca actataactc acacaatgta tacatcatgg cagacaaaca aaagaatgga 480 atcaaagtta acttcaaaat tagacacaac attgaagatg gaagcgttca actagcagac 540 cattatcaac aaaatactcc aattggcgat ggccctgtcc ttttaccaga caaccattac 600 ctgtccacac aatctgccct ttcgaaagat cccaacgaaa agagggacca catggtcctt 660 cttgagtttg taacagctgc tgggattaca catggcatgg atgaactgta ccaa 714 <210> 26 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> wt PylRS <400> 26 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctggc accgacactg tataactacc tgcggaaact ggatcgtatt 840 ctgcctggtc ctatcaaaat ctttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacaatggtg aacttttgtc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttatggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctg 1257 <210> 27 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 27 tagctgcatg gtttttggtg ataccctgg 29 <210> 28 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 28 ccagggtatc accaaaaacc atgcagcta 29 <210> 29 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> PylRS#1 (Y349F) <400> 29 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctggc accgacactg tataactacc tgcggaaact ggatcgtatt 840 ctgcctggtc ctatcaaaat ctttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacaatggtg aacttttgtc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttttggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctg 1257 <210> 30 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 30 gagcttaacc cggtctcagt tagatcg 27 <210> 31 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 31 ggtagcggtt gtacccgtg 19 <210> 32 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> variation <222> (18) <223> /replace="a,c,g,t" <220> <221> variation <222> (19) <223> /replace="a,c,g,t" <220> <221> variation <222> (24) <223> /replace="a,c,g,t" <220> <221> variation <222> (25) <223> /replace="a,c,g,t" <220> <221> variation <222> (30) <223> /replace="a,c,g,t" <220> <221> variation <222> (31) <223> /replace="a,c,g,t" <220> <221> variation <222> (36) <223> /replace="a,c,g,t" <220> <221> variation <222> (37) <223> /replace="a,c,g,t" <400> 32 gggtacaacc gctaccsnnc tgsnnaaasn ncacsnntgt aaattcttcc aggtgtt 57 <210> 33 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> variation <222> (39) <223> /replace="a,c,g,t" <220> <221> variation <222> (40) <223> /replace="a,c,g,t" <400> 33 ctttcagcag acgttcgaga ccaaaacctg caccaatsnn gggtttatca ataccccatt 60 c 61 <210> 34 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 34 ctttcagcag acgttcgaga c 21 <210> 35 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> CafRS#7 <400> 35 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctggc accgacactg tataactacc tgcggaaact ggatcgtatt 840 ctgcctggtc ctatcaaaat ctttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacacaggtg tcctttggcc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttttggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctg 1257 <210> 36 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> CafRS#7-R6 <220> <221> variation <222> (799) <223> /replace="a,c,g,t" <220> <221> variation <222> (800) <223> /replace="a,c,g,t" <220> <221> variation <222> (801) <223> /replace="a,c,g,t" <220> <221> variation <222> (808) <223> /replace="a,c,g,t" <220> <221> variation <222> (809) <223> /replace="a,c,g,t" <220> <221> variation <222> (811) <223> /replace="a,c,g,t" <220> <221> variation <222> (812) <223> /replace="a,c,g,t" <220> <221> variation <222> (820) <223> /replace="a,c,g,t" <220> <221> variation <222> (821) <223> /replace="a,c,g,t" <220> <221> variation <222> (822) <223> /replace="a,c,g,t" <220> <221> variation <222> (853) <223> /replace="a,c,g,t" <220> <221> variation <222> (854) <223> /replace="a,c,g,t" <220> <221> variation <222> (859) <223> /replace="a,c,g,t" <220> <221> variation <222> (860) <223> /replace="a,c,g,t" <400> 36 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctgnn nccgacanns nnsaactacn nncggaaact ggatcgtatt 840 ctgcctggtc ctnnsaaann stttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacacaggtg tcctttggcc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttttggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctg 1257 <210> 37 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> variation <222> (25) <223> /replace="a,c,g,t" <220> <221> variation <222> (26) <223> /replace="a,c,g,t" <220> <221> variation <222> (34) <223> /replace="a,c,g,t" <220> <221> variation <222> (35) <223> /replace="a,c,g,t" <220> <221> variation <222> (37) <223> /replace="a,c,g,t" <220> <221> variation <222> (38) <223> /replace="a,c,g,t" <220> <221> variation <222> (46) <223> /replace="a,c,g,t" <220> <221> variation <222> (47) <223> /replace="a,c,g,t" <400> 37 ggcagaatac gatccagttt ccgsnngtag ttsnnsnntg tcggsnncag cataggacgc 60 agacac 66 <210> 38 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> variation <222> (31) <223> /replace="a,c,g,t" <220> <221> variation <222> (32) <223> /replace="a,c,g,t" <220> <221> variation <222> (37) <223> /replace="a,c,g,t" <220> <221> variation <222> (38) <223> /replace="a,c,g,t" <400> 38 cggaaactgg atcgtattct gcctggtcct nnsaaannst ttgaagttgg tccgtgctat 60 cgt 63 <210> 39 <211> 1386 <212> DNA <213> Artificial Sequence <220> <223> CafRS#29 <400> 39 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctgac cccgacattg ttcaactacg cgcggaaact ggatcgtatt 840 ctgcctggtc ctaacaagag ctttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacacaggtg tcctttggcc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttttggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctgtaa 1260 tgagctcaga gagggtcctg attttcaggg cccttttttt acgtggtatt gtataaaatg 1320 gataaaccaa aggcgtactg ccgcgcagta gcggtaaacg gcagacaaaa aaaatgtcgc 1380 acagtg 1386 <210> 40 <211> 1386 <212> DNA <213> Artificial Sequence <220> <223> CafRS#29-R5 <220> <221> variation <222> (820) <223> /replace="a,c,g,t" <220> <221> variation <222> (821) <223> /replace="a,c,g,t" <220> <221> variation <222> (853) <223> /replace="a,c,g,t" <220> <221> variation <222> (854) <223> /replace="a,c,g,t" <220> <221> variation <222> (859) <223> /replace="a,c,g,t" <220> <221> variation <222> (860) <223> /replace="a,c,g,t" <220> <221> variation <222> (925) <223> /replace="a,c,g,t" <220> <221> variation <222> (926) <223> /replace="a,c,g,t" <220> <221> variation <222> (931) <223> /replace="a,c,g,t" <220> <221> variation <222> (932) <223> /replace="a,c,g,t" <400> 40 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctgac cccgacattg ttcaactacn nscggaaact ggatcgtatt 840 ctgcctggtc ctnnsaagnn stttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacannsgtg nnstttggcc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttttggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctgtaa 1260 tgagctcaga gagggtcctg attttcaggg cccttttttt acgtggtatt gtataaaatg 1320 gataaaccaa aggcgtactg ccgcgcagta gcggtaaacg gcagacaaaa aaaatgtcgc 1380 acagtg 1386 <210> 41 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> variation <222> (23) <223> /replace="a,c,g,t" <220> <221> variation <222> (24) <223> /replace="a,c,g,t" <400> 41 cagaatacga tccagtttcc gsnngtagtt atacagtgtc gg 42 <210> 42 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <220> <221> variation <222> (30) <223> /replace="a,c,g,t" <220> <221> variation <222> (31) <223> /replace="a,c,g,t" <220> <221> variation <222> (36) <223> /replace="a,c,g,t" <220> <221> variation <222> (37) <223> /replace="a,c,g,t" <400> 42 gggtacaacc gctacccatc tggccaaasn ncacsnntgt aaattcttcc aggtgtt 57 <210> 43 <211> 1260 <212> DNA <213> Artificial Sequence <220> <223> CafRS#30 <400> 43 atggataaaa aaccgctgga tgttctgatt agcgcaacag gtctgtggat gagccgtacc 60 ggcaccctgc ataaaatcaa acatcacgaa gttagccgca gcaaaatcta tattgaaatg 120 gcctgtggcg atcatctggt tgtgaataat agccgtagct gtcgtaccgc acgcgcattt 180 cgtcatcaca aatatcgtaa aacctgtaaa cgctgccgtg tgagtgatga agatattaac 240 aattttctga cacgcagcac cgaaagcaaa aattcagtta aagttcgtgt tgtgagcgca 300 cctaaagtta aaaaagcaat gccgaaaagc gttagtcgcg caccgaaacc tctggaaaat 360 agcgttagcg caaaagcaag caccaatacc agccgtagcg ttccgagtcc ggcaaaaagc 420 accccgaata gcagcgttcc ggcaagcgca ccggcaccga gcttaacccg gtctcagtta 480 gatcgtgttg aagcactgct gagtcctgaa gataaaatca gcctgaatat ggcaaaaccg 540 tttcgtgaac tggaaccgga actggttact cgtcgtaaaa atgattttca acgcttatat 600 accaacgacc gcgaagatta tctgggtaaa ctggaacgtg atattaccaa atttttcgtg 660 gatcgcggtt ttctggaaat caaaagcccg attctgattc cggcagaata tgttgaacgt 720 atgggcatta acaatgatac cgaactgagc aaacaaatct ttcgcgttga taaaaacctg 780 tgtctgcgtc ctatgctgac cccgacattg tataactaca gccggaaact ggatcgtatt 840 ctgcctggtc cttccaaagt ctttgaagtt ggtccgtgct atcgtaaaga aagtgatggt 900 aaagaacacc tggaagaatt tacaatggtg gtgtttggcc agatgggtag cggttgtacc 960 cgtgaaaatc tggaagcact gattaaagag tttctggatt acctggaaat cgactttgaa 1020 attgttggtg atagctgcat ggtttttggt gataccctgg atattatgca cggtgatctg 1080 gaactgagta gcgcagttgt tggtccggtt agcctggatc gtgaatgggg tattgataaa 1140 ccctggattg gtgcaggttt tggtctcgaa cgtctgctga aagtaatgca cggtttcaaa 1200 aacattaaac gtgcaagccg ttccgagagc tactataatg gtattagcac caacctgtaa 1260 1260 <210> 44 <211> 3139 <212> DNA <213> Artificial Sequence <220> <223> pSAm1 <400> 44 gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 60 atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 120 agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 180 ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 240 gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 300 gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 360 tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 420 acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 480 aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 540 cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 600 gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 660 cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 720 tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 780 tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 840 ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 900 tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 960 gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 1020 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 1080 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 1140 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 1200 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 1260 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 1320 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 1380 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 1440 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 1500 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 1560 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 1620 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 1680 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 1740 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 1800 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 1860 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 1920 cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca 1980 ggatctcgat cccgcgaaat taatacgact cactataggg agaccacaac ggtttccctc 2040 tagaaataat tttgtttaac tttaagaagg agatatacat atggaagcag gtatcaccgg 2100 cacctggtac aaccagctcg gctcgacctt catcgtgacc gcgggtgcag acggagctct 2160 gaccggtacc tacgtcacgg cgcgtggcaa cgccgagagc cgctacgtcc tgaccggtcg 2220 ttacgacagc gccccggcca ccgacggcag cggcaccgcc ctcggttgga cggtggcctg 2280 gaagaataac taccgcaacg cccactccgc gaccacgtgg agcggccagt acgtcggcgg 2340 cgccgaggcg aggatcaaca cccagtggct gctgacctcc ggcaccaccg aggccaacgc 2400 ctggaagtcc acgctggtcg gccacgacac cttcaccaag gtgaagccgt ccgccgcctc 2460 ctaataagct tgatccggct gctaacaaag cccgaaagga agctgagttg gctgctgcca 2520 ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg aggggttttt 2580 tgctgaaagg aggaactata tccggatctg gcgtaatagc gaagaggccc gcaccgatcg 2640 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2700 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2760 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2820 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2880 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2940 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 3000 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 3060 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3120 aacgcttaca atttaggtg 3139 <210> 45 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 45 gcagacggag ccctgaccgg tacctactag acggcgcgtg 40 <210> 46 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 46 cacgcgccgt ctagtaggta ccggtcaggg ctccgtctgc 40 <210> 47 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> SAm1UAG44 <400> 47 atggaagcag gtatcaccgg cacctggtac aaccagctcg gctcgacctt catcgtgacc 60 gcgggtgcag acggagccct gaccggtacc tactagacgg cgcgtggcaa cgccgagagc 120 cgctacgtcc tgaccggtcg ttacgacagc gccccggcca ccgacggcag cggcaccgcc 180 ctcggttgga cggtggcctg gaagaataac taccgcaacg cccactccgc gaccacgtgg 240 agcggccagt acgtcggcgg cgccgaggcg aggatcaaca cccagtggct gctgacctcc 300 ggcaccaccg aggccaacgc ctggaagtcc acgctggtcg gccacgacac cttcaccaag 360 gtgaagccgt ccgccgcctc ctaa 384 <210> 48 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 48 gatcaacacc cagtagctgc tgacctcc 28 <210> 49 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 49 ggaggtcagc agctactggg tgttgatc 28 <210> 50 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 50 gaggccaacg cctagaagtc cacgctgg 28 <210> 51 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 51 ccagcgtgga cttctaggcg ttggcctc 28 <210> 52 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> SAm1UAG120 <400> 52 atggaagcag gtatcaccgg cacctggtac aaccagctcg gctcgacctt catcgtgacc 60 gcgggtgcag acggagctct gaccggtacc tacgtcacgg cgcgtggcaa cgccgagagc 120 cgctacgtcc tgaccggtcg ttacgacagc gccccggcca ccgacggcag cggcaccgcc 180 ctcggttgga cggtggcctg gaagaataac taccgcaacg cccactccgc gaccacgtgg 240 agcggccagt acgtcggcgg cgccgaggcg aggatcaaca cccagtggct gctgacctcc 300 ggcaccaccg aggccaacgc ctagaagtcc acgctggtcg gccacgacac cttcaccaag 360 gtgaagccgt ccgccgcctc ctaa 384 <210> 53 <211> 5798 <212> DNA <213> Artificial Sequence <220> <223> pSBX8.CafRS#30.d58 <400> 53 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgacccgaca ccataacgct 60 cggttgccgc cgggcgtttt ttattggcca gatgattaat tcctaatttt tgttgacact 120 ctatcattga tagagttatt ttaccactcc ctatcagtga tagagaaaag tgaaatgaat 180 agttcgacaa aatctagata acgagggcaa aaaatgtcta aaggtgaaga acttttcact 240 ggagttgtcc caattcttgt tgaattagat ggtgatgtta atgggcacaa attttctgtc 300 agtggagagg gtgaaggtga tgcaacatag ggaaaactta cccttaaatt tatttgcact 360 actggaaaac tacctgttcc atggccaaca cttgtcacta ctttgactta tggtgttcaa 420 tgcttttcaa gatacccgga tcatatgaaa cggcatgact ttttcaagag tgccatgccc 480 gaaggttatg tacaggaaag aactatattt ttcaaagatg acgggaacta caagacacgt 540 gctgaagtca agtttgaagg tgataccctt gttaatagaa tcgagttaaa aggtattgat 600 tttaaagaag atggaaacat tcttggacac aaattggaat acaactataa ctcacacaat 660 gtatacatca tggcagacaa acaaaagaat ggaatcaaag ttaacttcaa aattagacac 720 aacattgaag atggaagcgt tcaactagca gaccattatc aacaaaatac tccaattggc 780 gatggccctg tccttttacc agacaaccat tacctgtcca cacaatctgc cctttcgaaa 840 gatcccaacg aaaagaggga ccacatggtc cttcttgagt ttgtaacagc tgctgggatt 900 acacatggca tggatgaact gtaccaaagc gcttggagcc acccgcagtt cgaaaaataa 960 taagcttgac ctgtgaagtg aaaaatggcg cacattgtgc gacatttttt ttgtctgccg 1020 tttaccgcta ctgcgcggca gtacgccttt ggtttatcca ttttatacaa tccatgtaaa 1080 aaagggccct gaaattcagg accctttctg agctcattac aggttggtgc taataccatt 1140 atagtagctc tcggaacggc ttgcacgttt aatgtttttg aaaccgtgca ttactttcag 1200 cagacgttcg agaccaaaac ctgcaccaat ccagggttta tcaatacccc attcacgatc 1260 caggctaacc ggaccaacaa ctgcgctact cagttccaga tcaccgtgca taatatccag 1320 ggtatcacca aaaaccatgc agctatcacc aacaatttca aagtcgattt ccaggtaatc 1380 cagaaactct ttaatcagtg cttccagatt ttcacgggta caaccgctac ccatctggcc 1440 aaacaccacc attgtaaatt cttccaggtg ttctttacca tcactttctt tacgatagca 1500 cggaccaact tcaaagactt tggaaggacc aggcagaata cgatccagtt tccggctgta 1560 gttatacaat gtcggggtca gcataggacg cagacacagg tttttatcaa cgcgaaagat 1620 ttgtttgctc agttcggtat cattgttaat gcccatacgt tcaacatatt ctgccggaat 1680 cagaatcggg cttttgattt ccagaaaacc gcgatccacg aaaaatttgg taatatcacg 1740 ttccagttta cccagataat cttcgcggtc gttggtatat aagcgttgaa aatcattttt 1800 acgacgagta accagttccg gttccagttc acgaaacggt tttgccatat tcaggctgat 1860 tttatcttca ggactcagca gtgcttcaac acgatctaac tgagaccggg ttaagctcgg 1920 tgccggtgcg cttgccggaa cgctgctatt cggggtgctt tttgccggac tcggaacgct 1980 acggctggta ttggtgcttg cttttgcgct aacgctattt tccagaggtt tcggtgcgcg 2040 actaacgctt ttcggcattg cttttttaac tttaggtgcg ctcacaacac gaactttaac 2100 tgaatttttg ctttcggtgc tgcgtgtcag aaaattgtta atatcttcat cactcacacg 2160 gcagcgttta caggttttac gatatttgtg atgacgaaat gcgcgtgcgg tacgacagct 2220 acggctatta ttcacaacca gatgatcgcc acaggccatt tcaatataga ttttgctgcg 2280 gctaacttcg tgatgtttga ttttatgcag ggtgccggta cggctcatcc acagacctgt 2340 tgcgctaatc agaacatcca gcggtttttt atccatatcg tacctcctta aatttctagg 2400 ttgtgaccta ggtgatttag tttaccagtg caaaagaaat gtcaaaagag aagggcgtga 2460 atttaacgcg gttccagcgc aaagacttca aaacctgcgt cggtgccgat ttcggcctat 2520 tggttaaaaa atgagctgag ttctagtaaa aaaaatcctt agctttcgct aaggatctgc 2580 agtggcggaa accccgggaa tctaacccgg ctgaacggat ttagagtcca ttcgatctac 2640 atgatcaggt ttccgaattc agcgttacaa gtattacaca aagtttttta tgttgagaat 2700 atttttttga tggggcatgg cgcaaaacct ttcgcggtat ggcatgcagg tggcactttt 2760 cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 2820 ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 2880 agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 2940 tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3000 gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3060 gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3120 attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3180 gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3240 agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3300 ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3360 cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3420 gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 3480 cggcaacaat tgatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 3540 gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tggctctcgc 3600 ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 3660 acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 3720 ctgattaagc attggtaaga attaatgatg tctcgtttag ataaaagtaa agtgattaac 3780 agcgcattag agctgcttaa tgaggtcgga atcgaaggtt taacaacccg taaactcgcc 3840 cagaagctag gtgtagagca gcctacattg tattggcatg taaaaaataa gcgggctttg 3900 ctcgacgcct tagccattga gatgttagat aggcaccata ctcacttttg ccctttagaa 3960 ggggaaagct ggcaagattt tttacgtaat aacgctaaaa gttttagatg tgctttacta 4020 agtcatcgcg atggagcaaa agtacattta ggtacacggc ctacagaaaa acagtatgaa 4080 actctcgaaa atcaattagc ctttttatgc caacaaggtt tttcactaga gaatgcatta 4140 tatgcactca gcgcagtggg gcattttact ttaggttgcg tattggaaga tcaagagcat 4200 caagtcgcta aagaagaaag ggaaacacct actactgata gtatgccgcc attattacga 4260 caagctatcg aattatttga tcaccaaggt gcagagccag ccttcttatt cggccttgaa 4320 ttgatcatat gcggattaga aaaacaactt aaatgtgaaa gtgggtctta atgagaatat 4380 tcgttttcac ccaaggaata gaggatatgg agaaaaaaat cactggatat accaccgttg 4440 atatatccca atggcatcgt aaagaacatt ttgaggcatt tcagtcagtt gctcaatgta 4500 cctataacca gaccgttcag ctggatatta cggccttttt aaagaccgta aagaaaaata 4560 agcacaagtt ttatccggcc tttattcaca ttcttgcccg cctgatgaat gctcatccgg 4620 agttccgtat ggcaatgaaa gacggtgagc tggtgatatg ggatagtgtt cacccttgtt 4680 acaccgtttt ccatgagcaa actgaaacgt tttcatcgct ctggagtgaa taccacgact 4740 agttccggca gtttctacac atatattcgc aagatgtggc gtgttacggt gaaaacctgg 4800 cctatttccc taaagggttt attgagaata tgtttttcgt ctcagccaat ccctgggtga 4860 gtttcaccag ttttgattta aacgtggcca atatggacaa cttcttcgcc cccgttttca 4920 ctatgggcaa atattatacg caaggcgaca aggtgctgat gccgctggcg attcaggttc 4980 atcatgccgt ttgtgatggc ttccatgtcg gcagaatgct taatgaatta caacagtact 5040 gcgatgagtg gcagggcggg gcgtaatagc ttcactagtt taaaaggatc taggtgaaga 5100 tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 5160 cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 5220 gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 5280 taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 5340 ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 5400 tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 5460 ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 5520 cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 5580 agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 5640 gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 5700 atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 5760 gggggcggag cctatggaaa aacgccagca acgcggcc 5798 <210> 54 <211> 5435 <212> DNA <213> Artificial Sequence <220> <223> pSBX8.CafRS#30.d47 <400> 54 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgacccgaca ccataacgct 60 cggttgccgc cgggcgtttt ttattggcca gatgattaat tcctaatttt tgttgacact 120 ctatcattga tagagttatt ttaccactcc ctatcagtga tagagaaaag tgaaatgaat 180 agttcgacaa aatctagata acgagggcaa aaaatggaag caggtatcac cggcacctgg 240 tacaaccagc tcggctcgac cttcatcgtg accgcgggtg cagacggagc cctgaccggt 300 acctactaga cggcgcgtgg caacgccgag agccgctacg tcctgaccgg tcgttacgac 360 agcgccccgg ccaccgacgg cagcggcacc gccctcggtt ggacggtggc ctggaagaat 420 aactaccgca acgcccactc cgcgaccacg tggagcggcc agtacgtcgg cggcgccgag 480 gcgaggatca acacccagtg gctgctgacc tccggcacca ccgaggccaa cgcctggaag 540 tccacgctgg tcggccacga caccttcacc aaggtgaagc cgtccgccgc ctcctaataa 600 gcttgacctg tgaagtgaaa aatggcgcac attgtgcgac attttttttg tctgccgttt 660 accgctactg cgcggcagta cgcctttggt ttatccattt tatacaatcc atgtaaaaaa 720 gggccctgaa attcaggacc ctttctgagc tcattacagg ttggtgctaa taccattata 780 gtagctctcg gaacggcttg cacgtttaat gtttttgaaa ccgtgcatta ctttcagcag 840 acgttcgaga ccaaaacctg caccaatcca gggtttatca ataccccatt cacgatccag 900 gctaaccgga ccaacaactg cgctactcag ttccagatca ccgtgcataa tatccagggt 960 atcaccaaaa accatgcagc tatcaccaac aatttcaaag tcgatttcca ggtaatccag 1020 aaactcttta atcagtgctt ccagattttc acgggtacaa ccgctaccca tctggccaaa 1080 caccaccatt gtaaattctt ccaggtgttc tttaccatca ctttctttac gatagcacgg 1140 accaacttca aagactttgg aaggaccagg cagaatacga tccagtttcc ggctgtagtt 1200 atacaatgtc ggggtcagca taggacgcag acacaggttt ttatcaacgc gaaagatttg 1260 tttgctcagt tcggtatcat tgttaatgcc catacgttca acatattctg ccggaatcag 1320 aatcgggctt ttgatttcca gaaaaccgcg atccacgaaa aatttggtaa tatcacgttc 1380 cagtttaccc agataatctt cgcggtcgtt ggtatataag cgttgaaaat catttttacg 1440 acgagtaacc agttccggtt ccagttcacg aaacggtttt gccatattca ggctgatttt 1500 atcttcagga ctcagcagtg cttcaacacg atctaactga gaccgggtta agctcggtgc 1560 cggtgcgctt gccggaacgc tgctattcgg ggtgcttttt gccggactcg gaacgctacg 1620 gctggtattg gtgcttgctt ttgcgctaac gctattttcc agaggtttcg gtgcgcgact 1680 aacgcttttc ggcattgctt ttttaacttt aggtgcgctc acaacacgaa ctttaactga 1740 atttttgctt tcggtgctgc gtgtcagaaa attgttaata tcttcatcac tcacacggca 1800 gcgtttacag gttttacgat atttgtgatg acgaaatgcg cgtgcggtac gacagctacg 1860 gctattattc acaaccagat gatcgccaca ggccatttca atatagattt tgctgcggct 1920 aacttcgtga tgtttgattt tatgcagggt gccggtacgg ctcatccaca gacctgttgc 1980 gctaatcaga acatccagcg gttttttatc catatcgtac ctccttaaat ttctaggttg 2040 tgacctaggt gatttagttt accagtgcaa aagaaatgtc aaaagagaag ggcgtgaatt 2100 taacgcggtt ccagcgcaaa gacttcaaaa cctgcgtcgg tgccgatttc ggcctattgg 2160 ttaaaaaatg agctgagttc tagtaaaaaa aatccttagc tttcgctaag gatctgcagt 2220 ggcggaaacc ccgggaatct aacccggctg aacggattta gagtccattc gatctacatg 2280 atcaggtttc cgaattcagc gttacaagta ttacacaaag ttttttatgt tgagaatatt 2340 tttttgatgg ggcatggcgc aaaacctttc gcggtatggc atgcaggtgg cacttttcgg 2400 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 2460 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 2520 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 2580 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 2640 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 2700 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 2760 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 2820 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 2880 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 2940 ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 3000 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 3060 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 3120 caacaattga tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 3180 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg ctctcgcggt 3240 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 3300 gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 3360 attaagcatt ggtaagaatt aatgatgtct cgtttagata aaagtaaagt gattaacagc 3420 gcattagagc tgcttaatga ggtcggaatc gaaggtttaa caacccgtaa actcgcccag 3480 aagctaggtg tagagcagcc tacattgtat tggcatgtaa aaaataagcg ggctttgctc 3540 gacgccttag ccattgagat gttagatagg caccatactc acttttgccc tttagaaggg 3600 gaaagctggc aagatttttt acgtaataac gctaaaagtt ttagatgtgc tttactaagt 3660 catcgcgatg gagcaaaagt acatttaggt acacggccta cagaaaaaca gtatgaaact 3720 ctcgaaaatc aattagcctt tttatgccaa caaggttttt cactagagaa tgcattatat 3780 gcactcagcg cagtggggca ttttacttta ggttgcgtat tggaagatca agagcatcaa 3840 gtcgctaaag aagaaaggga aacacctact actgatagta tgccgccatt attacgacaa 3900 gctatcgaat tatttgatca ccaaggtgca gagccagcct tcttattcgg ccttgaattg 3960 atcatatgcg gattagaaaa acaacttaaa tgtgaaagtg ggtcttaatg agaatattcg 4020 ttttcaccca aggaatagag gatatggaga aaaaaatcac tggatatacc accgttgata 4080 tatcccaatg gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct 4140 ataaccagac cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc 4200 acaagtttta tccggccttt attcacattc ttgcccgcct gatgaatgct catccggagt 4260 tccgtatggc aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca 4320 ccgttttcca tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgactagt 4380 tccggcagtt tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct 4440 atttccctaa agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt 4500 tcaccagttt tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacta 4560 tgggcaaata ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc 4620 atgccgtttg tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg 4680 atgagtggca gggcggggcg taatagcttc actagtttaa aaggatctag gtgaagatcc 4740 tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 4800 accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 4860 gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 4920 caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 4980 tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 5040 ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 5100 tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 5160 gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 5220 tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 5280 gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 5340 gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 5400 ggcggagcct atggaaaaac gccagcaacg cggcc 5435 <210> 55 <211> 5435 <212> DNA <213> Artificial Sequence <220> <223> pSBX8.CafRS#30.d53 <400> 55 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgacccgaca ccataacgct 60 cggttgccgc cgggcgtttt ttattggcca gatgattaat tcctaatttt tgttgacact 120 ctatcattga tagagttatt ttaccactcc ctatcagtga tagagaaaag tgaaatgaat 180 agttcgacaa aatctagata acgagggcaa aaaatggaag caggtatcac cggcacctgg 240 tacaaccagc tcggctcgac cttcatcgtg accgcgggtg cagacggagc tctgaccggt 300 acctacgtca cggcgcgtgg caacgccgag agccgctacg tcctgaccgg tcgttacgac 360 agcgccccgg ccaccgacgg cagcggcacc gccctcggtt ggacggtggc ctggaagaat 420 aactaccgca acgcccactc cgcgaccacg tggagcggcc agtacgtcgg cggcgccgag 480 gcgaggatca acacccagta gctgctgacc tccggcacca ccgaggccaa cgcctggaag 540 tccacgctgg tcggccacga caccttcacc aaggtgaagc cgtccgccgc ctcctaataa 600 gcttgacctg tgaagtgaaa aatggcgcac attgtgcgac attttttttg tctgccgttt 660 accgctactg cgcggcagta cgcctttggt ttatccattt tatacaatcc atgtaaaaaa 720 gggccctgaa attcaggacc ctttctgagc tcattacagg ttggtgctaa taccattata 780 gtagctctcg gaacggcttg cacgtttaat gtttttgaaa ccgtgcatta ctttcagcag 840 acgttcgaga ccaaaacctg caccaatcca gggtttatca ataccccatt cacgatccag 900 gctaaccgga ccaacaactg cgctactcag ttccagatca ccgtgcataa tatccagggt 960 atcaccaaaa accatgcagc tatcaccaac aatttcaaag tcgatttcca ggtaatccag 1020 aaactcttta atcagtgctt ccagattttc acgggtacaa ccgctaccca tctggccaaa 1080 caccaccatt gtaaattctt ccaggtgttc tttaccatca ctttctttac gatagcacgg 1140 accaacttca aagactttgg aaggaccagg cagaatacga tccagtttcc ggctgtagtt 1200 atacaatgtc ggggtcagca taggacgcag acacaggttt ttatcaacgc gaaagatttg 1260 tttgctcagt tcggtatcat tgttaatgcc catacgttca acatattctg ccggaatcag 1320 aatcgggctt ttgatttcca gaaaaccgcg atccacgaaa aatttggtaa tatcacgttc 1380 cagtttaccc agataatctt cgcggtcgtt ggtatataag cgttgaaaat catttttacg 1440 acgagtaacc agttccggtt ccagttcacg aaacggtttt gccatattca ggctgatttt 1500 atcttcagga ctcagcagtg cttcaacacg atctaactga gaccgggtta agctcggtgc 1560 cggtgcgctt gccggaacgc tgctattcgg ggtgcttttt gccggactcg gaacgctacg 1620 gctggtattg gtgcttgctt ttgcgctaac gctattttcc agaggtttcg gtgcgcgact 1680 aacgcttttc ggcattgctt ttttaacttt aggtgcgctc acaacacgaa ctttaactga 1740 atttttgctt tcggtgctgc gtgtcagaaa attgttaata tcttcatcac tcacacggca 1800 gcgtttacag gttttacgat atttgtgatg acgaaatgcg cgtgcggtac gacagctacg 1860 gctattattc acaaccagat gatcgccaca ggccatttca atatagattt tgctgcggct 1920 aacttcgtga tgtttgattt tatgcagggt gccggtacgg ctcatccaca gacctgttgc 1980 gctaatcaga acatccagcg gttttttatc catatcgtac ctccttaaat ttctaggttg 2040 tgacctaggt gatttagttt accagtgcaa aagaaatgtc aaaagagaag ggcgtgaatt 2100 taacgcggtt ccagcgcaaa gacttcaaaa cctgcgtcgg tgccgatttc ggcctattgg 2160 ttaaaaaatg agctgagttc tagtaaaaaa aatccttagc tttcgctaag gatctgcagt 2220 ggcggaaacc ccgggaatct aacccggctg aacggattta gagtccattc gatctacatg 2280 atcaggtttc cgaattcagc gttacaagta ttacacaaag ttttttatgt tgagaatatt 2340 tttttgatgg ggcatggcgc aaaacctttc gcggtatggc atgcaggtgg cacttttcgg 2400 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 2460 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 2520 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 2580 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 2640 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 2700 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 2760 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 2820 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 2880 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 2940 ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 3000 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 3060 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 3120 caacaattga tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 3180 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg ctctcgcggt 3240 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 3300 gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 3360 attaagcatt ggtaagaatt aatgatgtct cgtttagata aaagtaaagt gattaacagc 3420 gcattagagc tgcttaatga ggtcggaatc gaaggtttaa caacccgtaa actcgcccag 3480 aagctaggtg tagagcagcc tacattgtat tggcatgtaa aaaataagcg ggctttgctc 3540 gacgccttag ccattgagat gttagatagg caccatactc acttttgccc tttagaaggg 3600 gaaagctggc aagatttttt acgtaataac gctaaaagtt ttagatgtgc tttactaagt 3660 catcgcgatg gagcaaaagt acatttaggt acacggccta cagaaaaaca gtatgaaact 3720 ctcgaaaatc aattagcctt tttatgccaa caaggttttt cactagagaa tgcattatat 3780 gcactcagcg cagtggggca ttttacttta ggttgcgtat tggaagatca agagcatcaa 3840 gtcgctaaag aagaaaggga aacacctact actgatagta tgccgccatt attacgacaa 3900 gctatcgaat tatttgatca ccaaggtgca gagccagcct tcttattcgg ccttgaattg 3960 atcatatgcg gattagaaaa acaacttaaa tgtgaaagtg ggtcttaatg agaatattcg 4020 ttttcaccca aggaatagag gatatggaga aaaaaatcac tggatatacc accgttgata 4080 tatcccaatg gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct 4140 ataaccagac cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc 4200 acaagtttta tccggccttt attcacattc ttgcccgcct gatgaatgct catccggagt 4260 tccgtatggc aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca 4320 ccgttttcca tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgactagt 4380 tccggcagtt tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct 4440 atttccctaa agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt 4500 tcaccagttt tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacta 4560 tgggcaaata ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc 4620 atgccgtttg tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg 4680 atgagtggca gggcggggcg taatagcttc actagtttaa aaggatctag gtgaagatcc 4740 tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 4800 accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 4860 gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 4920 caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 4980 tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 5040 ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 5100 tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 5160 gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 5220 tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 5280 gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 5340 gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 5400 ggcggagcct atggaaaaac gccagcaacg cggcc 5435 <210> 56 <211> 5435 <212> DNA <213> Artificial Sequence <220> <223> pSBX8.CafRS#30.d51 <400> 56 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgacccgaca ccataacgct 60 cggttgccgc cgggcgtttt ttattggcca gatgattaat tcctaatttt tgttgacact 120 ctatcattga tagagttatt ttaccactcc ctatcagtga tagagaaaag tgaaatgaat 180 agttcgacaa aatctagata acgagggcaa aaaatggaag caggtatcac cggcacctgg 240 tacaaccagc tcggctcgac cttcatcgtg accgcgggtg cagacggagc tctgaccggt 300 acctacgtca cggcgcgtgg caacgccgag agccgctacg tcctgaccgg tcgttacgac 360 agcgccccgg ccaccgacgg cagcggcacc gccctcggtt ggacggtggc ctggaagaat 420 aactaccgca acgcccactc cgcgaccacg tggagcggcc agtacgtcgg cggcgccgag 480 gcgaggatca acacccagtg gctgctgacc tccggcacca ccgaggccaa cgcctagaag 540 tccacgctgg tcggccacga caccttcacc aaggtgaagc cgtccgccgc ctcctaataa 600 gcttgacctg tgaagtgaaa aatggcgcac attgtgcgac attttttttg tctgccgttt 660 accgctactg cgcggcagta cgcctttggt ttatccattt tatacaatcc atgtaaaaaa 720 gggccctgaa attcaggacc ctttctgagc tcattacagg ttggtgctaa taccattata 780 gtagctctcg gaacggcttg cacgtttaat gtttttgaaa ccgtgcatta ctttcagcag 840 acgttcgaga ccaaaacctg caccaatcca gggtttatca ataccccatt cacgatccag 900 gctaaccgga ccaacaactg cgctactcag ttccagatca ccgtgcataa tatccagggt 960 atcaccaaaa accatgcagc tatcaccaac aatttcaaag tcgatttcca ggtaatccag 1020 aaactcttta atcagtgctt ccagattttc acgggtacaa ccgctaccca tctggccaaa 1080 caccaccatt gtaaattctt ccaggtgttc tttaccatca ctttctttac gatagcacgg 1140 accaacttca aagactttgg aaggaccagg cagaatacga tccagtttcc ggctgtagtt 1200 atacaatgtc ggggtcagca taggacgcag acacaggttt ttatcaacgc gaaagatttg 1260 tttgctcagt tcggtatcat tgttaatgcc catacgttca acatattctg ccggaatcag 1320 aatcgggctt ttgatttcca gaaaaccgcg atccacgaaa aatttggtaa tatcacgttc 1380 cagtttaccc agataatctt cgcggtcgtt ggtatataag cgttgaaaat catttttacg 1440 acgagtaacc agttccggtt ccagttcacg aaacggtttt gccatattca ggctgatttt 1500 atcttcagga ctcagcagtg cttcaacacg atctaactga gaccgggtta agctcggtgc 1560 cggtgcgctt gccggaacgc tgctattcgg ggtgcttttt gccggactcg gaacgctacg 1620 gctggtattg gtgcttgctt ttgcgctaac gctattttcc agaggtttcg gtgcgcgact 1680 aacgcttttc ggcattgctt ttttaacttt aggtgcgctc acaacacgaa ctttaactga 1740 atttttgctt tcggtgctgc gtgtcagaaa attgttaata tcttcatcac tcacacggca 1800 gcgtttacag gttttacgat atttgtgatg acgaaatgcg cgtgcggtac gacagctacg 1860 gctattattc acaaccagat gatcgccaca ggccatttca atatagattt tgctgcggct 1920 aacttcgtga tgtttgattt tatgcagggt gccggtacgg ctcatccaca gacctgttgc 1980 gctaatcaga acatccagcg gttttttatc catatcgtac ctccttaaat ttctaggttg 2040 tgacctaggt gatttagttt accagtgcaa aagaaatgtc aaaagagaag ggcgtgaatt 2100 taacgcggtt ccagcgcaaa gacttcaaaa cctgcgtcgg tgccgatttc ggcctattgg 2160 ttaaaaaatg agctgagttc tagtaaaaaa aatccttagc tttcgctaag gatctgcagt 2220 ggcggaaacc ccgggaatct aacccggctg aacggattta gagtccattc gatctacatg 2280 atcaggtttc cgaattcagc gttacaagta ttacacaaag ttttttatgt tgagaatatt 2340 tttttgatgg ggcatggcgc aaaacctttc gcggtatggc atgcaggtgg cacttttcgg 2400 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 2460 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 2520 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 2580 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 2640 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 2700 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 2760 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 2820 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 2880 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 2940 ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 3000 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 3060 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 3120 caacaattga tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 3180 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg ctctcgcggt 3240 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 3300 gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 3360 attaagcatt ggtaagaatt aatgatgtct cgtttagata aaagtaaagt gattaacagc 3420 gcattagagc tgcttaatga ggtcggaatc gaaggtttaa caacccgtaa actcgcccag 3480 aagctaggtg tagagcagcc tacattgtat tggcatgtaa aaaataagcg ggctttgctc 3540 gacgccttag ccattgagat gttagatagg caccatactc acttttgccc tttagaaggg 3600 gaaagctggc aagatttttt acgtaataac gctaaaagtt ttagatgtgc tttactaagt 3660 catcgcgatg gagcaaaagt acatttaggt acacggccta cagaaaaaca gtatgaaact 3720 ctcgaaaatc aattagcctt tttatgccaa caaggttttt cactagagaa tgcattatat 3780 gcactcagcg cagtggggca ttttacttta ggttgcgtat tggaagatca agagcatcaa 3840 gtcgctaaag aagaaaggga aacacctact actgatagta tgccgccatt attacgacaa 3900 gctatcgaat tatttgatca ccaaggtgca gagccagcct tcttattcgg ccttgaattg 3960 atcatatgcg gattagaaaa acaacttaaa tgtgaaagtg ggtcttaatg agaatattcg 4020 ttttcaccca aggaatagag gatatggaga aaaaaatcac tggatatacc accgttgata 4080 tatcccaatg gcatcgtaaa gaacattttg aggcatttca gtcagttgct caatgtacct 4140 ataaccagac cgttcagctg gatattacgg cctttttaaa gaccgtaaag aaaaataagc 4200 acaagtttta tccggccttt attcacattc ttgcccgcct gatgaatgct catccggagt 4260 tccgtatggc aatgaaagac ggtgagctgg tgatatggga tagtgttcac ccttgttaca 4320 ccgttttcca tgagcaaact gaaacgtttt catcgctctg gagtgaatac cacgactagt 4380 tccggcagtt tctacacata tattcgcaag atgtggcgtg ttacggtgaa aacctggcct 4440 atttccctaa agggtttatt gagaatatgt ttttcgtctc agccaatccc tgggtgagtt 4500 tcaccagttt tgatttaaac gtggccaata tggacaactt cttcgccccc gttttcacta 4560 tgggcaaata ttatacgcaa ggcgacaagg tgctgatgcc gctggcgatt caggttcatc 4620 atgccgtttg tgatggcttc catgtcggca gaatgcttaa tgaattacaa cagtactgcg 4680 atgagtggca gggcggggcg taatagcttc actagtttaa aaggatctag gtgaagatcc 4740 tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 4800 accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 4860 gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 4920 caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 4980 tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 5040 ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 5100 tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 5160 gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 5220 tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 5280 gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 5340 gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 5400 ggcggagcct atggaaaaac gccagcaacg cggcc 5435 <210> 57 <211> 4568 <212> DNA <213> Artificial Sequence <220> <223> pASK75-PhoA-strepII <400> 57 ccatcgaatg gccagatgat taattcctaa tttttgttga cactctatca ttgatagagt 60 tattttacca ctccctatca gtgatagaga aaagtgaaat gaatagttcg acaaaaatct 120 agaacatgga gaaaataaag tgaaacaaag cactattgca ctggcactct taccgttact 180 gtttacccct gtgacaaaag cccggacacc agaaatgcct gttctggaaa accgggctgc 240 tcagggcgat attactgcac ccggcggtgc tcgccgttta acgggtgatc agactgccgc 300 tctgcgtgat tctcttagcg ataaacctgc aaaaaatatt attttgctga ttggcgatgg 360 gatgggggac tcggaaatta ctgccgcacg taattatgcc gaaggtgcgg gcggcttttt 420 taaaggtata gatgccttac cgcttaccgg gcaatacact cactatgcgc tgaataaaaa 480 aaccggcaaa ccggactacg tcaccgactc ggctgcatca gcaaccgcct ggtcaaccgg 540 tgtcaaaacc tataacggcg cgctgggcgt cgatattcac gaaaaagatc acccaacgat 600 tctggaaatg gcaaaagccg caggtctggc gaccggtaac gtttctaccg cagagttgca 660 ggatgccacg cccgctgcgc tggtggcaca tgtgacctcg cgcaaatgct acggtccgag 720 cgcgaccagt gaaaaatgtc cgggtaacgc tctggaaaaa ggcggaaaag gatcgattac 780 cgaacagctg cttaacgctc gtgccgacgt tacgcttggc ggcggcgcaa aaacctttgc 840 tgaaacggca accgctggtg aatggcaggg aaaaacgctg cgtgaacagg cacaggcgcg 900 tggttatcag ttggtgagcg atgctgcctc actgaattcg gtgacggaag cgaatcagca 960 aaaacccctg cttggcctgt ttgctgacgg caatatgcca gtgcgctggc taggaccgaa 1020 agcaacgtac catggcaata tcgataagcc cgcagtcacc tgtacgccaa atccgcaacg 1080 taatgacagt gtaccaaccc tggcgcagat gaccgacaaa gccattgaat tgttgagtaa 1140 aaatgagaaa ggctttttcc tgcaagttga aggtgcgtca atcgataaac aggatcatgc 1200 tgcgaatcct tgtgggcaaa ttggcgagac ggtcgatctc gatgaagccg tacaacgggc 1260 gctggaattc gctaaaaagg agggtaacac gctggtcata gtcaccgctg atcacgccca 1320 cgccagccag attgttgcgc cggataccaa agctccgggc ctcacccagg cgctaaatac 1380 caaagatggc gcagtgatgg tgatgagtta cgggaactcc gaagaggatt cacaagaaca 1440 taccggcagt cagttgcgta ttgcggcgta tggcccgcat gccgccaatg ttgttggact 1500 gaccgaccag accgatctct tctacaccat gaaagccgct ctggggctga aaccgcctag 1560 cgcttggtct cacccgcagt tcgaaaaata ataagcttga cctgtgaagt gaaaaatggc 1620 gcacattgtg cgacattttt tttgtctgcc gtttaccgct actgcgtcac ggatctccac 1680 gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 1740 acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 1800 ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 1860 gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 1920 tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 1980 ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 2040 gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 2100 gcgaatttta acaaaatatt aacgtttaca atttcaggtg gcacttttcg gggaaatgtg 2160 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 2220 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 2280 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 2340 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 2400 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 2460 atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 2520 caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 2580 gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 2640 accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 2700 ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 2760 gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 2820 acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaattg 2880 atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 2940 ggctggttta ttgctgataa atctggagcc ggtgagcgtg gctctcgcgg tatcattgca 3000 gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 3060 gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 3120 tggtaggaat taatgatgtc tcgtttagat aaaagtaaag tgattaacag cgcattagag 3180 ctgcttaatg aggtcggaat cgaaggttta acaacccgta aactcgccca gaagctaggt 3240 gtagagcagc ctacattgta ttggcatgta aaaaataagc gggctttgct cgacgcctta 3300 gccattgaga tgttagatag gcaccatact cacttttgcc ctttagaagg ggaaagctgg 3360 caagattttt tacgtaataa cgctaaaagt tttagatgtg ctttactaag tcatcgcgat 3420 ggagcaaaag tacatttagg tacacggcct acagaaaaac agtatgaaac tctcgaaaat 3480 caattagcct ttttatgcca acaaggtttt tcactagaga atgcattata tgcactcagc 3540 gcagtggggc attttacttt aggttgcgta ttggaagatc aagagcatca agtcgctaaa 3600 gaagaaaggg aaacacctac tactgatagt atgccgccat tattacgaca agctatcgaa 3660 ttatttgatc accaaggtgc agagccagcc ttcttattcg gccttgaatt gatcatatgc 3720 ggattagaaa aacaacttaa atgtgaaagt gggtcttaaa agcagcataa cctttttccg 3780 tgatggtaac ttcactagtt taaaaggatc taggtgaaga tcctttttga taatctcatg 3840 accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 3900 aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 3960 ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 4020 gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 4080 ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 4140 ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 4200 ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 4260 gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg 4320 cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 4380 cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 4440 cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 4500 aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 4560 acccgaca 4568 <210> 58 <211> 138 <212> DNA <213> Homo sapiens <400> 58 ctggcagaag caaaagttct ggcaaatcgt gaactggata aatatggtgt gagcgactat 60 tacaagaacc tgattaataa cgcgaaaacc gtggaaggtg ttaaagcact gattgatgaa 120 attctggcag cactgccg 138 <210> 59 <211> 46 <212> PRT <213> Homo sapiens <400> 59 Leu Ala Glu Ala Lys Val Leu Ala Asn Arg Glu Leu Asp Lys Tyr Gly 1 5 10 15 Val Ser Asp Tyr Tyr Lys Asn Leu Ile Asn Asn Ala Lys Thr Val Glu 20 25 30 Gly Val Lys Ala Leu Ile Asp Glu Ile Leu Ala Ala Leu Pro 35 40 45 <210> 60 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtL-ABD fusion protein <400> 60 atgaaagaag aagttaccat taaagttaat ctgattttcg ccgatggtaa aacccagacc 60 gcagaattta aaggcacctt tgaagaagca accgcaaaag cctatgccta tgccgatctg 120 ctggcaaaag aaaatggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 61 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> ProtL-ABD fusion protein <400> 61 Met Lys Glu Glu Val Thr Ile Lys Val Asn Leu Ile Phe Ala Asp Gly 1 5 10 15 Lys Thr Gln Thr Ala Glu Phe Lys Gly Thr Phe Glu Glu Ala Thr Ala 20 25 30 Lys Ala Tyr Ala Tyr Ala Asp Leu Leu Ala Lys Glu Asn Gly Glu Tyr 35 40 45 Thr Ala Asp Leu Glu Asp Gly Gly Asn Thr Ile Asn Ile Lys Phe Ala 50 55 60 Gly Gly Ala Val Asp Ala Asn Ser Leu Ala Glu Ala Lys Val Leu Ala 65 70 75 80 Asn Arg Glu Leu Asp Lys Tyr Gly Val Ser Asp Tyr Tyr Lys Asn Leu 85 90 95 Ile Asn Asn Ala Lys Thr Val Glu Gly Val Lys Ala Leu Ile Asp Glu 100 105 110 Ile Leu Ala Ala Leu Pro 115 <210> 62 <211> 3493 <212> DNA <213> Artificial Sequence <220> <223> pASK75-ProtL-ABD <400> 62 ccatcgaatg gccagatgat taattcctaa tttttgttga cactctatca ttgatagagt 60 tattttacca ctccctatca gtgatagaga aaagtgaaat gaatagttcg acaaaaatct 120 agaaataatt ttgtttaact ttaagaagga gatatacata tgaaagaaga agttaccatt 180 aaagttaatc tgattttcgc cgatggtaaa acccagaccg cagaatttaa aggcaccttt 240 gaagaagcaa ccgcaaaagc ctatgcctat gccgatctgc tggcaaaaga aaatggtgaa 300 tataccgcag atctggaaga tggtggtaat accatcaata tcaaatttgc cggtggtgcc 360 gttgatgcaa atagcctggc agaagcaaaa gttctggcaa atcgtgaact ggataaatat 420 ggtgtgagcg actattacaa gaacctgatt aataacgcga aaaccgtgga aggtgttaaa 480 gcactgattg atgaaattct ggcagcactg ccgtaataag cttgacctgt gaagtgaaaa 540 atggcgcaca ttgtgcgaca ttttttttgt ctgccgttta ccgctactgc gtcacggatc 600 tccacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga 660 ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg 720 ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat 780 ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg 840 ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata 900 gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt 960 tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat 1020 ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa 1080 atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 1140 tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 1200 aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 1260 acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 1320 acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 1380 ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 1440 ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 1500 caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 1560 ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 1620 aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 1680 aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 1740 tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 1800 aattgataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 1860 cggctggctg gtttattgct gataaatctg gagccggtga gcgtggctct cgcggtatca 1920 ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 1980 gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 2040 agcattggta ggaattaatg atgtctcgtt tagataaaag taaagtgatt aacagcgcat 2100 tagagctgct taatgaggtc ggaatcgaag gtttaacaac ccgtaaactc gcccagaagc 2160 taggtgtaga gcagcctaca ttgtattggc atgtaaaaaa taagcgggct ttgctcgacg 2220 ccttagccat tgagatgtta gataggcacc atactcactt ttgcccttta gaaggggaaa 2280 gctggcaaga ttttttacgt aataacgcta aaagttttag atgtgcttta ctaagtcatc 2340 gcgatggagc aaaagtacat ttaggtacac ggcctacaga aaaacagtat gaaactctcg 2400 aaaatcaatt agccttttta tgccaacaag gtttttcact agagaatgca ttatatgcac 2460 tcagcgcagt ggggcatttt actttaggtt gcgtattgga agatcaagag catcaagtcg 2520 ctaaagaaga aagggaaaca cctactactg atagtatgcc gccattatta cgacaagcta 2580 tcgaattatt tgatcaccaa ggtgcagagc cagccttctt attcggcctt gaattgatca 2640 tttgcggatt agaaaaacaa cttaaatgtg aaagtgggtc ttaaaagcag cataaccttt 2700 ttccgtgatg gtaacttcac tagtttaaaa ggatctaggt gaagatcctt tttgataatc 2760 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 2820 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 2880 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 2940 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 3000 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 3060 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 3120 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 3180 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 3240 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 3300 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 3360 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 3420 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 3480 acatgacccg aca 3493 <210> 63 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_PHE337TAG_fw <400> 63 cattaaagtt aatctgattt aggccgatgg taaaac 36 <210> 64 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_PHE337TAG_rv <400> 64 gttttaccat cggcctaaat cagattaact ttaatg 36 <210> 65 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_Y361N_L365S_fw <400> 65 caaaagccta tgccaacgcc gatctgagcg caaaagaaaa tggtg 45 <210> 66 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_Y361N_L365S_rv <400> 66 caccattttc ttttgcgctc agatcggcgt tggcataggc ttttg 45 <210> 67 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtLUAG337-ABD <400> 67 atgaaagaag aagttaccat taaagttaat ctgatttagg ccgatggtaa aacccagacc 60 gcagaattta aaggcacctt tgaagaagca accgcaaaag cctatgccaa cgccgatctg 120 agcgcaaaag aaaatggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 68 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_PHE347TAG_fw <400> 68 cagaccgcag aatagaaagg cacctttg 28 <210> 69 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_PHE347TAG_rv <400> 69 caaaggtgcc tttctattct gcggtctg 28 <210> 70 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_TYR361ALA_fw <400> 70 ccgcaaaagc ctatgccgcg gccgatctgc tggc 34 <210> 71 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_TYR361ALA_rv <400> 71 gccagcagat cggccgcggc ataggctttt gcgg 34 <210> 72 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtLUAG347-ABD <400> 72 atgaaagaag aagttaccat taaagttaat ctgattttcg ccgatggtaa aacccagacc 60 gcagaataga aaggcacctt tgaagaagca accgcaaaag cctatgccgc ggccgatctg 120 ctggcaaaag aaaatggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 73 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_ALA360TAG_fw <400> 73 ccgcaaaagc ctattagtat gccgatctgc 30 <210> 74 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_ALA360TAG_rv <400> 74 gcagatcggc atactaatag gcttttgcgg 30 <210> 75 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtLUAG360-ABD <400> 75 atgaaagaag aagttaccat taaagttaat ctgattttcg ccgatggtaa aacccagacc 60 gcagaattta aaggcacctt tgaagaagca accgcaaaag cctattagta tgccgatctg 120 ctggcaaaag aaaatggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 76 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_LEU364TAG_fw <400> 76 ctatgcctat gccgattagc tggcaaaaga aaatgg 36 <210> 77 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_LEU364TAG_rv <400> 77 ccattttctt ttgccagcta atcggcatag gcatag 36 <210> 78 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtLUAG364-ABD <400> 78 atgaaagaag aagttaccat taaagttaat ctgattttcg ccgatggtaa aacccagacc 60 gcagaattta aaggcacctt tgaagaagca accgcaaaag cctatgccta tgccgattag 120 ctggcaaaag aaaatggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 79 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_GLU368TAG_fw <400> 79 gatctgctgg caaaatagaa tggtgaatat accg 34 <210> 80 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_GLU368TAG_rv <400> 80 cggtatattc accattctat tttgccagca gatc 34 <210> 81 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtLUAG368-ABD <400> 81 atgaaagaag aagttaccat taaagttaat ctgattttcg ccgatggtaa aacccagacc 60 gcagaattta aaggcacctt tgaagaagca accgcaaaag cctatgccta tgccgatctg 120 ctggcaaaat agaatggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 82 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_ASN369TAG_fw <400> 82 ctgctggcaa aagaataggg tgaatatacc gc 32 <210> 83 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> AJR_ProtL_ASN369TAG_rv <400> 83 gcggtatatt caccctattc ttttgccagc ag 32 <210> 84 <211> 357 <212> DNA <213> Artificial Sequence <220> <223> ProtLUAG369-ABD <400> 84 atgaaagaag aagttaccat taaagttaat ctgattttcg ccgatggtaa aacccagacc 60 gcagaattta aaggcacctt tgaagaagca accgcaaaag cctatgccta tgccgatctg 120 ctggcaaaag aatagggtga atataccgca gatctggaag atggtggtaa taccatcaat 180 atcaaatttg ccggtggtgc cgttgatgca aatagcctgg cagaagcaaa agttctggca 240 aatcgtgaac tggataaata tggtgtgagc gactattaca agaacctgat taataacgcg 300 aaaaccgtgg aaggtgttaa agcactgatt gatgaaattc tggcagcact gccgtaa 357 <210> 85 <211> 5429 <212> DNA <213> Artificial Sequence <220> <223> pSBX8.CafRS#30d71 <400> 85 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgacccgaca ccataacgct 60 cggttgccgc cgggcgtttt ttattggcca gatgattaat tcctaatttt tgttgacact 120 ctatcattga tagagttatt ttaccactcc ctatcagtga tagagaaaag tgaaatgaat 180 agttcgacaa aatctagaaa taattttgtt taactttaag aaggagatat acatatgaaa 240 gaagaagtta ccattaaagt taatctgatt taggccgatg gtaaaaccca gaccgcagaa 300 tttaaaggca cctttgaaga agcaaccgca aaagcctatg ccaacgccga tctgagcgca 360 aaagaaaatg gtgaatatac cgcagatctg gaagatggtg gtaataccat caatatcaaa 420 tttgccggtg gtgccgttga tgcaaatagc ctggcagaag caaaagttct ggcaaatcgt 480 gaactggata aatatggtgt gagcgactat tacaagaacc tgattaataa cgcgaaaacc 540 gtggaaggtg ttaaagcact gattgatgaa attctggcag cactgccgta ataagcttga 600 cctgtgaagt gaaaaatggc gcacattgtg cgacattttt tttgtctgcc gtttaccgct 660 actgcgcggc agtacgcctt tggtttatcc attttataca atccatgtaa aaaagggccc 720 tgaaattcag gaccctttct gagctcatta caggttggtg ctaataccat tatagtagct 780 ctcggaacgg cttgcacgtt taatgttttt gaaaccgtgc attactttca gcagacgttc 840 gagaccaaaa cctgcaccaa tccagggttt atcaataccc cattcacgat ccaggctaac 900 cggaccaaca actgcgctac tcagttccag atcaccgtgc ataatatcca gggtatcacc 960 aaaaaccatg cagctatcac caacaatttc aaagtcgatt tccaggtaat ccagaaactc 1020 tttaatcagt gcttccagat tttcacgggt acaaccgcta cccatctggc caaacaccac 1080 cattgtaaat tcttccaggt gttctttacc atcactttct ttacgatagc acggaccaac 1140 ttcaaagact ttggaaggac caggcagaat acgatccagt ttccggctgt agttatacaa 1200 tgtcggggtc agcataggac gcagacacag gtttttatca acgcgaaaga tttgtttgct 1260 cagttcggta tcattgttaa tgcccatacg ttcaacatat tctgccggaa tcagaatcgg 1320 gcttttgatt tccagaaaac cgcgatccac gaaaaatttg gtaatatcac gttccagttt 1380 acccagataa tcttcgcggt cgttggtata taagcgttga aaatcatttt tacgacgagt 1440 aaccagttcc ggttccagtt cacgaaacgg ttttgccata ttcaggctga ttttatcttc 1500 aggactcagc agtgcttcaa cacgatctaa ctgagaccgg gttaagctcg gtgccggtgc 1560 gcttgccgga acgctgctat tcggggtgct ttttgccgga ctcggaacgc tacggctggt 1620 attggtgctt gcttttgcgc taacgctatt ttccagaggt ttcggtgcgc gactaacgct 1680 tttcggcatt gcttttttaa ctttaggtgc gctcacaaca cgaactttaa ctgaattttt 1740 gctttcggtg ctgcgtgtca gaaaattgtt aatatcttca tcactcacac ggcagcgttt 1800 acaggtttta cgatatttgt gatgacgaaa tgcgcgtgcg gtacgacagc tacggctatt 1860 attcacaacc agatgatcgc cacaggccat ttcaatatag attttgctgc ggctaacttc 1920 gtgatgtttg attttatgca gggtgccggt acggctcatc cacagacctg ttgcgctaat 1980 cagaacatcc agcggttttt tatccatatc gtacctcctt aaatttctag gttgtgacct 2040 aggtgattta gtttaccagt gcaaaagaaa tgtcaaaaga gaagggcgtg aatttaacgc 2100 ggttccagcg caaagacttc aaaacctgcg tcggtgccga tttcggccta ttggttaaaa 2160 aatgagctga gttctagtaa aaaaaatcct tagctttcgc taaggatctg cagtggcgga 2220 aaccccggga atctaacccg gctgaacgga tttagagtcc attcgatcta catgatcagg 2280 tttccgaatt cagcgttaca agtattacac aaagtttttt atgttgagaa tatttttttg 2340 atggggcatg gcgcaaaacc tttcgcggta tggcatgcag gtggcacttt tcggggaaat 2400 gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 2460 agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 2520 catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 2580 ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 2640 atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 2700 ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 2760 gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 2820 ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 2880 ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 2940 gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 3000 ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 3060 gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 3120 ttgatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 3180 gctggctggt ttattgctga taaatctgga gccggtgagc gtggctctcg cggtatcatt 3240 gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 3300 caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 3360 cattggtaag aattaatgat gtctcgttta gataaaagta aagtgattaa cagcgcatta 3420 gagctgctta atgaggtcgg aatcgaaggt ttaacaaccc gtaaactcgc ccagaagcta 3480 ggtgtagagc agcctacatt gtattggcat gtaaaaaata agcgggcttt gctcgacgcc 3540 ttagccattg agatgttaga taggcaccat actcactttt gccctttaga aggggaaagc 3600 tggcaagatt ttttacgtaa taacgctaaa agttttagat gtgctttact aagtcatcgc 3660 gatggagcaa aagtacattt aggtacacgg cctacagaaa aacagtatga aactctcgaa 3720 aatcaattag cctttttatg ccaacaaggt ttttcactag agaatgcatt atatgcactc 3780 agcgcagtgg ggcattttac tttaggttgc gtattggaag atcaagagca tcaagtcgct 3840 aaagaagaaa gggaaacacc tactactgat agtatgccgc cattattacg acaagctatc 3900 gaattatttg atcaccaagg tgcagagcca gccttcttat tcggccttga attgatcata 3960 tgcggattag aaaaacaact taaatgtgaa agtgggtctt aatgagaata ttcgttttca 4020 cccaaggaat agaggatatg gagaaaaaaa tcactggata taccaccgtt gatatatccc 4080 aatggcatcg taaagaacat tttgaggcat ttcagtcagt tgctcaatgt acctataacc 4140 agaccgttca gctggatatt acggcctttt taaagaccgt aaagaaaaat aagcacaagt 4200 tttatccggc ctttattcac attcttgccc gcctgatgaa tgctcatccg gagttccgta 4260 tggcaatgaa agacggtgag ctggtgatat gggatagtgt tcacccttgt tacaccgttt 4320 tccatgagca aactgaaacg ttttcatcgc tctggagtga ataccacgac tagttccggc 4380 agtttctaca catatattcg caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc 4440 ctaaagggtt tattgagaat atgtttttcg tctcagccaa tccctgggtg agtttcacca 4500 gttttgattt aaacgtggcc aatatggaca acttcttcgc ccccgttttc actatgggca 4560 aatattatac gcaaggcgac aaggtgctga tgccgctggc gattcaggtt catcatgccg 4620 tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt acaacagtac tgcgatgagt 4680 ggcagggcgg ggcgtaatag cttcactagt ttaaaaggat ctaggtgaag atcctttttg 4740 ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 4800 tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 4860 aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 4920 tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 4980 agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 5040 taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 5100 caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 5160 agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 5220 aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 5280 gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 5340 tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 5400 gcctatggaa aaacgccagc aacgcggcc 5429 <210> 86 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> ProtLUAG337-ABD <220> <221> UNSURE <222> (13) <223> modified amino acid Caf <400> 86 Met Lys Glu Glu Val Thr Ile Lys Val Asn Leu Ile Xaa Ala Asp Gly 1 5 10 15 Lys Thr Gln Thr Ala Glu Phe Lys Gly Thr Phe Glu Glu Ala Thr Ala 20 25 30 Lys Ala Tyr Ala Asn Ala Asp Leu Ser Ala Lys Glu Asn Gly Glu Tyr 35 40 45 Thr Ala Asp Leu Glu Asp Gly Gly Asn Thr Ile Asn Ile Lys Phe Ala 50 55 60 Gly Gly Ala Val Asp Ala Asn Ser Leu Ala Glu Ala Lys Val Leu Ala 65 70 75 80 Asn Arg Glu Leu Asp Lys Tyr Gly Val Ser Asp Tyr Tyr Lys Asn Leu 85 90 95 Ile Asn Asn Ala Lys Thr Val Glu Gly Val Lys Ala Leu Ile Asp Glu 100 105 110 Ile Leu Ala Ala Leu Pro 115

Claims

광-반응성 요소를 포함하고,
광-반응성 요소의 배열은 특정 파장의 광으로 폴리펩타이드를 조사하여 전환될 수 있고, 및
상기 배열의 전환은 폴리펩타이드의 리간드에 대한 결합 활성을 바꾸는 것인, 폴리펩타이드.
목적 분자의 분리 및/또는 정제를 위한 제1항의 광-반응성 요소를 포함하는 폴리펩타이드의 용도.
제1항 또는 제2항에 있어서,
광-반응성 요소를 포함하는 폴리펩타이드는 고체상의 일부인, 폴리펩타이드 또는 용도.
(i) 목적 분자를 포함하는 액체상을 제1항 또는 제3항의 광-반응성 요소를 포함하는 폴리펩타이드와 접촉시키는 단계로, 광-반응성 요소를 포함하는 폴리펩타이드는 고체상의 일부이고, 광-반응성 요소는 제1 배열로 존재하여 폴리펩타이드가 목적 분자에 대해 높은 친화성을 갖게 하며; 및
(ii) 광-반응성 요소를 제2 배열로 변화시켜 폴리펩타이드가 단계 (i)의 친화성과 비교하여 목적 분자에 대해 감소된 친화성을 갖게 하는 파장으로 광-반응성 요소를 포함하는 폴리펩타이드를 조사하고, 목적 분자를 용출하는 단계를 포함하는 목적 분자의 분리 및/또는 정제 방법.
제1항 또는 제3항, 제2항, 또는 제4항에 있어서,
광-반응성 요소를 포함하는 폴리펩타이드는 광-반응성 요소를 포함하는 스트렙타비딘, 또는 이의 변이체 또는 뮤테인인, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 중 어느 한 항, 제2항, 제3항 및 제5항 중 어느 한 항, 또는 제4항 또는 제5항에 있어서,
광-반응성 요소를 포함하는 폴리펩타이드는
i) SEQ ID NO: 2의 아미노산 서열;
(ii) SEQ ID NO: 4의 아미노산 서열;
(iii) SEQ ID NO: 6의 아미노산 서열;
(iv) SEQ ID NO: 86의 아미노산 서열;
(v) SEQ ID NO: 20의 아미노산 서열로, SEQ ID NO: 20의 12번 위치의 잔기는 광-반응성 요소로 대체되고;
(vi) SEQ ID NO: 61의 아미노산 서열로, SEQ ID NO: 61의 13번 위치의 잔기는 광-반응성 요소로 대체되고; 또는
(vii) (i)-(vi) 중 어느 하나에 따른 아미노산 서열과 적어도 80% 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성되며,
폴리펩타이드는 광-반응성 요소를 포함하고, 광-반응성 요소의 배열은 특정 파장의 광으로 폴리펩타이드를 조사하여 전환될 수 있으며, 상기 배열의 전환은 폴리펩타이드의 리간드에 대한 결합 활성을 바꾸는 것인, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항, 제5항 및 제6항 중 어느 한 항, 제2항, 제3항, 제5항 및 제6항 중 어느 한 항, 또는 제4항 내지 제6항 중 어느 한 항에 있어서,
광-반응성 요소의 한 배열의 다른 배열로의 전환은 폴리펩타이드의 리간드-결합 포켓 또는 부위의 형태 또는 형상을 변화시키는 것인, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제7항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제7항 중 어느 한 항, 또는 제4항 내지 제7항 중 어느 한 항에 있어서,
광-반응성 요소는 폴리펩타이드의 리간드-결합 포켓 또는 부위의 안에 또는 주변에 존재하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제8항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제8항 중 어느 한 항, 또는 제4항 내지 제8항 중 어느 한 항에 있어서,
광-반응성 요소는 리간드의 폴리펩타이드에 대한 결합에 관여하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제9항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제9항 중 어느 한 항, 또는 제4항 내지 제9항 중 어느 한 항에 있어서,
광-반응성 요소는
(i) SEQ ID NOs: 2, 4, 8 및 10 중 어느 하나의 96번 아미노산 위치;
(ii) SEQ ID NOs: 6 및 12 중 어느 하나의 132번 위치;
(iii) SEQ ID NO: 20의 12번 위치;
(iv) SEQ ID NOs: 61 및 86 중 어느 하나의 13번 위치;
(v) SEQ ID NOs: 2, 4, 8 또는 10 중 어느 하나의 아미노산 서열과 적어도 80% 동일성을 갖는 아미노산 서열에서, 각각 SEQ ID NO: 2, 4, 8 또는 10의 96번 아미노산 위치와 상동인 아미노산 위치;
(vi) SEQ ID NOs: 6 또는 12 중 어느 하나의 아미노산 서열과 적어도 80% 동일성을 갖는 아미노산 서열에서, 각각 SEQ ID NO: 6 또는 12의 132번 아미노산 위치와 상동인 아미노산 위치;
(vii) SEQ ID NO: 20의 아미노산 서열과 적어도 80% 동일성을 갖는 아미노산 서열에서, SEQ ID NO: 20의 12번 아미노산 위치와 상동인 아미노산 위치; 또는
(viii) SEQ ID NOs: 61 및 86 중 어느 하나의 아미노산 서열과 적어도 80% 동일성을 갖는 아미노산 서열에서, SEQ ID NO: 61의 13번 아미노산 위치와 상동인 아미노산 위치에 존재하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제10항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제10항 중 어느 한 항, 또는 제4항 내지 제10항 중 어느 한 항에 있어서,
제1 배열의 광-반응성 요소를 포함하는 폴리펩타이드는 제2 배열의 광-반응성 요소를 포함하는 폴리펩타이드와 비교하여 리간드에 대해 더 높은 친화성을 갖는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제11항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제11항 중 어느 한 항, 또는 제4항 내지 제11항 중 어느 한 항에 있어서,
제1 배열의 광-반응성 요소를 포함하는 폴리펩타이드는 리간드에 대해 높은 친화성을 가지며, 제2 배열의 광-반응성 요소를 포함하는 폴리펩타이드는 상기 리간드에 대해 낮은 친화성을 갖는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제12항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제12항 중 어느 한 항, 또는 제4항 내지 제12항 중 어느 한 항에 있어서,
광-반응성 요소는 아조(azo)기를 포함하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제13항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제13항 중 어느 한 항, 또는 제4항 내지 제13항 중 어느 한 항에 있어서,
광-반응성 요소는 광-전환성 아미노산 사이드 체인을 포함하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제14항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제14항 중 어느 한 항, 또는 제4항 내지 제14항 중 어느 한 항에 있어서,
광-반응성 요소는 비-천연 아미노산을 포함하고, 비-천연 아미노산의 2개의 이성질체는 특정 파장의 광에 의해 전환될 수 있는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제15항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제15항 중 어느 한 항, 또는 제4항 내지 제15항 중 어느 한 항에 있어서,
광-반응성 요소는
(i) 3'-카르복시페닐아조페닐알라닌(3'-carboxyphenylazophenylalanine) 또는 이의 유도체; 또는
(ii) 4'-카르복시페닐아조페닐알라닌(4'-carboxyphenylazophenylalanine) 또는 이의 유도체를 포함하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제16항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제16항 중 어느 한 항, 또는 제4항 내지 제16항 중 어느 한 항에 있어서,
이성질체는 트랜스 이성질체 또는 시스 이성질체인, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제17항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제17항 중 어느 한 항, 또는 제4항 내지 제17항 중 어느 한 항에 있어서,
3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 트랜스 이성질체를 포함하는 폴리펩타이드는 3'-카르복시페닐아조페닐알라닌 또는 4'-카르복시페닐아조페닐알라닌의 시스 이성질체를 포함하는 폴리펩타이드와 비교하여 리간드에 대해 증가된 친화성을 갖는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제18항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제18항 중 어느 한 항, 또는 제4항 내지 제18항 중 어느 한 항에 있어서,
405-470 nm를 갖는 가시광선에서 폴리펩타이드의 적어도 70%는 광-반응성 요소의 트랜스 이성질체를 포함하는, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제19항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제19항 중 어느 한 항, 또는 제4항 내지 제19항 중 어느 한 항에 있어서,
310 내지 370 nm를 갖는 자외선에서 폴리펩타이드의 적어도 85%는 광-반응성 요소의 시스 이성질체를 포함하는, 폴리펩타이드, 용도 또는 방법.
제3항 및 제5항 내지 제20항 중 어느 한 항, 제3항 및 제5항 내지 제20항 중 어느 한 항, 또는 제4항 내지 제20항 중 어느 한 항에 있어서,
고체상은 친수성인, 폴리펩타이드, 용도 또는 방법.
제3항 및 제5항 내지 제21항 중 어느 한 항, 제3항 및 제5항 내지 제21항 중 어느 한 항, 또는 제4항 내지 제21항 중 어느 한 항에 있어서,
고체상은 매트릭스, 하이드로젤, 비드, 자성 비드, 칩, 유리 표면, 플라스틱 표면, 금 표면, 은 표면 또는 플레이트인, 폴리펩타이드, 용도 또는 방법.
제22항에 있어서,
매트릭스, 하이드로젤, 비드, 칩, 유리 표면, 플라스틱 표면 또는 플레이트는 광-투과성인, 폴리펩타이드, 용도 또는 방법.
제22항 또는 제23항에 있어서,
매트릭스, 하이드로젤 또는 비드는 친화성 크로마토그래피 컬럼의 고체상인, 폴리펩타이드, 용도 또는 방법.
제22항 내지 제24항 중 어느 한 항에 있어서,
매트릭스는 N-하이드록시석신이미딜(NHS) 활성화된 CH-세파로스인, 폴리펩타이드, 용도 또는 방법.
제22항에 있어서,
플레이트는 마이크로타이터 웰 플레이트인, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제26항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제26항 중 어느 한 항, 또는 제4항 내지 제26항 중 어느 한 항에 있어서,
폴리펩타이드는 고체상에 공유적으로 또는 비-공유적으로 부착되는, 폴리펩타이드, 용도 또는 방법.
제3항 및 제5항 내지 제27항 중 어느 한 항, 제3항 및 제5항 내지 제27항 중 어느 한 항, 또는 제4항 내지 제27항 중 어느 한 항에 있어서,
고체상은 적어도 300 내지 500 nm, 바람직하게는 330 내지 450 nm의 파장 범위에서 내광성(light resistant)인, 폴리펩타이드, 용도 또는 방법.
제1항, 제3항 및 제5항 내지 제28항 중 어느 한 항, 제2항, 제3항 및 제5항 내지 제28항 중 어느 한 항, 또는 제4항 내지 제28항 중 어느 한 항에 있어서,
리간드는 펩타이드, 올리고펩타이드, 폴리펩타이드, 단백질, 항체 또는 이의 단편, 면역글로불린 또는 이의 단편, 효소, 호르몬, 사이토카인, 복합체, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 핵산, 탄수화물, 리포좀, 나노입자, 세포, 생체거대분자, 생체분자 및 저분자로 이루어진 군에서 선택된 분자인, 폴리펩타이드, 용도 또는 방법.
제29항에 있어서,
펩타이드 리간드는
(i) SEQ ID NO: 13의 아미노산 서열;
(ii) SEQ ID NO: 14의 아미노산 서열; 또는
(iii) SEQ ID NO: 13 또는 14와 적어도 80% 동일성을 가지고, 스트렙타비딘 또는 이의 돌연변이체 또는 변이체에 대해 친화성을 갖는 아미노산 서열을 포함하거나 이로 구성되는, 폴리펩타이드, 용도 또는 방법.
제30항에 있어서,
스트렙타비딘 돌연변이체는 SEQ ID NO: 7의 아미노산 서열을 갖는 단백질의 테트라머인, 폴리펩타이드, 용도 또는 방법.
제4항 내지 제31항 중 어느 한 항에 있어서,
단계 (i) 전 및/또는 동안, 폴리펩타이드는 400 내지 500 nm를 갖는 가시광선으로 조사되는, 방법.
제4항 내지 제32항 중 어느 한 항에 있어서,
(i') 적당한 완충액으로 고체상을 세척하는 단계를 더 포함하는, 방법.
제33항에 있어서,
단계 (i') 동안, 폴리펩타이드는 400 내지 500 nm를 갖는 가시광선으로 조사되는, 방법.
제4항 내지 제34항 중 어느 한 항에 있어서,
단계 (ii) 동안, 폴리펩타이드는 300 내지 390 nm를 갖는 자외선으로 조사되는, 방법.
제4항 내지 제35항 중 어느 한 항에 있어서,
(iii) 광-반응성 요소를 포함하는 폴리펩타이드를 목적 분자에 대해 친화성을 갖는 제1 형태로 재생하는 단계를 더 포함하는, 방법.
제36항에 있어서,
단계 (iii) 동안, 광-반응성 요소는 400 내지 500 nm를 갖는 가시광선으로 폴리펩타이드를 조사하여 재생되는, 방법.
제36항 또는 제37항에 있어서,
단계 (iii) 동안, 고체상은 적당한 완충액으로 세척되는, 방법.
제2항, 제3항 및 제5항 내지 제31항 중 어느 한 항, 또는 제4항 내지 제38항 중 어느 한 항에 있어서,
목적 분자는 펩타이드, 올리고펩타이드, 폴리펩타이드, 단백질, 항체 또는 이의 단편, 면역글로불린 또는 이의 단편, 효소, 호르몬, 사이토카인, 복합체, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 핵산, 탄수화물, 리포좀, 나노입자, 세포, 생체거대분자, 생체분자 및 저분자로 이루어진 군에서 선택된 분자인, 용도 또는 방법.
제2항, 제3항, 제5항 내지 제31항 및 제39항 중 어느 한 항, 또는 제4항 내지 제39항 중 어느 한 항에 있어서,
목적 분자는 천연 단백질 또는 재조합으로 생산된 단백질인, 용도 또는 방법.
제2항, 제3항, 제5항 내지 제31항, 제39항 및 제40항 중 어느 한 항, 또는 제4항 내지 제40항 중 어느 한 항에 있어서,
목적 분자는 치료 단백질인, 용도 또는 방법.
제39항에 있어서,
항체 단편은 Fab 단편, F(ab')2 단편, Fd 단편, Fv 단편, scFv 단편 또는 단일 도메인 항체인, 용도 또는 방법.
제4항 내지 제42항 중 어느 한 항에 있어서,
목적 분자를 포함하는 액체상은 세포 추출물 또는 배양 상등액인, 방법.
제43항에 있어서,
세포 추출물은 세포주변질(periplasm)의 추출물 또는 전체 세포 추출물인, 방법.
제1항, 제3항 및 제5항 내지 제31항 중 어느 한 항의 광-반응성 요소를 포함하는 폴리펩타이드를 포함하는 친화성 매트릭스.
제45항의 친화성 매트릭스를 포함하는 친화성 크로마토그래피 컬럼.
제46항에 있어서,
매트릭스는 광-투과성 튜브 또는 용기 내에 포함되고; 및/또는 튜브 또는 용기 내에 적어도 하나의 광섬유(fiberoptic)를 포함하는, 친화성 크로마토그래피 컬럼.
제47항에 있어서,
광-투과성 튜브 또는 용기는 유리 또는 플라스틱으로 제조되는, 친화성 크로마토그래피 컬럼.
(i) 제46항 내지 제48항 중 어느 한 항의 친화성 크로마토그래피 컬럼;
(ii) 광원;
(iii) 하우징; 및
(iv) 전기 인터페이스(electric interface)를 포함하는 친화성 크로마토그래피 기기(apparatus).
제49항에 있어서,
광원은 하나, 둘 이상의 발광 다이오드(들)(light-emitting diode, LED), 형광 튜브(들) 및/또는 레이저(들)을 포함하거나 이로 구성되는, 친화성 크로마토그래피 기기.
제49항 또는 제50항에 있어서,
광원에 의해 방출되는 광의 파장은 전기적으로 제어되는, 친화성 크로마토그래피 기기.
제49항 내지 제51항 중 어느 한 항에 있어서,
광원에 의해 방출되는 광의 파장은 전환 가능한 것인, 친화성 크로마토그래피 기기.
제49항 내지 제52항 중 어느 한 항에 있어서,
하나, 둘 이상의 광원(들)에 의해 방출되는 광의 파장은 400 내지 500 nm를 갖는 가시광선에서 300 내지 390 nm를 갖는 자외선까지 및 그 역으로 전환 가능한 것인, 친화성 크로마토그래피 기기.