KR20230124938A

KR20230124938A - 복수의 표적 분자와 함께 복합체를 형성할 수 있는후보 분자의 스크리닝 방법

Info

Publication number: KR20230124938A
Application number: KR1020237022183A
Authority: KR
Inventors: 데쓰오 고지마; 가오리 니시무라; 유고 구리키
Original assignee: 추가이 세이야쿠 가부시키가이샤
Priority date: 2020-12-25
Filing date: 2021-12-24
Publication date: 2023-08-28
Also published as: JPWO2022138892A1; EP4257978A1; WO2022138892A1; TW202242415A; US20240069033A1; CN116670284A

Abstract

Split GFP 기술로 대표되는 기술에 어피니티를 이용한 후보 분자의 회수 방법을 적용하는 것에 의해, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자를 스크리닝하는 방법이 발견되었다. 당해 방법에서는, 단백질의 제1 부분에 연결된 제1 표적 분자, 해당 단백질의 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 공존시킨다. 그리고, 해당 제1 부분에 연결된 제1 표적 분자 및 해당 제2 부분에 연결된 제2 표적 분자와 복합체를 형성할 수 있었던 피험 분자를, 어피니티 기술을 사용하여 회수한다.

Description

복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자의 스크리닝 방법

본 개시는, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자의 스크리닝 방법에 관한 것이다.

복수의 표적 분자와 함께 복합체를 형성하는 분자로서는, 이중특이성 항체나 단백질 분해 유도 키메라(Proteolysis targeting chimera; PROTAC)로 대표되는 이중특이성 분자, 및, 라파마이신이나 FK506과 같이 FKBP(FK506 binding protein)와의 결합을 거쳐 표적 분자와 결합하는 분자 등이 알려져 있다. 전자의 분자의 작성 방법으로서, 상이한 표적에 결합할 수 있는 분자를 따로따로 취득한 후에 그들을 연결시키는 수법이 알려져 있다(비특허문헌 1). 후자의 분자의 취득 방법으로서, 시험 화합물을 FKBP와 혼합하여 2자 복합체를 형성시킨 후, 이것을 표적 단백질과 혼합하고, 삼자 복합체의 형성을 질량 분석에 의해 검출하는 방법이 알려져 있다(특허문헌 1).

Split GFP 기술은, 단독으로는 발광하지 않도록 분할된 GFP 단백질이 근접해서 회합함으로써 발광한다는 현상을 이용한 기술이다. 각 GFP 단편에 상이한 단백질을 결합시킴으로써, GFP의 발광을 지표로 단백질끼리의 상호작용을 검출할 수 있다. 구체적으로는, GFP를 베타 스트랜드 단위로 GFP1-9, GFP10, 및 GFP11로 3분할하고, GFP10 및 GFP11에 각각 다른 단백질을 결합시키고 GFP1-9를 첨가하면, 이들 단백질의 상호작용을 발광으로 검출할 수 있다는 보고가 있다(비특허문헌 2). split GFP를 발현시킨 세포를 사용하고, 세포내에서의 GTPase와 GTPase-binding domain의 상호작용에 의한 발광을 지표로 하여, GTPase의 활성화 상태를 검출한 보고가 있다(특허문헌 2, 비특허문헌 3).

미국 특허 US9428845호 미국 특허출원 공개 20180164324호

Ulrich, H. W. et al. CANCER GENOMICS & PROTEOMICS 10: 1-18 (2013) Cabantous, S. et al. Sci Rep. 2013; 3: 2854. doi: 10.1038/srep02854 Koraichi, F. et al. Journal of Cell Science 2018; 131: jcs210419 doi: 10.1242/jcs.210419

복수의 표적 분자와 함께 복합체를 형성하는 분자를 취득하려고 한 경우, (i) 표적 분자마다 스크리닝하여 얻은 바인더를 연결시키는 방법이나, (ii) 한쪽의 표적 분자에 대한 바인더를 취득한 후에 그 표적 분자와 바인더의 복합체를 다른 표적 분자에 접촉시키는 방법이 생각된다.

경구 흡수성을 높이는 것, 또는 세포내 표적을 노리는 경우, 후보 분자의 분자량을 어느 정도 작게 할 필요가 있다. 그 때문에, 이와 같은 목적으로 후보 분자를 취득하려고 한 경우, 각 표적 분자에 대한 바인더를 취득한 후에 이들을 연결하는 (i)의 방법에서는, 개개의 바인더의 분자량에 큰 제한이 걸린다. 한편, 분자량을 지나치게 작게 하면, 결합에 사용할 수 있는 후보 분자측의 구조나 표적 분자측의 결합 부위에 제한이 생기기 때문에, 적용 가능한 표적 분자가 한정되어 버린다. 다른 한편 (ii)의 방법은, 2개의 분자를 연결시키는 것이 아니라, 라이브러리로부터 원하는 성질을 갖는 분자를 스크리닝하는 것이지만, 단독의 표적 분자에 대한 단일특이성에 의한 선별이 제1 공정이 된다. 이 공정에 있어서, 해당 표적(제1 표적) 분자에 대해서 우위인 결합 양식을 갖는 분자가 농축되기 때문에, 다음 공정에서는, 제1 표적에 대한 결합 양식에 편향이 있는 분자 집단으로부터, 원하는 성질을 갖는 분자를 선별해야 한다. 제1 표적 분자에 대한 우위인 결합 양식이, 복수의 표적 분자와 함께 복합체를 형성하기 위한 결합 양식과 일치한다고는 한정할 수 없기 때문에, 스크리닝되는 화합물의 다양성에 제한이 생긴다. 각 표적 분자와의 다양한 결합 양식을 발생시킬 수 있는 라이브러리로부터, 원하는 성질을 갖는 분자를 직접 선별할 수 있는 스크리닝 방법이 요구된다.

또한, 단일의 표적 분자에 대한 결합 활성뿐만 아니라, 후보 분자에 다양한 성질을 요구할수록, 다양한 피험 분자가 포함되는 라이브러리로부터 스크리닝을 행할 필요성이 높아진다. 게다가, 복수의 표적 분자와 함께 복합체를 형성하기 위해서는, 후보 분자가 복잡한 결합·반응 양식을 가져올 것이 필요한 바, 그를 위해 최적인 분자 구조는 예측이 어렵기 때문에, 가능한 한 다양성이 있는 라이브러리에 적용 가능하고, 후보 분자의 선택과 동정이 간편한, 스루풋성이 높은 스크리닝 방법이 요구된다.

Split GFP 기술은, 단백질-단백질 상호작용(PPI)의 검출을 위해서 이용되고 있지만(비특허문헌 2), GFP의 발광을 지표로 하고 있기 때문에, 이것을 스크리닝에 적용한 경우의 스루풋성은 높지 않다. 즉, 형광 검출에 의한 경우, 웰 등의 하나하나의 폐쇄 공간에, 표적 분자 및 단일의 후보 분자를 준비할 필요가 있기 때문에 수고와 비용이 들어, 취급할 수 있는 피험 분자의 수에 제한이 걸린다. 효율화를 위해서, 만일 각 폐쇄 공간에 복수의 피험 분자를 포함하는 라이브러리를 준비하여 스크리닝을 시도했다고 하더라도, 특정한 후보 분자를 선택, 동정하기 위해서는, 단일 분자만의 형광을 확인할 수 있을 때까지 단계적으로, 복수회의 어세이가 필요하여, 전자와 마찬가지로 스루풋성은 높지 않다. 이와 같은 관점에서, GFP 단백질의 발광을 지표로 하는 방법을 대신하는 새로운 방법에 의해, 분할된 단백질의 근접 또는 회합을 검출하고, 그것을 회수할 것이 요구되고 있다.

본 발명은 이와 같은 상황을 감안하여 이루어진 것으로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 스크리닝 방법을 제공하는 것을 과제의 하나로 한다.

본 발명자들은, 라이브러리에 포함되는 피험 분자와 복수의 표적 분자를 동일한 계 중에 공존시켜 스크리닝을 행하는 것이, 표적 분자와 많은 반응 양식을 만들어 내는, 가장 효과적인 방법이라고 생각했다. 그리고, 그를 위해 Split GFP 기술로 대표되는 기술에 어피니티를 이용한 후보 분자의 회수 방법을 적용하여, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 스크리닝 방법을 발견했다. 본 수법에서는, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 억제하면서, 복수의 표적 분자와 함께 복합체를 형성하는 후보 분자의 회수가 가능하다는 것이 발견되었다.

본 발명은 이와 같은 지견에 기초하는 것으로, 비한정된 구체적인 일 태양에 있어서 이하를 포함한다.

〔1〕 이하 (1) 및 (2)의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법:

(1) 제1 부분에 연결된 상기 제1 표적 분자, 제2 부분에 연결된 상기 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정; 및

(2) 공정(1) 후에, 상기 제1 부분과 상기 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체를 회수하는 공정.

〔1.1〕 공정(2)에 있어서의 상기 제1 표적 분자가, 상기 제1 부분에 연결된 제1 표적 분자이고, 상기 제2 표적 분자가, 상기 제2 부분에 연결된 제2 표적 분자인, 〔1〕에 기재된 방법.

〔2〕 공정(2) 후에, 회수된 복합체에 포함되는 후보 분자를 동정하는 공정(공정(3))을 추가로 포함하는, 〔1〕 또는 〔1.1〕에 기재된 방법.

〔3〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하는 분자인, 〔1〕∼〔2〕 중 어느 하나에 기재된 방법.

〔4〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성된 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하는 분자인, 〔1〕∼〔3〕 중 어느 하나에 기재된 방법.

〔5〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응하지 않는 분자인, 〔1〕∼〔4〕 중 어느 하나에 기재된 방법.

〔6〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 10분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔5〕 중 어느 하나에 기재된 방법.

〔7〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 20분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔6〕 중 어느 하나에 기재된 방법.

〔8〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 40분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔7〕 중 어느 하나에 기재된 방법.

〔9〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되지 않는 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응하지 않는 분자인, 〔1〕∼〔8〕 중 어느 하나에 기재된 방법.

〔10〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 10분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔9〕 중 어느 하나에 기재된 방법.

〔11〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 20분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔10〕 중 어느 하나에 기재된 방법.

〔12〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 40분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔11〕 중 어느 하나에 기재된 방법.

〔12.1〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체는, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체인, 〔1〕∼〔12〕 중 어느 하나에 기재된 방법.

〔13〕 상기 제3 분자는, 상기 제1 부분과, 상기 제2 부분을 포함하는 복합체를 검출할 수 있는 분자인, 〔1〕∼〔12.1〕 중 어느 하나에 기재된 방법.

〔14〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및 상기 제2 부분을 포함하는 복합체를 형성시킬 수 있는 분자인, 〔1〕∼〔13〕 중 어느 하나에 기재된 방법.

〔15〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 결합하는 분자인, 〔1〕∼〔14〕 중 어느 하나에 기재된 방법.

〔16〕 공정(2)와 공정(3) 사이에, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체로부터 상기 후보 분자를 용출하는 공정(공정(2A))을 추가로 포함하는, 〔2〕∼〔15〕 중 어느 하나에 기재된 방법.

〔16.1〕 공정(2A)가, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 용출하는 공정인, 〔16〕에 기재된 방법.

〔17〕 공정(2A)와 공정(3) 사이에, 공정(2A)에서 용출된 후보 분자를 인코드하는 폴리뉴클레오타이드를 증폭하는 공정(공정(2B))을 추가로 포함하는, 〔16〕 또는 〔16.1〕에 기재된 방법.

〔18〕 공정(3)이, 공정(2A)에서 용출된 후보 분자를 인코드하는 폴리뉴클레오타이드의 서열, 또는 공정(2B)에서 증폭된 폴리뉴클레오타이드의 서열을 결정하는 것을 포함하는, 〔16〕 또는 〔17〕에 기재된 방법.

〔19〕 공정(1)이, 상기 제1 표적 분자, 상기 제2 표적 분자, 상기 복수의 피험 분자를 포함하는 라이브러리, 및 상기 제3 분자를 혼합하는 것을 포함하는, 〔1〕∼〔18〕 중 어느 하나에 기재된 방법.

〔19.1〕 공정(1)에서 혼합되는, 상기 제1 표적 분자가, 상기 제1 부분에 연결된 제1 표적 분자이고, 상기 제2 표적 분자가, 상기 제2 부분에 연결된 제2 표적 분자인, 〔19〕에 기재된 방법.

〔20〕 공정(1) 후에, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 복수의 피험 분자를 포함하는 라이브러리와, 상기 제3 분자를 혼합하는 공정(공정(1A))을 추가로 포함하는, 〔1〕∼〔18〕 중 어느 하나에 기재된 방법.

〔20.1〕 공정(1A)에서 혼합되는, 상기 제1 표적 분자가, 상기 제1 부분에 연결된 제1 표적 분자이고, 상기 제2 표적 분자가, 상기 제2 부분에 연결된 제2 표적 분자인, 〔20〕에 기재된 방법.

〔21〕 공정(1), (2) 및 (2B), 또는 공정(1), (1A), (2) 및 (2B)를 복수회 반복하는 공정을 포함하는, 〔16〕∼〔20.1〕 중 어느 하나에 기재된 방법.

〔22〕 공정(1), (2), (2A) 및 (2B), 또는 공정(1), (1A), (2), (2A) 및 (2B)를 복수회 반복하는 공정을 포함하는, 〔16〕∼〔21〕 중 어느 하나에 기재된 방법.

〔23〕 in vitro로 행해지는, 〔1〕∼〔22〕 중 어느 하나에 기재된 방법.

〔24〕 상기 피험 분자가 폴리뉴클레오타이드에 의해 코드되어 있는 분자인, 〔1〕∼〔23〕 중 어느 하나에 기재된 방법.

〔25〕 상기 피험 분자가 펩타이드인, 〔1〕∼〔23〕 중 어느 하나에 기재된 방법.

〔26〕 상기 피험 분자가 폴리뉴클레오타이드에 연결된 펩타이드인, 〔1〕∼〔23〕 중 어느 하나에 기재된 방법.

〔27〕 상기 피험 분자의 분자량이 3000 이하인, 〔1〕∼〔26〕 중 어느 하나에 기재된 방법.

〔28〕 상기 피험 분자의 분자량이 2000 이하인, 〔1〕∼〔27〕 중 어느 하나에 기재된 방법.

〔29〕 상기 피험 분자가 상기 제1 표적 분자 및 상기 제2 표적 분자의 어느 일방에 결합하는 것이 알려져 있는 분자인, 〔1〕∼〔28〕 중 어느 하나에 기재된 방법.

〔30〕 상기 라이브러리가, 디스플레이 라이브러리 또는 DNA 인코드 라이브러리인, 〔1〕∼〔29〕 중 어느 하나에 기재된 방법.

〔31〕 상기 디스플레이 라이브러리가, mRNA 디스플레이 라이브러리인, 〔30〕에 기재된 방법.

〔32〕 상기 라이브러리가, 1×10⁴ 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔31〕 중 어느 하나에 기재된 방법.

〔33〕 상기 라이브러리가, 1×10⁵ 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔32〕 중 어느 하나에 기재된 방법.

〔34〕 상기 라이브러리가, 1×10⁶ 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔33〕 중 어느 하나에 기재된 방법.

〔35〕 상기 라이브러리가, 1×10⁸ 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔34〕 중 어느 하나에 기재된 방법.

〔36〕 상기 라이브러리가, 1×10¹⁰ 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔35〕 중 어느 하나에 기재된 방법.

〔37〕 상기 라이브러리가, 1×10¹¹ 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔36〕 중 어느 하나에 기재된 방법.

〔38〕 상기 라이브러리가, 1×10¹² 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔37〕 중 어느 하나에 기재된 방법.

〔39〕 상기 후보 분자가 펩타이드인, 〔1〕∼〔38〕 중 어느 하나에 기재된 방법.

〔40〕 상기 후보 분자가 환상 펩타이드인, 〔1〕∼〔39〕 중 어느 하나에 기재된 방법.

〔41〕 상기 후보 분자가, 상기 제1 표적 분자 및 상기 제2 표적 분자에 동시에 결합할 수 있는 분자인, 〔1〕∼〔40〕 중 어느 하나에 기재된 방법.

〔42〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 2배 이상의 결합 친화성을 갖는, 〔1〕∼〔41〕 중 어느 하나에 기재된 방법.

〔43〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 5배 이상의 결합 친화성을 갖는, 〔1〕∼〔42〕 중 어느 하나에 기재된 방법.

〔44〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 10배 이상의 결합 친화성을 갖는, 〔1〕∼〔43〕 중 어느 하나에 기재된 방법.

〔45〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 20배 이상의 결합 친화성을 갖는, 〔1〕∼〔44〕 중 어느 하나에 기재된 방법.

〔46〕 상기 후보 분자가, 이하 (i)∼(iii) 중 어느 성질을 갖는 분자인, 〔1〕∼〔45〕 중 어느 하나에 기재된 방법;

(i) 상기 제1 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자의 상기 제2 표적 분자에 대한 결합 친화성이, 해당 결합 전보다도 높아지는 분자,

(ii) 상기 제1 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자와 상기 제1 표적 분자의 복합체로서 상기 제2 표적 분자와 결합 가능해지는 분자, 및

(iii) 상기 제1 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 상기 제1 표적 분자의 상기 제2 표적 분자에 대한 결합 친화성이, 해당 결합 전보다도 높아지는 분자.

〔47〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자로 구성되는, 〔1〕∼〔46〕 중 어느 하나에 기재된 방법.

〔48〕 상기 후보 분자가, 상기 제1 표적 분자 및 상기 제2 표적 분자와 함께 형성할 수 있는 복합체가, 3자 복합체인, 〔1〕∼〔47〕 중 어느 하나에 기재된 방법.

〔49〕 공정(1)이 이하의 공정을 포함하는, 〔1〕∼〔48〕 중 어느 하나에 기재된 방법;

(i) 상기 제1 부분에 연결된 제1 표적 분자와 피험 분자를 혼합하는 공정, 및

(ii) 공정(i)에 있어서 얻어진 혼합물과 상기 제2 부분에 연결된 제2 표적 분자를 더 혼합하는 공정.

〔50〕 공정(1)이 이하의 공정을 포함하는, 〔1〕∼〔48〕 중 어느 하나에 기재된 방법;

(i) 상기 제2 부분에 연결된 제2 표적 분자와 피험 분자를 혼합하는 공정, 및

(ii) 공정(i)에 있어서 얻어진 혼합물과 상기 제1 부분에 연결된 제1 표적 분자를 더 혼합하는 공정.

〔51〕 상기 제1 부분과 상기 제1 표적 분자, 및 상기 제2 부분과 상기 제2 표적 분자가, 각각 링커에 의해 연결되어 있는, 〔1〕∼〔50〕 중 어느 하나에 기재된 방법.

〔52〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성된 경우에, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하는, 〔1〕∼〔51〕 중 어느 하나에 기재된 방법.

〔53〕 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분에 상기 제3 분자가 반응 또는 결합하는, 〔52〕에 기재된 방법.

〔54〕 상기 피험 분자가 상기 제1 표적 분자 및 상기 제2 표적 분자의 어느 것에도 결합하지 않는 경우, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되지 않는, 〔1〕∼〔53〕 중 어느 하나에 기재된 방법.

〔55〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되지 않는 경우, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하지 않는, 〔54〕에 기재된 방법.

〔56〕 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하지 않는 경우, 상기 제1 부분 및/또는 상기 제2 부분에 상기 제3 분자가 실질적으로 반응도 결합도 하지 않는, 〔55〕에 기재된 방법.

〔56.1〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체는, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체인, 〔1〕∼〔56〕 중 어느 하나에 기재된 방법.

〔57〕 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율이, 제1 부분에 FKBP를 연결시킨 분자 또는 제2 부분에 FRB를 연결시킨 분자 중 어느 것과, 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율의 5배 이상일 때, 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응 또는 결합하는 분자라고 판정되는, 〔1〕∼〔56.1〕 중 어느 하나에 기재된 방법.

〔58〕 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율이, 제1 부분에 FKBP를 연결시킨 분자 또는 제2 부분에 FRB를 연결시킨 분자 중 어느 것과, 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율의 5배 미만일 때, 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자라고 판정되는, 〔1〕∼〔57〕 중 어느 하나에 기재된 방법.

〔59〕 상기 제1 부분과 상기 제2 부분을 포함하는 복합체가, 상기 단백질의 일부 또는 전부를 포함하는, 〔13〕∼〔58〕 중 어느 하나에 기재된 방법.

〔60〕 상기 단백질이, GFP, 루시페라아제, 유비퀴틴, 또는 SNAP 태그인, 〔1〕∼〔59〕 중 어느 하나에 기재된 방법.

〔61〕 상기 제1 부분과 상기 제2 부분이, 각각 GFP10과 GFP11이거나, GFP11과 GFP10이고, 상기 제3 분자가 GFP1-9를 포함하는 단백질인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.

〔62〕 상기 제1 부분과 상기 제2 부분이, 각각 SNAP 태그의 N 말단측 단편과 SNAP 태그의 C 말단측 단편이거나, SNAP 태그의 C 말단측 단편과 SNAP 태그의 N 말단측 단편이고, 상기 제3 분자가 SNAP 비오틴인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.

〔63〕 상기 제1 부분과 상기 제2 부분이, 각각 유비퀴틴의 N 말단측 단편과 유비퀴틴의 C 말단측 단편이거나, 유비퀴틴의 C 말단측 단편과 유비퀴틴의 N 말단측 단편이고, 상기 제3 분자가 항유비퀴틴 항체인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.

〔64〕 상기 제1 부분과 상기 제2 부분이, 각각 Nanoluc-9와 Nanoluc-10이거나, Nanoluc-10과 Nanoluc-9이고, 상기 제3 분자가 Nanoluc1-8을 포함하는 단백질인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.

〔65〕 GFP10이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔61〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 73으로 표시되는 아미노산 서열,

(b) 서열 번호: 73으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 73으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔66〕 GFP11이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔61〕 및 〔65〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 74로 표시되는 아미노산 서열,

(b) 서열 번호: 74로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 74로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔67〕 GFP1-9가 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔61〕, 〔65〕 및 〔66〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 72로 표시되는 아미노산 서열,

(b) 서열 번호: 72로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 72로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔68〕 SNAP 태그의 N 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕 및 〔62〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 83으로 표시되는 아미노산 서열,

(b) 서열 번호: 83으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 83으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔69〕 SNAP 태그의 C 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔62〕 및 〔68〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 84로 표시되는 아미노산 서열,

(b) 서열 번호: 84로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 84로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔70〕 유비퀴틴의 N 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕 및 〔63〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 76으로 표시되는 아미노산 서열,

(b) 서열 번호: 76으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 76으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔71〕 유비퀴틴의 C 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔63〕 및 〔70〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 77로 표시되는 아미노산 서열,

(b) 서열 번호: 77로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 77로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔72〕 Nanoluc-9가 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕 및 〔64〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 80으로 표시되는 아미노산 서열,

(b) 서열 번호: 80으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 80으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔73〕 Nanoluc-10이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔64〕 및 〔72〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 81로 표시되는 아미노산 서열,

(b) 서열 번호: 81로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 81로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.

〔74〕 Nanoluc1-8이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔64〕, 〔72〕 및 〔73〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 79로 표시되는 아미노산 서열,

(b) 서열 번호: 79로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 79로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔75〕 상기 제1 표적 분자가, 이뮤노필린 패밀리에 속하는 단백질인, 〔1〕∼〔74〕 중 어느 하나에 기재된 방법.

〔76〕 상기 제1 표적 분자가, FKBP(FK506 binding protein/FK506 결합 단백질), 사이클로필린, FRB, 칼시뉴린, 및 Kras, Nras, Hras 등의 RAS 단백질로 이루어지는 군으로부터 선택되는, 〔1〕∼〔74〕 중 어느 하나에 기재된 방법.

〔77〕 상기 어피니티를 이용한 방법이, 풀다운법인, 〔1〕∼〔76〕 중 어느 하나에 기재된 방법.

〔78〕 상기 어피니티를 이용한 방법이, 비오틴과 비오틴 결합 단백질 사이의 어피니티, 또는 항원과 항체 사이의 어피니티를 이용한 방법인, 〔1〕∼〔77〕 중 어느 하나에 기재된 방법.

〔79〕 공정(2A)에 있어서의 용출이, 효소, 또는 열에 의해 행해지는, 〔16〕∼〔78〕 중 어느 하나에 기재된 방법.

〔80〕 공정(2A)에 있어서의 용출이, 상기 단백질의 제1 부분과 상기 제1 표적 분자 사이에 위치하는 제1 링커, 및 상기 단백질의 제2 부분과 상기 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 것에 의해 행해지는, 〔16〕∼〔79〕 중 어느 하나에 기재된 방법.

〔81〕 상기 제1 및 제2 링커가, 효소에 의해 절단되는 서열을 포함하는, 〔80〕에 기재된 방법.

〔82〕 상기 효소가 TEV 프로테아제인, 〔81〕에 기재된 방법.

〔83〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔82〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열,

(b) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.

〔84〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 71로 표시되는 아미노산 서열,

(b) 서열 번호: 71로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 71로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔85〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 75로 표시되는 아미노산 서열,

(b) 서열 번호: 75로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 75로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔86〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 78로 표시되는 아미노산 서열,

(b) 서열 번호: 78로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 78로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔87〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;

(a) 서열 번호: 82로 표시되는 아미노산 서열,

(b) 서열 번호: 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및

(c) 서열 번호: 82로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.

〔88〕 상기 제3 분자가, 상기 제1 부분 및 상기 제2 부분을 제공하는 상기 단백질에서 유래하는, 〔1〕∼〔87〕 중 어느 하나에 기재된 방법.

〔89〕 이하의 공정을 추가로 포함하는, 〔1〕∼〔88〕 중 어느 하나에 기재된 방법:

(4) 고상 담체에 고정된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제1 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정; 및/또는

(5) 고상 담체에 고정된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제2 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정.

〔90〕 공정(4)에 있어서, 고상 담체에 고정된 제1 표적 분자, 유리된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는, 〔89〕에 기재된 방법.

〔91〕 공정(5)에 있어서, 고상 담체에 고정된 제2 표적 분자, 유리된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는, 〔89〕 또는 〔90〕에 기재된 방법.

〔92〕 공정(4) 및 (5)가, 공정(1) 전에 행해지는, 〔89〕∼〔91〕 중 어느 하나에 기재된 방법.

〔93〕 공정(4) 후에 공정(5)가 행해지거나, 공정(5) 후에 공정(4)가 행해지는, 〔89〕∼〔92〕 중 어느 하나에 기재된 방법.

본 개시에 있어서, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 스크리닝 방법이 제공되었다. 본 개시의 방법을 이용하는 것에 의해, 계 중에 복수의 표적 분자와 피험 분자를 공존시킨 상태로부터, 1개의 표적 분자만과 복합체를 형성하는 피험 분자를 배제하면서, 복수의 표적 분자와 함께 복합체를 형성하는 후보 분자를 선별할 수 있다.

도 1은, 비오틴화 GFP1-9와 스트렙트아비딘간의 상호작용을 이용한 겔 시프트를 SDS-PAGE로 평가한 도면이다. 검출은 CBB 염색으로 행했다. (레인 1: 분자량 마커, 레인 2: 비오틴화 GFP1-9와 스트렙트아비딘의 혼합물, 레인 3: 비오틴화 GFP1-9, 레인 4: 비오틴화 GFP1-9(1/10양), 레인 5: 스트렙트아비딘)
도 2는, 비오틴화 GFP1-9의 SEC 분석의 결과(위 도면)와, 동 칼럼에서 분자량 마커를 흘려보낸 결과(아래 도면)이다. (마커 분자량: 좌측의 피크부터, 290.00x10³, 142.00x10³, 67.00x10³, 32.00x10³, 12.40x10³)
도 3은, 비오틴화 splitNanoluc와 스트렙트아비딘간의 상호작용을 이용한 겔 시프트를 SDS-PAGE로 평가한 도면이다. 검출은 CBB 염색으로 행했다. (레인 1: 분자량 마커, 레인 2: 비오틴화 splitNanoluc와 스트렙트아비딘의 혼합물, 레인 3: 비오틴화 splitNanoluc, 레인 4: 비오틴화 splitNanoluc(1/10양), 레인 5: 스트렙트아비딘)
도 4는, 비오틴화 splitNanoluc의 SEC 분석의 결과(위 도면)와, 동 칼럼에서 분자량 마커를 흘려보낸 결과(아래 도면)이다. (마커 분자량: 좌측의 피크부터, 290.00x10³, 142.00x10³, 67.00x10³, 32.00x10³, 12.40x10³)

본 개시는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자의 스크리닝 방법에 관한 것이다. 어떤 국면에 있어서 본 개시에 있어서의 스크리닝 방법은, 이하 (1) 및 (2)의 공정을 포함한다.

(1) 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정; 및

(2) 공정(1) 후에, 해당 제1 부분과 해당 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 해당 제1 표적 분자, 해당 제2 표적 분자, 및 해당 후보 분자를 포함하는 복합체를 회수하는 공정.

공정(1)

본 개시에 있어서의 스크리닝 방법은, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정(공정(1))을 포함한다. 본 개시에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를, 한번에 혼합할 수 있다. 또한 본 개시에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를, 복수회로 나누어 혼합할 수 있다. 구체적으로는, 제1 부분에 연결된 제1 표적 분자와 제2 부분에 연결된 제2 표적 분자를 혼합하고, 다음으로 이들 혼합물에 피험 분자를 포함하는 라이브러리를 혼합할 수 있다. 또한 다른 태양에 있어서, 제1 부분에 연결된 제1 표적 분자와 피험 분자를 포함하는 라이브러리를 혼합하고, 다음으로 이들 혼합물에 제2 부분에 연결된 제2 표적 분자를 혼합할 수 있다. 또 다른 태양에 있어서는, 제2 부분에 연결된 제2 표적 분자와 피험 분자를 포함하는 라이브러리를 혼합하고, 다음으로 이들 혼합물에 제1 부분에 연결된 제1 표적 분자를 혼합할 수 있다.

즉 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,

(i) 제1 부분에 연결된 제1 표적 분자와 제2 부분에 연결된 제2 표적 분자를 혼합하는 공정, 및

(ii) (i)에 있어서 얻어진 혼합물과 1 혹은 복수의 피험 분자 또는 그것을 포함하는 라이브러리를 혼합하는 공정

을 포함할 수 있다.

혹은 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,

(i) 제1 부분에 연결된 제1 표적 분자와 1 혹은 복수의 피험 분자 또는 그것을 포함하는 라이브러리를 혼합하는 공정, 및

(ii) (i)에 있어서 얻어진 혼합물과 제2 부분에 연결된 제2 표적 분자를 혼합하는 공정

을 포함할 수 있다.

혹은 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,

(i) 제2 부분에 연결된 제2 표적 분자와 1 혹은 복수의 피험 분자 또는 그것을 포함하는 라이브러리를 혼합하는 공정, 및

(ii) (i)에 있어서 얻어진 혼합물과 제1 부분에 연결된 제1 표적 분자를 혼합하는 공정

을 포함할 수 있다.

혹은 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,

(A) 제1 부분을 연결시킨 상기 제1 표적 분자,

(B) 제2 부분을 연결시킨 상기 제2 표적 분자, 및

(C) 피험 분자,

에 의해 형성된 복합체를 제3 분자와 혼합하는 공정

을 포함할 수 있다.

혹은 본 개시에 있어서의 스크리닝 방법은, 공정(1) 후에, 공정(1)에 있어서 얻어지는 혼합물에, 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 혼합하는 공정(공정(1A))을 포함해도 된다.

추가적인 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 공정(1) 후에 공정(1A)를 포함하는 것 대신에, 공정(1) 자체가, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 제3 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이어도 된다. 이 경우, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 제3 분자, 및 복수의 피험 분자를 포함하는 라이브러리는, 한번에 혼합해도 복수회로 나누어 혼합해도 된다. 또한 복수회로 나누어 혼합하는 경우, 이들 4개의 성분을 1개씩 순번으로 혼합해도 되고, 이들 4개 중 2개의 성분(예를 들면, 제1 부분에 연결된 제1 표적 분자와 제2 부분에 연결된 제2 표적 분자)을 포함하는 혼합물을 미리 준비하고, 거기에 다른 성분을 혼합해도 되고, 이들 4개 중 3개의 성분(예를 들면, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리)을 포함하는 혼합물을 미리 준비하고, 거기에 다른 성분을 혼합해도 된다.

또한 비한정된 일 태양에 있어서, 본 개시는, 이하 (1) 및 (2)의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법이어도 된다.

(1) (A) 제1 부분을 연결시킨 제1 표적 분자,

(B) 제2 부분을 연결시킨 제2 표적 분자, 및

(C) 피험 분자

에 의해 형성된 복합체를,

제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자와 혼합하는 공정이고,

해당 제1 부분 및 해당 제2 부분은, 단백질의 일부 또는 전부를 구성하고,

해당 제3 분자는, 해당 제1 부분 및 해당 제2 부분이 근접한 경우에 해당 제1 부분 및/또는 해당 제2 부분과 결합하는, 공정; 및

(2) 공정(1) 후에, 해당 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 해당 복합체를 회수하는 공정.

본 개시에 있어서의 스크리닝 방법에 있어서는, 각 공정에 있어서 특정되는 분자를 혼합하는 것에 의해, 그들 분자가 스크리닝계에 있어서 공존한다. 따라서, 일례로서 본 개시에 있어서의 공정(1)은 다음과 같이 표현할 수도 있다.

(1) 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 공존시키는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정.

또한 본 개시에 있어서는, 각 공정에 있어서 특정되는 분자를 혼합하는 것에 의해, 그들 분자가 접촉해도 된다. 즉, 일례로서 본 개시에 있어서의 공정(1)은 다음과 같이 표현할 수도 있다.

(1) 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 접촉시키는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정.

한편 후술하는 바와 같이, 본 개시에 있어서의 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체에는, 후보 분자가 제1(또는 제2) 표적 분자와 결합하고, 제1(또는 제2) 표적 분자가 제2(또는 제1) 표적 분자와 결합하고 있는 태양(후보 분자는 제2(또는 제1) 표적 분자란 직접적으로는 결합하고 있지 않는 태양)도 포함된다. 따라서, 본 개시에 있어서의 공정(1)에 있어서는, 피험 분자가 제1 표적 분자 및 제2 표적 분자의 양방과 접촉하는 것은 필수는 아니다. 본 개시에 있어서의 공정(1)에는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리가 혼합되어 있는 한, 혹은 이들이 동일한 계에 공존하고 있는 한, 피험 분자가 제1 표적 분자 및 제2 표적 분자의 어느 일방과만 접촉하는 태양이 포함된다.

공정(2)

본 개시에 있어서의 스크리닝 방법은, 공정(1)에 있어서 형성된 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를, 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용하여 회수하는 공정(공정(2))을 포함한다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 형성되면, 당해 복합체에 있어서, 제1 부분 및 제2 부분이 근접 또는 회합한다. 또한, 그에 수반하여, 혹은 그것과 연동하여, 제1 부분 및 제2 부분을 포함하는 복합체가 형성된다. 따라서 본 개시에 있어서는, 제1 부분 및 제2 부분이 근접 또는 회합하는 것을, 제1 부분 및 제2 부분을 포함하는 복합체가 형성된다고 표현할 수도 있다. 그리고 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제3 분자가 제1 부분 및/또는 제2 부분에 반응 또는 결합할 수 있다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 이와 같이 해서 형성된 제1 표적 분자, 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체를 선택하고, 당해 복합체로부터, 후보 분자를 회수할 수 있다. 일 태양에 있어서, 제1 부분 및 제2 부분을 제1 표적 분자 및 제2 표적 분자로부터 각각 절단하면, 제1 표적 분자, 제2 표적 분자, 및 후보 분자로 이루어지는 복합체를 취득할 수 있다. 또, 당해 복합체로부터 후보 분자를 회수할 수 있다. 본 개시에 있어서의 제3 분자는, 상기, 「제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체」, 「제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체」, 「제1 부분 및 제2 부분을 포함하는 복합체」, 및 「제1 부분 및 제2 부분이 근접 또는 회합하고 있는 것」 중 적어도 1개를 검출하는 것이 가능한 분자이다.

한편, 본 개시에 있어서의 스크리닝 방법에 있어서는, 피험 분자가 제1 표적 분자 및 제2 표적 분자의 어느 것에도 결합하지 않는 경우, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체는 형성되지 않는다. 그리고, 이와 같은 복합체가 형성되지 않는 경우, 제1 부분 및 제2 부분은 근접도 회합도 하지 않는다. 바꾸어 말하면, 후보 분자가 존재하지 않으면, 제1 부분 및 제2 부분을 포함하는 복합체는 형성되지 않는다. 이 경우, 제3 분자는 제1 부분 및/또는 제2 부분에 실질적으로 반응도 결합도 하지 않는다. 그리고, 이 경우, 제3 분자를 개재시킨 어피니티를 이용한 방법에 의해, 피험 분자는 회수되지 않는다. 따라서, 이 경우, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체는 형성되지 않고, 만일 피험 분자 중에 제1 표적 분자만과 복합체를 형성할 수 있는 분자, 혹은 제2 표적 분자만과 복합체를 형성할 수 있는 분자가 존재하고 있었다고 하더라도, 본 개시에 있어서의 스크리닝 방법을 이용하면, 그와 같은 피험 분자가 단리되어 버리는 확률을 저감할 수 있다. 본 개시의 스크리닝 방법은, 그와 같은 후보 분자의 존재에 기인한 검출 정밀도의 저하를 억제하는 것이 가능하다.

일 태양에 있어서, 공정(2)에 있어서 언급되는, 「제1 표적 분자, 제2 표적 분자, 및 후보 분자」를 포함하는 복합체로서는, 「제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자」를 포함하는 복합체를 가리킬 수 있고, 해당 복합체는, 문맥에 따라서 제3 분자를 추가로 포함하고 있어도 된다.

공정(2A)

일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수한 후, 당해 복합체로부터 후보 분자를 용출하는 공정(공정(2A))을 추가로 포함할 수 있다. 일 태양에 있어서, 용출은, 효소 반응 또는 열 반응에 의해 행할 수 있다. 효소 반응에 의한 용출에는, 후술하는 TEV 프로테아제를 이용할 수 있다.

공정(2B)

일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 후보 분자가 폴리뉴클레오타이드를 포함하거나 혹은 폴리뉴클레오타이드에 연결되어 있는 경우, 후보 분자가 폴리뉴클레오타이드에 의해 코드되는 경우, 또는 후보 분자가 폴리뉴클레오타이드 등인 경우, 당해 폴리뉴클레오타이드를 증폭하는 공정(공정(2B))을 포함할 수 있다. 폴리뉴클레오타이드의 증폭은, 폴리머라아제 연쇄 반응(PCR; polymerase chain reaction), LAMP(loop-mediated isothermal amplification), TMA(transcription-mediated amplification), TRC(transcription-reverse transcription concerned reaction), LCR(ligase chain reaction), SDA(standard displacement amplification), NASBA(nucleic acid sequence-based amplification) 등, 당업자에게 주지된 방법에 의해 행할 수 있다.

한편, 일 태양에 있어서, 상기에서 증폭된 폴리뉴클레오타이드를 전사하는 것에 의해, mRNA 라이브러리를 얻어도 되고, 이들을 주형으로 해서 재차 펩타이드의 라이브러리를 제조하고, 당해 라이브러리를 본 개시에 있어서의 스크리닝 방법에 제공할 수도 있다. 이와 같은 라이브러리는 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 펩타이드가 농축되어 있기 때문에, 이 라이브러리를 이용하여 재차 패닝을 행함으로써, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 펩타이드를, 보다 농축할 수 있다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 공정(1) 및 (2), 공정(1), (2) 및 (2B), 또는 공정(1), (1A), (2) 및 (2B)를 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복하는 것에 의해, 목적하는 후보 분자를 농축할 수 있다. 또한 본 개시에 있어서의 스크리닝 방법에 있어서는, 공정(1), (2), (2A) 및 (2B), 또는 공정(1), (1A), (2), (2A) 및 (2B)를 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복하는 것에 의해서도, 목적하는 후보 분자를 농축할 수 있다. 일 태양에 있어서, 후보 분자가 폴리뉴클레오타이드에 연결된 펩타이드인 경우, 이와 같이 해서 농축된 펩타이드에 포함되는 염기 서열 정보를 기초로 아미노산 서열을 동정하여, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 펩타이드를 제조할 수 있다. 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, in vitro로 행할 수 있다.

공정(3)

일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 회수된 제1 표적 분자, 제2 표적 분자, 및 후보 분자의 복합체에 포함되는 후보 분자를 동정하는 공정을 추가로 포함할 수 있다. 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 얻어지면, 당업자에게 주지된 방법에 의해, 그로부터 후보 분자를 단리, 취득할 수 있다. 일 태양에 있어서, 후보 분자의 동정은, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체로부터 후보 분자를 단리한 후에 행할 수 있다. 후보 분자의 동정은 당업자에게 주지된 방법으로 행하는 것이 가능하지만, 예를 들면, 후보 분자가 폴리뉴클레오타이드에 연결된 펩타이드 또는 화합물인 경우, 당해 후보 분자를 인코드하는 폴리뉴클레오타이드의 염기 서열을 결정하는 것에 의해 해당 펩타이드 또는 화합물을 동정할 수 있다. 구체적으로는, 예를 들면 폴리뉴클레오타이드를 PCR 증폭하고, 그의 염기 서열을 해석함으로써, 폴리뉴클레오타이드에 연결된 펩타이드의 아미노산 서열 또는 화합물을 분명히 할 수 있다. 폴리뉴클레오타이드가 mRNA인 경우는 당해 mRNA로부터 cDNA를 합성한 것을 이용해도 된다.

또한 후보 분자에 태그가 부여되어 있지 않은 경우는, 예를 들면 ASMS(Affinity Selection Mass Spectrometry)에 의해 후보 분자를 동정할 수 있다.

공정(4) 및 (5)

일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 고상 담체에 고정된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제1 표적 분자에 결합할 수 있는 후보 분자를 회수하는 공정(「공정(4)」), 및/또는, 고상 담체에 고정된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제2 표적 분자에 결합할 수 있는 후보 분자를 회수하는 공정(「공정(5)」)을 포함할 수 있다. 공정(4)에 있어서는, 고상 담체에 고정된 제1 표적 분자, 유리된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합해도 된다. 공정(5)에 있어서는, 고상 담체에 고정된 제2 표적 분자, 유리된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합해도 된다. 일 태양에 있어서, 공정(4) 후에 공정(5)를 행할 수 있고, 또는, 공정(5) 후에 공정(4)를 행할 수 있다. 공정(4) 및 (5)는, 공정(1)∼(3)과 조합할 수 있고, 예를 들면 공정(1) 전에 공정(4) 및 (5)를 행할 수 있다. 공정(4) 및 (5)의 실시 횟수에 제한은 없지만, 예를 들면 공정(4) 또는 (5)를 독립적으로 1회 또는 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복해서 실시해도 되고, 공정(4) 및 (5)를 1세트로 해서, 1회 또는 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복해서 실시할 수도 있다.

일 태양에 있어서, 공정(4) 및 (5)의 각각의 공정 후에, 전술한 공정(2A)와 마찬가지로, 피험 분자 또는 후보 분자를 용출하는 공정을 포함할 수 있다. 후보 분자가 폴리뉴클레오타이드를 포함하거나 혹은 폴리뉴클레오타이드에 연결되어 있는 경우에는, 공정(4) 및 (5)의 각각의 공정 후에, 전술한 공정(2B)와 마찬가지로, 폴리뉴클레오타이드를 증폭하는 공정을 포함할 수 있다. 일 태양에 있어서, 후보 분자의 동정은, 전술한 공정(3)에 따라 행할 수 있다.

특정한 이론에 구속되는 것은 아니지만, 피험 분자를 포함하는 라이브러리와 혼합할 때에, 한쪽의 표적 분자(예를 들면 제1 표적 분자)를 고상 담체에 고정하고, 다른 한쪽의 표적 분자(예를 들면 제2 표적 분자)를 유리된 상태로 함으로써, 회수되는 후보 분자군 중에는, 양방의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자가 포함될 수 있다고 생각된다. 다음으로, 고상 담체에 고정하는 표적 분자와 유리된 표적 분자를 바꿔 넣은 상태에서, 앞서 얻어진 후보 분자군과 혼합하면, 양방의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자가 농축된다고 생각된다. 이와 같이 표적 분자의 고정/유리 상태를 교대로 변경하면서 패닝을 행함으로써, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 선택할 수 있다고 생각된다. 일 태양에 있어서, 공정(4) 및 (5)를 공정(1) 전에 행할 수 있지만, 이 순번으로 패닝을 행하는 것에 의해, 제1 표적 분자 및/또는 제2 표적 분자에 특이적으로 결합할 수 있는 후보 분자를 효율적으로 농축할 수 있다고 생각된다. 구체적으로는, 공정(1) 이후에 있어서, 표적 분자에 대한 결합 친화성을 갖지 않는 비특이적인 피험 분자의 잔존율을 저감할 수 있다고 생각된다.

일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 이하의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법이다:

(4) 고상 담체에 고정된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제1 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정; 및

제3 분자

전술한 대로 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성된 경우, 제1 부분 및 제2 부분이 근접 또는 회합한다. 본 개시에 있어서 제3 분자는, 본 개시에 있어서의 제1 부분 및 제2 부분이 근접 또는 회합하고 있는 것을 검출하는 것이 가능한 분자이다. 또한 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제1 부분 및 제2 부분을 포함하는 복합체를 형성시킬 수 있는 분자이다. 일 태양에 있어서, 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분을 제공하는 단백질에서 유래하는 분자일 수 있다. 일 태양에 있어서, 제3 분자의 아미노산 서열은, 제1 부분 및 제2 부분을 제공하는 단백질 중에 존재하는 야생형의 아미노산 서열과 동일해도 되고, 상이해도 된다. 일 태양에 있어서, 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분과 함께, 어떤 단백질의 일부 또는 전부를 구성할 수 있고, 예를 들면, GFP 또는 루시페라아제의 전부를 구성할 수 있다. 이 경우여도, 제3 분자는, 제1 부분 및 제2 부분을 제공하는 단백질에 포함되지 않는 태그 및/또는 링커 서열 등을 포함할 수 있다. 이 경우여도, 제3 분자는, 제1 부분 및 제2 부분과 함께, 해당 단백질의 일부 또는 전부를 구성할 수 있다. 일 태양에 있어서, 본 개시에 있어서의 제3 분자에는, 아미노산 서열에 개변을 갖는 것도 포함된다. 예를 들면, 제3 분자의 조제나 안정성 등에 적합한 아미노산의 개변(1 또는 복수의 아미노산의 결실, 삽입, 치환 및/또는 부가)이 행해져도 된다.

종래의 발광을 지표로 한 방법 대신에 어피니티를 사용하여 피험 분자를 스크리닝하는 경우, 제3 분자는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에만, 해당 제1 부분 및/또는 제2 부분에 반응 또는 결합하는 분자일 것이 요구된다. 그래서 본 발명자들은, GFP1-9는 GFP10(또는 GFP11)의 비존재하에서 GFP11(또는 GFP10)과 회합할 수 있는 것인지, 아니면 GFP1-9가 GFP10 및 GFP11과 회합하기 위해서는 GFP10과 GFP11의 양방의 존재를 필요로 하는지에 대하여, 검증을 행했다. 그 결과, 본 발명자들은, GFP1-9는 GFP10(또는 GFP11)의 비존재하에서는 GFP11(또는 GFP10)과 회합하지 않는 것, GFP1-9가 GFP10 및 GFP11과 회합하기 위해서는 GFP10과 GFP11이 근접, 회합 혹은 상호작용하고 있을 것이 필요한 것을 발견했다.

또 본 발명자들은, 루시페라아제의 일종인 Nanoluc(등록상표)를 이용하여, 전술한 GFP와 마찬가지의 검증을 행했다. 즉, Nanoluc1-8은 Nanoluc-9(또는 Nanoluc-10)의 비존재하에서 Nanoluc-10(또는 Nanoluc-9)과 회합할 수 있는 것인지, 아니면 Nanoluc1-8이 Nanoluc-9 및 Nanoluc-10과 회합하기 위해서는 Nanoluc-9와 Nanoluc-10의 양방의 존재를 필요로 하는지에 대하여, 검증을 행했다. 그 결과, 본 발명자들은, Nanoluc1-8은 Nanoluc-9(또는 Nanoluc-10)의 비존재하에서는 Nanoluc-10(또는 Nanoluc-9)과 회합하지 않는 것, Nanoluc1-8이 Nanoluc-9 및 Nanoluc-10과 회합하기 위해서는 Nanoluc-9와 Nanoluc-10이 근접, 회합 혹은 상호작용하고 있을 것이 필요한 것을 발견했다.

이들 지견은, split GFP 기술이나 Nanoluc 기술로 대표되는 split-protein계에 어피니티를 이용한 후보 분자의 회수 방법을 적용하여, 일방의 표적 분자만과 복합체를 형성하는 피험 분자를 배제하면서, 다양성이 큰 라이브러리 중에서 후보 분자를 스크리닝하는 것이 가능한 계를 구축함에 있어서, 중요했다.

특정한 이론에 구속되는 것은 아니지만, 본 발명자들은 이하와 같이 고찰한다. 형광을 지표로 해서 라이브러리로부터 표적 분자에 대한 바인더의 스크리닝을 시도한 경우, 형광단의 성숙까지 어느 정도의 시간을 필요로 하기 때문에, 시간 경과와 함께 특정한 혹은 유사한 성질(예를 들면 높은 결합 활성)을 갖는 바인더 집단에 수속되어 버려, 다양한 성질을 갖는 후보 분자를 취득하는 것이 어려워질 가능성이 있다. 복잡한 결합·반응 양식을 가져오는 후보 분자의 취득 확률을 높이려면, 특정한 혹은 유사한 성질을 갖는 분자 집단이 아니라, 비록 결합 활성이 낮았다고 하더라도 가능한 한 다양한 성질을 갖는 후보 분자를 취득할 수 있는 스크리닝 방법인 것이 바람직하다. 이와 같은 관점에서도, 본 개시에 있어서의 후보 분자를 스크리닝하기 위해서는, 발광을 지표로 하는 방법을 대신하는 새로운 방법으로서, 어피니티를 사용한 후보 분자의 스크리닝 방법을 구축하는 것이 중요했다.

또 본 발명자들은, 단백질로서 유비퀴틴 및 SNAP 태그를 사용한 경우에도 GFP나 Nanoluc를 사용한 경우와 마찬가지로, 복수의 단백질과의 복합체를 형성할 수 있는 분자를 스크리닝하는 것이 가능한 것을 발견했다. 즉 본 발명자들은, 전장(全長) 유비퀴틴에 결합할 수 있는 한편으로, 그 단편인 split 유비퀴틴에는 결합할 수 없는 항유비퀴틴 항체를 사용하면, split 유비퀴틴을 이용하여 마찬가지의 스크리닝이 가능한 것을 착상하여, 이것을 분명히 했다. 또한, 전장 SNAP 태그는 기질인 SNAP-비오틴과 반응할 수 있는 데 비해, 그 단편인 split SNAP는 SNAP-비오틴과 반응할 수 없는 성질을 이용하면, split SNAP를 이용하여 마찬가지의 스크리닝이 가능한 것을 착상하여, 이것을 분명히 했다.

따라서, 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 반응 또는 결합할 수 있는 분자이다. 또한 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성된 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 반응 또는 결합할 수 있는 분자이다.

본 개시에 있어서의 일 태양에 있어서, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성된 경우에, 제1 부분 및 제2 부분은 근접 또는 회합하고 있다고 말할 수 있다. 또한 일 태양에 있어서, 제1 부분 및 제2 부분을 포함하는 복합체가 형성되어 있을 때에, 제1 부분 및 제2 부분은 근접 또는 회합하고 있다고 말할 수 있다.

본 개시에 있어서의 제1 부분 및 제2 부분의 근접, 및 제1 부분 및 제2 부분의 회합은, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성되는 것에 기인하는 것인 한, 그 정도 및 태양을 따지지 않는다. 예를 들면, 본 개시에 있어서의 제1 부분과 제2 부분이 근접 또는 회합하고 있는 상태에는, 제1 부분과 제2 부분이 분자간력 등에 의해 결합한 상태, 및 이들이 결합하고 있지 않는 상태 모두가 포함된다.

또한 전술한 대로, 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성되지 않는 경우, 제1 부분 및 제2 부분은 근접도 회합도 하지 않는다. 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접도 회합도 하지 않는 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자이다. 또한 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성되지 않는 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자이다.

또한 다른 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접도 회합도 하고 있지 않은 경우에, 제1 부분 및 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 10분의 1 미만, 20분의 1 미만, 30분의 1 미만, 또는 40분의 1 미만으로밖에, 제1 부분 및/또는 제2 부분과 반응 또는 결합하지 않는 분자이다. 또한 다른 태양에 있어서, 본 개시에 있어서의 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 10분의 1 미만, 20분의 1 미만, 30분의 1 미만, 또는 40분의 1 미만으로밖에, 제1 부분 및/또는 제2 부분과 반응 또는 결합하지 않는 분자이다.

제3 분자가, 제1 부분 및/또는 제2 부분과 반응 또는 결합하는지 여부는, 예를 들면 제1 표적 분자로서 FKBP(FK506 binding protein/FK506 결합 단백질), 제2 표적 분자로서 FRB(FKBP-rapamycin binding domain of FKBP12-rapamycin associated protein/FKBP-라파마이신 결합 단백질의 FKBP-라파마이신 결합 도메인), 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행하고, 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 라파마이신, 및 제3 분자를 포함하는 복합체의 회수를 시도했을 때에, 또는 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 라파마이신의 분자를 포함하는 복합체의 회수를 시도했을 때에, 당해 복합체가 회수되는지 여부에 의해 판정할 수 있다. 본 개시에 있어서는, 당해 복합체가 회수되었을 때에, 상기 제3 분자는 제1 부분 및/또는 제2 부분과 반응 또는 결합한 분자라고 판정할 수 있다. 또한 일 태양에 있어서, 당해 복합체가 회수되지 않을 때에, 상기 제3 분자는 제1 부분 및/또는 제2 부분과 실질적으로 반응도 결합도 하지 않은 분자라고 판정할 수 있다. 또한 본 개시에 있어서는, 어떤 분자의 제1 부분 및/또는 제2 부분에 대한 반응 또는 결합의 정도가, 제1 부분 및 제2 부분이 근접 또는 회합하고 있는 경우에 제1 부분 및/또는 제2 부분과 반응 또는 결합하는 것이 가능한 제3 분자의 그것과 비교해서, 10분의 1 미만, 20분의 1 미만, 30분의 1 미만, 또는 40분의 1 미만인 경우에, 당해 어떤 분자는, 제1 부분 및/또는 제2 부분과 실질적으로 반응도 결합도 하지 않은 분자라고 판정할 수 있다. 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 라파마이신, 및 제3 분자를 포함하는 복합체, 또는 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 라파마이신, 및 제3 분자를 포함하는 복합체가 회수되는지 여부, 또는 그 회수율은, 예를 들면, 라파마이신에 연결된 핵산의 양(분자수)을 지표로 산출할 수 있다.

또한 본 개시에 있어서는, (a) 제1 표적 분자로서 FKBP, 제2 표적 분자로서 FRB, 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행한 경우에 얻어지는 라파마이신의 회수율과, (b) 제2 표적 분자를 이용하지 않고서, 제1 표적 분자로서 FKBP, 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행한 경우에 얻어지는 라파마이신의 회수율, 또는 (c) 제1 표적 분자를 이용하지 않고서, 제2 표적 분자로서 FRB, 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행한 경우에 얻어지는 라파마이신의 회수율을 비교했을 때에, (a)에 있어서의 회수율이 (b) 또는 (c)에 있어서의 회수율의 5배 이상, 10배 이상, 15배 이상, 20배 이상, 30배 이상, 또는 40배 이상인 경우에, 제3 분자는 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제1 부분 및/또는 제2 부분과 반응 또는 결합하는 분자라고 판정할 수 있다. 바꾸어 말하면, 이 경우, 제3 분자는, 제1 표적 분자 및 제2 표적 분자의 어느 일방만을 포함하는 복합체와는 유의하게 반응 또는 결합하지 않고, 피험 분자, 제1 부분에 연결된 제1 표적 분자 및 제2 부분에 연결된 제2 표적 분자를 포함하는 복합체만과 유의하게 반응 또는 결합하는 분자라고 판정할 수 있다. 또한 일 태양에 있어서, 상기 (a)와 상기 (b) 또는 (c)를 비교했을 때에, (a)에 있어서의 회수율이 (b) 또는 (c)에 있어서의 회수율의 5배 미만, 10배 미만, 15배 미만, 20배 미만, 30배 미만, 또는 40배 미만인 경우에, 제3 분자는 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제1 부분 및/또는 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자라고 판정할 수 있다. 이와 같은 평가는, 예를 들면 실시예의 기재에 기초하여 행할 수 있다.

전술한 대로 본 개시에 있어서의 스크리닝 방법은, Split GFP 기술로 대표되는 Split protein계에 어피니티를 이용한 후보 분자의 회수 방법을 적용한 것을 특징의 하나로 한다. 즉 본 개시에 있어서의 스크리닝 방법은, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체, 또는 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수하는 공정을 포함한다. 따라서 본 개시에 있어서의 제3 분자는, 어피니티를 이용한 복합체의 회수를 위한 태그를 갖고 있어도 된다. 일 태양에 있어서, 제3 분자는, 비오틴화를 위한 태그 서열을 갖고 있어도 된다. 게다가, 제3 분자는, 정제를 위한 태그, 링커, 및/또는 그 밖의 서열을 포함하고 있어도 된다.

제1 부분, 제2 부분

본 개시의 일 태양에 있어서 제1 부분 및 제2 부분이란, 어떤 단백질의 일부를 구성하는 부분 또는 단편일 수 있다. 일 태양에 있어서, 상기 부분 또는 단편은, 해당 단백질의 본래의 기능이나 활성을 갖지 않는다. 본 개시에 있어서의 제1 부분 및 제2 부분은, 단백질을 2개, 3개, 또는 그 이상으로 분할하는 것에 의해 얻어지는 단백질의 부분(단편)일 수 있다. 혹은, 본 개시의 일 태양에 있어서의 제1 부분 및 제2 부분은, 이들이 근접 또는 회합했을 때에 원래의 단백질의 전부 또는 일부를 구성하는 부분일 수 있다. 여기에서, 분할된 단백질의 각 부분은, 일부 중복되는 아미노산 서열을 갖고 있어도 된다. 일 태양에 있어서, 그와 같은 중복되는 아미노산 서열은, 분할된 단백질의 각 부분의 말단 부분에 존재할 수 있다. 제1 부분 및 제2 부분이 회합한 경우에 원래의 단백질의 전부를 구성하는 태양에 있어서는, 제1 부분과 제2 부분이 회합한 단백질은, 해당 단백질이 분할되기 전에 갖고 있던 구조, 기능 또는 활성을 가질 수 있다. 또한 제1 부분 및 제2 부분이 회합한 경우에 원래의 단백질의 일부를 구성하는 태양에 있어서는, 제1 부분과 제2 부분이 근접 또는 회합한 단백질은, 해당 단백질을 구성하는 다른 부분, 예를 들면, 제3 분자와 추가로 회합하는 것에 의해, 해당 단백질이 분할되기 전에 갖고 있던 구조, 기능 또는 활성을 가질 수 있다. 전자의 단백질의 예로서, SNAP 태그 및 유비퀴틴을 들 수 있고, 후자의 단백질의 예로서, GFP 및 루시페라아제를 들 수 있다.

한편 본 개시에 있어서는, 제1 부분 및 제2 부분이 유래하는 단백질을, 「제1 부분 및 제2 부분을 제공하는 단백질」이라고 칭하는 경우가 있다.

본 개시에 있어서, 제1 부분 및/또는 제2 부분의 아미노산 서열은, 제1 부분 및 제2 부분을 제공하는 단백질의 야생형의 아미노산 서열과 동일해도 되고, 상이해도 된다. 예를 들면, 제1 부분이나 제2 부분의 조제나 안정성 등에 적합한 아미노산의 개변(1 또는 복수의 아미노산의 결실, 삽입, 치환 및/또는 부가)이 행해져도 된다.

제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체

본 개시에 있어서의 스크리닝 방법에 있어서는, 후보 분자가 제1 표적 분자 및 제2 표적 분자와 복합체를 형성하는 것이 가능한 분자인 경우, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 형성된다. 일 태양에 있어서, 당해 복합체로부터 제1 부분 및 제2 부분을 제거하면, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 취득할 수 있다. 본 개시에 있어서 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체는, 바람직하게는, 제1 표적 분자, 제2 표적 분자, 및 후보 분자로 구성되는 복합체, 또는 제1 표적 분자, 제2 표적 분자, 후보 분자, 및 제3 분자로 구성되는 복합체이다. 또한 일 태양에 있어서, 본 개시에 있어서의 복합체는, 상기 3자 또는 4자를 포함하는 한, 다른 분자를 포함하는 4자, 5자, 또는 6자 이상의 복합체여도 되지만, 바람직하게는 3자 복합체이다.

본 개시에 있어서의 복합체는, 제1 표적 분자, 제2 표적 분자, 및 후보 분자가 복합체를 형성하고 있는 한, 그 태양은 따지지 않는다. 즉 본 개시에 있어서의 복합체에는, 후보 분자가 제1 표적 분자와 제2 표적 분자의 양방에 결합하는 것에 의해 복합체를 형성하는 태양이 포함된다. 이와 같은 태양에는, 후보 분자를 개재시켜 제1 표적 분자 및 제2 표적 분자가 결합하고 있는 것이나, 후보 분자, 제1 표적 분자 및 제2 표적 분자 모두가, 다른 2자의 양방과 결합하고 있는 것이 포함된다. 또한 일 태양에 있어서, 본 개시에 있어서의 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체에는, 후보 분자가 제1(또는 제2) 표적 분자와 결합하고, 제1(또는 제2) 표적 분자가 제2(또는 제1) 표적 분자와 결합하는 것에 의해 3자의 복합체가 형성되는 태양도 또한 포함된다. 이와 같은 태양에 있어서는, 후보 분자는 제2(또는 제1) 표적 분자와는 직접적으로는 결합하고 있지 않다. 또한, 일 태양에 있어서, 후보 분자가 제1(또는 제2) 표적 분자와 결합함으로써, 제1(또는 제2) 표적 분자의 구조가 변화되고, 제1(또는 제2) 표적 분자와 제2(또는 제1) 표적 분자의 결합 친화성이 향상되는 것에 의해 3자의 복합체의 형성이 촉진되는 태양도 또한 포함된다. 이와 같은 태양에 있어서는, 후보 분자는 제2(또는 제1) 표적 분자와는 직접적으로는 결합하고 있지 않다.

한편 전술한 대로, 본 개시에 있어서의 제1 부분 및 제2 부분은 단백질(구체적으로는, 제1 부분 및 제2 부분을 제공하는 단백질)의 단편이다. 따라서, 본 개시에 있어서의 「제1 부분에 연결된 제1 표적 분자 및 제2 부분에 연결된 제2 표적 분자를 포함하는 복합체」는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질의 전부 또는 일부를 포함한다. 구체적으로는, 예를 들면 제1 부분 및 제2 부분을 제공하는 단백질이 후술하는 GFP나 루시페라아제인 경우의 일 태양에 있어서, 당해 복합체는 GFP나 루시페라아제의 일부를 포함한다. 한편, 예를 들면 제1 부분 및 제2 부분을 제공하는 단백질이 SNAP 태그 또는 유비퀴틴인 경우의 일 태양에 있어서, 당해 복합체는, SNAP 태그 또는 유비퀴틴의 전부를 포함한다.

제1 부분에 연결된 제1 표적· 제2 부분에 연결된 제2 표적

본 개시에 있어서, 제1 부분과 제1 표적 분자, 제2 부분과 제2 표적 분자는 링커를 개재시켜 연결되어 있어도 된다. 본 개시에 있어서는, 제1 부분과 제1 표적 분자 사이의 링커를 제1 링커, 제2 부분과 제2 표적 분자 사이의 링커를 제2 링커라고 부를 수 있다. 링커로서는, 유전자 공학에 의해 도입할 수 있는 임의의 펩타이드 링커, 또는 화학 합성에 의해 도입할 수 있는 링커(예를 들면, Protein Engineering, 9(3), 299-305, 1996 참조) 등을 이용할 수 있지만, 본 발명에 있어서는 펩타이드 링커가 바람직하다. 펩타이드 링커의 길이는 특별히 한정되지 않고, 목적에 따라서 당업자가 적절히 선택하는 것이 가능하지만, 바람직한 길이는 8 아미노산 이상(상한은 특별히 한정되지 않지만, 통상, 30 아미노산 이하, 바람직하게는 20 아미노산 이하)이고, 특히 바람직하게는 12 아미노산이다.

예를 들면, 펩타이드 링커의 경우:

Ser

Gly·Ser

Gly·Gly·Ser

Ser·Gly·Gly

Gly·Gly·Ser·Ser(서열 번호: 88)

Gly·Gly·Gly·Ser(서열 번호: 89)

Ser·Gly·Gly·Gly(서열 번호: 90)

Gly·Ser·Gly·Ser(서열 번호: 91)

Gly·Gly·Gly·Gly·Ser(서열 번호: 92)

Ser·Gly·Gly·Gly·Gly(서열 번호: 93)

Gly·Gly·Gly·Gly·Gly·Ser(서열 번호: 94)

Ser·Gly·Gly·Gly·Gly·Gly(서열 번호: 95)

Gly·Gly·Gly·Gly·Gly·Gly·Ser(서열 번호: 96)

Ser·Gly·Gly·Gly·Gly·Gly·Gly(서열 번호: 97)

(Gly·Gly·Gly·Gly·Ser)n

(Ser·Gly·Gly·Gly·Gly)n

Gly·Gly·Gly·Gly·Ser·Gly·Gly·Gly·Ser Gly·Gly·Ser(서열 번호: 124)

[n은 1 이상의 정수이다] 등을 들 수 있다. 단, 펩타이드 링커의 길이나 서열은 목적에 따라서 당업자가 적절히 선택할 수 있다.

또한 일 태양에 있어서, 후술하는 바와 같이 본 개시에 있어서의 링커는, 효소에 의해 절단 가능한 링커를 포함할 수 있다. 이와 같은 효소로서는, TEV 프로테아제(Tobacco Etch Virus Protease)가 예시되고, 본 개시에 있어서는, 안정성, 활성, 특이성 등을 향상시키기 위한 개량이 가해진 TEV 프로테아제를 이용해도 된다. 이와 같은 TEV 프로테아제는 시약 회사로부터 구입 가능하다. TEV 프로테아제에 의해 절단되는 링커로서는, 이하가 예시된다:

Glu·Asn·Leu·Tyr·Phe·Gln·Gly(서열 번호: 2).

피험 분자·라이브러리

본 개시에 있어서의 피험 분자로서는, 특별히 제한은 없고, 예를 들면, 천연물, 유기 화합물, 무기 화합물, 단백질, 펩타이드, 아미노산 등의 단일 화합물, 및, 화합물 라이브러리, 유전자 라이브러리의 발현 산물, 세포 추출물, 세포 배양 상청, 발효 미생물 산생물, 해양 생물 추출물, 식물 추출물, 원핵 세포 추출물, 진핵 단세포 추출물 혹은 동물 세포 추출물 등을 들 수 있다. 이들은 정제물이어도, 또한 식물, 동물 또는 미생물 등의 추출물 등과 같이 조(粗)정제물이어도 된다. 또한 피험 분자의 제조 방법도 특별히 제한되지 않고, 천연물로부터 단리된 것이어도, 화학적 또는 생화학적으로 합성된 것이어도, 또한 유전자 공학적으로 조제된 것이어도 된다.

일 태양에 있어서, 본 개시에 있어서의 피험 분자는 폴리뉴클레오타이드에 의해 코드되어 있는 분자일 수 있다. 이와 같은 분자로서 펩타이드를 들 수 있다. 또한 본 개시에 있어서의 피험 분자는, 태그가 되는 폴리뉴클레오타이드에 연결된 펩타이드여도 된다. 또한 본 개시에 있어서의 피험 분자는, 분자량이 3000 이하, 또는 2000 이하여도 된다. 한편 여기에서의 분자량은, 피험 분자가 태그로서의 폴리뉴클레오타이드나, 그것과 연결하기 위한 링커를 포함하는 경우, 폴리뉴클레오타이드나 링커를 제외한 부분의 분자량을 가리킨다.

본 개시에 있어서 펩타이드란, 2 이상의 아미노산이 아마이드 결합 및/또는 에스터 결합으로 결합한 것을 말한다. 한정을 의도하지 않지만, 본 개시에 있어서의 펩타이드에는, 쇄상 펩타이드, 및 환상 펩타이드가 포함된다. 또한, 본 개시에 있어서의 펩타이드에는, 펩타이드, 펩타이드와 폴리뉴클레오타이드의 복합체(펩타이드-폴리뉴클레오타이드 복합체), 펩타이드와 리보솜과 폴리뉴클레오타이드의 복합체 등이 포함된다. 또한, 본 개시에 있어서의 「폴리뉴클레오타이드」에는 DNA, mRNA, 및 tRNA가 포함된다. 또한, 본 개시에 있어서의 「펩타이드」에는, 그의 약학적으로 허용되는 염이 포함되어도 된다.

본 개시에 있어서의 펩타이드는, 일 태양에 있어서, 2∼100개, 3∼50개, 4∼30개, 또는 5∼20개의 아미노산이, 아마이드 결합 및/또는 에스터 결합에 의해 연결되어 있다. 예를 들면, 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 의해 얻어지는 펩타이드를 의약품으로서 사용하는 경우, 높은 막투과성을 획득하기 위해서, 펩타이드를 구성하는 아미노산의 수는 20 이하가 바람직하고, 18 이하, 16 이하, 15 이하, 또는 14 이하가 보다 바람직하고, 13 이하가 특히 바람직하며, 구체적으로는, 9, 10, 11, 12, 13이 예시된다. 또한 높은 대사 안정성을 획득하기 위해서는, 펩타이드를 구성하는 아미노산의 수는 8 이상인 것이 바람직하고, 9 이상이 보다 바람직하고, 10 이상이 더 바람직하며, 11 이상이 특히 바람직하다. 막투과성과 대사 안정성의 양립을 고려하면, 펩타이드를 구성하는 아미노산의 수는 5∼20, 또는 7∼20이 바람직하고, 7∼17, 8∼16, 9∼16, 또는 10∼16이 보다 바람직하고, 8∼13, 10∼15, 11∼15, 10∼14, 10∼13, 또는 11∼14가 더 바람직하며, 11∼13이 특히 바람직하다.

환상 펩타이드의 환상부를 구성하는 아미노산의 수는 한정되지 않지만, 예를 들면, 4 이상, 6 이상, 7 이상, 8 이상, 9 이상, 10 이상, 11 이상, 12 이상의 어느 것과, 20 이하, 18 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하의 어느 것의 조합에 의해 특정 가능한 범위를 들 수 있다. 막투과성과 대사 안정성의 양립을 고려하면, 상기 환상부를 구성하는 아미노산의 수는, 5∼16이 바람직하고, 5∼15, 5∼14, 7∼14, 또는 8∼14가 보다 바람직하고, 8∼13, 9∼13, 8∼12, 8∼11, 또는 9∼12가 더 바람직하며, 9∼11이 특히 바람직하다. 일 태양에 있어서, 환상 펩타이드의 환상부를 구성하는 아미노산의 수로서, 예를 들면, 7, 8, 9, 10, 11, 12, 13, 14, 15, 및 16을 들 수 있다. 한편, 본 개시에 있어서 펩타이드의 「환상부」란, 4 이상의 아미노산 잔기가 연결되어, 형성되어 있는 환상의 부분을 의미한다.

비한정된 일 태양에 있어서, 본 개시에 있어서의 환상 펩타이드는 직쇄부를 갖고 있어도 된다. 본 개시에 있어서, 환상 펩타이드의 부분 구조를 가리킬 때에 사용되는 「직쇄부」란, 환상부의 주쇄 구조에 포함되지 않는 부분이고, 해당 부분의 쇄 상에 적어도 1개의 아마이드 결합 및/또는 에스터 결합을 갖는 것을 말한다. 직쇄부의 아미노산의 수(유닛의 수)는 0∼8인 것이 바람직하고, 0∼5가 보다 바람직하며, 0∼3이 보다 바람직하다. 한편, 비한정된 일 태양에 있어서, 본 개시에 있어서의 직쇄부에는 천연 아미노산이나 비천연 아미노산(화학 수식이나 골격 변환된 아미노산을 포함한다)이 포함되는 경우가 있다.

비한정된 일 태양에 있어서, 본 개시에 있어서의 펩타이드에 포함되는 비천연 아미노산의 수는, 2 이상이 바람직하고, 4 이상, 또는 5 이상이 보다 바람직하고, 6 이상이 더 바람직하며, 또한 20 이하, 15 이하, 14 이하, 13 이하, 12 이하, 10 이하가 바람직하게 예시된다. 본 개시에 있어서의 펩타이드에 포함되는 비천연 아미노산의 수로서는, 환상부를 구성하는 아미노산의 수의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상이 예시된다. 또한, 본 개시에 있어서의 펩타이드에 포함되는 비천연 아미노산의 종류는, 1 이상이 바람직하고, 2 이상, 3 이상, 또는 4 이상이 보다 바람직하고, 7 이상이 더 바람직하며, 또한 20 이하, 15 이하, 14 이하, 13 이하, 12 이하, 10 이하가 바람직하게 예시된다.

한편 본 개시에 있어서의 피험 분자는, 본 개시에 있어서의 제1 표적 분자 및 제2 표적 분자의 어느 일방에 결합하는 것이 이미 알려져 있는 것이어도 된다. 또한 본 개시에 있어서의 피험 분자는, 공지된 스크리닝계에 있어서 선택된 분자여도 된다. 따라서 본 개시에 있어서의 스크리닝 방법은, 공정(1) 전에 공지된 스크리닝계를 사용하여 피험 분자를 취득하는 공정을 추가로 포함할 수 있다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 이와 같이 해서 취득된 피험 분자(예를 들면, 제1 표적 분자 및 제2 표적 분자의 어느 일방에 결합하는 것이 이미 알려져 있는 분자 등)를 공정(1)에 있어서의 피험 분자로서 사용할 수 있다.

본 개시에 있어서의 피험 분자는 라이브러리를 구성할 수 있다. 본 개시에 있어서의 라이브러리에는, 핵산(「폴리뉴클레오타이드」라고도 한다)에 의해 태그 붙이기(즉, 인코드)된 라이브러리(예를 들면, DNA 인코드 라이브러리; DNA-encoded library/DEL, mRNA 디스플레이 라이브러리, DNA 디스플레이 라이브러리; 예를 들면 Molecules. 2019 Apr; 24(8): 1629.를 참조.), 태그 없는 화합물 라이브러리가 포함된다. 또한 본 개시에 있어서의 라이브러리로서는, 디스플레이 라이브러리가 바람직하다. 디스플레이 라이브러리로서는, 디스플레이를 이용한 라이브러리가 예시되고, 그 중에서도 mRNA 디스플레이 라이브러리, DNA 디스플레이 라이브러리, 리보솜 디스플레이 라이브러리가 바람직하고, mRNA 디스플레이 라이브러리가 보다 바람직하다.

핵산에 의해 태그 붙이기(인코드)된 라이브러리는, 라이브러리를 구성하는 각 화합물이 바코드가 되는 특이적인 폴리뉴클레오타이드에 의해 태그 붙이기된 라이브러리이다. 이 라이브러리를 사용하여, 표적 분자에 특이적으로 결합할 수 있는 후보 분자를 스크리닝할 수 있다. 예를 들면, 원하는 표적에 라이브러리를 접촉시키고, 표적에 결합하지 않는 분자를 씻어 보냄으로써, 표적에 결합하는 후보 분자의 농축이 가능하다(패닝법). 이와 같은 과정을 거쳐 선택된 후보 분자에 대응되어 있는 태그를 해석함으로써 표적에 결합한 후보 분자를 분명히 할 수 있다(예를 들면 WO2013/100132를 참조).

피험 분자로서 펩타이드가 이용되는 경우, 표현형인 펩타이드와 그 유전자형인 펩타이드를 코드하는 RNA 혹은 DNA가 대응된다. 예를 들면, 아미노아실 tRNA의 아날로그인 항생 물질 퓨로마이신이 리보솜에 의한 mRNA 번역 신장 중의 단백질에 비특이적으로 연결되는 것을 이용하는 방법이 mRNA 디스플레이(Proc Natl Acad Sci USA. 1997;94:12297-302. RNA-peptide fusions for the in vitro selection of peptides and proteins. Roberts RW, Szostak JW.) 내지는 in vitro virus(FEBS Lett. 1997;414:405-8. In vitro virus: bonding of mRNA bearing puromycin at the 3'-terminal end to the C-terminal end of its encoded protein on the ribosome in vitro. Nemoto N, Miyamoto-Sato E, Husimi Y, Yanagawa H.)로서 보고되어 있다.

T7 프로모터 등의 프로모터를 포함하는 DNA 라이브러리로부터 전사로 얻은 mRNA의 라이브러리의 3' 말단에 퓨로마이신 등의 스페이서를 결합해 두고, 무세포 번역계에서 mRNA를 단백질로 번역시키면 퓨로마이신이 리보솜에 의해 아미노산과 뒤바뀌어 단백질에 도입되고, mRNA와 이것에 코드되는 단백질이 연결되어, mRNA와 그 산물이 대응된 라이브러리가 된다. 이 과정에서는 대장균 등의 형질 전환을 포함하지 않기 때문에 높은 효율이 실현되고, 대규모인 디스플레이 라이브러리를 구축할 수 있다. 패닝으로 농축, 선택된 분자에 붙어 있는 유전자 정보를 포함하는 태그인 mRNA로부터 cDNA를 합성하고, PCR 증폭하고, 염기 서열을 해석함으로써 결합한 펩타이드의 서열을 분명히 할 수 있다.

무세포 번역계를 이용한 디스플레이 라이브러리에는, mRNA 디스플레이 외에, 펩타이드와 퓨로마이신의 복합체가 결합하고 있는 펩타이드를 코드하는 cDNA로 이루어지는 라이브러리인 cDNA 디스플레이(Nucleic Acids Res. 2009;37(16) :e108.cDNA display: a novel screening method for functional disulfide-rich peptides by solid-phase synthesis and stabilization of mRNA-protein fusions. Yamaguchi J, Naimuddin M, Biyani M, Sasaki T, Machida M, Kubo T, Funatsu T, Husimi Y, Nemoto N.), mRNA 번역 중에 리보솜과 번역 산물이 비교적 안정된 복합체인 것을 이용한 리보솜 디스플레이(Proc Natl Acad Sci U S A. 1994;91:9022-6. An in vitro polysome display system for identifying ligands from very large peptide libraries. Mattheakis LC, Bhatt RR, Dower WJ.), bacteriophage endonuclease P2A가 DNA와 공유 결합을 형성하는 것을 이용한 covalent display(Nucleic AcidsRes. 2005;33:e10.Covalent antibody display--an in vitro antibody-DNA library selection system. Reiersen H, Lobersli I, Loset GA, Hvattum E, Simonsen B, Stacy JE, McGregor D, Fitzgerald K, Welschof M, Brekke OH, Marvik OJ.), 미생물의 플라스미드의 복제 개시 단백 RepA가 복제 개시점 ori에 결합하는 것을 이용한 CIS display(Proc Natl Acad Sci U S A. 2004;101:2806-10. CIS display: In vitro selection of peptides from libraries of protein-DNA complexes. Odegrip R, Coomber D, Eldridge B, Hederer R, Kuhlman PA, Ullman C, FitzGerald K, McGregor D.)가 알려져 있다. 또한, DNA 라이브러리를 구성하는 DNA의 1분자마다에 전사 번역계를 water-in-oil 에멀션이나 리포솜에 봉입하고, 번역 반응을 행하는 in vitro compartmentalization(Nat Biotechnol. 1998;16:652-6. Man-made cell-like compartments for molecular evolution. Tawfik DS, Griffiths AD.)도 알려져 있다. 적절히 공지된 방법을 이용하여 상기 방법을 사용할 수 있다.

태그 없는 화합물 라이브러리로서는, 핵산 라이브러리, 핵산 라이브러리를 번역하여 얻어지는 펩타이드 라이브러리, 화학 합성에 의해 얻어지는 화합물의 라이브러리 등을 예시할 수 있다. 여기에서의 「핵산」에는, 데옥시리보핵산(DNA), 리보핵산(RNA), 혹은 인공 염기를 갖는 뉴클레오타이드 유도체를 포함할 수도 있다. 또한, 펩타이드 핵산(PNA)을 포함할 수도 있다. 본 개시에 있어서 핵산은, 목적으로 하는 유전 정보가 유지되는 한, 이들 핵산 중 어느 하나, 혹은 혼성으로 할 수도 있다. 즉, DNA-RNA의 하이브리드 뉴클레오타이드나 DNA와 RNA와 같은 상이한 핵산이 1본쇄에 연결된 키메라 핵산도 본 개시에 있어서의 핵산에 포함된다.

펩타이드 라이브러리에 포함되는 펩타이드의 주형이 되는 핵산의 라이브러리로서는, mRNA 라이브러리, DNA 라이브러리 등이 예시된다. 펩타이드 서열 상에서 아미노산 잔기를 고정하지 않는 개소는 염기를 섞어 합성하는 것에 의해, 핵산 라이브러리를 얻을 수 있다. 예를 들면, DNA 라이브러리로서는, A, T, G, C, RNA 라이브러리로서는, A, U, G, C의 각각 4염기의 혼합(N)의 3의 배수개의 반복, 혹은 코돈의 1문자째 2문자째는 N, 3문자째는 W, M, K, S 등의 2염기의 혼합으로서 합성하고, 추가로 도입하는 아미노산의 종류를 16 이하로 억제하는 것이면, 3문자째를 1종류의 염기로 하는 방법도 있다. 또한, 코돈의 3문자에 상당하는 코돈 유닛을 준비하고, 이것을 임의의 비율로 혼합하여 합성에 이용하는 것에 의해 아미노산 잔기의 출현 빈도를 자유롭게 조정할 수 있다.

무세포 번역계를 이용하여 이들 핵산 라이브러리를 번역할 수 있다. 무세포 번역계를 사용하는 경우, 목적하는 핵산의 하류에 스페이서를 코드하는 서열을 포함하는 것이 바람직하다. 스페이서 서열로서는, 글라이신이나 세린을 포함하는 서열을 들 수 있지만 이것으로 한정되지 않는다. 또한 퓨로마이신, 그의 유도체 등 리보솜에 의한 번역 시에 펩타이드에 도입되는 화합물과 핵산 라이브러리 사이에는, RNA, DNA, 헥사에틸렌 글라이콜(spc18)의 폴리머(예를 들면 5개의 폴리머) 등으로 형성되는 링커를 포함하는 것이 바람직하다.

본 명세서에 있어서, 라이브러리에 포함되는 피험 분자의 배리에이션(종류)의 수를 「다양성」이라고 한다. 본 개시에 있어서의 라이브러리에 포함되는 후보 분자의 다양성은 특별히 한정되지 않지만, 1×10³ 이상, 1×10⁴ 이상, 1×10⁵ 이상, 1×10⁶ 이상, 1×10⁷ 이상, 1×10⁸ 이상, 1×10⁹ 이상, 1×10¹⁰ 이상, 1×10¹¹ 이상, 및 1×10¹² 이상이 예시된다. 이들 다양성은, 실측치로 한정되는 것은 아니고, 이론치여도 된다.

후보 분자

본 개시에 있어서의 후보 분자는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성하는 것이 가능한 분자이다. 해당 복합체는, 제1 표적 분자, 제2 표적 분자 및 후보 분자를 포함하는 한, 다른 분자를 포함하고 있어도 되고, 3자 복합체, 4자 복합체, 5자 복합체, 또는 그 이상의 분자로 구성되는 복합체여도 되지만, 3자 복합체가 바람직하다.

본 개시에 있어서의 후보 분자는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성하는 것이 가능한 한 한정되는 것은 아니지만, 바람직하게는 펩타이드, 보다 바람직하게는 환상 펩타이드가 예시된다.

일 태양에 있어서 본 개시에 있어서의 후보 분자는, 그것 단독으로 제1 표적 분자에 대한 결합 활성 및 제2 표적 분자에 대한 결합 활성을 갖는 분자일 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 후보 분자는, 제1 표적 분자 및 제2 표적 분자에 동시에 결합할 수 있는 분자일 수 있다. 또한 본 개시에 있어서의 후보 분자에는, 이와 같은 분자에 더하여, 그것 단독으로는 제2(또는 제1) 표적 분자에 대한 결합 활성을 갖지 않지만, 제1(또는 제2) 표적 분자에 결합하는 것에 의해 해당 제2(또는 해당 제1) 표적 분자에 대한 결합 활성을 획득하고, 그에 의해 제1 표적 분자 및 제2 표적 분자에 결합할 수 있는 분자도 포함될 수 있다. 이와 같은 분자로서 예를 들면, 그것 단독일 때보다도 제1(또는 제2) 표적 분자에 결합했을 때인 쪽이, 제2(또는 제1) 표적 분자에 대해서 2배 이상, 5배 이상, 10배 이상, 20배 이상, 또는 그 이상의 결합 친화성을 갖는 분자가 포함된다. 또 본 개시에 있어서는,

(i) 제1(또는 제2) 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자의 제2(또는 제1) 표적 분자에 대한 결합 활성이, 해당 결합 전보다도 높아지는 분자,

(ii) 제1(또는 제2) 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자와 해당 제1(또는 해당 제2) 표적 분자의 복합체로서 해당 제2(또는 해당 제1) 표적 분자와 결합 가능해지는 분자, 및

(iii) 제1(또는 제2) 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 제1(또는 해당 제2) 표적 분자의 제2 표적 분자에 대한 결합 친화성이, 해당 결합 전보다도 높아지는 분자

도 또한 후보 분자에 포함될 수 있다.

이와 같은 후보 분자로서 예를 들면, 제1(또는 제2) 표적 분자와 결합하는 것에 의해 제1(또는 제2) 표적 분자의 구조를 변화시키고, 그에 의해 제1(또는 제2) 표적 분자의 제2(또는 제1) 표적 분자에 대한 결합 친화성이 높아지고, 그 결과, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체의 형성을 유도하는 것이 가능한 분자가 포함될 수 있다.

본 개시에 있어서의 「제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체」에 있어서는, 후보 분자는 제1 표적 분자에만 결합해도 되고, 제2 표적 분자에만 결합해도 되고, 제1 표적 분자와 제2 표적 분자의 양방에 결합해도 된다.

비한정된 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 의해 얻어지는 후보 분자는, 공지된 방법에 의해 화학 수식 등 함으로써 최적화해도 된다. 또한 후보 분자의 유도체를 화학 합성해도 된다. 본 개시에 있어서 「최적화」란, 보다 드럭라이크한 분자가 되도록 화학 수식하는, 보다 약효 표적에 강한 활성을 갖는 분자가 되도록 화학 수식하고, 및/또는, 보다 독성이 회피된 분자가 되도록 화학 수식하는 것을 의미한다. 예를 들면 후보 분자가 펩타이드인 경우, 펩타이드 중의 각각의 아미노산의 구조를 변환시키는 것에 의해 「최적화」할 수 있다. 본 개시에 있어서는, 이와 같이 최적화된 후보 분자 또는 후보 분자의 유도체의 평가를 위해서, 이들을 본 개시에 있어서의 스크리닝 방법에 제공해도 된다.

표적 분자

본 개시에 있어서 제1 표적 분자 및 제2 표적 분자는 특별히 한정되지 않고, 단백질, 펩타이드, 핵산, 당, 지질 등이 예시되지만, 그 중에서도 단백질을 표적 분자로 하는 것이 바람직하다. 또한 생체내에 있어서의 표적 분자의 존재 장소도 특별히 한정되지 않는다. 일 태양에 있어서, 세포내의 단백질을 표적 분자로 할 수도 있다. 또한 일 태양으로서, 지금까지 창약이 곤란하다고 여겨져 온 tough target에 대한 창약을 가능하게 할 수 있는 단백질을 표적 분자로 할 수 있다.

일 태양에 있어서, 제1 표적 분자로서 이뮤노필린 패밀리에 속하는 단백질, 유비퀴틴 E3 리가아제 등이 예시된다. 이뮤노필린 패밀리에 속하는 단백질로서는, FKBP(FK506 binding protein/FK506 결합 단백질), 사이클로필린 등을 들 수 있다. 또한 제2 표적 분자도 특별히 한정되는 것은 아니지만, 제1 표적 분자로서 예를 들면 이뮤노필린 패밀리에 속하는 단백질을 사용하는 경우, 칼시뉴린, FRB(FKBP-rapamycin binding domain of FKBP12-rapamycin associated protein/FKBP-라파마이신 결합 단백질의 FKBP-라파마이신 결합 도메인), 또는 이것을 포함하는 단백질을 예시할 수 있다.

다른 일 태양에 있어서, 제1 표적 분자로서 Kras, Nras, Hras 등의 Ras 단백질을 예시할 수 있다. 이 경우, 일 태양에 있어서, 제2 표적 분자로서 FKBP를 예시할 수 있다.

일 태양에 있어서, 표적 분자는 고상 담체에 고정되어 있어도 된다. 예를 들면, 공정(4) 및 (5)에 있어서, 한쪽의 표적 분자를 고상 담체에 고정하고, 다른 한쪽의 표적 분자를 유리 상태로 할 수 있다. 고상 담체로서는, 표적 분자를 고정할 수 있는 담체이면 특별히 한정되지 않고, 본 분야에서 통상 사용되는 것을 사용할 수 있다. 예를 들면, 비즈(예를 들면, 자기 비즈, 유리 비즈), 멤브레인, 마이크로플레이트, 실리콘 칩 등이 예시된다. 표적 분자는, 이들 고상 담체에 공지된 방법으로 고정할 수 있다.

어피니티를 사용한 방법

본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 회수할 수 있다. 어피니티를 이용한 방법으로서는 풀다운법을 예시할 수 있다. 풀다운법은, 단백질 또는 단백질의 복합체에 태그를 붙이고, 해당 태그와, 해당 태그와 상호작용하는 단백질의 상호작용을 이용하여, 해당 단백질 또는 단백질의 복합체를 검출하는 방법이다. 풀다운법의 일례로서, 제3 분자에 태그를 붙이고, 해당 태그와 상호작용하는 단백질 사이의 상호작용을 이용하는 것에 의해, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체를 선택할 수 있다. 일 태양에 있어서, 제3 분자와 태그는, 전술한 본 개시의 링커를 개재시켜 연결되어 있어도 된다. 또한, 일 태양에 있어서, 태그 자체를 제3 분자로서 이용할 수도 있다. 이 경우, 근접 또는 회합한 제1 부분과 제2 부분의 어느 하나 또는 양방에 태그 붙이기하고, 해당 태그와 상호작용하는 단백질 사이의 상호작용을 이용하는 것에 의해, 상기 복합체를 선택할 수도 있다. 전술한 대로 본 개시의 스크리닝 방법에 있어서는, 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체와 특이적으로 반응 또는 결합할 수 있으므로, 당해 제3 분자와의 어피니티를 이용하는 것에 의해, 제1 표적 분자 및 제2 표적 분자와 결합한 후보 분자를 효율적으로 취득할 수 있다.

본 개시에 있어서 태그로서 이용 가능한 단백질과, 당해 태그와 상호작용하는 단백질의 조합으로서는, 비오틴 또는 그 유도체와 비오틴 결합 단백질(예를 들면 스트렙트아비딘)의 조합, Strep-tag(등록상표)와 Strep-Tactin(등록상표)의 조합, SBP(Streptavidin binding peptide)-tag와 스트렙트아비딘의 조합, 공지된 펩타이드 태그(His-tag, HA-tag, FLAG-tag 등)와 그에 대한 항체의 조합 등을 예시할 수 있다.

또한 본 개시에 있어서는, 항원과 항체 사이의 어피니티를 이용하여, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수도 있다. 구체적으로는, 근접 또는 회합한 제1 부분 및 제2 부분을 포함하는 복합체를 특이적으로 인식하는 항체를 사용하여, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수 있다.

일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 있어서는, 용출에 의해, 후보 분자, 또는 후보 분자를 포함하는 복합체를 단리할 수 있다. 일 태양에 있어서, 용출은, 효소 반응 또는 열 반응에 의해 행할 수 있다. 추가적인 태양에 있어서, 용출은, 제3 분자에 포함되는 링커를 절단하는 것에 의해 행해도 된다. 추가적인 태양에 있어서, 용출은, 제1 부분과 제1 표적 분자 사이에 위치하는 제1 링커, 및/또는, 단백질의 제2 부분과 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 것에 의해 행해도 된다. 그 경우, 제3 분자에 포함되는 링커, 또는, 제1 링커 및/혹은 제2 링커는, 예를 들면 효소 반응에 의해 절단할 수 있다. 따라서 본 개시에 있어서의 제3 분자에 포함되는 링커, 또는, 제1 링커 및/혹은 제2 링커는, 효소에 의해 절단 가능한 서열을 포함할 수 있다. 효소와 효소에 의해 절단 가능한 서열의 조합으로서는, TEV 프로테아제와 ENLYFQG(서열 번호: 2) 등을 들 수 있다. 제1 부분과 제1 표적 분자 사이에 위치하는 제1 링커, 및/또는, 단백질의 제2 부분과 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 용출 방법에 의하면, 제1 부분, 제2 부분, 또는 제3 분자 등에 결합한 목적으로 하지 않는 피험 분자의 회수율을 더 억제할 수 있는 점에서 유용하다.

제1 부분, 제2 부분, 및 제3 분자의 구체적인 태양

본 개시에 있어서의 스크리닝 방법에 있어서는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질로서, GFP, 루시페라아제, SNAP 태그, 유비퀴틴 등을 예시할 수 있고, 본 명세서에 있어서의 이들 용어에는, 각각의 아미노산 개변체가 포함된다. 상기 단백질로서, GFP(Cabantous, S. et al. Sci Rep. 2013; 3: 2854. doi: 10.1038/srep02854, Wen-Xue J. et al. Sci Rep. 2016; 6: 20568. doi: 10.1038/srep20568을 예시로서 참조할 것.), SNAP 태그(Analyst, 2012, 137, 4760-4765; Anal. Chem. 2016, 88, 8166-8171을 예시로서 참조할 것.), 유비퀴틴(PNAS July 3, 2007 104 (27) 11209-11214를 예시로서 참조할 것.), 및 루시페라아제(예를 들면, 심해 새우(Oplophorus gracilirostris) 유래의 루시페라아제, 그 중에서도 Nanoluc(등록상표)를 들 수 있다. US2010/0281552, US2012/0174242 및 US2018/0172692, 및 Andrew, D. et al. Sci Rep. 2017; 7: 8186. doi:10.1038/s41598-017-07569-y; Anal. Chem. 2018, 90, 3001-3004를 예시로서 참조할 것.)가 예시된다. 각각의 아미노산 서열로서는, GFP(서열 번호: 71), SNAP 태그(서열 번호: 82), 유비퀴틴(서열 번호: 75), Nanoluc(서열 번호: 78) 등을 예시할 수 있고, 이들 아미노산 개변체를 이용해도 된다.

본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질은, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함할 수 있다;

(a) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열,

본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질은, 당업자에게 주지된 야생형의 단백질 및 아미노산이 개변된 단백질을 포함한다.

또한 본 개시에 있어서의 제1 부분 및 제2 부분으로서, GFP, SNAP 태그, 유비퀴틴, 또는 루시페라아제(예를 들면 Nanoluc)를 분할하는 것에 의해 얻어지는 부분을 예시할 수 있다. 상기 분할은, 2분할 이상이면 되고, 3분할 또는 4분할이어도 된다. 3분할하는 경우에는, 본 개시에 있어서의 제1 부분 및 제2 부분으로서는, 분할된 단편 중, 분자량이 작은 단편을 사용하는 것이 바람직하고, GFP에 있어서의 GFP10 및 GFP11, Nanoluc에 있어서의 Nanoluc-9 및 Nanoluc-10이 예시된다. 이 경우, 나머지 단편(GFP에 있어서의 GFP1-9, Nanoluc에 있어서의 Nanoluc1-8)을 본 개시에 있어서의 제3 분자에 포함시킬 수 있다.

한편 본 개시에 있어서의 유비퀴틴은, 13번째의 Ile가 Ala로 치환된 유비퀴틴(I13A)인 것이 바람직하다.

구체적으로는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 GFP인 경우, 전장 GFP(서열 번호: 71)의 192번째∼210번째의 아미노산 서열로 이루어지는 부분(서열 번호: 73), 및 상기 전장 GFP의 211번째∼231번째의 아미노산 서열로 이루어지는 부분(서열 번호: 74)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 한편 GFP에 있어서 192번째∼210번째의 아미노산 서열로 이루어지는 부분은 GFP10, 211번째∼231번째의 아미노산 서열로 이루어지는 부분은 GFP11로서 알려져 있다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 73에 기재된 아미노산 서열을 포함하는 GFP10을 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 74에 기재된 아미노산 서열을 포함하는 GFP11을 사용할 수 있다. 본 명세서에 있어서, GFP의 단편을 split GFP라고 칭하는 경우가 있고, GFP1-9, GFP10, 및 GFP11을 각각 splitGFP1-9, splitGFP10, 및 splitGFP11이라고 칭하는 경우가 있다.

또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 SNAP 태그인 경우, 전장 SNAP 태그(서열 번호: 82)의 1번째∼91번째의 아미노산 서열로 이루어지는 부분(SNAP 태그의 N 말단측 단편: 서열 번호: 83), 및 전장 SNAP 태그의 92번째∼196번째의 아미노산 서열로 이루어지는 부분(SNAP 태그의 C 말단측 단편: 서열 번호: 84)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 본 개시에 있어서 전장 SNAP 태그의 1번째∼91번째의 아미노산 서열로 이루어지는 부분은 SNAP(N), 92번째∼196번째의 아미노산 서열로 이루어지는 부분은 SNAP(C)라고도 칭해진다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 83에 기재된 아미노산 서열을 포함하는 SNAP(N)을 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 84에 기재된 아미노산 서열을 포함하는 SNAP(C)를 사용할 수 있다. 본 명세서에 있어서, SNAP 태그 단편을 split SNAP라고 칭하는 경우가 있다.

또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 유비퀴틴(I13A)인 경우, 전장 유비퀴틴(서열 번호: 75)의 1번째∼37번째의 아미노산 서열로 이루어지는 부분(유비퀴틴의 N 말단측 단편, 서열 번호: 76), 및 전장 유비퀴틴의 35번째∼76번째의 아미노산 서열로 이루어지는 부분(유비퀴틴의 C 말단측 단편, 서열 번호: 77)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 본 개시에 있어서 전장 유비퀴틴의 1번째∼37번째의 아미노산 서열로 이루어지는 부분은 splitUb(N), 35번째∼76번째의 아미노산 서열로 이루어지는 부분은 splitUb(C)라고도 칭해진다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 76에 기재된 아미노산 서열을 포함하는 splitUb(N)을 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 77에 기재된 아미노산 서열을 포함하는 splitUb(C)를 사용할 수 있다.

한편 본 개시에 있어서는, splitUb(N)과 splitUb(C)를 링커(GSGS/서열 번호: 90)로 연결시킨 단백질을 splitUb(N-C)라고 부르는 경우가 있다. 본 개시에 있어서의 유비퀴틴에는 이와 같은 splitUb(N-C)도 포함된다.

본 명세서에 있어서, 유비퀴틴의 단편을 split 유비퀴틴 또는 splitUb라고 칭하는 경우가 있다.

또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 루시페라아제의 일종인 Nanoluc인 경우, 전장 Nanoluc(서열 번호: 78)의 153번째∼163번째의 아미노산 서열로 이루어지는 부분(서열 번호: 80), 및 상기 전장 Nanoluc의 164번째∼174번째의 아미노산 서열로 이루어지는 부분(서열 번호: 81)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 본 개시에 있어서 전장 Nanoluc의 153번째∼163번째의 아미노산 서열로 이루어지는 부분은 split Nanoluc-9, 164번째∼174번째의 아미노산 서열로 이루어지는 부분은 split Nanoluc-10이라고도 칭해진다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 80에 기재된 아미노산 서열을 포함하는 split Nanoluc-9를 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 81에 기재된 아미노산 서열을 포함하는 split Nanoluc-10을 사용할 수 있다. 본 명세서에 있어서, Nanoluc의 단편을 split Nanoluc라고 칭하는 경우가 있고, Nanoluc1-8, Nanoluc-9, 및 Nanoluc-10을 각각, splitNanoluc1-8, splitNanoluc-9, 및 splitNanoluc-10으로 칭하는 경우가 있다.

또한 본 개시에 있어서의 제3 분자로서는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 GFP인 경우, 전장 GFP의 1∼191번째의 아미노산 서열을 갖는 GFP1-9(서열 번호: 72)를 포함하는 분자가 예시되고, 보다 구체적으로는 서열 번호: 48의 아미노산 서열을 갖는 분자가 예시된다. 또한 단백질이 SNAP 태그인 경우, SNAP-비오틴이 예시된다. 또한 단백질이 유비퀴틴(I13A)인 경우, 항유비퀴틴 항체가 예시된다. SNAP-비오틴 및 항유비퀴틴 항체는 당업자에게 주지된 것을 사용할 수 있지만, 전장 유비퀴틴에 결합할 수 있는 한편으로, 그 단편인 split 유비퀴틴에는 결합할 수 없는 항유비퀴틴 항체가 바람직하게 예시된다. 본 개시에 있어서의 항유비퀴틴 항체는, splitUb(N) 또는 splitUb(C)가 근접 또는 회합하고 있지 않는 경우에는 이들을 인식하지 않고, splitUb(N) 및 splitUb(C)가 근접 또는 회합하고 있는 경우에 특이적으로 인식하는 항체인 것이 보다 바람직하다. 항유비퀴틴 항체로서는, Mouse IgG1 모노클로날 항체(클론: FK2, [MBL사]), Mouse IgG1 모노클로날 항체(클론: 1B3, [MBL사])가 예시된다. 또한, 단백질이 Nanoluc인 경우, 전장 Nanoluc의 1∼152번째의 아미노산 서열을 갖는 split Nanoluc1-8(서열 번호: 79)을 포함하는 분자가 예시되고, 보다 구체적으로는 서열 번호: 85의 아미노산 서열을 갖는 분자가 예시된다.

본 개시에 있어서의 스크리닝 방법에 있어서는, 예를 들면 제1 부분 및 제2 부분을 제공하는 단백질이 GFP인 경우, 예를 들면 스트렙트아비딘과 비오틴의 상호작용을 이용하여, 비오틴화된 GFP1-9, GFP10에 연결된 제1 표적 분자, GFP11에 연결된 제2 표적 분자, 및 후보 분자의 복합체를 회수할 수 있다. 또한, 상기 단백질이 Nanoluc인 경우, 예를 들면 스트렙트아비딘과 비오틴의 상호작용을 이용하여, 비오틴화된 splitNanoluc1-8, splitNanoluc-9에 연결된 제1 표적 분자, splitNanoluc-10에 연결된 제2 표적 분자, 및 후보 분자의 복합체를 회수할 수 있다. 또한, SNAP 태그는 기질인 SNAP-비오틴과 결합하면, 효소 반응에 의해 비오틴화된 SNAP 태그가 생성된다. 따라서, 본 개시에 있어서의 단백질로서 SNAP 태그를 사용하는 경우, SNAP 태그에 결합한 비오틴과 스트렙트아비딘의 상호작용을 이용하는 것에 의해, 비오틴화된 SNAP 태그, 제1 표적 분자, 제2 표적 분자, 및 후보 분자의 복합체를 회수할 수 있다. 본 개시에 있어서의 제3 분자는, 비오틴화를 위한 태그 서열(예를 들면, Avi 태그 서열(서열 번호: 1)), 용출을 위한 절단 서열(예를 들면, TEV 프로테아제에 의한 절단 서열), 정제를 위한 태그 서열(예를 들면, His 태그 서열), 및/또는 그 밖의 서열을 포함하고 있어도 된다.

또한 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 있어서는, 제3 분자 그 자체를 사용하여 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수도 있다. 예를 들면 본 개시에 있어서의 단백질로서 유비퀴틴이 이용되는 경우, 제3 분자인 항유비퀴틴 항체와 유비퀴틴 사이의 어피니티에 기초하여, splitUb(N)과 연결된 제1 표적 분자, splitUb(C)와 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수도 있다.

본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자에는, 상기 아미노산 서열을 갖는 것에 더하여, 상기 아미노산 서열에 있어서 개변을 갖는 것도 포함된다.

구체적으로는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질에는, 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열을 포함하는 단백질에 더하여,

(1) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질, 및

(2) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질

이 포함된다.

또한, 본 개시에 있어서의 제1 부분, 및 제2 부분에는, 상기 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열을 포함하는 단백질에 더하여,

(1) 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질, 및

(2) 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질

이 포함된다.

또한, 본 개시에 있어서의 제3 분자로서는, 상기 서열 번호: 72 또는 79로 표시되는 아미노산 서열을 포함하는 단백질이 예시되지만, 전술한 대로, 풀다운에 이용되는 비오틴화를 위한 Avi 태그 서열, 용출에 이용되는 TEV 프로테아제에 의한 절단 서열, 정제를 위한 His 태그, 및/또는 그 밖의 서열을 포함하고 있어도 된다. 즉, 일 태양에 있어서, 본 개시에 있어서의 제3 분자로서는, 서열 번호: 72 또는 79로 표시되는 아미노산 서열을 포함하고 있기만 하면, 본 개시의 스크리닝법을 실시할 수 있는 한, 이것에 어떠한 서열이 부가되어 있어도 된다. 예를 들면, 본 실시예에서는, GFP1-9로서, Avi 태그(서열 번호: 1), TEV 프로테아제 절단 서열(서열 번호: 2), His 태그 서열(서열 번호: 3), 및 GFP1-9(서열 번호: 72)를 포함하는 GFP1-9(서열 번호: 48)를 사용하고 있다.

또한, 본 개시에 있어서의 제3 분자에는,

(1) 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열을 포함하는 단백질이고, 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질, 및

(2) 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질이고, 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질

도 포함된다.

아미노산의 부가, 결실, 치환, 및/또는 삽입은, 당 분야에서 공지된 방법에 의해 행하는 것이 가능하다. 예를 들면, 아미노산 서열을 코드하는 핵산에 대해서, 예를 들면 부위 특이적 변이 유발법(Kunkel et al., Proc. Natl. Acad. Sci. USA 82, 488-492(1985))이나 Overlap extension PCR을 행할 수 있다. 이들을 적절히 단독으로 또는 조합하여 행해도 된다.

일반적으로, 단백질에 있어서의 1개 또는 복수(예를 들면, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10을 초과한다)의 아미노산의 개변(예를 들면, 보존적인 치환, 결실, 삽입, 및/또는 부가)은, 그 펩타이드의 기능에 영향을 미치지 않거나, 또는 원래의 단백질의 기능을 강화하기까지 하는 것이 알려져 있다. 아미노산은, 그 측쇄의 특징에 따라서, 소수성 아미노산(A, I, L, M, F, P, W, Y, V), 친수성 아미노산(R, D, N, C, E, Q, G, H, K, S, T)으로 분류된다. 또한 아미노산의 측쇄는, 지방족 측쇄(G, A, V, L, I, P), 하이드록실기를 포함하는 측쇄(S, T, Y), 황 원자를 포함하는 측쇄(C, M), 카복실산 및 아마이드를 포함하는 측쇄(D, N, E, Q), 염기를 포함하는 측쇄(R, K, H), 및 방향족을 포함하는 측쇄(H, F, Y, W)로 분류할 수도 있다. 서열 번호: 71∼84의 어느 하나로 표시되는 아미노산 서열을 포함하는 단백질에 포함되는 아미노산을, 동일한 특징을 갖는 그룹으로 분류되는 다른 아미노산으로 개변된 단백질도 또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자에 포함된다. 단, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자는, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 한, 비보존적 개변도 포함해도 된다.

또한 본 발명의 일 태양에 있어서, 서열 번호: 48, 71∼84의 어느 하나로 표시되는 아미노산 서열과 높은 서열의 동일성을 갖는 아미노산 서열을 포함하는 단백질도 또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자에 포함된다. 본 개시에 있어서 높은 동일성이란, 아미노산 서열 전체 혹은 염기 서열 전체에서, 적어도 50% 이상, 더 바람직하게는 70% 이상, 75% 이상, 80% 이상, 85% 이상, 더 바람직하게는 90% 이상(예를 들면, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열의 동일성을 가리킨다. 서열의 동일성은, 칼린 및 알츌에 의한 알고리즘 BLAST(Proc. Natl. Acad. Sci. USA 87:2264-2268, 1990, Proc Natl Acad Sci USA 90: 5873, 1993)를 이용하여 결정할 수 있다. BLAST의 알고리즘에 기초한 BLASTN이나 BLASTX로 불리는 프로그램이 개발되어 있다(Altschul SF, et al: J Mol Biol 215: 403, 1990). BLASTN을 이용하여 염기 서열을 해석하는 경우는, 파라미터는, 예를 들면 score=100, wordlength=12로 한다. 또한, BLASTX를 이용하여 아미노산 서열을 해석하는 경우는, 파라미터는, 예를 들면 score=50, wordlength=3으로 한다. BLAST와 Gapped BLAST 프로그램을 이용하는 경우는, 각 프로그램의 디폴트 파라미터를 이용한다. 이들 해석 방법의 구체적인 수법은 공지이다.

본 개시에 있어서 「기능적으로 동등」이란, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자가 아미노산의 개변 전에 갖고 있던 기능을 유지하고 있는 것을 말한다. 구체적으로는, 본 개시에 있어서의 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을, 제3 분자에 의해 검출할 수 있는 한, 그들은 아미노산의 개변의 전후로 기능적으로 동등하다고 판단된다. 한편, 아미노산의 개변을 행한 것에 의해, 본 개시에 있어서의 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을, 제3 분자에 의해 검출할 수 없게 된 경우에는, 그들은 아미노산의 개변의 전후로 기능적으로 동등하지는 않다고 판단된다. 예를 들면 GFP이면, GFP10 및 GFP11이 근접했을 때에 GFP1-9와 회합하는 성질을 유지하고 있으면 본 개시의 스크리닝 방법에 이용할 수 있기 때문에, 만일 아미노산의 개변이 되어 있었다고 하더라도, 상기 성질을 갖고 있으면 기능적으로 동등하다. 루시페라아제(예를 들면, Nanoluc), SNAP 태그, 및 유비퀴틴에 대해서도 마찬가지이다.

본 개시에 있어서의, 아미노산 서열에 있어서 개변을 갖는, 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자는, 당해 단백질을 코드하는 핵산을 이용하여 조제할 수 있다. 이와 같은 핵산을 조제하기 위한 방법으로서, 예를 들면, site-directed mutagenesis법(Kramer, W. and Fritz, H.-J. (1987) Oligonucleotide-directed construction of mutagenesis via gapped duplex DNA. Methods in Enzymology, 154: 350-367)을 들 수 있다. 혹은, 하이브리다이제이션 기술(Southern, E.M. (1975) Journal of Molecular Biology, 98, 503)에 의해서도, 서열 번호: 48, 71∼84의 어느 하나에 기재된 단백질과 기능적으로 동등한 단백질을 코드하는 핵산을 얻는 것도 가능하다. 즉, 본 개시에 있어서의 개변된, 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 부분을 코드하는 핵산은, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 코드하는 핵산과 스트린젠트한 조건하에서 하이브리다이즈하는 것이어도 된다. 스트린젠트한 하이브리다이제이션 조건은, 당업자이면, 적절히 선택할 수 있다. 일례를 나타내면, 25% 폼아마이드, 보다 엄격한 조건에서는 50% 폼아마이드, 4×SSC, 50mM Hepes pH 7.0, 10×덴하르트 용액, 20μg/ml 변성 연어 정자 DNA를 포함하는 하이브리다이제이션 용액 중, 42℃에서 하룻밤 프리하이브리다이제이션을 행한 후, 표지한 프로브를 첨가하고, 42℃에서 하룻밤 보온하는 것에 의해 하이브리다이제이션을 행한다. 그 후의 세정에 있어서의 세정액 및 온도 조건은, 예를 들면 「2×SSC, 0.1% SDS, 50℃」, 「2×SSC, 0.1% SDS, 42℃」, 「1xSSC, 0.1% SDS, 37℃」 정도이고, 보다 엄격한 조건으로서는 「2×SSC, 0.1% SDS, 65℃」, 「0.5xSSC, 0.1% SDS, 42℃」 정도이며, 더 엄격한 조건으로서는 「0.2xSSC, 0.1% SDS, 65℃」 정도에서 실시할 수 있다. 이와 같이 하이브리다이제이션의 조건이 엄격해질수록, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 코드하는 핵산 서열과 높은 상동성을 갖는 핵산의 단리를 기대할 수 있다. 단, 상기 SSC, SDS 및 온도의 조건의 조합은 예시이고, 당업자이면, 하이브리다이제이션의 스트린젠시를 결정하는 상기 혹은 다른 요소(예를 들면, 프로브 농도, 프로브의 길이, 하이브리다이제이션 반응 시간 등)를 적절히 조합하는 것에 의해, 상기와 마찬가지의 스트린젠시를 실현하는 것이 가능하다.

이에 의해 단리된 핵산은, 아미노산 서열의 레벨에 있어서, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 갖는 단백질과 높은 상동성을 갖는다고 생각된다. 또한 염기 서열의 레벨에 있어서, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 코드하는 핵산의 염기 서열과 높은 상동성을 갖는다고 생각된다. 높은 상동성이란, 전술한 대로, 아미노산 서열 전체 혹은 염기 서열 전체로, 적어도 50% 이상, 바람직하게는 70% 이상, 또는 75% 이상, 더 바람직하게는 80% 이상, 또는 85% 이상, 특히 바람직하게는 90% 이상(예를 들면, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열의 동일성을 가리킨다.

본 개시의 핵산은, 예를 들면, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자, 및 이들의 아미노산 개변체의 조제 등에 이용하는 것이 가능하다. 이들 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자, 및 이들의 아미노산 개변체를 조제하는 경우에는, 통상, 이들을 코드하는 핵산을 적당한 발현 벡터에 삽입하고, 해당 벡터를 적당한 세포에 도입하고, 형질 전환 세포를 배양하여, 발현시킨 개변된 단백질을 단리, 정제, 배양한다. 이와 같은 단백질은, 정제를 용이하게 하는 등의 목적으로, 다른 단백질과의 융합 단백질로서 발현시키는 것도 가능하다. 예를 들면, 대장균을 숙주로 해서 말토오스 결합 단백질과의 융합 단백질로서 조제하는 방법(미국 New England BioLabs사 발매의 벡터 pMAL 시리즈), 글루타티온-S-트랜스퍼라아제(GST)와의 융합 단백질로서 조제하는 방법(Amersham Pharmacia Biotech사 발매의 벡터 pGEX 시리즈), 히스티딘 태그(예를 들면 서열 번호: 3)를 부가하여 조제하는 방법(Novagen사의 pET 시리즈) 등을 이용하는 것이 가능하다. 숙주 세포로서는, 재조합 단백질의 발현에 적합한 세포이면 특별히 제한은 없고, 상기의 대장균 외, 예를 들면, 효모, 여러 가지 동식물 세포, 곤충 세포 등을 이용하는 것이 가능하다. 숙주 세포로의 벡터의 도입에는, 당업자에게 공지된 여러 가지 방법을 이용하는 것이 가능하다. 예를 들면, 대장균으로의 도입에는, 칼슘 이온을 이용한 도입 방법(Mandel, M., Higa, A. (1970) Journal of Molecular Biology, 53, 158-162, Hanahan, D. (1983) Journal of Molecular Biology, 166, 557-580)을 이용할 수 있다. 숙주 세포내에서 발현시킨 단백질은, 해당 숙주 세포 또는 그의 세포 배양물 혹은 배양 상청으로부터, 당업자에게 공지된 방법에 의해 정제하여, 회수하는 것이 가능하다. 단백질을 상기의 말토오스 결합 단백질 등과의 융합 단백질로서 발현시킨 경우에는, 용이하게 어피니티 정제를 행하는 것이 가능하다.

본 개시의 일 태양에 있어서, 핵산은 벡터에 삽입된 것이어도 된다. 벡터로서는, 예를 들면, 대장균을 숙주로 하는 경우에는, 벡터를 대장균(예를 들면, JM109, DH5α, HB101, XL1Blue) 등에서 대량으로 증폭시켜 대량 조제하기 위해서, 대장균에서 증폭되기 위한 「ori」를 가지고, 추가로 형질 전환된 대장균의 선발 유전자(예를 들면, 약제(암피실린이나 테트라사이클린, 카나마이신, 클로람페니콜 등)에 의해 판별할 수 있는 약제 내성 유전자)를 갖는 벡터를 들 수 있지만 이것으로 한정되지 않는다. 이와 같은 벡터의 예로서는, M13계 벡터, pUC계 벡터, pBR322, pBluescript, pCR-Script 등을 들 수 있다. 또한, cDNA의 서브클로닝, 절출을 목적으로 한 경우, 상기 벡터 외에, 예를 들면, pGEM-T, pDIRECT, pT7 등을 들 수 있다. 단백질을 생산하는 목적에 있어서 벡터를 사용하는 경우에는, 특히, 발현 벡터가 유용하다. 발현 벡터로서는, 예를 들면, 대장균에서의 발현을 목적으로 한 경우는, 벡터가 대장균으로 증폭되는 상기 특징을 가지는 것 외에, 숙주를 JM109, DH5α, HB101, XL1-Blue 등의 대장균으로 한 경우에 있어서는, 대장균에서 효율 좋게 발현할 수 있는 프로모터, 예를 들면, lacZ 프로모터(Ward 등, Nature (1989) 341, 544-546; FASEB J. (1992) 6, 2422-2427), araB 프로모터(Better 등, Science (1988) 240, 1041-1043), 또는 T7 프로모터 등을 가지고 있는 것이 불가결하다. 이와 같은 벡터로서는, 상기 벡터 외에 pGEX-5X-1(파마시아사제), 「QIAexpress system」(퀴아젠사제), pEGFP, 또는 pET 등을 들 수 있다.

또한, 벡터에는, 폴리펩타이드 분비를 위한 시그널 서열이 포함되어 있어도 된다. 폴리펩타이드 분비를 위한 시그널 서열로서는, 대장균의 페리플라즘에 산생시키는 경우, pelB 시그널 서열(Lei, S. P. et al J. Bacteriol. (1987) 169, 4379)을 사용하면 된다. 숙주 세포로의 벡터의 도입은, 예를 들면 염화 칼슘법, 일렉트로포레이션법을 이용하여 행할 수 있다. 또한 식물체 내에서 발현하는 벡터로서 pMH1, pMH2, pCAMBIA 등의 벡터를 들 수 있다.

대장균 이외에도, 예를 들면, 단백질을 제조하기 위한 벡터로서는, 포유동물 유래의 발현 벡터(예를 들면, pcDNA3(인비트로젠사제)이나, pEGF-BOS(Nucleic Acids. Res. 1990, 18(17), p5322), pEF, pCDM8), 곤충 세포 유래의 발현 벡터(예를 들면 「Bac-to-BAC baculovairus expression system」(깁코 BRL사제), pBacPAK8), 식물 유래의 발현 벡터(예를 들면 pMH1, pMH2), 동물 바이러스 유래의 발현 벡터(예를 들면, pHSV, pMV, pAdexLcw), 레트로바이러스 유래의 발현 벡터(예를 들면, pZIPneo), 효모 유래의 발현 벡터(예를 들면, 「Pichia Expression Kit」(인비트로젠사제), pNV11, SP-Q01), 고초균 유래의 발현 벡터(예를 들면, pPL608, pKTH50) 등을 들 수 있다.

CHO 세포, COS 세포, NIH3T3 세포 등의 동물 세포에서의 발현을 목적으로 한 경우에는, 세포내에서 발현시키기 위해서 필요한 프로모터, 예를 들면 SV40 프로모터(Mulligan 등, Nature (1979) 277, 108), MMLV-LTR 프로모터, EF1α 프로모터(Mizushima 등, Nucleic Acids Res. (1990) 18, 5322), CMV 프로모터 등을 가지고 있는 것이 불가결하고, 세포로의 형질 전환을 선발하기 위한 유전자(예를 들면, 약제(네오마이신, G418 등)에 의해 판별할 수 있는 약제 내성 유전자)를 가지면 더 바람직하다. 이와 같은 특성을 갖는 벡터로서는, 예를 들면, pMAM, pDR2, pBK-RSV, pBK-CMV, pOPRSV, pOP13 등을 들 수 있다.

형질 전환 세포는, 예를 들면, 단백질의 제조나 발현을 위한 산생계로서 사용할 수 있다. 단백질의 제조를 위한 산생계는, in vitro 및 in vivo의 산생계가 있다.

진핵 세포를 사용하는 경우, 예를 들면, 동물 세포, 식물 세포, 진균 세포를 숙주에 이용할 수 있다. 동물 세포로서는, 포유류 세포(예를 들면, 전술한 CHO 세포, COS 세포, NIH3T3 세포에 더하여, 3T3, 미엘로마 세포, BHK(baby hamster kidney), HeLa, Vero 등의 세포), 양서류 세포(예를 들면 아프리카발톱개구리 난모 세포(Valle, et al., Nature (1981) 291, 358-340)), 혹은 곤충 세포(예를 들면, sf9, sf21, Tn5 등의 세포)가 알려져 있다. CHO 세포로서는, 특히, DHFR 유전자를 결손한 CHO 세포인 dhfr-CHO(Proc. Natl. Acad. Sci. USA (1980) 77, 4216-4220)나 CHO K-1(Proc. Natl. Acad. Sci. USA (1968) 60, 1275)을 적합하게 사용할 수 있다. 대량 발현을 목적으로 하는 경우에는 특히 CHO 세포가 바람직하다.

식물 세포로서는, 후술하는 식물 유래의 세포 외, 예를 들면, 니코티아나 타바쿰(Nicotiana tabacum) 유래의 세포가 단백질 생산계로서 알려져 있고, 이것을 캘러스 배양하면 된다.

또한 진균 세포로서는, 효모, 예를 들면, 사카로마이세스(Saccharomyces)속, 예를 들면, 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 사상균, 예를 들면, 아스퍼질러스(Aspergillus)속, 예를 들면, 아스퍼질러스 니제르(Aspergillus niger)가 알려져 있지만 이들로 한정되지 않는다.

비한정된 일 태양에 있어서, 본 개시는, 본 개시에 있어서의 스크리닝 방법에 의해 얻어진 후보 분자의 제조 방법에 관한 것이다. 예를 들면 후보 분자가 펩타이드인 경우, 당해 펩타이드의 아미노산 서열에 기초하여 펩타이드를 제조할 수 있다.

본 명세서에 있어서, 「1E+N」은 1×10의 N승을 의미한다. 예를 들면, 1E+8은 1×10의 8승을, 1E+6이면 1×10의 6승을 의미한다. 마찬가지로, 1.8E+12이면 1.8×10의 12승을, 3.03E+05이면 3.03×10의 5승을 의미한다.

본 명세서에 있어서, 「및/또는」이라는 용어의 의의는, 「및」과 「또는」이 적절히 조합된 모든 조합을 포함한다. 구체적으로는, 예를 들면, 「A, B, 및/또는 C」에는, 이하의 7방법의 배리에이션이 포함된다;

(i) A, (ii) B, (iii) C, (iv) A 및 B, (v) A 및 C, (vi) B 및 C, (vii) A, B, 및 C.

본 명세서에 있어서, 범위를 나타내는 「∼」는 그 양단의 값을 포함하고, 예를 들면, 「A∼B」는, A 이상이고, 또한 B 이하인 범위를 의미한다.

한편, 본 명세서에 있어서 인용된 모든 선행기술문헌은, 참조로서 본 명세서에 원용된다.

실시예

본 발명은, 이하의 실시예에 의해 더 예시되지만, 하기의 실시예로 한정되는 것은 아니다.

실시예 중에서는 이하의 약호를 사용했다.

DMSO 다이메틸설폭사이드

DTT 다이싸이오트레이톨

FA 폼산

TFA 트라이플루오로아세트산

THF 테트라하이드로퓨란

TCEP 트리스(2-카복시에틸)포스핀

TEA 트라이에틸아민

HFIP 헥사플루오로아이소프로판올

실시예 1 비오틴화 GFP1-9 단백질의 조제

벡터 조제

pET-15b 벡터에, 서열 번호: 15(D-1)의 합성 DNA를 Nde1/BamH1의 제한 효소를 사용하여 삽입한 발현 벡터를 조제했다.

합성 DNA 서열 번호: 15(D-1)

DNA 서열:

CATATGGGTGGCACCAGCAGCAAGGGCGAGGAACTGTTCACCGGTGTGGTTCCGATCCTGGTGGAGCTGGACGGCGATGTTAACGGTCACAAATTTAGCGTGCGTGGTGAGGGCGAAGGTGACGCGACCATCGGCAAGCTGACCCTGAAATTCATTAGCACCACCGGTAAACTGCCGGTGCCGTGGCCGACCCTGGTTACCACCCTGACCTACGGTGTGCAGGCGTTTAGCCGTTATCCGGACCACATGAAGCGTCACGATTTCTTTAAAAGCGCGATGCCGGAGGGCTACGTTCAAGAACGTACCATTAGCTTCAAGGACGATGGCAAGTATAAAACCCGTGCGGTGGTTAAATTTGAGGGCGATACCCTGGTTAACCGTATCGAGCTGAAGGGTACCGACTTCAAAGAAGATGGCAACATTCTGGGTCACAAGCTGGAATACAACTTTAACAGCCACAACGTGTATATCACCGCGGACAAGCAGAAAAACGGCATTAAAGCGAACTTCACCGTGCGTCACAACGTTGAGGACGGTAGCGTTCAACTGGCGGATCACTACCAGCAAAACACCCCGATTGGTGATGGTACCCGTGGCAGCGGTAGCATTGAAGGTCGTCATAGCGGCAGCGGTAGCCCGGTGCTGCTGCCGGACAACCACTATCTGAGCACCCAGACCGTTCTGAGCAAAGATCCGAACGAGGCGGGCACTCGTGGCAGCGGTAGCATCGAAGGTCGTCACAGCGGCAGCGGTAGCCGTGACCACATGGTGCTGCACGAATACGTTAACGCGGCGGGCATCACCCACGGTATGGACGAACTGTATAAAGGCAGCGGCGGCACCTAAGGATCC

단백질에 비오틴화를 위한 Avi 태그 서열(서열 번호: 1), 절단을 위한 TEV 프로테아제 인식 서열(서열 번호: 2), 정제를 위한 His 태그(서열 번호: 3)를 부가하기 위해서, Nco1/Nde1 제한 효소를 이용하여, 인서트 태그 서열(서열 번호: 16)을 목적 단백질의 N 말단에 삽입했다. Ligation 산물을 사용하여, 대장균 DH5α 컴피텐트 셀(도요보, #DNA-903)을 형질 전환하고, 클로닝 후, 삽입 개소의 서열 해석을 행하여, 태그 부가 발현 벡터의 완성을 확인했다.

추가로 발현 효율과 His 태그 정제의 효율을 올리기 위해, His 태그와 ORF 서열 사이의 서열에 Gly-Gly-Ser-Ser(서열 번호: 88)의 서열을 PCR로 삽입했다. 구체적으로는, 1x Prime STAR Max Premix(다카라), 2μM Fw-primer(서열 번호: 13), 2μM Rv-primer(서열 번호: 14), 1.4ng 태그 부가 발현 벡터를 혼합하고, 98℃ 10초, 55℃ 15초, 72℃ 45초 사이클을 30사이클 반복했다. PCR 산물을 사용하여, 대장균 DH5α 컴피텐트 셀(도요보, #DNA-903)을 형질 전환하고, 클로닝 후, 삽입 개소의 서열 해석을 행하여, 본 실시예에서 사용하는 GFP1-9 발현 벡터의 완성을 확인했다.

단백질 발현 및 정제

대장균 BL21(DE3) 컴피텐트 셀(Novagen)을, GFP1-9 발현 벡터와, pACYC184 벡터에 대장균 BirA 유전자를 도입한 BirA 발현 벡터로 형질 전환하여, 발현주를 구축했다.

구축한 대장균 발현주를 배지 A(10g/L Tryptone, 5g/L Yeast Extract, 10g/L NaCl, 100μg/mL 암피실린, 34μg/mL 클로람페니콜)에 식균하고, 37℃, 200rpm으로 배양했다. OD600=0.7에 이른 시점에서, 빙수에 플라스크를 5분 침지하여, 4℃까지 배양액의 온도를 낮췄다. 0.5mM IPTG(아이소프로필-β-싸이오갈락토피라노사이드), 50μM Biotin이 되도록 가하고, 19℃, 200rpm으로 하룻밤 배양함으로써 비오틴화 수식을 받은 목적 단백질을 발현시켰다. 배양균체는 원심에 의해 회수하고, 액체 질소로 동결한 후, -80℃에서 보존했다.

동결균체를 extraction buffer(50mM Tris pH 8.0, 150mM NaCl, 1% CHAPS, 5% Glycerol, Proteinase Inhibitor Cocktail(EDTA-free))를 이용하여 현탁하고, 5kUnit/E.coli가 되도록 rLysozyme(Novagen, #71110-3)을 첨가한 후, 실온에서 20분 방치했다. 재차 현탁하고, 초음파 파쇄한 후, 1M MgCl₂를 0.2%v/v가 되도록, 25U/μL benzonase(EMD millipore, #70746-2.5KUN)를 0.03%v/v가 되도록 가하고, 재차 실온에서 20분 정치했다. 샘플을 원심하여 회수한 상청을, 0.22μm 필터로 여과했다.

여과한 샘플을, HisTrap HP 5mL(GE Healthcare, #17-5248-02)를 사용하여 정제했다. GFP10, GFP11 부분을 절단하기 위해, 용출 샘플에 종농도 2mM이 되도록 CaCl₂를 가하고, 샘플의 1/100양(w/w)의 Factor Xa Protease(New England Biolabs, #P8010L)를 가했다. 투석 카세트: Slide-A-Lyzer 10K Dialysis Cassettes G2 30mL Capacity(Thermo Fisher, #87732)를 이용하여, 샘플을 투석 Buffer(50mM Tris-HCl(pH 8.0), 150mM NaCl, 2mM CaCl₂)로 치환했다.

투석 샘플을 회수 후, Streptavidin Mutein Matrix(Roche, #03708152001)를 이용하여 정제했다. 목적 단백질을 포함하는 프랙션을 회수하고, 합계 10mL를 Amicon Ultra-15 10K(MERCK, #UFC901024)에 의해, 3mL volume이 되도록 농축했다. 6M Gdn Buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, 3M Guanidine-Hydrochloride(pH 8.0))를 등량 가하고, 40분간 빙상에서 변성시켰다. 변성 전후에서의 흡수 파장 스펙트럼의 변화를 확인하여, 변성되어 있는 것을 확인한 후, HiLoad 26/600 Superdex 75 pg(GE 헬스케어, #28-9893-34)에 의해, 겔 여과 정제했다. 겔 여과 정제의 Running buffer로서, 50mM Tris-HCl, 150mM NaCl, 10% Glycerol, 3M Guanidine Hydrochloride(pH 8.0), 1mM DTT를 이용했다. 마지막으로 변성제의 구아니딘을 제거하고, 리폴딩시키기 위해, 얻어진 샘플을 투석 카세트: Slide-A-Lyzer 10K Dialysis Cassette 30mL capacity(Thermo Fisher, #87732)로 투석했다.

SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다. 또한, 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다. SEC 분석의 결과, 목적 단백질의 주성분은, 32kDa의 분자량 마커와 동일한 정도의 유지 시간을 나타내고, 또한 단량체로서 존재하고 있는 것을 확인했다. SDS-PAGE의 레인 정보를 표 1, 결과를 도 1에, SEC 분석의 결과를 도 2에 나타낸다. SEC 분석의 칼럼에는, AdvanceBio SEC 300A 2.7μm 4.6×150mm(Agilent사, #PL1580-3301)를 사용했다.

실시예 2 mRNA Display를 이용한 splitGFP의 재회합 어세이

복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 스크리닝할 때, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 낮게 억제한 계가 필요해진다.

그래서, GFP10(서열 번호: 40), GFP11(서열 번호: 41), 및 GFP10-11 연결체(서열 번호: 39) 각각의, GFP1-9(서열 번호: 48)에 대한 결합능을 평가했다. GFP10, GFP11, 및 GFP10-11 연결체의 각각에 핵산을 연결시킨 Display 분자를 조제하고, 이들을 GFP1-9와 인큐베이트하고, GFP1-9에 결합한 분자의 핵산 부분을 qPCR했다. 한편, 본 실시예에서는, N 말단에 Avi 태그 서열, TEV 프로테아제 인식 서열, 및 His 태그 서열이 부가된 GFP의 1∼9번째의 스트랜드를 GFP1-9, C 말단에 GS 링커가 부가된 GFP의 10번째의 스트랜드를 GFP10, C 말단에 GS 링커가 부가된 GFP의 11번째의 스트랜드를 GFP11, GFP9와 GFP10이 연결되고 C 말단에 GS 링커가 부가된 단백질을 GFP10-11로 표기하는 경우가 있다.

(1) mRNA의 합성

주형 DNA(서열 번호: 17(D-3)∼서열 번호: 19(D-5))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 29(mR-1)∼서열 번호: 31(mR-3))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.

주형 DNA 서열 번호: 17(D-3)

DNA 서열: GFP10-11

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGACCTGCCGGACGACCACTACCTGTCTACCCAGACCATCCTGCTGAAAGACCTGAACGAAAAACGTGACCACATGGTTCTGCTGGAATACGTTACCGCGGCGGGTATCACCGACGCGTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

주형 DNA 서열 번호: 18(D-4)

DNA 서열: GFP10

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGACCTGCCGGACGACCACTACCTGTCTACCCAGACCATCCTGCTGAAAGACCTGAACGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

주형 DNA 서열 번호: 19(D-5)

DNA 서열: GFP11

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGAAAAACGTGATCATATGGTGCTGCTGGAATATGTGACCGCGGCGGGCATTACCGATGCGTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

mRNA 서열 번호: 29(mR-1)

GFP10-11 RNA 서열:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGACCUGCCGGACGACCACUACCUGUCUACCCAGACCAUCCUGCUGAAAGACCUGAACGAAAAACGUGACCACAUGGUUCUGCUGGAAUACGUUACCGCGGCGGGUAUCACCGACGCGUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 30(mR-2)

GFP10 RNA 서열:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGACCUGCCGGACGACCACUACCUGUCUACCCAGACCAUCCUGCUGAAAGACCUGAACGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 31(mR-3)

GFP11 RNA 서열:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGAAAAACGUGAUCAUAUGGUGCUGCUGGAAUAUGUGACCGCGGCGGGCAUUACCGAUGCGUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

(2) mRNA Display에 의한 재회합 어세이

mRNA와 펩타이드가 연결된 Display 분자를 조제하고, 비오틴화 GFP1-9에 의한 회수율을 조사했다. WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜에 따라 번역했다.

각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 이하의 식에 의해 Display 분자의 제시율(%)을 계산했다.

Display 분자의 제시율(%)=번역 펩타이드와 링커로 이루어지는 밴드 강도/밴드 강도의 합계×100

RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.84μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.

TricinePAGE의 검출은, 형광 표지한 퓨로마이신 링커를 검출했다. TricinePAGE의 결과 얻어진 제시율은 표 2와 같이 되었다.

재회합 어세이에 사용할 때는, 형광 표지가 없는 퓨로마이신 링커를 사용하고, 번역 산물은, mRNA 부분에서의 결합을 회피하기 위해서 역전사를 행했다. 구체적인 방법으로서는, 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 5), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.

1xTBS의 버퍼 중에서, 0.42μM의 각 Display 분자와, 1μM의 비오틴화 GFP1-9와 혼합하고, 실온에서 1시간 반응시켰다.

Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, GFP1-9와 비오틴 사이에 도입한 TEV 프로테아제 인식 서열을 인식하는 TEV 프로테아제에 의해 절단하여 핵산의 용출을 행했다. 구체적인 TEV 용출액은, 1xTEV buffer, 1mM DTT, 0.2U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 5))로 qPCR을 걸었다. qPCR의 반응액은, 1xExtaq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 비오틴화 GFP1-9와 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량(분자수)을 산출했다. 표 중에서는 핵산량(분자수)의 단위를 「분자」라고 표기했다.

각 서열에서 검량선을 긋기 위해서, 핵산량(분자수)으로, 1E+8/μL, 1E+7/μL, 1E+6/μL, 1E+5/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.

GFP1-9와의 결합에 의해 회수된 각 Display 분자의 핵산량을, GFP1-9와 혼합하기 전에 존재하고 있던 각 Display 분자의 핵산량(인풋의 값)으로 나눈 겉보기의 회수율을 산출하고, 추가로 제시율로 보정한 회수율을, 표 3에 정리했다.

겉보기의 회수율(%)=회수된 핵산량(분자수)/인풋의 핵산량(분자수)×100

회수율(%)=회수된 핵산량(분자수)/(인풋의 핵산량(분자수)×각 제시율×0.01)×100

결과, GFP1-9에 의해 GFP10-11 연결체가 회수되고, GFP10 단독, 혹은 GFP11 단독의 회수율은, 연결체의 회수율에 비해 1000배 정도 낮은 것이 나타났다. 즉, GFP1-9는 GFP10(또는 GFP11)의 비존재하에서는 GFP11(또는 GFP10)과 회합하지 않는 것, GFP1-9가 GFP10 및 GFP11과 회합하기 위해서는 GFP10과 GFP11이 근접, 회합 혹은 상호작용하고 있을 것이 필요하다는 것이 나타났다. 이 결과로부터, GFP10을 어떤 표적 단백질에 결합시킨 분자, GFP11을 다른 표적 단백질에 결합시킨 분자, 및 GFP1-9를 사용하면, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자(예를 들면, 복수의 표적 분자 사이의 결합을 증강 또는 저해하는 분자, 복수의 표적 분자를 연결하는 분자, 복수의 표적 분자에 의한 복합체의 형성을 유발하는 분자 등)의 효율적인 스크리닝이 가능해지는 것이 나타났다.

실시예 3 GFP의 재회합을 이용한, 라파마이신 회수 검증 실험

다음으로, GFP10, GFP11에 각각 다른 단백질을 결합시킨 융합 단백질을 조제하고, 상기 단백질이 복합체를 형성하는 것에 의한 GFP10, GFP11의 근접 효과로, GFP1-9에 의해 상기 단백질의 복합체를 선택적으로 회수하는 것이 가능한지를 검증했다. 복합체 형성을 위한 단백질 페어의 모델로서, FKBP(FK506-binding protein)와 FRB(FKBP-Rapamycin binding domain of FKBP12-Rapamycin associated protein)를 이용했다. 이 2개의 단백질은 라파마이신 존재하에서 복합체를 형성하는 것이 알려져 있다.

라파마이신에 화학적으로 핵산을 결합시킨 라파마이신-핵산을 조제하고, GFP1-9에 의해, 2개의 융합 단백질과 라파마이신의 복합체가 회수되는지 여부를 검증했다.

(1) 라파마이신-클릭 태그의 조제

LCMS의 분석 조건은, 하기와 같다.

(1-1) 다이벤조사이클로옥틴(DBCO) 수식된 라파마이신 유도체의 합성

라파마이신, 42-[22-(11,12-다이데하이드로다이벤조[b,f]아조신-5(6H)-일)-17,22-다이옥소-4,7,10,13-테트라옥사-16-아자도코산-1-오에이트](화합물 nk01)의 합성

질소 분위기하, 다이벤조사이클로옥틴-PEG4-산(7.5mg, 0.013mmol)을 테트라하이드로퓨란(THF)(64.3μL)에 용해시켜 혼합물을 0℃로 냉각 후, 트라이에틸아민(2.7μL, 0.019mmol) 및 2,4,6-트라이클로로벤조일 클로라이드(2.0μL, 0.013mmol)를 가하고 0℃에서 1시간 교반했다. 반응 혼합물에 라파마이신(11.8mg, 0.013mmol) 및 4-다이메틸아미노피리딘(1.6mg, 0.013mmol)을 첨가했다. 반응 혼합물을 0℃에서 5분간 교반한 후, 15℃에서 3시간 교반 후, 역상 실리카 겔 칼럼 크로마토그래피(0.1% 폼산 수용액/0.1% 폼산 아세토나이트릴 용액)로 정제하여, 라파마이신, 42-[22-(11,12-다이데하이드로다이벤조[b,f]아조신-5(6H)-일)-17,22-다이옥소-4,7,10,13-테트라옥사-16-아자도코산-1-오에이트](화합물 nk01)(3.9mg, 21%)를 얻었다.

LCMS(ESI)m/z=1477(M+H)+

유지 시간: 1.15분(분석 조건 SQDFA05)

(1-2) 라파마이신-핵산의 조제

화합물 nk02의 합성

10mM 42-[22-(11,12-다이데하이드로다이벤조[b,f]아조신-5(6H)-일)-17,22-다이옥소-4,7,10,13-테트라옥사-16-아자도코산-1-오에이트](화합물 nk01)의 DMSO 용액(20μL), 2mM DNA-N3(서열 번호: 98)의 10mM 아세트산 나트륨 수용액(20μL), DMSO(20μL)를 각각 가하고, 37℃에서 16시간 정치했다. 반응 혼합물에 물(60μL), 클로로폼-아이소아밀 알코올 혼합액(120μL)을 가하여, 액 추출을 행하고, 수층을 동결 건조하고, 얻어진 잔사를 DMSO(80μL)에 녹여, 조생성물(화합물 nk02)의 DMSO 용액을 얻었다.

LC-HRMS:m/z=934.5680(M-9H)^9-, Calcd 934.5685(M-9H)^9-, (Calcd for C₃₀₂H₄₃₇N₆₈O₁₆₈P₂₃:Molecular Weight 8420.4)

유지 시간: 6.57분(분석 조건 LTQ TEA/HFIP20＿01)

화합물 nk03의 합성

20mM 다이벤조사이클로옥틴-PEG4-산의 DMSO 용액(2.5μL), 2mM DNA-N3(서열 번호: 98)의 수용액(5μL), 20mM 아세트산 나트륨 수용액(2.5μL)을 각각 가하고, 37℃에서 16시간 정치했다. 반응액을 동결 건조하고, 얻어진 잔사를 DMSO(20μL)에 녹여, 조생성물(화합물 nk03)의 DMSO 용액을 얻었다.

LC-HRMS:m/z=1503.7145(M-5H)^5-, Calcd 1503.7196 (M-5H)^5-, (Calcd for C₂₅₁H₃₆₀N₆₇O₁₅₆P₂₃:Molecular Weight 7524.3)

유지 시간: 3.61분(분석 조건 LTQ TEA/HFIP20＿01)

(2) 라파마이신-핵산의 조제

화합물 nk02 혹은 화합물 nk03에, T4 RNA ligase에 의해, qPCR로 검출하기 위한 핵산을 연결하고, 모델 실험에 사용하기 위한 라파마이신-클릭 태그-핵산 분자(화합물 nk04, 화합물 nk06) 및 클릭 태그-핵산 분자(화합물 nk05, 화합물 nk07: 네거티브 컨트롤에 사용)를 조제했다.

주형 DNA(서열 번호: 20(D-6), 서열 번호: 120(D-22), 서열 번호: 121(D-23))로부터, RiboMAX Large Scale RNA production System T7(Promega사, P1300)을 이용한 in vitro 전사 반응에 의해 주형 mRNA(서열 번호: 32(mR-4), 서열 번호: 122(mR-17), 서열 번호: 123(mR-18))를 합성하고, RNeasy Mini kit(Qiagen사)에 의해 정제했다. 1xligation buffer(50mM HEPES·KOH(pH 8.2), 10mM MgCl₂, 2.67mM DTT, 0.67mM ATP), 10% PEG8000, 32μM 화합물 nk02 혹은 화합물 nk03, 10μM mR-4, 2U/μL T4RNAligase(NEB, #M0204L)가 되도록 혼합하고, 37℃ 1시간 인큐베이트하여, 라이게이션 반응을 행했다. 라이게이션 반응 후, RNeasy Mini kit(Qiagen사)에 의해 정제하여, 조제했다. 서열 번호: 32와 화합물 nk02가 연결된 것을 화합물 nk04, 서열 번호: 32와 화합물 nk03이 연결된 것을 화합물 nk05, 서열 번호: 122 혹은 서열 번호: 123과 화합물 nk02가 연결된 혼합물을 화합물 nk06, 서열 번호: 122 혹은 서열 번호: 123과 화합물 nk03이 연결된 혼합물을 화합물 nk07로 했다.

서열 번호: 120, 서열 번호: 121의 (Random)9는, AAC, ACT, AGG, AGT, ATT, CAG, CAT, CCG, CGG, CGT, CTA, GAA, GCT, GGT, GTA, TGC, TGG, TTT 중 어느 코돈이 랜덤으로 9잔기 출현한다.

서열 번호: 122, 서열 번호: 123의 (Random)9는, AAC, ACU, AGG, AGU, AUU, CAG, CAU, CCG, CGG, CGU, CUA, GAA, GCU, GGU, GUA, UGC, UGG, UUU 중 어느 코돈이 랜덤으로 9잔기 출현한다.

주형 DNA 서열 번호: 20(D-6)

GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGCAGTTTATGTTTTAGGAGATTCTGAGGCCGACCGGCACCGGCACCGGCGATAGGGCGGCGGGGACAAA

mRNA 서열 번호: 32(mR-4)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGCAGUUUAUGUUUUAGGAGAUUCUGAGGCCGACCGGCACCGGCACCGGCGAUAGGGCGGCGGGGACAAA

주형 DNA 서열 번호: 120(D-22)

GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATG(Random)9ATGCCGACCGGCACCGGCACCGGCGATAGGGCGGCGGGGACAAA

주형 DNA 서열 번호: 121(D-23)

GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATG(Random)9TAGCCGACCGGCACCGGCACCGGCGATAGGGCGGCGGGGACAAA

mRNA 서열 번호: 122(mR-17)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUG(Random)9AUGCCGACCGGCACCGGCACCGGCGAUAGGGCGGCGGGGACAAA

mRNA 서열 번호: 123(mR-18)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUG(Random)9UAGCCGACCGGCACCGGCACCGGCGAUAGGGCGGCGGGGACAAA

(3) 융합 단백질의 조제

FKBP와 GFP11을 연결한 융합 단백질(Hisx6-FKBP12-Link12-GFP11, (염기 서열의 서열 번호: 21, 아미노산 서열의 서열 번호: 86) 및 FRB와 GFP10을 연결한 융합 단백질(GFP10-Link12-FRB-Hisx6, 염기 서열의 서열 번호: 22, 아미노산 서열의 서열 번호: 87)을 조제했다.

구체적으로는, 발현 벡터에 pET11a를 이용하여, 대장균 BL21(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 0.5가 될 때까지, 암피실린이 함유된 TB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, Hisx6-FKBP12-Link12-GFP11은 37℃에서 4시간, GFP10-Link12-FRB-Hisx6은 15℃에서 하룻밤 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.

융합되는 단백질 사이에는, 12잔기의 GS 링커를 넣었다. 각 단백질의 아미노산 서열은 표 5와 같다.

(4) GFP의 재회합을 이용한, 라파마이신 회수 검증 실험

화합물 nk06과, GFP1-9, 라파마이신을 개재시켜 복합체를 형성하는 단백질(FKBP 또는 FRB)과 GFP11 또는 10을 연결한 융합 단백질(Hisx6-FKBP12-Link12-GFP11 혹은 GFP10-Link12-FRB-Hisx6)을 이용하여, GFP10 및 11의 근접 효과에 의한 GFP1-9와의 재회합의 이용에 의해, 상기 복합체를 회수할 수 있는지를, 화합물 nk06의 핵산의 회수량을 지표로 검증했다.

화합물 nk06 혹은 화합물 nk07의 mRNA 부분에서의 결합을 회피하기 위해서, mRNA 부위의 역전사를 행했다. 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 6), 0.5μM 화합물 nk06 혹은 화합물 nk07이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.

조건 1에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6, 및 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.

조건 2에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6을 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.

조건 3에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11과 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.

조건 4에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, GFP10-Link12-FRB-Hisx6과 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.

조건 5에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6, 및 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk07의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.

Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, 용출 buffer(1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer(서열 번호: 4), 0.5μM Rv-primer(서열 번호: 6))를 가하여 현탁하고, 95℃에서 10분간 가열하여, 핵산을 용출했다. 반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 6))로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, 50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.

각 서열에서 검량선을 긋기 위해서, 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.

Hisx6-FKBP12-Link12-GFP11과 GFP10-Link12-FRB-Hisx6을 개재시켜 GFP1-9와의 결합에 의해 회수된, 화합물 nk06 혹은 화합물 nk07의 핵산의 회수율을, 인풋의 값(어세이에 반입한 화합물 nk06 혹은 화합물 nk07의 양)으로 나눈 회수율을 이하의 식으로부터 산출하고, 표 6에 정리했다.

회수율(%)=회수된 핵산량/인풋의 핵산량×100

결과, 화합물 nk06, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6, 및 비오틴화 GFP1-9의 모든 것이 갖추어진 조건(조건 1)에서만 회수율이 높았다. 이것으로부터, 비오틴화 GFP1-9를 개재시켜 화합물 nk06이 회수되기 위해서는, Hisx6-FKBP12-Link12-GFP11 및 GFP10-Link12-FRB-Hisx6의 양방이 존재할 것이 필요하고, GFP 시스템을 사용함으로써 라파마이신과 같이 2종의 단백질의 상호작용을 촉진할 수 있는 분자를 선택적으로 취득하는 것이 가능하다는 것이 시사되었다.

라파마이신은, FKBP12 단백질에는 Kd=12nM 정도의 결합력을 나타내는 것이 알려져 있지만(J Am Chem Soc. 2005;127:4715-21), GFP10-Link12-FRB-Hisx6이 존재하지 않는 조건에서는, 라파마이신은 회수되지 않았다(조건 2). 실시예 2의 결과와 합하면, GFP10과 GFP11의 각각에 다른 표적 단백질을 연결시키면, 이들 표적 단백질과의 3자 복합체를 형성할 수 있는 시험 화합물을 선택적으로 회수할 수 있고, 어느 표적 단백질만과 복합체를 형성할 수 있는 시험 화합물은 회수되지 않는 것이 나타났다.

실시예 4 GFP 이외의 단백질의 응용예

다음으로, GFP 이외의 분자에서도, 시험 화합물을 개재시킨 근접 효과에 의해 표적 단백질을 회수하는 것이 가능한지 검증했다. 사용한 단백질은, 인간 O6-alkylguanine-DNA alkyltransferase(hAGT)를 개변해서 작성되고, 벤질구아닌 유도체가 특이적 반응 이질이 되는 SNAP 태그, 모노유비퀴틴, 및 심해 새우(Oplophorus gracilirostris) 유래의 루시페라아제, Nanoluc(등록상표)이다.

실시예 4-1 mRNA Display를 이용한 splitSNAP-tag의 재회합 어세이

split SNAP-tag는, SNAP-tag를 91번째와 92번째의 잔기 사이에서 분할한 단백질이고, 양자가 근접하는 것에 의해 효소 활성이 회복하기 때문에 세포내에서의 PPI의 이미징에 이용되고 있다.

이 성질을 응용하여, split SNAP-tag의 N 말단 분자, 혹은 split SNAP-tag의 C 말단 분자만으로는, 비오틴 수식된 SNAP-tag 기질(SNAP-Biotin)과는 반응하지 않고, 전장체만이 반응할 수 있어, 이에 의해 전장체의 선택적인 회수가 가능한지 여부를 검증하기 위한 실험을 행했다.

실시예 4-1-1 주형 DNA의 합성

pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, C 말단에 GS 링커가 부가된 SNAP 태그 N 말단 단편, C 말단에 GS 링커가 부가된 SNAP 태그 C 말단 단편, C 말단에 GS 링커가 부가된 전장 SNAP 태그를 각각 코드하는 DNA 서열(서열 번호: 23(D-9)∼서열 번호: 25(D-11))을 PCR에 의해 조제했다. 한편, 본 실시예에서는, C 말단에 GS 링커가 부가된 SNAP-tagN 말단 단편을 SNAP(N)과, C 말단에 GS 링커가 부가된 SNAP-tagC 말단 단편을 SNAP(C), C 말단에 GS 링커가 부가된 전장 SNAP 태그를 SNAP(full)이라고 표기하는 경우가 있다.

C 말단에 GS 링커가 부가된 SNAP 태그 N 말단 단편을 코드하는 DNA(서열 번호: 23(D-9))의 조제는, 하기의 프라이머를 이용하여 2단계의 PCR을 실시하는 것에 의해 행했다.

1st PCR에 있어서는, pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, Fw-primer(서열 번호: 7), Rv-primer(서열 번호: 8)를 이용했다.

2nd PCR에 있어서는, 1st PCR 산물을 주형으로 하고, Fw-primer(서열 번호: 9), Rv-primer(서열 번호: 10)를 이용하여 PCR을 행함으로써 목적하는 DNA 서열(서열 번호: 23(D-9))을 얻었다.

DNA 서열 번호: 23(D-9)

DNA 서열: SNAP(N)

GGCGTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATGGACAAAGACTGCGAAATGAAGCGCACCACCCTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGGCTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGGCTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

C 말단에 GS 링커가 부가된 SNAP 태그 C 말단 단편을 코드하는 DNA(서열 번호: 24(D-10))의 조제는, 하기의 프라이머를 이용하여 2단계의 PCR을 실시하는 것에 의해 행했다.

1st PCR에 있어서는, pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, Fw-primer(서열 번호: 11), Rv-primer(서열 번호: 12)를 이용했다.

2nd PCR에 있어서는, 1st PCR 산물을 주형으로 하고, Fw-primer(서열 번호: 9), Rv-primer(서열 번호: 10)를 이용하여 PCR을 행함으로써 목적하는 DNA 서열(서열 번호: 24(D-10))을 얻었다.

DNA 서열 번호: 24(D-10)

DNA 서열: SNAP(C)

GGCGTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATGGTCGACGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCGCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCCTGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCCACAGACTGGGCAAGCCTGGGCTGGGTCCTGCAGGCGGATCCGCGTTTAAACTCGAGGTTAATGGCTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

C 말단에 GS 링커가 부가된 전장 SNAP 태그를 코드하는 DNA(서열 번호: 25(D-11))의 조제는, 하기의 프라이머를 이용하여 2단계의 PCR을 실시하는 것에 의해 행했다.

1st PCR에 있어서는, pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, Fw-primer(서열 번호: 7), Rv-primer(서열 번호: 12)를 이용했다.

2nd PCR에 있어서는, 1st PCR 산물을 주형으로 하고, Fw-primer(서열 번호: 9), Rv-primer(서열 번호: 10)를 이용하여 PCR을 행함으로써 목적하는 DNA 서열(서열 번호: 25(D-11))을 얻었다.

DNA 서열 번호: 25(D-11)

DNA 서열: SNAP(full)

GGCGTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATGGACAAAGACTGCGAAATGAAGCGCACCACCCTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGGCTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCGCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCCTGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCCACAGACTGGGCAAGCCTGGGCTGGGTCCTGCAGGCGGATCCGCGTTTAAACTCGAGGTTAATGGCTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

실시예 4-1-2 mRNA의 합성

주형 DNA(서열 번호: 23(D-9)∼서열 번호: 25(D-11))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 33(mR-5)∼서열 번호: 35(mR-7))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.

mRNA 서열 번호: 33(mR-5)

RNA 서열: SNAP(N)_A7_mRNA

GGGUUAACUUUAAUAAGGAGAUAUAAAUAUGGACAAAGACUGCGAAAUGAAGCGCACCACCCUGGAUAGCCCUCUGGGCAAGCUGGAACUGUCUGGGUGCGAACAGGGCCUGCACCGUAUCAUCUUCCUGGGCAAAGGAACAUCUGCCGCCGACGCCGUGGAAGUGCCUGCCCCAGCCGCCGUGCUGGGCGGACCAGAGCCACUGAUGCAGGCCACCGCCUGGCUCAACGCCUACUUUCACCAGCCUGAGGCCAUCGAGGAGUUCCCUGUGCCAGCCCUGCACCACCCAGUGUUCCAGCAGGGCUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 34(mR-6)

RNA 서열: SNAP(C)_A7_mRNA

GGGUUAACUUUAAUAAGGAGAUAUAAAUAUGGUCGACGAGAGCUUUACCCGCCAGGUGCUGUGGAAACUGCUGAAAGUGGUGAAGUUCGGAGAGGUCAUCAGCUACAGCCACCUGGCCGCCCUGGCCGGCAAUCCCGCCGCCACCGCCGCCGUGAAAACCGCCCUGAGCGGAAAUCCCGUGCCCAUUCUGAUCCCCUGCCACCGGGUGGUGCAGGGCGACCUGGACGUGGGGGGCUACGAGGGCGGGCUCGCCGUGAAAGAGUGGCUGCUGGCCCACGAGGGCCACAGACUGGGCAAGCCUGGGCUGGGUCCUGCAGGCGGAUCCGCGUUUAAACUCGAGGUUAAUGGCUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 35(mR-7)

RNA 서열: SNAP(full)_A7_mRNA

GGGUUAACUUUAAUAAGGAGAUAUAAAUAUGGACAAAGACUGCGAAAUGAAGCGCACCACCCUGGAUAGCCCUCUGGGCAAGCUGGAACUGUCUGGGUGCGAACAGGGCCUGCACCGUAUCAUCUUCCUGGGCAAAGGAACAUCUGCCGCCGACGCCGUGGAAGUGCCUGCCCCAGCCGCCGUGCUGGGCGGACCAGAGCCACUGAUGCAGGCCACCGCCUGGCUCAACGCCUACUUUCACCAGCCUGAGGCCAUCGAGGAGUUCCCUGUGCCAGCCCUGCACCACCCAGUGUUCCAGCAGGAGAGCUUUACCCGCCAGGUGCUGUGGAAACUGCUGAAAGUGGUGAAGUUCGGAGAGGUCAUCAGCUACAGCCACCUGGCCGCCCUGGCCGGCAAUCCCGCCGCCACCGCCGCCGUGAAAACCGCCCUGAGCGGAAAUCCCGUGCCCAUUCUGAUCCCCUGCCACCGGGUGGUGCAGGGCGACCUGGACGUGGGGGGCUACGAGGGCGGGCUCGCCGUGAAAGAGUGGCUGCUGGCCCACGAGGGCCACAGACUGGGCAAGCCUGGGCUGGGUCCUGCAGGCGGAUCCGCGUUUAAACUCGAGGUUAAUGGCUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

실시예 4-1-3 mRNA Display에 의한 재회합 어세이

WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜의 조성에 따라 번역했다.

각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 전술한 식에 따라 Display 분자의 제시율(%)을 계산했다. RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.84μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.

TricinePAGE의 검출은, 형광 표지한 퓨로마이신 링커를 검출했다. TricinePAGE의 결과 얻어진 제시율은 표 7과 같이 되었다.

mRNA 부분에서의 결합을 회피하기 위해서, mRNA 부위의 역전사를 행했다. 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 5), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.

각 Display 분자 단독, 또는 SNAP(N)의 Display 분자와 SNAP(C)의 Display 분자를 등량 혼합한 mixture를, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중, 4℃에서 30분 정치했다. 이 용액에, 1/4양의 5mM DTT, 2500nM의 SNAP-Biotin(New ENGLAND BioLabs사)의 PBS 용액을 가하고, 37℃에서 30분 효소 반응을 행했다.

Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해, 효소 반응에 의해 비오틴화된 Display 분자 혹은 미반응의 SNAP-Biotin을 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, 정제수를 가하고 95℃에서 5분간 인큐베이트하여 핵산의 용출을 행했다.

반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 99), Rv-primer(서열 번호: 10)로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 55℃ 20초, 72℃ 60초 사이클을 50사이클 반복했다.

각 서열에서 검량선을 긋기 위해서, 셀렉션 전에 조제한 각 Display 분자(인풋)를 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.

SNAP-Biotin과의 반응과, 그것에 이어지는 Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 회수된 각 Display 분자의 핵산량을, 반응계 중에 가한 핵산의 이론량으로 나눔으로써 겉보기의 회수율(겉보기의 회수율(%)=회수된 핵산량/가한 핵산량의 이론치×100)을 산출하고, 추가로 제시율로 보정한 「회수율」(회수율(%)=회수된 핵산량/(가한 핵산량의 이론치×제시율×0.01)×100)을, 표 8에 정리했다.

결과, SNAP(full)을 제시한 클론은 SNAP-Biotin의 존재하만 효율적으로 회수되고, 그 밖의 컨트롤과 비교해서 적어도 50배 이상 회수율이 높은 것이 분명해졌다.

이 결과로부터, SNAP(N)을 어떤 표적 단백질에 결합시킨 분자, SNAP(C)를 다른 표적 단백질에 결합시킨 분자, 및 SNAP-Biotin을 사용하면, GFP와 마찬가지로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 효율적인 스크리닝이 가능해지는 것이 나타났다.

실시예 4-2 mRNA Display를 이용한 splitUbiquitin의 재회합 어세이

split 유비퀴틴은 세포내의 단백질간 상호작용 해석에 이용되는 툴이고, 유비퀴틴의 13번째의 Ile를 Ala로 치환(I13A)함으로써, N 말단 분자와 C 말단측 분자가 자연히 회합하지 않는 것이 보고되어 있다.

전술한 대로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 스크리닝하는 경우, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 낮게 억제한 계가 필요해진다. split 유비퀴틴을 이 스크리닝에 이용할 수 있는지를 검증하기 위해서, split 유비퀴틴 N 말단 분자, 혹은 split 유비퀴틴 C 말단 분자만으로는, 항유비퀴틴 항체에 결합하지 않고, 전장체로만 상기 항체에 결합하는 것의 검증 실험을 행했다. 유비퀴틴의 I13A 변이체를 실험에 이용했다. 한편, 본 실시예에서는, C 말단에 GS 링커가 부가된 유비퀴틴 N 말단 단편을 splitUb(N)과, C 말단에 GS 링커가 부가된 유비퀴틴 C 말단 단편을 splitUb(C), splitUb(N)과 splitUb(C)가 GSGS 링커로 연결되고, C 말단에 GS 링커가 부가된 단백질을 splitUb(N-C)라고 표기하는 경우가 있다.

실시예 4-2-1 mRNA의 합성

주형 DNA(서열 번호: 26(D-12)∼서열 번호: 28(D-14))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 36(mR-8)∼서열 번호: 38(mR-10))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.

주형 DNA 서열 번호: 26(D-12)

DNA 서열: splitUb(N)

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

주형 DNA 서열 번호: 27(D-13)

DNA 서열: splitUb(C)

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCATCCCCCCCGACCAGCAGAGGCTCATCTTTGCAGGCAAGCAGCTGGAAGATGGCCGCACTCTTTCTGACTACAACATCCAGAAAGAGTCGACCCTGCACCTGGTCCTGCGCCTGAGGGGTGGCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

주형 DNA 서열 번호: 28(D-14)

DNA 서열: splitUb(N-C)

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCATCCCCCCCGACCAGCAGAGGCTCATCTTTGCAGGCAAGCAGCTGGAAGATGGCCGCACTCTTTCTGACTACAACATCCAGAAAGAGTCGACCCTGCACCTGGTCCTGCGCCTGAGGGGTGGCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

mRNA 서열 번호: 36(mR-8)

RNA 서열: splitUb(N)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 37(mR-9)

RNA 서열: splitUb(C)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAUCCCCCCCGACCAGCAGAGGCUCAUCUUUGCAGGCAAGCAGCUGGAAGAUGGCCGCACUCUUUCUGACUACAACAUCCAGAAAGAGUCGACCCUGCACCUGGUCCUGCGCCUGAGGGGUGGCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 38(mR-10)

RNA 서열: splitUb(N-C)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCAUCCCCCCCGACCAGCAGAGGCUCAUCUUUGCAGGCAAGCAGCUGGAAGAUGGCCGCACUCUUUCUGACUACAACAUCCAGAAAGAGUCGACCCUGCACCUGGUCCUGCGCCUGAGGGGUGGCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

실시예 4-2-2 mRNA Display에 의한 재회합 어세이

각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 전술한 식에 따라 Display 분자의 제시율(%)을 계산했다. RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.42μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.

각 Display 분자의 제시율을 확인하는 경우는, 형광 표지한 퓨로마이신 링커를 이용하고 있어, 형광 검출치를 평가했다. Tricine PAGE의 결과 얻어진 제시율은 표 9와 같이 되었다.

번역 조제한 각 Display 분자를, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 항유비퀴틴 항체(Mouse IgG1 모노클로날 항체; 클론명 FK2) 고정 비즈인, Anti-Multi Ubiquitin mAb-Magnetic Beads(MBL사, #D058-11)와 혼합하고, 실온에서 1시간 반응시켰다.

유비퀴틴 N 말단 단편과 C 말단 단편이 독립할 때의 상호작용도 함께 평가하기 위해, splitUb(N)의 디스플레이 분자와 splitUb(C)의 Display 분자를 1:1로 혼합한 조건도 이와 마찬가지로 행했다.

상청을 제거하고, tTBS(나카라이 테스크)로 수회 세정 후, 상청과 등량의 용출 buffer(1xEx taq buffer, 0.2mM dNTP)를 가하여 현탁하고, 95℃에서 10분간 가열하여, 핵산을 용출했다. 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 5))로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 항유비퀴틴 항체 고정 비즈와 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량을 산출했다.

항유비퀴틴 항체와의 결합에 의해 회수된 각 Display 분자의 핵산량을, 반응계 중과 혼합하기 전에 존재하고 있던 각 Display 분자의 핵산량(인풋의 값)으로 나눈 겉보기의 회수율을 산출하고, 추가로 제시율로 보정한 회수율을 표 10에 정리했다.

겉보기의 회수율(%)=회수된 핵산량/인풋의 핵산량×100

회수율(%)=회수된 핵산량/(인풋의 핵산량×각 제시율×0.01)×100

결과, splitUb(N-C)의 존재하에서는 효율적으로 회수되고, 그 밖의 컨트롤과 비교해서 적어도 16배 이상 회수율이 높은 것이 분명해졌다.

이 결과로부터, split 유비퀴틴(I13A)의 N 말단 분자를 어떤 표적 단백질에 결합시킨 분자, split 유비퀴틴의 C 말단 분자를 다른 표적 단백질에 결합시킨 분자, 및 항유비퀴틴 항체를 사용하면, GFP와 마찬가지로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 효율적인 스크리닝이 가능해지는 것이 나타났다.

실시예 4-3 전하 펩타이드의 상호작용을 이용한 splitUbiquitin의 재회합 어세이

다음으로, splitUb(N)과 splitUb(C)에 각각 전하를 가진 펩타이드 서열(플러스의 전하를 가지는 아미노산을 많이 포함하는 K-peptide(「Kpep」라고 표기하는 경우도 있다.), 혹은 마이너스의 전하를 가지는 아미노산을 많이 포함하는 E-peptide(「Epep」라고 표기하는 경우도 있다.))를 부가한 컨스트럭트(서열 번호: 55(P-11)∼서열 번호: 57(P-13))로 이루어지는 Display 분자를 조제했다. 부가한 펩타이드끼리가 전하에 의해 서로 끌어당기면 splitUb끼리가 근접해서 항유비퀴틴 항체로 회수되고, 반대로 전하에 의해 서로 반발하면 회수되지 않는다. 이것이 검증되면, splitUb에 부가된 분자끼리의 복합체 형성을, 유비퀴틴과 항유비퀴틴 항체를 개재시킨 회수율로 평가하는 것이 가능해진다.

실시예 4-3-1 mRNA의 합성

주형 DNA(서열 번호: 49(D-15)∼서열 번호: 51(D-17))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 52(mR-11)∼서열 번호: 54(mR-13))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.

주형 DNA 서열 번호: 49(D-15)

DNA 서열: Kpep-splitUb(N)

GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGAAAGTGAGCGCGCTGAAAGAAAACGTGAGCGCCCTGAAAGAAAAAGTGAGCGCGCTGACCGAAAAAGTGAGCGCGCTGAAAGAGAAAGTGAGCGCGCTGAAAGAAGGCTCTGGCTCTGGCTCTGGCTCTATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

주형 DNA 서열 번호: 50(D-16)

DNA 서열: Epep-splitUb(N)

GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGAAAGTGAGCGCGCTGGAAAACGAAGTGAGCGCGCTGGAAAAAGAAGTGAGCGTGCTGGAAAAAGAAGTGAGCGCGCTGGAAAAAGAAGTGCGCGCGCTGGAAAAAGGCTCTGGCTCTGGCTCTGGCTCTATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

주형 DNA 서열 번호: 51(D-17)

DNA 서열: Epep-splitUb(C)

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCATCCCCCCCGACCAGCAGAGGCTCATCTTTGCAGGCAAGCAGCTGGAAGATGGCCGCACTCTTTCTGACTACAACATCCAGAAAGAGTCGACCCTGCACCTGGTCCTGCGCCTGAGGGGTGGCGGCTCTGGCTCTGGCTCTGGCTCTAAAGTGAGCGCGCTGGAAAACGAAGTGAGCGCGCTGGAAAAAGAAGTGAGCGTGCTGGAAAAAGAAGTGAGCGCGCTGGAAAAAGAAGTGCGCGCGCTGGAAAAAGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA

mRNA 서열 번호: 52(mR-11)

RNA 서열: Kpep-splitUb(N)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAAAGUGAGCGCGCUGAAAGAAAACGUGAGCGCCCUGAAAGAAAAAGUGAGCGCGCUGACCGAAAAAGUGAGCGCGCUGAAAGAGAAAGUGAGCGCGCUGAAAGAAGGCUCUGGCUCUGGCUCUGGCUCUAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 53(mR-12)

RNA 서열: Epep-splitUb(N)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAAAGUGAGCGCGCUGGAAAACGAAGUGAGCGCGCUGGAAAAAGAAGUGAGCGUGCUGGAAAAAGAAGUGAGCGCGCUGGAAAAAGAAGUGCGCGCGCUGGAAAAAGGCUCUGGCUCUGGCUCUGGCUCUAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

mRNA 서열 번호: 54(mR-13)

RNA 서열: Epep-splitUb(C)

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAUCCCCCCCGACCAGCAGAGGCUCAUCUUUGCAGGCAAGCAGCUGGAAGAUGGCCGCACUCUUUCUGACUACAACAUCCAGAAAGAGUCGACCCUGCACCUGGUCCUGCGCCUGAGGGGUGGCGGCUCUGGCUCUGGCUCUGGCUCUAAAGUGAGCGCGCUGGAAAACGAAGUGAGCGCGCUGGAAAAAGAAGUGAGCGUGCUGGAAAAAGAAGUGAGCGCGCUGGAAAAAGAAGUGCGCGCGCUGGAAAAAGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA

실시예 4-3-2 mRNA Display에 의한 재회합 어세이

각 Display 분자의 제시율을 확인하는 경우는, 형광 표지한 퓨로마이신 링커를 이용하여, 형광 검출치를 평가했다. TricinePAGE의 결과 얻어진 제시율은 표 11과 같이 되었다.

조건 1에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Kpep-splitUb(N)의 Display 분자, Epep-splitUb(C)의 Display 분자를 각각 0.2μM이 되도록 가하고, 실온에서 1시간 반응시켰다.

조건 2에서는 Epep-splitUb(N)의 Display 분자, Epep-splitUb(C)의 Display 분자를 각각 0.2μM, 조건 3에서는 Kpep-splitUb(N)의 Display 분자를 0.4μM, 조건 4에서는 Epep-splitUb(N)의 Display 분자를 0.4μM, 조건 5에서는 Epep-splitUb(C)의 Display 분자를 0.4μM이 되도록 가한 점을 제외하고, 조건 1과 마찬가지의 조건에서 반응시켰다.

항유비퀴틴 항체 고정 비즈인, Anti-Multi Ubiquitin mAb-Magnetic(MBL사, #D058-11)과 혼합하고, 실온에서 30분 반응시켰다.

상청을 제거하고, tTBS(나카라이 테스크)로 수회 세정 후, 상청과 등량의 용출 buffer(1xEx taq buffer, 0.2mM dNTP)를 가하여 현탁하고, 95℃에서 5분간 가열하여, 핵산을 용출했다. 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 5))로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 항유비퀴틴 항체 고정 비즈와 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량을 산출했다.

항유비퀴틴 항체에 의해 회수된, 핵산의 회수율을, 인풋의 값(어세이에 반입한 Display 분자의 양)으로 나눈 회수율을 이하의 식으로부터 산출하고, 표 12에 정리했다.

겉보기의 회수율(%)=회수된 핵산량/인풋의 핵산량×100

결과, Kpep-splitUb(N)과 Epep-splitUb(C)가 갖추어진 조건(조건 1)에서만 회수율이 높았다. 이것으로부터, splitUb(N)과 splitUb(C)에 부가된 분자끼리가 상호작용하여, 복합체를 형성하는 경우만, splitUb(N)과 splitUb(C)가 근접하여, 항유비퀴틴 항체에 의해, 회수할 수 있는 것이 증명되었다.

실시예 4-4 mRNA Display를 이용한 split Nanoluc의 재회합 어세이

Nanoluc는 10개의 β 스트랜드로 이루어지는 발광 단백질이고, 이것을 1-8번째의 β 스트랜드, 9번째의 β 스트랜드, 10번째의 β 스트랜드로 3분할하여, 친화성을 조정함으로써, PPI를 발광으로 검출하기 위한 split Nanoluc 시스템이 보고되어 있다. 본 시스템에서는 전술한 split GFP 시스템과 마찬가지로, PPI를 검출하고자 하는 2종류의 단백질에 대해, 9번째의 스트랜드 및 10번째의 스트랜드를 결합시킨다. 9번째 내지 10번째의 스트랜드 단체와 1-8번째의 스트랜드를 혼합해서 기질을 가해도 발광은 관측할 수 없는 한편, 이 2개의 단백질이 근접했을 때만 나머지1-8번째의 β 스트랜드와 복합체를 형성하고, 기질을 첨가함으로써 발광을 관측할 수 있기 때문에, wash free의 ELISA 등으로의 이용이 이루어지고 있다. 한편으로, 9번째 및 10번째의 스트랜드 단체가 1-8번째의 스트랜드와 어느 정도 결합할지에 관해서는 분명해져 있지 않아, 선택적 풀다운에 이용할 수 있을지는 검증이 필요했다.

그래서, 9번째와 10번째의 스트랜드를 링커로 연결한 분자는 1-8번째의 스트랜드를 이용함으로써 풀다운 가능한 한편, 9번째 내지 10번째의 스트랜드 단체, 내지 이 양자를 단순히 혼합한 경우에는 1-8번째의 스트랜드에서는 풀다운할 수 없는 것을 검증했다. 이 가설이 검증되면, 목적물의 선택적 풀다운이 가능해진다. 한편, 본 실시예에서는, N 말단에 Avi 태그 서열 및 His 태그 서열이 부가된 Nanoluc의 1-8번째의 스트랜드를 splitNanoluc1-8, C 말단에 GS 링커 및 TEV 프로테아제 인식 서열이 부가된 9번째의 스트랜드를 splitNanoluc-9, C 말단에 GS 링커 및 TEV 프로테아제 인식 서열이 부가된 10번째의 스트랜드를 splitNanoluc-10, splitNanoluc-9와 splitNanoluc-10이 GS 링커로 연결되고, C 말단에 GS 링커 및 TEV 프로테아제 인식 서열이 부가된 단백질을 splitNanoluc9-10으로 표기하는 경우가 있다.

실시예 4-4-1 비오틴화 splitNanoluc1-8 단백질의 조제

벡터 조제

pET-15b 벡터에, 서열 번호: 58(D-18)의 합성 DNA를 Nco1/BamH1의 제한 효소를 사용하여 삽입한 발현 벡터를 조제했다.

합성 DNA 서열 번호: 58(D-18)

DNA 서열:

CCATGGGCCTGAACGATATTTTTGAAGCGCAGAAGATTGAGTGGCACGAACACCATCATCATCATCACGGTGGTAGCAGCGTGTTCACCCTGGAGGACTTTGTTGGCGATTGGGAACAGACCGCGGCGTACAACCTGGACCAGGTGCTGGAGCAAGGTGGCGTTAGCAGCCTGCTGCAGAACCTGGCGGTGAGCGTTACCCCGATCCAACGTATTGTTCGTAGCGGCGAGAACGCGCTGAAGATCGACATTCACGTGATCATTCCGTATGAAGGCCTGAGCGCGGATCAGATGGCGCAAATCGAGGAAGTGTTCAAGGTGGTTTACCCGGTTGACGATCACCACTTTAAAGTGATCCTGCCGTATGGTACCCTGGTGATTGACGGCGTTACCCCGAACATGCTGAACTACTTCGGTCGTCCGTATGAAGGCATCGCGGTTTTTGATGGTAAGAAAATTACCGTTACCGGCACCCTGTGGAACGGCAACAAGATTATTGACGAACGCCTGATTACCCCGGACTAATGAGGATCC

단백질 발현 및 정제

대장균 SHuffle T7 Express Competent E.coli(NEW ENGLAND BioLabs, Cat.No C3029H)를, splitNanoluc 발현 벡터와, pACYC184 벡터에 대장균 BirA 유전자를 도입한 BirA 발현 벡터로 형질 전환하여, 발현주를 구축했다.

구축한 대장균 발현주를 배지 A(LB 배지(invitrogen, #12780-052), 100μg/mL 암피실린, 50μg/mL 스펙티노마이신 이염산염, 34μg/mL 클로람페니콜)에서 OD600=0.5가 될 때까지 배양한 후, 빙수에 플라스크를 5분 침지하여, 4℃까지 배양액의 온도를 낮췄다. 200μM IPTG(아이소프로필-β-싸이오갈락토피라노사이드), 50μM Biotin이 되도록 가하고, 16℃, 200rpm으로 하룻밤 배양함으로써 비오틴화 수식을 받은 목적 단백질을 발현시켰다. 배양균체는 원심에 의해 회수하고, 액체 질소로 동결한 후, -80℃에서 보존했다.

동결균체를 extraction buffer(50mM 인산 수소 나트륨 pH 7.5, 500mM NaCl, ProteinaseInhibitorCocktail(EDTA-free))를 이용하여 현탁하고, 5k U/E.coli가 되도록 rLysozyme(Novagen, #71110-3)을 첨가한 후, 실온에서 20분 방치했다. 재차 현탁하고, 초음파 파쇄한 후, 1M MgCl₂를 0.2%v/v가 되도록, 25U/μL benzonase(EMD Millipore, #70746-2.5KUN)를 0.03%v/v가 되도록 가하고, 재차 실온에서 20분 정치했다. 샘플을 원심하여 회수한 상청을, 0.22μm 필터로 여과했다.

여과한 샘플을, HisTrap HP 1mL(GE Healthcare, #17-5247-01)를 사용하여 정제했다.

정제 샘플을 회수 후, Streptavidin Mutein Matrix(Roche, #03708152001)를 이용하여 정제했다. 목적 단백질을 포함하는 프랙션을 회수하고, Amicon Ultra-15 10K(MERCK, #UFC801024)에 의해, 1/10 volume이 되도록 농축했다.

농축 샘플을, 겔 여과 정제했다. 겔 여과 정제의 Running buffer로서, 50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0을 이용했다.

SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다. 또한, 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다.

실시예 4-4-2 mRNA Dispaly를 이용한 split Nanoluc의 재회합 어세이

복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 스크리닝하는 경우, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 낮게 억제한 계가 필요해진다.

그래서, splitNanoluc-9(서열 번호: 66), splitNanoluc-10(서열 번호: 67), 및 splitNanoluc9-10 연결체(서열 번호: 65) 각각의, splitNanoluc1-8(서열 번호: 85)에 대한 결합능을 평가했다. splitNanoluc-9, splitNanoluc-10, 및 splitNanoluc9-10 연결체의 각각에 핵산을 연결시킨 Display 분자를 조제하고, 이들을 splitNanoluc1-8과 인큐베이트하고, splitNanoluc1-8에 결합한 분자의 핵산 부분을 qPCR했다.

(1) mRNA의 합성

주형 DNA(서열 번호: 59(D-19)∼서열 번호: 61(D-21))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 62(mR-14)∼서열 번호: 64(mR-16))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.

주형 DNA 서열 번호: 59(D-19)

DNA 서열: splitNanoluc9-10

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCAGCATGCTGTTTCGTGTGACCATTAACAGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGGCGTGAGCGGCTGGCGTCTGTTTAAAAAAATTAGCGGTTCTGGTTCTGGTTCTGGTTCTGAAAACCTGTATTTTCAGGGCAAAAAAA

주형 DNA 서열 번호: 60(D-20)

DNA 서열: splitNanoluc-9

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCAGCATGCTGTTTCGTGTGACCATTAACAGCGGTTCTGGTTCTGGTTCTGGTTCTGAAAACCTGTATTTTCAGGGCAAAAAAA

주형 DNA 서열 번호: 61(D-21)

DNA 서열: splitNanoluc-10

GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGTGAGCGGCTGGCGTCTGTTTAAAAAAATTAGCGGTTCTGGTTCTGGTTCTGGTTCTGAAAACCTGTATTTTCAGGGCAAAAAAA

mRNA 서열 번호: 62(mR-14)

splitNanoluc9-10 RNA 서열:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAGCAUGCUGUUUCGUGUGACCAUUAACAGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGGCGUGAGCGGCUGGCGUCUGUUUAAAAAAAUUAGCGGUUCUGGUUCUGGUUCUGGUUCUGAAAACCUGUAUUUUCAGGGCAAAAAAA

mRNA 서열 번호: 63(mR-15)

splitNanoluc-9 RNA 서열:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAGCAUGCUGUUUCGUGUGACCAUUAACAGCGGUUCUGGUUCUGGUUCUGGUUCUGAAAACCUGUAUUUUCAGGGCAAAAAAA

mRNA 서열 번호: 64(mR-16)

splitNanoluc-10 RNA 서열:

GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGUGAGCGGCUGGCGUCUGUUUAAAAAAAUUAGCGGUUCUGGUUCUGGUUCUGGUUCUGAAAACCUGUAUUUUCAGGGCAAAAAAA

(2) mRNA Display에 의한 재회합 어세이

mRNA와 펩타이드가 연결된 Display 분자를 조제하고, 비오틴화 splitNanoluc1-8에 의한 회수율을 조사했다. WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜에 따라 번역했다.

TricinePAGE의 검출은, 형광 표지한 퓨로마이신 링커를 검출했다. TricinePAGE의 결과 얻어진 제시율은 표 14와 같이 되었다.

재회합 어세이에 사용할 때는, 형광 표지가 없는 퓨로마이신 링커를 사용하고, 번역 산물은, mRNA 부분에서의 결합을 회피하기 위해서 역전사를 행했다. 구체적인 방법으로서는, 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 68), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.

각 Display 분자를, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 33nM의 Display 분자에 대해서, 1μM의 비오틴화 splitNanoluc1-8을 가하여 혼합하고, 실온에서 1시간 반응시켰다.

Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 splitNanoluc1-8 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, splitNanoluc-9 혹은 splitNanoluc-10과 연결한 스스로를 코드하는 mRNA 부분 사이에 도입한 TEV 프로테아제 인식 서열을 인식하는 TEV 프로테아제에 의해 절단하여 핵산의 용출을 행했다. 구체적인 TEV 용출액은, 1xTEV buffer, 1mM DTT, 0.2U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 68))로 qPCR을 걸었다. qPCR의 반응액은, 1x Ex taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 비오틴화 splitNanoluc1-8과 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량을 산출했다.

splitNanoluc1-8과의 결합에 의해 회수된 각 Display 분자의 핵산량을, splitNanoluc1-8과 혼합하기 전에 존재하고 있던 각 Display 분자의 핵산량(인풋의 값)으로 나눈 겉보기의 회수율을 산출하고, 추가로 제시율로 보정한 회수율을, 표 15에 정리했다.

겉보기의 회수율(%)=회수된 핵산량/인풋의 핵산량×100

결과, splitNanoluc1-8에 의해 splitNanoluc9-10의 연결체가 회수되고, splitNanoluc-9 단독, 혹은 splitNanoluc-10 단독의 회수율은, 연결체의 회수율에 비해 300배 이상 낮은 것이 나타났다. 즉, Nanoluc1-8은 Nanoluc-9(또는 Nanoluc-10)의 비존재하에서는 Nanoluc-10(또는 Nanoluc-9)과 회합하지 않는 것, Nanoluc1-8이 Nanoluc-9 및 Nanoluc-10과 회합하기 위해서는 Nanoluc-9와 Nanoluc-10이 근접, 회합 혹은 상호작용하고 있을 것이 필요하다는 것이 나타났다. 이 결과로부터, splitNanoluc-9를 어떤 표적 단백질에 결합시킨 분자, splitNanoluc-10에 다른 표적 단백질에 결합시킨 분자, 및 splitNanoluc1-8을 사용하면, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 효율적인 스크리닝이 가능해지는 것이 나타났다.

실시예 5 펩타이드 라이브러리 중의 라파마이신-핵산 농축 검증 실험

전술한, GFP의 재회합을 이용한 라파마이신 회수 검증 실험에 있어서, GFP10, GFP11, GFP1-9의 삼자를 이용하여 효율적으로 라파마이신을 회수할 수 있는 것이 나타났다. 그래서, 펩타이드 디스플레이 라이브러리에 라파마이신-핵산(화합물 nk04)을 1/(1×10의 3승), 혹은 1/(1×10의 6승)의 비율이 되도록 혼합한, 혼합 라이브러리를 조제하고, 1라운드의 mRNA Display의 패닝 조작을 행함으로써, 목적하는 라파마이신-핵산이 농축되는지를 검증했다.

펩타이드 디스플레이 라이브러리의 조제

번역에 사용하는 아실화 tRNA의 합성

WO2013/100132에 기재된 수법으로 패닝에 사용하는 아실화 tRNA를 조제했다. WO2018/225864에 기재된 MeHnl7F2, S3F5MePyr, MeSnPr, MeA3Pyr, F3Cl, Pic2, MeG, Nle, MeStBuOH, SNtBuAca, SiPen, nBuG, MeHph, SPh2C, Ala(4-Thz)를 포함하는 15종류의 아미노산을 이용하여, Elongator 아미노아실화 tRNA 혼합물을 조제했다. 각각의 아실화 tRNA의 번역액 중의 최종 농도는 10μM∼20μM이었다. Pnaz 보호의 pCpA 아미노산은, 탈보호를 실시하지 않고서 페놀 추출 이후의 작업을 행했다. Initiator 아미노아실화 tRNA는, WO2017/150732에 기재된 화합물 AAtR-3(Acbz-MeCys(StBu)-tRNAfMetCAU)와 동일 화합물이고, 최종 농도가 25μM이 되도록 번역액 중에 첨가하여 이용했다.

펩타이드 화합물 라이브러리를 코드하는 랜덤화된 2본쇄 DNA 라이브러리

WO2013/100132에 기재된 수법으로 DNA 라이브러리를 구축했다. TTT, TTG, CTT, ATT, ATG, GTT, CCG, ACT, GCT, CAT, CAG, AAC, GAA, TGG, CGG, AGT, AGG, GGT, CTG, GTG, TCT, TCG, TGC, CGT를 포함하는 24종류의 트리플렛이 랜덤으로 8회 내지 9회 반복해서 출현하는 것을 준비했다.

번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PURE system을 이용했다. 구체적으로는, 1mM의 GTP, 1mM의 ATP, 20mM의 크레아틴 인산, 50mM의 HEPES-KOH pH 7.6, 100mM의 아세트산 칼륨, 10mM의 아세트산 마그네슘, 2mM의 스페르미딘, 1mM의 다이싸이오트레이톨, 1mg/mL E.coli MRE600(RNase 네거티브) 유래 tRNA(Roche사)(비특허문헌: Yokogawa T et al. 2010에 기재된 방법으로, 일부의 tRNA를 제거하고 있다), 4μg/mL의 크레아틴 키나아제, 3μg/mL의 미오키나아제, 2unit/mL의 무기 파이로포스파타아제, 1.1μg/mL의 뉴클레오타이드 이인산 키나아제, 0.26μM의 EF-G, 2.7μM의 IF1, 0.4μM의 IF2, 1.5μM의 IF3, 40μM의 EF-Tu, 35μM의 EF-Ts, 1.2μM의 리보솜, 2.73μM의 AlaRS, 1μM의 GlyRS, 0.4μM의 IleRS, 0.5μM의 변이체 PheRS(WO2016/148044), 0.16μM의 ProRS, 1μM의 변이체 SerRS(WO2016/148044), 0.09μM의 ThrRS, 1μM의 변이체 ValRS(WO2016/148044), 0.11μM의 LysRS, 0.5μM의 HisRS, 3μM의 in vitro 전사 대장균 tRNA Ala1B, 250μM의 글라이신, 100μM의 아이소류신, 250μM의 프롤린, 250μM의 트레오닌, 250μM의 라이신, 5mM의 N-메틸발린, 5mM의 N-메틸세린, 5mM의 N-메틸알라닌, 5mM의 N-메틸페닐알라닌, 1mM Ala(4-Thz), Elongator 아미노아실화 tRNA 혼합물, 25μM Initiator 아미노아실화 tRNA(WO2020/138336A1), 0.5μM Penicillin G Amidase(PGA), 1μM의 EF-P-Lys, 전술한 2본쇄 DNA 라이브러리로부터 WO2013/100132에 따라 조제한 mRNA-퓨로마이신 연결체를 1μM이 되도록 번역 반응 혼합물에 첨가하고, 37℃에서 1시간 정치함으로써 번역을 행했다.

번역한 라이브러리에 대해서, 핵산의 분자수로서 1/(1×10의 3승)의 비율이 되도록 라파마이신-핵산(화합물 nk04)을 가한 혼합물을 혼합 라이브러리 A, 마찬가지로 1/(1×10의 6승)의 비율이 되도록 라파마이신-핵산(화합물 nk04)을 가한 혼합물을 혼합 라이브러리 B로서 조제했다. 혼합 라이브러리 A와 혼합 라이브러리 B를 사용하여, WO2013/100132를 모방하여 패닝을 1라운드 실시했다.

조건 1에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 2μM Hisx6-FKBP12-Link12-GFP11, 2μM GFP10-Link12-FRB-Hisx6, 1μM 비오틴화 GFP1-9에 대해서, 혼합 라이브러리 A를 0.3μM이 되도록 가하고, 실온에서 1.5시간 반응시켰다.

조건 2에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 2μM Hisx6-FKBP12-Link12-GFP11, 2μM GFP10-Link12-FRB-Hisx6, 1μM 비오틴화 GFP1-9에 대해서, 혼합 라이브러리 B를 0.3μM이 되도록 가하고, 실온에서 1.5시간 반응시켰다.

Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, GFP1-9와 비오틴 사이에 도입한 TEV 프로테아제 인식 서열을 인식하여 절단하는 TEV 프로테아제에 의해 처리하여 핵산의 용출을 행했다. 구체적인 TEV 용출액으로서, 1xTEV buffer, 1mM DTT, 0.2U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 라이브러리 A(혹은 B)의 전체 서열(화합물 nk04의 부가 핵산 서열을 포함한다)에 상보성을 가지는 프라이머(Fw-primer(서열 번호: 117), Rv-primer(서열 번호: 118))로 PCR한 후, 그 PCR 산물의 qPCR을 행하고, 라이브러리의 서열의 평가를 행했다. 단, 화합물 nk04 부가 핵산 서열과 그것 이외의 라이브러리 유래의 서열에서 동 프라이머를 사용했을 때의 PCR 증폭 효율에 차가 없는 것은 확인되어 있다(데이터를 나타내지 않는다). qPCR의 프라이머에는, 전술한 프라이머(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 6)) 혹은 화합물 nk04의 부가 핵산 서열에만 상보성을 가지는 프라이머((Fw-primer(서열 번호: 69), Rv-primer(서열 번호: 70))를 사용했다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.

각 서열에서 검량선을 긋기 위해서, 인풋 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.

화합물 nk04의 핵산의 회수율과, 라이브러리 A(혹은 B)의 전체 핵산 회수율을 비교함으로써, 패닝을 1라운드 행한 후의 라이브러리 중의 화합물 nk04의 분자 농도(%)를 이하의 식에 의해 산출했다(표 16).

화합물 nk04의 분자 농도(%)=화합물 nk04 부가 핵산 서열 핵산 농도(분자수/μL)/라이브러리의 핵산 농도(분자수/μL)×100

결과, 패닝 실시 전후로, 라이브러리 중의 화합물 nk04의 분자 농도가 400∼3000배가 되어 있고, splitGFP를 사용한 mRNA display panning에 의해, 2개의 표적을 인식하는 분자가 효율적으로 농축되는 것이 나타났다.

실시예 6 splitGFP 기술을 사용한 bispecific 분자의 패닝

전술한 대로, 펩타이드 디스플레이 라이브러리와 혼합한 라파마이신-핵산을, GFP의 재회합에 의해 농축하는 것이 나타났다. 다음으로, 1x10의 12승으로 이루어지는 펩타이드 디스플레이 라이브러리로부터, 동 수법으로, 2개의 표적 단백질에 결합하는 펩타이드를 취득 가능한지, mRNA 디스플레이 패닝을 행하여 검증했다.

패닝의 1라운드째에서는, 비즈에 편측의 표적 단백질의 비오틴화체를 고정하고, 다른 편측의 표적 단백질을 유리된 상태로 존재시켜 셀렉션을 행했다. 2라운드째에서는, 비즈에 고정하는 비오틴화 표적 단백질과 유리된 표적 단백질을 바꿔 넣고, 셀렉션했다.

3라운드째 이후는, GFP10 및 GFP11에 각각의 표적 단백질을 결합시킨 융합 단백질을 조제하고, 이들 2개의 융합 단백질과, 비오틴화 GFP1-9의 존재하에서 셀렉션을 행했다.

실시예 6-1 패닝 표적 단백질의 조제

패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 GTPase KRas(KRAS)를 이용했다. C 말단에 소르타제 인식 서열(LPXTG 서열(X는 임의의 아미노산)(서열 번호 116)), His 태그, TEV 프로테아제 절단 태그, 비오틴화 효소 인식 태그를 부가한, KRAS-FLAGSorHisTEV-Bio(서열 번호 100)를 조제했다.

구체적으로는, 발현 벡터에 pET21a(+)를 이용하여 대장균 BL2(DE3)을, 비오틴 리가아제(BirA) 발현 벡터와 함께, 형질 전환하여 발현주를 작성했다. OD600이 0.7이 될 때까지, 암피실린과 클로람페니콜이 함유된 LB 배지에서 배양하고, 1mM의 IPTG로 유도를 걸고, 0.1mM의 biotin 존재하에서, 30℃에서 5시간 배양했다. 회수한 가용성 분획을 Ni Sepharose High Performance(GE)를 이용하여 정제하고, 그 후, Streptavidin Mutein Matrix(Roche)를 이용하여 정제했다. 정제는, 각각 제품에 첨부된 기본 프로토콜에 따라 행했다. Superdex 75 Increase 10/300 GL(GE)을 이용하여, 사이즈 분획 크로마토그래피를 행하고, 정제한 최종 산물을, 보존 buffer(25mM HEPES, 150mM NaCl, 1mM MsCl₂, 1mM DTT, 10% Glycerol, pH 7.6)에 넣고, -80℃에서 보존했다.

SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다. SEC 분석의 결과, 목적 단백질이 이론치 부근의 분자량 마커와 동일한 정도의 유지 시간을 나타내고, 또한 단량체로서 존재하고 있는 것을 확인했다. SEC 분석의 칼럼에는, TSKgel G2000SWXL(TOSOH, #08540)을 사용했다.

패닝에 사용하는 표적 단백질로서, N 말단에 정제 태그, thronbin 절단 사이트를 부가한, HAT-KRAS-nonbio(서열 번호 101)를 조제했다.

구체적으로는, 발현 벡터에 pETBlue1을 이용하여, 대장균 Tuner(DE3)pLacI(Novagen)을 형질 전환하여 발현주를 작성했다. OD600이 0.6이 될 때까지, 암피실린이 함유된 LB 배지에서 배양하고, 0.1mM의 IPTG로 유도를 걸고, 30℃에서 하룻밤 배양했다. 회수한 가용성 분획을 Ni Sepharose excel(GE healthcare)을 이용하여 기본 프로토콜에 따라 정제했다. HiLoad 26/600 Superdex 75 pg(GE healthcare)를 이용하여, 사이즈 분획 크로마토그래피를 행하고, 정제한 최종 산물을 보존 buffer(20mM HEPES, 100mM NaCl, 1mM DTT, 5mM MgCl₂, pH 8.0)에 넣고, -80℃에서 보존했다.

SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다.

패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 글루타티온 S-트랜스퍼라아제(GST)를 이용했다. C 말단에 정제 태그, TEV 프로테아제 절단 태그, 비오틴화 효소 인식 태그를 부가한, GST-HisTEVAvi(서열 번호 103)를 조제했다.

구체적으로는, 발현 벡터에 pGEX-4T-1을 이용하여, 대장균 BL21 star(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 1.2가 될 때까지, TB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, 37℃에서 4시간 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 제품에 첨부된 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.

전술에서 조제한 GST-HisTEV-Avi를 비오틴 존재하에서 비오틴 리가아제(BirA)에 의해 처리하여, GST-HisTEV-Bio(서열 번호 102)를 얻었다.

BirA를 대장균으로 조제·정제했다. 구체적으로는, 발현 벡터에 pET30a를 이용하여, 대장균 BL21(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 4가 될 때까지, 암피실린이 함유된 TB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, 15℃에서 16시간 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.

비오틴화 반응액은, 46mM Tris HCl pH 8.3, 9mM Mg(OAc)2, 35μM biotin, 0.825μM BirA, 30.5μM GST-HisTev-Avi가 되도록 조제하고, 실온에서 1시간 정치했다. 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다.

패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 글루타티온 S-트랜스퍼라아제(GST)를 이용했다. C 말단에 정제용 His 태그, 소르타제 인식 서열을 부가한, GST-SorAHis(서열 번호 104)를 조제했다.

구체적으로는, 발현 벡터에 pGEX-4T-1을 이용하여, 대장균 BL21 Star(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 1.2가 될 때까지, 암피실린이 함유된 LB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, 15℃에서 하룻밤 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 제품에 첨부된 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.

패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 FKBP12를 이용했다. C 말단에 정제 태그, TEV 프로테아제 절단 태그, 비오틴화 효소 인식 태그를 부가한, FKBP-HisTEVAvi(서열 번호 114)를 조제했다. 구체적으로는, 발현 벡터에 pET11a를 이용하여, 대장균 BL21(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 0.5가 될 때까지, 암피실린이 함유된 LB 배지에서 배양하고, 1.0mM의 IPTG로 유도를 걸고, 37℃에서 3시간 배양했다. 회수한 가용성 분획을 His Trap FF(Cytiva)를 이용하여 제품에 첨부된 기본 프로토콜에 따라 정제하여, Amicon Ultra-15 10k cut(Merck Millipore)로 농축하고 0.22μm filter 처리한 것을, Superdex 75pg column(Cytiva)에 의해 SEC 정제했다. 보존 buffer(50mM Tris, pH 7.5, 150mM NaCl, 1mM TCEP)에 넣고, -80℃에서 보존했다.

전술에서 조제한 FKBP-HisTEV-Avi를 비오틴 존재하에서 비오틴 리가아제(BirA)에 의해 처리하여, FKBP-HisTEV-Bio(서열 번호 115)를 얻었다. 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다.

전술한 조제 단백질의 서열을 아래 표에 나타낸다. 「K^*」는, 비오틴화된 Lys를 나타내고 있다.

실시예 6-2: GFP10 또는 GFP11이 연결된 표적 단백질의 조제

상기 방법에 의해 조제한 C 말단에 소르타제 인식 서열을 포함하는 KRAS-SorHisTEVAvi와 GST-SorAHis의 컨스트럭트에 대해, LPXTG 서열(X는 임의의 아미노산)을 인식하는 트랜스펩티다아제인 eSrtA를 이용한 소르타제 반응에 의해 GFP10 또는 GFP11을 부가하여, 융합 단백질을 조제했다.

실시예 6-2-1 Sortase A pentamutant (eSrtA)의 조제

비특허문헌 Proc. Natl. Acad. Sci. USA. 2011 Jul 12;108(28):11399-11404.의 방법에 준하여, eSrtA를 대장균으로 발현시켜, 정제했다. 한편, 여기에서 합성한 소르타제 A는 야생형이 아니라, 보다 고활성인 P94R/D160N/D165A/K190E/K196T 오중 변이체(Sortase A pentamutant(eSrtA))이다(서열 번호: 105).

실시예 6-2-2 tri-Gly 부가 GFP 펩타이드의 합성

N 말단에 소르타제의 기질이 되는 Gly-Gly-Gly를 포함하는 GFP 펩타이드(Sor-sp11-L12, 서열 번호: 106 및 Sor-sp10-12, 서열 번호: 107)를, 고상 합성법에 의한 통상적 방법에 의해 합성했다.

실시예 6-2-3 소르타제 반응에 의한, 표적 단백질에의 GFP10 또는 GFP11의 부가

KRAS와 GFP10을 연결한 융합 단백질(KRAS-sp10, 아미노산 서열의 서열 번호: 109), KRAS와 GFP11을 연결한 융합 단백질(KRAS-sp11, 아미노산 서열의 서열 번호: 108), GST와 GFP10을 연결한 연결 단백질(GST-sp10, 아미노산 서열의 서열 번호: 110)의 조제를 행했다.

구체적으로는, 반응 Buffer(0.05M Tris-HCl(pH 7.5), 0.15M NaCl, 10mM CaCl2) 중, 40μM KRAS-SorTEVHisAvi, 1mM Sor-sp10-12(혹은, 1mM Sor-sp11-L12), 1μM eSrtA를 빙상에서 혼합하고, 4℃에서 하룻밤 인큐베이트했다. 반응 후의 액에 20mM의 EDTA를 가하여 반응을 정지시켰다.

마찬가지로, GSTSorAHis에 대해서도 마찬가지의 반응액을 조제하고, GFP10을 부가했다. 반응은, 37℃에서 2시간 인큐베이트했다.

소르타제 반응의 전후의 샘플을 SDS-PAGE 분석하고, 목적 단백질의 이론 분자량에 대응하는 겔 시프트를 확인함으로써, 반응이 정상적으로 진행된 것을 확인했다. 이들 반응으로 얻어진 표적 단백질의 전장 서열을 아래 표에 나타낸다.

실시예 6-3 펩타이드 디스플레이 라이브러리의 조제

실시예 6-3-1 번역에 사용하는 아실화 tRNA의 합성

WO2018/143145 및 WO2018/225864에 기재된 수법에 준하여 패닝에 사용하는 아실화 tRNA를 조제했다. Pro(4-pip-4-F2), Asp(SMe), Hph(3-Cl), cisPro(4-pip-4-F2), MeHnl(7-F2), Ser(3-F-5-Me-Pyr), MeSer(nPr), MeAla(3-Pyr), Phe(3-Cl), Pic(2), MeGly, Nle, MeSer(tBuOH), Ser(NtBu-Aca), Ser(iPen), nBuGly, MeHph, Ser(Ph-2-Cl)을 포함하는 19종류의 아미노산을 이용하여, Elongator 아미노아실화 tRNA 혼합물을 조제했다. 각각의 아실화 tRNA의 번역액 중의 최종 농도는 10μM∼20μM이었다. Pnaz 보호의 pCpA 아미노산은, 탈보호를 실시하지 않고서 페놀 추출 이후의 작업을 행한 Initiator 아미노아실화 tRNA는, WO2020/138336에 기재된 화합물 AAtR-18(BdpFL-Phe-tRNA(fMet)cau)과 동일 화합물이고, 최종 농도가 25μM이 되도록 번역액 중에 첨가하여 이용했다.

실시예 6-3-2 펩타이드 라이브러리를 코드하는 랜덤화된 2본쇄 DNA 라이브러리

WO2013/100132에 기재된 수법에 준하여, DNA 라이브러리를 구축했다. TTT, TTG, CTT, CTG, ATT, ATG, GTT, GTG, TCT, TCG, CCG, ACT, GCT, TAC, CAT, CAG, AAC, GAT, GAG, TGC, TGG, CGT, CGG, AGT, AGG, GGT의 26종류의 트리플렛이 랜덤으로 8회 내지 9회 반복해서 출현하는 것을 준비했다.(서열 번호: 111, 119)

DNA 라이브러리(서열 번호: 111)

GTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATG(Random_triplet)₉TAGCCGACCGGCACCGGCACCGGCAAAAAAA

DNA 라이브러리(서열 번호: 119)

GTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATG(Random_triplet)₈TAGCCGACCGGCACCGGCACCGGCAAAAAAA

실시예 6-3-3 펩타이드 디스플레이 라이브러리의 번역

번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PURE system을 이용했다. 구체적으로는, 1mM의 GTP, 1mM의 ATP, 20mM의 크레아틴 인산, 50mM의 HEPES-KOH pH 7.6, 100mM의 아세트산 칼륨, 1mM의 아세트산 마그네슘, 2mM의 스페르미딘, 1mM의 다이싸이오트레이톨, 1mg/mL E.coli MRE600(RNase 네거티브) 유래 tRNA(Roche사)(비특허문헌: Yokogawa T et al. 2010에 기재된 방법으로, 일부의 tRNA를 제거하고 있다), 4μg/mL의 크레아틴 키나아제, 3μg/mL의 미오키나아제, 2unit/mL의 무기 파이로포스파타아제, 1.1μg/mL의 뉴클레오타이드 이인산 키나아제, 0.26μM의 EF-G, 2.7μM의 IF1, 0.4μM의 IF2, 1.5μM의 IF3, 40μM의 EF-Tu, 59μM의 EF-Ts, RNasein 0.4U/μL, 1.2μM의 리보솜, 1μM의 EF-P-Lys, 2.73μM의 AlaRS, 1μM의 GlyRS, 0.4μM의 IleRS, 0.5μM의 변이체 PheRS(WO2016/148044), 0.16μM의 ProRS, 1μM의 변이체 SerRS(WO2016/148044), 0.09μM의 ThrRS, 1μM의 변이체 ValRS(WO2016/148044), 0.11μM의 LysRS, 3μM의 in vitro 전사 대장균 tRNA Ala1B, 250μM의 글라이신, 100μM의 아이소류신, 250μM의 프롤린, 250μM의 트레오닌, 250μM의 라이신, 5mM의 N-메틸발린, 5mM의 N-메틸세린, 5mM의 N-메틸알라닌, 5mM의 N-메틸페닐알라닌, Elongator 아미노아실화 tRNA 혼합물, 25μM Initiator 아미노아실화 tRNA(WO2017/150732에 기재된 화합물 AAtR-3(Acbz-MeCys(StBu)-tRNAfMetCAU)), 0.5μM Penicillin G Amidase(PGA), 전술한 2본쇄 DNA 라이브러리로부터 WO2013/100132에 따라 조제한 mRNA-퓨로마이신 연결체를 1μM이 되도록 번역 반응 혼합물에 첨가하고, 37℃에서 1시간 정치함으로써 번역을 행했다.

실시예 6-4 패닝

번역한 display 라이브러리를 사용하여, WO2013/100132를 모방하여 패닝을 5라운드 실시했다.

실시예 6-4-1 GST 및 KRas를 표적 단백질로서 이용한 패닝

라운드 1에서는, Streptavidin 코팅 자기 비즈에, GST-HisTev-Bio가 0.4μM이 되도록 고정하고, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼에, display 라이브러리를 0.6μM이 되도록 가하고, 4μM HAT-KRAS-nonbio, 0.4mM GDP 존재하에서, 4℃에서 2시간 반응시켰다.

반응 후에, 마그넷으로 모아 상청을 제거한 비즈를, 2mM DTT가 되도록 가한 tTBS(나카라이 테스크)로 수회 세정 후, TEV 프로테아제 인식 서열을 인식하여 절단하는 TEV 프로테아제에 의해 처리하여 핵산의 용출을 행했다.

구체적인 TEV 용출액으로서, 1xTEV buffer, 10mM DTT, 0.1U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 라이브러리 인식 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))로 PCR하여, 다음 라운드의 인풋 라이브러리로 했다.

또한, TEV 용출 산물의 일부를 사용하여 qPCR을 행하고, 각 라운드의 라이브러리의 회수율을 평가했다. qPCR의 프라이머에는, 전술한 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))를 사용했다. qPCR의 반응액은, 1x Ex taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.

라운드 2에서는, Streptavidin 코팅 자기 비즈에, KRAS-FLAG-Sor-His-Tev-Bio가 0.4μM이 되도록 고정하고, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼에, display 라이브러리를 0.3μM이 되도록 가하고, 4μM GST-HisTevAvi, 0.4mM GDP 존재하에서, 4℃에서 2시간 반응시켰다.

그 후는, TEV 용출액의 DTT 농도를 1mM로 변경하고, 그것 이외는 라운드 1과 마찬가지의 작업을 행했다.

라운드 3∼라운드 5에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 0.8μM KRAS-sp11, 0.8μM GST-sp10, 1μM 비오틴화 GFP1-9에 대해서, display 라이브러리를 0.3μM이 되도록 가하고, 4℃에서 2시간 반응시켰다.

Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, GFP1-9와 비오틴 사이에 도입한 TEV 프로테아제 인식 서열을 인식하여 절단하는 TEV 프로테아제에 의해 처리하여 핵산의 용출을 행했다. 구체적인 TEV 용출액으로서, 1xTEV buffer, 1mM DTT, 0.1U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 라이브러리 인식 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))로 PCR하여, 다음 라운드의 인풋 라이브러리로 했다.

또한, TEV 용출 산물의 일부를 사용하여 qPCR을 행하고, 라이브러리의 회수율을 평가했다. qPCR의 프라이머에는, 전술한 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))를 사용했다. qPCR의 반응액은, 1x Ex taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.

라이브러리의 회수율을 추측하는 검량선을 긋기 위해서, 인풋 라이브러리를, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.

2라운드째 이후는, 인풋 라이브러리를 2개로 나누고, 한쪽은 표적 단백질 존재하, 다른 한쪽은 표적 단백질 비존재하에서 셀렉션을 행하고, 쌍방의 핵산 회수율을, qPCR의 결과로부터 평가했다. 패닝의 각 라운드의 회수율(%)을 이하의 식에 의해 산출했다. 결과를 아래 표에 나타낸다.

라이브러리의 회수율(%)=라이브러리의 아웃풋 핵산량(분자수)/(라이브러리의 인풋 핵산량(분자수))×100

라운드 1에서는, GST-HisTev-Bio 대신에 KRAS-FLAGSorHisTev-Bio를 사용하고, HAT-KRAS-nonbio 대신에 GST-HisTevAvi를 사용, 라운드 2에서는 KRAS-FLAGSorHisTev-Bio 대신에 GST-HisTev-Bio를 사용하고, GST-HisTevAvi 대신에 HAT-KRAS-nonbio를 사용한 것 이외에는 실시예 6-4-1의 방법에 준하여 패닝을 행했다. 라운드 3∼라운드 5에 대해서는 실시예 6-4-1의 방법에 따라 행했다. 패닝의 각 라운드의 회수율(%)을 아래 표에 나타낸다.

결과, 표 21 및 22에 나타내는 바와 같이 후반 라운드에 있어서, 표적 단백질 존재하와 표적 단백질 비존재하의 셀렉션간에 회수율에 차가 나 있는 것으로부터, 표적 단백질 존재하에 있어서만 회수되는 분자가, 각 라운드의 라이브러리에 존재하고, 그들이 라운드를 거듭할 때마다 농축되고 있을 가능성이 생각된다.

실시예 6-4-2 FKBP 및 KRAS를 표적 단백질로서 이용한 패닝

GST-HisTev-Bio 대신에 FKBP-HisTev-Bio를 사용하고, GST-HisTevAvi 대신에 FKBP-HisTevAvi를 사용한 것 이외에는 실시예 6-4-1의 방법에 준하여 라운드 1 및 라운드 2를 행했다.

KRAS-sp11 대신에 Hisx6-FKBP12-Link12-GFP11을 사용하고, GST-sp10 대신에 KRAS-sp10을 사용한 것 이외에는 실시예 6-4-1의 방법에 준하여 라운드 3∼라운드 5를 행했다.

패닝의 각 라운드의 회수율(%)을 아래 표에 나타낸다.

라운드 1에서는, FKBP-HisTev-Bio 대신에 KRAS-HisTev-Bio를 사용하고, KRAS-FLAG-Sor-His-Tev-Bio 대신에 FKBP-HisTevAvi를 사용, 라운드 2에서는 KRAS-FLAGSorHisTev-Bio 대신에 FKBP-HisTev-Bio를 사용하고, FKBP-HisTevAvi 대신에 HAT-KRAS-nonbio를 사용한 것 이외에는, 실시예 6-4-1의 방법에 준하여 패닝을 행했다.

FKBP-HisTev-Bio 대신에 KRAS-HisTev-Bio를 사용하고, KRAS-FLAG-Sor-His-Tev-Bio 대신에 FKBP-HisTevAvi를 사용한 것 이외에는 실시예 6-4-2의 방법에 준하여 라운드 1 및 라운드 2를 행했다. 라운드 3∼라운드 5에 대해서는 실시예 6-4-2의 방법에 따라 행했다. 패닝의 각 라운드의 회수율(%)을 아래 표에 나타낸다.

결과, 표 23 및 24에 나타내는 바와 같이 후반 라운드에 있어서, 표적 단백질 존재하와 표적 단백질 비존재하의 셀렉션간에 회수율에 차가 나 있는 것으로부터, 표적 단백질 존재하에 있어서만 회수되는 분자가, 각 라운드의 라이브러리에 존재하고, 그들이 라운드를 거듭할 때마다 농축되고 있을 가능성이 생각된다.

본 개시에 있어서의 스크리닝 방법에 의해, 다양한 분자를 포함하는 라이브러리 중에서, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자를 하이스루풋으로 선택할 수 있다. 본 개시의 스크리닝 방법에 의하면, 1개의 표적 분자만과 복합체를 형성하는 피험 분자를 배제하면서, 목적하는 후보 분자를 효율적으로 취득하는 것이 가능하다. 또한 본 개시에 있어서의 스크리닝 방법을 이용하면, 복수의 표적 분자와의 다양한 결합 양식을 발생시킬 수 있는 후보 분자를 취득하는 것을 기대할 수 있다. 본 개시에 있어서의 스크리닝 방법은, 의약품의 새로운 후보 분자의 탐색에 있어서 유용하다.

SEQUENCE LISTING <110> CHUGAI SEIYAKU KABUSHIKI KAISHA <120> Method for screening a candidate molecule which can form a complex with multiple target molecules <130> C1-A2032P <150> JP 2020-216004 <151> 2020-12-25 <160> 124 <170> PatentIn version 3.5 <210> 1 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Avi-tag sequence <400> 1 Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu 1 5 10 15 <210> 2 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> TEV protease sequence <400> 2 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 3 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> His tag sequence <400> 3 His His His His His His 1 5 <210> 4 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Fw(GFP) <400> 4 gtaatacgac tcactatagg gttaacttta agaaggag 38 <210> 5 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Rv(GFP) <400> 5 tttttttaga gccagagcca gagccaga 28 <210> 6 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> reverse transcription S2_mRNA#13 <400> 6 tttgtccccg ccgccctatc gccggtgccg gtgccggtcg g 41 <210> 7 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Fw_1for SNAP(N) prep. <400> 7 taaggagata taaatatgga caaagactgc gaa 33 <210> 8 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Rv_1for SNAP(N) prep. <400> 8 agagccagag ccagagccag agccagagcc ctgctggaac actgggtggt 50 <210> 9 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Fw_2 for SNAP(N) prep. <400> 9 ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tg 52 <210> 10 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Rv_2 for SNAP(N) prep. <400> 10 tttttttaga gccagagcca gagccagagc cagagcc 37 <210> 11 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Fw_1for SNAP(C) prep. <400> 11 taaggagata taaatatggt cgacgagagc tttacccgcc aggt 44 <210> 12 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Rv_1for SNAP(C) prep. <400> 12 agagccagag ccagagccag agccagagcc attaacctcg agtttaaacg c 51 <210> 13 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> GGSS-primer_F <400> 13 tggtggcagc agcagcaagg gcgaggaact gtt 33 <210> 14 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> GGSS-primer_R <400> 14 ctgctgctgc caccatgatg gtgatgatgg tgac 34 <210> 15 <211> 852 <212> DNA <213> Artificial Sequence <220> <223> GFP1-9 <400> 15 catatgggtg gcaccagcag caagggcgag gaactgttca ccggtgtggt tccgatcctg 60 gtggagctgg acggcgatgt taacggtcac aaatttagcg tgcgtggtga gggcgaaggt 120 gacgcgacca tcggcaagct gaccctgaaa ttcattagca ccaccggtaa actgccggtg 180 ccgtggccga ccctggttac caccctgacc tacggtgtgc aggcgtttag ccgttatccg 240 gaccacatga agcgtcacga tttctttaaa agcgcgatgc cggagggcta cgttcaagaa 300 cgtaccatta gcttcaagga cgatggcaag tataaaaccc gtgcggtggt taaatttgag 360 ggcgataccc tggttaaccg tatcgagctg aagggtaccg acttcaaaga agatggcaac 420 attctgggtc acaagctgga atacaacttt aacagccaca acgtgtatat caccgcggac 480 aagcagaaaa acggcattaa agcgaacttc accgtgcgtc acaacgttga ggacggtagc 540 gttcaactgg cggatcacta ccagcaaaac accccgattg gtgatggtac ccgtggcagc 600 ggtagcattg aaggtcgtca tagcggcagc ggtagcccgg tgctgctgcc ggacaaccac 660 tatctgagca cccagaccgt tctgagcaaa gatccgaacg aggcgggcac tcgtggcagc 720 ggtagcatcg aaggtcgtca cagcggcagc ggtagccgtg accacatggt gctgcacgaa 780 tacgttaacg cggcgggcat cacccacggt atggacgaac tgtataaagg cagcggcggc 840 acctaaggat cc 852 <210> 16 <211> 109 <212> DNA <213> Artificial Sequence <220> <223> Tag insert sequence <400> 16 ccatgggtct gaacgacatc ttcgaggcgc aaaaaattga gtggcacgag gagaacctgt 60 acttccaggg tcaccatcat caccatcata tgcgtaaggg cgaggaact 109 <210> 17 <211> 203 <212> DNA <213> Artificial Sequence <220> <223> GFP10-11 <400> 17 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggacctgcc 60 ggacgaccac tacctgtcta cccagaccat cctgctgaaa gacctgaacg aaaaacgtga 120 ccacatggtt ctgctggaat acgttaccgc ggcgggtatc accgacgcgt ctggctctgg 180 ctctggctct ggctctaaaa aaa 203 <210> 18 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> GFP10 <400> 18 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggacctgcc 60 ggacgaccac tacctgtcta cccagaccat cctgctgaaa gacctgaacg gctctggctc 120 tggctctggc tctaaaaaaa 140 <210> 19 <211> 146 <212> DNA <213> Artificial Sequence <220> <223> GFP11 <400> 19 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggaaaaacg 60 tgatcatatg gtgctgctgg aatatgtgac cgcggcgggc attaccgatg cgtctggctc 120 tggctctggc tctggctcta aaaaaa 146 <210> 20 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Rapamycin-nucleic acid <400> 20 gtaatacgac tcactatagg gttaacttta agaaggagat atacatatgc agtttatgtt 60 ttaggagatt ctgaggccga ccggcaccgg caccggcgat agggcggcgg ggacaaa 117 <210> 21 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> Hisx6-FKBP12-Link12-GFP11 <400> 21 atgcaccacc accaccacca catgggcgtc caagtcgaaa cgatcagtcc gggcgatggc 60 cgtaccttcc cgaaacgcgg tcaaacgtgc gtggttcatt ataccggcat gctggaagat 120 ggtaaaaaat ttgatagctc tcgtgaccgc aacaaaccgt ttaaattcat gctgggcaaa 180 caggaagtga ttcgtggctg ggaagaaggt gttgcacaga tgagcgtcgg tcaacgcgct 240 aaactgacca tcagtccgga ttatgcgtac ggtgccacgg gccatccggg tattatcccg 300 ccgcacgcaa ccctggtctt tgacgtggaa ctgctgaaac tggaaggcgg tggcggttca 360 ggcggtggct cgggtggcag tacgtccgaa aaacgcgatc acatggttct gctggaatat 420 gtcacggctg cgggtatcac cgatgcttcg 450 <210> 22 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> GFP10-Link12-FRB-Hisx6 <400> 22 atggacctgc cggacaatca ctatctgagt acgcaaacga tcctgctgaa agacctgaac 60 gatgttggtg gtggtggctc tggcggtggc agcggcggtt ctgaaatgtg gcatgaaggt 120 ctggaagaag caagccgtct gtattttggc gaacgcaacg tgaaaggcat gttcgaagtt 180 ctggaaccgc tgcacgctat gatggaacgt ggcccgcaga ccctgaaaga aacgagtttt 240 aaccaagcgt atggtcgtga tctgatggaa gcccaggaat ggtgccgcaa atacatgaaa 300 tccggcaatg tcaaagacct gacccaagcc tgggacctgt attaccatgt ctttcgtcgc 360 atctctaaac aacaccatca tcatcaccat 390 <210> 23 <211> 359 <212> DNA <213> Artificial Sequence <220> <223> SNAP(N) whole_DNA <400> 23 ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tggacaaaga 60 ctgcgaaatg aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg 120 cgaacagggc ctgcaccgta tcatcttcct gggcaaagga acatctgccg ccgacgccgt 180 ggaagtgcct gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc 240 ctggctcaac gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct 300 gcaccaccca gtgttccagc agggctctgg ctctggctct ggctctggct ctaaaaaaa 359 <210> 24 <211> 404 <212> DNA <213> Artificial Sequence <220> <223> SNAP(C) whole_DNA <400> 24 ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tggtcgacga 60 gagctttacc cgccaggtgc tgtggaaact gctgaaagtg gtgaagttcg gagaggtcat 120 cagctacagc cacctggccg ccctggccgg caatcccgcc gccaccgccg ccgtgaaaac 180 cgccctgagc ggaaatcccg tgcccattct gatcccctgc caccgggtgg tgcagggcga 240 cctggacgtg gggggctacg agggcgggct cgccgtgaaa gagtggctgc tggcccacga 300 gggccacaga ctgggcaagc ctgggctggg tcctgcaggc ggatccgcgt ttaaactcga 360 ggttaatggc tctggctctg gctctggctc tggctctaaa aaaa 404 <210> 25 <211> 668 <212> DNA <213> Artificial Sequence <220> <223> SNAP(full) whole_DNA <400> 25 ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tggacaaaga 60 ctgcgaaatg aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg 120 cgaacagggc ctgcaccgta tcatcttcct gggcaaagga acatctgccg ccgacgccgt 180 ggaagtgcct gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc 240 ctggctcaac gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct 300 gcaccaccca gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa 360 agtggtgaag ttcggagagg tcatcagcta cagccacctg gccgccctgg ccggcaatcc 420 cgccgccacc gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc 480 ctgccaccgg gtggtgcagg gcgacctgga cgtggggggc tacgagggcg ggctcgccgt 540 gaaagagtgg ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc 600 aggcggatcc gcgtttaaac tcgaggttaa tggctctggc tctggctctg gctctggctc 660 taaaaaaa 668 <210> 26 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> UbNter_DNA <400> 26 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgatgcagat 60 cttcgtgaag accctgaccg gcaagaccgc cactctggag gtggagccca gtgacaccat 120 cgaaaatgtg aaggccaaga tccaagataa agaaggcatc cccggctctg gctctggctc 180 tggctctaaa aaaa 194 <210> 27 <211> 209 <212> DNA <213> Artificial Sequence <220> <223> UbCter_DNA <400> 27 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcatccc 60 ccccgaccag cagaggctca tctttgcagg caagcagctg gaagatggcc gcactctttc 120 tgactacaac atccagaaag agtcgaccct gcacctggtc ctgcgcctga ggggtggcgg 180 ctctggctct ggctctggct ctaaaaaaa 209 <210> 28 <211> 332 <212> DNA <213> Artificial Sequence <220> <223> UbI13A full_DNA <400> 28 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgatgcagat 60 cttcgtgaag accctgaccg gcaagaccgc cactctggag gtggagccca gtgacaccat 120 cgaaaatgtg aaggccaaga tccaagataa agaaggcatc cccggctctg gctctggcat 180 cccccccgac cagcagaggc tcatctttgc aggcaagcag ctggaagatg gccgcactct 240 ttctgactac aacatccaga aagagtcgac cctgcacctg gtcctgcgcc tgaggggtgg 300 cggctctggc tctggctctg gctctaaaaa aa 332 <210> 29 <211> 182 <212> RNA <213> Artificial Sequence <220> <223> GFP10-11 <400> 29 ggguuaacuu uaagaaggag auauacauau ggaccugccg gacgaccacu accugucuac 60 ccagaccauc cugcugaaag accugaacga aaaacgugac cacaugguuc ugcuggaaua 120 cguuaccgcg gcggguauca ccgacgcguc uggcucuggc ucuggcucug gcucuaaaaa 180 aa 182 <210> 30 <211> 119 <212> RNA <213> Artificial Sequence <220> <223> GFP10 <400> 30 ggguuaacuu uaagaaggag auauacauau ggaccugccg gacgaccacu accugucuac 60 ccagaccauc cugcugaaag accugaacgg cucuggcucu ggcucuggcu cuaaaaaaa 119 <210> 31 <211> 125 <212> RNA <213> Artificial Sequence <220> <223> GFP11 <400> 31 ggguuaacuu uaagaaggag auauacauau ggaaaaacgu gaucauaugg ugcugcugga 60 auaugugacc gcggcgggca uuaccgaugc gucuggcucu ggcucuggcu cuggcucuaa 120 aaaaa 125 <210> 32 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> Rapamycin-nucleic acid <400> 32 ggguuaacuu uaagaaggag auauacauau gcaguuuaug uuuuaggaga uucugaggcc 60 gaccggcacc ggcaccggcg auagggcggc ggggacaaa 99 <210> 33 <211> 338 <212> RNA <213> Artificial Sequence <220> <223> SNAP(N) whole_mRNA <400> 33 ggguuaacuu uaauaaggag auauaaauau ggacaaagac ugcgaaauga agcgcaccac 60 ccuggauagc ccucugggca agcuggaacu gucugggugc gaacagggcc ugcaccguau 120 caucuuccug ggcaaaggaa caucugccgc cgacgccgug gaagugccug ccccagccgc 180 cgugcugggc ggaccagagc cacugaugca ggccaccgcc uggcucaacg ccuacuuuca 240 ccagccugag gccaucgagg aguucccugu gccagcccug caccacccag uguuccagca 300 gggcucuggc ucuggcucug gcucuggcuc uaaaaaaa 338 <210> 34 <211> 383 <212> RNA <213> Artificial Sequence <220> <223> SNAP(C) whole_mRNA <400> 34 ggguuaacuu uaauaaggag auauaaauau ggucgacgag agcuuuaccc gccaggugcu 60 guggaaacug cugaaagugg ugaaguucgg agaggucauc agcuacagcc accuggccgc 120 ccuggccggc aaucccgccg ccaccgccgc cgugaaaacc gcccugagcg gaaaucccgu 180 gcccauucug auccccugcc accggguggu gcagggcgac cuggacgugg ggggcuacga 240 gggcgggcuc gccgugaaag aguggcugcu ggcccacgag ggccacagac ugggcaagcc 300 ugggcugggu ccugcaggcg gauccgcguu uaaacucgag guuaauggcu cuggcucugg 360 cucuggcucu ggcucuaaaa aaa 383 <210> 35 <211> 647 <212> RNA <213> Artificial Sequence <220> <223> SNAP(full) whole_mRNA <400> 35 ggguuaacuu uaauaaggag auauaaauau ggacaaagac ugcgaaauga agcgcaccac 60 ccuggauagc ccucugggca agcuggaacu gucugggugc gaacagggcc ugcaccguau 120 caucuuccug ggcaaaggaa caucugccgc cgacgccgug gaagugccug ccccagccgc 180 cgugcugggc ggaccagagc cacugaugca ggccaccgcc uggcucaacg ccuacuuuca 240 ccagccugag gccaucgagg aguucccugu gccagcccug caccacccag uguuccagca 300 ggagagcuuu acccgccagg ugcuguggaa acugcugaaa guggugaagu ucggagaggu 360 caucagcuac agccaccugg ccgcccuggc cggcaauccc gccgccaccg ccgccgugaa 420 aaccgcccug agcggaaauc ccgugcccau ucugaucccc ugccaccggg uggugcaggg 480 cgaccuggac guggggggcu acgagggcgg gcucgccgug aaagaguggc ugcuggccca 540 cgagggccac agacugggca agccugggcu ggguccugca ggcggauccg cguuuaaacu 600 cgagguuaau ggcucuggcu cuggcucugg cucuggcucu aaaaaaa 647 <210> 36 <211> 173 <212> RNA <213> Artificial Sequence <220> <223> UbNter_mRNA <400> 36 ggguuaacuu uaagaaggag auauacauau gaugcagauc uucgugaaga cccugaccgg 60 caagaccgcc acucuggagg uggagcccag ugacaccauc gaaaauguga aggccaagau 120 ccaagauaaa gaaggcaucc ccggcucugg cucuggcucu ggcucuaaaa aaa 173 <210> 37 <211> 188 <212> RNA <213> Artificial Sequence <220> <223> UbCter_mRNA <400> 37 ggguuaacuu uaagaaggag auauacauau gggcaucccc cccgaccagc agaggcucau 60 cuuugcaggc aagcagcugg aagauggccg cacucuuucu gacuacaaca uccagaaaga 120 gucgacccug caccuggucc ugcgccugag ggguggcggc ucuggcucug gcucuggcuc 180 uaaaaaaa 188 <210> 38 <211> 311 <212> RNA <213> Artificial Sequence <220> <223> UbI13A full_mRNA <400> 38 ggguuaacuu uaagaaggag auauacauau gaugcagauc uucgugaaga cccugaccgg 60 caagaccgcc acucuggagg uggagcccag ugacaccauc gaaaauguga aggccaagau 120 ccaagauaaa gaaggcaucc ccggcucugg cucuggcauc ccccccgacc agcagaggcu 180 caucuuugca ggcaagcagc uggaagaugg ccgcacucuu ucugacuaca acauccagaa 240 agagucgacc cugcaccugg uccugcgccu gagggguggc ggcucuggcu cuggcucugg 300 cucuaaaaaa a 311 <210> 39 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> GFP10-GFP11-GS4 <400> 39 Met Asp Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu 1 5 10 15 Lys Asp Leu Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val 20 25 30 Thr Ala Ala Gly Ile Thr Asp Ala Ser Gly Ser Gly Ser Gly Ser Gly 35 40 45 Ser Lys Lys 50 <210> 40 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> GFP10-GS4 <400> 40 Met Asp Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu 1 5 10 15 Lys Asp Leu Asn Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 20 25 30 <210> 41 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> GFP11-GS4 <400> 41 Met Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala 1 5 10 15 Gly Ile Thr Asp Ala Ser Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 20 25 30 <210> 42 <211> 103 <212> PRT <213> Artificial Sequence <220> <223> splitSNAP (N)-GS5 <400> 42 Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu 1 5 10 15 Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile 20 25 30 Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala 35 40 45 Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala 50 55 60 Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro 65 70 75 80 Val Pro Ala Leu His His Pro Val Phe Gln Gln Gly Ser Gly Ser Gly 85 90 95 Ser Gly Ser Gly Ser Lys Lys 100 <210> 43 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> SNAP (C)-GS5 <400> 43 Met Val Asp Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys 1 5 10 15 Val Val Lys Phe Gly Glu Val Ile Ser Tyr Ser His Leu Ala Ala Leu 20 25 30 Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly 35 40 45 Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Gln Gly Asp 50 55 60 Leu Asp Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu 65 70 75 80 Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala 85 90 95 Gly Gly Ser Ala Phe Lys Leu Glu Val Asn Gly Ser Gly Ser Gly Ser 100 105 110 Gly Ser Gly Ser Lys Lys 115 <210> 44 <211> 206 <212> PRT <213> Artificial Sequence <220> <223> SNAP (full)-GS5 <400> 44 Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu 1 5 10 15 Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile 20 25 30 Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala 35 40 45 Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala 50 55 60 Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro 65 70 75 80 Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg 85 90 95 Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile 100 105 110 Ser Tyr Ser His Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala 115 120 125 Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro 130 135 140 Cys His Arg Val Val Gln Gly Asp Leu Asp Val Gly Gly Tyr Glu Gly 145 150 155 160 Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu 165 170 175 Gly Lys Pro Gly Leu Gly Pro Ala Gly Gly Ser Ala Phe Lys Leu Glu 180 185 190 Val Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 195 200 205 <210> 45 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> splitUb (N)-GS4 <400> 45 Met Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu 1 5 10 15 Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln 20 25 30 Asp Lys Glu Gly Ile Pro Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 35 40 45 <210> 46 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> splitUb (C)-GS4 <400> 46 Met Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln 1 5 10 15 Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser 20 25 30 Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Gly Ser Gly Ser Gly 35 40 45 Ser Gly Ser Lys Lys 50 <210> 47 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> splitUb (N-C)-GS4 <400> 47 Met Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu 1 5 10 15 Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln 20 25 30 Asp Lys Glu Gly Ile Pro Gly Ser Gly Ser Gly Ile Pro Pro Asp Gln 35 40 45 Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg Thr Leu 50 55 60 Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His Leu Val Leu Arg 65 70 75 80 Leu Arg Gly Gly Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 85 90 <210> 48 <211> 233 <212> PRT <213> Artificial Sequence <220> <223> Avi-Tev-His-GFP1-9 <400> 48 Met Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu 1 5 10 15 Glu Asn Leu Tyr Phe Gln Gly His His His His His His Gly Gly Ser 20 25 30 Ser Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val 35 40 45 Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu 50 55 60 Gly Glu Gly Asp Ala Thr Ile Gly Lys Leu Thr Leu Lys Phe Ile Ser 65 70 75 80 Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu 85 90 95 Thr Tyr Gly Val Gln Ala Phe Ser Arg Tyr Pro Asp His Met Lys Arg 100 105 110 His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg 115 120 125 Thr Ile Ser Phe Lys Asp Asp Gly Lys Tyr Lys Thr Arg Ala Val Val 130 135 140 Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr 145 150 155 160 Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn 165 170 175 Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly 180 185 190 Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val 195 200 205 Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Thr 210 215 220 Arg Gly Ser Gly Ser Ile Glu Gly Arg 225 230 <210> 49 <211> 320 <212> DNA <213> Artificial Sequence <220> <223> Kpep-UbNter_DNA <400> 49 gtaatacgac tcactatagg gttaacttta agaaggagat atacatatga aagtgagcgc 60 gctgaaagaa aacgtgagcg ccctgaaaga aaaagtgagc gcgctgaccg aaaaagtgag 120 cgcgctgaaa gagaaagtga gcgcgctgaa agaaggctct ggctctggct ctggctctat 180 gcagatcttc gtgaagaccc tgaccggcaa gaccgccact ctggaggtgg agcccagtga 240 caccatcgaa aatgtgaagg ccaagatcca agataaagaa ggcatccccg gctctggctc 300 tggctctggc tctaaaaaaa 320 <210> 50 <211> 320 <212> DNA <213> Artificial Sequence <220> <223> Epep-UbNter_DNA <400> 50 gtaatacgac tcactatagg gttaacttta agaaggagat atacatatga aagtgagcgc 60 gctggaaaac gaagtgagcg cgctggaaaa agaagtgagc gtgctggaaa aagaagtgag 120 cgcgctggaa aaagaagtgc gcgcgctgga aaaaggctct ggctctggct ctggctctat 180 gcagatcttc gtgaagaccc tgaccggcaa gaccgccact ctggaggtgg agcccagtga 240 caccatcgaa aatgtgaagg ccaagatcca agataaagaa ggcatccccg gctctggctc 300 tggctctggc tctaaaaaaa 320 <210> 51 <211> 338 <212> DNA <213> Artificial Sequence <220> <223> Epep-UbCter_DNA <400> 51 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcatccc 60 ccccgaccag cagaggctca tctttgcagg caagcagctg gaagatggcc gcactctttc 120 tgactacaac atccagaaag agtcgaccct gcacctggtc ctgcgcctga ggggtggcgg 180 ctctggctct ggctctggct ctaaagtgag cgcgctggaa aacgaagtga gcgcgctgga 240 aaaagaagtg agcgtgctgg aaaaagaagt gagcgcgctg gaaaaagaag tgcgcgcgct 300 ggaaaaaggc tctggctctg gctctggctc taaaaaaa 338 <210> 52 <211> 302 <212> RNA <213> Artificial Sequence <220> <223> Kpep-UbNter_mRNA <400> 52 ggguuaacuu uaagaaggag auauacauau gaaagugagc gcgcugaaag aaaacgugag 60 cgcccugaaa gaaaaaguga gcgcgcugac cgaaaaagug agcgcgcuga aagagaaagu 120 gagcgcgcug aaagaaggcu cuggcucugg cucuggcucu augcagaucu ucgugaagac 180 ccugaccggc aagaccgcca cucuggaggu ggagcccagu gacaccaucg aaaaugugaa 240 ggccaagauc caagauaaag aaggcauccc cggcucuggc ucuggcucug gcucuaaaaa 300 aa 302 <210> 53 <211> 302 <212> RNA <213> Artificial Sequence <220> <223> Epep-UbNter_mRNA <400> 53 ggguuaacuu uaagaaggag auauacauau gaaagugagc gcgcuggaaa acgaagugag 60 cgcgcuggaa aaagaaguga gcgugcugga aaaagaagug agcgcgcugg aaaaagaagu 120 gcgcgcgcug gaaaaaggcu cuggcucugg cucuggcucu augcagaucu ucgugaagac 180 ccugaccggc aagaccgcca cucuggaggu ggagcccagu gacaccaucg aaaaugugaa 240 ggccaagauc caagauaaag aaggcauccc cggcucuggc ucuggcucug gcucuaaaaa 300 aa 302 <210> 54 <211> 317 <212> RNA <213> Artificial Sequence <220> <223> Epep-UbCter_mRNA <400> 54 ggguuaacuu uaagaaggag auauacauau gggcaucccc cccgaccagc agaggcucau 60 cuuugcaggc aagcagcugg aagauggccg cacucuuucu gacuacaaca uccagaaaga 120 gucgacccug caccuggucc ugcgccugag ggguggcggc ucuggcucug gcucuggcuc 180 uaaagugagc gcgcuggaaa acgaagugag cgcgcuggaa aaagaaguga gcgugcugga 240 aaaagaagug agcgcgcugg aaaaagaagu gcgcgcgcug gaaaaaggcu cuggcucugg 300 cucuggcucu aaaaaaa 317 <210> 55 <211> 91 <212> PRT <213> Artificial Sequence <220> <223> Kpep-splitUb(N)-GS4 <400> 55 Met Lys Val Ser Ala Leu Lys Glu Asn Val Ser Ala Leu Lys Glu Lys 1 5 10 15 Val Ser Ala Leu Thr Glu Lys Val Ser Ala Leu Lys Glu Lys Val Ser 20 25 30 Ala Leu Lys Glu Gly Ser Gly Ser Gly Ser Gly Ser Met Gln Ile Phe 35 40 45 Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu Val Glu Pro Ser 50 55 60 Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile 65 70 75 80 Pro Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 85 90 <210> 56 <211> 91 <212> PRT <213> Artificial Sequence <220> <223> Epep-splitUb(N)-GS4 <400> 56 Met Lys Val Ser Ala Leu Glu Asn Glu Val Ser Ala Leu Glu Lys Glu 1 5 10 15 Val Ser Val Leu Glu Lys Glu Val Ser Ala Leu Glu Lys Glu Val Arg 20 25 30 Ala Leu Glu Lys Gly Ser Gly Ser Gly Ser Gly Ser Met Gln Ile Phe 35 40 45 Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu Val Glu Pro Ser 50 55 60 Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile 65 70 75 80 Pro Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 85 90 <210> 57 <211> 96 <212> PRT <213> Artificial Sequence <220> <223> Epep-splitUb(C)-GS4 <400> 57 Met Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln 1 5 10 15 Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser 20 25 30 Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Gly Ser Gly Ser Gly 35 40 45 Ser Gly Ser Lys Val Ser Ala Leu Glu Asn Glu Val Ser Ala Leu Glu 50 55 60 Lys Glu Val Ser Val Leu Glu Lys Glu Val Ser Ala Leu Glu Lys Glu 65 70 75 80 Val Arg Ala Leu Glu Lys Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys 85 90 95 <210> 58 <211> 533 <212> DNA <213> Artificial Sequence <220> <223> Avi-His-splitNanoluc1-8 <400> 58 ccatgggcct gaacgatatt tttgaagcgc agaagattga gtggcacgaa caccatcatc 60 atcatcacgg tggtagcagc gtgttcaccc tggaggactt tgttggcgat tgggaacaga 120 ccgcggcgta caacctggac caggtgctgg agcaaggtgg cgttagcagc ctgctgcaga 180 acctggcggt gagcgttacc ccgatccaac gtattgttcg tagcggcgag aacgcgctga 240 agatcgacat tcacgtgatc attccgtatg aaggcctgag cgcggatcag atggcgcaaa 300 tcgaggaagt gttcaaggtg gtttacccgg ttgacgatca ccactttaaa gtgatcctgc 360 cgtatggtac cctggtgatt gacggcgtta ccccgaacat gctgaactac ttcggtcgtc 420 cgtatgaagg catcgcggtt tttgatggta agaaaattac cgttaccggc accctgtgga 480 acggcaacaa gattattgac gaacgcctga ttaccccgga ctaatgagga tcc 533 <210> 59 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> Nanoluc9-10 <400> 59 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcagcat 60 gctgtttcgt gtgaccatta acagcggcgg cggcagcggc ggcggcggca gcggcgtgag 120 cggctggcgt ctgtttaaaa aaattagcgg ttctggttct ggttctggtt ctgaaaacct 180 gtattttcag ggcaaaaaaa 200 <210> 60 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Nanoluc-9 <400> 60 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcagcat 60 gctgtttcgt gtgaccatta acagcggttc tggttctggt tctggttctg aaaacctgta 120 ttttcagggc aaaaaaa 137 <210> 61 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Nanoluc-10 <400> 61 ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggtgagcgg 60 ctggcgtctg tttaaaaaaa ttagcggttc tggttctggt tctggttctg aaaacctgta 120 ttttcagggc aaaaaaa 137 <210> 62 <211> 179 <212> RNA <213> Artificial Sequence <220> <223> Nanoluc9-10 <400> 62 ggguuaacuu uaagaaggag auauacauau gggcagcaug cuguuucgug ugaccauuaa 60 cagcggcggc ggcagcggcg gcggcggcag cggcgugagc ggcuggcguc uguuuaaaaa 120 aauuagcggu ucugguucug guucugguuc ugaaaaccug uauuuucagg gcaaaaaaa 179 <210> 63 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> Nanoluc-9 <400> 63 ggguuaacuu uaagaaggag auauacauau gggcagcaug cuguuucgug ugaccauuaa 60 cagcgguucu gguucugguu cugguucuga aaaccuguau uuucagggca aaaaaa 116 <210> 64 <211> 116 <212> RNA <213> Artificial Sequence <220> <223> Nanoluc-10 <400> 64 ggguuaacuu uaagaaggag auauacauau ggugagcggc uggcgucugu uuaaaaaaau 60 uagcgguucu gguucugguu cugguucuga aaaccuguau uuucagggca aaaaaa 116 <210> 65 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> SplitNanoluc9-10-GS4-TEV <400> 65 Met Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser Gly Gly Gly Ser 1 5 10 15 Gly Gly Gly Gly Ser Gly Val Ser Gly Trp Arg Leu Phe Lys Lys Ile 20 25 30 Ser Gly Ser Gly Ser Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Gly 35 40 45 Lys Lys 50 <210> 66 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> SplitNanoluc-9-GS4-TEV <400> 66 Met Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser Gly Ser Gly Ser 1 5 10 15 Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Gly Lys Lys 20 25 <210> 67 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> SplitNanoluc-10-GS4-TEV <400> 67 Met Val Ser Gly Trp Arg Leu Phe Lys Lys Ile Ser Gly Ser Gly Ser 1 5 10 15 Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Gly Lys Lys 20 25 <210> 68 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Nanoluc_qPCR_Rvprimer <400> 68 tttttttgcc ctgaaaatac aggttttc 28 <210> 69 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Fw primer for #13Rapa_F5 <400> 69 gatatacata tgcagtttat gtt 23 <210> 70 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Rv primer for #13Rapa_R4 <400> 70 ggtcggcctc agaatctcct a 21 <210> 71 <211> 231 <212> PRT <213> Artificial Sequence <220> <223> GFP full <400> 71 Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val 1 5 10 15 Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu 20 25 30 Gly Glu Gly Asp Ala Thr Ile Gly Lys Leu Thr Leu Lys Phe Ile Ser 35 40 45 Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu 50 55 60 Thr Tyr Gly Val Gln Ala Phe Ser Arg Tyr Pro Asp His Met Lys Arg 65 70 75 80 His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg 85 90 95 Thr Ile Ser Phe Lys Asp Asp Gly Lys Tyr Lys Thr Arg Ala Val Val 100 105 110 Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr 115 120 125 Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn 130 135 140 Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly 145 150 155 160 Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val 165 170 175 Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Asp 180 185 190 Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp 195 200 205 Leu Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala 210 215 220 Ala Gly Ile Thr Asp Ala Ser 225 230 <210> 72 <211> 191 <212> PRT <213> Artificial Sequence <220> <223> GFP1-9 <400> 72 Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val 1 5 10 15 Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu 20 25 30 Gly Glu Gly Asp Ala Thr Ile Gly Lys Leu Thr Leu Lys Phe Ile Ser 35 40 45 Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu 50 55 60 Thr Tyr Gly Val Gln Ala Phe Ser Arg Tyr Pro Asp His Met Lys Arg 65 70 75 80 His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg 85 90 95 Thr Ile Ser Phe Lys Asp Asp Gly Lys Tyr Lys Thr Arg Ala Val Val 100 105 110 Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr 115 120 125 Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn 130 135 140 Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly 145 150 155 160 Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val 165 170 175 Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 <210> 73 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> GFP10 <400> 73 Asp Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys 1 5 10 15 Asp Leu Asn <210> 74 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> GFP11 <400> 74 Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala Gly 1 5 10 15 Ile Thr Asp Ala Ser 20 <210> 75 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> Ubiquitin full <400> 75 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys 35 40 45 Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu 50 55 60 Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly 65 70 75 <210> 76 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> splitUb (N) <400> 76 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro 35 <210> 77 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> splitUb (C) <400> 77 Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu 1 5 10 15 Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr 20 25 30 Leu His Leu Val Leu Arg Leu Arg Gly Gly 35 40 <210> 78 <211> 170 <212> PRT <213> Artificial Sequence <220> <223> Nanoluc full <400> 78 Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Glu Gln Thr Ala 1 5 10 15 Ala Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu 20 25 30 Leu Gln Asn Leu Ala Val Ser Val Thr Pro Ile Gln Arg Ile Val Arg 35 40 45 Ser Gly Glu Asn Ala Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr 50 55 60 Glu Gly Leu Ser Ala Asp Gln Met Ala Gln Ile Glu Glu Val Phe Lys 65 70 75 80 Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu Pro Tyr 85 90 95 Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Leu Asn Tyr Phe 100 105 110 Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr 115 120 125 Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu 130 135 140 Ile Thr Pro Asp Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser Val 145 150 155 160 Ser Gly Trp Arg Leu Phe Lys Lys Ile Ser 165 170 <210> 79 <211> 148 <212> PRT <213> Artificial Sequence <220> <223> SplitNanoluc1-8 <400> 79 Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Glu Gln Thr Ala 1 5 10 15 Ala Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu 20 25 30 Leu Gln Asn Leu Ala Val Ser Val Thr Pro Ile Gln Arg Ile Val Arg 35 40 45 Ser Gly Glu Asn Ala Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr 50 55 60 Glu Gly Leu Ser Ala Asp Gln Met Ala Gln Ile Glu Glu Val Phe Lys 65 70 75 80 Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu Pro Tyr 85 90 95 Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Leu Asn Tyr Phe 100 105 110 Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr 115 120 125 Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu 130 135 140 Ile Thr Pro Asp 145 <210> 80 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> SplitNanoluc-9 <400> 80 Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser 1 5 10 <210> 81 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> SplitNanoluc-10 <400> 81 Val Ser Gly Trp Arg Leu Phe Lys Lys Ile Ser 1 5 10 <210> 82 <211> 194 <212> PRT <213> Artificial Sequence <220> <223> SNAP (full) <400> 82 Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu 1 5 10 15 Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile 20 25 30 Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala 35 40 45 Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala 50 55 60 Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro 65 70 75 80 Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg 85 90 95 Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile 100 105 110 Ser Tyr Ser His Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala 115 120 125 Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro 130 135 140 Cys His Arg Val Val Gln Gly Asp Leu Asp Val Gly Gly Tyr Glu Gly 145 150 155 160 Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu 165 170 175 Gly Lys Pro Gly Leu Gly Pro Ala Gly Gly Ser Ala Phe Lys Leu Glu 180 185 190 Val Asn <210> 83 <211> 91 <212> PRT <213> Artificial Sequence <220> <223> SplitSNAP (N) <400> 83 Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu 1 5 10 15 Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile 20 25 30 Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala 35 40 45 Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala 50 55 60 Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro 65 70 75 80 Val Pro Ala Leu His His Pro Val Phe Gln Gln 85 90 <210> 84 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> SplitSNAP (C) <400> 84 Val Asp Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val 1 5 10 15 Val Lys Phe Gly Glu Val Ile Ser Tyr Ser His Leu Ala Ala Leu Ala 20 25 30 Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn 35 40 45 Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Gln Gly Asp Leu 50 55 60 Asp Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu 65 70 75 80 Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly 85 90 95 Gly Ser Ala Phe Lys Leu Glu Val Asn 100 105 <210> 85 <211> 173 <212> PRT <213> Artificial Sequence <220> <223> Avi-His-spNluc1-8 <400> 85 Met Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu 1 5 10 15 His His His His His His Gly Gly Ser Ser Val Phe Thr Leu Glu Asp 20 25 30 Phe Val Gly Asp Trp Glu Gln Thr Ala Ala Tyr Asn Leu Asp Gln Val 35 40 45 Leu Glu Gln Gly Gly Val Ser Ser Leu Leu Gln Asn Leu Ala Val Ser 50 55 60 Val Thr Pro Ile Gln Arg Ile Val Arg Ser Gly Glu Asn Ala Leu Lys 65 70 75 80 Ile Asp Ile His Val Ile Ile Pro Tyr Glu Gly Leu Ser Ala Asp Gln 85 90 95 Met Ala Gln Ile Glu Glu Val Phe Lys Val Val Tyr Pro Val Asp Asp 100 105 110 His His Phe Lys Val Ile Leu Pro Tyr Gly Thr Leu Val Ile Asp Gly 115 120 125 Val Thr Pro Asn Met Leu Asn Tyr Phe Gly Arg Pro Tyr Glu Gly Ile 130 135 140 Ala Val Phe Asp Gly Lys Lys Ile Thr Val Thr Gly Thr Leu Trp Asn 145 150 155 160 Gly Asn Lys Ile Ile Asp Glu Arg Leu Ile Thr Pro Asp 165 170 <210> 86 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> Hisx6-FKBP12-Link12-GFP11 <400> 86 Met His His His His His His Met Gly Val Gln Val Glu Thr Ile Ser 1 5 10 15 Pro Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr Cys Val Val 20 25 30 His Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Phe Asp Ser Ser Arg 35 40 45 Asp Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile 50 55 60 Arg Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala 65 70 75 80 Lys Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro 85 90 95 Gly Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu 100 105 110 Lys Leu Glu Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr 115 120 125 Ser Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala 130 135 140 Gly Ile Thr Asp Ala Ser 145 150 <210> 87 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> GFP10-Link12-FRB-Hisx6 <400> 87 Met Asp Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Thr Ile Leu Leu 1 5 10 15 Lys Asp Leu Asn Asp Val Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly 20 25 30 Gly Ser Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser Arg Leu Tyr 35 40 45 Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu Glu Pro Leu 50 55 60 His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu Thr Ser Phe 65 70 75 80 Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu Trp Cys Arg 85 90 95 Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Thr Gln Ala Trp Asp 100 105 110 Leu Tyr Tyr His Val Phe Arg Arg Ile Ser Lys Gln His His His His 115 120 125 His His 130 <210> 88 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 88 Gly Gly Ser Ser 1 <210> 89 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 89 Gly Gly Gly Ser 1 <210> 90 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 90 Ser Gly Gly Gly 1 <210> 91 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 91 Gly Ser Gly Ser 1 <210> 92 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 92 Gly Gly Gly Gly Ser 1 5 <210> 93 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 93 Ser Gly Gly Gly Gly 1 5 <210> 94 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 94 Gly Gly Gly Gly Gly Ser 1 5 <210> 95 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 95 Ser Gly Gly Gly Gly Gly 1 5 <210> 96 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 96 Gly Gly Gly Gly Gly Gly Ser 1 5 <210> 97 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 97 Ser Gly Gly Gly Gly Gly Gly 1 5 <210> 98 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Annealing seq. for Rapamycin-nucleic acid prep. <400> 98 cccgtccccg ccgccct 17 <210> 99 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> SNAP_qPCR_Fw <400> 99 gtaatacgac tcactatagg gttaacttta ataaggag 38 <210> 100 <211> 233 <212> PRT <213> Artificial Sequence <220> <223> KRAS-FLAGSorHisTEV-Bio <400> 100 Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys 1 5 10 15 Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr 20 25 30 Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly 35 40 45 Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr 50 55 60 Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys 65 70 75 80 Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr 85 90 95 Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val 100 105 110 Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys 115 120 125 Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr 130 135 140 Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val 145 150 155 160 Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Gly Ser 165 170 175 Ser Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met 180 185 190 Thr Gly Gly Gly Gly Ser Ser His His His His His His Ser Ser Gly 195 200 205 Glu Asn Leu Tyr Phe Gln Gly Ser Gly Gly Gly Leu Asn Asp Ile Phe 210 215 220 Glu Ala Gln Lys Ile Glu Trp His Glu 225 230 <210> 101 <211> 205 <212> PRT <213> Artificial Sequence <220> <223> HAT-KRAS-nonbio <400> 101 Met Lys Asp His Leu Ile His Asn Val His Lys Glu Glu His Ala His 1 5 10 15 Ala His Ser Ser Gly Ser Leu Val Pro Arg Gly Ser Ser Gly Gly Ser 20 25 30 Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys Ser 35 40 45 Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr Asp 50 55 60 Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly Glu 65 70 75 80 Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr Ser 85 90 95 Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys Val 100 105 110 Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr Arg 115 120 125 Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val Leu 130 135 140 Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys Gln 145 150 155 160 Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr Ser 165 170 175 Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val Arg 180 185 190 Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly 195 200 205 <210> 102 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> GST-HisTEV-Bio <400> 102 Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro 1 5 10 15 Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 20 25 30 Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 35 40 45 Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys 50 55 60 Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn 65 70 75 80 Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu 85 90 95 Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser 100 105 110 Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 115 120 125 Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 130 135 140 Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 145 150 155 160 Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 165 170 175 Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr 180 185 190 Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala 195 200 205 Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser 210 215 220 His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly 225 230 235 240 Ser Gly Gly Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp 245 250 255 His Glu <210> 103 <211> 258 <212> PRT <213> Artificial Sequence <220> <223> GST-HisTEVAvi <400> 103 Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro 1 5 10 15 Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 20 25 30 Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 35 40 45 Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys 50 55 60 Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn 65 70 75 80 Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu 85 90 95 Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser 100 105 110 Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 115 120 125 Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 130 135 140 Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 145 150 155 160 Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 165 170 175 Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr 180 185 190 Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala 195 200 205 Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser 210 215 220 His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly 225 230 235 240 Ser Gly Gly Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp 245 250 255 His Glu <210> 104 <211> 254 <212> PRT <213> Artificial Sequence <220> <223> GST-SrtAHis <400> 104 Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro 1 5 10 15 Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 20 25 30 Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 35 40 45 Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys 50 55 60 Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn 65 70 75 80 Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu 85 90 95 Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser 100 105 110 Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 115 120 125 Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 130 135 140 Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 145 150 155 160 Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 165 170 175 Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr 180 185 190 Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala 195 200 205 Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser 210 215 220 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met Thr 225 230 235 240 Gly Gly Gly Gly Ser Ser His His His His His His His His 245 250 <210> 105 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> eSrtA <400> 105 Met Gln Ala Lys Pro Gln Ile Pro Lys Asp Lys Ser Lys Val Ala Gly 1 5 10 15 Tyr Ile Glu Ile Pro Asp Ala Asp Ile Lys Glu Pro Val Tyr Pro Gly 20 25 30 Pro Ala Thr Arg Glu Gln Leu Asn Arg Gly Val Ser Phe Ala Glu Glu 35 40 45 Asn Glu Ser Leu Asp Asp Gln Asn Ile Ser Ile Ala Gly His Thr Phe 50 55 60 Ile Asp Arg Pro Asn Tyr Gln Phe Thr Asn Leu Lys Ala Ala Lys Lys 65 70 75 80 Gly Ser Met Val Tyr Phe Lys Val Gly Asn Glu Thr Arg Lys Tyr Lys 85 90 95 Met Thr Ser Ile Arg Asn Val Lys Pro Thr Ala Val Glu Val Leu Asp 100 105 110 Glu Gln Lys Gly Lys Asp Lys Gln Leu Thr Leu Ile Thr Cys Asp Asp 115 120 125 Tyr Asn Glu Glu Thr Gly Val Trp Glu Thr Arg Lys Ile Phe Val Ala 130 135 140 Thr Glu Val Lys Leu Glu His His His His His His 145 150 155 <210> 106 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Sor-sp11-L12 <400> 106 Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr Ser Glu Lys 1 5 10 15 Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala Gly Ile Thr 20 25 30 Asp Ala Ser 35 <210> 107 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Sor-sp10-12 <400> 107 Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Met Asp Leu Pro 1 5 10 15 Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp Leu Asn 20 25 30 <210> 108 <211> 228 <212> PRT <213> Artificial Sequence <220> <223> KRAS-sp11 <400> 108 Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys 1 5 10 15 Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr 20 25 30 Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly 35 40 45 Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr 50 55 60 Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys 65 70 75 80 Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr 85 90 95 Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val 100 105 110 Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys 115 120 125 Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr 130 135 140 Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val 145 150 155 160 Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Gly Ser 165 170 175 Ser Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met 180 185 190 Thr Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr Ser Glu 195 200 205 Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala Gly Ile 210 215 220 Thr Asp Ala Ser 225 <210> 109 <211> 225 <212> PRT <213> Artificial Sequence <220> <223> KRAS-sp10 <400> 109 Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys 1 5 10 15 Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr 20 25 30 Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly 35 40 45 Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr 50 55 60 Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys 65 70 75 80 Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr 85 90 95 Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val 100 105 110 Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys 115 120 125 Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr 130 135 140 Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val 145 150 155 160 Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Gly Ser 165 170 175 Ser Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met 180 185 190 Thr Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Met Asp Leu 195 200 205 Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp Leu 210 215 220 Asn 225 <210> 110 <211> 272 <212> PRT <213> Artificial Sequence <220> <223> GST-sp10 <400> 110 Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro 1 5 10 15 Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu 20 25 30 Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu 35 40 45 Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys 50 55 60 Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn 65 70 75 80 Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu 85 90 95 Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser 100 105 110 Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu 115 120 125 Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn 130 135 140 Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp 145 150 155 160 Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu 165 170 175 Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr 180 185 190 Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala 195 200 205 Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser 210 215 220 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met Thr 225 230 235 240 Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Met Asp Leu Pro 245 250 255 Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp Leu Asn 260 265 270 <210> 111 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> DNA library <220> <221> misc_feature <222> (50)..(52) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (53)..(55) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (56)..(58) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (59)..(61) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (62)..(64) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (65)..(67) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (68)..(70) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (71)..(73) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (74)..(76) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <400> 111 gtaatacgac tcactatagg gttaacttta ataaggagat ataaatatgn nnnnnnnnnn 60 nnnnnnnnnn nnnnnntagc cgaccggcac cggcaccggc aaaaaaa 107 <210> 112 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> qPCR primer_Fw <400> 112 gtaatacgac tcactatagg gttaacttta ataaggag 38 <210> 113 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> qPCR primer_Rv <400> 113 tttttttgcc ggtgccggtg ccggtcggct a 31 <210> 114 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> FKBP-HisTEVAvi <400> 114 Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe 1 5 10 15 Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu 20 25 30 Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys 35 40 45 Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val 50 55 60 Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp 65 70 75 80 Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala 85 90 95 Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Ser Ser 100 105 110 Leu Pro Met Thr Gly Gly Gly Gly Ser Ser His His His His His His 115 120 125 Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly Ser Gly Gly Gly Leu Asn 130 135 140 Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu 145 150 155 <210> 115 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> FKBP-SrtAHis <400> 115 Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe 1 5 10 15 Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu 20 25 30 Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys 35 40 45 Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val 50 55 60 Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp 65 70 75 80 Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala 85 90 95 Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Ser Ser 100 105 110 Leu Pro Met Thr Gly Gly Gly Gly Ser Ser His His His His His His 115 120 125 Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly Ser Gly Gly Gly Leu Asn 130 135 140 Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu 145 150 155 <210> 116 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> sortase recognition sequence <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be any naturally occurring amino acid <400> 116 Leu Pro Xaa Thr Gly 1 5 <210> 117 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Fw-primer <400> 117 gtaatacgac tcactatagg gttaacttta agaaggaga 39 <210> 118 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Rv-primer <400> 118 tttgtccccg ccgccctatc gccggtgccg gtgccggtcg gct 43 <210> 119 <211> 104 <212> DNA <213> Artificial Sequence <220> <223> v9case1 lib <220> <221> misc_feature <222> (50)..(52) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (53)..(55) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (56)..(58) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (59)..(61) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (62)..(64) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (65)..(67) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (68)..(70) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <220> <221> misc_feature <222> (71)..(73) <223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act, gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg, or ggt <400> 119 gtaatacgac tcactatagg gttaacttta ataaggagat ataaatatgn nnnnnnnnnn 60 nnnnnnnnnn nnntagccga ccggcaccgg caccggcaaa aaaa 104 <210> 120 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> v7c1 ID45_9 (ATG) <220> <221> misc_feature <222> (50)..(52) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (53)..(55) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (56)..(58) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (59)..(61) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (62)..(64) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (65)..(67) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (68)..(70) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (71)..(73) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (74)..(76) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <400> 120 gtaatacgac tcactatagg gttaacttta agaaggagat atacatatgn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnatgc cgaccggcac cggcaccggc gatagggcgg cggggacaaa 120 <210> 121 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> v7c1 ID45_9 (TAG) <220> <221> misc_feature <222> (50)..(52) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (53)..(55) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (56)..(58) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (59)..(61) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (62)..(64) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (65)..(67) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (68)..(70) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (71)..(73) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <220> <221> misc_feature <222> (74)..(76) <223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa, gct, ggt, gta, tgc, tgg, or ttt <400> 121 gtaatacgac tcactatagg gttaacttta agaaggagat atacatatgn nnnnnnnnnn 60 nnnnnnnnnn nnnnnntagc cgaccggcac cggcaccggc gatagggcgg cggggacaaa 120 <210> 122 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> v7c1 ID45_9 (ATG) <220> <221> misc_feature <222> (32)..(34) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (35)..(37) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (38)..(40) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (41)..(43) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (44)..(46) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (47)..(49) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (50)..(52) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (53)..(55) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (56)..(58) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <400> 122 ggguuaacuu uaagaaggag auauacauau gnnnnnnnnn nnnnnnnnnn nnnnnnnnau 60 gccgaccggc accggcaccg gcgauagggc ggcggggaca aa 102 <210> 123 <211> 102 <212> RNA <213> Artificial Sequence <220> <223> v7c1 ID45_9 (TAG) <220> <221> misc_feature <222> (32)..(34) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (35)..(37) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (38)..(40) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (41)..(43) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (44)..(46) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (47)..(49) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (50)..(52) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (53)..(55) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <220> <221> misc_feature <222> (56)..(58) <223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa, gcu, ggu, gua, ugc, ugg, or uuu <400> 123 ggguuaacuu uaagaaggag auauacauau gnnnnnnnnn nnnnnnnnnn nnnnnnnnua 60 gccgaccggc accggcaccg gcgauagggc ggcggggaca aa 102 <210> 124 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> GS linker <400> 124 Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser 1 5 10

Claims

이하 (1) 및 (2)의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법:
(1) 제1 부분에 연결된 상기 제1 표적 분자, 제2 부분에 연결된 상기 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정; 및
(2) 공정(1) 후에, 상기 제1 부분과 상기 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체를 회수하는 공정.
제 1 항에 있어서,
공정(2) 후에, 회수된 복합체에 포함되는 후보 분자를 동정하는 공정(공정(3))을 추가로 포함하는, 방법.
제 1 항 또는 제 2 항에 있어서,
상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하는 분자인, 방법.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응하지 않는 분자인, 방법.
제 2 항 내지 제 4 항 중 어느 한 항에 있어서,
공정(2)와 공정(3) 사이에, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체로부터 상기 후보 분자를 용출하는 공정(공정(2A))을 추가로 포함하는, 방법.
제 5 항에 있어서,
공정(3)이, 공정(2A)에서 용출된 후보 분자를 인코드하는 폴리뉴클레오타이드의 서열을 결정하는 것을 포함하는, 방법.
제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
공정(1) 및 (2)를 복수회 반복하는 공정을 포함하는, 방법.
제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
in vitro로 행해지는, 방법.
제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
상기 라이브러리가, 디스플레이 라이브러리 또는 DNA 인코드 라이브러리인, 방법.
제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 라이브러리가, 1×10⁴ 이상의 다양성을 갖는 라이브러리인, 방법.
제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
상기 단백질이, GFP, 루시페라아제, 유비퀴틴, 또는 SNAP 태그인, 방법.
제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
상기 어피니티를 이용한 방법이, 풀다운법인, 방법.
제 5 항 내지 제 12 항 중 어느 한 항에 있어서,
공정(2A)에 있어서의 용출이, 효소, 또는 열에 의해 행해지는, 방법.
제 5 항 내지 제 13 항 중 어느 한 항에 있어서,
공정(2A)에 있어서의 용출이, 상기 단백질의 제1 부분과 상기 제1 표적 분자 사이에 위치하는 제1 링커, 및 상기 단백질의 제2 부분과 상기 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 것에 의해 행해지는, 방법.
제 1 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 방법;
(a) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열,
(b) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.