KR20180132081A

KR20180132081A - 돌연변이체 포어

Info

Publication number: KR20180132081A
Application number: KR1020187029957A
Authority: KR
Inventors: 라크말 자야싱; 마크 브루스; 루크 멕네일; 라미즈 이큐발 나타니; 프라티크 레이즈 싱; 네일 로저 우드; 스테판 로버트 영
Original assignee: 옥스포드 나노포어 테크놀로지즈 리미티드
Priority date: 2016-04-06
Filing date: 2017-04-06
Publication date: 2018-12-11
Also published as: US20220064230A1; EP3440098A1; CN116514944A; CN118256605A; EP3440098B1; EP4397970A2; EP4122949B1; US11939359B2; KR102472805B1; US20190202876A1; CA3212147A1; JP2022095668A; CN118326019A; AU2017246690B2; CA3020203A1; CN118326018A; CN118272512A; EP4122949A1; WO2017174990A1; JP2019520035A

Abstract

본 발명은 라이세닌의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 라이세닌의 돌연변이체 형태를 사용하는 피분석물의 특성규명에 관한 것이다.

Description

돌연변이체 포어

본 발명은 라이세닌(lysenin)의 돌연변이체 형태에 관한 것이다. 본 발명은 또한 라이세닌의 돌연변이체 형태를 사용하는 피분석물 특징화(characterisation)에 관한 것이다

나노포어 감지는 피분석물 분자와 수용체 사이의 개별 결합 또는 상호작용 반응의 관찰에 의존하는 감지 접근법이다. 나노포어 센서는 절연막에 나노미터 치수의 단일 포어를 배치하고, 피분석물 분자의 존재하에 포어를 통해 전압-유도된 이온성 수송을 측정함으로써 생성될 수 있다. 분석물의 신원은 그의 구별되는 전류 특징, 전류 블록의 지속 기간과 범위 및 전류 수준의 변동을 통해 드러난다. 이러한 나노포어 센서는 상업적으로 입수가능하며, 예를 들어 Oxford Nanopore Technologies Ltd에 의해 판매되는 MinION^TM 디바이스는 전자 칩 내에 통합된 복수의 나노포어를 포함한다.

광범위한 응용 분야에 걸쳐 신속하고 저렴한 핵산(예를 들어, DNA 또는 RNA) 서열분석 기술이 현재 필요하다. 현존하는 기술은 증폭 기술에 의존하여 큰 용적의 핵산을 생성하고 신호 검출을 위한 다량의 전문 형광 화학물질이 필요하기 때문에 느리고 주로 비용이 많이 든다. 나노포어 감지는 요구되는 뉴클레오타이드 및 시약의 양을 줄임으로써 신속하고 저렴한 핵산 서열분석을 제공할 수 있는 가능성을 가지고 있다.

나노포어 감지를 사용하는 핵산 서열분석의 필수적인 성분 중 하나는 포어를 통한 핵산 이동 제어이다. 또다른 성분은 핵산 폴리머가 포어를 통해 이동함에 따른 뉴클레오타이드의 식별이다. 과거에는 뉴클레오타이드 식별을 달성하기 위해 핵산이 헤몰라이신의 돌연변이체를 통과했다. 이것은 서열의존적인 것으로 보여지는 전류 특징을 제공했다. 헤몰라이신 포어가 사용될때 관찰된 전류에 많은 수의 뉴클레오타이드가 기여하여, 관찰된 전류와 폴리뉴클레오타이드 간의 직접적인 관계를 보다 도전적으로 만든다는 것이 또한 밝혀졌다.

뉴클레오타이드 식별을 위한 전류 범위는 헤몰라이신 포어의 돌연변이를 통해 향상되었지만, 뉴클레오타이드들 사이의 전류 차이가 더 향상될 수 있다면 서열분석 시스템이 더 높은 성능을 보일 것이다. 또한, 핵산이 포어를 통해 이동될 때, 일부 전류 상태는 높은 편차를 나타낸다는 것이 관찰되었다. 일부 돌연변이체 헤몰라이신 포어는 다른 것보다 높은 편차를 보이는 것으로 나타났다. 이러한 상태의 편차에는 서열 특정 정보가 포함될 수 있지만, 시스템을 간소화하기 위해 편차가 낮은 포어를 생성하는 것이 바람직하다. 또한, 관찰된 전류에 기여하는 뉴클레오타이드의 수를 감소시키는 것이 바람직하다.

라이세닌(efL1로도 알려짐)은 지렁이 줄지렁이(Eisenia fetida)의 체강 유체에서 정제된 포어-형성 독소이다. 그것은 라이세닌-유도된 용혈을 억제하는 스핑고미엘린에 특이적으로 결합한다(Yamaji 등, J. Biol. Chem. 1998; 273(9): 5300-6). 라이세닌 모노머의 결정 구조는 De Colbis 등, Structure, 2012; 20: 1498-1507에 개시되어 있다.

발명의 요약

본 발명자들은 놀랍게도 폴리뉴클레오타이드와 상호작용하는 모노머의 능력을 향상시키기 위해 하나 이상의 변형이 이루어져있는 새로운 돌연변이체 라이세닌 모노머를 확인하였다. 본 발명자들은 놀랍게도 신규한 돌연변이체 모노머를 포함하는 포어가 폴리뉴클레오타이드와 상호작용하는 향상된 능력을 가지며, 따라서 폴리뉴클레오타이드의 서열과 같은 특성을 평가하기 위한 개선된 특성을 나타내는 것을 실증하였다. 돌연변이체 포어는 놀랍게도 개선된 뉴클레오타이드 식별력을 나타낸다. 특히 돌연변이체 포어는 놀랍게도 증가된 전류 범위를 나타내어, 서로 상이한 뉴클레오타이드를 식별별하기 쉬워졌으며, 상태의 편차가 감소하여 신호-대-잡음비가 높아졌다. 또한, 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수가 감소된다. 이것은 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 관찰된 전류와 폴리뉴클레오타이드 사이의 직접적인 관계를 확인하는 것을 용이하게 한다.

본원에 개시된 모든 아미노산 치환, 결실 및/또는 첨가는 달리 언급되지 않는 한, 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머와 관련된다.

서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머에 대한 언급은 서열번호: 14 내지 16에 나타낸 바와 같은 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 포함한다. 아미노산 치환, 결실 및/또는 첨가는 서열번호: 2에 대해 본원에 개시된 치환, 결실 및/또는 첨가와 균등한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 라이세닌 모노머에 대해 이루어졌다.

돌연변이체 모노머는 단리된 모노머로 간주될 수 있다.

따라서, 본 발명은 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 변이체는 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함한다.

본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 치환체 중 하나 이상을 포함한다:

D35N/S;

S74K/R;

E76D/N;

S78R/K/N/Q;

S80K/R/N/Q;

S82K/R/N/Q;

E84R/K/N/A;

E85N;

S86K/Q;

S89K;

M90K/I/A;

E92D/S;

E94D/Q/G/A/K/R/S/N;

E102N/Q/D/S;

T104R/K/Q;

T106R/K/Q;

R115S;

Q117S; 및

N119S.

본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 중 하나 이상에 돌연변이를 포함한다:

D35/E94/T106;

K37/E94/E102/T106;

K37/E94/T104/T106;

K37/E94/T106;

K37/E94/E102/T106;

G43/E94/T106;

K45/V47/E92/E94/T106;

K45/V47/E94/T106;

K45/S49/E92/E94/T106;

K45/S49/E94/T106;

K45/E94/T106;

K45/T106;

V47/E94/T106;

V47/V88/E94/T106;

S49/E94/T106;

T51/E94D/T106;

S74/E94;

E76/E94;

S78/E94;

Y79/E94;

S80/E94;

S82/E94;

S82/E94/T106;

H83/E94;

H83/E94/T106;

E85/E94/T106;

S86/E94;

V88/M90/E94/T106;

S89/E94;

M90/E94/T106;

T91/E94/T106;

E92/E94/T106;

T93/E94/T106;

E94/Y96/T106;

E94/S98/K99/T106;

E94/K99/T106;

E94/E102;

E94/T104;

E94/T106;

E94/P108;

E94/P109;

E94/T110;

E94/S111;

E94/T114;

E94/R115;

E94/Q117; 및

E94/E119.

E84R/E94D;

E84K/E94D;

E84N/E94D;

E84A/E94Q;

E84K/E94Q 및

E94Q/D121S.

본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 변이체는 하기 치환체 조합 중 하나를 포함한다:

- E84Q/E85K/E92Q/E94D/E97S/D126G;

- E84Q/E85K/E92Q/E94Q/E97S/D126G; 또는

- E84Q/E85K/E92Q/E94D/E97S/T106K/D126G.

본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 변이체에서 (a) 서열번호: 2의 34 내지 70번 위치 또는 이들 위치에 상응하는 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되고, (b) 서열번호: 2의 71 내지 107번 위치 또는 이들 위치에 상응하는 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되었다.

본 발명은 또한 하기를 제공한다:

- 라이세닌으로부터 유래된 2개 이상의 공유결합된 모노머를 포함하는 작제물로서, 모노머 중 적어도 하나가 본 발명의 돌연변이체 라이세닌 모노머인, 작제물;

- 본 발명의 돌연변이체 라이세닌 모노머 또는 본 발명의 유전적으로 융합된 작제물을 암호화하는 폴리뉴클레오타이드;

- 본 발명의 충분한 수의 돌연변이체 라이세닌 모노머를 포함하는 라이세닌으로부터 유래된 호모-올리고머성 포어;

- 본 발명의 적어도 하나의 돌연변이체 라이세닌 모노머를 포함하는 라이세닌으로부터 유래된 헤테로-올리고머성 포어;

- 본 발명의 적어도 하나의 작제물을 포함하는 포어;

- (a) 표적 피분석물이 포어를 통해 이동하도록 상기 표적 피분석물을 본 발명의 포어와 접촉시키는 단계; 및 (b) 상기 포어에 대해 상기 피분석물이 이동할 때 하나 이상의 측정값을 취하는 단계로서, 상기 측정값은 상기 표적 피분석물의 하나 이상의 특징을 나타내며, 그렇게 함으로써 상기 표적 피분석물을 특징화하는 단계를 포함하는 표적 피분석물의 특징화 방법;

- 본 발명의 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성하여 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 형성하는 단계를 포함하는, 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 형성하는 방법;

- 본 발명의 포어와 폴리뉴클레오타이드 결합 단백질 사이의 복합체를 포함하는, 표적 폴리뉴클레오타이드를 특징화하기 위한 센서;

- 표적 피분석물을 특징화하기 위해 본 발명의 포어를 사용하는 단계;

- (a) 본 발명의 포어 및 (b) 막을 포함하는, 표적 폴리뉴클레오타이드를 특징화하기 위한 키트;

- (a) 본 발명의 복수의 포어 및 (b) 복수의 폴리뉴클레오타이드 결합 단백질을 포함하는, 샘플내 표적 폴리뉴클레오타이드를 특징화하기 위한 장치;

- 본 발명의 하나 이상의 변형 및/또는 치환을 생성하는 단계를 포함하는, 폴리뉴클레오타이드를 특징화하기 위한 서열번호: 2에 나타낸 서열을 포함하는 라이세닌 모노머의 능력을 개선시키는 방법;

- 라이세닌으로부터 유래된 하나 이상의 모노머에 본 발명의 적어도 하나의 돌연변이체 라이세닌 모노머를 공유결합시키는 단계를 포함하는, 본 발명의 작제물을 생성하는 방법; 및

- 본 발명의 적어도 하나의 돌연변이체 모노머 또는 본 발명의 적어도 하나의 작제물을 본 발명의 충분한 수의 모노머, 본 발명의 작제물 또는 라이세닌으로부터 유래된 모노머로 올리고머화시켜 포어를 형성하는 단계를 포함하는, 본 발명의 포어를 형성하는 방법.

도 1은 라이세닌 돌연변이체 1의 중앙 플롯을 도시한다.
도 2는 라이세닌 돌연변이체 10의 중앙 플롯을 도시한다.
도 3은 라이세닌 돌연변이체-라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)의 중앙 플롯을 도시한다.
도 4는 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드에 의한 라이세닌 돌연변이체- 라이세닌 - (E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9의 중앙 플롯을 도시한다.
도 5는 실시예에 사용된 어댑터를 도시한다. A는 30 iSpC3에 상응한다. B는 서열번호: 19에 상응한다. C는 4 iSp18에 상응한다. D는 서열번호: 20에 상응한다. E는 그의 5' 말단에 부착된 5BNA-G//iBNA-G//iBNA-T//iBNA-T//i-BNA-A를 갖는 서열번호: 21에 상응한다. F는 5' 포스페이트를 갖는 서열번호: 22에 상응한다. G는 서열번호: 24에 상응한다. H는 콜레스테롤에 상응한다.
도 6은 라이세닌의 모노머의 3D 구조를 도시한다. 스핑고미엘린 함유 막과 상호작용할 때, 라이세닌 모노머는 함께 어셈블리되어 중간 예비-포어를 통해 노나머 포어를 형성한다. 어셈블리 과정 동안, 흑색으로 표시된 폴리펩타이드 섹션(서열번호: 2의 아미노산 65 내지 74에 상응함)은 도 7에 도시된 베타 배럴의 바닥 루프로 전환된다. 흑색으로 표시된 폴리펩타이드 섹션의 한쪽 상의 2개의 베타 시트 및 흑색으로 표시된 폴리펩타이드 섹션에 상기 베타 시트를 연결하는 폴리펩타이드 섹션(서열번호: 2의 아미노산 34 내지 64 및 75 내지 107에 상응함)은 도 7에 도시된 포어의 베타 배럴을 형성하도록 연장한다. 이러한 큰 구조적 변화는 모노머 구조를 연구하여 라이세닌 포어의 베타 배럴 영역을 예측하는 것을 어렵게 만든다.
도 7은 라이세닌 포어의 영역을 도시한다. 도 7a는 라이세닌의 노노머 포어의 3D 구조를 도시하고, 도 7b는 라이세닌 포어로부터 취해진 모노머의 구조를 도시한다. 각각의 모노머는 라이세닌 포어의 배럴에 2개의 베타 시트를 제공한다. 베타 시트(서열번호: 2의 아미노산 34 내지 64 및 75 내지 107에 상응하는 아미노산을 함유함)는 포어의 바닥에서 비구조적 루프(서열번호: 2의 위치 65 내지 74에 상응하는 아미노산)에 의해 연결된다.
도 8은 3개의 라이세닌 관련된 단백질의 아미노산 서열(서열번호: 14 내지 16)을 갖는 라이세닌의 아미노산 서열(서열번호: 2)의 정렬이다. 라이세닌과 밀접하게 관련된 서열을 갖는 3개의 라이세닌 동족체는 비-중복 단백질 서열의 데이터베이스를 사용하여 BLAST 검색을 수행함으로써 확인되었다. 라이세닌 관련된 단백질 1(LRP1), 라이세닌 관련된 단백질 2(LRP2) 및 라이세닌 관련된 단백질 3(LRP3)의 단백질 서열은 라이세닌의 서열과 정렬되어 4개의 단백질의 유사성을 보여 주었다. 진한 회색 음영은 동일한 아미노산이 4개의 모든 서열에 존재하는 위치를 나타낸다. LRP1은 라이세닌과 대략 75% 동일하고, LRP2는 라이세닌과 대략 88% 동일하며, 및 LRP3은 라이세닌과 대략 79% 동일하다.
서열목록의 설명
서열번호: 1은 라이세닌 모노머를 암호화하는 폴리뉴클레오타이드 서열을 나타낸다.
서열번호: 2는 라이세닌 모노머의 아미노산 서열을 나타낸다.
서열번호: 3은 Phi29 DNA 폴리머라제를 암호화하는 폴리뉴클레오타이드 서열을 나타낸다.
서열번호: 4는 Phi29 DNA 폴리머라제의 아미노산 서열을 나타낸다.
서열번호: 5는 E. coli로부터의 sbcB 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 E. coli로부터의 엑소뉴클레아제 I 효소(EcoExo I)를 암호화한다.
서열번호: 6은 E. coli로부터의 엑소뉴클레아제 I 효소(EcoExo I)의 아미노산 서열을 나타낸다.
서열번호: 7은 E. coli로부터의 xthA 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 이것은 E. coli로부터 엑소뉴클레아제 Ⅲ 효소를 암호화한다.
서열번호: 8은 E. coli로부터의 엑소뉴클레아제 Ⅲ 효소의 아미노산 서열을 나타낸다. 이 효소는 3'-5' 방향으로 이중 가닥 DNA(dsDNA)의 한 가닥으로부터 5' 모노포스페이트 뉴클레오사이드의 분배적 소화를 수행한다. 가닥 상의 효소 개시는 대략 4개의 뉴클레오타이드의 5' 돌출부(overhang)를 필요로 한다.
서열번호: 9는 T. 테모필러스(thermophilus)로부터의 recJ 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 T. 테모필러스의 RecJ 효소(TthRecJ-cd)를 암호화한다.
서열번호: 10은 T. 테모필러스로부터의 RecJ 효소(TthRecJ-cd)의 아미노산 서열을 나타낸다. 이 효소는 5'-3' 방향으로 ssDNA에서 5' 모노포스페이트 뉴클레오사이드의 진행적 소화를 수행한다. 가닥에서의 효소 개시는 적어도 4개의 뉴클레오타이드를 필요로 한다.
서열번호: 11은 박테리오파아지 람다 exo(redX) 유전자로부터 유래된 코돈 최적화된 폴리뉴클레오타이드 서열을 나타낸다. 그것은 박테리오파아지 람다 엑소뉴클레아제를 암호화한다.
서열번호: 12는 박테리오파아지 람다 엑소뉴클레아제의 아미노산 서열을 나타낸다. 그 서열은 삼량체로 어셈블리하는 3개의 동일한 하위단위 중 하나이다. 효소는 5'-3' 방향에서 dsDNA의 한 가닥으로부터 뉴클레오타이드의 고도의 진행적 소화를 수행한다(http://www.neb.com/nebecomm/products/productM0262.asp). 가닥상의 효소 개시는 5' 포스페이트를 갖는 대략 4개의 뉴클레오타이드의 5' 돌출부를 우선적으로 필요로 한다.
서열번호: 13은 Hel308 Mbu의 아미노산 서열을 나타낸다.
서열번호: 14는 라이세닌 관련된 단백질(LRP) 1의 아미노산 서열을 나타낸다.
서열번호: 15는 라이세닌 관련된 단백질(LRP) 2의 아미노산 서열을 나타낸다.
서열번호: 16은 라이세닌 관련된 단백질(LRP) 3의 아미노산 서열을 나타낸다.
서열번호: 17은 활성화된 버전의 파라스포린(parasporin)-2의 아미노산 서열을 나타낸다. 전장 단백질은 아미노 및 카복시 말단에서 절단되어 포어를 형성할 수 있는 활성화된 버전을 형성한다.
서열번호: 18은 Dda 1993의 아미노산 서열을 나타낸다.
서열번호: 19 내지 24는 실시예에서 사용된 폴리뉴클레오타이드 서열을 나타낸다.

개시된 생성물 및 방법의 상이한 적용이 당해 분야의 특정 요구에 맞춰질 수 있음을 이해해야 한다. 본 명세서에서 사용된 용어는 단지 본 발명의 특정 구현예를 설명하기 위한 것이며, 단지 본 발명을 제한하고자 하는 것이 아님을 이해해야 한다.

본 명세서 및 첨부된 청구범위에서 사용된 것과 같이, 단수 형태는 내용이 명확하게 달리 지시하지 않는한 복수의 지시대상을 포함한다. 따라서, 예를 들어, "돌연변이체 모노머"에 대한 언급은 "돌연변이체 모노머들"을 포함하고, "치환체"에 대한 언급은 2종 이상의 상기 치환체들을 포함하고, "포어"에 대한 언급은 2종 이상의 상기 포어를 포함하고, "폴리뉴클레오타이드"에 대한 언급은 2종 이상의 상기 폴리뉴클레오타이드를 포함하며, 등등이다.

본 명세서에서, 특정 위치에서 상이한 아미노산이 기호 "/"로 분리되는 경우, /기호 "/"는 "또는"을 의미한다. 예를 들어, P108R/K는 P108R 또는 P108K를 의미한다. 본 명세서에서, 상이한 위치 또는 상이한 치환이 기호 "/"에 의해 분리되는 경우, 기호 "/"는 "및"을 의미한다. 예를 들어, E94/P108은 E94 및 P108을 의미하거나, E94D/P108K는 E94D 및 P108K를 의미한다.

본 명세서에 인용된 모든 공보, 특허 및 특허 출원은 상기한 바와 같이 또는 그 이하의 것을 포함하여 그 전체가 본원에 참고로 포함된다.

돌연변이체 라이세닌 모노머

일 양태에서, 본 발명은 돌연변이체 라이세닌 모노머를 제공한다. 돌연변이체 라이세닌 모노머는 본 발명의 포어를 형성하는데 사용될 수 있다. 돌연변이체 라이세닌 모노머는 야생형 라이세닌 모노머(예를 들어, 서열번호: 2, 서열번호: 14, 서열번호: 15 또는 서열번호: 16)의 서열과 상이한 서열을 갖는 모노머이다. 돌연변이체 라이세닌 모노머는 전형적으로 본 발명의 다른 모노머 또는 라이세닌으로부터의 또는 라이세닌으로부터 유래된 다른 모노머의 존재하에 포어를 형성하는 능력을 보유한다. 따라서, 돌연변이체 모노머는 전형적으로 포어를 형성할 수 있다. 포어를 형성하는 돌연변이체 모노머의 능력을 확인하기 위한 방법은 당해 분야에 잘 알려져 있으며, 실시예에 기재되어 있다. 예를 들어, 전기생리학에 의해 포어의 형성이 측정된다. 포어는 전형적으로, 예를 들어 지질 막 또는 블록 코-폴리머 막일 수 있는 막에 삽입된다. 전기 또는 광학 측정은 막에 삽입된 본 발명의 하나 이상의 모노머를 포함하는 포어와 같은 단일 라이세닌 포어로부터 획득될 수 있다. 전위차가 막을 가로질러 가해질 수 있고, 막을 통과하는 전류 흐름이 검출될 수 있다. 전류 흐름은 전기적 또는 광학적 수단과 같은 임의의 적합한 방법에 의해 검출될 수 있다. 포어가 폴리뉴클레오타이드, 바람직하게는 단일가닥 폴리뉴클레오타이드를 전위시키는 능력은 폴리뉴클레오타이드 결합 단백질, DNA, 연료(예를 들어, MgCl2, ATP) 예비-혼합물을 첨가하고, 전위차(예를 들어, 180mV)를 적용하고, 및 폴리뉴클레오타이드 결합 단백질-제어된 DNA 이동을 검출하기 위해 포어를 통한 전류 흐름을 모니터링함으로써 결정될 수 있다.

돌연변이체 모노머는 포어에 존재할 때 폴리뉴클레오타이드와 상호작용하는 능력이 변경된다. 따라서, 하나 이상의 돌연변이체 모노머를 포함하는 포어는 개선된 뉴클레오타이드 판독 특성을 가지며, 예를 들어 (1) 개선된 폴리뉴클레오타이드 포착 및 (2) 개선된 폴리뉴클레오타이드 인식 또는 식별을 나타낸다. 특히, 돌연변이체 모노머로부터 제조된 포어는 야생형보다 더 쉽게 뉴클레오타이드 및 폴리뉴클레오타이드를 포획한다. 또한, 돌연변이체 모노머로 제조된 포어는 증가된 전류 범위를 나타내어, 서로 상이한 뉴클레오타이드를 쉽게 구별할 수 있게 되고, 상태의 변차가 감소되어 신호-대-잡음비가 높아진다. 또한, 폴리뉴클레오타이드가 돌연변이체로부터 형성된 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수가 감소된다. 이것은 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 관측된 전류와 폴리뉴클레오타이드 사이의 직접적인 관계를 확인하는 것을 용이하게 한다. 돌연변이체의 개선된 뉴클레오타이드 판독 특성은 5개의 주요 기전을 통해, 즉 하기의 변화에 의해 달성된다:

· 입체 장애(아미노산 잔기의 크기를 증가 또는 감소시킴);

· 전하(예를 들어, -ve 전하의 도입 또는 제거 및/또는 +ve 전하의 도입 또는 제거)

· 수소 결합(예를 들어, 염기쌍에 수소 결합할 수 있는 아미노산 도입)

· π 스태킹(예를 들어, 비국소화된 전자 pi 시스템을 통해 상호작용하는 아미노산을 도입함); 및/또는

. (예를 들어 배럴 또는 채널의 크기를 증가시키는 아미노산을 도입하는) 포어의 구조 변경.

상기 5가지 기전 중 임의의 하나 이상이 본 발명의 돌연변이체 모노머로부터 형성된 포어의 개선된 특성을 담당할 수 있다. 예를 들어, 본 발명의 돌연변이체 모노머를 포함하는 포어는 변경된 입체 장애, 변경된 수소 결합 및 변경된 구조의 결과로서 개선된 뉴클레오타이드 판독 특성을 나타낼 수 있다.

본 발명의 돌연변이체 모노머는 서열번호: 2에 나타낸 서열의 변이체를 포함한다. 서열번호: 2는 라이세닌 모노머의 야생형 서열이다. 서열번호: 2의 변이체는 서열번호: 2의 아미노산 서열과 상이한 아미노산 서열을 갖는 폴리펩타이드이다. 전형적으로 변이체는 그의 포어 형성 능력을 보유한다.

S80, T106, T104에서의 치환을 포함하는 하나 이상의 돌연변이체 모노머를 포함하는 포어는 개선된 폴리뉴클레오타이드 포획을 나타낸다. 상기 치환의 특정 예는 S80K/R, T104R/K 및 T106R/K를 포함한다. 이들 위치 중 임의의 하나 이상, 예컨대, 2, 3, 4 또는 5에서 아미노산 측쇄의 양전하를 증가시키는 상기 위치에서의 다른 치환은 돌연변이체 모노머를 포함하는 포어의 특성을 개선시키고, 즉 야생형 포어 또는 E84Q/E85K/E92Q/E97S/D126G와 같은 다른 포획 증진 돌연변이를 포함하는 돌연변이체 모노머를 포함하는 포어, 예를 들어 상기 돌연변이만을 포함하는 돌연변이체 모노머 또는 하기의 돌연변이 E84Q/E85K/E92Q/E94D/E97S/D126G를 포함하는 돌연변이체 모노머와 비교하여, 폴리뉴클레오타이드의 포획을 개선시키는데 사용될 수 있다. 전형적으로, 개선이 E84Q/E85K/E92Q/E97S/D126G 또는 E84Q/E85K/E92Q/E94D/E97S/D126G와 같은 다른 돌연변이를 포함하는 포어에 대해 결정되는 경우, 이들 돌연변이는 시험되는 돌연변이체 모노머, 즉 돌연변이 또는 돌연변이의 조합의 효과가 시험 위치(들)에서 시험되는 모노머/포어와 동일한 기준선 모노머/포어와 관련하여 결정된다. 돌연변이체 모노머 또는 대조군 모노머를 포함하는 포어의 특성은 헤테로올리고머성 포어, 또는 보다 바람직하게는 호모올리고머성 포어를 사용하여 결정될 수 있다. 바람직한 돌연변이 조합의 예는 본 명세서 전반에 걸쳐, 예를 들어 표 9에 기재되어 있다.

D35, K37, K45, V47, S49, E76, S78, S82, V88, S89, M90, T91, E92, E94, Y96, S98, V100, T104에서의 치환을 포함하는 하나 이상의 돌연변이체 모노머를 포함하는 포어는 개선된 폴리뉴클레오타이드 인식 또는 식별력을 나타낸다. 이러한 치환의 특정 예로는 D35N, K37N/S, K45R/K/D/T/Y/N, V47K/R, S49K/R/L, T51KE76S/N, S78N, S82N, V88I, S89Q, M90I/A, T91S, E92D/E, E94D/Q/N, Y96D, S98Q, V100S 및 T104K가 있다. 이러한 돌연변이는 표 9에 설명된 바와 같이 각각 잡음을 감소시키고, 전류 범위를 증가시키며, 및/또는 채널 게이팅을 감소시킬 수 있다. 아미노산 측쇄의 크기를 증가 또는 감소시키고, 전하를 증가 또는 감소시키는 다른 돌연변이는 동일한 수소 결합 형성을 초래하며, 및/또는 서열번호: 2의 지정된 위치 또는 서열번호: 2의 변이체 내의 상응하는 위치에 형성되는 상기 예시적인 돌연변이 중 임의의 하나 이상과 동일한 방식으로 π 스태킹에 영향을 미칠 수 있다. 돌연변이는 개별적으로 또는 조합하여 도입할 수 있다. 예를 들어, 이들 위치 중 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 또는 18은 야생형 포어와 비교하여 폴리뉴클레오타이드 인식 또는 식별이 개선되도록 신호 대 잡음을 개선하고, 범위를 증가시키며 및/또는 채널 게이팅을 감소시키는 돌연변이체 모노머를 포함하는 포어, 돌연변이 E84Q/E85K/E92QE97S/D126G를 포함하는 돌연변이체 모노머, 예컨대 상기 돌연변이 단독, 돌연변이 E84Q/E85K/E92Q/E94D/E97S/D126G, 돌연변이 E84Q/E85K/E92Q/E94Q/E97S/D126G 및/또는 돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G을 포함하는 모노머를 포함하는 포어의 특성을 개선하도록 돌연변이될 수 있다. 전형적으로, E84Q/E85K/E92Q/E97S/D126G, E84Q/E85K/E92Q/E94D/E97S/D126G, E84Q/E85K/E92Q/E94Q/E97S/D126G 또는 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G와 같은 다른 돌연변이를 포함하는 포어에 대하여 개선이 측정되는 경우, 상기 돌연변이는 시험되는 돌연변이체 모노머에 또한 존재하며, 즉 돌연변이, 또는 돌연변이 조합의 효과(들)은 시험 위치(들)에서 다른 시험된 모노머/포어와 동일한 기준선 모노머/포어에 대하여 측정된다. 돌연변이체 모노머 또는 대조군 모노머를 포함하는 포어의 특성은 헤테로올리고머성 포어, 또는 보다 바람직하게는 호모올리고머성 포어를 사용하여 결정될 수 있다. 바람직한 돌연변이 조합의 예는 본 명세서 전반에 걸쳐, 예를 들어 표 9에 기재되어 있다.

E94 및/또는 Y96에서 치환체를 포함하는 하나 이상의 돌연변이체 모노머를 포함하는 포어는 폴리뉴클레오타이드가 야생형 포어 또는 돌연변이 E84Q/E85K/E92QE97S/D126G를 포함하는 돌연변이체 모노머를 포함하는 포어와 비교하여, 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수를 감소시킬 수 있다. 예를 들어, 치환 Y96D/E는 판독 헤드의 크기를 줄이기 위해, 바람직하게는 E94Q/D와 조합하여 이루어질 수 있다. 야생형 포어 또는 돌연변이 E84Q/E85K/E92QE97S/D126G를 포함하는 돌연변이체 모노머를 포함하는 포어와 비교하여 폴리뉴클레오타이드가 포어를 통해 이동함에 따라 전류에 기여하는 뉴클레오타이드의 수를 감소시키는 것은 포어의 배럴의 일부를 형성하는 모노머의 2개의 베타 가닥 각각으로부터 짝수의 아미노산(전형적으로 포어의 루멘내에 존재하는 아미노산 및 포어의 루멘으로부터 멀어지게 될 수 있는 인접한 아미노산), 즉, 본원에 기술된 바와 같이, 서열번호: 2의 아미노산 34 내지 65 및 74 내지 107에 상응하는 위치를 결실시킴으로써 달성될 수도 있다.

본 발명의 변형

본 발명은 라이세닌 포어에서 배럴의 구조에 기여하는 베타 시트의 아미노산 서열이 야생형 라이세닌과 비교하여, 및 당해 분야, 예를 들어 WO 2013//153359에 개시된 라이세닌 돌연변이체와 비교하여, 변형되는 돌연변이체 라이세닌 모노머를 제공한다. 본 발명의 변형은 서열번호: 2의 아미노산 34 내지 107, 특히 서열번호: 2의 아미노산 34 내지 65 및 74 내지 107에 상응하는 라이세닌 모모머의 영역에 존재한다. LR1, LR2 및 LR3 모노머의 상응하는 영역은 도 8의 정렬로 도시된다.

본 발명은 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 위치들 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114에서의 1개 이상, 예컨대 2 내지 22개, 3 내지 20개, 4 내지 15개, 5 내지 10개, 6, 7, 8 또는 9개의 변형을 포함한다. 변이체는 임의의 수 및 임의의 위치의 조합에서의 변형을 포함할 수 있다. 일 양태에서, 변형은 아미노산의 치환, 결실 또는 첨가일 수 있으며, 바람직하게는 치환 또는 결실 돌연변이이다. 바람직한 변형은 "추가의 변형"이라는 제목으로 아래에서 논의된다. 돌연변이체 라이세닌 모노머는 서열번호: 2의 다른 위치에서 변형을 포함할 수 있다. 예를 들어, 본 발명의 하나 이상, 예컨대 2 내지 20개, 3 내지 15개, 4 내지 10개 또는 6 내지 8개의 변형에 더해, 돌연변이체 라이세닌 모노머는 당해 분야, 예를 들어 WO 2013/153359에 기술된 서열번호: 2의 하나 또는 그 이상, 예컨대 2 내지 20개, 3 내지 15개, 4 내지 10개 또는 6 내지 8개의 아미노산 치환 또는 결실을 가질 수 있다.

변이체는 바람직하게는 하기 위치 T91, V95, Y96, S98, K99, V100, I101 및 K112 중 하나 이상에서의 변형을 포함한다. 이 변이체는 임의의 수와 위치의 임의의 조합에서 변형될 수 있다. 변형은 바람직하게는 세린(S) 또는 글루타민(Q)에 의한 치환이다. 변이체는 바람직하게는 T91S, V95S, Y96S, S98Q, K99S, V100S, I101S 및 K112S 중 하나 이상을 포함한다. 변이체는 임의의 수 및 이러한 치환의 임의의 조합을 포함할 수 있다.

변이체는 바람직하게는 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93, Y96, S98, K99, P108, P109, T110, S111 및 T114 중 하나 이상에서의 변형을 포함한다. 변이체는 임의의 수 및 위치의 임의의 조합에서의 변형을 포함할 수 있다. 변형은 아스파라긴(N), 트립토판(W), 세린(S), 글루타민(Q), 라이신(K), 아스파르트산(D), 아르기닌(R), 트레오닌(T), 티로신(Y), 류신(L) 또는 이소류신(I)에 의한 치환이다. 변이체는 바람직하게는 하나 이상의 치환체들 K37N/W/S/Q, G43K, K45D/R/N/Q/T/Y, V47K/S/N, S49K/L, T51K, H83S/K, V88I/T, T91K, T93K, Y96D, S98K, K99Q/L, P108K/R, P109K, T110K/R, S111K 및 T114K를 포함한다. 변이체는 바람직하게는 하기 위치 중 하나 이상에서의 변형을 포함한다:

E94/P108;

E94/P109;

E94/T110;

E94/P108;

E94D/T110R;

E94D/S111K;

E94D/T114K;

H83S/E94Q;

E94/K99/T106;

E94/T93/T106;

E94/T91/T106;

H83/E94/T106;

E94/Y96/T106;

K45/E94/T106;

E94/S98/K99/T106;

K37/E94/T106;

K45/E94/T106;

K37/E94/E102/T106;

K37/E94/T104/T106;

K45/E94/T106;

K45/V47/E94/T106;

V47/E94/T106;

T51/E94/T106;

K45/S49/E94/T106;

S49/E94/T106;

K45/T106;

V47/E94/T106;

G43/E94/T106;

V88/M90/E94/T106;

V47/V88/E94/T106;

K45/S49/E94/E92/T106;

K45/V47/E92/E94/T106; 및

E94/K99/T106.

변이체는 바람직하게는 하기 치환체 중 하나 이상을 포함한다:

E94D/P108K;

E94D/P109K;

E94D/T110K;

E94D/P108R;

E94D/T110R;

E94D/S111K;

E94D/T114K;

H83S/E94Q;

E94D/K99Q/T106K;

E94D/T93K/T106K;

E94D/T91K/T106K;

H83K/E94D/T106K;

E94Q/Y96D/T106K;

K45D/E94K/T106K;

K45R/E94D/T106K;

E94D/S98K/K99L/T106K;

K37N/E94D/T106K;

K37W/E94D/T106K;

K37S/E94D/T106K;

K45N/E94N/T106K;

K37Q/E94D/E102N/T106K;

K37S/E94D/E102S/T106K;

K37S/E94D/T104K/T106K;

K45Q/E94Q/T106K;

K45T/V47K/E94D/T106K;

V47S/E94D/T106K;

T51K/E94D/T106K;

K45Y/S49K/E94D/T106K;

S49L/E94D/T106K;

K45R/T106K;

V47K/E94D/T106K;

G43K/E94D/T106K;

V88I/M90A/E94D/T106K;

V47N/V88T/E94D/T106K;

K45N/S49K/E94N/E92D/T106K;

K45N/V47K/E92D/E94N/T106K; 및

E94D/K99Q/T106K.

본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 치환체중 하나 이상을 포함한다:

D35N/S;

S74K/R;

E76D/N;

S78R/K/N/Q;

S80K/R/N/Q;

S82K/R/N/Q;

E84R/K/N/A;

E85N;

S86K/Q;

S89K;

M90K/I/A;

E92D/S;

E94D/Q/G/A/K/R/S/N;

E102N/Q/D/S;

T104R/K/Q;

T106R/K/Q;

R115S;

Q117S; 및

N119S.

변이체는 임의의 수 및 이러한 치환의 임의의 조합을 포함할 수 있다. 변이체는 바람직하게는 치환체 E94D/Q/G/A/K/R/S, S86Q 및 E92S 중 하나 이상, 예컨대 E94D/Q/G/A/K/R/S; S86Q; E92S; E94D/Q/G/A/K/R/S 및 S86Q; E94D/Q/G/A/K/R/S 및 E92S; S86Q 및 E92S; 또는 E94D/Q/G/A/K/R/S, S86Q 및 E92S를 포함한다.

변이체는 바람직하게는 하나 이상의 치환체를 포함한다:

D35N/S;

S74K/R;

E76D/N;

S78R/K/N/Q;

S80K/R/N/Q;

S82K/R/N/Q;

E84R/K/N/A;

E85N;

S86K;

S89K;

M90K/I/A;

E92D;

E94D/Q/K/N;

E102N/Q/D/S;

T104R/K/Q;

T106R/K/Q;

R115S;

Q117S; 및

N119S.

변이체는 임의의 수 및 이들 치환의 조합을 포함할 수 있다.

E94D/E102N;

E94D/E102Q;

E94D/S80K;

S82K/E94D;

E94D/T106R;

E94D/T106K;

E94D/T104R;

E94D/T104K;

S78R/E94D;

S78K/E94D;

S80R/E94D;

S82R/E94D;

E76D/E94D;

E76N/E94D;

E94D/E102D;

E84R/E94D;

E84K/E94D;

E84N/E94D;

S78N/E94D;

S80N/E94D;

S82N/E94D;

E94D/P108K;

E94D/P109K;

S74K/E94D;

E94D/T110K;

S74R/E94D;

E94D/P108R;

E94D/T110R;

S86K/E94D;

S89K/E94D;

E94D/S111K;

E94D/T114K;

E76N/E94Q;

S78Q/E94Q;

S80Q/E94Q;

S82Q/E94Q;

H83S/E94Q;

E84A/E94Q;

E84K/E94Q;

E94Q/T104Q;

E94Q/T106Q;

E94Q/R115S;

E94Q/Q117S;

E94Q/N119S;

E94Q/D121S;

E76S/E94Q;

E94D/K99Q/T106K;

E94D/T93K/T106K;

E94D/T91K/T106K;

E94D/M90K/T106K;

E85N/E94D/T106K;

H83K/E94D/T106K;

E94Q/Y96D/T106K;

K45D/E94K/T106K;

K45R/E94D/T106K;

E94D/S98K/K99L/T106K;

D35N/E94D/T106K;

D35S/E94D/T106K;

K37N/E94D/T106K;

K37W/E94D/T106K;

K37S/E94D/T106K;

K45N/E94N/T106K;

E92D/E94Q/T106K;

K37Q/E94D/E102N/T106K;

E94Q/T106K;

K37S/E94D/E102S/T106K;

K37S/E94D/T104K/T106K;

K45Q/E94Q/T106K;

M90I/E94D/T106K;

K45T/V47K/E94D/T106K;

V47S/E94D/T106K;

T51K/E94D/T106K;

K45Y/S49K/E94D/T106K;

S49L/E94D/T106K;

K45R/T106K;

V47K/E94D/T106K;

G43K/E94D/T106K;

V88I/M90A/E94D/T106K;

V47N/V88T/E94D/T106K;

K45N/S49K/E94N/E92D/T106K;

K45N/V47K/E92D/E94N/T106K;

E94D/K99Q/T106K;

S82K/E94D/T106K; 및

Y79S/E94Q.

변이체는 임의의 수 및 이러한 치환의 임의의 조합을 포함할 수 있다.

본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 모노머는 포어를 형성할 수 있고, 상기 변이체는 하기 중 하나 이상의 돌연변이를 포함한다:

D35/E94/T106;

K37/E94/E102/T106;

K37/E94/T104/T106;;

K37/E94/T106;

K37/E94/E102/T106;

G43/E94/T106;

K45/V47/E92/E94/T106;

K45/V47/E94/T106;

K45/S49/E92/E94/T106;

K45/S49/E94/T106;

K45/E94/T106;

K45/T106;

V47/E94/T106;

V47/V88/E94/T106;

S49/E94/T106;

T51/E94D/T106;

S74/E94;

E76/E94;

S78/E94;

Y79/E94;

S80/E94;

S82/E94;

S82/E94/T106;

H83/E94;

H83/E94/T106;

E85/E94/T106;

S86/E94;

V88/M90/E94/T106;

S89/E94;

M90/E94/T106;

T91/E94/T106;

E92/E94/T106;

T93/E94/T106;

E94/Y96/T106;

E94/S98/K99/T106;

E94/K99/T106;

E94/E102;

E94/T104;

E94/T106;

E94/P108;

E94/P109;

E94/T110;

E94/S111;

E94/T114;

E94/R115;

E94/Q117; 및

E94/E119.

변이체는 바람직하게는 하나 이상의 치환체를 포함한다:

D35N/E94D/T106K;

D35S/E94D/T106K;

K37Q/E94D/E102N/T106K;

K37S/E94D/E102S/T106K;

K37S/E94D/T104K/T106K;

K37N/E94D/T106K;

K37W/E94D/T106K;

K37S/E94D/T106K;

G43K/E94D/T106K;

K45N/V47K/E92D/E94N/T106K;

K45T/V47K/E94D/T106K;

K45N/S49K/E94N/E92D/T106K;

K45Y/S49K/E94D/T106K;

K45D/E94K/T106K;

K45R/E94D/T106K;

K45N/E94N/T106K;

K45Q/E94Q/T106K;

K45R/T106K;

V47S/E94D/T106K;

V47K/E94D/T106K;

V47N/V88T/E94D/T106K;

S49L/E94D/T106K;

T51K/E94D/T106K;

S74K/E94D;

S74R/E94D;

E76D/E94D;

E76N/E94D;

E76S/E94Q;

E76N/E94Q;

S78R/E94D;

S78K/E94D;

S78N/E94D;

S78Q/E94Q;

Y79S/E94Q;

S80K/E94D;

S80R/E94D;

S80N/E94D;

S80Q/E94Q;

S82K/E94D;

S82R/E94D;

S82N/E94D;

S82Q/E94Q;

S82K/E94D/T106K;

H83S/E94Q;

H83K/E94D/T106K;

E85N/E94D/T106K;

S86K/E94D;

V88I/M90A/E94D/T106K;

S89K/E94D;

M90K/E94D/T106K;

M90I/E94D/T106K;

T91K/E94D/T106K;

E92D/E94Q/T106K;

T93K/E94D /T106K;

E94Q/Y96D/T106K;

E94D/S98K/K99L/T106K;

E94D/K99Q/T106K;

E94D/E102N;

E94D/E102Q;

E94D/E102D;

E94D/T104R;

E94D/T104K;

E94Q/T104Q;

E94D/T106R;

E94D/T106K;

E94Q/T106Q;

E94Q/T106K;

E94D/P108K;

E94D/P108R;

E94D/P109K;

E94D/T110K;

E94D/T110R;

E94D/S111K;

E94D/T114K;

E94Q/R115S;

E94Q/Q117S; 및

E94Q/N119S.

변이체는 임의의 수 및 상기 치환체의 임의의 조합을 포함할 수 있다.

E84R/E94D;

E84K/E94D;

E84N/E94D;

E84A/E94Q;

E84K/E94Q 및

E94Q/D121S.

본 발명의 돌연변이체 모노머는 바람직하게는 상기 정의된 변형 및/또는 치환의 임의의 조합을 포함한다. 예시적인 조합은 실시예에 개시되어 있다.

배럴 결실

또 다른 구현예에서, 본 발명은 또한 서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머를 제공하며, 상기 변이체에서 (a) 서열번호: 2의 34 내지 70번 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되거나, 또는 서열번호: 2의 34 내지 70번 위치에 상응하는 위치에서 아미노산 잔기가 결실되고, (b) 서열번호: 2의 71 내지 107번 위치에서 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되었거나, 또는 서열번호: 2의 71 내지 107번 위치에 상응하는 위치에서 아미노산 잔기가 결실되었다.

34 내지 70번 위치에서 결실된 아미노산의 수는 71 내지 107번 위치에서 결실된 아미노산의 수와 상이할 수 있다. 34 내지 70번 위치에서 결실된 아미노산의 수는 바람직하게는 71 내지 107번 위치에서 결실된 아미노산의 수와 동일하다.

34 내지 70번 위치의 아미노산 및 71 내지 107번 위치의 아미노산의 임의의 조합은 결실될 수 있다. 결실된 아미노산의 위치는 바람직하게는 표 1 또는 2의 행 또는 표 1 및/또는 2의 하나 초과의 행에 표시된다. 예를 들어, D35 및 V34가 34 내지 70번 위치에서 결실되면, T104 및 I105는 71 내지 107번 위치에서 결실될 수 있다. 마찬가지로, D35, V34, K37 및 I38은 34 내지 70번 위치에서 결실될 수 있으며, E102, H103, T104 및 I105는 71 내지 107번 위치에서 결실될 수 있다. 이는 포어의 배럴을 감싸는 베타 시트 구조를 유지시킨다.

34 내지 70번 위치 및 71 내지 107번 위치에서 결실된 아미노산은 표 1 또는 2의 행에 있을 필요는 없다. 예를 들어, D35 및 V34가 34 내지 70번 위치에서 결실된 경우, I72 및 E71은 71 내지 107번 위치에서 결실될 수 있다.

34 내지 70번 위치에서 결실된 아미노산은 바람직하게는 연속적이다. 71 내지 107번 위치에서 결실된 아미노산은 바람직하게는 연속적이다. 34 내지 70번 위치에서 결실된 아미노산 및 71 내지 107번 위치에서 결실된 아미노산은 바람직하게는 연속적이다.

본 발명은 바람직하게는 하기가 결실된 돌연변이체 모노머를 제공한다:

(ⅰ) N46/V47/T91/T92; 또는

(ii) N48/S49/T91/T92.

숙련자는 본 발명에 따라 결실될 수 있는 아미노산의 다른 조합을 확인할 수 있다. (즉, 임의의 아미노산이 상기 정의된 바와 같이 결실되기 전에) 하기 논의는 서열번호: 2의 잔기의 넘버링을 사용한다.

배럴 결실 변이체는 적합한 경우, 상기 또는 하기 논의된 임의의 변형 및/또는 치환을 추가로 포함한다. "적합한 경우"는 배럴 결실 후 위치가 여전히 돌연변이체 모노머에 존재하는지를 의미한다.

화학적 변형

또 다른 양태에서, 본 발명은 화학적으로-변형된 돌연변이체 라이세닌 모노머를 제공한다. 돌연변이체 모노머는 상기 또는 하기에서 논의된 임의의 것일 수 있다. 그 결과, 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함하는 서열번호: 2의 변이체 또는 상기 논의된 배럴 결실을 포함하는 변이체와 같은 본 발명의 돌연변이체 모노머는, 하기 논의되는 바와 같이 본 발명에 따라 화학적으로-변형될 수 있다.

하기 논의되는 추가의 변형 중 임의의 것을 포함하는 돌연변이체 모노머, 즉 모노머의 능력을 변경시키는 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역, 또는 바람직하게는 폴리뉴클레오타이드와 상호작용하는 영역 내에 하나 이상의 변형을 포함하는 돌연변이체 모노머는 화학적으로 변형될 수 있다. 이들 화학적으로 변형된 모노머는 본 발명의 변형을 포함할 필요는 없으며, 즉 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함할 필요는 없다. 화학적으로-변형된 돌연변이체 모노머는 바람직하게는 서열번호: 2의 하기 위치 (a) E84, E85, E92, E97 및 D126; (b) E85, E97 및 D126 또는 (c) E84 및 E92 중 하나 이상에서의 치환을 포함하는 서열번호: 2의 변이체를 포함한다. 하기에서 논의되는 치환체의 임의의 수와 조합이 생성될 수 있다.

돌연변이체 모노머는 모노머로부터 형성된 포어의 배럴 또는 채널의 직경이 감소되거나 좁아지도록 하는 임의의 방식으로 화학적으로-변형될 수 있다. 이에 대해서는 이하에서 더 상세히 논의된다.

화학적 변형은 바람직하게는 화학 분자가 돌연변이체 모노머에 공유결합되도록 하는 것이다. 화학 분자는 당해 분야에 공지된 임의의 방법을 사용하여 돌연변이체 모노머에 공유결합될 수 있다. 화학 분자는 일반적으로 화학 결합을 통해 부착된다.

돌연변이체 모노머는 바람직하게는 하나 이상의 시스테인에 결합(시스테인 연결)함으로써, 하나 이상의 라이신에 분자 부착함으로써, 하나 이상의 비-천연 아미노산에 분자 부착함으로써 또는 에피토프의 효소변형에 의해 화학적으로 변형된다. 화학적 개질제가 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인은 바람직하게는 치환에 의해 돌연변이체 모노머로 도입된다. 상기 변형을 수행하기 위한 적합한 방법은 당해 분야에 잘 알려져있다. 적합한 비-천연 아미노산은 Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444의 도 1에서 아미노산 넘버링된 1 내지 71 중 임의의 하나 및 4-아지도-L-페닐알라닌(Faz)를 포함하지만, 이에 한정되지 않는다.

돌연변이체 모노머는 임의의 위치 또는 부위에서 모노머로부터 형성된 포어의 배럴의 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 모노머는 (i) 말레이미드, 예컨대: 4-페닐아조말레이나닐, 1.N-(2-하이드록시에틸)말레이미드, N-사이클로헥실말레이미드, 1.3-말레이미도프로피온산, 1.1-4-아미노페닐-1H-피롤,2,5,디온, 1.1-4-하이드록시페닐-1H-피롤,2,5,디온, N-에틸말레이미드, N-메톡시카르보닐말레이미드, N-tert-부틸말레이미드, N-(2-아미노에틸)말레이미드, 3-말레이미도-프록실, N-(4-클로로페닐)말레이미드, 1-[4-(디메틸아미노)-3,5-디니트로페닐]-1H-피롤-2,5-디온, N-[4-(2-벤즈이미다졸릴)페닐]말레이미드, N-[4-(2-벤조옥사졸릴)페닐]말레이미드, N-(1-나프틸)-말레이미드, N-(2,4-크실릴)말레이미드, N-(2,4-디플루오로페닐)말레이미드, N-(3-클로로-파라-톨일)-말레이미드, 1-(2-아미노-에틸)-피롤-2,5-디온 하이드로클로라이드, 1-사이클로펜틸-3-메틸-2,5-디하이드로 1H-피롤-2,5-디온, 1-(3-아미노프로필)-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 3-메틸-1-[2-옥소-2-(피페라진-1-일)에틸)-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 1-벤질-2,5-디하이드로-1H-피롤-2,5-디온, 3-메틸-1-(3,3,3-트리플루오로프로필)-2,5-디하이드로-1H-피롤-2,5-디온, 1-[4-(메틸아미노)사이클로헥실]-2,5-디하이드로-1H-피롤-2,5-디온 트리플루오로아세트산, SMILES O=C1C=CC(=O)N1CC=2C=CN=CC2, SMILES O=C1C=CC(=O)N1CN2CCNCC2, 1-벤질-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, 1-(2-플루오로페닐)-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, N-(4-페녹시페닐)말레이미드, N-(4-니트로페닐)말레이미드; (ii) 아이오도세타미드, 예컨대, 3-(2-아이오도아세트아미도)-프록실, N-(사이클로프로필메틸)-2-아이오도아세트아미드, 2-아이오도-N-(2-페닐에틸)아세트아미드, 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드, N-(4-아세틸페닐)-2-아이오도아세트아미드, N-(4-(아미노설포닐)페닐)-2-아이오도아세트아미드, N-(1,3-벤조티아졸-2-일)-2-아이오도아세트아미드, N-(2,6-디에틸페닐)-2-아이오도아세트아미드, N-(2-벤조일-4-클로로페닐)-2-아이오도아세트아미드; (ⅲ) 브로모아세트아미드: 예컨대 N-(4-(아세틸아미노)페닐)-2-브로모아세트아미드, N-(2-아세틸페닐)-2-브로모아세트아미드, 2-브로모-N-(2-시아노페닐)아세트아미드, 2-브로모-N-(3-트리플루오로메틸)페닐)아세트아미드, N-(2-벤조일페닐)-2-브로모아세트아미드, 2-브로모-N-(4-플루오로페닐)-3-메틸부탄아미드, N-벤질-2-브로모-N-페닐프로피온아미드, N-(2-브로모-부티릴)-4-클로로-벤젠설폰아미드, 2-브로모-N-메틸-N-페닐아세트아미드, 2-브로모-N-펜에틸-아세트아미드, 2-아다만탄-1-일-2-브로모-N-사이클로헥실-아세트아미드, 2-브로모-N-(2-메틸페닐)부탄아미드, 모노브로모아세트아닐라이드; (ⅳ) 디설파이드, 예컨대: 알드리티올-2, 알드리티올-4, 이소프로필 디설파이드, 1-(이소부틸디설파닐)-2-메틸프로판, 디벤질 디설파이드, 4-아미노페닐 디설파이드, 3-(2-피리딜디티오)프로피온산, 3-(2-피리딜디티오)프로피온산 하이드라자이드, 3-(2-피리딜디티오)프로피온산, N-석신이미딜 에스테르, am6amPDP1-βCD; 및 (v) 티올, 예컨대: 4-페닐티아졸-2-티올, Purpald, 5,6,7,8-테트라하이드로-퀴나졸린-2-티올.

돌연변이체 모노머는 폴리에틸렌 글리콜(PEG), 핵산, 예컨대 DNA, 염료, 형광단 또는 발색단의 부착에 의해 화학적으로 변형될 수 있다. 일부 구현예에서, 돌연변이체 모노머는 모노머 및 표적 피분석물, 표적 뉴클레오타이드 또는 표적 폴리뉴클레오타이드를 포함하는 포어 사이의 상호작용을 촉진시키는 분자 어댑터에 의해 화학적으로 변형된다. 어댑터의 존재는 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드 사이의 호스트-게스트 화학을 향상시키고, 그렇게 함으로써 돌연변이체 모노머로부터 형성된 포어의 서열분석 능력을 향상시킨다.

화학적으로-변형된 돌연변이체 모노머는 바람직하게는 서열번호: 2에 나타낸 서열의 변이체를 포함한다. 변이체는 하기에 정의된다. 상기 변이체는 전형적으로 하나 이상의 잔기가 시스테인, 라이신 또는 비-천연 아미노산으로 대체된 하나 이상의 치환을 포함한다. 비-천연 아미노산으로는 4-아지도-L-페닐알라닌(Faz), 4-아세틸-L-페닐알라닌, 3-아세틸-L-페닐알라닌, 4-아세토아세틸-L-페닐알라닌, O-알릴-L-티로신, 3-(페닐셀라닐)-L-알라닌, O-2-프로핀-1-일-L-티로신, 4-(디하이드록시보릴)-L-페닐알라닌, 4-[(에틸설파닐)카보닐]-L-페닐알라닌, (2S)-2-아미노-3-4-[(프로판-2-일설파닐)카보닐]페닐;프로판산, (2S)-2-아미노-3-4-[(2-아미노-3-설파닐프로파노일)아미노]페닐;프로판산, O-메틸-L-티로신, 4-아미노-L-페닐알라닌, 4-시아노-L-페닐알라닌, 3-시아노-L-페닐알라닌, 4-플루오로-L-페닐알라닌, 4-아이오도-L-페닐알라닌, 4-브로모-L-페닐알라닌, O-(트리플루오로메틸)티로신, 4-니트로-L-페닐알라닌, 3-하이드록시-L-티로신, 3-아미노-L-티로신, 3-아이오도-L-티로신, 4-이소프로필-L-페닐알라닌, 3-(2-나프틸)-L-알라닌, 4-페닐-L-페닐알라닌, (2S)-2-아미노-3-(나프탈렌-2-일아미노)프로판산, 6-(메틸설파닐)노르류신, 6-옥소-L-라이신, D-티로신, (2R)-2-하이드록시-3-(4-하이드록시페닐)프로판산, (2R)-2-암모니오옥타노에이트3-(2,2'-비피리딘-5-일)-D-알라닌, 2-아미노-3-(8-하이드록시-3-퀴놀릴)프로판산, 4-벤조일-L-페닐알라닌, S-(2-니트로벤질)시스테인, (2R)-2-아미노-3-[(2-니트로벤질)설파닐]프로판산, (2S)-2-아미노-3-[(2-니트로벤질)옥시]프로판산, O-(4,5-디메톡시-2-니트로벤질)-L-세린, (2S)-2-아미노-6-([(2-니트로벤질)옥시]카보닐; 아미노)헥산산, O-(2-니트로벤질)-L-티로신, 2-니트로페닐알라닌, 4-[(E)-페닐디아제닐]-L-페닐알라닌, 4-[3-(트리플루오로메틸)-3H-디아지렌-3-일]-D-페닐알라닌, 2-아미노-3-[[5-(디메틸아미노)-1-나프틸]설포닐아미노]프로판산, (2S)-2-아미노-4-(7-하이드록시-2-옥소-2H-크로멘-4-일)부탄산, (2S)-3-[(6-아세틸나프탈렌-2-일)아미노]-2-아미노프로판산, 4-(카복시메틸)페닐알라닌, 3-니트로-L-티로신, O-설포-L-티로신, (2R)-6-아세트아미도-2-암모니오헥사노에이트, 1-메틸히스티딘, 2-아미노노난산, 2-아미노데칸산, L-호모시스테인, 5-설파닐노르발린, 6-설파닐-L-노르류신, 5-(메틸설파닐)-L-노르발린, N⁶-[(2R,3R)-3-메틸-3,4-디하이드로-2H-피롤-2-일]카보닐;-L-라이신, N⁶-[(벤질옥시)카보닐]라이신, (2S)-2-아미노-6-[(사이클로펜틸카보닐)아미노]헥산산, N⁶-[(사이클로펜틸옥시)카보닐]-L-라이신, (2S)-2-아미노-6-[(2R)-테트라하이드로푸란-2-일카보닐]아미노;헥산산, (2S)-2-아미노-8-[(2R,3S)-3-에티닐테트라하이드로푸란-2-일]-8-옥소옥탄산, N⁶-(tert-부톡시카보닐)-L-라이신, (2S)-2-하이드록시-6-([(2-메틸-2-프로판일)옥시]카보닐;아미노)헥산산, N⁶-[(알릴옥시)카보닐]라이신, (2S)-2-아미노-6-([(2-아지도벤질)옥시]카보닐;아미노)헥산산, N⁶-L-프롤일-L-라이신, (2S)-2-아미노-6-[(프로프-2-인-1-일옥시)카보닐]아미노];헥산산 및 N⁶-[(2-아지도에톡시)카보닐]-L-라이신이 포함되지만, 이에 한정되지 않는다. 가장 바람직한 비-천연 아미노산은 4-아지도-L-페닐알라닌(Faz)이다.

돌연변이체 모노머는 서열번호: 2의 임의의 위치: K37, V47, S49, T55, S86, E92 및 E94에서 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 더욱 바람직하게는, 돌연변이체 모노머는 위치 E92 및/또는 E94에서 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 일 구현예에서, 돌연변이체 모노머는 하나 이상의 시스테인(시스테인 연결), 하나 이상의 라이신 또는 이들 위치에서 하나 이상의 비-천연 아미노산에 분자를 부착시킴으로써 화학적으로 변형된다. 돌연변이체 모노머는 바람직하게는 K37C, V47C, S49C, T55C, S86C, E92C 및 E94C 중 하나 이상을 포함하는 서열번호: 2에 나타낸 서열의 변이체를 포함하며, 여기에서, 하나 이상의 분자가 하나 이상의 도입된 시스테인에 부착된다. 돌연변이체 모노머는 보다 바람직하게는 E92C 및/또는 E94C를 포함하는 서열번호: 2에 나타낸 서열의 변이체를 포함하며, 여기에서 하나 이상의 분자가 도입된 시스테인(들)에 부착된다. 이들 2가지 바람직한 구현예의 각각에서, 하나 이상의 시스테인(Cs)은 하나 이상의 라이신 또는 하나 이상의 비-천연 아미노산, 예컨대 하나 이상의 Faz로 대체될 수 있다.

시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 향상될 수 있다. 예를 들어, 측접하는 아르기닌, 히스티딘 또는 라이신 잔기의 염기성 기는 시스테인 티올 그룹의 pKa를 보다 반응성인 S^-그룹의 pKa로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대 dTNB에 의해 보호될 수 있다. 이들은 링커가 부착되기 전에 돌연변이체 모노머의 하나 이상의 시스테인 잔기와 반응할 수 있다.

분자는 돌연변이체 모노머에 직접 부착될 수 있다. 분자는 바람직하게는 화학적 가교결합제 또는 펩타이드 링커와 같은 링커를 사용하여 돌연변이체 모노머에 부착된다. 적합한 화학적 가교결합제는 당해 분야에 잘 알려져있다. 바람직한 가교결합제는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디설파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디설파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디설파닐)옥타노에이트를 포함한다. 가장 바람직한 가교결합제는 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP)이다. 전형적으로, 분자는 분자/가교결합제 복합체가 돌연변이체 모노머에 공유결합되기 전에 이중작용성 가교결합제에 공유결합되어 있지만, 이중작용성 가교결합제/모노머 복합체가 분자에 부착되기 전에 이중작용성 가교결합제를 모노머에 공유결합시킬 수도 있다.

링커는 바람직하게는 디티오트레이톨(DTT)에 대하여 저항성이다. 적합한 링커는 아이오도아세트아미드-계 및 말레이미드-계 링커를 포함하지만, 이에 한정되지 않는다.

본 발명의 화학적으로-변형된 돌연변이체 모노머를 포함하는 포어의 이점은 하기에서 보다 상세히 논의된다.

본 발명에 따라 이루어질 수 있는 추가의 화학적 변형은 이하에서 논의된다.

추가 변형

상기 논의된 임의의 돌연변이체 모노머는 적합한 경우(즉, 관련 아미노 위치가 돌연변이체 모노머에 잔류하거나, 또는 또다른 아미노산으로 변형/치환되지 않은 경우) 서열번호: 2의 약 44번 위치 내지 약 126번 위치까지의 영역 내에서 추가의 변형을 가질 수 있다. 이 영역의 적어도 일부는 전형적으로 라이세닌의 막 관통 영역에 기여한다. 이 영역의 적어도 일부는 전형적으로 라이세닌의 배럴 또는 채널에 기여한다. 이 영역의 적어도 일부는 전형적으로 라이세닌의 내벽이나 라이닝에 기여한다.

라이세닌의 막 관통 영역은 서열번호: 2의 44 내지 67번 위치로서 확인되었다(De Colbis 등, Structure, 2012; 20: 1498-1507).

상기 변이체는 바람직하게는 폴리뉴클레오타이드와 상호작용하는 모노머 또는 바람직하게는 영역의 능력을 변경시키는 서열번호: 2의 약 44 내지 약 126번 위치의 영역내에 하나 이상의 변형을 포함한다. 모노머와 폴리뉴클레오타이드 사이의 상호작용은 증가되거나 감소될 수 있다. 모노머와 폴리뉴클레오타이드 사이의 증가된 상호작용은 예를 들어, 돌연변이체 모노머를 포함하는 포어에 의한 폴리뉴클레오타이드의 포획을 용이하게 할 것이다. 영역과 폴리뉴클레오타이드 사이의 감소된 상호작용은 예를 들어, 폴리뉴클레오타이드의 인식 또는 식별력을 개선할 것이다. 폴리뉴클레오타이드의 인식 또는 식별력은 (신호-대-잡음비를 증가시키는) 돌연변이체 모노머를 포함하는 포어의 상태 편차를 감소시키고, 및/또는 돌연변이체 모노머를 포함하는 포어를 통해 폴리뉴클레오타이드가 이동함에 따라 전류에 기여하는 폴리뉴클레오타이드에서 뉴클레오타이드의 수를 감소시킴으로써 개선될 수 있다.

폴리뉴클레오타이드와 상호작용하는 모노머의 능력은 당해 분야에 공지된 방법을 사용하여 결정될 수 있다. 모노머는 임의의 방식, 예를 들어 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스 힘, π-양이온 상호작용 또는 정전기력에 의해 폴리뉴클레오타이드와 상호작용할 수 있다. 예를 들어, 폴리뉴클레오타이드에 결합하는 영역의 능력은 통상적인 결합 분석을 사용하여 측정될 수 있다. 적합한 검정은 형광에-기초한 결합 검정, 핵자기 공명(NMR), 등온 적정 열량측정(ITC) 또는 전자 스핀 공명(ESR) 분광법을 포함하지만, 이에 한정되지는 않는다. 대안적으로, 폴리뉴클레오타이드와 상호작용하기 위한 하나 이상의 돌연변이체 모노머를 포함하는 포어의 능력은 상기 또는 하기에서 논의된 방법 중 임의의 것을 사용하여 결정될 수 있다. 바람직한 검정은 실시예에 기재되어 있다.

하나 이상의 변형은 서열번호: 2의 약 44번 위치 내지 약 126번 위치까지의 영역 내에서 추가로 이루어질 수 있다. 하나 이상의 변형은 바람직하게는 하기 영역 중 임의의 한 영역내에서 이루어진다: 약 40번 위치 내지 약 125번 위치, 약 50번 위치 내지 약 120번 위치, 약 60번 위치 내지 약 110번 위치 및 약 70번 위치 내지 약 100번 위치. 폴리뉴클레오타이드 포획을 개선시키기 위해 하나 이상의 변형이 이루어지면, 보다 바람직하게는 하기 영역 중 임의의 한 영역내에서 이루어진다: 약 44번 위치 내지 약 103번 위치, 약 68번 위치 내지 약 103번 위치, 약 84번 위치 내지 약 103번 위치, 약 44번 위치 내지 약 97번 위치, 약 68번 위치 내지 약 97번 위치 또는 약 84번 위치 내지 약 97번 위치. 폴리뉴클레오타이드 인식 또는 식별력을 개선하기 위해 하나 이상의 변형이 이루어지면, 보다 바람직하게는 하기 영역 중 임의의 한 영역내에서 이루어진다: 약 44번 위치 내지 약 109번 위치, 약 44번 위치 내지 약 97번 위치 또는 약 48번 위치 내지 약 88번 위치. 상기 영역은 바람직하게는 서열번호: 2의 약 44번 위치 내지 67번 위치이다.

하나 이상의 변형이 폴리뉴클레오타이드 인식 또는 식별력을 개선하도록 의도된 경우, 이들은 폴리뉴클레오타이드 포획을 개선시키기 위한 하나 이상의 변형에 부가하여 바람직하게 이루어진다. 이하에 논의된 바와 같이, 이것은 돌연변이체 모노머로부터 형성된 포어가 폴리뉴클레오타이드를 효율적으로 포획하고, 폴리뉴클레오타이드를 특징화, 예컨대 그의 서열을 추정하는 것을 허용한다.

폴리뉴클레오타이드와 상호작용하는 능력을 변경시키는, 특히 폴리뉴클레오타이드를 포획 및/또는 인식 또는 식별하는 능력을 개선시키는 단백질 나노포어의 변형은 당해 분야에 잘 기재되어 있다. 예를 들어, 그러한 변형은 WO 2010/034018 및 WO 2010/055307에 개시되어 있다. 유사한 변형이 본 발명에 따른 라이세닌 모노머에 대해 이루어질 수 있다.

1, 2, 5, 10, 15, 20, 30개 또는 그 이상의 변형과 같은 임의의 수의 변형이 이루어질 수 있다. 폴리뉴클레오타이드와 상호작용하는 모노머의 능력이 변경되는한 임의의 변형(들)이 이루어질 수 있다. 적합한 변형은 아미노산 치환, 아미노산 첨가 및 아미노산 결실을 포함하지만, 이에 한정되지 않는다. 하나 이상의 변형은 바람직하게는 하나 이상의 치환이다. 이에 대해서는 이하에서 자세히 설명한다.

하나 이상의 변형은 바람직하게는 (a) 모노머의 입체 효과를 변경시키거나, 바람직하게는 영역의 입체 효과를 변경시키고, (b) 모노머의 순 전하를 변경시키거나, 또는 바람직하게는 영역의 순 전하를 변경시키고, (c) 폴리뉴클레오타이드와의 수소 결합에 대한 모노머 또는 바람직하게는 영역의 능력을 변경시키거나, (d) 비국소화된 전자 파이 시스템을 통해 상호작용하는 화학 기를 도입 또는 제거하고 및/또는 (e) 모노머의 구조를 변경시키거나, 바람직하게는 영역의 구조를 변경시킨다. 하나 이상의 변형은 보다 바람직하게는 (a) 내지 (e)의 임의의 조합을 초래한다: 예컨대, (a) 및 (b); (a) 및 (c); (a) 및 (d); (a) 및 (e); (b) 및 (c); (b) 및 (d); (b) 및 (e); (c) 및 (d); (c) 및 (e); (d) 및 (e), (a), (b) 및 (c); (a), (b) 및 (d); (a), (b) 및 (e); (a), (c) 및 (d); (a), (c) 및 (e); (a), (d) 및 (e); (b), (c) 및 (d); (b), (c) 및 (e); (b), (d) 및 (e); (c), (d) 및 (e); (a), (b), (c) 및 d); (a), (b), (c) 및 (e); (a), (b), (d) 및 (e); (a), (c), (d) 및 (e); (b), (c), (d) 및 (e); 및 (a), (b), (c) 및 (d).

(a)의 경우, 모노머의 입체 효과가 증가되거나 감소될 수 있다. 입체 효과를 변경시키는 임의의 방법이 본 발명에 따라 사용될 수 있다. 페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 큰 부피의 잔기의 도입은 모노머의 입체 장애를 증가시킨다. 하나 이상의 변형은 바람직하게는 F, W, Y 및 H 중 하나 이상의 도입이다. F, W, Y 및 H의 임의의 조합이 도입될 수 있다. F, W, Y 및 H 중 하나 이상은 첨가에 의해 도입될 수 있다. F, W, Y 및 H 중 하나 이상은 바람직하게는 치환에 의해 도입된다. 이러한 잔기의 도입에 적합한 위치는 하기에서 보다 상세히 논의된다.

페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 큰 부피의 잔기의 제거는 반대로 모노머의 입체 장애를 감소시킨다. 하나 이상의 변형은 바람직하게는 F, W, Y 및 H 중 하나 이상의 제거이다. F, W, Y 및 H의 임의의 조합이 제거될 수 있다. F, W, Y 및 H 중 하나 이상이 결실에 의해 제거될 수 있다. F, W, Y 및 H 중 하나 이상은 바람직하게는 세린(S), 트레오닌(T), 알라닌(A) 및 발린(V)과 같은 보다 작은 측기를 갖는 잔기로 치환함으로써 제거된다.

(b)의 경우 순 전하는 어떤 방식으로든 변경될 수 있다. 순 양전하는 바람직하게는 증가 또는 감소된다. 순 양전하는 임의의 방식으로 증가될 수 있다. 순 양전하는 바람직하게는 하나 이상의 양으로 하전된 아미노산을 도입, 바람직하게는 치환함으로써, 및/또는 하나 이상의 음전하를 중화, 바람직하게는 치환함으로써 증가된다.

순 양전하는 바람직하게는 하나 이상의 양으로 하전된 아미노산을 도입함으로써 증가된다. 하나 이상의 양으로 하전된 아미노산은 첨가에 의해 도입될 수 있다. 하나 이상의 양으로 하전된 아미노산은 바람직하게는 치환에 의해 도입된다. 양으로 하전된 아미노산은 순 양전하를 갖는 아미노산이다. 양으로 하전된 아미노산은 자연-발생적이거나 비-자연-발생적일 수 있다. 양으로 하전된 아미노산은 합성 또는 변형될 수 있다. 예를 들어, 순 양전하를 갖는 변형된 아미노산은 본 발명에 사용하기 위해 구체적으로 설계될 수 있다. 아미노산에 대한 수많은 상이한 유형의 변형이 당해 기술에 잘 알려져있다.

바람직한 자연-발생 양으로 하전된 아미노산에는 히스티딘(H), 라이신(K) 및 아르기닌(R)이 포함되지만, 이에 한정되지는 않는다. 하나 이상의 변형은 바람직하게는 하나 이상의 H, K 및 R의 도입이다. H, K 및 R의 임의의 수 및 조합이 도입될 수 있다. H, K 및 R 중 하나 이상은 첨가에 의해 도입될 수 있다. H, K 및 R 중 하나 이상은 바람직하게는 치환에 의해 도입된다. 이러한 잔기의 도입에 적합한 위치는 하기에서 보다 상세히 논의된다.

자연-발생 아미노산을 첨가하거나 치환하는 방법은 당해 기술에 잘 알려져 있다. 예를 들어, 메티오닌(M)은 모노머를 암호화하는 폴리뉴클레오타이드의 관련된 위치에서 메티오닌(ATG)에 대한 코돈을 아르기닌(AGA)에 대한 코돈으로 대체함으로써 아르기닌(R)으로 치환될 수 있다. 이어서 폴리뉴클레오타이드는 하기 논의되는 바와 같이 발현될 수 있다.

비-자연-발생 아미노산을 첨가 또는 치환하는 방법 또한 당해 분야에 잘 알려져있다. 예를 들어, 비-자연-발생 아미노산은 포어를 발현하는 IVTT 시스템에 합성 아미노아실-tRNA를 포함시킴으로써 도입될 수 있다. 대안적으로, 이들은 특정 아미노산의 합성(즉, 비-자연-발생) 유사체의 존재하에 특정 아미노산에 대해 영양 요구성이 있는 E. coli에서 모노머를 발현시킴으로써 도입될 수 있다. 또한 부분적인 펩타이드 합성을 사용하여 포어를 생산하는 경우, 네이키드 결찰(naked ligation)에 의해 생산될 수 있다.

임의의 아미노산은 양으로 하전된 아미노산으로 치환될 수 있다. 하나 이상의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산은 하나 이상의 양으로 하전된 아미노산으로 치환될 수 있다. 하전되지않은 아미노산은 순 전하를 갖고 있지 않다. 적합한 하전되지않은 아미노산은 시스테인(C), 세린(S), 트레오닌(T), 메티오닌(M), 아스파라긴(N) 및 글루타민(Q)을 포함하지만, 이에 한정되지 않는다. 무극성 아미노산은 무극성 측쇄를 갖는다. 적합한 무극성 아미노산은 글리신(G), 알라닌(A), 프롤린(P), 이소류신(I), 류신(L) 및 발린(V)이 포함되지만, 이에 한정되지 않는다. 방향족 아미노산은 방향족 측쇄를 갖는다. 적합한 방향족 아미노산은 히스티딘(H), 페닐알라닌(F), 트립토판(W) 및 티로신(Y)을 포함하지만, 이에 한정되지 않는다. 바람직하게는, 하나 이상의 음으로 하전된 아미노산은 하나 이상의 양으로 하전된 아미노산으로 치환된다. 적합한 음으로 하전된 아미노산은 아스파르트산(D) 및 글루탐산(E)을 포함하지만, 이에 한정되지 않는다.

바람직한 도입에는 K에 의한 E의 치환, R에 의한 M의 치환, H에 의한 M의 치환, K에 의한 M의 치환, R에 의한 D의 치환, H에 의한 D의 치환, K에 의한 D의 치환, R에 의한 E의 치환, H에 의한 E의 치환, R에 의한 N의 치환, R에 의한 T의 치환 및 R에 의한 G의 치환이 포함되지만, 이에 한정되지 않는다. 가장 바람직하게는 E는 K에 의해 치환된다.

임의의 수의 양으로 하전된 아미노산이 도입되거나 치환될 수 있다. 예를 들어, 1, 2, 5, 10, 15, 20, 25, 30 또는 그 초과의 양으로 하전된 아미노산이 도입되거나 치환될 수 있다.

순 양전하는 하나 이상의 음전하를 중화시킴으로써 보다 바람직하게 증가된다. 하나 이상의 음전하는 치환에 의해 하나 이상의 음으로 하전된 아미노산을 하나 이상의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산으로 치환함으로써 중화될 수 있다. 음전하를 제거하면 순 양전하가 증가한다. 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산은 자연-발생적 또는 비-자연-발생적일 수 있다. 그것들은 합성 또는 변형될 수 있다. 적합한 하전되지않은 아미노산, 무극성 아미노산 및 방향족 아미노산은 상기 논의되었다. 바람직한 치환은 Q에 의한 E의 치환, S에 의한 E의 치환, A에 의한 E의 치환, Q에 의한 D의 치환, N에 의한 E의 치환, N에 의한 D의 치환, G에 의한 D의 치환 및 S에 의한 D의 치환을 포함하지만, 이에 한정되지 않는다.

하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산의 임의의 수 및 조합이 치환될 수 있다. 예를 들어, 1, 2, 5, 10, 15, 20, 25 또는 30개 또는 그 초과의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산이 치환될 수 있다. 음으로 하전된 아미노산은 (1) 하전되지않은 아미노산; (2) 무극성 아미노산; (3) 방향족 아미노산; (4) 하전되지않은 아미노산 및 무극성 아미노산; (5) 하전되지않은 아미노산 및 방향족 아미노산; 및 (5) 무극성 아미노산 및 방향족 아미노산; 또는 (6) 하전되지않은 아미노산, 무극성 아미노산 및 방향족 아미노산에 의해 치환될 수 있다.

하나 이상의 음전하는 1, 2, 3, 또는 4개의 아미노산내와 같은 부근에 하나 이상의 양으로 하전된 아미노산을 도입함으로써, 또는 하나 이상의 음으로 하전된 아미노산에 인접하여 도입함으로써 중화될 수 있다. 양으로 및 음으로 하전된 아미노산의 예가 상기 논의되었다. 양으로 하전된 아미노산은 예를 들어 치환에 의해 상기 논의된 임의의 방식으로 도입될 수 있다.

순 양전하는 바람직하게는 하나 이상의 음으로 하전된 아미노산을 도입하고 /하거나 하나 이상의 양전하를 중화시킴으로써 감소된다. 이것이 수행될 수 있는 방법은 순 양전하를 증가시키는 것과 관련하여 상기 논의에서 분명해질 것이다. 순 양전하를 증가시키는 것과 관련하여 상기 논의된 구현예 모두는 전하가 반대 방향으로 변경되는 것을 제외하고는 순 양전하를 감소시키는데 동등하게 적용된다. 특히, 하나 이상의 양전하는 바람직하게는 하나 이상의 양으로 하전된 아미노산을 하나 이상의 하전되지않은 아미노산, 무극성 아미노산 및/또는 방향족 아미노산으로 치환함으로써, 또는 하나 이상의 음으로 하전된 아미노산을 하나 또는 그 이상의 양으로 하전된 아미노산의 1, 2, 3 또는 4개의 아미노산 근처 또는 내에 또는 근접하여 도입함으로써 중화된다.

순 음전하는 바람직하게 증가되거나 감소된다. 순 양전하를 증가 또는 감소시키는 것과 관련하여 상기 논의된 모든 구현예는 순 음전하를 각각 감소시키거나 증가시키는데 동등하게 적용된다.

(c)의 경우, 모노머의 수소 결합에 대한 능력은 어떤 방식으로든 변경될 수 있다. 세린(S), 트레오닌(T), 아스파라긴(N), 글루타민(Q), 티로신(Y) 또는 히스티딘(H)의 도입은 모노머의 수소 결합 능력을 증가시킨다. 하나 이상의 변형은 바람직하게는 S, T, N, Q, Y 및 H 중 하나 이상의 도입이다. S, T, N, Q, Y 및 H의 임의의 조합이 도입될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 첨가에 의해 도입될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 치환에 의해 도입되는 것이 바람직하다. 이러한 잔기의 도입에 적합한 위치는 하기에서 보다 상세히 논의된다.

세린(S), 트레오닌(T), 아스파라긴(N), 글루타민(Q), 티로신(Y) 또는 히스티딘(H)의 제거는 모노머의 수소 결합 능력을 감소시킨다. 하나 이상의 변형은 바람직하게는 하나 이상의 S, T, N, Q, Y 및 H의 제거이다. S, T, N, Q, Y 및 H의 임의의 조합은 제거될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 결실에 의해 제거될 수 있다. S, T, N, Q, Y 및 H 중 하나 이상은 알라닌(A), 발린(V), 이소류신(I) 및 류신(L)과 같은, 수소 결합이 덜한 다른 아미노산으로 치환함으로써 바람직하게 제거된다.

(d)의 경우, 페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 방향족 잔기의 도입은 모노머의 π 적층을 증가시킨다. 페닐알라닌(F), 트립토판(W), 티로신(Y) 또는 히스티딘(H)과 같은 방향족 잔기의 제거는 또한 모노머에서 π 적층을 감소시킨다. 이러한 아미노산은 (a)를 참조하여 상기 논의된 바와 같이 도입되거나 제거될 수 있다.

(e)의 경우, 모노머의 구조를 변경시키는 본 발명에 따라 하나 이상의 변형이 이루어질 수 있다. 예를 들어, 하나 이상의 루프 영역이 제거, 단축 또는 연장될 수 있다. 이것은 전형적으로 폴리뉴클레오타이드가 포어내로 또는 포어외로 진입 또는 유출하는 것을 용이하게 한다. 하나 이상의 루프 영역은 포어의 시스 측, 포어의 트랜스 측 또는 포어의 양측 모두일 수 있다. 대안적으로, 포어의 아미노 말단 및/또는 카복시 말단의 하나 이상의 영역이 연장되거나 결실될 수 있다. 이것은 전형적으로 포어의 크기 및/또는 전하를 변경시킨다.

특정 아미노산의 도입은 하나 이상의 기전을 통해 폴리뉴클레오타이드와 상호작용하는 모노머의 능력을 향상시킬 것이라는 상기 논의로부터 명백해질 것이다. 예를 들어, E를 H로 치환하면, (b)에 따라 (음전하를 중화함으로써) 순 양전하를 증가시킬뿐만 아니라, (c)에 따라 모노머가 수소 결합하는 능력을 증가시킬 것이다.

변이체는 바람직하게는 서열번호: 2의 하기 위치 중 하나 이상에서의 치환을 포함한다: M44, N46, N48, E50, R52, H58, D68, F70, E71, S74, E76, S78, Y79, S80, H81, S82, E84, E85, S86, Q87, S89, M90, E92, E94, E97, E102, H103, T104, T106, R115, Q117, N119, D121 및 D126. 변이체는 바람직하게는 상기 위치들의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 또는 34에서의 치환을 포함한다. 변이체는 바람직하게는 서열번호: 2의 하기 위치 중 하나 이상에서의 치환을 포함한다: D68, E71, S74, E76, S78, S80, S82, E84, E85, S86, Q87, S89, E92, E102, T104, T106, R115, Q117, N119 및 D121. 변이체는 바람직하게는 상기 위치의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20에 치환을 포함한다.

변이체는 바람직하게는 서열번호: 2의 하기 위치들 중 하나 이상에 치환을 포함한다: (a) E84, E85, E92, E97 및 D126; (b) E85, E97 및 D126 또는 (c) E84 및 E92. 변이체로 치환된 아미노산은 그의 자연-발생 또는 비-자연-발생 유도체일 수 있다. 변이체로 치환된 아미노산은 D-아미노산일 수 있다. 상기 열거된 각 위치는 아스파라긴(N), 세린(S), 글루타민(Q), 아르기닌(R), 글리신(G), 티로신(Y), 아스파르트산(D), 류신(L), 라이신(K) 또는 알라닌(A)에 의해 치환될 수 있다.

변이체는 바람직하게는 서열번호: 2의 하기 돌연변이 중 적어도 하나를 포함한다:

(a) 44번 위치의 세린(S);

(b) 46번 위치의 세린(S);

(c) 48번 위치의 세린(S);

(d) 52번 위치의 세린(S);

(e) 58번 위치의 세린(S);

(f) 68번 위치의 세린(S);

(g) 70번 위치의 세린(S);

(h) 71번 위치의 세린(S);

(i) 76번 위치의 세린(S);

(j) 79번 위치의 세린(S);

(k) 81번 위치의 세린(S);

(l) 84번 위치의 세린(S), 아스파르트산(D) 또는 글루타민(Q);

(m) 85번 위치의 세린(S) 또는 라이신(K);

(n) 87번 위치의 세린(S);

(o) 90번 위치의 세린(S);

(p) 92번 위치의 아스파라긴(N) 또는 글루타민(Q);

(q) 94번 위치의 세린(S) 또는 아스파라긴(N);

(r) 97번 위치의 세린(S) 또는 아스파라긴(N);

(s) 102번 위치의 세린(S);

(t) 103번 위치의 세린(S);

(u) 121번 위치의 아스파라긴(N) 또는 세린(S);

(v) 50번 위치의 세린(S);

(w) 94번 위치의 아스파라긴(N) 또는 세린(S);

(x) 97번 위치의 아스파라긴(N) 또는 세린(S);

(y) 121번 위치의 세린(S) 또는 아스파라긴(N);

(z) 126번 위치의 아스파라긴(N) 또는 글루타민(Q) 또는 글리신(G); 및

(aa) 128번 위치의 세린(S) 또는 아스파라긴(N).

변이체는 임의의 수의 돌연변이 (a) 내지 (aa), 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 또는 27개의 돌연변이를 포함할 수 있다. 돌연변이의 바람직한 조합은 이하에서 논의된다. 변이체에 도입된 아미노산은 그의 자연-발생 또는 비-자연-발생 유도체일 수 있다. 변이체에 도입된 아미노산은 D-아미노산일 수 있다.

(a) 68번 위치의 세린(S);

(b) 71번 위치의 세린(S);

(c) 76번 위치의 세린(S);

(d) 84번 위치의 아스파르트산(D) 또는 글루타민(Q);

(e) 85번 위치의 라이신(K);

(f) 92번 위치의 아스파라긴(N) 또는 글루타민(Q);

(g) 102번 위치의 세린(S);

(h) 121번 위치의 아스파라긴(N) 또는 세린(S);

(i) 50번 위치의 세린(S);

(j) 94번 위치의 아스파라긴(N) 또는 세린(S);

(k) 97번 위치의 아스파라긴(N) 또는 세린(S); 및

(l) 126번 위치의 아스파라긴(N) 또는 글루타민(Q) 또는 글리신(G).

변이체는 임의의 수의 돌연변이 (a) 내지 (l), 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 돌연변이를 포함할 수 있다. 돌연변이의 바람직한 조합은 이하에서 논의된다. 변이체에 도입된 아미노산은 그의 자연-발생 또는 비-자연-발생 유도체일 수 있다. 변이체에 도입된 아미노산은 D-아미노산일 수 있다.

상기 변이체는 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역 이외의 하나 이상의 추가 변형을 포함할 수 있으며, 상기 논의된 영역에서의 변형과 조합하여, 폴리뉴클레오타이드 포획을 향상시키고, 및/또는 폴리뉴클레오타이드 인식 또는 식별을 개선시킨다. 적합한 변형에는 D35, E128, E135, E134 및 E167 중 하나 이상에서의 치환이 포함되지만, 이에 한정되지는 않는다. 특히, 128, 135, 134 및 167번 위치 중 하나 이상에서 E를 치환함으로써 음전하를 제거하면 폴리뉴클레오타이드 포획이 개선된다. 이들 위치 중 하나 이상의 E는 상기 논의된 임의의 방법으로 치환될 수 있다. 바람직하게는 E128, E135, E134 및 E167 모두가 상기한 바와 같이 치환된다. E는 바람직하게는 A로 치환된다. 환언하면, 변이체는 바람직하게는 E128A, E135A, E134A 및 E167A 중 하나 이상 또는 모두를 포함한다. 다른 바람직한 치환체는 D35Q이다.

바람직한 구현예에서, 변이체는 서열번호: 2의 하기 치환체를 포함한다:

i. E84D 및 E85K 중 하나 이상, 예컨대 둘;

ii. E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 2, 3, 4, 5 또는 6개;

iii. E92N, E94N, E97N, D121N 및 D126N 중 하나 이상, 예컨대 2, 3, 4 또는 5개;

iv. E92N, E94N, E97N, D121N, D126N 및 E128N 중 하나 이상, 예컨대 2, 3, 4, 5 또는 6개;

v. E76S, E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

vi. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E50S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

vii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E71S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

viii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E94S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

ix. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E102S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

x. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E128S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

xi. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E135S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

xii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D68S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

xiii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D121S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

xiv. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D134S 중 하나 이상, 예컨대 2, 3, 4, 5, 6 또는 7개;

xv. E84D, E85K 및 E92Q 중 하나 이상, 예컨대 2 또는 3개;

xvi. E84Q, E85K, E92Q, E97S, D126G 및 E135S 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xvii. E85K, E92Q, E94S, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xviii. E76S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xix. E71S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xx. D68S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xxi. E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3 또는 4개;

xxii. E84Q, E85K, E92Q, E97S, H103S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxiii. E84Q, E85K, M90S, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxiv. E84Q, Q87S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxv. E84Q, E85S, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xxvi. E84S, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xxvii. H81S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxviii. Y79S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxix. F70S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxx. H58S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxxi. R52S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxxii. N48S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxxiii. N46S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxxiv. M44S, E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

xxxv. E92Q 및 E97S 중 하나 이상, 예컨대 둘다;

xxxvi. E84Q, E85K, E92Q 및 E97S 중 하나 이상, 예컨대 1, 2, 3 또는 4개;

xxxvii. E84Q 및 E85K 중 하나 이상, 예컨대 둘다;

xxxviii. E84Q, E85K 및 D126G 중 하나 이상, 예컨대 1, 2 또는 3개;

xxxix. E84Q, E85K, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3 또는 4개;

xl. E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2 또는 3개;

xli. E84Q, E85K, E92Q, E97S 및 D126G 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xlii. E84Q, E85K, E92Q, E97S 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xliii. E84Q, E85K, E92Q, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xliv. E84Q, E85K, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xlv. E84Q, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xlvi. E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개;

xlvii. E84D, E85K 및 E92Q 중 하나 이상, 예컨대 1, 2 또는 3개;

xlviii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D121S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

xlix. E84Q, E85K, E92Q, E97S, D126G, E167A 및 D68S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

l. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E135S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

li. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E128S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

lii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E102S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

liii. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E94S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

liv. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E71S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

lv. E84Q, E85K, E92Q, E97S, D126G, E167A 및 E50S 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

lvi. E76S, E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4, 5, 6 또는 7개;

lvii. E92N, E94N, E97N, D121N, D126N 및 E128N 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개;

lviii. E92N, E94N, E97N, D121N 및 D126N 중 하나 이상, 예컨대 1, 2, 3, 4 또는 5개; 또는

lix. E84Q, E85K, E92Q, E97S, D126G 및 E167A 중 하나 이상, 예컨대 1, 2, 3, 4, 5 또는 6개.

상기에서, 제1 문자는 치환된 서열번호: 2의 아미노산을 지칭하며, 숫자는 서열번호: 2내 위치이고, 제2 문자는 제1 문자가 치환될 아미노산을 지칭한다. 따라서, E84D는 84번 위치의 글루탐산(E)을 아스파르트산(D)으로 치환하는 것을 지칭한다.

상기 변이체는 i 내지 lix 중 임의의 하나에서 임의의 치환의 수, 예컨대 1, 2, 3, 4, 5, 6 또는 7개를 포함할 수 있다. 변이체는 바람직하게는 상기 i 내지 lix 중 임의의 하나에 나타낸 모든 치환을 포함한다.

바람직한 구현예에서, 변이체는 상기 i 내지 xv 중 어느 하나의 치환을 포함한다. 변이체는 i 내지 xv 중 임의의 하나의 치환의 임의의 수, 예컨대 1, 2, 3, 4, 5, 6 또는 7개를 포함할 수 있다. 변이체는 바람직하게는 상기 i 내지 xv 중 어느 하나에 나타낸 모든 치환을 포함한다.

하나 이상의 변형이 폴리뉴클레오타이드를 인식 또는 식별하는 모노머의 능력을 개선시키려는 경우, 이들은 바람직하게는 폴리뉴클레오타이드 포획을 개선시키는 상기 논의된 변형예, 예컨대 E84Q, E85K, E92Q, E97S, D126G 및 E167A에 더해 이루어진다.

상기 확인된 영역에 대한 하나 이상의 변형은 상기 영역 내의 하나 이상의 아미노산이 라이세닌의 상동체 또는 파라로그내 상응하는 위치(들)에 존재하는 아미노산으로 치환하는 것과 관련될 수 있다. 라이세닌의 동족체의 4가지 예는 서열번호: 14 내지 17에 제시된다. 이러한 치환의 이점은 동족체 모노머가 또한 포어를 형성하기 때문에 포어를 형성하는 돌연변이체 모노머를 생성할 가능성이 있다는 것이다. 예를 들어, 돌연변이는 서열번호: 2와 서열번호: 14 내지 서열번호: 17 중 임의의 하나 사이에서 상이한 서열번호: 2의 임의의 하나 이상의 위치에서 제조될 수 있다. 이러한 돌연변이는 서열번호: 14 내지 17 중 어느 하나에 있어서의 상응하는 위치로부터의 아미노산, 바람직하게는 서열번호: 14 내지 16 중 어느 하나에서의 아미노산에 의한 서열번호: 2의 아미노산의 치환일 수 있다. 대안적으로, 상기 위치 중 어느 하나의 돌연변이는 임의의 아미노산에 의한 치환, 또는 결실 또는 삽입 돌연변이, 예컨대 1 내지 30개의 아미노산, 예컨대 2 내지 20개, 3 내지 10개 또는 4 내지 8개의 아미노산의 치환, 결실 또는 삽입일 수 있다. 본원에 개시된 돌연변이 및 선행 기술, 예를 들어 WO 2013/153359에 개시된 돌연변이 외에, 서열번호: 2와 서열번호: 14 내지 17의 모든 것, 바람직하게는 서열번호: 14 내지 16의 모든 것 사이에 보존되거나 또는 동일한 아미노산은 바람직하게는 본 발명의 변이체에 보존되거나 존재한다. 보존적 돌연변이는 서열번호: 2와 서열번호: 14 내지 17, 또는 보다 바람직하게는 서열번호: 14 내지 16 사이에서 보존되거나 동일한 상기 위치들 중 임의의 하나 이상에서 이루어질 수 있다.

본 발명은 서열번호: 2에서 특정 위치에 상응하는 라이세닌 모노머의 구조 내의 위치에서 서열번호: 2의 특정 위치로 치환된 것으로서 본원에 기재된 임의의 하나 이상의 아미노산을 포함하는 라이세닌 돌연변이체 모노머를 제공한다. 상응하는 위치는 당해 분야의 표준 기술에 의해 결정될 수 있다. 예를 들어, 위에서 언급한 PILEUP 및 BLAST 알고리즘은 라이세닌 모노머의 서열을 서열번호: 2와 정렬하여 상응하는 잔기를 동정하는데 사용될 수 있다.

돌연변이체 모노머는 전형적으로 야생형 라이세닌 모노머와 동일한 3D 구조, 예컨대 서열번호: 2의 서열을 갖는 라이세닌 모노머와 동일한 3D 구조를 형성하는 능력을 보유한다. 라이세닌 모노머의 3D 구조는 당해 분야에 알려져 있으며, 예를 들어 De Colbis 등, Structure, 2012(20): 1498-1507에 개시되어 있다. 돌연변이체 모노머는 전형적으로 다른 라이세닌 모노머와 함께 호모올리고머성 및/또는 헤테로올리고머성 포어를 형성하는 능력을 보유한다. 돌연변이체 모노머는 전형적으로 포어에 존재할 때 야생형 라이세닌 모노머와 동일한 3D 구조를 형성하도록 리폴딩하는 능력을 보유한다. 라이세닌 포어 내의 라이세닌 모노머의 3D 구조는 본원의 도 7에 도시된다. 본원에 기재된 돌연변이에 추가하여 야생형 라이세닌 서열에서 임의의 수의 돌연변이, 예컨대 2 내지 100개, 3 내지 80개, 4 내지 70개, 5 내지 60개, 10 내지 50개 또는 20 내지 40개의 돌연변이가 이루어질 수 있으며, 단, 라이세닌 돌연변이체 모노머는 본 발명의 돌연변이에 의해 그것에 부여된 개선된 특성 중 하나 이상을 보유한다.

전형적으로, 라이세닌 모노머는 라이세닌 모노머가 다른 동일한 돌연변이체 모노머 또는 상이한 라이세닌 돌연변이체 모노머와 조립되어 포어를 형성할 때 2개의 베타 시트를 라이세닌 포어의 배럴에 제공하는 능력을 보유할 것이다.

변이체는 또한, 바람직하게는 E84Q/E85K/E92Q/E97S/D126G 중 하나 이상 또는, 적합한 경우 E84Q/E85K/E92Q/E97S/D126G 모두를 포함한다. "적합한 경우"는 위치가 여전히 돌연변이체 모노머에 존재하는지 또는 상이한 아미노산으로 변형되지 않았는지를 의미한다.

위에서 논의된 특정 돌연변이 이외에, 변이체는 다른 돌연변이를 포함할 수 있다. 이러한 돌연변이는 폴리뉴클레오타이드와 상호작용하는 모노머의 능력을 반드시 향상시키지는 않는다. 돌연변이는 예를 들어 발현 및/또는 정제를 용이하게 할 수 있다. 서열번호: 2의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게는 아미노산 유사성 또는 동일성에 기반하여 그 서열과 적어도 50% 상동일 것이다. 보다 바람직하게는, 변이체는 전체 서열에 대해 서열번호: 2의 아미노산 서열과의 아미노산 유사성 또는 동일성을 기반으로 하여 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 및 더 바람직하게는 적어도 95%, 97% 또는 99% 상동일 수 있다. 100 또는 그 이상, 예를 들어 125, 150, 175 또는 200 이상의 인접한 아미노산의 스트레치(stretch)에 걸쳐 아미노산 유사성 또는 동일성이 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95%일 수 있다("경질 상동성").

상동성을 결정하기 위해 당해 분야의 표준 방법을 사용할 수 있다. 예를 들어, UWGCG 패키지는 상동성을 계산, 예를 들어 그의 디폴트 설정하는 데 사용할 수 있는 BESTFIT 프로그램을 제공한다(Devereux et al (1984) Nucleic Acids Research 12, p387-395). PILEUP 및 BLAST 알고리즘은 예를 들어 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S.F et al (1990) J Mol Biol 215:403-10에 기술된 바와 같이, 상동성 또는 라인 업 서열(예컨대 균등한 잔기 또는 상응하는 서열(전형적으로 그들의 디폴트 설정))을 계산하는데 사용될 수 있다. BLAST 분석을 수행하는 소프트웨어는 미국 국립생물공학 정보센터(National Center for Biotechnology Information)(http://www.ncbi.nlm.nih.gov/)를 통해 공공연하게 이용가능하다. 유사성은 쌍별 동일성을 사용하거나, BLOSUM62와 같은 평점 매트릭스를 적용하고 균등한 동일성으로 변환하여 측정할 수 있다. 진화된 변화라기보다는 기능성 변화를 나타내기 때문에, 의도적으로 돌연변이된 위치는 상동성을 결정할 때 마스킹된다. 유사성은 예를 들어, 단백질 서열의 포괄적인 데이터베이스에 대한 PSIBLAST를 사용하는 위치-특정 평점 매트릭스의 적용에 의해 보다 민감하게 결정될 수 있다. 진화론적 시간 척도에 걸친 치환 빈도보다는 아미노산의 화학-물리적 특성을 반영하는 상이한 평점 매트릭스가 사용될 수 있다(예를 들어, 전하).

1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 치환과 같은 아미노산 치환이 상기 논의된 것 이외에 서열번호: 2의 아미노산 서열에 대해 이루어질 수 있다. 보존적 치환은 아미노산을 유사한 화학 구조, 유사한 화학적 특성 또는 유사한 측쇄 용적의 다른 아미노산으로 대체한다. 도입된 아미노산은 그들이 대체되는 아미노산에 대하여 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존의 방향족 또는 지방족 아미노산 대신에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변화는 당해 기술 분야에 잘 알려져 있으며, 하기 표 3에 정의된 20개의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 갖는 경우, 이는 표 4의 아미노산 측쇄에 대한 친수도 척도를 참고로 결정될 수 있다.

상기 변이체는 아미노산이 라이세닌의 동족체 및 파라로그내에 상응하는 위치(들)의 아미노산으로 대체된 상기 지정된 영역 외의 하나 이상의 치환을 포함할 수 있다. 라이세닌의 동족체의 4가지 예가 서열번호: 14 내지 17에 개시되어 있다.

서열번호: 2의 아미노산 서열의 하나 이상의 아미노산 잔기가 상기 변이체에서 추가로 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개의 잔기가 결실되거나, 그 이상이 될 수 있다.

변이체는 서열번호: 2의 단편을 포함할 수 있다. 이러한 단편은 포어 형성 활성을 보유한다. 이것은 상기에 기재된 바와 같이 분석될 수 있다. 단편은 길이가 적어도 50, 100, 150, 200 또는 250개의 아미노산일 수 있다. 이러한 단편은 본 발명의 포어를 생성하는데 사용될 수 있다. 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역이 본 발명에 따른 하나 이상의 결실에 의해 변형될 수 있기 때문에, 단편은 전체 영역을 함유할 필요는 없다. 따라서, 비변형된 영역의 길이보다 짧은 단편이 본 발명에 의해 구상된다. 단편은 바람직하게는 서열번호: 2의 포어 형성 도메인을 포함한다. 단편은 더욱 바람직하게, 본 발명에 따라 변형된 서열번호: 2의 약 44번 위치 내지 약 126번 위치의 영역을 포함한다.

하나 이상의 아미노산은 대안적으로 또는 추가로, 상기 기재된 변이체에 첨가될 수 있다. 연장부는 이의 단편을 포함하여, 서열번호: 2의 변이체의 아미노산 서열의 아미노 말단 또는 카복시 말단에 제공될 수 있다. 연장은 매우 짧을 수 있으며, 예를 들어 1 내지 10개의 아미노산 길이일 수 있다. 대안적으로, 연장은 예를 들어 최대 50 또는 100개의 아미노산까지 더 길어질 수 있다. 캐리어 단백질은 본 발명에 따른 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 이하에 더 상세하게 논의된다.

상기에 논의된 바와 같이, 변이체는 서열번호: 2의 아미노산 서열과는 상이하고 포어를 형성하는 그의 능력을 보유하는 아미노산 서열을 갖는 폴리펩타이드이다. 변이체는 전형적으로 포어 형성을 담당하는 서열번호: 2의 영역, 즉 약 44번 위치 내지 약 126번 위치를 함유하며, 이 영역은 상기 논의된 바와 같이 본 발명에 따라 변형된다. 상기에 논의된 바와 같이, 이 영역의 단편을 포함할 수 있다. 본 발명의 변형에 추가하여, 서열번호: 2의 변이체는 하나 이상의 추가의 변형, 예컨대 치환, 첨가 또는 결실을 포함할 수 있다. 이러한 변형은 바람직하게는 서열번호: 2의 약 1번 위치 내지 약 43번 위치 및 약 127번 위치 내지 약 297번 위치(즉, 본 발명에 따라 변형된 영역 외부)에 해당하는 변이체의 연장부에 위치한다.

돌연변이체 모노머는 예를 들어 히스티딘 잔기(hist 태그), 아스파르트산 잔기(asp 태그), 스트렙타비딘 태그 또는 플래그 태그의 첨가에 의해, 또는 폴리펩타이드가 그러한 서열을 자연적으로 함유하지 않는 세포로부터 그들의 분비를 촉진시키는 신호 서열의 첨가에 의해, 그것의 확인 또는 정제를 돕기 위해 변형될 수 있다. 유전적 태그를 도입하는 대안은 화학적으로 포어의 원상태 또는 조작적 위치에 태그를 화학적으로 반응시키는 것이다. 이것의 예는 겔-이동 시약을 포어 외부에서 조작된 시스테인에 반응시키는 것이다. 이것은 헤몰라이신 헤테로-올리고머를 분리하는 방법으로 실증되었다(Chem Biol. 1997 Jul;4(7):497-505).

돌연변이체 모노머는 노출 표지로 표지될 수 있다. 상기 노출 표지는 포어를 검출할 수 있는 임의의 적합한 표지일 수 있다. 적합한 표지에는 형광 분자, 방사성 동위원소, 예를 들어, ¹²⁵I, ³⁵S, 효소, 항체, 항원, 폴리뉴클레오타이드, 폴리에틸렌 글리콜(PEGs), 펩타이드 및 리간드, 예컨대 바이오틴이 포함되지만, 이에 한정되지 않는다.

돌연변이체 모노머는 또한 D-아미노산을 사용하여 생산될 수 있다. 예를 들어, 돌연변이체 모노머는 L-아미노산과 D-아미노산의 혼합물을 포함할 수 있다. 이러한 단백질 또는 펩타이드를 생산하는 것은 당해 분야에서 통상적인 것이다.

돌연변이체 모노머는 폴리뉴클레오타이드와의 상호작용을 용이하게 하기 위해 하나 이상의 특정 변형을 포함한다. 돌연변이체 모노머는 또한, 포어 형성을 방해하지 않는한 다른 비-특이적 변형을 함유할 수 있다. 수많은 비-특이적 측쇄 변형이 당해 분야에 공지되어 있고, 돌연변이체 모노머의 측쇄로 제조될 수 있다. 이러한 변형은 예를 들어, 알데히드와의 반응에 이어 NaBH₄에 의한 환원, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의한 아실화에 의한, 아미노산의 환원 알킬화를 포함한다.

돌연변이체 모노머는 당해 분야에 공지된 표준 방법을 사용하여 생산될 수 있다. 모노머는 합성적으로 또는 재조합 수단으로 제조될 수 있다. 예를 들어, 모노머는 시험관내 번역 및 전사(IVTT)에 의해 합성될 수 있다. 포어 모노머를 제조하기 위한 적합한 방법은 국제 출원 번호 PCT/GB09/001690(WO 2010/004273으로 공개됨), PCT/GB09/001679(WO 2010/004265로 공개됨) 또는 PCT/GB10/000133(WO 2010/086603)에 논의되어 있다. 막에 포어를 삽입하는 방법은 아래에 논의되어 있다.

돌연변이체 모노머를 암호화하는 폴리뉴클레오타이드 서열은 당해 분야의 표준 방법을 사용하여 유래 및 복제될 수 있다. 이러한 서열은 하기에서 보다 상세히 논의된다. 돌연변이체 모노머를 암호화하는 폴리뉴클레오타이드 서열은 당해 분야의 표준 기술을 사용하여 박테리아 숙주 세포에서 발현될 수 있다. 돌연변이체 모노머는 재조합 발현 벡터로부터의 폴리펩타이드의 원위치 발현에 의해 세포에서 생성될 수 있다. 발현 벡터는 선택적으로 폴리펩타이드의 발현을 조절하기 위해 유도성 프로모터를 운반한다.

돌연변이체 모노머는 포어 생산 유기체로부터의 임의의 단백질 액체 크로마토그래피 시스템에 의한 정제 후, 또는 이하에 기재된 바와 같은 재조합 발현 후 대규모로 생산될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템은 FPLC, AKTA 시스템, Bio-Cad 시스템, Bio-Rad BioLogic 시스템 및 Gilson HPLC 시스템을 포함한다. 돌연변이체 모노머는 본 발명에 따라 사용하기 위해 자연-발생 또는 인공 막에 삽입될 수 있다. 막에 포어를 삽입하는 방법은 아래에 논의되어 있다.

일부 구현예에서, 돌연변이체 모노머는 화학적으로 변형된다. 돌연변이체 모노머는 임의의 방식으로, 및 임의의 부위에서 화학적으로 변형될 수 있다. 돌연변이체 모노머는 바람직하게는 하나 이상의 시스테인에 분자의 부착(시스테인 연결), 하나 이상의 라이신에 분자의 부착, 하나 이상의 비-천연 아미노산에 분자의 부착, 에피토프의 효소변형 또는 말단의 변형에 의해 화학적으로 변형된다. 상기 변형을 수행하기 위한 적합한 방법은 당해 분야에 잘 알려져있다. 적합한 비-천연 아미노산은 Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444의 도 1에서 4-아지도-L-페닐알라닌(Faz) 및 1-71로 넘버링된 아미노산 중 임의의 하나를 포함하지만, 이에 한정되지는 않는다. 돌연변이체 모노머는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 모노머는 폴리에틸렌 글리콜(PEG), 핵산, 예컨대 DNA, 염료, 형광단 또는 발색단의 부착에 의해 화학적으로 변형될 수 있다.

일부 구현예에서, 돌연변이체 모노머는 모노머 및 표적 피분석물, 표적 뉴클레오타이드 또는 표적 폴리뉴클레오타이드를 포함하는 포어 사이의 상호작용을 용이하게 하는 분자 어댑터에 의해 화학적으로 변형된다. 어댑터의 존재는 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드의 호스트-게스트 화학을 개선시키고, 그렇게 함으로써 돌연변이체 모노머로부터 형성된 포어의 서열분석 능력을 개선시킨다. 호스트-게스트 화학의 원리는 당해 분야에 잘 알려져있다. 어댑터는 뉴클레오타이드 또는 폴리뉴클레오타이드와의 상호작용을 향상시키는 포어의 물리적 또는 화학적 특성에 영향을 미친다. 어댑터는 포어의 배럴 또는 채널의 전하를 변경시키거나, 뉴클레오타이드 또는 폴리뉴클레오타이드와 특이적으로 상호작용하거나 또는 뉴클레오타이드 또는 폴리뉴클레오타이드에 결합하여, 그렇게 함으로써 포어와의 상호작용을 촉진시킬 수 있다.

분자 어댑터는 바람직하게는 환형 분자, 예를 들어 사이클로덱스트린, 하이브리드화가 가능한 종, DNA 결합제 또는 인터킬레이터, 펩타이드 또는 펩타이드 유사체, 합성 폴리머, 방향족 평면 분자, 작은 양으로-하전된 분자 또는 수소-결합이 가능한 소분자이다.

어댑터는 환형일 수 있다. 환형 어댑터는 바람직하게는 포어와 동일한 대칭을 갖는다.

어댑터는 전형적으로 호스트-게스트 화학을 통해 피분석물, 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용한다. 어댑터는 전형적으로 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있다. 어댑터는 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 하나 이상의 화학기는 바람직하게는 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스 힘, π-양이온 상호작용 및/또는 정전기력에 의해 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용한다. 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있는 하나 이상의 화학기는 바람직하게는 양으로 하전된다. 뉴클레오타이드 또는 폴리뉴클레오타이드와 상호작용할 수 있는 하나 이상의 화학기는 보다 바람직하게는 아미노기를 포함한다. 아미노기는 1차, 2차 또는 3차 탄소 원자에 부착될 수 있다. 어댑터는 더욱더 바람직하게는 아미노기의 고리, 예컨대 6, 7, 8 또는 9개의 아미노기의 고리를 포함한다. 어댑터는 가장 바람직하게는 6 또는 9개의 아미노기의 고리를 포함한다. 양성자화된 아미노기의 고리는 뉴클레오타이드 또는 폴리뉴클레오타이드내 음으로 하전된 포스페이트기와 상호작용할 수 있다.

포어 내에서의 어댑터의 정확한 위치결정은 어댑터와 돌연변이체 모노머를 포함하는 포어 사이의 호스트-게스트 화학에 의해 용이하게 될 수 있다. 어댑터는 바람직하게는 포어 내의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 어댑터는 더 바람직하게 비-공유 상호작용, 예컨대 소수성 상호작용, 수소 결합, 반 데르 발스 힘, π-양이온 상호작용 및/또는 정전기력을 통해 포어 내의 하나 이상의 아미노산과 상호작용할 수 있는 하나 이상의 화학기를 포함한다. 포어 내의 하나 이상의 아미노산과 상호작용할 수 있는 화학기는 전형적으로 하이드록실 또는 아민이다. 하이드록실기는 1차, 2차 또는 3차 탄소 원자에 부착될 수 있다. 하이드록실기는 포어 내의 하전되지않은 아미노산과 수소 결합을 형성할 수 있다. 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드 사이의 상호작용을 용이하게 하는 임의의 어댑터가 사용될 수 있다.

적합한 어댑터는 사이클로덱스트린, 환형 펩타이드 및 쿠커비투릴(cucurbituril)을 포함하지만, 이에 한정되지는 않는다. 어댑터는 바람직하게는 사이클로덱스트린 또는 이의 유도체이다. 사이클로덱스트린 또는 이의 유도체는 Eliseev, A. V., and Schneider, H-J. (1994) J. Am. Chem. Soc. 116, 6081-6088에 개시된 임의의 것일 수 있다. 어댑터는 더 바람직하게는 헵타키스-6-아미노-β-사이클로덱스트린(am₇-βCD), 6-모노데옥시-6-모노아미노-β-사이클로덱스트린(am₁-βCD) 또는 헵타키스-(6-데옥시-6-구아니디노)-사이클로덱스트린(gu₇-βCD)이다. gu₇-βCD의 구아니디노 그룹은 am₇-βCD의 1차 아민보다 훨씬 높은 pKa를 가지므로 더 많이 양으로 하전된다. 이 gu₇-βCD 어댑터는 포어 내의 뉴클레오타이드의 체류 시간을 증가시키고, 측정된 잔존 전류의 정확도를 높일 뿐만 아니라, 고온 또는 낮은 데이터 수집 속도에서 염기 검출 속도를 증가시키는데 사용될 수 있다.

이하에 더 상세히 논의되는 바와 같이 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP) 가교결합제가 사용되는 경우, 어댑터는 바람직하게는 헵타키스(6-데옥시-6-아미노)-6-N-모노(2-피리딜)디티오프로파노일-β-사이클로덱스트린(am₆amPDP₁-βCD)이다.

더 적합한 어댑터에는 8개의 당 단위를 포함하는 γ-사이클로덱스트린이 포함된다(따라서 8배 대칭을 가짐). γ-사이클로덱스트린은 링커 분자를 함유할 수 있거나, 또는 상기 논의된 β-사이클로덱스트린의 예에서 사용된 모든 또는 그 이상의 변형된 당 단위를 포함하도록 변형될 수 있다.

분자 어댑터는 바람직하게는 돌연변이체 모노머에 공유결합된다. 어댑터는 당해 분야에 공지된 임의의 방법을 사용하여 포어에 공유결합될 수 있다. 어댑터는 전형적으로 화학적 연결을 통해 부착된다. 분자 어댑터가 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인이 바람직하게는 치환에 의해 돌연변이체로 도입된다. 본 발명의 돌연변이체 모노머는 물론 272 및 283번 위치 중 하나 또는 둘 모두에 시스테인 잔기를 포함할 수 있다. 돌연변이체 모노머는 이들 시스테인 중 하나 또는 둘 모두에 분자 어댑터를 부착시킴으로써 화학적으로 변형될 수 있다. 대안적으로, 돌연변이체 모노머는 하나 이상의 시스테인 또는 다른 위치에 도입된 FAz와 같은 비-천연 아미노산에 분자를 부착시킴으로써 화학적으로 변형될 수 있다.

시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 향상될 수 있다. 예를 들어, 측접하는 아르기닌, 히스티딘 또는 라이신 잔기의 염기성 기는 시스테인 티올 그룹의 pKa를 반응성 S^- 그룹의 pKa로 변화시킬 것이다. 시스테인 잔기의 반응성은 dTNB와 같은 티올 보호기에 의해 보호될 수 있다. 이들은 링커가 부착되기 전에 돌연변이체 모노머의 하나 이상의 시스테인 잔기와 반응될 수 있다. 분자는 돌연변이체 모노머에 직접 부착될 수 있다. 분자는 바람직하게는 링커, 예컨대 화학적 가교결합제 또는 펩타이드 링커를 사용하여 돌연변이체 모노머에 부착된다.

적합한 화학적 가교결합제는 당해 분야에 잘 알려져있다. 바람직한 가교결합제는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디설파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디설파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디설파닐)옥타노에이트를 포함한다. 가장 바람직한 가교결합제는 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP)이다. 전형적으로, 분자는 분자/가교결합제 복합체가 돌연변이체 모노머에 공유결합되기 전에 이중작용성 가교결합제에 공유결합되어 있지만, 이중작용성 가교결합제/모노머 복합체가 분자에 부착되기 전에 이중작용성 가교결합제를 모노머에 공유결합시킬 수도 있다.

다른 구현예에서, 모노머는 폴리뉴클레오타이드 결합 단백질에 부착될 수 있다. 이것은 본 발명의 방법에 사용될 수 있는 모듈러 서열분석 시스템을 형성한다. 폴리뉴클레오타이드 결합 단백질은 하기에서 논의된다.

폴리뉴클레오타이드 결합 단백질은 돌연변이체 모노머에 공유결합될 수 있다. 단백질은 당해 분야에 공지된 임의의 방법을 사용하여 포어에 공유결합될 수 있다. 모노머와 단백질은 화학적으로 융합되거나 유전적으로 융합될 수 있다. 전체 작제물이 단일 폴리뉴클레오타이드 서열로부터 발현되는 경우 모노머 및 단백질은 유전적으로 융합된다. 포어와 폴리뉴클레오타이드 결합 단백질의 유전적 융합은 국제 출원 제 PCT/GB09/001679호(WO 2010/004265로 공개됨)에서 논의된다.

폴리뉴클레오타이드 결합 단백질이 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인은 바람직하게는 치환에 의해 돌연변이체로 도입된다. 그러한 치환은 전형적으로 동족체 중에서 낮은 보존성을 갖는 루프 영역에서 이루어지므로, 돌연변이 또는 삽입이 용인될 수 있음을 나타낸다. 따라서, 이들은 폴리뉴클레오타이드 결합 단백질을 부착시키는데 적합하다. 이러한 치환은 전형적으로 서열번호: 2의 잔기 1 내지 43 및 127 내지 297에서 이루어진다. 시스테인 잔기의 반응성은 상기 기재된 바와 같은 변형에 의해 향상될 수 있다.

폴리뉴클레오타이드 결합 단백질은 돌연변이체 모노머에 직접 또는 하나 이상의 링커를 통해 부착될 수 있다. 폴리뉴클레오타이드 결합 단백질은 국제 출원 번호 PCT/GB10/000132(WO 2010/086602로 공개됨)에 기재된 하이브리드화 링커를 사용하여 돌연변이체 모노머에 부착될 수 있다. 대안적으로, 펩타이드 링커가 사용될 수 있다. 펩타이드 링커는 아미노산 서열이다. 펩타이드 링커의 길이, 가요성 및 친수성은 전형적으로 모노머 및 분자의 기능을 방해하지 않도록 설계된다. 바람직한 가요성 펩타이드 링커는 2 내지 20개, 예컨대 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산의 연장이다. 보다 바람직한 가요성 링커는 (SG)₁, (SG)₂, (SG)₃, (SG)₄, (SG)₅ 및 (SG)₈(여기서, S가 세린이고 G가 글리신임)을 포함한다. 바람직한 경질 링커는 2 내지 30개, 예컨대 4, 6, 8, 16 또는 24개의 프롤린 아미노산의 연장이다. 보다 바람직한 경질 링커는 (P)₁₂(여기서, P가 프롤린임)를 포함한다.

돌연변이체 모노머는 분자 어댑터 및 폴리뉴클레오타이드 결합 단백질로 화학적으로 변형될 수 있다.

돌연변이 라이세닌 모노머 제조

본 발명은 또한 폴리뉴클레오타이드를 특징화하기 위해 서열번호: 2에 나타낸 서열을 포함하는 라이세닌 모노머의 능력을 개선시키는 방법을 제공한다. 상기 방법은 서열번호: 2의 본 발명의 하나 이상의 변형 및/또는 치환을 형성하는 단계를 포함한다. 특징적인 폴리뉴클레오타이드와 관련하여 돌연변이체 라이세닌 모노머와 관련하여 상기 논의된 구현예 중 임의의 것은 본 발명의 방법에 동등하게 적용된다.

작제물

본 발명은 또한 라이세닌으로부터 유도된 2종 이상의 공유결합된 모노머를 포함하로서, 적어도 하나의 모노머가 본 발명의 돌연변이체 라이세닌 모노머인 작제물을 제공한다. 본 발명의 작제물은 포어 형성 능력을 보유한다. 본 발명의 하나 이상의 작제물은 표적 피분석물을 특징화하기 위한 포어를 형성하는데 사용될 수 있다. 본 발명의 하나 이상의 작제물은 표적 폴리뉴클레오타이드를 서열화하는 것과 같이 표적 폴리뉴클레오타이드를 특징화하기 위한 포어를 형성하는데 사용될 수 있다. 작제물은 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 모노머를 포함할 수 있다. 2개 이상의 모노머는 동일하거나 상이할 수 있다.

작제물 내의 적어도 모노머는 본 발명의 돌연변이체 모노머이다. 작제물내 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상의 모노머가 본 발명의 돌연변이체 모노머일 수 있다. 작제물 내의 모든 모노머는 바람직하게는 본 발명의 돌연변이체 모노머이다. 돌연변이체 모노머는 동일하거나 상이할 수 있다. 바람직한 구현예에서, 작제물은 본 발명의 2개의 돌연변이체 모노머를 포함한다.

작제물 내의 본 발명의 돌연변이체 모노머는 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 작제물 내의 본 발명의 돌연변이체 모노머의 배럴은 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 길이는 아미노산의 수 및/또는 길이 단위로 측정될 수 있다. 작제물 내의 본 발명의 돌연변이체 모노머는 바람직하게는 상기 기재된 바와 같이 34 내지 70번 위치 및/또는 71 내지 107번 위치에서 결실된 동일한 수의 아미노산을 갖는다.

작제물 내의 다른 모노머는 본 발명의 돌연변이체 모노머일 필요는 없다. 예를 들어, 적어도 하나의 모노머는 서열번호: 2에 나타낸 서열을 포함할 수 있다. 작제물 내의 적어도 하나의 모노머는 서열번호: 2의 파라로그 또는 동족체일 수 있다. 적합한 동족체는 서열번호: 14 내지 17로 나타낸다.

대안적으로, 적어도 하나의 모노머는 서열번호: 2의 변이체를 포함할 수 있으며, 이 변이체는 아미노산 동일성을 기반으로 전체 서열에 대해 서열번호: 2와 적어도 50% 상동성이지만, 본 발명의 돌연변이체 모노머에 의해 요구되는 임의의 특정 돌연변이를 포함하지 않거나, 또는 상기 기재된 바와 같이 아미노산이 결실되어 있지 않다. 더 바람직하게는, 변이체는 전체 서열에 걸쳐 서열번호: 2의 아미노산 서열과 아미노산 동일성을 기반으로 하여 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 및 더 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 상기 변이체는 상기 논의된 단편 또는 임의의 다른 변이체일 수 있다. 본 발명의 작제물은 또한 아미노산 동일성에 기초한 전체 서열에 걸쳐, 서열번호: 14, 15, 16 또는 17에 대해 상기 언급된 상동성의 적어도 50% 상동성 또는 적어도 임의의 다른 상동성 수준인 서열번호: 14, 15, 16 또는 17의 변이체를 포함할 수 있다.

작제물 내의 모든 모노머는 본 발명의 돌연변이체 모노머일 수 있다. 돌연변이체 모노머는 동일하거나 상이할 수 있다. 보다 바람직한 구현예에서, 작제물은 2개의 모노머를 포함하고, 모노머 중 적어도 하나는 본 발명의 돌연변이체 모노머이다.

모노머는 유전적으로 융합될 수 있다. 모노머는 전체 작제물이 단일 폴리뉴클레오타이드 서열로부터 발현되는 경우 유전적으로 융합된다. 모노머의 암호화 서열은 임의의 방법으로 조합되어 작제물을 암호화하는 단일 폴리뉴클레오타이드 서열을 형성할 수 있다. 유전적 융합은 국제 출원 제 PCT/GB09/001679호(WO 2010/004265로 공개됨)에서 논의된다.

모노머는 임의의 배치형태로 유전적으로 융합될 수 있다. 모노머는 말단 아미노산을 통해 융합될 수 있다. 예를 들어, 하나의 모노머의 아미노 말단은 다른 모노머의 카복시 말단에 융합될 수 있다.

2종 이상의 모노머는 직접 유전적으로 함께 융합될 수 있다. 모노머는 바람직하게는 링커를 사용하여 유전적으로 융합된다. 링커는 모노머의 이동도를 제한하도록 설계될 수 있다. 바람직한 링커는 아미노산 서열(즉, 펩타이드 링커)이다. 상기 논의된 임의의 펩타이드 링커가 사용될 수 있다.

펩타이드 링커의 길이, 가요성 및 친수성은 전형적으로 모노머 및 분자의 기능을 교란시키지 않도록 설계된다. 바람직한 가요성 펩타이드 링커는 2 내지 20개, 예컨대 4, 6, 8, 10 또는 16개의 세린 및/또는 글리신 아미노산의 연장이다. 더 바람직한 가요성 링커는 (SG)₁, (SG)₂,(SG)₃, (SG)₄, (SG)₅ 및 (SG)₈(여기서, S가 세린이고 G가 글리신임)이다. 바람직한 경질 링커는 2 내지 30, 예컨대 4, 6, 8, 16 또는 24개의 프롤린 아미노산의 연장이다. 더 바람직한 경질 링커는 P가 프롤린 인(P)₁₂(여기서, P는 프롤린임)를 포함한다.

또 다른 바람직한 구현예에서, 모노머는 화학적으로 융합된다. 모노머는 예를 들어 화학적 가교결합제를 통해 화학적으로 부착되는 경우 화학적으로 융합된다. 위에서 논의된 임의의 화학적 가교결합제가 사용될 수 있다. 링커는 하나 이상의 시스테인 잔기 또는 비-천연 아미노산, 예컨대 돌연변이체 모노머에 도입된 Faz에 부착될 수 있다. 대안적으로, 링커는 작제물 내의 모노머 중 하나의 말단에 부착될 수 있다. 모노머는 전형적으로 서열번호: 2의 잔기 1 내지 43 및 127 내지 297 중 하나 이상을 통해 연결된다.

작제물이 상이한 모노머를 함유하는 경우, 모노머의 과잉의 함량에서 링커의 농도를 유지함으로써 자체에 대한 모노머의 가교결합이 예방될 수 있다. 대안적으로, 2개의 링커가 사용되는 "잠금 및 키" 배열이 사용될 수 있다. 각 링커의 단 하나의 단부가 더 긴 링커를 형성하기 위해 함께 반응할 수 있고, 링커의 다른 단부는 각각 상이한 모노머와 반응할 수 있다. 이러한 링커는 국제 출원 제 PCT/GB10/000132호(WO 2010/086602로 공개됨)에 기재되어 있다.

본 발명은 또한 본 발명의 작제물을 제조하는 방법으로서, 상기 방법은 라이세닌으로부터 유래된 하나 이상의 모노머에 본 발명의 적어도 하나의 돌연변이체 라이세닌 모노머를 공유결합시키는 단계를 포함하는, 방법을 제공한다. 본 발명의 작제물과 관련하여 상기 논의된 임의의 구현예는 작제물을 제조하는 방법에 동등하게 적용된다.

폴리뉴클레오타이드

본 발명은 또한 본 발명의 돌연변이체 모노머를 암호화하는 폴리뉴클레오타이드 서열을 제공한다. 돌연변이체 모노머는 상기 논의된 임의의 것일 수 있다. 폴리뉴클레오타이드 서열은 바람직하게는 전체 서열에 대해 서열번호: 1의 서열과 뉴클레오타이드 동일성을 기반으로 하여 적어도 50%, 60%, 70%, 80%, 90% 또는 95% 상동성 서열을 포함한다. 300 또는 그 이상, 예를 들어 375, 450, 525 또는 600 이상의 인접 뉴클레오타이드("경질 상동성")의 연장에 걸쳐 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95% 뉴클레오타이드 동일성이 있을 수 있다. 상동성은 상기 기재된 바와 같이 계산될 수 있다. 폴리뉴클레오타이드 서열은 유전자 암호의 축 퇴에 기초하여 서열번호: 1과 상이한 서열을 포함할 수 있다.

본 발명은 또한 본 발명의 유전적으로 융합된 작제물 중 임의의 것을 암호화하는 폴리뉴클레오타이드 서열을 제공한다. 폴리뉴클레오타이드는 바람직하게는 상기 기재된 바와 같은 서열번호: 1 또는 그의 변이체에 나타낸 바와 같은 2종 이상의 서열을 포함한다.

폴리뉴클레오타이드 서열은 당해 분야의 표준 방법을 사용하여 유래 및 복제될 수 있다. 야생형 라이세닌을 암호화하는 염색체 DNA는 유기체, 예컨대 줄지렁이(Eisenia fetida)를 생성하는 포어로부터 추출될 수 있다. 포어 모노머를 암호화하는 유전자는 특정 프라이머를 포함하는 PCR을 사용하여 증폭될 수 있다. 이어서, 증폭된 서열은 부위 지향적 돌연변이유발을 겪을 수 있다. 부위 지향적 돌연변이유발의 적합한 방법은 당해 분야에 공지되어 있으며, 예를 들어 결합 연쇄 반응을 포함한다. 본 발명의 작제물을 암호화하는 폴리뉴클레오타이드는 공지된 기술, 예컨대 Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY에 기재된 기술을 사용하여 제조될 수 있다.

이어서, 수득된 폴리뉴클레오타이드 서열은 클로닝 벡터와 같은 재조합 복제 가능 벡터 내로 편입될 수 있다. 벡터는 양립가능한 숙주 세포에서 폴리뉴클레오타이드를 복제하는데 사용될 수 있다. 따라서, 폴리뉴클레오타이드 서열은 폴리뉴클레오타이드를 복제가능한 벡터에 도입하고, 벡터를 양립가능한 숙주 세포에 도입하고, 및 벡터의 복제를 야기하는 조건하에 숙주 세포를 성장시킴으로써 제조될 수 있다. 벡터는 숙주 세포로부터 회수될 수 있다. 폴리뉴클레오타이드의 클로닝을 위한 적합한 숙주 세포는 당해 분야에 공지되어 있으며, 이하에서 보다 상세히 기술된다.

폴리뉴클레오타이드 서열은 적합한 발현 벡터 내로 클로닝될 수 있다. 발현 벡터에서, 폴리뉴클레오타이드 서열은 전형적으로 숙주 세포에 의한 암호화 서열의 발현을 제공할 수 있는 조절 서열에 작동가능하게 연결된다. 이러한 발현 벡터는 포어 하위단위를 발현하는데 사용될 수 있다.

용어 "작동가능하게 연결된"은 기재된 상기 성분이 의도된 방식으로 기능할 수 있는 관계에 있는 병치를 지칭한다. 암호화 서열에 "작동가능하게 연결된" 조절 서열은 조절 서열과 양립가능한 조건 하에서 암호화 서열의 발현이 달성되는 방식으로 결찰된다. 동일하거나 상이한 폴리뉴클레오타이드 서열의 다중 복제본이 벡터에 도입될 수 있다.

발현 벡터는 적합한 숙주 세포에 도입될 수 있다. 따라서, 본 발명의 돌연변이체 모노머 또는 작제물은 폴리뉴클레오타이드 서열을 발현 벡터에 삽입하고,이 벡터를 양립가능한 박테리아 숙주 세포에 도입하고, 및 폴리뉴클레오타이드 서열의 발현을 유도하는 조건하에 숙주 세포를 성장시킴으로써 제조될 수 있다. 재조합적으로-발현된 모노머 또는 작제물은 숙주 세포 막의 포어로 자기-조립될 수 있다. 대안적으로, 이러한 방식으로 생성된 재조합 포어는 숙주 세포로부터 제거되어 다른 막에 삽입될 수 있다. 2개 이상의 상이한 하위단위를 포함하는 포어를 제조할 때, 상이한 하위단위는 상기 기재된 바와 같이 상이한 숙주 세포에서 별도로 발현되고, 숙주 세포로부터 제거되고, 별개의 막, 예컨대 양 적혈구 막 또는 스핑고미엘린을 함유하는 리포좀에서 포어로 조립될 수 있다.

예를 들어, 라이세닌 모노머는 스핑고미엘린 및 하기 지질 중 하나 이상: 포스파티딜세린; POPE; 콜레스테롤; 및 대두 PC를 포함하는 지질 혼합물을 첨가하고, 혼합물을 예를 들어 30℃에서 60분 동안 배양함으로써 올리고머화될 수 있다. 올리고머화된 모노머는 임의의 적합한 방법, 예를 들어 WO2013/153359에 기재된 바와 같은 SDS-PAGE 및 겔 정제에 의해 정제될 수 있다.

벡터는 예를 들어, 복제 기원이 제공된 플라스미드, 바이러스 또는 파아지 벡터, 선택적으로 상기 폴리뉴클레오타이드 서열의 발현을 위한 프로모터 및 선택적으로 프로모터의 조절자일 수 있다. 벡터는 하나 이상의 선택가능한 마커 유전자, 예를 들어 테트라사이클린 저항성 유전자를 함유할 수 있다. 프로모터 및 다른 발현 조절 신호는 발현 벡터가 설계된 숙주 세포와 양립가능하도록 선택될 수 있다. 전형적으로 T7, trc, lac, ara 또는 λ_L 프로모터가 사용된다.

숙주 세포는 전형적으로 포어 하위단위를 높은 수준으로 발현한다. 폴리뉴클레오타이드 서열로 형질전환된 숙주 세포는 세포를 형질전환하는데 사용되는 발현 벡터와 양립가능하도록 선택될 것이다. 숙주 세포는 전형적으로 박테리아이며, 바람직하게는 에스케리치아 콜라이(Escherichia coli)이다. λDE3 용질원을 갖는 임의의 세포, 예를 들어 C41 (DE3), BL21 (DE3), JM109 (DE3), B834 (DE3), TUNER, Origami 및 Origami B는 T7 프로모터를 포함하는 벡터를 발현할 수 있다. 상기 열거된 조건 외에도, Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20647-52에 인용된 방법 중 임의의 방법이 사용되어, 라이세닌 단백질을 발현시킬 수 있다.

포어

본 발명은 또한 다양한 포어를 제공한다. 본 발명의 포어는 피분석물의 특성을 분석하는데 이상적이다. 본 발명의 포어는 고도의 민감도로 상이한 뉴클레오타이드를 구별할 수 있기 때문에 폴리뉴클레오타이드 서열분석과 같은 특징화에 특히 이상적이다. 핵산을 서열분석하고 단일 염기 변화를 확인하는 것을 포함하여, DNA와 RNA와 같은 핵산을 특징화하기 위해 포어가 사용될 수 있다. 본 발명의 포어는 메틸화된 및 메틸화되지않은 뉴클레오타이드를 구별할 수 있다. 본 발명의 포어의 염기 해상도는 놀랍게도 높다. 포어는 4개의 DNA 뉴클레오타이드의 거의 완전한 분리를 나타낸다. 포어는 포어 내의 체류 시간 및 포어를 통해 흐르는 전류에 기초하여 데옥시시티딘 모노포스페이트(dCMP)와 메틸-dCMP를 구별하기 위해 추가로 사용될 수 있다.

본 발명의 포어는 또한 다양한 조건 하에서 상이한 뉴클레오타이드를 구별할 수 있다. 특히, 포어는 폴리뉴클레오타이드의 서열분석과 같은 특징화에 유리한 조건 하에서 뉴클레오타이드 사이를 구별할 것이다. 본 발명의 포어가 상이한 뉴클레오타이드를 구별할 수 있는 정도는 적용된 전위, 염 농도, 완충액, 온도 및 우레아, 베타인 및 DTT와 같은 첨가제의 존재를 변경함으로써 제어될 수 있다. 이렇게하면 특히 서열분석할 때 포어의 기능을 미세조정할 수 있다. 이에 대해서는 이하에 더 상세히 논의된다. 본 발명의 포어는 또한 뉴클레오타이드 기반으로 뉴클레오타이드보다는 하나 이상의 모노머와의 상호작용으로부터 폴리뉴클레오타이드 폴리머를 동정하는데 사용될 수 있다.

본 발명의 포어는 단리, 실질적으로 단리, 정제 또는 실질적으로 정제될 수 있다. 본 발명의 포어는 지질 또는 다른 포어와 같은 임의의 다른 성분이 완전히 없는 경우 단리되거나 정제된다. 포어는 의도된 용도를 저해하지 않을 캐리어 또는 희석제와 혼합되는 경우 실질적으로 단리된다. 예를 들어, 포어는 지질 또는 다른 포어와 같은 다른 성분의 10% 미만, 5% 미만, 2% 미만 또는 1% 미만을 포함하는 형태로 존재하는 경우 실질적으로 단리되거나 실질적으로 정제된다. 대안적으로, 본 발명의 포어는 지질 이중층에 존재할 수 있다.

본 발명의 포어는 개체 또는 단일 포어로서 존재할 수 있다. 대안적으로, 본 발명의 포어는 상동성 또는 이종성 모집단 또는 복수의 2종 이상의 포어에 존재할 수 있다.

호모-올리고머성 포어

본 발명은 또한 본 발명의 동일한 돌연변이체 모노머를 포함하는 라이세닌으로부터 유래된 호모-올리고머성 포어를 제공한다. 모노머는 아미노산 서열이 동일하다. 본 발명의 호모-올리고머성 포어는 폴리뉴클레오타이드 특징화, 예컨대 서열분석에 이상적이다. 본 발명의 호모-올리고머성 포어는 상기 논의된 임의의 이점을 가질 수 있다. 본 발명의 특정 호모-올리고머성 포어의 이점은 실시예에 나타나 있다.

호모-올리고머성 포어는 임의의 수의 돌연변이체 모노머를 함유할 수 있다. 포어는 전형적으로 2종 이상의 돌연변이체 모노머를 포함한다. 호모-올리고머성 포어는 임의의 수의 돌연변이체 모노머를 함유할 수 있다. 포어는 전형적으로 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 동일한 돌연변이체 모노머, 예컨대 6, 7, 8 또는 9개의 돌연변이체 모노머를 포함한다. 포어는 바람직하게는 8 또는 9개의 동일한 돌연변이체 모노머를 포함한다. 포어는 가장 바람직하게는 9개의 동일한 돌연변이체 모노머를 포함한다. 이 모노머의 수는 본 명세서에서 "충분한 수"로 언급된다.

1개 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 돌연변이체 모노머는 바람직하게는 상기 또는 하기에서 논의한 바와 같이 화학적으로 변형된다.

1개 이상의 돌연변이체 모노머는 바람직하게는 상기 또는 하기에서 논의된 바와 같이 화학적으로 변형된다. 환언하면, 화학적으로 변형된 모노머(및 화학적으로 변형되지 않은 모노머) 중 하나 이상은 각 모노머의 아미노산 서열이 동일하다면 포어가 호모-올리고머성이 되는 것을 방지하지 못한다.

라이세닌 포어를 제조하는 방법은 실시예 및 Yamaji 등, J. Biol. Chem. 1998; 273(9): 5300-6에 기술되어 있다.

헤테로-올리고머성 포어

본 발명은 또한 본 발명의 적어도 하나의 돌연변이체 모노머를 포함하는 라이세닌으로부터 유래된 헤테로-올리고머성 포어로서, 적어도 하나의 모노머가 다른 모노머와 상이한, 헤테로-올리고머성 포어를 제공한다. 모노머는 그의 아미노산 서열의 관점에서 다른 모노머와 상이하다. 본 발명의 헤테로-올리고머성 포어는 폴리뉴클레오타이드 특징화, 예컨대 서열분석에 이상적이다. 헤테로-올리고머성 포어는 당해 분야에 공지된 방법(예를 들어, Protein Sci. 2002 Jul;11(7):1813-24)을 사용하여 제조될 수 있다.

헤테로-올리고머성 포어는 포어를 형성하기에 충분한 모노머를 함유한다. 모노머는 예를 들어 야생형을 포함하는 임의의 유형일 수 있다. 포어는 전형적으로 2개 이상의 모노머를 포함한다. 포어는 전형적으로 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 모노머, 예컨대 6, 7, 8, 9 또는 10개의 모노머를 포함한다. 포어는 바람직하게는 8 또는 9개의 모노머를 포함한다. 포어는 가장 바람직하게는 9개의 모노머를 포함한다. 이 모노머의 수는 본 명세서에서 "충분한 수"로 언급된다.

포어는 본 발명의 돌연변이체 모노머에 의해 요구되는 돌연변이를 가지지 않거나 또는 상기에 기재된 바와 같이 아미노산이 결실되지 않은, 서열번호: 2에 나타낸 서열, 그의 파라로그, 그의 동족체 또는 그의 변이체를 포함하는 적어도 하나의 모노머를 포함할 수 있다. 적합한 변이체는 서열번호: 2, 14, 15, 16 및 17 및 그의 변이체를 포함하는 본 발명의 작제물과 관련하여 상기 논의된 임의의 변이체이다. 이 구현예에서, 잔존 모노머는 바람직하게는 본 발명의 돌연변이체 모노머이다.

바람직한 구현예에서, 포어는 (a) 본 발명의 하나의 돌연변이체 모노머 및 (b) 포어를 형성하기에 충분한 수의 동일한 모노머를 포함하며, 여기에서 (a)에서의 상기 돌연변이체 모노머는 (b)에서의 동일한 모노머와 상이하다. (b)에서의 동일한 모노머는 바람직하게는 본 발명의 돌연변이체 모노머에 의해 요구되는 돌연변이를 갖지 않는 서열번호: 2에 나타낸 서열, 그의 파라로그, 그의 동족체 또는 그의 변이체를 포함한다.

본 발명의 헤테로-올리고머성 포어는 바람직하게는 본 발명의 단 하나의 돌연변이체 라이세닌 모노머만을 포함한다.

또 다른 바람직한 구현예에서, 헤테로-올리고머성 포어 내의 모노머는 모두 본 발명의 돌연변이체 모노머이고, 이들 중 적어도 하나는 다른 것들과 상이하다.

포어 내의 본 발명의 돌연변이체 모노머는 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 포어 내의 본 발명의 돌연변이체 모노머의 배럴은 바람직하게는 대략 동일한 길이 또는 동일한 길이이다. 길이는 아미노산의 수 및/또는 길이 단위로 측정될 수 있다. 포어 내의 본 발명의 돌연변이체 모노머는 바람직하게는 34 내지 70번 위치 및/또는 71 내지 107번 위치에서 결실된 동일한 수의 아미노산을 갖는다.

상기 논의된 모든 구현예에서, 하나 이상의 돌연변이체 모노머는 바람직하게는 상기 또는 하기에서 논의된 바와 같이 화학적으로 변형된다. 하나의 모노머에 대한 화학적 변형의 존재는 포어가 헤테로-올리고머가 되지 않게 한다. 적어도 하나의 모노머의 아미노산 서열은 다른 모노머의 서열(들)과 상이해야 한다. 포어를 생성하는 방법은 아래에 더 상세히 논의된다.

작제물-함유 포어

본 발명은 또한 본 발명의 적어도 하나의 작제물을 포함하는 포어를 제공한다. 본 발명의 작제물은 라이세닌으로부터 유래된 2종 이상의 공유결합된 모노머를 포함하며, 여기에서 모노머 중 적어도 하나는 본 발명의 돌연변이체 라이세닌 모노머이다. 환언하면, 작제물은 하나 초과의 모노머를 함유해야 한다. 포어 내의 모노머 중 적어도 2종은 본 발명의 작제물의 형태이다. 모노머는 임의의 유형일 수 있다.

포어는 전형적으로 (a) 2개의 모노머를 포함하는 하나의 작제물 및 (b) 포어를 형성하기에 충분한 수의 모노머를 함유한다. 작제물은 위에 논의된 것 중 임의의 하나일 수 있다. 모노머는 본 발명의 돌연변이체 모노머를 포함하여 상기 논의된 임의의 것일 수 있다.

또 다른 전형적인 포어는 본 발명의 1 초과의 작제물, 예컨대 본 발명의 2, 3 또는 4개의 작제물을 포함한다. 이러한 포어는 포어를 형성하기에 충분한 수의 모노머를 추가로 포함한다. 모노머는 상기 논의된 임의의 것일 수 있다. 본 발명의 추가의 포어는 2개의 모노머를 포함하는 작제물만을 포함한다. 본 발명에 따른 특정 포어는 2개의 모노머를 각각 포함하는 몇개의 작제물을 포함한다. 작제물은 각 작제물로부터 하나의 모노머 만이 포어에 기여하도록 하는 구조를 갖는 포어로 올리고머화할 수 있다. 전형적으로, 작제물의 다른 모노머(즉, 포어를 형성하지 않는 모노머)는 포어의 외부에 있을 것이다.

돌연변이는 상기에 기재된 바와 같이 작제물에 도입될 수 있다. 돌연변이는 교대일 수 있는데, 즉, 돌연변이는 2개의 모노머 작제물 내의 각 모노머에 대해 상이하고, 작제물은 교대로 변형을 일으키는 호모-올리고머로서 조립된다. 환언하면, MutA 및 MutB를 포함하는 모노머가 융합되고 조립되어 A-B:A-B:A-B:A-B 포어를 형성한다. 대안적으로, 돌연변이는 이웃할 수 있으며, 즉 동일한 돌연변이가 작제물 내의 2개의 모노머에 도입되고, 이어서 이것은 상이한 돌연변이체 모노머로 올리고머화된다. 즉, MutA를 포함하는 모노머는 융합된 후, MutB-함유 모노머에 의해 올리고머화되어, A-A:B:B:B:B:B:B를 형성한다.

작제물-함유 포어 내의 하나 이상의 본 발명의 모노머는 상기 또는 하기에서 논의된 바와 같이 화학적으로-변형될 수 있다.

본 발명의 화학적으로-변형된 포어

또 다른 양태에서, 본 발명은 화학적으로-변형된 하나 이상의 돌연변이체 모노머를 포함하는 화학적으로-변형된 라이세닌 포어를 제공하여, 조립된 포어의 배럴/채널의 개방 직경이 하나의 부위에서, 또는 배럴의 길이; 예컨대 2, 3, 4 또는 5개의 부위에 따라 감소되거나 좁아지거나, 또는 조여진다. 포어는 본 발명의 호모-올리고머성 및 헤테로-올리고머성 포어와 관련하여 상기 논의된 임의의 수의 모노머를 포함할 수 있다. 포어는 바람직하게는 9개의 화학적으로-변형된 모노머를 포함한다. 화학적으로-변형된 포어는 상기에 기재된 바와 같이 호모-올리고머성일 수 있다. 환언하면, 화학적으로-변형된 포어 내의 모든 모노머는 동일한 아미노산 서열을 가질 수 있고, 동일한 방식으로 화학적으로 변형될 수 있다. 상기 화학적으로-변형된 포어는 상기에 기재된 바와 같이 헤테로-올리고머성일 수 있다. 환언하면, 포어는 (a) 화학적으로 변형된 단 하나의 모노머, (b) 적어도 2개, 예컨대, 3, 4, 5, 6, 또는 7개의 화학적으로-변형된 모노머가 서로 상이한, 1 초과, 예컨대 2, 3, 4, 5, 6, 7 또는 8개의 화학적으로-변형된 모노머 또는 (c) 적어도 2개, 예컨대 3, 4, 5, 6, 7, 8 또는 9개의 화학적으로-변형된 모노머가 서로 상이한 단독의 화학적으로-변형된 모노머(즉, 모든 모노머는 화학적으로-변형됨)를 포함할 수 있다. 모노머는 그들의 아미노산 서열, 그의 화학적 변형, 또는 그들의 아미노산 서열 및 이들의 화학적 변형의 관점에서 서로 상이할 수 있다. 화학적으로-변형된 모노머(들)은 상기 및/또는 하기에 논의된 임의의 것일 수 있다.

본 발명은 또한 하기 논의된 임의의 방법으로 화학적으로-변형된 돌연변이체 라이세닌 모노머를 제공한다. 돌연변이체 모노머는 상기 또는 하기에서 논의된 임의의 것일 수 있다. 그 결과, 본 발명의 돌연변이체 모노머, 예컨대 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상의 변형을 포함하는 서열번호: 2의 변이체, 또는 상기 논의된 배럴 결실을 포함하는 변이체는 하기 논의되는 바와 같이 본 발명에 따라 화학적으로-변형될 수 있다.

돌연변이체 모노머는 화학적으로-변형되어 조립된 포어의 배럴의 직경이 포어를 통과하는 피분석물의 크기에 의존하는 임의의 감소 인자에 의해 감소되거나 좁아질 수 있다. 수축 구역의 폭은 전형적으로 예를 들어 피분석물이 포어를 통한 이온 유동을 감소시킴으로써 피분석물의 전좌 동안 측정 신호의 파괴 정도를 결정할 것이다. 신호의 파괴가 클수록 전형적으로 측정 감도가 더 커진다. 따라서, 수축 구역은 전위되는 피분석물보다 약간 넓게 선택될 수 있다. 예를 들어 ssDNA의 전좌에 대하여, 수축 구역의 폭은 0.8 내지 3.0nm 범위의 값으로부터 선택될 수 있다.

화학적 변형은 또한 수축 구역의 길이를 결정할 수 있으며, 이 수축 구역은 차례로 측정 신호에 기여하는 폴리머 단위, 예컨대 뉴클레오타이드의 수를 결정할 것이다. 임의의 특정 시간에서 전류 신호에 기여하는 뉴클레오타이드는 k-mer로 언급될 수 있으며, 여기서 k는 정수이고 전체 또는 단편적 수일 수 있다. 4종의 핵 염기를 갖는 폴리뉴클레오타이드를 측정하는 경우, 3-mer는 4³개의 잠재적인 신호 수준을 발생시킬 것이다. k의 값이 클수록 더 많은 수의 신호 수준이 발생한다. 전형적으로 측정 신호 데이터의 분석을 단순화하기 때문에 짧은 수축 구역을 제공하는 것이 바람직하다.

화학적 변형은 바람직하게는 화학 분자가 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머에 공유결합되도록 하는 것이다. 화학 분자는 당해 분야에 공지된 임의의 방법을 사용하여 포어, 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머에 공유결합시킬 수 있다. 화학 분자는 일반적으로 화학 결합을 통해 부착된다.

돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 바람직하게는 하나 이상의 시스테인에 대한 분자의 부착(시스테인 연결), 하나 이상의 라이신에 대한 분자의 부착, 하나 이상의 비-천연 아미노산에 대한 분자의 부착 또는 에피토프의 효소 변형에 의해 화학적으로 변형된다. 화학적 개질제가 시스테인 연결을 통해 부착되면, 하나 이상의 시스테인은 바람직하게는 치환에 의해 상기 돌연변이체에 도입된다. 그러한 변형을 수행하기 위한 적합한 방법은 당해 분야에 잘 알려져있다. 적합한 비-천연 아미노산은 Liu C. C. and Schultz P. G., Annu. Rev. Biochem., 2010, 79, 413-444의 도 1에서 1-71로 넘버링된 아미노산 중 임의의 하나 및 4-아지도-L-페닐알라닌(Faz)을 포함하지만 이에 한정되지는 않는다.

돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 임의의 위치 또는 부위에서 조립된 포어의 배럴의 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 돌연변이체 모노머는 (i) 말레이미드 예컨대: 4-페닐아조말레이나닐, 1.N-(2-하이드록시에틸)말레이미드, N-사이클로헥실말레이미드, 1.3-말레이미도프로피온산, 1.1-4-아미노페닐-1H-피롤,2,5,디온, 1.1-4-하이드록시페닐-1H-피롤,2,5,디온, N-에틸말레이미드, N-메톡시카보닐말레이미드, N-tert-부틸말레이미드, N-(2-아미노에틸)말레이미드　, 3-말레이미도-프록실, N-(4-클로로페닐)말레이미드, 1-[4-(디메틸아미노)-3,5-디니트로페닐]-1H-피롤-2,5-디온, N-[4-(2-벤즈이미다졸릴)페닐]말레이미드, N-[4-(2-벤즈옥사졸일)페닐]말레이미드, N-(1-나프틸)-말레이미드, N-(2,4-크실릴)말레이미드, N-(2,4-디플루오로페닐)말레이미드, N-(3-클로로-파라-톨릴)-말레이미드, 1-(2-아미노-에틸)-피롤-2,5-디온 하이드로클로라이드, 1-사이클로펜틸-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, 1-(3-아미노프로필)-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 3-메틸-1-[2-옥소-2-(피페라진-1-일)에틸]-2,5-디하이드로-1H-피롤-2,5-디온 하이드로클로라이드, 1-벤질-2,5-디하이드로-1H-피롤-2,5-디온, 3-메틸-1-(3,3,3-트리플루오로프로필)-2,5-디하이드로-1H-피롤-2,5-디온, 1-[4-(메틸아미노)사이클로헥실]-2,5-디하이드로-1H-피롤-2,5-디온 트리플루오로아세트산, SMILES O=C1C=CC(=O)N1CC=2C=CN=CC2, SMILES O=C1C=CC(=O)N1CN2CCNCC2, 1-벤질-3-메틸-2,5-디하이드로-1H-피롤-2,5-디온, 1-(2-플루오로페닐)-3-메틸-2,5-디하이드로　1H-피롤-2,5-디온, N-(4-페녹시페닐)말레이미드　, N-(4-니트로페닐)말레이미드　 (ii) 아이오도세타미드 예컨대: 3-(2-아이오도아세트아미도)-프록실, N-(사이클로프로필메틸)-2-아이오도아세트아미드, 2-아이오도-N-(2-페닐에틸)아세트아미드, 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드, N-(4-아세틸페닐)-2-아이오도아세트아미드, N-(4-(아미노설포닐)페닐)-2-아이오도아세트아미드, N-(1,3-벤조티아졸-2-일)-2-아이오도아세트아미드, N-(2,6-디에틸페닐)-2-아이오도아세트아미드, N-(2-벤조일-4-클로로페닐)-2-아이오도아세트아미드, (iii) 브로모아세트아미드: 예컨대 N-(4-(아세틸아미노)페닐)-2-브로모아세트아미드, N-(2-아세틸페닐)-2-브로모아세트아미드, 2-브로모-N-(2-시아노페닐)아세트아미드, 2-브로모-N-(3-(트리플루오로메틸)페닐)아세트아미드, N-(2-벤조일페닐)-2-브로모아세트아미드, 2-브로모-N-(4-플루오로페닐)-3-메틸부탄아미드, N-벤질-2-브로모-N-페닐프로피온아미드, N-(2-브로모-부티릴)-4-클로로-벤젠설폰아미드, 2-브로모-N-메틸-N-페닐아세트아미드, 2-브로모-N-펜에틸-아세트아미드, 2-아다만탄-1-일-2-브로모-N-사이클로헥실-아세트아미드, 2-브로모-N-(2-메틸페닐)부탄아미드, 모노브로모아세트아닐라이드, (iv) 디설파이드 예컨대: 알드리티올-2, 알드리티올-4, 이소프로필 디설파이드, 1-(이소부틸디설파닐)-2-메틸프로판, 디벤질 디설파이드, 4-아미노페닐 디설파이드, 3-(2-피리딜디티오)프로피온산, 3-(2-피리딜디티오)프로피온산 하이드라자이드, 3-(2-피리딜디티오)프로피온산 N-석신이미딜 에스테르, am6amPDP1-βCD

및 (v) 티올 예컨대: 4-페닐티아졸-2-티올, Purpald, 5,6,7,8-테트라하이드로-퀴나졸린-2-티올의 부착에 의해 화학적으로 변형될 수 있다.

돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 폴리에틸렌 글리콜(PEG), 핵산, 예컨대 DNA, 염료, 형광단 또는 발색단의 부착에 의해 화학적으로 변형될 수 있다. 일부 구현예에서, 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 모노머 및 표적 피분석물, 표적 뉴클레오타이드 또는 표적 폴리뉴클레오타이드를 포함하는 포어 사이의 상호작용을 용이하게 하는 분자 어댑터로 화학적으로 변형된다. 어댑터의 존재는 포어와 뉴클레오타이드 또는 폴리뉴클레오타이드의 호스트-게스트 화학을 향상시키고, 그렇게 함으로써 돌연변이체 모노머로부터 형성된 포어의 서열분석 능력을 향상시킨다.

돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 임의의 위치: K37, V47, S49, T55, S86, E92, E94에서 조립된 포어의 배럴의 개방 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 더욱 바람직하게는, 돌연변이체 모노머는 위치 E92 및 E94에서 조립된 포어의 배럴의 개방 직경을 감소시키거나 좁히는 효과를 갖는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 일 구현예에서, 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머는 이들 위치에서 하나 이상의 시스테인에 분자를 부착(시스테인 연결)시킴으로써 화학적으로 변형된다.

시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 향상될 수 있다. 예를 들어, 측접하는 아르기닌, 히스티딘 또는 라이신 잔기의 염기성 기는 시스테인 티올 그룹의 pKa를 반응성 S^- 그룹의 pKa로 변화시킬 것이다. 시스테인 잔기의 반응성은 dTNB와 같은 티올 보호기에 의해 보호될 수 있다. 이들은 링커가 부착되기 전에 돌연변이체 모노머의 하나 이상의 시스테인 잔기와 반응될 수 있다.

분자는 돌연변이체 모노머 또는 하나 이상의 돌연변이체 모노머에 직접 부착될 수 있다. 분자는 바람직하게는 링커, 예컨대 화학적 가교결합제 또는 펩타이드 링커를 사용하여 돌연변이체 모노머에 부착된다. 적합한 화학적 가교결합제는 당해 분야에 잘 알려져있다. 바람직한 가교결합제는 2,5-디옥소피롤리딘-1-일 3-(피리딘-2-일디설파닐)프로파노에이트, 2,5-디옥소피롤리딘-1-일 4-(피리딘-2-일디설파닐)부타노에이트 및 2,5-디옥소피롤리딘-1-일 8-(피리딘-2-일디설파닐)옥타노에이트를 포함한다. 가장 바람직한 가교결합제는 석신이미딜 3-(2-피리딜디티오)프로피오네이트(SPDP)이다. 전형적으로, 분자는 분자/가교결합제 복합체가 돌연변이체 모노머에 공유결합되기 전에 이중작용성 가교결합제에 공유결합되어 있지만, 이중작용성 가교결합제/모노머 복합체가 분자에 부착되기 전에 이중작용성 가교결합제를 모노머에 공유결합시킬 수도 있다.

이러한 방식으로 화학적으로-변형된 포어는 (i) 판독 헤드의 선명도 개선, (ii) 염기들간의 개선된 식별력, 및 (iii) 개선된 범위, 즉 개선된 신호대 잡음비의 특정 장점을 나타낸다.

배럴 내의 특정 위치를 화학 분자로 변경함으로써 신규한 판독기-헤드가 도입되거나 오래된 판독기 헤드가 변형될 수 있다. 변형된 분자의 크기로 인해, 판독기 헤드의 물리적 크기가 상당히 변경될 수 있다. 유사하게, 변형된 분자의 화학적 특성으로 인해 판독기-헤드의 특성이 변경될 수 있다. 두 가지 효과의 조합은 염기의 개선된 해상도와 더 나은 식별력을 갖춘 판독기 헤드를 구현하는 것으로 실증되었다. 상이한 위치에서 상이한 염기의 신호에 대한 상대적인 기여도가 변경되었을뿐만 아니라, 극단적인 판독기-헤드 위치는 신호에 대한 이들의 기여도가 훨씬 낮아서 주어진 모멘트에서 분석된 Kmer의 길이가 더 짧은 것을 의미하는 매우 낮은 식별력을 나타낸다. 이 더 선명한 판독기-헤드는 원래의 신호에서 Kmers의 디콘볼루션 프로세스를 더욱 단순화한다.

본 발명의 포어의 제조

본 발명은 또한 본 발명의 포어를 제조하는 방법을 제공한다. 상기 방법은 본 발명의 적어도 하나의 돌연변이체 모노머 또는 본 발명의 적어도 하나의 작제물이 본 발명의 충분한 수의 돌연변이체 라이세닌 모노머, 본 발명의 작제물, 라이세닌 모노머 또는 라이세닌 유래의 모노머와 함께 올리고머화하여 포어를 형성시키는 단계를 포함한다. 상기 방법이 본 발명의 호모-올리고머성 포어의 제조에 관한 것이라면, 상기 방법에 사용된 모든 모노머는 동일한 아미노산 서열을 갖는 본 발명의 돌연변이체 라이세닌 모노머이다. 상기 방법이 본 발명의 헤테로-올리고머성 포어의 제조에 관한 것이라면, 상기 모노머 중 적어도 하나는 다른 것과 상이하다.

전형적으로, 모노머는 상기 기재된 바와 같이 숙주 세포에서 발현되고, 숙주 세포로부터 제거되고, 양성 적혈구 막 또는 스핑고미엘린을 함유하는 리포좀과 같은 별개의 막에서 포어로 조립된다.

예를 들어, 라이세닌 모노머는 스핑고미엘린 및 하기 지질: 포스파티딜 세린; POPE; 콜레스테롤; 및 대두 PC 중 하나 이상을 포함하는 지질 혼합물을 첨가하고, 및 상기 혼합물을 예를 들어 30℃에서 60분 동안 배양함으로써 올리고머화될 수 있다. 올리고머화된 모노머는 임의의 적합한 방법, 예를 들어 WO2013/153359에 기재된 바와 같은 SDS-PAGE 및 겔 정제에 의해 정제될 수 있다.

본 발명의 포어와 관련하여 상기에서 논의된 임의의 구현예는 포어를 생성하는 방법에 동등하게 적용된다.

피분석물의 특징화 방법

본 발명은 표적 피분석물을 특징화하는 방법을 제공한다. 상기 방법은 상기 표적 피분석물이 상기 포어를 통해 이동하도록 상기 표적 피분석물을 본 발명의 포어와 접촉시키는 단계를 포함한다. 포어는 위에 논의된 것들 중 임의의 하나일 수 있다. 이어서, 당해 분야에 공지된 표준 방법을 사용하여 포어에 대해 피분석물이 이동함에 따라 표적 피분석물의 하나 이상의 특징이 측정된다. 표적 피분석물의 하나 이상의 특징은 바람직하게는 피분석물이 포어를 통해 이동함에 따라 측정된다. 단계 (a) 및 (b)는 바람직하게 포어를 가로질러 인가된 전위로 수행된다. 이하에서 보다 상세히 논의되는 바와 같이, 인가된 전위는 전형적으로 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성시킨다. 인가된 전위는 전압 전위일 수 있다. 대안적으로, 인가된 전위는 화학 포텐셜일 수 있다. 이것의 한 예는 양친매성 층에 걸쳐 염 구배를 사용하는 것이다. 염 구배는 Holden 등, J Am Chem Soc. 2007 Jul 11;129(27):8650-5에 개시되어 있다.

본 발명의 방법은 표적 피분석물을 특징화하기 위한 것이다. 본 방법은 적어도 하나의 피분석물을 특징화하기 위한 것이다. 이 방법은 2종 이상의 피분석물의 특징화과 관련될 수 있다. 상기 방법은 임의의 수의 피분석물, 예컨대 2, 5, 10, 15, 20, 30, 40, 50, 100 또는 그 초과의 피분석물을 특징화하는 단계를 포함할 수 있다.

상기 표적 피분석물은 바람직하게는 금속 이온, 무기 염, 폴리머, 아미노산, 펩타이드, 폴리펩타이드, 단백질, 뉴클레오타이드, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 염료, 표백제, 약제, 진단제, 기분전환 약제(recreational drug), 폭발물 또는 환경오염 물질이다. 이 방법은 2종 이상의 단백질, 2개 이상의 뉴클레오타이드 또는 2개 이상의 의약품과 같은 동일한 유형의 2종 이상의 피분석물의 특징화과 관련될 수 있다. 대안적으로, 상기 방법은 하나 이상의 단백질, 하나 이상의 뉴클레오타이드 및 하나 이상의 의약품과 같은 상이한 유형의 2종 이상의 피분석물의 특징화과 관련될 수 있다.

상기 표적 피분석물은 세포로부터 분비될 수 있다. 대안적으로, 상기 표적 피분석물은 세포 내에 존재하는 분석물일 수 있으므로, 본 발명을 수행하기 전에 피분석물을 세포로부터 추출해야한다.

피분석물은 바람직하게는 아미노산, 펩타이드, 폴리펩타이드 및/또는 단백질이다. 아미노산, 펩타이드, 폴리펩타이드 또는 단백질은 자연-발생적 또는 비-자연-발생적일 수 있다. 폴리펩타이드 또는 단백질은 그 안에 합성 또는 변형된 아미노산을 포함할 수 있다. 아미노산에 대한 수많은 상이한 유형의 변형이 당해 분야에 공지되어 있다. 적합한 아미노산 및 이의 변형은 상기에 기재되어 있다. 본 발명의 목적을 위해, 상기 표적 피분석물은 당해 분야에서 이용가능한 임의의 방법에 의해 변형될 수 있는 것으로 이해되어야 한다.

단백질은 효소, 항체, 호르몬, 성장 인자 또는 성장 조절 단백질, 예컨대 사이토카인일 수 있다. 사이토카인은 인터류킨, 바람직하게는 IFN-1, IL-1, IL-2, IL-4, IL-5, IL-6, IL-10, IL-12 및 IL-13, 인터페론, 바람직하게는, IL-γ 및 다른 사이토카인, 예컨대 TNF-α로부터 선택될 수 있다. 단백질은 박테리아 단백질, 진균 단백질, 바이러스 단백질 또는 기생충-유래된 단백질일 수 있다.

상기 표적 피분석물은 바람직하게는 뉴클레오타이드, 올리고뉴클레오타이드 또는 폴리뉴클레오타이드이다. 뉴클레오타이드는 전형적으로 핵 염기, 당 및 적어도 하나의 포스페이트기를 함유한다. 핵 염기는 전형적으로 복소환형이다. 핵 염기는 퓨린 및 피리미딘, 더 구체적으로는 아데닌, 구아닌, 티민, 우라실 및 시토신을 포함하지만, 이에 한정되지 않는다. 당은 전형적으로 펜토스 당이다. 뉴클레오타이드 당은 리보오스 및 데옥시리보스를 포함하지만, 이에 한정되지 않는다. 뉴클레오타이드는 전형적으로 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드이다. 뉴클레오타이드는 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 함유한다. 포스페이트는 뉴클레오타이드의 5' 또는 3' 측에 부착될 수 있다.

뉴클레오타이드는 아데노신 모노포스페이트(AMP), 아데노신 디포스페이트(ADP), 아데노신 트리포스페이트(ATP), 구아노신 모노포스페이트(GMP), 구아노신 디포스페이트(GDP), 구아노신 트리포스페이트(GTP), 티미딘 모노포스페이트(TMP), 티미딘 디포스페이트(TDP), 티미딘 트리포스페이트(TTP), 우리딘 모노포스페이트(UMP), 우리딘 디포스페이트(UDP), 우리딘 트리포스페이트(UTP), 시티딘 모노포스페이트(CMP), 시티딘 디포스페이트(CDP), 시티딘 트리포스페이트(CTP), 5-메틸시티딘 모노포스페이트, 5-메틸시티딘 디포스페이트, 5-메틸시티딘 트리포스페이트, 5-하이드록시메틸시티딘 모노포스페이트, 5-하이드록시메틸시티딘 디포스페이트, 5-하이드록시메틸시티딘 트리포스페이트, 환형 아데노신 모노포스페이트(cAMP), 환형 구아노신 모노포스페이트(cGMP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시아데노신 디포스페이트(dADP), 데옥시아데노신 트리포스페이트(dATP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시구아노신 디포스페이트(dGDP), 데옥시구아노신 트리포스페이트(dGTP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시티미딘 디포스페이트(dTDP), 데옥시티미딘 트리포스페이트(dTTP), 데옥시우리딘 모노포스페이트(dUMP), 데옥시우리딘 디포스페이트(dUDP), 데옥시우리딘 트리포스페이트(dUTP), 데옥시시티딘 모노포스페이트(dCMP), 데옥시시티딘 디포스페이트(dCDP) 및 데옥시시티딘 트리포스페이트(dCTP), 5-메틸-2'-데옥시시티딘 모노포스페이트, 5-메틸-2'-데옥시시티딘 디포스페이트, 5-메틸-2'-데옥시시티딘 트리포스페이트, 5-하이드록시메틸-2'-데옥시시티딘 모노포스페이트, 5-하이드록시메틸-2'-데옥시시티딘 디포스페이트 및 5-하이드록시메틸-2'-데옥시시티딘 트리포스페이트를 포함하지만, 이에 한정되지 않는다. 뉴클레오타이드는 바람직하게는 AMP, TMP, GMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 뉴클레오타이드는 무염기성(즉, 핵 염기가 결여됨)일 수 있다. 뉴클레오타이드는 추가의 변형을 함유할 수 있다. 특히, 적합한 변형된 뉴클레오타이드는 2'아미노 피리미딘(예컨대, 2'-아미노 시티딘 및 2'-아미노 우리딘), 2'-하이드록실 퓨린(예컨대, 2'-플루오로 피리미딘(예컨대 2'-플루오로시티딘 및 2'플루오로 우리딘), 하이드록실 피리미딘(예컨대 5'-α-P-보라노 우리딘), 2'-O-메틸 뉴클레오타이드(예컨대, 2'-O-메틸 아데노신, 2'-O-메틸 구아노신, 2'-O-메틸 시티딘 및 2'-O-메틸 우리딘), 4'-티오 피리미딘(예컨대 4'-티오 우리딘 및 4'-티오 시티딘) 및 핵염기의 변형을 갖는 뉴클레오타이드(예컨대 5-펜티닐-2'-데옥시 우리딘, 5-(3-아미노프로필)-우리딘 및 1,6-디아미노헥실-N-5-카바모일메틸 우리딘)을 포함하지만, 이에 한정되지 않는다.

올리고뉴클레오타이드는 전형적으로 50개 이하의 뉴클레오타이드, 예컨대 40개 이하, 30개 이하, 20개 이하, 10개 이하 또는 5개 이하의 뉴클레오타이드를 갖는 짧은 뉴클레오타이드 폴리머이다. 올리고뉴클레오타이드는 무염기성 및 변형된 뉴클레오타이드를 포함하는, 상기 논의된 임의의 뉴클레오타이드를 포함할 수 있다. 본 발명의 방법은 바람직하게는 표적 폴리뉴클레오타이드를 특징화하기 위한 것이다. 폴리뉴클레오타이드, 예컨대 핵산은 2종 이상의 뉴클레오타이드를 포함하는 거대분자이다. 폴리뉴클레오타이드 또는 핵산은 임의의 뉴클레오타이드의 임의의 조합을 포함할 수 있다. 뉴클레오타이드는 자연-발생적이거나 인공적일 수 있다. 표적 폴리뉴클레오타이드 내의 하나 이상의 뉴클레오타이드는 산화되거나 메틸화될 수 있다. 표적 폴리뉴클레오타이드의 하나 이상의 뉴클레오타이드가 손상될 수 있다. 예를 들어, 폴리뉴클레오타이드는 피리미딘 이량체를 포함할 수 있다. 이러한 이량체는 전형적으로 자외선에 의한 손상과 관련이 있으며 피부 흑색종의 주요 원인이다. 표적 폴리뉴클레오타이드 내의 하나 이상의 뉴클레오타이드는 예를 들어 표지 또는 태그로 변형될 수 있다. 적합한 라벨은 상기에 기술되어 있다. 표적 폴리뉴클레오타이드는 하나 이상의 스페이서를 포함할 수 있다.

뉴클레오타이드는 상기 정의된 바와 같다. 폴리뉴클레오타이드에 존재하는 뉴클레오타이드는 전형적으로 아데노신 모노포스페이트(AMP), 구아노신 모노포스페이트(GMP), 티미딘 모노포스페이트(TMP), 우리딘 모노포스페이트(UMP), 시티딘 모노포스페이트(CMP), 환형 아데노신 모노포스페이트(cAMP), 환형 구아노신 모노포스페이트(cGMP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시우리딘 모노포스페이트(dUMP) 및 데옥시시티딘 모노포스페이트(dCMP)를 포함하지만, 이에 한정되지 않는다. 뉴클레오타이드는 바람직하게는 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP, dCMP 및 dUMP로부터 선택된다.

뉴클레오타이드는 무염기성일 수 있다(즉, 핵 염기가 결여됨).

폴리뉴클레오타이드 내의 뉴클레오타이드는 임의의 방식으로 서로 부착될 수 있다. 뉴클레오타이드는 전형적으로 핵산에서와 같이 당 및 포스페이트 기에 의해 부착된다. 뉴클레오타이드는 피리미딘 이량체에서와 같이 그것의 핵염기를 통해 연결될 수 있다.

폴리뉴클레오타이드는 단일 가닥 또는 이중 가닥일 수 있다. 폴리뉴클레오타이드의 적어도 일부는 바람직하게는 이중 가닥이다. 단일 가닥 폴리뉴클레오타이드는 거기에 혼성화된 하나 이상의 프라이머를 가질 수 있고, 따라서 이중 가닥 폴리뉴클레오타이드의 하나 이상의 짧은 영역을 포함할 수 있다. 프라이머는 표적 폴리뉴클레오타이드와 동일한 유형의 폴리뉴클레오타이드일 수 있거나, 상이한 유형의 폴리뉴클레오타이드일 수 있다.

폴리뉴클레오타이드는 핵산, 예컨대 데옥시리보핵산(DNA) 또는 리보핵산(RNA)이다. 표적 폴리뉴클레오타이드는 DNA의 하나의 가닥에 혼성화된 하나의 RNA 가닥을 포함할 수 있다. 폴리뉴클레오타이드는 당해 분야에 공지된 임의의 합성 핵산, 에컨대 펩타이드 핵산(PNA), 글리세롤 핵산(GNA), 트레오스 핵산(TNA), 고정 핵산(LNA) 또는 뉴클레오타이드 측쇄를 갖는 다른 합성 폴리머일 수 있다.

상기 표적 폴리뉴클레오타이드의 전체 또는 일부만이 이 방법을 사용하여 특징화될 수 있다. 표적 폴리뉴클레오타이드는 임의의 길이일 수 있다. 예를 들어, 폴리뉴클레오타이드는 길이가 적어도 10, 적어도 50, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 400 또는 적어도 500개의 뉴클레오타이드 쌍일 수 있다. 폴리뉴클레오타이드는 1000개 이상의 뉴클레오타이드 쌍, 5000개 이상의 뉴클레오타이드 쌍 길이 또는 100,000개 이상의 뉴클레오타이드 쌍 길이일 수 있다.

표적 폴리뉴클레오타이드와 같은 표적 피분석물은 임의의 적합한 샘플내에 존재한다. 본 발명은 전형적으로 상기 표적 피분석물, 예컨대 표적 폴리뉴클레오타이드를 함유하거나 포함하는 것으로 알려진 샘플에서 수행된다. 대안적으로, 본 발명은 샘플에서 수행되어, 하나 이상의 표적 피분석물, 예컨대 샘플에서의 존재가 알려지거나 기대되는 하나 이상의 표적 폴리펩타이드의 동일성을 확인할 수 있다.

샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득되거나 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 유기체 또는 미생물은 전형적으로 시생누대계(archaean), 원핵 생물 또는 진핵 생물이며, 전형적으로 5개 계: 식물계, 동물계, 균계, 모네라계 및 원생생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득되거나 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 샘플은 바람직하게는 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 소변, 림프액, 타액, 점액 또는 양수이지만, 혈액, 혈장 또는 혈청이 바람직하다. 전형적으로, 샘플은 인간에서 기원한 것이지만, 대안적으로 말, 소, 양 또는 돼지와 같은 상업적으로 사육된 동물과 같은 다른 포유 동물로부터 기원할 수 있거나, 또는 고양이 또는 개와 같은 애완 동물일 수 있다. 대안적으로 식물 기원의 샘플은 전형적으로 상업 작물, 예컨대 곡물, 콩과 식물, 과일 또는 야채, 예를 들어 밀, 보리, 귀리, 카놀라, 옥수수, 대두, 쌀, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩, 렌즈 콩, 사탕수수, 코코아, 면으로부터 수득된다.

샘플은 비-생물학적 샘플일 수 있다. 비-생물학적 샘플은 바람직하게는 유체 샘플이다. 비-생물학적 샘플의 예로는 외과적 유체, 물, 예컨대 음용수, 해수 또는 강물, 및 실험실 테스트용 시약이 포함된다.

샘플은 전형적으로, 예를 들어 원심 분리에 의해, 또는 적혈구와 같은 원하지 않는 분자 또는 세포를 걸러내는 막을 통과함으로써 분석되기 전에 가공된다. 샘플은 채취 즉시 측정될 수 있다. 샘플은 전형적으로 분석 이전에, 바람직하게는 -70℃ 이하로 저장될 수 있다.

포어는 전형적으로 막에 존재한다. 임의의 막이 본 발명에 따라 사용될 수 있다. 적합한 막은 당해 분야에 잘 알려져있다. 막은 바람직하게는 스핑고미엘린을 포함한다. 막은 바람직하게는 양친매성 층이다. 양친매성 층은 적어도 하나의 친수성 부분 및 적어도 하나의 친유성 또는 소수성 부분을 모두 갖는 인지질과 같은 양친매성 분자로 형성된 층이다. 양친매성 분자는 합성 또는 자연 발생될 수 있다. 단일층을 형성하는 비-자연 발생 양친매성체 및 양친매성 화합물은 당 분야에 공지되어 있고, 예를 들어 블록 코폴리머를 포함한다(Gonzalez-Perez 등, Langmuir, 2009, 25, 10447-10450). 블록 코폴리머는 단일 폴리머 사슬을 생성하기 위해 함께 중합되는 2종 이상의 모노머 하위단위가 있는 폴리머성 물질이다. 블록 코폴리머는 전형적으로 각 모노머 하위단위에 의해 기여되는 특성을 갖는다. 그러나, 블록 코폴리머는 개별 하위단위로부터 형성된 폴리머가 가지지 않는 특유의 특성을 가진다. 모노머 하위단위 중 하나가 소수성(즉, 친유성)이고, 다른 하위단위(들)이 수성 매질에서 친수성이 되도록 블록 코폴리머가 조작될 수 있다. 이 경우, 블록 코-폴리머는 양친매성 특성을 가질 수 있고, 생물학적 막을 모방하는 구조를 형성할 수 있다. 블록 코-폴리머는 디블록(2개의 모노머 하위단위로 이루어짐)일 수 있지만, 2개 이상의 모노머 하위단위로 구성되어 양친매성으로서 행동하는 보다 복잡한 배열을 형성할 수도 있다. 코폴리머는 트리블록, 테트라블록 또는 펜타블록 코폴리머일 수 있다.

양친매성 층은 단일층 또는 이중층일 수 있다. 양친매성 층은 전형적으로 평면 지질 이중층 또는 지지된 이중층이다.

양친매성 층은 전형적으로 지질 이중층이다. 지질 이중층은 세포막의 모델이며, 다양한 실험 연구를 위한 탁월한 플랫폼 역할을 한다. 예를 들어, 지질 이중층은 단일-채널 기록에 의한 막 단백질의 시험관내 연구에 사용될 수 있다. 대안적으로, 지질 이중층은 다양한 범위의 물질의 존재를 검출하는 바이오센서로 사용될 수 있다. 지질 이중층은 임의의 지질 이중층일 수 있다. 적합한 지질 이중층은 평면 지질 이중층, 지지된 이중층 또는 리포좀을 포함하지만, 이에 한정되지 않는다. 적합한 지질 이중층은 바람직하게는 평면 지질 이중층이다. 적합한 지질 이중층은 국제 출원 제 PCT/GB08/000563호(WO 2008/102121로 공개됨), 국제 출원 제 PCT/GB08/004127호(WO 2009/077734로 공개됨) 및 국제 출원 제 PCT/GB2006/001057호(WO 2006/100484로 공개됨)에 개시되어 있다.

지질 이중층을 형성하는 방법은 당해 분야에 공지되어 있다. 적합한 방법은 실시예에 개시되어 있다. 지질 이중층은 통상적으로 Montal과 Mueller의 방법에 의해 형성되며(Proc. Natl. Acad. Sci. USA., 1972; 69: 3561-3566), 지질 단일층은 수용액/공기 계면에서 그 계면에 수직인 개구 쪽을 지나 운반된다.

Montal & Mueller의 방법은 단백질 포어 삽입에 적합한 양질의 지질 이중층을 형성하는 비용-효율적이고 상대적으로 간단한 방법이기 때문에 대중적이다. 이중층 형성의 다른 일반적인 방법은 팁-침지, 이중층 페인팅 및 리포좀 이중층의 패치-클램핑을 포함한다.

바람직한 구현예에서, 지질 이중층은 국제 출원 제 PCT/GB08/004127호(WO 2009/077734로 공개됨)에 기재된 바와 같이 형성된다. 또 다른 바람직한 구현예에서, 막은 고체 상태의 층이다. 고체 상태의 층은 생물학적 기원이 아니다. 환언하면, 고체 상태 층은 생물학적 환경, 예컨대 생물체 또는 세포, 또는 생물학적으로 이용가능한 구조의 합성으로 제조된 버전으로부터 유래되거나 단리되지 않는다. 고체 상태 층은 마이크로전자 재료, 절연 물질, 예컨대 Si₃N₄, Al₂O₃ 및 SiO, 유기 및 무기 폴리머, 예컨대 폴리아미드, 플라스틱, 예컨대 Teflon® 또는 엘라스토머, 예컨대 2-성분 첨가-경화 실리콘 고무 및 유리를 포함하지만, 이에 한정되지 않는다. 고체 상태 층은 단원자 층, 예컨대 그래핀, 또는 단지 수 원자 두께의 층으로 형성될 수 있다. 적합한 그래핀 층은 국제 출원 제 PCT/US2008/010637호(WO 2009/035647호로 공개됨)에 개시되어 있다.

상기 방법은 (i) 포어를 포함하는 인공 양친매성 층, (ii) 포어를 포함하는 단리된 자연-발생 지질 이중층, 또는 (iii) 내부에 포어가 삽입된 세포를 사용하여 수행된다. 본 방법은 전형적으로 인공 양친매성 층, 예컨대 인공 지질 이중층을 사용하여 수행된다. 상기 층은 포어 이외에 다른 막 및/또는 막 단백질뿐만 아니라 다른 분자를 포함할 수 있다. 적합한 장치 및 조건은 이하에 논의되어 있다. 본 발명의 방법은 전형적으로 시험관내에서 수행된다. 표적 폴리뉴클레오타이드와 같은 피분석물은 막에 커플링될 수 있다. 이는 임의의 공지된 방법을 사용하여 수행될 수 있다. (상기에서 상세히 논의된 바와 같이) 막이 지질 이중층과 같은 양친매성 층인 경우, 표적 폴리뉴클레오타이드와 같은 피분석물은 바람직하게는 막 내에 존재하는 폴리펩타이드 또는 막 내에 존재하는 소수성 앵커를 통해 막에 커플링된다. 소수성 앵커는 바람직하게는 지질, 지방산, 스테롤, 탄소 나노튜브 또는 아미노산이다.

표적 폴리뉴클레오타이드와 같은 피분석물은 막에 직접 커플링될 수 있다. 표적 폴리뉴클레오타이드와 같은 피분석물은 바람직하게는 링커를 통해 막에 커플링된다. 바람직한 링커는 폴리뉴클레오타이드, 폴리에틸렌 글리콜(PEG) 및 폴리펩타이드와 같은 폴리머를 포함하지만, 이에 한정되지는 않는다. 폴리뉴클레오타이드가 막에 직접 커플링되면, 막과 포어의 내부 사이의 거리로 인해 폴리뉴클레오타이드의 단부까지 특징화를 계속할 수 없으므로 일부 데이터가 손실될 것이다. 링커가 사용되는 경우, 폴리뉴클레오타이드는 가공이 완료될 수 있다. 링커가 사용되는 경우, 링커는 임의의 위치에서 폴리뉴클레오타이드에 부착될 수 있다. 링커는 테일(tail) 폴리머에서 폴리뉴클레오타이드에 부착되는 것이 바람직하다.

커플링은 안정적이거나 일시적일 수 있다. 특정 적용을 위해, 커플링의 일시적인 성질이 바람직하다. 안정적인 커플링 분자가 폴리뉴클레오타이드의 5' 또는 3' 말단 중 하나에 직접 부착되면, 이중층과 포어 내부 사이의 거리로 인해 특징화 작업이 폴리뉴클레오타이드의 단부로 이어지지 못하기 때문에 일부 데이터가 손실될 것이다. 커플링이 일시적이면, 커플링된 단부가 무작위로 이중층이 없어지면 폴리뉴클레오타이드가 가공되어 완료될 수 있다. 막과 안정적이거나 일시적인 연결을 형성하는 화학기에 대해서는 이하에서 더 상세히 논의된다. 표적 폴리뉴클레오타이드와 같은 피분석물은 콜레스테롤 또는 지방 아실 사슬을 사용하여 지질 이중층과 같은 양친매성 층에 일시적으로 커플링될 수 있다. 헥사데칸산(hexadecanoic acid)과 같은 6 내지 30개의 탄소 원자의 길이를 갖는 임의의 지방 아실 사슬이 사용될 수 있다.

바람직한 구현예에서, 표적 폴리뉴클레오타이드와 같은 피분석물은 양친매성 층에 커플링된다. 표적 폴리뉴클레오타이드와 같은 피분석물의 합성 지질 이중층에 대한 커플링은 다양한 상이한 테더링 전략으로 이전에 수행되었다. 이것들은 이하에 표 5에 요약되어 있다.

폴리뉴클레오타이드는 티올, 콜레스테롤, 지질 및 바이오틴 기와 같은 반응성 기의 첨가를 위해 쉽게 양립가능한 합성 반응에서 변형된 포스포르아미다이트를 사용하여 작용화될 수 있다. 이러한 상이한 부착 화학은 폴리뉴클레오타이드에 대한 부착 옵션을 제공한다. 각각의 상이한 변형 기는 폴리뉴클레오타이드를 약간 다른 방식으로 테더링하고 커플링은 항상 영구적인 것은 아니므로 폴리뉴클레오타이드에 대한 상이한 체류 시간을 이중층에 제공한다. 일시적 커플링의 이점은 상기에 논의되어 있다.

폴리뉴클레오타이드의 커플링은 또한 반응성 기가 폴리뉴클레오타이드에 첨가될 수 있는 수많은 다른 수단에 의해 달성될 수 있다. DNA의 양 말단에 반응성 기를 추가하는 것은 이전에 보고된 바 있다. 티올 기는 폴리뉴클레오타이드 키나제와 ATPγS를 사용하여 ssDNA의 5'에 첨가될 수 있다(Grant, G. P. and P. Z. Qin (2007). "핵산의 5' 말단에 니트록시드 스핀 라벨을 부착하는 쉬운 방법." Nucleic Acids Res 35(10): e77). 바이오틴, 티올 및 형광단과 같은 화학기의 보다 다양한 선택은 변형된 올리고뉴클레오타이드를 ssDNA의 3'에 통합하기 위해 말단 전달효소를 사용하여 첨가될 수 있다(Kumar, A., P. Tchen, 등 (1988). "말단 데옥시뉴클레오티딜 전이효소를 갖는 합성 올리고뉴클레오타이드 프로브의 비방사성 표지." Anal Biochem 169(2): 376-82).

대안적으로, 반응기는 이미 이중층에 커플링된 것에 상보적인 짧은 DNA 단편을 첨가하는 것으로 간주될 수 있으므로, 혼성화를 통해 부착이 달성될 수 있다. ssDNA의 단편의 결찰은 T4 RNA 리가제 I을 사용하여 보고되었다(Troutt, A. B., M. G. McHeyzer-Williams, 등 (1992). "Ligation-anchored PCR: 단일면 특이성을 갖는 간단한 증폭 기술." Proc Natl Acad Sci U S A 89(20): 9823-5). 대안적으로, ssDNA 또는 dsDNA 중 하나를 네이티브 dsDNA에 결찰되고, 그후 2개의 가닥을 열적 또는 화학적 변성으로 분리할 수 있었다. 네이티브 dsDNA에는 듀플렉스의 한쪽 단부 또는 2개의 모든 단부에 ssDNA를 추가할 수 있거나, 한쪽 단부 또는 2개의 모든 단부에 dsDNA를 추가할 수 있다. 그런 다음 듀플렉스가 용융될 때 5' 말단, 3' 말단 또는 둘 모두에서의 결찰 또는 변형에 ssDNA가 결찰에 사용되는 경우, 또는 dsDNA가 결찰에 사용되는 경우 각각의 단일 가닥은 5' 또는 3' 변형을 가질 것이다. 폴리뉴클레오타이드가 합성 가닥인 경우, 커플링 화학은 폴리뉴클레오타이드의 화학적 합성 동안 편입될 수 있다. 예를 들어, 폴리뉴클레오타이드는 그것에 반응성 기가 부착된 프라이머를 사용하여 합성될 수 있다.

게놈 DNA 섹션의 증폭을 위한 일반적인 기술은 폴리머라제 연쇄 반응(PCR)을 사용하는 것이다. 여기에서 2개의 합성 올리고뉴클레오타이드 프라이머를 사용하여 DNA의 동일한 부문의 수많은 복제본이 생성될 수 있으며, 각 복제본에 대해 듀플렉스의 각 가닥의 5'는 합성 폴리뉴클레오타이드일 것이다. 콜레스테롤, 티올, 바이오틴 또는 지질과 같은 반응성 기를 갖는 안티센스 프라이머를 사용함으로써, 증폭된 상기 표적 DNA의 각 복제본은 커플링을 위한 반응성 기를 함유할 것이다.

본 발명의 방법에 사용되는 포어는 본 발명의 포어(즉, 본 발명의 적어도 하나의 돌연변이체 모노머 또는 본 발명의 적어도 하나의 작제물을 포함하는 포어)이다. 포어는 상기 논의된 방법 중 임의의 방식으로 화학적으로 변형될 수 있다. 포어는 바람직하게는 상기 논의된 바와 같이 표적 피분석물과 상호작용할 수 있는 공유 어댑터로 변형된다.

이 방법은 바람직하게는 표적 폴리뉴클레오타이드를 특징화하기 위한 것이며, 단계 (a)는 표적 폴리뉴클레오타이드를 포어 및 폴리뉴클레오타이드 결합 단백질과 접촉시키는 것을 포함하며, 폴리뉴클레오타이드 결합 단백질이 포어를 통한 표적 폴리뉴클레오타이드의 이동을 조절한다. 폴리뉴클레오타이드 결합 단백질은 폴리뉴클레오타이드에 결합할 수 있고 포어를 통해 그것의 이동을 제어할 수 있는 임의의 단백질일 수 있다. 폴리뉴클레오타이드 결합 단백질이 폴리뉴클레오타이드에 결합하는지의 여부를 결정하는 것은 당해 분야에서 간단하다. 폴리뉴클레오타이드 결합 단백질은 전형적으로 폴리뉴클레오타이드의 적어도 하나의 특성과 상호작용하고, 이를 변형시킨다. 폴리뉴클레오타이드 결합 단백질은 폴리뉴클레오타이드를 절단하여 개별 뉴클레오타이드 또는 뉴클레오타이드의 단쇄, 예컨대 디- 또는 트리뉴클레오타이드를 형성함으로써 폴리뉴클레오타이드를 변형시킬 수 있다. 상기 모이어티는 폴리뉴클레오타이드를 배향시키거나 특정 위치로 이동시킴으로써, 즉 그것의 운동을 제어함으로써 폴리뉴클레오타이드를 변형시킬 수 있다.

폴리뉴클레오타이드 결합 단백질은 바람직하게는 폴리뉴클레오타이드 취급 효소이다. 폴리뉴클레오타이드 취급 효소는 폴리뉴클레오타이드의 적어도 하나의 특성과 상호작용하고 변형시킬 수 있는 폴리펩타이드이다. 효소는 폴리뉴클레오타이드를 절단하여 개별 뉴클레오타이드 또는 뉴클레오타이드의 단쇄, 예컨대 디- 또는 트리뉴클레오타이드를 형성함으로써 변형시킬 수 있다. 효소는 폴리뉴클레오타이드를 배향시키거나 특정 위치로 이동시킴으로써 폴리뉴클레오타이드를 변형시킬 수 있다. 폴리뉴클레오타이드 결합 단백질은 전형적으로 폴리뉴클레오타이드 결합 도메인 및 촉매 도메인을 포함한다. 폴리뉴클레오타이드 취급 효소는 표적 서열을 결합시킬 수 있고 포어를 통해 그것의 이동을 제어할 수 있는한 효소 활성을 나타내지 않아도 된다. 예를 들어, 효소는 그의 효소 활성을 제거하도록 변형될 수 있거나 효소로서 작용하지 못하는 조건 하에서 사용될 수 있다. 이러한 조건에 대해서는 아래에서 더 상세히 논의된다.

폴리뉴클레오타이드 취급 효소는 바람직하게는 핵산 분해 효소로부터 유도된다. 효소의 작제물에 사용되는 폴리뉴클레오타이드 취급 효소는 더욱 바람직하게는 효소 분류(EC) 그룹 3.1.11, 3.1.13, 3.1.14, 3.1.15, 3.1.16, 3.1.21, 3.1.22, 3.1.25, 3.1.26, 3.1.27, 3.1.30 및 3.1.31 중 어느 하나의 구성원으로부터 유도된다. 효소는 국제 출원 제 PCT/GB10/000133호(WO 2010/086603호로 공개됨)에 개시된 임의의 것일 수 있다.

바람직한 효소는 폴리머라제, 엑소뉴클레아제, 헬리카제 및 토포이소머라제, 예컨대 자이라제이다. 적합한 효소는 E. coli 유래의 엑소뉴클레아제 I(서열번호: 6), E. coli 유래의 엑소뉴클레아제 III 효소(서열번호: 8), T. 테모필러스의 RecJ(서열번호: 10) 및 박테리오파아지 람다 엑소뉴클레아제(서열번호: 12) 및 그의 변이체를 포함하지만, 이에 한정되지 않는다. 서열번호: 10에 나타낸 서열을 포함하는 3개의 하위단위 또는 이의 변이체가 상호작용하여 삼량체 엑소뉴클레아제를 형성한다. 효소는 Phi29 DNA 폴리머라제(서열번호: 4) 또는 그의 변이체일 수 있다. 효소는 헬리카제일 수 있거나, 또는 헬리카제로부터 유래될 수 있다. 전형적인 헬리카제는 Hel308, RecD 또는 XPD, 예를 들어 Hel308 Mbu(서열번호: 13) 또는 그의 변이체이다.

효소는 가장 바람직하게는 헬리카제, 예컨대 Hel308 헬리카제, RecD 헬리카제, 예컨대 TraI 헬리카제 또는 TrwC 헬리카제, XPD 헬리카제 또는 Dda 헬리카제로부터 유도된다. 헬리카제는 국제 출원 번호 PCT/GB2012/052579(WO 2013/057495로 공개됨); PCT/GB2012/053274(WO 2013/098562로 공개됨); PCT/GB2012/053273(WO2013098561로 공개됨); PCT/GB2013/051925(WO 2014/013260으로 공개됨); PCT/GB2013/051924(WO 2014/013259로 공개됨); PCT/GB2013/051928(WO 2014/013262로 공개됨) 및 PCT/GB2014/052736에 개시된 임의의 헬리카제, 변형된 헬리카제 또는 헬리카제 작제물일 수 있다.

헬리카제는 바람직하게는 서열번호: 18(Dda)로 나타낸 서열 또는 그의 변이체을 포함한다. 변이체는 막관통(transmembrane) 포어에 대해 이하에 논의된 방법 중 임의의 방법으로 천연 서열과 상이할 수 있다. 서열번호: 18의 바람직한 변이체는 (a) E94C 및 A360C 또는 (b) E94C, A360C, C109A 및 C136A 및 임의로(ΔM1) G1G2(즉, M1의 결실 및 이어서 G1 및 G2의 첨가)를 포함한다.

서열번호: 4, 6, 8, 10, 12, 13 또는 18의 변이체는 서열번호: 4, 6, 8, 10, 12, 13 또는 18의 아미노산 서열과 상이한 아미노산 서열을 갖는 효소이며, 폴리뉴클레오타이드 결합능력을 보유한다. 상기 변이체는 폴리뉴클레오타이드의 결합을 용이하게하고, 및/또는 고염 농도 및/또는 실온에서 그의 활성을 촉진시키는 변형을 포함할 수 있다.

서열번호: 4, 6, 8, 10, 12, 13 또는 18의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게는 아미노산 동일성에 기반하여 그 서열과 적어도 50% 상동성일 것이다. 더욱 바람직하게는, 변이체 폴리펩타이드는 전체 서열에 걸쳐 서열번호: 4, 6, 8, 10, 12, 13 또는 18의 아미노산 서열에 대한 아미노산 동일성을 기반으로 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 및 더 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 200 또는 그 이상, 예를 들어 230, 250, 270 또는 280 이상의 인접 아미노산의 스트레치에 대해 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95%의 아미노산 동일성("경질 상동성")이 있을 수 있다. 상동성은 상기한 바와 같이 결정된다. 상기 변이체는 서열번호: 2와 관련하여 상기 논의된 방법 중 임의의 방법으로 야생형 서열과 상이할 수 있다. 효소는 상기에서 논의된 바와 같이 포어에 공유결합될 수 있다.

나노포어를 사용하여 폴리뉴클레오타이드를 서열분석하기 위한 2개의 주요 전략, 즉 가닥 서열분석과 엑소뉴클레아제 서열분석이 있다. 본 발명의 방법은 가닥 서열분석 또는 엑소뉴클레아제 서열분석과 관련될 수 있다.

가닥 서열분석에서, DNA는 적용된 전위와 함께 또는 반대로 나노포어를 통해 전위된다. 점진적으로 또는 순차적으로 이중가닥 DNA에서 작용하는 엑소뉴클레아제는 인가된 전위하에 걸쳐 포어의 시스 측 상에 사용하여 잔존 단일 가닥을 공급하거나, 역 전위하에 트랜스 측 상에 사용하여 공급할 수 있다. 마찬가지로, 이중 가닥 DNA를 풀어주는 헬리카제도 비슷한 방식으로 사용될 수 있다. 폴리머라제도 사용될 수 있다. 적용된 전위에 대해 가닥 전좌가 필요한 서열분석 적용 분야에도 가능성이 있지만, DNA는 역전되거나 전위가 없는 효소에 의해 먼저 "포착"되어야 한다. 이후에 바인딩이 바뀌면 전위가 바뀌어 가닥이 포어를 통과하여 시스에서 트랜스로 통과하고 전류 흐름에 의해 확장된 형태로 유지된다. 단일 가닥 DNA 엑소뉴클레아제 또는 단일 가닥 DNA 의존성 폴리머라제는 최근 전위된 단일 가닥을 포어를 통해 제어된 단계적인 방식, 트랜스에서 시스 방식으로 끌어 당기는 분자 모터로서 작용할 수 있다.

일 구현예에서, 표적 폴리뉴클레오타이드를 특징화하는 방법은 표적 서열을 포어 및 헬리카제 효소와 접촉시키는 단계를 포함한다. 임의의 헬리카제가 상기 방법에서 사용될 수 있다. 헬리카제는 포어와 관련하여 두 가지 방식으로 작동할 수 있다. 첫째, 본 방법은 바람직하게는 헬리카제를 사용하여, 인가된 전압에 기인한 필드(field)로 포어를 통한 표적 서열의 이동을 제어한다. 이 방식에서 DNA의 5' 말단은 먼저 포어에 포획되고, 효소는 DNA가 포어 안으로 들어가도록 이동을 조절하여 표적 서열이 마지막으로 이중층의 트랜스 측으로 전위될 때까지 필드가 있는 포어를 통과하게 한다. 대안적으로, 본 방법은 바람직하게는 헬리카제 효소가 인가된 전압에 기인한 필드에 대한 포어를 통한 표적 서열의 이동을 제어하도록 수행된다. 이 방식에서 DNA의 3' 말단은 먼저 포어에 포획되고, 효소는 포어를 통해 DNA의 이동을 제어하여 최종적으로 이중층의 시스 측으로 다시 배출될 때까지 인가된 영역에 대해 표적서열이 포어로부터 뽑아 낸다.

엑소뉴클레아제 서열분석에서, 엑소뉴클레아제는 표적 폴리뉴클레오타이드의한 단부로부터 이들 개별 뉴클레오타이드를 방출하고, 이들 개별 뉴클레오타이드는 하기 논의되는 바와 같이 동정된다. 또 다른 구현예에서, 표적 폴리뉴클레오타이드를 특징화하는 방법은 표적 서열을 포어 및 엑소뉴클레아제 효소와 접촉시키는 단계를 포함한다. 상기 논의된 임의의 엑소뉴클레아제 효소가 이 방법에 사용될 수 있다. 상기 효소는 상기에서 논의된 바와 같이 포어에 공유결합될 수 있다.

엑소뉴클레아제는 전형적으로 폴리뉴클레오타이드의 한쪽 말단에 걸리고 그 말단에서 한 번에 하나의 뉴클레오타이드를 서열을 소화하는 효소이다. 엑소뉴클레아제는 5'에서 3' 방향 또는 3'에서 5' 방향으로 폴리뉴클레오타이드를 분해할 수 있다. 엑소뉴클레아제가 결합하는 폴리뉴클레오타이드의 말단은 전형적으로 사용된 효소의 선택 및/또는 당해 분야에 공지된 방법을 사용하여 결정된다. 폴리뉴클레오타이드의 양 말단의 하이드록실기 또는 캡 구조는 전형적으로 폴리뉴클레오타이드의 특정 말단에 대한 엑소뉴클레아제의 결합을 방지하거나 용이하게 하는데 사용될 수 있다.

상기 방법은 폴리뉴클레오타이드를 엑소뉴클레아제와 접촉시켜, 뉴클레오타이드가 상기 논의된 바와 같이 뉴클레오타이드의 비율의 특징화 또는 동정을 가능하게 하는 속도로 폴리뉴클레오타이드의 말단으로부터 소화되도록 하는 단계를 포함한다. 이를 행하는 방법은 당해 분야에 잘 알려져있다. 예를 들어, Edman 분해는 고성능 액체 크로마토그래피(HPLC)를 사용하여 확인될 수 있도록 폴리펩타이드 말단으로부터 단일 아미노산을 연속으로 소화시키는데 사용된다. 상동성 방법이 본 발명에서 사용될 수 있다.

엑소뉴클레아제가 기능하는 속도는 전형적으로 야생형 엑소뉴클레아제의 최적 속도보다 느리다. 본 발명의 방법에서 엑소뉴클레아제 활성의 적합한 속도는 0.5 내지 1000 뉴클레오타이드/초, 0.6 내지 500 뉴클레오타이드/초, 0.7 내지 200 뉴클레오타이드/초, 0.8 내지 100 뉴클레오타이드/초, 0.9 내지 50 뉴클레오타이드/초 또는 초당 1 내지 20 또는 10 뉴클레오타이드/초를 포함한다. 속도는 바람직하게는 1, 10, 100, 500 또는 1000 뉴클레오타이드/초이다. 엑소뉴클레아제 활성의 적합한 속도는 다양한 방법으로 달성될 수 있다. 예를 들어, 감소된 최적 활성 속도를 갖는 변이체 엑소뉴클레아제가 본 발명에 따라 사용될 수 있다.

본 발명의 방법은 표적 폴리뉴클레오타이드와 같은 표적 피분석물의 하나 이상의 특징을 측정하는 단계를 포함한다. 상기 방법은 표적 폴리뉴클레오타이드와 같은 표적 피분석물의 2, 3, 4 또는 5 이상의 특성을 측정하는 단계를 포함할 수 있다. 표적 폴리뉴클레오타이드의 경우, 하나 이상의 특징은 (i) 표적 폴리뉴클레오타이드의 길이, (ii) 표적 폴리뉴클레오타이드의 동일성, (iii) 표적 폴리뉴클레오타이드의 서열, (iv) 상기 표적 폴리뉴클레오타이드의 2차 구조 및 (v) 표적 폴리뉴클레오타이드가 변형되었는지 여부로부터 바람직하게 선택된다. (i) 내지 (v)의 임의의 조합이 본 발명에 따라 측정될 수 있다.

(i)에 있어서, 폴리뉴클레오타이드의 길이는 표적 폴리뉴클레오타이드와 포어 사이의 상호작용 수를 이용하여 측정될 수 있다.

(ii)에 있어서, 폴리뉴클레오타이드의 동일성은 여러 가지 방법으로 측정될 수 있다. 폴리뉴클레오타이드의 동일성은 표적 폴리뉴클레오타이드의 서열의 측정과 함께 또는 표적 폴리뉴클레오타이드의 서열 측정없이 측정될 수 있다. 전자는 간단하며; 폴리뉴클레오타이드는 서열분석되고 이에 의해 동정된다. 후자는 여러 가지 방법으로 수행될 수 있다. 예를 들어, 폴리뉴클레오타이드 내의 특정 모티프의 존재가 측정될 수 있다(폴리뉴클레오타이드의 잔존 서열 측정없이). 대안적으로, 상기 방법에서의 특정 전기적 및/또는 광학적 신호의 측정은 표적 폴리뉴클레오타이드를 특정 공급원으로부터 유래한 것으로 식별할 수 있다.

(iii)에 있어서, 폴리뉴클레오타이드의 서열은 이전에 기재된 바와 같이 결정될 수 있다. 적합한 서열분석 방법, 특히 전기적 측정을 이용하는 방법은 Stoddart D 등, Proc Natl Acad Sci, 12;106(19):7702-7, Lieberman KR et al, J Am Chem Soc. 2010;132(50):17961-72 및 국제 출원 WO 2000/28312에 기재되어 있다.

(iv)에 있어서, 2차 구조는 다양한 방식으로 측정될 수 있다. 예를 들어, 상기 방법이 전기적 측정을 포함하는 경우, 2차 구조는 체류 시간의 변화 또는 포어를 통해 흐르는 전류의 변화를 사용하여 측정될 수 있다. 이것은 단일 가닥 및 이중-가닥 폴리뉴클레오타이드의 영역이 구별되게 한다.

(v)에 있어서, 임의의 변형의 존재 또는 부재가 측정될 수 있다. 상기 방법은 바람직하게는 표적 폴리뉴클레오타이드가 메틸화, 산화, 손상, 하나 이상의 단백질 또는 하나 이상의 라벨, 태그 또는 스페이서에 의해 변형되는지 여부를 결정하는 단계를 포함한다. 특정 변형은 이하에 기재된 방법을 사용하여 측정될 수 있는 포어와의 특정 상호작용을 초래할 것이다. 예를 들어, 메틸시토신은 각각의 뉴클레오타이드와의 상호작용동안 포어를 통해 흐르는 전류에 기초하여 시토신과 구별될 수 있다.

본 발명은 또한 표적 폴리뉴클레오타이드의 서열을 평가하는 방법을 제공한다. 본 발명은 또한 표적 폴리뉴클레오타이드의 서열분석 방법을 제공한다.

다양한 상이한 유형의 측정이 이루어질 수 있다. 여기에는 전기 측정 및 광학 측정이 포함되지만, 이에 한정되지 않는다. 전기 측정으로는 전류 측정, 임피던스 측정, 터널링 측정(Ivanov AP 등, Nano Lett. 2011 Jan 12;11(1):279-85) 및 FET 측정(국제 출원 WO 2005/124888)이 포함된다. 형광 측정을 포함하는 적합한 광학 방법은 J. Am. Chem. Soc. 2009, 131 1652-1653에 개시되어 있다. 광학 측정은 전기 측정과 조합될 수 있다(Soni GV 등, Rev Sci Instrum. 2010 Jan;81(1):014301). 측정은 포어를 통해 흐르는 이온 전류의 측정과 같은 막관통 전류 측정일 수 있다.

전기 측정은 Stoddart D 등, Proc Natl Acad Sci, 12;106(19):7702-7, Lieberman KR et al, J Am Chem Soc. 2010;132(50):17961-72 및 국제 출원 WO-2000/28312에 기재된 바와 같이, 표준 단일 채널 레코딩을 사용하여 수행할 수 있다. 대안적으로, 전기적 측정은 다중-채널 시스템, 예를 들어 국제 출원 WO-2009/077734 및 국제 출원 WO-2011/067559에 기술되어 있다.

바람직한 구현예에서, 상기 방법은:

(a) 표적 폴리뉴클레오타이드가 포어를 통해 이동하고 결합 단백질이 포어를 통해 표적 폴리뉴클레오타이드의 이동을 제어하도록 표적 폴리뉴클레오타이드를 본 발명의 포어 및 폴리뉴클레오타이드 결합 단백질과 접촉시키는 단계; 및

(b) 상기 폴리뉴클레오타이드가 상기 포어에 대해 이동함에 따라 상기 포어를 통과하는 전류를 측정하는 단계로서, 상기 전류는 상기 표적 폴리뉴클레오타이드의 하나 이상의 특징을 나타내며, 그렇게 함으로써 상기 표적 폴리뉴클레오타이드를 특징화하는 단계를 포함한다.

상기 방법은 포어가 막 내로 삽입되는 막/포어 시스템을 조사하기에 적합한 임의의 장치를 사용하여 수행될 수 있다. 상기 방법은 막관통 포어 감지에 적합한 임의의 장치를 사용하여 수행될 수 있다. 예를 들어, 상기 장치는 수용액을 포함하는 챔버 및 상기 챔버를 2개의 섹션으로 분리하는 장벽을 포함한다. 장벽은 포어를 포함하는 막이 형성되는 소구멍을 갖는다.

본 방법은 국제 출원 제 PCT/GB08/000562(WO 2008/102120)에 기재된 장치를 사용하여 수행될 수 있다.

본 방법은 표적 폴리뉴클레오타이드와 같은 피분석물이 포어에 대해 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 따라서, 상기 장치는 또한 전위를 인가하고 상기 막 및 포어를 가로 질러 전기 신호를 측정할 수 있는 전기 회로를 포함할 수 있다. 본 방법은 패치 클램프 또는 전압 클램프를 사용하여 수행될 수 있다. 상기 방법은 바람직하게 전압 클램프의 용도를 포함한다.

본 발명의 방법은 표적 폴리뉴클레오타이드와 같은 피분석물이 포어에 대해 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 막관통 단백질 포어를 통한 이온 전류를 측정하기 위한 적당한 조건은 당해 분야에 공지되어 있으며, 실시예에 개시되어 있다. 이 방법은 전형적으로 막 및 포어를 가로 질러 인가된 전압으로 수행된다. 사용되는 전압은 전형적으로 +2V 내지 -2V, 전형적으로 -400mV 내지 +400mV이다. 사용되는 전압은 바람직하게는 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20mV 및 0 mV에서 선택되는 하한, 및 +10 mV, + 20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV에서 선택되는 상한을 갖는 범위이다. 사용되는 전압은 더 바람직하게는 100mV 내지 240mV의 범위이고, 가장 바람직하게는 120mV 내지 220mV의 범위이다. 증가된 인가된 전위를 사용함으로써 포어에 의한 상이한 뉴클레오타이드 사이의 식별을 증가시키는 것이 가능하다.

상기 방법은 전형적으로 임의의 전하 캐리어, 예컨대 금속 염, 예를 들어 알칼리 금속 염, 할라이드 염, 예를 들어 염화물 염, 예컨대 알칼리 금속 염화물 염의 존재 하에서 수행된다. 전하 캐리어는 이온성 액체 또는 유기 염, 예를 들어 테트라메틸암모늄 염화물, 트리메틸페닐 암모늄 염화물, 페닐트리메틸암모늄 염화물 또는 1-에틸-3-메틸 이미다졸륨 염화물을 포함할 수 있다. 상기 논의된 예시적인 장치에서, 염은 챔버 내의 수용액에 존재한다. 염화칼륨(KCl), 염화나트륨(NaCl) 또는 염화 세슘(CsCl)이 전형적으로 사용된다. KCl이 바람직하다. 염 농도는 포화 상태일 수 있다. 염 농도는 3M 이하일 수 있고, 전형적으로 0.1 내지 2.5M, 0.3 내지 1.9M, 0.5 내지 1.8M, 0.7 내지 1.7M, 0.9 내지 1.6M 또는 1M 내지 1.4M이다. 염 농도는 바람직하게는 150 mM 내지 1 M이다. 상기 방법은 바람직하게는 적어도 0.3 M, 예컨대 적어도 0.4 M, 적어도 0.5 M, 적어도 0.6 M, 적어도 0.8, 적어도 1.0 M, 적어도 1.5 M, 적어도 2.0 M, 적어도 2.5 M 또는 적어도 3.0 M의 염 농도를 사용하여 수행된다. 높은 염 농도는 높은 신호대 잡음비를 제공하고, 정상적인 전류 변동의 배경에 대해 확인되는 뉴클레오타이드의 존재를 나타내는 전류를 허용한다.

본 방법은 전형적으로 완충액의 존재하에 수행된다. 상기 논의된 예시적인 장치에서, 완충액은 챔버 내의 수용액에 존재한다. 임의의 완충제가 본 발명의 방법에 사용될 수 있다. 전형적으로 완충액은 HEPES이다. 또 다른 적합한 완충액은 Tris-HCl 완충액이다. 상기 방법은 전형적으로 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5의 pH에서 수행된다. 사용된 pH는 바람직하게는 약 7.5이다.

본 방법은 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃ 또는 20℃ 내지 60℃에서 수행될 수 있다. 상기 방법은 전형적으로 실온에서 수행된다. 상기 방법은 약 37℃와 같은 효소 기능을 지지하는 온도에서 선택적으로 수행된다.

본 방법은 전형적으로 폴리뉴클레오타이드 결합 단백질, 예컨대 헬리카제 또는 엑소뉴클레아제의 작용을 용이하게 하는 유리 뉴클레오타이드 또는 유리 뉴클레오타이드 유사체 및 효소 보조인자의 존재 하에서 수행된다. 유리 뉴클레오타이드는 상기 논의된 임의의 개별 뉴클레오타이드 중 하나 이상일 수 있다. 유리 뉴클레오타이드는 아데노신 모노포스페이트(AMP), 아데노신 디포스페이트(ADP), 아데노신 트리포스페이트(ATP), 구아노신 모노포스페이트(GMP), 구아노신 디포스페이트(GDP), 구아노신 트리포스페이트(GTP), 티미딘 모노포스페이트(TMP), 티미딘 디포스페이트(TDP), 티미딘 트리포스페이트(TTP), 우리딘 모노포스페이트(UMP), 우리딘 디포스페이트(UDP), 우리딘 트리포스페이트(UTP), 시티딘 모노포스페이트(CMP), 시티딘 디포스페이트(CDP), 시티딘 트리포스페이트(CTP), 환형 아데노신 모노포스페이트(cAMP), 환형 구아노신 모노포스페이트(cGMP), 데옥시아데노신 모노포스페이트(dAMP), 데옥시아데노신 디포스페이트(dADP), 데옥시아데노신 트리포스페이트(dATP), 데옥시구아노신 모노포스페이트(dGMP), 데옥시구아노신 디포스페이트(dGDP), 데옥시구아노신 트리포스페이트(dGTP), 데옥시티미딘 모노포스페이트(dTMP), 데옥시티미딘 디포스페이트(dTDP), 데옥시티미딘 트리포스페이트(dTTP), 데옥시우리딘 모노포스페이트(dUMP), 데옥시우리딘 디포스페이트(dUDP), 데옥시우리딘 트리포스페이트(dUTP), 데옥시시티딘 모노포스페이트(dCMP), 데옥시시티딘 디포스페이트(dCDP) 및 데옥시시티딘 트리포스페이트(dCTP)를 포함하지만, 이에 한정되지 않는다. 유리 뉴클레오타이드는 바람직하게는 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 유리 뉴클레오타이드는 바람직하게는 아데노신 트리포스페이트(ATP)이다. 효소 보조인자는 헬리카제를 기능시키는 요소이다. 효소 보조인자는 바람직하게는 2가의 금속 양이온이다. 2가 금속 양이온은 바람직하게는 Mg²⁺, Mn²⁺, Ca²⁺또는 Co²⁺이다. 효소 보조인자는 가장 바람직하게는 Mg²⁺이다.

표적 폴리뉴클레오타이드는 포어 및 폴리뉴클레오타이드 결합 단백질과 임의의 순서로 접촉될 수 있다. 바람직하게는, 표적 폴리뉴클레오타이드가 폴리뉴클레오타이드 결합 단백질 및 포어와 접촉할 때, 표적 폴리뉴클레오타이드는 먼저 폴리뉴클레오타이드 결합 단백질과 복합체를 형성한다. 전압이 포어를 가로 질러 인가되면, 표적 폴리뉴클레오타이드/단백질 복합체는 포어와 복합체를 형성하고 포어를 통한 폴리뉴클레오타이드의 이동을 제어한다.

개별 뉴클레오타이드를 확인하는 방법

본 발명은 또한 개별 뉴클레오타이드를 특징화하는 방법을 제공한다. 환언하면, 표적 피분석물은 개별 뉴클레오타이드이다. 상기 방법은 뉴클레오타이드가 포어와 상호작용하도록 뉴클레오타이드를 본 발명의 포어와 접촉시키는 단계 및 상호작용 동안 포어를 통과하는 전류를 측정함으로써 뉴클레오타이드를 특징화하는 단계를 포함한다. 따라서, 본 발명은 개별 뉴클레오타이드의 나노포어 감지를 포함한다. 본 발명은 또한 상호작용 동안 포어를 통과하는 전류를 측정하여 뉴클레오타이드의 동일성을 결정하는 단계를 포함하는 개별 뉴클레오타이드를 동정하는 방법을 제공한다. 상기 논의된 본 발명의 포어 중 임의의 포어를 사용할 수 있다. 포어는 바람직하게는 상기 논의된 바와 같은 분자 어댑터로 화학적으로 변형된다.

뉴클레오타이드는 뉴클레오타이드에 특이적인 방식으로(즉, 뉴클레오타이드와 관련된 특유의 전류가 포어를 통해 흐르는 것으로 검출된 경우) 포어를 통해 전류가 흐를 경우 존재한다. 뉴클레오타이드에 대한 특정 방식으로 포어를 통해 전류가 흐르지 않으면 뉴클레오타이드는 존재하지 않는다.

본 발명은 포어를 통과하는 전류에 대해 이들이 갖는 상이한 효과에 기초하여 유사한 구조의 뉴클레오타이드를 구별하는 데 사용될 수 있다. 개별 뉴클레오타이드는 포어와 상호작용할 때 그의 전류 진폭으로부터 단일 분자 수준에서 확인될 수 있다. 본 발명은 또한 특정 뉴클레오타이드가 샘플 내에 존재하는지의 여부를 결정하는데 사용될 수 있다. 본 발명은 또한 샘플 중의 특정 뉴클레오타이드의 농도를 측정하는데 사용될 수 있다.

포어는 전형적으로 막에 존재한다. 본 방법은 상기 기재된 임의의 적합한 막/포어 시스템을 사용하여 수행될 수 있다.

개별 뉴클레오타이드는 단일 뉴클레오타이드이다. 개별 뉴클레오타이드는 뉴클레오타이드 결합에 의해 또 다른 뉴클레오타이드 또는 폴리뉴클레오타이드에 결합되지 않는 뉴클레오타이드이다. 뉴클레오타이드 결합은 또 다른 뉴클레오타이드의 당 그룹에 결합된 뉴클레오타이드의 포스페이트 기 중 하나를 포함한다. 개별 뉴클레오타이드는 전형적으로 적어도 5, 적어도 10, 적어도 20, 적어도 50, 적어도 100, 적어도 200, 적어도 500, 적어도 1000 또는 적어도 5000개의 뉴클레오타이드의 또 다른 폴리뉴클레오타이드와의 뉴클레오타이드 결합에 의해 결합되지 않는 것이다. 예를 들어, 개별 뉴클레오타이드는 DNA 또는 RNA 가닥과 같은 표적 폴리뉴클레오타이드 서열로부터 소화되었다. 본 발명의 방법은 임의의 뉴클레오타이드를 동정하는데 사용될 수 있다. 뉴클레오타이드는 상기 논의된 임의의 것일 수 있다.

뉴클레오타이드는 리보핵산(RNA) 또는 데옥시리보핵산(DNA)과 같은 핵산 서열의 소화로부터 유래될 수 있다. 핵산 서열은 당해 분야에 공지된 임의의 방법을 사용하여 소화될 수 있다. 적합한 방법은 효소 또는 촉매를 사용하는 방법을 포함 하지만, 이에 한정되지는 않는다. 핵산의 촉매적 소화는 Deck 등, Inorg. Chem., 2002; 41: 669-677에 개시되어 있다.

단일 폴리뉴클레오타이드로부터의 개별 뉴클레오타이드는 폴리뉴클레오타이드의 전체 또는 일부를 서열분석하기 위해 순차적인 방식으로 포어와 접촉될 수 있다. 서열분석 폴리뉴클레오타이드는 상기에서 더 상세히 논의된다.

뉴클레오타이드는 막의 양측의 포어와 접촉될 수 있다. 뉴클레오타이드는 막의 양측의 포어로 도입될 수 있다. 뉴클레오타이드는 막의 측면과 접촉하여 뉴클레오타이드가 포어를 통해 막의 다른 측면으로 통과하게 할 수 있다. 예를 들어, 뉴클레오타이드는 포어의 단부와 접촉하며, 이는 네이티브 환경에서 뉴클레오타이드가 포어를 통과할 수 있도록 뉴클레오타이드와 같은 이온 또는 소분자가 포어의 배럴 또는 채널로 들어가게 한다. 그와 같은 경우, 뉴클레오타이드는 포어의 배럴 또는 채널을 통해 막을 통과할 때 포어 및/또는 어댑터와 상호작용한다. 대안적으로, 뉴클레오타이드가 막의 측면과 접촉하여, 뉴클레오타이드가 어댑터를 통해 또는 어댑터와 함께 포어와 상호작용할 수 있게 하고, 포어로부터 해리하여 막의 같은 측면 상에 남아있게 할 수 있다. 본 발명은 어댑터의 위치가 고정된 포어를 제공한다. 그 결과, 뉴클레오타이드는 바람직하게는 어댑터가 뉴클레오타이드와 상호작용할 수 있게 하는 포어의 단부와 접촉된다.

뉴클레오타이드는 임의의 방식으로 및 임의의 부위에서 포어와 상호작용할 수 있다. 상기 논의된 바와 같이, 뉴클레오타이드는 바람직하게는 어댑터를 통해 또는 어댑터와 함께 포어에 가역적으로 결합한다. 뉴클레오타이드는 가장 바람직하게는 막을 가로 질러 포어를 통과할 때 어댑터를 통해 또는 어댑터와 함께 가역적으로 포어에 결합한다. 뉴클레오타이드는 또한 막을 통해 포어를 통과할 때 어댑터를 통해 또는 어댑터와 함께 포어의 배럴 또는 채널에 가역적으로 결합할 수 있다.

뉴클레오타이드와 포어 사이의 상호작용 동안, 뉴클레오타이드는 그 뉴클레오타이드에 특이적인 방식으로 포어를 통해 흐르는 전류에 영향을 미친다. 예를 들어, 특정 뉴클레오타이드는 특정한 평균 기간 및 특정 정도로 포어를 통해 흐르는 전류를 감소시킬 것이다. 환언하면, 포어를 통해 흐르는 전류는 특정 뉴클레오타이드에 대해 특유적이다. 특정 뉴클레오타이드가 포어를 통해 흐르는 전류에 미치는 효과를 측정하기 위해 대조군 실험이 수행될 수 있다. 시험 샘플에서 본 발명의 방법을 수행한 결과는 샘플 내의 특정 뉴클레오타이드를 확인하거나 특정 뉴클레오타이드가 샘플에 존재하는지 여부를 결정하기 위해 이와 같은 대조군 실험으로부터 유래된 결과와 비교될 수 있다. 포어를 통해 흐르는 전류가 특정 뉴클레오타이드를 나타내는 방식으로 영향을 받는 빈도를 사용하여 샘플 내의 뉴클레오타이드 농도를 결정할 수 있다. 샘플 내의 상이한 뉴클레오타이드의 비율도 계산될 수 있다. 예를 들어, dCMP 대 메틸-dCMP의 비가 계산될 수 있다.

상기 방법은 상기 논의된 임의의 장치, 샘플 또는 조건의 사용을 포함할 수 있다.

센서를 형성하는 방법

본 발명은 또한 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 형성하는 방법을 제공한다. 상기 방법은 본 발명의 포어와 헬리카제 또는 엑소뉴클레아제와 같은 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성하는 단계를 포함한다. 복합체는 표적 폴리뉴클레오타이드의 존재하에 포어와 단백질을 접촉시킨 다음 포어를 가로 질러 전위를 가함으로써 형성될 수 있다. 인가된 전위는 상술한 바와 같이 화학 포텐셜 또는 전압 포텐셜일 수 있다. 대안적으로, 복합체는 포어를 단백질에 공유결합시킴으로써 형성될 수 있다. 공유결합을 위한 방법은 당해 분야에 공지되어 있으며, 예를 들어 국제 출원 번호 PCT/GB09/001679(WO 2010/004265로 공개됨) 및 PCT/GB10/000133(WO 2010/086603으로 공개됨)에 개시되어 있다. 복합체는 표적 폴리뉴클레오타이드를 특징화하기 위한 센서이다. 상기 방법은 바람직하게는 본 발명의 포어와 헬리카제 사이에 복합체를 형성하는 단계를 포함한다. 상기 논의된 구현예들 중 임의의 것이 본 방법에 동일하게 적용된다.

본 발명은 또한 표적 폴리뉴클레오타이드를 특징화하기 위한 센서를 제공한다. 센서는 본 발명의 포어와 폴리뉴클레오타이드 결합 단백질 사이의 복합체를 포함한다. 상기 논의된 구현예들 중 어느 것도 본 발명의 센서에 동일하게 적용된다.

키트

본 발명은 또한 표적 폴리뉴클레오타이드를 특징화, 예컨대 서열분석하기 위한 키트를 제공한다. 키트는 (a) 본 발명의 포어 및 (b) 막을 포함한다. 키트는 바람직하게는 헬리카제 또는 엑소뉴클레아제와 같은 폴리뉴클레오타이드 결합 단백질을 추가로 포함한다. 상기 논의된 구현예 중 임의의 것이 본 발명의 키트에 동등하게 적용 가능하다.

본 발명의 키트는 상기 언급된 임의의 구현예가 수행될 수 있게 하는 하나 이상의 다른 시약 또는 기구를 추가로 포함할 수 있다. 이러한 시약 또는 기기는 하기 중 하나 이상을 포함한다: 적합한 완충액(수용액), 대상체(예컨대, 혈관 또는 바늘을 포함하는 기구)로부터 샘플을 얻는 수단, 폴리뉴클레오타이드 서열을 증폭 및/또는 발현하는 수단, 상기 정의된 막 또는 전압 또는 패치 클램프 장치. 시약이 건조한 상태의 키트에 존재할 수 있으므로 유체 샘플이 시약을 재현탁시킨다. 키트는 또한 선택적으로, 키트가 본 발명의 방법에서 사용될 수 있게 하는 지침, 또는 방법이 사용될 수 있는 환자에 관한 세부 사항을 포함할 수 있다. 키트는 선택적으로 뉴클레오타이드를 포함할 수 있다.

장치

본 발명은 또한 샘플내 표적 폴리뉴클레오타이드를 특징화, 예컨대 샘플화하는 장치를 제공한다. 상기 장치는 (a) 본 발명의 복수의 포어 및 (b) 헬리카제 또는 엑소뉴클레아제와 같은 복수의 폴리뉴클레오타이드 결합 단백질을 포함할 수 있다. 상기 장치는 어레이 또는 칩과 같은 피분석물 분석을 위한 임의의 종래 장치일 수 있다.

어레이 또는 칩은 전형적으로 단일 나노포어가 삽입된 블록 코-폴리머 막과 같은 막의 복수의 웰들을 함유한다. 상기 어레이는 전자 칩 내에 통합될 수 있다.

상기 장치는 바람직하게는 하기를 포함한다:

상기 복수의 포어를 지지할 수 있고 상기 포어 및 단백질을 사용하여 폴리뉴클레오타이드 특징화 또는 서열분석을 수행할 수 있는 센서 디바이스;

- 특징화 또는 서열 분석을 수행하기 위한 물질을 보관하기 위한 적어도 하나의 저장소;

- 상기 적어도 하나의 저장소로부터 상기 센서 디바이스로 물질을 제어가능하게 공급하도록 구성된 유체공학 시스템(fluidics system); 및

- 각각의 샘플을 수용하기 위한 복수의 콘테이너로서, 상기 유체공학 시스템은 상기 컨테이너로부터 상기 센서 디바이스로 상기 샘플을 선택적으로 공급하도록 구성된 콘테이너.

상기 장치는 국제 출원 PCT/GB10/000789(WO 2010/122293로 공개됨), 국제 출원 PCT/GB10/002206(WO 2011/067559로 공개됨) 또는 국제 출원 PCT/US99/25679(WO 00/28312로 공개됨).

하기 실시예는 본 발명을 설명한다.

실시예 1

본 실시예는 복수의 상이한 돌연변이체 라이세닌 나노포어를 통해 DNA의 운동을 제어하기 위해 헬리카제 - T4 Dda - E94C/C109A/C136A/A360C(돌연변이 E94C/C109A/C136A/A360C를 갖는 서열번호: 18)이 어떻게 사용되었는지를 설명한다. 테스트한 모든 나노포어는 DNA가 나노포어를 통해 전위됨에 따라 전류의 변화를 나타냈다. 테스트한 돌연변이체 나노 포어는 1) 증가된 범위, 2) 잡음 감소, 3) 개선된 신호:잡음, 4) 돌연변이 대조군 나노포어와 비교될때 증가된 포획, 또는 5) 기준선과 비교될때 판독 헤드의 변경된 크기를 나타냈다.

재료 및 방법

DNa 작제물 준비

ㆍ 70 uL의 T4 Dda - E94C/C109A/C136A/A360C를 2 mM EDTA가 포함된 70 uL 1x KOAc 완충액으로 완충액 교환(Zeba 컬럼 사용)했다.

ㆍ 70 uL의 T4 Dda - E94C/C109A/C136A/A360C 완충액 교환 혼합물을 70 uL의 2 uM DNA 어댑터에 첨가했다(서열의 세부사항에 대하여 도 5 참조). 이어서, 샘플을 혼합하고 실온에서 5분 동안 배양하였다.

ㆍ 1 uL의 140 mM TMAD를 첨가하고, 샘플을 혼합하고, 실온에서 60분 동안 배양하였다. 이 샘플은 샘플 A로 알려져 있다. 2ul 분취액을 애질런트 분석을 위해 제거했다.

HS/ATP 단계

ㆍ 아래 표의 시약을 혼합하고, 실온에서 25분 동안 배양했다. 이 샘플은 샘플 B로 알려져 있다.

SPRI 정제

ㆍ SPRI 비드 1.1 mL를 샘플 B에 첨가한 다음, 샘플을 혼합하고 5분간 배양하였다.

ㆍ 비드를 펠렛화하고 상층액을 제거하였다. 이어서, 비드를 50 mM Tris·HCl, 2.5 M NaCl, 20% PEG8000으로 세척하였다.

ㆍ 샘플 C는 70 uL의 10 mM Tris.HCl, 20 mM NaCl에서 용출되었다.

효소에 의한 어댑터에 대한 10kb λC의 결찰

ㆍ 하기 표의 시약을 써모사이클러에서 20℃에서 10분간 배양하였다.

ㆍ 반응 혼합물(1x 500ul 분취액)을 200ul의 20% SPRI 비드로 SPRI 정제하고, 750ul의 세정 완충액 1에서 세정하고, 125ul의 용리 완충액 1에서 용출시켰다. 최종 DNA 서열(서열번호: 24)을 DNA로 하이브리드화시켰다. 이 샘플은 샘플 D로 알려져 있다.

전기생리학 실험

전기 측정은 완충액(25mM K 인산염 완충액, 150mM 칼륨 페로시아나이드(II), 150mM 칼륨 페리시아나이드(III), pH 8.0) 내 블록 코-폴리머에 삽입된 단일 라이세닌 나노포어로부터 획득하였다. 블럭 코-폴리머에 삽입된 단일 포어를 얻은 후, 완충액(2 mL, 25 mM K 인산염 완충액, 150 mM 칼륨 페로시아나이드(II), 150 mM 칼륨 페로시아나이드(III), pH 8.0)을 상기 시스템을 통해 흘려서, 임의의 과잉의 라이세닌 나노포어를 제거하였다. 이어서, 150 uL의 500 mM KCl, 25 mM K 인산염, pH 8.0을 시스템을 통해 흘렸다. 10분 후 150uL의 500mM KCl, 25mM K 인산염, pH8.0을 추가로 흘린 후 T4 Dda-E94C/C109A/C136A/A360C, DNA, 연료(MgCl2, ATP) 사전 혼합액(150 μL 총, 샘플 D)를 단일 나노포어 실험 시스템으로 흘렸다. 실험은 180 mV에서 실행되었으며 헬리카제-제어된 DNA 운동을 모니터링했다.

결과

막관통 포어의 영역에 대한 돌연변이의 효과를 측정하기 위해 복수의 상이한 나노포어를 조사하였다. 조사된 돌연변이체 포어는 이들이 비교된 기준선 나노포어와 함께 아래에 열거되어 있다(기준선 포어 1-4). 개선된 나노포어를 확인하기 위해 많은 상이한 파라미터를 조사했다. 1) 개선된 나노포어에서 기준선보다 낮은, 신호의 평균 잡음(잡음이 모든 가닥에 대해 계산된, 가닥의 모든 사건의 표준 편차와 동일한 경우) 2) 신호 내의 전류 레벨의 확산을 측정치이고, 개선된 나노포어에서 기준선보다 높은, 평균 전류 범위, 3) 표에 인용된 잡음에 대한 평균 신호가 모든 가닥에 걸쳐 신호 대 잡음(신호의 평균 잡음으로 나눈 평균 전류 범위)이며, 개선된 나노포어에서 기준선보다 높은 값임 4) 개선된 나노포어에서 기준선보다 높은 DNA의 포획율 및 5) 개선된 나노포어에서 기준선의 판독-헤드의 크기에 따라 증가되거나 감소될 수 있는 판독 헤드 크기.

이하의 각 표는 해당 기준선 나노포어에 대한 관련 데이터를 포함한다: 표 6 = 돌연변이체 1, 표 7 = 돌연변이체 2, 표 8 = 돌연변이체 3 및 표 9 = 돌연변이체 10, 이는 돌연변이된 포어와 비교했다.

라이세닌 돌연변이체 1 = 라이세닌 - (E84Q/E85K/E92Q/E97S/D126G)9(돌연변이 E84Q/E85K/E92Q/E97S/D126G를 갖는 서열번호: 2). (기준선 1)

라이세닌 돌연변이체 2 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/D126G를 갖는 서열번호: 2). (기준선 2)

라이세닌 돌연변이체 3 = 라이세닌 - (E84Q/E85K/E92Q/E94Q/E97S/D126G)9(돌연변이 E84Q/E85K/E92Q/E94Q/E97S/D126G를 갖는 서열번호: 2). (기준선 3)

라이세닌 돌연변이체 4 = 라이세닌 - (E84Q/E85K/S89Q/E92Q/E97S/D126G)9(돌연변이 E84Q/E85K/S89Q/E92Q/E97S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 5 = 라이세닌 - (E84Q/E85K/T91S/E92Q/E97S/D126G)9(돌연변이 E84Q/E85K/T91S/E92Q/E97S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 6 = 라이세닌 - (E84Q/E85K/E92Q/E97S/S98Q/D126G)9(돌연변이 E84Q/E85K/E92Q/E97S/S98Q/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 7 = 라이세닌 - (E84Q/E85K/E92Q/E97S/V100S/D126G)9(돌연변이 E84Q/E85K/E92Q/E97S/V100S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 8 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/S80K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/S80K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 9 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T106R/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106R/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 10 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2). (기준선 4)

라이세닌 돌연변이체 11 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T104R/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T104R/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 12 = 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T104K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T104K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 13 = 라이세닌 - (S78N/E84Q/E85K/E92Q/E94D/E97S/D126G)9(돌연변이 S78N/E84Q/E85K/E92Q/E94D/E97S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 14 = 라이세닌 - (S82N/E84Q/E85K/E92Q/E94D/E97S/D126G)9(돌연변이 S82N/E84Q/E85K/E92Q/E94D/E97S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 15 = 라이세닌 - (E76N/E84Q/E85K/E92Q/E94Q/E97S/D126G)9(돌연변이 E76N/E84Q/E85K/E92Q/E94Q/E97S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 16 = 라이세닌 - (E76S/E84Q/E85K/E92Q/E94Q/E97S/D126G)9(돌연변이 E76S/E84Q/E85K/E92Q/E94Q/E97S/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 17 = 라이세닌 - (E84Q/E85K/E92Q/E94Q/Y96D/D97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92Q/E94Q/Y96D/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 18 = 라이세닌 - (K45D/E84Q/E85K/E92Q/E94K/D97S/T106K/D126G)9(돌연변이 K45D/E84Q/E85K/E92Q/E94K/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 19 = 라이세닌 - (K45R/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 K45R/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 20 = 라이세닌 - (D35N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 D35N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 21 = 라이세닌 - (K37N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 K37N/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 22 = 라이세닌 - (K37S/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G)9(돌연변이 K37S/E84Q/E85K/E92Q/E94D/D97S/T106K/D126G를 갖는 서열번호: 2.

라이세닌 돌연변이체 23 = 라이세닌 - (E84Q/E85K/E92D/E94Q/D97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92D/E94Q/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 24 = 라이세닌 - (E84Q/E85K/E92E/E94Q/D97S/T106K/D126G)9(돌연변이 E84Q/E85K/E92E/E94Q/D97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 25 = 라이세닌 - (K37S/E84Q/E85K/E92Q/E94D/D97S/T104K/T106K/D126G)9(돌연변이 K37S/E84Q/E85K/E92Q/E94D/D97S/T104K/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 26 = 라이세닌 - (E84Q/E85K/M90I/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 E84Q/E85K/M90I/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 27 = 라이세닌 - (K45T/V47K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 K45T/V47K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 28 = 라이세닌 - (T51K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 T51K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 29 = 라이세닌 - (K45Y/S49K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 K45Y/S49K/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 30 = 라이세닌 - (S49L/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 S49L/E84Q/E85K/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 31 = 라이세닌 - (E84Q/E85K/V88I/M90A/E92Q/E94D/E97S/T106K/D126G)9(돌연변이 E84Q/E85K/V88I/M90A/E92Q/E94D/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 32 = 라이세닌 - (K45N/S49K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G)9(돌연변이 K45N/S49K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G를 갖는 서열번호: 2).

라이세닌 돌연변이체 33 = 라이세닌 - (K45N/V47K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G)9(돌연변이 K45N/V47K/E84Q/E85K/E92D/E94N/E97S/T106K/D126G를 갖는 서열번호: 2)

판독헤드 분석

라이세닌 돌연변이 1과 10의 경우, 본 발명자들은 모든 가능한 9mer 폴리뉴클레오타이드의 예상 이온 전류 분포 모델을 수득하였다. 모델은 각각의 9mer의 전류 분포의 평균 및 표준 편차를 포함할 수 있다.

본 발명자들은 라이세닌 돌연변이체 1 및 10에 대해 수득된 모델의 구조를 검사하고 비교했다. 도면(도 1 및 2 참조)은 이러한 비교의 예를 제공한다. 각 모델(라이세닌 1 또는 10)의 경우, 본 발명자들은 A, x_2, x_3, x_4, x_5, x_6, x_7, x_8, x_9 형태의 모든 9mer에 대한 분포의 평균을 조합했으며, 여기에서 x_{i}는 {A, C, G, T}로부터 선택된 임의의 폴리뉴클레오타이드를 나타내며, 평균들에 적용된 조합은 중간값을 취한다. 상기 중간 평균은 위치 1의 모든 뉴클레오타이드 {A, C, G, T}와 모든 위치에 대해 반복되어, 9mer의 9 위치 중 어느 위치에 존재할 때 각 뉴클레오타이드의 중앙 효과를 인코딩하는 36개의 중간 값을 얻는다.

도 1(라이세닌 돌연변이체 1) 및 2(라이세닌 돌연변이체 2)는 2개의 상이한 포어에 대해 이 중간 값을 플롯팅한다. 도 1과 도 2의 플롯은 판독 헤드의 각 위치에 있는 모든 염기 사이의 식별력 수준을 보여준다. 식별력이 클수록 특정 위치에서의 전류 기여 수준 차이가 커진다. 위치가 판독 헤드의 일부가 아닌 경우, 해당 위치에서의 전류 기여도는 4개의 모든 염기에서 유사할 것이다. 도 2(라이세닌 돌연변이체 10)은 판독 헤드의 위치 6에서 8에서의 4개의 모든 염기에 대한 유사한 전류 기여도를 보여준다. 도 1(라이세닌 돌연변이체 1)은 판독 헤드의 임의의 위치에서 4개의 모든 염기에 대해 유사한 전류 기여도를 나타내지 않는다. 따라서, 라이세닌 돌연변이체 10은 라이세닌 돌연변이체 1보다 짧은 판독 헤드를 가지고있다. 더 짧은 판독 헤드는 한 번에 신호에 기여하는 염기가 적어서 개선된 기본 호출 정확도를 이끌 수 있으므로 유리할 수 있다.

실시예 2

본 실시예는 배럴/채널의 직경이 감소된 화학적으로 변형된 조립된 포어를 제조하는데 사용되는 프로토콜을 설명한다.

모노머 라이세닌 샘플(약 10umol)은 시스테인 잔기의 최대 반응성 및 고효율 커플링 반응을 보장하기 위해 먼저 감소되었다. 모노머성 라이세닌 샘플(약 10umol)을 1mM 디티오트레이톨(DTT)과 5 내지 15분 동안 배양하였다. 세포 잔해 및 현탁된 응집체를 20,000 rpm으로 10분간 원심 분리하여 펠렛화하였다. 가용성 분획을 회수하고, 7Kd 분자량 컷오프 Zeba 스핀 컬럼(ThermoFisher)을 사용하여 완충액을 1mM Tris, 1mM EDTA, pH 8.0으로 교환하였다.

부착된 분자(예를 들어, 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드)를 적합한 용매, 전형적으로 DMSO에서 100 mM의 농도로 용해시켰다. 이것을 1mM의 최종 농도로 완충액 교환된 라이세닌 모노머 샘플에 첨가하였다. 수득된 용액을 30℃에서 2시간 동안 배양하였다. 이어서 Encapsula Nanosciences(포스파티딜세린(0.325mg/ml): POPE(0.55mg/ml): 콜레스테롤(0.45mg/ml): 대두 PC(0.9mg/ml): 스핑고미엘린(0.275mg/ml))의 5 지질 혼합물 20uL을 첨가하여 변형된 샘플(100 uL)을 올리고머화하였다. 샘플을 30℃에서 60분 동안 배양했다. 이어서, 샘플을 SDS-PAGE에 적용시키고, 국제 출원 번호 PCT/GB2013/050667(WO2013/153359로 공개됨)에 기재된 바와 같이 겔로부터 정제하였다.

실시예 3

본 실시예는 배럴/채널(라이세닌-E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9의 감소된 직경을 갖는 화학적으로 변형된 조립된 라이세닌 포어를 라이세닌 - (E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9(돌연변이 E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 갖는 E94C (돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드)와 비교하였다

재료 및 방법

DNa 작제물을 실시예 1에서 기재된 바와 같이 제조하였다. 전기생리학 실험을 실시예 1에 기재된 바와 같이 수행하였다.

결과

전기 생리학 실험은 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드를 갖는 화학적으로 변형된 조립된 포어(라이세닌-(E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9가 21pA의 중간 범위를 나타내었음을 보여주며, 이는 중앙값 범위가 12pA인 라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9보다 컸다. 이러한 중앙값 범위 증가는 kmer의 해상도를 위한 큰 전류 공간을 제공하였다.

도 3은 E94C(돌연변이 E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2,2,2-트리플루오로에틸)아세트아미드를 갖는 (라이세닌-(E84Q/E85K/E92Q/E94D/E97S/T106K/D126G/C272A/C283A)9) 및 4((라이세닌-(E84Q/E85K/E92Q/E94C/E97S/T106K/D126G/C272A/C283A)9가 실시예 1에 기재된 바와 같이 중간 플롯을 나타냈다. 도 4가 도 3과 비교될 때, 상이한 위치에서 상이한 염기의 신호에 대한 상대적 기여도가 변경되었지만, 도 4의 극단적인(7 내지 8번 위치)에서의 판독-헤드 위치는 신호에 대한 이들의 기여도가 훨씬 낮아서 주어진 순간에 분석되는 Kmer의 길이가 더 짧아졌다는 것을 의미하는 매우 적은 식별력을 보여주었다. 이 짧은 판독 헤드는 기본 호출 정확도로 이어질 수 있는, 임의로 한 번에 신호에 기여하는 염기가 적어서 개선될 수 있는 이점이 있다.

실시예 3에 기재된 것과 유사한 실험을 E92C(돌연변이 E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2)를 통해 부착된 2-아이오도-N-(2-페닐에틸)아세트아미드를 갖는 라이세닌-(E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A)9 및 E92C(돌연변이 E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A를 갖는 서열번호: 2))를 통해 부착된 1-벤질-2,5-디 하이드로-1H-피롤-2,5-디온을 갖는 라이세닌-(E84Q/E85S/E92C/E94D/E97S/T106K/D126G/C272A/C283A)9 상에서 수행하였다.

<110> OXFORD NANOPORE TECHNOLOGIES LIMITED <120> MUTANT PORE <130> N407106WO <150> GB 1605899.2 <151> 2016-04-06 <150> GB 1608274.5 <151> 2016-05-11 <160> 24 <170> KoPatentIn 3.0 <210> 1 <211> 897 <212> DNA <213> Eisenia fetida <400> 1 atgagtgcga aggctgctga aggttatgaa caaatcgaag ttgatgtggt tgctgtgtgg 60 aaggaaggtt atgtgtatga aaatcgtggt agtacctccg tggatcaaaa aattaccatc 120 acgaaaggca tgaagaacgt taatagcgaa acccgtacgg tcaccgcgac gcattctatt 180 ggcagtacca tctccacggg tgacgccttt gaaatcggct ccgtggaagt ttcatattcg 240 catagccacg aagaatcaca agtttcgatg accgaaacgg aagtctacga atcaaaagtg 300 attgaacaca ccattacgat cccgccgacc tcgaagttca cgcgctggca gctgaacgca 360 gatgtcggcg gtgctgacat tgaatatatg tacctgatcg atgaagttac cccgattggc 420 ggtacgcaga gtattccgca agtgatcacc tcccgtgcaa aaattatcgt tggtcgccag 480 attatcctgg gcaagaccga aattcgtatc aaacatgctg aacgcaagga atatatgacc 540 gtggttagcc gtaaatcttg gccggcggcc acgctgggtc acagtaaact gtttaagttc 600 gtgctgtacg aagattgggg cggttttcgc atcaaaaccc tgaatacgat gtattctggt 660 tatgaatacg cgtatagctc tgaccagggc ggtatctact tcgatcaagg caccgacaac 720 ccgaaacagc gttgggccat taataagagc ctgccgctgc gccatggtga tgtcgtgacc 780 tttatgaaca aatacttcac gcgttctggt ctgtgctatg atgacggccc ggcgaccaat 840 gtgtattgtc tggataaacg cgaagacaag tggattctgg aagttgtcgg ctaatga 897 <210> 2 <211> 297 <212> PRT <213> Eisenia fetida <400> 2 Met Ser Ala Lys Ala Ala Glu Gly Tyr Glu Gln Ile Glu Val Asp Val 1 5 10 15 Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly Ser Thr 20 25 30 Ser Val Asp Gln Lys Ile Thr Ile Thr Lys Gly Met Lys Asn Val Asn 35 40 45 Ser Glu Thr Arg Thr Val Thr Ala Thr His Ser Ile Gly Ser Thr Ile 50 55 60 Ser Thr Gly Asp Ala Phe Glu Ile Gly Ser Val Glu Val Ser Tyr Ser 65 70 75 80 His Ser His Glu Glu Ser Gln Val Ser Met Thr Glu Thr Glu Val Tyr 85 90 95 Glu Ser Lys Val Ile Glu His Thr Ile Thr Ile Pro Pro Thr Ser Lys 100 105 110 Phe Thr Arg Trp Gln Leu Asn Ala Asp Val Gly Gly Ala Asp Ile Glu 115 120 125 Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Gly Gly Thr Gln Ser 130 135 140 Ile Pro Gln Val Ile Thr Ser Arg Ala Lys Ile Ile Val Gly Arg Gln 145 150 155 160 Ile Ile Leu Gly Lys Thr Glu Ile Arg Ile Lys His Ala Glu Arg Lys 165 170 175 Glu Tyr Met Thr Val Val Ser Arg Lys Ser Trp Pro Ala Ala Thr Leu 180 185 190 Gly His Ser Lys Leu Phe Lys Phe Val Leu Tyr Glu Asp Trp Gly Gly 195 200 205 Phe Arg Ile Lys Thr Leu Asn Thr Met Tyr Ser Gly Tyr Glu Tyr Ala 210 215 220 Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Gln Gly Thr Asp Asn 225 230 235 240 Pro Lys Gln Arg Trp Ala Ile Asn Lys Ser Leu Pro Leu Arg His Gly 245 250 255 Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Arg Ser Gly Leu Cys 260 265 270 Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Asp Lys Arg Glu 275 280 285 Asp Lys Trp Ile Leu Glu Val Val Gly 290 295 <210> 3 <211> 1830 <212> DNA <213> Bacteriophage phi-29 <400> 3 atgaaacaca tgccgcgtaa aatgtatagc tgcgcgtttg aaaccacgac caaagtggaa 60 gattgtcgcg tttgggccta tggctacatg aacatcgaag atcattctga atacaaaatc 120 ggtaacagtc tggatgaatt tatggcatgg gtgctgaaag ttcaggcgga tctgtacttc 180 cacaacctga aatttgatgg cgcattcatt atcaactggc tggaacgtaa tggctttaaa 240 tggagcgcgg atggtctgcc gaacacgtat aataccatta tctctcgtat gggccagtgg 300 tatatgattg atatctgcct gggctacaaa ggtaaacgca aaattcatac cgtgatctat 360 gatagcctga aaaaactgcc gtttccggtg aagaaaattg cgaaagattt caaactgacg 420 gttctgaaag gcgatattga ttatcacaaa gaacgtccgg ttggttacaa aatcaccccg 480 gaagaatacg catacatcaa aaacgatatc cagatcatcg cagaagcgct gctgattcag 540 tttaaacagg gcctggatcg catgaccgcg ggcagtgata gcctgaaagg tttcaaagat 600 atcatcacga ccaaaaaatt caaaaaagtg ttcccgacgc tgagcctggg tctggataaa 660 gaagttcgtt atgcctaccg cggcggtttt acctggctga acgatcgttt caaagaaaaa 720 gaaattggcg agggtatggt gtttgatgtt aatagtctgt atccggcaca gatgtacagc 780 cgcctgctgc cgtatggcga accgatcgtg ttcgagggta aatatgtttg ggatgaagat 840 tacccgctgc atattcagca catccgttgt gaatttgaac tgaaagaagg ctatattccg 900 accattcaga tcaaacgtag tcgcttctat aagggtaacg aatacctgaa aagctctggc 960 ggtgaaatcg cggatctgtg gctgagtaac gtggatctgg aactgatgaa agaacactac 1020 gatctgtaca acgttgaata catcagcggc ctgaaattta aagccacgac cggtctgttc 1080 aaagatttca tcgataaatg gacctacatc aaaacgacct ctgaaggcgc gattaaacag 1140 ctggccaaac tgatgctgaa cagcctgtat ggcaaattcg cctctaatcc ggatgtgacc 1200 ggtaaagttc cgtacctgaa agaaaatggc gcactgggtt ttcgcctggg cgaagaagaa 1260 acgaaagatc cggtgtatac cccgatgggt gttttcatta cggcctgggc acgttacacg 1320 accatcaccg cggcccaggc atgctatgat cgcattatct actgtgatac cgattctatt 1380 catctgacgg gcaccgaaat cccggatgtg attaaagata tcgttgatcc gaaaaaactg 1440 ggttattggg cccacgaaag tacgtttaaa cgtgcaaaat acctgcgcca gaaaacctac 1500 atccaggata tctacatgaa agaagtggat ggcaaactgg ttgaaggttc tccggatgat 1560 tacaccgata tcaaattcag tgtgaaatgc gccggcatga cggataaaat caaaaaagaa 1620 gtgaccttcg aaaacttcaa agttggtttc agccgcaaaa tgaaaccgaa accggtgcag 1680 gttccgggcg gtgtggttct ggtggatgat acgtttacca ttaaatctgg cggtagtgcg 1740 tggagccatc cgcagttcga aaaaggcggt ggctctggtg gcggttctgg cggtagtgcc 1800 tggagccacc cgcagtttga aaaataataa 1830 <210> 4 <211> 608 <212> PRT <213> Bacteriophage phi-29 <400> 4 Met Lys His Met Pro Arg Lys Met Tyr Ser Cys Ala Phe Glu Thr Thr 1 5 10 15 Thr Lys Val Glu Asp Cys Arg Val Trp Ala Tyr Gly Tyr Met Asn Ile 20 25 30 Glu Asp His Ser Glu Tyr Lys Ile Gly Asn Ser Leu Asp Glu Phe Met 35 40 45 Ala Trp Val Leu Lys Val Gln Ala Asp Leu Tyr Phe His Asn Leu Lys 50 55 60 Phe Asp Gly Ala Phe Ile Ile Asn Trp Leu Glu Arg Asn Gly Phe Lys 65 70 75 80 Trp Ser Ala Asp Gly Leu Pro Asn Thr Tyr Asn Thr Ile Ile Ser Arg 85 90 95 Met Gly Gln Trp Tyr Met Ile Asp Ile Cys Leu Gly Tyr Lys Gly Lys 100 105 110 Arg Lys Ile His Thr Val Ile Tyr Asp Ser Leu Lys Lys Leu Pro Phe 115 120 125 Pro Val Lys Lys Ile Ala Lys Asp Phe Lys Leu Thr Val Leu Lys Gly 130 135 140 Asp Ile Asp Tyr His Lys Glu Arg Pro Val Gly Tyr Lys Ile Thr Pro 145 150 155 160 Glu Glu Tyr Ala Tyr Ile Lys Asn Asp Ile Gln Ile Ile Ala Glu Ala 165 170 175 Leu Leu Ile Gln Phe Lys Gln Gly Leu Asp Arg Met Thr Ala Gly Ser 180 185 190 Asp Ser Leu Lys Gly Phe Lys Asp Ile Ile Thr Thr Lys Lys Phe Lys 195 200 205 Lys Val Phe Pro Thr Leu Ser Leu Gly Leu Asp Lys Glu Val Arg Tyr 210 215 220 Ala Tyr Arg Gly Gly Phe Thr Trp Leu Asn Asp Arg Phe Lys Glu Lys 225 230 235 240 Glu Ile Gly Glu Gly Met Val Phe Asp Val Asn Ser Leu Tyr Pro Ala 245 250 255 Gln Met Tyr Ser Arg Leu Leu Pro Tyr Gly Glu Pro Ile Val Phe Glu 260 265 270 Gly Lys Tyr Val Trp Asp Glu Asp Tyr Pro Leu His Ile Gln His Ile 275 280 285 Arg Cys Glu Phe Glu Leu Lys Glu Gly Tyr Ile Pro Thr Ile Gln Ile 290 295 300 Lys Arg Ser Arg Phe Tyr Lys Gly Asn Glu Tyr Leu Lys Ser Ser Gly 305 310 315 320 Gly Glu Ile Ala Asp Leu Trp Leu Ser Asn Val Asp Leu Glu Leu Met 325 330 335 Lys Glu His Tyr Asp Leu Tyr Asn Val Glu Tyr Ile Ser Gly Leu Lys 340 345 350 Phe Lys Ala Thr Thr Gly Leu Phe Lys Asp Phe Ile Asp Lys Trp Thr 355 360 365 Tyr Ile Lys Thr Thr Ser Glu Gly Ala Ile Lys Gln Leu Ala Lys Leu 370 375 380 Met Leu Asn Ser Leu Tyr Gly Lys Phe Ala Ser Asn Pro Asp Val Thr 385 390 395 400 Gly Lys Val Pro Tyr Leu Lys Glu Asn Gly Ala Leu Gly Phe Arg Leu 405 410 415 Gly Glu Glu Glu Thr Lys Asp Pro Val Tyr Thr Pro Met Gly Val Phe 420 425 430 Ile Thr Ala Trp Ala Arg Tyr Thr Thr Ile Thr Ala Ala Gln Ala Cys 435 440 445 Tyr Asp Arg Ile Ile Tyr Cys Asp Thr Asp Ser Ile His Leu Thr Gly 450 455 460 Thr Glu Ile Pro Asp Val Ile Lys Asp Ile Val Asp Pro Lys Lys Leu 465 470 475 480 Gly Tyr Trp Ala His Glu Ser Thr Phe Lys Arg Ala Lys Tyr Leu Arg 485 490 495 Gln Lys Thr Tyr Ile Gln Asp Ile Tyr Met Lys Glu Val Asp Gly Lys 500 505 510 Leu Val Glu Gly Ser Pro Asp Asp Tyr Thr Asp Ile Lys Phe Ser Val 515 520 525 Lys Cys Ala Gly Met Thr Asp Lys Ile Lys Lys Glu Val Thr Phe Glu 530 535 540 Asn Phe Lys Val Gly Phe Ser Arg Lys Met Lys Pro Lys Pro Val Gln 545 550 555 560 Val Pro Gly Gly Val Val Leu Val Asp Asp Thr Phe Thr Ile Lys Ser 565 570 575 Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser 580 585 590 Gly Gly Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys 595 600 605 <210> 5 <211> 1390 <212> DNA <213> Escherichia coli <400> 5 atgatgaacg atggcaaaca gcagagcacc ttcctgtttc atgattatga aaccttcggt 60 acccatccgg ccctggatcg tccggcgcag tttgcggcca ttcgcaccga tagcgaattc 120 aatgtgattg gcgaaccgga agtgttttat tgcaaaccgg ccgatgatta tctgccgcag 180 ccgggtgcgg tgctgattac cggtattacc ccgcaggaag cgcgcgcgaa aggtgaaaac 240 gaagcggcgt ttgccgcgcg cattcatagc ctgtttaccg tgccgaaaac ctgcattctg 300 ggctataaca atgtgcgctt cgatgatgaa gttacccgta atatctttta tcgtaacttt 360 tatgatccgt atgcgtggag ctggcagcat gataacagcc gttgggatct gctggatgtg 420 atgcgcgcgt gctatgcgct gcgcccggaa ggcattaatt ggccggaaaa cgatgatggc 480 ctgccgagct ttcgtctgga acatctgacc aaagccaacg gcattgaaca tagcaatgcc 540 catgatgcga tggccgatgt ttatgcgacc attgcgatgg cgaaactggt taaaacccgt 600 cagccgcgcc tgtttgatta tctgtttacc caccgtaaca aacacaaact gatggcgctg 660 attgatgttc cgcagatgaa accgctggtg catgtgagcg gcatgtttgg cgcctggcgc 720 ggcaacacca gctgggtggc cccgctggcc tggcacccgg aaaatcgtaa cgccgtgatt 780 atggttgatc tggccggtga tattagcccg ctgctggaac tggatagcga taccctgcgt 840 gaacgcctgt ataccgccaa aaccgatctg ggcgataatg ccgccgtgcc ggtgaaactg 900 gttcacatta acaaatgccc ggtgctggcc caggcgaaca ccctgcgccc ggaagatgcg 960 gatcgtctgg gtattaatcg ccagcattgt ctggataatc tgaaaatcct gcgtgaaaac 1020 ccgcaggtgc gtgaaaaagt ggtggcgatc ttcgcggaag cggaaccgtt caccccgagc 1080 gataacgtgg atgcgcagct gtataacggc ttctttagcg atgccgatcg cgcggcgatg 1140 aaaatcgttc tggaaaccga accgcgcaat ctgccggcgc tggatattac ctttgttgat 1200 aaacgtattg aaaaactgct gtttaattat cgtgcgcgca attttccggg taccctggat 1260 tatgccgaac agcagcgttg gctggaacat cgtcgtcagg ttttcacccc ggaatttctg 1320 cagggttatg cggatgaact gcagatgctg gttcagcagt atgccgatga taaagaaaaa 1380 gtggcgctgc 1390 <210> 6 <211> 485 <212> PRT <213> Escherichia coli <400> 6 Met Met Asn Asp Gly Lys Gln Gln Ser Thr Phe Leu Phe His Asp Tyr 1 5 10 15 Glu Thr Phe Gly Thr His Pro Ala Leu Asp Arg Pro Ala Gln Phe Ala 20 25 30 Ala Ile Arg Thr Asp Ser Glu Phe Asn Val Ile Gly Glu Pro Glu Val 35 40 45 Phe Tyr Cys Lys Pro Ala Asp Asp Tyr Leu Pro Gln Pro Gly Ala Val 50 55 60 Leu Ile Thr Gly Ile Thr Pro Gln Glu Ala Arg Ala Lys Gly Glu Asn 65 70 75 80 Glu Ala Ala Phe Ala Ala Arg Ile His Ser Leu Phe Thr Val Pro Lys 85 90 95 Thr Cys Ile Leu Gly Tyr Asn Asn Val Arg Phe Asp Asp Glu Val Thr 100 105 110 Arg Asn Ile Phe Tyr Arg Asn Phe Tyr Asp Pro Tyr Ala Trp Ser Trp 115 120 125 Gln His Asp Asn Ser Arg Trp Asp Leu Leu Asp Val Met Arg Ala Cys 130 135 140 Tyr Ala Leu Arg Pro Glu Gly Ile Asn Trp Pro Glu Asn Asp Asp Gly 145 150 155 160 Leu Pro Ser Phe Arg Leu Glu His Leu Thr Lys Ala Asn Gly Ile Glu 165 170 175 His Ser Asn Ala His Asp Ala Met Ala Asp Val Tyr Ala Thr Ile Ala 180 185 190 Met Ala Lys Leu Val Lys Thr Arg Gln Pro Arg Leu Phe Asp Tyr Leu 195 200 205 Phe Thr His Arg Asn Lys His Lys Leu Met Ala Leu Ile Asp Val Pro 210 215 220 Gln Met Lys Pro Leu Val His Val Ser Gly Met Phe Gly Ala Trp Arg 225 230 235 240 Gly Asn Thr Ser Trp Val Ala Pro Leu Ala Trp His Pro Glu Asn Arg 245 250 255 Asn Ala Val Ile Met Val Asp Leu Ala Gly Asp Ile Ser Pro Leu Leu 260 265 270 Glu Leu Asp Ser Asp Thr Leu Arg Glu Arg Leu Tyr Thr Ala Lys Thr 275 280 285 Asp Leu Gly Asp Asn Ala Ala Val Pro Val Lys Leu Val His Ile Asn 290 295 300 Lys Cys Pro Val Leu Ala Gln Ala Asn Thr Leu Arg Pro Glu Asp Ala 305 310 315 320 Asp Arg Leu Gly Ile Asn Arg Gln His Cys Leu Asp Asn Leu Lys Ile 325 330 335 Leu Arg Glu Asn Pro Gln Val Arg Glu Lys Val Val Ala Ile Phe Ala 340 345 350 Glu Ala Glu Pro Phe Thr Pro Ser Asp Asn Val Asp Ala Gln Leu Tyr 355 360 365 Asn Gly Phe Phe Ser Asp Ala Asp Arg Ala Ala Met Lys Ile Val Leu 370 375 380 Glu Thr Glu Pro Arg Asn Leu Pro Ala Leu Asp Ile Thr Phe Val Asp 385 390 395 400 Lys Arg Ile Glu Lys Leu Leu Phe Asn Tyr Arg Ala Arg Asn Phe Pro 405 410 415 Gly Thr Leu Asp Tyr Ala Glu Gln Gln Arg Trp Leu Glu His Arg Arg 420 425 430 Gln Val Phe Thr Pro Glu Phe Leu Gln Gly Tyr Ala Asp Glu Leu Gln 435 440 445 Met Leu Val Gln Gln Tyr Ala Asp Asp Lys Glu Lys Val Ala Leu Leu 450 455 460 Lys Ala Leu Trp Gln Tyr Ala Glu Glu Ile Val Ser Gly Ser Gly His 465 470 475 480 His His His His His 485 <210> 7 <211> 804 <212> DNA <213> Escherichia coli <400> 7 atgaaatttg tctcttttaa tatcaacggc ctgcgcgcca gacctcacca gcttgaagcc 60 atcgtcgaaa agcaccaacc ggatgtgatt ggcctgcagg agacaaaagt tcatgacgat 120 atgtttccgc tcgaagaggt ggcgaagctc ggctacaacg tgttttatca cgggcagaaa 180 ggccattatg gcgtggcgct gctgaccaaa gagacgccga ttgccgtgcg tcgcggcttt 240 cccggtgacg acgaagaggc gcagcggcgg attattatgg cggaaatccc ctcactgctg 300 ggtaatgtca ccgtgatcaa cggttacttc ccgcagggtg aaagccgcga ccatccgata 360 aaattcccgg caaaagcgca gttttatcag aatctgcaaa actacctgga aaccgaactc 420 aaacgtgata atccggtact gattatgggc gatatgaata tcagccctac agatctggat 480 atcggcattg gcgaagaaaa ccgtaagcgc tggctgcgta ccggtaaatg ctctttcctg 540 ccggaagagc gcgaatggat ggacaggctg atgagctggg ggttggtcga taccttccgc 600 catgcgaatc cgcaaacagc agatcgtttc tcatggtttg attaccgctc aaaaggtttt 660 gacgataacc gtggtctgcg catcgacctg ctgctcgcca gccaaccgct ggcagaatgt 720 tgcgtagaaa ccggcatcga ctatgaaatc cgcagcatgg aaaaaccgtc cgatcacgcc 780 cccgtctggg cgaccttccg ccgc 804 <210> 8 <211> 268 <212> PRT <213> Escherichia coli <400> 8 Met Lys Phe Val Ser Phe Asn Ile Asn Gly Leu Arg Ala Arg Pro His 1 5 10 15 Gln Leu Glu Ala Ile Val Glu Lys His Gln Pro Asp Val Ile Gly Leu 20 25 30 Gln Glu Thr Lys Val His Asp Asp Met Phe Pro Leu Glu Glu Val Ala 35 40 45 Lys Leu Gly Tyr Asn Val Phe Tyr His Gly Gln Lys Gly His Tyr Gly 50 55 60 Val Ala Leu Leu Thr Lys Glu Thr Pro Ile Ala Val Arg Arg Gly Phe 65 70 75 80 Pro Gly Asp Asp Glu Glu Ala Gln Arg Arg Ile Ile Met Ala Glu Ile 85 90 95 Pro Ser Leu Leu Gly Asn Val Thr Val Ile Asn Gly Tyr Phe Pro Gln 100 105 110 Gly Glu Ser Arg Asp His Pro Ile Lys Phe Pro Ala Lys Ala Gln Phe 115 120 125 Tyr Gln Asn Leu Gln Asn Tyr Leu Glu Thr Glu Leu Lys Arg Asp Asn 130 135 140 Pro Val Leu Ile Met Gly Asp Met Asn Ile Ser Pro Thr Asp Leu Asp 145 150 155 160 Ile Gly Ile Gly Glu Glu Asn Arg Lys Arg Trp Leu Arg Thr Gly Lys 165 170 175 Cys Ser Phe Leu Pro Glu Glu Arg Glu Trp Met Asp Arg Leu Met Ser 180 185 190 Trp Gly Leu Val Asp Thr Phe Arg His Ala Asn Pro Gln Thr Ala Asp 195 200 205 Arg Phe Ser Trp Phe Asp Tyr Arg Ser Lys Gly Phe Asp Asp Asn Arg 210 215 220 Gly Leu Arg Ile Asp Leu Leu Leu Ala Ser Gln Pro Leu Ala Glu Cys 225 230 235 240 Cys Val Glu Thr Gly Ile Asp Tyr Glu Ile Arg Ser Met Glu Lys Pro 245 250 255 Ser Asp His Ala Pro Val Trp Ala Thr Phe Arg Arg 260 265 <210> 9 <211> 1275 <212> DNA <213> Thermus thermophilus <400> 9 atgtttcgtc gtaaagaaga tctggatccg ccgctggcac tgctgccgct gaaaggcctg 60 cgcgaagccg ccgcactgct ggaagaagcg ctgcgtcaag gtaaacgcat tcgtgttcac 120 ggcgactatg atgcggatgg cctgaccggc accgcgatcc tggttcgtgg tctggccgcc 180 ctgggtgcgg atgttcatcc gtttatcccg caccgcctgg aagaaggcta tggtgtcctg 240 atggaacgcg tcccggaaca tctggaagcc tcggacctgt ttctgaccgt tgactgcggc 300 attaccaacc atgcggaact gcgcgaactg ctggaaaatg gcgtggaagt cattgttacc 360 gatcatcata cgccgggcaa aacgccgccg ccgggtctgg tcgtgcatcc ggcgctgacg 420 ccggatctga aagaaaaacc gaccggcgca ggcgtggcgt ttctgctgct gtgggcactg 480 catgaacgcc tgggcctgcc gccgccgctg gaatacgcgg acctggcagc cgttggcacc 540 attgccgacg ttgccccgct gtggggttgg aatcgtgcac tggtgaaaga aggtctggca 600 cgcatcccgg cttcatcttg ggtgggcctg cgtctgctgg ctgaagccgt gggctatacc 660 ggcaaagcgg tcgaagtcgc tttccgcatc gcgccgcgca tcaatgcggc ttcccgcctg 720 ggcgaagcgg aaaaagccct gcgcctgctg ctgacggatg atgcggcaga agctcaggcg 780 ctggtcggcg aactgcaccg tctgaacgcc cgtcgtcaga ccctggaaga agcgatgctg 840 cgcaaactgc tgccgcaggc cgacccggaa gcgaaagcca tcgttctgct ggacccggaa 900 ggccatccgg gtgttatggg tattgtggcc tctcgcatcc tggaagcgac cctgcgcccg 960 gtctttctgg tggcccaggg caaaggcacc gtgcgttcgc tggctccgat ttccgccgtc 1020 gaagcactgc gcagcgcgga agatctgctg ctgcgttatg gtggtcataa agaagcggcg 1080 ggtttcgcaa tggatgaagc gctgtttccg gcgttcaaag cacgcgttga agcgtatgcc 1140 gcacgtttcc cggatccggt tcgtgaagtg gcactgctgg atctgctgcc ggaaccgggc 1200 ctgctgccgc aggtgttccg tgaactggca ctgctggaac cgtatggtga aggtaacccg 1260 gaaccgctgt tcctg 1275 <210> 10 <211> 425 <212> PRT <213> Thermus thermophilus <400> 10 Met Phe Arg Arg Lys Glu Asp Leu Asp Pro Pro Leu Ala Leu Leu Pro 1 5 10 15 Leu Lys Gly Leu Arg Glu Ala Ala Ala Leu Leu Glu Glu Ala Leu Arg 20 25 30 Gln Gly Lys Arg Ile Arg Val His Gly Asp Tyr Asp Ala Asp Gly Leu 35 40 45 Thr Gly Thr Ala Ile Leu Val Arg Gly Leu Ala Ala Leu Gly Ala Asp 50 55 60 Val His Pro Phe Ile Pro His Arg Leu Glu Glu Gly Tyr Gly Val Leu 65 70 75 80 Met Glu Arg Val Pro Glu His Leu Glu Ala Ser Asp Leu Phe Leu Thr 85 90 95 Val Asp Cys Gly Ile Thr Asn His Ala Glu Leu Arg Glu Leu Leu Glu 100 105 110 Asn Gly Val Glu Val Ile Val Thr Asp His His Thr Pro Gly Lys Thr 115 120 125 Pro Pro Pro Gly Leu Val Val His Pro Ala Leu Thr Pro Asp Leu Lys 130 135 140 Glu Lys Pro Thr Gly Ala Gly Val Ala Phe Leu Leu Leu Trp Ala Leu 145 150 155 160 His Glu Arg Leu Gly Leu Pro Pro Pro Leu Glu Tyr Ala Asp Leu Ala 165 170 175 Ala Val Gly Thr Ile Ala Asp Val Ala Pro Leu Trp Gly Trp Asn Arg 180 185 190 Ala Leu Val Lys Glu Gly Leu Ala Arg Ile Pro Ala Ser Ser Trp Val 195 200 205 Gly Leu Arg Leu Leu Ala Glu Ala Val Gly Tyr Thr Gly Lys Ala Val 210 215 220 Glu Val Ala Phe Arg Ile Ala Pro Arg Ile Asn Ala Ala Ser Arg Leu 225 230 235 240 Gly Glu Ala Glu Lys Ala Leu Arg Leu Leu Leu Thr Asp Asp Ala Ala 245 250 255 Glu Ala Gln Ala Leu Val Gly Glu Leu His Arg Leu Asn Ala Arg Arg 260 265 270 Gln Thr Leu Glu Glu Ala Met Leu Arg Lys Leu Leu Pro Gln Ala Asp 275 280 285 Pro Glu Ala Lys Ala Ile Val Leu Leu Asp Pro Glu Gly His Pro Gly 290 295 300 Val Met Gly Ile Val Ala Ser Arg Ile Leu Glu Ala Thr Leu Arg Pro 305 310 315 320 Val Phe Leu Val Ala Gln Gly Lys Gly Thr Val Arg Ser Leu Ala Pro 325 330 335 Ile Ser Ala Val Glu Ala Leu Arg Ser Ala Glu Asp Leu Leu Leu Arg 340 345 350 Tyr Gly Gly His Lys Glu Ala Ala Gly Phe Ala Met Asp Glu Ala Leu 355 360 365 Phe Pro Ala Phe Lys Ala Arg Val Glu Ala Tyr Ala Ala Arg Phe Pro 370 375 380 Asp Pro Val Arg Glu Val Ala Leu Leu Asp Leu Leu Pro Glu Pro Gly 385 390 395 400 Leu Leu Pro Gln Val Phe Arg Glu Leu Ala Leu Leu Glu Pro Tyr Gly 405 410 415 Glu Gly Asn Pro Glu Pro Leu Phe Leu 420 425 <210> 11 <211> 738 <212> DNA <213> Bacteriophage lambda <400> 11 tccggaagcg gctctggtag tggttctggc atgacaccgg acattatcct gcagcgtacc 60 gggatcgatg tgagagctgt cgaacagggg gatgatgcgt ggcacaaatt acggctcggc 120 gtcatcaccg cttcagaagt tcacaacgtg atagcaaaac cccgctccgg aaagaagtgg 180 cctgacatga aaatgtccta cttccacacc ctgcttgctg aggtttgcac cggtgtggct 240 ccggaagtta acgctaaagc actggcctgg ggaaaacagt acgagaacga cgccagaacc 300 ctgtttgaat tcacttccgg cgtgaatgtt actgaatccc cgatcatcta tcgcgacgaa 360 agtatgcgta ccgcctgctc tcccgatggt ttatgcagtg acggcaacgg ccttgaactg 420 aaatgcccgt ttacctcccg ggatttcatg aagttccggc tcggtggttt cgaggccata 480 aagtcagctt acatggccca ggtgcagtac agcatgtggg tgacgcgaaa aaatgcctgg 540 tactttgcca actatgaccc gcgtatgaag cgtgaaggcc tgcattatgt cgtgattgag 600 cgggatgaaa agtacatggc gagttttgac gagatcgtgc cggagttcat cgaaaaaatg 660 gacgaggcac tggctgaaat tggttttgta tttggggagc aatggcgatc tggctctggt 720 tccggcagcg gttccgga 738 <210> 12 <211> 226 <212> PRT <213> Bacteriophage lambda <400> 12 Met Thr Pro Asp Ile Ile Leu Gln Arg Thr Gly Ile Asp Val Arg Ala 1 5 10 15 Val Glu Gln Gly Asp Asp Ala Trp His Lys Leu Arg Leu Gly Val Ile 20 25 30 Thr Ala Ser Glu Val His Asn Val Ile Ala Lys Pro Arg Ser Gly Lys 35 40 45 Lys Trp Pro Asp Met Lys Met Ser Tyr Phe His Thr Leu Leu Ala Glu 50 55 60 Val Cys Thr Gly Val Ala Pro Glu Val Asn Ala Lys Ala Leu Ala Trp 65 70 75 80 Gly Lys Gln Tyr Glu Asn Asp Ala Arg Thr Leu Phe Glu Phe Thr Ser 85 90 95 Gly Val Asn Val Thr Glu Ser Pro Ile Ile Tyr Arg Asp Glu Ser Met 100 105 110 Arg Thr Ala Cys Ser Pro Asp Gly Leu Cys Ser Asp Gly Asn Gly Leu 115 120 125 Glu Leu Lys Cys Pro Phe Thr Ser Arg Asp Phe Met Lys Phe Arg Leu 130 135 140 Gly Gly Phe Glu Ala Ile Lys Ser Ala Tyr Met Ala Gln Val Gln Tyr 145 150 155 160 Ser Met Trp Val Thr Arg Lys Asn Ala Trp Tyr Phe Ala Asn Tyr Asp 165 170 175 Pro Arg Met Lys Arg Glu Gly Leu His Tyr Val Val Ile Glu Arg Asp 180 185 190 Glu Lys Tyr Met Ala Ser Phe Asp Glu Ile Val Pro Glu Phe Ile Glu 195 200 205 Lys Met Asp Glu Ala Leu Ala Glu Ile Gly Phe Val Phe Gly Glu Gln 210 215 220 Trp Arg 225 <210> 13 <211> 760 <212> PRT <213> Methanococcoides burtonii <400> 13 Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr 1 5 10 15 Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile 20 25 30 Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr 35 40 45 Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile 50 55 60 Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala 65 70 75 80 Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys 85 90 95 Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly 100 105 110 Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu 115 120 125 Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp 130 135 140 Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val 145 150 155 160 Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala 165 170 175 Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly 180 185 190 Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly 195 200 205 Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile 210 215 220 Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile 225 230 235 240 Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys 245 250 255 Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp 260 265 270 Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser 275 280 285 Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys 290 295 300 Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu 305 310 315 320 Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr 325 330 335 Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile 340 345 350 Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro 355 360 365 Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu 370 375 380 Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe 385 390 395 400 Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp 405 410 415 Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr 420 425 430 Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe 435 440 445 Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu 450 455 460 Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser 465 470 475 480 Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr 485 490 495 Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly 500 505 510 Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly 515 520 525 Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr 530 535 540 Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln 545 550 555 560 Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val 565 570 575 Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr 580 585 590 Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu 595 600 605 Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn 610 615 620 Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu 625 630 635 640 Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser 645 650 655 Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu 660 665 670 Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala 675 680 685 Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly 690 695 700 Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr 705 710 715 720 Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn 725 730 735 Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn 740 745 750 Gln Lys Thr Phe Asn Asp Phe Gln 755 760 <210> 14 <211> 300 <212> PRT <213> Eisenia fetida <400> 14 Met Ser Ser Ser Thr Val Met Ala Asp Gly Phe Glu Glu Ile Glu Val 1 5 10 15 Asp Val Val Ser Val Trp Lys Glu Gly Tyr Ala Tyr Glu Asn Arg Gly 20 25 30 Asn Ser Ser Val Gln Gln Lys Ile Thr Met Thr Lys Gly Met Lys Asn 35 40 45 Leu Asn Ser Glu Thr Lys Thr Leu Thr Ala Thr His Thr Leu Gly Arg 50 55 60 Thr Leu Lys Val Gly Asp Pro Phe Glu Ile Ala Ser Val Glu Val Ser 65 70 75 80 Tyr Thr Phe Ser His Gln Lys Ser Gln Val Ser Met Thr Gln Thr Glu 85 90 95 Val Tyr Ser Ser Gln Val Ile Glu His Thr Val Thr Ile Pro Pro Asn 100 105 110 Lys Lys Phe Thr Arg Trp Lys Leu Asn Ala Asp Val Gly Gly Thr Gly 115 120 125 Ile Glu Tyr Met Tyr Leu Ile Asp Glu Val Thr Ala Ile Gly Ala Asp 130 135 140 Leu Thr Ile Pro Glu Val Asn Lys Ser Arg Ala Lys Ile Leu Val Gly 145 150 155 160 Arg Gln Ile His Leu Gly Glu Thr Glu Ile Arg Ile Lys His Ala Glu 165 170 175 Arg Lys Glu Tyr Met Thr Val Ile Ser Arg Lys Ser Trp Pro Ala Ala 180 185 190 Thr Leu Gly Asn Ser Asn Leu Phe Lys Phe Val Leu Phe Glu Asp Ser 195 200 205 Ser Gly Ile Arg Ile Lys Thr Leu Asn Thr Met Tyr Pro Gly Tyr Glu 210 215 220 Trp Ala Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Glu Ser Ser 225 230 235 240 Asp Asn Pro Lys Gln Arg Trp Ala Leu Ser Lys Ala Met Pro Leu Arg 245 250 255 His Gly Asp Val Val Thr Phe Arg Asn Asn Phe Phe Thr Asn Ser Gly 260 265 270 Met Cys Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Glu Lys 275 280 285 Arg Glu Asp Lys Trp Ile Leu Glu Val Val Asn Thr 290 295 300 <210> 15 <211> 300 <212> PRT <213> Eisenia fetida <400> 15 Met Ser Ser Arg Ala Gly Ile Ala Glu Gly Tyr Glu Gln Ile Glu Val 1 5 10 15 Asp Val Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly 20 25 30 Ser Thr Ser Val Glu Gln Lys Ile Lys Ile Thr Lys Gly Met Arg Asn 35 40 45 Leu Asn Ser Glu Thr Lys Thr Leu Thr Ala Ser His Ser Ile Gly Ser 50 55 60 Thr Ile Ser Thr Gly Asp Leu Phe Glu Ile Ala Thr Val Asp Val Ser 65 70 75 80 Tyr Ser Tyr Ser His Glu Glu Ser Gln Val Ser Met Thr Glu Thr Glu 85 90 95 Val Tyr Glu Ser Lys Glu Ile Glu His Thr Ile Thr Ile Pro Pro Thr 100 105 110 Ser Lys Phe Thr Arg Trp Gln Leu Asn Ala Asp Val Gly Gly Ala Asp 115 120 125 Ile Glu Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Gly Gly Thr 130 135 140 Leu Ser Ile Pro Gln Val Ile Lys Ser Arg Ala Lys Ile Leu Val Gly 145 150 155 160 Arg Glu Ile Tyr Leu Gly Glu Thr Glu Ile Arg Ile Lys His Ala Asp 165 170 175 Arg Lys Glu Tyr Met Thr Val Val Ser Arg Lys Ser Trp Pro Ala Ala 180 185 190 Thr Leu Gly His Ser Lys Leu Tyr Lys Phe Val Leu Tyr Glu Asp Met 195 200 205 Tyr Gly Phe Arg Ile Lys Thr Leu Asn Thr Met Tyr Ser Gly Tyr Glu 210 215 220 Tyr Ala Tyr Ser Ser Asp Gln Gly Gly Ile Tyr Phe Asp Gln Gly Ser 225 230 235 240 Asp Asn Pro Lys Gln Arg Trp Ala Ile Asn Lys Ser Leu Pro Leu Arg 245 250 255 His Gly Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Arg Ser Gly 260 265 270 Leu Cys Tyr Tyr Asp Gly Pro Ala Thr Asp Val Tyr Cys Leu Asp Lys 275 280 285 Arg Glu Asp Lys Trp Ile Leu Glu Val Val Lys Pro 290 295 300 <210> 16 <211> 300 <212> PRT <213> Eisenia fetida <400> 16 Met Ser Ala Thr Ala Val Thr Ala Asp Gly Leu Glu Glu Ile Glu Val 1 5 10 15 Asp Val Val Ala Val Trp Lys Glu Gly Tyr Val Tyr Glu Asn Arg Gly 20 25 30 Asp Thr Ser Val Glu Gln Lys Ile Thr Met Thr Lys Gly Met Lys Asn 35 40 45 Leu Asn Ser Glu Thr Lys Thr Leu Thr Ala Thr His Thr Val Gly Arg 50 55 60 Thr Leu Lys Val Gly Asp Pro Phe Glu Ile Gly Ser Val Glu Val Ser 65 70 75 80 Tyr Ser Phe Ser His Gln Glu Ser Gln Val Ser Met Thr Gln Thr Glu 85 90 95 Val Tyr Ser Ser Gln Val Ile Glu His Thr Val Thr Ile Pro Pro Thr 100 105 110 Ser Lys Phe Thr Arg Trp Lys Leu Asn Ala Asp Val Gly Gly Thr Asp 115 120 125 Ile Glu Tyr Met Tyr Leu Ile Asp Glu Val Thr Pro Ile Ser Val Thr 130 135 140 Gln Thr Ile Pro Gln Val Ile Arg Ser Arg Ala Lys Ile Leu Val Gly 145 150 155 160 Arg Gln Ile His Leu Gly Thr Thr Ala Val Arg Ile Lys His Ala Glu 165 170 175 Arg Gln Glu Tyr Met Thr Val Ile Glu Arg Lys Lys Trp Pro Ala Ala 180 185 190 Thr Leu Gly Lys Ser Asn Leu Phe Lys Phe Val Leu Phe Glu Asp Ser 195 200 205 Ser Gly Thr Arg Ile Lys Thr Leu Asn Thr Met Tyr Pro Gly Tyr Glu 210 215 220 Trp Ala Tyr Ser Ser Asp Gln Gly Gly Val Tyr Phe Asp Glu Ser Ser 225 230 235 240 Asp Asn Pro Lys Gln Arg Trp Ala Leu Ser Lys Ala Leu Pro Leu Arg 245 250 255 His Gly Asp Val Val Thr Phe Met Asn Lys Tyr Phe Thr Asn Ser Gly 260 265 270 Leu Cys Tyr Asp Asp Gly Pro Ala Thr Asn Val Tyr Cys Leu Asp Lys 275 280 285 Arg Glu Asp Lys Trp Ile Leu Glu Val Val Asn Pro 290 295 300 <210> 17 <211> 252 <212> PRT <213> Bacillus thuringiensis <400> 17 Met Asp Val Ile Arg Glu Tyr Leu Met Phe Asn Glu Leu Ser Ala Leu 1 5 10 15 Ser Ser Ser Pro Glu Ser Val Arg Ser Arg Phe Ser Ser Ile Tyr Gly 20 25 30 Thr Asn Pro Asp Gly Ile Ala Leu Asn Asn Glu Thr Tyr Phe Asn Ala 35 40 45 Val Lys Pro Pro Ile Thr Ala Gln Tyr Gly Tyr Tyr Cys Tyr Lys Asn 50 55 60 Val Gly Thr Val Gln Tyr Val Asn Arg Pro Thr Asp Ile Asn Pro Asn 65 70 75 80 Val Ile Leu Ala Gln Asp Thr Leu Thr Asn Asn Thr Asn Glu Pro Phe 85 90 95 Thr Thr Thr Ile Thr Ile Thr Gly Ser Phe Thr Asn Thr Ser Thr Val 100 105 110 Thr Ser Ser Thr Thr Thr Gly Phe Lys Phe Thr Ser Lys Leu Ser Ile 115 120 125 Lys Lys Val Phe Glu Ile Gly Gly Glu Val Ser Phe Ser Thr Thr Ile 130 135 140 Gly Thr Ser Glu Thr Thr Thr Glu Thr Ile Thr Val Ser Lys Ser Val 145 150 155 160 Thr Val Thr Val Pro Ala Gln Ser Arg Arg Thr Ile Gln Leu Thr Ala 165 170 175 Lys Ile Ala Lys Glu Ser Ala Asp Phe Ser Ala Pro Ile Thr Val Asp 180 185 190 Gly Tyr Phe Gly Ala Asn Phe Pro Lys Arg Val Gly Pro Gly Gly His 195 200 205 Tyr Phe Trp Phe Asn Pro Ala Arg Asp Val Leu Asn Thr Thr Ser Gly 210 215 220 Thr Leu Arg Gly Thr Val Thr Asn Val Ser Ser Phe Asp Phe Gln Thr 225 230 235 240 Ile Val Gln Pro Ala Arg Ser Leu Leu Asp Glu Gln 245 250 <210> 18 <211> 439 <212> PRT <213> Enterobacteria phage T4 <400> 18 Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile 1 5 10 15 Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly 20 25 30 Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala 35 40 45 Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His 50 55 60 Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr 65 70 75 80 Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val 85 90 95 Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu 100 105 110 Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu 115 120 125 Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn 130 135 140 Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser 145 150 155 160 Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val 165 170 175 Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn 180 185 190 Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly 195 200 205 Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser 210 215 220 Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe 225 230 235 240 Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile 245 250 255 Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln 260 265 270 Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu 275 280 285 Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr 290 295 300 Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile 305 310 315 320 Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr 325 330 335 Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe 340 345 350 Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys 355 360 365 Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe 370 375 380 Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly 385 390 395 400 Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala 405 410 415 Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly 420 425 430 Arg Tyr Asp Val Phe Tyr Val 435 <210> 19 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Adaptor portion B of Fig 5 <400> 19 ggcgtctgct tgggtgttta accttttttt ttttt 35 <210> 20 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Adaptor portion D of Fig 5 <400> 20 ggttgtttct gttggtgctg atattgct 28 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Adaptor portion E of Fig 5 <400> 21 aacacccaag cagacgcctt 20 <210> 22 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Adaptor portion F of Fig 5 <400> 22 gcaatatcag caccaacaga aacaaccttt gaggcgagcg gtcaa 45 <210> 23 <211> 10178 <212> DNA <213> Artificial Sequence <220> <223> 10kb Lambda cDNA <400> 23 caaagtccat gccatcaaac tgctggtttt cattgatgat gcgggaccag ccatcaacgc 60 ccaccaccgg aacgatgcca ttctgcttat caggaaaggc gtaaatttct ttcgtccacg 120 gattaaggcc gtactggttg gcaacgatca gtaatgcgat gaactgcgca tcgctggcat 180 cacctttaaa tgccgtctgg cgaagagtgg tgatcagttc ctgtgggtcg acagaatcca 240 tgccgacacg ttcagccagc ttcccagcca gcgttgcgag tgcagtactc attcgtttta 300 tacctctgaa tcaatatcaa cctggtggtg agcaatggtt tcaaccatgt accggatgtg 360 ttctgccatg cgctcctgaa actcaacatc gtcatcaaac gcacgggtaa tggatttttt 420 gctggccccg tggcgttgca aatgatcgat gcatagcgat tcaaacaggt gctggggcag 480 gcctttttcc atgtcgtctg ccagttctgc ctctttctct tcacgggcga gctgctggta 540 gtgacgcgcc cagctctgag cctcaagacg atcctgaatg taataagcgt tcatggctga 600 actcctgaaa tagctgtgaa aatatcgccc gcgaaatgcc gggctgatta ggaaaacagg 660 aaagggggtt agtgaatgct tttgcttgat ctcagtttca gtattaatat ccatttttta 720 taagcgtcga cggcttcacg aaacatcttt tcatcgccaa taaaagtggc gatagtgaat 780 ttagtctgga tagccataag tgtttgatcc attctttggg actcctggct gattaagtat 840 gtcgataagg cgtttccatc cgtcacgtaa tttacgggtg attcgttcaa gtaaagattc 900 ggaagggcag ccagcaacag gccaccctgc aatggcatat tgcatggtgt gctccttatt 960 tatacataac gaaaaacgcc tcgagtgaag cgttattggt atgcggtaaa accgcactca 1020 ggcggccttg atagtcatat catctgaatc aaatattcct gatgtatcga tatcggtaat 1080 tcttattcct tcgctaccat ccattggagg ccatccttcc tgaccatttc catcattcca 1140 gtcgaactca cacacaacac catatgcatt taagtcgctt gaaattgcta taagcagagc 1200 atgttgcgcc agcatgatta atacagcatt taatacagag ccgtgtttat tgagtcggta 1260 ttcagagtct gaccagaaat tattaatctg gtgaagtttt tcctctgtca ttacgtcatg 1320 gtcgatttca atttctattg atgctttcca gtcgtaatca atgatgtatt ttttgatgtt 1380 tgacatctgt tcatatcctc acagataaaa aatcgccctc acactggagg gcaaagaaga 1440 tttccaataa tcagaacaag tcggctcctg tttagttacg agcgacattg ctccgtgtat 1500 tcactcgttg gaatgaatac acagtgcagt gtttattctg ttatttatgc caaaaataaa 1560 ggccactatc aggcagcttt gttgttctgt ttaccaagtt ctctggcaat cattgccgtc 1620 gttcgtattg cccatttatc gacatatttc ccatcttcca ttacaggaaa catttcttca 1680 ggcttaacca tgcattccga ttgcagcttg catccattgc atcgcttgaa ttgtccacac 1740 cattgatttt tatcaatagt cgtagtcata cggatagtcc tggtattgtt ccatcacatc 1800 ctgaggatgc tcttcgaact cttcaaattc ttcttccata tatcacctta aatagtggat 1860 tgcggtagta aagattgtgc ctgtctttta accacatcag gctcggtggt tctcgtgtac 1920 ccctacagcg agaaatcgga taaactatta caacccctac agtttgatga gtatagaaat 1980 ggatccactc gttattctcg gacgagtgtt cagtaatgaa cctctggaga gaaccatgta 2040 tatgatcgtt atctgggttg gacttctgct tttaagccca gataactggc ctgaatatgt 2100 taatgagaga atcggtattc ctcatgtgtg gcatgttttc gtctttgctc ttgcattttc 2160 gctagcaatt aatgtgcatc gattatcagc tattgccagc gccagatata agcgatttaa 2220 gctaagaaaa cgcattaaga tgcaaaacga taaagtgcga tcagtaattc aaaaccttac 2280 agaagagcaa tctatggttt tgtgcgcagc ccttaatgaa ggcaggaagt atgtggttac 2340 atcaaaacaa ttcccataca ttagtgagtt gattgagctt ggtgtgttga acaaaacttt 2400 ttcccgatgg aatggaaagc atatattatt ccctattgag gatatttact ggactgaatt 2460 agttgccagc tatgatccat ataatattga gataaagcca aggccaatat ctaagtaact 2520 agataagagg aatcgatttt cccttaattt tctggcgtcc actgcatgtt atgccgcgtt 2580 cgccaggctt gctgtaccat gtgcgctgat tcttgcgctc aatacgttgc aggttgcttt 2640 caatctgttt gtggtattca gccagcactg taaggtctat cggatttagt gcgctttcta 2700 ctcgtgattt cggtttgcga ttcagcgaga gaatagggcg gttaactggt tttgcgctta 2760 ccccaaccaa caggggattt gctgctttcc attgagcctg tttctctgcg cgacgttcgc 2820 ggcggcgtgt ttgtgcatcc atctggattc tcctgtcagt tagctttggt ggtgtgtggc 2880 agttgtagtc ctgaacgaaa accccccgcg attggcacat tggcagctaa tccggaatcg 2940 cacttacggc caatgcttcg tttcgtatca cacaccccaa agccttctgc tttgaatgct 3000 gcccttcttc agggcttaat ttttaagagc gtcaccttca tggtggtcag tgcgtcctgc 3060 tgatgtgctc agtatcaccg ccagtggtat ttatgtcaac accgccagag ataatttatc 3120 accgcagatg gttatctgta tgttttttat atgaatttat tttttgcagg ggggcattgt 3180 ttggtaggtg agagatctga attgctatgt ttagtgagtt gtatctattt atttttcaat 3240 aaatacaatt ggttatgtgt tttgggggcg atcgtgaggc aaagaaaacc cggcgctgag 3300 gccgggttat tcttgttctc tggtcaaatt atatagttgg aaaacaagga tgcatatatg 3360 aatgaacgat gcagaggcaa tgccgatggc gatagtgggt atcatgtagc cgcttatgct 3420 ggaaagaagc aataacccgc agaaaaacaa agctccaagc tcaacaaaac taagggcata 3480 gacaataact accgatgtca tatacccata ctctctaatc ttggccagtc ggcgcgttct 3540 gcttccgatt agaaacgtca aggcagcaat caggattgca atcatggttc ctgcatatga 3600 tgacaatgtc gccccaagac catctctatg agctgaaaaa gaaacaccag gaatgtagtg 3660 gcggaaaagg agatagcaaa tgcttacgat aacgtaagga attattacta tgtaaacacc 3720 aggcatgatt ctgttccgca taattactcc tgataattaa tccttaactt tgcccacctg 3780 ccttttaaaa cattccagta tatcactttt cattcttgcg tagcaatatg ccatctcttc 3840 agctatctca gcattggtga ccttgttcag aggcgctgag agatggcctt tttctgatag 3900 ataatgttct gttaaaatat ctccggcctc atcttttgcc cgcaggctaa tgtctgaaaa 3960 ttgaggtgac gggttaaaaa taatatcctt ggcaaccttt tttatatccc ttttaaattt 4020 tggcttaatg actatatcca atgagtcaaa aagctcccct tcaatatctg ttgcccctaa 4080 gacctttaat atatcgccaa atacaggtag cttggcttct accttcaccg ttgttcggcc 4140 gatgaaatgc atatgcataa catcgtcttt ggtggttccc ctcatcagtg gctctatctg 4200 aacgcgctct ccactgctta atgacattcc tttcccgatt aaaaaatctg tcagatcgga 4260 tgtggtcggc ccgaaaacag ttctggcaaa accaatggtg tcgccttcaa caaacaaaaa 4320 agatgggaat cccaatgatt cgtcatctgc gaggctgttc ttaatatctt caactgaagc 4380 tttagagcga tttatcttct gaaccagact cttgtcattt gttttggtaa agagaaaagt 4440 ttttccatcg attttatgaa tatacaaata attggagcca acctgcaggt gatgattatc 4500 agccagcaga gaattaagga aaacagacag gtttattgag cgcttatctt tccctttatt 4560 tttgctgcgg taagtcgcat aaaaaccatt cttcataatt caatccattt actatgttat 4620 gttctgaggg gagtgaaaat tcccctaatt cgatgaagat tcttgctcaa ttgttatcag 4680 ctatgcgccg accagaacac cttgccgatc agccaaacgt ctcttcaggc cactgactag 4740 cgataacttt ccccacaacg gaacaactct cattgcatgg gatcattggg tactgtgggt 4800 ttagtggttg taaaaacacc tgaccgctat ccctgatcag tttcttgaag gtaaactcat 4860 cacccccaag tctggctatg cagaaatcac ctggctcaac agcctgctca gggtcaacga 4920 gaattaacat tccgtcagga aagcttggct tggagcctgt tggtgcggtc atggaattac 4980 cttcaacctc aagccagaat gcagaatcac tggctttttt ggttgtgctt acccatctct 5040 ccgcatcacc tttggtaaag gttctaagct taggtgagaa catccctgcc tgaacatgag 5100 aaaaaacagg gtactcatac tcacttctaa gtgacggctg catactaacc gcttcataca 5160 tctcgtagat ttctctggcg attgaagggc taaattcttc aacgctaact ttgagaattt 5220 ttgtaagcaa tgcggcgtta taagcattta atgcattgat gccattaaat aaagcaccaa 5280 cgcctgactg ccccatcccc atcttgtctg cgacagattc ctgggataag ccaagttcat 5340 ttttcttttt ttcataaatt gctttaaggc gacgtgcgtc ctcaagctgc tcttgtgtta 5400 atggtttctt ttttgtgctc atacgttaaa tctatcaccg caagggataa atatctaaca 5460 ccgtgcgtgt tgactatttt acctctggcg gtgataatgg ttgcatgtac taaggaggtt 5520 gtatggaaca acgcataacc ctgaaagatt atgcaatgcg ctttgggcaa accaagacag 5580 ctaaagatct cggcgtatat caaagcgcga tcaacaaggc cattcatgca ggccgaaaga 5640 tttttttaac tataaacgct gatggaagcg tttatgcgga agaggtaaag cccttcccga 5700 gtaacaaaaa aacaacagca taaataaccc cgctcttaca cattccagcc ctgaaaaagg 5760 gcatcaaatt aaaccacacc tatggtgtat gcatttattt gcatacattc aatcaattgt 5820 tatctaagga aatacttaca tatggttcgt gcaaacaaac gcaacgaggc tctacgaatc 5880 gagagtgcgt tgcttaacaa aatcgcaatg cttggaactg agaagacagc ggaagctgtg 5940 ggcgttgata agtcgcagat cagcaggtgg aagagggact ggattccaaa gttctcaatg 6000 ctgcttgctg ttcttgaatg gggggtcgtt gacgacgaca tggctcgatt ggcgcgacaa 6060 gttgctgcga ttctcaccaa taaaaaacgc ccggcggcaa ccgagcgttc tgaacaaatc 6120 cagatggagt tctgaggtca ttactggatc tatcaacagg agtcattatg acaaatacag 6180 caaaaatact caacttcggc agaggtaact ttgccggaca ggagcgtaat gtggcagatc 6240 tcgatgatgg ttacgccaga ctatcaaata tgctgcttga ggcttattcg ggcgcagatc 6300 tgaccaagcg acagtttaaa gtgctgcttg ccattctgcg taaaacctat gggtggaata 6360 aaccaatgga cagaatcacc gattctcaac ttagcgagat tacaaagtta cctgtcaaac 6420 ggtgcaatga agccaagtta gaactcgtca gaatgaatat tatcaagcag caaggcggca 6480 tgtttggacc aaataaaaac atctcagaat ggtgcatccc tcaaaacgag ggaaaatccc 6540 ctaaaacgag ggataaaaca tccctcaaat tgggggattg ctatccctca aaacaggggg 6600 acacaaaaga cactattaca aaagaaaaaa gaaaagatta ttcgtcagag aattctggcg 6660 aatcctctga ccagccagaa aacgaccttt ctgtggtgaa accggatgct gcaattcaga 6720 gcggcagcaa gtgggggaca gcagaagacc tgaccgccgc agagtggatg tttgacatgg 6780 tgaagactat cgcaccatca gccagaaaac cgaattttgc tgggtgggct aacgatatcc 6840 gcctgatgcg tgaacgtgac ggacgtaacc accgcgacat gtgtgtgctg ttccgctggg 6900 catgccagga caacttctgg tccggtaacg tgctgagccc ggccaaactc cgcgataagt 6960 ggacccaact cgaaatcaac cgtaacaagc aacaggcagg cgtgacagcc agcaaaccaa 7020 aactcgacct gacaaacaca gactggattt acggggtgga tctatgaaaa acatcgccgc 7080 acagatggtt aactttgacc gtgagcagat gcgtcggatc gccaacaaca tgccggaaca 7140 gtacgacgaa aagccgcagg tacagcaggt agcgcagatc atcaacggtg tgttcagcca 7200 gttactggca actttcccgg cgagcctggc taaccgtgac cagaacgaag tgaacgaaat 7260 ccgtcgccag tgggttctgg cttttcggga aaacgggatc accacgatgg aacaggttaa 7320 cgcaggaatg cgcgtagccc gtcggcagaa tcgaccattt ctgccatcac ccgggcagtt 7380 tgttgcatgg tgccgggaag aagcatccgt taccgccgga ctgccaaacg tcagcgagct 7440 ggttgatatg gtttacgagt attgccggaa gcgaggcctg tatccggatg cggagtctta 7500 tccgtggaaa tcaaacgcgc actactggct ggttaccaac ctgtatcaga acatgcgggc 7560 caatgcgctt actgatgcgg aattacgccg taaggccgca gatgagcttg tccatatgac 7620 tgcgagaatt aaccgtggtg aggcgatccc tgaaccagta aaacaacttc ctgtcatggg 7680 cggtagacct ctaaatcgtg cacaggctct ggcgaagatc gcagaaatca aagctaagtt 7740 cggactgaaa ggagcaagtg tatgacgggc aaagaggcaa ttattcatta cctggggacg 7800 cataatagct tctgtgcgcc ggacgttgcc gcgctaacag gcgcaacagt aaccagcata 7860 aatcaggccg cggctaaaat ggcacgggca ggtcttctgg ttatcgaagg taaggtctgg 7920 cgaacggtgt attaccggtt tgctaccagg gaagaacggg aaggaaagat gagcacgaac 7980 ctggttttta aggagtgtcg ccagagtgcc gcgatgaaac gggtattggc ggtatatgga 8040 gttaaaagat gaccatctac attactgagc taataacagg cctgctggta atcgcaggcc 8100 tttttatttg ggggagaggg aagtcatgaa aaaactaacc tttgaaattc gatctccagc 8160 acatcagcaa aacgctattc acgcagtaca gcaaatcctt ccagacccaa ccaaaccaat 8220 cgtagtaacc attcaggaac gcaaccgcag cttagaccaa aacaggaagc tatgggcctg 8280 cttaggtgac gtctctcgtc aggttgaatg gcatggtcgc tggctggatg cagaaagctg 8340 gaagtgtgtg tttaccgcag cattaaagca gcaggatgtt gttcctaacc ttgccgggaa 8400 tggctttgtg gtaataggcc agtcaaccag caggatgcgt gtaggcgaat ttgcggagct 8460 attagagctt atacaggcat tcggtacaga gcgtggcgtt aagtggtcag acgaagcgag 8520 actggctctg gagtggaaag cgagatgggg agacagggct gcatgataaa tgtcgttagt 8580 ttctccggtg gcaggacgtc agcatatttg ctctggctaa tggagcaaaa gcgacgggca 8640 ggtaaagacg tgcattacgt tttcatggat acaggttgtg aacatccaat gacatatcgg 8700 tttgtcaggg aagttgtgaa gttctgggat ataccgctca ccgtattgca ggttgatatc 8760 aacccggagc ttggacagcc aaatggttat acggtatggg aaccaaagga tattcagacg 8820 cgaatgcctg ttctgaagcc atttatcgat atggtaaaga aatatggcac tccatacgtc 8880 ggcggcgcgt tctgcactga cagattaaaa ctcgttccct tcaccaaata ctgtgatgac 8940 catttcgggc gagggaatta caccacgtgg attggcatca gagctgatga accgaagcgg 9000 ctaaagccaa agcctggaat cagatatctt gctgaactgt cagactttga gaaggaagat 9060 atcctcgcat ggtggaagca acaaccattc gatttgcaaa taccggaaca tctcggtaac 9120 tgcatattct gcattaaaaa atcaacgcaa aaaatcggac ttgcctgcaa agatgaggag 9180 ggattgcagc gtgtttttaa tgaggtcatc acgggatccc atgtgcgtga cggacatcgg 9240 gaaacgccaa aggagattat gtaccgagga agaatgtcgc tggacggtat cgcgaaaatg 9300 tattcagaaa atgattatca agccctgtat caggacatgg tacgagctaa aagattcgat 9360 accggctctt gttctgagtc atgcgaaata tttggagggc agcttgattt cgacttcggg 9420 agggaagctg catgatgcga tgttatcggt gcggtgaatg caaagaagat aaccgcttcc 9480 gaccaaatca accttactgg aatcgatggt gtctccggtg tgaaagaaca ccaacagggg 9540 tgttaccact accgcaggaa aaggaggacg tgtggcgaga cagcgacgaa gtatcaccga 9600 cataatctgc gaaaactgca aataccttcc aacgaaacgc accagaaata aacccaagcc 9660 aatcccaaaa gaatctgacg taaaaacctt caactacacg gctcacctgt gggatatccg 9720 gtggctaaga cgtcgtgcga ggaaaacaag gtgattgacc aaaatcgaag ttacgaacaa 9780 gaaagcgtcg agcgagcttt aacgtgcgct aactgcggtc agaagctgca tgtgctggaa 9840 gttcacgtgt gtgagcactg ctgcgcagaa ctgatgagcg atccgaatag ctcgatgcac 9900 gaggaagaag atgatggcta aaccagcgcg aagacgatgt aaaaacgatg aatgccggga 9960 atggtttcac cctgcattcg ctaatcagtg gtggtgctct ccagagtgtg gaaccaagat 10020 agcactcgaa cgacgaagta aagaacgcga aaaagcggaa aaagcagcag agaagaaacg 10080 acgacgagag gagcagaaac agaaagataa acttaagatt cgaaaactcg ccttaaagcc 10140 ccgcagttac tggattaaac aagcccaaca agccagga 10178 <210> 24 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Adaptor portion G of Fig 5 <400> 24 ttgaccgctc gcctc 15

Claims

서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체는 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93¸ V95, Y96, S98, K99, V100, I101, P108, P109, T110, S111, K112 및 T114 중 하나 이상에서 변형을 포함하는, 돌연변이체 라이세닌 모노머.
청구항 1에 있어서, 상기 변이체가 하기 위치 T91, V95, Y96, S98, K99, V100, I101 및 K112 중 하나 이상에서의 변형을 포함하는, 돌연변이체 라이세닌 모노머.
청구항 2에 있어서, 상기 변형은 세린(S) 또는 글루타민(Q)에 의한 치환인, 돌연변이체 라이세닌 모노머.
청구항 2 또는 3에 있어서, 상기 변이체가 하기 치환 T91S, V95S, Y96S, S98Q, K99S, V100S, I101S 및 K112S 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머.
청구항 1에 있어서, 상기 변이체가 하기 위치 K37, G43, K45, V47, S49, T51, H83, V88, T91, T93, Y96, S98, K99, P108, P109, T110, S111 및 T114 중 하나 이상에서의 변형을 포함하는, 돌연변이체 라이세닌 모노머.
청구항 5에 있어서, 상기 변형이 아스파라긴(N), 트립토판(W), 세린(S), 글루타민(Q), 라이신(K), 아스파르트산(D), 아르기닌(R), 트레오닌(T), 티로신(Y), 류신(L) 또는 이소류신(I)에 의한 치환인, 돌연변이체 라이세닌 모노머.
청구항 5 또는 6에 있어서, 상기 변이체가 하기 치환 K37N/W/S/Q, G43K, K45D/R/N/Q/T/Y, V47K/S/N, S49K/L, T51K, H83S/K, V88I/T, T91K, T93K, Y96D, S98K, K99Q/L, P108K/R, P109K, T110K/R, S111K 및 T114K 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머.
청구항 5 내지 7 중 어느 한 항에 있어서, 상기 변이체가 하기 위치의 조합 중 하나 이상에서의 변형을 포함하는, 돌연변이체 라이세닌 모노머:
E94/P108;
E94/P109;
E94/T110;
E94/P108;
E94D/T110R;
E94D/S111K;
E94D/T114K;
H83S/E94Q;
E94/K99/T106;
E94/T93/T106;
E94/T91/T106;
H83/E94/T106;
E94/Y96/T106;
K45/E94/T106;
K45/E94/T106;
E94/S98/K99/T106;
K37/E94/T106;
K37/E94/T106;
K37/E94/T106;
K45/E94/T106;
K37/E94/E102/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;
K45/E94/T106;
K45/V47/E94/T106;
V47/E94/T106;
T51/E94/T106;
K45/S49/E94/T106;
S49/E94/T106;
K45/T106;
V47/E94/T106;
G43/E94/T106;
V88/M90/E94/T106;
V47/V88/E94/T106;
K45/S49/E94/E92/T106;
K45/V47/E92/E94/T106; 및
E94/K99/T106.
청구항 8에 있어서, 상기 변이체가 하기 치환의 조합 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
E94D/P108K;
E94D/P109K;
E94D/T110K;
E94D/P108R;
E94D/T110R;
E94D/S111K;
E94D/T114K;
H83S/E94Q;
E94D/K99Q/T106K;
E94D/T93K/T106K;
E94D/T91K/T106K;
H83K/E94D/T106K;
E94Q/Y96D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
E94D/S98K/K99L/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
K45N/E94N/T106K;
K37Q/E94D/E102N/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K45Q/E94Q/T106K;
K45T/V47K/E94D/T106K;
V47S/E94D/T106K;
T51K/E94D/T106K;
K45Y/S49K/E94D/T106K;
S49L/E94D/T106K;
K45R/T106K;
V47K/E94D/T106K;
G43K/E94D/T106K;
V88I/M90A/E94D/T106K;
V47N/V88T/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45N/V47K/E92D/E94N/T106K; 및
E94D/K99Q/T106K.
서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체가 하기 치환 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K/Q;
S89K;
M90K/I/A;
E92D/S;
E94D/Q/G/A/K/R/S/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S.
청구항 10에 있어서, 상기 변이체가 치환 E94D/Q/G/A/K/R/S, S86Q 및 E92S 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머.
청구항 10에 있어서, 상기 변이체가 하기 치환 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
D35N/S;
S74K/R;
E76D/N;
S78R/K/N/Q;
S80K/R/N/Q;
S82K/R/N/Q;
E84R/K/N/A;
E85N;
S86K;
S89K;
M90K/I/A;
E92D;
E94D/Q/K/N;
E102N/Q/D/S;
T104R/K/Q;
T106R/K/Q;
R115S;
Q117S; 및
N119S.
청구항 12에 있어서, 상기 변이체가 하기 치환의 조합 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
E94D/E102N;
E94D/E102Q;
E94D/S80K;
S82K/E94D;
E94D/T106R;
E94D/T106K;
E94D/T104R;
E94D/T104K;
S78R/E94D;
S78K/E94D;
S80R/E94D;
S82R/E94D;
E76D/E94D;
E76N/E94D;
E94D/E102D;
E84R/E94D;
E84K/E94D;
E84N/E94D;
S78N/E94D;
S80N/E94D;
S82N/E94D;
E94D/P108K;
E94D/P109K;
S74K/E94D;
E94D/T110K;
S74R/E94D;
E94D/P108R;
E94D/T110R;
S86K/E94D;
S89K/E94D;
E94D/S111K;
E94D/T114K;
E76N/E94Q;
S78Q/E94Q;
S80Q/E94Q;
S82Q/E94Q;
H83S/E94Q;
E84A/E94Q;
E84K/E94Q;
E94Q/T104Q;
E94Q/T106Q;
E94Q/R115S;
E94Q/Q117S;
E94Q/N119S;
E94Q/D121S;
E76S/E94Q;
E94D/K99Q/T106K;
E94D/T93K/T106K;
E94D/T91K/T106K;
E94D/M90K/T106K;
E85N/E94D/T106K;
H83K/E94D/T106K;
E94Q/Y96D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
E94D/S98K/K99L/T106K;
D35N/E94D/T106K;
D35S/E94D/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
K45N/E94N/T106K;
E92D/E94Q/T106K;
K37Q/E94D/E102N/T106K;
E94Q/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K45Q/E94Q/T106K;
M90I/E94D/T106K;
K45T/V47K/E94D/T106K;
V47S/E94D/T106K;
T51K/E94D/T106K;
K45Y/S49K/E94D/T106K;
S49L/E94D/T106K;
K45R/T106K;
V47K/E94D/T106K;
G43K/E94D/T106K;
V88I/M90A/E94D/T106K;
V47N/V88T/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45N/V47K/E92D/E94N/T106K;
E94D/K99Q/T106K;
S82K/E94D/T106K; 및
Y79S/E94Q.
서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체가 하기 위치의 조합 중 하나 이상에서의 돌연변이를 포함하는, 돌연변이체 라이세닌 모노머:
D35/E94/T106;
K37/E94/E102/T106;
K37/E94/T104/T106;
K37/E94/T106;
K37/E94/E102/T106;
G43/E94/T106;
K45/V47/E92/E94/T106;
K45/V47/E94/T106;
K45/S49/E92/E94/T106;
K45/S49/E94/T106;
K45/E94/T106;
K45/T106;
V47/E94/T106;
V47/V88/E94/T106;
S49/E94/T106;
T51/E94D/T106;
S74/E94;
E76/E94;
S78/E94;
Y79/E94;
S80/E94;
S82/E94;
S82/E94/T106;
H83/E94;
H83/E94/T106;
E85/E94/T106;
S86/E94;
V88/M90/E94/T106;
S89/E94;
M90/E94/T106;
T91/E94/T106;
E92/E94/T106;
T93/E94/T106;
E94/Y96/T106;
E94/S98/K99/T106;
E94/K99/T106;
E94/E102;
E94/T104;
E94/T106;
E94/P108;
E94/P109;
E94/T110;
E94/S111;
E94/T114;
E94/R115;
E94/Q117; 및
E94/E119.
청구항 14에 있어서, 상기 변이체가 하기 치환의 조합 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
D35N/E94D/T106K;
D35S/E94D/T106K;
K37Q/E94D/E102N/T106K;
K37S/E94D/E102S/T106K;
K37S/E94D/T104K/T106K;
K37N/E94D/T106K;
K37W/E94D/T106K;
K37S/E94D/T106K;
G43K/E94D/T106K;
K45N/V47K/E92D/E94N/T106K;
K45T/V47K/E94D/T106K;
K45N/S49K/E94N/E92D/T106K;
K45Y/S49K/E94D/T106K;
K45D/E94K/T106K;
K45R/E94D/T106K;
K45N/E94N/T106K;
K45Q/E94Q/T106K;
K45R/T106K;
V47S/E94D/T106K;
V47K/E94D/T106K;
V47N/V88T/E94D/T106K;
S49L/E94D/T106K;
T51K/E94D/T106K;
S74K/E94D;
S74R/E94D;
E76D/E94D;
E76N/E94D;
E76S/E94Q;
E76N/E94Q;
S78R/E94D;
S78K/E94D;
S78N/E94D;
S78Q/E94Q;
Y79S/E94Q;
S80K/E94D;
S80R/E94D;
S80N/E94D;
S80Q/E94Q;
S82K/E94D;
S82R/E94D;
S82N/E94D;
S82Q/E94Q;
S82K/E94D/T106K;
H83S/E94Q;
H83K/E94D/T106K;
E85N/E94D/T106K;
S86K/E94D;
V88I/M90A/E94D/T106K;
S89K/E94D;
M90K/E94D/T106K;
M90I/E94D/T106K;
T91K/E94D/T106K;
E92D/E94Q/T106K;
T93K/E94D /T106K;
E94Q/Y96D/T106K;
E94D/S98K/K99L/T106K;
E94D/K99Q/T106K;
E94D/E102N;
E94D/E102Q;
E94D/E102D;
E94D/T104R;
E94D/T104K;
E94Q/T104Q;
E94D/T106R;
E94D/T106K;
E94Q/T106Q;
E94Q/T106K;
E94D/P108K;
E94D/P108R;
E94D/P109K;
E94D/T110K;
E94D/T110R;
E94D/S111K;
E94D/T114K;
E94Q/R115S;
E94Q/Q117S; 및
E94Q/N119S.
서열번호: 2에 나타낸 아미노산 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체가 하기 치환 쌍 중 하나 이상을 포함하는, 돌연변이체 라이세닌 모노머:
E84R/E94D;
E84K/E94D;
E84N/E94D;
E84A/E94Q;
E84K/E94Q 및
E94Q/D121S.
청구항 1 내지 16 중 어느 한 항에 있어서, 상기 모노머가 청구항 1 내지 16 중 어느 한 항에 정의된 변형 및/또는 치환의 임의의 수 및 임의의 조합을 포함하는, 돌연변이체 라이세닌 모노머.
서열번호: 2에 나타낸 서열의 변이체를 포함하는 돌연변이체 라이세닌 모노머로서, 상기 변이체에서 (a) 서열번호: 2의 34 내지 70번 위치에서의 아미노산에 대응하는 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실되었고, (b) 서열번호: 2의 71 내지 107번 위치에서의 아미노산에 대응하는 2, 4, 6, 8, 10, 12, 14, 16, 18 또는 20개의 아미노산이 결실된, 돌연변이체 라이세닌 모노머.
청구항 18에 있어서, 동일한 수의 아미노산이 (a) 및 (b)에서 결실된, 돌연변이체 라이세닌 모노머.
청구항 18 또는 19에 있어서, 결실된 아미노산의 위치는 표 1 또는 2의 행 또는 표 1 및/또는 2의 둘 이상의 행에 표시되는, 돌연변이체 라이세닌 모노머.
청구항 18 내지 20 중 어느 한 항에 있어서, 서열번호: 2의 하기 아미노산에 대응하는 아미노산이 결실되는, 돌연변이체 라이세닌 모노머:
(i) N46/V47/T91/T92; 또는
(ii) N48/S49/T91/T92.
청구항 18 내지 21 중 어느 한 항에 있어서, 상기 변이체는 적당한 경우, 청구항 1 내지 17 중 어느 한 항에 정의된 임의의 변형 및/또는 치환을 추가로 포함하는, 돌연변이체 라이세닌 모노머.
청구항 1 내지 22 중 어느 한 항에 있어서, 상기 변이체는
- 서열번호: 2의 하기 위치 (a) E84, E85, E92, E97 및 D126; (b) E85, E97 및 D126 또는 (c) E84 및 E92 중 하나 이상에서의 치환; 또는
- E84Q/E85K/E92Q/E97S/D126G 중 하나 이상 또는, 적합한 경우 E84Q/E85K/E92Q/E97S/D126G 모두에서의 치환
을 추가로 포함하는, 돌연변이체 라이세닌 모노머.
청구항 23에 있어서, 상기 변이체는 하기 치환의 조합들 중 하나를 포함하는, 돌연변이체 라이세닌 모노머:
- E84Q/E85K/E92Q/E94D/E97S/D126G;
- E84Q/E85K/E92Q/E94Q/E97S/D126G; 또는
- E84Q/E85K/E92Q/E94D/E97S/T106K/D126G.
청구항 1 내지 24 중 어느 한 항에 있어서, 포어를 형성할 수 있는, 돌연변이체 라이세닌 모노머.
청구항 1에 있어서, 상기 변이체는 서열번호: 2에 나타낸 서열과 적어도 70% 동일한 아미노산 서열을 포함하는, 돌연변이체 라이세닌 모노머.
라이세닌으로부터 유래된 2개 이상의 공유결합된 모노머들을 포함하는 작제물로서, 모노머 중 적어도 하나가 청구항 1 내지 26 중 어느 한 항에 정의된 돌연변이체 라이세닌 모노머인, 작제물.
청구항 27에 있어서, 2개 이상의 모노머가 동일하거나 상이한, 작제물.
청구항 27 또는 28에 있어서, 2개 이상의 모노머가 유전적으로 융합된, 작제물.
청구항 1 내지 26 중 어느 한 항에 따른 돌연변이체 라이세닌 모노머 또는 청구항 27에 따른 작제물을 암호화하는 폴리뉴클레오타이드.
청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 라이세닌 모노머 및/또는 청구항 27 내지 29 중 어느 한 항에 따른 적어도 하나의 작제물을 포함하는 포어.
청구항 31에 있어서, 청구항 1 내지 26 중 어느 한 항에 따른 6 내지 12개의 돌연변이체 라이세닌 모노머를 포함하는 호모-올리고머성 포어인, 포어.
청구항 31에 있어서, 청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 라이세닌 모노머를 포함하는 헤테로-올리고머성 포어인, 포어.
표적 피분석물의 특성규명(characterising) 방법으로서,
(a) 표적 피분석물이 포어를 통해 이동하도록 상기 표적 피분석물을 청구항 31 내지 33 중 어느 한 항의 포어와 접촉시키는 단계; 및
(b) 상기 포어에 대해 상기 피분석물이 이동할 때 하나 이상의 측정값을 취함으로써 상기 표적 피분석물을 특성규명하는 단계로서, 상기 측정값은 상기 표적 피분석물의 하나 이상의 특징을 나타내는, 상기 표적 피분석물을 특성규명하는 단계를 포함하는, 방법.
청구항 34에 있어서,
(i) 포어가 2개의 구획으로 챔버를 분리시키는 막 내에 존재하고, 각각의 구획은 수용액을 함유하며;
(ii) 단계 (a)는 1개의 구획 내에 상기 피분석물을 제공하는 단계를 포함하며;
(iii) 단계 (b)는 상기 막을 가로지르는 전위차를 인가하는 단계를 포함하며; 그리고/또는
(iv) 단계 (c)는 상기 막을 가로질러 전류 흐름을 측정하는 단계를 포함하는, 방법.
청구항 34 또는 35에 있어서, 상기 표적 피분석물이 금속 이온, 무기 염, 폴리머, 아미노산, 펩타이드, 폴리펩타이드, 단백질, 뉴클레오타이드, 올리고뉴클레오타이드, 폴리뉴클레오타이드, 염료, 표백제, 약제, 진단제, 기분전환 약제(recreational drug), 폭발물 또는 환경오염 물질인, 방법.
청구항 36에 있어서, 상기 표적 피분석물이 표적 폴리뉴클레오타이드인, 방법.
청구항 37에 있어서, 상기 단계 (a)는 상기 표적 폴리뉴클레오타이드를 상기 포어 및 폴리뉴클레오타이드 결합 단백질과 접촉시키는 단계를 포함하며, 상기 단백질이 상기 포어를 통한 상기 표적 폴리뉴클레오타이드의 이동을 제어하는, 방법.
청구항 37 또는 38에 있어서, 상기 표적 폴리뉴클레오타이드를 특성규명하는 단계는 상기 표적 폴리뉴클레오타이드의 서열을 확립시키거나, 상기 표적 폴리뉴클레오타이드를 서열분석하는 단계를 포함하는, 방법.
표적 폴리뉴클레오타이드를 특성규명하기 위한 센서를 형성하는 방법으로서,
청구항 31 내지 33 중 어느 한 항에 따른 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 형성하는 단계 및 그렇게 함으로써 상기 표적 폴리뉴클레오타이드를 특성규명하기 위한 센서를 형성하는 단계를 포함하는, 방법.
청구항 40에 있어서, 상기 복합체는 (a) 상기 표적 폴리뉴클레오타이드의 존재하에 상기 포어와 상기 폴리뉴클레오타이드 결합 단백질을 접촉시키고, (a) 상기 포어를 가로지르는 전위를 인가함으로써 형성되는, 방법.
청구항 41에 있어서, 상기 전위는 전압 전위 또는 화학 전위인, 방법.
청구항 40에 있어서, 상기 복합체는 상기 폴리뉴클레오타이드 결합 단백질에 상기 포어를 공유결합시킴으로써 형성되는, 방법.
표적 폴리뉴클레오타이드를 특성규명하기 위한 센서로서,
청구항 31 내지 33 중 어느 한 항에 따른 포어와 폴리뉴클레오타이드 결합 단백질 사이에 복합체를 포함하는, 센서.
표적 피분석물을 특성규명하기 위한, 청구항 31 내지 33 중 어느 한 항에 따른 포어의 용도.
표적 폴리뉴클레오타이드를 특성규명하기 위한 키트로서,
(a) 청구항 31 내지 33 중 어느 한 항에 따른 포어 및 (b) 막을 포함하는, 키트.
청구항 46에 있어서, 상기 키트는 양친매성 층을 포함하는 칩을 추가로 포함하는, 키트.
샘플 내 표적 폴리뉴클레오타이드를 특성규명하기 위한 장치로서,
(a) 청구항 31 내지 33 중 어느 한 항에 따른 복수의 포어, 및 (b) 복수의 폴리뉴클레오타이드 결합 단백질을 포함하는, 샘플 내 표적 폴리뉴클레오타이드를 특성규명하기 위한 장치.
폴리뉴클레오타이드를 특성규명하기 위해 서열번호: 2에 나타낸 서열을 포함하는 라이세닌 모노머의 능력을 개선하는 방법으로서,
청구항 1 내지 26 중 어느 한 항에 정의된 변형 및/또는 치환 중 하나 이상을 형성하는 단계를 포함하는, 방법.
청구항 27 내지 30 중 어느 한 항에 따른 작제물의 제조 방법으로서,
라이세닌으로부터 유래된 하나 이상의 모노머에 청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 라이세닌 모노머를 공유결합시키는 단계를 포함하는, 방법.
청구항 31 내지 33 중 어느 한 항에 따른 포어의 형성 방법으로서,
청구항 1 내지 26 중 어느 한 항에 따른 적어도 하나의 돌연변이체 모노머 또는 청구항 27 내지 30 중 어느 한 항에 따른 적어도 하나의 작제물을 충분한 수의 청구항 1 내지 26 중 어느 한 항에 따른 모노머, 청구항 27 내지 30 중 어느 한 항에 따른 작제물 및/또는 라이세닌으로부터 유래된 모노머로 올리고머화시켜, 포어를 형성하는 단계를 포함하는, 방법.