KR102086182B1 - 효소 방법 - Google Patents
효소 방법 Download PDFInfo
- Publication number
- KR102086182B1 KR102086182B1 KR1020147020837A KR20147020837A KR102086182B1 KR 102086182 B1 KR102086182 B1 KR 102086182B1 KR 1020147020837 A KR1020147020837 A KR 1020147020837A KR 20147020837 A KR20147020837 A KR 20147020837A KR 102086182 B1 KR102086182 B1 KR 102086182B1
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- gly
- arg
- val
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/04—Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; involved in cellular and subcellular movement (3.6.4)
- C12Y306/04012—DNA helicase (3.6.4.12)
Abstract
본 발명은 표적 폴리뉴클레오티드를 특성화하는 신규 방법에 관한 것이다. 방법은 기공 및 RecD 헬리카제를 사용한다. 헬리카제는 기공을 통한 표적 폴리뉴클레오티드의 이동을 제어한다.
Description
본 발명은 표적 폴리뉴클레오티드를 특성화하는 신규 방법에 관한 것이다. 이러한 방법은 기공 및 RecD 헬리카제를 사용한다. 헬리카제는 기공을 통한 표적 폴리뉴클레오티드의 이동을 제어한다.
현재, 광범위한 용도에 걸쳐 신속하고 저렴한 폴리뉴클레오티드 (예를 들어, DNA 또는 RNA) 서열분석 및 확인 기술에 대한 필요성이 존재한다. 기존의 기술은 느리고 고가인데, 이는 주로 이들이 대량의 폴리뉴클레오티드를 생산하기 위한 증폭 기술에 의존하고, 신호 검출을 위해 다량의 전문 형광 화학물질을 필요로 하기 때문이다.
막횡단 기공 (나노기공)은 중합체 및 다양한 소분자에 대한 직접적인 전기 바이오센서로서 큰 잠재력을 갖는다. 특히, 최근에는 잠재적인 DNA 서열분석 기술로서의 나노기공에 초점이 맞춰져 왔다.
나노기공을 가로지르는 전위가 인가되면, 분석물, 예컨대 뉴클레오티드가 특정 기간 동안 일시적으로 배럴 내에 체류할 때 전류 흐름에 변화가 발생한다. 뉴클레오티드의 나노기공 검출은 공지된 서명 및 지속기간의 전류 변화를 제공한다. "가닥 서열분석" 방법에서는, 단일 폴리뉴클레오티드 가닥이 기공을 통과하고, 뉴클레오티드의 정체가 유도된다. 가닥 서열분석은 기공을 통한 폴리뉴클레오티드의 이동을 제어하는 뉴클레오티드 취급 단백질의 사용을 포함할 수 있다.
발명의 개요
본 발명자들은 RecD 헬리카제가, 특히 전위, 예컨대 전압이 인가되는 경우에, 기공을 통한 폴리뉴클레오티드의 이동을 제어할 수 있다는 것을 입증하였다. 헬리카제는 인가된 전압으로부터 생성되는 전계에 대항하여 또는 이와 함께 표적 폴리뉴클레오티드를 제어된 단계적 방식으로 이동시킬 수 있다. 놀랍게도, 헬리카제는 폴리뉴클레오티드를 특성화하는데, 특히 가닥 서열분석을 사용하여 그의 서열을 결정하는데 유리한 높은 염 농도에서 기능할 수 있다. 이것은 하기에서 보다 상세하게 논의한다.
따라서, 본 발명은
(a) 표적 폴리뉴클레오티드를 막횡단 기공 및 RecD 헬리카제와 접촉시켜, 표적 폴리뉴클레오티드가 기공을 통해 이동하고 RecD 헬리카제가 기공을 통한 표적 뉴클레오티드의 이동을 제어하도록 하는 단계; 및
(b) 폴리뉴클레오티드가 기공에 대해 이동할 때, 표적 뉴클레오티드의 하나 이상의 특징을 나타내는 하나 이상의 측정을 수행함으로써 표적 폴리뉴클레오티드를 특성화하는 단계
를 포함하는, 표적 폴리뉴클레오티드를 특성화하는 방법을 제공한다.
본 발명은 또한
- 기공과 RecD 헬리카제 사이에 복합체를 형성함으로써 표적 폴리뉴클레오티드를 특성화하기 위한 센서를 형성하는 것을 포함하는, 표적 폴리뉴클레오티드를 특성화하기 위한 센서를 형성하는 방법;
- 기공을 통한 표적 폴리뉴클레오티드의 이동을 제어하기 위한 RecD 헬리카제의 용도;
- (a) 기공 및 (b) RecD 헬리카제를 포함하는, 표적 폴리뉴클레오티드를 특성화하기 위한 키트; 및
- 다수의 기공 및 다수의 RecD 헬리카제를 포함하는, 샘플 내의 표적 폴리뉴클레오티드를 특성화하기 위한 분석 장치;
- (a) 표적 폴리뉴클레오티드를 RecD 헬리카제와 접촉시켜, RecD 헬리카제가 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 단계; 및
(b) RecD 헬리카제가 폴리뉴클레오티드의 이동을 제어할 때, 표적 뉴클레오티드의 하나 이상의 특징을 나타내는 하나 이상의 측정을 수행함으로써 표적 폴리뉴클레오티드를 특성화하는 단계
를 포함하는, 표적 폴리뉴클레오티드를 특성화하는 방법;
- 폴리뉴클레오티드의 특성화 동안 표적 폴리뉴클레오티드의 이동을 제어하기 위한 RecD 헬리카제의 용도;
- 폴리뉴클레오티드의 일부 또는 전부의 서열분석 동안 표적 폴리뉴클레오티드의 이동을 제어하기 위한 RecD 헬리카제의 용도;
- RecD 헬리카제를 포함하는 것을 특징으로 하는, 샘플 내의 표적 폴리뉴클레오티드를 특성화하기 위한 분석 장치; 및
- (a) 표적 폴리뉴클레오티드를 특성화하기 위한 분석 장치 및 (b) RecD 헬리카제를 포함하는, 표적 폴리뉴클레오티드를 특성화하기 위한 키트를 제공한다.
도 1. a) 나노기공을 통한 DNA 이동을 제어하기 위한 헬리카제 용도의 예시적인 개략도. 콜레스테롤-태그를 함유하는 프라이머가 어닐링되어 있는 ssDNA 기질을 이중층의 시스 측에 부가한다. 콜레스테롤 태그는 이중층에 결합하여, 이중층 표면에서 기질을 풍부화시킨다. 시스 구획에 부가된 헬리카제는 DNA에 결합한다. 2가 금속 이온 및 NTP 기질의 존재 하에, 헬리카제는 DNA를 따라 이동한다. 인가된 전압 하에, DNA 기질은 나노기공에 의해 포획된다. DNA에 결합된 헬리카제가 기공의 상부와 접촉할 때까지, 인가된 전위의 힘 하에 DNA가 기공을 통해 잡아당겨짐으로써 추가의 제어되지 않은 DNA 전위를 방지한다. 이후, 헬리카제는 제어된 방식으로 나노기공을 통한 DNA의 이동을 진행시킨다.
개략도는 DNA를 나노기공에 도입하는 2가지 가능한 방법을 보여준다: 한 방식 (상부 섹션)에서는 헬리카제는 포획된 DNA를 인가된 전계의 방향으로 나노기공 내로 이동시키고, 다른 방식 (하부 섹션)에서는 헬리카제가 포획된 DNA를 인가된 전계의 방향에 대항하여 나노기공 외부로 잡아당긴다. 인가된 전계와 함께 이동하는 경우, DNA는 막의 트랜스 측으로 이동한다. 상부 및 하부 섹션 둘 다에서 트랜스 측 상의 화살표는 DNA의 운동 방향을 나타내고 시스 측 상의 화살표는 DNA에 대한 헬리카제의 운동 방향을 나타낸다. 전계에 대항하여 이동하는 경우, DNA는 막의 시스 측으로 다시 이동하고, 헬리카제가 해리되지 않으면 DNA는 완전히 시스 측으로 전위될 수 있다. 기질 설계, 예컨대 적합한 리더의 사용을 통해, 하나의 방법 또는 둘 다의 방법을 동시에 사용할 수 있다. 헬리카제의 RecD 패밀리는 DNA를 따라 5'-3' 방향으로 이동한다. 따라서, 전계와 함께 DNA를 이동시키는 것은 DNA의 5' 하류 포획을 필요로 하고, 전계에 대항하여 DNA를 이동시키는 것은 3' 하류 DNA 포획을 필요로 한다. b) 실시예에 사용된 DNA 기질 설계.
도 2. 헬리카제는 제어된 방식으로 나노기공을 통해 DNA를 이동시킴으로써, DNA가 나노기공 (MspA-(B2)8)을 통해 이동할 때 전류에서의 단계적 변화를 생성시킬 수 있다. 헬리카제-DNA 사건 예 (140 mV, 400 mM NaCl, 10 mM Hepes, pH 8.0, 0.60 nM 400량체 DNA (서열 172, 173 및 174), 100 nM Tra1 Eco (서열 61), 1 mM DTT, 1 mM ATP, 1 mM MgCl2). 상부) Tra1 400량체 DNA 사건의 전류 대 시간 획득의 섹션. 개방-기공 전류는 ~100 pA이다. DNA는 인가된 전위 (+140 mV)의 힘 하에 나노기공에 의해 포획된다. 효소가 부착된 DNA는 긴 차단을 생성하고 (상기 조건 하에 ~25 pA에서), 이는 효소가 기공을 통해 DNA를 이동시킬 때의 전류에서의 단계적 변화를 나타낸다. 중간부) DNA-효소 포획 및 DNA를 기공을 통해 잡아당길 때의 전류에서의 단계적 변화를 나타내는, 헬리카제-제어된 DNA 사건 중 하나의 확대. 하부) DNA가 나노기공을 통해 이동할 때의 전류에서의 단계적 변화의 추가 확대.
도 3. MspA-B2(8) 나노기공을 통한 TraI Eco (서열 61) 헬리카제 제어된 400량체 DNA (400량체 DNA 서열 172, 173 및 174) 이동 사건의 추가 예. 하부) 가닥이 나노기공을 통해 이동할 때의 DNA의 다양한 섹션으로부터의 전류에서의 단계적 변화를 나타내는 사건의 섹션의 확대.
도 4. 효소 활성을 시험하기 위한 형광 검정. a) 맞춤 형광 기질을 사용하여, 혼성화된 dsDNA를 전치시키는 헬리카제의 능력을 검정하였다. 1) 형광 기질 가닥 (50 nM 최종)은 5' ssDNA 오버행, 및 혼성화된 dsDNA의 40개 염기 섹션을 갖는다. 상부의 주 가닥은 3' 단부에 카르복시플루오레세인 염기를 갖고, 혼성화된 상보체는 5' 단부에 블랙-홀 켄처(black-hole quencher) (BHQ-1) 염기를 갖는다. 혼성화되었을 때, 플루오레세인으로부터의 형광은 국부 BHQ-1에 의해 켄칭되고, 기질은 본질적으로 비-형광성이 된다. 형광 기질의 더 짧은 가닥에 상보적인 1 μM의 포획 가닥이 검정에 포함된다. 2) 나타낸 바와 같이, ATP (1 mM) 및 MgCl2 (10 mM)의 존재 하에, 기질에 부가된 헬리카제 (100 nM)는 형광 기질의 5' 꼬리에 결합하고, 주 가닥을 따라 이동하고, 상보적 가닥을 전치시킨다. 3) BHQ-1을 갖는 상보적 가닥이 완전히 전치되면, 주 가닥 상의 플루오레세인이 형광을 발한다. 4) 과량의 포획 가닥은 상보적 DNA에 우선적으로 어닐링되어, 초기 기질의 재-어닐링 및 형광 상실을 방지한다. b) 100 mM 내지 1M의 다양한 농도의 KCl을 함유하는 완충 용액 (RecD Nth 및 Dth 서열 28 및 35, 100 mM Hepes pH 8.0, 1 mM ATP, 10 mM MgCl2, 50 nM 형광 기질 DNA, 1 μM 포획 DNA)에서의 RecD 헬리카제 활성의 초기 비율의 그래프.
도 5. 다양한 Tra1 헬리카제, TrwC Cba (+140 mV, 10 mM Hepes, pH 8.0, 0.6 nM, 400량체 DNA 서열 172, 172 및 173, 100 nM TrwC Cba 서열 65, 1 mM DTT, 1 mM ATP, 1 mM MgCl2)를 사용한 헬리카제 제어된 DNA 사건의 예. 상부) TrwC Cba 400량체 DNA 사건의 전류 대 시간 획득의 섹션. 개방-기공 전류는 ~100 pA이다. DNA는 인가된 전위 (+140 mV)의 힘 하에 나노기공에 의해 포획된다. 효소가 부착된 DNA는 긴 차단을 생성하고 (상기 조건 하에 ~25 pA에서), 이는 효소가 기공을 통해 DNA를 이동시킬 때의 전류에서의 단계적 변화를 나타낸다. 하부) 하부 트레이스는 DNA를 기공을 통해 잡아당길 때의 단계적 서열 의존성 전류 변화를 나타내는 DNA 사건의 확대된 섹션을 나타낸다.
도 6. TrwC (Atr) (서열 144) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 7. TrwC (Sal) (서열 140) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 8. TrwC (Ccr) (서열 136) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 9. TrwC (Eco) (서열 74) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 10. TrwC (Oma) (서열 106) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 11. TrwC (Afe) (서열 86) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예. 하부 트레이스는 헬리카제 제어된 DNA 이동의 확장된 영역을 나타낸다.
도 12. TrwC (Mph) (서열 94) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예. 하부 트레이스는 헬리카제 제어된 DNA 이동의 확장된 영역을 나타낸다.
개략도는 DNA를 나노기공에 도입하는 2가지 가능한 방법을 보여준다: 한 방식 (상부 섹션)에서는 헬리카제는 포획된 DNA를 인가된 전계의 방향으로 나노기공 내로 이동시키고, 다른 방식 (하부 섹션)에서는 헬리카제가 포획된 DNA를 인가된 전계의 방향에 대항하여 나노기공 외부로 잡아당긴다. 인가된 전계와 함께 이동하는 경우, DNA는 막의 트랜스 측으로 이동한다. 상부 및 하부 섹션 둘 다에서 트랜스 측 상의 화살표는 DNA의 운동 방향을 나타내고 시스 측 상의 화살표는 DNA에 대한 헬리카제의 운동 방향을 나타낸다. 전계에 대항하여 이동하는 경우, DNA는 막의 시스 측으로 다시 이동하고, 헬리카제가 해리되지 않으면 DNA는 완전히 시스 측으로 전위될 수 있다. 기질 설계, 예컨대 적합한 리더의 사용을 통해, 하나의 방법 또는 둘 다의 방법을 동시에 사용할 수 있다. 헬리카제의 RecD 패밀리는 DNA를 따라 5'-3' 방향으로 이동한다. 따라서, 전계와 함께 DNA를 이동시키는 것은 DNA의 5' 하류 포획을 필요로 하고, 전계에 대항하여 DNA를 이동시키는 것은 3' 하류 DNA 포획을 필요로 한다. b) 실시예에 사용된 DNA 기질 설계.
도 2. 헬리카제는 제어된 방식으로 나노기공을 통해 DNA를 이동시킴으로써, DNA가 나노기공 (MspA-(B2)8)을 통해 이동할 때 전류에서의 단계적 변화를 생성시킬 수 있다. 헬리카제-DNA 사건 예 (140 mV, 400 mM NaCl, 10 mM Hepes, pH 8.0, 0.60 nM 400량체 DNA (서열 172, 173 및 174), 100 nM Tra1 Eco (서열 61), 1 mM DTT, 1 mM ATP, 1 mM MgCl2). 상부) Tra1 400량체 DNA 사건의 전류 대 시간 획득의 섹션. 개방-기공 전류는 ~100 pA이다. DNA는 인가된 전위 (+140 mV)의 힘 하에 나노기공에 의해 포획된다. 효소가 부착된 DNA는 긴 차단을 생성하고 (상기 조건 하에 ~25 pA에서), 이는 효소가 기공을 통해 DNA를 이동시킬 때의 전류에서의 단계적 변화를 나타낸다. 중간부) DNA-효소 포획 및 DNA를 기공을 통해 잡아당길 때의 전류에서의 단계적 변화를 나타내는, 헬리카제-제어된 DNA 사건 중 하나의 확대. 하부) DNA가 나노기공을 통해 이동할 때의 전류에서의 단계적 변화의 추가 확대.
도 3. MspA-B2(8) 나노기공을 통한 TraI Eco (서열 61) 헬리카제 제어된 400량체 DNA (400량체 DNA 서열 172, 173 및 174) 이동 사건의 추가 예. 하부) 가닥이 나노기공을 통해 이동할 때의 DNA의 다양한 섹션으로부터의 전류에서의 단계적 변화를 나타내는 사건의 섹션의 확대.
도 4. 효소 활성을 시험하기 위한 형광 검정. a) 맞춤 형광 기질을 사용하여, 혼성화된 dsDNA를 전치시키는 헬리카제의 능력을 검정하였다. 1) 형광 기질 가닥 (50 nM 최종)은 5' ssDNA 오버행, 및 혼성화된 dsDNA의 40개 염기 섹션을 갖는다. 상부의 주 가닥은 3' 단부에 카르복시플루오레세인 염기를 갖고, 혼성화된 상보체는 5' 단부에 블랙-홀 켄처(black-hole quencher) (BHQ-1) 염기를 갖는다. 혼성화되었을 때, 플루오레세인으로부터의 형광은 국부 BHQ-1에 의해 켄칭되고, 기질은 본질적으로 비-형광성이 된다. 형광 기질의 더 짧은 가닥에 상보적인 1 μM의 포획 가닥이 검정에 포함된다. 2) 나타낸 바와 같이, ATP (1 mM) 및 MgCl2 (10 mM)의 존재 하에, 기질에 부가된 헬리카제 (100 nM)는 형광 기질의 5' 꼬리에 결합하고, 주 가닥을 따라 이동하고, 상보적 가닥을 전치시킨다. 3) BHQ-1을 갖는 상보적 가닥이 완전히 전치되면, 주 가닥 상의 플루오레세인이 형광을 발한다. 4) 과량의 포획 가닥은 상보적 DNA에 우선적으로 어닐링되어, 초기 기질의 재-어닐링 및 형광 상실을 방지한다. b) 100 mM 내지 1M의 다양한 농도의 KCl을 함유하는 완충 용액 (RecD Nth 및 Dth 서열 28 및 35, 100 mM Hepes pH 8.0, 1 mM ATP, 10 mM MgCl2, 50 nM 형광 기질 DNA, 1 μM 포획 DNA)에서의 RecD 헬리카제 활성의 초기 비율의 그래프.
도 5. 다양한 Tra1 헬리카제, TrwC Cba (+140 mV, 10 mM Hepes, pH 8.0, 0.6 nM, 400량체 DNA 서열 172, 172 및 173, 100 nM TrwC Cba 서열 65, 1 mM DTT, 1 mM ATP, 1 mM MgCl2)를 사용한 헬리카제 제어된 DNA 사건의 예. 상부) TrwC Cba 400량체 DNA 사건의 전류 대 시간 획득의 섹션. 개방-기공 전류는 ~100 pA이다. DNA는 인가된 전위 (+140 mV)의 힘 하에 나노기공에 의해 포획된다. 효소가 부착된 DNA는 긴 차단을 생성하고 (상기 조건 하에 ~25 pA에서), 이는 효소가 기공을 통해 DNA를 이동시킬 때의 전류에서의 단계적 변화를 나타낸다. 하부) 하부 트레이스는 DNA를 기공을 통해 잡아당길 때의 단계적 서열 의존성 전류 변화를 나타내는 DNA 사건의 확대된 섹션을 나타낸다.
도 6. TrwC (Atr) (서열 144) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 7. TrwC (Sal) (서열 140) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 8. TrwC (Ccr) (서열 136) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 9. TrwC (Eco) (서열 74) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 10. TrwC (Oma) (서열 106) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예.
도 11. TrwC (Afe) (서열 86) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예. 하부 트레이스는 헬리카제 제어된 DNA 이동의 확장된 영역을 나타낸다.
도 12. TrwC (Mph) (서열 94) 헬리카제를 사용한 헬리카제 제어된 DNA 이동을 나타내는 전류 트레이스의 예. 하부 트레이스는 헬리카제 제어된 DNA 이동의 확장된 영역을 나타낸다.
서열 목록의 설명
서열 1은 MS-B1 돌연변이체 MspA 단량체를 코딩하는 코돈 최적화된 폴리뉴클레오티드 서열을 나타낸다. 상기 돌연변이체는 신호 서열이 결여되고, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 2는 MspA 단량체의 MS-B1 돌연변이체의 성숙 형태의 아미노산 서열을 나타낸다. 상기 돌연변이체는 신호 서열이 결여되고, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 3은 α-용혈소-E111N/K147N (α-HL-NN; 문헌 [Stoddart et al., PNAS, 2009; 106(19): 7702-7707])의 하나의 서브유닛을 코딩하는 폴리뉴클레오티드 서열을 나타낸다.
서열 4는 α-HL-NN의 하나의 서브유닛의 아미노산 서열을 나타낸다.
서열 5 내지 7은 MspB, C 및 D의 아미노산 서열을 나타낸다.
서열 8은 RecD-유사 모티프 I의 서열을 나타낸다.
서열 9, 10 및 11은 연장된 RecD-유사 모티프 I의 서열을 나타낸다.
서열 12는 RecD 모티프 I의 서열을 나타낸다.
서열 13, 14 및 15는 연장된 RecD 모티프 I의 서열을 나타낸다.
서열 16은 RecD-유사 모티프 V의 서열을 나타낸다.
서열 17은 RecD 모티프 V의 서열을 나타낸다.
서열 18 내지 45는 표 5에서의 RecD 헬리카제의 아미노산 서열을 나타낸다.
서열 46 내지 53은 MobF 모티프 III의 서열을 나타낸다.
서열 54 내지 60은 MobQ 모티프 III의 서열을 나타낸다.
서열 61 내지 171은 표 7에 나타낸 TraI 헬리카제 및 TraI 하위군 헬리카제의 아미노산 서열을 나타낸다.
서열 172 내지 182는 실시예에 사용된 서열을 나타낸다.
발명의 상세한 설명
개시된 생성물 및 방법의 다양한 적용은 당업계의 특정한 요구에 맞추어 질 수 있다는 것이 이해되어야 한다. 본원에 사용된 용어는 본 발명의 특정한 실시양태를 설명하는 목적만을 위한 것이며, 제한할 의도가 없다는 것이 또한 이해되어야 한다.
또한, 본 명세서 및 첨부된 특허청구범위에서 사용되는 경우에, 단수 형태는 문맥이 명확하게 달리 지시하지 않는 한 복수 지시대상을 포함한다. 따라서, 예를 들어 "기공"에 대한 언급은 2개 이상의 이러한 기공을 포함하고, "헬리카제"에 대한 언급은 2개 이상의 이러한 헬리카제를 포함하며, "폴리뉴클레오티드"에 대한 언급은 2개 이상의 이러한 폴리뉴클레오티드를 포함하는 것 등이다.
본원에 인용된 모든 간행물, 특허 및 특허 출원은, 상기한 것이든 하기한 것이든 관계없이, 그 전문이 본원에 참고로 포함된다.
본 발명의 방법
본 발명은 표적 폴리뉴클레오티드를 특성화하는 방법을 제공한다. 이러한 방법은 표적 폴리뉴클레오티드를 막횡단 기공 및 RecD 헬리카제와 접촉시켜, 표적 폴리뉴클레오티드가 기공을 통해 이동하고 RecD 헬리카제가 기공을 통한 표적 뉴클레오티드의 이동을 제어하도록 하는 것을 포함한다. 이어서, 폴리뉴클레오티드가 기공에 대해 이동할 때, 표적 폴리뉴클레오티드의 하나 이상의 특징을 당업계에 공지된 표준 방법을 사용하여 측정한다. 표적 폴리뉴클레오티드의 하나 이상의 특징은 바람직하게는 폴리뉴클레오티드가 기공을 통해 이동할 때 측정한다. 단계 (a) 및 (b)는 바람직하게는 기공을 가로지르는 전위를 인가하면서 수행한다. 하기에서 보다 상세하게 논의되는 바와 같이, 인가된 전위는 전형적으로 기공과 헬리카제 사이에 복합체를 형성시킨다. 인가된 전위는 전압 전위일 수 있다. 대안적으로, 인가된 전위는 화학 전위일 수 있다. 그의 예는 친양쪽성 층을 가로지르는 염 구배를 사용하는 것이다. 염 구배는 문헌 [Holden et al., J Am Chem Soc. 2007 Jul 11;129(27):8650-5]에 개시되어 있다.
일부 경우에는, 폴리뉴클레오티드가 기공에 대해 이동할 때 기공을 통과하는 전류를 사용하여 표적 폴리뉴클레오티드의 서열을 결정한다. 이것이 가닥 서열분석이다.
상기 방법은 여러 이점이 있다. 첫째, 놀랍게도 본 발명자들은 RecD 헬리카제가 놀랍게도 높은 염 내성을 갖고, 따라서 본 발명의 방법을 높은 염 농도에서 수행할 수 있다는 것을 보여주었다. 가닥 서열분석의 문맥에서, 전하 운반체, 예컨대 염은 전압 오프셋(offset)을 인가하여 표적 폴리뉴클레오티드를 포획하고 전위시키며 폴리뉴클레오티드가 기공에 대해 이동할 때 생성된 서열-의존성 전류 변화를 측정하기 위한 전도성 용액을 생성시키는데 필요하다. 측정 신호는 염의 농도에 의존적이므로, 획득되는 신호의 규모를 증가시키기 위해 높은 염 농도를 사용하는 것이 유리하다. 높은 염 농도는 높은 신호 대 노이즈 비를 제공하고, 정상적인 전류 변동의 배경값에 대비하여 뉴클레오티드의 존재를 나타내는 전류가 확인되도록 한다. 가닥 서열분석을 위해, 100 mM을 초과하는 염 농도, 예를 들어 400mM, 600mM 또는 800mM을 초과하는 염 농도가 이상적이다. 놀랍게도 본 발명자들은 RecD 헬리카제가 매우 높은 염 농도, 예컨대 예를 들어 1M에서 효과적으로 기능할 것임을 보여주었다. 본 발명은 1M, 예를 들어 2M을 초과하는 염 농도에서 효과적으로 기능하는 헬리카제를 포함한다.
둘째, 전압이 인가될 때, 놀랍게도 RecD 헬리카제는 표적 폴리뉴클레오티드를 2가지 방향으로, 즉 인가된 전압으로부터 생성되는 전계와 함께 또는 이에 대항하여 이동시킬 수 있다. 따라서, 본 발명의 방법은 2가지 바람직한 방식 중 하나로 수행할 수 있다. 표적 폴리뉴클레오티드가 기공에 대해 이동하는 방향, 즉 전계의 방향 또는 전계에 대항하는 방향에 따라 상이한 신호가 얻어진다. 이것은 하기에서 보다 상세하게 논의한다.
셋째, RecD 헬리카제는 전형적으로 기공을 통해 표적 폴리뉴클레오티드를 한번에 1개의 뉴클레오티드씩 이동시킨다. 따라서, RecD 헬리카제는 단일-염기 래칫(ratchet)처럼 기능할 수 있다. 이는 표적 폴리뉴클레오티드 내의 전부는 아니더라도 실질적으로 모든 뉴클레오티드가 기공을 사용하여 확인될 수 있기 때문에 표적 폴리뉴클레오티드의 서열분석 시에 당연히 유리하다.
넷째, RecD 헬리카제는 단일 가닥 폴리뉴클레오티드 및 이중 가닥 폴리뉴클레오티드의 이동을 제어할 수 있다. 이는 다양한 상이한 표적 폴리뉴클레오티드가 본 발명에 따라 특성화될 수 있다는 것을 의미한다.
다섯째, RecD 헬리카제는 인가된 전압으로부터 생성되는 전계에 대해 매우 저항성인 것으로 보인다. 본 발명자들은 "언지핑(unzipping)" 조건 하에서는 폴리뉴클레오티드의 이동을 거의 보지 못했다. 언지핑 조건은 전형적으로 뉴클레오티드의 부재, 예를 들어 ATP의 부재 하에 존재할 것이다. 헬리카제가 언지핑 방식으로 작동할 때 그것은 표적 서열이 인가된 전압의 영향 하에 너무 빨리 기공을 통해 이동하는 것을 방지하는 브레이크와 같이 작용한다. 이는 인가된 전압으로부터 생성되는 전계에 대항하여 폴리뉴클레오티드를 이동시키는 경우 원치 않는 "역방향" 이동의 문제가 없다는 것을 의미하기 때문에 중요하다.
여섯째, RecD 헬리카제는 생산이 용이하고, 취급이 용이하다. 따라서, 그의 사용은 간단하고 덜 고가인 서열분석 방법에 기여하였다.
본 발명의 방법은 표적 폴리뉴클레오티드를 특성화하기 위한 것이다. 폴리뉴클레오티드, 예컨대 핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 폴리뉴클레오티드 또는 핵산은 임의의 뉴클레오티드의 임의의 조합을 포함할 수 있다. 뉴클레오티드는 자연 발생된 것이거나 인공적인 것일 수 있다. 표적 폴리뉴클레오티드 내의 하나 이상의 뉴클레오티드는 산화 또는 메틸화될 수 있다. 표적 폴리뉴클레오티드 내의 하나 이상의 뉴클레오티드는 손상될 수 있다. 표적 폴리뉴클레오티드 내의 하나 이상의 뉴클레오티드는, 예를 들어 표지 또는 태그로 변형될 수 있다. 표적 폴리뉴클레오티드는 하나 이상의 스페이서를 포함할 수 있다.
뉴클레오티드는 전형적으로 핵염기, 당 및 적어도 하나의 포스페이트 기를 함유한다. 핵염기는 전형적으로 헤테로시클릭이다. 핵염기는 퓨린 및 피리미딘, 보다 구체적으로 아데닌, 구아닌, 티민, 우라실 및 시토신을 포함하지만, 이에 제한되지는 않는다. 당은 전형적으로 펜토스 당이다. 뉴클레오티드 당은 리보스 및 데옥시리보스를 포함하지만, 이에 제한되지는 않는다. 뉴클레오티드는 전형적으로 리보뉴클레오티드 또는 데옥시리보뉴클레오티드이다. 뉴클레오티드는 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 함유한다. 포스페이트는 뉴클레오티드의 5' 또는 3' 측 상에 부착될 수 있다.
뉴클레오티드는 아데노신 모노포스페이트 (AMP), 구아노신 모노포스페이트 (GMP), 티미딘 모노포스페이트 (TMP), 우리딘 모노포스페이트 (UMP), 시티딘 모노포스페이트 (CMP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시우리딘 모노포스페이트 (dUMP) 및 데옥시시티딘 모노포스페이트 (dCMP)를 포함하지만, 이에 제한되지는 않는다. 뉴클레오티드는 바람직하게는 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다.
뉴클레오티드는 무염기성일 수 있다 (즉, 핵염기가 결여됨).
폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있다. 바람직하게는, 폴리뉴클레오티드의 적어도 일부분은 이중 가닥이다.
폴리뉴클레오티드는 핵산, 예컨대 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)일 수 있다. 표적 폴리뉴클레오티드는 1개의 DNA 가닥에 혼성화된 1개의 RNA 가닥을 포함할 수 있다. 폴리뉴클레오티드는 당업계에 공지된 임의의 합성 핵산, 예컨대 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA), 또는 뉴클레오티드 측쇄를 갖는 다른 합성 중합체일 수 있다.
상기 방법을 사용하여 표적 폴리뉴클레오티드 전체 또는 그의 일부만을 특성화할 수 있다. 표적 폴리뉴클레오티드는 임의의 길이일 수 있다. 예를 들어, 폴리뉴클레오티드는 적어도 10개, 적어도 50개, 적어도 100개, 적어도 150개, 적어도 200개, 적어도 250개, 적어도 300개, 적어도 400개 또는 적어도 500개 뉴클레오티드 쌍 길이일 수 있다. 폴리뉴클레오티드는 1000개 이상의 뉴클레오티드 쌍, 5000개 이상의 뉴클레오티드 쌍 길이, 또는 100000개 이상의 뉴클레오티드 쌍 길이일 수 있다.
표적 폴리뉴클레오티드는 임의의 적합한 샘플 내에 존재한다. 본 발명은 전형적으로 표적 폴리뉴클레오티드를 함유하는 것으로 알려져 있거나 또는 함유하는 것으로 추정되는 샘플 상에서 수행된다. 대안적으로, 본 발명은 샘플 내의 존재가 알려져 있거나 또는 예상되는 하나 이상의 표적 폴리뉴클레오티드의 정체를 확인하기 위해 샘플 상에서 수행될 수 있다.
샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득되거나 또는 추출된 샘플 상에서 시험관 내 수행될 수 있다. 유기체 또는 미생물은 전형적으로 고세균, 원핵생물 또는 진핵생물이고, 전형적으로 5개 계: 식물계, 동물계, 진균계, 원핵생물계 및 원생생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득되거나 또는 추출된 샘플 상에서 시험관 내 수행될 수도 있다. 샘플은 바람직하게는 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 요, 림프, 타액, 점액 또는 양수일 수 있지만, 바람직하게는 혈액, 혈장 또는 혈청이다. 전형적으로, 샘플은 인간 기원이지만, 대안적으로 샘플은 또 다른 포유동물, 예컨대 말, 소, 양 또는 돼지와 같이 상업적으로 사육되는 동물로부터의 것일 수 있거나 또는 대안적으로 고양이 또는 개와 같은 애완동물로부터의 것일 수 있다. 대안적으로, 식물 기원의 샘플은 전형적으로 상업 작물, 예컨대 곡류, 콩과식물, 과일 또는 채소, 예를 들어 밀, 보리, 귀리, 카놀라, 옥수수, 대두, 벼, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩, 렌틸, 사탕수수, 코코아, 목화로부터 수득된다.
샘플은 비-생물학적 샘플일 수 있다. 비-생물학적 샘플은 바람직하게는 유체 샘플이다. 비-생물학적 샘플의 예는 수술 유체, 물, 예컨대 음용수, 해수 또는 강수, 및 실험실 시험용 시약을 포함한다.
샘플은 전형적으로 검정되기 전에, 예를 들어 원심분리에 의해 또는 원치 않는 분자 또는 세포, 예컨대 적혈구를 여과해내는 막의 통과에 의해 처리된다. 샘플은 수득 직후에 측정할 수 있다. 샘플은 또한 전형적으로 검정 전에, 바람직하게는 -70℃ 미만에서 보관할 수 있다.
막횡단 기공은 어느 정도까지 막을 가로지르는 구조이다. 그것은 인가된 전위에 의해 구동된 이온, 예컨대 수화 이온이 막을 가로질러 유동하거나 또는 막 내부에서 유동하는 것을 허용한다. 막횡단 기공은 전형적으로 이온이 막의 한쪽으로부터 막의 다른 쪽으로 유동할 수 있도록 전체 막을 가로지른다. 그러나, 막횡단 기공이 반드시 막을 가로질러야만 하는 것은 아니다. 그것은 한쪽 끝에서 폐쇄될 수도 있다. 예를 들어, 기공은 이온이 그것을 따라 또는 그 내부로 유동할 수 있는 막 내의 우물일 수 있다.
임의의 막을 본 발명에 따라 사용할 수 있다. 적합한 막은 당업계에 익히 공지되어 있다. 막은 바람직하게는 친양쪽성 층이다. 친양쪽성 층은 적어도 하나의 친수성 부분 및 적어도 하나의 친지성 또는 소수성 부분을 둘 다 갖는 친양쪽성 분자, 예컨대 인지질로부터 형성된 층이다. 친양쪽성 층은 단층 또는 이중층일 수 있다. 친양쪽성 층은 전형적으로 평면 지질 이중층 또는 지지된 이중층이다.
친양쪽성 층은 전형적으로 지질 이중층이다. 지질 이중층은 세포막의 모델이고, 다양한 실험 연구를 위한 우수한 플랫폼으로서의 역할을 한다. 예를 들어, 지질 이중층은 단일 채널 기록에 의한 막 단백질의 시험관내 조사에 사용될 수 있다. 대안적으로, 지질 이중층은 다양한 물질의 존재를 검출하기 위한 바이오센서로서 사용될 수 있다. 지질 이중층은 임의의 지질 이중층일 수 있다. 적합한 지질 이중층은 평면 지질 이중층, 지지된 이중층 또는 리포솜을 포함하지만, 이에 제한되지는 않는다. 지질 이중층은 바람직하게는 평면 지질 이중층이다. 적합한 지질 이중층은 국제 출원 번호 PCT/GB08/000563 (WO 2008/102121로서 공개됨), 국제 출원 번호 PCT/GB08/004127 (WO 2009/077734로서 공개됨) 및 국제 출원 번호 PCT/GB2006/001057 (WO 2006/100484로서 공개됨)에 개시되어 있다.
지질 이중층을 형성하는 방법은 당업계에 공지되어 있다. 적합한 방법은 실시예에 개시되어 있다. 지질 이중층은 지질 단층이 수성 용액/공기 계면에 대해 수직인 개구부의 어느 한 측을 지나 계면 상에 보유되는, 몬탈(Montal) 및 뮐러(Mueller) (문헌 [Proc. Natl. Acad. Sci. USA., 1972; 69: 3561-3566])의 방법에 의해 통상적으로 형성된다.
몬탈 & 뮐러의 방법은 단백질 기공 삽입에 적합한 우수한 품질의 지질 이중층을 형성하는 비용-효과적이고 비교적 간단한 방법이기 때문에 대중적이다. 이중층 형성의 다른 통상적인 방법은 팁-디핑(tip-dipping), 이중층 페인팅 및 리포솜 이중층의 패치-클램핑(patch-clamping)을 포함한다.
바람직한 실시양태에서, 지질 이중층은 국제 출원 번호 PCT/GB08/004127 (WO 2009/077734로서 공개됨)에 기재된 바와 같이 형성된다.
또 다른 바람직한 실시양태에서, 막은 고체 상태 층이다. 고체-상태 층은 생물학적 기원의 것이 아니다. 달리 말하면, 고체 상태 층은 생물학적 환경, 예컨대 유기체 또는 세포, 또는 생물학적으로 입수가능한 구조의 합성에 의해 제조된 버전으로부터 유래 또는 단리되지 않는다. 고체 상태 층은, 마이크로전자 물질, 절연 물질, 예컨대 Si3N4, Al2O3, 및 SiO, 유기 및 무기 중합체, 예컨대 폴리아미드, 플라스틱, 예컨대 테플론(Teflon)® 또는 엘라스토머, 예컨대 2-성분 부가-경화 실리콘 고무, 및 유리를 포함하지만 이에 제한되지 않는 유기 및 무기 물질 둘 다로부터 형성될 수 있다. 고체 상태 층은 1원자 층, 예컨대 그래핀, 또는 단지 수개 원자 두께인 층으로부터 형성될 수 있다. 적합한 그래핀 층은 국제 출원 번호 PCT/US2008/010637 (WO 2009/035647로서 공개됨)에 개시되어 있다.
방법은 전형적으로, (i) 기공을 포함하는 인공 친양쪽성 층, (ii) 기공을 포함하는 단리된 자연-발생 지질 이중층, 또는 (iii) 그 안에 삽입된 기공을 갖는 세포를 사용하여 수행된다. 방법은 전형적으로 인공 친양쪽성 층, 예컨대 인공 지질 이중층을 사용하여 수행된다. 상기 층은 기공 이외에 다른 막횡단 및/또는 막내 단백질, 뿐만 아니라 다른 분자를 포함할 수 있다. 적합한 장치 및 조건은 하기에서 논의한다. 본 발명의 방법은 전형적으로 시험관 내에서 수행된다.
폴리뉴클레오티드는 막에 커플링될 수 있다. 이것은 임의의 공지된 방법을 사용하여 수행될 수 있다. 막이 친양쪽성 층, 예컨대 지질 이중층 (상기에서 상세하게 논의된 바와 같은 것)인 경우에, 폴리뉴클레오티드는 바람직하게는 막 내에 존재하는 폴리펩티드 또는 막 내에 존재하는 소수성 앵커를 통해 막에 커플링된다. 소수성 앵커는 바람직하게는 지질, 지방산, 스테롤, 탄소 나노튜브 또는 아미노산이다.
폴리뉴클레오티드는 막에 직접적으로 커플링될 수도 있다. 폴리뉴클레오티드는 바람직하게는 링커를 통해 막에 커플링된다. 바람직한 링커는 중합체, 예컨대 폴리뉴클레오티드, 폴리에틸렌 글리콜 (PEG) 및 폴리펩티드를 포함하지만, 이에 제한되지는 않는다. 폴리뉴클레오티드가 막에 직접적으로 커플링되는 경우에는, 막과 헬리카제 사이의 거리로 인해 특성화 실행이 폴리뉴클레오티드의 단부까지 계속될 수 없으므로 일부 데이터가 손실될 것이다. 링커가 사용되는 경우에는, 폴리뉴클레오티드가 완전히 처리될 수 있다. 링커가 사용되는 경우에, 링커는 임의의 위치에서 폴리뉴클레오티드에 부착될 수 있다. 링커는 바람직하게는 꼬리 중합체에서 폴리뉴클레오티드에 부착된다.
커플링은 안정적이거나 또는 일시적일 수 있다. 특정 용도에 대해, 커플링의 일시적인 특성이 바람직하다. 안정적인 커플링 분자가 폴리뉴클레오티드의 5' 또는 3' 단부에 직접적으로 부착된 경우에는, 이중층과 헬리카제의 활성 부위 사이의 거리로 인해 특성화 실행이 폴리뉴클레오티드의 단부까지 계속될 수 없으므로 일부 데이터가 손실될 것이다. 커플링이 일시적인 경우에는, 커플링된 단부가 무작위로 이중층으로부터 자유롭게 되었을 때, 폴리뉴클레오티드가 완전히 처리될 수 있다. 막과 안정적이거나 또는 일시적인 연결을 형성하는 화학적 기는 하기에서 보다 상세하게 논의한다. 폴리뉴클레오티드는 콜레스테롤 또는 지방 아실 쇄를 사용하여 친양쪽성 층, 예컨대 지질 이중층에 일시적으로 커플링될 수 있다. 6 내지 30개 탄소 원자 길이를 갖는 임의의 지방 아실 쇄, 예컨대 헥사데칸산이 사용될 수 있다.
바람직한 실시양태에서, 폴리뉴클레오티드는 친양쪽성 층에 커플링된다. 폴리뉴클레오티드를 합성 지질 이중층에 커플링시키는 것은 이전에 다양한 상이한 테더링(tethering) 전략으로 수행되어 왔다. 이들은 하기 표 1에 요약되어 있다.
표 1
폴리뉴클레오티드는 합성 반응에서 반응성 기, 예컨대 티올, 콜레스테롤, 지질 및 비오틴 기의 부가에 대해 용이하게 상용성인 변형된 포스포르아미다이트를 사용하여 관능화될 수 있다. 상이한 이들 부착 화학물질은 폴리뉴클레오티드에 대한 한 벌의 부착 옵션을 제공한다. 각각의 상이한 변형 기는 폴리뉴클레오티드를 약간씩 상이한 방식으로 테더링시키고, 커플링은 항상 영구적인 것은 아니어서, 이중층에 대한 폴리뉴클레오티드의 상이한 체류 시간을 제공한다. 일시적인 커플링의 이점은 상기에 논의되어 있다.
반응성 기가 폴리뉴클레오티드에 부가될 수 있는 한, 폴리뉴클레오티드의 커플링은 다수의 다른 수단에 의해 달성될 수도 있다. 반응성 기를 DNA의 한쪽 단부에 부가하는 것은 이전에 보고되어 있다. 티올 기는 폴리뉴클레오티드 키나제 및 ATPγS를 사용하여 ssDNA의 5'에 부가될 수 있다 (문헌 [Grant, G. P. and P. Z. Qin (2007). "A facile method for attaching nitroxide spin labels at the 5' terminus of nucleic acids." Nucleic Acids Res 35(10): e77]). 말단 트랜스퍼라제를 사용하여 보다 다양한 선택의 화학적 기, 예컨대 비오틴, 티올 및 형광단을 부가하여 변형된 올리고뉴클레오티드를 ssDNA의 3'에 혼입시킬 수 있다 (문헌 [Kumar, A., P. Tchen, et al. (1988). "Nonradioactive labeling of synthetic oligonucleotide probes with terminal deoxynucleotidyl transferase." Anal Biochem 169(2): 376-82]).
대안적으로, 부착이 혼성화를 통해 달성될 수 있도록, 반응성 기가 이중층에 이미 커플링된 것에 대해 상보적인 짧은 DNA 조각의 부가인 것으로 간주될 수 있다. T4 RNA 리가제 I을 사용한 짧은 ssDNA 조각의 라이게이션이 보고되어 있다 (문헌 [Troutt, A. B., M. G. McHeyzer-Williams, et al. (1992). "Ligation-anchored PCR: a simple amplification technique with single-sided specificity." Proc Natl Acad Sci U S A 89(20): 9823-5]). 대안적으로, ssDNA 또는 dsDNA를 천연 dsDNA에 라이게이션한 다음, 2개의 가닥을 열 또는 화학 변성에 의해 분리할 수 있다. 천연 dsDNA에 대해, ssDNA 조각을 듀플렉스의 한쪽 또는 양쪽 단부에, 또는 dsDNA를 한쪽 또는 양쪽 단부에 부가하는 것이 가능하다. 이어서, 듀플렉스가 용융되면, 각각의 단일 가닥은, ssDNA가 라이게이션에 사용된 경우에는 5' 또는 3' 변형을, dsDNA가 라이게이션에 사용된 경우에는 5' 단부, 3' 단부 또는 둘 다에서의 변형을 가질 것이다. 폴리뉴클레오티드가 합성 가닥인 경우에, 커플링 화학은 폴리뉴클레오티드의 화학적 합성 동안에 혼입될 수 있다. 예를 들어, 폴리뉴클레오티드는 반응성 기가 부착되어 있는 프라이머를 사용하여 합성될 수 있다.
게놈 DNA의 섹션의 증폭을 위한 통상적인 기술은 폴리머라제 연쇄 반응 (PCR)을 사용하는 것이다. 여기서, 2개의 합성 올리고뉴클레오티드 프라이머를 사용하여, DNA의 동일한 섹션의 다수의 카피를 생성할 수 있고, 여기서 각각의 카피에 대해 듀플렉스 내의 각각의 가닥의 5'는 합성 폴리뉴클레오티드일 것이다. 반응성 기, 예컨대 콜레스테롤, 티올, 비오틴 또는 지질을 갖는 안티센스 프라이머를 사용함으로써, 증폭된 표적 DNA의 각각의 카피는 커플링을 위한 반응성 기를 함유할 것이다.
막횡단 기공은 바람직하게는 막횡단 단백질 기공이다. 막횡단 단백질 기공은 어느 정도까지 막을 가로지르는 단백질 구조이다. 그것은 인가된 전위에 의해 구동된 이온이 막을 가로질러 유동하거나 또는 막 내부에서 유동하는 것을 허용한다. 막횡단 단백질 기공은 전형적으로 이온, 예컨대 분석물이 막의 한쪽으로부터 막의 다른 쪽으로 유동하는 것을 허용하는 폴리펩티드 또는 폴리펩티드 모음이다. 그러나, 막횡단 단백질 기공이 반드시 막을 가로질러야만 하는 것은 아니다. 그것은 한쪽 끝에서 폐쇄될 수도 있다. 예를 들어, 막횡단 기공은 이온이 그것을 따라 또는 그 내부로 유동할 수 있는 막 내의 우물을 형성할 수 있다. 막횡단 단백질 기공은 바람직하게는 분석물, 예컨대 뉴클레오티드가 막을 가로질러 유동하거나 또는 막 내부에서 유동하는 것을 허용한다. 막횡단 단백질 기공은 폴리뉴클레오티드, 예컨대 DNA 또는 RNA가 기공을 통해 이동하는 것을 가능하게 한다.
막횡단 단백질 기공은 단량체 또는 올리고머일 수 있다. 기공은 바람직하게는 여러 개의 반복되는 서브유닛, 예컨대 6, 7, 8 또는 9개의 서브유닛으로 구성된다. 기공은 바람직하게는 육량체, 칠량체, 팔량체 또는 구량체 기공이다.
막횡단 단백질 기공은 전형적으로 이온이 그를 통해 유동할 수 있는 배럴 또는 채널을 포함한다. 기공의 서브유닛은 전형적으로 중심 축을 둘러싸고, 가닥이 막횡단 β 배럴 또는 채널 또는 막횡단 α-나선 다발 또는 채널이 되게 한다.
막횡단 단백질 기공의 배럴 또는 채널은 전형적으로 분석물, 예컨대 뉴클레오티드, 폴리뉴클레오티드 또는 핵산과의 상호작용을 용이하게 하는 아미노산을 포함한다. 이들 아미노산은 바람직하게는 배럴 또는 채널의 수축부 근처에 위치한다. 막횡단 단백질 기공은 전형적으로 하나 이상의 양으로 하전된 아미노산, 예컨대 아르기닌, 리신 또는 히스티딘, 또는 방향족 아미노산, 예컨대 티로신 또는 트립토판을 포함한다. 이들 아미노산은 전형적으로 기공과 뉴클레오티드, 폴리뉴클레오티드 또는 핵산 간의 상호작용을 용이하게 한다.
본 발명에 따라 사용하기 위한 막횡단 단백질 기공은 β-배럴 기공 또는 α-나선 다발 기공으로부터 유도될 수 있다. β-배럴 기공은 β-가닥으로부터 형성된 배럴 또는 채널을 포함한다. 적합한 β-배럴 기공은 β-독소, 예컨대 α-용혈소, 탄저병 독소 및 류코시딘, 및 박테리아의 외부 막 단백질/포린, 예컨대 미코박테리움 스메그마티스(Mycobacterium smegmatis) 포린 (Msp), 예를 들어 MspA, 외부 막 포린 F (OmpF), 외부 막 포린 G (OmpG), 외부 막 포스포리파제 A 및 네이세리아(Neisseria) 자가수송체 지단백질 (NalP)을 포함하지만, 이에 제한되지는 않는다. α-나선 다발 기공은 α-나선으로부터 형성된 배럴 또는 채널을 포함한다. 적합한 α-나선 다발 기공은 내부 막 단백질 및 α 외부 막 단백질, 예컨대 WZA 및 ClyA 독소를 포함하지만, 이에 제한되지는 않는다. 막횡단 기공은 Msp로부터 또는 α-용혈소 (α-HL)로부터 유도될 수 있다.
바람직하게는 막횡단 단백질 기공은 Msp로부터, 바람직하게는 MspA로부터 유도된다. 이러한 기공은 올리고머일 것이고, 전형적으로 Msp로부터 유도된 7, 8, 9 또는 10개의 단량체를 포함한다. 기공은 동일한 단량체를 포함하는 Msp로부터 유도된 호모-올리고머 기공일 수 있다. 대안적으로, 기공은 서로 상이한 적어도 하나의 단량체를 포함하는 Msp로부터 유도된 헤테로-올리고머 기공일 수 있다. 바람직하게는, 기공은 MspA 또는 그의 상동체 또는 파라로그로부터 유도된다.
Msp로부터 유도된 단량체는 서열 2에 나타낸 서열 또는 그의 변이체를 포함한다. 서열 2는 MspA 단량체의 MS-(B1)8 돌연변이체이다. 그것은 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다. 서열 2의 변이체는 서열 2와 다른 아미노산 서열을 갖고 그의 기공을 형성하는 능력을 보유하는 폴리펩티드이다. 기공을 형성하는 변이체의 능력은 당업계에 공지된 임의의 방법을 사용하여 검정할 수 있다. 예를 들어, 변이체를 다른 적절한 서브유닛과 함께 친양쪽성 층 내로 삽입할 수 있고, 올리고머화하여 기공을 형성하는 그의 능력을 결정할 수 있다. 막, 예컨대 친양쪽성 층 내로 서브유닛을 삽입하기 위한 방법은 당업계에 공지되어 있다. 예를 들어, 서브유닛을 지질 이중층을 함유하는 용액 중에 정제된 형태로 현탁시킬 수 있고, 이에 따라 그것을 지질 이중층으로 확산시켜, 지질 이중층에 대한 결합 및 기능적 상태로의 조립에 의해 삽입한다. 대안적으로, 문헌 [M.A. Holden, H. Bayley. J. Am. Chem. Soc. 2005, 127, 6502-6503] 및 국제 출원 번호 PCT/GB2006/001057 (WO 2006/100484로서 공개됨)에 기재된 "픽 앤드 플레이스(pick and place)" 방법을 사용하여 서브유닛을 막 내로 직접 삽입할 수도 있다.
서열 2의 아미노산 서열의 전체 길이에 대해, 변이체는 바람직하게는 아미노산 동일성을 기준으로 하여 상기 서열에 대해 적어도 50% 상동성일 것이다. 보다 바람직하게는, 변이체는 전체 서열에 대해 서열 2의 아미노산 서열에 대한 아미노산 동일성을 기준으로 하여 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 보다 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 100개 이상, 예를 들어 125, 150, 175 또는 200개 또는 그 초과의 인접 아미노산의 스트레치에 대한 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95% 아미노산 동일성이 존재할 수도 있다 ("강한 상동성").
당업계에서의 표준 방법을 사용하여 상동성을 결정할 수 있다. 예를 들어, UWGCG 패키지는, 예를 들어 그의 디폴트 설정 상에 사용된 상동성을 계산하기 위해 사용될 수 있는 BESTFIT 프로그램을 제공한다 (문헌 [Devereux et al (1984) Nucleic Acids Research 12, p387-395]). PILEUP 및 BLAST 알고리즘은, 예를 들어 문헌 [Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S.F et al (1990) J Mol Biol 215:403-10]에 기재된 바와 같이, 상동성 또는 라인 업 서열을 계산 (예컨대 (전형적으로 그의 디폴트 설정 상에서) 동등한 잔기 또는 상응하는 서열을 확인)하기 위해 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국 국립 생물 정보 센터 (http://www.ncbi.nlm.nih.gov/)를 통해 공개적으로 입수가능하다.
서열 2는 MspA 단량체의 MS-(B1)8 돌연변이체이다. 변이체는 MspA와 비교하여 MspB, C 또는 D 단량체에서의 돌연변이 중 임의의 것을 포함할 수 있다. 성숙 형태의 MspB, C 및 D를 서열 5 내지 7에 나타낸다. 특히, 변이체는 MspB에 존재하는 하기 치환: A138P를 포함할 수 있다. 변이체는 MspC에 존재하는 하기 치환: A96G, N102E 및 A138P 중 하나 이상을 포함할 수 있다. 변이체는 MspD에 존재하는 하기 돌연변이: G1의 결실, L2V, E5Q, L8V, D13G, W21A, D22E, K47T, I49H, I68V, D91G, A96Q, N102D, S103T, V104I, S136K 및 G141A 중 하나 이상을 포함할 수 있다. 변이체는 Msp B, C 및 D로부터의 돌연변이 및 치환 중 하나 이상의 조합을 포함할 수 있다. 변이체는 바람직하게는 돌연변이 L88N을 포함한다. 서열 2의 변이체는 MS-B1의 모든 돌연변이 이외에 돌연변이 L88N을 갖고, MS-B2로 불린다. 본 발명에 사용된 기공은 바람직하게는 MS-(B2)8이다.
상기에 논의된 것 이외에, 서열 2의 아미노산 서열에 대한 아미노산 치환, 예를 들어 1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 치환이 이루어질 수 있다. 보존적 치환은 아미노산을 유사한 화학 구조, 유사한 화학적 특성 또는 유사한 측쇄 부피의 다른 아미노산으로 대체한다. 도입된 아미노산은 그것이 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기성, 산성, 중성 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존의 방향족 또는 지방족 아미노산 대신에 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변화는 당업계에 익히 공지되어 있고, 하기 표 2에 정의된 바와 같은 20개의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 갖는 경우에, 이는 또한 표 3에서의 아미노산 측쇄에 대한 소수친수성 스케일을 참고하여 결정될 수 있다.
표 2 - 아미노산의 화학적 특성
표 3- 소수친수성 스케일
서열 2의 아미노산 서열 중 1개 이상의 아미노산 잔기가 상기에 기재된 폴리펩티드로부터 추가로 결실될 수 있다. 1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 잔기 또는 그 초과가 결실될 수 있다.
변이체는 서열 2의 단편을 포함할 수 있다. 이러한 단편은 기공 형성 활성을 보유한다. 단편은 적어도 50, 100, 150 또는 200개 아미노산 길이일 수 있다. 이러한 단편을 사용하여 기공을 생성할 수 있다. 단편은 바람직하게는 서열 2의 기공 형성 도메인을 포함한다. 단편은 서열 2의 잔기 88, 90, 91, 105, 118 및 134 중 1개를 포함하여야 한다. 전형적으로, 단편은 서열 2의 잔기 88, 90, 91, 105, 118 및 134 모두를 포함한다.
1개 이상의 아미노산이 상기에 기재된 폴리펩티드에 대안적으로 또는 부가적으로 부가될 수 있다. 서열 2 또는 그의 폴리펩티드 변이체 또는 단편의 아미노산 서열의 아미노 말단 또는 카르복시 말단에 연장이 제공될 수 있다. 연장은 상당히 짧은, 예를 들어 1 내지 10개 아미노산 길이일 수 있다. 대안적으로, 연장은 보다 긴, 예를 들어 50 또는 100개 이하의 아미노산일 수 있다. 운반 단백질이 본 발명에 따른 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 하기에서 보다 상세하게 논의한다.
상기에 논의된 바와 같이, 변이체는 서열 2와 다른 아미노산 서열을 갖고 그의 기공을 형성하는 능력을 보유하는 폴리펩티드이다. 변이체는 전형적으로 기공 형성을 담당하는 서열 2의 영역을 함유한다. β-배럴을 함유하는 Msp의 기공 형성 능력은 각각의 서브유닛 내의 β-시트에 의해 제공된다. 서열 2의 변이체는 전형적으로 β-시트를 형성하는 서열 2 내의 영역을 포함한다. 생성된 변이체가 그의 기공을 형성하는 능력을 보유하는 한, β-시트를 형성하는 서열 2의 영역에 대해 하나 이상의 변형이 이루어질 수 있다. 서열 2의 변이체는 바람직하게는 그의 α-나선 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대 치환, 부가 또는 결실을 포함한다.
Msp로부터 유도된 단량체는, 예를 들어 히스티딘 잔기 (hist 태그), 아스파르트산 잔기 (asp 태그), 스트렙타비딘 태그 또는 플래그 태그의 부가에 의해, 또는 세포로부터의 그의 분비를 촉진하기 위한 신호 서열의 부가에 의해 (폴리펩티드는 이러한 서열을 자연적으로 함유하지 않음) 변형되어 그의 확인 또는 정제를 보조할 수 있다. 유전적 태그를 도입하는 것에 대한 대안은 태그를 기공 상의 천연 또는 조작된 위치 상에서 화학적으로 반응시키는 것이다. 이의 예는 겔-시프트 시약을 기공의 외부 상에서 조작된 시스테인에 대해 반응시키는 것일 것이다. 이는 용혈소 헤테로-올리고머를 분리하는 방법으로서 입증되어 있다 (문헌 [Chem Biol. 1997 Jul; 4(7):497-505]).
Msp로부터 유도된 단량체는 표식 표지로 표지될 수 있다. 표식 표지는 기공이 검출되게 하는 임의의 적합한 표지일 수 있다. 적합한 표지는 형광 분자, 방사성 동위원소, 예를 들어 125I, 35S, 효소, 항체, 항원, 폴리뉴클레오티드 및 리간드, 예컨대 비오틴을 포함하지만, 이에 제한되지는 않는다.
Msp로부터 유도된 단량체는 D-아미노산을 사용하여 생산될 수도 있다. 예를 들어, Msp로부터 유도된 단량체는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 이러한 단백질 또는 펩티드를 생산하기 위해 당업계에서 통상적인 것이다.
Msp로부터 유도된 단량체는 뉴클레오티드 구별을 용이하게 하는 하나 이상의 특이적 변형을 함유한다. Msp로부터 유도된 단량체는 다른 비-특이적 변형이 기공 형성을 방해하지 않는 한, 이를 함유할 수도 있다. 다수의 비-특이적 측쇄 변형이 당업계에 공지되어 있고, Msp로부터 유도된 단량체의 측쇄에 대해 이루어질 수 있다. 이러한 변형은, 예를 들어 알데히드와의 반응 후 NaBH4로의 환원에 의한 아미노산의 환원성 알킬화, 메틸아세트이미데이트로의 아미딘화 또는 아세트산 무수물로의 아실화를 포함한다.
Msp로부터 유도된 단량체는 당업계에 공지된 표준 방법을 사용하여 생산될 수 있다. Msp로부터 유도된 단량체는 합성에 의해 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 기공은 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 기공을 생산하는 적합한 방법은 국제 출원 번호 PCT/GB09/001690 (WO 2010/004273으로서 공개됨), PCT/GB09/001679 (WO 2010/004265로서 공개됨) 또는 PCT/GB10/000133 (WO 2010/086603으로서 공개됨)에 논의되어 있다. 기공을 막 내로 삽입하는 방법이 논의되어 있다.
막횡단 단백질 기공은 바람직하게는 α-용혈소 (α-HL)로부터도 유도된다. 야생형 α-HL 기공은 7개의 동일한 단량체 또는 서브유닛으로 형성된다 (즉, 이것은 칠량체임). α-용혈소-NN의 1개의 단량체 또는 서브유닛의 서열을 서열 4에 나타낸다. 막횡단 단백질 기공은 바람직하게는 7개의 단량체를 포함하고, 이들 각각은 서열 4에 나타낸 서열 또는 그의 변이체를 포함한다. 서열 4의 아미노산 1, 7 내지 21, 31 내지 34, 45 내지 51, 63 내지 66, 72, 92 내지 97, 104 내지 111, 124 내지 136, 149 내지 153, 160 내지 164, 173 내지 206, 210 내지 213, 217, 218, 223 내지 228, 236 내지 242, 262 내지 265, 272 내지 274, 287 내지 290 및 294는 루프 영역을 형성한다. 서열 4의 잔기 113 및 147은 α-HL의 배럴 또는 채널의 수축 부분을 형성한다.
이러한 실시양태에서, 서열 4에 나타낸 서열 또는 그의 변이체를 각각 포함하는 7개의 단백질 또는 단량체를 포함하는 기공이 본 발명의 방법에서 바람직하게 사용된다. 7개의 단백질은 동일할 수 있거나 (동종칠량체) 또는 상이할 수 있다 (이종칠량체).
서열 4의 변이체는 서열 4와 다른 아미노산 서열을 갖고 그의 기공을 형성하는 능력을 보유하는 단백질이다. 기공을 형성하는 변이체의 능력은 당업계에 공지된 임의의 방법을 사용하여 검정할 수 있다. 예를 들어, 변이체를 다른 적절한 서브유닛과 함께 친양쪽성 층, 예컨대 지질 이중층 내로 삽입할 수 있고, 올리고머화하여 기공을 형성하는 그의 능력을 결정할 수 있다. 친양쪽성 층, 예컨대 지질 이중층 내로 서브유닛을 삽입하기 위한 방법은 당업계에 공지되어 있다. 적합한 방법은 상기에 논의되어 있다.
변이체는 헬리카제에 대한 공유 부착 또는 그와의 상호작용을 용이하게 하는 변형을 포함할 수 있다. 변이체는 바람직하게는 헬리카제에 대한 부착을 용이하게 하는 1개 이상의 반응성 시스테인 잔기를 포함한다. 예를 들어, 변이체는 서열 4의 위치 8, 9, 17, 18, 19, 44, 45, 50, 51, 237, 239 및 287 중 1개 이상 및/또는 아미노 또는 카르복시 말단에서 시스테인을 포함할 수 있다. 바람직한 변이체는 서열 4의 위치 8, 9, 17, 237, 239 및 287의 잔기의 시스테인으로의 치환 (A8C, T9C, N17C, K237C, S239C 또는 E287C)을 포함한다. 변이체는 바람직하게는 국제 출원 번호 PCT/GB09/001690 (WO 2010/004273으로서 공개됨), PCT/GB09/001679 (WO 2010/004265로서 공개됨) 또는 PCT/GB10/000133 (WO 2010/086603으로서 공개됨)에 기재된 변이체 중 어느 하나이다.
변이체는 뉴클레오티드와의 임의의 상호작용을 용이하게 하는 변형을 포함할 수도 있다.
변이체는 유기체, 예를 들어 스타필로코쿠스(Staphylococcus) 박테리아에 의해 자연적으로 발현되는 자연 발생 변이체일 수 있다. 대안적으로, 변이체는 에스케리키아 콜라이(Escherichia coli)와 같은 박테리아에 의해 시험관 내에서 또는 재조합적으로 발현될 수 있다. 변이체는 또한 재조합 기술에 의해 생성된 비-자연 발생 변이체를 포함한다. 서열 4의 아미노산 서열의 전체 길이에 대해, 변이체는 바람직하게는 아미노산 동일성을 기준으로 하여 상기 서열에 대해 적어도 50% 상동성일 것이다. 보다 바람직하게는, 변이체 폴리펩티드는 전체 서열에 대해 서열 4의 아미노산 서열에 대한 아미노산 동일성을 기준으로 하여 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 보다 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 200개 이상, 예를 들어 230, 250, 270 또는 280개 또는 그 초과의 인접 아미노산의 스트레치에 대한 적어도 80%, 예를 들어 적어도 85%, 90% 또는 95% 아미노산 동일성이 존재할 수도 있다 ("강한 상동성"). 상동성은 상기에 논의된 바와 같이 결정할 수 있다.
상기에 논의된 것 이외에, 서열 4의 아미노산 서열에 대한 아미노산 치환, 예를 들어 1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 치환이 이루어질 수 있다. 보존적 치환은 상기에 논의된 바와 같이 이루어질 수 있다.
서열 4의 아미노산 서열 중 1개 이상의 아미노산 잔기가 상기에 기재된 폴리펩티드로부터 추가로 결실될 수 있다. 1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 잔기 또는 그 초과가 결실될 수 있다.
변이체는 서열 4의 단편일 수 있다. 이러한 단편은 기공-형성 활성을 보유한다. 단편은 적어도 50, 100, 200 또는 250개 아미노산 길이일 수 있다. 단편은 바람직하게는 서열 4의 기공-형성 도메인을 포함한다. 단편은 전형적으로 서열 4의 잔기 119, 121, 135, 113 및 139를 포함한다.
1개 이상의 아미노산이 상기에 기재된 폴리펩티드에 대안적으로 또는 부가적으로 부가될 수 있다. 서열 4 또는 그의 변이체 또는 단편의 아미노산 서열의 아미노 말단 또는 카르복시 말단에 연장이 제공될 수 있다. 연장은 상당히 짧은, 예를 들어 1 내지 10개 아미노산 길이일 수 있다. 대안적으로, 연장은 보다 긴, 예를 들어 50 또는 100개 이하의 아미노산일 수 있다. 운반 단백질이 기공 또는 변이체에 융합될 수 있다.
상기에 논의된 바와 같이, 서열 4의 변이체는 서열 4와 다른 아미노산 서열을 갖고 그의 기공을 형성하는 능력을 보유하는 서브유닛이다. 변이체는 전형적으로 기공 형성을 담당하는 서열 4의 영역을 함유한다. β-배럴을 함유하는 α-HL의 기공 형성 능력은 각각의 서브유닛 내의 β-가닥에 의해 제공된다. 서열 4의 변이체는 전형적으로 β-가닥을 형성하는 서열 4 내의 영역을 포함한다. β-가닥을 형성하는 서열 4의 아미노산은 상기에 논의되어 있다. 생성된 변이체가 그의 기공을 형성하는 능력을 보유하는 한, β-가닥을 형성하는 서열 4의 영역에 대해 하나 이상의 변형이 이루어질 수 있다. 서열 4의 β-가닥 영역에 대해 이루어질 수 있는 특이적 변형은 상기에 논의되어 있다.
서열 4의 변이체는 바람직하게는 그의 α-나선 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대 치환, 부가 또는 결실을 포함한다. α-나선 및 루프를 형성하는 아미노산은 상기에 논의되어 있다.
변이체는 상기에 논의된 바와 같이 변형되어 그의 확인 또는 정제를 보조할 수 있다.
α-HL로부터 유도된 기공은 Msp로부터 유도된 기공에 관하여 상기에 논의된 바와 같이 제조될 수 있다.
일부 실시양태에서, 막횡단 단백질 기공은 화학적으로 변형된다. 기공은 임의의 방식으로 임의의 부위에서 화학적으로 변형될 수 있다. 막횡단 단백질 기공은 바람직하게는 하나 이상의 시스테인에 대한 분자의 부착 (시스테인 연결), 하나 이상의 리신에 대한 분자의 부착, 하나 이상의 비-천연 아미노산에 대한 분자의 부착, 에피토프의 효소 변형 또는 말단의 변형에 의해 화학적으로 변형된다. 이러한 변형을 수행하기에 적합한 방법은 당업계에 익히 공지되어 있다. 막횡단 단백질 기공은 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 기공은 염료 또는 형광단의 부착에 의해 화학적으로 변형될 수 있다.
기공 내의 임의의 개수의 단량체가 화학적으로 변형될 수 있다. 1개 이상, 예컨대 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 단량체가 바람직하게는 상기에 논의된 바와 같이 화학적으로 변형된다.
시스테인 잔기의 반응성은 인접 잔기의 변형에 의해 증진될 수 있다. 예를 들어, 플랭킹 아르기닌, 히스티딘 또는 리신 잔기의 염기성 기는 시스테인 티올 기의 pKa를 보다 반응성인 S- 기의 것으로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대 dTNB에 의해 보호될 수 있다. 이들을 링커가 부착되기 전에 기공의 1개 이상의 시스테인 잔기와 반응시킬 수 있다.
분자 (기공을 화학적으로 변형시키는 것)는 국제 출원 번호 PCT/GB09/001690 (WO 2010/004273으로서 공개됨), PCT/GB09/001679 (WO 2010/004265로서 공개됨) 또는 PCT/GB10/000133 (WO 2010/086603으로서 공개됨)에 개시된 바와 같이 링커를 통해 부착될 수 있거나 또는 기공에 직접적으로 부착될 수 있다.
임의의 RecD 헬리카제를 본 발명에 따라 사용할 수 있다. RecD 헬리카제의 구조는 당업계에 공지되어 있다 (문헌 [FEBS J. 2008 Apr;275(8):1835-51. Epub 2008 Mar 9. ATPase activity of RecD is essential for growth of the Antarctic Pseudomonas syringae Lz4W at temperature. Satapathy AK, Pavankumar TL, Bhattacharjya S, Sankaranarayanan R, Ray MK; EMS Microbiol Rev. 2009 May;33(3):657-87. The diversity of conjugative relaxases and its application in plasmid classification. Garcillan-Barcia MP, Francia MV, de la Cruz F; J Biol Chem. 2011 Apr 8;286(14):12670-82. Epub 2011 Feb 2. Functional characterization of the multidomain F plasmid TraI relaxase-helicase. Cheng Y, McNamara DE, Miley MJ, Nash RP, Redinbo MR]).
RecD 헬리카제는 전형적으로 아미노산 모티프 X1-X2-X3-G-X4-X5-X6-X7 (이하 RecD-유사 모티프 I로 불림; 서열 8)을 포함하고, 여기서 X1은 G, S 또는 A이고, X2는 임의의 아미노산이고, X3은 P, A, S 또는 G이고, X4는 T, A, V, S 또는 C이고, X5는 G 또는 A이고, X6은 K 또는 R이고, X7은 T 또는 S이다. X1은 바람직하게는 G이다. X2는 바람직하게는 G, I, Y 또는 A이다. X2는 보다 바람직하게는 G이다. X3은 바람직하게는 P 또는 A이다. X4는 바람직하게는 T, A, V 또는 C이다. X4는 바람직하게는 T, V 또는 C이다. X5는 바람직하게는 G이다. X6은 바람직하게는 K이다. X7은 바람직하게는 T 또는 S이다. RecD 헬리카제는 바람직하게는 Q-(X8)16-18-X1-X2-X3-G-X4-X5-X6-X7 (이하 연장된 RecD-유사 모티프 I로 불림; 각각 16, 17 및 18개의 X8이 존재하는 서열 9, 10 및 11)을 포함하고, 여기서 X1 내지 X7은 상기에 정의된 바와 같고, X8은 임의의 아미노산이다. 연장된 RecD-유사 모티프 I에는 바람직하게는 16개의 X8 잔기 (즉, (X8)16)가 존재한다 (서열 9). (X8)16에 적합한 서열은 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42 및 44에서 확인할 수 있다.
RecD 헬리카제는 바람직하게는 아미노산 모티프 G-G-P-G-Xa-G-K-Xb (이하 RecD 모티프 I로 불림; 서열 12)를 포함하고, 여기서 Xa는 T, V 또는 C이고, Xb는 T 또는 S이다. Xa는 바람직하게는 T이다. Xb는 바람직하게는 T이다. Rec-D 헬리카제는 바람직하게는 서열 G-G-P-G-T-G-K-T (서열 19; 표 5 참조)를 포함한다. RecD 헬리카제는 보다 바람직하게는 아미노산 모티프 Q-(X8)16-18-G-G-P-G-Xa-G-K-Xb (이하 연장된 RecD 모티프 I로 불림; 각각 16, 17 및 18개의 X8이 존재하는 서열 13, 14 및 15)를 포함하고, 여기서 Xa 및 Xb는 상기에 정의된 바와 같고, X8은 임의의 아미노산이다. 연장된 RecD 모티프 I에는 바람직하게는 16개의 X8 잔기 (즉, (X8)16)가 존재한다 (서열 13). (X8)16에 적합한 서열은 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42 및 44에서 확인할 수 있다.
RecD 헬리카제는 전형적으로 아미노산 모티프 X1-X2-X3-X4-X5-(X6)3-Q-X7 (이하 RecD-유사 모티프 V로 불림; 서열 16)을 포함하고, 여기서 X1은 Y, W 또는 F이고, X2는 A, T, S, M, C 또는 V이고, X3은 임의의 아미노산이고, X4는 T, N 또는 S이고, X5는 A, T, G, S, V 또는 I이고, X6은 임의의 아미노산이고, X7은 G 또는 S이다. X1은 바람직하게는 Y이다. X2는 바람직하게는 A, M, C 또는 V이다. X2는 보다 바람직하게는 A이다. X3은 바람직하게는 I, M 또는 L이다. X3은 보다 바람직하게는 I 또는 L이다. X4는 바람직하게는 T 또는 S이다. X4는 보다 바람직하게는 T이다. X5는 바람직하게는 A, V 또는 I이다. X5는 보다 바람직하게는 V 또는 I이다. X5는 가장 바람직하게는 V이다. (X6)3은 바람직하게는 H-K-S, H-M-A, H-G-A 또는 H-R-S이다. (X6)3은 보다 바람직하게는 H-K-S이다. X7은 바람직하게는 G이다. RecD 헬리카제는 바람직하게는 아미노산 모티프 Xa-Xb-Xc-Xd-Xe-H-K-S-Q-G (이하 RecD 모티프 V로 불림; 서열 17)를 포함하고, 여기서 Xa는 Y, W 또는 F이고, Xb는 A, M, C 또는 V이고, Xc는 I, M 또는 L이고, Xd는 T 또는 S이고, Xe는 V 또는 I이다. Xa는 바람직하게는 Y이다. Xb는 바람직하게는 A이다. Xd는 바람직하게는 T이다. Xe는 바람직하게는 V이다. RecD 헬리카제는 바람직하게는 (1) RecD-유사 모티프 I 및 V (서열 8 및 12), (2) RecD 모티프 I 및 RecD-유사 모티프 V (서열 12 및 16), (3) RecD 모티프 I 및 V (서열 12 및 17), (4) 연장된 RecD-유사 모티프 I 및 RecD-유사 모티프 V (서열 9, 10 또는 11 및 16), (5) 연장된 RecD 모티프 I 및 RecD-유사 모티프 V (서열 13, 14 또는 15 및 16) 또는 (6) 연장된 RecD 모티프 I 및 RecD 모티프 V (서열 13, 14 또는 15 및 17)를 포함한다.
바람직한 RecD 모티프 I은 하기 표 5에 나타낸다. 바람직한 RecD-유사 모티프 I은 하기 표 7에 나타낸다. 바람직한 RecD-유사 모티프 V는 하기 표 5 및 7에 나타낸다.
RecD 헬리카제는 바람직하게는 하기 표 4에 나타낸 헬리카제 중 하나 또는 그의 변이체이다.
표 4 - 바람직한 RecD 헬리카제 및 그의 등록 번호
RecD 헬리카제는 보다 바람직하게는 하기 표 5에 나타낸 헬리카제 중 하나 또는 그의 변이체이다. RecD 헬리카제는 보다 바람직하게는 표 5에 나타낸 헬리카제 중 하나의 서열, 즉 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42 및 44 중 하나, 또는 그의 변이체를 포함한다.
표 5 - 보다 바람직한 RecD 헬리카제
상기 표에서의 모든 서열은 (나타낸 바와 같이) RecD-유사 모티프 V를 포함한다. 서열 18, 25, 28, 30, 35, 37, 39 및 42만이 (나타낸 바와 같이) RecD 모티프 V를 포함한다.
RecD 헬리카제는 바람직하게는 TraI 헬리카제 또는 TraI 하위군 헬리카제이다. TraI 헬리카제 및 TraI 하위군 헬리카제는 2개의 RecD 헬리카제 도메인, 릴랙사제 도메인 및 C-말단 도메인을 함유할 수 있다. TraI 하위군 헬리카제는 바람직하게는 TrwC 헬리카제이다. TraI 헬리카제 또는 TraI 하위군 헬리카제는 바람직하게는 하기 표 6에 나타낸 헬리카제 중 하나 또는 그의 변이체이다.
TraI 헬리카제 또는 TraI 하위군 헬리카제는 전형적으로 상기에 정의된 바와 같은 RecD-유사 모티프 I (서열 8) 및/또는 상기에 정의된 바와 같은 RecD-유사 모티프 V (서열 16)를 포함한다. TraI 헬리카제 또는 TraI 하위군 헬리카제는 바람직하게는 RecD-유사 모티프 I (서열 8) 및 RecD-유사 모티프 V (서열 16)를 둘 다 포함한다. TraI 헬리카제 또는 TraI 하위군 헬리카제는 전형적으로 하기 2개의 모티프 중 하나를 추가로 포함한다:
- 아미노산 모티프 H-(X1)2-X2-R-(X3)5-12-H-X4-H (이하 MobF 모티프 III으로 불림; 서열 46 내지 53은 모든 가능한 MobF 모티프 III을 나타냄 (X3의 모든 가능한 개수 포함)) (여기서 X1 및 X3은 임의의 아미노산이고, X2 및 X4는 D, E, K 및 R을 제외한 임의의 아미노산으로부터 독립적으로 선택됨). (X1)2는 물론 X1a-X1b이다. X1a 및 X1b는 다양한 아미노산 중 동일한 것일 수 있다. X1a는 바람직하게는 D 또는 E이다. X1b는 바람직하게는 T 또는 D이다. (X1)2는 바람직하게는 DT 또는 ED이다. (X1)2는 가장 바람직하게는 DT이다. (X3)5-12에서 5 내지 12개의 아미노산은 동일하거나 또는 상이할 수 있다. X2 및 X4는 G, P, A, V, L, I, M, C, F, Y, W, H, Q, N, S 및 T로부터 독립적으로 선택된다. X2 및 X4는 바람직하게는 하전되지 않는다. X2 및 X4는 바람직하게는 H가 아니다. X2는 보다 바람직하게는 N, S 또는 A이다. X2는 가장 바람직하게는 N이다. X4는 가장 바람직하게는 F 또는 T이다. (X3)5-12는 바람직하게는 6 또는 10개 잔기 길이이다 (서열 47 및 51). (X3)5-12의 적합한 실시양태는 하기 표 7에서 나타낸 서열 61, 65, 69, 73, 74, 82, 86, 90, 94, 98, 102, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 (즉, 서열 78 및 106을 제외한 모든 것)로부터 유도될 수 있다. MobF 모티프 III의 바람직한 실시양태는 하기 표 7에 나타낸다.
- 아미노산 모티프 G-X1-X2-X3-X4-X5-X6-X7-H-(X8)6-12-H-X9 (이하 MobQ 모티프 III으로 불림; 서열 54 내지 60은 모든 가능한 MobQ 모티프 III을 나타냄 (X8의 모든 가능한 개수 포함)) (여기서 X1, X2, X3, X5, X6, X7 및 X9는 D, E, K 및 R을 제외한 임의의 아미노산으로부터 독립적으로 선택되고, X4는 D 또는 E이고, X8은 임의의 아미노산임). X1, X2, X3, X5, X6, X7 및 X9는 G, P, A, V, L, I, M, C, F, Y, W, H, Q, N, S 및 T로부터 독립적으로 선택된다. X1, X2, X3, X5, X6, X7 및 X9는 바람직하게는 하전되지 않는다. X1, X2, X3, X5, X6, X7 및 X9는 바람직하게는 H가 아니다. (X8)6-12에서 6 내지 12개의 아미노산은 동일하거나 또는 상이할 수 있다. (X8)6-12의 적합한 실시양태는 하기 표 7에 나타낸 서열 78 및 106으로부터 유도될 수 있다. MobF 모티프 III의 바람직한 실시양태는 하기 표 7에 나타낸다.
표 6 - 바람직한 TraI 헬리카제 및 TraI 하위군 헬리카제 및 그의 등록 번호
TraI 헬리카제 또는 TraI 하위군 헬리카제는 보다 바람직하게는 하기 표 7에 나타낸 헬리카제 중 하나 또는 그의 변이체이다. TraI 헬리카제 또는 TraI 하위군 헬리카제는 보다 바람직하게는 표 7에 나타낸 헬리카제 중 하나의 서열, 즉 서열 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 하나, 또는 그의 변이체를 포함한다.
표 7 - 보다 바람직한 TraI 헬리카제 및 TraI 하위군 헬리카제
서열 78 및 106은 MobQ 모티프 III을 포함하는 반면, 표 7에서의 다른 서열은 MobF 모티프 III을 포함한다.
TraI 헬리카제는 바람직하게는 서열 61에 나타낸 서열 또는 그의 변이체를 포함한다.
RecD 헬리카제의 변이체는 야생형 헬리카제와 다른 아미노산 서열을 갖고 폴리뉴클레오티드 결합 활성을 보유하는 효소이다. 특히, 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체는 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나와 다른 아미노산 서열을 갖고 폴리뉴클레오티드 결합 활성을 보유하는 효소이다. 서열 18 또는 61의 변이체는 서열 18 또는 61과 다른 아미노산 서열을 갖고 폴리뉴클레오티드 결합 활성을 보유하는 효소이다. 변이체는 헬리카제 활성을 보유한다. 헬리카제 활성을 측정하는 방법은 당업계에 공지되어 있다. 헬리카제 활성은 또한 실시예에 기재된 바와 같이 측정할 수 있다. 변이체는 하기에서 논의되는 2가지 방식 중 적어도 하나로 작동하여야 한다. 바람직하게는, 변이체는 둘 다의 방식으로 작동한다. 변이체는 헬리카제를 코딩하는 폴리뉴클레오티드의 취급을 용이하게 하고/거나 높은 염 농도 및/또는 실온에서의 그의 활성을 용이하게 하는 변형을 포함할 수 있다. 변이체는 전형적으로 상기에 논의된 모티프의 외부 영역에서 야생형 헬리카제와 상이하다. 그러나, 변이체는 이들 모티프(들) 내부의 변형을 포함할 수 있다.
서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나, 예컨대 서열 18 또는 61의 아미노산 서열의 전체 길이에 대해, 변이체는 바람직하게는 아미노산 동일성을 기준으로 하여 상기 서열에 대해 적어도 10% 상동성일 것이다. 보다 바람직하게는, 변이체 폴리펩티드는 전체 서열에 대해 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나, 예컨대 서열 18 또는 61의 아미노산 서열에 대한 아미노산 동일성을 기준으로 하여 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 보다 바람직하게는 적어도 95%, 97% 또는 99% 상동성일 수 있다. 150개 이상, 예를 들어 200, 300, 400, 500, 600, 700, 800, 900 또는 1000개 또는 그 초과의 인접 아미노산의 스트레치에 대한 적어도 70%, 예를 들어 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 아미노산 동일성이 존재할 수도 있다 ("강한 상동성"). 상동성은 상기 기재된 바와 같이 결정된다. 변이체는 서열 2 및 4에 관하여 상기에 논의된 방식 중 임의의 것으로 야생형 서열과 상이할 수 있다.
특히, 변이체는 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168의 단편을 포함할 수 있다. 이러한 단편은 폴리뉴클레오티드 결합 활성을 보유한다. 단편은 적어도 약 200, 적어도 약 300, 적어도 약 400, 적어도 약 500, 적어도 약 600, 적어도 약 650, 적어도 약 700, 적어도 약 800, 적어도 약 900 또는 적어도 약 1000개 아미노산 길이일 수 있다. 단편의 길이는 야생형 서열의 길이에 좌우될 것이다. 하기에서 보다 상세하게 논의되는 바와 같이, 단편은 바람직하게는 관련 야생형 서열의 RecD-유사 모티프 I 및/또는 RecD-유사 모티프 V를 포함한다.
상기에 논의된 바와 같이, TraI 헬리카제 및 TraI 하위군 헬리카제는 릴랙사제 도메인을 포함한다. 릴랙사제 도메인은 MobF 모티프 III 또는 MobQ 모티프 III을 포함하고, 전형적으로 TraI 헬리카제 또는 TraI 하위군 헬리카제의 아미노 (N) 말단에서 발견된다. TraI 헬리카제 및 TraI 하위군 헬리카제의 바람직한 단편, 예컨대 서열 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168의 바람직한 단편은 야생형 서열의 N 말단 도메인이 결여된다. N-말단 도메인은 전형적으로 대략 단백질의 N 말단 3/1에 상응한다. 서열 61 (1756개 아미노산 길이인 것)에서, N-말단 도메인은 전형적으로 약 500 내지 약 700개 아미노산 길이, 예컨대 약 550 내지 약 600개 아미노산 길이이다. 서열 65, 69 및 73 (각각 970, 943 및 960개 아미노산 길이인 것)에서, N-말단 도메인은 전형적으로 약 300 내지 약 350개 아미노산 길이, 예컨대 약 320 내지 약 340개 아미노산 길이이다.
서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168의 아미노산 서열에 대한 아미노산 치환, 예를 들어 1, 2, 3, 4, 5, 10, 20 또는 30개 이하의 치환이 이루어질 수 있다. 치환은 바람직하게는 상기에 논의된 바와 같은 보존적 치환이다. 1개 이상의 치환이 서열 41의 아미노산 위치 K555, R554, T644, R647, P666, M667, H646, N604, N596, Y598, V470, G391, H409, T407, R410 및 Y414에서 이루어질 수 있다. 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168에서, 치환은 서열 41의 아미노산 위치 K555, R554, T644, R647, P666, M667, H646, N604, N596, Y598, V470, G391, H409, T407, R410 및 Y414에 상응하는 하나 이상의 아미노산 위치에서 이루어질 수 있다. 다양한 단백질 서열에서 상응하는 아미노산 위치를 결정하는 것은 간단하다. 예를 들어, 단백질은 그의 상동성을 기준으로 하여 정렬될 수 있다. 상동성은 상기에 논의된 바와 같이 결정할 수 있다.
서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체, 예컨대 단편은 바람직하게는 관련 야생형 서열의 RecD-유사 모티프 I (또는 RecD 모티프 I) 및/또는 RecD-유사 모티프 V (또는 RecD 모티프 V)를 포함한다. 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체, 예컨대 단편은 바람직하게는 관련 야생형 서열의 RecD-유사 모티프 I (또는 RecD 모티프 I) 및 RecD-유사 모티프 V (또는 RecD 모티프 V)를 포함한다. 예를 들어, 서열 18의 변이체는 바람직하게는 RecD 모티프 I GGPGTGKT (서열 19) 및 RecD 모티프 V WAVTIHKSQG (서열 20)를 포함한다. 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 각각의 RecD-유사 모티프 I 및 V (또는 RecD 모티프 I 및 V)를 표 5 및 7에 나타낸다. 그러나, 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체는 다양한 야생형 서열로부터의 RecD-유사 모티프 I (또는 RecD 모티프 I) 및/또는 RecD-유사 모티프 V (또는 RecD 모티프 V)를 포함할 수 있다. 예를 들어, 서열 28 또는 서열 35의 변이체는 서열 21의 RecD 모티프 I 및 RecD-유사 모티프 V (각각 GGPGTGKS 및 YALTVHRAQG; 서열 22 및 23)를 포함할 수 있다. 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체는 표 5 및 7에 나타낸 바람직한 모티프 중 어느 하나를 포함할 수 있다. 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42, 44, 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체는 또한 관련 야생형 서열의 RecD-유사 모티프 I 및 V 내부의 변형을 포함할 수 있다. 적합한 변형은 2개의 모티프를 정의할 때의 상기에 논의되어 있다. 상기 단락에서의 논의가 서열 61, 65, 69, 73, 74, 82, 86, 90, 94, 98, 102, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168에서의 MobF 모티프 III 및 서열 78 및 106에서의 MobQ 모티프 III에 대해 동등하게 적용된다. 특히, 서열 61, 65, 69, 73, 74, 82, 86, 90, 94, 98, 102, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체, 예컨대 단편은 바람직하게는 관련 야생형 서열의 MobF 모티프 III을 포함한다. 서열 78 또는 106의 변이체, 예컨대 단편은 바람직하게는 관련 야생형 서열의 MobQ 모티프 III을 포함한다. 서열 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나의 변이체, 예컨대 단편은 바람직하게는 관련 야생형 서열의 RecD-유사 모티프 I (또는 RecD 모티프 I), RecD-유사 모티프 V (또는 RecD 모티프 V) 및 MobF 또는 MobQ 모티프 III을 포함한다.
헬리카제는 기공에 공유적으로 부착될 수 있다. 헬리카제는 바람직하게는 기공에 공유적으로 부착되지 않는다. 기공 및 헬리카제에 대한 전압의 인가는 전형적으로 표적 폴리뉴클레오티드를 서열분석할 수 있는 센서를 형성시킨다. 이것은 하기에서 보다 상세하게 논의한다.
본원에 기재된 단백질 중 임의의 것, 즉 막횡단 단백질 기공 또는 RecD 헬리카제는, 예를 들어 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙타비딘 태그, 플래그 태그, SUMO 태그, GST 태그 또는 MBP 태그의 부가에 의해, 또는 세포로부터의 그의 분비를 촉진하기 위한 신호 서열의 부가에 의해 (폴리펩티드는 이러한 서열을 자연적으로 함유하지 않음) 변형되어 그의 확인 또는 정제를 보조할 수 있다. 유전적 태그를 도입하는 것에 대한 대안은 태그를 기공 또는 헬리카제 상의 천연 또는 조작된 위치 상에서 화학적으로 반응시키는 것이다. 이의 예는 겔-시프트 시약을 기공의 외부 상에서 조작된 시스테인에 대해 반응시키는 것일 것이다. 이는 용혈소 헤테로-올리고머를 분리하는 방법으로서 입증되어 있다 (문헌 [Chem Biol. 1997 Jul;4(7):497-505]).
기공 및/또는 헬리카제는 표식 표지로 표지될 수 있다. 표식 표지는 기공이 검출되게 하는 임의의 적합한 표지일 수 있다. 적합한 표지는 형광 분자, 방사성 동위원소, 예를 들어 125I, 35S, 효소, 항체, 항원, 폴리뉴클레오티드 및 리간드, 예컨대 비오틴을 포함하지만, 이에 제한되지는 않는다.
단백질은 합성에 의해 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 기공 및/또는 헬리카제는 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 기공 및/또는 헬리카제의 아미노산 서열은 비-자연 발생 아미노산을 포함하거나 또는 단백질의 안정성을 증가시키도록 변형될 수 있다. 단백질이 합성 수단에 의해 생산되는 경우에, 이러한 아미노산은 생산 동안에 도입될 수 있다. 기공 및/또는 헬리카제는 합성 또는 재조합 생산 후에 변경될 수도 있다.
기공 및/또는 헬리카제는 D-아미노산을 사용하여 생산될 수도 있다. 예를 들어, 기공 또는 헬리카제는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 이러한 단백질 또는 펩티드를 생산하기 위해 당업계에서 통상적인 것이다.
기공 및/또는 헬리카제는 다른 비-특이적 변형이 기공 형성 또는 헬리카제 기능을 방해하지 않는 한, 이를 함유할 수도 있다. 다수의 비-특이적 측쇄 변형이 당업계에 공지되어 있고, 단백질(들)의 측쇄에 대해 이루어질 수 있다. 이러한 변형은, 예를 들어 알데히드와의 반응 후 NaBH4로의 환원에 의한 아미노산의 환원성 알킬화, 메틸아세트이미데이트로의 아미딘화 또는 아세트산 무수물로의 아실화를 포함한다.
기공 및 헬리카제는 당업계에 공지된 표준 방법을 사용하여 생산될 수 있다. 기공 또는 헬리카제를 코딩하는 폴리뉴클레오티드 서열은 당업계에서의 표준 방법을 사용하여 유도 및 복제될 수 있다. 기공 또는 헬리카제를 코딩하는 폴리뉴클레오티드 서열은 당업계에서의 표준 기술을 사용하여 박테리아 숙주 세포에서 발현될 수 있다. 기공 및/또는 헬리카제는 재조합 발현 벡터로부터의 폴리펩티드의 계내 발현에 의해 세포에서 생산될 수 있다. 발현 벡터는 임의로 유도성 프로모터를 보유하여 폴리펩티드의 발현을 제어한다. 이들 방법은 문헌 [Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY]에 기재되어 있다.
기공 및/또는 헬리카제는 단백질 생산 유기체로부터의 임의의 단백질 액체 크로마토그래피 시스템에 의한 정제 후에, 또는 재조합 발현 후에 대규모로 생산될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템은 FPLC, AKTA 시스템, 바이오-캐드(Bio-Cad) 시스템, 바이오-래드 바이오로직(Bio-Rad BioLogic) 시스템 및 길슨(Gilson) HPLC 시스템을 포함한다.
본 발명의 방법은 표적 폴리뉴클레오티드의 하나 이상의 특징을 측정하는 것을 포함한다. 방법은 표적 폴리뉴클레오티드의 2, 3, 4 또는 5개 또는 그 초과의 특징을 측정하는 것을 포함할 수 있다. 하나 이상의 특징은 바람직하게는 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 정체, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택된다. (i) 내지 (v)의 임의의 조합을 본 발명에 따라 측정할 수 있다.
(i)의 경우에, 폴리뉴클레오티드의 길이는 표적 폴리뉴클레오티드와 기공 사이의 상호작용의 개수를 사용하여 측정할 수 있다.
(ii)의 경우에, 폴리뉴클레오티드의 정체는 다수의 방식으로 측정할 수 있다. 폴리뉴클레오티드의 정체는 표적 폴리뉴클레오티드의 서열을 측정하면서 또는 표적 폴리뉴클레오티드의 서열을 측정하지 않으면서 측정할 수 있다. 전자는 간단하고; 폴리뉴클레오티드를 서열분석함으로써 확인한다. 후자는 여러 방식으로 수행할 수 있다. 예를 들어, (폴리뉴클레오티드의 나머지 서열을 측정하지 않으면서) 폴리뉴클레오티드 내의 특정한 모티프의 존재를 측정할 수 있다. 대안적으로, 방법에서의 특정한 전기 및/또는 광학 신호의 측정은 표적 폴리뉴클레오티드를 특정한 공급원으로부터 나오는 것으로서 확인할 수 있다.
(iii)의 경우에, 폴리뉴클레오티드의 서열은 이전에 기재된 바와 같이 결정될 수 있다. 적합한 서열분석 방법, 특히 전기 측정을 사용하는 것은 문헌 [Stoddart D et al., Proc Natl Acad Sci, 12;106(19):7702-7, Lieberman KR et al., J Am Chem Soc. 2010;132(50):17961-72], 및 국제 출원 WO 2000/28312에 기재되어 있다.
(iv)의 경우에, 2차 구조는 다양한 방식으로 측정할 수 있다. 예를 들어, 방법이 전기 측정을 포함하는 경우에, 2차 구조는 체류 시간에서의 변화 또는 기공을 통해 흐르는 전류에서의 변화를 사용하여 측정할 수 있다. 이는 단일-가닥 및 이중-가닥 폴리뉴클레오티드의 영역이 구별되도록 한다.
(v)의 경우에, 임의의 변형의 존재 또는 부재를 측정할 수 있다. 방법은 바람직하게는 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 손상에 의해, 하나 이상의 단백질로, 또는 하나 이상의 표지, 태그 또는 스페이서로 변형되었는지의 여부를 결정하는 것을 포함한다. 특정 변형은 기공과의 특정 상호작용을 생성할 것이고, 이는 하기 기재된 방법을 사용하여 측정할 수 있다. 예를 들어, 메틸시토신은 그의 각각의 뉴클레오티드와의 상호작용 동안에 기공을 통해 흐르는 전류에 기반하여 시토신과 구별될 수 있다.
다양한 상이한 유형의 측정이 이루어질 수 있다. 이는 제한 없이 전기 측정 및 광학 측정을 포함한다. 가능한 전기 측정은 전류 측정, 임피던스 측정, 터널링(tunnelling) 측정 (문헌 [Ivanov AP et al., Nano Lett. 2011 Jan 12;11(1):279-85]), 및 FET 측정 (국제 출원 WO 2005/124888)을 포함한다. 광학 측정은 전기 측정과 조합될 수 있다 (문헌 [Soni GV et al., Rev Sci Instrum. 2010 Jan;81(1):014301]). 측정은 막횡단 전류 측정, 예컨대 기공을 통해 흐르는 이온 전류의 측정일 수 있다.
전기 측정은 문헌 [Stoddart D et al., Proc Natl Acad Sci, 12;106(19):7702-7, Lieberman KR et al., J Am Chem Soc. 2010;132(50):17961-72], 및 국제 출원 WO-2000/28312에 기재된 바와 같은 표준 단일 채널 기록 장치를 사용하여 이루어질 수 있다. 대안적으로, 전기 측정은, 예를 들어 국제 출원 WO-2009/077734 및 국제 출원 WO-2011/067559에 기재된 바와 같은 다중-채널 시스템을 사용하여 이루어질 수 있다.
바람직한 실시양태에서, 방법은
(a) 표적 폴리뉴클레오티드를 막횡단 기공 및 RecD 헬리카제와 접촉시켜, 표적 폴리뉴클레오티드가 기공을 통해 이동하고 RecD 헬리카제가 기공을 통한 표적 뉴클레오티드의 이동을 제어하도록 하는 단계; 및
(b) 폴리뉴클레오티드가 기공에 대해 이동할 때, 표적 뉴클레오티드의 하나 이상의 특징을 나타내는, 기공을 통과하는 전류를 측정함으로써 표적 폴리뉴클레오티드를 특성화하는 단계
를 포함한다.
방법은 기공이 막 내로 삽입된 막/기공 시스템을 조사하는데 적합한 임의의 장치를 사용하여 수행할 수 있다. 방법은 막횡단 기공 센싱에 적합한 임의의 장치를 사용하여 수행할 수 있다. 예를 들어, 장치는 수용액을 포함하는 챔버 및 챔버를 2개의 섹션으로 분리하는 장벽을 포함한다. 장벽은 기공을 함유하는 막이 형성된 개구부를 갖는다.
방법은 국제 출원 번호 PCT/GB08/000562 (WO 2008/102120)에 기재된 장치를 사용하여 수행할 수 있다.
방법은 폴리뉴클레오티드가 기공에 대해 이동할 때 기공을 통과하는 전류를 측정하는 것을 포함할 수 있다. 따라서, 장치는 또한 전위를 인가할 수 있고 막 및 기공을 가로지르는 전기 신호를 측정할 수 있는 전기 회로를 포함할 수 있다. 방법은 패치 클램프 또는 전압 클램프를 사용하여 수행할 수 있다. 방법은 바람직하게는 전압 클램프의 사용을 포함한다.
본 발명의 방법은 폴리뉴클레오티드가 기공에 대해 이동할 때 기공을 통과하는 전류를 측정하는 것을 포함할 수 있다. 막횡단 단백질 기공을 통한 이온 전류를 측정하는데 적합한 조건은 당업계에 공지되어 있고, 실시예에 개시되어 있다. 방법은 전형적으로 막 및 기공을 가로지르는 전압을 인가하면서 수행한다. 사용되는 전압은 전형적으로 +2 V 내지 -2 V, 전형적으로 -400 mV 내지 +400 mV이다. 사용되는 전압은 바람직하게는 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20 mV 및 0 mV로부터 선택되는 하한치 및 +10 mV, +20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV로부터 독립적으로 선택되는 상한치를 갖는 범위이다. 사용되는 전압은 보다 바람직하게는 100 mV 내지 240 mV 범위이고, 가장 바람직하게는 120 mV 내지 220 mV 범위이다. 증가된 인가 전위를 사용함으로써 기공에 의한 상이한 뉴클레오티드 간의 구별을 증가시키는 것이 가능하다.
방법은 전형적으로 임의의 전하 운반체, 예컨대 금속 염, 예를 들어 알칼리 금속 염, 할라이드 염, 예를 들어 클로라이드 염, 예컨대 알칼리 금속 클로라이드 염의 존재 하에 수행한다. 전하 운반체는 이온성 액체 또는 유기 염, 예를 들어 테트라메틸 암모늄 클로라이드, 트리메틸페닐 암모늄 클로라이드, 페닐트리메틸 암모늄 클로라이드, 또는 1-에틸-3-메틸 이미다졸륨 클로라이드를 포함할 수 있다. 상기에 논의된 예시적인 장치에서, 염은 챔버 내 수용액 중에 존재한다. 염화칼륨 (KCl), 염화나트륨 (NaCl) 또는 염화세슘 (CsCl)이 전형적으로 사용된다. KCl이 바람직하다. 염 농도는 포화일 수 있다. 염 농도는 3M 이하일 수 있고, 전형적으로 0.1 내지 2.5 M, 0.3 내지 1.9 M, 0.5 내지 1.8 M, 0.7 내지 1.7 M, 0.9 내지 1.6 M 또는 1 M 내지 1.4 M이다. 염 농도는 바람직하게는 150 mM 내지 1 M이다. 상기에 논의된 바와 같이, RecD 헬리카제는 놀랍게도 높은 염 농도 하에서 작동한다. 방법은 바람직하게는 적어도 0.3 M, 예컨대 적어도 0.4 M, 적어도 0.5 M, 적어도 0.6 M, 적어도 0.8 M, 적어도 1.0 M, 적어도 1.5 M, 적어도 2.0 M, 적어도 2.5 M 또는 적어도 3.0 M의 염 농도를 사용하여 수행한다. 높은 염 농도는 높은 신호 대 노이즈 비를 제공하고, 정상적인 전류 변동의 배경값에 대비하여 뉴클레오티드의 존재를 나타내는 전류가 확인되도록 한다.
방법은 전형적으로 완충제의 존재 하에 수행한다. 상기에 논의된 예시적인 장치에서, 완충제는 챔버 내 수용액 중에 존재한다. 임의의 완충제가 본 발명의 방법에서 사용될 수 있다. 전형적으로, 완충제는 HEPES이다. 또 다른 적합한 완충제는 트리스-HCl 완충제이다. 방법은 전형적으로 pH 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5에서 수행한다. 사용되는 pH는 바람직하게는 약 7.5이다.
방법은 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃, 또는 20℃ 내지 60℃에서 수행할 수 있다. 방법은 전형적으로는 실온에서 수행한다. 방법은 임의로 효소 기능을 지지하는 온도, 예컨대 약 37℃에서 수행한다.
방법은 전형적으로 헬리카제의 작용을 용이하게 하는 유리 뉴클레오티드 또는 유리 뉴클레오티드 유사체 및 효소 보조인자의 존재 하에 수행한다. 유리 뉴클레오티드는 상기에 논의된 임의의 개별적 뉴클레오티드 중 하나 이상일 수 있다. 유리 뉴클레오티드는 아데노신 모노포스페이트 (AMP), 아데노신 디포스페이트 (ADP), 아데노신 트리포스페이트 (ATP), 구아노신 모노포스페이트 (GMP), 구아노신 디포스페이트 (GDP), 구아노신 트리포스페이트 (GTP), 티미딘 모노포스페이트 (TMP), 티미딘 디포스페이트 (TDP), 티미딘 트리포스페이트 (TTP), 우리딘 모노포스페이트 (UMP), 우리딘 디포스페이트 (UDP), 우리딘 트리포스페이트 (UTP), 시티딘 모노포스페이트 (CMP), 시티딘 디포스페이트 (CDP), 시티딘 트리포스페이트 (CTP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시아데노신 디포스페이트 (dADP), 데옥시아데노신 트리포스페이트 (dATP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시구아노신 디포스페이트 (dGDP), 데옥시구아노신 트리포스페이트 (dGTP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시티미딘 디포스페이트 (dTDP), 데옥시티미딘 트리포스페이트 (dTTP), 데옥시우리딘 모노포스페이트 (dUMP), 데옥시우리딘 디포스페이트 (dUDP), 데옥시우리딘 트리포스페이트 (dUTP), 데옥시시티딘 모노포스페이트 (dCMP), 데옥시시티딘 디포스페이트 (dCDP) 및 데옥시시티딘 트리포스페이트 (dCTP)를 포함하지만, 이에 제한되지는 않는다. 유리 뉴클레오티드는 바람직하게는 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 유리 뉴클레오티드는 바람직하게는 아데노신 트리포스페이트 (ATP)이다. 효소 보조인자는 헬리카제가 기능하게 하는 인자이다. 효소 보조인자는 바람직하게는 2가 금속 양이온이다. 2가 금속 양이온은 바람직하게는 Mg2 +, Mn2 +, Ca2 + 또는 Co2+이다. 효소 보조인자는 가장 바람직하게는 Mg2 +이다.
표적 폴리뉴클레오티드는 임의의 순서로 RecD 헬리카제 및 기공과 접촉시킬 수 있다. 표적 폴리뉴클레오티드를 RecD 헬리카제 및 기공과 접촉시킬 때, 표적 폴리뉴클레오티드가 먼저 헬리카제와 복합체를 형성하는 것이 바람직하다. 기공을 가로지르는 전압이 인가되면, 표적 폴리뉴클레오티드/헬리카제 복합체는 기공과 복합체를 형성하고, 기공을 통한 폴리뉴클레오티드의 이동을 제어한다.
상기에 논의된 바와 같이, RecD 헬리카제는 기공에 대해 2가지 방식으로 작동할 수 있다. 첫째로, 바람직하게는 RecD 헬리카제가 표적 서열을 인가된 전압으로부터 생성되는 전계와 함께 기공을 통해 이동시키도록 그것을 사용하여 방법을 수행한다. 상기 방식에서는, DNA의 5' 단부가 먼저 기공에 포획되고, 효소는 DNA를 기공 내로 이동시켜 최종적으로 표적 서열이 이중층의 트랜스 측으로 전위될 때까지 그것을 전계와 함께 기공에 통과시킨다. 대안적으로, 바람직하게는 효소가 표적 서열을 인가된 전압으로부터 생성되는 전계에 대항하여 기공을 통해 이동시키도록 방법을 수행한다. 상기 방식에서는, DNA의 3' 단부가 먼저 기공에 포획되고, 효소는 DNA를 기공을 통해 이동시켜 최종적으로 표적 서열이 이중층의 시스 측으로 다시 나올 때까지 그것을 인가된 전계에 대항하여 기공 외부로 잡아당긴다.
본 발명의 방법은 가장 바람직하게는 MspA로부터 유도된 기공 및 서열 61에 나타낸 서열 또는 그의 변이체를 포함하는 헬리카제를 포함한다. MspA 및 서열 61에 관하여 상기에 논의된 실시양태 중 임의의 것을 조합하여 사용할 수 있다.
다른 방법
본 발명은 또한 표적 폴리뉴클레오티드를 특성화하기 위한 센서를 형성하는 방법을 제공한다. 방법은 기공과 RecD 헬리카제 사이에 복합체를 형성하는 것을 포함한다. 복합체는 기공과 헬리카제를 표적 폴리뉴클레오티드의 존재 하에 접촉시킨 다음, 기공을 가로지르는 전위를 인가함으로써 형성할 수 있다. 인가된 전위는 상기에 기재된 바와 같은 화학 전위 또는 전압 전위일 수 있다. 대안적으로, 복합체는 기공을 헬리카제에 공유적으로 부착시킴으로써 형성할 수 있다. 공유적으로 부착시키는 방법은 당업계에 공지되어 있고, 예를 들어 국제 출원 번호 PCT/GB09/001679 (WO 2010/004265로서 공개됨) 및 PCT/GB10/000133 (WO 2010/086603으로서 공개됨)에 개시되어 있다. 복합체는 표적 폴리뉴클레오티드를 특성화하기 위한 센서이다. 방법은 바람직하게는 Msp로부터 유도된 기공과 RecD 헬리카제 사이에 복합체를 형성하는 것을 포함한다. 본 발명의 방법에 관하여 상기에 논의된 실시양태 중 임의의 것이 상기 방법에 대해 동등하게 적용된다.
키트
본 발명은 또한 표적 폴리뉴클레오티드를 특성화하기 위한 키트를 제공한다. 키트는 (a) 기공 및 (b) RecD 헬리카제를 포함한다. 본 발명의 방법에 관하여 상기에 논의된 실시양태 중 임의의 것이 키트에 대해 동등하게 적용된다.
키트는 친양쪽성 층, 예컨대 지질 이중층을 형성하는데 필요한 막의 성분, 예컨대 인지질을 추가로 포함할 수 있다.
본 발명의 키트는 상기에 언급된 실시양태 중 임의의 것을 수행할 수 있게 하는 하나 이상의 다른 시약 또는 기기를 추가로 포함할 수 있다. 이러한 시약 또는 기기는 하기 중 하나 이상을 포함한다: 적합한 완충제(들) (수용액), 대상체로부터 샘플을 수득하는 수단 (예컨대 바늘을 포함하는 용기 또는 기기), 폴리뉴클레오티드를 증폭 및/또는 발현시키는 수단, 상기에 정의된 바와 같은 막, 또는 전압 또는 패치 클램프 장치. 시약은 키트에 건조 상태로 존재하여, 유체 샘플로 시약을 재현탁시킬 수 있다. 키트는 또한 임의로, 키트를 본 발명의 방법에 사용할 수 있도록 하는 지침서 또는 방법을 사용할 수 있는 환자에 관한 상세사항을 포함할 수 있다. 키트는 임의로 뉴클레오티드를 포함할 수 있다.
장치
본 발명은 또한 표적 폴리뉴클레오티드를 특성화하기 위한 장치를 제공한다. 장치는 다수의 기공 및 다수의 RecD 헬리카제를 포함한다. 장치는 바람직하게는 본 발명의 방법을 수행하기 위한 지침서를 추가로 포함한다. 장치는 폴리뉴클레오티드 분석을 위한 임의의 통상적인 장치, 예컨대 어레이 또는 칩일 수 있다. 본 발명의 방법에 관하여 상기에 논의된 실시양태 중 임의의 것이 본 발명의 장치에 대해 동등하게 적용가능하다.
장치는 바람직하게는 본 발명의 방법을 수행하도록 설정된다.
장치는 바람직하게는
막 및 다수의 기공을 지지할 수 있고, 기공 및 헬리카제를 사용한 폴리뉴클레오티드 특성화를 수행하도록 작동할 수 있는 센서 장치;
특성화를 수행하기 위한 물질을 보유하기 위한 적어도 하나의 저장소;
물질을 적어도 하나의 저장소로부터 센서 장치로 제어가능하게 공급하도록 구성된 유체공학 시스템; 및
각각의 샘플을 수용하기 위한 다수의 용기
를 포함하며, 유체공학 시스템은 샘플을 선별적으로 용기로부터 센서 장치로 공급하도록 구성된다. 장치는 국제 출원 번호 PCT/GB08/004127 (WO 2009/077734로서 공개됨), PCT/GB10/000789 (WO 2010/122293으로서 공개됨), 국제 출원 번호 PCT/GB10/002206 (아직 공개되지 않음) 또는 국제 출원 번호 PCT/US99/25679 (WO 00/28312로서 공개됨)에 기재된 것 중 임의의 것일 수 있다.
기공 없는 특성화
일부 실시양태에서, 표적 폴리뉴클레오티드는 RecD 헬리카제를 사용하지만 기공을 사용하지 않고 부분적으로 또는 완전히 서열분석되는 것과 같이 특성화된다. 특히, 본 발명은 또한 표적 폴리뉴클레오티드를 RecD 헬리카제와 접촉시켜, RecD 헬리카제가 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 것을 포함하는, 표적 폴리뉴클레오티드를 특성화하는 방법을 제공한다. 상기 방법에서, 표적 폴리뉴클레오티드는 바람직하게는 기공, 예컨대 막횡단 기공과 접촉되지 않는다. 방법은 RecD 헬리카제가 폴리뉴클레오티드의 이동을 제어할 때, 하나 이상의 측정을 수행함으로써 표적 뉴클레오티드를 특성화하는 것을 포함한다. 측정은 표적 폴리뉴클레오티드의 하나 이상의 특징을 나타낸다. 임의의 이러한 측정은 본 발명에 따라 수행할 수 있다. 이들은 제한 없이 전기 측정 및 광학 측정을 포함한다. 이들은 상기에 상세하게 논의되어 있다. 본 발명의 기공-기반 방법에 관하여 상기에 논의된 실시양태 중 임의의 것을 기공이 결여된 방법에서 사용할 수 있다. 예를 들어, 상기에 논의된 RecD 헬리카제 중 임의의 것을 사용할 수 있다.
본 발명은 또한 RecD 헬리카제를 포함하는 분석 장치를 제공한다. 본 발명은 또한 (a) 표적 폴리뉴클레오티드를 특성화하기 위한 분석 장치 및 (b) RecD 헬리카제를 포함하는, 표적 폴리뉴클레오티드를 특성화하기 위한 키트를 제공한다. 이들 장치 및 키트는 바람직하게는 기공, 예컨대 막횡단 기공을 포함하지 않는다. 적합한 장치는 상기에 논의되어 있다.
하기 실시예는 본 발명을 예시한다.
실시예 1
본 실시예는 나노기공을 통한 무손상 DNA 가닥의 이동을 제어하기 위한 TraI 헬리카제 (TraI Eco; 서열 61)의 용도를 예시한다. 본 실시예 전반에 걸쳐 사용된 일반적 방법 및 기질은 도 1에 나타내고, 도면 설명에 기재되어 있다.
물질 및 방법
PhiX174의 ~400 bp 단편을 증폭시키도록 프라이머를 설계하였다. 이들 프라이머의 각각의 5'-단부는 단독중합체 스트레치 또는 10개 뉴클레오티드의 단독중합체 섹션의 반복 단위인 50개 뉴클레오티드의 비-상보적 영역을 포함하였다. 이들은 나노기공을 통한 가닥의 제어된 전위에 대한 식별자로서, 뿐만 아니라 전위의 방향성을 결정하는 역할을 한다. 또한, 정방향 프라이머의 5'-단부는 "캡핑"되어 4개의 2'-O-메틸-우라실 (mU) 뉴클레오티드를 포함하였고, 역방향 프라이머의 5'-단부는 화학적으로 인산화되었다. 이어서, 이들 프라이머 변형은 람다 엑소뉴클레아제를 사용하여 안티센스 가닥만 우세하게 제어적으로 소화되게 한다. mU 캡핑은 센스 가닥을 뉴클레아제 소화로부터 보호하는 반면, 안티센스 가닥의 5'에서의 PO4는 이를 촉진한다. 따라서, 람다 엑소뉴클레아제와의 인큐베이션 후, 듀플렉스의 센스 가닥만이 이제는 단일 가닥 DNA (ssDNA)로서 무손상으로 유지된다. 이어서, 생성된 ssDNA를 이전에 기재된 바와 같이 PAGE 정제하였다.
본원에 기재된 모든 실험에서 사용된 DNA 기질 설계는 도 1b에 나타낸다. DNA 기질은 나노기공에 의한 포획을 보조하기 위한 50T 5'-리더를 갖는, PhiX로부터의 ssDNA의 400개 염기 섹션 (서열 172)으로 이루어진다. 3' 콜레스테롤 태그를 함유하는 프라이머 (서열 173)는 50T 리더 바로 뒤에서 상기 가닥에 어닐링되어 이중층의 표면 상에서 DNA를 풍부화시키고, 이에 따라 포획 효율을 개선시킨다. 추가적 프라이머 (서열 174)를 가닥의 3' 단부를 향해 사용하여 3' 단부에 의한 가닥의 포획을 보조한다.
완충 용액: 400 mM NaCl, 10 mM Hepes, pH 8.0, 1 mM ATP, 1 mM MgCl2, 1 mM DTT
나노기공: 이.콜라이(E. coli) MS(B2)8 MspA ONLP3476 MS-(L88N/D90N/D91N/D93N/D118R/D134R/E139K)8
효소: TraI Eco (서열 61; ONLP3572, ~4.3 μM) 23.3 μl -> 100 nM 최종.
1,2-디피타노일-글리세로-3-포스포콜린 지질 (아반티 폴라 리피즈(Avanti Polar Lipids)) 이중층 내에 삽입된 단일 MspA 나노기공으로부터 전기 측정을 획득하였다. 몬탈-뮐러 기술을 통해 (맞춤 델린(Delrin) 챔버에서) 20 μm 두께의 PTFE 필름에서 ~100 μm 직경의 개구부에 걸쳐 이중층을 형성하여, 2개의 1 mL 완충 용액을 분리시켰다. 모든 실험은 언급된 완충 용액 중에서 수행하였다. 1440A 디지타이저(digitizer)가 장착된 악소패치(Axopatch) 200B 증폭기 (몰레큘라 디바이시스(Molecular Devices)) 상에서 단일-채널 전류를 측정하였다. Ag/AgCl 전극을 완충 용액에 연결하여, 시스 구획 (나노기공 및 효소/DNA 둘 다가 부가된 것)이 악소패치 헤드스테이지의 바닥에 연결되고, 트랜스 구획이 헤드스테이지의 활성 전극에 연결되도록 하였다. 이중층에서 단일 기공을 달성한 후, DNA 폴리뉴클레오티드 및 헬리카제를 50μL의 완충제에 첨가하고, 5분 동안 예비-인큐베이션하였다 (DNA = 12.0 nM, 효소 = 2 μM). 상기 예비-인큐베이션 믹스를 전기생리학 챔버의 시스 구획 내의 950 μL의 완충제에 첨가하여, MspA 나노기공에서의 헬리카제-DNA 복합체의 포획을 개시하였다 (DNA = 0.6 nM, 효소 = 0.1 μM의 최종 농도를 제공함). 필요에 따라 2가 금속 (1 mM MgCl2) 및 NTP (1 mM ATP)를 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시하였다. 실험은 +140 mV의 일정한 전위에서 수행하였다.
결과 및 논의
도 1에 나타낸 바와 같이 헬리카제-DNA 기질을 MspA 나노기공에 부가하는 것은 도 2 및 3에 나타낸 바와 같이 특징적인 전류 차단을 생성한다. 헬리카제가 결합되지 않은 DNA는 나노기공과 일시적으로 상호작용하여 전류에서의 단기적인 차단을 생성한다 (<< 1초). 헬리카제가 결합되고 활성인 (즉, ATPase 작용 하에 DNA 가닥을 따라 이동하는) DNA는 도 2 및 3에 나타낸 바와 같이 전류에서의 단계적 변화와 함께 긴 특징적인 차단 수준을 생성한다. 나노기공 내의 상이한 DNA 모티프는 특유의 전류 차단 수준을 생성한다. 주어진 기질에 대해, 본 발명자들은 DNA 서열을 반영하는 전류 전이의 특징적인 패턴을 관찰하였다 (도 3에서의 예).
도 1에 나타낸 실행에서, DNA 가닥은 DNA가 가닥에 따른 무작위 위치에서 헬리카제와 함께 포획될 때 무작위 출발점으로부터 서열분석된다.
염 내성
상기 유형의 나노기공 가닥 서열분석 실험은 일반적으로 이온성 염을 필요로 한다. 이온성 염은 전압 오프셋을 인가하여 DNA를 포획하고 전위시키며 DNA가 나노기공을 통과할 때 생성된 서열 의존성 전류 변화를 측정하기 위한 전도성 용액을 생성시키는데 필요하다. 측정 신호는 이온의 농도에 의존적이므로, 획득되는 신호의 규모를 증가시키기 위해 높은 이온성 염 농도를 사용하는 것이 유리하다. 나노기공 서열분석을 위해, 100 mM KCl을 초과하는 염 농도가 이상적이고, 400 mM KCl 이상의 염 농도가 바람직하다.
그러나, 다수의 효소 (일부 헬리카제 및 DNA 모터 단백질 포함)는 높은 염 조건에 내성이 아니다. 높은 염 조건 하에, 효소는 언폴딩되거나 또는 구조적 완전성을 상실하거나, 또는 적절하게 기능하지 못한다. 공지 및 연구되어 있는 헬리카제에 대한 현재의 문헌은 거의 모든 헬리카제가 대략 100 mM KCl/NaCl 초과의 염 농도에서 기능하지 못한다는 것을 나타내고, 400 mM KCl 이상의 조건에서 정확한 활성을 나타내는 것으로 보고된 헬리카제는 존재하지 않는다. 내염성 종으로부터의 유사한 효소의 잠재적 호염성 변이체가 존재하지만, 이는 표준 발현 시스템 (예를 들어, 이. 콜라이)에서의 발현 및 정제가 매우 어렵다.
본 발명자들은 놀랍게도 본 실시예에서 TraI가 염의 매우 높은 수준까지 염 내성을 나타내는 것을 보여주었다. 본 발명자들은 형광 실험 또는 나노기공 실험에서 효소가 400 mM KCl 내지 1M KCl의 염 농도에서 기능성을 유지한다는 것을 발견하였다.
정방향 및 역방향 작동 방식
대부분의 헬리카제는 단방향 방식으로 단일-가닥 폴리뉴클레오티드 기질을 따라 이동하여, 턴오버된 각각의 NTPase에 대해 특정 개수의 염기를 이동시킨다. 헬리카제 이동을 다양한 방식으로 이용하여 제어된 방식으로 나노기공을 통해 DNA를 공급할 수 있다. 도 1은 2가지 기본적인 '정방향' 및 '역방향' 작동 방식을 예시한다. 정방향 방식에서, DNA는 DNA가 인가된 전계의 힘 하에 이동할 때와 동일한 방향으로 헬리카제에 의해 기공 내로 공급된다. 상기 방향은 트랜스 화살표에 의해 나타낸다. 5'-3' 헬리카제인 TraI에 대해, 이것은 헬리카제가 나노기공의 상부와 접촉할 때까지 나노기공에서 DNA의 5' 단부를 포획하는 것을 필요로 하고, 이어서 DNA를 헬리카제의 제어 하에 인가된 전위로부터의 전계와 함께, 즉 시스로부터 트랜스로 이동시키면서 나노기공 내로 공급한다. 역방향 방식은 DNA의 3' 단부를 포획하는 것을 필요로 하고, 이후 헬리카제는 꿰어진 DNA를 인가된 전위로부터의 전계에 대항하여, 즉 트랜스로부터 시스로 이동시키면서 나노기공 외부로 다시 잡아당기는 것을 진행시킨다. 도 1은 TraI Eco를 사용한 이들 2가지 작동 방식을 나타낸다.
실시예 2
본 실시예는 효소 활성을 시험하기 위한 형광 검정을 사용하여 RecD 헬리카제의 염 내성을 예시한다.
맞춤 형광 기질을 사용하여, 혼성화된 dsDNA를 전치시키는 헬리카제의 능력을 검정하였다 (도 4a). 도 4a의 1)에 나타낸 바와 같이, 형광 기질 가닥 (50 nM 최종)은 5' ssDNA 오버행, 및 혼성화된 dsDNA의 40개 염기 섹션을 갖는다. 상부의 주 가닥은 3' 단부에 카르복시플루오레세인 염기를 갖고, 혼성화된 상보체는 5' 단부에 블랙-홀 켄처 (BHQ-1) 염기를 갖는다. 혼성화되었을 때, 플루오레세인으로부터의 형광은 국부 BHQ-1에 의해 켄칭되고, 기질은 본질적으로 비-형광성이 된다. 형광 기질의 더 짧은 가닥에 상보적인 1 μM의 포획 가닥이 검정에 포함된다. 2)에 나타낸 바와 같이, ATP (1 mM) 및 MgCl2 (10 mM)의 존재 하에, 기질에 부가된 헬리카제 (100 nM)는 형광 기질의 5' 꼬리에 결합하고, 주 가닥을 따라 이동하고, 나타낸 바와 같이 상보적 가닥을 전치시킨다. 3)에 나타낸 바와 같이, BHQ-1을 갖는 상보적 가닥이 완전히 전치되면, 주 가닥 상의 플루오레세인이 형광을 발한다. 4)에 나타낸 바와 같이, 과량의 포획 가닥은 상보적 DNA에 우선적으로 어닐링되어, 초기 기질의 재-어닐링 및 형광 상실을 방지한다.
기질 DNA: 3' 단부 근처에 카르복시플루오레세인을 갖는 서열 175 및 5' 단부에 블랙-홀 켄처-1을 갖는 서열 176
포획 DNA: 서열 177
도 4b의 그래프는 100 mM 내지 1 M의 다양한 농도의 KCl을 함유하는 완충 용액 (100 mM Hepes pH 8.0, 1 mM ATP, 10 mM MgCl2, 50 nM 형광 기질 DNA, 1 μM 포획 DNA)에서의 2개의 RecD 헬리카제 (RecD Nth 및 Dth, 서열 28 및 35) 활성의 초기 비율을 나타낸다. 헬리카제는 1 M에서 작동한다.
실시예 3
본 실시예에서는, 상이한 TraI 헬리카제, 즉 TrwC Cba (서열 65)를 사용하였다. 모든 실험은 동일한 실험 조건 (기공 = MspA B2, DNA = 400량체 서열 172, 173 및 174, 완충제 = 400mM KCl, 10mM Hepes pH 8.0, 1mM DTT, 1mM ATP, 1mM MgCl2) 하에 이전에 실시예 1에 기재된 바와 같이 수행하였다. 도 5는 상기 효소를 사용한 헬리카제 제어된 DNA 사건의 2가지 전형적인 예를 나타낸다.
실시예 4
본 실시예에서는, 다수의 상이한 TrwC 헬리카제 (TrwC (Atr) (서열 144), TrwC (Sal) (서열 140), TrwC (Ccr) (서열 136) 및 TrwC (Eco) (서열 74))를 MspA 나노기공 (MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8, 즉 G75S/G77S/L88N/Q126R을 갖는 8 x 서열 2를 통한 DNA (서열 178, 179 (3' 단부에 /iSp18//iSp18//iSp18//iSp18//iSp18//iSp18/TT/3CholTEG/를 가짐) 및 180)의 이동을 제어하는 그의 능력에 대해 조사하였다.
물질 및 방법
완충 용액: TrwC (Atr), TrwC (Eco) 및 TrwC (CcR)에 대해 pH 8.0의, TrwC (Sal)에 대해 pH 9.0의 625mM KCl, 75mM K 페로시아나이드, 25mM K 페리시아나이드, 100mM Hepes.
효소: 모두 최종 농도 100 nM인 TrwC (Atr) (100 nM) 또는 TrwC (Sal) (100 nM) 또는 TrwC (Ccr) (100 nM) 또는 TrwC (Eco) (100 nM)
백금 전극을 Ag/AgCl 대신에 사용한 것을 제외하고, 실시예 1에 기재된 바와 같이 1,2-디피타노일-글리세로-3-포스포콜린 지질 (아반티 폴라 리피즈) 이중층 내에 삽입된 단일 MspA 나노기공으로부터 전기 측정을 획득하였다. 이중층에서 단일 기공을 달성한 후, MgCl2 (10 mM) 및 dTTP (TrwC (Atr), TrwC (Ccr) 및 TrwC (Eco)에 대해 5 mM) 또는 ATP (TrwC (Sal)에 대해 1 mM)를 시스 챔버에 첨가하고, 대조 실험을 +120 mV의 인가된 전위에서 5분 동안 실행하였다. DNA 폴리뉴클레오티드 (서열 179 및 180에 혼성화된 서열 178, 0.1 nM)를 시스 챔버에 첨가하고, 또 다른 대조 실험을 +120 mV의 인가된 전위에서 5분 동안 실행하였다. 최종적으로, 적절한 헬리카제 (모두 최종 농도 100 nM로 첨가되는 TrwC (Atr), TrwC (Sal), TrwC (Ccr) 또는 TrwC (Eco))를 전기생리학 챔버의 시스 구획에 첨가하여, MspA 나노기공에서의 헬리카제-DNA 복합체의 포획을 개시하였다. 실험은 +120 mV의 일정한 전위에서 수행하였다.
결과 및 논의
조사한 각각의 헬리카제에 대해 헬리카제 제어된 DNA 이동이 관찰되었다. 트레이스의 예는 각각 도 6-9에 나타낸다.
실시예 5
본 실시예에서는, 다수의 상이한 TrwC 헬리카제 (TrwC (Oma) (서열 106), TrwC (Afe) (서열 86), 및 TrwC (Mph) (서열 94))를 MspA 나노기공 (MS-(G75S/G77S/L88N/D90N/D91N/D93N/D118R/Q126R/D134R/E139K)8, 즉 G75S/G77S/L88N/Q126R을 갖는 8 x 서열 2를 통한 DNA (TrwC (Oma)에 대해 서열 172 내지 174, 및 TrwC (Afe) 및 TrwC (Mph)에 대해 서열 182 (3' 단부에 콜레스테롤 태그를 가짐)에 혼성화된 서열 181)의 이동을 제어하는 그의 능력에 대해 조사하였다.
완충 용액: 625mM KCl, 75mM K 페로시아나이드, 25mM K 페리시아나이드, 100mM Hepes, pH8.0
효소: 모두 최종 농도 100 nM인 TrwC (Oma), TrwC (Afe), 및 TrwC (Mph)
백금 전극을 Ag/AgCl 대신에 사용한 것을 제외하고, 실시예 1에 기재된 바와 같이 1,2-디피타노일-글리세로-3-포스포콜린 지질 (아반티 폴라 리피즈) 이중층 내에 삽입된 단일 MspA 나노기공으로부터 전기 측정을 획득하였다. 이중층에서 단일 기공을 달성한 후, MgCl2 (10 mM)를 시스 챔버에 첨가하고, 대조 실험을 120 mV의 인가된 전위에서 5분 동안 실행하였다. 최종 0.15 nM의 DNA 폴리뉴클레오티드 (TrwC (Oma)에 대해 서열 172 내지 174 (실시예 1에서와 같음), 또는 TrwC (Afe) 및 TrwC (Mph)에 대해 서열 182에 혼성화된 서열 181) 및 최종 100 nM의 적절한 헬리카제 (TrwC (Oma), TrwC (Afe), 및 TrwC (Mph))를 시스 챔버에 첨가하고, 또 다른 대조 실험을 +120 mV의 인가된 전위에서 10분 동안 실행하였다. 최종적으로, ATP (1 mM)를 전기생리학 챔버의 시스 구획에 첨가함으로써 헬리카제 ATPase 활성을 개시하였다. 실험은 +120 mV의 일정한 전위에서 실행했다.
결과 및 논의
조사한 각각의 헬리카제에 대해 헬리카제 제어된 DNA 이동이 관찰되었다. 트레이스의 예는 각각 도 10-12에 나타낸다.
SEQUENCE LISTING
<110> OXFORD NANOPORE TECHNOLOGIES LIMITED
<120> ENZYME METHOD
<130> N115505A
<150> US 61/581,332
<151> 2011-12-29
<160> 182
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> Artificial sequence
<220>
<223> MspA (D90N, D91N, D93N, D118R, D134R and E139K)
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> Artificial sequence
<220>
<223> MspA (D90N, D91N, D93N, D118R, D134R and E139K)
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> Artificial sequence
<220>
<223> a-hemolysin-E111N/K147N
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> Artificial sequence
<220>
<223> a-hemolysin-E111N/K147N
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> Mycobacterium smegmatis
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> Mycobacterium smegmatis
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> Mycobacterium smegmatis
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = G, S or A
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = P, A, S or G
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = T, A, V, S or C
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa = G or A
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa = K or R
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa = T or S
<400> 8
Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
1 5
<210> 9
<211> 25
<212> PRT
<213> Artificial sequence
<220>
<223> Extended RecD-like motif I
<220>
<221> MISC_FEATURE
<222> (2)..(17)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa = G, S or A
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = P, A, S or G
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = T, A, V, S or C
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = G or A
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = K or R
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = T or S
<400> 9
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
20 25
<210> 10
<211> 26
<212> PRT
<213> Artificial sequence
<220>
<223> Extended RecD-like motif I
<220>
<221> MISC_FEATURE
<222> (2)..(18)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = G, S or A
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa = P, A, S or G
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = T, A, V, S or C
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = G or A
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = K or A
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa = T or S
<400> 10
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
20 25
<210> 11
<211> 27
<212> PRT
<213> Artificial sequence
<220>
<223> Extended RecD-like motif I
<220>
<221> MISC_FEATURE
<222> (2)..(19)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = G, S or A
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = P, A, S or G
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = T, A, V, S or C
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = G or A
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa = K or R
<220>
<221> MISC_FEATURE
<222> (27)..(27)
<223> Xaa = T or S
<400> 11
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa
20 25
<210> 12
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD motif I
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = T, V or C
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa = T or S
<400> 12
Gly Gly Pro Gly Xaa Gly Lys Xaa
1 5
<210> 13
<211> 25
<212> PRT
<213> Artificial sequence
<220>
<223> Extended RecD motif I
<220>
<221> MISC_FEATURE
<222> (2)..(17)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = T, V or C
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa = T or S
<400> 13
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Gly Gly Pro Gly Xaa Gly Lys Xaa
20 25
<210> 14
<211> 26
<212> PRT
<213> Artificial sequence
<220>
<223> Extended RecD motif I
<220>
<221> MISC_FEATURE
<222> (2)..(18)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = T, V or C
<220>
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa = T or S
<400> 14
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Gly Gly Pro Gly Xaa Gly Lys Xaa
20 25
<210> 15
<211> 27
<212> PRT
<213> Artificial sequence
<220>
<223> Extended RecD motif I
<220>
<221> MISC_FEATURE
<222> (2)..(19)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa = T, V or C
<220>
<221> MISC_FEATURE
<222> (27)..(27)
<223> Xaa = T or S
<400> 15
Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Gly Gly Pro Gly Xaa Gly Lys Xaa
20 25
<210> 16
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = Y, W or F
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = A, T, S, M, C or V
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = T, N or S
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = A, T, G, S, V or I
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa = G or S
<400> 16
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gln Xaa
1 5 10
<210> 17
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD motif V
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa = Y, W or F
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa = A, M, C or V
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa = I, M or L
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = T or S
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = V or I
<400> 17
Xaa Xaa Xaa Xaa Xaa His Lys Ser Gln Gly
1 5 10
<210> 18
<211> 753
<212> PRT
<213> Acaryochloris marina
<400> 18
Met Pro Ser Ser Ser Ala His Pro Gly Ser Pro Pro Ile Glu Gln Leu
1 5 10 15
Gln Gly Val Val Glu Arg Leu Thr Phe His Ser Asp Glu Ser Gly Tyr
20 25 30
Thr Val Ala Arg Leu Lys Ala Pro Arg Thr Arg Glu Leu Ile Thr Ile
35 40 45
Val Gly Ser Phe Ala Asn Ile Gln Ala Gly Gln Thr Leu Gln Leu Gln
50 55 60
Gly Ile Trp Arg Asp His Pro Lys Tyr Gly Pro Gln Phe Gln Val Lys
65 70 75 80
Gln Tyr Lys Glu Thr Lys Pro Ala Thr Leu Thr Gly Ile Glu Lys Tyr
85 90 95
Leu Gly Ser Gly Leu Ile Lys Gly Val Gly Pro Val Thr Ala Lys Arg
100 105 110
Ile Val Ala His Phe Gly Leu Asp Thr Leu Asp Ile Ile Glu Thr His
115 120 125
Ile Glu Arg Leu Ile Glu Val Pro Gly Ile Ala Lys Lys Arg Val Lys
130 135 140
Leu Ile Gln Thr Ala Leu Asp Ser Gln Lys Ala Ile Lys Glu Val Met
145 150 155 160
Val Phe Leu Gln Gly His Gly Val Ser Thr Thr Tyr Ala Val Lys Ile
165 170 175
Phe Lys Gln Tyr Gly Asp Glu Ser Ile Glu Thr Val Thr His Asn Pro
180 185 190
Tyr Arg Leu Ala Thr Asp Val Tyr Gly Ile Gly Phe Val Thr Ala Asp
195 200 205
Glu Ile Ala Arg Ser Leu Gly Ile Ser Pro His Ser Glu Tyr Arg Tyr
210 215 220
Arg Ser Gly Leu Leu His Val Leu Ser Glu Ser Ala Glu Glu Gly His
225 230 235 240
Cys Tyr Leu Pro Gln Pro Glu Leu Ile Asp Arg Ala Val Lys Arg Leu
245 250 255
Ala Leu Pro Asp Tyr Gln Pro Lys Pro Asp Gln Val Glu Tyr Leu Ile
260 265 270
His Ala Met Ile Ser Asp Ala Glu Leu Ile Val Glu Arg Leu Thr His
275 280 285
Glu Gly Ser Thr Lys Leu Leu Cys Tyr Ala Pro Pro Phe Phe Gln Ala
290 295 300
Glu Phe His Leu Ser Arg Arg Val Leu Gln Leu Leu Ala Ser Ser Leu
305 310 315 320
Val Val Asp Asn Glu Arg Val Arg Ala Trp Leu Asp Arg Phe Met Ala
325 330 335
Gln Thr Asp Val Ser Leu Ser Lys Gln Gln Gln Gln Ala Val Glu Met
340 345 350
Ala Ala Ser Gln Arg Val Val Ile Leu Thr Gly Gly Pro Gly Thr Gly
355 360 365
Lys Thr Phe Thr Thr Arg Thr Ile Val Ala Leu Trp Lys Ala Met Gly
370 375 380
Lys Asp Ile Val Leu Ala Ser Pro Thr Gly Arg Ala Ala Gln Arg Leu
385 390 395 400
Ser Glu Val Thr Gly His Glu Ala Lys Thr Ile His Arg Leu Leu Glu
405 410 415
Phe Asp Pro Lys Thr Met Lys Phe Gln Arg Asn Ser Asp Asn Pro Ile
420 425 430
Pro Ala Asp Ala Val Val Ile Asp Glu Ala Ser Met Leu Asp Leu Phe
435 440 445
Leu Ala Asn Ser Leu Ile Lys Ala Ile Asp Thr Asn Ala Gln Leu Leu
450 455 460
Leu Val Gly Asp Thr Asp Gln Leu Pro Ser Val Gly Pro Gly Asn Val
465 470 475 480
Leu Leu Asp Leu Ile Thr Ser Gly Arg Ile Pro Ile Ile Glu Leu Thr
485 490 495
Glu Val Phe Arg Gln Ala Gln Ala Ser His Ile Ile Arg Asn Ala His
500 505 510
Arg Ile Asn Gln Gly Gln Phe Pro Asn Leu Glu Ser Val Ser Pro Ser
515 520 525
Pro Lys Thr Asp Cys Leu Trp Leu Gly Ala Pro Glu Pro Glu Asn Gly
530 535 540
Val Gln Ala Ile Gln Glu Leu Ile Asn Asp Leu Leu Pro Glu Leu Gly
545 550 555 560
Phe Gln Pro Ala Arg Asp Val Gln Val Leu Cys Pro Met Thr Arg Gly
565 570 575
Glu Val Gly Thr Arg Lys Leu Asn Gln Val Leu Gln Ala Leu Ile Asn
580 585 590
Pro Pro Cys Pro Asp Lys Pro Glu Leu Thr Arg Gly Gly Leu Ile Leu
595 600 605
Arg Val Gly Asp Arg Val Leu Gln Gln Val Asn Asp Tyr Asn Arg Glu
610 615 620
Val Phe Asn Gly Asp Met Gly Val Ile Glu Asp Ile Asn Leu Glu Glu
625 630 635 640
Ile Glu Val Thr Val His Tyr Ala Glu Arg Ser Val Ser Tyr Asp Leu
645 650 655
Ala Asp Leu Asn Glu Ile Gly Leu Ala Trp Ala Val Thr Ile His Lys
660 665 670
Ser Gln Gly Ser Glu Tyr Pro Val Val Ile Leu Pro Leu Tyr Met Gln
675 680 685
His Tyr Ile Met Leu Ser Arg Asn Leu Leu Tyr Thr Gly Leu Thr Arg
690 695 700
Ala Lys Lys Leu Ala Ile Leu Val Gly Pro Lys Asn Ala Ile Ser Met
705 710 715 720
Ala Ile Arg Gln Ile Lys Asp Arg Gln Arg Tyr Thr Leu Leu Glu Arg
725 730 735
Arg Leu Gly Gly Val Pro Lys Ala Asn Glu Ser Leu Ala Ser Ala Ile
740 745 750
Leu
<210> 19
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD motif I of RecD2 Ama
<400> 19
Gly Gly Pro Gly Thr Gly Lys Thr
1 5
<210> 20
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Ama
<400> 20
Trp Ala Val Thr Ile His Lys Ser Gln Gly
1 5 10
<210> 21
<211> 710
<212> PRT
<213> Deinococcus deserti
<400> 21
Met Ser His Ala Leu Pro Asn Glu Pro Phe Arg Val Thr Gly Gly Val
1 5 10 15
Asn Lys Val Arg Phe Arg Ala Glu Ser Gly Phe Thr Val Met Thr Ala
20 25 30
Arg Leu Arg Asn Asn Asp Gly Glu Asp Pro Asp Ala Thr Val Ile Gly
35 40 45
Met Met Pro Pro Leu Asp Ala Gly Asp Ser Phe Ser Ala Asp Val Leu
50 55 60
Met Glu Glu His Arg Glu Tyr Gly Tyr Gln Tyr Arg Val Leu Asn Leu
65 70 75 80
Val Leu Glu Ala Thr Pro Ala Asp Leu Thr Glu Ala Gly Val Ala Ala
85 90 95
Tyr Leu Glu Ala Arg Val Gly Gly Val Gly Lys Val Leu Ala Gly Arg
100 105 110
Ile Ala Lys Ala Phe Gly Pro Ala Thr Phe Asp Leu Leu Glu Thr Glu
115 120 125
Pro Asp Lys Leu Leu Gln Val Pro Gly Val Thr Ala Ser Thr Leu His
130 135 140
Lys Met Val Gln Ser Trp Ser Gln Gln Gly Leu Glu Arg Arg Leu Leu
145 150 155 160
Ala Gly Leu Gln Gly Leu Gly Leu Thr Ile Ser Gln Ala Gln Arg Ala
165 170 175
Val Lys His Phe Gly Glu Ala Ala Leu Glu Arg Leu Thr Ala Asp Leu
180 185 190
Phe Ala Leu Thr Glu Val Glu Gly Ile Gly Phe Leu Thr Ala Asp Lys
195 200 205
Leu Trp Gln Ser Gln Gly Gly Ala Leu Asp Asp Ala Arg Arg Leu Thr
210 215 220
Ala Ala Ala Val Tyr Ala Leu Gln Gln Ala Ala Gln Gln Gly Gly His
225 230 235 240
Ser Tyr Leu Pro Arg Ser Arg Ala Glu Arg Gly Val Ala His Tyr Thr
245 250 255
Arg Val Thr Gln Ala Gln Ala Gln Met Ala Val Asp Thr Ala Val Glu
260 265 270
Leu Gly Arg Leu Ser Asp Asp Thr Pro Pro Leu Leu Asp Thr Gln Asp
275 280 285
Pro Leu His Asp Gly Thr Arg Ile Tyr Leu Pro His Val Leu Arg Ala
290 295 300
Glu Lys Lys Leu Ala Gly Leu Ile Arg Thr Leu Leu Ala Thr Pro Pro
305 310 315 320
Ser Gly Glu Trp Ser Val Pro Ala Gly Ala Ser Lys Gly Leu Ser Glu
325 330 335
Glu Gln Ala Gln Ile Leu Asp Leu Leu Glu Asp His Arg Leu Val Val
340 345 350
Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr Thr Thr Arg Ala Val
355 360 365
Ala Asp Leu Ala Glu Arg Leu Gly Leu Glu Val Gly Leu Cys Ala Pro
370 375 380
Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val Thr Gly Arg Thr Ala
385 390 395 400
Ser Thr Ile His Arg Leu Leu Gly Tyr Gly Pro Ala Gly Phe Arg His
405 410 415
Asn His Leu Glu Pro Ala Pro Tyr Asp Leu Leu Ile Val Asp Glu Val
420 425 430
Ser Met Cys Gly Asp Gly Leu Met Leu Ser Leu Leu Ala Ala Val Pro
435 440 445
Pro Gly Ser Arg Val Leu Leu Val Gly Asp Thr Asp Gln Leu Pro Pro
450 455 460
Val Asp Ala Gly Leu Pro Leu His Ala Leu Thr His Ala Ala Pro Thr
465 470 475 480
Val Arg Leu Thr Gln Val Tyr Arg Gln Ala Ala Glu Asn Pro Ile Ile
485 490 495
Arg Ala Ala His Gly Leu Leu Gln Gly Gln Ala Pro Ala Trp Gly Asp
500 505 510
Pro Arg Leu Asn Leu Ile Glu Thr Glu Pro Asp Gly Gly Ala Arg Arg
515 520 525
Val Ala Leu Thr Val Arg Glu Leu Gly Gly Pro Thr Gln Val Gln Val
530 535 540
Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Val Glu Met Leu Asn His
545 550 555 560
Gln Leu Gln Ser Leu Phe Asn Pro Gly Gln Gly Gly Val Arg Ile Gly
565 570 575
Asp Ser Glu Ala Arg Ala Gly Asp Val Val Val Gln Thr Lys Asn Asp
580 585 590
Tyr Thr Asn Glu Ile Phe Asn Gly Thr Leu Gly Thr Val Leu Lys Ala
595 600 605
Glu Gly Gly Arg Leu Thr Val Asp Phe Asp Gly Asn Ile Val Asp Leu
610 615 620
Ala Gly Ala Glu Leu Phe Asn Leu Gln Leu Gly Tyr Ala Leu Thr Val
625 630 635 640
His Arg Ala Gln Gly Ser Glu Trp Gly Thr Val Leu Gly Val Leu His
645 650 655
Glu Ala His Met Pro Met Leu Ser Arg Asn Leu Val Tyr Thr Ala Leu
660 665 670
Thr Arg Ala Arg Glu Arg Phe Tyr Ala Val Gly Ser Ala Thr Ser Trp
675 680 685
Gln Lys Ala Ala Val Arg Gln Arg Glu Glu Arg Asn Thr Ala Leu Leu
690 695 700
Glu Arg Ile Lys Ala Arg
705 710
<210> 22
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD motif I of RecD2 Dde
<400> 22
Gly Gly Pro Gly Thr Gly Lys Ser
1 5
<210> 23
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Dde
<400> 23
Tyr Ala Leu Thr Val His Arg Ala Gln Gly
1 5 10
<210> 24
<211> 726
<212> PRT
<213> Deinococcus geothermalis
<400> 24
Met Arg Glu Pro Pro Gly Val Phe Pro Ser Arg Gly Val Arg Ala Arg
1 5 10 15
Lys Gly Ala Ile Leu Ala Gly Met Ser Ala Gly Leu Pro Thr Glu Pro
20 25 30
Phe Arg Val Thr Gly Gly Val Asn Lys Val Arg Phe Arg Ala Glu Ser
35 40 45
Gly Phe Thr Val Met Ser Ala Arg Leu Arg Asn Ala Glu Gly Glu Asp
50 55 60
Pro Asp Ala Thr Val Ile Gly Val Met Pro Pro Leu Glu Val Gly Asp
65 70 75 80
Ser Phe Ser Ala Glu Val Leu Met Glu Glu His Arg Glu Tyr Gly His
85 90 95
Gln Tyr Arg Val Leu Asn Met Val Leu Glu Ala Gln Pro Ala Asp Leu
100 105 110
Thr Glu Ala Gly Val Ala Ala Tyr Leu Glu Ala Arg Val Gly Gly Val
115 120 125
Gly Lys Val Leu Ala Gly Arg Ile Ala Arg Thr Phe Gly Pro Ala Thr
130 135 140
Phe Asp Val Leu Glu Gln Glu Pro Glu Lys Leu Leu Gln Val Pro Gly
145 150 155 160
Val Thr Ala Ser Thr Leu His Lys Met Val Ser Ser Trp Ser Gln Gln
165 170 175
Gly Leu Glu Arg Arg Leu Leu Ala Gly Leu Gln Gly Leu Gly Leu Ser
180 185 190
Ile Ser Gln Ala Gln Arg Ala Val Lys His Phe Gly Glu Ala Ala Leu
195 200 205
Glu Arg Leu Gln Ala Asp Leu Phe Ala Leu Thr Glu Val Glu Gly Ile
210 215 220
Gly Phe Leu Thr Ala Asp Arg Leu Trp Gln Ala Gln Gly Gly Ala Gln
225 230 235 240
Asp Asp Pro Arg Arg Leu Thr Ala Ala Ala Val Tyr Ala Leu Gln Gln
245 250 255
Ala Gly Gln Gln Gly Gly His Ala Phe Leu Pro Arg Ala Arg Ala Glu
260 265 270
Arg Gly Val Leu His Tyr Thr Arg Val Ser Pro Glu Gln Ala Arg Leu
275 280 285
Ala Val Glu Thr Ala Thr Glu Leu Gly Arg Leu Ala Asp Asp Pro Thr
290 295 300
Pro Ala Gly Glu Ser Arg Ile Tyr Leu Pro His Val Leu Arg Thr Glu
305 310 315 320
Lys Lys Leu Ala Gly Leu Ile Arg Thr Leu Leu Ala Thr Pro Pro Ala
325 330 335
Gly Ala Glu Trp Ala Val Pro Val Gly Ala Ala Gln Gly Leu Ser Glu
340 345 350
Glu Gln Ala Arg Val Leu Gln Leu Leu Glu Asp His Arg Leu Val Val
355 360 365
Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr Ala Thr Arg Ala Val
370 375 380
Ala Asp Leu Ala Glu Arg Leu Gly Leu Glu Val Gly Leu Cys Ala Pro
385 390 395 400
Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val Thr Gly Arg Pro Ala
405 410 415
Ser Thr Ile His Arg Leu Leu Gly Tyr Gly Pro Ala Gly Phe Arg His
420 425 430
Asn His Leu Glu Pro Ala Pro Tyr Asp Leu Leu Ile Val Asp Glu Val
435 440 445
Ser Met Thr Gly Asp Ala Leu Met Leu Ser Leu Leu Ala Ala Val Ala
450 455 460
Pro Gly Ala Arg Val Leu Leu Val Gly Asp Thr Asp Gln Leu Pro Pro
465 470 475 480
Val Asp Ser Gly Leu Pro Leu Leu Ala Ile Ala Gln Thr Ala Pro Thr
485 490 495
Val Arg Leu Ser Thr Val Tyr Arg Gln Ala Ala Glu Asn Pro Ile Ile
500 505 510
Arg Ala Ala His Gly Leu Leu His Gly Gln Ala Pro Ser Trp Gly Asp
515 520 525
Pro Arg Leu Asp Leu Thr Glu Thr Glu Pro Asp Val Gly Ala Arg Arg
530 535 540
Val Ala Leu Met Val Arg Asp Leu Gly Gly Pro Gly Arg Val Gln Val
545 550 555 560
Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Val Glu Thr Leu Asn Arg
565 570 575
His Leu Gln Ala Leu Phe Asn Pro Gly Glu Gly Gly Thr Arg Ile Ala
580 585 590
Asp Gly Glu Ala Arg Pro Gly Asp Val Val Val Gln Thr Lys Asn Asp
595 600 605
Tyr Gln Asn Glu Val Phe Asn Gly Thr Val Gly Thr Val Leu Lys Ala
610 615 620
Glu Gly Gly Arg Leu Thr Val Asp Phe Asp Gly Asn Ile Val Glu Leu
625 630 635 640
Ala Gly Ala Glu Leu Phe Asn Leu Gln Leu Gly Tyr Ala Leu Thr Val
645 650 655
His Arg Ala Gln Gly Ser Glu Trp Pro Thr Val Leu Gly Val Leu His
660 665 670
Glu Val His Met Pro Met Leu Ser Arg Asn Leu Ala Tyr Thr Ala Leu
675 680 685
Thr Arg Ala Arg Glu Arg Phe Leu Ala Val Gly Ser Ala Ser Ala Trp
690 695 700
Glu Lys Ala Ala Gly Arg Gln Arg Glu Glu Arg Asn Thr Ala Leu Leu
705 710 715 720
Glu Arg Ile Arg Arg Arg
725
<210> 25
<211> 768
<212> PRT
<213> Haliangium ochraceum DSM
<400> 25
Met Ala Gly Ser Pro Gly Asn Gly Pro Arg Thr Glu Arg His Arg Gln
1 5 10 15
Arg Arg Thr Pro Val Ala Asp Asp Pro Ala Gln Thr Gly Ser Val Val
20 25 30
Glu Gly Thr Leu Thr Arg Ile Val Tyr Glu Asn Ala Asp Thr His Trp
35 40 45
Thr Val Ala Arg Val Arg Val Gly Asp Asp Glu Ala Gly Thr Thr Arg
50 55 60
Asp Pro Ala Ala Arg Ala Glu Gly Glu Ile Thr Val Val Gly Ser Met
65 70 75 80
Val Gly Val Ala Pro Gly Thr Pro Leu Arg Leu Arg Gly Thr Trp Glu
85 90 95
Gln His Asn Ser Tyr Gly Arg Gln Phe Arg Val His Ser Tyr Gln Ala
100 105 110
Arg Met Pro Glu Thr Ile Ala Gly Leu Glu Arg Tyr Leu Gly Ser Gly
115 120 125
Glu Phe Arg Gly Ile Gly Pro Glu Leu Ala Lys Arg Ile Val Glu His
130 135 140
Phe Gly Leu Glu Ala Leu Ser Val Ile Glu Lys Ala Pro Lys Arg Leu
145 150 155 160
Gln Glu Val Asp Gly Ile Gly Ala Ala Arg Ala Glu Lys Ile Ala Glu
165 170 175
Ala Trp Thr Ala Gln Arg Asp Val His Asp Val Met Val Phe Leu Arg
180 185 190
Gly Tyr Gly Val Thr Ala Ser Gln Ala Ala Arg Ile His Lys Arg Tyr
195 200 205
Gly Asn Arg Ala Glu Ala Ile Val Arg Glu Asn Pro Tyr Arg Leu Ala
210 215 220
Leu Asp Ile Trp Gly Ile Gly Phe Lys Thr Ala Asp Ser Ile Ala Gln
225 230 235 240
Asn Leu Gly Met Ala Arg Asp Ala Pro Glu Arg Leu Glu Ala Gly Leu
245 250 255
Ile His Val Leu Gly Lys Leu Ala Glu Asp Gly His Val His Val Pro
260 265 270
Glu Pro Asn Leu Leu Asp Thr Ala Ala Gly Ile Leu Glu Val Asp Ala
275 280 285
Met Leu Leu Pro Glu Ala Leu Asp Arg Leu Glu Thr Ser Gln Leu Val
290 295 300
Val Cys Glu Ala Leu Gly Asp Arg Gly Thr Cys Val Ser Leu Thr Phe
305 310 315 320
Leu Trp Gln His Glu Ser Asp Ala Ala Ala Arg Tyr Ala Ala Leu Val
325 330 335
Glu Thr Pro Met Arg Pro Arg Lys Leu Asp Leu Asp Gln Ala Leu Ala
340 345 350
Ala Phe Glu Ala Glu Ala Glu Leu Ala Leu Thr Ala Glu Gln Arg Arg
355 360 365
Ala Ala Leu Ala Ala Val Met Asp Lys Ser Val Val Leu Thr Gly Gly
370 375 380
Pro Gly Val Gly Lys Thr Thr Ile Val Arg Ala Ile Val Phe Leu Phe
385 390 395 400
Glu Arg Leu Gly Arg Ser Val Thr Leu Ala Ala Pro Thr Gly Arg Ala
405 410 415
Ala Lys Arg Leu Ala Glu Ser Thr Ala Arg Asp Ala Ala Thr Ile His
420 425 430
Arg Leu Leu Glu Phe Gln Pro Ala Gly Gly Gly Phe Phe Arg Ser Ala
435 440 445
Asp Asn Pro Leu Asp Ser Asp Val Val Ile Ile Asp Glu Thr Ser Met
450 455 460
Val Asp Ile Ala Leu Leu Ala Ala Leu Leu Asp Ala Met Pro Ala Ser
465 470 475 480
Ala Gln Leu Val Leu Val Gly Asp Ile Asp Gln Leu Pro Ser Val Gly
485 490 495
Pro Gly Ala Val Leu Ala Asp Leu Ile Ala Ser Arg Ala Ala Thr Val
500 505 510
Val Arg Leu Thr Glu Ile Phe Arg Gln Ala Arg Glu Ser Arg Ile Val
515 520 525
Met Ala Ala His Glu Ile Asn Ser Gly Met Val Pro Gln Leu Ala Pro
530 535 540
Pro Gln Gly Thr Ser Ala His Arg Ser Asp Phe Tyr Phe Ile Ser Arg
545 550 555 560
Glu Gln Pro Val Arg Ala Arg Glu Thr Ile Val Asp Leu Val Ala Glu
565 570 575
Arg Ile Pro Glu Ala Phe Gly Phe Asp Pro Leu Ala Asp Ile Gln Val
580 585 590
Leu Cys Pro Val His Arg Gly Glu Leu Gly Thr Ile Ala Leu Asn Arg
595 600 605
Ala Leu Gln Glu Arg Leu Thr Pro Ala Val Asp Glu Gln His Gln Val
610 615 620
Thr Arg Gly Glu Arg Ser Tyr Arg Val Gly Asp Lys Val Met Gln Leu
625 630 635 640
Glu Asn Asp Tyr Asp Arg Gly Val Phe Asn Gly Asp Ile Gly Val Ile
645 650 655
Phe Glu Ile Ala Gly Glu Arg Lys Lys Val Leu Val Asp Tyr Met Asp
660 665 670
Gly Arg Val Val Gly Tyr Glu Ala Arg Asp Leu Asp Gln Leu Thr His
675 680 685
Ala Tyr Ala Ile Ser Val His Lys Ser Gln Gly Ser Glu Tyr Pro Val
690 695 700
Val Val Leu Pro Leu Ala Thr Gln His Tyr Ile Met Leu Gln Arg Asn
705 710 715 720
Leu Leu Tyr Thr Ala Val Thr Arg Gly Lys Ser Leu Val Val Ile Val
725 730 735
Gly Ser Ala Lys Ala Val Arg Arg Ala Val Glu Asn Gln Thr Asn Thr
740 745 750
Ala Arg Trp Thr Trp Leu Ala Glu Arg Ile Arg Glu Gln Leu Gly Glu
755 760 765
<210> 26
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD motif I of RecD2 Hoc
<400> 26
Gly Gly Pro Gly Val Gly Lys Thr
1 5
<210> 27
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Hoc
<400> 27
Tyr Ala Ile Ser Val His Lys Ser Gln Gly
1 5 10
<210> 28
<211> 726
<212> PRT
<213> Natranaerobius thermophilus
<400> 28
Met Glu Met Ala Gln Ile Glu Gly Ile Ile Lys Arg Val Thr Tyr His
1 5 10 15
Asn Pro Glu Asn Met Phe Thr Val Ala Lys Leu Val Thr Gln Glu Thr
20 25 30
Arg Asn Glu Ile Thr Ile Val Gly Asn Met Pro His Leu Thr Pro Gly
35 40 45
Glu Arg Leu Asp Leu Ser Gly Glu Tyr Val Asp His Lys Lys Phe Gly
50 55 60
Lys Gln Phe Gln Val Asp Ser Tyr Glu Ile Lys Leu Pro Val Thr Val
65 70 75 80
Asp Gly Leu Ile Lys Phe Leu Ser Ser Gly Met Ile Lys Gly Ile Gly
85 90 95
Pro Lys Thr Ala Glu Ser Leu Val Glu His Phe Gly Lys Glu Val Leu
100 105 110
Gln Val Ile Glu Asn Thr Pro Glu Lys Leu Gln Glu Val Pro Gly Ile
115 120 125
Gly Lys Glu Lys Ala Ala Gln Ile Ser Arg Gly Phe Gln Glu His Lys
130 135 140
Gln Ile Lys Asp Ile Met Val Phe Leu Gln Glu Phe Gly Val Ser Pro
145 150 155 160
Ala Phe Ala Leu Lys Ile Tyr Arg Arg Phe Gly Asp Asn Thr Ile Gln
165 170 175
Lys Val Ser Glu Asn Pro Tyr Ser Leu Ala Arg Glu Val Phe Gly Ile
180 185 190
Gly Phe Lys Thr Ala Asp Lys Ile Ala Arg Glu Met Gly Val Ser Val
195 200 205
Asp Ser Glu Glu Arg Ala Lys Ala Ala Val Val Tyr Leu Leu Glu Glu
210 215 220
Lys Ser Gln Asp Gly Asn Thr Phe Leu Lys Arg Glu Glu Leu Ile Glu
225 230 235 240
Ala Leu Lys Glu Leu Glu Val Glu Asn Val Asn Leu Asn Ser Val Leu
245 250 255
Glu Glu Leu Val Glu Glu Lys Glu Ile Val Val Glu Asn Ile Pro Glu
260 265 270
Ala Gly Glu Leu Ile Tyr Pro Ala Pro Phe Phe Phe Ala Glu Gln Gly
275 280 285
Ile Ala Ser Arg Leu Lys Arg Leu Lys Asp Gly Val Asp Arg Glu Leu
290 295 300
Phe Pro Arg Ile Gln Lys Ile Ala Glu Lys Tyr Leu Glu Glu Gln Ala
305 310 315 320
Asn Leu Val Leu Ser Pro Glu Gln His Gln Val Ile Lys Gln Val Pro
325 330 335
Glu Thr Gly Leu Met Val Val Thr Gly Gly Pro Gly Thr Gly Lys Thr
340 345 350
Thr Val Ile Lys Cys Leu Met Asp Ile Phe Gln Lys Ala Gly Gln Lys
355 360 365
Val Met Leu Ala Ala Pro Thr Gly Arg Ala Ala Lys Arg Met Ser Glu
370 375 380
Ala Thr Gly Asp Glu Ala Lys Thr Ile His Arg Leu Leu Glu Phe Thr
385 390 395 400
Tyr Asp Lys Glu Glu Gly Met Lys Phe Gln Arg Asn Gln Asp Arg Pro
405 410 415
Leu Lys Gly Asp Leu Leu Ile Val Asp Glu Ala Ser Met Ile Asp Thr
420 425 430
Ile Leu Met Asn Asn Leu Leu Lys Ala Ile Ser Pro Gly Thr Arg Leu
435 440 445
Val Leu Val Gly Asp Thr Asp Gln Leu Pro Ser Val Gly Ala Gly Asn
450 455 460
Val Leu Gln Asp Ile Ile Glu Ser Gly Arg Ile Pro Leu Val Arg Leu
465 470 475 480
Lys Arg Val Phe Arg Gln Ala Arg Glu Ser Met Val Val Val Asn Ala
485 490 495
His Arg Ile Asn Glu Gly Lys Phe Pro Ile Leu Asn Ala Lys Gly Lys
500 505 510
Asp Phe Tyr Phe Leu Pro Arg Glu Glu Pro Glu Asp Val Val Lys Thr
515 520 525
Ile Ile Ser Leu Cys Ala Lys Arg Leu Pro Asn Tyr Asn Gly Tyr His
530 535 540
Pro Val Asn Asp Ile Gln Val Leu Ser Pro Met Arg Arg Thr Val Thr
545 550 555 560
Gly Val Glu Asn Leu Asn Gln Ser Leu Gln Lys Val Leu Asn Pro Pro
565 570 575
Gln Lys Asn Lys Ala Glu Ile Asn Phe Gly Gly Ala Cys Tyr Arg Thr
580 585 590
Gly Asp Lys Val Met Gln Val Lys Asn Asp Tyr Glu Lys Asn Val Phe
595 600 605
Asn Gly Asp Thr Gly Ile Val Thr Lys Val Asp Ala Glu Glu Asn Val
610 615 620
Val Asn Val Arg Tyr Gly His Gly Glu Glu Ile Ala Tyr Glu Gly Arg
625 630 635 640
Glu Leu Asp Ala Leu Val His Ala Tyr Cys Ile Ser Val His Lys Ser
645 650 655
Gln Gly Ser Glu Tyr Pro Val Val Val Leu Pro Val Thr Thr Gln His
660 665 670
Tyr Ile Met Leu Gln Arg Asn Leu Leu Tyr Thr Ala Val Thr Arg Ala
675 680 685
Lys Ser Leu Val Val Leu Val Gly Thr Lys Lys Ser Ile Gly Ile Ala
690 695 700
Ile Ser Asn Lys Lys Thr Asp Glu Arg Asn Thr Phe Leu Gln His Arg
705 710 715 720
Ile Ala Val Tyr Glu Val
725
<210> 29
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Nth
<400> 29
Tyr Cys Ile Ser Val His Lys Ser Gln Gly
1 5 10
<210> 30
<211> 729
<212> PRT
<213> Octadecabacter antarcticus
<400> 30
Met Lys Gln Ser Ala Glu Asn Ser Lys Gln Glu Val Leu Ala Gly Leu
1 5 10 15
Val Glu Arg Val Thr Phe His Ser Leu Glu Ser Gly Phe Cys Val Leu
20 25 30
Arg Leu Lys Ala Arg Gly His Arg Asp Leu Val Thr Thr Ile Gly His
35 40 45
Ala Ala Met Ile Ser Ala Gly Glu Trp Val Thr Ala Ser Gly Asp Trp
50 55 60
Ile Asn Asp Arg Asp His Gly Leu Gln Phe Lys Ala Arg Phe Leu Arg
65 70 75 80
Thr Ser Ala Pro Ser Ser Leu Glu Gly Ile Glu Lys Tyr Leu Gly Ser
85 90 95
Gly Met Ile Arg Gly Ile Gly Pro Val Tyr Ala Lys Arg Met Val Lys
100 105 110
Lys Phe Gly Lys Asp Val Phe Asp Leu Ile Glu Ala Glu Pro Glu Arg
115 120 125
Leu Arg Glu Val Glu Gly Ile Gly Pro Lys Arg Ala Asp Lys Ile Thr
130 135 140
Ser Ala Trp Ala Asp Gln Lys Val Ile Arg Glu Ile Met Val Phe Leu
145 150 155 160
His Glu His Ser Val Gly Thr Ala Arg Ala Val Arg Ile Phe Lys Thr
165 170 175
Tyr Gly Thr Asp Ala Val Gln Val Met Ser Glu Asn Pro Tyr Gln Leu
180 185 190
Ala Arg Asp Ile Arg Gly Ile Gly Phe Arg Thr Ala Asp Met Ile Ala
195 200 205
Glu Lys Leu Gly Ile Glu Lys Thr Ala Met Ile Arg Val Arg Ala Gly
210 215 220
Ile Ser Tyr Ala Leu Thr Glu Ala Met Gly Asn Gly His Cys Gly Leu
225 230 235 240
Pro Arg Gln Glu Leu Ile Pro Leu Ala Ile Lys Leu Leu Asp Val Pro
245 250 255
Asp Glu Leu Ile His Thr Ala Ile Glu Phe Glu Ile Thr Asp Gly Thr
260 265 270
Val Thr Ala Asp Thr Val Ser Asp Thr Pro Cys Val Phe Leu Ser Gly
275 280 285
Leu Tyr His Ala Glu Lys Gly Ile Ala Gly Arg Phe Arg Ala Leu Ile
290 295 300
Ser Gly Ser Leu Pro Trp Pro Lys Ile Asp Ala Asp Lys Ala Leu Pro
305 310 315 320
Trp Val Glu Lys Lys Thr Gly Leu Ala Leu Ala Glu Ser Gln Val Glu
325 330 335
Ala Ile Arg Leu Ala Leu Cys Ser Lys Val Thr Val Ile Thr Gly Gly
340 345 350
Pro Gly Val Gly Lys Thr Thr Ile Val Asn Ser Ile Leu Gln Ile Leu
355 360 365
Ala Ala Lys Ala Val Thr Leu Leu Leu Cys Ala Pro Thr Gly Arg Ala
370 375 380
Ala Lys Arg Met Lys Glu Ala Thr Gly Met Glu Ala Lys Thr Ile His
385 390 395 400
Arg Leu Leu Glu Ile Asp Pro Asn Ser Phe Gly Phe Lys Arg Asn Glu
405 410 415
Glu Asn Pro Leu Glu Cys Asp Leu Leu Val Ile Asp Glu Ser Ser Met
420 425 430
Val Asp Val Ser Leu Met Gln Ser Leu Leu Arg Ala Val Pro Asp His
435 440 445
Ala Ala Val Leu Ile Val Gly Asp Ile Asp Gln Leu Pro Ser Val Gly
450 455 460
Pro Gly Gln Val Leu Ala Asp Ile Ile Gly Ser Asn Ala Ile Pro Ile
465 470 475 480
Val Arg Leu Thr Glu Val Phe Arg Gln Ala Ala Lys Ser Arg Ile Ile
485 490 495
Thr Asn Ala His Leu Ile Asn Lys Gly Lys Thr Pro Asp Leu Ser Thr
500 505 510
Pro Asp Ser Glu Thr Asp Phe Tyr Phe Val Pro Ala Glu Asp Pro Glu
515 520 525
Gln Ala Val Ser Arg Ile Ile Thr Leu Val Gln Ser Arg Ile Pro Lys
530 535 540
Arg Phe Gly Leu Asp Pro Ile Arg Asp Ile Gln Val Leu Cys Pro Met
545 550 555 560
Asn Arg Ser Gly Val Gly Ala Arg Ser Leu Asn Ile Glu Leu Gln Ala
565 570 575
Ala Leu Asn Thr Pro Gly Glu Asn Lys Val Glu Arg Phe Gly Ser Thr
580 585 590
Phe Ala Pro Gly Asp Lys Val Met Gln Ile Glu Asn Asp Tyr Asp Lys
595 600 605
Glu Val Tyr Asn Gly Asp Ile Gly Tyr Val Glu Ser Val Asp Val Asn
610 615 620
Glu Gly Glu Leu Thr Ala Ser Phe Asp Gly Arg Ala Val Ser Tyr Leu
625 630 635 640
Phe Gly Glu Leu Asp Thr Leu Val Leu Ala Tyr Ala Ala Thr Ile His
645 650 655
Lys Ser Gln Gly Ser Glu Tyr Pro Ala Val Val Ile Pro Val Leu Thr
660 665 670
Gln His Tyr Val Met Leu Gln Arg Asn Leu Leu Tyr Thr Gly Ile Thr
675 680 685
Arg Gly Lys Arg Leu Val Val Leu Val Gly Gln Arg Lys Ala Val Ala
690 695 700
Ile Ala Val Lys Asn Val Ser Gly Arg Gln Arg Trp Ser Lys Leu Asn
705 710 715 720
Glu Trp Leu Val Glu Gly Glu Gly Thr
725
<210> 31
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Oan
<400> 31
Tyr Ala Ala Thr Ile His Lys Ser Gln Gly
1 5 10
<210> 32
<211> 741
<212> PRT
<213> Salinispora tropica
<400> 32
Met Ala Asp Val Thr Ala Ala Pro Arg Pro Ala Leu Ala Thr Leu Asp
1 5 10 15
Ala Val Leu Glu Arg Leu Thr Tyr Val Asn Glu Glu Ser Gly Tyr Thr
20 25 30
Val Ala Arg Val Ala Thr Asp Arg Gly Ser Asp Leu Leu Thr Val Val
35 40 45
Gly Ala Leu Leu Gly Ala Gln Pro Gly Glu Ser Leu Arg Leu His Gly
50 55 60
Arg Trp Ser Ser His Pro Lys Tyr Gly Arg Gln Phe Glu Val Asp Ser
65 70 75 80
Tyr Thr Thr Val Leu Pro Ala Thr Ile Gln Gly Ile Gln Arg Tyr Leu
85 90 95
Gly Ser Gly Leu Val Lys Gly Ile Gly Pro Val Phe Ala Glu Arg Ile
100 105 110
Val Ala His Phe Gly Leu Glu Thr Leu Arg Ile Ile Glu Glu Glu Pro
115 120 125
Ala Arg Leu Val Glu Val Pro Gly Leu Gly Pro Lys Arg Thr Ala Lys
130 135 140
Ile Thr Ala Ala Trp Glu Glu Gln Gln Ala Ile Lys Glu Val Met Val
145 150 155 160
Phe Leu Gln Gly Val Gly Val Ser Thr Ser Leu Ala Val Arg Ile Tyr
165 170 175
Lys Gln Tyr Gly Asp Thr Ser Thr Asp Val Val Thr Lys Glu Pro Tyr
180 185 190
Arg Leu Ala Ala Asp Val Trp Gly Ile Gly Phe Lys Thr Ala Asp Thr
195 200 205
Ile Ala Gln Ser Val Gly Ile Pro His Asp Ser Pro Gln Arg Val Met
210 215 220
Ala Gly Leu Gln Tyr Thr Leu Ser Glu Ala Thr Asp Asn Gly His Cys
225 230 235 240
Tyr Leu Pro Glu Pro Glu Leu Ile Ala Asp Ala Thr Lys Ile Leu Asp
245 250 255
Val Pro Ala Asp Leu Val Thr Arg Cys Leu Asp Asp Leu Val Ala Glu
260 265 270
Glu Gly Val Val Arg Glu Ser Leu Pro Gly Gly Asp Ala Glu Pro Val
275 280 285
Arg Ala Val Tyr Leu Val Pro Phe His Arg Ala Glu Arg Ser Leu Ala
290 295 300
Thr Ser Leu Leu Arg Leu Leu Asp Asp Gly Thr Asp Arg Leu Pro His
305 310 315 320
Phe Ala Gly Val Asp Trp Ala Lys Ala Leu Thr Trp Leu Lys Ala Arg
325 330 335
Thr Gly Asn Asp Leu Ala Pro Glu Gln Glu Gln Ala Val Arg Leu Ala
340 345 350
Leu Thr Ser Lys Val Ala Val Leu Thr Gly Gly Pro Gly Cys Gly Lys
355 360 365
Ser Phe Thr Val Arg Ser Ile Val Glu Leu Ala Ala Ala Lys Arg Ala
370 375 380
Lys Val Thr Leu Val Ala Pro Thr Gly Arg Ala Ala Lys Arg Leu Ser
385 390 395 400
Glu Leu Thr Gly His Pro Ala Ala Thr Val His Arg Leu Leu Gln Leu
405 410 415
Arg Pro Gly Gly Asp Ala Ser Tyr Asp Arg Asp Asn Pro Leu Asp Val
420 425 430
Asp Leu Leu Val Val Asp Glu Ala Ser Met Leu Asp Leu Ile Leu Ala
435 440 445
Asn Lys Leu Val Lys Ala Val Pro Pro Gly Ala His Leu Leu Leu Val
450 455 460
Gly Asp Val Asp Gln Leu Pro Ser Val Gly Ala Gly Glu Val Leu Arg
465 470 475 480
Asp Leu Leu Ala Ala Pro Ala Ile Pro Arg Val Arg Leu Thr Gln Ile
485 490 495
Phe Arg Gln Ala Ala Gln Ser Gly Val Val Thr Asn Ala His Arg Ile
500 505 510
Asn Ala Gly Arg Pro Pro Leu Leu Gln Gly Leu Pro Asp Phe Phe Leu
515 520 525
Phe Ala Cys Asp Asp Thr Glu Ala Thr Ala Glu Arg Thr Val Asp Val
530 535 540
Ala Cys Ser Arg Ile Pro Ala Lys Phe Arg Leu Asp Pro Arg Arg Asp
545 550 555 560
Val Gln Val Leu Thr Pro Met His Arg Gly Pro Ala Gly Ser Gly Ala
565 570 575
Leu Asn Thr Leu Leu Gln Gln Arg Leu Thr Pro His Arg Glu Gly Gln
580 585 590
Pro Glu Arg Arg Ala Gly Gly Arg Val Phe Arg Ile Gly Asp Lys Val
595 600 605
Thr Gln Ile Arg Asn Asn Tyr Asp Lys Gly Glu Ala Gly Val Phe Asn
610 615 620
Gly Thr Leu Gly Ile Val Thr Gln Leu Ser Thr Glu Glu Gln Thr Leu
625 630 635 640
Thr Val Arg Thr Asp Glu Asp Glu Ser Ile Asp Tyr Asp Phe Asp Glu
645 650 655
Leu Asp Glu Leu Ala His Ala Tyr Ala Met Thr Ile His Arg Ser Gln
660 665 670
Gly Ser Glu Tyr Pro Ala Val Val Ile Pro Leu Thr Thr Ser Ala Trp
675 680 685
Met Met Leu Gln Arg Asn Leu Leu Tyr Thr Ala Val Thr Arg Ala Lys
690 695 700
Gln Leu Val Val Leu Val Gly Ser Arg Arg Ala Leu Ala Ala Ala Val
705 710 715 720
Arg Thr Val Gly Ala Gly Arg Arg His Thr Ala Leu Asn His Arg Leu
725 730 735
Ala Ala Ala Thr Pro
740
<210> 33
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD motif I of RecD2 Str
<400> 33
Gly Gly Pro Gly Cys Gly Lys Ser
1 5
<210> 34
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Str
<400> 34
Tyr Ala Met Thr Ile His Arg Ser Gln Gly
1 5 10
<210> 35
<211> 732
<212> PRT
<213> Desulfonatronospira thiodismutans
<400> 35
Met Asn Thr Ser Asn Thr Thr Ser Leu Glu Tyr Leu Gln Gly Gln Ile
1 5 10 15
Glu Arg Ile Thr Tyr Thr Asn Glu Glu Asn Gly Tyr Thr Val Ala Lys
20 25 30
Val Lys Val Arg Gly Arg Arg Asp Leu Val Thr Val Val Gly Ser Ile
35 40 45
Ala Ser Pro Leu Ala Gly Gln Val Leu Lys Met Lys Gly Glu Trp Ser
50 55 60
Asn His Pro Lys Phe Gly Glu Gln Phe Lys Ala Val Phe Cys Glu Cys
65 70 75 80
Ala Val Pro Ala Thr Ser Ala Gly Ile Gln Arg Tyr Leu Gly Ser Gly
85 90 95
Leu Ile Lys Gly Ile Gly Pro Val Met Ala Lys Lys Ile Val Ser Leu
100 105 110
Phe Gly Asp Lys Thr Leu Asp Ile Ile Glu His Glu Thr Asp Arg Leu
115 120 125
Thr Glu Val Asp Gly Ile Gly Gln Lys Arg Ile Glu Lys Ile Lys Lys
130 135 140
Ala Trp Glu Glu Gln Lys Glu Ile Arg Glu Val Met Leu Phe Leu Gln
145 150 155 160
Gly His Gly Val Ser Ser Thr Tyr Ala Ser Lys Ile Phe Lys Thr Tyr
165 170 175
Gly Lys Asp Ser Ile Lys Val Val Gln Asp Asn Pro Tyr Arg Leu Ala
180 185 190
Thr Asp Ile Phe Gly Ile Gly Phe Ile Thr Ala Asp Asn Ile Ala Gln
195 200 205
Lys Leu Gly Phe Ser Leu Glu Ser Glu Phe Arg Ile Gln Ala Gly Ile
210 215 220
Leu Tyr Val Leu His Gln Leu Ser Asp Glu Gly His Val Tyr Tyr Pro
225 230 235 240
Arg Gln Asp Leu Ala Arg Lys Ala Ala Glu Ile Leu Lys Val Asp Ala
245 250 255
Glu Leu Val Asp Gln Gln Ile Asp Ser Leu Glu Thr Leu Gln Tyr Ile
260 265 270
Val Met Glu Ser Leu Pro Gln Gln Glu Gln Lys Ala Val Tyr Leu Ala
275 280 285
Lys Tyr Phe Tyr Ser Glu Thr Ser Ile Ala Ala Lys Leu Lys Lys Leu
290 295 300
Ile Lys Ala Pro Lys Ser Ile Arg Gln Val Asp Thr Asp Lys Ala Leu
305 310 315 320
Asp Trp Val Gln Lys Thr Tyr Gly Leu Asn Leu Ala Glu Lys Gln Ala
325 330 335
Glu Ala Val Arg Lys Ala Leu Leu Asp Lys Ile Leu Val Ile Thr Gly
340 345 350
Gly Pro Gly Thr Gly Lys Ser Phe Leu Leu Asn Ala Ile Leu Lys Ile
355 360 365
Val Ser Arg Leu Lys Val Lys Ile Leu Leu Ala Ala Pro Thr Gly Arg
370 375 380
Ala Ala Lys Arg Met Gln Glu Ser Thr Gly Tyr Glu Ala Lys Thr Ile
385 390 395 400
His Arg Leu Leu Glu Phe Asp Phe Gln Lys Gly Gly Phe Lys Lys Asn
405 410 415
Asp Glu His Pro Leu Asn Cys Asp Leu Leu Ile Val Asp Glu Met Ser
420 425 430
Met Val Asp Thr Val Leu Met His His Leu Leu Lys Ala Val Arg Met
435 440 445
Asp Thr Thr Leu Ile Met Val Gly Asp Val Asn Gln Leu Pro Ser Val
450 455 460
Gly Pro Gly Asn Val Leu Lys Asp Ile Ile Asn Ser Gly Ser Val Pro
465 470 475 480
Val Val Glu Leu Asn Glu Ile Phe Arg Gln Ala Arg Glu Ser Ser Ile
485 490 495
Ile Val Asn Ala His Met Ile Asn Gln Gly Arg Leu Pro Val Leu Gln
500 505 510
Pro Arg Gln Asp Lys Leu Asp Asp Phe Phe Phe Met Gln Glu Glu Asp
515 520 525
Pro His Lys Val Leu Glu Lys Ile Lys Tyr Ile Val Met Glu Arg Ile
530 535 540
Pro Gln Arg Phe Lys Leu Asn Pro Ile Asp His Val Gln Val Ile Ser
545 550 555 560
Pro Met Asn Arg Gly Val Val Gly Val Ser Asn Leu Asn Thr Glu Leu
565 570 575
Gln Ala Cys Leu Asn Pro Gln Gly Gln Glu Ile Ile Arg Gly Gly Lys
580 585 590
Thr Phe Arg Gln Gly Asp Lys Val Met Gln Ile Arg Asn Asn Tyr Asp
595 600 605
Lys Glu Val Phe Asn Gly Asp Ile Gly Val Ile Thr Gly Leu Asp Leu
610 615 620
Glu Glu Gln Glu Ile Lys Val Arg Phe Tyr Asp Arg Gln Val Val Tyr
625 630 635 640
Glu Tyr Ser Asp Leu Asp Glu Leu Val Leu Ala Tyr Ala Val Ser Ile
645 650 655
His Lys Ser Gln Gly Ser Asp Tyr Pro Ala Val Val Ile Pro Leu Leu
660 665 670
Thr Gln His Tyr Ile Met Leu Gln Lys Asn Leu Val Tyr Thr Gly Ile
675 680 685
Thr Arg Gly Lys Asn Leu Val Val Val Ile Gly Thr Lys Lys Ala Leu
690 695 700
Ala Ile Ala Val Lys Asn Ala Gly Thr Asn Glu Arg Tyr Thr His Leu
705 710 715 720
Ala Gly Arg Leu Asn His Lys Ile Gln Glu Ile Thr
725 730
<210> 36
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Dth
<400> 36
Tyr Ala Val Ser Ile His Lys Ser Gln Gly
1 5 10
<210> 37
<211> 730
<212> PRT
<213> Nitrosococcus halophilus
<400> 37
Met Lys Pro Pro Leu His Ser Glu Thr Pro Pro Glu Phe Leu Thr Gly
1 5 10 15
Ala Val Glu Arg Val Thr Phe His Ser Glu Glu Asn Gly Phe Cys Val
20 25 30
Leu Arg Ile Lys Val Arg Gly Glu Arg Asp Leu Ile Thr Val Val Gly
35 40 45
Asn Thr Pro Thr Val Thr Pro Gly Glu Tyr Val Glu Cys His Gly Glu
50 55 60
Trp Val Asn Asp Arg Thr His Gly Leu Gln Phe Lys Thr Lys His Leu
65 70 75 80
Arg Val Ile Pro Pro Ser Thr Leu Glu Gly Ile Glu Lys Tyr Leu Gly
85 90 95
Ser Gly Met Val Lys Gly Ile Gly Pro His Phe Ala Lys Lys Leu Val
100 105 110
Gln Ala Phe Gly Glu Gln Val Phe Glu Val Ile Glu His Glu Ser Glu
115 120 125
Arg Leu Thr Glu Leu Asp Gly Ile Gly Pro Lys Arg Lys Glu Gln Val
130 135 140
Ile Gln Ala Trp Ala Glu Gln Arg Val Ile Arg Ala Ile Met Val Phe
145 150 155 160
Leu Gln Ser His Gly Val Gly Ser Ala Arg Ala Val Arg Ile Tyr Lys
165 170 175
Thr Tyr Gly Asp Lys Ala Ile Glu Arg Val Arg Glu Asn Pro Tyr Arg
180 185 190
Leu Ala Leu Asp Ile His Gly Ile Gly Phe Lys Thr Ala Asp Arg Ile
195 200 205
Ala Gln Arg Leu Gly Ile Pro Ala Asp Ser Leu Ile Arg Ala Gln Ala
210 215 220
Gly Val Arg His Val Leu Gln Glu Phe Ala Asn Glu Gly His Cys Ala
225 230 235 240
Met Glu Gln Gly Arg Leu Val Glu Thr Ala Ser Gln Leu Leu Glu Ile
245 250 255
Pro Ala Pro Ile Ile Glu Gln Ala Ile Thr Gln Glu Val Ala Glu Gly
260 265 270
Gln Leu Ile Ala Glu Ile Ile Ala Gly Lys Pro Cys Leu Phe Leu Ala
275 280 285
Pro Leu Tyr Arg Ser Glu Ile Gly Val Ala Lys His Leu Gln Arg Leu
290 295 300
Leu Arg Gly Val Pro Pro Trp Gly Gln Ile Asn Ala Asp Lys Ala Ile
305 310 315 320
Pro Trp Val Glu Ala Lys Thr Gly Leu Leu Leu Ser Pro Ser Gln Arg
325 330 335
Val Ala Leu Ile Gln Thr Ile Asn Asn Lys Ile Thr Val Ile Thr Gly
340 345 350
Gly Pro Gly Val Gly Lys Thr Thr Val Val Asn Ser Ile Leu Arg Ile
355 360 365
Val Arg Ala Lys Gln Thr Gln Val Leu Leu Gly Ala Pro Thr Gly Arg
370 375 380
Ala Ala Lys Arg Leu Ala Glu Ser Thr Gly Leu Glu Ala Lys Thr Ile
385 390 395 400
His Arg Leu Leu Glu Phe Asp Pro His Ala Met Gly Phe Lys His His
405 410 415
Ala Ala Asn Pro Leu Gln Ala Asp Leu Ile Val Ile Asp Glu Val Ser
420 425 430
Met Val Asp Val Gly Leu Met Asn Gln Leu Leu Gln Ala Ile Pro Asn
435 440 445
His Ala Ala Cys Ile Leu Ile Gly Asp Lys Asp Gln Leu Pro Ser Val
450 455 460
Gly Pro Gly Gln Ile Leu Ala Asp Ile Ile Ala Ser Gln Lys Ile Ser
465 470 475 480
Thr Val His Leu Ser Glu Val Phe Arg Gln Ala Ala Ser Ser Lys Ile
485 490 495
Val Val Asn Ala His Arg Ile Asn Gln Gly Lys Met Pro Glu Lys Ala
500 505 510
Asp Glu Ala Ala Thr Leu Ser Asp Phe Tyr Phe Ile Pro Thr Lys Ser
515 520 525
Pro Glu Thr Ile Gln Asp Arg Val Leu Glu Leu Val Thr Ser Arg Ile
530 535 540
Pro Lys Arg Phe Gly Phe Asp Ser Thr Arg Asp Ile Gln Val Leu Thr
545 550 555 560
Pro Met Asn Arg Gly Ser Leu Gly Ala Arg Ala Leu Asn Gly Leu Leu
565 570 575
Gln Gln Gln Leu Asn Gly Gln Ser Gln Pro Lys Ile Asn Arg Phe Gly
580 585 590
Trp Ser Phe Ala Pro Gly Asp Lys Val Ile Gln Thr Val Asn Asn Tyr
595 600 605
Asp Lys Glu Val Phe Asn Gly Asp Ile Gly Arg Ile Thr Arg Ile Ala
610 615 620
Leu Glu Glu Gly Leu Val His Ile Asp Phe Asp Gly Arg Glu Ile Glu
625 630 635 640
Tyr Glu Leu Gly Glu Leu Asp Glu Ile Ala Leu Ala Tyr Ala Thr Ser
645 650 655
Val His Lys Ser Gln Gly Ser Glu Tyr Pro Ala Val Val Ile Pro Leu
660 665 670
Ala Ile Gln His Tyr Thr Leu Leu Gln Arg Asn Leu Leu Tyr Thr Gly
675 680 685
Ile Thr Arg Gly Lys Arg Leu Val Val Leu Val Gly Gln Pro Lys Ala
690 695 700
Leu Ala Ile Ala Val Lys Arg Ile Asn Ser Thr Ala Arg Leu Thr His
705 710 715 720
Leu Ser Ala Arg Leu Ala Asn Ser Gln Ile
725 730
<210> 38
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Nha
<400> 38
Tyr Ala Thr Ser Val His Lys Ser Gln Gly
1 5 10
<210> 39
<211> 728
<212> PRT
<213> Desulfohalobium retbaense
<400> 39
Met Ser Ala Thr Thr Leu Gln Ala Glu Ile Val Ser Ile Val Phe His
1 5 10 15
Asn Pro Glu Asn Asp Tyr Val Val Ala Arg Ala Arg Ala Glu Gly Glu
20 25 30
Pro Gly Gln Ser Thr Val Val Gly Ile Met Pro Gln Val Met Pro Gly
35 40 45
Glu Gln Val Arg Leu Glu Gly Glu Trp Arg Glu His Pro Lys Phe Gly
50 55 60
Arg Gln Phe His Ala Val Ser His Thr Arg Glu Leu Pro Ala Thr Ile
65 70 75 80
Asn Gly Ile Arg Arg Tyr Leu Ala Ser Gly Arg Ile Lys Gly Val Gly
85 90 95
Pro Val Met Ala Glu Arg Leu Val Gln Phe Phe Gly Lys Asp Val Leu
100 105 110
Asp Ile Leu Asp Asn Ala Pro Glu Arg Leu Leu Glu Val Glu Gly Leu
115 120 125
Gly Lys Lys Thr Leu Glu Gly Ile Lys Ala Ser Trp Asp Gln Gln Arg
130 135 140
Glu Val Arg Asn Val Met Leu Phe Leu Gln Ser His Asp Val Pro Pro
145 150 155 160
Thr Tyr Ala Gly Arg Ile Phe Ala Arg Tyr Gly Asn Gln Ala Val Glu
165 170 175
Lys Leu Gln Gln Asn Pro Tyr Glu Leu Ala Tyr Glu Ile Arg Gly Ile
180 185 190
Gly Phe Lys Thr Ala Asp Thr Met Ala Leu Lys Leu Gly Phe Gln Glu
195 200 205
Asp Ser Pro Glu Arg Leu Glu Ala Gly Leu Val Tyr Thr Leu Phe Gln
210 215 220
Phe Ala Glu Gln Gly His Met Phe Tyr Pro Gly Asp Glu Leu Val His
225 230 235 240
Lys Val Thr Glu Thr Leu Gly Val Gly Asp Thr Gly Lys Val Asp Gly
245 250 255
Ala Leu Ala Arg Leu Glu Glu Arg Lys Arg Val Val Val Glu Asp Leu
260 265 270
Pro Glu Gln Ala Val Leu Arg Ala Val Phe Leu Arg His Phe His Asn
275 280 285
Trp Glu Ala Glu Ile Ala Ser Arg Leu Thr Ala Leu Val Ser His Pro
290 295 300
Ala Pro Val Asn Glu Gly Lys Leu Asp Ser Ile Leu Pro Gly Leu Glu
305 310 315 320
Gln Lys Ile Gly Val Ala Leu Ser Ser Glu Gln Lys Glu Ala Val Phe
325 330 335
Glu Ala Cys Ala Asn Lys Thr Phe Ile Leu Thr Gly Gly Pro Gly Thr
340 345 350
Gly Lys Thr Thr Ile Thr Gln Ala Val Val Arg Gly Leu Gly Lys Leu
355 360 365
Gly Tyr Lys Ile Lys Leu Ala Ala Pro Thr Gly Arg Ala Ala Lys Arg
370 375 380
Leu Ser Glu Ala Thr Gly Ala Ser Ala Ser Thr Leu His Arg Leu Leu
385 390 395 400
Gly Phe Ser Pro Asp Gly Ala Phe Ala Tyr Asn Glu Glu Lys Lys Leu
405 410 415
Lys Val Asp Ala Leu Val Val Asp Glu Ala Ser Met Leu Asp Cys Gln
420 425 430
Leu Cys Val His Leu Leu Arg Ala Leu Pro Leu Thr Cys Arg Leu Ile
435 440 445
Leu Val Gly Asp Val His Gln Leu Pro Ser Val Gly Ala Gly Asn Ile
450 455 460
Leu Glu Asp Leu Leu Glu Ser Arg Ala Val Pro Ser Arg His Leu Thr
465 470 475 480
His Ile Phe Arg Gln Ala Gln Glu Ser Leu Ile Val Val Asn Ala His
485 490 495
Arg Phe Asn Glu Gly Leu Phe Pro Thr Thr Ser Ala Lys Glu Pro Pro
500 505 510
Glu Ala Asp Phe Phe Trp Val Glu Gln Asp Asp Pro Ala Arg Val Gln
515 520 525
Glu Ile Ile Arg Gln Leu Val Cys Glu Arg Ile Pro Ala Ile Tyr Gly
530 535 540
Leu Asp Pro Leu Arg Asp Val Gln Val Leu Ser Pro Met His Lys Gly
545 550 555 560
Glu Val Gly Thr Gln Gln Leu Asn Thr Leu Leu Gln Gln Glu Leu Asn
565 570 575
Pro Ser Gly Pro Thr Leu Thr Arg Gly Asn Arg Met Phe Arg Gln Gly
580 585 590
Asp Arg Val Leu Gln Thr Arg Asn Asn Tyr Glu Lys Asp Val Phe Asn
595 600 605
Gly Asp Leu Gly Trp Ile Thr Ala Ile Asn Ala Asp Ser Gln Thr Met
610 615 620
Gln Ile Asp Phe Glu Gly Arg Asp Leu Thr Tyr Glu Gln Gly Glu Leu
625 630 635 640
Asp Glu Leu Thr Leu Ala Tyr Ala Val Ser Val His Lys Ser Gln Gly
645 650 655
Ser Glu Tyr Pro Ala Val Val Leu Pro Val Val Thr Gln His Phe Met
660 665 670
Leu Leu Gln Arg Asn Leu Ile Tyr Thr Ala Leu Thr Arg Ala Lys Ser
675 680 685
Leu Ala Val Leu Val Gly Ser Ser Lys Ala Leu Gly Ile Ala Leu Asn
690 695 700
His Lys Arg Gly Ala Glu Arg Tyr Thr His Leu Arg Tyr Arg Leu Gln
705 710 715 720
Asp Ala Ala Asn Asp Ile Pro Tyr
725
<210> 40
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Dre
<400> 40
Tyr Ala Val Ser Val His Lys Ser Gln Gly
1 5 10
<210> 41
<211> 715
<212> PRT
<213> Deinococcus radiidurans
<400> 41
Met Ser Ala Ala Leu Pro Ala Glu Pro Phe Arg Val Ser Gly Gly Val
1 5 10 15
Asn Lys Val Arg Phe Arg Ser Asp Thr Gly Phe Thr Val Met Ser Ala
20 25 30
Thr Leu Arg Asn Glu Gln Gly Glu Asp Pro Asp Ala Thr Val Ile Gly
35 40 45
Val Met Pro Pro Leu Asp Val Gly Asp Thr Phe Ser Ala Glu Val Leu
50 55 60
Met Glu Glu His Arg Glu Tyr Gly Tyr Gln Tyr Arg Val Val Asn Met
65 70 75 80
Val Leu Glu Ala Met Pro Ala Asp Leu Ser Glu Glu Gly Val Ala Ala
85 90 95
Tyr Phe Glu Ala Arg Val Gly Gly Val Gly Lys Val Leu Ala Gly Arg
100 105 110
Ile Ala Lys Thr Phe Gly Ala Ala Ala Phe Asp Leu Leu Glu Asp Asp
115 120 125
Pro Gln Lys Phe Leu Gln Val Pro Gly Ile Thr Glu Ser Thr Leu His
130 135 140
Lys Met Val Ser Ser Trp Ser Gln Gln Gly Leu Glu Arg Arg Leu Leu
145 150 155 160
Ala Gly Leu Gln Gly Leu Gly Leu Thr Ile Asn Gln Ala Gln Arg Ala
165 170 175
Val Lys His Phe Gly Ala Asp Ala Leu Asp Arg Leu Glu Lys Asp Leu
180 185 190
Phe Thr Leu Thr Glu Val Glu Gly Ile Gly Phe Leu Thr Ala Asp Lys
195 200 205
Leu Trp Gln Ala Arg Gly Gly Ala Leu Asp Asp Pro Arg Arg Leu Thr
210 215 220
Ala Ala Ala Val Tyr Ala Leu Gln Leu Ala Gly Thr Gln Ala Gly His
225 230 235 240
Ser Phe Leu Pro Arg Ser Arg Ala Glu Lys Gly Val Val His Tyr Thr
245 250 255
Arg Val Thr Pro Gly Gln Ala Arg Leu Ala Val Glu Thr Ala Val Glu
260 265 270
Leu Gly Arg Leu Ser Glu Asp Asp Ser Pro Leu Phe Ala Ala Glu Ala
275 280 285
Ala Ala Thr Gly Glu Gly Arg Ile Tyr Leu Pro His Val Leu Arg Ala
290 295 300
Glu Lys Lys Leu Ala Ser Leu Ile Arg Thr Leu Leu Ala Thr Pro Pro
305 310 315 320
Ala Asp Gly Ala Gly Asn Asp Asp Trp Ala Val Pro Lys Lys Ala Arg
325 330 335
Lys Gly Leu Ser Glu Glu Gln Ala Ser Val Leu Asp Gln Leu Ala Gly
340 345 350
His Arg Leu Val Val Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr
355 360 365
Thr Thr Lys Ala Val Ala Asp Leu Ala Glu Ser Leu Gly Leu Glu Val
370 375 380
Gly Leu Cys Ala Pro Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val
385 390 395 400
Thr Gly Arg Thr Ala Ser Thr Val His Arg Leu Leu Gly Tyr Gly Pro
405 410 415
Gln Gly Phe Arg His Asn His Leu Glu Pro Ala Pro Tyr Asp Leu Leu
420 425 430
Ile Val Asp Glu Val Ser Met Met Gly Asp Ala Leu Met Leu Ser Leu
435 440 445
Leu Ala Ala Val Pro Pro Gly Ala Arg Val Leu Leu Val Gly Asp Thr
450 455 460
Asp Gln Leu Pro Pro Val Asp Ala Gly Leu Pro Leu Leu Ala Leu Ala
465 470 475 480
Gln Ala Ala Pro Thr Ile Lys Leu Thr Gln Val Tyr Arg Gln Ala Ala
485 490 495
Lys Asn Pro Ile Ile Gln Ala Ala His Gly Leu Leu His Gly Glu Ala
500 505 510
Pro Ala Trp Gly Asp Lys Arg Leu Asn Leu Thr Glu Ile Glu Pro Asp
515 520 525
Gly Gly Ala Arg Arg Val Ala Leu Met Val Arg Glu Leu Gly Gly Pro
530 535 540
Gly Ala Val Gln Val Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Met
545 550 555 560
Asp His Leu Asn Tyr His Leu Gln Ala Leu Phe Asn Pro Gly Glu Gly
565 570 575
Gly Val Arg Ile Ala Glu Gly Glu Ala Arg Pro Gly Asp Thr Val Val
580 585 590
Gln Thr Lys Asn Asp Tyr Asn Asn Glu Ile Phe Asn Gly Thr Leu Gly
595 600 605
Met Val Leu Lys Ala Glu Gly Ala Arg Leu Thr Val Asp Phe Asp Gly
610 615 620
Asn Val Val Glu Leu Thr Gly Ala Glu Leu Phe Asn Leu Gln Leu Gly
625 630 635 640
Tyr Ala Leu Thr Val His Arg Ala Gln Gly Ser Glu Trp Gly Thr Val
645 650 655
Leu Gly Val Leu His Glu Ala His Met Pro Met Leu Ser Arg Asn Leu
660 665 670
Val Tyr Thr Ala Leu Thr Arg Ala Arg Asp Arg Phe Phe Ser Ala Gly
675 680 685
Ser Ala Ser Ala Trp Gln Ile Ala Ala Ala Arg Gln Arg Glu Ala Arg
690 695 700
Asn Thr Ala Leu Leu Glu Arg Ile Arg Ala His
705 710 715
<210> 42
<211> 738
<212> PRT
<213> Chlorobium chlorochromatii
<400> 42
Met Ser Val Gln Asp Gly Gln Glu Ser Tyr Tyr Tyr Ser Pro Lys Glu
1 5 10 15
Arg Leu Ser Gly Ala Val Glu Arg Val Thr Phe His Ser Gln Lys Asn
20 25 30
Gly Phe Ser Val Leu Arg Ile Lys Val Lys Gly Arg Arg Asp Leu Val
35 40 45
Thr Val Val Gly Ala Thr Pro Ser Ile Ala Pro Gly Glu Phe Val Glu
50 55 60
Cys Leu Gly Glu Trp His Asn Asp Ser Thr Tyr Gly Leu Gln Phe Arg
65 70 75 80
Ala Thr Glu Leu Thr Val Val Pro Pro Glu Thr Ile Asp Gly Ile Glu
85 90 95
Lys Tyr Leu Ala Ser Gly Met Val Lys Gly Ile Gly Pro His Phe Ala
100 105 110
Lys Thr Leu Val Tyr Ala Phe Arg Glu Asp Val Phe Thr Val Ile Glu
115 120 125
Glu Glu Pro Glu Arg Leu Leu Glu Leu Pro Gly Ile Gly Gln Lys Arg
130 135 140
Met Glu Met Val Thr Ser Ala Trp Ala Asp Gln Lys Val Ile Arg Asp
145 150 155 160
Ile Met Val Phe Leu Gln Ser His Gly Leu Gly Thr Ser Arg Ala Val
165 170 175
Arg Ile Phe Lys Thr Tyr Gly Asn Glu Ser Ile Leu Arg Val Lys Glu
180 185 190
Asn Pro Tyr Arg Leu Val Leu Asp Ile Tyr Gly Val Gly Phe Lys Thr
195 200 205
Ala Asp Ala Leu Ala Met Gln Leu Gly Ile Ala Pro Asp Ser Leu Ile
210 215 220
Arg Ala Gln Ala Gly Val His His Val Leu Gln Glu Ile Ala Ser Ser
225 230 235 240
Gly His Cys Ala Ala Pro Arg Glu Gln Leu Val Ala Glu Ala Ser Arg
245 250 255
Leu Leu Ser Ile Pro Glu Glu Arg Thr His Glu Ala Ile Asp Ala Glu
260 265 270
Leu Arg Ala Gly Asn Leu Val Arg Glu Glu Leu Arg Gly Val Glu Thr
275 280 285
Leu Tyr Leu Leu Ser Leu His Arg Ala Glu Leu Gly Val Ala Thr Ser
290 295 300
Leu Met Arg Leu Leu Glu Gly Glu Ile Pro Trp Arg His Leu Ala Ile
305 310 315 320
Glu Glu Ala Leu Pro Trp Val Glu Ala Gln Asn Asn Ile Thr Leu Ser
325 330 335
Pro Ser Gln Lys Glu Ala Leu His Thr Ala Leu Thr Asn Lys Val Thr
340 345 350
Val Ile Thr Gly Gly Pro Gly Val Gly Lys Thr Thr Leu Val Lys Ser
355 360 365
Ile Leu Leu Ile Leu Gln Ala Gln Lys Val Arg Val Ala Leu Cys Ala
370 375 380
Pro Thr Gly Arg Ala Ala Lys Arg Leu Ser Glu Ser Thr Gly Leu Glu
385 390 395 400
Ala Lys Thr Ile His Arg Leu Leu Glu Phe Asp Pro Leu Thr Gly Gly
405 410 415
Phe Lys His Gln Arg Asp Asn Pro Leu Glu Cys Asp Leu Val Val Val
420 425 430
Asp Glu Ser Ser Met Val Asp Val Val Leu Met Asn Arg Leu Leu Ala
435 440 445
Ala Val Pro Glu Lys Ala Ala Leu Leu Leu Ile Gly Asp Val Asp Gln
450 455 460
Leu Pro Ser Val Gly Ala Gly Ala Val Leu Ala Asp Ile Ile Arg Ser
465 470 475 480
Glu Thr Ile Pro Thr Ile Arg Leu Thr Glu Ile Phe Arg Gln Ala Ala
485 490 495
Ser Ser Arg Ile Ile Met Asn Ala His Arg Ile Asn Lys Gly Glu Leu
500 505 510
Pro Leu Arg Asp Glu Ser Asn Thr Leu Ser Asp Phe Tyr Leu Ile Ala
515 520 525
Ala Asn Thr Pro Glu Glu Ile Tyr Asn Arg Leu Leu Thr Val Ile Thr
530 535 540
Glu Arg Ile Pro Ala Arg Phe Gly Leu His Pro Val Arg Asp Val Gln
545 550 555 560
Val Leu Thr Pro Met Asn Arg Gly Gly Leu Gly Ala Arg Ala Leu Asn
565 570 575
Val Glu Leu Gln Lys Val Leu Asn Gly Gln Val Glu Pro Ser Val Thr
580 585 590
Arg Phe Gly Thr Arg Tyr Ala Ala Gly Asp Lys Val Ile Gln Met Val
595 600 605
Asn Asn Tyr Asp Lys Glu Val Phe Asn Gly Asp Ile Gly His Ile Ser
610 615 620
Ala Val Glu Arg Glu Asp Gly Ala Val Leu Val Asp Phe Asp Gly Thr
625 630 635 640
Leu Val Ser Tyr Glu Phe Gly Glu Leu Asp Glu Leu Ser Leu Ala Tyr
645 650 655
Ala Thr Ser Ile His Lys Ser Gln Gly Ser Glu Tyr Pro Ala Val Val
660 665 670
Ile Pro Leu Ala Met Gln His Tyr Asn Leu Leu Glu Arg Asn Leu Ile
675 680 685
Tyr Thr Ala Val Thr Arg Gly Lys Lys Leu Val Val Ile Ile Gly Glu
690 695 700
Thr Arg Ala Leu Ala Met Ala Val Lys Asn His Lys Ala Met Arg Arg
705 710 715 720
Leu Thr Gly Leu Ala Glu Arg Leu Ser Ala Leu Ala Arg Tyr Glu Ala
725 730 735
Asn Leu
<210> 43
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Cch
<400> 43
Tyr Ala Thr Ser Ile His Lys Ser Gln Gly
1 5 10
<210> 44
<211> 715
<212> PRT
<213> Deinococcus maricopensis
<400> 44
Met Leu Asp Thr Ser Ser Pro His Pro Ala Leu Cys Cys Thr Arg Asn
1 5 10 15
Val Thr Glu Arg Thr Pro Thr Ala Gln Pro His Leu Gln Val Thr Gly
20 25 30
Thr Val Gln Lys Val Arg Tyr Arg Ala Asp Ser Gly Phe Ala Val Leu
35 40 45
Thr Ala Ser Ile Arg Asn Asp His Gly Glu Asp Pro Asp Ala Thr Leu
50 55 60
Val Gly Pro Val Pro Pro Leu Glu Ala Gly Asp Ala Phe Thr Ala Thr
65 70 75 80
Val Val Val Glu Glu His Arg Glu Tyr Gly Pro Gln Tyr Lys Val Ile
85 90 95
Gly Met Ile Leu Asp Ala His Pro Thr Asp Leu Asn Glu Ala Gly Val
100 105 110
Ala Ala Tyr Leu Glu Ala Arg Val Gly Gly Val Gly Arg Val Leu Ala
115 120 125
Gly Arg Ile Ala Arg Ala Phe Gly Ser Ala Thr Phe Asp Ile Leu Thr
130 135 140
Asp Asp Pro Lys Arg Leu Leu Gln Val Pro Gly Val Thr Gln Ser Thr
145 150 155 160
Leu His Lys Ile Leu Val Ser Trp Glu Glu Gln Gly Gly Glu Arg Arg
165 170 175
Thr Leu Ala Ala Leu Gln Gly Met Gly Leu Ser Val Gly Gln Ala Gln
180 185 190
Arg Ala Leu Lys His Phe Gly Val Ala Ala Ile Glu Arg Leu Gln Thr
195 200 205
Asp Leu Tyr Ala Leu Thr Glu Val Glu Gly Ile Gly Phe Leu Thr Ala
210 215 220
Asp Lys Leu Ala Gln Glu Gln Gly Met Pro Gln Asp Asp Pro Arg Arg
225 230 235 240
Leu Thr Ala Ala Ala Val Tyr Ala Leu Gln Leu Ala Gly Thr Ser Gly
245 250 255
Gly His Thr Tyr Leu Pro Arg Pro Arg Ala Val Arg Gly Leu Met His
260 265 270
Tyr Thr Arg Val Asn Glu Gly Leu Ala Glu Ala Ala Leu Glu Asn Ala
275 280 285
Thr Thr Phe Gly Arg Leu Ala Asp Asp Asp Gly Arg Ile Tyr Leu Pro
290 295 300
His Ala Leu Arg Ala Glu Lys Lys Leu Ala Gln Thr Val Arg Thr Leu
305 310 315 320
Leu Ala Thr Pro Pro Gln Asp Glu Trp Thr Val Lys Arg Gly Ala Ala
325 330 335
Lys Gly Leu Ser Asp Glu Gln Glu Gln Val Leu His Leu Leu Glu His
340 345 350
His Arg Leu Val Val Leu Thr Gly Gly Pro Gly Thr Gly Lys Ser Thr
355 360 365
Thr Thr Arg Ala Val Ala Asp Leu Ala Glu Lys Leu Gly Leu Glu Val
370 375 380
Gly Leu Cys Ala Pro Thr Gly Lys Ala Ala Arg Arg Leu Gly Glu Val
385 390 395 400
Thr Gly Arg Thr Ala Ser Thr Val His Arg Leu Leu Gly Tyr Gly Pro
405 410 415
Glu Gly Phe Arg Phe Gly Ala Met Glu Pro Val Met Phe Asp Leu Ile
420 425 430
Ile Val Asp Glu Val Ser Met Met Gly Asp Thr Leu Met Leu Ala Leu
435 440 445
Leu Gln Ala Val Pro Pro Gly Ala Arg Ile Leu Leu Val Gly Asp Ser
450 455 460
Asp Gln Leu Pro Pro Val Asp Ala Gly Leu Pro Leu Ala Ala Leu Thr
465 470 475 480
Ala Ala Ala Pro Thr Val Arg Leu Ser Arg Val Tyr Arg Gln Ala Met
485 490 495
Asp Asn Pro Ile Ile Gly Ala Ala His Ala Ile Met His Ala Gln Ala
500 505 510
Pro Thr Phe Gly Asp Pro Arg Leu Gln Phe His Ala Val Glu Thr Asp
515 520 525
Thr Gly Ala Arg Arg Val Ala Leu Leu Val Arg Glu Leu Gly Gly Pro
530 535 540
Gly Lys Val Gln Val Leu Thr Pro Met Arg Lys Gly Pro Leu Gly Met
545 550 555 560
Asp Thr Leu Asn Thr His Leu Gln Thr Leu Phe Asn Pro Gly Asp Gly
565 570 575
Gly Val Arg Ile Gly Asp Thr His Ala Arg Pro Gly Asp Leu Val Val
580 585 590
Gln Thr Lys Asn Asp Tyr Gln Asn Glu Ile Phe Asn Gly Thr Val Gly
595 600 605
Thr Val Leu Asp Met Glu Gly Asn Thr Leu Thr Ile Asp Phe Asp Ser
610 615 620
Asn Val Val Thr Leu Ser Gly Ala Glu Leu Trp Asn Leu Asn Leu Ala
625 630 635 640
Tyr Ala Leu Thr Val His Arg Gly Gln Gly Ser Glu Trp Pro Thr Val
645 650 655
Leu Gly Val Leu His Glu Ala His Gly Pro Met Leu Asn Arg Asn Leu
660 665 670
Ala Tyr Thr Ala Leu Thr Arg Ala Arg Glu Arg Phe Ile Gly Val Gly
675 680 685
Ser Glu Ser Ala Trp Arg Ala Ala Ala Thr Arg Ala Arg Asp Ala Arg
690 695 700
His Thr His Leu Leu Glu Arg Ile Gln Ala Lys
705 710 715
<210> 45
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of RecD2 Dma
<400> 45
Tyr Ala Leu Thr Val His Arg Gly Gln Gly
1 5 10
<210> 46
<211> 13
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(10)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa = any amino acid except D, E, R and K
<400> 46
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10
<210> 47
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(11)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa = any amino acid except D, E, R and K
<400> 47
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10
<210> 48
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(12)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa = any amino acid except D, E, R and K
<400> 48
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10 15
<210> 49
<211> 16
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(13)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa = any amino acid except D, E, R and K
<400> 49
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa His
1 5 10 15
<210> 50
<211> 17
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(14)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa = any amino acid except D, E, R and K
<400> 50
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa
1 5 10 15
His
<210> 51
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(15)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa = any amino acid except D, E, R and K
<400> 51
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
1 5 10 15
Xaa His
<210> 52
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(16)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa = any amino acid except D, E, R and K
<400> 52
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
His Xaa His
<210> 53
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa = any amino acid except D, E, R and K
<220>
<221> MISC_FEATURE
<222> (6)..(17)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = any amino acid
<400> 53
His Xaa Xaa Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa His Xaa His
20
<210> 54
<211> 17
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(15)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa = any amino acid except D, E, K and R
<400> 54
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa His
1 5 10 15
Xaa
<210> 55
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(16)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> Xaa = any amino acid except D, E, K and R
<400> 55
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
His Xaa
<210> 56
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(17)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa = any amino acid except D, E, K and R
<400> 56
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa His Xaa
<210> 57
<211> 20
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(18)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> Xaa = any amino acid except D, E, K and R
<400> 57
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa His Xaa
20
<210> 58
<211> 21
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(19)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa = any amino acid
<400> 58
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa His Xaa
20
<210> 59
<211> 22
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(20)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa = any amino acid except D, E, K and R
<400> 59
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa His Xaa
20
<210> 60
<211> 23
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III
<220>
<221> MISC_FEATURE
<222> (2)..(4)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa = D or E
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa = any amino acid except D, E, K and R
<220>
<221> MISC_FEATURE
<222> (10)..(21)
<223> Xaa = any amino acid
<220>
<221> MISC_FEATURE
<222> (23)..(23)
<223> Xaa = any amino acid except D, E, K and R
<400> 60
Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa His Xaa
20
<210> 61
<211> 1756
<212> PRT
<213> Escherichia coli
<400> 61
Met Met Ser Ile Ala Gln Val Arg Ser Ala Gly Ser Ala Gly Asn Tyr
1 5 10 15
Tyr Thr Asp Lys Asp Asn Tyr Tyr Val Leu Gly Ser Met Gly Glu Arg
20 25 30
Trp Ala Gly Lys Gly Ala Glu Gln Leu Gly Leu Gln Gly Ser Val Asp
35 40 45
Lys Asp Val Phe Thr Arg Leu Leu Glu Gly Arg Leu Pro Asp Gly Ala
50 55 60
Asp Leu Ser Arg Met Gln Asp Gly Ser Asn Lys His Arg Pro Gly Tyr
65 70 75 80
Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Met Met Ala Met Leu
85 90 95
Gly Gly Asp Lys Arg Leu Ile Asp Ala His Asn Gln Ala Val Asp Phe
100 105 110
Ala Val Arg Gln Val Glu Ala Leu Ala Ser Thr Arg Val Met Thr Asp
115 120 125
Gly Gln Ser Glu Thr Val Leu Thr Gly Asn Leu Val Met Ala Leu Phe
130 135 140
Asn His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His Ala
145 150 155 160
Val Val Ala Asn Val Thr Gln His Asn Gly Glu Trp Lys Thr Leu Ser
165 170 175
Ser Asp Lys Val Gly Lys Thr Gly Phe Ile Glu Asn Val Tyr Ala Asn
180 185 190
Gln Ile Ala Phe Gly Arg Leu Tyr Arg Glu Lys Leu Lys Glu Gln Val
195 200 205
Glu Ala Leu Gly Tyr Glu Thr Glu Val Val Gly Lys His Gly Met Trp
210 215 220
Glu Met Pro Gly Val Pro Val Glu Ala Phe Ser Gly Arg Ser Gln Ala
225 230 235 240
Ile Arg Glu Ala Val Gly Glu Asp Ala Ser Leu Lys Ser Arg Asp Val
245 250 255
Ala Ala Leu Asp Thr Arg Lys Ser Lys Gln His Val Asp Pro Glu Ile
260 265 270
Arg Met Ala Glu Trp Met Gln Thr Leu Lys Glu Thr Gly Phe Asp Ile
275 280 285
Arg Ala Tyr Arg Asp Ala Ala Asp Gln Arg Thr Glu Ile Arg Thr Gln
290 295 300
Ala Pro Gly Pro Ala Ser Gln Asp Gly Pro Asp Val Gln Gln Ala Val
305 310 315 320
Thr Gln Ala Ile Ala Gly Leu Ser Glu Arg Lys Val Gln Phe Thr Tyr
325 330 335
Thr Asp Val Leu Ala Arg Thr Val Gly Ile Leu Pro Pro Glu Asn Gly
340 345 350
Val Ile Glu Arg Ala Arg Ala Gly Ile Asp Glu Ala Ile Ser Arg Glu
355 360 365
Gln Leu Ile Pro Leu Asp Arg Glu Lys Gly Leu Phe Thr Ser Gly Ile
370 375 380
His Val Leu Asp Glu Leu Ser Val Arg Ala Leu Ser Arg Asp Ile Met
385 390 395 400
Lys Gln Asn Arg Val Thr Val His Pro Glu Lys Ser Val Pro Arg Thr
405 410 415
Ala Gly Tyr Ser Asp Ala Val Ser Val Leu Ala Gln Asp Arg Pro Ser
420 425 430
Leu Ala Ile Val Ser Gly Gln Gly Gly Ala Ala Gly Gln Arg Glu Arg
435 440 445
Val Ala Glu Leu Val Met Met Ala Arg Glu Gln Gly Arg Glu Val Gln
450 455 460
Ile Ile Ala Ala Asp Arg Arg Ser Gln Met Asn Leu Lys Gln Asp Glu
465 470 475 480
Arg Leu Ser Gly Glu Leu Ile Thr Gly Arg Arg Gln Leu Leu Glu Gly
485 490 495
Met Ala Phe Thr Pro Gly Ser Thr Val Ile Val Asp Gln Gly Glu Lys
500 505 510
Leu Ser Leu Lys Glu Thr Leu Thr Leu Leu Asp Gly Ala Ala Arg His
515 520 525
Asn Val Gln Val Leu Ile Thr Asp Ser Gly Gln Arg Thr Gly Thr Gly
530 535 540
Ser Ala Leu Met Ala Met Lys Asp Ala Gly Val Asn Thr Tyr Arg Trp
545 550 555 560
Gln Gly Gly Glu Gln Arg Pro Ala Thr Ile Ile Ser Glu Pro Asp Arg
565 570 575
Asn Val Arg Tyr Ala Arg Leu Ala Gly Asp Phe Ala Ala Ser Val Lys
580 585 590
Ala Gly Glu Glu Ser Val Ala Gln Val Ser Gly Val Arg Glu Gln Ala
595 600 605
Ile Leu Thr Gln Ala Ile Arg Ser Glu Leu Lys Thr Gln Gly Val Leu
610 615 620
Gly His Pro Glu Val Thr Met Thr Ala Leu Ser Pro Val Trp Leu Asp
625 630 635 640
Ser Arg Ser Arg Tyr Leu Arg Asp Met Tyr Arg Pro Gly Met Val Met
645 650 655
Glu Gln Trp Asn Pro Glu Thr Arg Ser His Asp Arg Tyr Val Ile Asp
660 665 670
Arg Val Thr Ala Gln Ser His Ser Leu Thr Leu Arg Asp Ala Gln Gly
675 680 685
Glu Thr Gln Val Val Arg Ile Ser Ser Leu Asp Ser Ser Trp Ser Leu
690 695 700
Phe Arg Pro Glu Lys Met Pro Val Ala Asp Gly Glu Arg Leu Arg Val
705 710 715 720
Thr Gly Lys Ile Pro Gly Leu Arg Val Ser Gly Gly Asp Arg Leu Gln
725 730 735
Val Ala Ser Val Ser Glu Asp Ala Met Thr Val Val Val Pro Gly Arg
740 745 750
Ala Glu Pro Ala Ser Leu Pro Val Ser Asp Ser Pro Phe Thr Ala Leu
755 760 765
Lys Leu Glu Asn Gly Trp Val Glu Thr Pro Gly His Ser Val Ser Asp
770 775 780
Ser Ala Thr Val Phe Ala Ser Val Thr Gln Met Ala Met Asp Asn Ala
785 790 795 800
Thr Leu Asn Gly Leu Ala Arg Ser Gly Arg Asp Val Arg Leu Tyr Ser
805 810 815
Ser Leu Asp Glu Thr Arg Thr Ala Glu Lys Leu Ala Arg His Pro Ser
820 825 830
Phe Thr Val Val Ser Glu Gln Ile Lys Ala Arg Ala Gly Glu Thr Leu
835 840 845
Leu Glu Thr Ala Ile Ser Leu Gln Lys Ala Gly Leu His Thr Pro Ala
850 855 860
Gln Gln Ala Ile His Leu Ala Leu Pro Val Leu Glu Ser Lys Asn Leu
865 870 875 880
Ala Phe Ser Met Val Asp Leu Leu Thr Glu Ala Lys Ser Phe Ala Ala
885 890 895
Glu Gly Thr Gly Phe Thr Glu Leu Gly Gly Glu Ile Asn Ala Gln Ile
900 905 910
Lys Arg Gly Asp Leu Leu Tyr Val Asp Val Ala Lys Gly Tyr Gly Thr
915 920 925
Gly Leu Leu Val Ser Arg Ala Ser Tyr Glu Ala Glu Lys Ser Ile Leu
930 935 940
Arg His Ile Leu Glu Gly Lys Glu Ala Val Thr Pro Leu Met Glu Arg
945 950 955 960
Val Pro Gly Glu Leu Met Glu Thr Leu Thr Ser Gly Gln Arg Ala Ala
965 970 975
Thr Arg Met Ile Leu Glu Thr Ser Asp Arg Phe Thr Val Val Gln Gly
980 985 990
Tyr Ala Gly Val Gly Lys Thr Thr Gln Phe Arg Ala Val Met Ser Ala
995 1000 1005
Val Asn Met Leu Pro Ala Ser Glu Arg Pro Arg Val Val Gly Leu
1010 1015 1020
Gly Pro Thr His Arg Ala Val Gly Glu Met Arg Ser Ala Gly Val
1025 1030 1035
Asp Ala Gln Thr Leu Ala Ser Phe Leu His Asp Thr Gln Leu Gln
1040 1045 1050
Gln Arg Ser Gly Glu Thr Pro Asp Phe Ser Asn Thr Leu Phe Leu
1055 1060 1065
Leu Asp Glu Ser Ser Met Val Gly Asn Thr Glu Met Ala Arg Ala
1070 1075 1080
Tyr Ala Leu Ile Ala Ala Gly Gly Gly Arg Ala Val Ala Ser Gly
1085 1090 1095
Asp Thr Asp Gln Leu Gln Ala Ile Ala Pro Gly Gln Ser Phe Arg
1100 1105 1110
Leu Gln Gln Thr Arg Ser Ala Ala Asp Val Val Ile Met Lys Glu
1115 1120 1125
Ile Val Arg Gln Thr Pro Glu Leu Arg Glu Ala Val Tyr Ser Leu
1130 1135 1140
Ile Asn Arg Asp Val Glu Arg Ala Leu Ser Gly Leu Glu Ser Val
1145 1150 1155
Lys Pro Ser Gln Val Pro Arg Leu Glu Gly Ala Trp Ala Pro Glu
1160 1165 1170
His Ser Val Thr Glu Phe Ser His Ser Gln Glu Ala Lys Leu Ala
1175 1180 1185
Glu Ala Gln Gln Lys Ala Met Leu Lys Gly Glu Ala Phe Pro Asp
1190 1195 1200
Ile Pro Met Thr Leu Tyr Glu Ala Ile Val Arg Asp Tyr Thr Gly
1205 1210 1215
Arg Thr Pro Glu Ala Arg Glu Gln Thr Leu Ile Val Thr His Leu
1220 1225 1230
Asn Glu Asp Arg Arg Val Leu Asn Ser Met Ile His Asp Ala Arg
1235 1240 1245
Glu Lys Ala Gly Glu Leu Gly Lys Glu Gln Val Met Val Pro Val
1250 1255 1260
Leu Asn Thr Ala Asn Ile Arg Asp Gly Glu Leu Arg Arg Leu Ser
1265 1270 1275
Thr Trp Glu Lys Asn Pro Asp Ala Leu Ala Leu Val Asp Asn Val
1280 1285 1290
Tyr His Arg Ile Ala Gly Ile Ser Lys Asp Asp Gly Leu Ile Thr
1295 1300 1305
Leu Gln Asp Ala Glu Gly Asn Thr Arg Leu Ile Ser Pro Arg Glu
1310 1315 1320
Ala Val Ala Glu Gly Val Thr Leu Tyr Thr Pro Asp Lys Ile Arg
1325 1330 1335
Val Gly Thr Gly Asp Arg Met Arg Phe Thr Lys Ser Asp Arg Glu
1340 1345 1350
Arg Gly Tyr Val Ala Asn Ser Val Trp Thr Val Thr Ala Val Ser
1355 1360 1365
Gly Asp Ser Val Thr Leu Ser Asp Gly Gln Gln Thr Arg Val Ile
1370 1375 1380
Arg Pro Gly Gln Glu Arg Ala Glu Gln His Ile Asp Leu Ala Tyr
1385 1390 1395
Ala Ile Thr Ala His Gly Ala Gln Gly Ala Ser Glu Thr Phe Ala
1400 1405 1410
Ile Ala Leu Glu Gly Thr Glu Gly Asn Arg Lys Leu Met Ala Gly
1415 1420 1425
Phe Glu Ser Ala Tyr Val Ala Leu Ser Arg Met Lys Gln His Val
1430 1435 1440
Gln Val Tyr Thr Asp Asn Arg Gln Gly Trp Thr Asp Ala Ile Asn
1445 1450 1455
Asn Ala Val Gln Lys Gly Thr Ala His Asp Val Leu Glu Pro Lys
1460 1465 1470
Pro Asp Arg Glu Val Met Asn Ala Gln Arg Leu Phe Ser Thr Ala
1475 1480 1485
Arg Glu Leu Arg Asp Val Ala Ala Gly Arg Ala Val Leu Arg Gln
1490 1495 1500
Ala Gly Leu Ala Gly Gly Asp Ser Pro Ala Arg Phe Ile Ala Pro
1505 1510 1515
Gly Arg Lys Tyr Pro Gln Pro Tyr Val Ala Leu Pro Ala Phe Asp
1520 1525 1530
Arg Asn Gly Lys Ser Ala Gly Ile Trp Leu Asn Pro Leu Thr Thr
1535 1540 1545
Asp Asp Gly Asn Gly Leu Arg Gly Phe Ser Gly Glu Gly Arg Val
1550 1555 1560
Lys Gly Ser Gly Asp Ala Gln Phe Val Ala Leu Gln Gly Ser Arg
1565 1570 1575
Asn Gly Glu Ser Leu Leu Ala Asp Asn Met Gln Asp Gly Val Arg
1580 1585 1590
Ile Ala Arg Asp Asn Pro Asp Ser Gly Val Val Val Arg Ile Ala
1595 1600 1605
Gly Glu Gly Arg Pro Trp Asn Pro Gly Ala Ile Thr Gly Gly Arg
1610 1615 1620
Val Trp Gly Asp Ile Pro Asp Asn Ser Val Gln Pro Gly Ala Gly
1625 1630 1635
Asn Gly Glu Pro Val Thr Ala Glu Val Leu Ala Gln Arg Gln Ala
1640 1645 1650
Glu Glu Ala Ile Arg Arg Glu Thr Glu Arg Arg Ala Asp Glu Ile
1655 1660 1665
Val Arg Lys Met Ala Glu Asn Lys Pro Asp Leu Pro Asp Gly Lys
1670 1675 1680
Thr Glu Leu Ala Val Arg Asp Ile Ala Gly Gln Glu Arg Asp Arg
1685 1690 1695
Ser Ala Ile Ser Glu Arg Glu Thr Ala Leu Pro Glu Ser Val Leu
1700 1705 1710
Arg Glu Ser Gln Arg Glu Arg Glu Ala Val Arg Glu Val Ala Arg
1715 1720 1725
Glu Asn Leu Leu Gln Glu Arg Leu Gln Gln Met Glu Arg Asp Met
1730 1735 1740
Val Arg Asp Leu Gln Lys Glu Lys Thr Leu Gly Gly Asp
1745 1750 1755
<210> 62
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TraI Eco
<400> 62
Gly Tyr Ala Gly Val Gly Lys Thr
1 5
<210> 63
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TraI Eco
<400> 63
Tyr Ala Ile Thr Ala His Gly Ala Gln Gly
1 5 10
<210> 64
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TraI Eco
<400> 64
His Asp Thr Ser Arg Asp Gln Glu Pro Gln Leu His Thr His
1 5 10
<210> 65
<211> 970
<212> PRT
<213> Citromicrobium bathyomarinum
<400> 65
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 66
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Cba
<400> 66
Gly Ile Ala Gly Ala Gly Lys Ser
1 5
<210> 67
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Cba
<400> 67
Tyr Ala Leu Asn Val His Met Ala Gln Gly
1 5 10
<210> 68
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Cba
<400> 68
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His
1 5 10
<210> 69
<211> 943
<212> PRT
<213> Halothiobacillus neapolitanus c2
<400> 69
Met Leu Arg Ile Lys Asn Leu Lys Gly Asp Pro Ser Ala Ile Ile Asp
1 5 10 15
Tyr Ala Glu Asn Lys Lys Asn His Pro Asp Gln Lys Ser Gly Tyr Tyr
20 25 30
Asp Ala Lys Gly Ala Pro Ser Ala Trp Gly Gly Ala Leu Ala Ala Asp
35 40 45
Leu Gly Leu Ser Gly Ser Val Gln Ala Ala Asp Leu Lys Lys Leu Leu
50 55 60
Ser Gly Glu Leu Ser Asp Gly Thr Arg Phe Ala Lys Glu Asp Pro Asp
65 70 75 80
Arg Arg Leu Gly Ile Asp Met Ser Phe Ser Ala Pro Lys Ser Val Ser
85 90 95
Leu Ala Ala Leu Val Gly Gly Asp Glu Arg Ile Ile Gln Ala His Asp
100 105 110
Ala Ala Val Arg Thr Ala Met Ser Met Ile Glu Gln Glu Tyr Ala Thr
115 120 125
Ala Arg Phe Gly His Ala Gly Arg Asn Val Val Cys Ser Gly Lys Leu
130 135 140
Val Tyr Ala Ala Tyr Arg His Glu Asp Ala Arg Thr Val Asp Asp Ile
145 150 155 160
Ala Asp Pro Gln Leu His Thr His Cys Ile Val Ser Asn Ile Thr Ile
165 170 175
Asp Pro Glu Thr Gly Lys Pro Arg Ser Ile Asp Phe Ala Trp Gly Gln
180 185 190
Asp Gly Ile Lys Leu Ala Gly Ala Met Tyr Arg Ala Glu Leu Ala Arg
195 200 205
Arg Leu Lys Glu Met Gly Tyr Glu Leu Arg Lys Ser Glu Glu Gly Phe
210 215 220
Glu Leu Ala Gln Ile Ser Asp Glu Gln Val Glu Thr Phe Ser Arg Arg
225 230 235 240
Arg Val Gln Val Asp Gln Ala Leu Glu Gln Gln Gly Thr Asp Arg Glu
245 250 255
His Ala Ser Ser Glu Leu Lys Thr Ala Val Thr Leu Ala Thr Arg Gln
260 265 270
Gly Lys Ala Gln Leu Ser Ala Glu Asp Gln Tyr Glu Glu Trp Gln Gln
275 280 285
Arg Ala Ala Glu Ala Glu Leu Asp Leu Ser Gln Pro Val Gly Pro Arg
290 295 300
Val Ser Val Thr Pro Pro Glu Ile Asp Leu Asp His Thr Phe Glu His
305 310 315 320
Leu Ser Glu Arg Ala Ser Val Ile Asn Lys Asp Ala Val Arg Leu Asp
325 330 335
Ala Leu Ile Asn His Met Ser Glu Gly Ala Thr Leu Ser Thr Val Asp
340 345 350
Lys Ala Ile Gln Gly Ala Ala Val Thr Gly Asp Val Phe Glu Ile Glu
355 360 365
Asp Gly Ile Lys Arg Lys Ile Ile Thr Arg Glu Thr Leu Lys Arg Glu
370 375 380
Gln Gln Ile Leu Leu Leu Ala Gln Gln Gly Arg Gly Val Asn Ser Val
385 390 395 400
Leu Ile Gly Val Gly Asp Thr Lys His Leu Ile Glu Asp Ala Glu Gln
405 410 415
Ala Gln Gly Phe Arg Phe Ser Glu Gly Gln Arg Arg Ala Ile Asn Leu
420 425 430
Thr Ala Thr Thr Thr Asp Gln Val Ser Gly Ile Val Gly Ala Ala Gly
435 440 445
Ala Gly Lys Thr Thr Ala Met Lys Thr Val Ala Asp Leu Ala Lys Ser
450 455 460
Gln Gly Leu Thr Val Val Gly Ile Ala Pro Ser Ser Ala Ala Ala Asp
465 470 475 480
Glu Leu Lys Ser Ala Gly Ala Asp Asp Thr Met Thr Leu Ala Thr Phe
485 490 495
Asn Leu Lys Gly Glu Ala Ala Gly Pro Arg Leu Leu Ile Leu Asp Glu
500 505 510
Ala Gly Met Val Ser Ala Arg Asp Gly Glu Ala Leu Leu Lys Lys Leu
515 520 525
Gly Lys Glu Asp Arg Leu Ile Phe Val Gly Asp Pro Lys Gln Leu Ala
530 535 540
Ala Val Glu Ala Gly Ser Pro Phe Ala Gln Leu Met Arg Ser Gly Ala
545 550 555 560
Ile Gln Tyr Ala Glu Ile Thr Glu Ile Asn Arg Gln Lys Asp Gln Lys
565 570 575
Leu Leu Asp Ile Ala Gln His Phe Ala Lys Gly Lys Ala Glu Glu Ala
580 585 590
Val Ala Leu Ala Thr Lys Tyr Val Thr Glu Val Pro Val Thr Leu Pro
595 600 605
Asp Lys Pro Glu His Lys Ile Thr Arg Gln Ala Lys Thr Glu Ala Arg
610 615 620
Arg Leu Ala Ile Ala Ser Ala Thr Ala Lys Arg Tyr Leu Glu Leu Ser
625 630 635 640
Gln Glu Glu Arg Ala Thr Thr Leu Val Leu Ser Gly Thr Asn Ala Val
645 650 655
Arg Lys Gln Val Asn Glu Gln Val Arg Lys Gly Leu Ile Asp Lys Gly
660 665 670
Glu Ile Asn Gly Glu Ser Phe Thr Val Ser Thr Leu Asp Lys Ala Asp
675 680 685
Met Thr Arg Ala Lys Met Arg Lys Ala Gly Asn Tyr Lys Pro Gly Gln
690 695 700
Val Ile Lys Thr Ala Gly Lys Gln Ala Glu Gln Ser Glu Val Val Ala
705 710 715 720
Val Asn Leu Asp Gln Asn Leu Ile Gln Val Lys Leu Ser Asp Gly Thr
725 730 735
Leu Lys Ser Ile Asp Ala Ser Arg Phe Asp Val Lys Lys Thr Gln Val
740 745 750
Phe Asn Pro Arg Gln Ile Asp Ile Ala Ala Gly Asp Lys Ile Ile Phe
755 760 765
Thr Asn Asn Asp Gln Ala Thr Glu Thr Lys Asn Asn Gln Ile Gly Leu
770 775 780
Ile Glu Glu Ile Lys Asp Gly Lys Ala Ile Ile Asn Ser Asn Gly Ala
785 790 795 800
Lys Val Glu Ile Asp Ile Gln Arg Lys Leu His Ile Asp His Ala Tyr
805 810 815
Cys Ile Thr Ile His Arg Ser Gln Gly Gln Thr Val Asp Ser Val Ile
820 825 830
Val Ala Gly Glu Ala Ser Arg Thr Thr Thr Ala Glu Ala Ala Tyr Val
835 840 845
Ala Cys Thr Arg Glu Arg Tyr Lys Leu Glu Ile Ile Thr Asp Asn Thr
850 855 860
Glu Arg Leu Ser Lys Asn Trp Val Arg Tyr Ala Asp Arg Gln Thr Ala
865 870 875 880
Ala Glu Ala Leu Lys Ser Ser Glu Glu Lys Tyr Pro His Leu Asp Glu
885 890 895
Ile Arg Glu Glu Leu Arg Arg Glu Leu Gln Gln Glu Leu Glu Arg Gln
900 905 910
Glu Pro Thr Asn Ile Thr Pro Glu Leu Glu Ile Glu Met Glu Arg Ser
915 920 925
Met Phe Asp Gln Tyr Thr Leu His Ser Arg Gln Pro Arg Ser Tyr
930 935 940
<210> 70
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Hne
<400> 70
Gly Ala Ala Gly Ala Gly Lys Thr
1 5
<210> 71
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Hne
<400> 71
Tyr Cys Ile Thr Ile His Arg Ser Gln Gly
1 5 10
<210> 72
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Hne
<400> 72
His Glu Asp Ala Arg Thr Val Asp Asp Ile Ala Asp Pro Gln Leu His
1 5 10 15
Thr His
<210> 73
<211> 960
<212> PRT
<213> Erythrobacter litoralis HTCC2594
<400> 73
Met Leu Ser Val Ala Asn Val Arg Ser Pro Thr Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Gly Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Lys Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Ser Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
Gln Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Ile Val Glu Lys Gly
115 120 125
Lys Met Val Thr Gln Ala Thr Gly Asn Leu Ala Val Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Ile Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Glu Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Glu Ile Glu Asp Arg Ala Thr Leu Gly Lys Gln Trp Ser
260 265 270
Glu Thr Ala Gln Ser Ile Gly Leu Asp Leu Thr Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Asn Ala Leu Gly Gln Ser Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Ile
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Ala Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ser Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Glu Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asn Ser Ser Pro
420 425 430
Ala Ile Glu Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Ala
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Glu
450 455 460
Leu Ile Leu Thr Ser Lys Asp Arg Thr Ile Ala Ile Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Glu Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Arg Gly Trp Thr Lys Leu Leu Gly Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Thr Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ser Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Asn Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Lys Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Asn Arg Glu Ile
690 695 700
Gly Pro Gly Met Met Lys Leu Asp Val Leu Asp Arg Val Asn Ala Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Gln Val Leu
725 730 735
Glu Ile Ser Arg Lys Gln Gln Ala Leu Gly Leu Ser Val Gly Glu Tyr
740 745 750
Arg Val Leu Gly Gln Asp Arg Lys Gly Arg Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Lys Ala Gly
770 775 780
Lys Gly Asp Glu Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Ala Ile Ala Gly Gly Lys
820 825 830
Ile Thr Phe Glu Thr Ser Gln Gly Asp Gln Val Glu Leu Lys Arg Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Ala His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Thr Ser
865 870 875 880
Ser Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Met Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Asn Ala Glu Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Leu Glu
915 920 925
Val Thr Gly Ser Val Lys Ser Thr Ala Ala Lys Gly Ser Gly Val Asp
930 935 940
Gln Leu Lys Pro Glu Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
<210> 74
<211> 966
<212> PRT
<213> Escherichia coli
<400> 74
Met Leu Ser His Met Val Leu Thr Arg Gln Asp Ile Gly Arg Ala Ala
1 5 10 15
Ser Tyr Tyr Glu Asp Gly Ala Asp Asp Tyr Tyr Ala Lys Asp Gly Asp
20 25 30
Ala Ser Glu Trp Gln Gly Lys Gly Ala Glu Glu Leu Gly Leu Ser Gly
35 40 45
Glu Val Asp Ser Lys Arg Phe Arg Glu Leu Leu Ala Gly Asn Ile Gly
50 55 60
Glu Gly His Arg Ile Met Arg Ser Ala Thr Arg Gln Asp Ser Lys Glu
65 70 75 80
Arg Ile Gly Leu Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Leu
85 90 95
Gln Ala Leu Val Ala Gly Asp Ala Glu Ile Ile Lys Ala His Asp Arg
100 105 110
Ala Val Ala Arg Thr Leu Glu Gln Ala Glu Ala Arg Ala Gln Ala Arg
115 120 125
Gln Lys Ile Gln Gly Lys Thr Arg Ile Glu Thr Thr Gly Asn Leu Val
130 135 140
Ile Gly Lys Phe Arg His Glu Thr Ser Arg Glu Arg Asp Pro Gln Leu
145 150 155 160
His Thr His Ala Val Ile Leu Asn Met Thr Lys Arg Ser Asp Gly Gln
165 170 175
Trp Arg Ala Leu Lys Asn Asp Glu Ile Val Lys Ala Thr Arg Tyr Leu
180 185 190
Gly Ala Val Tyr Asn Ala Glu Leu Ala His Glu Leu Gln Lys Leu Gly
195 200 205
Tyr Gln Leu Arg Tyr Gly Lys Asp Gly Asn Phe Asp Leu Ala His Ile
210 215 220
Asp Arg Gln Gln Ile Glu Gly Phe Ser Lys Arg Thr Glu Gln Ile Ala
225 230 235 240
Glu Trp Tyr Ala Ala Arg Gly Leu Asp Pro Asn Ser Val Ser Leu Glu
245 250 255
Gln Lys Gln Ala Ala Lys Val Leu Ser Arg Ala Lys Lys Thr Ser Val
260 265 270
Asp Arg Glu Ala Leu Arg Ala Glu Trp Gln Ala Thr Ala Lys Glu Leu
275 280 285
Gly Ile Asp Phe Ser Arg Arg Glu Trp Ser Gly Arg Glu Lys Gly Gly
290 295 300
Ser Glu Lys Gln Ala His Ser Phe Met Pro Ser Asp Glu Ala Ala Lys
305 310 315 320
Arg Ala Val Arg Tyr Ala Ile Asn His Leu Thr Glu Arg Gln Ser Val
325 330 335
Met Asp Glu Arg Glu Leu Val Asp Thr Ala Met Lys His Ala Val Gly
340 345 350
Ala Ala Arg Leu Glu Asp Ile Gln Lys Glu Leu Leu Arg Gln Thr Glu
355 360 365
Thr Gly Tyr Leu Ile Arg Glu Ala Pro Arg Tyr Arg Pro Gly Gly Gln
370 375 380
Thr Gly Pro Thr Asp Glu Pro Gly Lys Thr Arg Ala Glu Trp Val Ala
385 390 395 400
Glu Leu Ala Ala Lys Gly Met Lys Gln Gly Ala Ala Arg Glu Arg Val
405 410 415
Asp Asn Ala Ile Lys Thr Gly Gly Leu Val Pro Ile Glu Pro Arg Tyr
420 425 430
Thr Thr Gln Thr Ala Leu Glu Arg Glu Lys Arg Ile Leu Gln Ile Glu
435 440 445
Arg Asp Gly Arg Gly Ala Val Ala Pro Val Ile Ala Ala Glu Ala Ala
450 455 460
Arg Glu Arg Leu Ala Ser Thr Asn Leu Asn Gln Gly Gln Arg Glu Ala
465 470 475 480
Ala Glu Leu Ile Val Ser Ala Ala Asn Arg Val Val Gly Val Gln Gly
485 490 495
Phe Ala Gly Thr Gly Lys Ser His Met Leu Asp Thr Ala Lys Gln Met
500 505 510
Ile Glu Gly Glu Gly Tyr His Val Arg Ala Leu Ala Ala Tyr Gly Ser
515 520 525
Gln Val Lys Ala Leu Arg Glu Leu Asn Val Glu Ala Asn Thr Leu Ala
530 535 540
Ser Phe Leu Arg Ala Lys Asp Lys Asn Ile Asp Ser Arg Thr Val Leu
545 550 555 560
Val Ile Asp Glu Ala Gly Val Val Pro Thr Arg Leu Met Glu Gln Thr
565 570 575
Leu Lys Leu Ala Glu Lys Ala Gly Ala Arg Val Val Leu Met Gly Asp
580 585 590
Thr Ala Gln Thr Lys Ala Ile Glu Ala Gly Arg Pro Phe Asp Gln Leu
595 600 605
Gln Ala Ala Gly Met Gln Thr Ala His Met Arg Glu Ile Gln Arg Gln
610 615 620
Lys Asn Pro Glu Leu Lys Ile Ala Val Glu Leu Ala Ala Ala Gly Lys
625 630 635 640
Ala Ser Ser Ser Leu Glu Arg Ile Lys Asp Val Thr Glu Ile Lys Asn
645 650 655
His His Glu Arg Arg Ala Ala Val Ala Glu Ala Tyr Ile Ala Leu Lys
660 665 670
Pro Asp Glu Arg Asp Arg Thr Leu Ile Val Ser Gly Thr Asn Glu Ala
675 680 685
Arg Arg Glu Ile Asn Gln Ile Val Arg Glu Gly Leu Gly Thr Ala Gly
690 695 700
Lys Gly Ile Glu Phe Asp Thr Leu Val Arg Val Asp Thr Thr Gln Ala
705 710 715 720
Glu Arg Arg His Ser Lys Asn Tyr Gln Val Gly His Val Ile Gln Pro
725 730 735
Glu Arg Asp Tyr Ala Lys Thr Gly Leu Gln Arg Gly Glu Leu Tyr Arg
740 745 750
Val Val Glu Thr Gly Pro Gly Asn Arg Leu Thr Val Ile Gly Glu His
755 760 765
Asp Gly Gln Arg Ile Gln Phe Ser Pro Met Thr His Thr Lys Ile Ser
770 775 780
Val Tyr Gln Pro Glu Arg Ala Glu Leu Ala Val Gly Asp Thr Ile Arg
785 790 795 800
Ile Thr Arg Asn Asp Lys His Leu Asp Leu Ala Asn Gly Asp Arg Met
805 810 815
Lys Val Val Ala Val Glu Asp Arg Lys Val Thr Val Thr Asp Gly Lys
820 825 830
Arg Asn Val Glu Leu Pro Thr Asp Lys Pro Leu His Val Asp His Ala
835 840 845
Tyr Ala Thr Thr Val His Ser Ser Gln Gly Leu Thr Ser Asp Arg Val
850 855 860
Leu Ile Asp Ala His Ala Glu Ser Arg Thr Thr Ala Lys Asp Val Tyr
865 870 875 880
Tyr Val Ala Ile Ser Arg Ala Arg Phe Glu Ala Arg Val Phe Thr Asn
885 890 895
Asp Arg Gly Lys Leu Pro Ala Ala Ile Ala Arg Glu Asn Ile Lys Ser
900 905 910
Ala Ala His Asp Leu Ala Arg Asp Arg Gly Gly Arg Ser Ala Ala Ala
915 920 925
Glu Arg Gln Arg Glu Gln Gln Arg Glu Ala Glu Arg Asn Arg Gln Thr
930 935 940
Gln Gln Pro Ala His Asp Arg Gln Lys Ala Ala Arg Glu Ala Glu Arg
945 950 955 960
Gly Met Glu Ala Gly Arg
965
<210> 75
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Eco
<400> 75
Gly Phe Ala Gly Thr Gly Lys Ser
1 5
<210> 76
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Eco
<400> 76
Tyr Ala Thr Thr Val His Ser Ser Gln Gly
1 5 10
<210> 77
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Eco
<400> 77
His Glu Thr Ser Arg Glu Arg Asp Pro Gln Leu His Thr His
1 5 10
<210> 78
<211> 1101
<212> PRT
<213> Agrobacterium tumefaciens C58
<400> 78
Met Ala Ile Ala His Phe Ser Ala Ser Ile Val Ser Arg Gly Asp Gly
1 5 10 15
Arg Ser Val Val Leu Ser Ala Ala Tyr Gln His Cys Ala Lys Met Glu
20 25 30
Tyr Glu Arg Glu Ala Arg Thr Ile Asp Tyr Thr Arg Lys Gln Gly Leu
35 40 45
Val His Gln Glu Phe Ile Leu Pro Ala Asp Ala Pro Lys Trp Val Arg
50 55 60
Ala Leu Ile Ala Asp Cys Ser Val Ala Gly Ala Ser Glu Ala Phe Trp
65 70 75 80
Asn Lys Val Glu Ala Phe Glu Lys Arg Ser Asp Ala Gln Leu Ala Arg
85 90 95
Asp Leu Thr Ile Ala Leu Pro Arg Glu Leu Thr Ser Glu Gln Asn Ile
100 105 110
Ala Leu Val Arg Asp Phe Val Glu Lys His Ile Leu Gly Lys Gly Met
115 120 125
Val Ala Asp Trp Val Tyr His Asp Asn Pro Gly Asn Pro His Ile His
130 135 140
Leu Met Thr Thr Leu Arg Pro Leu Thr Glu Asp Gly Phe Gly Ala Lys
145 150 155 160
Lys Val Ala Val Ile Gly Glu Asp Gly Gln Leu Val Arg Thr Lys Ser
165 170 175
Gly Lys Ile Leu Tyr Glu Leu Trp Ala Gly Ser Thr Asp Asp Phe Asn
180 185 190
Val Val Arg Asp Gly Trp Phe Glu Arg Leu Asn His His Leu Thr Leu
195 200 205
Gly Gly Ile Asp Leu Lys Ile Asp Gly Arg Ser Tyr Glu Lys Gln Gly
210 215 220
Ile Asp Leu Glu Pro Thr Ile His Leu Gly Val Gly Ala Lys Ala Ile
225 230 235 240
Ser Arg Lys Ala Glu Gln Gln Gly Val Arg Pro Glu Leu Glu Arg Ile
245 250 255
Glu Leu Asn Glu Glu Arg Arg Ser Glu Asn Thr Arg Arg Ile Leu Lys
260 265 270
Asn Pro Ala Ile Val Leu Asp Leu Ile Met Arg Glu Lys Ser Val Phe
275 280 285
Asp Glu Arg Asp Val Ala Lys Val Leu His Arg Tyr Val Asp Asp Pro
290 295 300
Ala Val Phe Gln Gln Leu Met Leu Arg Ile Ile Leu Asn Pro Glu Val
305 310 315 320
Leu Arg Leu Gln Arg Asp Thr Ile Glu Phe Ala Thr Gly Glu Lys Val
325 330 335
Pro Ala Arg Tyr Ser Thr Arg Ala Met Ile Arg Leu Glu Ala Thr Met
340 345 350
Ala Arg Gln Ala Met Trp Leu Ser Asp Lys Glu Thr His Ala Val Ser
355 360 365
Thr Ala Val Leu Leu Ala Ala Thr Phe Gly Arg His Gly Arg Leu Ser
370 375 380
Glu Glu Gln Lys Ala Ala Ile Glu Cys Ile Ala Gly Pro Ala Arg Ile
385 390 395 400
Ala Ala Val Val Gly Arg Ala Gly Ala Gly Lys Thr Thr Met Met Lys
405 410 415
Ala Ala Arg Glu Ala Trp Glu Leu Ala Gly Tyr Arg Val Val Gly Gly
420 425 430
Ala Leu Ala Gly Lys Ala Ser Glu Gly Leu Asp Lys Glu Ala Gly Ile
435 440 445
Glu Ser Arg Thr Leu Ser Ser Trp Glu Leu Arg Trp Asn Arg Gly Arg
450 455 460
Asp Val Leu Asp Asn Lys Thr Val Phe Val Met Asp Glu Ala Gly Met
465 470 475 480
Val Ala Ser Lys Gln Met Ala Gly Phe Val Asp Ala Val Val Arg Ala
485 490 495
Gly Ala Lys Ile Val Leu Val Gly Asp Pro Glu Gln Leu Gln Pro Ile
500 505 510
Glu Ala Gly Ala Ala Phe Arg Ala Ile Val Asp Arg Ile Gly Tyr Ala
515 520 525
Glu Leu Glu Thr Ile Tyr Arg Gln Arg Glu Asp Trp Met Arg Lys Ala
530 535 540
Ser Leu Asp Leu Ala Arg Gly Asn Val Glu Lys Ala Leu Ala Leu Tyr
545 550 555 560
Asn Ala Asn Ala Arg Ile Val Gly Glu Arg Leu Lys Ala Glu Ala Val
565 570 575
Glu Arg Leu Ile Ala Asp Trp Asn Arg Asp Tyr Asp Gln Thr Lys Thr
580 585 590
Thr Leu Ile Leu Ala His Leu Arg Arg Asp Val Arg Met Leu Asn Val
595 600 605
Met Ala Arg Glu Lys Leu Val Glu Arg Gly Ile Val Gly Glu Gly His
610 615 620
Val Phe Arg Thr Ala Asp Gly Glu Arg Arg Phe His Ala Gly Asp Gln
625 630 635 640
Ile Val Phe Leu Lys Asn Glu Thr Leu Leu Gly Val Lys Asn Gly Met
645 650 655
Ile Gly His Val Val Glu Ala Val Pro Asn Arg Ile Val Ala Val Val
660 665 670
Gly Asp Arg Asp His Arg Arg His Val Val Val Glu Gln Arg Phe Tyr
675 680 685
Ser Asn Leu Asp His Gly Tyr Ala Thr Thr Ile His Lys Ser Gln Gly
690 695 700
Ala Thr Val Asp Arg Val Lys Val Leu Ala Ser Leu Ser Leu Asp Arg
705 710 715 720
His Leu Thr Tyr Val Ala Met Thr Arg His Arg Glu Asp Leu Gln Leu
725 730 735
Tyr Tyr Gly Cys Arg Ser Phe Ala Phe Asn Gly Gly Leu Ala Lys Val
740 745 750
Leu Ser Arg Lys Asn Ala Lys Glu Thr Thr Leu Asp Tyr Glu Arg Gly
755 760 765
Lys Leu Tyr Arg Glu Ala Leu Arg Phe Ala Glu Asn Arg Gly Leu His
770 775 780
Ile Met Gln Val Ala Arg Thr Met Leu Arg Asp Arg Leu Asp Trp Thr
785 790 795 800
Leu Arg Gln Lys Thr Lys Val Ser Asp Leu Val His Arg Leu Arg Ala
805 810 815
Leu Gly Glu Arg Leu Gly Leu Asp Gln Ser Pro Lys Thr Gln Thr Met
820 825 830
Lys Glu Ala Ala Pro Met Val Thr Gly Ile Lys Thr Phe Ser Gly Ser
835 840 845
Val Ala Asp Thr Val Gly Asp Lys Leu Gly Ala Asp Pro Thr Leu Lys
850 855 860
Gln Gln Trp Glu Glu Val Ser Ala Arg Phe Arg Tyr Val Phe Ala Asp
865 870 875 880
Pro Glu Thr Ala Phe Arg Ala Val Asn Phe Asp Thr Val Leu Ala Asp
885 890 895
Lys Glu Ala Ala Lys Ala Val Leu Gln Lys Leu Glu Ala Glu Pro Ala
900 905 910
Ser Ile Gly Ala Leu Lys Gly Lys Thr Gly Ile Leu Ala Ser Lys Thr
915 920 925
Glu Arg Glu Ala Arg Arg Val Ala Glu Val Asn Val Pro Ala Leu Lys
930 935 940
Arg Asp Leu Glu Gln Tyr Leu Arg Met Arg Glu Thr Ala Thr Leu Arg
945 950 955 960
Ile Val Thr Glu Glu Gln Ala Leu Arg Gln Arg Val Ser Ile Asp Ile
965 970 975
Pro Ala Leu Ser Pro Ala Ala Arg Val Val Leu Glu Arg Val Arg Asp
980 985 990
Ala Ile Asp Arg Asn Asp Leu Pro Ala Ala Leu Gly Tyr Ala Leu Ser
995 1000 1005
Asn Arg Glu Thr Lys Leu Glu Ile Asp Gly Phe Asn Gln Ala Val
1010 1015 1020
Thr Glu Arg Phe Gly Glu Arg Thr Leu Leu Ser Asn Val Ala Arg
1025 1030 1035
Glu Pro Ser Gly Lys Leu Tyr Glu Lys Leu Ser Asp Gly Met Arg
1040 1045 1050
Pro Glu Gln Lys Glu Gln Leu Lys Gln Ala Trp Pro Ile Met Arg
1055 1060 1065
Thr Ala Gln Gln Leu Ala Ala His Glu Arg Thr Val Gln Ser Leu
1070 1075 1080
Lys Gln Ala Glu Glu Leu Arg Gln Thr Leu Arg Gln Ala Pro Val
1085 1090 1095
Leu Lys Gln
1100
<210> 79
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TraA Atu
<400> 79
Gly Arg Ala Gly Ala Gly Lys Thr
1 5
<210> 80
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TraA Atu
<400> 80
Tyr Ala Thr Thr Ile His Lys Ser Gln Gly
1 5 10
<210> 81
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III of TraA Atu
<400> 81
Gly Met Val Ala Asp Trp Val Tyr His Asp Asn Pro Gly Asn Pro His
1 5 10 15
Ile His
<210> 82
<211> 878
<212> PRT
<213> Sulfobacillus acidophilus TPY
<400> 82
Met Ser Ala Thr Asp Arg Glu Ile Asp Pro Ser Thr Gly Ala Val Arg
1 5 10 15
Tyr Phe Ala Glu Ser Gly Glu Pro Pro Gly Arg Trp Arg Gly His Ala
20 25 30
Ala Ser Leu Gly Arg Pro Gly Gly Asp Ile Val Lys Ala Gly Glu Leu
35 40 45
Glu Arg Leu Leu Asn Gly Gln His Pro Glu Ser Gly Glu Ser Leu Val
50 55 60
Gln Thr Gln Ala Gly Lys Ser His Arg Pro Gly Trp Asp Leu Thr Phe
65 70 75 80
Ser Ser Pro Lys Ser Val Ser Ala Val Trp Ala Ala Ala Asp Pro Glu
85 90 95
Leu Arg Ala Ala Ile Glu Arg Ala His Glu Ala Ala Val Gln Ala Ala
100 105 110
Phe Asp Tyr Leu Gln Ala Asn Ala Ala Tyr Thr Arg Arg Gly Lys Gly
115 120 125
Gly Thr Glu Leu Glu Arg Val Gln Leu Ile Gly Ile Glu Tyr Gln His
130 135 140
Ser Thr Ser Arg Ala Gln Asp Pro His Leu His Ser His Leu Leu Ile
145 150 155 160
Ala Asn Val Ala Gln Arg Ser Asp Gly Thr Trp Gly Thr Leu Glu Ser
165 170 175
Arg Pro Met Phe Gln His Arg Met Ala Ala Gly Ser Leu Tyr Gln Ser
180 185 190
Glu Leu Ala Ala Arg Leu Arg Asp Met Gly Phe Glu Ile Val Lys Gly
195 200 205
Arg Gly Gly Thr Phe Glu Ile Asp Gly Val Pro Gly Asp Leu Lys Lys
210 215 220
Leu Trp Ser Gly Arg His Glu Gln Met Glu Ala Asn Gly Ala Thr Gly
225 230 235 240
Gln Ser Arg Glu Ala Glu Arg Ala Phe Leu Glu Gly Arg Pro Glu Lys
245 250 255
Gly Lys Ile His Arg Pro Ser Leu Phe Ala Lys Trp Gly Ala Glu Ala
260 265 270
Ala Ala His Gly Leu Asp Pro Val Lys Ile Arg Thr Glu Leu Met Arg
275 280 285
Gly Arg Ile Gln Ser Ala Glu Pro Leu Glu Trp Ala Gln Ile Arg Glu
290 295 300
Arg Leu Thr Ala Asp Arg Ser Thr Phe Arg Arg Glu Asp Val Ile Arg
305 310 315 320
Gln Val Ala Thr Ala Ser Tyr Gly Gln Tyr Ser Ala Gln Gln Leu Gln
325 330 335
Ala Leu Val Asp Ala Ala Leu Thr Gln Ser Glu Ser Gly Phe Val Arg
340 345 350
Leu Gly Ser Asp Asp Arg Gly Glu Phe Tyr Thr Thr Val Glu His Leu
355 360 365
Glu Arg Glu Lys Arg Met Leu Ser Ala Met Gly Arg Leu Ala Ala Ser
370 375 380
Thr Thr His Ala Ala Asp Val Arg Ala Val Glu Arg Ala Ile Ser Lys
385 390 395 400
Asp Arg Gly Gly Trp Lys Leu Ser Asp Glu Gln Ala Gln Ala Val Arg
405 410 415
Ala Leu Ala Gly Gly Ser Arg Ile Ala Thr Thr Arg Gly Ala Ala Gly
420 425 430
Thr Gly Lys Thr Thr Ser Met Ile Ala Leu Lys Glu Ala Tyr Glu Ser
435 440 445
Ser Gly Tyr Lys Leu Leu Gly Ala Thr Ile Ser Asn Gln Ala Ala Gln
450 455 460
Val Leu Glu Lys Glu Ser Gly Ile Thr Ser Met Ser Val Ala Lys Leu
465 470 475 480
Leu Tyr Glu Leu Ala Ser Ala Glu Glu Lys Ser Glu Thr Met Ala Arg
485 490 495
Met Gln Trp Ala Glu Gln Glu Glu Ala Lys Ala Arg Gln Ala Ala Asp
500 505 510
Arg Gly Glu Glu Tyr Glu Pro Lys Pro Phe Pro Gly Met Gly Val Ala
515 520 525
Asp Ala Val Phe Glu Arg Val Phe Pro Ala Lys Ala Lys Lys Asp Ala
530 535 540
Ile Thr Leu Asp Glu Arg Thr Ile Val Ile Val Asp Glu Ala Gly Met
545 550 555 560
Val Asp Thr Pro Gln Leu Ala Gln Leu Ile Glu His Val Glu Arg Ser
565 570 575
Gly Ala Lys Ile Val Leu Ile Gly Asp Glu Arg Gln Ile Gln Ala Val
580 585 590
Gly Ala Gly Gly Gly Phe Gln Ala Ala Arg Gln Ile Thr Arg Gln Val
595 600 605
Gly Gly Asp Ala Glu Leu Thr Glu Val Arg Arg Gln Lys Val Ala Trp
610 615 620
Gln Arg Glu Ala Ala Glu Gln Ile Ser Leu Gly Gln Ala Arg Glu Ala
625 630 635 640
Leu Gln Met Tyr Glu Arg Glu Gly Arg Leu His Thr Ala Asp Gly Pro
645 650 655
Glu Glu Ala Ala Arg Glu Leu Val Gln Asp Trp Ile Arg Asp Arg Leu
660 665 670
Gln Asp Lys Ala Ala Ser Gln Leu Ile Ile Ala Ser Ser His Ala Gln
675 680 685
Gly Ala Val Leu Asn His Leu Ala Gln Glu Thr Leu Arg Ser His Gly
690 695 700
Met Leu Gly Pro Leu Val Ala Glu Gly Leu Ser Thr Ala Arg Gln Gly
705 710 715 720
Lys His Asp Leu Tyr Val Gly Asp Glu Ile Arg Phe Ile Lys Asn Ala
725 730 735
Lys Lys Gln Gly Trp Ile Asn Gly Asp Arg Gly Thr Val Ile Gly Met
740 745 750
Gly Pro Ala Gly Gln Ile Arg Val Arg Leu Glu Glu Ser Gly Gln Val
755 760 765
Val Glu Phe Asp Pro Arg Gln Tyr Arg His Trp Gln Leu Ala Tyr Ala
770 775 780
Ser Thr Ala His Lys Ser Gln Gly Ser Thr Val Asp Arg Ala Tyr Tyr
785 790 795 800
Leu Leu Ser Ser Gly Asp His Arg Glu Leu Gly Tyr Val Ala Ala Ser
805 810 815
Arg His Lys Gln Asp Leu Arg Leu Tyr Val Asp Gln Ser Val Tyr Glu
820 825 830
Ala Lys Ser Asp Arg Asp Gln Leu Ile Gln Glu Ile Ala Arg Ser Leu
835 840 845
Ala Lys Ser Asp Arg Lys Glu Ile Ala Leu Ser Leu Ala Ala Lys Ala
850 855 860
Gly Ser Asp Arg Val Gln Asp His Asp Thr Gly His Ser Arg
865 870 875
<210> 83
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Sac
<400> 83
Gly Ala Ala Gly Thr Gly Lys Thr
1 5
<210> 84
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Sac
<400> 84
Tyr Ala Ser Thr Ala His Lys Ser Gln Gly
1 5 10
<210> 85
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Sac
<400> 85
His Ser Thr Ser Arg Ala Gln Asp Pro His Leu His Ser His
1 5 10
<210> 86
<211> 909
<212> PRT
<213> Acidithiobacillus ferrivorans SS3
<400> 86
Met Leu Ser Ile His Ala Lys Lys Gly Ser Thr Ala Glu His Val Ala
1 5 10 15
Gln Val Ala Asp Tyr Pro Asp Glu Gln Pro Glu Gln Arg Pro Glu Gln
20 25 30
Gln Ser Arg Pro Ala Asn Gly Thr Gly Ala Ile Glu Asp Tyr Tyr Ser
35 40 45
Gln Ser Asn Gly Gly Thr Pro Ser Ile Trp Val Gly Ala Gly Ala Glu
50 55 60
Ala Ile Gly Leu Ala Gly Gln Ala Val Glu Arg Glu Thr Met Thr Arg
65 70 75 80
Leu Leu Gln Gly Leu His Pro Asp Asp Gly Arg Ala Leu Val Asp Lys
85 90 95
Ala Gly Pro Gln Arg Arg Tyr Gly Tyr Asp Leu Thr Phe Ser Ala Pro
100 105 110
Lys Ser Val Ser Ile Val Trp Ala Val Ala Asp Arg Asp Leu Arg Glu
115 120 125
Ala Ile Ala Thr Ala His Asp Ala Ala Val Ala Gln Ala Leu Arg His
130 135 140
Ile Glu Thr His Leu Pro Val Ala Arg Arg Gly His Ala Gly Glu Glu
145 150 155 160
Arg Glu Leu Ala His Leu Ile Thr Gly Val Tyr Arg His Ala Ser Ser
165 170 175
Arg Glu Gln Asp Pro Gln Ile His Ser His Ala Leu Leu Met Asn Leu
180 185 190
Ala Gln Arg Leu Asp Gly Thr Trp Gly Ala Ile Glu Ser Trp Glu Ile
195 200 205
Tyr Arg His Lys Met Ala Leu Gly Ala Leu Tyr Arg Thr Val Leu Ala
210 215 220
Gln Arg Leu Gln Glu Met Gly Phe Gly Ile Glu Arg Asp Gly Asp Ser
225 230 235 240
Phe Arg Ile Leu Gly Val Ser Glu Asp Ala Glu Arg Glu Phe Ser Arg
245 250 255
Arg Arg Gln Gln Ile Glu Thr Leu Leu Leu Glu Arg Gly Arg Ser Asn
260 265 270
Ala Glu Ala Ala Ala Leu Ala Thr Leu Asp Thr Arg Arg Arg Lys Glu
275 280 285
Val Ile Asp Arg Ala Ile Leu Ala Ala Asp Trp Arg Glu Arg Ala Ala
290 295 300
His Tyr Gly Leu Ser Ala Lys Thr Val Gln Ala Leu Arg Gln Gly Leu
305 310 315 320
Leu Ala Ala Ser Tyr Asp Arg Ala Ala Val Leu Arg Asp Leu Thr Ala
325 330 335
His Asp Ser Thr Phe Glu Glu Arg His Ile Trp His Arg Val Ala Val
340 345 350
Ala Ala Gln Ala Cys Gly Met Gly Tyr Asp Glu Ile Arg Ala Glu Val
355 360 365
Ala Gln Leu Arg Arg Asp Thr Glu Ile Val Pro Leu Gln Ala Phe Gly
370 375 380
Pro Ala Arg Phe Thr Thr Arg Glu Met Gln Ser Ile Glu Gln Gln Met
385 390 395 400
Val Thr Asp Ala Gln Ala Leu Ala Ala Val Asp Trp His Leu Val Asp
405 410 415
Gly Ala Thr Val Arg Arg Ala Ile Glu Glu Ala Asp Arg Glu Ala Glu
420 425 430
Gln Lys Gly Phe Ser Leu Ser Glu Glu Gln Arg Arg Ala Ile Trp His
435 440 445
Ile Thr His Arg Ile Gly Ala Leu Gln Met Ile Gln Gly His Ala Gly
450 455 460
Ala Gly Lys Thr Thr Met Leu Asp Ala Ala Arg Arg Ala Trp Glu Ala
465 470 475 480
Ala Gly Phe Arg Val His Gly Ala Ala Ile Ala Lys Lys Ala Ala His
485 490 495
Gly Leu Phe His Gly Ala Asn Ile Asp Ser Gln Ser Leu Ala Ala Leu
500 505 510
Leu Leu Ser Leu Lys Pro Gly Glu Asp Pro Val Thr Gly Glu Pro Ile
515 520 525
Pro Pro Thr Arg Thr Leu Asn Ala Arg Asp Val Ile Val Ile Asp Glu
530 535 540
Ala Gly Met Val Gly Ser Arg Met Met Gln Glu Leu Leu Ala Gln Val
545 550 555 560
Arg Ala Ser Gly Ala Lys Leu Val Leu Val Gly Asp Ile Ala Gln Leu
565 570 575
Gln Ala Ile Asp Ala Gly Gly Ala Phe Arg Ala Leu Gln Lys Thr Gly
580 585 590
Pro Asp Ala Val Ala Tyr Leu Lys Glu Asn Leu Arg Gln Arg Gly Glu
595 600 605
Lys Ala Glu Asp Met Lys Lys Val Val Ala Leu Thr Arg Gln Gly Asp
610 615 620
Ala Ala Lys Ala Leu Glu Ile Leu Asp Arg His Gly Leu Ile Glu Ile
625 630 635 640
Ala Asp Gly Trp Pro Glu Ala Ala Ala Met Ala Val Gly Arg Trp Val
645 650 655
Asn Leu Tyr Asp Ala Glu Gln Pro Gln Glu Ala Leu Leu Leu Ala Ala
660 665 670
Thr Asn Ala Ala Thr Glu Thr Leu Asn Ala Leu Ala Arg His Ala Leu
675 680 685
Lys Ser Arg Gly Leu Leu Asp Asp Arg Pro Ala Val Thr Ile Thr Val
690 695 700
Arg Asp Arg Gln Gly Lys Ser Leu Gly Gln Arg Glu Ile Ala Leu Gly
705 710 715 720
Glu Arg Leu Val Phe Arg Ala Asn Arg Asn His Ala Gly Ile Leu Asn
725 730 735
Asn Glu Ala Gly Thr Val Thr Ala Leu Ser Glu Gly Phe His Gly Pro
740 745 750
Glu Ile Thr Ile Arg Lys Asp Asp Gly Ser Glu Ile Thr Ile Ile Pro
755 760 765
Gly Gln Ser Val Pro Glu Gly Arg Thr Glu Arg Gln Ile Ser Pro Gly
770 775 780
Ala Gly Tyr Ala Gln Ile Glu Tyr Ala Tyr Ala Gly Thr Thr His Arg
785 790 795 800
Asn Gln Gly Thr Thr Ala Asp His Val Val Val Phe Ala Asp Gly Ser
805 810 815
Met Glu Ser Arg Glu Lys Ala Tyr Val Asp Leu Ser Arg Met Arg His
820 825 830
Thr Thr Ala Val Val Phe Ala Arg Pro Asp Ile Glu Asn Asp Leu Ala
835 840 845
Glu Leu Gly Met Glu Pro Glu Val Gln Gly Phe Asp Ala Ile Lys Lys
850 855 860
Ile Ile Gly Ala Met Ser Arg Ser Gln Gln Lys Asn Thr Ser Leu Asp
865 870 875 880
Tyr Thr Val Thr Gly Lys Pro Glu Pro Glu Thr Gly Thr Thr Glu Ser
885 890 895
Thr Pro Ala Ser Leu Pro His Arg Gly Arg Val Ala Ser
900 905
<210> 87
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Afe
<400> 87
Gly His Ala Gly Ala Gly Lys Thr
1 5
<210> 88
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Afe
<400> 88
Tyr Ala Gly Thr Thr His Arg Asn Gln Gly
1 5 10
<210> 89
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Afe
<400> 89
His Ala Ser Ser Arg Glu Gln Asp Pro Gln Ile His Ser His
1 5 10
<210> 90
<211> 1185
<212> PRT
<213> Terriglobus saanensis SP1PR4
<400> 90
Met Leu Thr Ile Ser Lys Ala Ile Ser Ser Val Gln Ala Gln Thr Tyr
1 5 10 15
His Lys Leu Glu Tyr Thr Ser Asp Ala Gln Ser Tyr Tyr Lys Gln Glu
20 25 30
Asp Thr Val Arg Gly Glu Trp Gln Gly Lys Leu Ala Ala Ser Ile Gly
35 40 45
Leu Ser Gly Glu Val Ser Pro Leu Glu Phe Ser Arg Leu Thr Glu Gly
50 55 60
Ile His Pro Gln Thr Glu Ala Gln Met Val Arg His Arg Glu Gly Gln
65 70 75 80
Glu Tyr Thr Ser Ala Asp Gly Ser Val Thr Lys Pro Val Glu His Arg
85 90 95
Ala Gly Trp Asp Ala Thr Phe Ser Ala Pro Lys Ser Val Ser Leu Thr
100 105 110
Ala Leu Val Gly Gly Asp Glu Arg Val Thr Glu Ala His Arg Ala Ala
115 120 125
Val Thr Thr Ala Leu Asp Glu Leu Glu Lys Tyr Thr His Ala Arg Ile
130 135 140
Gly Gly Asn Asn Pro Ala Glu Met Thr Gly Lys Phe Val Ala Ala Lys
145 150 155 160
Phe Glu His Asp Thr Ala Arg Pro Val Asn Gly Tyr Ala Ala Pro Gln
165 170 175
Leu His Thr His Ala Ile Ile Phe Asn Val Thr Glu Arg Glu Asp Gly
180 185 190
Ser Thr Arg Ala Ile Gln Glu Arg Thr Phe Phe Glu Ser Gln Asn Tyr
195 200 205
Ala Thr Ala Val Tyr Gln Ser Val Leu Thr His Arg Leu Arg Lys Leu
210 215 220
Gly Tyr Glu Ile Glu Pro Gly Gln Ser Gly Ala Pro Glu Ile Lys Gly
225 230 235 240
Tyr Ser Gln Ala Tyr Leu Asp Ala Ser Ser Pro Arg Ser Gln Gln Ile
245 250 255
Lys Glu Gln Met Glu Arg Ala Gly Phe Gln Gly Pro Glu Ala Ala Gln
260 265 270
Ile Ala Ala His Ala Thr Arg Asp Arg Lys Gln Thr Leu Thr Pro Ser
275 280 285
Gly Val Leu Ala Ala His Lys Glu Met Ala Ala Glu Tyr Gly Asn Gln
290 295 300
Pro Glu Arg Val Ile Gly Ala Ala Arg Glu Arg Val Leu Thr Gln Ala
305 310 315 320
Gln Gly Thr Gly Val Gln Pro Asp Ser Arg Gly Ala Val Ala Phe Ala
325 330 335
Lys Glu Lys Val Phe Glu Arg Glu Ala Val Ala Asp Glu Arg Val Ile
340 345 350
Met Arg Glu Ala Leu Arg Arg Gly Met Gly Glu Val Ser Phe Ser Glu
355 360 365
Val Gln Ser Glu Phe Gln Arg Arg Arg Glu Glu Gly Glu Phe Arg Ser
370 375 380
Val Gln Gly Gln Lys Tyr Ser Ser Gly Arg Ser Phe Thr Thr Pro Glu
385 390 395 400
Thr Ile Ala Asp Glu Arg Ala Asn Val Arg His Val Leu Asp Gly Leu
405 410 415
Gly Ala Ala Ala Pro Met Leu Ser Thr Ala Ala Ala Asp Gln Gln Ala
420 425 430
Lys Ser Arg Asp Phe Leu Asn Glu Ala Gln Gln Thr Ala Ile Arg Glu
435 440 445
Val Leu Thr Ser Thr Asp Arg Val His Gly Phe Gln Gly Leu Ala Gly
450 455 460
Thr Gly Lys Thr Ser Thr Leu Ala Ala Ile Arg Glu Gly Ala Glu Gln
465 470 475 480
Gly Gly Tyr Lys Val Glu Gly Phe Ala Pro Thr Ser Lys Ala Thr Gly
485 490 495
Gln Leu Arg Glu Ser Gly Ile Glu Ala Asn Thr Leu Gln Ser Phe Leu
500 505 510
Ala Gln Gln Lys Asn Ala Asp Ser Ala Ser Lys His Leu Tyr Met Leu
515 520 525
Asp Glu Ser Ser Leu Ala Ser Thr Arg Gln Met Arg Ala Phe Leu Glu
530 535 540
Lys Ile His Gln Glu Asp Arg Val Leu Val Ile Gly Asp Thr Arg Gln
545 550 555 560
His Gln Gly Val Asp Ala Gly Arg Pro Phe Gln Gln Met Gln Glu Ala
565 570 575
Gly Met Gln Thr Ser Lys Leu Asp Thr Ile Met Arg Gln Lys Asp Pro
580 585 590
Glu Leu Leu Arg Ala Val Gln Tyr Leu Ala Thr Asn Glu Thr Glu Lys
595 600 605
Gly Ile Ala Leu Leu Ser Gln Gln Gly Arg Val Thr Glu Leu Ala Arg
610 615 620
Ala Ser Glu Arg Ile Val Ala Ile Ala Arg Asp Tyr Ala Ala Arg Pro
625 630 635 640
Glu Asn Thr Leu Ile Val Ser Pro Asp Asn Arg Ser Arg Gln Gln Ile
645 650 655
Asn Glu Ala Val Arg Gly Glu Leu Leu Lys Asp Gly Thr Leu Ala Gln
660 665 670
Asp Gly Arg Gln Phe Leu Thr Leu Ser His Arg Ser Asp Met Thr Gly
675 680 685
Pro Asp Arg Thr Trp Ala Ala Met Tyr Arg Pro Gly Asp Val Val Gln
690 695 700
Tyr Glu Arg Gly Ser Lys Ala Glu Gly Ile Gly Arg Gly Ser Phe Gly
705 710 715 720
Val Val Gln Ser Ser Asp Ala Ala Ser Asn Arg Leu Thr Val Glu Phe
725 730 735
Ser Asn Gly Ser Ser Val Glu Tyr Asp Pro Lys Arg Val Tyr Gly Val
740 745 750
Asn Val Tyr Arg Glu Thr Ser Arg Glu Phe Ala Thr Gly Asp Arg Leu
755 760 765
Gln Phe Ser Ala Ile His Lys Asp Leu Gly Ile Ser Asn Arg Asp Met
770 775 780
Gly Thr Ile Thr Lys Met Glu Pro Asp Arg Leu Thr Val Leu Met Asp
785 790 795 800
Gly Lys Glu Gln Arg Ser Val Ser Phe Asn Pro Ala Asp Phe Arg Gln
805 810 815
Phe Asp His Gly Tyr Ala Val Thr Ser His Ser Ser Gln Gly Leu Thr
820 825 830
Thr Asp Arg Val Ile Ala Asn Ile Asp Thr Asp Ser Ser Arg Ser Leu
835 840 845
Ile Asn Asn Arg Leu Ala Tyr Val Ala Ile Ser Arg Ala Ser Glu Asp
850 855 860
Ala Arg Ile Tyr Thr Asn Asp Ala Ala Thr Leu Gly Gln Arg Leu Ser
865 870 875 880
Thr Asp Val Thr Lys Thr Ala Ala Leu Asp Phe Thr Ala Arg Pro Glu
885 890 895
His Ser Ala Ala Gln Glu Val Ser Lys Ala Arg Thr Val Val Val His
900 905 910
Glu Tyr Asn Asn Pro Asp Ser Arg Leu Ala Ser Val Thr Arg Glu Tyr
915 920 925
Val Ile Arg Pro Glu Arg Ser Ile Ile Phe Ala Pro Asp Arg Ala Glu
930 935 940
Arg Glu Lys Leu Thr Gln Ile Ile Arg Ala Asp Leu Tyr Ala Asn Gly
945 950 955 960
Lys Leu Gly His Asp Ala Gln Ala Met Ser Val Leu Ile Glu Lys Glu
965 970 975
Thr Gly Ser Lys Met Arg Val Glu Ser Tyr Gln Pro Gly Asp Lys Ile
980 985 990
Gln Tyr Lys Thr Gly Ser Pro Gly Leu Asp Gly Ile Pro His Asp Ser
995 1000 1005
His Ala Thr Val Val Ser Thr Thr Pro Arg Ser Asn Leu Leu Ser
1010 1015 1020
Val Arg Phe Asp Ala Thr Arg Glu Glu Val Ser Tyr Asn Pro Ala
1025 1030 1035
Gln Phe Arg Thr Gln Thr Arg Glu Ser Arg Val Tyr Gln Glu Glu
1040 1045 1050
Thr Arg Glu Val Ala Gln Gly Glu Arg Val Arg Phe Thr Thr Tyr
1055 1060 1065
Asp Lys Glu Ile Gly Val Arg Ser Gly Asp Leu Gly Thr Val Thr
1070 1075 1080
Arg Ile Gly Gln Asp His Ser Met Thr Val Lys Met Asp Ser Gly
1085 1090 1095
Arg Thr Ala Glu Val Ser Pro Glu Lys Ala Leu His Ile Asp Tyr
1100 1105 1110
Gly Tyr Ala Val Asp Ser Leu Lys Asn Val Arg Ala Glu Arg Val
1115 1120 1125
Ile Ala Thr Gly Asp Arg Leu Thr His Gln Ser Phe Gln Gly Thr
1130 1135 1140
Ser Ser Lys Ala Gly Leu Ser Leu Tyr Thr Asn Ala Pro Gln Gln
1145 1150 1155
Asp Ser Ser Pro Thr Lys Glu Ile Ala Ser Pro Glu Leu Ala Gln
1160 1165 1170
Pro Ala Lys Gln Gln His Asp Phe Gly Ile Gly Phe
1175 1180 1185
<210> 91
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Tsa
<400> 91
Gly Leu Ala Gly Thr Gly Lys Thr
1 5
<210> 92
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Tsa
<400> 92
Tyr Ala Val Thr Ser His Ser Ser Gln Gly
1 5 10
<210> 93
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Tsa
<400> 93
His Asp Thr Ala Arg Pro Val Asn Gly Tyr Ala Ala Pro Gln Leu His
1 5 10 15
Thr His
<210> 94
<211> 1186
<212> PRT
<213> Microlunatus phosphovorus NM-1
<400> 94
Met Thr Val Ser Met Arg Val Met Thr Ala Gly Asp Gly Tyr Lys Tyr
1 5 10 15
Leu Leu Arg Ser Val Ala Ala Gly Asp Gly Asp Arg Ser Leu Ser Thr
20 25 30
Pro Leu Thr Arg Tyr Tyr Ala Glu Ala Gly Asn Pro Pro Gly Phe Trp
35 40 45
Ile Gly Gln Gly Leu Ala Ala Leu Gly His Gly Glu Leu Thr Thr Gly
50 55 60
Ser Glu Val Ser Glu Ala Gln Leu Glu Leu Leu Ile Gly Ser Gly Arg
65 70 75 80
Asp Pro Ile Thr Gly Asp Pro Leu Gly Lys Ala Tyr Pro Thr Phe Ala
85 90 95
Pro Val Ala Asp Arg Ile Glu Arg Arg Ile Lys Ala Leu Asp Ala Glu
100 105 110
Leu Gly Pro Ala Ala Arg Ala Val Glu Thr Ala Arg Ile Glu Ala Glu
115 120 125
Glu Ile Glu Arg Gly Thr Arg Arg Ala Val Ala Gly Phe Asp Phe Thr
130 135 140
Phe Ser Val Pro Lys Ser Val Ser Ala Leu Trp Ala Val Ala Asp Ala
145 150 155 160
Gly Thr Gln Ala Leu Ile Ala Asp Ala His His Ala Ala Val Ala Glu
165 170 175
Leu Val Ala Phe Ile Glu Gly Glu Val Ala Val Thr Arg Thr Gly Ala
180 185 190
Asp Gly Pro Glu Gly Thr Val Ala His Val Asp Val Leu Gly Val Ala
195 200 205
Ala Thr Ala Phe Asp His Tyr Asp Ser Arg Ala Gly Asp Pro Gln Leu
210 215 220
His Thr His Val Val Ile Ser Asn Lys Val Lys Thr Ala Gln Asp Gly
225 230 235 240
Lys Trp Arg Ala Leu Ala Gly Arg Pro Met His Ala Ala Val Val Ala
245 250 255
Val Ser Glu Leu Tyr Asn Ala Ala Leu Ala Asp Gln Leu Thr Arg Thr
260 265 270
Leu Gly Ile Glu Trp Glu Ser Arg Asp Arg Gly Arg Asp Arg Asn Pro
275 280 285
Ala Trp Glu Leu Val Gly Val Thr Glu Glu Leu Ile Gly Glu Phe Ser
290 295 300
Thr Arg Ser His His Ile Glu Ala Glu Lys Glu Arg Leu Ile Ala Glu
305 310 315 320
Tyr Val Ala Thr His Gly Arg Gln Pro Ser Ala Arg Ile Val Leu Lys
325 330 335
Leu Arg Ala Gln Ala Thr Leu Ala Thr Arg Pro Glu Lys His Ile His
340 345 350
Ser Leu Ala Asp Leu Thr Arg Gln Trp Arg Glu Arg Ala Gly Arg Val
355 360 365
Leu Gly Gln Asp Ala Thr Gly Trp Ala Arg Thr Leu Thr Arg Gln Ala
370 375 380
Ala Asp Ala Pro Ala Arg Val Leu Arg Ala Asp Asp Val Pro Leu Asp
385 390 395 400
Val Val Arg Glu Val Gly Leu Ser Val Met Ala Val Val Ser Glu Lys
405 410 415
Arg Ser Thr Trp Met Arg Trp Asn Leu His Ala Glu Ala Ser Arg Gln
420 425 430
Met Met Gly Trp Arg Phe Gly Thr Met Leu Asp Arg Glu Ala Ile Thr
435 440 445
Gly Leu Val Val Asp Ala Ala Glu Gln Ala Ser Leu Arg Leu Thr Pro
450 455 460
Pro Glu Leu Ala Ser Ser Pro Val Gln Phe Arg Arg Ser Asp Gly Thr
465 470 475 480
Ser Arg Phe Arg Pro His Ala Ser Val Leu Phe Ser Ser Glu Ala Leu
485 490 495
Leu Ala Ala Glu Asp Arg Leu Leu Ala Arg Ala Asp Thr Leu Ala Gly
500 505 510
Pro Val Val Gly Leu Glu Thr Val Glu Gln Ile Thr Ser Arg Pro Asp
515 520 525
Pro Arg Gly Arg Met Leu Gly Glu Asp Gln Ala Ala Ala Leu Ala Ala
530 535 540
Ile Ala Val Ser Gly Arg Thr Leu Asp Val Leu Val Gly Pro Ala Gly
545 550 555 560
Ala Gly Lys Thr Thr Ala Met Asn Ala Leu Arg Arg Ala Trp Glu Lys
565 570 575
Glu His Gly Pro Gly Ser Val Val Gly Leu Ala Pro Ser Ala Val Ala
580 585 590
Ala Gln Val Leu Ala Asp Asp Leu Gly Val Val Thr Glu Asn Thr Ala
595 600 605
Lys Trp Trp Gln Asn His Leu Met His Gly Thr Thr Phe Glu Ala Gly
610 615 620
Gln Leu Ile Ile Ile Asp Glu Ala Ser Leu Ala Gly Thr Ala Ser Leu
625 630 635 640
Asp Arg Ile Thr Ala Glu Ala Glu Gln Ala Gly Ala Lys Thr Leu Leu
645 650 655
Val Gly Asp Trp Gly Gln Leu Gln Ser Val Asp Ala Gly Gly Ala Phe
660 665 670
Ser Met Leu Val His Ala Arg Asp Asp Thr Pro Glu Leu Leu Asp Ile
675 680 685
His Arg Phe Thr His Arg Trp Glu Lys Thr Thr Ser Leu Gln Leu Arg
690 695 700
His Gly Arg Pro Glu Ala Ile Asp Thr Leu Ile Asp His Asp Arg Ile
705 710 715 720
Thr Gly Gly Glu Gln Glu Ala Met Ile Asp Ala Ala Tyr Gly Ala Trp
725 730 735
Arg His Asp Leu Ala Ala Gly Arg Ala Ser Ile Leu Val Ala Glu Thr
740 745 750
His Glu Thr Val Thr Ala Leu Asn Ala Arg Ala Arg Ala Asp Arg Ile
755 760 765
Ile Asp Gly Thr Val His Gly Thr Arg Glu Val Gly Leu His Asp Gly
770 775 780
Thr Ala Val Ser Glu Gly Asp Leu Val Ile Thr Arg His Asn Asp Arg
785 790 795 800
Arg Leu Arg Asn Gly Arg Ser Trp Val Arg Asn Gly Asp Arg Trp Thr
805 810 815
Val Ala Gly Val His Ala Asp Gly Ser Val Ser Ile Arg Pro Val Gly
820 825 830
Arg Arg Arg Arg Gly Gly Ile Val Leu Pro Ala Asp Tyr Val Ala Glu
835 840 845
His Leu Asp Leu Gly Tyr Ala Ile Thr Ala His Arg Ala Gln Gly Val
850 855 860
Thr Thr Asp Thr Ala His Val Ile Ala Thr Ala Thr Thr Thr Arg Glu
865 870 875 880
Asn Phe Tyr Val Ala Met Thr Arg Gly Ala Asp Gly Asn Tyr Ala Tyr
885 890 895
Val Val Leu Asp Arg Pro Asp Asp Ser His Gly Val Pro His Pro Ser
900 905 910
Asp Asn Pro Asp Ala Thr Ala Arg Ser Val Leu Tyr Gly Val Ile Gln
915 920 925
His Ile Gly Ala Glu Leu Ser Ala His Glu Thr Ile Thr Ala Glu His
930 935 940
Glu Arg Trp Ser Asn Ile Gly Gln Leu Ala Ala Glu Tyr Glu Thr Ile
945 950 955 960
Ala Gln Ala Ala Gln His Asp Arg Trp Gly Ala Leu Leu Ala Ala Ala
965 970 975
Gly Leu Ala Ser Ala Gln Val Asp Ala Val Leu Asp Ser Asp Ala Tyr
980 985 990
Pro Ala Leu Ser Ala Glu Leu Arg His Ala Glu Ala Asn His His Asp
995 1000 1005
Leu Asp Thr Leu Leu Pro Arg Leu Ile Ala Ala Arg Gly Leu Gly
1010 1015 1020
Asp Ala Asp Asp Ile Ala Ser Val Ile His Ala Arg Val Ala Arg
1025 1030 1035
Ala Thr Ala Arg Pro Ala Gly Ser Gly Arg Thr Arg Lys Pro Pro
1040 1045 1050
Arg Leu Ile Ala Gly Leu Ile Pro Tyr Ala His Gly Pro Met Ala
1055 1060 1065
Asp Asp Met Arg Gln Ala Leu Asp Glu Arg His Glu Leu Ile Glu
1070 1075 1080
Ala Arg Ala Asp Ala Val Leu Thr Gly Ala Leu Thr Asp Lys Ala
1085 1090 1095
Leu Trp Thr Ala Gln Leu Gly Pro Ala Pro Lys Asp Ala Lys Gln
1100 1105 1110
Arg Arg Ala Trp Arg Arg Ala Ala Val Ile Val Ala Ala Tyr Arg
1115 1120 1125
Asp Arg Tyr Gln Ile Thr Asp Asp Arg Ser Pro Leu Gly Pro Ala
1130 1135 1140
Pro Gln Ser Thr Arg Gln Lys Ile Asp Ala Ala Arg Ala Arg Ala
1145 1150 1155
Ala Leu Asp Arg Ala Arg Ala Ile Thr Asp Glu Thr Gln Pro Glu
1160 1165 1170
Pro Ala Arg Ser Ala Thr Thr Arg Pro Ala Arg Thr Leu
1175 1180 1185
<210> 95
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Mph
<400> 95
Gly Pro Ala Gly Ala Gly Lys Thr
1 5
<210> 96
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Mph
<400> 96
Tyr Ala Ile Thr Ala His Arg Ala Gln Gly
1 5 10
<210> 97
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Mph
<400> 97
His Tyr Asp Ser Arg Ala Gly Asp Pro Gln Leu His Thr His
1 5 10
<210> 98
<211> 1843
<212> PRT
<213> Thermodesulfovibrio yellowstonii DSM 11347
<400> 98
Met Val Asn Phe Leu Glu Lys Glu Gly Tyr Ile Gln Tyr Arg Glu Thr
1 5 10 15
Val Asn Gly Glu Thr Ile Ser Lys Ser Ser Asp Asn Ala Thr Val Leu
20 25 30
Val Asn Thr His Leu Cys Gly Arg Leu Asp Pro Gln Ile His Asn His
35 40 45
Ile Ser Phe Phe Asn Phe Thr Arg Thr Glu Asn Gly Asp Trp Lys Ala
50 55 60
Ile Asn Ser Asp Ala Ile Tyr Ser Asn Lys Tyr Met Phe Glu Ala Tyr
65 70 75 80
Leu Glu Asn Gln Leu Ala Tyr Gln Leu Lys Gln Gln Gly Ile Asn Thr
85 90 95
Glu Leu Val Lys Glu Gly Asn Ser Lys Glu Tyr Val Thr Lys Ile Ala
100 105 110
Gly Leu Asn Glu Glu His Trp Lys Gly Ile Ala Arg Thr Ser Glu Leu
115 120 125
Ile Asp Lys Tyr Leu Glu Gln His Lys Glu Glu Leu Leu Gln Lys Tyr
130 135 140
Pro Asn Ala Thr Glu Ser Gln Leu Arg Glu Tyr Ala Tyr Leu Glu Ile
145 150 155 160
Arg Gln Ser Lys Gln Ser Lys Thr Ile Gly Glu Leu Phe Lys Gln Val
165 170 175
Glu Asp Ser Leu Lys Glu Gln Gly Leu Thr Gln Gln Asp Ile Ile Lys
180 185 190
Leu Val Ser Glu Lys Arg Glu Asn Leu Thr Gln Glu Leu Asn Gln Ala
195 200 205
Asn Lys Glu Glu Leu Ala Lys Glu Ile Ile Asn Lys Ala Ile Asp Glu
210 215 220
Val Ile Asp Arg Asn Ser Thr Phe Ser Gln Ser Asp Leu Phe Lys Ala
225 230 235 240
Ala Phe Gln Ile Ser Ala Gly Arg Val Asp Ser Asp Thr Leu Val Gln
245 250 255
Ala Val Lys Glu Asn Glu Arg Leu Ile Glu Met Gly Tyr Val Gln Asp
260 265 270
Lys Gln His Asn Arg Ala Asn Ala Thr Tyr Gln Glu Lys Tyr Phe Thr
275 280 285
Ser Gln Glu Val Ile Ala Trp Glu His Asn Ile Leu Lys Ser Ile Glu
290 295 300
Glu Gly Lys Gly Ser Val Glu Lys Ile Thr Glu Gln Arg Tyr Glu Asn
305 310 315 320
Glu Lys Leu Thr Lys Ser Gln Leu Glu Ala Ile Asn His Ile Leu Gln
325 330 335
Ser Thr Asp Arg Tyr Thr Ala Val Val Gly Trp Ala Gly Val Gly Lys
340 345 350
Thr Thr Phe Val Gly Glu Met Ser Lys Glu Leu Gly Lys Ile Asn Glu
355 360 365
Ile Ala Lys Glu Ala Gly Tyr Arg Leu Ile Gly Val Ser Asn Thr Asn
370 375 380
Thr Ala Val Asn Glu Leu Lys Glu Val Gly Ile Glu Ala Met Thr Thr
385 390 395 400
Ala Lys Phe Leu Asn Ser Ala Lys Ala Leu Gln Ser Leu Asp Ser Lys
405 410 415
Thr Ile Leu Ile Val Asp Glu Ala Ser Phe Leu Ser Thr Lys Asp Met
420 425 430
Ser Thr Ile Leu Asp Lys Thr Arg Glu Ser Gly Cys Arg Ile Val Phe
435 440 445
Ile Gly Asp Asp Arg Gln Leu Pro Gly Val Gln Ala Gly Ser Pro Phe
450 455 460
Ala Ala Leu Ile Arg Glu Asn Lys Ile Asn His Val Lys Met Thr Asp
465 470 475 480
Ile Val Arg Gln Arg Asn Glu Glu Leu Lys Ser Ala Val Tyr Asp Ile
485 490 495
Tyr His Lys Asn Ile Glu Ser Ala Leu Asn Lys Ile Thr Phe Lys Thr
500 505 510
Ile Glu Arg Asp Ser Ala Leu Glu Ile Ala Thr His Ala Leu Lys Ser
515 520 525
Asp Lys Pro Ile Asn Ile Val Asp Arg Glu Ile Phe Glu Lys Val Lys
530 535 540
Glu Met Phe Glu Gly Gln Gly Ser Ala Thr Gln Tyr Val Gln Gln Phe
545 550 555 560
Lys Ser Ala Pro Phe Glu Arg Glu Ile Ile Glu Lys Leu Gly Ile Glu
565 570 575
Asp Ala Gly Gln Arg Glu Ala Phe Phe Phe Tyr Lys Asp Phe Gly Phe
580 585 590
His Glu Gly Glu Asn Pro His Gly Ile Lys Glu Asp Gln Ala Lys Lys
595 600 605
Ser Ile Arg Gln Met Ile Lys Met Gly Trp Val Val Ala Thr Glu Val
610 615 620
Glu Val Asn Gly Lys Lys Tyr Gly Ala Tyr Gln Lys Thr Gly Leu Phe
625 630 635 640
Gly Val Asp Pro Ser Arg Ile Arg Glu Val Leu Gly Glu Lys Tyr Glu
645 650 655
Glu Tyr Gln Lys Gln Ile Glu Gln Gln Gln Lys Glu Ile Leu Arg Glu
660 665 670
Ile Ala Lys Glu Tyr Ile Ser Gln Gly Tyr Lys Asn Ser Ala Ile Ser
675 680 685
Val Ala Thr Asn Gln Asp Ala Lys Ile Leu Asn Ser Leu Ile Ser Glu
690 695 700
Glu Leu Arg Asn Gly Glu Leu Lys Gly Ala Lys Ser Ile Glu Val Asn
705 710 715 720
Val Trp Val Asn Lys Asn Leu Asp Asn Val Glu Arg Leu Lys Ala Ser
725 730 735
Ser Tyr Asn Val Gly Asp Lys Leu Leu Val Met Ser Ser Gly Gly Gly
740 745 750
Val Ser Val Gly Lys Glu Leu Phe Val Lys Glu Val Asp Ile Val Lys
755 760 765
Asn Thr Leu Lys Val Glu Tyr Thr Thr Lys Lys Gly Glu Val Lys Glu
770 775 780
Arg Val Phe Asn Ile Glu Lys Leu Gly Asp Lys Val Gln Ala Phe Gln
785 790 795 800
Asn Glu Ser Ile Gln Ile Ala Glu Gly Glu Lys Leu Ile Phe Asn Asn
805 810 815
Thr Tyr Arg Asn Lys Asn Phe Ala Asn Ser Glu Phe Ala Tyr Val Lys
820 825 830
Ser Ile Asn Asn Glu Asp Gly Ser Ile Thr Ile Val Ser Lys Leu Asp
835 840 845
Ser Asp Lys Ala Lys Thr Thr Thr Phe Thr Lys Glu Glu Leu Ala Gln
850 855 860
Gly Val His Phe Gln His Gly Tyr Ala Val Thr Ala Asp His Met Gln
865 870 875 880
Gly Lys Thr Thr Gln Asn Val Ile Ala Phe Glu Thr Arg Asn Tyr Glu
885 890 895
Asn Phe Leu Val Ser Ile Thr Arg Ala Lys Gln Asn Ala Thr Ile Tyr
900 905 910
Ser Thr Met Ser Lys Glu Arg Phe Ile Glu Lys Ala Ser Glu Glu Ala
915 920 925
Thr Lys Glu Arg Ile Glu Arg Met Ala Tyr Lys Phe Asn Glu Glu Val
930 935 940
Phe Asn Thr Val Lys Glu Gln Ile Tyr Lys Asn Phe Lys Gln Gln Gln
945 950 955 960
Glu Gln Val Lys Glu Gln Gly Phe Glu Asn Glu Arg Glu Gly Gln Phe
965 970 975
Gln Lys Gln Glu Ser Lys Glu Gln Ser Glu Arg Tyr Gln Glu Ser Val
980 985 990
Phe Trp Ala Ser Glu Ala Ile Lys Asn Tyr Glu Lys Ser Glu Tyr Gln
995 1000 1005
Lys Trp Ala Lys Asn Phe Ser Glu Lys Asp Phe Lys Ala Val Gln
1010 1015 1020
Lys Pro Gln Lys Pro Asn Ile Val Lys Lys Ile Ala Asn Ala Met
1025 1030 1035
Val Asp Ser Asn Tyr Val Asp Arg Lys Phe Lys Asp Trp Leu Asn
1040 1045 1050
Gly Lys Thr Arg Asp Lys Phe Glu Lys Trp Thr Leu Lys Asp Gln
1055 1060 1065
Ile Lys Thr Trp Trp Lys Asn Asn Leu Asn Arg Asp Leu Glu Lys
1070 1075 1080
Leu Thr Gly Gln Lys Arg Arg Asp Tyr Trp Lys Thr Tyr Glu Val
1085 1090 1095
Tyr Thr Lys Asp Gln Asn Gly Gln Trp His Lys Gly Ile Gln Lys
1100 1105 1110
Leu His Val Arg Val Arg Gly Asp Lys Thr Thr Ile Glu Gly Tyr
1115 1120 1125
Thr Leu Thr Lys Asp Gly Ile His Tyr Phe Lys Ile Glu Lys Gln
1130 1135 1140
Lys Gly Leu Phe Gly Ile Glu Lys Val Leu Asp Gln Ser Met Glu
1145 1150 1155
Phe Ala Pro His Gln Leu Ser Pro Val Gln Gln Ile Ala Ala Val
1160 1165 1170
Gly Ala Gln Lys Pro Val Ile Gln His Val Glu Pro Pro Lys Leu
1175 1180 1185
Glu Lys Tyr Phe Thr Pro Ala Gln Met Lys Asn Ile Gln Asp Met
1190 1195 1200
Ala Arg Glu Ile Val Gln Lys Gln Gln Glu Lys Gln Gln Lys Ile
1205 1210 1215
Ser Glu Val Arg Glu Tyr Glu Gln Lys Ser His Glu His Ile Arg
1220 1225 1230
Glu Pro Ile Gln Lys Trp Gln Glu Met Val Gln Ala Gly Asp Arg
1235 1240 1245
Phe Asn Glu Val Leu Ala Asn Thr Trp Gln Lys Trp Gln Ser Gln
1250 1255 1260
Ala Gln Asn Val Arg Glu Phe Ile Ile Gln Lys Asp Arg Thr Thr
1265 1270 1275
Asn Lys Glu Ile Phe Gln Trp Ser Lys Glu Asn Gln Ile Gly Lys
1280 1285 1290
Glu Val Val Leu Ala Thr Thr Arg Glu Met Gln Asp Lys Gly Leu
1295 1300 1305
Ile Cys Val Glu Ser Tyr Asp Glu Lys Thr Arg Thr Ile Thr Phe
1310 1315 1320
Ile Ser Ala Ser Lys Leu Ser Glu Gln Gln Lys Ala Ile Ser Lys
1325 1330 1335
Ala Val Glu Ser Ile Tyr Arg Asn Ser Ser Lys Trp Ser Phe Ser
1340 1345 1350
Leu Lys Asp Ile Lys Ala Glu Leu Lys Arg Ser Gly Val Asp Ala
1355 1360 1365
Ala Asp Arg Thr Ile Tyr Lys His Leu Ser Ser Met Gly Tyr Lys
1370 1375 1380
Lys Asp Asp Lys Gly Arg Phe His Phe Leu Asn Asp Ser Ile His
1385 1390 1395
Val Arg Gln Asp Arg Glu Ile Ile Ser Val Phe Ala Glu Lys Thr
1400 1405 1410
Ser Gly Lys Gly Tyr Phe Thr Ala Ser Glu Leu His Lys Asn Ile
1415 1420 1425
Ser His Ile His His Ile His Pro Gln Arg Leu Glu Lys Tyr Leu
1430 1435 1440
His Glu Glu Lys Thr Leu Lys Leu Ile Gly Phe Gln Lys Asn Ser
1445 1450 1455
Asp Gly Lys Leu Glu Ala Ile Phe Cys His Lys Gln Asp Tyr Glu
1460 1465 1470
Asn Ser Lys Gln His Trp Leu Asn Ser Ile Ala Ser Ile Pro Gln
1475 1480 1485
Lys Ala Asp Glu Gln Leu Val Arg Phe Tyr Ile Glu Lys Glu Gly
1490 1495 1500
Ile Ser Pro Trp Lys Asn Leu Thr Lys Asp Gln Leu Gln Lys Leu
1505 1510 1515
Gln Ser Glu Phe Lys Asn Ala Gly Val Asn Glu Lys Lys Gly Tyr
1520 1525 1530
Phe Phe Ser Cys Val Glu Arg Val Gln His Gln Met Arg Glu Thr
1535 1540 1545
Glu Ile Gln Arg Val Met Gln Thr Ile Arg Phe Met Thr Glu Arg
1550 1555 1560
Met Gln Gln Ser Gln Gln Gln Gln Glu His Ser Leu Ala Gln Gln
1565 1570 1575
Asn Val Gln Ile Asp Arg Glu Val Leu Lys Met His Ser Met Leu
1580 1585 1590
Asn Arg Asn Ile Gln Tyr Asp Ile Thr His Glu Glu Phe Gln Arg
1595 1600 1605
Val Lys Glu Tyr Met Asp Thr His Asn Gly Ser Val Val Ala Met
1610 1615 1620
Gln Asn Pro Pro Gln Asn Glu Lys Tyr Ser Ser Val Leu Tyr Thr
1625 1630 1635
Thr Lys Lys Asp Ile Tyr Met Glu Lys Ala Met Ala Glu Lys Ile
1640 1645 1650
Gly Val Lys Tyr Gln Asn Glu Ser Thr Ala Tyr Phe Ser Ser Lys
1655 1660 1665
Asp Leu Val Ser Asn Thr Gly Leu Gly Lys Asp Lys Ile Asp Gln
1670 1675 1680
Ala Met His Lys Met Phe Arg Ser Gly Trp Val Ile Pro Val Thr
1685 1690 1695
Val Ser Thr Asp Lys Lys Leu Tyr Gly Ala Trp Gln Lys Thr Ser
1700 1705 1710
Leu Tyr Gly Val Asp Thr Glu Arg Val Lys Glu Ala Tyr Gly Lys
1715 1720 1725
Glu Lys Glu Lys Val Val Gln Gln Leu Lys Glu Glu Trp Lys Lys
1730 1735 1740
Ile Lys Ala Gln Glu Gln Gly Asn Lys Lys Glu Lys Asp Tyr Ile
1745 1750 1755
Ser Lys Thr Asp Ile Arg Asn Glu Leu Asn Asn Glu Val His Thr
1760 1765 1770
Lys Ala Ile Ser Glu Gly Ile Lys Arg Ser Leu Asp Gly Asn Ile
1775 1780 1785
Ile Ser Glu His Lys Ile Thr Ile Lys Thr Lys Glu Ser Asp Ser
1790 1795 1800
Lys Glu Val Thr Val Tyr Lys Pro Ala Gln Ser Ile Glu Lys Ser
1805 1810 1815
Gln Ser Gln Ser His Glu Lys Ser Thr Asn Pro Ser Gln Asp Lys
1820 1825 1830
Thr Ala Ser Val Ser Met Glu Arg Gly Arg
1835 1840
<210> 99
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Tye
<400> 99
Gly Trp Ala Gly Val Gly Lys Thr
1 5
<210> 100
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Tye
<400> 100
Tyr Ala Val Thr Ala Asp His Met Gln Gly
1 5 10
<210> 101
<211> 13
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Tye
<400> 101
His Leu Cys Gly Arg Leu Asp Pro Gln Ile His Asn His
1 5 10
<210> 102
<211> 942
<212> PRT
<213> Rhodothermus marinus SG0.5JP17-172
<400> 102
Met Ile Arg Gly Val Leu Ile Ser Arg Ala Ser Val Gln Arg Gln Leu
1 5 10 15
Asp His Met Ala Ala Val Pro Gly Arg Gln Asp Val Val Trp His Gly
20 25 30
Ile Ala Leu Ser His Asp Gly Leu Gln Gly Ile Ala Arg Glu Gly Lys
35 40 45
Leu Ser Val Ala Gly Thr Gly Ala Arg Leu Leu Gln Leu Pro Ala Gln
50 55 60
Val Ser Thr Lys Gln Ala Thr Ala Leu Ile Leu Gly His Gln Trp Asp
65 70 75 80
Gly Val Asp Ile Gly Gly Arg Gln Val Cys Arg Pro Met Tyr Gly Ile
85 90 95
Val Trp Gly Ala Asp Lys Thr Ile Ser Gln Leu Leu Ala His Glu Gln
100 105 110
Leu Arg Pro Leu Val Leu Glu Ala Met His Glu Ala Val Gln Lys Ala
115 120 125
Leu Ala Glu Thr Glu Arg Leu Leu Trp Thr Arg Ala Gly Lys Gly Gly
130 135 140
Arg Glu Ala Val Pro Val Arg Gly Val Leu Ala Leu Tyr Ser Ile His
145 150 155 160
Met Thr Ser Gly Asp Gly Ser Pro His Leu His Val His Ile Gly Leu
165 170 175
Arg Ala Thr Ala Pro Ser Val Asp Gly Arg Trp Arg Thr Leu Asp Pro
180 185 190
Arg Ala Val Phe Gly Leu Trp Lys Arg Thr Leu Asp Gly Ala Ile Gly
195 200 205
Arg His Leu Tyr Gln Ala Leu Gln Gln Arg Gly Ile His Val Asp Glu
210 215 220
His Val Leu Val Gly Ser Thr Trp Thr Pro Ala Ile Arg Ser Leu Thr
225 230 235 240
Pro His Ser Glu Arg Leu Ser Arg Arg Arg Gln Gln Val Leu Glu Ala
245 250 255
Leu Ala Thr Leu Ala Asp Asp Pro Thr Trp Arg Gln Asn Leu Val Ala
260 265 270
Trp Arg Ile Thr Arg Arg Asp Val Ala Leu Glu Ala Val Glu His Gly
275 280 285
Leu Asp Arg Met Leu Arg Asp Pro Glu Gln Ala Arg Arg Val Ala Ala
290 295 300
Val Trp Gly Ile Pro Glu Gly Glu Ile Glu Lys Ala Leu Gly Arg Thr
305 310 315 320
Leu Pro Glu Ala Pro Pro Leu Lys Lys Ala Leu Phe Arg Tyr Ala Glu
325 330 335
Ala Val Arg Met Arg Asp Ala Gln Val Arg Leu Gln Thr Ala Arg Gln
340 345 350
Ile Phe Gly Glu Leu Gln Gly His Ile Arg Arg Trp Cys Val Gly Asp
355 360 365
Ile Thr Ala Ala Leu Ala Tyr His Thr Asp Ala Ala Ser Ala Thr Ala
370 375 380
Leu Thr Tyr Trp Leu Leu Arg Asp Trp Gln His Leu Gly Leu Ile Gln
385 390 395 400
Thr Arg Gln Ser Leu Ser Ala Ala Val Phe Ser Arg Leu Leu Lys Gly
405 410 415
Glu Ile Thr Ser Thr Thr Glu Leu Arg Ala Val Phe Gly Pro His Ala
420 425 430
Tyr Val Val Thr Thr Arg Gln Leu Glu Glu Glu Gln Ala Leu Tyr Glu
435 440 445
Lys Ala Leu Gly Leu Ala Arg Ala Arg Arg Gln Pro Ile Leu Thr Asn
450 455 460
Ala Pro Ala His Phe Thr Pro Glu Gln Arg Ala Ala Leu Asp Val Leu
465 470 475 480
Arg Arg Gly Arg Ala Leu Ser Val Val Gln Gly Val Ala Gly Ala Gly
485 490 495
Lys Thr Thr Leu Leu His Pro Leu Val Glu Ala Ala Gln Gln Gln Gly
500 505 510
Leu Arg Val Gln Val Leu Ala Arg Asn Ala Ile Ile Ala Arg Glu Leu
515 520 525
Gly Glu Glu Leu Gly Val Pro Ser Ser Thr Leu Glu Thr Ala Thr Arg
530 535 540
Gln Gly Leu Arg Pro Arg Gln Pro Thr Leu Leu Ile Val Asp Glu Gly
545 550 555 560
Gly Val Val Asp Leu His His Met Gln Ala Leu Leu Glu Ala Ala Ser
565 570 575
Gln Pro His Met Gln Leu Val Leu Leu Gly Asp Arg Gln Gln Thr Gln
580 585 590
Pro Ile Asp Gln Arg Ala Ala Phe Ala Ile Val Ala Ala Ala Ala Ala
595 600 605
Arg Ala Gly Gln Leu Arg Gln Leu Arg Thr Ser Phe Arg Thr Gln Ala
610 615 620
Trp Gln Ala Glu His Glu Ala Leu Arg Arg Ala Leu Ser Pro Gln His
625 630 635 640
Ala Gln Lys Ala Val Ala Met Ala Gly Ala Asp Gly Arg Ile Tyr Gly
645 650 655
Ser Thr Asp Leu Thr Thr Ala Ile Arg Gln Ala Val Asp Trp Trp Gln
660 665 670
Ala Leu Ser Arg Arg Glu Ser Thr Val Ile Leu Ser Pro Thr Asn Glu
675 680 685
Leu Ala Ala Ala Ala Ala Thr Glu Ala Gln Ser Arg Leu Gly Ile Thr
690 695 700
Ile Asp Pro Arg Thr Arg Leu Arg Trp Gly Gln Arg Cys Gly Ile Gly
705 710 715 720
Asp Thr Val Arg Ile Arg Phe Asn Arg His Asp Leu Gly Leu Leu Asn
725 730 735
Gly Thr Thr Ala Arg Val Val Asp Ile Asp Gln Asp Gly Ile Thr Ile
740 745 750
Glu His Arg Gly Arg Arg Leu Tyr Leu Asp His Gly Trp Thr Ala Glu
755 760 765
His Val Glu Leu Ala Tyr Ala Leu Thr Ile Asp Ser Ala Gln Gly Leu
770 775 780
Thr Val Asp Arg Ala Ile Val Leu Ala Thr Glu Thr Gly His Ser Arg
785 790 795 800
Leu Tyr Thr Ala Ala Thr Arg Gly Arg Gln Ala Pro Val Trp Val Val
805 810 815
Val His Asp Glu Glu Glu Thr Pro Asp Gln Ala Leu Glu Arg Arg Leu
820 825 830
Gln Arg Asp Asp Ile Ala Arg Thr Gly His Glu His Val Gly Gln Arg
835 840 845
Ile Gly Lys Ser Thr Ser Pro Glu Lys Glu Arg Leu Leu Ala Ile Leu
850 855 860
Gln Arg Leu Glu Glu His Asp Leu Ile Asp Pro Asp Leu Ala Arg Leu
865 870 875 880
Tyr Arg Ala Arg Ile Leu Asn Asp Ala Thr Arg Pro Arg Ala Lys Arg
885 890 895
Phe Ile Glu Leu His Val Gln Leu Ile Gln Gln Ala Gln Gly Arg Arg
900 905 910
Asp Val Leu Arg Leu Val Arg Thr Ala Arg Tyr Glu Glu Ala Gln Arg
915 920 925
Leu Leu Glu Arg Gly Arg Asn Arg Asp Asp Gly Leu Glu Leu
930 935 940
<210> 103
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Rma
<400> 103
Gly Val Ala Gly Ala Gly Lys Thr
1 5
<210> 104
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Rma
<400> 104
Tyr Ala Leu Thr Ile Asp Ser Ala Gln Gly
1 5 10
<210> 105
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Rma
<400> 105
His Met Thr Ser Gly Asp Gly Ser Pro His Leu His Val His
1 5 10
<210> 106
<211> 961
<212> PRT
<213> Oceanicaulis alexandrii HTCC2633
<400> 106
Met Ala Ile Phe His Phe Ser Ala Lys Val Ile Gly Arg Ser Ser Gly
1 5 10 15
Arg Ser Ala Val Ala Ala Ala Ala Tyr Arg Ala Gly Glu Gln Leu His
20 25 30
Asp Gln Arg Ile Asp Arg Thr His Asp Phe Thr Asn Lys Ala Gly Val
35 40 45
Leu His Ser Glu Val Met Leu Pro Lys Gly Ala Pro Glu Ala Phe Ala
50 55 60
Asp Arg Ala Thr Leu Trp Asn Ala Val Glu Ala Ala Glu Lys Arg Lys
65 70 75 80
Asp Ala Gln Leu Ala Arg Glu Val Glu Phe Ala Leu Pro Arg Glu Leu
85 90 95
Ser Lys Lys Asp Asn Ile Lys Leu Thr Arg Glu Phe Val Lys Ala Glu
100 105 110
Phe Val Glu Lys Gly Met Ile Ala Asp Leu Asn Val His Trp Asp Ile
115 120 125
Gly Glu Asp Gly Lys Ala Lys Pro His Ala His Ala Met Leu Thr Met
130 135 140
Arg Glu Val Thr Lys Asp Gly Phe Gly Ala Lys Val Arg Asp Trp Asn
145 150 155 160
Arg Thr Ala Leu Ile Glu Gln Trp Arg Glu Arg Trp Ala Asp His Val
165 170 175
Asn Arg Ala Leu Ala Glu Arg Asp Ile Asp Ala Arg Ile Asp His Arg
180 185 190
Ser Leu Glu Ala Gln Gly Ile Ala Leu Glu Pro Gln Asp Lys Ile Gly
195 200 205
Pro Ala Ala Ser Arg Ile Gly Gly Arg Gly Leu Glu Ala Glu Arg Ile
210 215 220
Glu Glu His Arg Ala Ile Ala Gln Arg Asn Gly Glu Arg Ile Ile Ala
225 230 235 240
Asn Pro Ala Leu Ala Leu Asp Ala Ile Thr His Gln Gln Ala Thr Phe
245 250 255
Thr Arg Arg Asp Leu Ala Ala Phe Val His Arg His Ser Asp Gly Lys
260 265 270
Glu Gln Phe Asp Ala Ala Tyr Asn Ala Val Arg Ser Ser Ala Asp Met
275 280 285
Ile Ala Leu Gly Thr Asp Gly Arg Gly Gln Asp Arg Phe Thr Ser Arg
290 295 300
Ala Met Ile Glu Ala Glu Gln Arg Leu His Arg Ala Ala Asp Thr Met
305 310 315 320
Ala Glu Arg Lys Gly His Ala Val Asn Asp Val Gln Arg Asn Ala Ala
325 330 335
Phe Ala Asn Ala Ala Lys Arg Gly Leu Val Leu Ser Gly Glu Gln Lys
340 345 350
Ser Ala Phe Glu His Val Thr Asn Ser Lys Gly Leu Thr Ile Val Val
355 360 365
Gly Tyr Ala Gly Thr Gly Lys Ser Ala Met Leu Gly Val Ala Arg Glu
370 375 380
Ala Trp Glu Gly Ala Gly Asn Thr Val Arg Gly Ala Ala Leu Ser Gly
385 390 395 400
Ile Ala Ala Glu Gly Met Glu Asn Gly Ser Gly Ile Ala Ser Arg Thr
405 410 415
Ile Ala Ser Leu Glu His Gln Trp Gly Lys Gly Arg Glu Gln Leu Thr
420 425 430
Ser Arg Asp Val Leu Val Ile Asp Glu Ala Gly Met Val Gly Thr Arg
435 440 445
Gln Met Glu Arg Val Leu Ser His Ala Ala Lys Ala Gly Ala Asn Val
450 455 460
Val Leu Val Gly Asp Gln Gln Gln Leu Gln Ala Ile Glu Ala Gly Ala
465 470 475 480
Ala Phe Arg Ala Ile His Glu Arg His Gly Gly Val Glu Ile Ser Glu
485 490 495
Val Arg Arg Gln Leu Ser Ala Trp Gln Gln Asp Ala Thr Arg His Leu
500 505 510
Ala Thr Gly Arg Thr Gly Glu Ala Ile Ser Thr Tyr Glu Glu Arg Gly
515 520 525
Met Val His Ala Ala Asp Thr Arg Glu Thr Ala Arg Ala Asp Leu Ile
530 535 540
Leu Arg Trp Asn Gln Glu Arg Gln Asp Ser Pro Gly Asp Ser Arg Ile
545 550 555 560
Ile Leu Thr His Thr Asn Asp Glu Val Arg Glu Leu Asn Arg Met Ala
565 570 575
Arg Glu Lys Met Arg Lys Ala Gly Ala Leu Gly Ala Asp Ala Thr Ile
580 585 590
Lys Ala Ala Arg Gly Glu Arg Gln Phe Ala Ser Gly Asp Arg Ile Ile
595 600 605
Phe Leu Arg Asn Glu Arg Gly Leu Gly Val Lys Asn Gly Thr Leu Gly
610 615 620
Thr Val Ala Met Ala Asn Asp Gln Ser Met Ala Val Arg Thr Asp Asp
625 630 635 640
Gly Arg Glu Val Ala Phe Asp Thr Lys Asp Tyr Ala His Ile Asp His
645 650 655
Gly Tyr Ala Ala Thr Ile His Lys Ala Gln Gly Met Thr Val Asp Arg
660 665 670
Ala His Val Leu Ala Thr Pro Gly Leu Asp Ser His Ser Ala Tyr Val
675 680 685
Ala Met Ser Arg His Arg Glu Gly Leu Ala Leu His Tyr Gly Arg Asn
690 695 700
Asp Phe Ala Asp Gln Ser Lys Leu Val Arg Leu Leu Ser Arg Glu Arg
705 710 715 720
Gly Lys Asp Leu Ala Gly Asp Tyr Lys Pro Glu Gln Ala Phe Ala Glu
725 730 735
Leu Arg Gly Ile Ser Phe Arg Glu Arg Ile Ile Glu Val Val Arg Gln
740 745 750
Val Pro Glu Arg Ala Lys Ser Ile Phe Gly Asn Phe Arg Pro Gln Ala
755 760 765
Arg Gln Leu Glu Pro Ile Pro Ala Leu Ala Asn Met Gln Asp Asp Gln
770 775 780
Arg Arg Ala Val Glu Arg Tyr Ala Arg Ala Leu Gly Asp Ile Ala Thr
785 790 795 800
Met Gln Thr Lys Gly Leu Pro Val Leu Pro His Gln Lys Ala Ala Leu
805 810 815
Glu Lys Ala Gly Lys Ala Leu Asp Ala Ile Arg Pro His Ala Ala Thr
820 825 830
Asp Leu Ala Lys Ala Leu Asp Arg Arg Pro Glu Leu Ile Ala Glu Ala
835 840 845
Ala Gly Gly Arg Ser Gln Glu Ala Met Arg Ala Met Gln His Glu Ala
850 855 860
Ala Val Arg Thr Asp Pro Ala Leu Arg Thr Glu Arg Phe Val Ser Asp
865 870 875 880
Trp Gln Gly Leu Ser Thr Ala Arg Lys Gln Leu Glu Gln Gln Gly Asp
885 890 895
Arg Ala Gly Ala Ala Arg Val Ser Ala Lys Gln Asn Glu Leu Ala Lys
900 905 910
Ser Leu Glu Arg Asp Pro Gln Val Glu Gly Leu Leu Arg Gly Lys Ser
915 920 925
Arg Glu Leu Gly Ile Asp Pro Lys Pro Glu Arg Ser Ile Ala Asn Glu
930 935 940
Leu Ser Thr Thr Leu Thr Arg Glu Arg Thr Arg Ser Phe Asp Met Gly
945 950 955 960
Ile
<210> 107
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Oma
<400> 107
Gly Tyr Ala Gly Thr Gly Lys Ser
1 5
<210> 108
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Oma
<400> 108
Tyr Ala Ala Thr Ile His Lys Ala Gln Gly
1 5 10
<210> 109
<211> 24
<212> PRT
<213> Artificial sequence
<220>
<223> MobQ motif III of TrwC Oma
<400> 109
Gly Met Ile Ala Asp Leu Val Asn Val His Trp Asp Ile Gly Glu Asp
1 5 10 15
Gly Lys Ala Lys Pro His Ala His
20
<210> 110
<211> 970
<212> PRT
<213> Citromicrobium sp. JLT1363
<400> 110
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Val Gly Glu Gly Ala Lys Arg Leu Gly Leu Asn Gly Lys Val
35 40 45
Glu Ala Gln Thr Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Leu Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Met Val Glu Lys Gly
115 120 125
Lys Thr Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Thr Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Thr Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Ser Arg Arg Gln Glu Val Leu Asp Ala Arg Arg
225 230 235 240
Gly Ser Gly Leu Glu Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Asp Gly Ile Glu Asp Arg Glu Ala Leu Gly Met Gln Trp Ser
260 265 270
Asp Thr Ala Lys Ser Ile Gly Leu Asp Leu Ala Pro Leu Val Glu Arg
275 280 285
Ala Gln Thr Arg Ser Leu Lys Gln Ser Ile Glu Thr Gly Arg Phe Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Gly Arg Phe Val Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Lys Ser Val Leu Arg
325 330 335
Gln Asp Arg Glu Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Ala Thr Ile Ala Asp Ile Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Met
385 390 395 400
Gly Glu His Lys Asp Trp Leu Ala Ser Arg Asp Glu Val Leu Thr Glu
405 410 415
Gln Arg Ile Val Ser Glu Val Ala Ala Gly Lys Gly Ala Ser Ser Ser
420 425 430
Ala Val Glu Pro Glu Ser Ala Thr Asp Arg Val Gln Ala Ala Ala Met
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Gly Ala Ala Lys
450 455 460
Leu Ile Leu Thr Ser Glu Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Ser Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Lys Lys Leu Leu Asp Asp Pro Gly Asn Ala Ala
530 535 540
Leu Arg Ala Glu Ala Lys Ala Ala Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Asp Val His Arg Leu Val Leu Met Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Thr Gly Met Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Thr Ala Leu Arg His Leu Gln Pro His Thr Leu Glu Ala Arg Gly
645 650 655
Asp Gly Ala Leu Val Ala Ala Asn Thr Trp Leu Ala Leu Asp Lys Asp
660 665 670
Thr Arg Ser Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Asn Gly Glu Ile
690 695 700
Gly Pro Gly Lys Ala Glu Leu Gly Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Ser Ala Tyr Gln Pro Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Ser Ala Gly Glu Tyr
740 745 750
Arg Val Leu Gly Gln Asp Arg Lys Gly Arg Gln Val Glu Val Ala Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Gln Asn Leu Thr Leu His Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Ala Val Val Gly Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Gln Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Ala His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Ile Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ser Asp Arg Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Leu Glu
915 920 925
Val Thr Ala Gln Val Ala Pro Thr Glu Lys Lys Asn Gly Glu Leu Asp
930 935 940
Gln Leu Lys Pro Glu Glu Ala Asn Lys Ala Glu Lys Glu Ile Ala Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 111
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Cjlt
<400> 111
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His
1 5 10
<210> 112
<211> 974
<212> PRT
<213> Erythrobacter sp. SD-21
<400> 112
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ala Asp Asn Tyr Tyr Thr Gly Ala Asp Ala Asp Arg Ser Gly
20 25 30
Thr Trp Val Gly Lys Gly Ala Glu Arg Leu Gly Leu Glu Gly Arg Val
35 40 45
Asn Ala Glu Gln Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Gly Gly
50 55 60
Ile Gln Val Gly Asn Ala Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Leu Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Gly
85 90 95
Asp Gln Arg Ile Ile Asp Ala Tyr Arg Glu Ala Val Ile Glu Thr Leu
100 105 110
Arg Trp Ala Glu Lys Asn Ala Ala Gln Thr Arg Met Gly Ser Gln Ala
115 120 125
Gly Tyr Gly Lys Val Ala Thr Asp Asn Leu Thr Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Val Ala Asn Val Thr Gln Gly Ser Asp Gly Lys Trp Arg Ala Leu Arg
165 170 175
Asn Asp Lys Leu Trp Ser Phe Asn Thr Leu Leu Asn Ser Met Thr Met
180 185 190
Ala Arg Phe Arg Leu Ala Val Glu Lys Met Gly Tyr Glu Ala Gly Pro
195 200 205
Val Gly Lys His Gly Asn Phe Glu Ala Ala Gly Ile Ala Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Glu Glu Val Leu Asp Ala Val Arg
225 230 235 240
Gln Leu Gly Glu Asn Thr Pro Lys Thr Arg Asp Ile Ala Val Leu Asp
245 250 255
Thr Arg Lys Ser Lys Ala Pro Val Arg Asp Arg Asp Gly Leu Leu Asp
260 265 270
Ala Trp Arg Gln Lys Ala Gln Glu Val Gly Ile Asp Leu Ala Gly Leu
275 280 285
Ile Asp Ala Ser Gln Met Arg Ala Ala Ala Lys Val Ala Gly Gly Ser
290 295 300
Lys Glu Gln Ser Leu Leu Gln Arg Gly Ile Thr Lys Leu Arg Glu Phe
305 310 315 320
Ala Gln Arg Ile Lys Gly Asp Pro Ala Asp Pro Leu Ile Pro Ala His
325 330 335
Val Leu Lys Gln Asp Ala Pro Thr Ile Ala Ala Ala Gln Ala Val Ala
340 345 350
Ser Ala Val Arg His Leu Ser Gln Arg Glu Ala Ala Phe Pro Arg Glu
355 360 365
Gly Leu Leu Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Val Asp
370 375 380
His Val Glu Thr Arg Val Asn Ala Leu Val Arg Ser Gly Ala Leu Glu
385 390 395 400
Pro Gly Lys Gly Asp His Lys Gly Trp Leu Ala Ser Arg Glu Ala Leu
405 410 415
Asp Leu Glu Ser Thr Ile Leu Ala Asn Val Asp Gln Gly Arg Gly Ala
420 425 430
Val Leu Pro Ile Leu Asp Arg Lys Asp Ala Ala Glu Arg Val Gln Ala
435 440 445
Val Ala Ala Ile Asn His Gly Ile Ser Leu Asn Glu Gly Gln Glu Asp
450 455 460
Ala Ala Gly Leu Val Leu Ser Ser Arg Asp Arg Ile Val Ala Ile Gln
465 470 475 480
Gly Ile Ala Gly Ala Gly Lys Ser Ser Val Met Lys Pro Val Ala Gln
485 490 495
Leu Leu Gly Glu Glu Gly Lys Gln Val Leu Gly Leu Ala Val Gln Asn
500 505 510
Thr Leu Val Gln Met Leu Glu Arg Asp Thr Gly Ile Arg Ser Met Thr
515 520 525
Ile Ala Arg Phe Leu Ala Gln Trp Gly Arg Leu Leu His Glu Pro Gly
530 535 540
Asn Ala Thr Leu Leu Ser Glu Ala Arg Gly Ala Leu Gly Asp His Val
545 550 555 560
Leu Val Leu Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Ala Lys
565 570 575
Leu Val Arg Leu Ala Asn Leu Ala Glu Val His Arg Leu Val Leu Val
580 585 590
Gly Asp Lys Arg Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Asp
595 600 605
Leu Val Gln Gln Ala Gly Ile Glu Arg Ala Asp Met Asp Val Asn Leu
610 615 620
Arg Gly Arg Asp Pro Val Leu Arg Arg Ala Gln Ala Ala Ala Gln Glu
625 630 635 640
Gly Arg Ile Asp Asp Ala Leu Gln Ala Leu Ala Pro Ser Thr Ile Glu
645 650 655
Ala Arg Gly Asp Ser Ala Ile Val Ala Ala Glu Lys Trp Leu Ser Leu
660 665 670
Ser Pro Ala Asp Arg Asp Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala
675 680 685
Leu Arg Ser Ala Val Asn Glu Ala Val Gln Arg Gly Leu Lys Ala Asn
690 695 700
Gly Glu Leu Gly Leu Arg Ser Gly Arg Leu Thr Val His Ser Arg Val
705 710 715 720
Asn Val Thr Asn Glu Glu Leu Arg Tyr Leu Arg Thr Tyr Gln Pro Gly
725 730 735
Met Val Leu Asn Phe Arg Ser Arg Asp Ser Thr Gln Lys Leu Ser Lys
740 745 750
Gly Asp Tyr Thr Val Lys Thr Ile Asp His Ala Arg Lys Gln Leu Val
755 760 765
Leu Glu Asp Arg Lys Gly Arg Leu Arg Lys Phe Asn Pro Ala Arg Leu
770 775 780
Arg Pro Gly Ala Val Glu Ser Arg Leu Ser Leu Phe Glu Arg Lys Ser
785 790 795 800
Leu Ser Ile Ile Glu Gly Asp Lys Ile Arg Trp Thr Asp Asn Asp His
805 810 815
Lys Arg Gly Leu Phe Asn Ala Asp Gln Ala Arg Ile Val Ala Ile Asp
820 825 830
Thr Lys Gly Val Leu Val Glu Thr Ser Gly Gly Gln Glu Leu Arg Leu
835 840 845
Ser Arg Gly Asp Pro Met Leu Lys Arg Val Asp Leu Ala Tyr Ala Leu
850 855 860
Asn Ala His Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val
865 870 875 880
Met Asp Ser His Glu Arg Asn Leu Ala Asn Arg Gln Thr Phe Leu Val
885 890 895
Ser Val Thr Arg Leu Arg Asp Gly Leu Thr Leu Ile Ala Asp Asn Ala
900 905 910
Glu Lys Leu Gly Arg Ala Ile Lys Ser Asn Ser Gly Val Lys Ala Ser
915 920 925
Ala Leu Glu Val Thr Gln Arg Leu Lys Ala Ala Ala Ala Lys Gly Leu
930 935 940
Ser Gln Asp Arg Asp Val Gly Ser Ala Ser Pro Ala Ser Asp Lys Pro
945 950 955 960
Glu Leu Thr Lys Glu Arg Val Lys Pro Phe Glu Ile Gly Ile
965 970
<210> 113
<211> 970
<212> PRT
<213> Erythrobacter sp. NAP1
<400> 113
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Gln Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Thr His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Leu Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Met Val Glu Lys Gly
115 120 125
Lys Thr Val Thr Gln Thr Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Arg Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Thr Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Thr Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Ser Arg Arg Gln Glu Val Leu Asp Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Glu Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Asp Gly Ile Glu Asp Arg Glu Ala Leu Gly Met Gln Trp Ser
260 265 270
Asp Thr Ala Lys Ser Ile Gly Leu Asp Leu Ala Pro Leu Val Glu Arg
275 280 285
Ala Arg Thr Arg Thr Leu Arg Gln Ser Ile Glu Thr Gly Arg Phe Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Gly Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Lys Ser Val Leu Arg
325 330 335
Gln Asp Arg Glu Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Ile Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Asp His Arg Gly Trp Leu Ala Ser Arg Asp Ala Val Leu Thr Glu
405 410 415
Gln Gln Ile Val Ser Glu Val Ala Ala Gly Arg Gly Ala Ser Ser Pro
420 425 430
Ala Ile Glu Arg Gly Ser Ala Thr Asp Arg Val Gln Thr Ala Ala Met
435 440 445
Ala Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Gly Ala Ala Lys
450 455 460
Leu Ile Leu Thr Ser Glu Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Thr Glu Val Leu Arg
485 490 495
Asp Glu Gly Arg Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Lys Lys Leu Leu Asp Asp Pro Gly Asn Ala Ala
530 535 540
Leu Arg Leu Glu Ala Lys Ala Ala Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Met Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Thr Gly Thr Ala Ser Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Glu Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Gln Pro His Thr Val Glu Ala Lys Gly
645 650 655
Asp Gly Ala Leu Val Ala Ala Asp Thr Trp Leu Ala Leu Asp Lys Asp
660 665 670
Asp Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Ile Gln Gln Gly Leu Leu Ala Asn Gly Glu Ile
690 695 700
Gly Pro Gly Lys Ala Glu Leu Gly Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Ser Ala Tyr Gln Pro Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Ser Ala Gly Glu Tyr
740 745 750
Arg Val Leu Gly Gln Asp Arg Lys Gly Arg Gln Val Glu Val Ala Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Gln Asn Leu Thr Leu His Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Ala Val Val Gly Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Gln Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Ala His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Ile Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ser Asp Arg Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Leu Glu
915 920 925
Val Thr Ala Gln Leu Thr Pro Thr Glu Lys Lys Asn Gly Glu Leu Asp
930 935 940
Gln Leu Lys Pro Glu Glu Ala Asn Lys Ala Glu Lys Glu Leu Ala Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 114
<211> 978
<212> PRT
<213> Novosphingobium pentaromativorans US6-1
<400> 114
Met Leu Ser Val Ala Asn Val Arg Thr Ala Gly Gly Ala Ala Asn Tyr
1 5 10 15
Phe Ala Ala Asp Asn Tyr Tyr Thr Arg Ala Asp Ala Glu Arg Ser Gly
20 25 30
Gln Trp Leu Gly Arg Gly Ala Glu Thr Leu Gly Leu Arg Gly Val Ile
35 40 45
Glu Ala Ser Gln Phe Glu Ala Val Leu Lys Gly Met Leu Pro Asp Gly
50 55 60
Ser Arg Val Gly Ser Asp Asn Arg Ala His Arg Ala Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Met Pro Lys Ser Trp Ser Ile Leu Ala Leu Val Gly Gly
85 90 95
Asp Arg Arg Ile Leu Asp Ala Tyr Gly Ala Ala Val Arg Glu Thr Leu
100 105 110
Ala Trp Ala Glu Lys Asn Leu Ala Glu Thr Arg Met Glu Val Arg Gly
115 120 125
Lys Glu Arg Val Val Ala Thr Arg Asn Leu Val Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Ala His Phe His Ala Val
145 150 155 160
Val Ala Asn Val Thr Gln Gly Pro Asp Gly Lys Trp Arg Ala Leu Arg
165 170 175
Asn Asp Lys Ile Trp Glu His Asn Thr Leu Leu Asn Ala Met Thr Met
180 185 190
Ala Arg Phe Arg Leu Ala Val Glu Lys Leu Gly Tyr Gln Val Gly Glu
195 200 205
Tyr Gly Lys His Gly Asn Phe Glu Ala Val Gly Val Pro Lys Pro Val
210 215 220
Arg Asp Ala Phe Ser Ser Arg Arg Ala Glu Ile Leu Asp Lys Leu Ser
225 230 235 240
Thr Met Glu Gly Lys Gly Leu Ala Ala Arg Asn Ala Ala Asn Leu Met
245 250 255
Thr Arg Ala Asp Lys Gly Pro Val Ala Asp Arg Gln Ala Leu Val Asp
260 265 270
Gln Trp Arg Glu Ala Ala Ala Gln Leu Gly Val Asp Pro Arg Leu Val
275 280 285
Ile Ser Lys Ala Asn Ala Arg Ala Thr Thr Asp Ile Gly Ser Val Ser
290 295 300
Gly Ile Gly Asn Ser Val Arg Ser Ile Gly Gln Arg Ala Arg Leu Leu
305 310 315 320
Ala Ala Thr Phe Ala Glu His Leu Gly Leu Arg Gln Gly Asp Pro Leu
325 330 335
Val Pro Arg Asp Met Glu Arg Arg Thr Pro Glu Gln Ile Ala Ala Val
340 345 350
His Ala Val Ala Ser Ala Ile Arg His Leu Gly Glu Arg Glu Ala Ala
355 360 365
Phe Ser Arg Thr Glu Ile Tyr Arg Ser Ala Leu Gly Phe Ala Leu Pro
370 375 380
Thr Thr Leu Pro Asp Ile Glu His Arg Val Asp Gln Leu Leu Arg Gln
385 390 395 400
Gly His Leu Gln Lys Gly Lys Gly Ala Asp Arg Asn Leu Val Thr Thr
405 410 415
Arg Asp Ala Ile Gly Leu Glu Gln Arg Ile Ile Ala Ala Val Glu Thr
420 425 430
Gly Arg Gly His Gly Ser Ala Val Val Glu Ala Asp Val Ala Gly Glu
435 440 445
Arg Leu Gln Ala Leu Ser Gln Leu Lys Tyr Gly Leu Thr Leu Asn Pro
450 455 460
Gly Gln Glu Gly Ala Gly Arg Leu Leu Leu Ala Ser His Asn Arg Ile
465 470 475 480
Val Ala Ile Gln Gly Val Ala Gly Ala Gly Lys Ser Thr Val Leu Lys
485 490 495
Pro Val Ala Asp Ile Leu Arg Glu Glu Gly Arg Ser Val Leu Gly Leu
500 505 510
Ala Val Gln Asn Thr Leu Val Gln Met Leu Glu Arg Asp Thr Gly Ile
515 520 525
Pro Ser Met Thr Val Ala Arg Phe Leu Arg Gln His Gln Gly Leu Leu
530 535 540
Glu Gly Ala Asp Gln Ala Arg Leu Ala Glu Ala Arg Ala Ser Leu Arg
545 550 555 560
Gly Thr Thr Val Leu Leu Asp Glu Ala Ser Met Val Gly Asn Ala Asp
565 570 575
Lys Glu Lys Leu Val Arg Leu Ala Asn Leu Leu Gln Leu Asp Arg Phe
580 585 590
Ala Ser Ile Gly Asp Arg Lys Gln Leu Gly Ala Val Asp Ala Gly Lys
595 600 605
Pro Phe Asp Val Met Gln Lys Ala Gly Val Glu Thr Ala Thr Met Asn
610 615 620
Thr Asn Leu Arg Ala Arg Asp Lys Ala Leu Arg Asp Ala Gln Tyr Ala
625 630 635 640
Ala Gln Gly Gly Asn Ile Asp Glu Ala Leu Arg His Leu Gly Pro His
645 650 655
Val Val Ala Ser Gly Asn Thr Ala Ala Val Asp Ala Ala Ala Ala Trp
660 665 670
Leu Ser Leu Ser Pro Ala Glu Arg Glu Val Thr Ala Ile Tyr Ala Ser
675 680 685
Gly Arg Asn Leu Arg Gly Gln Val Asn Glu Ala Val Gln Ile Gly Leu
690 695 700
Lys Ala Asn Gly Glu Leu Gly Pro Gly Ser Leu Gly Leu Thr Val Leu
705 710 715 720
Ser Arg Val Asn Leu Thr Arg Glu Glu Met Arg Tyr Ser Arg Ser Tyr
725 730 735
Ala Ala Gly Met Val Leu Glu Val Asp Arg Arg Gln Arg Gly Gln Gly
740 745 750
Leu Gln Lys Gly Arg Tyr Glu Val Val Glu Thr Asp Pro Thr Arg Glu
755 760 765
His Val Met Leu Gln Asn Glu Arg Gly Lys Arg Phe Glu Phe Arg Pro
770 775 780
Gly Gln Met Arg Pro Gln Gly Glu Gln Asp Pro Leu Arg Leu Phe Glu
785 790 795 800
Val Arg Pro Leu Glu Ile His Asp Gly Asp Arg Ile Arg Trp Thr Ala
805 810 815
Thr Asp His Lys Arg Gly Leu Leu Asn Ala Asp Gln Ala Arg Ile Val
820 825 830
Ala Val Asp Ala Lys Gly Val Thr Val Lys Thr Ser Leu Gly Ala Glu
835 840 845
His Arg Leu Gly Leu Ser Asp Pro Met Leu Glu Arg Leu Asp Leu Ala
850 855 860
Tyr Ala Leu Asn Ala His Met Ala Gln Gly Leu Thr Ser Asn Arg Gly
865 870 875 880
Ile Ala Val Met Asp Ser Arg Glu Arg Asn Leu Ala Asn Gln Gln Thr
885 890 895
Phe Leu Val Thr Ile Thr Arg Leu Arg Asp Gly Leu Thr Leu Phe Val
900 905 910
Asp Asn Ala Gly Lys Leu Glu Ala Ala Val Glu Arg Asn Pro Gly Met
915 920 925
Lys Arg Ser Ala Leu Glu Thr Val Asn Gln Leu Arg Asp Ala Ala Ala
930 935 940
Met Gly Gln Ala Lys Gly Lys Ala Ser Asp Arg Ser Gln Glu Pro Ala
945 950 955 960
Arg Glu Pro Pro Glu Leu Asp Arg Ser Ile Thr Lys Pro Phe Glu Ile
965 970 975
Gly Ile
<210> 115
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Npe
<400> 115
Gly Val Ala Gly Ala Gly Lys Ser
1 5
<210> 116
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Npe
<400> 116
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Ala His Phe His
1 5 10
<210> 117
<211> 981
<212> PRT
<213> Novosphingobium nitrogenifigens DSM 19370
<400> 117
Met Ile Ser Phe Lys Ala Leu Pro Ser Ala Ala Ser Thr Ala Glu Tyr
1 5 10 15
Phe Ser Lys Asp Asn Tyr Tyr Thr Leu Gly Gln Ala Gln Glu Leu Ser
20 25 30
Ala Trp Thr Gly Arg Ala Ala Glu Asp Leu Gly Leu Ala Gly Arg Val
35 40 45
Asp Glu Lys Val Phe Ala Ala Leu Leu Glu Gly Lys Leu Pro Asn Gly
50 55 60
Val Gln Ile Ala Ala Ser Gln Gly Lys His Arg Ala Gly Val Asp Ile
65 70 75 80
Thr Phe Ala Ala Ser Lys Ser Val Ser Leu Leu Ala Leu Ile Gly Gly
85 90 95
Asp Glu Arg Ile Val Val Ala Met Gln Glu Ser Val Gln Ala Ala Leu
100 105 110
Thr Trp Val Glu Lys Asn Val Met Glu Ala Arg Ile Trp Asp Pro Val
115 120 125
Leu Gly Glu Gln Val Pro Glu Lys Thr Gly Asn Leu Val Ala Ala Thr
130 135 140
Phe Leu His Asp Val Ser Arg Asn Asn Asp Pro Gln Leu His Val His
145 150 155 160
Ser Ile Val Ala Asn Ala Thr Arg Ala Ser Asp Gly Lys Trp Arg Ala
165 170 175
Met Thr Asn Lys Ala Phe Tyr Glu Ala Gln His Ile Ile Ser Ala Val
180 185 190
Gln Asn Ala Glu Leu Arg Thr Arg Ile Glu Ala Leu Gly Tyr Glu Thr
195 200 205
Thr Pro Ala Lys Asn Pro Ile Asp Gly Ala Phe Glu Val Gln Gly Val
210 215 220
Ser Arg Glu Val Val Glu Ala Phe Ser Ser Arg Arg Leu Glu Ile Leu
225 230 235 240
Ala Ala Leu Ala Lys Ser Gly Arg Gly Ser Ala Ala Glu Arg Gln Ile
245 250 255
Val Thr Leu Asn Thr Arg Lys Asp Lys Asp Leu Thr Leu Asp Pro Glu
260 265 270
Gln Arg Asn Leu Gly Trp His Glu Thr Ala Arg Ser Leu Gly Phe Asp
275 280 285
Pro Ala Pro Leu Ile Asn Gln Ala Arg Glu Arg Ala Gly Arg Asp Gln
290 295 300
Thr Val Trp Thr Arg Ile Val Asp Gly Ile Arg Gly Ile Gly Ala Lys
305 310 315 320
Gly Met Ala Ile Ala Ala Ala Met Gly Ile Thr Pro Gly Asp Gly Asp
325 330 335
Pro Leu Val Pro Glu Arg Leu Gly Arg Leu Asp Pro Val Ser Tyr Ala
340 345 350
Ala Ala Gln Ala Val Ala Ser Ala Ala Arg Glu Leu Gly Glu Asn Glu
355 360 365
Ala Ala Phe Ser Arg His Asp Leu Ile Arg Thr Ala Leu Glu Arg Gln
370 375 380
Gly Pro Phe Thr Val Ser His Ile Glu Ala Arg Ile Asp Gln Leu Thr
385 390 395 400
Arg Gly Gly Gln Leu Ile Gly Arg Glu Gln Met Leu Thr Ser Glu Gln
405 410 415
Ala Leu Ala Met Glu Ser Arg Val Ile Asp Leu Ala Glu Ala Gly Lys
420 425 430
Gly Ala Ile Glu Pro Ile Ala Thr Gly Val Gln Val Gly Ala Arg Leu
435 440 445
Gln Ala Ala Ala Arg Glu Leu Gly Leu Arg Arg Leu Asn Pro Gly Gln
450 455 460
Glu Arg Ala Gly Val Ala Ile Leu Thr Ser Arg Asp Arg Val His Leu
465 470 475 480
Ile Gln Gly Gly Ala Gly Val Gly Lys Ser Ala Ala Leu Ala Pro Val
485 490 495
Ala Ala Ile Ala Arg Ala Glu Gly His Gln Val Ile Ala Leu Ala His
500 505 510
Val Gly Arg Met Ala Arg Glu Phe Gly Ala Lys Val Asn Ala Pro Ala
515 520 525
Ser Thr Val Asp Gly Phe Leu Arg Lys Tyr Glu Arg Val Ile Asp Gly
530 535 540
Thr Ala Tyr Pro Val Lys Met Glu Ala Ala Arg Gln Ala Leu Ser Gly
545 550 555 560
Thr Leu Ile Met Val Asp Glu Ala Ser Gln Ile Gly Thr Asp Arg Phe
565 570 575
Ala Arg Leu Ile Glu Leu Ala Asn Lys Met Glu Val Ala Gly Leu Val
580 585 590
Phe Ala Gly Asp Lys Gly Gln Leu Pro Ala Ile Glu Arg Gly Arg Pro
595 600 605
Phe Ala Asp Leu Gln Arg Glu Asp Val Ala Arg Ser Ala Ile Thr Glu
610 615 620
Asn Leu Arg Ala Lys Thr Pro Gln Met Gln Ala Ile Asn Lys Ala Ile
625 630 635 640
Glu Glu Gly Asp Ile Ala Gly Ala Phe Glu Ala Leu Arg Pro Thr Thr
645 650 655
Ser Thr Val Pro Leu Gly Lys Ala Ala Glu Thr Ala Ala Thr Met Trp
660 665 670
Ala Asn Leu Pro Arg Asp Glu Arg Glu Gln Thr Val Leu Leu Ala Ser
675 680 685
Gly Arg Ala Met Arg Thr Ala Gly Asn Ala Ala Thr Gln Arg Ala Leu
690 695 700
Leu Ala Lys Gly Glu Leu Gly Val Ala Lys Ala Ser Leu Lys Val Leu
705 710 715 720
Asp Arg Ile Thr Ile Thr Lys Glu Gly Ala Arg Gln Leu Lys Gly Tyr
725 730 735
Gln Asp Gly Arg Leu Val Glu Phe Thr Thr Asn Leu Pro Lys Ala Gly
740 745 750
Phe Ala Arg Gly Glu Ile Gly Glu Val Val Asn Val Ala Asp Gly Lys
755 760 765
Val Glu Leu Val Met Glu Gly Gly Glu Val Arg Ser Phe Asp Pro Ser
770 775 780
Arg Leu Pro Arg Asn Leu Lys His Asp Ala Val Thr Ile Tyr Glu Gln
785 790 795 800
Lys Gln Ile Thr Ile His Glu Gly Asp Arg Ile Arg Trp Thr Ala Lys
805 810 815
Asp Glu Ala Arg Glu Leu Phe Asn Gly Asp Met Ala His Val Lys Arg
820 825 830
Ile Asp Gly Asp Ser Ile Ile Val Arg Thr Ala Asn Gly Asp Glu His
835 840 845
Gln Leu Phe Gly Lys Asp Pro Met Arg Asp Arg Phe Asp Leu Ala Tyr
850 855 860
Ala Ile Asn Val His Ile Ala Gln Gly Ile Thr Ala Lys Ala Gly Ile
865 870 875 880
Val Met Met Ser Ser Leu Glu Arg Leu Leu Asn Ser Ser Arg Ala Phe
885 890 895
Val Val Ala Ala Thr Arg Ile Ala Glu Thr Ile His Leu Val Val Asp
900 905 910
Asp Pro Asn Lys Val Glu Lys Gln Val Glu Arg Asn Pro Gly Asp Lys
915 920 925
Thr Ser Ala Arg Glu Val Ala Lys Pro Thr Ser Glu Thr Asp Lys Lys
930 935 940
Ala Glu Lys Lys Asp Phe Glu Lys Glu Arg Asp Tyr Ala Lys Glu Leu
945 950 955 960
Lys Lys His Leu Gly Ile Asp Lys Met Thr Glu Ala Arg Ser Arg Asp
965 970 975
Trp Asp Met Gly Leu
980
<210> 118
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Nni
<400> 118
Gly Gly Ala Gly Val Gly Lys Ser
1 5
<210> 119
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Nni
<400> 119
Tyr Ala Ile Asn Val His Ile Ala Gln Gly
1 5 10
<210> 120
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Nni
<400> 120
His Asp Val Ser Arg Asn Asn Asp Pro Gln Leu His Val His
1 5 10
<210> 121
<211> 1010
<212> PRT
<213> Sphingomonas wittichii RW1
<400> 121
Met Leu Ser Val Ala Ser Val Arg Ser Ala Ser Gly Ala Ala Asn Tyr
1 5 10 15
Phe Ala Lys Asp Asp Tyr Tyr Thr Val Glu Gly Ser Ser Glu Ile Ser
20 25 30
Ala Trp Gly Gly Glu Gly Ala Gly Ala Leu Gly Leu Ser Gly Glu Val
35 40 45
Gly Lys Asp Ala Phe Glu Gly Met Leu Asn Gly Ile Leu Pro Ser Gly
50 55 60
Glu Gly Val Ala Gln Val Glu Asn Arg Arg Ala Gly Leu Asp Leu Thr
65 70 75 80
Phe Ser Met Pro Lys Ser Ala Ser Ile Leu Ala Tyr Val Ala Gly Asp
85 90 95
Lys Arg Ile Leu Ala Ala Asn Met Ala Ala Val Gln Lys Thr Met Ala
100 105 110
Trp Val Glu Lys Asn Leu Ala Glu Gly Arg Lys Asp Ile Gly Gly Arg
115 120 125
Thr Val Pro Val Ala Thr Gly Asn Leu Val Tyr Ala Leu Phe Gln His
130 135 140
Asp Thr Ser Arg Ala Leu Asp Pro Gln Gly His Ile His Ala Val Ile
145 150 155 160
Ala Asn Leu Thr Arg Leu Pro Asp Gly Lys Trp Gln Ala Leu His Ala
165 170 175
Asp Lys Ile Trp Ser His Asn Thr Val Ile Gly Ser Ile Tyr His Ala
180 185 190
Tyr Leu Arg Glu Gly Ile Glu Gln Leu Gly Phe Arg Ile Glu Ala Leu
195 200 205
Gly Lys His Gly Thr Phe Glu Ile Ala Gly Val Pro Arg Lys Val Ile
210 215 220
Asp Ala Tyr Ser Gln Arg Arg Glu Ala Ile Leu Glu Lys Ala Ala Ala
225 230 235 240
Leu Gly Ile Val Ser His Lys Gly Arg Asp Gln Ile Thr Thr Asn Thr
245 250 255
Arg Asp Pro Lys Leu Asn Val Lys Asp Arg Asp Ala Leu Lys Gln Glu
260 265 270
Trp Ile Asp Lys Ala Ala Ser Leu Gly Phe Asp Gly Lys Ala Leu Val
275 280 285
Glu Gly Ala Leu Ala Arg Ser Asp Arg His Gly Ala Leu Gly Pro Leu
290 295 300
Glu Arg Gly Tyr Lys Ala Val Thr Glu Ala Ile Ala Ala Gly Arg Glu
305 310 315 320
Lys Leu Gly Asp Leu Val Arg Pro Ala Asp Pro Leu Val Asp Arg Gly
325 330 335
Leu Ala Arg Val Thr Gln Ser Pro Ala Ile Ala Arg Ala Gln Leu Ala
340 345 350
Val Ala Ser Ala Val Arg Ile His Ser Glu Arg Glu Ala Ala Phe Pro
355 360 365
Ile His Arg Leu Ala Lys Thr Ala Leu Asp Leu Gly Leu Lys Asp Val
370 375 380
Thr Ile Asp Arg Ile Glu Gln Arg Ile Gln Gln Leu Val Ala Arg Gly
385 390 395 400
Thr Leu Leu Arg Gly Gln Glu Arg Ala Ala Asp Phe Val Thr Thr Arg
405 410 415
Gln Ala Leu Ala Thr Glu Thr Gln Ile Leu Thr Gln Val Glu Ala Gly
420 425 430
Arg Gly Gln Ala Asn Pro Ile Ile Asp Ala Ser Glu Ala Pro Gly Arg
435 440 445
Leu Gln Ala Ala Ala Thr Gln Pro Leu Asn Thr Gly Gln Leu Ala Ala
450 455 460
Ala Thr Leu Ile Leu Gly Ser Ala Asp Arg Thr Val Ser Ile Gln Gly
465 470 475 480
Ile Ala Gly Ala Gly Lys Ser Thr Met Leu Gln Ala Val Ala Arg Val
485 490 495
Ala Glu Ala Glu Gly Arg Ala Ile Thr Gly Leu Ala Phe Gln Asn Lys
500 505 510
Met Val Ala Asp Leu Ala Glu Gly Ala Gly Val Pro Ala Gln Thr Ile
515 520 525
Ala Ser Phe Val Leu Ala His Glu Arg Tyr Val Ala Glu Pro Gln Gly
530 535 540
Pro Gly Tyr Asp Ala Ala Arg Ala Ala His Ala Gly Ser Met Leu Val
545 550 555 560
Val Asp Glu Thr Ser Met Val Ser Ser Asn Asp Met Leu Lys Leu His
565 570 575
Ala Ile Val Glu Thr Leu Gly Val Asp Lys Leu Val Leu Val Gly Asp
580 585 590
Arg Gln Gln Leu Ser Ser Ile Asp Ala Gly Lys Ser Phe Ala Met Ile
595 600 605
Gln Ala Ala Gly Gly Thr Leu Ala Arg Met Asp Glu Asn Ile Arg Gln
610 615 620
Arg Thr Asp Val Leu Arg Thr Val Ala Ala Leu Ala Asn Ile Gly Lys
625 630 635 640
Ala Ser Glu Ala Met Arg Val Leu Gly Asp Lys Val Ile Glu Ala Ser
645 650 655
Gln Pro Ala Glu His Ala Ala Asp Leu Trp Leu Ala Leu Asp Pro Ala
660 665 670
Glu Arg Gln Ala Thr Ala Val Phe Ala Ser Gly Arg Glu Ala Arg Ala
675 680 685
Ala Ile Asn Glu Arg Ile Gln Ala Gly Leu Ala Ala Glu Gly Ser Leu
690 695 700
Glu Gly Glu Gly Ile His Leu Thr Val Tyr Glu Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg Tyr Ala Ala Thr Tyr Arg Ala Gly Met Thr Leu
725 730 735
Glu Val Gly Arg Gly Gly Gly Gln Asp Ile Gly Leu Arg Ala Gly Arg
740 745 750
Tyr Asp Val Leu Ala Val His Ala Asn Gly Lys Val Glu Leu Gly Glu
755 760 765
Gly Arg Arg Arg Ile Arg Phe Asp Pro Leu Lys Leu Ser Pro Thr Glu
770 775 780
Thr Arg Asp Arg Leu Gln Leu Thr Glu Lys Lys Asp Leu His Leu Arg
785 790 795 800
Ala Gly Asp Arg Ile Arg Trp Thr Ala Asn Asp Lys Pro Arg Gly Leu
805 810 815
Thr Asn Ala Ser Leu Ala Arg Val Val Ala Val Asp Arg Asp Ser Val
820 825 830
Thr Val Glu Thr Ala Gly Arg Asp Arg Leu Val Leu Ala Phe Gly Asp
835 840 845
Pro Met Leu Ser Arg Val Asp Leu Ala Tyr Ala Leu Asn Met His Met
850 855 860
Ala Gln Gly Ile Thr Thr Asp Lys Ala Ile Thr Val Met Asp Ser His
865 870 875 880
Glu Arg Asn Leu Ser Asn Gln Arg Leu Phe Asn Val Gly Val Thr Arg
885 890 895
Val Arg Asp Asp Leu Thr Met Val Val Asp Asp Lys Ala Lys Leu Glu
900 905 910
Arg Gln Leu Asp His Asn Pro Gly Asn Lys Thr Ser Ala Leu Glu Thr
915 920 925
Leu Gly Arg Leu Glu Ile Asp Gly Pro Gly Arg Ala Gln Ala Ser Gly
930 935 940
Pro Phe Asp Pro Gly Pro Val Glu Gly Gly Pro Gly Pro Lys Ala Ala
945 950 955 960
Glu Gly Leu Asp Gly Phe Pro Pro Val Pro Pro Ala Glu Gly Gln Val
965 970 975
Ala Ala Arg Ala Lys Ser Asp Asp Leu Ser Ala Pro Arg Leu Lys Pro
980 985 990
Glu Gln Ala Asp Leu Leu Pro Pro Leu Pro Glu Arg Ser Leu Gly Leu
995 1000 1005
Asp Leu
1010
<210> 122
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Swi
<400> 122
Tyr Ala Leu Asn Met His Met Ala Gln Gly
1 5 10
<210> 123
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Nni
<400> 123
His Asp Thr Ser Arg Ala Leu Asp Pro Gln Gly His Ile His
1 5 10
<210> 124
<211> 1014
<212> PRT
<213> Sphingomonas sp. KA1
<400> 124
Met His Ser Ile Ala Ala Val Arg Ser Ser Gly Gly Ala Ala Asp Tyr
1 5 10 15
Phe Ala Asn Asp Asn Tyr Tyr Thr Ala Gln Glu Ser Ala Gln Ala Gly
20 25 30
Val Trp Ala Gly Glu Gly Ala Arg Ala Leu Gly Leu Glu Gly Thr Val
35 40 45
Gly Arg Asp Ala Phe Glu Ala Ile Leu Asn Gly His Leu Pro Asp Gly
50 55 60
Asp Lys Val Gly Gln Val Glu Gly Arg Arg Leu Gly Leu Asp Leu Thr
65 70 75 80
Phe Ser Met Pro Lys Ser Ala Ser Ile Leu Ala Leu Val Ser Gly Asp
85 90 95
Arg Arg Ile Leu Asp Ala His Met Ala Ala Val Arg Ser Thr Met Ser
100 105 110
Gln Leu Val Glu Lys Gln Leu Ala Glu Gly Arg Asn Tyr Glu Arg Ser
115 120 125
Arg Ser Gly Glu Pro Glu Lys Thr Gly Asn Leu Val Tyr Ala Leu Phe
130 135 140
Ala His Asp Thr Ser Arg Ala Leu Asp Pro Gln Gly His Ile His Ala
145 150 155 160
Val Val Ala Asn Leu Thr Arg Asp Leu Lys Gly Asn Trp Lys Ala Leu
165 170 175
Trp Asn Gly Glu Ile Trp Lys Asn Asn Thr Thr Ile Gly Gln Phe Tyr
180 185 190
His Ala Ala Phe Arg Ala Gln Leu Gln Lys Leu Gly Tyr Glu Thr Glu
195 200 205
Ala Ser Gly Lys His Gly Ala Phe Glu Ile Lys Gly Val Pro Thr Ala
210 215 220
Val Ile Lys Ala Phe Ser Thr Arg Ala Asn Glu Ile Glu Ala Lys Ile
225 230 235 240
Ala Glu Thr Gly Ala Thr Arg Leu Ala Thr Lys Lys Gln Ile Thr Leu
245 250 255
Tyr Thr Arg Asp Pro Lys Leu Ala Val Glu Asp Arg Ala Ala Leu Ala
260 265 270
Glu Gly Trp Lys Thr Arg Ala Ala Glu Leu Gly Phe Asp Gly Lys Pro
275 280 285
Leu Ile Ala Glu Ala Met Ala Arg Ala Ala His Gln Val Arg Pro Thr
290 295 300
Leu Arg Glu Thr Ala Ser Gln Ala Phe Ala Glu Val Ala Glu Arg Ile
305 310 315 320
Ser Ala Ala Met Arg Pro Pro Ser Ala Leu Ala Val Ser Gly Pro Ala
325 330 335
Ala Leu Phe Leu Ser Ala Glu Thr Ile Lys Ala Gln His Ala Thr Ala
340 345 350
Ser Ala Ile Arg His Leu Ser Glu Arg Glu Ala Ala Phe Ser Pro Gln
355 360 365
Ala Ile Leu Ser Ala Ala Leu Gly Phe Gln Ile Lys Gly Leu Glu Gly
370 375 380
Gly Ala Val Ala Leu Arg Ile Gly Glu Leu Val Arg Glu Gly His Leu
385 390 395 400
Ile Pro Gly Lys Ser Asp Arg Leu Asp Gly His Tyr Asp Leu Val Thr
405 410 415
Thr Pro Ala Ala Leu Gly Arg Glu Gln Gln Ile Leu Asp Arg Ile Asp
420 425 430
Ala Gly Ala Gly Lys Gly Arg Val Phe Met Ala Pro Glu Val Ala Met
435 440 445
Val Arg Leu Gln Ala Ala Ala Arg Glu Leu Gly Ile Glu Arg Ala Gly
450 455 460
Ser Asp Gly Trp Gln Leu Asn Ala Gly Gln Leu Ala Ala Gly Val Ala
465 470 475 480
Val Leu Ser Gly Lys Asp Arg Phe Leu Asn Ile Gln Gly Val Ala Gly
485 490 495
Ala Gly Lys Ser Thr Leu Leu Gly Ala Leu Asp Lys Val Leu Ser Ala
500 505 510
Glu Gly Val Lys Leu Val Gly Leu Ala Phe Gln Asn Lys Met Val Ala
515 520 525
Asp Leu Arg Gly Gly Gly Ser Gly Met Met Thr Ala Glu Gln Met Arg
530 535 540
Glu Ala Gly Ile Glu Ala Trp Thr Ile Ala Ser Phe Val Asn Arg Tyr
545 550 555 560
Ala Gly Pro Ala Ala Gln Gly Gln Gly Glu Arg Phe Glu Thr Ala Arg
565 570 575
Thr Ala Leu Gln Asn Thr Val Ile Ile Thr Asp Glu Ser Ser Met Val
580 585 590
Ser Ser Arg Asp Met Ala Ser Leu Thr Met Ile Ala Glu Arg Leu Asp
595 600 605
Leu Ala Lys Ala Pro Phe Ile Gly Asp Arg Gln Gln Leu Ser Ala Ile
610 615 620
Glu Gln Gly Lys Met Phe Ala Val Ser Gln Ala Ala Gly Gln Ala Thr
625 630 635 640
Val Arg Met Asp Glu Asn Ile Arg Gln Lys Gly Ser Pro Leu Leu Leu
645 650 655
Ala Val Ala Gly Leu Ser Asn Glu Gly His Ala Gly Leu Ala Leu Asp
660 665 670
Leu Leu Ala Ala His Gly Arg Val Ile Glu Asp Lys Ala Asp His Ile
675 680 685
Ala Ala Ala Ala Asp Leu Trp Leu Ser Leu Ala Pro Glu Glu Arg Ala
690 695 700
Arg Thr Ala Ile Phe Thr Ala Gly Arg Asp Asp Arg Thr Arg Ile Asn
705 710 715 720
Gly Leu Val Gln Gln Gly Leu Leu Lys Glu Gly Ser Leu Ala Gly Pro
725 730 735
Gly Val Pro Phe Ser Thr Leu Gln Ser Ala Asn Ala Thr Arg Glu Glu
740 745 750
Met Arg Phe Ala Ser Thr Tyr Arg Pro Gly Gln Val Leu Glu Ala Arg
755 760 765
Met Asp Val Arg Glu Leu Gly Leu Arg Arg Gly Glu Tyr Asp Val Val
770 775 780
Ala Ile Gly Arg Asp Gly Lys Val Thr Leu Glu Arg Asp Gly Lys Arg
785 790 795 800
Lys Val Ile Asp Pro Asp Arg Ile Asp Pro Gln His Arg Phe Asp Arg
805 810 815
Ile Gly Leu Tyr Asp Arg Lys Asp Ile Thr Leu His Gly Gly Glu Thr
820 825 830
Val Phe Trp Arg Glu Lys Asp Gly Pro Arg Asp Ile Ala Lys Ser Thr
835 840 845
Tyr Ala Lys Val Val Ser Ala Thr Gly Gln Ala Val Thr Leu Glu Leu
850 855 860
Ala Asp Lys Arg Gln Ile Thr Leu Pro Ser Ser Asp Pro Met Leu Arg
865 870 875 880
Arg Leu Asp Leu Gly Tyr Ala Leu Asn Ala His Met Ala Gln Gly Met
885 890 895
Thr Gln Ala Gln Ala Ile Glu Val Ile Ser Ser Arg Gln Arg Asn Leu
900 905 910
Ala Thr Gln Arg Thr Gln Asn Val Leu Asn Thr Arg Ala Thr Asp Asp
915 920 925
Met Arg Val Val Thr Asn Asp Leu Glu Ala Leu Lys Phe Gln Leu Asp
930 935 940
Arg Thr Pro Gly Asn Lys Thr Ser Ala Leu Glu Thr Val Gly Arg Leu
945 950 955 960
Glu Val Asp Ala Arg Pro Ala Asn Pro Ile Glu Pro Arg Gln Leu Pro
965 970 975
Glu Leu Arg Met Ser Pro Glu Leu Lys Ala Lys Leu Asp Ala Ala Leu
980 985 990
Gly Pro Val Ala Ala Pro Ala Val Arg Gln Leu Pro Val Pro Glu Lys
995 1000 1005
Ser Leu Gly Leu Asp Leu
1010
<210> 125
<211> 1018
<212> PRT
<213> Candidatus Puniceispirillum marinum IMCC1322
<400> 125
Met Val Ala Ser Phe Ser Ser Leu Gly Ser Ala Ser Ala Thr Thr Gly
1 5 10 15
Tyr Phe Glu Lys Asp Gly Tyr Tyr Ala Arg Asp Asp Pro Glu His Arg
20 25 30
Gln Ala Ser Phe Trp Tyr Gly Arg Gly Ala Glu Glu Leu Gly Leu Ala
35 40 45
Ala Pro Arg Asp Asp Pro Asp Ala Arg Ala Arg His Ile Asp Ala Glu
50 55 60
Asp Phe Arg Ser Ile Leu Glu Gly Tyr Val Pro Asp Thr Asp Ile Arg
65 70 75 80
Leu Gly His Lys Arg Asp Gly Glu His Lys His Arg Pro Gly Phe Asp
85 90 95
Leu Thr Leu Ser Ala Pro Lys Ser Val Ser Leu Ala Ala Leu Leu His
100 105 110
Gly Asp Lys Arg Val Ile Ala Ala His Asp Ala Ala Val Lys Ala Thr
115 120 125
Leu Asp His Val Glu Gln Asn Tyr Leu Gln Val Arg Ile His Asp Pro
130 135 140
Ala Thr Gly Arg Lys Pro Arg Phe Asn Ala Pro His Leu Ile Ala Gly
145 150 155 160
Val Phe Arg His Glu Ala Ser Arg Asn Leu Asp Pro Gln Leu His Ser
165 170 175
His Ala Val Ile Ala Asn Met Val Arg Asp Asn Glu Gly Lys Trp Arg
180 185 190
Ser Val Glu Pro Thr Glu Ile Phe Gln Asn Lys Lys Leu Leu Gly Ala
195 200 205
Phe Tyr Arg Asn Glu Leu Ala Gly Asn Leu Ile Glu Leu Gly Tyr Lys
210 215 220
Leu Asp Pro Leu Gln Leu Gly Thr Met Gln Ser Phe Glu Ile Ser Gly
225 230 235 240
Tyr Asp Lys Ala Leu Arg Asp Ala Phe Ser Thr Arg Arg Gln Asp Ile
245 250 255
Leu Lys Tyr Met Asp Glu Arg Gly Trp Glu Lys Asn Glu Lys Met Ala
260 265 270
Gln Arg Ala Ala Leu Ile Thr Arg Gly Arg Lys Asn Glu Pro Asp Arg
275 280 285
Ala Leu Met His Ala Gln Trp Gly Glu Arg Leu Ala Glu Leu Gln Arg
290 295 300
Asp Gly Ile Gly Leu Gly Ile Thr Thr Pro Arg Arg Thr Ala Ala Leu
305 310 315 320
Ala Glu Arg Val Ala Ala Met Asn Thr Pro Asp Met Arg Asn Glu Ile
325 330 335
Ala Gln Gly Ala Leu Ala Trp Ala Leu Ala His Leu Glu Glu Arg Lys
340 345 350
Thr Val Phe Thr His Pro Glu Leu Val Ala Thr Ala Leu Ser Gln Thr
355 360 365
Pro Gly Lys Thr Gly Leu Asp Glu Ile Glu Thr Gly Leu Thr Gly Leu
370 375 380
Lys Asn Ser Gly Arg Val Ile Asp Ala Val Ile Pro Asp Arg Arg Ser
385 390 395 400
Asp Arg Ala Met Ala Val Leu Thr Thr Asp Arg Ala Ile Glu Thr Glu
405 410 415
Arg Asp Ile Leu Gln Arg Leu Glu His Gly Arg Gly Gly Gly Gly Ser
420 425 430
Val Pro Val Thr Arg Asp Leu Glu Gln Thr Leu Thr Ser Gly Gln Leu
435 440 445
Thr Ser Gly Gln Gln Asp Ala Ile Arg Thr Ile Leu Gln Ser Asp Asp
450 455 460
Lys Ile Ile Gly Ile Gln Gly Arg Ala Gly Thr Gly Lys Thr His Met
465 470 475 480
Leu Asn Thr Val Val Asp Leu Ala Glu Asp Ala Lys Ile Phe Gly Leu
485 490 495
Ala Pro Thr Ala Ser Ala Ala Arg Thr Leu Glu Ala Glu Ala Gln Ile
500 505 510
Pro Ala Gly Thr Leu Gln Gly Phe Leu Met Arg Asn Ala Gly Leu Ala
515 520 525
Asp Gly Ser Met Asp Pro Ala Arg Val Ala Thr Ile Lys Ala Arg Leu
530 535 540
Asp Gly Ala Ile Ile Val Val Asp Glu Ala Ser Leu Ala Ser Ala Val
545 550 555 560
Glu Met Arg Asp Leu Leu Gln Ile Thr Asp Lys Leu Asp Leu Gln Arg
565 570 575
Leu Val Leu Val Gly Asp Thr Arg Gln Leu Asn Gly Val Gly Ala Gly
580 585 590
Ala Pro Phe Arg Leu Met Gln Gln Ala Gly Met Glu Thr Ala Ser Met
595 600 605
Arg Asp Ile Val Arg Gln Arg Asp Pro Leu Leu Lys Asp Ala Val His
610 615 620
Glu Ala Ser Leu Gly Arg Gly Glu Ala Ala Leu Glu Met Leu Lys Glu
625 630 635 640
Ser Val Ile Glu Thr Asp Lys Gln Ser Leu Ser Ile Glu Ala Ala Glu
645 650 655
Gln Trp Leu Glu Leu Gly Asp Asp Glu Arg Ala Ala Thr Leu Leu Val
660 665 670
Ala Pro Met Arg His Gln Arg Asp Glu Ile Asn Glu His Ile Arg Glu
675 680 685
Ala Leu Val Asp Asp Gly Thr Ile His Gly Asp Val Met Glu Ile Thr
690 695 700
Arg Leu Asp Ser Tyr Cys Met Thr Arg Ala Gln Lys Gln Asp Pro Ala
705 710 715 720
Asn Tyr Gln Ala Gly Asp Lys Val Val Phe Ala Val Asp Ser Asn Arg
725 730 735
Thr Gly Leu Lys Ala Asn Glu Ile Tyr Thr Val Ala Asp His Asp Glu
740 745 750
Arg Phe Val Thr Leu Val Asp Gly Asp Gly Glu Met Arg Cys Phe Asp
755 760 765
Pro Gly Gly Gly Ile Val Thr Arg Arg Asp Ile Ala Ser Arg Leu Asp
770 775 780
Val Phe Glu Pro Val Glu Met Ser Leu Gln Ala Gly Asp His Ile Arg
785 790 795 800
Trp Thr Arg Asn Asp Asn Ala Arg Gly Leu Ile Asn Ala Arg Gln Ala
805 810 815
Glu Val Thr Asp Ile Thr Ser Glu Gln Gly Ile Gln Ser Val His Met
820 825 830
Arg Thr Asn Asp Gly Arg Thr Leu Ser Leu Asp His Asp Asp Pro Gln
835 840 845
Leu Gly His Cys Asp Tyr Ala Phe Ala Ser Thr Ala His Gly Ala Gln
850 855 860
Gly Gln Thr Met Asp Arg Val Ile Ala Val Met Asp Ser Asp His Val
865 870 875 880
Ala Leu Ser Asn Gln Lys Thr Phe Tyr Val Glu Ile Ser Arg Ala Arg
885 890 895
Asp Glu Val Thr Ile Val Thr Asp Asp Arg Leu Gln Leu Ala Asp Thr
900 905 910
Leu Ala Ser Asn Ser Gly Glu Met Ala Ser Ala Leu Glu Ala Ile Gly
915 920 925
Glu Val Thr Thr Arg Glu Ala Pro Ala Ala Pro Ala Leu Asp Val Asn
930 935 940
His Asp Arg Val Thr Asp Ile Ala Thr Ala Glu Met Thr Pro Thr Glu
945 950 955 960
Pro Met Leu Glu Arg Tyr Asp Glu Pro Pro Pro Pro Thr His Glu Ala
965 970 975
Glu Tyr Gly Glu Thr Val Arg His Glu Pro Thr Ser Glu Asp Gly Ser
980 985 990
Ile Val Thr Arg Glu Arg Glu Pro Glu Pro Thr Glu Glu Lys Thr Lys
995 1000 1005
Glu Arg Asp Ile Gly Met Glu Met Gly Leu
1010 1015
<210> 126
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Pma
<400> 126
Gly Arg Ala Gly Thr Gly Lys Thr
1 5
<210> 127
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Pma
<400> 127
Phe Ala Ser Thr Ala His Gly Ala Gln Gly
1 5 10
<210> 128
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Pma
<400> 128
His Glu Ala Ser Arg Asn Leu Asp Pro Gln Leu His Ser His
1 5 10
<210> 129
<211> 994
<212> PRT
<213> Parvularcula bermudensis HTCC2503
<400> 129
Met Val Ala Ser Ile Ala Ala Val Ser Ser Ala Ser Ala Gly Ala Ala
1 5 10 15
Tyr Tyr Gly Lys Asp Asn Tyr Tyr Ala Lys Gly Gly Asp Ala Pro Glu
20 25 30
Pro Ser Ser Trp Phe Gly Lys Gly Ala Ala Ser Leu Gly Leu Lys Gly
35 40 45
Gly Val Glu Thr Glu Thr Phe Glu Arg Val Leu Asn Gly Glu Thr Leu
50 55 60
Asp Gly Arg Arg Val Gly Gln Arg Glu Gly Glu Thr Ala Glu Gln Ala
65 70 75 80
Gln Ala Arg Ala His Arg Pro Gly Ile Asp Leu Thr Phe Ser Pro Pro
85 90 95
Lys Asp Val Ser Leu Leu Leu Tyr Ile Gly Gly Asp Lys Arg Ile Leu
100 105 110
Gly Ala His Arg Ala Ala Val Asp Gln Thr Leu Lys Trp Ala Glu Arg
115 120 125
Asn Leu Ala Gly Thr Arg Ile Arg Thr Gly Pro Ser Ala Thr Pro Ala
130 135 140
Val Lys Thr Gly Asn Leu Val Ile Ala Arg Phe Glu His Asp Ile Ser
145 150 155 160
Arg Asp Lys Asp Pro Gln Leu His Thr His Ala Val Ile Ala Asn Ile
165 170 175
Thr Lys Thr Asp Asp Gly Arg Trp Arg Ala Leu His Asn Asp Pro Phe
180 185 190
Phe Ala His Arg Lys Thr Leu Ser Leu Ala Tyr Asp Ala Thr Leu Arg
195 200 205
Asn Ala Leu Arg Glu Leu Gly Tyr Arg Val Lys Leu Glu Asp Gly Lys
210 215 220
Ser Gly Arg Tyr Ser Val Asp Gly Val Pro Asp Gly Ala Arg Ala Glu
225 230 235 240
Phe Ser Lys Gly Lys Asp Arg Ile Asp Ser Ala Ala Val Gly Leu Lys
245 250 255
His Pro Thr Pro Ser Ala Arg Asp Lys Leu Ala Val Lys Thr Arg Pro
260 265 270
Ala Lys Asp Glu Leu Arg Gln Glu Glu Arg Val Ala Leu Arg Glu Thr
275 280 285
Arg Gly Ala Pro Trp Lys Ala Thr Leu Glu His Thr Val Ala Val Ser
290 295 300
Val Glu Arg Gln Ala Gln Gly His Leu Gln Arg Pro Leu Asp Asp Arg
305 310 315 320
Ala Val Gly Arg Val Gly Met Glu Gly Leu Ala Arg Arg Met Ala Gln
325 330 335
Asn Leu Phe Arg Pro Thr Lys Thr Leu Arg Leu Ser Glu Asn Asp Pro
340 345 350
Tyr Lys Leu Glu Arg Ala Ala Ser Glu Lys Gly Tyr Ser Ala Arg Ala
355 360 365
Ala Val Ser Phe Gly Leu Arg His His Glu Glu Arg Glu Ala Ala Phe
370 375 380
Ser Leu His His Val Arg Arg Thr Ala Leu Glu His Ala Ala Asp Gly
385 390 395 400
Val Thr Leu Arg Asp Ile Asp Arg Glu Leu Arg Phe Leu Arg Ala Asn
405 410 415
Arg Lys Leu Leu Val Asn Ala Lys Asp Pro Asn Ala Glu Ser Thr Thr
420 425 430
Lys Arg Ser Leu Thr His Glu Glu Arg Thr Leu Ser Leu Leu Gln Asp
435 440 445
Ala Gly Arg Thr Gly Pro Leu Val Pro Glu Gln Thr Leu Arg Ser Ala
450 455 460
Leu Glu Ser Thr His Leu Thr Gly Gly Gln Lys Ala Ala Ile Gly Leu
465 470 475 480
Ile Leu Gly Gly Pro Asn Arg Leu Val Gly Val Gln Gly Tyr Ala Gly
485 490 495
Thr Gly Lys Thr Thr Met Met Arg Gln Thr Ala Ala Leu Ala Arg Asp
500 505 510
Leu Ala Pro Leu Ala Lys Lys Asp Gly Tyr Lys Val Leu Gly Leu Ala
515 520 525
Pro Thr His Ser Ala Arg Lys Thr Leu Glu Glu Ser Gly Gly Phe Asp
530 535 540
Ser Arg Thr Val Ser Ala Phe Leu Arg Glu Ala Gly Gly Gly Thr Leu
545 550 555 560
Pro Pro Asp Ile Lys Asn Thr Ile Val Leu Ile Asp Glu Ala Ser Phe
565 570 575
Leu Ser Thr Arg Asn Met Asn Ala Leu Leu Glu Arg Leu Ile Ala Leu
580 585 590
Lys Pro Ala Lys Ile Val Leu Ser Gly Asp Arg Arg Gln His Gly Ala
595 600 605
Val Glu Ala Gly Arg Pro Phe Asp Ile Ala Gln Arg Ala Gly Leu Pro
610 615 620
Thr Ala Ile Met Lys Asp Ile Val Arg Leu Pro Lys Asp Glu Gly His
625 630 635 640
Arg Asp Gln Arg Ala Ala Val Glu Ala Ala Ala Gln Gly Lys Val Ala
645 650 655
Val Ala Met Lys Arg Leu Gly Ala Asn Ile Val Glu Arg Pro Gly Asn
660 665 670
Leu Ala Gly Gly Ala Val Glu Ala Trp Arg Ala Leu Pro Lys Asp Lys
675 680 685
Gln Asp Lys Ala Leu Leu Val Ala Pro Ser His Arg Leu Arg Glu Ala
690 695 700
Ile Asn Gln Gly Ile Arg Ser Glu Leu Ile Ala Asn Gly Arg Leu Ser
705 710 715 720
Ala Glu Thr Met Thr Ile Ser Val Leu Arg Ser Lys Asn Leu Thr Arg
725 730 735
Ala Glu Ala Met Ser Pro Arg Ser Tyr Ala Ala Gly Asp Ile Leu Gln
740 745 750
Phe His Ala Arg Leu Asp Ala Ile Asn Ala Lys Lys Asn Thr Arg Arg
755 760 765
Leu Val Thr Ala Val Asp Glu Glu Arg Gly Arg Leu Thr Leu Arg Asn
770 775 780
Ala Arg Gly Lys Asp Gln Thr Val Pro Leu Ser Arg Leu Gln Gly Arg
785 790 795 800
Tyr Glu Asn Thr Pro Tyr Ser Leu His Arg Glu Glu Pro Leu Glu Leu
805 810 815
Arg Arg Gly Asp Ser Val Met Phe Thr Arg Ser Asn Pro Asp Ala Gly
820 825 830
Leu Ser Ala Met Asp Ala Ala Lys Val Val Gly Trp Asp Gln Glu Arg
835 840 845
Val Ser Leu Asn Val Ser Gly Thr Gln Arg Gln Phe Gly Arg Asp Asp
850 855 860
Pro Ala Leu Arg Ser Leu Thr His Gly Tyr Ala Met Thr Ser His Ala
865 870 875 880
Ala Gln Gly Arg Thr Ala Lys Asp Val Val Ala Val Met Asp Ser Lys
885 890 895
Glu Arg Ala Leu Thr Ser Gln Val Gly Phe Tyr Val Ser Ile Ser Arg
900 905 910
Ser Ala Asp Thr Leu Ala Leu Ile Val Asn Asp Lys Glu Arg Val Leu
915 920 925
Asn Thr Met Gln Arg Gln Thr Gly Leu Lys Thr Ser Ala Met Glu Thr
930 935 940
Glu Gly Arg Ile Gly Asp Leu Thr Asp Leu Gly Thr His Gln Gly Thr
945 950 955 960
Gly Thr Thr Ser Ser Leu Ser Val Pro Ala Leu Ala Ala Asp Gln Arg
965 970 975
Asn Glu Ala Thr Gly Asn Glu Gln Asp Ser Ser Leu Asp Gln Gly Leu
980 985 990
Ser Leu
<210> 130
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Pbe
<400> 130
Gly Tyr Ala Gly Thr Gly Lys Thr
1 5
<210> 131
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Pbe
<400> 131
Tyr Ala Met Thr Ser His Ala Ala Gln Gly
1 5 10
<210> 132
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Pbe
<400> 132
His Asp Ile Ser Arg Asp Lys Asp Pro Gln Leu His Thr His
1 5 10
<210> 133
<211> 961
<212> PRT
<213> Acidovorax sp. JS42
<400> 133
Met Ile Ser Met Asn Asn Val Gly Ser Ala Gly Gln Ala Leu His Tyr
1 5 10 15
Phe Ser Ala Asp Asn Tyr Tyr Thr Gln Asp Glu Gly Leu Glu His Ser
20 25 30
Glu Trp Phe Gly Lys Gly Ala Glu His Leu Gly Leu Ser Gly Lys Ile
35 40 45
Asp Arg Gln Ala Phe Phe Glu Val Leu Asn Gly Lys Val Asp Gly Gln
50 55 60
Glu Leu Gly Lys Trp Val Lys Asn Glu Glu Thr Gly Glu Lys Glu Arg
65 70 75 80
Glu His Arg Pro Gly Thr Asp Met Thr Phe Ser Ala Pro Lys Ser Val
85 90 95
Ser Leu Met Ala Glu Val Tyr Gly Lys Arg Asp Val Arg Glu Ala His
100 105 110
Glu Ala Ala Val Lys Lys Ala Leu Ser His Ile Glu Thr Glu Leu Ala
115 120 125
Arg Thr Arg Gln Thr Val Asp Gly Lys Thr Glu Ala Val Gln Thr Gly
130 135 140
Asn Val Thr Val Ala Met Phe Arg His Asn Thr Ser Arg Asp Leu Asp
145 150 155 160
Pro Gln Thr His Thr His Ala Val Ile Met Asn Ala Thr Lys Arg Glu
165 170 175
Asp Gly Gln Trp Arg Ser Leu Thr Asn Glu Glu Ile Tyr Asn Ala Gln
180 185 190
Arg Val Ile Gly Ala Ile Tyr Thr Ser Glu Leu Ala Asp Arg Leu Gln
195 200 205
Ala Leu Gly Tyr Asp Ile Arg Arg Thr Asp Glu Lys Gly Asn Phe Glu
210 215 220
Ile Ala Gly Ile Thr Arg Glu Gln Ile Glu His Phe Ser Gln Arg Arg
225 230 235 240
Ala Glu Ile Glu Ala Ala Leu Lys Ala Lys Gly Val Asp Ile Asp Asp
245 250 255
Ala Ser Ala Gln Gln Lys Glu Asp Ala Thr Leu Lys Thr Arg Ala Arg
260 265 270
Lys Val Asp Val Asp His Glu Ala Leu Ile Gly Ser Trp Lys Glu Arg
275 280 285
Ala Lys Asp Ile Gly Ile Asp Phe Asp Ala Ile Gln Ala Lys Ala Asp
290 295 300
Ala Gln Arg Ala Gln Gly Gly Val Val Arg Ala Asp Lys Leu Thr Gly
305 310 315 320
Arg Glu Ala Met Ser Phe Ala Ala Ala His Leu Ile Glu Arg Glu Ala
325 330 335
Val Val Ser Lys Asn Asp Leu Met Ala Ala Ala Ile Glu His Gly Ala
340 345 350
Gly Arg Val Ser Ala Ser Glu Val Lys Arg Ala Phe Asp Lys Leu Glu
355 360 365
Lys Asp Gly Asp Leu Val Ala Leu Pro Asp Gly Asn Tyr Thr Thr Lys
370 375 380
Lys Met Leu Gly Ser Glu Met Trp Ala Leu Asp Gln Val Arg Ala Gln
385 390 395 400
Lys Gly Gln Thr Pro Lys Met Met Glu Pro Glu Ala Val Ala Ala Arg
405 410 415
Ile Ala Gln Ala Glu Gly Arg Gln Gly Phe Lys Tyr Ser Glu Gly Gln
420 425 430
Lys Glu Ala Ile Ser Lys Val Leu Thr Thr Glu Asp Arg Tyr Val Ala
435 440 445
Val Gln Gly Leu Ala Gly Thr Gly Lys Thr Thr Met Leu Lys Gly Val
450 455 460
Arg Glu Met Ala Gln Glu Gln Gly Tyr Thr Val Arg Gly Met Ala Pro
465 470 475 480
Thr Gly Ala Ala Ser Lys Val Leu Ala Arg Glu Thr Gly Ile Ala Thr
485 490 495
Asp Thr Val Ser Met Phe Gln Ile Lys Glu Arg Gln Leu Gln Lys Asp
500 505 510
Ile Glu Phe Ala Lys Gln Tyr Ala Pro Asp Phe Gln Arg Lys Ala Glu
515 520 525
Val Trp Ile Val Asp Glu Ser Ser Phe Leu Ser Gln Arg Gln Lys Ala
530 535 540
Gln Leu Asp His Met Ala Glu Lys Ala Gly Ala Lys Val Val Tyr Leu
545 550 555 560
Gly Asp Thr Leu Gln Leu Gln Gly Val Glu Ala Gly Lys Pro Phe Glu
565 570 575
Leu Ala Gln Arg Asp Gly Met Glu Thr Ala Tyr Met Thr Glu Ile Asn
580 585 590
Arg Gln Lys Thr Ala Asp Leu Lys Gln Ala Val Asp Ile Ile Thr Gly
595 600 605
Arg Asp Asn Leu Gly Asp Gly Gln Arg Leu Thr Gln Val Glu Leu Ala
610 615 620
Asn Asn Ala Arg Ala Phe Glu Tyr Met Asp Lys Ala Gly Met Ile Arg
625 630 635 640
Glu Ile Pro Glu Lys Ser Glu Asp Asp Lys Gly Arg Leu Val Ala Ala
645 650 655
Val Val Gln Asp Ile Leu Lys Leu Asp Lys Ala Glu Arg Glu Arg Thr
660 665 670
Ile Val Ile Thr Ala Tyr Asn Glu Asp Arg Arg Ala Ile Asn Ala Gly
675 680 685
Val Arg Glu Gly Leu Lys Glu Gln Gly Glu Leu Ser Arg Ser Glu Asp
690 695 700
Thr Arg Glu Ile Tyr Thr Ser Lys Gly Trp Thr Arg Ala Met Gln Lys
705 710 715 720
Glu Ala Gln Tyr Tyr Lys Ala Gly Asp Val Val Arg Phe Gly Arg Asp
725 730 735
Tyr Gln Gln Ile Asp Ala Lys Lys Gly Glu Tyr Met Arg Val Ser Ala
740 745 750
Val Asp Ala Pro Asn Gly Thr Val Val Leu Gln Lys Glu Asp Gly Ser
755 760 765
Val Ile Ala Trp Gln Pro Lys Lys His Asn Lys Ile Glu Val Tyr Asp
770 775 780
Arg Asp Thr Arg Glu Leu Ala Lys Gly Asp Leu Ile Arg Ile Thr Arg
785 790 795 800
Asn Glu Gly Glu Phe Lys Asn Gly Glu Val Ala Arg Val Thr Ala Val
805 810 815
Ala Gly Asp Lys Val Thr Leu Glu Leu Lys Gln Gly Lys Asp Val Ser
820 825 830
Leu His Gln Val Asp Leu Ser Arg Asn Lys His Trp Asp His Ala Tyr
835 840 845
Ala Gln Thr Val His Ala Ser Gln Gly Ala Thr Gln His Arg Ala Ile
850 855 860
Phe His Ile Arg Ala Pro Gln Thr Glu Ser Glu Lys Lys Gln Glu Arg
865 870 875 880
Ala Leu Glu Asn Met Ala Lys Val Phe Gly Asp Arg Ser Phe Tyr Val
885 890 895
Gly Ala Thr Arg Ala Ser His Glu Leu Arg Ile Tyr Thr Asn Asp Lys
900 905 910
Ala Val Ala Ala Lys Ala Val Ala Ala Lys Gln Asp Lys Thr Ser Ala
915 920 925
Val Glu Thr Leu Arg Gln His Glu Arg Ala Thr Ala Ile Thr Ala Asp
930 935 940
Lys Ala Gly Gln Arg Pro Val Ser Pro Gln Arg Asn Gly Asp Val Gln
945 950 955 960
Arg
<210> 134
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Ajs
<400> 134
Tyr Ala Gln Thr Val His Ala Ser Gln Gly
1 5 10
<210> 135
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Ajs
<400> 135
His Asn Thr Ser Arg Asp Leu Asp Pro Gln Thr His Thr His
1 5 10
<210> 136
<211> 936
<212> PRT
<213> Caulobacter crescentus NA1000
<400> 136
Met Gly Arg Arg Gln Ile Pro Gly Cys Arg Ala Arg Val Gln Leu Glu
1 5 10 15
Arg Arg Arg Thr Gly Leu Met Val Ala Ser Leu Ser Ser Leu Ser Ser
20 25 30
Ser Ala Gln Ala Ser Ser Tyr Tyr Glu Ala Asp Asp Tyr His Ala Glu
35 40 45
Gly Gly Ala Ala Pro Ser Arg Trp Gln Gly Ser Gly Ala Ala Ala Leu
50 55 60
Gly Leu Glu Gly Glu Val Asp Pro Glu Arg Phe Arg Gln Leu Leu Asp
65 70 75 80
Gly Val Leu Ser Asp His Val Ala Leu Gly Ala Arg Arg Asp Glu Gly
85 90 95
Arg Gln His Arg Pro Gly Trp Asp Leu Thr Leu Ser Ala Pro Lys Ser
100 105 110
Ile Ser Ile Met Ala Leu Val Ala Gly Asp Arg Arg Leu His Ala Ala
115 120 125
His Ala Ala Ala Val Glu Ala Ala Leu Ala Phe Thr Glu Arg His Ala
130 135 140
Gly Gly Thr Arg Ile Arg Asp Gly Glu Arg Val Ala His Val Arg Thr
145 150 155 160
Gly Ala Leu Ala Met Ala Thr Phe Gln His Glu Thr Ser Arg Ala Gln
165 170 175
Asp Pro Gln Leu His Thr His Ala Val Ile Leu Asn Met Thr Arg Asp
180 185 190
Leu Glu Gly Thr Trp Arg Ser Leu Asp Ser Arg Ala Leu Tyr Gln Leu
195 200 205
Gln Lys Thr Ile Gly Glu Val Tyr Arg Gln Glu Leu Ala Gly Ala Val
210 215 220
Arg Ala Leu Gly Tyr Ala Ile Glu Val Gly Lys Glu Ser Met Phe Glu
225 230 235 240
Ile Ser Asp Val Pro Ala Ser Val Arg Glu Ala Phe Ser Glu Arg Ala
245 250 255
Arg Gln Val Glu Ala His Leu Ala Thr Lys Gly Leu Thr Arg Ala Thr
260 265 270
Ala Thr Ala Glu Glu Lys Gln Ala Ala Thr Leu Tyr Thr Arg Ala Ser
275 280 285
Lys Lys Ala Ala Asp Arg Ala Glu Leu Ser Arg Ala Trp Arg Val Glu
290 295 300
Ala Asp Gly Leu Gly Phe Ser Ser Glu Ala Arg Arg Ser Leu Leu Thr
305 310 315 320
Glu Ala Leu Asp Arg Ala Glu Ala Ser Lys Ala Ile Arg Asp Arg Gly
325 330 335
Ala Val Leu Ala Gln Asp Ala Val Arg Phe Ala Ala Glu Lys Leu Gly
340 345 350
Glu Arg Gln Ala Ile Phe Ser Arg Ala Glu Leu Glu Arg Glu Ala Gly
355 360 365
Arg Lys Ala Ile Gly Leu Ala Thr Arg Thr Glu Ile Met Ala Ala Val
370 375 380
Asp Lys Arg Gln Gln Ser His Gln Leu Glu Ala Arg Ala Leu Arg Ser
385 390 395 400
Pro Ile Gly Leu Asp Leu Glu Gly Phe Thr Thr Asp Arg Ala Ile Ala
405 410 415
His Glu Lys Arg Leu Leu Glu Ile Glu Arg Glu Gly Arg Asn Ala Leu
420 425 430
Ala Pro Ile Val Pro Pro Ile Glu Ala Ser Arg Ile Ile Asn Ala Ala
435 440 445
Ser Leu Ala Ala Ser Glu Arg Gly Leu Ala Trp Ser Asp Asp Gln Arg
450 455 460
Arg Ala Thr Lys Ala Val Leu Thr Ser Arg Ser Ala Val Val Gly Val
465 470 475 480
Gln Gly Phe Ala Gly Thr Ala Lys Thr Thr Thr Val Leu Ala Thr Leu
485 490 495
Ala Lys Ala Ala Ala Glu Gln Gly Tyr Gln Val Lys Ala Leu Ala Pro
500 505 510
Ser Ala Ser Ala Ala Ile Thr Leu Gly Glu Ala Leu Asp Leu Glu Gly
515 520 525
Arg Thr Ile Ala Arg His Leu Val Glu Arg Pro Asn Ala Arg Pro Ser
530 535 540
Ala Arg Glu Leu Trp Ile Val Asp Glu Ala Ser Leu Val Ser Ala Arg
545 550 555 560
Asp Met Ala Arg Leu Leu Asp Glu Ala Gln Arg Arg Gly Ala Arg Thr
565 570 575
Leu Leu Val Gly Asp Ala His Gln Leu Gly Ser Val Gly Ala Gly Ala
580 585 590
Ala Phe Arg Gln Leu Gln Asp Ala Gly Leu Glu Thr Ala His Leu Thr
595 600 605
Lys Ile Val Arg Gln Ser Asn Thr Leu Thr Leu Glu Ala Val Glu Ala
610 615 620
Thr Leu Ala Gly His Ala Arg Arg Ala Phe Asp Ala Leu Asp Arg Gly
625 630 635 640
Gly Gly Gln Ile Ile Glu Ala Gln Ser Val Glu Asp Arg Gln Ala Leu
645 650 655
Ile Ala Ala His Phe Ala Gln Leu Asp Ser Ala Gln Arg Arg Arg Thr
660 665 670
Leu Ile Ile Asp Pro Ser Arg Glu Gly Arg Glu Gln Leu Thr Ala Arg
675 680 685
Ile Arg Ala Glu Leu Ile Ala Ala Gly His Leu Gly Lys Ala Ala Val
690 695 700
Thr Val Thr Ser Leu Val Ala Lys Asp Leu Thr Gln Ala Glu Arg Lys
705 710 715 720
Glu Ala Gly Ser Tyr Ala Pro Gly Asp Ile Val Thr Phe Ala Arg Thr
725 730 735
Leu Thr Gly Lys Ala Val Ala Lys Asp Thr Ala Tyr Glu Val Gln Ala
740 745 750
Val Asp Ala Arg Arg Arg Thr Val Thr Leu Ser Asp Gly Arg Asp Ala
755 760 765
Arg Ile Asp Trp Ala Pro His Arg Trp Gly Ser Ala Glu Ala Phe Glu
770 775 780
Pro Val Asp Arg Glu Leu Arg Gln Gly Asp Arg Ile Glu Phe Thr Arg
785 790 795 800
Asn Asn Met Arg Leu His Gln Val Asn Gly Leu Gln Gly Glu Ile Val
805 810 815
Ser Leu Asp Val Glu Ala Arg Lys Ala Gln Val Arg Thr Asp Arg Gly
820 825 830
His Ile Arg Thr Leu Asp Leu Asn Ala Leu Gln Asp Arg His Phe Arg
835 840 845
His Ala Tyr Val Gln Thr Ala Phe Ala Ala Gln Gly Arg Thr Thr Asp
850 855 860
His Val Leu Phe His Ala Glu Ser Gln Arg Ser Asn Leu Ile Asp Gln
865 870 875 880
Ala Thr Leu Tyr Val Ala Ile Ser Arg Ala Arg His Gly Ala Thr Ile
885 890 895
Val Thr Asp Asp Arg Ala Lys Val Ile Arg Gly Val Glu Ala Arg Ser
900 905 910
Gly Arg Arg Leu Thr Ala Leu Gly Ala Glu Gly Ser Gly Arg Glu Ala
915 920 925
Gly Leu Asp Gln Asp Ala Gly Leu
930 935
<210> 137
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Ccr
<400> 137
Gly Phe Ala Gly Thr Ala Lys Thr
1 5
<210> 138
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Ccr
<400> 138
Tyr Val Gln Thr Ala Phe Ala Ala Gln Gly
1 5 10
<210> 139
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Ccr
<400> 139
His Glu Thr Ser Arg Ala Gln Asp Pro Gln Leu His Thr His
1 5 10
<210> 140
<211> 936
<212> PRT
<213> Sphingopyxis alaskensis RB2256
<400> 140
Met Val Ala Ser Val Ser Ala Leu Thr Ser Ser Ala Gln Ala Ser Ser
1 5 10 15
Tyr Tyr Glu Ala Asp Asp Tyr Tyr Ala Glu Gly Gly Leu Ser Pro Ser
20 25 30
Glu Trp Gln Gly Lys Gly Ala Glu Glu Leu Gly Leu Ser Gly Asp Val
35 40 45
Asp Arg Asp Gln Phe Arg Glu Leu Leu Asp Gly Lys Val Ala Gly Gln
50 55 60
Gln Leu Gly Thr Val Arg Asp Gly Gln Leu Glu His Arg Pro Gly Trp
65 70 75 80
Asp Val Thr Leu Ser Ala Pro Lys Ser Val Ser Ile Met Ala Glu Val
85 90 95
Ala Gly Asp Arg Arg Leu Ile Glu Ala His Gly Gln Ala Val Lys Thr
100 105 110
Thr Leu Ala His Ile Glu Ala His Met Ala Ala Thr Arg Val Arg His
115 120 125
Gly Gly Ser Val Thr Arg Glu Ala Thr Gly Asn Leu Val Val Ala Gly
130 135 140
Phe Gln His Gly Thr Ser Arg Ala Gln Asp Pro Gln Leu His Thr His
145 150 155 160
Asn Val Ile Met Asn Ala Thr Gln Gly Glu Asp Gly Ser Trp Arg Ser
165 170 175
Leu Glu Pro Arg Ala Ile Tyr Gln Leu Gln Lys Gln Ile Gly Ala Ile
180 185 190
Tyr Arg Gln Glu Leu Ala Leu Lys Val Gly Glu Leu Gly Tyr Glu Ile
195 200 205
Ala Pro Gly Lys Glu Ser Met Phe Glu Ile Lys Gly Val Ser Glu Ala
210 215 220
Ala Met Ala Ala Phe Ser Thr Arg Ser Ala Glu Ile Glu Ala Ala Leu
225 230 235 240
Gly Glu Arg Gly Thr Ser Arg Glu Glu Ala Ser Ala Ala Glu Lys Gln
245 250 255
Val Ala Ala Leu Asp Thr Arg Gln Ala Lys Val Val Ala Asp His Gly
260 265 270
Ala Leu Val Ala Asp Trp Arg Glu Thr Ala Asp Arg Ala Gly Phe Asp
275 280 285
Ala Glu Ala Arg Leu Ala Leu Val Arg Glu Ala Glu Ala Arg Ala Ala
290 295 300
Asn Gly Val Gln Leu Pro Asp Pro Ser Val Ala Asp Arg Ala Val Ala
305 310 315 320
His Ala Ala Asp Lys Leu Gly Glu Arg Gln Ser Val Phe Ala Val Ala
325 330 335
Ala Leu His Glu Glu Ala Gly Arg Val Gly Leu Gly Lys Val Gly Tyr
340 345 350
Ser Glu Ile Gly Glu Ala Ile Gly Arg Ala Thr Lys Glu Gly Glu Leu
355 360 365
Val Glu Arg Thr Phe Leu Asp Arg Arg Gly Ala Ala Phe Ala Gly Phe
370 375 380
Thr Thr Ser Gln Asn Ile Ala Ala Glu Lys Thr Leu Leu Arg Ile Glu
385 390 395 400
Ala Arg Gly Arg Gly Ala Leu Ala Pro Ile Ala Ser Pro Leu Ala Ala
405 410 415
Ala Lys Ala Val Ala Gly Ala Ala Ala Gln Ala Glu Arg Ser Gly Phe
420 425 430
Gly Trp Asn Pro Asp Gln Lys Ala Ala Thr Glu Gln Leu Leu Thr Ser
435 440 445
Arg Asn Arg Val Thr Ala Val Gln Gly Tyr Ala Gly Thr Ala Lys Thr
450 455 460
Thr Thr Val Leu Ala Thr Phe Ala Arg Glu Ala Glu Ala Arg Gly Val
465 470 475 480
Ser Val Val Ala Leu Ala Pro Thr Ala Ser Ala Ala Met Thr Leu Gly
485 490 495
Glu Ala Leu Gly Thr Arg Gly Asp Thr Val Ala Arg His Leu Leu Ala
500 505 510
Pro Glu Asp Ser Ala Pro Gly Gln Pro Val Ala Trp Ile Val Asp Glu
515 520 525
Ala Ser Leu Leu Ser Ala Arg Asp Thr Ala Arg Leu Phe Glu Leu Ala
530 535 540
Glu Gln His Asp Ala Arg Ile Ile Leu Val Gly Asp Val Lys Gln Leu
545 550 555 560
Gly Ser Val Glu Ala Gly Ala Ala Phe Ala Gln Leu Gln Gly Val Gly
565 570 575
Met Glu Thr Ala Lys Leu Gly Glu Ile Val Arg Gln Ser Asn Ala Ala
580 585 590
Thr Lys Glu Ala Val Leu Ala Ser Ile Glu Gly Asp Ala Lys Lys Ala
595 600 605
Leu Ala Ala Leu Asp Arg Gly Gly Gly Gln Ile Val Glu His Ala Asp
610 615 620
Arg Ser Gly Arg Phe Ala Ala Ile Ala Asp Arg Tyr Ala Gly Leu Asp
625 630 635 640
Lys Ala Ala Arg Thr Arg Thr Leu Val Ile Glu Pro Ser Arg Glu Gly
645 650 655
Arg Asp Ala Leu Thr Ala Gly Ile Arg Thr Ala Leu Val Asn Ser Gly
660 665 670
Ala Leu Ser Gly Pro Ala Val Thr Met Glu Ser Leu Val Asn Lys Gly
675 680 685
Leu Thr Arg Ala Glu Ala Arg Asp Pro Leu Ser Tyr Asp Arg Gly Asp
690 695 700
Val Val Arg Phe Thr Arg Asp Tyr Ala Asp Lys Gly Val Ala Arg Gly
705 710 715 720
Asp Ala Tyr Arg Val Glu Ala Val Asn Pro Ala Lys Ala Ala Ile Ala
725 730 735
Leu Arg Ser Glu Asp Gly Arg Glu Val Asp Trp Arg Leu Arg Gln Trp
740 745 750
Gly Ala Gly Lys Val Gln Val Phe Ala Pro Gln Asn Ile Asp Leu Arg
755 760 765
Thr Gly Asp Ser Ile Arg Phe Thr Arg Asn Asp Arg Asp Ala Gly Arg
770 775 780
Ile Asn Gly Ala Arg Gly Glu Val Ile Ala Val Asp Glu Gln Ala Arg
785 790 795 800
Thr Ala Thr Val Leu Gly Ala Arg Gly Gln Val Gln Thr Leu Asp Leu
805 810 815
Asp Ala Val Arg Asp Arg His Ile Ala His Ala Tyr Val Asp Thr Ala
820 825 830
Phe Ala Ala Gln Gly Arg Thr Ala Asp His Val Ile Ile His Ala Asp
835 840 845
Ser Lys Ala Thr Asn Leu Val Asp Gln Lys Ser Phe Tyr Val Gly Ile
850 855 860
Ser Arg Ala Lys Glu Ser Ala Thr Ile Val Thr Asp Asp Arg Ala Lys
865 870 875 880
Leu Thr Ser Ala Ile Asn Glu Arg Ala Gly Ala Val Gln Thr Ala Leu
885 890 895
Ser Gln Ala Pro Ala Ala Gly Ala Gly Met Val Gln Ser Ala Ile Ala
900 905 910
Ala Pro Ala Ala Asp Lys Ala Ile Ser Ala Ala Val Ser Gln Ala Ala
915 920 925
Thr Ser Leu Pro Gly Met Gly Leu
930 935
<210> 141
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Sal
<400> 141
Gly Tyr Ala Gly Thr Ala Lys Thr
1 5
<210> 142
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Sal
<400> 142
Tyr Val Asp Thr Ala Phe Ala Ala Gln Gly
1 5 10
<210> 143
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Sal
<400> 143
His Gly Thr Ser Arg Ala Gln Asp Pro Gln Leu His Thr His
1 5 10
<210> 144
<211> 927
<212> PRT
<213> Acetobacter tropicalis NBRC 101654
<400> 144
Met Val Ala Thr Val Ser Gly Leu Thr Asn Ala Ala Gln Ala Ser Ala
1 5 10 15
Tyr Tyr Glu Ala Glu Asp Tyr Tyr Ser Glu Asp Gly Asn Ala Pro Ser
20 25 30
Val Trp Leu Gly Lys Gly Ala Ala Glu Leu Gly Leu Phe Gly Glu Ile
35 40 45
Asp Gln Glu Ala Phe Thr Arg Leu Leu His Gly Glu Ile Thr Glu Asp
50 55 60
His Arg Leu Gly Thr Ser Arg Asp Gly Glu Trp Ser His Arg Pro Gly
65 70 75 80
Trp Asp Leu Thr Phe Ser Ala Pro Lys Ser Val Ser Val Met Ala Glu
85 90 95
Val Ala Gly Asp Arg Arg Leu Ile Glu Ala His Glu Ala Ala Val Gln
100 105 110
Arg Thr Leu Ser Leu Ala Glu Gln His Leu Ala Ala Thr Arg Ile Arg
115 120 125
Glu Asp Gly Glu Val Arg Arg Glu Val Thr Gln Asn Leu Val Ile Ala
130 135 140
Ser Phe Arg His Gly Thr Ser Arg Ala Leu Asp Pro Gln Leu His Ser
145 150 155 160
His Asn Val Ile Leu Asn Met Thr Gln Asp His Asp Gly Gln Trp Arg
165 170 175
Ser Leu Glu Pro Arg Ala Leu Tyr Gln Leu Gln Lys Gln Leu Gly Ala
180 185 190
Leu Tyr Arg Gln Glu Leu Ala His Glu Val Thr Glu Leu Gly Tyr Glu
195 200 205
Ile Thr Lys Gly Lys Asp Ser Ser Phe Glu Ile Ala Gly Leu Ser Pro
210 215 220
Glu Ser Leu Glu Ala Phe Ser Gln Arg Ala Gln Ala Ile Glu Ala Gln
225 230 235 240
Leu Ala Glu Arg Gly Lys Ser Arg Ala Gln Ala Ser Ala Ala Glu Lys
245 250 255
Gln Thr Ile Ala Leu Asp Thr Arg Gln Ala Lys Glu Ala Val Pro Gln
260 265 270
Ala Glu Leu Val Gln Ala Trp Arg Glu Ala Ala Asp Ser Ala Gly Leu
275 280 285
Thr Glu Glu Lys Arg Arg Gln Leu Val Ala Glu Ala Gln Gly Arg Leu
290 295 300
Ala Ala Gln Ser Ala Gln Lys Ser Ser Asn Ala Phe Gly Arg Glu Leu
305 310 315 320
Leu Ala Asp Gln Ala Val Ala Gln Gly Ala Ala Met Leu Gly Glu Arg
325 330 335
Asn Ser Val Phe Ala Thr Thr Ala Leu His Glu Ala Ala Gly Arg Phe
340 345 350
Ala Ile Gly Ala Val Ser Gln Ala Glu Ile Ala Glu Ala Ile Thr Arg
355 360 365
Ala Glu Thr Ala Gly Gly Leu Glu Lys Arg Thr Tyr Leu Asp Tyr Arg
370 375 380
Gly Ala Ser Phe Glu Gly Met Thr Thr Ala Ala Asn Ile Ala His Glu
385 390 395 400
Met Thr Leu Leu Arg Leu Glu Glu Asp Gly Arg His Gln Ala Ala Pro
405 410 415
Ile Leu Ser Pro Leu Glu Ala Gly Lys Ala Val Ala Glu Val Glu Gln
420 425 430
Arg Ser Ala Leu Lys Gly His Thr Trp Asn Glu Glu Gln Arg Ala Ala
435 440 445
Thr Thr Gln Ile Leu Thr Ser Asn Asn Gln Ile Val Gly Leu Gln Gly
450 455 460
Tyr Ala Gly Thr Ala Lys Thr Ser Thr Val Leu Ala Thr Val Ala Lys
465 470 475 480
Ser Ala Glu Ala Gln Gly Tyr Arg Val Thr Ala Leu Ala Pro Thr Ala
485 490 495
Ser Ala Ala Gln Val Leu Gly Asp Ala Leu Asp Ser Arg Ala Asp Thr
500 505 510
Leu Ala Arg His Leu Leu Ala Pro Gly Arg Pro Ser Ser Gln Pro Gln
515 520 525
Leu Trp Ile Val Asp Glu Ala Ser Leu Val Ser Ala Lys Asp Met Ala
530 535 540
Lys Leu Leu Ser Thr Ala Gln Ser His Arg Ala Arg Val Leu Leu Val
545 550 555 560
Gly Asp Ile Lys Gln Leu Gly Ser Ile Glu Ala Gly Ala Ala Phe Glu
565 570 575
Gln Leu Gln Glu Ala Gly Met Glu Thr Ala Arg Leu Thr Ser Ile Leu
580 585 590
Arg Gln Thr Asn Glu His Thr Lys Ala Ala Val Glu Ala Ser Leu Glu
595 600 605
Gly Asn Ala Lys Lys Ala Leu Glu Ala Leu Asp Arg Gly Gly Gly Arg
610 615 620
Val Val Ala Ile Ala Asp Arg Glu Gly Arg Phe Ala Gln Ile Ala Glu
625 630 635 640
Asp Tyr Ala Ala Leu Ser Pro Glu Glu Arg Gln Lys Thr Leu Val Ile
645 650 655
Glu Pro Ser Arg Glu Gly Arg Asp Ala Leu Thr Gln Asp Ile Arg Asn
660 665 670
Lys Leu Ile Glu Arg Gly Gln Leu Gly Ala Glu Val Leu Lys Ala Thr
675 680 685
Lys Phe Val Ser Lys Asp Leu Thr Lys Ala Glu Ala Lys Arg Ala Glu
690 695 700
Ser Tyr Glu Leu Gly Asp Ile Val Arg Phe Ala Lys Asp Tyr Ala Asp
705 710 715 720
Lys Gly Val Ser Arg His Gly Ala Tyr Arg Val Ile Gln Ala Asp Glu
725 730 735
Ala Lys Asn Val Leu Thr Leu Gln Asp Glu Arg Gly Arg Glu Leu Ala
740 745 750
Trp His Pro Arg Gln Trp Gly Ala Ala Gln Ala Gln Val Tyr Arg Glu
755 760 765
Glu Ala Leu Glu Leu Arg Val Gly Asp Arg Val Gln Phe Thr Arg Asn
770 775 780
Asp Lys Ala Ala Lys Arg Val Asn Gly Gln Leu Gly Glu Val Ile Thr
785 790 795 800
Ile Asp Pro Asp Arg Gly Leu Ala Arg Val Lys Leu Gln Gly Asn Arg
805 810 815
Ile Glu Thr Leu Asn Leu Glu Ser Ala Arg Asp Arg His Phe Ser His
820 825 830
Ala Tyr Ala Ser Thr Ala Phe Ala Ala Gln Gly Arg Thr Ala Glu Arg
835 840 845
Val Phe Ala Asn Ala Glu Ser Ser Ala Thr His Leu Leu Glu Gln Lys
850 855 860
Ser Phe Tyr Val Ala Leu Ser Arg Ala Lys Val Glu Ser Val Leu Tyr
865 870 875 880
Thr Asp Asp Arg Ser Lys Met Gln Val Gly Leu Gln Glu Arg Ala Gly
885 890 895
Ile Ala Thr Arg Ala Leu Lys Glu Arg Gly Ala Asp Met Gln Asp Gly
900 905 910
Lys Gln Lys Ala Gln Glu Lys Ala Gln Ala Ala Ser Leu Ala Leu
915 920 925
<210> 145
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Atr
<400> 145
Tyr Ala Ser Thr Ala Phe Ala Ala Gln Gly
1 5 10
<210> 146
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Atr
<400> 146
His Gly Thr Ser Arg Ala Leu Asp Pro Gln Leu His Ser His
1 5 10
<210> 147
<211> 917
<212> PRT
<213> Acidobacterium capsulatum
<400> 147
Met Leu Thr Ile Ser Lys Pro Leu Ser Ser Thr Gln Ala Gln Thr Tyr
1 5 10 15
His Ala Lys Glu Phe Thr Ala Ala Glu Gln Asn Tyr Trp Lys Gln Glu
20 25 30
Asp Ile Ile Gln Gly Glu Trp Arg Gly Gln Leu Ala Glu Lys Phe Glu
35 40 45
Leu Ser Gly Ala Val Gly Gly Gln Glu Phe Ala Arg Leu Ala Glu Gly
50 55 60
Gln His Pro Gln Thr Gly Glu Gln Leu Val Arg His Arg Ala Val His
65 70 75 80
Glu Tyr Lys Thr Glu Asp Gly Arg Thr Val Thr Pro Val Glu His Arg
85 90 95
Ala Gly Trp Asp Ala Thr Phe Ser Ala Pro Lys Ser Val Ser Leu Thr
100 105 110
Ala Leu Val Gly Gly Asp Ser Glu Val Arg Glu Ala His Arg Lys Ala
115 120 125
Val Ala Phe Ala Leu Ala Glu Leu Glu Arg Tyr Thr Gln Val Arg Ile
130 135 140
Gly Gly Asn Asn Pro Pro Glu Thr Thr Gly Arg Phe Val Ala Ala Thr
145 150 155 160
Phe Glu His Asp Thr Ala Arg Pro Val Gly Gly Tyr Ala Ala Pro Gln
165 170 175
Leu His Thr His Ala Val Val Phe Asn Met Thr Glu Cys Glu Asp Gly
180 185 190
Thr Ile Arg Ala Leu Gln Pro Arg Ser Leu Phe Glu Thr Gln Gln Phe
195 200 205
Ala Thr Ala Val Tyr Gln Ser His Leu Thr Tyr Gln Leu Arg Ser Leu
210 215 220
Gly Tyr Glu Ile Glu Pro Gly Arg Ser Gly Ala Pro Glu Ile Lys Gly
225 230 235 240
Tyr Ser Gln Glu Tyr Leu Asp Ala Ser Ser Pro Arg Arg Gln Gln Ile
245 250 255
Val Glu Ala Val Ala Arg Ser Gly Phe Ser Gly Pro Glu Ala Ala Gln
260 265 270
Ile Ala Ala His Asn Thr Arg Asp Gly Lys Gln Ile Leu Ser Pro Arg
275 280 285
Glu Val Val Ala Ala His Arg Gln Ile Ala Ala Glu Phe Gly Asn Gln
290 295 300
Ala Asp Thr Val Ile Ala Glu Ala Arg Ser Arg Arg Gln Glu Gln Ala
305 310 315 320
Arg Glu Asn Pro Pro Asp Glu Arg Lys Gln Gln Val Asn Ser Ala Val
325 330 335
Thr Phe Ala Arg Asp Lys Gly Phe Glu Arg Glu Ala Val Leu Asp Glu
340 345 350
Arg Ala Ile Leu Val Asp Ala Met Arg Lys Gly Met Gly Glu Met Thr
355 360 365
Tyr Pro Glu Val Arg Ala Gly Phe Glu Ala Arg Val Arg Ser Gly Glu
370 375 380
Phe Arg Glu Val Ser His Asp Gly Lys Ala Ala Ala Arg Ser Phe Thr
385 390 395 400
Thr Ala Gly Thr Ile Gln Ala Glu Lys Glu Ile Ile Ala Ser Val Arg
405 410 415
Glu Gly Gln His Arg Ser Pro Gln Leu Met Ser Val Gln Asp Ala Ile
420 425 430
Pro Leu Thr Glu Ala Arg Gln Gln Leu Asn Gln Thr Gln Arg Lys Ala
435 440 445
Ile Glu Gln Ile Leu Thr Ser Arg Asp Gln Ile Gln Gly Leu Gln Gly
450 455 460
Ser Ala Gly Ser Gly Lys Thr Ser Thr Leu Ser Ala Ile Arg Leu Gly
465 470 475 480
Ala Glu Gln Asn Gly Tyr Val Val Glu Gly Phe Ala Pro Thr Ser Arg
485 490 495
Ala Ala His Gln Leu Arg Asp Ala Gly Ile Ser Ala Asp Thr Leu Gln
500 505 510
Gly Phe Leu Ala Arg Ala Arg Val Gln Asp Ala Pro Gly Arg Arg His
515 520 525
Leu Tyr Met Val Asp Glu Ser Ser Leu Ala Ser Thr Glu Gln Met Arg
530 535 540
Asp Phe Leu Arg Arg Ile Ser Lys Glu Asp Lys Val Leu Leu Ile Gly
545 550 555 560
Asp Val Arg Gln His Gln Gly Val Asp Ala Gly Lys Pro Phe Glu Gln
565 570 575
Leu Gln Gln Ser Gly Met Gln Thr Ala Ile Leu Asp Arg Ile Val Arg
580 585 590
Gln Lys Asp Pro Glu Leu Leu Arg Ala Val Glu His Leu Ser Lys Asn
595 600 605
Gln Thr Glu Ala Gly Leu Gln Met Leu Gln Gln Gln Gly Arg Val Thr
610 615 620
Glu Ile Val Asp Pro Glu Gln Arg Ile Ser Ala Ile Ala Lys Ala Tyr
625 630 635 640
Ala Met His Pro Glu Lys Thr Ile Ile Val Ser Pro Asp Asn Ala Ser
645 650 655
Arg Arg Ala Ile Asn Gln Ala Val Arg Gln Thr Leu Gln Ser Leu Gly
660 665 670
Arg Leu Asp Ala Glu Asp Arg Ser Ile Asn Val Leu Thr Pro Arg Ser
675 680 685
Asp Met Thr Gly Ala Asp Arg Ala Trp Ala Ala Arg Tyr Gln Pro Gly
690 695 700
Asp Val Leu His Tyr Ile Arg Gly Ser Lys Glu Leu Gly Ile Glu Gly
705 710 715 720
Gly Ser Tyr Ala Glu Val Ile Ala Ala Thr Pro Lys Asp Asn Leu Val
725 730 735
Thr Ile Arg Lys Ser Asp Gly Glu Leu Val Thr Tyr Asp Pro Ser Arg
740 745 750
Leu His Gly Ile Ser Ala Tyr Lys Glu Ile Glu Arg Glu Phe Ala Ile
755 760 765
Gly Asp Arg Val Gln Leu Thr Ala Pro Asn Arg Asp Leu Gln Val Ala
770 775 780
Asn Arg Asp Leu Gly Thr Leu Lys Ser Phe Asp Asp Ala Gly Arg Ile
785 790 795 800
Thr Leu Arg Met Asp Ser Gly Lys Asp Val Ser Phe Asp Pro Arg Asp
805 810 815
Met Arg His Phe Asp His Gly Tyr Ala Val Thr Ser Tyr Ser Ala Gln
820 825 830
Gly Leu Thr Ser Glu Arg Val Leu Val Asn Met Asp Ile Glu Val His
835 840 845
Pro Glu Leu Ile Asn Gly Arg Phe Ala Tyr Val Ser Val Ser Arg Ala
850 855 860
Ser Gln Glu Ala Gln Ile Phe Thr Asn Asp Ala Ser Asn Leu Ala Glu
865 870 875 880
Ser Leu Ser Arg Asp Val Ser Lys Thr Ser Ala Ile Pro Ala Pro Arg
885 890 895
Pro Glu Leu Ile Gln Asp Arg Ala Glu Thr Arg Ser Ile Gly Leu Gly
900 905 910
His Ala Leu Ser His
915
<210> 148
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Aca
<400> 148
Gly Ser Ala Gly Ser Gly Lys Thr
1 5
<210> 149
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Aca
<400> 149
Tyr Ala Val Thr Ser Tyr Ser Ala Gln Gly
1 5 10
<210> 150
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Aca
<400> 150
His Asp Thr Ala Arg Pro Val Gly Gly Tyr Ala Ala Pro Gln Leu His
1 5 10 15
Thr His
<210> 151
<211> 1184
<212> PRT
<213> Granulicella tundricola
<400> 151
Met Leu Thr Ile Ser Lys Ala Ile Ser Ser Ala Gln Ala Gln Thr Tyr
1 5 10 15
His Lys Leu Glu Tyr Thr Ser Asp Ala Gln Ser Tyr Tyr Lys Gln Asp
20 25 30
Glu Thr Val Lys Gly Glu Trp Gln Gly Lys Leu Ala Ala Ser Leu Gly
35 40 45
Leu Ser Gly Glu Val Ala Pro Leu Glu Phe Ser Arg Leu Thr Glu Gly
50 55 60
Ile His Pro Gln Thr Glu Ala Gln Met Val Arg His Arg Glu Gly Gln
65 70 75 80
Glu Tyr Thr Asn Ala Asp Gly Ser Val Thr Lys Pro Val Gln His Arg
85 90 95
Ala Gly Trp Asp Ala Thr Phe Ser Ala Pro Lys Ser Val Ser Leu Thr
100 105 110
Ala Leu Val Gly Gly Asp Glu Arg Val Thr Glu Ala His Arg Ala Ala
115 120 125
Val Thr Thr Ala Leu Glu Glu Leu Glu Lys Tyr Thr His Ala Arg Ile
130 135 140
Gly Gly Asn Asn Pro Ala Glu Val Thr Gly Lys Phe Val Ala Ala Lys
145 150 155 160
Phe Glu His Asp Thr Ala Arg Pro Val Asn Gly Tyr Ala Ala Pro Gln
165 170 175
Leu His Thr His Ala Ile Ile Phe Asn Val Thr Gln Arg Glu Asp Gly
180 185 190
Ser Thr Arg Ala Ile Gln Glu Arg Thr Phe Phe Glu Ser Gln Asn Tyr
195 200 205
Ala Thr Ala Val Tyr Gln Ser Val Leu Thr His Gln Leu Arg Lys Leu
210 215 220
Gly Tyr Glu Ile Glu Pro Gly Gln Ser Gly Ala Pro Gln Ile Leu Gly
225 230 235 240
Phe Thr Gln Ala Tyr Leu Asp Ala Ser Ser Pro Arg Ser Arg Gln Ile
245 250 255
Lys Glu Gln Met Glu Arg Val Gly Phe Gln Gly Pro Glu Ala Ala Gln
260 265 270
Ile Ala Ala His Ala Thr Arg Asp Arg Lys Gln Thr Leu Thr Pro Ala
275 280 285
Glu Val Leu Ala Ala His Lys Glu Met Ala Lys Asp Phe Gly Asp Gln
290 295 300
Pro Glu Arg Val Val Ala Asp Ala Arg Glu Arg Ala Leu Thr Gln Ala
305 310 315 320
Gln Glu Ile Ser Val Gln Pro Asp Ser Arg Gly Ala Val Ala Phe Ala
325 330 335
Lys Glu Lys Val Phe Glu Arg Glu Ala Val Ala Asp Glu Arg Leu Ile
340 345 350
Met Arg Glu Ala Leu Arg Arg Gly Met Gly Glu Val Ser Phe Ser Asp
355 360 365
Val Gln Ser Glu Phe Gln Arg Arg Gln Ala Glu Gly Glu Phe Arg Ser
370 375 380
Val Gln Gly Gln Lys Tyr Ala Ser Gly Arg Ser Phe Thr Thr Pro Glu
385 390 395 400
Thr Ile Ala Asp Glu Arg Ala Asn Val Gln His Val Leu Asn Gly Gln
405 410 415
Gly Ala Ser Ala Pro Met Leu Ser Thr Ala Ala Ala Glu Arg Gln Ala
420 425 430
Thr Ser Arg Asp Phe Leu Asn Glu Ala Gln Gln Thr Ala Ile Arg Glu
435 440 445
Val Leu Thr Ser Thr Asp Arg Ile His Gly Phe Gln Gly Leu Ala Gly
450 455 460
Thr Gly Lys Thr Ser Thr Leu Ala Ala Ile Arg Glu Gly Ala Glu Gln
465 470 475 480
Gly Asn Tyr Lys Val Glu Gly Phe Ala Pro Thr Ser Lys Ala Ala Gly
485 490 495
Gln Leu Arg Glu Ala Gly Ile Glu Ala Asn Thr Leu Gln Ser Phe Leu
500 505 510
Ala Arg Gln Lys Ala Pro Asp Ser Ser Arg His Leu Tyr Met Leu Asp
515 520 525
Glu Ser Ser Leu Ala Ser Thr Lys Gln Met Arg Ala Phe Leu Glu Lys
530 535 540
Ile His Pro Gln Asp Arg Val Leu Val Ile Gly Asp Thr Arg Gln His
545 550 555 560
Gln Gly Val Asp Ala Gly Arg Pro Phe Gln Gln Met Gln Glu Ala Gly
565 570 575
Met Gln Thr Ser Lys Leu Asp Thr Ile Met Arg Gln Lys Asp Pro Glu
580 585 590
Leu Leu Arg Ala Val Gln His Leu Ala Thr Asn Glu Thr Glu Met Gly
595 600 605
Ile Ala Leu Leu Thr Gln Gln Gly Arg Val Thr Glu Leu Ala Asn Ala
610 615 620
Ser Glu Arg Ile Ala Ala Ile Ala Arg Asp Tyr Ala Ala Lys Pro Glu
625 630 635 640
Asn Thr Leu Ile Val Ser Pro Asp Asn Arg Ser Arg Gln Gln Ile Asn
645 650 655
Glu Ala Val Arg Gly Glu Leu Leu Lys Ala Gly Lys Leu Ala Glu Asp
660 665 670
Gly Arg Gln Phe Leu Thr Leu Ser His Arg Ser Asp Met Thr Gly Pro
675 680 685
Asp Arg Thr Trp Ala Ala Met Tyr Arg Pro Gly Asp Val Val Gln Tyr
690 695 700
Glu Arg Gly Ser Lys Ala Glu Gly Ile Glu Arg Gly Ser Phe Gly Val
705 710 715 720
Val Arg Ser Ser Asp Ala Ala Thr Asn Arg Leu Thr Val Glu Leu Pro
725 730 735
Asn Gly Val Asn Val Glu Tyr Asp Pro Lys Arg Val Tyr Gly Val Asn
740 745 750
Val Tyr Arg Glu Thr Ser Arg Glu Phe Ala Thr Gly Asp Arg Leu Gln
755 760 765
Phe Ser Ala Ile Tyr Lys Asp Leu Gly Ile Ser Asn Arg Asp Met Gly
770 775 780
Thr Ile Thr Arg Met Glu Pro Asp Arg Leu Thr Val Leu Met Asp Gly
785 790 795 800
Lys Glu Gln Arg Ser Val Ser Phe Asn Pro Ile Glu Phe Arg Gln Phe
805 810 815
Asp His Gly Tyr Ala Val Thr Ser His Ser Ser Gln Gly Leu Thr Thr
820 825 830
Asp Arg Val Ile Ala Asn Ile Asp Thr Glu Ser Ser Arg Ser Leu Ile
835 840 845
Asn Asn Arg Leu Ala Tyr Val Ala Ile Ser Arg Ala Ser Glu Asp Ala
850 855 860
Arg Ile Tyr Thr Asn Asp Ala Ala Thr Leu Gly Gln Arg Leu Ala Thr
865 870 875 880
Asp Val Thr Lys Thr Ala Ala Leu Asp Phe Thr Ala Lys Pro Glu Pro
885 890 895
Arg Ala Thr Gln Glu Ala Ser Lys Ala Arg Thr Val Ala Val His Glu
900 905 910
Tyr Lys Asn Ser Asp Ser Arg Leu Ala Ala Val Ala Thr Glu Tyr Val
915 920 925
Ser Arg Pro Glu Arg Ser Val Ile Val Ala Leu Asp Arg Ala Glu Arg
930 935 940
Glu Gln Leu Thr Gln Leu Val Arg Ala Asp Leu Tyr Ala Gln Gly Lys
945 950 955 960
Leu Gly Arg Asp Ala Gln Ala Ile Ser Val Leu Ile Glu Lys Ala Thr
965 970 975
Gly Asn Lys Met Arg Val Asp Ser Tyr Gln Pro Gly Glu Lys Ile Gln
980 985 990
Tyr Lys Thr Gly Ser Pro Gly Leu Asn Gly Ile Pro His Glu Ser Gln
995 1000 1005
Ala Thr Val Val Ser Thr Thr Ser Arg Gly Asn Leu Leu Ser Ile
1010 1015 1020
Arg Phe Asp Ala Thr Arg Glu Glu Val Ser Tyr Asn Pro Gly Gln
1025 1030 1035
Leu Arg Thr Ala Thr Arg Glu Ser Arg Val Tyr Gln Glu Ala Thr
1040 1045 1050
Arg Glu Val Ala Glu Gly Glu Arg Val Arg Phe Thr Arg Tyr Asp
1055 1060 1065
Lys Asp Met Gly Val Arg Ser Gly Asp Leu Gly Thr Val Thr Arg
1070 1075 1080
Ile Gly Glu Asp His Ala Met Arg Val Lys Met Asp Ser Gly Lys
1085 1090 1095
Ile Ala Glu Val Pro Pro Glu Lys Ala Gln His Ile Asp Tyr Gly
1100 1105 1110
Tyr Val Val Asp Ser Leu Lys Asp Val Arg Ala Glu Arg Val Ile
1115 1120 1125
Ala Thr Gly Asp Gly Leu Thr Gln Gln Ala Phe Gln Ala Ala Ser
1130 1135 1140
Ser Lys Ala Asp Leu Ala Leu Tyr Thr Ser Pro Pro Gln Gln Glu
1145 1150 1155
Phe Ala Ser Ser Lys Glu Ile Ala Val Thr Glu Phe Ala Gln Pro
1160 1165 1170
Thr Lys Gln Gln Asn Asp Phe Gly Ile Gly Phe
1175 1180
<210> 152
<211> 1156
<212> PRT
<213> Burkholderia multivorans ATCC 17616
<400> 152
Met Ile Ser Lys Glu Pro Ile Arg Ser Val Ala Asp Ala Ala Arg Tyr
1 5 10 15
His Asp Lys Ser Phe Asn Lys Asp Ala Gly Lys Lys Ala Asp Asn Tyr
20 25 30
Tyr Val Asn Glu Lys Ala Thr Ala His Trp Gln Gly Arg Gly Ala Asp
35 40 45
Phe Leu Gly Ile Arg Gly Lys Ala Val Thr Lys Glu Glu Phe Ile Gln
50 55 60
Phe Leu Ser Gly Arg Met Pro His Pro Asp Thr Gly Lys Ile Gln Asn
65 70 75 80
Leu Ala Asn Asn Ser Lys Gly Asp Lys Arg Arg Ala Gly Ile Asp Phe
85 90 95
Thr Ile Ala Pro Pro Lys Ser Val Ser Ile Ala Ala Leu Val Gly Lys
100 105 110
Asp Asp Arg Val Ile Ala Ala His Leu Ala Ala Asn Ala Arg Thr Met
115 120 125
Glu Trp Phe Glu Lys His Ala Ser Leu Ile Arg Val Lys Asp Glu Lys
130 135 140
Gly Arg Asn Arg Pro Glu Val Ala Gly Asn Leu Leu Tyr Ala Thr Val
145 150 155 160
Leu His Glu Thr Asn Arg Glu Asn Glu Pro Gln Leu His Asn His Asn
165 170 175
Val Ile Val Ser Ala Val Tyr Asp Gly Ala Arg His Ser Trp Arg Ser
180 185 190
Leu Thr Asn Asp Leu Leu Tyr Thr Leu Arg Ala Arg Gly Asp Ile Ile
195 200 205
Tyr Lys Ala Glu Leu Ala Ala Ala Leu Arg His Leu Gly Tyr Gln Leu
210 215 220
Val Tyr Ala Glu Asn Gly Ile Asp Phe Glu Leu Lys Gly Phe Ser Arg
225 230 235 240
Asp His Val Asp Thr Phe Ser Thr Arg Ala Val Gln Val Arg Glu Ala
245 250 255
Leu Leu Lys His Gly Ile Asp Pro Gly Glu Ala Ser Phe Asp Ala Arg
260 265 270
Arg Val Ala Lys Leu Asp Ser Arg Ala Ala Lys Gln Glu His Pro Arg
275 280 285
Glu Ile Leu Gln Ser Val Trp Glu Glu Thr Ala Lys Glu Ala Asn Leu
290 295 300
Asp Val Ala Ser Ile Val Glu Arg Ala Arg Glu Ala Phe Ala Asp Arg
305 310 315 320
Gln Val Pro Arg Arg Gly Val Glu Arg Thr Val Glu His Gly Ala Ala
325 330 335
Met Gly Gln Asp Ser Gly Pro Ser Arg Gly Ala Ala Val Ser Val Ser
340 345 350
Asn Asp Ala Arg Ala Asn Ala Leu Arg Ala Val Ser Trp Ala Ile Glu
355 360 365
His Leu Thr Glu Arg Glu Gln Ala Phe Thr Leu Val Asp Leu Glu Val
370 375 380
Thr Ala Leu Lys Phe Ser Arg Gly Ser Ile Ser Glu Ile Glu Trp Ala
385 390 395 400
Ile Asp Gln His Val Arg Asn His Met Leu Val Asp Arg Gly Ile Thr
405 410 415
Val Gly Gly Gln Ile Gln Tyr Thr Thr His Lys Ala Ile Asp Asn Glu
420 425 430
Leu Lys Leu Ala Glu His Ile Leu Ala Gly Arg Gly Gln Gly Asn Val
435 440 445
Val Leu Asp Ala Glu Asp Gln Phe Asp Ala Ala Val Ala Ala Phe Glu
450 455 460
Ala Lys Lys Thr Ala Glu Ile Gly Glu Gln Phe Lys Leu Ser Gly Glu
465 470 475 480
Gln Ile Gln Ala Ala Arg Asn Val Leu Met His Glu Asp Ser Ile Gln
485 490 495
Gly Ile Gln Gly Glu Ala Gly Thr Gly Lys Thr Ala Ala Leu Ala Met
500 505 510
Val Lys Asp Val Ala Gln Ala Met Gly Trp Glu Val Ile Gly Val Ala
515 520 525
Thr Ser Ala Ala Ala Ala Lys Glu Leu Glu Ala Ser Ser Gly Ile Gln
530 535 540
Ser Asp Thr Val Ala Gly Tyr Phe Ala Lys Arg Asp Ser Ala Ile Arg
545 550 555 560
Ala Val Glu Leu Arg Leu Gln Asp Leu Arg Lys Ser Ile Ser Glu Arg
565 570 575
Ala Thr Leu Arg Gly Leu Asp Asp Gln Arg Ile Glu Ala Arg Thr Leu
580 585 590
Ala Val Lys Ser Glu Asp Ile Asp Tyr Gly Thr His Arg Tyr Thr Phe
595 600 605
Asp His Gln Arg Gly Glu Val Phe Arg Ser Pro Glu Asn Leu Arg Asn
610 615 620
Ala Ile Gly Ala Ala Leu Ser Glu Ile Ala Ala Arg His Arg Glu Ala
625 630 635 640
Ala Gly Thr Glu Gln Gly His Pro Val Thr Leu Gly Glu Gln Ala Arg
645 650 655
Glu Thr Val Arg Ala Ala Ala Ala Asn Val Ala Ala Ser Leu Gly Arg
660 665 670
Arg Leu Met Thr Phe Glu Gln Ile Gly Thr Ala Glu Ala Val Ala Ala
675 680 685
Arg Asn Thr Leu Tyr Leu Glu Arg Gln Gly Ser Ala Thr Glu Leu Asp
690 695 700
Ala Glu Tyr Ala Arg Thr Gln Ala Lys Leu Glu Asn Leu Arg Arg Tyr
705 710 715 720
Gly Asn Val Asp Gly Lys Lys Thr Leu Ile Val Met Asp Glu Ser Ser
725 730 735
Leu Thr Gly Val Asp Asp Thr Glu Lys Leu Leu Arg Phe Ala Arg Glu
740 745 750
Ile Gly Ala Arg Thr Val Leu Gln Gly Asp Val Lys Gln His Gly Ser
755 760 765
Val Ala Ala Gly Arg Ala Phe Glu Gln Ala Gln Ile Ala Gly Met Asn
770 775 780
Val Ser Ile Leu Glu Glu Thr Arg Arg Phe Arg Asp Ala Thr Ala Gln
785 790 795 800
Thr Arg Gln Ala Leu Ala Asp Met Lys Ala Gly Asn Tyr Ala Gln Ala
805 810 815
Ile Ala Arg Leu Asp Thr Leu Arg Val Ala Glu Ser Asp Leu Ala Lys
820 825 830
Thr Val Ala Glu Arg Tyr Leu Glu Asn Leu Gln Glu Leu Thr Ala Lys
835 840 845
Gly Val Asp Ala Pro Lys Val Gly Val Val Ala Ile Thr Asn Ser Asp
850 855 860
Arg Lys Leu Ile Asn Ala Ala Val His Gln Ala Leu Thr Asp Val Gly
865 870 875 880
Ile Ile Ser Gly Pro His Phe Glu Lys Pro His Leu Asp Asp Pro Lys
885 890 895
Met Thr Gly Ala Glu Gln Arg Tyr Ala Ser Met Leu Ser Arg Asn Arg
900 905 910
Val Asp Ala Leu Ile Tyr Arg Lys Ser Tyr Arg Glu Ile Gly Val Glu
915 920 925
Lys Gly Asp Val Leu Thr Val Thr Gly Tyr Asp Val Gln Lys Asn Arg
930 935 940
Ile Tyr Ala Leu Asn Ala Lys Gly Lys Ser Val Glu Ile Asn Pro Gln
945 950 955 960
Arg Gln Asp Tyr Phe Ser Pro Ala Ile Gln Glu Ser Arg Val Phe Ala
965 970 975
Val Gly Asp Arg Val Glu Thr Arg Ala Ile Ile Arg Leu Pro Gly Gln
980 985 990
Glu Leu Asn Arg Leu Asp Asn Gly Thr Gln Gly Val Ile Val Ala Ile
995 1000 1005
Asp Ser Leu Gly Ala Lys Ile Arg Trp Tyr Arg Asp Gly Lys Glu
1010 1015 1020
Ser Asp Leu Lys Asn Asp Asp Leu Arg Phe Val Asp His Ala Tyr
1025 1030 1035
Ala His Thr Ser Tyr Lys Glu Gln Gly Ala Thr Asn His Arg Glu
1040 1045 1050
Ile Val Ala Val Ser Lys Ile Gly Ala Arg Val Phe Asn Arg Glu
1055 1060 1065
Ala Ala Tyr Val Ala Ala Ser Arg Ala Lys Asp Asn Thr Glu Ile
1070 1075 1080
Ile Thr Ser Asp Leu Asp Thr Leu Leu Arg Asn Ala Gly Arg Glu
1085 1090 1095
Val Gly Lys Thr Thr Ala Val Glu Phe Glu Arg Ala Glu Ser Ser
1100 1105 1110
Leu Asp Gln Ser Ala Asp Gln Gly Ala Lys His Gly Ala Thr Arg
1115 1120 1125
Ser Ile Glu Val Ala Pro Thr Arg Ser Val Glu Thr Glu Arg Thr
1130 1135 1140
Leu Glu Arg Ser Pro Asp Pro Gly Asn Leu Leu Gly Phe
1145 1150 1155
<210> 153
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Bmu
<400> 153
Gly Glu Ala Gly Thr Gly Lys Thr
1 5
<210> 154
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Bmu
<400> 154
Tyr Ala His Thr Ser Tyr Lys Glu Gln Gly
1 5 10
<210> 155
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Aca
<400> 155
His Glu Thr Asn Arg Glu Asn Glu Pro Gln Leu His Asn His
1 5 10
<210> 156
<211> 986
<212> PRT
<213> Legionella longbeachae NSW150
<400> 156
Met Leu Ser Ile Gln Pro Leu Lys Ser Ala Lys Gly Ala Ala Asp Tyr
1 5 10 15
Tyr Ala Ala Thr Phe Asn Tyr Tyr Ala Gly Asp Ala Gln Ala Met Arg
20 25 30
Trp Leu Gly Gln Ala Ser Gln Lys Met Gln Leu Thr Gly Ile Val Gln
35 40 45
Lys Glu Gln Met Leu Ala Leu Leu Glu Gly Gln Leu Pro Asn Gly Gln
50 55 60
Ser Leu His Asn Leu Gln Gly Glu His Arg Pro Gly Phe Asp Met Thr
65 70 75 80
Phe Ser Ala Pro Lys Ser Val Ser Leu Leu Val Gly Leu Gly Val Ala
85 90 95
Pro Glu Leu Val Arg Tyr His Asp Glu Ala Val Ala Tyr Ala Ile Asp
100 105 110
Gln Ile Glu Lys Glu Phe Ala Glu Ala Arg Val Ser Arg Asn Gly Ala
115 120 125
Ile Phe Tyr Glu Lys Thr Glu Asn Leu Ala Val Ala Ala Phe Arg Gln
130 135 140
Pro Ser Ser Arg Ala Asn Asp Pro Ala Leu His Thr His Cys Val Thr
145 150 155 160
Met Asn Leu Thr Phe His Glu Gly Lys Ala Arg Ser Leu Ala Ser Asp
165 170 175
Ile Ser Arg Ser Asn Gly Val Ile Glu Gln Ile Gln Asn Asn Ala His
180 185 190
Tyr Cys Gly Leu Met Tyr Arg Gln His Leu Ala Asn Arg Leu Lys Glu
195 200 205
Ala Asp Phe Pro Leu Arg Leu Ser Gly Asp Gly Leu Phe Glu Ile Asp
210 215 220
Gly Ile Pro Glu Lys Val Leu Gln Gly Phe Ser Arg Arg Arg Glu Asp
225 230 235 240
Ile Glu Arg His Met Glu Glu Lys Gly Trp Ser Gly Ala Lys Ser Ala
245 250 255
Ser Ala Ala Thr Leu Leu Thr Arg Gln Asn Lys Glu Glu His Asp Ile
260 265 270
Thr Leu Leu Glu Gln Asp Trp Lys Glu Arg Ala Lys Asp Leu Gly Phe
275 280 285
Asp Ala Gln Ala Phe Met Gln Asn Arg Asn Gln Val Gln Ser Leu Ser
290 295 300
Trp Phe Ser Ala Ile Lys Asp Lys Leu Met Ala Leu Val Gly Lys Gln
305 310 315 320
Ser Lys Asp Lys Ser Pro Ser Glu Met Asp Ala Ala Ile Ala Cys Val
325 330 335
His Val Ala Thr Glu Thr Leu Ser Gln Arg Thr Ser Met Phe Ser Ala
340 345 350
Arg Gly Leu Ala Phe Glu Ala Met Lys His Ser Leu Val Tyr Pro Lys
355 360 365
Ala Val Ser Lys Glu Ser Ile Asn Asp Ala Ile Gln His Glu Ile Lys
370 375 380
Asn Gln Ser Leu Tyr Glu Ala Arg Cys Pro Glu Thr Gly Gln Arg Phe
385 390 395 400
Leu Thr Thr Pro Trp Leu Leu Thr Thr Glu Thr Glu Thr Leu Ala Arg
405 410 415
Ile Glu His Asn Lys Gly Val Val Pro Ala Ile Ala Thr Lys Glu Thr
420 425 430
Val Lys Ala Phe Gln Lys Gln Arg His Pro Leu Leu Pro Tyr Pro Leu
435 440 445
Thr His Ser Gln Lys Glu Ala Met Thr Val Leu Leu Thr Ser Lys Asp
450 455 460
Arg Tyr Leu Ala Ile Gln Gly Tyr Ala Gly Val Ala Lys Thr Ser Met
465 470 475 480
Leu Ser Glu Ala Lys Leu Leu Ile Glu Ala Gln Gly Tyr Ala Leu Arg
485 490 495
Gly Ile Thr Val Ala Ser Ser Ala Ala Tyr Glu Leu Gln Glu Lys Ala
500 505 510
Gly Ile Lys Thr Asp Val Phe Pro Leu Val His Gln Glu Leu Lys Asn
515 520 525
Ala Pro Thr Ala Ser Leu Ser Lys Thr Leu Phe Ile Val Asp Glu Ala
530 535 540
Ser Met Leu Ser Ser His Gln Gly His Glu Leu Met Lys Gln Ile Glu
545 550 555 560
Arg Thr His Ala Arg Leu Val Leu Val Gly Asp Lys Ala Gln Leu Pro
565 570 575
Ser Val Asn Ala Gly Arg Ile Phe Gly Leu Thr Gln Glu Tyr Gly Ile
580 585 590
Glu His Ser Ile Met Asp Glu Ile Val Arg Gln Lys Asn Thr Val Leu
595 600 605
Lys Glu Ala Val Ile Ala Ala Thr Lys Gly Asn Val Lys Glu Ala Leu
610 615 620
Asp Lys Leu Asp Val Lys Glu Cys Val Thr His Glu Glu Arg Ile Ala
625 630 635 640
Trp Ile Ala Asn His Trp Leu Ser Leu Ser Gln Lys Gly Arg Asp Asp
645 650 655
Thr Leu Leu Phe Ala Pro Thr His Ala His Arg Glu Glu Ile Thr Lys
660 665 670
Leu Ile Arg Asn Gly Leu Lys Gly Glu Gly Ile Leu Glu Asn Glu Gly
675 680 685
Leu Cys Gln Thr Val Leu Lys Ala Lys Lys Met Glu Pro Ile Gln Ser
690 695 700
Arg Phe Ile Ala Tyr Tyr Gln Lys Gly Asp Lys Val Arg Phe Asn Gln
705 710 715 720
Glu Phe Lys Thr Asn Asn Ile Gln Ala Gly Ala Tyr Tyr Thr Val Gly
725 730 735
Glu Ile Ser Lys Lys Asn Arg Gln Asp Asn Val Leu Pro Leu Ile Asn
740 745 750
Glu Gln Gly Lys Gln Ile Gln Phe Lys Leu Asn Asn Leu Pro Lys Tyr
755 760 765
Lys Thr His Asn Ala Ala Phe Glu Arg Ile Ile Glu Leu Tyr Gln Pro
770 775 780
Lys Lys Leu Glu Leu Leu Val Gly Asp Lys Val Met Trp Thr Arg Asn
785 790 795 800
Phe Lys Ala Asn Asn Leu Arg Asn Gly Gln Cys Ala Thr Leu His Glu
805 810 815
Ile Lys Glu Asn Val Phe Thr Phe Ile Thr Lys Glu Gly Arg Gln Leu
820 825 830
Thr Leu Glu Lys Asp His Pro Ala Leu Lys His Leu Asp Tyr Ser Tyr
835 840 845
Val Leu Thr Asn Tyr Lys Val Gln Gly Lys Asp Ala Pro Phe Gly Ile
850 855 860
Gly Leu Met Glu Ser Tyr His Arg Phe Gly Thr Thr Leu Asn Asn Phe
865 870 875 880
Tyr Val Gln Ile Ser Arg Ala Ile His Gly Met Ile Leu Val Thr Asp
885 890 895
Asn Lys Glu Glu Leu Val His Ala Ile Arg Arg Asn Thr Glu Glu Lys
900 905 910
Pro Val Ala Leu Asp Arg Ile Ser Ser Glu Gln Leu Val Arg His Glu
915 920 925
Glu Arg Phe Val Gln Ser Asn Lys Phe Ser Met Gln Ala Val Ile Thr
930 935 940
Lys Lys Gln Ala Phe Glu Ser Gln Lys Ser Pro Gln Ser Arg His Gln
945 950 955 960
Lys Ile Thr Met Asp Glu Leu Leu Val Pro His Lys Lys Thr Glu Ile
965 970 975
Asn Arg Pro Leu Ile Lys Glu Leu Glu Leu
980 985
<210> 157
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Llo
<400> 157
Gly Tyr Ala Gly Val Ala Lys Thr
1 5
<210> 158
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Llo
<400> 158
Tyr Val Leu Thr Asn Tyr Lys Val Gln Gly
1 5 10
<210> 159
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Llo
<400> 159
Gln Pro Ser Ser Arg Ala Asn Asp Pro Ala Leu His Thr His
1 5 10
<210> 160
<211> 1047
<212> PRT
<213> Asticcacaulis excentricus CB 48
<400> 160
Met Leu Lys Ile Thr Arg Leu Lys Ser Ala Ser Arg Ser Gly Asp Tyr
1 5 10 15
Tyr Gly Lys Asp Asp Tyr Tyr Val Thr Gly Glu Ala Asn Thr Pro Asn
20 25 30
Leu Arg Trp Gly Gly Glu Gly Ala Ala Gln Leu Gly Leu Val Gly Glu
35 40 45
Ala Asn Ser Leu Asp Phe Lys Lys Leu Leu Lys Gly Ile Asn Pro Asp
50 55 60
Pro Asp Gly Ser Ala Leu Ser Lys Ala Asp Glu Ala Leu Arg Glu Gln
65 70 75 80
Ala Gly Ala Ser Gly Glu Thr Asp Pro Glu Arg Thr Ile Pro Lys His
85 90 95
Ala Pro Gly Trp Asp Met Thr Phe Ser Ala Thr Lys Ser Ala Ser Ile
100 105 110
Met Ala Leu Val Ala Gly Asp Asp Arg Ile Gln Ala Ala Phe Asn Arg
115 120 125
Ser Val Gln Ser Thr Met Asp Tyr Ala Glu Lys His Phe Ala Ile Thr
130 135 140
Arg Gln Arg Thr Asp Gly Gly Ala Pro Lys Gln Ile Leu Thr Gly Asn
145 150 155 160
Leu Thr Tyr Ala Thr Thr Ser His Ser Met Ser Arg Ala Gly Asp Pro
165 170 175
Glu Met His Asn His Val Val Leu Ala Asn Ala Thr Arg Met Glu Asp
180 185 190
Gly Thr Trp Arg Ala Leu Glu Thr Ala Pro Leu Tyr Lys His Gln Gln
195 200 205
Phe Leu Gly Asn Val Gln Lys Ala Glu Phe Ala His Glu Leu Lys Lys
210 215 220
Leu Gly Tyr Asn Leu Val Gln Gly Lys Thr Gln Gly Thr Trp Glu Ile
225 230 235 240
Ala Glu Phe Ser Ala Ala Tyr Arg Gly Glu Asn Asp Lys Ala Gly Ile
245 250 255
Gly Pro Ala Asp Leu Leu Ile Asp Thr Phe Ser Lys Arg His Val Glu
260 265 270
Ile Met Gly Lys Ile Ala Ala Ala Glu Ala Asp Lys Gly Arg Glu Leu
275 280 285
Ser Lys Gly Glu Arg Gln Thr Leu Ile Leu Lys Asp Arg Pro Gln Lys
290 295 300
Leu Leu Thr Asp Arg Asp Val Gln Gln Ala Leu Trp Lys Glu Val Ala
305 310 315 320
Arg Asp Ala Gly Val Asp Leu Asp Gln Ile Val Ser Ala Ala Lys Thr
325 330 335
Arg Glu Val Gly Gln Asp Leu Thr Pro Gln Arg Lys Gly Asp Ile Gly
340 345 350
Leu Ala Gly Lys Val Met Ala Tyr Ile Asp Glu Lys Val Leu Gly Arg
355 360 365
Thr Arg Asp Leu Ser Ala Glu Ala Ser Leu Ala Leu Gly Leu Arg Ser
370 375 380
Gln Glu Arg Gln Ser Thr Ile Phe Thr Pro Tyr Ala Val Ile Phe Asp
385 390 395 400
Ala Met Leu Ala Asn Gly Asn Arg His Arg Ile Gln Asp Tyr Gln Ala
405 410 415
Thr Gly Phe Leu Gln Arg Pro Glu Ile Val Lys Ala Asp Arg Glu Lys
420 425 430
Leu Ala His Ile Thr Thr Gln Arg Ala Ile Thr Met Glu Asp Ala Ile
435 440 445
Val Glu Arg Val Ile Arg Ser Gln Ala Arg Ser Lys Ala Phe Thr Pro
450 455 460
Asp Val Ser Asp Arg Ala Met Tyr Gly Ile Val Ala Asp Gly Lys Ala
465 470 475 480
Leu Ala Pro Asn Thr Gln Gln Ala Ala Val Val Gln His Val Leu Thr
485 490 495
Asp Gly Ala Arg Tyr Ser Val Ile His Gly Ser Ala Gly Thr Gly Lys
500 505 510
Thr Thr Thr Phe Asp Leu Val Arg Gln Thr Leu Asp Arg Leu Ser Ala
515 520 525
Gly Gln Ile Glu Ile Val Ala Leu Ala Pro Thr His Lys Ala Lys Gly
530 535 540
Glu Leu Ala Asp Arg Ala Gly Ile Ala Thr Glu Thr Val Gln Met Phe
545 550 555 560
Leu Leu Gln Gln Gln Lys Gly Ser Thr Gln Thr Ala Pro Ser Ser Gln
565 570 575
Met Ala Asn Leu Lys Gly Lys Trp Leu Leu Val Asp Glu Gly Ser Met
580 585 590
Leu Ser Asn Val Gln Met Asp Arg Ile Ile Asp Val Ala Glu Arg Ser
595 600 605
Gly Val Asp Lys Val Ile Phe Ser Phe Asp Glu Arg Gln Leu Ala Ala
610 615 620
Met Glu Ala Gly Ala Pro Thr Arg Leu Ala Met His Ala Gly Ala Ser
625 630 635 640
Thr Val Tyr Leu Lys Asp Asn Val Arg Gln Ala Gln Met Pro Val Leu
645 650 655
Arg Ala Gly Ile Met Lys Met Ala Asp Gly Lys Pro Trp Glu Ala Leu
660 665 670
Pro Ser Ile Arg Pro Tyr Val Thr Glu Thr Arg Ser Asn Asp Asp Gln
675 680 685
Ile Leu Ala Arg Ala Ala Val Ala Lys Trp Arg Glu Met Gly Pro Asp
690 695 700
Thr Lys Val Val Val Gly Thr Asn Lys Met Arg Gly Leu Ala Asn Ala
705 710 715 720
Met Ile Arg Thr Glu Leu Gln Gly Met Gly Leu Val Gly Arg Glu Asp
725 730 735
Val Ala His Lys Thr Tyr Val Ser Glu Asn Arg Ser Pro Glu Gln Leu
740 745 750
Gly Met Ile Thr Ala Tyr Ala Leu Gly Gln Arg Ile Ile Phe His Lys
755 760 765
Ala Asp Glu Ala Asn Arg Ile Gly Arg His Thr Val His Ser Val Val
770 775 780
Gly Ile Asp Met Arg Thr Asn Arg Leu Thr Leu Gln Ser Thr Glu Tyr
785 790 795 800
Gly Lys Arg Ser Tyr Asn Leu Ala Gly Leu Thr Ser Gly Arg Asp Glu
805 810 815
Pro Thr Phe Gly Val Tyr Arg Glu Gln Thr Ile Lys Leu Ser Val Gly
820 825 830
Asp Gln Leu Ala Trp Asn Ile Thr Asp Lys Lys Ala Gly Val Thr Asn
835 840 845
Asn Asp Ala Phe Thr Val Ala Ala Ile Lys Gly Ser Lys Leu Ala Thr
850 855 860
Gln Arg Glu Val Glu Ile Asp Gly Val Arg Thr Leu Lys Thr Gln Val
865 870 875 880
Phe Asp Leu Glu Asn Asp Pro Val Ala Arg Phe Met Ser His Gly Tyr
885 890 895
Ser Leu Thr Ala Asn Arg Ala Gln Gly Ala Ser Phe Gly Lys Val Val
900 905 910
Ala Val Leu Gly Ser Tyr Met Gly Glu Phe Ala Asn Gln Ala Arg Gly
915 920 925
Tyr Val Met Ala Ser Arg Pro Arg Gln Glu Phe Gln Trp Val Thr Asp
930 935 940
Asp Leu Lys Ser Leu Phe Arg Arg Leu Ala Glu Asn Asp Gly Ile Asn
945 950 955 960
Pro Ser Ala Leu Asn His Ile Asp Arg Ala Met Asp Leu Ala Asp Lys
965 970 975
Ala Asp Arg Val Lys Pro Ala Pro Gln Pro Asp Lys Ala Pro Glu Ile
980 985 990
Pro Lys Pro Glu Pro Val Thr Ala Lys Ala Lys Glu Thr Glu Lys Glu
995 1000 1005
Lys Ser Glu Val Ala Asn Pro Gly Gly His His Ile Thr Glu Asp
1010 1015 1020
Gln Lys Ser Ser Ser Lys Glu Lys Asp Ile Gly Glu Lys His Ile
1025 1030 1035
Ala Gln Asn Asp Ile Leu Phe Arg Ile
1040 1045
<210> 161
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Aex
<400> 161
Gly Ser Ala Gly Thr Gly Lys Thr
1 5
<210> 162
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Aex
<400> 162
Tyr Ser Leu Thr Ala Asn Arg Ala Gln Gly
1 5 10
<210> 163
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Aex
<400> 163
His Ser Met Ser Arg Ala Gly Asp Pro Glu Met His Asn His
1 5 10
<210> 164
<211> 981
<212> PRT
<213> Methylobacterium radiotolerans JCM 2831
<400> 164
Met Thr Ala Ser Leu His Arg Leu Gly Ala Gly Ala Pro Ala Ala Ala
1 5 10 15
Tyr Tyr Thr Gln Asp Ser Gln Arg Glu Ala Arg Pro Asp Lys Arg Asp
20 25 30
Glu Tyr Tyr Leu Ser Asp Gly Gly Gly Val Trp Trp Ser Ser Gly Gly
35 40 45
Thr Ile Val Arg His Gly Ala Ala Ile Asp Ala Ala Ser Phe Arg Asp
50 55 60
Leu Cys Ala Gly Leu His Pro Gly Thr Gly Lys Pro Leu Val Arg Gly
65 70 75 80
Ala Gly Pro Gly His Trp Ala Gly Val Asp Cys Thr Met Thr Pro Gly
85 90 95
Lys Ser Val Ser Val Leu Trp Met Ala Gly Thr Pro Glu Gln Arg Ala
100 105 110
Ala Ile Glu Ala Ala His Arg Ala Ala Val Glu Arg Ala Leu Ser Phe
115 120 125
Val Thr Ala Glu Gly Leu Val Thr Val Arg Thr Gly Ala Gly Gly Thr
130 135 140
Glu Gln His Arg Pro Arg Asp Leu Ile Val Gly Arg Phe Asp His Tyr
145 150 155 160
Thr Thr Arg Glu Gly Asp Pro Asn Ile His Thr His Cys Val Phe Ile
165 170 175
Asn Val Ala Gly Ala Pro Glu Asn Ala Gly Ala Gly Arg Tyr Lys Ser
180 185 190
Arg Thr His Leu Thr Ile Glu Pro Glu Arg Leu Tyr Ala Ala Gln Leu
195 200 205
Gly Val Gly Ala Ala Tyr Arg Ala Ala Leu Ala Glu Gly Leu Arg Glu
210 215 220
Gln Phe Gly Leu Gln Tyr Arg Glu Ala Gly Arg Gly Gln Trp Glu Val
225 230 235 240
Ala Cys Val Pro Glu Ala Leu Leu Ala Ala Phe Ser Lys Arg Ser Glu
245 250 255
Gln Ile Leu Ala Tyr Ala Gly Ala Gly Ala Ser Ser Ala Gln Arg Glu
260 265 270
Ile Ala Ala Leu Ala Thr Arg Arg Gly Lys Glu Glu Leu Pro Thr Gly
275 280 285
Pro Glu Leu Glu Ala Arg Trp Arg Lys Glu Leu Ala Ala Cys Ala Ile
290 295 300
Asp Pro Trp Leu Ala Ala Arg His Pro Glu Arg Asp Pro Ala Phe Val
305 310 315 320
Met Ala Ala Glu Arg Asp Arg Glu Arg Glu Ala Pro Phe Asp Pro Pro
325 330 335
Glu Ile Pro Gly Asp Ser Pro Met Ala Arg Ala Ala Ser Ala Leu Phe
340 345 350
Arg His Glu Ser Val Val Ala Arg Lys Asp Leu Leu Gln Arg Ala Leu
355 360 365
Glu Val Ala Gly Val Ala Gly Ile Gly Val Asp Ala Val Glu Ala Glu
370 375 380
Leu Ala Gln Phe Glu Arg Asp Gly Ala Leu Leu Leu Leu Ala Asp Ala
385 390 395 400
Glu Leu Val Pro Gly Ala Ser Ala Cys Trp Thr Ser Pro Gly Ile Ala
405 410 415
Ala Cys Glu Ala Ala Met Leu Arg Ala Ala Asp Arg Pro Leu Glu Arg
420 425 430
Thr Trp Ile Thr Pro Glu Ala Val Glu Ala Ala Leu Ala Asp Ala Pro
435 440 445
His Leu Ser Pro Glu Gln Gly Glu Ala Val Arg His Ala Ala Gly Arg
450 455 460
Asp Gly Val Ala Leu Leu Gln Ala Gly Ala Gly Thr Gly Lys Thr Thr
465 470 475 480
Thr Ala Ala Ala Leu Val Ala Ala Ala Arg Gly Ser Gly Leu Arg Val
485 490 495
Ile Gly Leu Ala Pro Ser Trp Val Ala Ala Asp Glu Leu Gly Arg Ser
500 505 510
Thr Gly Ile Pro Ala Gln Ala Ile Ala Arg Trp Arg Gln Asp Gln Thr
515 520 525
Gln Ala Ala Gly Pro Asp Ala Ile His His Pro Asp Arg Ser Ala Val
530 535 540
Leu Asp Ala Asp Thr Leu Val Met Val Asp Glu Ala Gly Met Val Ala
545 550 555 560
Thr Arg Asp Met Glu Ala Val Leu Ser Ala Ala Arg Ser Val Gly Ala
565 570 575
Lys Val Val Leu Ile Gly Asp Arg Arg Gln Leu Ala Ser Val Gly Gly
580 585 590
Ala Ser Ala Leu Arg Ala Val Ala Asp Val Val Gly Arg Ser Ala Val
595 600 605
Leu Glu Gln Val Arg Arg Gln Thr Val Glu Trp Gln Arg Ala Ala Ser
610 615 620
Val Leu Met Ala Arg Gly Glu Val Glu Ala Ala Leu Arg Ala Tyr Ala
625 630 635 640
Ala Arg Asp Arg Ile Glu Leu Val Ala Gly Ala Glu Ala Ala Gln Val
645 650 655
Arg Ala Leu Ala Val Trp Ser Glu Gln Arg Ala Ala His Gly Glu Asp
660 665 670
Val Leu Ile Val Thr Arg Arg Asn Ala Asp Ala Ala Ala Leu Asn Val
675 680 685
Gln Ala Arg Ala Val Leu Arg Gly Glu Gly Arg Leu Gly Pro Asp Leu
690 695 700
Ile Thr Leu Pro Ala Arg Asp Arg Asp Asp Arg Pro Val Pro Leu Ala
705 710 715 720
Leu Ala Val Gly Asp Ala Leu Arg Phe Gly Glu Ser Leu Pro His Leu
725 730 735
Gly Leu Arg Asn Gly Asn Arg Ala Arg Val Glu Ala Ile Thr Ala Glu
740 745 750
Pro Glu Arg Gly Val Arg Leu Arg Leu Ala Leu Glu Asp Gly Arg Ala
755 760 765
Leu Glu Val Ala Trp Ser Asp Leu Ala Gln Gln Pro Arg Phe Gly Arg
770 775 780
Lys Trp Pro Gln Pro Arg Ile Val His Ala Tyr Ala Gly Thr Val Tyr
785 790 795 800
Ala Ala Gln Gly Arg Thr Ser Ser Ala Ala Val Met Tyr Val Gly Ala
805 810 815
Ala Thr Asp Ala Arg Glu Leu Tyr Val Gly Leu Thr Arg His Arg His
820 825 830
Glu Ala Arg Val Val Val Glu Arg Asp Arg Leu Asp Ala Leu Cys Arg
835 840 845
Gln Arg Gln Ala Asp Ala Arg Met Pro Ala Thr Asp Ala Met Val Leu
850 855 860
Glu Arg Leu Phe Arg Glu Ala Arg Thr Tyr Ser Glu Lys Val Asn Val
865 870 875 880
Val Asp His Ala Ala Asp Arg Val Ala Phe Val Arg Asp Gly Ser Leu
885 890 895
Gly Thr Arg Glu Leu Val Gly Gln Gly Ile Asp Val Arg Arg Met Met
900 905 910
Cys Ala Ala Arg Leu Leu Arg Glu Ala Met Ala Trp Leu Gly Val Glu
915 920 925
Gln Leu Ile Val Pro Thr Trp Arg Leu Val Asp Ala Tyr Gly Arg Arg
930 935 940
Leu Thr Gln Ala Pro Ala Arg Val Thr Arg Ala Leu Val Gly Glu Leu
945 950 955 960
Ala Ser Arg Leu Gly Arg Pro Asp Ala Leu Ser Gly His Glu Arg Gly
965 970 975
His His Ile Glu Arg
980
<210> 165
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Mra
<400> 165
Ala Gly Ala Gly Thr Gly Lys Thr
1 5
<210> 166
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Mra
<400> 166
Tyr Ala Gly Thr Val Tyr Ala Ala Gln Gly
1 5 10
<210> 167
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Mra
<400> 167
His Tyr Thr Thr Arg Glu Gly Asp Pro Asn Ile His Thr His
1 5 10
<210> 168
<211> 949
<212> PRT
<213> Mycobacterium parascrofulaceum ATCC BAA-614
<400> 168
Met Ala Arg Val Leu Thr Ile Ala Lys Leu Ser Arg Trp Ser Val Asn
1 5 10 15
Tyr Tyr Asn Asp Thr Ala Arg Ala Ala Gly Gln Ala Ala Lys Asp Leu
20 25 30
Gln Cys Ala Asn Gly Gly Leu Gly Glu Tyr Tyr Gly Glu His Asp Thr
35 40 45
Arg Thr Pro Val Trp Val Cys Ala Gly Asp Ala His Arg Ala Ala Glu
50 55 60
Leu Val Gly Leu Ser Asp Ala Glu Arg Ala Gly Gly Asp Ala Asp Pro
65 70 75 80
Gly Val Val Ala Arg Trp Leu Asp Glu Gly Ile Ala Pro Asn Gly Ala
85 90 95
Cys Gly Arg Ala Phe Gly Lys Gly Ser Val His Gly Phe Asp Leu Thr
100 105 110
Phe Cys Ala Pro Lys Ser Val Ser Leu Val Arg Ala Leu Arg Ala Asn
115 120 125
Glu Val Ala Asp Lys Ala Val Leu Ala Ala His Thr Thr Ala Ile Ala
130 135 140
Glu Ala Leu Lys Tyr Leu Ala Val His Ala Gly Tyr Thr Arg Val His
145 150 155 160
Asn Pro Thr Thr Gly Asp Lys Asp Leu Val Arg Leu Pro Gly Leu Val
165 170 175
Ala Val Ala Tyr Gln His Glu Thr Ser Arg Ala Gly Asp Pro His Leu
180 185 190
His Thr His Val Leu Val Pro Asn Arg Gln Ala Arg Ala Asp Gly Arg
195 200 205
Leu Val Ser Leu Asp Gly Thr Ser Leu Phe His Glu Ala Lys Ala Ala
210 215 220
Gly Val Ile Tyr Gln Ala Thr Leu Arg Arg Glu Leu His Arg Ser Leu
225 230 235 240
Gly Val Glu Trp Ala Ala Val Asp Pro Arg Thr Gly Met Ala Glu Val
245 250 255
Ala Gly Ile Asp Pro Asn Ser Val Ser Ala Trp Ser Gln Arg Ala Ser
260 265 270
Gln Leu Arg Glu Trp Ala Ala His Asn Leu Val Val Val Gly Ser Gly
275 280 285
Ala Gly Pro Ser Ala Ala Gln Leu Ala Ala Ala Gln Lys Ala Thr Arg
290 295 300
Pro Ala Lys Pro Glu Gln Leu Pro Trp Val Gln Leu Val Ala Glu Trp
305 310 315 320
Arg Ala Asp Ala Arg Gly Leu Lys Val Asp Arg Ala Ala Phe Leu Gln
325 330 335
Ala Arg Gln Ala Arg Arg Ala Ala Ala Ala Ala Pro Phe His Arg Ala
340 345 350
Arg Leu Ala Ala Ala Ala Ala Lys Ile Glu Lys Ala Ala Phe Thr Arg
355 360 365
Ala Asp Leu Val Glu Val Ile Gly Ala Gln Leu Pro Val Asp Ile Asp
370 375 380
Gly Glu Thr Arg Thr Pro Arg Glu Leu Ile Glu Ala Ser Val Asp Ala
385 390 395 400
Val Gly Met Arg Leu Thr Ala Pro Arg Ala Ala His Gln Arg Glu Gly
405 410 415
His Glu Arg Tyr Thr Leu Asp Arg Ile Leu Ala Glu Glu Ala Leu Leu
420 425 430
Leu Asp Ala Val Gly Ala Arg Glu Glu Arg Ser Gln Leu Phe Gly Leu
435 440 445
His Glu Phe Asp Leu Glu Gly Leu Ser Gly Asp Gln Gln Arg Ala Val
450 455 460
Arg Thr Ile Ala Trp Leu Pro Trp Leu Val Cys Pro Leu Ser Ala Pro
465 470 475 480
Ala Gly Ala Gly Lys Thr Thr Ser Met Arg Ala Leu Arg Ala Ala Ala
485 490 495
Asn His Ser Gly Lys Arg Val Leu Val Val Ala Pro Thr Gly Lys Ala
500 505 510
Val Asp Val Ala Val Arg Glu Gly Ala Gly Asp Thr Gly Val Thr Val
515 520 525
Ala Ala Ala Leu Arg Ser Leu Arg Glu Asn Thr Leu Thr Leu Thr Pro
530 535 540
Arg Thr Leu Val Val Val Asp Glu Ala Gly Met Val Gly Thr Asp Ala
545 550 555 560
Leu Arg Glu Leu Leu Ala Ala Ala Thr Ala Ala Gly Val Lys Thr Val
565 570 575
Leu Val Gly Asp Ala Tyr Gln Leu Ala Pro Val Lys Ala Arg Gly Gly
580 585 590
Met Phe Ala Gln Leu Cys Thr Asp Leu Pro Trp Thr Gln Thr Leu Ser
595 600 605
Glu Val Trp Arg Met Gln Asp Pro Ala Glu Arg Ala Ala Ser Leu Ala
610 615 620
Leu Arg Asp Gly Gly Pro Ala Pro Val Arg Arg Ala Val Ala Trp Tyr
625 630 635 640
Arg Ala Gln Asp Arg Leu His Ala Gly Asp Pro Ile Ala Met Ala Ala
645 650 655
Asp Ala Leu Ala Ala Tyr Lys Thr Asp Val Ala Ala Gly Lys Asp Ala
660 665 670
Leu Leu Ile Ala Asp Thr Thr Glu Met Val Asp Ala Leu Asn Arg Arg
675 680 685
Leu His Asp Glu Arg Ile Asp Pro Gln Ala Pro Thr Val Ala Ala Ala
690 695 700
Arg Gly Gln Arg Leu Ala Val Gly Asp Val Ile Val Ser Arg Arg Asn
705 710 715 720
Glu Pro Ala Ile Pro Val Phe Glu Ala Arg Arg Ala Val Pro Asp Pro
725 730 735
Ser Ala Asp Pro Val Arg Asn Gly Gln Arg Trp Gln Val Leu Ala Val
740 745 750
Asp Arg Glu His Asp Arg Ile Ala Ala Arg Arg Leu Glu Asp Gly Ala
755 760 765
Arg Val Val Leu Ser Gly Asp Tyr Leu Arg Glu His Val Ser Tyr Gly
770 775 780
Tyr Ala Val Thr Val His Ala Ala Gln Gly Val Thr Ala Asp Thr Ala
785 790 795 800
His Ala Val Leu Gly Glu Ser Thr Arg Arg Asn Leu Leu Tyr Val Ala
805 810 815
Met Thr Arg Gly Arg Glu Thr Asn His Ala Tyr Leu Tyr Glu Arg Leu
820 825 830
Gly Gly Glu Thr Glu His Glu His Pro Glu Pro Gln Ser Gly Met His
835 840 845
Val Ala Arg Arg Gly Thr Gly His Gln Ala Ala Gln Leu Val Arg Gly
850 855 860
Ile Ile Gly His Arg Asn Glu Gln Pro Arg Thr Ala His Asp Val Ala
865 870 875 880
Ala Gln Thr Glu Asp His Ala Gln Leu Pro Ala Arg Val Gln Ser Leu
885 890 895
Leu Ala Arg Arg Ala Ala Gly Val Ala Arg Arg Arg Ala Ala Tyr Gln
900 905 910
Gln Trp Arg Asp Asp Arg Leu Asp Arg Leu Leu Asp Gln Gln Gln Trp
915 920 925
Ile Asp His Gln Arg His Arg Ser Arg Gly Arg Gly Gln Ser Arg Asp
930 935 940
Tyr Gly Leu Glu Leu
945
<210> 169
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif I of TrwC Mpa
<400> 169
Ala Pro Ala Gly Ala Gly Lys Thr
1 5
<210> 170
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> RecD-like motif V of TrwC Mpa
<400> 170
Tyr Ala Val Thr Val His Ala Ala Gln Gly
1 5 10
<210> 171
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> MobF motif III of TrwC Mpa
<400> 171
His Glu Thr Ser Arg Ala Gly Asp Pro His Leu His Thr His
1 5 10
<210> 172
<211> 526
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<220>
<221> misc_feature
<222> (1)..(4)
<223> 2'-O-Methyl-Uracil
<400> 172
nnnntttttt tttttttttt tttttttttt tttttttttt tttttttttg ccatcagatt 60
gtgtttgtta gtcgctggtt gtttctgttg gtgctgatat tgcttttgat gccgacccta 120
aattttttgc ctgtttggtt cgctttgagt cttcttcggt tccgactacc ctcccgactg 180
cctatgatgt ttatcctttg gatggtcgcc atgatggtgg ttattatacc gtcaaggact 240
gtgtgactat tgacgtcctt ccccgtacgc cgggcaataa tgtttatgtt ggtttcatgg 300
tttggtctaa ctttaccgct actaaatgcc gcggattggt ttcgctgaat caggttatta 360
aagagattat ttgtctccag ccacttaagt gaggtgattt atgtttggtg ctattgctgg 420
cggtattgct tctgctcttg ctggtggcgc catgtctaaa ttgtttggag gcggtctttt 480
tccccctttt tccccctttt tccccctttt tccccctttt tccccc 526
<210> 173
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 173
tgaccgcctc caaacaattt agacatgg 28
<210> 174
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 174
agcgactaac aaacacaatc tgatggcttt tttttttttt tttttttttt ttttttt 57
<210> 175
<211> 80
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 175
ccccccccca ccccccccca ccccccccca cccccccccc ctattctgtt tatgtttctt 60
gtttgttagc cctattctgt 80
<210> 176
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 176
acagaatagg gctaacaaac aagaaacata aacagaatag 40
<210> 177
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 177
ctattctgtt tatgtttctt gtttgttagc cctattctgt 40
<210> 178
<211> 163
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 178
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt gcgttaaatt 60
caattacgtc acattagaaa cgtcagaaac ttcagaaggg cgggcggtcc atgcaacgtc 120
gcattaggaa cgttaattac ttaattcgcc ttacgtgaaa ttc 163
<210> 179
<211> 27
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 179
taatgtgacg taattgaatt taacgct 27
<210> 180
<211> 83
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 180
ttcacgtaag gcgaattaag taattaacgt tcctaatgcg acgttgcatg gaccgcccgc 60
ccttctgaag tttctgacgt ttc 83
<210> 181
<211> 5358
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 181
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt ggttgtttct 60
gttggtgctg atattgcccg gtggtaccgt ctccagccac ttaagtgagg tgatttatgt 120
ttggtgctat tgctggcggt attgcttctg ctcttgctgg tggcgccatg tctaaattgt 180
ttggaggcgg tcaaaaagcc gcctccggtg gcattcaagg tgatgtgctt gctaccgata 240
acaatactgt aggcatgggt gatgctggta ttaaatctgc cattcaaggc tctaatgttc 300
ctaaccctga tgaggccgcc cctagttttg tttctggtgc tatggctaaa gctggtaaag 360
gacttcttga aggtacgttg caggctggca cttctgccgt ttctgataag ttgcttgatt 420
tggttggact tggtggcaag tctgccgctg ataaaggaaa ggatactcgt gattatcttg 480
ctgctgcatt tcctgagctt aatgcttggg agcgtgctgg tgctgatgct tcctctgctg 540
gtatggttga cgccggattt gagaatcaaa aagagcttac taaaatgcaa ctggacaatc 600
agaaagagat tgccgagatg caaaatgaga ctcaaaaaga gattgctggc attcagtcgg 660
cgacttcacg ccagaatacg aaagaccagg tatatgcaca aaatgagatg cttgcttatc 720
aacagaagga gtctactgct cgcgttgcgt ctattatgga aaacaccaat ctttccaagc 780
aacagcaggt ttccgagatt atgcgccaaa tgcttactca agctcaaacg gctggtcagt 840
attttaccaa tgaccaaatc aaagaaatga ctcgcaaggt tagtgctgag gttgacttag 900
ttcatcagca aacgcagaat cagcggtatg gctcttctca tattggcgct actgcaaagg 960
atatttctaa tgtcgtcact gatgctgctt ctggtgtggt tgatattttt catggtattg 1020
ataaagctgt tgccgatact tggaacaatt tctggaaaga cggtaaagct gatggtattg 1080
gctctaattt gtctaggaaa taaccgtcag gattgacacc ctcccaattg tatgttttca 1140
tgcctccaaa tcttggaggc ttttttatgg ttcgttctta ttacccttct gaatgtcacg 1200
ctgattattt tgactttgag cgtatcgagg ctcttaaacc tgctattgag gcttgtggca 1260
tttctactct ttctcaatcc ccaatgcttg gcttccataa gcagatggat aaccgcatca 1320
agctcttgga agagattctg tcttttcgta tgcagggcgt tgagttcgat aatggtgata 1380
tgtatgttga cggccataag gctgcttctg acgttcgtga tgagtttgta tctgttactg 1440
agaagttaat ggatgaattg gcacaatgct acaatgtgct cccccaactt gatattaata 1500
acactataga ccaccgcccc gaaggggacg aaaaatggtt tttagagaac gagaagacgg 1560
ttacgcagtt ttgccgcaag ctggctgctg aacgccctct taaggatatt cgcgatgagt 1620
ataattaccc caaaaagaaa ggtattaagg atgagtgttc aagattgctg gaggcctcca 1680
ctatgaaatc gcgtagaggc tttgctattc agcgtttgat gaatgcaatg cgacaggctc 1740
atgctgatgg ttggtttatc gtttttgaca ctctcacgtt ggctgacgac cgattagagg 1800
cgttttatga taatcccaat gctttgcgtg actattttcg tgatattggt cgtatggttc 1860
ttgctgccga gggtcgcaag gctaatgatt cacacgccga ctgctatcag tatttttgtg 1920
tgcctgagta tggtacagct aatggccgtc ttcatttcca tgcggtgcac tttatgcgga 1980
cacttcctac aggtagcgtt gaccctaatt ttggtcgtcg ggtacgcaat cgccgccagt 2040
taaatagctt gcaaaatacg tggccttatg gttacagtat gcccatcgca gttcgctaca 2100
cgcaggacgc tttttcacgt tctggttggt tgtggcctgt tgatgctaaa ggtgagccgc 2160
ttaaagctac cagttatatg gctgttggtt tctatgtggc taaatacgtt aacaaaaagt 2220
cagatatgga ccttgctgct aaaggtctag gagctaaaga atggaacaac tcactaaaaa 2280
ccaagctgtc gctacttccc aagaagctgt tcagaatcag aatgagccgc aacttcggga 2340
tgaaaatgct cacaatgaca aatctgtcca cggagtgctt aatccaactt accaagctgg 2400
gttacgacgc gacgccgttc aaccagatat tgaagcagaa cgcaaaaaga gagatgagat 2460
tgaggctggg aaaagttact gtagccgacg ttttggcggc gcaacctgtg acgacaaatc 2520
tgctcaaatt tatgcgcgct tcgataaaaa tgattggcgt atccaacctg cagagtttta 2580
tcgcttccat gacgcagaag ttaacacttt cggatatttc tgatgagtcg aaaaattatc 2640
ttgataaagc aggaattact actgcttgtt tacgaattaa atcgaagtgg actgctggcg 2700
gaaaatgaga aaattcgacc tatccttgcg cagctcgaga agctcttact ttgcgacctt 2760
tcgccatcaa ctaacgattc tgtcaaaaac tgacgcgttg gatgaggaga agtggcttaa 2820
tatgcttggc acgttcgtca aggactggtt tagatatgag tcacattttg ttcatggtag 2880
agattctctt gttgacattt taaaagagcg tggattacta tctgagtccg atgctgttca 2940
accactaata ggtaagaaat catgagtcaa gttactgaac aatccgtacg tttccagacc 3000
gctttggcct ctattaagct cattcaggct tctgccgttt tggatttaac cgaagatgat 3060
ttcgattttc tgacgagtaa caaagtttgg attgctactg accgctctcg tgctcgtcgc 3120
tgcgttgagg cttgcgttta tggtacgctg gactttgtgg gataccctcg ctttcctgct 3180
cctgttgagt ttattgctgc cgtcattgct tattatgttc atcccgtcaa cattcaaacg 3240
gcctgtctca tcatggaagg cgctgaattt acggaaaaca ttattaatgg cgtcgagcgt 3300
ccggttaaag ccgctgaatt gttcgcgttt accttgcgtg tacgcgcagg aaacactgac 3360
gttcttactg acgcagaaga aaacgtgcgt caaaaattac gtgcggaagg agtgatgtaa 3420
tgtctaaagg taaaaaacgt tctggcgctc gccctggtcg tccgcagccg ttgcgaggta 3480
ctaaaggcaa gcgtaaaggc gctcgtcttt ggtatgtagg tggtcaacaa ttttaattgc 3540
aggggcttcg gccccttact tgaggataaa ttatgtctaa tattcaaact ggcgccgagc 3600
gtatgccgca tgacctttcc catcttggct tccttgctgg tcagattggt cgtcttatta 3660
ccatttcaac tactccggtt atcgctggcg actccttcga gatggacgcc gttggcgctc 3720
tccgtctttc tccattgcgt cgtggccttg ctattgactc tactgtagac atttttactt 3780
tttatgtccc tcatcgtcac gtttatggtg aacagtggat taagttcatg aaggatggtg 3840
ttaatgccac tcctctcccg actgttaaca ctactggtta tattgaccat gccgcttttc 3900
ttggcacgat taaccctgat accaataaaa tccctaagca tttgtttcag ggttatttga 3960
atatctataa caactatttt aaagcgccgt ggatgcctga ccgtaccgag gctaacccta 4020
atgagcttaa tcaagatgat gctcgttatg gtttccgttg ctgccatctc aaaaacattt 4080
ggactgctcc gcttcctcct gagactgagc tttctcgcca aatgacgact tctaccacat 4140
ctattgacat tatgggtctg caagctgctt atgctaattt gcatactgac caagaacgtg 4200
attacttcat gcagcgttac catgatgtta tttcttcatt tggaggtaaa acctcttatg 4260
acgctgacaa ccgtccttta cttgtcatgc gctctaatct ctgggcatct ggctatgatg 4320
ttgatggaac tgaccaaacg tcgttaggcc agttttctgg tcgtgttcaa cagacctata 4380
aacattctgt gccgcgtttc tttgttcctg agcatggcac tatgtttact cttgcgcttg 4440
ttcgttttcc gcctactgcg actaaagaga ttcagtacct taacgctaaa ggtgctttga 4500
cttataccga tattgctggc gaccctgttt tgtatggcaa cttgccgccg cgtgaaattt 4560
ctatgaagga tgttttccgt tctggtgatt cgtctaagaa gtttaagatt gctgagggtc 4620
agtggtatcg ttatgcgcct tcgtatgttt ctcctgctta tcaccttctt gaaggcttcc 4680
cattcattca ggaaccgcct tctggtgatt tgcaagaacg cgtacttatt cgccaccatg 4740
attatgacca gtgtttccag tccgttcagt tgttgcagtg gaatagtcag gttaaattta 4800
atgtgaccgt ttatcgcaat ctgccgacca ctcgcgattc aatcatgact tcgtgataaa 4860
agattgagtg tgaggttata acgccgaagc ggtaaaaatt ttaatttttg ccgctgaggg 4920
gttgaccaag cgaagcgcgg taggttttct gcttaggagt ttaatcatgt ttcagacttt 4980
tatttctcgc cataattcaa actttttttc tgataagctg gttctcactt ctgttactcc 5040
agcttcttcg gcacctgttt tacagacacc taaagctaca tcgtcaacgt tatattttga 5100
tagtttgacg gttaatgctg gtaatggtgg ttttcttcat tgcattcaga tggatacatc 5160
tgtcaacgcc gctaatcagg ttgtttctgt tggtgctgat attgcttttg atgccgaccc 5220
taaatttttt gcctgtttgg ttcgctttga gtcttcttcg gttccgacta ccctcccgac 5280
tgcctatgat gtttatcctt tgaatggtcg ccatgatggt ggttattata ccgtcaagga 5340
ctgtgtgact attgacgt 5358
<210> 182
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> Polynucleotide used in the Examples
<400> 182
gcaatatcag caccaacaga aacaaccttt tttttttttt tttttttttt ttttttt 57
Claims (39)
- (a) 표적 폴리뉴클레오티드를 막횡단 기공 및 RecD 헬리카제와 접촉시켜, 표적 폴리뉴클레오티드가 기공을 통해 이동하고 RecD 헬리카제가 기공을 통한 표적 뉴클레오티드의 이동을 제어하도록 하는 단계; 및
(b) 폴리뉴클레오티드가 기공에 대해 이동할 때, 표적 뉴클레오티드의 하나 이상의 특징을 나타내는 하나 이상의 측정을 수행함으로써 표적 폴리뉴클레오티드를 특성화하는 단계
를 포함하며, 0.3M 내지 1.0M의 염 농도를 사용하여 수행되는, 표적 폴리뉴클레오티드를 특성화하는 방법. - 제1항에 있어서, 하나 이상의 특징이 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 정체, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택된 것인 방법.
- 제2항에 있어서, 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 손상에 의해, 또는 하나 이상의 단백질에 의해, 또는 하나 이상의 표지, 태그 또는 스페이서에 의해 변형된 것인 방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 표적 폴리뉴클레오티드의 하나 이상의 특징을 전기 측정, 광학 측정, 또는 둘 모두에 의해 측정하며, 전기 측정이 전류 측정, 임피던스 측정, 터널링(tunnelling) 측정, 또는 전계 효과 트랜지스터 (FET) 측정인 방법.
- 제1항에 있어서, 기공을 가로지르는 전압을 인가하여 기공과 헬리카제 사이에 복합체를 형성하는 단계를 추가로 포함하는 방법.
- 제1항에 있어서, 폴리뉴클레오티드의 적어도 일부분이 이중 가닥인 방법.
- 제1항에 있어서, 기공이 막횡단 단백질 기공 또는 고체 상태 기공인 방법.
- 제7항에 있어서, 막횡단 단백질 기공이 α-용혈소, 류코시딘, 미코박테리움 스메그마티스(Mycobacterium smegmatis) 포린 A (MspA), 외부 막 포린 F (OmpF), 외부 막 포린 G (OmpG), 외부 막 포스포리파제 A, 네이세리아(Neisseria) 자가수송체 지단백질 (NalP) 및 WZA로부터 선택된 것인 방법.
- 제7항에 있어서, 막횡단 단백질이 (a) 8개의 동일한, 서열 2에 나타낸 서브유닛으로 형성되고 기공 활성을 보유하는 것이거나, 또는 (b) 7개의 동일한, 서열 4에 나타낸 서브유닛으로 형성된 α-용혈소이고 기공 활성을 보유하는 것인 방법.
- 제1항에 있어서, RecD 헬리카제가
- 아미노산 모티프 X1-X2-X3-G-X4-X5-X6-X7 (서열 8) (여기서 X1은 G, S 또는 A이고, X2는 임의의 아미노산이고, X3은 P, A, S 또는 G이고, X4는 T, A, V, S 또는 C이고, X5는 G 또는 A이고, X6은 K 또는 R이고, X7은 T 또는 S임);
- 아미노산 모티프 X1-X2-X3-X4-X5-(X6)3-Q-X7 (서열 16) (여기서 X1은 Y, W 또는 F이고, X2는 A, T, S, M, C 또는 V이고, X3은 임의의 아미노산이고, X4는 T 또는 N이고, X5는 A, T, G, S, V 또는 I이고, X6은 임의의 아미노산이고, X7은 G 또는 S임); 또는
- 둘 모두
를 포함하는 것인 방법. - 제10항에 있어서, RecD 헬리카제가 하기 모티프
(a) GGPGTGKT(서열 19), WAVTIHKSQG(서열 20), 또는 둘 모두;
(b) GGPGTGKS(서열 22), YALTVHRAQG(서열 23), 또는 둘 모두;
(c) GGPGVGKT(서열 26), YAISVHKSQG(서열 27), 또는 둘 모두;
(d) GGPGTGKT(서열 19), YCISVHKSQG(서열 29), 또는 둘 모두;
(e) GGPGVGKT(서열 26), YAATIHKSQG(서열 31), 또는 둘 모두;
(f) GGPGCGKS(서열 33), YAMTIHRSQG(서열 34), 또는 둘 모두;
(g) GGPGTGKS(서열 22), YAVSIHKSQG(서열 36), 또는 둘 모두;
(h) GGPGVGKT(서열 26), YATSVHKSQG(서열 38), 또는 둘 모두;
(i) GGPGTGKT(서열 19), YAVSVHKSQG(서열 40), 또는 둘 모두;
(j) GGPGVGKT(서열 26), YATSIHKSQG(서열 43), 또는 둘 모두; 또는
(k) GGPGTGKS(서열 22), YALTVHRGQG(서열 45), 또는 둘 모두
를 포함하는 것인 방법. - 제12항에 있어서, RecD 헬리카제가
(a) 서열 18, 21, 24, 25, 28, 30, 32, 35, 37, 39, 41, 42 및 44 중 어느 하나에 나타낸 서열
을 포함하고 헬리카제 활성을 보유하는 것인 방법. - 제1항에 있어서, RecD 헬리카제가 TraI 헬리카제 또는 TraI 하위군 헬리카제인 방법.
- 제14항에 있어서, TraI 헬리카제 또는 TraI 하위군 헬리카제가
- 아미노산 모티프 H-(X1)2-X2-R-(X3)5-12-H-X4-H (서열 46 내지 53) (여기서 X1 및 X3은 임의의 아미노산이고, X2 및 X4는 D, E, K 및 R을 제외한 임의의 아미노산으로부터 독립적으로 선택됨); 또는
- 아미노산 모티프 G-X1-X2-X3-X4-X5-X6-X7-H-(X8)6-12-H-X9 (서열 54 내지 60) (여기서 X1, X2, X3, X5, X6, X7 및 X9는 D, E, K 및 R을 제외한 임의의 아미노산으로부터 독립적으로 선택되고, X4는 D 또는 E이고, X8은 임의의 아미노산임)
를 추가로 포함하는 것인 방법. - 제17항에 있어서, TraI 헬리카제 또는 TraI 하위군 헬리카제가 (a) 서열 61, 65, 69, 73, 74, 78, 82, 86, 90, 94, 98, 102, 106, 110, 112, 113, 114, 117, 121, 124, 125, 129, 133, 136, 140, 144, 147, 151, 152, 156, 160, 164 및 168 중 어느 하나에 나타낸 서열을 포함하고 헬리카제 활성을 보유하는 것인 방법.
- 제1항에 있어서, 염이 KCl인 방법.
- 기공과 RecD 헬리카제 사이에 복합체를 형성함으로써 표적 폴리뉴클레오티드를 특성화하기 위한 센서를 형성하는 것을 포함하며, 여기서 표적 폴리뉴클레오티드의 특성화는 0.3M 내지 1.0M의 염 농도를 사용하여 수행되는 것인, 표적 폴리뉴클레오티드를 특성화하기 위한 센서를 형성하는 방법.
- 제20항에 있어서, (a) 기공과 헬리카제를 표적 폴리뉴클레오티드의 존재 하에 접촉시키고, 기공을 가로지르는 전압 전위 또는 화학 전위를 인가하거나, 또는 (b) 기공을 헬리카제에 공유적으로 부착시킴으로써 복합체를 형성하는 것인 방법.
- 기공 및 RecD 헬리카제를 포함하는, 0.3M 내지 1.0M의 염 농도에서 표적 폴리뉴클레오티드를 특성화하기 위한 키트.
- 제22항에 있어서, 친양쪽성 층을 포함하는 칩을 추가로 포함하는 키트.
- 다수의 기공 및 다수의 RecD 헬리카제를 포함하는, 0.3M 내지 1.0M의 염 농도에서 샘플 내의 표적 폴리뉴클레오티드를 특성화하기 위한 분석 장치.
- 제24항에 있어서,
다수의 기공을 지지할 수 있고, 기공 및 헬리카제를 사용한 폴리뉴클레오티드 특성화를 수행하도록 작동할 수 있는 센서 장치;
특성화를 수행하기 위한 물질을 보유하기 위한 적어도 하나의 저장소;
물질을 적어도 하나의 저장소로부터 센서 장치로 제어가능하게 공급하도록 구성된 유체공학 시스템; 및
각각의 샘플을 수용하기 위한 다수의 용기
를 포함하며, 유체공학 시스템은 샘플을 선별적으로 용기로부터 센서 장치로 공급하도록 구성된 것인 분석 장치. - (a) 표적 폴리뉴클레오티드를 RecD 헬리카제와 접촉시켜, RecD 헬리카제가 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 단계; 및
(b) RecD 헬리카제가 폴리뉴클레오티드의 이동을 제어할 때, 표적 뉴클레오티드의 하나 이상의 특징을 나타내는 하나 이상의 측정을 수행함으로써 표적 폴리뉴클레오티드를 특성화하는 단계
를 포함하며, 0.3M 내지 1.0M의 염 농도를 사용하여 수행되는, 표적 폴리뉴클레오티드를 특성화하는 방법. - 제26항에 있어서,
(a) 하나 이상의 특징이 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 정체, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택되거나;
(b) 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 손상에 의해, 또는 하나 이상의 단백질에 의해, 또는 하나 이상의 표지, 태그 또는 스페이서에 의해 변형되거나, 표적 폴리뉴클레오티드의 적어도 일부분이 이중 가닥이거나;
(c) 하나 이상의 특징을 전기 측정, 광학 측정, 또는 둘 모두에 의해 측정하거나;
(d) RecD가 표 4 또는 5에 나타낸 헬리카제 중 하나이며, 표 4는 하기 표이고
표 5는 하기 표이거나
,
TraI 헬리카제 또는 TraI 하위군 헬리카제이거나,
RecD가
- 아미노산 모티프 X1-X2-X3-G-X4-X5-X6-X7 (서열 8) (여기서 X1은 G, S 또는 A이고, X2는 임의의 아미노산이고, X3은 P, A, S 또는 G이고, X4는 T, A, V, S 또는 C이고, X5는 G 또는 A이고, X6은 K 또는 R이고, X7은 T 또는 S임);
- 아미노산 모티프 X1-X2-X3-X4-X5-(X6)3-Q-X7 (서열 16) (여기서 X1은 Y, W 또는 F이고, X2는 A, T, S, M, C 또는 V이고, X3은 임의의 아미노산이고, X4는 T 또는 N이고, X5는 A, T, G, S, V 또는 I이고, X6은 임의의 아미노산이고, X7은 G임); 또는
- 둘 모두
를 포함하는 것이거나;
(e) 0.3M 내지 1.0M의 염 농도를 사용하여 수행되는
방법. - 제27항에 있어서, 염이 KCl인 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161581332P | 2011-12-29 | 2011-12-29 | |
US61/581,332 | 2011-12-29 | ||
PCT/GB2012/053274 WO2013098562A2 (en) | 2011-12-29 | 2012-12-28 | Enzyme method |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140108706A KR20140108706A (ko) | 2014-09-12 |
KR102086182B1 true KR102086182B1 (ko) | 2020-03-06 |
Family
ID=47561658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147020837A KR102086182B1 (ko) | 2011-12-29 | 2012-12-28 | 효소 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10385382B2 (ko) |
EP (1) | EP2798084B1 (ko) |
JP (1) | JP6228128B2 (ko) |
KR (1) | KR102086182B1 (ko) |
CN (1) | CN104126018B (ko) |
AU (1) | AU2012360244B2 (ko) |
BR (1) | BR112014016112B8 (ko) |
CA (1) | CA2861808C (ko) |
WO (1) | WO2013098562A2 (ko) |
Families Citing this family (101)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008102121A1 (en) | 2007-02-20 | 2008-08-28 | Oxford Nanopore Technologies Limited | Formation of lipid bilayers |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
EP3029467B1 (en) | 2008-09-22 | 2020-01-08 | University of Washington | Msp nanopores and related methods |
WO2010086622A1 (en) | 2009-01-30 | 2010-08-05 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
EP3633370A1 (en) | 2011-05-27 | 2020-04-08 | Oxford Nanopore Technologies Limited | Coupling method |
IN2014DN00221A (ko) | 2011-07-25 | 2015-06-05 | Oxford Nanopore Tech Ltd | |
JP6457811B2 (ja) | 2011-09-23 | 2019-01-23 | オックスフォード ナノポール テクノロジーズ リミテッド | ポリマー単位を含むポリマーの解析 |
EP2987870B1 (en) | 2011-10-21 | 2020-02-19 | Oxford Nanopore Technologies Limited | Method of characterizing a target polynucleotide using a transmembrane pore and molecular motor |
EP2798083B1 (en) | 2011-12-29 | 2017-08-09 | Oxford Nanopore Technologies Limited | Method for characterising a polynucelotide by using a xpd helicase |
CN104126018B (zh) | 2011-12-29 | 2021-09-14 | 牛津纳米孔技术公司 | 酶方法 |
GB201202519D0 (en) | 2012-02-13 | 2012-03-28 | Oxford Nanopore Tech Ltd | Apparatus for supporting an array of layers of amphiphilic molecules and method of forming an array of layers of amphiphilic molecules |
US10739341B2 (en) | 2012-02-15 | 2020-08-11 | Oxford Nanopore Technologies Limited | Aptamer method |
WO2013153359A1 (en) | 2012-04-10 | 2013-10-17 | Oxford Nanopore Technologies Limited | Mutant lysenin pores |
CA2879355C (en) | 2012-07-19 | 2021-09-21 | Oxford Nanopore Technologies Limited | Helicase construct and its use in characterising polynucleotides |
US10808231B2 (en) | 2012-07-19 | 2020-10-20 | Oxford Nanopore Technologies Limited | Modified helicases |
WO2014013259A1 (en) | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Ssb method |
US9551023B2 (en) | 2012-09-14 | 2017-01-24 | Oxford Nanopore Technologies Ltd. | Sample preparation method |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
EP2917366B1 (en) | 2012-11-06 | 2017-08-02 | Oxford Nanopore Technologies Limited | Quadruplex method |
GB201222928D0 (en) | 2012-12-19 | 2013-01-30 | Oxford Nanopore Tech Ltd | Analysis of a polynucleotide |
KR102168813B1 (ko) | 2013-03-08 | 2020-10-22 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 효소 정지 방법 |
GB201318465D0 (en) | 2013-10-18 | 2013-12-04 | Oxford Nanopore Tech Ltd | Method |
GB201314695D0 (en) * | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
CN103265958A (zh) * | 2013-06-08 | 2013-08-28 | 东莞市保得生物工程有限公司 | 一种商品化有机物料腐熟剂的制备方法 |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
EP3575410A3 (en) | 2013-10-18 | 2020-03-04 | Oxford Nanopore Technologies Limited | Modified enzymes |
US9580758B2 (en) | 2013-11-12 | 2017-02-28 | Luc Montagnier | System and method for the detection and treatment of infection by a microbial agent associated with HIV infection |
EP3074534B1 (en) | 2013-11-26 | 2019-05-01 | Illumina, Inc. | Methods for polynucleotide sequencing |
GB201406155D0 (en) * | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
US10385389B2 (en) | 2014-01-22 | 2019-08-20 | Oxford Nanopore Technologies Ltd. | Method for attaching one or more polynucleotide binding proteins to a target polynucleotide |
CN106133513B (zh) | 2014-02-19 | 2019-08-13 | 华盛顿大学 | 蛋白质特征的基于纳米孔的分析 |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
WO2015150786A1 (en) | 2014-04-04 | 2015-10-08 | Oxford Nanopore Technologies Limited | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
US10443097B2 (en) | 2014-05-02 | 2019-10-15 | Oxford Nanopore Technologies Ltd. | Method of improving the movement of a target polynucleotide with respect to a transmembrane pore |
GB201411285D0 (en) * | 2014-06-25 | 2014-08-06 | Prosser Joseph | Sequencer |
CN117164682A (zh) | 2014-09-01 | 2023-12-05 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
WO2016055778A1 (en) | 2014-10-07 | 2016-04-14 | Oxford Nanopore Technologies Limited | Mutant pores |
GB201418159D0 (en) | 2014-10-14 | 2014-11-26 | Oxford Nanopore Tech Ltd | Method |
EP3971300A1 (en) | 2014-10-16 | 2022-03-23 | Oxford Nanopore Technologies plc | Sorting of polymers |
US10480026B2 (en) | 2014-10-17 | 2019-11-19 | Oxford Nanopore Technologies Ltd. | Method for nanopore RNA characterisation |
GB201418469D0 (en) | 2014-10-17 | 2014-12-03 | Oxford Nanopore Tech Ltd | Method |
GB201418512D0 (en) | 2014-10-17 | 2014-12-03 | Oxford Nanopore Tech Ltd | Electrical device with detachable components |
GB201502810D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
WO2016166232A1 (en) | 2015-04-14 | 2016-10-20 | Katholieke Universiteit Leuven | Nanopores with internal protein adaptors |
GB201508003D0 (en) | 2015-05-11 | 2015-06-24 | Oxford Nanopore Tech Ltd | Apparatus and methods for measuring an electrical current |
GB201508669D0 (en) | 2015-05-20 | 2015-07-01 | Oxford Nanopore Tech Ltd | Methods and apparatus for forming apertures in a solid state membrane using dielectric breakdown |
CN108137656A (zh) | 2015-09-24 | 2018-06-08 | 豪夫迈·罗氏有限公司 | α-溶血素变体 |
EP3387432B1 (en) | 2015-12-08 | 2022-09-28 | Katholieke Universiteit Leuven KU Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
EP4015531A3 (en) | 2016-03-02 | 2022-09-28 | Oxford Nanopore Technologies PLC | Mutant pore |
CA3212147A1 (en) | 2016-04-06 | 2017-10-12 | Oxford Nanopore Technologies Plc | Mutant pore |
GB201609221D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
GB201609220D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
EP3464616B1 (en) | 2016-05-25 | 2022-05-04 | Oxford Nanopore Technologies plc | Method |
GB201611770D0 (en) | 2016-07-06 | 2016-08-17 | Oxford Nanopore Tech | Microfluidic device |
GB201616590D0 (en) | 2016-09-29 | 2016-11-16 | Oxford Nanopore Technologies Limited | Method |
GB201620450D0 (en) | 2016-12-01 | 2017-01-18 | Oxford Nanopore Tech Ltd | Method |
WO2018146491A1 (en) | 2017-02-10 | 2018-08-16 | Oxford Nanopore Technologies Limited | Modified nanopores, compositions comprising the same, and uses thereof |
GB201707140D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Method |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
EP3646025B1 (en) | 2017-06-29 | 2021-08-04 | President and Fellows of Harvard College | Deterministic stepping of polymers through a nanopore |
SG11201913174PA (en) | 2017-06-30 | 2020-01-30 | Vib Vzw | Novel protein pores |
GB2569977A (en) | 2018-01-05 | 2019-07-10 | Oxford Nanopore Tech Ltd | Method |
GB201807793D0 (en) | 2018-05-14 | 2018-06-27 | Oxford Nanopore Tech Ltd | Method |
GB201808556D0 (en) | 2018-05-24 | 2018-07-11 | Oxford Nanopore Tech Ltd | Method |
GB201808554D0 (en) | 2018-05-24 | 2018-07-11 | Oxford Nanopore Tech Ltd | Method |
GB201809323D0 (en) | 2018-06-06 | 2018-07-25 | Oxford Nanopore Tech Ltd | Method |
US20220162692A1 (en) | 2018-07-30 | 2022-05-26 | Oxford University Innovation Limited | Assemblies |
GB201821155D0 (en) | 2018-12-21 | 2019-02-06 | Oxford Nanopore Tech Ltd | Method |
JP2022523435A (ja) | 2019-03-12 | 2022-04-22 | オックスフォード ナノポール テクノロジーズ ピーエルシー | ナノ細孔センシングデバイスと操作方法およびその成形方法 |
GB201907244D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
GB201907246D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
WO2020254672A1 (en) | 2019-06-19 | 2020-12-24 | Therycell Gmbh | Spatial characterisation of target structures in a sample |
GB201917060D0 (en) | 2019-11-22 | 2020-01-08 | Oxford Nanopore Tech Ltd | Method |
JP2023503514A (ja) | 2019-12-02 | 2023-01-30 | オックスフォード ナノポール テクノロジーズ ピーエルシー | ナノポアを使用する標的ペプチドの特徴付けの方法 |
GB201917742D0 (en) | 2019-12-04 | 2020-01-15 | Oxford Nanopore Tech Ltd | Method |
GB202004944D0 (en) | 2020-04-03 | 2020-05-20 | King S College London | Method |
EP4168583A2 (en) | 2020-06-18 | 2023-04-26 | Oxford Nanopore Technologies plc | Method of characterising a polynucleotide moving through a nanopore |
WO2021255475A1 (en) | 2020-06-18 | 2021-12-23 | Oxford Nanopore Technologies Limited | A method of selectively characterising a polynucleotide using a detector |
GB202009349D0 (en) | 2020-06-18 | 2020-08-05 | Oxford Nanopore Tech Ltd | Method |
US20230266268A1 (en) | 2020-07-22 | 2023-08-24 | Oxford Nanopore Technologies Inc. | Solid state nanopore formation |
EP4196608A1 (en) | 2020-08-11 | 2023-06-21 | F. Hoffmann-La Roche AG | Nucleoside-5'-oligophosphates tagged with positively-charged polymers, nanopores incorporating negative charges, and methods and systems using the same |
GB202015993D0 (en) | 2020-10-08 | 2020-11-25 | Oxford Nanopore Tech Ltd | Method |
WO2022243692A1 (en) | 2021-05-19 | 2022-11-24 | Oxford Nanopore Technologies Plc | Methods for complement strand sequencing |
GB202107192D0 (en) | 2021-05-19 | 2021-06-30 | Oxford Nanopore Tech Ltd | Method |
GB202107354D0 (en) | 2021-05-24 | 2021-07-07 | Oxford Nanopore Tech Ltd | Method |
WO2022263496A1 (en) | 2021-06-17 | 2022-12-22 | F. Hoffmann-La Roche Ag | Engineered nanopore with a negatively charged polymer threaded through the channel |
GB202112235D0 (en) | 2021-08-26 | 2021-10-13 | Oxford Nanopore Tech Ltd | Nanopore |
GB202118908D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
GB202118906D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
WO2023123359A1 (zh) * | 2021-12-31 | 2023-07-06 | 深圳华大生命科学研究院 | 解旋酶bch2x及其用途 |
GB202205617D0 (en) | 2022-04-14 | 2022-06-01 | Oxford Nanopore Tech Plc | Novel modified protein pores and enzymes |
WO2023215603A1 (en) | 2022-05-06 | 2023-11-09 | 10X Genomics, Inc. | Methods and compositions for in situ analysis of v(d)j sequences |
WO2023222657A1 (en) | 2022-05-17 | 2023-11-23 | Oxford Nanopore Technologies Plc | Method and adaptors |
CN115074336B (zh) * | 2022-06-29 | 2024-03-22 | 电子科技大学 | 一种具有磷脂翻转酶活性的蛋白及其纯化方法 |
GB202211607D0 (en) | 2022-08-09 | 2022-09-21 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
WO2024033443A1 (en) | 2022-08-09 | 2024-02-15 | Oxford Nanopore Technologies Plc | Novel pore monomers and pores |
GB202211602D0 (en) | 2022-08-09 | 2022-09-21 | Oxford Nanopore Tech Plc | Novel pore monomers and pores |
GB202307486D0 (en) | 2023-05-18 | 2023-07-05 | Oxford Nanopore Tech Plc | Method |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6602979B1 (en) | 1994-12-19 | 2003-08-05 | The United States Of America As Represented By The Department Of Health And Human Services | Screening assays for compounds that cause apoptosis |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
WO2002092821A1 (fr) | 2001-05-01 | 2002-11-21 | National Institute Of Advanced Industrial Science And Technology | Nouveau maxizyme |
US20030010638A1 (en) | 2001-06-15 | 2003-01-16 | Hansford Derek J. | Nanopump devices and methods |
US7399590B2 (en) | 2002-02-21 | 2008-07-15 | Asm Scientific, Inc. | Recombinase polymerase amplification |
AU2003272438B2 (en) * | 2002-09-20 | 2009-04-02 | New England Biolabs, Inc. | Helicase dependent amplification of nucleic acids |
US7745116B2 (en) | 2003-04-08 | 2010-06-29 | Pacific Biosciences Of California, Inc. | Composition and method for nucleic acid sequencing |
US7851203B2 (en) | 2003-10-01 | 2010-12-14 | Lawrence Livermore National Security, Llc | Functionalized apertures for the detection of chemical and biological materials |
WO2006028508A2 (en) | 2004-03-23 | 2006-03-16 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
JP4757804B2 (ja) | 2004-10-27 | 2011-08-24 | 株式会社カネカ | 新規カルボニル還元酵素、その遺伝子、およびその利用法 |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
WO2008102121A1 (en) | 2007-02-20 | 2008-08-28 | Oxford Nanopore Technologies Limited | Formation of lipid bilayers |
EP3798317B1 (en) * | 2007-04-04 | 2024-01-03 | The Regents of the University of California | Compositions, devices, systems, and methods for using a nanopore |
EP3540436B1 (en) | 2007-09-12 | 2023-11-01 | President And Fellows Of Harvard College | High-resolution molecular sensor |
GB2453377A (en) | 2007-10-05 | 2009-04-08 | Isis Innovation | Transmembrane protein pores and molecular adapters therefore. |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
US8231969B2 (en) | 2008-03-26 | 2012-07-31 | University Of Utah Research Foundation | Asymmetrically functionalized nanoparticles |
JP2011527191A (ja) | 2008-07-07 | 2011-10-27 | オックスフォード ナノポア テクノロジーズ リミテッド | 塩基検出細孔 |
US20110229877A1 (en) | 2008-07-07 | 2011-09-22 | Oxford Nanopore Technologies Limited | Enzyme-pore constructs |
US20100092960A1 (en) | 2008-07-25 | 2010-04-15 | Pacific Biosciences Of California, Inc. | Helicase-assisted sequencing with molecular beacons |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
GB0820927D0 (en) * | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
US9222082B2 (en) | 2009-01-30 | 2015-12-29 | Oxford Nanopore Technologies Limited | Hybridization linkers |
WO2010086622A1 (en) | 2009-01-30 | 2010-08-05 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
CA2753294A1 (en) | 2009-02-23 | 2010-08-26 | Cytomx Therapeutics, Inc. | Proproteins and methods of use thereof |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
BRPI1012752B1 (pt) | 2009-04-20 | 2019-06-25 | Oxford Nanopore Technologies Limited | Método e aparelho para detectar uma interação de uma entidade molecular com uma proteína de membrana em uma camada de moléculas anfifílicas |
US9309557B2 (en) | 2010-12-17 | 2016-04-12 | Life Technologies Corporation | Nucleic acid amplification |
WO2011067559A1 (en) | 2009-12-01 | 2011-06-09 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
CN103392008B (zh) | 2010-09-07 | 2017-10-20 | 加利福尼亚大学董事会 | 通过持续性酶以一个核苷酸的精度控制dna在纳米孔中的移动 |
WO2012107778A2 (en) | 2011-02-11 | 2012-08-16 | Oxford Nanopore Technologies Limited | Mutant pores |
EP3633370A1 (en) | 2011-05-27 | 2020-04-08 | Oxford Nanopore Technologies Limited | Coupling method |
IN2014DN00221A (ko) | 2011-07-25 | 2015-06-05 | Oxford Nanopore Tech Ltd | |
JP6457811B2 (ja) | 2011-09-23 | 2019-01-23 | オックスフォード ナノポール テクノロジーズ リミテッド | ポリマー単位を含むポリマーの解析 |
EP2987870B1 (en) | 2011-10-21 | 2020-02-19 | Oxford Nanopore Technologies Limited | Method of characterizing a target polynucleotide using a transmembrane pore and molecular motor |
EP2798083B1 (en) | 2011-12-29 | 2017-08-09 | Oxford Nanopore Technologies Limited | Method for characterising a polynucelotide by using a xpd helicase |
CN104126018B (zh) | 2011-12-29 | 2021-09-14 | 牛津纳米孔技术公司 | 酶方法 |
WO2013153359A1 (en) | 2012-04-10 | 2013-10-17 | Oxford Nanopore Technologies Limited | Mutant lysenin pores |
WO2014013259A1 (en) | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Ssb method |
US10808231B2 (en) | 2012-07-19 | 2020-10-20 | Oxford Nanopore Technologies Limited | Modified helicases |
CA2879355C (en) | 2012-07-19 | 2021-09-21 | Oxford Nanopore Technologies Limited | Helicase construct and its use in characterising polynucleotides |
KR102168813B1 (ko) | 2013-03-08 | 2020-10-22 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 효소 정지 방법 |
RU2669844C2 (ru) | 2013-03-14 | 2018-10-16 | Аркема Инк. | Способы сшивания полимерных композиций в присутствии атмосферного кислорода |
EP3575410A3 (en) | 2013-10-18 | 2020-03-04 | Oxford Nanopore Technologies Limited | Modified enzymes |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
-
2012
- 2012-12-28 CN CN201280069777.2A patent/CN104126018B/zh active Active
- 2012-12-28 EP EP12816097.5A patent/EP2798084B1/en active Active
- 2012-12-28 US US14/369,072 patent/US10385382B2/en active Active
- 2012-12-28 WO PCT/GB2012/053274 patent/WO2013098562A2/en active Application Filing
- 2012-12-28 KR KR1020147020837A patent/KR102086182B1/ko active IP Right Grant
- 2012-12-28 JP JP2014549533A patent/JP6228128B2/ja active Active
- 2012-12-28 AU AU2012360244A patent/AU2012360244B2/en active Active
- 2012-12-28 BR BR112014016112A patent/BR112014016112B8/pt active IP Right Grant
- 2012-12-28 CA CA2861808A patent/CA2861808C/en active Active
Non-Patent Citations (1)
Title |
---|
Nucleic Acids Res. 2004, 32(7): 2158-2170 |
Also Published As
Publication number | Publication date |
---|---|
CN104126018A (zh) | 2014-10-29 |
BR112014016112A2 (pt) | 2020-07-14 |
EP2798084B1 (en) | 2017-04-19 |
WO2013098562A2 (en) | 2013-07-04 |
EP2798084A2 (en) | 2014-11-05 |
JP2015503917A (ja) | 2015-02-05 |
CA2861808A1 (en) | 2013-07-04 |
BR112014016112B8 (pt) | 2022-12-27 |
CN104126018B (zh) | 2021-09-14 |
US20140335512A1 (en) | 2014-11-13 |
AU2012360244B2 (en) | 2018-08-23 |
BR112014016112B1 (pt) | 2022-05-24 |
KR20140108706A (ko) | 2014-09-12 |
US10385382B2 (en) | 2019-08-20 |
AU2012360244A1 (en) | 2014-07-24 |
WO2013098562A3 (en) | 2013-08-22 |
JP6228128B2 (ja) | 2017-11-08 |
CA2861808C (en) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102086182B1 (ko) | 효소 방법 | |
US20230212665A1 (en) | Enzyme stalling method | |
US11634763B2 (en) | Enzyme method | |
US20200239950A1 (en) | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores | |
US9617591B2 (en) | Method for characterising a polynucleotide by using a XPD helicase |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |