KR102643631B1

KR102643631B1 - 올리고뉴클레오티드의 신규 생성 방법

Info

Publication number: KR102643631B1
Application number: KR1020227022320A
Authority: KR
Inventors: 안드레아스 크라메리; 데이비드 그레이엄 튜
Original assignee: 글락소스미스클라인 인털렉츄얼 프로퍼티 디벨로프먼트 리미티드
Priority date: 2017-12-19
Filing date: 2018-12-17
Publication date: 2024-03-05
Also published as: CN118516431A; BR112020012252A2; WO2019121500A1; CN111479923A; ES2914591T3; KR20240033153A; GB201721307D0; EP3728585B1; KR20200099564A; EP3728585A1; JP2022109986A; DK3728585T3; EP4015631A1; US20240287566A1; JP2021507699A; CN111479923B; JP7065970B2; CA3085237A1; KR102417049B1; KR20220094219A

Abstract

본 발명은 효소를 사용하여 올리고뉴클레오티드를 생성하는 신규 방법에 관한 것이며, 여기서 상기 방법은 화학적으로 변형된 올리고뉴클레오티드, 예컨대 요법에 사용하기 위한 것의 생성에 사용하기에 적합하다.

Description

올리고뉴클레오티드의 신규 생성 방법 {NOVEL PROCESSES FOR THE PRODUCTION OF OLIGONUCLEOTIDES}

본 발명은 효소를 사용하여 올리고뉴클레오티드를 생성하는 신규 방법에 관한 것이며, 여기서 상기 방법은 화학적으로 변형된 올리고뉴클레오티드, 예컨대 요법에 사용하기 위한 화학적으로 변형된 올리고뉴클레오티드의 생성에 사용하기에 적합하다.

포스포르아미다이트 화학을 통한 올리고뉴클레오티드 및 변형된 올리고뉴클레오티드의 화학적 합성은 잘 확립되어 있으며, 수십년 동안 이들 정의된 서열 생체고분자를 합성하기 위한 선택된 방법이었다. 합성 공정은 통상적으로 고체상 합성으로서 실행되며, 여기서 단일 뉴클레오티드는 각각의 뉴클레오티드의 첨가와 함께 순차적으로 첨가되며, 이는 후속 단계를 위해 제조에서 성장하는 올리고뉴클레오티드 ("올리고")를 첨가하고 탈보호하기 위해 여러 화학적 단계의 사이클을 필요로 한다. 뉴클레오티드의 순차적 첨가 종료시, 올리고가 고체상 지지체로부터 방출되고, 추가 탈보호가 일어난 다음, 조질 올리고뉴클레오티드가 컬럼 크로마토그래피에 의해 추가로 정제된다.

이 방법은 일상적인 것으로 간주될 수 있고 자동화될 수 있지만, 특히 올리고뉴클레오티드 치료제를 위해 필요로 되는 대규모로 올리고뉴클레오티드를 제조하는 것이 목표인 경우, 이 방법에는 여러 단점이 있다. 이들 단점은 다음을 포함하나, 이에 제한되지는 않는다:

1) 크로마토그래피 사용에 내재된 실제적인 한계로 인해 대량의 올리고뉴클레오티드를 정제하는데 적합하지 않다. 대규모 크로마토그래피의 사용은 고가이고, 컬럼 크기 및 성능의 한계로 인해 성취하기 어렵다.

2) 합성되는 올리고뉴클레오티드의 길이에 따라 오류의 수가 누적된다. 따라서, 현재 공정의 선형 순차적 성질은 수율의 기하학적 저하를 초래한다. 예를 들어, 뉴클레오티드 첨가의 각각의 사이클에 대한 수율이 99%인 경우, 20 머의 수율은 83%일 것이다.

3) 합성 올리고뉴클레오티드 합성기 및 하류 정제 및 단리 장비에 대한 규모 제한: 현재는 단일 배치로 생성될 수 있는 생성물의 최대량은 대략 10 kg이다.

따라서, 컬럼 크로마토그래피를 감소시키고 (또는 이상적으로 제거하고) 또한 수율을 증가시키기 위해 순수하게 순차적이지 않은 방식으로 합성을 수행할 필요가 있다.

DNA 폴리머라제는 종종 분자 생물학 및 유사한 응용에 사용하기 위한 올리고뉴클레오티드를 합성하는데 사용된다. 그러나, DNA 폴리머라제는 상대적으로 짧은 길이의 올리고뉴클레오티드 및 상이한 데옥시리보스 또는 리보스 변형을 갖는 뉴클레오티드를 구별할 필요성 모두로 인해 치료용 올리고뉴클레오티드의 합성에 부적합하다. 예를 들어, 치료용 올리고뉴클레오티드는 종종 20 내지 25개 범위의 뉴클레오티드이다. DNA 폴리머라제는 각각의 방향으로 프라이머로서 적어도 7 또는 8개의 뉴클레오티드, 및 최적으로 18 내지 22개의 뉴클레오티드를 필요로 하므로, 프라이머가 목적 생성물과 크기가 유사한 경우 치료용 올리고를 합성하려는 시도가 거의 없다. 또한, DNA 폴리머라제는 모든 뉴클레오티드가 반응에 존재할 것을 요구하고, 들어오는 뉴클레오티드를 정렬하기 위해 왓슨-크릭 염기 쌍형성에 의존한다. 그러므로, DNA 폴리머라제는 데옥시리보스 또는 리보스 변형, 예컨대 갭머(gapmer)에 의해 요구되는 변형의 임의의 순서를 구별할 수 없고, 결과는 주어진 위치에서 데옥시리보스 또는 리보스 변형의 혼합일 것이다.

<발명의 요약>

본 발명은 적어도 하나의 변형된 뉴클레오티드 잔기를 갖는 단일-가닥 올리고뉴클레오티드 생성물의 생성 방법이며,

a) 생성물 서열의 절편을 포함하는 올리고뉴클레오티드 (I)의 풀을 제공하는 단계이며, 여기서 생성물 서열의 적어도 하나의 절편은 적어도 하나의 변형된 뉴클레오티드 잔기를 함유하고, 각각의 절편은 효소적 합성 또는 고체상 합성에 의해 생성된 것인 단계;

b) 단일-가닥 올리고뉴클레오티드 생성물의 서열과 상보적인 주형 올리고뉴클레오티드 (II)를 제공하는 단계이며, 상기 주형은 생성물로부터 분리되어 향후 반응에 사용하기 위해 재순환되는 것을 허용하는 특성을 갖는 것인 단계;

c) 주형 올리고뉴클레오티드로의 절편 올리고뉴클레오티드의 어닐링을 허용하는 조건에서 (I) 및 (II)를 접촉시키는 단계;

d) 리가제를 사용하여 절편 올리고뉴클레오티드를 연결하여 생성물을 형성하는 단계;

e) 어닐링된 주형 및 임의의 불순물 올리고뉴클레오티드 가닥을 변성시키기 위해 조건을 변화시키고, 불순물을 분리하는 단계;

f) 어닐링된 주형 및 생성물 올리고뉴클레오티드 가닥을 변성시키기 위해 조건을 변화시키고, 단일-가닥 올리고뉴클레오티드 생성물을 분리하는 단계; 및

g) 향후 반응에 사용하기 위해 주형 올리고뉴클레오티드를 재순환시키는 단계

를 포함하는 방법을 제공한다.

본 발명은 또한 이중-가닥 올리고뉴클레오티드 생성물의 생성 방법을 제공하며, 여기서 단일-가닥 올리고뉴클레오티드 생성물을 생성하기 위한 상기 언급된 방법에 의해 생성된 2개의 상보적 단일-가닥 올리고뉴클레오티드는 어닐링을 허용하는 조건 하에 혼합된다.

<도면의 설명>
도 1 절편 올리고뉴클레오티드의 효소적 생성의 개략도: a) 2-단계 반응: 첨가 및 탈보호를 포함하는 절편 합성을 위한 3'-연장. 예시적인 첨가 단계는 단일-가닥 핵산 프라이머의 3'-OH로의 뉴클레오티드-3',5'-비스(티오)포스페이트의 ATP 의존적 라이게이션 및 이어서 포스파타제에 의한 단일-가닥 올리고뉴클레오티드 상의 3'-포스페이트의 탈보호를 수반한다; 및 b) 절편 서열을 생성하기 위한 예시적인 3'-연장 (첨가 및 탈보호), 이어서 부위-특이적 뉴클레아제 (예를 들어, 엔도뉴클레아제 V - 이노신 후, 즉 이노신에 대해 3'에 있는 제2 포스포디에스테르 결합에서 1개의 염기를 절단함)를 사용한 쇄 절단에 의한 절편의 방출.
도 2 절편 올리고뉴클레오티드를 라이게이션하여 생성물을 형성하는 단계, 및 불순물을 제거하기 위해 조건을 변화시키는 단계를 포함하는 본 발명의 방법의 개략도.
도 3 다수의 주형 배열의 개략도.
도 4 플로우 시스템에서 수행되는 본 발명의 방법의 기본 개략도.
도 5 플로우 시스템에서 수행되는 본 발명의 방법의 상세한 개략도: a) 라이게이션 화학 섹션, b) 라이게이션 정제 섹션, 및 c) 대안적인 라이게이션 화학 섹션, 및 d) 대안적인 정제 섹션. N.B. 섹션 a) 및 b) (대안적으로 c) 및 d))는 단일 단계로 수행될 수 있다 (예를 들어, a)에서 수집 용기 = b)에서 라이게이션 단계로부터의 출력).
도 6 본 발명의 방법 동안 생성될 수 있는 불순물의 예.
도 7 상업용 NEB T4 리가제 (서열식별번호(SEQ ID NO):3) 및 비변형된 DNA (실시예 1)를 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 8 펄로자(PERLOZA) 결합된 T4 리가제 (서열식별번호: 4) 및 비변형된 DNA (실시예 1)를 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 9 실시예 2에 따라 발현된 펄로자 결합된 T4 리가제 및 2'-OMe 변형된 올리고뉴클레오티드 단편을 사용한 라이게이션 반응의 결과를 나타내는 크로마토그램.
도 10 실시예 4에 대한 HPLC 트레이스: 상부 트레이스 (a) - 리가제 대조군 없음. 하부 트레이스 (b) - 클론 A4. 생성물 및 주형은 이 HPLC 방법에서 공동-용리한다. 2개의 중간체 라이게이션 단편 (절편)은 10.3 및 11.2분에 클론 A4 트레이스에서 볼 수 있다.
도 11 "허브"로 지칭되는 지지체 물질 및 3개의 주형 서열을 포함하는, 실시예 13에서 사용된 "트리-주형 허브"의 개략도.
도 12 실시예 13에서 사용된 반연속적인 라이게이션 기구의 개략도.
도 13 실시예 14에서 사용된 데드-엔드 여과 기구의 개략도.
도 14 실시예 14에서 사용된 크로스-플로우 여과 기구의 개략도.
도 15 실시예 14에서 60℃에서 10 kDa MWCO NADIR 막을 사용한 데드-엔드 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 a)는 2개의 투석여과 부피 후 여과 셀에 남아있고 주로 트리-주형 허브를 함유한 체류물 용액의 크로마토그램이고; 크로마토그램 b)는 2개의 투석여과 부피 후 생성물이 풍부한 투과물 용액의 크로마토그램이다.
도 16 실시예 14에서 50℃ 및 3.0 bar 압력에서 5 kDa MWCO 스나이더(Snyder) 막을 사용한 크로스-플로우 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 a)는 20개의 투석여과 부피 후 주로 트리-주형 허브 및 생성물을 함유한 체류물 용액의 크로마토그램이고; 도 b)는 20개의 투석여과 부피 후 주로 절편 올리고뉴클레오티드를 함유한 투과물의 크로마토그램이다.
도 17 실시예 14에서 80℃ 및 3.1 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 크로스-플로우 여과 실험으로부터의 결과를 나타내는 크로마토그램. 도 17은 a) 20개의 투석여과 부피 후 트리-주형 허브만을 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물만을 함유한 투과물 용액의 크로마토그램을 나타낸다.

<발명의 상세한 설명>

<정의>

본원에서 사용된 바와 같은 용어 "올리고뉴클레오티드" 또는 생략하여 "올리고"는 뉴클레오티드 잔기의 중합체를 의미한다. 이들은 데옥시리보뉴클레오티드 (여기서, 생성된 올리고뉴클레오티드는 DNA임), 리보뉴클레오티드 (여기서, 생성된 올리고뉴클레오티드는 RNA임), 변형된 뉴클레오티드, 또는 이들의 혼합물일 수 있다. 올리고뉴클레오티드는 자연에서 발견되는 바와 같은 뉴클레오티드 잔기로 완전히 구성될 수 있거나, 변형된 적어도 하나의 뉴클레오티드, 또는 뉴클레오티드 사이의 적어도 하나의 연결을 함유할 수 있다. 올리고뉴클레오티드는 단일-가닥 또는 이중-가닥일 수 있다. 본 발명의 올리고뉴클레오티드는 또 다른 분자, 예를 들어 N-아세틸갈락토사민 (GalNAc) 또는 이들의 집합 (GalNAc 클러스터)에 접합될 수 있다.

본원에서 사용된 바와 같은 용어 "치료용 올리고뉴클레오티드"는 예를 들어 인간 또는 동물에서 상태 또는 질환의 예방 또는 치료에서 치료적 적용을 갖는 올리고뉴클레오티드를 의미한다. 이러한 올리고뉴클레오티드는 전형적으로 하나 이상의 변형된 뉴클레오티드 잔기 또는 연결을 함유한다. 치료용 올리고뉴클레오티드는 안티센스, 스플라이스-전환 또는 엑손-스키핑, 면역자극 및 RNA 간섭 (RNAi), 예를 들어 microRNA (miRNA) 및 작은 간섭 RNA (siRNA)를 포함하나 이에 제한되지는 않는 여러 상이한 메커니즘 중 하나를 통해 작용한다. 치료용 올리고뉴클레오티드는 아프타머일 수 있다. 치료용 올리고뉴클레오티드는 항상은 아니지만 일반적으로 정의된 서열을 가질 것이다.

본원에서 사용된 바와 같은 용어 "주형"은 표적 (또는 생성물) 올리고뉴클레오티드의 서열과 100% 상보적인 서열을 갖는 올리고뉴클레오티드를 의미한다.

달리 특정되지 않는 한, 본원에서 사용된 바와 같은 용어 "상보적"은 100% 상보적을 의미한다.

본원에서 사용된 바와 같은 용어 "생성물"은 본원에서 "표적 올리고뉴클레오티드"로도 지칭되는, 특정 서열을 갖는 목적 올리고뉴클레오티드를 의미한다.

본원에서 사용된 바와 같은 용어 "풀(pool)"은 서열이 다양할 수 있고, 표적 서열보다 짧거나 길 수 있고, 표적 서열과 동일한 서열을 갖지 않을 수 있는 올리고뉴클레오티드의 군을 지칭한다. 올리고뉴클레오티드의 풀은 올리고뉴클레오티드 합성, 예를 들어 정제와 함께 또는 정제 없이 사용되는 포스포르아미다이트 화학을 통한 고체상 화학적 합성 또는 효소적 합성의 생성물일 수 있다. 올리고뉴클레오티드의 풀은 표적 서열의 절편으로 구성될 수 있다. 각각의 절편 자체는 그 절편의 풀로서 존재할 수 있고, 올리고뉴클레오티드 합성, 예를 들어 포스포르아미다이트 화학을 통한 고체상 화학적 합성 또는 효소적 합성의 생성물일 수 있다.

본원에서 사용된 바와 같은 용어 "어닐링"은 서열 특이적 방식으로 상보적 올리고뉴클레오티드의 혼성화, 예를 들어 이중-가닥 올리고뉴클레오티드를 형성하기 위한 왓슨 및 크릭 염기-쌍형성의 수소 결합을 통한 2개의 단일-가닥 올리고뉴클레오티드의 쌍형성을 의미한다. "어닐링을 허용하는 조건"은 혼성화된 상보적 올리고뉴클레오티드의 T_m에 의존할 것이고, 관련 기술분야의 통상의 기술자에게 쉽게 명백할 것이다. 예를 들어, 어닐링을 위한 온도는 혼성화된 올리고뉴클레오티드의 T_m 미만일 수 있다. 대안적으로, 어닐링을 위한 온도는 혼성화된 올리고뉴클레오티드의 T_m에 근접할 수 있다 (예를 들어, +/- 1, 2 또는 3℃). 어닐링을 위한 온도는 일반적으로 혼성화된 올리고뉴클레오티드의 T_m보다 10℃ 더 높지 않다. 어닐링을 허용하는 특정 조건은 실시예 섹션에 요약되어 있는 바와 같다.

이중-가닥 올리고뉴클레오티드와 관련하여, 본원에서 사용된 바와 같은 용어 "변성"은 상보적 가닥이 더 이상 어닐링되지 않음, 즉 왓슨 및 크릭 염기-쌍형성이 파괴되고 가닥이 해리되었음을 의미하는데 사용된다. 변성은 조건의 변화, 예를 들어 온도의 상승, pH의 변화, 또는 완충 용액의 염 농도의 변화의 결과로서 일어난다. 변성을 위한 조건은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다. 본원에 기재된 바와 같은 이중-가닥 올리고뉴클레오티드 ("이중나선")를 변성시키면 단일-가닥 생성물 또는 불순물 올리고뉴클레오티드 및 단일-가닥 주형 올리고뉴클레오티드가 생성된다.

본원에서 사용된 바와 같은 용어 "불순물" 또는 "불순물들"은 목적 생성물 서열을 갖지 않는 올리고뉴클레오티드를 의미한다. 이들 올리고뉴클레오티드는 생성물보다 더 짧은 (예를 들어, 1, 2, 3, 4, 5개 이상의 뉴클레오티드 잔기가 더 짧은), 또는 생성물보다 더 긴 (예를 들어, 1, 2, 3, 4, 5개 이상의 뉴클레오티드 잔기가 더 긴) 올리고뉴클레오티드를 포함할 수 있다. 생성 방법이 절편 사이에 연결이 형성되는 단계를 포함하는 경우, 불순물은 하나 이상의 연결이 형성되지 않으면 남아있는 올리고뉴클레오티드를 포함한다. 불순물은 또한 부정확한 뉴클레오티드가 혼입된 올리고뉴클레오티드를 포함하며, 이는 주형과 비교하여 미스매치를 초래한다. 불순물은 상기 기재된 특징 중 하나 이상을 가질 수 있다. 도 6은 발생할 수 있는 일부 불순물을 나타낸다.

본원에서 사용된 바와 같은 용어 "절편"은 더 긴 올리고뉴클레오티드의 더 작은 부분, 특히 생성물 또는 표적 올리고뉴클레오티드의 더 작은 부분이다. 주어진 생성물에 대해, 그의 절편 모두가 그의 주형에 어닐링되고 함께 라이게이션되는 경우, 생성물이 형성된다.

본원에서 사용된 바와 같은 용어 "효소적 라이게이션"은 2개의 인접한 뉴클레오티드 사이의 연결이 효소적으로, 즉 효소에 의해 형성되는 것을 의미한다. 이 연결은 자연 발생 포스포디에스테르 결합 (PO), 또는 포스포로티오에이트 (PS) 또는 포스포르아미데이트 (PA)를 포함하나 이에 제한되지는 않는 변형된 연결일 수 있다.

본원에서 사용된 바와 같은 용어 "효소적 합성"은 효소, 예를 들어 리가제, 트랜스퍼라제, 포스파타제 및 뉴클레아제, 특히 엔도뉴클레아제를 사용한, 절편 및 최종 생성물을 포함하는 올리고뉴클레오티드의 생성을 의미한다. 이들 효소는 야생형 효소 또는 돌연변이체 효소일 수 있다. 변형된 뉴클레오티드 또는 올리고뉴클레오티드 기질에 작용할 수 있는 돌연변이체 효소는 본 발명의 범위 내에 포함된다.

본원에서 사용된 바와 같은 용어 "리가제"는 2개의 올리고뉴클레오티드 분자의 연결, 즉 공유결합적 연결을, 예를 들어 하나의 올리고뉴클레오티드 (또는 절편)의 3' 말단 및 동일한 또는 또 다른 올리고뉴클레오티드 (또는 절편)의 5' 말단 사이의 포스포디에스테르 결합의 형성에 의해 촉매하는 효소를 의미한다. 이들 효소는 종종 DNA 리가제 또는 RNA 리가제로 지칭되며, 보조인자: ATP (진핵생물, 바이러스 및 고세균 DNA 리가제) 또는 NAD (원핵생물 DNA 리가제)를 사용한다. 모든 유기체에서 발생함에도 불구하고, DNA 리가제는 아미노산 서열, 분자 크기 및 특성의 광범위한 다양성을 나타낸다 (Nucleic Acids Research, 2000, Vol. 28, No. 21, 4051-4058). 이들은 통상적으로 국제 생화학 분자 생물학 연합에 의해 정의된 바와 같은 효소 클래스 EC 6.5의 구성원, 즉 인산 에스테르 결합을 형성하는데 사용되는 리가제이다. 비변형된 올리고뉴클레오티드를 또 다른 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 리가제, 비변형된 올리고뉴클레오티드를 변형된 올리고뉴클레오티드에 (즉, 변형된 5' 올리고뉴클레오티드를 비변형된 3' 올리고뉴클레오티드에, 및/또는 비변형된 5' 올리고뉴클레오티드를 변형된 3' 올리고뉴클레오티드에) 연결시킬 수 있는 리가제, 뿐만 아니라 변형된 올리고뉴클레오티드를 또 다른 변형된 올리고뉴클레오티드에 연결시킬 수 있는 리가제는 본 발명의 범위 내에 포함된다.

본원에서 사용된 바와 같은 용어 "단일-가닥 리가제" 또는 "ss리가제"는 (i) 단일-가닥 수용자 RNA 가닥의 3'-OH로의 5'-인산화된 단일-가닥 RNA의 ATP-의존적 라이게이션 및 (ii) RNA 또는 변형된 올리고뉴클레오티드의 3' 말단으로의 단일 잔기 (변형된 잔기 포함), 예를 들어 뉴클레오티드-3',5'-비스포스페이트, 3',5'-티오비스포스페이트 또는 3'-포스페이트-5' 티오포스페이트의 라이게이션을 촉매할 수 있는 효소, 예를 들어 RNA 리가제를 의미한다 (Modified Oligoribonucleotides: 17 (11), 2077-2081, 1978). ss리가제의 예는 T4 RNA 리가제이며, 이는 또한 특정 조건 하에 DNA 기질에 작용하는 것으로 나타났다 (Nucleic Acids research 7(2), 453-464, 1979). T4 박테리오파지로 감염된 에스케리키아 콜라이(Escherichia coli)에서 T4 RNA 리가제의 자연적 기능은 바이러스 공격에 대한 박테리아 방어 메커니즘에 의해 야기되는 박테리아 tRNA에 대한 단일-가닥 파단을 복구하는 것이다. 비변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제, 비변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제, 변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제, 뿐만 아니라 변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 ss리가제는 본 발명의 범위 내에 포함된다. 본 발명에 따른 ss리가제는 라이게이션 발생을 위해 주형 올리고뉴클레오티드를 필요로 하지 않는 리가제이며, 즉 리가제의 라이게이션 활성은 주형-독립적이다.

본원에서 사용된 바와 같은 "열안정한 리가제"는 상승된 온도에서, 즉 인간 체온 초과, 즉 37℃ 초과에서 활성인 리가제이다. 열안정한 리가제는 예를 들어, 40℃ - 65℃; 또는 40℃ - 90℃ 등에서 활성일 수 있다.

본원에서 사용된 바와 같은 "트랜스퍼라제"는 하나의 뉴클레오티드의 또 다른 뉴클레오티드 또는 올리고뉴클레오티드로의 주형 독립적 연결을 촉매하는 효소를 의미한다. 본원에 기재된 바와 같은 트랜스퍼라제는 DNA 뉴클레오티딜엑소트랜스퍼라제 (DNTT) 또는 말단 트랜스퍼라제로도 공지된 말단 뉴클레오티딜 트랜스퍼라제 (TdT)를 포함한다. TdT는 V-D-J 항체 유전자 접합부 다양성을 가능하게 하는 미성숙, 프리-B, 프리-T-림프계 세포에서 발현되는 전문화된 DNA 폴리머라제이다. TdT는 DNA 분자의 3' 말단으로의 뉴클레오티드의 첨가를 촉매한다. 본원에 기재된 바와 같은 트랜스퍼라제는 비자연 발생 또는 돌연변이체 TdT를 포함한다. 비변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제, 비변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제, 변형된 뉴클레오티드를 비변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제, 뿐만 아니라 변형된 뉴클레오티드를 변형된 올리고뉴클레오티드에 연결시킬 수 있는 트랜스퍼라제는 본 발명의 범위 내에 포함된다.

본원에서 사용된 바와 같은 용어 "포스파타제"는 포스포에스테르의 가수분해를 촉매하여 알콜을 생성하는 효소를 의미한다. 알칼리성 포스파타제는 DNA 및 RNA (및 변형된 올리고뉴클레오티드)의 5' 및 3' 말단의 탈인산화를 비특이적으로 촉매하고, 또한 뉴클레오티드 트리포스페이트 (NTP 및 dNTP)를 가수분해시키고, 알칼리성 pH 환경에서 최적으로 활성이다.

본원에서 사용된 바와 같은 용어 "서열-특이적 엔도뉴클레아제" 또는 "부위-특이적 엔도뉴클레아제"는 상호교환적으로 사용되고, 특정 위치에서 단일-가닥 올리고뉴클레오티드를 특이적으로 절단하는 뉴클레아제를 의미한다. 예를 들어, 엔도뉴클레아제 V는 이노신 후 1개의 염기, 즉 이노신에 대해 3'에 있는 제2 포스포디에스테르 결합에서 RNA를 절단한다. 부위-특이적 엔도뉴클레아제의 다른 예는 메가뉴클레아제, 아연 핑거 뉴클레아제, TALEN 및 Cas9의 패밀리를 포함한다.

본원에서 사용된 바와 같은 용어 "프라이머"는 본 발명의 절편 올리고뉴클레오티드를 합성하기 위한 출발점으로서 사용되는 올리고뉴클레오티드 서열을 의미한다. 프라이머는 적어도 3개의 뉴클레오티드를 포함하고, 지지체 물질에 부착될 수 있다.

본원에서 사용된 바와 같은 용어 "변형된 뉴클레오티드 잔기" 또는 "변형된 올리고뉴클레오티드"는 자연 발생 뉴클레오티드 잔기 또는 올리고뉴클레오티드와 상이한 그의 화학의 적어도 하나의 측면을 함유하는 뉴클레오티드 잔기 또는 올리고뉴클레오티드를 의미한다. 이러한 변형은 뉴클레오티드 잔기의 임의의 부분, 예를 들어 당, 염기 또는 포스페이트에서 발생할 수 있다. 뉴클레오티드의 변형의 예는 하기 개시되어 있다.

본원에서 사용된 바와 같은 용어 "변형된 리가제"는 하나 이상의 아미노산 잔기만큼 자연 발생 "야생형" 리가제와 상이한 리가제를 의미한다. 이러한 리가제는 자연에서 발견되지 않는다. 이러한 리가제는 본 발명의 신규 방법에 유용하다. 변형된 리가제의 예는 하기 개시되어 있다. 용어 "변형된 리가제" 및 "돌연변이체 리가제"는 상호교환적으로 사용된다.

본원에서 사용된 바와 같은 용어 "변형된 트랜스퍼라제"는 하나 이상의 아미노산 잔기만큼 자연 발생 "야생형" 트랜스퍼라제와 상이한 트랜스퍼라제를 의미한다. 이러한 트랜스퍼라제는 자연에서 발견되지 않는다. 이러한 트랜스퍼라제는 본 발명의 신규 방법에 유용하다. 용어 "변형된 트랜스퍼라제" 및 "돌연변이체 트랜스퍼라제"는 상호교환적으로 사용된다.

본원에서 사용된 바와 같은 용어 "갭머"는 2개의 외부 "윙 절편"에 의해 플랭킹된 내부 "갭 절편"을 갖는 올리고뉴클레오티드를 의미하며, 여기서 갭 절편은 RNase H 절단을 지지하는 다수의 뉴클레오티드로 이루어지고, 각각의 윙 절편은 갭 절편 내 뉴클레오티드와 화학적으로 구별되는 하나 이상의 뉴클레오티드로 이루어진다.

본원에서 사용된 바와 같은 용어 "지지체 물질"은 올리고뉴클레오티드, 예를 들어 주형 또는 프라이머의 분자량을 증가시켜, 예를 들어 불순물 및 생성물이 반응 혼합물로부터 분리될 때 이에 의해 유지되는 것을 허용하는 고분자량 화합물 또는 물질을 의미한다.

본원에서 사용된 바와 같은, 의문 핵산 서열 및 대상 핵산 서열 사이의 "동일성 백분율"은 쌍별 BLASTN 정렬이 수행된 후 대상 핵산 서열이 의문 핵산 서열과 100% 의문 포함을 갖는 경우 BLASTN 알고리즘에 의해 계산된 백분율로 표현된 "동일성" 값이다. 의문 핵산 서열 및 대상 핵산 서열 사이의 이러한 쌍별 BLASTN 정렬은 낮은 복잡성 영역에 대한 필터를 끈 상태에서 미국 국립생물공학정보센터(National Center for Biotechnology Institute)의 웹사이트에서 이용가능한 BLASTN 알고리즘의 디폴트 설정을 사용하여 수행된다. 중요하게는, 의문 핵산 서열은 본원의 하나 이상의 청구항에서 확인된 핵산 서열에 의해 기재될 수 있다. 의문 서열은 대상 서열과 100% 동일할 수 있거나, 또는 동일성 %가 100% 미만이 되도록 대상 서열과 비교하여 특정 정수까지의 뉴클레오티드 변경을 포함할 수 있다. 예를 들어, 의문 서열은 대상 서열과 적어도 80, 85, 90, 95, 96, 97, 98, 또는 99% 동일하다.

<발명의 진술>

본 발명의 한 측면에서, 적어도 하나의 변형된 뉴클레오티드 잔기를 갖는 단일-가닥 올리고뉴클레오티드 생성물의 생성 방법이며,

를 포함하는 방법이 제공된다.

본 발명의 한 실시양태에서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드는 효소적으로 생성된다.

본 발명의 한 실시양태에서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드는 단일-가닥 리가제 (ss리가제)를 사용하여 생성된다. 한 실시양태에서, ss리가제는 RNA 리가제이다. 한 실시양태에서, ss리가제는 T4 RNA 리가제 또는 변형된 T4 RNA 리가제이다.

또 다른 실시양태에서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은

(i) 3' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티 및 5' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티를 갖는, 뉴클레오티드, 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드를 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 단계;

(ii) 포스파타제를 사용하여 3'-포스페이트 모이어티, 3'-티오포스페이트 모이어티 또는 3' 디티오포스페이트 모이어티를 제거하는 단계;

(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계: 및

(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계

를 포함한다.

본 발명의 한 실시양태에서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은 황으로 치환된 포스페이트 산소 중 하나 이상을 갖는 3',5' 뉴클레오티드 비스포스페이트를 단계 (i)에서 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 것을 포함한다.

본 발명의 한 실시양태에서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은 3',5' 뉴클레오티드 비스포스페이트, 3',5' 뉴클레오티드 티오포스페이트 (예를 들어, 3',5' 비스티오포스페이트 또는 3'-포스페이트-5'-티오포스페이트 또는 3'-티오포스페이트-5'-포스페이트) 또는 3',5' 뉴클레오티드 디티오포스페이트 (예를 들어, 3',5' 비스디티오포스페이트 또는 3'-포스페이트-5'-디티오포스페이트 또는 3'-디티오포스페이트-5'-포스페이트)를 단계 (i)에서 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 것을 포함한다.

본 발명의 한 실시양태에서, 하나 이상의 절편 올리고뉴클레오티드는 트랜스퍼라제를 사용하여 생성된다. 본 발명의 한 실시양태에서, 트랜스퍼라제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법은

(i) 3'-OH 상에 보호기를 갖는, 뉴클레오티드-5'-트리포스페이트, 알파-티오트리포스페이트 또는 알파디티오트리포스페이트를 트랜스퍼라제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 첨가하는 단계;

(ii) 3'-OH를 재생시키기 위해 3'-위치를 탈보호하는 단계;

(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계;

를 포함한다.

본 발명의 한 실시양태에서, 각각의 절편은 효소적 합성에 의해 생성된다. 본 발명의 한 실시양태에서, 각각의 절편은 ss리가제를 사용하여 생성된다. 본 발명의 한 실시양태에서, 각각의 절편은 트랜스퍼라제를 사용하여 생성된다.

ss리가제, 예를 들어 RNA 리가제, 트랜스퍼라제, 또는 단일 뉴클레오티드를 단일-가닥 올리고뉴클레오티드에 첨가할 수 있는 임의의 다른 효소를 주형 독립적 방식으로 사용하는 것은 정의된 서열을 갖는 올리고뉴클레오티드의 합성을 허용한다. 이러한 접근법은 단일 염기를 반복적으로 첨가함으로써 전체 올리고뉴클레오티드 생성물을 생성하는데 사용될 수 있다. 그러나, 각각의 합성 사이클이 100% 수율로 실행되지 않으면, 서열 결실 오류가 최종 생성물에 혼입될 것이다. 예를 들어, 올리고뉴클레오티드가 합성 사이클에서 99% 수율로 하나의 뉴클레오티드만큼 연장되는 경우, 나머지 1%는 후속적 합성 사이클에서 반응하는데 이용가능하지만, 형성되는 생성물은 목적 생성물보다 1개 뉴클레오티드 더 짧을 것이다. 사이클의 수가 증가함에 따라, 오류율이 복합되므로, 이 예에서, 99% 사이클 수율은 20머의 생성을 위한 단일 염기 단축된 서열의 20%의 형성을 유발할 것이다.

본 발명에 따라, 오류의 순차적 누적은 다음에 의해 회피된다. 먼저, 오직 짧은 서열, 전형적으로 5 내지 8개의 뉴클레오티드 길이가 단일 뉴클레오티드의 첨가에 의해 합성된다. 이 방법은 오류 누적의 더 적은 사이클에 노출되므로 긴 서열보다 더 고순도를 갖는 짧은 서열을 야기한다. 둘째, 이들 짧은 서열이 상보적 DNA 주형 상에 어셈블리된 후, 함께 연결된다. 리가제와 함께 상보적 주형을 사용하면, 정확한 길이 및 정확한 서열 둘 모두를 갖는 짧은 올리고뉴클레오티드만이 어셈블리되는 것이 보장된다. 따라서, 본 발명의 방법은 더 높은 총괄 수율 및, 중요하게는 더 높은 총괄 서열 충실도 모두를 야기한다.

본 발명의 한 실시양태는 본원에 앞서 기재된 바와 같은 방법을 제공하며, 여기서 주형 및 불순물 이중나선의 변성 및/또는 주형 및 생성물 이중나선의 변성은 온도 증가로부터 발생한다. 한 실시양태에서, 변성은 pH 변화의 결과로서 발생한다. 추가 실시양태에서, 변성은 완충 용액 중 염 농도를 변화시킴으로써 발생한다.

본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 절편 올리고뉴클레오티드는 3 내지 15개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 절편은 5 내지 10개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 절편은 5 내지 8개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 절편은 4, 5, 6, 7 또는 8개의 뉴클레오티드 길이이다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 7개의 뉴클레오티드 길이인 5' 절편, 6개의 뉴클레오티드 길이인 중심 절편 및 7개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 6개의 뉴클레오티드 길이인 5' 절편, 8개의 뉴클레오티드 길이인 중심 절편 및 6개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 5개의 뉴클레오티드 길이인 5' 절편, 10개의 뉴클레오티드 길이인 중심 절편 및 5개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 3개의 절편 올리고뉴클레오티드가 존재한다: 4개의 뉴클레오티드 길이인 5' 절편, 12개의 뉴클레오티드 길이인 중심 절편 및 4개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다. 특정 실시양태에서, 4개의 절편 올리고뉴클레오티드가 존재한다: 5개의 뉴클레오티드 길이인 5' 절편, 5개의 뉴클레오티드 길이인 5'-중심 절편, 5개의 뉴클레오티드 길이인 중심-3' 절편, 및 5개의 뉴클레오티드 길이인 3' 절편, 이는 함께 라이게이션될 때 20개의 뉴클레오티드 길이 ("20-머")인 올리고뉴클레오티드를 형성한다.

본 발명의 한 실시양태는 본원에 앞서 기재된 바와 같은 방법을 제공하며, 여기서 생성물은 10 내지 200개의 뉴클레오티드 길이이다. 본 발명의 추가 실시양태에서, 생성물은 15 내지 30개의 뉴클레오티드 길이이다. 본 발명의 한 실시양태에서, 생성물은 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 뉴클레오티드 길이이다. 본 발명의 한 실시양태에서, 생성물은 20개의 뉴클레오티드 길이, "20-머"이다. 본 발명의 한 실시양태에서, 생성물은 21개의 뉴클레오티드 길이, "21-머"이다. 본 발명의 한 실시양태에서, 생성물은 22개의 뉴클레오티드 길이, "22-머"이다. 본 발명의 한 실시양태에서, 생성물은 23개의 뉴클레오티드 길이, "23-머"이다. 본 발명의 한 실시양태에서, 생성물은 24개의 뉴클레오티드 길이, "24-머"이다. 본 발명의 한 실시양태에서, 생성물은 25개의 뉴클레오티드 길이, "25-머"이다. 본 발명의 한 실시양태에서, 생성물은 26개의 뉴클레오티드 길이, "26-머"이다. 본 발명의 한 실시양태에서, 생성물은 27개의 뉴클레오티드 길이, "27-머"이다. 본 발명의 한 실시양태에서, 생성물은 28개의 뉴클레오티드 길이, "28-머"이다. 본 발명의 한 실시양태에서, 생성물은 29개의 뉴클레오티드 길이, "29-머"이다. 본 발명의 한 실시양태에서, 생성물은 30개의 뉴클레오티드 길이, "30-머"이다.

본 발명의 한 실시양태에서, 방법은 치료용 올리고뉴클레오티드를 생성하는 방법이다. 본 발명의 한 실시양태에서, 방법은 단일-가닥 치료용 올리고뉴클레오티드를 생성하는 방법이다. 본 발명의 한 실시양태에서, 방법은 이중-가닥 치료용 올리고뉴클레오티드를 생성하는 방법이다.

본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형이 생성물로부터 분리되는 것을 허용하는 특성은 주형이 지지체 물질에 부착된 것이다. 본 발명의 추가 실시양태에서, 지지체 물질은 가용성 지지체 물질이다. 본 발명의 또 다른 추가 실시양태에서, 가용성 지지체 물질은 폴리에틸렌 글리콜, 가용성 유기 중합체, DNA, 단백질, 덴드리머, 다당류, 올리고당 및 탄수화물로 이루어진 군으로부터 선택된다. 본 발명의 한 실시양태에서, 지지체 물질은 폴리에틸렌 글리콜 (PEG)이다. 본 발명의 추가 실시양태에서, 지지체 물질은 불용성 지지체 물질이다. 본 발명의 추가 실시양태에서, 지지체 물질은 고체 지지체 물질이다. 또 다른 추가 실시양태에서, 고체 지지체 물질은 유리 비드, 중합체 비드, 섬유질 지지체, 막, 스트렙타비딘 코팅된 비드 및 셀룰로스로 이루어진 군으로부터 선택된다. 한 실시양태에서, 고체 지지체 물질은 스트렙타비딘 코팅된 비드이다. 추가 실시양태에서, 고체 지지체 물질은 반응 용기 자체의 일부, 예를 들어 반응 벽이다.

본 발명의 한 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형의 다수의 반복된 카피는 연속적인 방식으로 단일 부착점을 통해 지지체 물질에 부착된다. 주형의 다수의 반복된 카피는 예를 들어 도 3에 나타낸 바와 같이 링커에 의해 분리될 수 있다. 주형의 다수의 반복된 카피는 직접 반복부일 수 있으며, 즉 이는 링커에 의해 분리되지 않는다.

본 발명의 또 다른 실시양태에서, 주형은 다수의 부착점에서 지지체 물질에 부착된다.

본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형이 생성물로부터 분리되는 것을 허용하는 특성은 주형의 분자량이다. 예를 들어, 주형 서열의 반복된 카피는 링커 서열과 함께 또는 링커 서열 없이 단일 올리고뉴클레오티드 상에 존재할 수 있다.

본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 주형, 또는 주형 및 지지체 물질은 예를 들어 하기 상세히 설명된 바와 같이 향후 반응에 사용하기 위해 재순환된다. 본 발명의 또 다른 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 반응은 예를 들어 도 4 또는 도 5에 나타낸 바와 같이 연속적인 또는 반연속적인 유동 공정을 사용하여 수행된다.

본 발명의 한 실시양태에서, 방법은 올리고뉴클레오티드, 특히 치료용 올리고뉴클레오티드의 대규모 제조를 위한 것이다. 본 발명의 맥락에서, 올리고뉴클레오티드의 대규모 제조는 1 리터 이상의 규모로 제조하는 것을 의미하며, 예를 들어 방법은 1 L 이상의 반응기에서 수행된다. 대안적으로 또는 추가로, 본 발명의 맥락에서, 올리고뉴클레오티드의 대규모 제조는 생성물을 그램 규모로 제조하는 것, 특히 10 그램 이상의 생성물을 생성하는 것을 의미한다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 그램 규모이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100 그램 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950 그램 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 500 그램 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물은 킬로그램 규모이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 1 kg 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 kg 이상이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드 생성물의 양은 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100 kg 이상이다.

본 발명의 한 실시양태에서, 생성된 생성물의 양은 10 그램 내지 100 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 10 그램 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 100 그램 내지 100 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 100 그램 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 500 그램 내지 100 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 500 그램 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 1 kg 내지 50 kg이다. 본 발명의 한 실시양태에서, 생성된 생성물의 양은 10 kg 내지 50 kg이다.

본 발명의 한 실시양태에서, 올리고뉴클레오티드 제조는 2, 3, 4, 5, 6, 7, 8, 9, 10 리터 이상의 규모로, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9 또는 10 L 반응기에서 일어난다. 본 발명의 한 실시양태에서, 올리고뉴클레오티드 제조는 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 리터 이상의 규모로, 예를 들어 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 L 반응기에서 일어난다. 본 발명의 한 실시양태에서, 올리고뉴클레오티드 제조는 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 리터 이상의 규모로, 예를 들어 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 L 반응기에서 일어난다.

본 발명의 한 실시양태에서, 반응기 부피는 약 10,000 L, 약 5000 L, 약 2000 L, 약 1000 L, 약 500 L, 약 125 L, 약 50 L, 약 20 L, 약 10 L, 또는 약 5 L이다.

본 발명의 한 실시양태에서, 반응기 부피는 5 내지 10,000 L, 10 내지 5000 L, 20 내지 2000 L, 또는 50 내지 1000 L이다.

본 발명에 따른 올리고뉴클레오티드는 RNA 또는 DNA-기반 올리고뉴클레오티드와 비교하여 적어도 하나의 백본 변형, 및/또는 적어도 하나의 당 변형, 및/또는 적어도 하나의 염기 변형을 가질 수 있다.

본 발명의 한 실시양태에서, 하나 이상의 절편 올리고뉴클레오티드는 RNA 또는 DNA-기반 올리고뉴클레오티드와 비교하여 적어도 하나의 백본 변형, 및/또는 적어도 하나의 당 변형, 및/또는 적어도 하나의 염기 변형을 갖는다. 한 실시양태에서, 모든 절편 올리고뉴클레오티드는 적어도 하나의 백본 변형을 갖는다. 한 실시양태에서, 절편 중 적어도 하나는 완전히 변형된 백본을 갖는다. 본 발명의 한 실시양태에서, 모든 절편은 완전히 변형된 백본을 갖는다. 한 실시양태에서, 모든 절편 올리고뉴클레오티드의 백본은 포스포로티오에이트 연결로 이루어진다. 한 실시양태에서, 절편 중 2개 이상은 RNA 또는 DNA-기반 올리고뉴클레오티드와 비교하여 적어도 하나의 당 변형 및/또는 적어도 하나의 염기 변형을 갖는다. 한 실시양태에서, "윙" 절편은 적어도 하나의 당 변형을 포함한다. 한 실시양태에서, "윙" 절편은 변형된 당으로 완전히 이루어진다. 한 실시양태에서, "윙" 절편은 2'-MOE-변형된 당으로 완전히 이루어진다.

본 발명의 한 실시양태는 본원에 앞서 개시된 바와 같은 방법을 제공하며, 여기서 생성물은 적어도 1개의 변형된 뉴클레오티드 잔기를 함유한다. 추가 실시양태에서, 변형은 당 모이어티의 2' 위치에 있다.

본 발명의 방법에 사용된 올리고뉴클레오티드는 당 변형, 즉 리보실 모이어티의 변형된 버전, 예컨대 2'-O-변형된 RNA, 예컨대 2'-O-알킬 또는 2'-O-(치환된)알킬, 예를 들어 2'-O-메틸, 2'-O-(2-시아노에틸), 2'-O-(2-메톡시)에틸 (2'-MOE), 2'-O-(2-티오메틸)에틸, 2'-O-부티릴, 2'-O-프로파르길, 2'-O-알릴, 2'-O-(3-아미노)프로필, 2'-O-(3-(디메틸아미노)프로필), 2'-O-(2-아미노)에틸, 2'-O-(2-(디메틸아미노)에틸); 2'-데옥시 (DNA); 2'-O-(할로알콕시)메틸 (Arai K. et al. Bioorg. Med. Chem. 2011, 21, 6285), 예를 들어 2'-O-(2-클로로에톡시)메틸 (MCEM), 2'-O-(2, 2-디클로로에톡시)메틸 (DCEM); 2'-O- 알콕시카르보닐, 예를 들어 2'-O-[2-(메톡시카르보닐)에틸] (MOCE), 2'-O-[2-(N-메틸카르바모일)에틸] (MCE), 2'-O-[2-(N, N-디메틸카르바모일)에틸] (DCME); 2'-할로, 예를 들어 2'-F, FANA (2'-F 아라비노실 핵산); 카르바슈가 및 아자슈가 변형; 3'-O-알킬, 예를 들어 3'-O-메틸, 3'-O-부티릴, 3'-0-프로파르길; 및 이들의 유도체를 포함할 수 있다.

본 발명의 한 실시양태에서, 당 변형은 2'-플루오로 (2'-F), 2'-O-메틸 (2'-OMe), 2'-O-메톡시에틸 (2'-MOE), 및 2'-아미노로 이루어진 군으로부터 선택된다. 또 다른 추가 실시양태에서, 변형은 2'-MOE이다.

다른 당 변형은 "브릿지(bridged)" 또는 "이환식(bicyclic)" 핵산 (BNA), 예를 들어 잠금 핵산 (LNA), 크실로-LNA, α-L-LNA, β-D-LNA, cEt (2'-O,4'-C 구속된 에틸) LNA, cMOEt (2'-O,4'-C 구속된 메톡시에틸) LNA, 에틸렌-브릿지 핵산 (ENA), 트리시클로 DNA; 비잠금 핵산 (UNA); 시클로헥세닐 핵산 (CeNA), 알트리올 핵산 (ANA), 헥시톨 핵산 (HNA), 플루오린화 HNA (F-HNA), 피라노실-RNA (p-RNA), 3'-데옥시피라노실-DNA (p-DNA); 모르폴리노 (예를 들어, PMO, PPMO, PMOPlus, PMO-X에서); 및 이들의 유도체를 포함한다.

본 발명의 방법에 사용된 올리고뉴클레오티드는 다른 변형, 예컨대 펩티드-기반 핵산 (PNA), 붕소 변형된 PNA, 피롤리딘-기반 옥시-펩티드 핵산 (POPNA), 글리콜- 또는 글리세롤-기반 핵산 (GNA), 트레오스-기반 핵산 (TNA), 비환식 트레오니놀-기반 핵산 (aTNA), 통합된 염기 및 백본을 갖는 올리고뉴클레오티드 (ONIB), 피롤리딘-아미드 올리고뉴클레오티드 (POM); 및 이들의 유도체를 포함할 수 있다.

본 발명의 한 실시양태에서, 변형된 올리고뉴클레오티드는 포스포로디아미데이트 모르폴리노 올리고머 (PMO), 잠금 핵산 (LNA), 펩티드 핵산 (PNA), 브릿지 핵산 (BNA), 예컨대 (S)-cEt-BNA, 또는 SPIEGELMER를 포함한다.

추가 실시양태에서, 변형은 핵염기에 있다. 염기 변형은 자연 퓨린 및 피리미딘 염기 (예를 들어, 아데닌, 우라실, 구아닌, 시토신, 및 티민)의 변형된 버전, 예컨대 이노신, 히포크산틴, 오로트산, 아그마티딘, 리시딘, 2-티오피리미딘 (예를 들어, 2-티오우라실, 2-티오티민), G-클램프 및 그의 유도체, 5-치환된 피리미딘 (예를 들어, 5-메틸시토신, 5-메틸우라실, 5-할로우라실, 5-프로피닐우라실, 5-프로피닐시토신, 5-아미노메틸우라실, 5-히드록시메틸우라실, 5-아미노메틸시토신, 5-히드록시메틸시토신, 수퍼 T), 2,6-디아미노퓨린, 7-데아자구아닌, 7-데아자아데닌, 7-아자-2, 6-디아미노퓨린, 8-아자-7-데아자구아닌, 8-아자-7-데아자아데닌, 8-아자-7-데아자-2, 6-디아미노퓨린, 수퍼 G, 수퍼 A, 및 N4- 에틸시토신, 또는 그의 유도체; N²-시클로펜틸구아닌 (cPent-G), N²-시클로펜틸-2-아미노퓨린 (cPent-AP), 및 N²-프로필-2-아미노퓨린 (Pr-AP), 또는 그의 유도체; 및 축퇴 또는 범용 염기, 예컨대 2,6-디플루오로톨루엔 또는 결여 염기, 예컨대 비염기성 부위 (예를 들어, 1-데옥시리보스, 1,2-디데옥시리보스, 1-데옥시-2-O-메틸리보스; 또는 고리 산소가 질소로 대체된 피롤리딘 유도체 (아자리보스))를 포함한다. 수퍼 A, 수퍼 G 및 수퍼 T의 유도체의 예는 US6683173에서 찾을 수 있다. cPent-G, cPent-AP 및 Pr-AP는 siRNA에 혼입될 때 면역자극 효과를 감소시키는 것으로 나타났다 (Peacock H. et al. J. Am. Chem. Soc. (2011), 133, 9200).

본 발명의 한 실시양태에서, 핵염기 변형은 5-메틸 피리미딘, 7-데아자구아노신 및 비염기성 뉴클레오티드로 이루어진 군으로부터 선택된다. 한 실시양태에서, 변형은 5-메틸 시토신이다.

본 발명의 방법에 사용된 올리고뉴클레오티드는 백본 변형, 예를 들어 RNA에 존재하는 포스포디에스테르의 변형된 버전, 예컨대 포스포로티오에이트 (PS), 포스포로디티오에이트 (PS2), 포스포노아세테이트 (PACE), 포스포노아세트아미드 (PACA), 티오포스포노아세테이트, 티오포스포노아세트아미드, 포스포로티오에이트 프로드러그, H-포스포네이트, 메틸 포스포네이트, 메틸 포스포노티오에이트, 메틸 포스페이트, 메틸 포스포로티오에이트, 에틸 포스페이트, 에틸 포스포로티오에이트, 보라노포스페이트, 보라노포스포로티오에이트, 메틸 보라노포스페이트, 메틸 보라노포스포로티오에이트, 메틸 보라노포스포네이트, 메틸보라노포스포노티오에이트, 및 이들의 유도체를 포함할 수 있다. 또 다른 변형은 포스포르아미다이트, 포스포르아미데이트, N3'→P5' 포스포르아미데이트, 포스포르디아미데이트, 포스포로티오디아미데이트, 술파메이트, 디메틸렌술폭사이드, 술포네이트, 트리아졸, 옥살릴, 카르바메이트, 메틸렌이미노 (MMI), 및 티오아세트아미도 핵산 (TANA); 및 이들의 유도체를 포함한다.

추가 실시양태에서, 변형은 백본에 있고, 포스포로티오에이트 (PS), 포스포르아미데이트 (PA) 및 포스포로디아미데이트로 이루어진 군으로부터 선택된다. 본 발명의 한 실시양태에서, 변형된 올리고뉴클레오티드는 포스포로디아미데이트 모르폴리노 올리고머 (PMO)이다. PMO는 포스포로디아미데이트 연결을 갖는 메틸렌모르폴린 고리의 백본을 갖는다. 본 발명의 한 실시양태에서, 생성물은 포스포로티오에이트 (PS) 백본을 갖는다.

본 발명의 한 실시양태에서, 올리고뉴클레오티드는 상기 개시된 바와 같은 2개 이상의 변형의 조합을 포함한다. 관련 기술분야의 통상의 기술자는 올리고뉴클레오티드의 많은 합성 유도체가 있음을 이해할 것이다.

본 발명의 한 실시양태에서, 생성물은 갭머이다. 본 발명의 한 실시양태에서, 윙 절편은 백본 및 당 변형을 포함하고, 중심 또는 '갭' 절편은 백본 변형을 포함하나 당 변형은 포함하지 않는다. 본 발명의 한 실시양태에서, 갭머의 5' 및 3' 윙은 2'-MOE 변형된 뉴클레오티드를 포함하거나 이로 이루어진다. 본 발명의 한 실시양태에서, 갭머의 갭 절편은 당 모이어티의 2' 위치에 수소를 함유하는 뉴클레오티드, 즉 DNA-유사를 포함하거나 이로 이루어진다. 본 발명의 한 실시양태에서, 갭머의 5' 및 3' 윙은 2'MOE 변형된 뉴클레오티드로 이루어지고, 갭머의 갭 절편은 당 모이어티의 2' 위치에 수소를 함유하는 뉴클레오티드 (즉, 데옥시뉴클레오티드)로 이루어진다. 본 발명의 한 실시양태에서, 갭머의 5' 및 3' 윙은 2'MOE 변형된 뉴클레오티드로 이루어지고, 갭머의 갭 절편은 당 모이어티의 2' 위치에 수소를 함유하는 뉴클레오티드 (즉, 데옥시뉴클레오티드)로 이루어지고, 모든 뉴클레오티드 사이의 연결은 포스포로티오에이트 연결이다.

본 발명의 한 실시양태는 본원에 앞서 기재된 바와 같은 방법을 제공하며, 여기서 생성된 생성물은 90% 초과 순수하다. 추가 실시양태에서, 생성물은 95% 초과 순수하다. 추가 실시양태에서, 생성물은 96% 초과 순수하다. 추가 실시양태에서, 생성물은 97% 초과 순수하다. 추가 실시양태에서, 생성물은 98% 초과 순수하다. 추가 실시양태에서, 생성물은 99% 초과 순수하다. 올리고뉴클레오티드의 순도는 임의의 적합한 방법, 예를 들어 고성능 액체 크로마토그래피 (HPLC) 또는 질량 분광법 (MS), 특히 액체 크로마토그래피-MS (LC-MS), HPLC-MS 또는 모세관 전기영동 질량 분광법 (CEMS)을 사용하여 결정될 수 있다.

본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드는 안티센스 올리고뉴클레오티드이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드는 아프타머이다. 본 발명의 한 실시양태에서, 생성된 올리고뉴클레오티드는 miRNA이다. 본 발명의 한 실시양태에서, 생성물은 치료용 올리고뉴클레오티드이다.

본 발명의 또 다른 실시양태는 이중-가닥 올리고뉴클레오티드를 생성하는 방법을 제공하며, 여기서 2개의 상보적 단일-가닥 올리고뉴클레오티드는 임의의 상기 실시양태의 방법에 의해 생성된 후, 어닐링을 허용하는 조건 하에 혼합되며, 이러한 조건은 통상의 기술자에게 쉽게 명백하다. 한 실시양태에서, 생성물은 siRNA이다.

본 발명의 한 실시양태에서, 절편을 라이게이션하기 위한 반응 용기에 뉴클레오티드가 실질적으로 없다. 본 발명의 한 실시양태에서, 절편을 라이게이션하기 위한 반응 용기에 뉴클레오티드가 없다. 본 발명의 또 다른 실시양태에서, 절편을 라이게이션하기 위한 반응 용기는 뉴클레오티드의 풀을 포함하지 않으며, 즉 반응물에는 뉴클레오티드가 실질적으로 내지 완전히 없다.

본원에 개시된 본 발명은 올리고뉴클레오티드 결합의 특성을 사용하여 이들의 생성을 위한 개선된 방법을 제공한다. 표적 서열과 100% 상보성을 갖는 주형 올리고뉴클레오티드를 제공하고, 생성물이 특정 조건 하에 방출되고 분리될 수 있도록 반응 조건을 제어함으로써, 높은 정도의 순도를 갖는 생성물이 수득될 수 있다.

생성물 (또는 불순물):주형 이중나선의 변성 및 주형으로부터 생성물 (또는 불순물)의 분리

주형으로부터의 생성물 (또는 임의의 불순물)의 방출은 주형 올리고뉴클레오티드 가닥 및 생성물 (또는 불순물) 사이의 왓슨-크릭 염기 쌍형성이 파괴되는 것 (즉, 이중나선의 변성)을 필요로 한다. 그 후, 생성물 (또는 불순물)은 주형으로부터 분리될 수 있으며, 이는 2개의 별도의 단계 또는 1개의 조합된 단계로서 일어날 수 있다.

방법이 컬럼 반응기에서 수행되는 경우, 생성물 (또는 불순물)의 방출 및 분리는 1개의 단계로서 일어날 수 있다. pH 또는 염 농도를 변경하거나 염기 쌍형성을 파괴하는 화학 작용제 (예컨대, 포름아미드 또는 우레아)를 함유하는 완충제의 실행은 올리고뉴클레오티드 가닥의 변성을 야기할 것이고, 생성물 (또는 불순물)이 완충제에서 용리될 것이다.

공정이 다른 반응 용기에서 수행되는 경우, 생성물 (또는 불순물)의 방출 및 분리는 2-단계 공정으로 발생할 수 있다. 먼저, 왓슨-크릭 염기 쌍이 파괴되어 가닥을 변성시킨 후, 생성물 (또는 불순물)이 주형으로부터 분리되며, 예를 들어 반응 용기로부터 제거된다. 생성물의 방출 및 분리가 2-단계 공정으로 수행되는 경우, 완충제 상태 (pH, 염)를 변경하거나 화학적 파괴제(disrupting agent) (포름아미드, 우레아)를 도입함으로써 왓슨-크릭 염기 쌍의 파괴가 성취될 수 있다. 대안적으로, 온도 상승은 또한 두 가닥의 해리, 즉 변성을 야기할 것이다. 그 후, 생성물 (또는 불순물)은 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합을 포함하는 방법을 통해 분리 (및 또한 원한다면 반응 용기로부터 제거)될 수 있다.

공정이 연속적인 또는 반연속적인 유동 반응기에서 수행되는 경우, 생성물 (또는 불순물)의 방출 및 분리는 한 단계 또는 두 단계일 수 있다. 예를 들어, 한 단계로 생성물 (또는 불순물)의 방출 및 분리는 두 가닥의 해리를 유발하기 위해 온도를 증가시키고, 온도를 상승시키기 위해 사용된 반응기의 동일한 부분에서 분자량에 기초하여 방출된 가닥을 분리함으로써 영향을 받을 수 있다. 두 단계에서 생성물 (또는 불순물)의 방출 및 분리는 반응기의 한 부분에서 두 가닥의 해리를 야기하기 위해 온도를 상승시키고, 반응기의 상이한 부분에서 분자량에 기초하여 방출된 가닥을 분리함으로써 영향을 받을 수 있다.

주형으로부터 불순물을 특이적으로 방출하고 분리하지만, 생성물을 주형에 유지함

부정확한 뉴클레오티드가 쇄 연장 동안 올리고뉴클레오티드 가닥에 혼입되는 경우, 또는 쇄 연장 반응이 조기에 종결되는 경우, 불순물이 발생한다. 반응이 절편 올리고뉴클레오티드를 라이게이션하는 단계를 포함하고 하나 이상의 라이게이션 단계가 일어나지 않는 경우에도 불순물이 발생한다. 발생할 수 있는 불순물의 종류는 도 6에 예시되어 있다.

왓슨-크릭 염기 쌍형성의 특성은 생성물의 방출 전에 주형에 결합된 임의의 불순물을 특이적으로 방출하는데 사용될 수 있다. 각각의 이중-가닥 올리고뉴클레오티드는 특정 조건 하에 해리할 것이며, 상기 조건은 100% 상보성을 갖는 서열과 비교하는 경우 100% 상보성을 갖지 않는 서열에 대해 상이하다. 이러한 조건을 결정하는 것은 통상의 기술자의 권한 내에 있다.

올리고뉴클레오티드를 변성시키는 통상적인 방법은 온도를 상승시키는 것이다. 염기 쌍의 절반이 해리되는 온도, 즉 이중나선의 50%가 단일-가닥 상태인 온도를 용융 온도, T_m이라고 한다. 용융 온도를 결정하는 가장 신뢰성 있고 정확한 수단은 경험적인 것이다. 그러나, 이는 번거롭고 보통 필수적이 아니다. T_m 값을 계산하기 위해 여러 식이 사용될 수 있으며 (Nucleic Acids Research 1987, 15 (13): 5069-5083; PNAS 1986, 83 (11): 3746-3750; Biopolymers 1997, 44 (3): 217-239), 수많은 용융 온도 계산기는 시약 공급회사 및 대학이 호스팅하는 온라인에서 찾을 수 있다. 주어진 올리고뉴클레오티드 서열에 대해, 모든 포스포로티오에이트 연결을 갖는 변이체는 모든 포스포디에스테르 연결을 갖는 변이체보다 더 낮은 온도에서 용융하는 것으로 공지되어 있다. 올리고뉴클레오티드에서 포스포로티오에이트 연결의 수를 증가시키는 것은 그의 의도된 표적에 대한 올리고뉴클레오티드의 T_m을 낮추는 경향이 있다.

반응 혼합물로부터 불순물을 특이적으로 분리하기 위해, 먼저 생성물:주형 이중나선의 용융 온도를 계산한다. 그 후, 반응 용기를 제1 온도, 예를 들어 생성물:주형 이중나선의 용융 온도 미만의 온도, 예를 들어 용융 온도보다 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10℃ 낮은 온도로 가열한다. 이 가열 단계는 주형으로부터 생성물이 아닌, 즉 주형과 100% 상보적이지 않은 올리고뉴클레오티드의 변성을 야기한다. 그 후, 이들 변성된 올리고뉴클레오티드는 상기 개시된 방법, 예를 들어 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합 중 하나를 사용하여 반응 용기로부터 제거될 수 있다. 그 후, 반응 용기를 더 높은 제2 온도, 예를 들어 계산된 용융 온도보다 높은, 예를 들어 용융 온도보다 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10℃ 높은 온도로 상승시켜, 주형으로부터 생성물의 변성을 야기할 것이다. 그 후, 생성물은 상기 개시된 방법, 예를 들어 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합 중 하나를 사용하여 분리 (및 반응 용기로부터 제거)될 수 있다.

파괴제가 pH 또는 염 농도의 변화를 야기하는 작용제 또는 화학적 파괴제인 경우, 유사한 공정이 사용될 수 있다. 파괴제는 주형으로부터 생성물이 아닌 올리고뉴클레오티드의 변성을 야기하기 위해 생성물이 해리하는 농도 바로 아래까지 농도가 증가된다. 그 후, 이들 불순물은 상기 개시된 방법 중 하나를 사용하여 반응 용기로부터 제거될 수 있다. 그 후, 파괴제는 생성물이 주형으로부터 해리하는 농도 초과로 농도가 증가된다. 그 후, 생성물은 상기 개시된 방법 중 하나를 사용하여 반응 용기로부터 제거될 수 있다.

상기 개시된 바와 같은 공정으로부터 수득된 생성물은 추가 정제 단계의 필요 없이 높은 정도의 순도를 갖는다. 예를 들어, 수득된 생성물은 95% 초과 순수하다.

주형의 특성

주형은 생성물에서 불순물이 되는 것을 방지하기 위해 생성물이 제거될 때 반응 용기에서 유지되는 것을 허용하는 특성을 요구한다. 다시 말해서, 주형은 생성물로부터 분리되는 것을 허용하는 특성을 갖는다. 본 발명의 한 실시양태에서, 이 체류는 주형을 지지 물질에 커플링함으로써 성취된다. 이 커플링는 고분자량을 갖는 주형-지지체 복합체를 생성하고, 따라서 불순물 및 생성물이 예를 들어 여과에 의해 제거될 때 반응 용기에서 유지될 수 있다. 주형은 고체 지지체 물질, 예컨대 중합체 비드, 섬유질 지지체, 막, 스트렙타비딘 코팅된 비드 및 셀룰로스에 커플링될 수 있다. 주형은 또한 가용성 지지체 물질, 예컨대 폴리에틸렌 글리콜, 가용성 유기 중합체, DNA, 단백질, 덴드리머, 다당류, 올리고당 및 탄수화물에 커플링될 수 있다.

각각의 지지체 물질은 주형이 부착될 수 있는 다수의 점을 가질 수 있으며, 각각의 부착점은 예를 들어 도 3에 나타낸 방식으로 부착된 다수의 주형을 가질 수 있다.

주형은 지지체 물질로의 부착 없이 고분자량 자체를 가질 수 있으며, 예를 들어 도 3에 나타낸 방식으로 예를 들어 링커에 의해 분리된 주형의 다수의 카피를 갖는 분자일 수 있다.

주형을 반응 용기에서 유지하는 능력은 또한 회수되거나 연속적인 또는 반연속적인 유동 공정에서 사용함으로써 주형이 향후 반응을 위해 재순환되는 것을 허용한다.

주형을 생성물 (또는 불순물)로부터 분리하는 방법

상기 개시된 바와 같은 주형의 특성은 주형 및 생성물의 분리, 또는 주형 결합된 생성물 및 불순물의 분리를 허용한다. 분자량-기반 분리, 전하-기반 분리, 소수성-기반 분리, 특이적 서열-기반 분리 또는 이들 방법의 조합이 사용될 수 있다.

주형이 고체 지지체에 부착된 경우, 생성물로부터의 주형의 분리, 또는 주형에 결합된 생성물로부터의 불순물의 분리는 관련 기술분야의 통상의 기술자에게 쉽게 명백한 바와 같이 적절한 조건 하에 고체 지지체를 세척함으로써 성취된다. 주형이 가용성 지지체에 커플링되거나 그 자체가 반복 주형 서열로 구성된 경우, 생성물로부터의 주형의 분리, 또는 불순물로부터의 주형 결합된 생성물의 분리는 예를 들어 더 큰 분자는 필터에 의해 유지되고 더 작은 분자는 통과하도록 필터 물질이 선택되는 기술, 예컨대 한외여과 또는 나노-여과를 사용함으로써 분자량-기반 분리에 의해 성취될 수 있다. 주형 생성물 복합체로부터의 불순물의 단일 분리 단계, 또는 주형으로부터의 생성물의 분리가 충분히 효율적이지 않은 경우, 다수의 순차적 여과 단계를 사용하여 분리 효율을 증가시키고 목적 순도를 충족시키는 생성물을 생성할 수 있다.

효율적이고 산업적 생산 규모로 적용가능한 이러한 올리고뉴클레오티드의 분리 방법을 제공하는 것이 바람직하다. 문헌 ["Therapeutic oligonucleotides: The state of the art in purification technologies" Sanghvi et al. Current Opinion in Drug Discovery (2004) Vol. 7 No. 8]은 올리고뉴클레오티드 정제를 위해 사용된 공정을 검토한다.

WO 01/55160 A1은 오염물과 이민 연결을 형성한 후 이민-연결 불순물을 크로마토그래피 또는 다른 기술로 제거함으로써 올리고뉴클레오티드를 정제하는 것을 개시한다. 문헌 ["Size Fractionation of DNA Fragments Ranging from 20 to 30000 Base Pairs by Liquid/Liquid chromatography" Muller et al. Eur. J. Biochem (1982) 128-238]은 뉴클레오티드 서열의 분리를 위해 PEG/덱스트란 상이 침착된 미세결정질 셀룰로스의 고체 컬럼의 사용을 개시한다. 문헌 ["Separation and identification of oligonucleotides by hydrophilic interaction chromatography." Easter et al. The Analyst (2010); 135(10)]은 고체 실리카 지지체 상을 사용하는 HPLC의 변이체를 사용한 올리고뉴클레오티드의 분리를 개시한다. 문헌 ["Fractionation of oligonucleotides of yeast soluble ribonucleic acids by countercurrent distribution" Doctor et al. Biochemistry (1965) 4(1) 49-54]은 건조 DEAE-셀룰로스로 충전된 건조 고체 컬럼의 사용을 개시한다. 문헌 ["Oligonucleotide composition of a yeast lysine transfer ribonucleic acid" Madison et al.; Biochemistry, 1974, 13(3)]은 뉴클레오티드 서열의 분리를 위한 고체상 크로마토그래피의 사용을 개시한다.

액체-액체 크로마토그래피는 공지된 분리 방법이다. 문헌 ["Countercurrent Chromatography The Support-Free Liquid Stationary Phase" Billardello, B.; Berthod, A; Wilson & Wilson's Comprehensive Analytical Chemistry 38; Berthod, A., Ed.; Elsevier Science B.V.: Amsterdam (2002) pp 177-200]은 액체-액체 크로마토그래피에 대한 유용한 일반적인 설명을 제공한다. 다양한 액체-액체 크로마토그래피 기술이 공지되어 있다. 이러한 기술 중 하나는 액체-액체 역류 크로마토그래피 (본원에서 "CCC"로 지칭됨)이다. 또 다른 공지된 기술은 원심 분배 크로마토그래피 (본원에서 "CPC"로 지칭됨)이다.

상기 개시된 방법 및 WO 2013/030263에 개시된 방법은 생성물 올리고뉴클레오티드를 예를 들어 주형 및/또는 불순물로부터 분리하는데 사용될 수 있다.

본 발명의 방법, 즉 라이게이션 단계 (d)에서 사용하기 위한 리가제

본 발명의 한 실시양태에서, 리가제는 ATP 의존적 리가제이다. ATP 의존적 리가제는 크기의 범위가 30 내지 >100 kDa이다. 본 발명의 한 실시양태에서, 리가제는 NAD 의존적 리가제이다. NAD 의존적 효소는 고도로 상동성이며, 70-80 kDa의 단량체 단백질이다. 본 발명의 한 실시양태에서, 리가제는 열안정한 리가제이다. 열안정한 리가제는 호열성 박테리아로부터 유래될 수 있다.

본 발명의 한 실시양태에서, 리가제는 주형-의존적 리가제이다.

본 발명의 한 실시양태에서, 리가제는 야생형 엔테로박테리아(Enterobacteria) 파지 CC31 DNA 리가제 (서열식별번호: 6) 또는 야생형 시겔라(Shigella) 파지 Shf125875 DNA 리가제 (서열식별번호: 8)이다.

본 발명의 한 실시양태에서, 리가제는 변형된 리가제이다. 예를 들어, 변형된 리가제는 변형된 T4 DNA 리가제, 변형된 엔테로박테리아 파지 CC31 리가제, 변형된 시겔라 파지 Shf125875 리가제 및 변형된 클로렐라(Chlorella) 리가제를 포함한다.

한 실시양태에서, 야생형 T4 DNA 리가제는 서열식별번호: 3의 아미노산 위치 368 또는 아미노산 위치 371에서 변형된다.

한 실시양태에서, 돌연변이체 리가제는 서열식별번호: 3을 포함하거나 이로 이루어지며, 여기서 위치 368의 아미노산은 R 또는 K이다.

한 실시양태에서, 돌연변이체 리가제는 서열식별번호: 3을 포함하거나 이로 이루어지며, 여기서 위치 371의 아미노산은 다음 아미노산: L, K, Q, V, P, R 중 임의의 하나이다.

한 실시양태에서, T4 DNA 리가제와 관련하여 상기 개시된 상응하는 잔기(들)는 엔테로박테리아 파지 CC31 리가제, 시겔라 파지 Shf125875 리가제 및 클로렐라 리가제 중 임의의 하나에서 돌연변이된다. DNA 리가제의 보존된 영역은 문헌 [Chem. Rev. 2006, 106, 687-699] 및 [Nucleic Acids Research, 2000, Vol. 28, No. 21, 4051-4058]에 개시되어 있다. 한 실시양태에서, 리가제는 링커 영역에서 변형된다.

본 발명의 한 실시양태에서, 리가제는 서열식별번호: 23을 포함하거나 이로 이루어지거나, 야생형 리가제, 예를 들어 엔테로박테리아 파지 CC31 리가제를 제외하고 리가제는 이와 적어도 90% 서열 동일성을 갖는다.

본 발명의 한 실시양태에서, 리가제는 다음 아미노산 서열: 서열식별번호: 10-28 중 임의의 하나를 포함하거나 이로 이루어진다.

본 발명의 한 실시양태에서, 리가제는 예를 들어 비드 상에 고정화된다.

출발 물질로 사용되는 올리고뉴클레오티드

본 발명의 방법을 위한 출발 물질로 사용되는 올리고뉴클레오티드는 "풀"로 본원에 기재되어 있으며, 그의 정의는 상기 제공된다. 풀은 올리고뉴클레오티드의 비균질한 세트이다. 풀을 형성하는 올리고뉴클레오티드는 다른 올리고뉴클레오티드 생성 방법, 예를 들어 고체상 또는 효소적 합성에 의해 생성된 것일 것이며, 따라서 불순물을 함유할 가능성이 있다.

풀은 생성물 올리고뉴클레오티드의 절편으로 구성되며, 이어서 주형 상에 어셈블리되는 동안 함께 연결된다. 각각의 절편은 상이한 길이 및/또는 부정확하게 혼입된 잔기의 불순물을 갖는 비균질한 세트일 것이다.

효소를 사용한 절편 올리고뉴클레오티드의 생성

1) ss리가제, 예를 들어 RNA 리가제

ss리가제는 ATP 구동된 첨가, 예를 들어, 3',5' 뉴클레오티드 비스포스페이트, 3',5' 뉴클레오티드 티오포스페이트 (예를 들어, 3',5' 비스티오포스페이트 또는 3'-포스페이트-5'-티오포스페이트 또는 3'-티오포스페이트-5'-포스페이트) 또는 3'5' 뉴클레오티드 디티오포스페이트 (예를 들어, 3',5' 비스디티오포스페이트 또는 3'-포스페이트-5'-디티오포스페이트 또는 3'-디티오포스페이트-5'-포스페이트)를 짧은 올리고뉴클레오티드 (프라이머)의 3'-OH에 주형-독립적 방식으로 첨가하는 것을 촉매한다. 통상의 기술자는 당 모이어티의 3' 위치에 디포스페이트 (또는 디티오포스페이트) 또는 트리포스페이트 (또는 하나 이상의 산소 원자가 황에 의해 치환된 다른 올리고포스페이트)가 또한 사용될 수 있으나, 추가 포스페이트 (또는 티오포스페이트) 모이어티는 필요하지 않다는 것을 이해할 것이다. 동등하게 변형된 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드는 상기 언급된 개별 뉴클레오티드 대신에 사용될 수 있다. 올리고뉴클레오티드 프라이머는 통상적으로 최소 3개의 뉴클레오티드 길이이다. 이 첨가 반응의 생성된 올리고뉴클레오티드는 출발 올리고뉴클레오티드보다 1개 뉴클레오티드 더 길다 (또는 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드가 각각 사용되는 경우 출발 올리고뉴클레오티드보다 2, 3 또는 4개 뉴클레오티드 더 길다). 새로운 3' 위치가 이제 인산화된다. 후속 뉴클레오티드를 첨가하기 위해, 성장하는 올리고뉴클레오티드의 3' 포스페이트는 가수분해에 의해 제거되어 3'-OH를 생성한다. 이 가수분해는 전형적으로 도 1에 나타낸 바와 같이 포스파타제 효소를 사용하여 수행된다.

2) 트랜스퍼라제

말단 데옥시뉴클레오티딜 트랜스퍼라제 (TdT) 효소는 3'-보호된 뉴클레오티드 트리포스페이트, 예를 들어 3'-O-아지도메틸, 3'-아미노옥시 또는 3'-O-알릴 기에 의해 보호된 3'-보호된 뉴클레오티드 트리포스페이트를 주형-독립적 방식으로 짧은 올리고뉴클레오티드 (프라이머)의 3'-OH에 첨가하는 것을 촉매한다. 이 올리고뉴클레오티드 프라이머는 통상적으로 최소 3개의 뉴클레오티드 길이이다.

적합한 방법은 예를 들어, EP2796552, US8808989, WO16128731 A1 및 WO16139477 A1에 기재되어 있다.

절편 올리고뉴클레오티드를 생성하기 위한 상기 기재된 ss리가제 및 트랜스퍼라제 방법에 사용되는 프라이머 올리고뉴클레오티드는

(1) 원한다면 절편 올리고뉴클레오티드의 일부로서 유지될 수 있거나, 또는

(2) 생성물 올리고뉴클레오티드로부터 절단되어, 목적 생성물의 분리를 허용하고, 추가 절편 올리고뉴클레오티드를 제조하기 위해 재순환의 가능성을 허용할 수 있다. 절편 올리고뉴클레오티드로부터 프라이머의 절단은 절단이 효과적이고 또한 정확하도록 서열 특이적 뉴클레아제 및 적절한 설계의 프라이머 및 절편을 사용하여 수행될 수 있다.

<실시예>

약어

OMe O-메틸

MOE O-메톡시에틸 (DNA 백본) 또는 메톡시에틸 (RNA 백본)

CBD 셀룰로스 결합 도메인

HPLC 고성능 액체 크로마토그래피

PBS 포스페이트 완충 염수

HAA 헥실암모늄 아세테이트

SDS PAGE 나트륨 도데실 술페이트 폴리아크릴아미드 겔 전기영동

LCMS 액체 크로마토그래피 질량 분광법

PO 포스포디에스테르

DTT 디티오트레이톨

Ni-NTA 니켈 니트릴로트리아세트산

/3Phos/ 3'-포스페이트 기

/5Phos/ 5' 포스페이트 기

(p) 포스페이트 기

PS 또는 * 포스포로티오에이트

/i데옥실/ 2' 데옥시이노신

5mC 5-메틸시토신

BSA 소 혈청 알부민

LNA 잠금 핵산

WT 야생형

실시예 1: 야생형 T4 DNA 리가제를 사용한 올리고뉴클레오티드 (DNA) 절편 어셈블리 및 라이게이션

1.1 출발 및 대조군 서열의 화학적 합성

다수의 짧은 올리고뉴클레오티드 ("절편")가 상보적 주형 가닥 상에 정확한 순서로 어셈블리되고 목적 최종 생성물 ("표적")을 제공하도록 라이게이션될 수 있음을 입증하기 위해, 표 1에 상세히 기재된 바와 같은 절편, 표적 및 주형 서열을 표준 방법을 사용하여 화학적으로 합성하였다.

1.2 HPLC 분석

흡광도를 258 nm에서 모니터링하면서, 0.2 ml/분으로 실행하는 애질런트(Agilent) ZORBAX 이클립스 플러스(Eclipse Plus) XDB-C18 컬럼 (4.6 x 150 mm, 5 ㎛ dp. 애질런트 P/N 993967-902)을 사용하여 HPLC 분석을 수행하였다. 컬럼을 60℃에서 유지하였다. 20 ㎕의 샘플을 주입하고, 20-31% 완충제 B로부터 구배를 20분에 걸쳐 실행한 후, 5분 동안 최대 80% 완충제 B로 계단식으로 진행하였다.

완충제 A: 75 ml 1 M HAA, 300 ml 이소프로필 알콜, 200 ml 아세토니트릴, 4425 ml 물

완충제 B: 650 ml 이소프로필 알콜, 350 ml 아세토니트릴

<표 1>

(p) 포스페이트

1.3 상업용 T4 DNA 리가제 (서열식별번호: 3)를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법

5' 절편, 중심 절편 및 3' 절편을 주형 상에 어셈블리하였다: 각각의 절편 및 주형을 1 mg/ml의 농도로 물에 용해시킨 후 다음과 같이 혼합하였다.

5'-절편 2 ㎕

중심 절편 2 ㎕

3-절편 2 ㎕

비오티닐화 주형 2 ㎕

H₂O 36 ㎕

조합된 올리고뉴클레오티드 용액을 94℃에서 5분 동안 인큐베이션하고, 37℃로 냉각한 후, 37℃에서 추가 5분 동안 인큐베이션하여 절편이 주형에 어닐링하도록 하였다. 그 후, 2 ㎕ (2 ㎍과 동등함)의 T4 DNA 리가제 (NEB) 및 4 ㎕의 1 x T4 DNA 라이게이션 완충제 (NEB)을 첨가하고, 반응물 (총 반응 부피 50 ㎕)을 실온에서 1시간 동안 인큐베이션하였다. 그 후, 40 ㎕의 스트렙타비딘 코팅된 자성 비드를 첨가하고, 현탁액을 실온에서 10분 동안 인큐베이션하여, 비오티닐화 주형이 스트렙타비딘 비드에 결합되도록 하였다. 스트렙타비딘 비드를 2 x 100 ㎕ PBS로 세척하여, 비결합된 절편을 제거하였다. 세척액을 HPLC에 의해 분석하였다. 그 후, 반응 혼합물을 94℃에서 10분 동안 인큐베이션하여, 결합된 라이게이션 생성물 (또는 임의의 결합된 절편)을 주형으로부터 분리시킨 후, 얼음 상에서 급속하게 냉각시켜 DNA를 '용융'하고, 주형으로의 올리고뉴클레오티드 생성물 (또는 절편)의 재어닐링을 정지시켰다. 그 후, 라이게이션 반응의 분석을 HPLC에 의해 수행하였다.

1.4 사내 T4 DNA 리가제 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법

1.4.1 비드 슬러리 생성

N-말단에서 셀룰로스 결합 도메인 (CBD)에 융합된 T4 리가제 (서열식별번호: 4)를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 이 T4 리가제 아미노산 서열은 N-말단 메티오닌 (M)이 글리신 및 세린 (GS)으로 대체되었다는 점에서 상업용 T4 리가제 서열 (서열식별번호: 3)과 상이하다. CBD 융합 단백질의 생성 및 발현을 돕기 위해 이들 아미노산 치환을 수행하였다. CBD-T4 리가제 융합 단백질을 BL21 A1 세포 (인비트로젠)에서 발현시켰다. 상등액을 수확하고, 600 ㎕의 펄로자 100 (펄로자) 비드에 첨가하고, 26℃에서 1시간 동안 진탕하였다. 그 후, 펄로자 셀룰로스 비드를 수집하고, 2 ml 완충제 (50 mM 트리스(Tris) pH 8.0, 200 mM NaCl, 0.1% 트윈(Tween) 20, 10% 글리세롤), 이어서 5 ml PBS로 세척하고, 최종적으로 200 ㎕ PBS (10 mM PO₄ ^3-, 137 mM NaCl, 2.7 mM KCl pH 7.4)에 재현탁시켰다. 단백질 발현을 분석하기 위해, 15 ㎕의 펄로자 비드 슬러리를 5 ㎕의 SDS 로딩 완충제와 혼합하고, 표준 프로토콜에 따라 SDS PAGE 구배 겔 (4 - 20%) 상에서 실행시키기 전에 80℃에서 10분 동안 인큐베이션하였다.

1.4.2 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션

펄로자 비드에 결합된 T4 리가제에 대해, 상기 1.3의 어셈블리 및 라이게이션 방법을 다음과 같이 변형하였다. 초기 절편 혼합물에서, 36 ㎕의 H₂O를 8 ㎕의 H₂O로 감소시켰다. 어닐링 후, 2 ㎕의 상업용 T4 DNA 리가제를 20 ㎕의 펄로자 비드 슬러리로 대체하였다. 스트렙타비딘 자성 비드를 첨가하기 전에, 펄로자 비드를 스핀다운시키고, 상등액을 제거하였다. 스트렙타비딘 자성 비드를 상등액에 첨가하고, 실온에서 10분 동안 인큐베이션하여, 비오티닐화 주형이 스트렙타비딘 비드에 결합되도록 하였다.

1.5 결과 및 결론

생성물, 주형 및 모든 3개의 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었다.

리가제 반응물의 HPLC 분석은 일부 라이게이션되지 않은 올리고뉴클레오티드 절편이 남아있지만, 상업용 T4 DNA 리가제 (NEB)는 3개의 절편의 라이게이션을 촉매하여 목적 생성물 올리고뉴클레오티드를 생성할 수 있다는 것을 나타내었다 (도 7). 펄로자 비드 결합된 T4 DNA 리가제는 올리고뉴클레오티드 절편의 라이게이션에서 덜 효율적인 것으로 나타났으며, 올리고뉴클레오티드 절편은 대조군 세척 샘플 및 반응 샘플 둘 모두에서 나타났다 (도 8). 그러나, 상업용 효소와 비교하여 동일한 양의 효소가 비드 상에 첨가되었는지를 확인하기가 어렵기 때문에, 라이게이션 효율의 직접 비교는 불가능하였다.

실시예 2: 야생형 T4 DNA 리가제를 사용한 2'-OMe 리보스 변형된 올리고뉴클레오티드 절편 어셈블리 및 라이게이션

2.1 모든 절편에서 각각의 뉴클레오티드 위치의 2' OMe

T4 DNA 리가제가 리보스 고리의 2' 위치에서 변형을 갖는 올리고뉴클레오티드 절편을 라이게이션할 수 있는지를 결정하기 위해, 하기 나타낸 바와 같이 리보스 고리의 2' 위치가 OMe 기로 치환되고, 티미딘이 우리딘으로 대체된 것을 제외하고 실시예 1에서와 동일한 서열을 갖는 올리고뉴클레오티드 절편을 합성하였다.

<표 2>

(p) = 포스페이트

둘 모두 펄로자 비드에 결합된 상업용 NEB 리가제 및 T4 리가제 CBD 융합체를 사용한 어셈블리, 라이게이션 및 HPLC 분석을 실시예 1의 방법을 사용하여 수행하였다. 상업용 T4 DNA 리가제 (NEB) 실험을 위한 반응 믹스에 사용된 물의 양은 36 ㎕가 아니라 26 ㎕이므로, 최종 반응 부피는 40 ㎕였다. 사내 T4 DNA 리가제 비드 슬러리 실험을 위한 반응 믹스에 사용된 물의 양은 23 ㎕이고, 사용된 비드의 양은 5 ㎕이므로, 최종 반응 부피는 또한 40 ㎕였다. 2'-OMe DNA와 대조적으로 비변형된 DNA를 사용한 대조군 실험을 병렬로 실행하였다.

대조군 실험으로부터의 결과는 실시예 1에 따른 것이었다. 2'-OMe 실험에 대해 HPLC를 사용하여 생성물이 검출되지 않았으며, 이는 펄로자 비드에 결합된 상업용 T4 DNA 리가제 또는 사내 T4 DNA 리가제 CBD 융합체를 사용하였는지 여부에 관계없이, T4 DNA 리가제가 2'-OMe 변형된 올리고뉴클레오티드 절편을 완전히 라이게이션할 수 없음을 나타낸다.

2.2 단일 절편에서 각각의 뉴클레오티드 위치의 2'-OMe

각각의 올리고뉴클레오티드의 1 mg/ml 용액을 사용하여, 표 3에 상세히 기재된 바와 같은 반응을 설정하였다.

<표 3>

상업용 NEB 리가제 및 사내 펄로자 결합된 T4 DNA 리가제를 사용한 실시예 1의 방법을 사용하여 어셈블리 및 라이게이션을 수행하였다.

반응물을 94℃에서 5분 동안 인큐베이션한 후, 5분 동안 37℃에서 인큐베이션하여, 어닐링을 허용하였다. 4 ㎕의 1x NEB T4 DNA 라이게이션 완충제를 5 ㎕ (대략 2 ㎍)의 사내 T4 DNA 리가제 또는 2 ㎕ (대략 2 ㎍)의 상업용 T4 DNA 리가제 (리가제 대조군 없음인 실험 1 제외)와 함께 각각의 반응물에 첨가하고, 라이게이션 반응을 2시간 동안 실온에서 진행시켰다. 그 후, 스트렙타비딘 자성 비드를 각각의 반응물에 첨가하고, 반응물을 94℃로 가열한 후, 실시예 1에 기재된 바와 같이 얼음에서 급속하게 냉각시켜, 주형을 출발 물질 및 생성물로부터 분리시켰다.

프로세싱된 반응물을 둘로 분할하였다: 절반을 실시예 1 (섹션 1.2)에 기재된 바와 같이 HPLC에 의해 분석하였다. HPLC 결과를 확인하기 위해 샘플의 나머지 절반을 질량 분광법을 위해 유지시켰다.

비변형된 올리고뉴클레오티드 절편 (실험 5)의 라이게이션은 전장 생성물을 생성할 것으로 예상된 바와 같이 진행되었다. 도 9에 나타낸 바와 같이 5' 절편이 2'-OMe 치환된 경우 (실험 3) 소량의 라이게이션이 나타났으나, 3' 절편이 2'-OMe 치환된 경우 (실험 2) 라이게이션이 나타나지 않았다. 2.1에 따라 모든 3개의 절편이 2'-OMe 치환된 경우 (실험 4) 유의한 생성물이 나타나지 않았다.

2.3 결론

야생형 T4 DNA 리가제는 2'-OMe 치환된 올리고뉴클레오티드 절편의 라이게이션에 불량하지만, 3' 절편보다 5' 올리고뉴클레오티드 절편의 변형에 약간 덜 민감하였다.

실시예 3: 야생형 및 돌연변이체 리가제를 사용한 2'-OMe 리보스 변형된 올리고뉴클레오티드 절편 어셈블리 및 라이게이션

3.1 재료

야생형 엔테로박테리아 파지 리가제 CC31 (서열식별번호: 6), 야생형 시겔라 파지 Shf125875 리가제 (서열식별번호: 8), 및 N-말단에서 CBD에 각각 융합된 서열식별번호: 10-19의 10개의 돌연변이체 T4 리가제를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 1.4.1에 개시된 바와 같이, CBD 융합 단백질을 생성하고 발현시키기 위해, 각각의 경우에 N-말단 메티오닌 (M)을 글리신 및 세린 (GS)으로 대체하였다 (예를 들어, 엔테로박테리아 파지 리가제 CC31의 경우 서열식별번호: 7 및 시겔라 파지 Shf125875 리가제의 경우 서열식별번호: 9).

하기 올리고뉴클레오티드를 표준 고체상 방법에 의해 합성하였다.

<표 4>

N.B. OMe는 리보스 고리 상의 2' 메톡시 치환을 나타낸다.

(p) = 포스페이트

* 처음 5개의 뉴클레오티드는 2'-OMe (GGCCA) 변형되었지만, 최종 A는 그렇지 않다는 점을 주목한다.

3.2 리가제 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법

3.2.1 비드 슬러리 생성

CBD에 융합된 리가제를 1.4에 기재된 바와 같이 펄로자 비드에 결합시켜 비드 슬러리를 생성하였다.

3.2.2 비드 슬러리를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션

96 웰 플레이트에서 50 ㎕의 최종 부피로 하기 구성성분을 사용하여 라이게이션 반응물을 제조하였다:

2 ㎕ ~1 mg/mL 5' (2'-OMe) 절편

2 ㎕ ~1 mg/mL 중심 절편

2 ㎕ ~1 mg/mL 3' 절편

2 ㎕ ~1 mg/mL 주형

5 ㎕ NEB T4 DNA 리가제 완충제

22 ㎕ H₂O

15 ㎕ 펄로자 결합된 비드 슬러리

펄로자 비드 슬러리를 첨가하기 전에 반응물을 15분 동안 실온에서 인큐베이션하여 절편이 주형에 어닐링되도록 하였다. 펄로자 비드 슬러리를 첨가하고, 반응물을 실온에서 1시간 동안 인큐베이션하였다. 1시간 인큐베이션 후, 용액을 ACOPREP 어드밴스 350 필터 플레이트 (PN 8082)로 이동시키고, 필터 플레이트를 ABGENE 슈퍼플레이트 (써모 사이언티픽(Thermo Scientific), #AB-2800)의 상단에 위치시키고, 10분 동안 4,000 rpm에서 원심분리하여, 펄로자 비드 슬러리를 제거하였다. 그 후, 실시예 1 (섹션 1.2)에 기재된 방법을 사용하여 HPLC에 의해 용액을 분석하였다.

각각의 올리고뉴클레오티드 어셈블리 및 라이게이션을 각각의 리가제에 대해 6회 반복하였다.

3.3 결과 및 결론

야생형 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 6) 및 야생형 시겔라 파지 Shf125875 리가제 (서열식별번호: 8)는 5개의 2'-OMe 핵염기 및 1개의 데옥시핵염기를 함유하는 2' OMe 치환된 5' 절편을 비변형된 DNA만을 함유하는 절편으로 라이게이션할 수 있다. 또한, 야생형 T4 DNA 리가제 (서열식별번호: 3 및 4)는 실시예 2에 나타나고 본원에서 재확인된 바와 같이 이 반응을 수행하는데 불량하지만, 위치 368 및 371에서의 수많은 돌연변이는 5개의 2' OMe 핵염기 및 1개의 데옥시핵염기를 함유하는 2'-OMe 치환된 5' 절편을 리가제 (서열식별번호: 10-19) 상에 비변형된 DNA만을 함유하는 절편으로 라이게이션하는 능력을 부여한다.

실시예 4: 돌연변이체 DNA 리가제를 사용한 2' MOE 리보스 변형된 및 5-메틸 피리미딘 변형된 올리고뉴클레오티드 절편 어셈블리 및 라이게이션

4.1 재료

하기 표 5에 기재된 바와 같은 변형된 올리고뉴클레오티드 절편을 표준 고체상-기반 방법에 의해 합성하였다.

<표 5>

(p) = 포스페이트, mX = MOE 염기, dX = DNA 염기

모두 5-메틸 피리미딘

야생형 엔테로박테리아 파지 CC31 리가제, 야생형 T4 리가제 및 야생형 시겔라 파지 Shf125875 리가제에 기초한 돌연변이체 DNA 리가제 (서열식별번호: 20-28)를 표준 클로닝, 발현 및 추출 방법을 사용하여 N-말단에서 셀룰로스 결합 도메인 (CBD)에 각각 융합시켰다. CBD에 융합된 리가제를 1.4에 기재된 바와 같이 펄로자 비드에 결합시켜, 비드 슬러리를 생성하였다. 리가제를 펄로자 비드로부터 방출하기 위해, 2 ㎕의 TEV 프로테아제를 슬러리에 첨가하고, 밤새 4℃에서 인큐베이션하였다. 이제 셀룰로스 결합 도메인이 결여된 절단된 단백질을 10분 동안 4000 rpm에서 원심분리에 의해 수집하였다.

4.2 방법

반응을 다음과 같이 설정하였다:

중심 절편 20 μM 최종

MOE 3' 절편 20 μM 최종

MOE 5' 절편 20 μM 최종

주형 20 μM 최종

NEB T4 DNA 리가제 완충제 5 ㎕

돌연변이체 DNA 리가제 15 ㎕

H₂O 최종 반응 부피를 50 ㎕로 만듦

DNA 리가제를 첨가하기 전에 모든 구성성분을 혼합하고 볼텍싱하였다. 반응물을 1시간 동안 35℃에서 인큐베이션하였다. 1시간 후, PCR 블록에서 95℃에서 5분 동안 가열에 의해 반응을 정지시켰다.

실시예 1 (섹션 1.2)에서 사용된 HPLC 프로토콜에 따라 생성물 동일성을 확인하기 위해 샘플을 HPLC 및 LCMS 둘 모두에 의해 분석하였다. 상업용 NEB T4 DNA 리가제의 대조군 및 음성 대조군 (임의의 리가제 대신 H₂O)을 포함시켰다.

4.3 결과 및 결론

도 10은 대조군 반응 및 서열식별번호: 23 (클론 A4 - 돌연변이체 엔테로박테리아 파지 CC31 리가제)에 의해 촉매된 반응에 대한 HPLC 트레이스를 나타낸다. 이 HPLC 방법을 사용하여 생성물 및 주형이 공동-용리되므로, 생성물은 생성물 + 주형 피크의 피크 면적의 증가로서 보인다. 돌연변이체 리가제 트레이스 (b)에서, 생성물 + 주형 피크가 증가할 뿐만 아니라, 2개의 새로운 피크가 10.3 및 11.2분에서 나타난다. 이들 피크는 MOE 5' 절편 또는 MOE 3' 절편과 중심 절편의 라이게이션에 상응한다. 또한, 입력 절편 피크는 생성물 및 중간체 피크 증가와 함께 대조군보다 실질적으로 더 작다. NEB 상업용 T4 리가제 트레이스 (a)는 입력 올리고뉴클레오티드 절편의 수반된 저하와 함께 주형 + 생성물, 소량의 중간체 라이게이션 생성물에 대한 피크 면적의 약간의 증가를 나타내었다. 그러나, 돌연변이체 리가제 (서열식별번호: 23)는 실질적으로 더 큰 생성물 + 주형 피크 면적 및 입력 올리고뉴클레오티드 절편에 대한 피크 면적의 수반된 감소를 나타내었다. 그러므로, 돌연변이체 리가제 (서열식별번호: 23)는 상업용 T4 DNA 리가제보다 2' MOE 치환된 절편에 대해 훨씬 더 효과적인 리가제이다. 다른 돌연변이체 리가제 (서열식별번호: 20, 21, 24-28)에 대해 유사한 개선이 나타났다.

실시예 5: 라이게이션 부위에서 상이한 뉴클레오티드 쌍형성의 효과

5.1 재료

N-말단에서 셀룰로스 결합 도메인 (CBD)에 융합된 돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 추출된 CBD-돌연변이체 엔테로박테리아 파지 CC31 리가제 융합 단백질을 25 ml의 펄로자 100 (펄로자) 셀룰로스 비드에 첨가하고, 20℃에서 1시간 동안 진탕하였다. 그 후, 펄로자 비드를 수집하고, 250 ml 완충제 (50 mM 트리스 pH 8.0, 200 mM NaCl, 0.1% 트윈 20, 10% 글리세롤), 이어서 250 ml PBS로 세척하고, 최종적으로 10 ml PBS (10 mM PO₄ ^3-, 137 mM NaCl, 2.7 mM KCl pH 7.4)에 재현탁시켰다. 단백질 발현을 분석하기 위해, 15 ㎕의 펄로자 비드 슬러리를 5 ㎕의 SDS 로딩 완충제와 혼합하고, 표준 프로토콜에 따라 SDS PAGE 구배 겔 (4 - 20%) 상에서 실행시키기 전에 80℃에서 10분 동안 인큐베이션하였다. 비드로부터 리가제의 방출을 위해, 70 ㎕의 TEV 프로테아제를 첨가하고, 밤새 4℃에서 진탕하면서 인큐베이션하였다. 소화된 비드를 80 ml의 PBS로 세척함으로써 리가제를 수집하였다. 그 후, 아미콘(Amicon) 30 Kd MCO 필터를 사용하여 리가제를 1.2 ml로 농축시켰다.

하기 비오티닐화 DNA 주형 올리고뉴클레오티드 (표 6) 및 DNA 절편 올리고뉴클레오티드 (표 7)를 표준 고체상 방법에 의해 합성하였다. 볼드체 표시된 뉴클레오티드는 라이게이션 부위에 존재하는 것임을 주목한다 (즉, 라이게이션 반응에서 함께 연결된 뉴클레오티드 - 표 7; 및 라이게이션 반응을 통해 연결된 것과 상보적인 뉴클레오티드 - 표 6).

<표 6>

<표 7>

(p) = 포스페이트

N.B. 이전 실시예와 달리, 본 실시예에서 라이게이션 반응은 2개의 절편: 5'-절편 및 3'-절편을 함께 연결시키는 것을 수반하며, 즉 중심 절편이 없다는 점을 주목한다.

5.2 방법

반응을 다음과 같이 설정하였다:

<표 8>

각각의 50 ㎕ 반응에 대해:

3' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕

5' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕

주형 (1 mM 스톡, 20 μM 최종) 1 ㎕

NEB DNA 리가제 완충제 (T4 리가제를 위한) 5 ㎕

돌연변이체 CC31 DNA 리가제 (0.45 mM 스톡, 90 μM 최종) 10 ㎕

H₂O 50 ㎕까지

각각의 반응 믹스를 30분 및 1시간 둘 모두 동안 35℃에서 인큐베이션하였다. 각각의 반응을 95℃에서 5분 동안 가열함으로써 종결시켰다. HPLC 분석을 수행하였다.

5.3 결과 및 결론

모든 반응은 HPLC 분석에서 1시간 인큐베이션 후 생성물 피크를 생성하였다. 따라서, 라이게이션 방법은 접합부에서 뉴클레오티드의 모든 조합이 연결되도록 작용한다. 생성물 수율을 개선시키기 위한 최적화가 가능하지만, 결과가 결정적이어서 필요하지는 않았으며, 반응이 접합부에서 뉴클레오티드의 모든 조합이 연결되도록 작용한다는 것이 명확하였다.

실시예 6: 라이게이션 부위에서 상이한 변형의 효과

6.1 재료

돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하고, 클로렐라 바이러스 DNA 리가제 (서열식별번호: 29, SplintR 리가제, NEB로서 시판됨)를 구입하였다.

하기 비오티닐화 주형 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 9)를 표준 고체상 방법에 의해 합성하였다.

<표 9>

OMe는 리보스 고리 상의 2' 메톡시 치환을 나타낸다.

F는 리보스 고리 상의 2' 플루오로 치환을 나타낸다.

모든 나머지 당 잔기는 데옥시리보스 잔기이다.

Me는 5-메틸 시토신을 나타낸다.

6.2 방법

반응을 다음과 같이 설정하였다:

<표 10>

각각의 50 ㎕ 반응에 대해:

3' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕

중심 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕

5' 절편 (1 mM 스톡, 20 μM 최종) 1 ㎕

주형 (1 mM 스톡, 20 μM 최종) 1 ㎕

H₂O 50 ㎕까지

돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)에 대해

DNA 리가제 완충제 (50 mM 트리스-HCl, 1 mM DTT) 5 ㎕

돌연변이체 CC31 DNA 리가제 (0.45 mM) 10 ㎕

MnCl₂ (50 mM) 5 ㎕

ATP (10 mM) 10 ㎕

반면, 클로렐라 바이러스 DNA 리가제 (서열식별번호: 29, SplintR 리가제, NEB로서 시판됨)에 대해

NEB DNA 리가제 완충제 (클로렐라를 위해) 5 ㎕

클로렐라 바이러스 DNA 리가제 2 ㎕

각각의 반응 믹스를 20℃에서 1시간 동안 인큐베이션하였다. 각각의 반응을 95℃에서 10분 동안 가열함으로써 종결시켰다. HPLC 분석을 실시예 1의 방법을 사용하여 수행하였다.

6.3 결과 및 결론

모든 반응은 HPLC 분석에서 생성물 피크를 생성하였다. 따라서, 라이게이션 방법은 접합부에서 시험된 변형의 모든 조합이 연결되도록 작용한다. 생성물 수율을 개선시키기 위한 최적화가 가능하지만, 결과가 결정적이어서 필요하지는 않았으며, 반응이 접합부에서 시험된 변형의 모든 조합이 연결되도록 작용한다는 것이 명확하였다.

실시예 7: 더 큰 올리고뉴클레오티드를 구축하기 위해 상이한 수의 절편을 사용하는 능력

7.1 재료

돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하였다.

하기 비오티닐화 주형 DNA 올리고뉴클레오티드 및 DNA 절편 올리고뉴클레오티드 (표 11)를 표준 고체상 방법에 의해 합성하였다.

<표 11>

(p) = 포스페이트,

7.2 방법

반응을 다음과 같이 설정하였다:

<표 12>

반응을 100 ㎕의 총 부피로 포스페이트 완충 염수, pH = 7.04에서 실행하고 다음과 같이 설정하였다:

주형 (20 μM 최종)

각각의 절편 (20 μM 최종)

MgCl₂ (10 mM 최종)

ATP (100 μM 최종)

돌연변이체 CC31 DNA 리가제 (25 μM 최종)

각각의 반응물을 28℃에서 밤새 인큐베이션한 후, 94℃에서 1분 동안 가열함으로써 종결시켰다. 생성물을 HPLC 질량 분광법에 의해 분석하였다.

7.3 결과 및 결론

4개의 절편을 사용한 반응은 27개의 염기 쌍 길이의 완전히 라이게이션된 생성물을 생성하였다. 5개의 절편을 사용한 반응은 33개의 염기 쌍 길이의 생성물을 생성하였다. 두 경우 모두에서, 생성물의 관찰된 질량은 목적 서열에 대해 예상된 것과 일치하였다. 결론적으로, 적절한 상보적 주형 서열에 의해 정의된 바와 같이 목적 길이 및 서열의 올리고뉴클레오티드를 생성하기 위해 다수의 절편을 어셈블리하는 것이 명확하게 가능하다.

실시예 8: 갭머를 형성하기 위한 5-10-5 절편의 어셈블리 및 라이게이션, 여기서 5' 및 3' 절편은 (i) 2'-OMe 리보스 당 변형, (ii) 포스포로티오에이트 연결 또는 (iii) 2'-OMe 리보스 당 변형 및 포스포로티오에이트 연결을 포함하며, 중심 절편은 비변형된 DNA이다.

8.1 재료

돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하였으며, 하기 비오티닐화 주형 DNA 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 13)를 표준 고체상 방법에 의해 합성하였다.

<표 13>

OMe는 리보스 고리 상의 2' 메톡시 치환을 나타낸다.

모든 나머지 당 잔기는 데옥시리보스 잔기이다.

*포스포로티오에이트

8.2 방법

반응을 다음과 같이 설정하였다:

<표 14>

각각의 반응 1, 2 및 3을 다음 구성성분을 갖는 포스페이트 완충 염수 중 100 ㎕ 최종 부피로 설정하였다:

3' 절편 20 μM 최종

중심 절편 20 μM 최종

5' 절편 20 μM 최종

주형 20 μM 최종

MgCl₂ 10 mM 최종

ATP 50 μM 최종

효소 25 μM 최종

각각의 반응 믹스를 20℃에서 밤새 인큐베이션하였다. 각각의 반응을 95℃에서 10분 동안 가열함으로써 종결시켰다. HPLC 질량 분광법 분석을 수행하였다.

8.3 결과 및 결론

3개의 단편 모두의 성공적인 라이게이션에 상응하는 생성물 올리고뉴클레오티드를 3개의 반응 모두에서 생성하였다.

따라서, 돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)는 3개의 절편을 함께 라이게이션하여 '갭머'를 형성할 수 있으며, 여기서 5' 및 3' '윙'은 포스포로티오에이트 백본을 갖는 반면, 중심 영역은 포스포디에스테르 백본을 갖고, 갭머의 모든 당 잔기는 데옥시리보스 잔기이다. 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)는 또한 3개의 절편을 함께 라이게이션하여 '갭머'를 형성할 수 있으며, 여기서 5' 및 3' '윙'은 2'-메톡시리보스 (2'-OMe) 잔기를 갖는 반면, 중심 영역은 데옥시리보스 잔기를 갖고, 모든 연결은 포스포디에스테르 연결이다. 최종적으로, 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)는 3개의 절편을 함께 라이게이션하여 '갭머'를 형성할 수 있으며, 여기서 5' 및 3' '윙'은 조합된 변형 (포스포로티오에이트 백본 및 2'-메톡시리보스 잔기)을 갖는 반면, 중심 영역은 데옥시리보스 잔기 및 포스포디에스테르 연결을 갖는다.

실시예 9: 잠금 핵산 (LNA)을 포함하는 절편의 어셈블리 및 라이게이션

9.1 재료

돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 5.1에 기재된 바와 같이 생성하였다. 돌연변이체 스타필로코쿠스 아우레우스(Staphylococcus aureus) NAD 의존적 리가제 (NAD-14)를 13.1에 기재된 바와 같이 생성하였다.

하기 비오티닐화 주형 DNA 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 15)를 표준 고체상 방법에 의해 합성하였다.

<표 15>

(p) = 포스페이트

LNA = 잠금 핵산

9.2 방법

반응을 다음과 같이 설정하였다:

반응 부피 100 ㎕

주형 20 μM 최종

효소 25 μM 최종

모든 올리고뉴클레오티드 절편 20 μM 최종

반응을 표 16에 기재된 바와 같이 다양한 효소 (돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23) 또는 NAD-14), 2가 양이온 (Mg²⁺ 또는 Mn²⁺) 및 올리고뉴클레오티드 절편의 조합으로 설정하였다.

<표 16>

각각의 반응 믹스를 28℃에서 밤새 인큐베이션하였다. 각각의 반응을 94℃에서 1분 동안 가열함으로써 종결시켰다. HPLC 질량 분광법 분석을 수행하였다.

9.3 결과 및 결론

생성물 올리고뉴클레오티드가 대조군 반응에서 생성되었으며 (오직 비변형된 올리고뉴클레오티드), 여기서 단일 잠금 핵산은 접합부의 3' 또는 5' 측 상에 있는지에 관계없이 라이게이션 접합부에서 하나의 절편에 포함되었다. 잠금 핵산이 양쪽 측 (올리고 1 + 올리고 2)에 포함된 경우, 생성물이 검출되지 않았다. 데이터는 Mg2+ 또는 Mn2+ 사용 여부에 관계없이 두 효소 모두에 대해 유사하였다.

접합부의 3' 및 5' 측 둘 모두에서 잠금 핵산을 갖는 절편을 라이게이션할 수 있는 효소를 확인하기 위해 효소 돌연변이 및/또는 선택 스크린을 수행할 수 있었다.

실시예 10: Mg²⁺ 또는 Mn²⁺의 존재하에 엔테로박테리아 파지 CC31 리가제의 변이체를 사용한, 갭머를 형성하기 위한 3개의 절편 (7-6-7)의 어셈블리 및 라이게이션, 여기서 5' 및 3' 절편은 2' MOE 리보스 당 변형을 포함하며, 모든 연결은 포스포로티오에이트 연결이다.

10.1 포스포로티오에이트 결합 형성

돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)가 포스포로티오에이트 백본, 2' MOE 리보스 당 변형 및 5-메틸화된 피리미딘 염기를 갖는 변형된 올리고뉴클레오티드 절편을 라이게이션할 수 있는지를 결정하기 위해, 반응을 표 15에 나타낸 올리고뉴클레오티드 절편을 사용하여 수행하였다. 반응을 Mg²⁺ 및 Mn²⁺ 이온의 존재하에 수행하였다.

10.2 재료

올리고뉴클레오티드를 하기 나타낸 바와 같이 표준 방법을 사용하여 화학적으로 합성하였다:

<표 17>

(p)* = 5'-포스포로티오에이트, * = 포스포로티오에이트 연결, mX = MOE 염기, dX = DNA 염기

모든 절편 및 생성물은 5-메틸 피리미딘을 갖는다 (주형 제외).

mT 및 m (Me)U는 등가물로 고려된다.

N.B. 표 17에 나타낸 비오티닐화 주형으로 혼성화될 때 표 17의 절편의 라이게이션에 의해 생성된 표적 2'MOE PS 분자는 다음과 같다:

5'-mG*mG*mC*mC*mA*dA*dA*dC*dC*dT*dC*dG*dG*dC*dT*mU*mA*mC*mC*mU-3'

(서열식별번호: 1)

정제된 돌연변이체 엔테로박테리아 파지 CC31 리가제 (서열식별번호: 23)를 실시예 5.1에 기재된 바와 같이 제조하였다. HPLC 분석을 수행하였다.

10.3 엔테로박테리아 파지 CC31 리가제 변이체 (서열식별번호: 23)를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법

반응물을 다음과 같이 제조하였다:

MgCl₂ 반응물

10 x T4 DNA 리가제 완충제 (NEB)* 5 ㎕

주형 20 μM 최종 농도

5' 절편 2' MOE PS 20 μM 최종 농도

중심 절편 PS 20 μM 최종 농도

3' 절편 2' MOE PS 20 μM 최종 농도

리가제 (24.3 μM) 10 ㎕

물 50 ㎕까지로 만듦

*1 x 완충제는 50 mM 트리스-HCl, 10 mM MgCl₂, 1 mM ATP, 10 mM DTT, pH 7.5를 함유한다.

MnCl₂ 반응물

10 x 리가제 완충제* 5 ㎕

ATP (10 mM) 5 ㎕

MnCl₂ (50 mM) 5 ㎕

주형 20 μM 최종 농도

5' 절편 2' MOE PS 20 μM 최종 농도

중심 절편 PS 20 μM 최종 농도

3' 절편 2' MOE PS 20 μM 최종 농도

리가제 (24.3 μM) 10 ㎕

물 50 ㎕까지로 만듦

*1 x 완충제는 50 mM 트리스-HCl, 10 mM DTT, pH 7.5를 함유한다.

최종 반응물은 20 μM의 각각의 절편 및 주형, 5 mM MgCl₂ 또는 5 mM MnCl₂, 1mM ATP, 50 mM 트리스-HCl, 10 mM DTT, pH 7.5 및 4.9 μM 리가제를 함유하였다. 효소를 함유하지 않은 추가 반응물을 제조하고, 음성 대조군으로서 사용하였다. 반응물을 16시간 동안 25℃에서 인큐베이션한 후, 5분 동안 95℃로 가열함으로써 켄칭하였다. 침전된 단백질을 원심분리에 의해 제거하고, 샘플을 HPLC에 의해 분석하였다.

10.4 결과 및 결론

생성물, 주형 및 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었으며, 라이게이션이 관찰되지 않았다. 5 mM MgCl₂의 존재하에 수행된 리가제 반응은 5' 절편 및 중심 절편의 라이게이션으로부터 형성된 중간체 생성물의 형성을 야기하였으나, 전장 생성물은 검출되지 않았다. MnCl₂의 존재하에 수행된 리가제 반응은 전장 생성물 및 중간체 (5' 절편 + 중심 절편 중간체) 둘 모두를 생성하였다. 리가제 반응 둘 모두는 라이게이션되지 않은 올리고뉴클레오티드 절편이 남아있음을 나타내었다. 그러나, 생성물 수율을 극대화하기 위해 프로토콜의 최적화가 가능하다.

실시예 11: 천연 Mg²⁺의 존재하에 야생형 클로렐라 바이러스 DNA 리가제를 사용한, 갭머를 형성하기 위한 3개의 절편 (7-6-7)의 어셈블리 및 라이게이션, 여기서 5' 및 3' 절편은 2' MOE 리보스 당 변형을 포함하며, 모든 연결은 포스포로티오에이트 연결이다.

11.1 재료

클로렐라 바이러스 DNA 리가제 (서열식별번호: 29, SplintR 리가제, NEB로 시판됨)가 포스포로티오에이트 백본을 갖는 변형된 올리고뉴클레오티드 절편을 라이게이션할 수 있는지를 결정하기 위해, 실시예 10.2 표 17에 나타낸 올리고뉴클레오티드 절편을 사용하여 2' MOE 리보스 당 변형 및 5-메틸화된 피리미딘 염기 반응을 수행하였다. 효소 활성에 대한 온도의 효과를 조사하기 위해 반응을 25℃, 30℃ 및 37℃에서 수행하였다.

11.2 상업용 클로렐라 바이러스 DNA 리가제 (서열식별번호: 29)를 사용한 올리고뉴클레오티드 어셈블리 및 라이게이션 방법

각각의 올리고뉴클레오티드 절편 및 주형을 하기 상세히 설명된 바와 같이 뉴클레아제 무함유 물에 용해시켰다:

비오티닐화 주형 249.6 ng/㎕

5' 절편 2' MOE PS 182.0 ng/㎕

중심 절편 PS 534.0 ng/㎕

3' 절편 2' MOE PS 531.0 ng/㎕

반응물을 다음과 같이 제조하였다:

10 x 완충제 (NEB)* 6 ㎕

주형 3.8 ㎕

5' 절편 2' MOE PS 18.1 ㎕

중심 절편 PS 4.8 ㎕

3' 절편 2' MOE PS 6.3 ㎕

물 15 ㎕

SplintR 리가제 (25 U/㎕) 6 ㎕

최종 반응물은 20 μM의 각각의 절편 및 주형, 50 mM 트리스-HCl, 10 mM MgCl₂, 1 mM ATP, 10 mM DTT, pH 7.5 및 2.5 U/㎕ 리가제를 함유하였다. 반응물을 25℃, 30℃ 및 37℃에서 인큐베이션하였다. 효소를 함유하지 않는 추가 반응물을 제조하고, 음성 대조군으로서 사용하였다. 16시간 인큐베이션 후, 반응물을 10분 동안 95℃로 가열함으로써 켄칭하였다. 침전된 단백질을 원심분리에 의해 제거하고, 샘플을 HPLC에 의해 분석하였다.

11.3 결과 및 결론

생성물, 주형 및 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었으며, 라이게이션이 관찰되지 않았다. 리가제 반응물의 HPLC 분석은 라이게이션되지 않은 올리고뉴클레오티드 절편이 남아있지만, 클로렐라 바이러스 DNA 리가제는 절편을 성공적으로 라이게이션할 수 있음을 나타내었다. 리가제의 활성은 온도 상승에 따라 증가하였다. 25℃에서 클로렐라 바이러스 DNA 리가제는 5' 절편 및 중심 절편을 성공적으로 라이게이션할 수 있었지만, 전장 생성물은 관찰되지 않았다. 30℃ 및 37℃에서, 5' 절편 및 중심 절편으로부터 형성된 중간체 이외에 전장 생성물이 검출되었다.

실시예 12: 갭머를 형성하기 위한 3개의 절편 (7-6-7)의 라이게이션을 향한 활성에 대한 15개의 ATP 및 NAD 리가제의 패널의 스크리닝, 여기서 5' 및 3' 절편은 2' MOE 리보스 당 변형을 포함하고, 모든 연결은 포스포로티오에이트 연결이다.

12.1 재료

표 18 및 19에 기재된 야생형 ATP 및 NAD 의존적 리가제를 각각 N-말단에서 CBD에 융합시켰다. 표준 클로닝, 발현 및 추출 방법을 사용하여 유전자를 합성하고, pET28a로 클로닝하고, 이. 콜라이 BL21(DE3)에서 발현시켰다.

<표 18>

ATP 의존적 리가제

<표 19>

NAD 의존적 리가제

CBD-리가제 융합체를 하기 변형을 사용하여 1.4에 기재된 바와 같이 펄로자 비드에 결합시켰다. CBD-리가제 융합 단백질을 BL21(DE3) 세포 (NEB)의 단일 콜로니로부터 성장시키고, 50 mL 발현 배양액에서 성장시켰다. 세포를 원심분리에 의해 수확하고, 5-10 mL 트리스-HCl (50 mM, pH 7.5)에 재현탁시키고, 초음파처리에 의해 용해하였다. 용해물을 원심분리에 의해 제거하고, 1 ml의 펄로자 100 (펄로자) 비드 (50 % 슬러리, 50 mM 트리스-HCl pH 7.5로 사전-평형화됨)를 상등액에 첨가하고, 이를 20℃에서 1시간 동안 진탕시켰다. 그 후, 펄로자 셀룰로스 비드를 수집하고, 30 ml 완충제 (50 mM 트리스 pH 8.0, 200 mM NaCl, 0.1% 트윈 20, 10% 글리세롤), 이어서 10 ml 트리스-HCl (50 mM, pH 7.5)로 세척하고, 최종적으로 1 mL 트리스-HCl (50 mM, pH 7.5)에 재현탁시켰다. 단백질 발현을 분석하기 위해, 20 ㎕의 펄로자 비드 슬러리를 20 ㎕의 SDS 로딩 완충제와 혼합하고, 표준 프로토콜에 따라 SDS PAGE 구배 겔 (4 - 20%) 상에서 실행시키기 전에 95℃에서 5분 동안 인큐베이션하였다.

12.2 2' MOE 및 포스포로티오에이트 변형된 올리고뉴클레오티드 어셈블리 및 라이게이션 방법

실시예 10.2 표 17에 나타낸 포스포로티오에이트 백본, 2' MOE 리보스 당 변형 및 5-메틸화된 피리미딘 염기를 갖는 변형된 올리고뉴클레오티드 절편을 사용하였다. 각각의 올리고뉴클레오티드 절편 및 주형을 하기 상세히 설명된 바와 같이 뉴클레아제 무함유 물에 용해시켰다:

비오티닐화 주형 1500 ng/㎕

5' 절편 2' MOE PS 1008 ng/㎕

중심 절편 PS 725 ng/㎕

3' 절편 2' MOE PS 1112 ng/㎕

ATP 검정 믹스를 다음과 같이 제조하였다:

주형 85.6 ㎕

5' 절편 2' MOE PS 43.5 ㎕

중심 절편 PS 46.8 ㎕

3' 절편 2' MOE PS 40.1 ㎕

DTT 1M 8 ㎕

MgCl₂ 1M 4 ㎕

ATP (50 mM) 16 ㎕

트리스 0.5 M 80 ㎕

물 476 ㎕

NAD 검정 믹스를 다음과 같이 제조하였다:

주형 85.6 ㎕

5' 절편 2' MOE PS 43.5 ㎕

중심 절편 PS 46.8 ㎕

3' 절편 2' MOE PS 40.1 ㎕

DTT 1M 8 ㎕

MgCl₂ 1M 4 ㎕

NAD (50 mM) 1.6 ㎕

트리스 0.5 M 80 ㎕

물 490.4 ㎕

각각의 고정화된 단백질 (40 ㎕, 50% 펄로자 비드 슬러리)을 PCR 튜브에 피펫팅하였다. 비드를 원심분리에 의해 펠렛화하고, 상등액을 피펫팅에 의해 제거하였다. 검정 믹스 (40 ㎕)를 각각의 반응물에 첨가하였다 (최종 반응물은 20 μM의 각각의 절편 및 주형, 50 mM 트리스-HCl, 10 mM MgCl₂, 1 mM ATP 또는 100 μM NAD, 10 mM DTT, pH 7.5, 및 펄로자 비드 상의 40 ㎕의 리가제를 함유함). 단백질을 함유하지 않는 반응물을 음성 대조군으로 사용하였다. 반응물을 18시간 동안 30℃에서 인큐베이션한 후, 10분 동안 95℃로 가열함으로써 켄칭하였다. 침전된 단백질을 원심분리에 의해 제거하고, 샘플을 HPLC에 의해 분석하였다.

12.3 결과 및 결론

생성물, 주형 및 절편 올리고뉴클레오티드는 대조군 크로마토그램에서 명확하게 분해되었으며, 라이게이션이 관찰되지 않았다. 리가제 반응물의 HPLC 분석은 모든 단백질이 5' 절편 및 중심 절편의 성공적인 라이게이션을 촉매하여 중간체 생성물을 형성시켰지만, 오직 일부 리가제만이 모든 3개의 절편의 라이게이션을 촉매하여 표 20에 기재된 바와 같은 전장 생성물을 수득하였음을 나타내었다. 스타필로코쿠스 아우레우스 (SaNAD, 서열식별번호: 61)로부터의 NAD 의존적 리가제는 가장 완전한 길이의 생성물을 수득하였다. 생성물 수율을 개선시키기 위한 최적화가 가능하고, 통상의 기술자의 기술 범위 내에 있다.

<표 20>

* 반응에서 소비되지 않고 내부 표준으로서 작용하는 주형에 대한 HPLC 피크 면적으로부터 전환율을 계산하였다. 전환율 = 생성물 면적/ (주형 + 생성물 면적)*100

실시예 13: 반연속적인 라이게이션 반응

13.1 재료

N-말단에서 CBD에 융합된 돌연변이체 스타필로코쿠스 아우레우스 리가제 (NAD-14)를 표준 클로닝, 발현 및 추출 방법을 사용하여 생성하였다. 그 후, CBD-NAD-14 돌연변이체 리가제를 펄로자 비드에 결합시켰다: 50 ml의 단백질 용해물을 7.5 ml 펄로자 비드에 첨가하고, 실온에서 1시간 동안 인큐베이션한 후, 비드를 유리 컬럼 (바이오라드(BioRad) 이코노-컬럼(Econo-Column) 10 cm 길이, 2.5 cm 직경 #7372512)에 수집하였다. 비드를 200 ml 완충제 Y (50 mM 트리스8, 500 mM NaCl, 0.1% 트윈 20, 10% 글리세롤)로 세척한 후, 200 ml 완충제 Z (50 mM 트리스8, 200 mM NaCl, 0.1% 트윈 20, 10% 글리세롤) 및 200 ml PBS로 세척하였다. 비드 상의 돌연변이체 NAD-14 리가제의 추정된 농도는 비드 ml 당 69 μM의 리가제였다.

하기 주형 DNA 올리고뉴클레오티드 및 절편 올리고뉴클레오티드 (표 21)를 표준 고체상 방법에 의해 합성하였다.

<표 21>

(p) = 포스페이트, mX = MOE 염기, dX = DNA 염기

모두 5-메틸 피리미딘

모든 연결은 포스포디에스테르 연결이다.

"허브"라고 지칭되는 지지체 물질 및 3개의 주형 서열을 포함하는 "트리-주형 허브" (대략 24 kDa)를 생성하였다 (도 11). 주형의 각각의 카피를 자체 개별 부착점에서 "허브"에 공유결합으로 부착하였다. "트리-주형 허브" 분자는 표적 (생성물) 올리고뉴클레오티드 (주형 서열과 100% 상보적)보다 더 높은 분자량을 가지며, 이에 의해 불순물 및 생성물이 반응 혼합물로부터 분리될 때 이를 유지되게 할 수 있다. 이 특정 경우, 주형 서열은 서열식별번호: 30이고, 3개의 카피가 허브에 부착되었다는 것에 주목해야 한다. 다음 실시예에서, 상이한 주형 서열을 갖는 트리-주형 허브를 또한 생성하였다. 따라서, 주형 서열이 실시예마다 다르기 때문에, 트리-주형 허브도 마찬가지이다.

하기 반응 믹스 (총 부피 5 ml)를 제조하였다:

250 ㎕ 1 M KH₂PO₄, pH 7.5 (50 mM 최종)

108 ㎕ 0.07011 M 중심 절편 (1.5 mM 최종)

137 ㎕ 0.05481 M 3'-절편 (1.5 mM 최종)

168 ㎕ 0.04461 M 5'-절편 (1.5 mM 최종)

750 ㎕ 0.00387M 허브 (주형) (0.55 mM 최종)

350 ㎕ 50 mM NAD⁺ (3.5 mM 최종)

1000 ㎕ 50 mM MgCl₂ (10 mM 최종)

2237 ㎕ 뉴클레아제 무함유 H₂O

13.2 방법

반연속적인 시스템을 도 12에 나타낸 바와 같이 설정하였다.

4 ml의 펄로자 비드 및 고정화된 돌연변이체 NAD-14 리가제를 파마시아(Pharmacia) XK16 컬럼 (B)에 충전하였다. 컬럼 물 구획을 사용하여 컬럼의 온도를 30℃에서 유지시키기 위해 수조 및 연동 펌프 (C)를 사용하였다. pH 7.5에서 50 mM KH₂PO₄를 함유하는 120 ml (30x 컬럼 부피)의 완충제를 120분 동안 1 ml/분에서 실행시킴으로써 비드를 평형화시켰다. 파마시아 XK16 컬럼을 통한 유동을 생성하기 위해 AKTA 익스플로러(explorer) 펌프 A1 (A)을 사용하였다.

컬럼 평형화 후, 5 ml 반응 믹스 (볼텍싱에 의해 잘 혼합됨)를 컬럼 상에 로딩하고, 저장소 튜브 (D)에 수집하고, AKTA 익스플로러 A1 펌프를 사용하여 컬럼을 통해 재순환시켰다. 반응 믹스를 16시간 동안 연속적인 순환 방식으로 1 ml/분의 유속으로 시스템을 통해 재순환시켰다. HPLC 분석을 위해 30분, 60분, 90분, 4시간, 5시간, 6시간, 7시간, 14시간 및 16시간 후 샘플을 수집하였다.

13.3 결과 및 결론

<표 22>

각각의 절편, 중간체 및 생성물의 백분율은 트리-주형 허브 피크 면적에 대한 피크 면적 분율로서 표시한다.

결론적으로, 반연속적인 유동 반응이 작동하였고, 16시간 후에 반응이 거의 완료되었다.

실시예 14: 여과에 의한 상이한 크기의 올리고뉴클레오티드의 분리: a) 20-머 올리고뉴클레오티드 (서열식별번호: 1) 및 3개의 비상보적 20-머 올리고뉴클레오티드 (서열식별번호: 30)를 포함하는 허브의 분리; (b) 절편 6-머 및 8-머 올리고뉴클레오티드 (표 1 참조) 및 3개의 상보적 20-머 올리고뉴클레오티드 (서열식별번호: 2)를 포함하는 허브로부터 20-머 올리고뉴클레오티드 (서열식별번호: 1)의 분리

14.1 재료

사용된 모든 올리고뉴클레오티드는 표준 고체상 방법에 의해 합성하였다.

13.1 (도 11)에 기재된 바와 같은 트리-주형 허브를 사용하였다.

표 23 및 24에 나타낸 바와 같이 다양한 분자량 컷오프 및 상이한 제조사의 다양한 필터를 사용하였다.

14.2 방법

14.2.1 중합체 막의 스크리닝을 위한 데드-엔드 여과 설정 및 프로토콜: (프로토콜 1)

자성 교반기 및 핫플레이트 상에 놓인 수조에 위치된 MET 데드-엔드 여과 셀을 포함하는 데드-엔드 여과 기구를 도 13에 나타낸 바와 같이 설정하였다. 셀 내부 압력은 질소 유동으로부터 제공되었다.

시험될 막 (14 ㎠)의 쿠폰을 먼저 적절한 크기로 절단하고, 셀에 위치시켰다. 막을 먼저 HPLC 등급 물 (200 ml)로 컨디셔닝한 후, PBS 완충제 (200 ml)로 컨디셔닝하였다. 그 후, 셀을 감압하고, 나머지 PBS 용액을 제거하고, 올리고뉴클레오티드를 함유하는 용액 (1 g/L 농도의 PBS 중 40 ml의 올리고뉴클레오티드)으로 대체하였다. 셀을 교반기 핫플레이트 상에 위치시키고, 자성 진탕을 사용하여 교반하면서 용액을 목적 온도로 가열하였다. 셀에 압력을 가하였다 (대략 3.0 bar를 목표로 하며; 실제 압력은 각각의 경우에 기록됨). 용액의 교반을 정지시키거나 계속하고, 투과물 용액을 수집하고 (대략 20 ml), HPLC에 의해 분석하였다. 플럭스를 기록하였다. 그 후, 시스템을 감압시켜, 체류물 용액의 샘플링 및 HPLC에 의한 분석을 허용하였다. 그 후, 추가 PBS 완충제 (20 ml)을 여과 셀에 첨가하고, 이전 절차를 3회 반복하였다. 최종적으로 막을 PBS 완충제로 세척하였다.

모든 샘플을 어떠한 희석 없이 HPLC에 의해 분석하였다.

14.2.2 중합체 막의 스크리닝을 위한 크로스-플로우 여과 설정 및 프로토콜: (프로토콜 2)

크로스-플로우 여과 기구를 도 14에 나타낸 바와 같이 설정하였다. 원뿔형 플라스크로 이루어진 공급 용기 (1)는 정제될 올리고뉴클레오티드 용액을 함유하였다. 핫 플레이트 (3)를 사용하여 셀 내의 온도를 유지하면서 용액을 HPLC 펌프 (2)를 사용하여 크로스-플로우 여과 셀 (4)로 펌핑하였다. 기어 펌프 (6)를 사용하여 셀 내의 용액을 재순환시켰다. 압력 게이지 (5)를 통해 실험 동안 압력을 판독할 수 있었다. 투과물 용액을 투과물 수집 용기 (8)로부터 샘플링하면서, 체류물 용액의 샘플을 샘플링 밸브 (7)로부터 취하였다.

시험될 막의 쿠폰을 먼저 적절한 크기로 절단하고, 셀에 위치시켰다. 시스템을 PBS 용액 (100 ml)으로 세척하였다. 용액의 온도를 목적 설정 점으로 조정하였다. PBS 중 올리고뉴클레오티드 생성물을 함유하는 용액 (1 g/L에서 7.5 ml)을 시스템에 공급하였다. 그 후, HPLC 펌프를 사용하여 투과물 용액의 유속 (전형적으로 3 ml/분)과 일치하는 유속으로 PBS 용액을 시스템으로 펌핑하였다. 압력 게이지를 사용하여 압력을 기록하였다. 5개의 투석여과 부피마다 HPLC 분석을 위해 체류물 용액을 샘플링하였다. 투석여과 부피마다 HPLC 분석을 위해 투과물 용액을 샘플링하였다. 20개의 투석여과 부피 후 실험을 정지시켰다.

5 kDa 분자량 컷오프를 갖는 스나이더 막 (로트 번호 120915R2) 및 서열식별번호: 46 및 서열식별번호: 30을 사용하는 실험의 경우, 상기 방법을 다음과 같이 변형하였다. 시험될 막의 쿠폰을 먼저 적절한 크기로 절단하고, 셀에 위치시켰다. 시스템을 인산칼륨 용액 (100 ml, 50 mM, pH 7.5)으로 세척하였다. 용액의 온도를 목적 설정 점으로 조정하였다. 인산칼륨 중 올리고뉴클레오티드 생성물을 함유하는 용액 (대략 1 g/L)을 에틸렌디아민테트라아세트산 (EDTA) (230 ㎕의 500 mM 용액)에 첨가하였다. 그 후, 용액을 시스템에 공급하였다. 그 후, HPLC 펌프를 사용하여 투과물 용액의 유속 (전형적으로 4 ml/분)과 일치하는 유속으로 인산칼륨 완충제를 시스템으로 펌핑하였다. 압력 게이지를 사용하여 압력을 기록하였다. 5개의 투석여과 부피마다 HPLC 분석을 위해 체류물 용액을 샘플링하였다. 투석여과 부피마다 HPLC 분석을 위해 투과물 용액을 샘플링하였다. 15개의 투석여과 부피 후 실험을 정지시켰다.

14.3 결과

<표 23>

MWCO = 분자량 컷오프

60℃에서 10 kDa MWCO NADIR 막을 사용한 실험에서, 생성물 서열 (서열식별번호: 1) 및 비상보적 트리-주형 허브 (서열식별번호: 30 포함) 사이의 명확한 분리가 입증되었다. 도 15는 a) 2개의 투석여과 부피 후 여과 셀에 남아있고 주로 트리-주형 허브를 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물이 풍부한 투과물 용액의 크로마토그램을 나타낸다.

<표 24>

MWCO = 분자량 컷오프

* 용질의 농도가 너무 낮아 의미있는 분석을 방지함

50℃ 및 3.0 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 실험에서, 절편 서열 (표 1 참조) 및 상보적 트리-주형 허브 (서열식별번호: 2 포함) 및 생성물 (서열식별번호: 1) 사이의 명확한 분리가 입증되었다. 도 16은 a) 20개의 투석여과 부피 후 주로 트리-주형 허브 및 생성물을 함유한 체류물 용액의 크로마토그램; 및 b) 20개의 투석여과 부피 후 주로 절편 올리고뉴클레오티드를 함유한 투과물의 크로마토그램을 나타낸다.

80℃ 및 3.1 bar 압력에서 5 kDa MWCO 스나이더 막을 사용한 실험에서, 상보적 트리-주형 허브 (서열식별번호: 2 포함) 및 생성물 (서열식별번호: 1) 사이의 명확한 분리가 입증되었다. 도 17은 a) 20개의 투석여과 부피 후 트리-주형 허브만을 함유한 체류물 용액의 크로마토그램; 및 b) 2개의 투석여과 부피 후 생성물만을 함유한 투과물 용액의 크로마토그램을 나타낸다.

14.4 결론

여과를 사용하여 상이한 길이 및 분자량의 올리고뉴클레오티드를 분리할 수 있다. 상기 나타낸 바와 같이, 막의 유형 및 조건, 예컨대 온도는 분리 수준에 영향을 미친다. 상이한 길이/분자량의 올리고뉴클레오티드의 주어진 세트에 대해, 요구되는 분리를 허용하기 위해 적합한 막 및 조건을 선택할 수 있다. 예를 들어, 본 발명자들은 표 1에 요약된 바와 같은 절편 올리고뉴클레오티드 (6 및 8개의 뉴클레오티드 길이의 짧은 다량체)가 생성물 올리고뉴클레오티드 (서열식별번호: 1을 갖는 20-머 올리고뉴클레오티드) 및 트리-주형 허브 (고체 지지체에 부착된 서열식별번호: 2의 3 x 20-머를 포함함)로부터 분리될 수 있고, 생성물 올리고뉴클레오티드 및 트리-주형 허브가 차례로 서로로부터 분리될 수 있음을 입증하였다.

실시예 15: 2'-OMe 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis로 이루어진 히스티딘 태그에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.

리가제를 마지막으로 첨가하여 하기 표 25에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 85의 존재에 대해 HPLC에 의해 분석하였다.

<표 25>

<표 26>

*생성물로의 전환율 (%) - 파장 258 nm에서의 프라이머 N 피크 vs. 생성물 N+1(pi) 피크의 면적 %

실시예 16: 2'-OMe 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

리가제를 마지막으로 첨가하여 하기 표 27에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 85의 존재에 대해 HPLC에 의해 분석하였다.

<표 27>

<표 28>

실시예 17: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

리가제를 마지막으로 첨가하여 하기 표 29에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.

<표 29>

<표 30>

실시예 18: 2'H 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

리가제를 마지막으로 첨가하여 하기 표 31에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.

<표 31>

<표 32>

실시예 19: 2'MOE 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

야생형 ss리가제 (서열식별번호: 63 내지 83)를 N-말단에서 6xHis에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다.

리가제를 마지막으로 첨가하여 하기 표 33에 따라 반응을 설정하였다. 반응물을 25℃에서 20시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.

<표 33>

<표 34>

실시예 20: 2'OMe 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장의 최적화

야생형 ss리가제 (서열식별번호: 67)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.

리가제를 마지막으로 첨가하여 하기 표 35에 따라 반응을 설정하였다. 반응물을 25℃에서 18시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 85의 존재에 대해 HPLC에 의해 분석하였다.

<표 35>

<표 36>

실시예 21: 2'MOE 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장의 최적화

리가제를 마지막으로 첨가하여 하기 표 37에 따라 반응을 설정하였다. 반응물을 25℃에서 12시간 동안 인큐베이션하였다. 그 후, 반응물을 15분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.

<표 37>

<표 38>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 87 피크의 면적 %

실시예 22: WT를 돌연변이체와 비교하는 반응 - 2'MOE 염기 변형 및 포스페이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

야생형 또는 돌연변이체 ss리가제 (서열식별번호: 67 및 88 내지 92)를 N-말단에서 6xHis에 각각 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.

리가제를 마지막으로 첨가하여 하기 표 39에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.

<표 39>

<표 40>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 vs. 서열식별번호: 87 피크의 면적 %

실시예 23: WT를 돌연변이체와 비교하는 반응 - 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장

리가제를 마지막으로 첨가하여 하기 표 41에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC에 의해 분석하였다.

<표 41>

<표 42>

실시예 24: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장 - 아데노신

돌연변이체 ss리가제 (서열식별번호: 88)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.

리가제를 마지막으로 첨가하여 하기 표 43에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.

<표 43>

<표 44>

실시예 25: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장 - 5-메틸시티딘

리가제를 마지막으로 첨가하여 하기 표 45에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 93의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.

<표 45>

<표 46>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 93 피크의 면적 %

실시예 26: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장 - 티미딘

리가제를 마지막으로 첨가하여 하기 표 47에 따라 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 94의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.

<표 47>

<표 48>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 86 피크 vs. 서열식별번호: 94 피크의 면적 %

실시예 27: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 올리고뉴클레오티드 합성을 위한 단일 염기 라이게이션에 의한 3' 연장, 이어서 3' 탈인산화 및 제2 단일 염기 라이게이션 및 제2 탈인산화 - 반응 순서.

돌연변이체 ss리가제 (서열식별번호: 88) 및 야생형 포스파타제 (서열식별번호: 95)를 N-말단에서 6xHis에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) Star에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 Ni-NTA를 사용하여 단백질을 정제하고 직접 사용하였다. 단백질 농도를 미세유체 모세관 전기영동을 통해 결정하였다.

리가제를 마지막으로 첨가하여 하기 표 49에 따라 제1 라이게이션 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 87의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다. 반응물의 나머지를 이온-교환 크로마토그래피에 의해 정제하고, 동결건조시키고, 제1 탈보호 (즉, 탈인산화)에서 직접 사용하였다.

<표 49>

<표 50>

포스파타제를 마지막으로 첨가하여 하기 표 51에 따라 제1 탈보호/탈인산화 반응을 설정하였다. 반응물을 37℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 96의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다. 반응물의 나머지를 이온-교환 크로마토그래피에 의해 정제하고, 동결건조시키고, 제2 라이게이션 반응에서 직접 사용하였다.

<표 51>

<표 52>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 85 피크 vs. 서열식별번호: 96 피크의 면적 %

리가제를 마지막으로 첨가하여 하기 표 53에 따라 제2 라이게이션 반응을 설정하였다. 반응물을 25℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 96의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다. 반응물의 나머지를 이온-교환 크로마토그래피에 의해 정제하고, 동결건조시키고, 제2 탈보호/탈인산화 반응에서 직접 사용하였다.

<표 53>

<표 54>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 97 피크 vs. 서열식별번호: 96 피크의 면적 %

포스파타제를 마지막으로 첨가하여 하기 표 55에 따라 제2 탈보호/탈인산화 반응을 설정하였다. 반응물을 37℃에서 24시간 동안 인큐베이션하였다. 그 후, 반응물을 30분 동안 70℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 98의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.

<표 55>

<표 56>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 97 피크 vs. 서열식별번호: 98 피크의 면적 %

실시예 28: 2'MOE 염기 변형 및 포스포로티오에이트 연결을 갖는 절편 또는 생성물 올리고뉴클레오티드 서열의 방출을 위한 엔도뉴클레아제에 의한 특이적 쇄 절단

야생형 엔도뉴클레아제 (서열식별번호: 100)를 N-말단에서 CBD에 융합시켰다. 유전자를 합성하고, 표준 클로닝, 발현 및 추출 방법을 사용하여 이. 콜라이 BL21(DE3) A1에서 생성된 유전자를 코딩하는 단백질 및 pET28a로 클로닝하였다. 표준 방법을 사용하여 비드 셀룰로스에 결합시킨 후 TEV 프로테아제로 절단함으로써 단백질을 정제하고 직접 사용하였다.

엔도뉴클레아제를 마지막으로 첨가하여 하기 표 58에 따라 반응을 설정하였다. 반응물을 65℃에서 16시간 동안 인큐베이션하였다. 그 후, 반응물을 5분 동안 95℃로 가열함으로써 켄칭하고, 4000 x g에서 15분 동안 원심분리하고, 10 ㎕의 상등액을 HPLC 바이알로 이동시켰다. 그 후, 반응물을 서열식별번호: 101 및 ACTIA (표 57에 기재된 특정 변형)의 존재에 대해 HPLC 및 LCMS에 의해 분석하였다.

<표 57>

<표 58>

<표 59>

*생성물로의 전환율 (%) - 파장 258 nm에서의 서열식별번호: 100 피크 vs. 서열식별번호: 101 및 ACTIA 피크의 면적 %

전반적인 결론

본 발명자들은 간단한 물 및 공기 안정한 뉴클레오시드 유도체로부터 출발하여 먼저 RNA 리가제 효소를 사용하여 짧은 올리고뉴클레오티드 절편을 생성하고 둘째로 상보적 주형 상에 짧은 절편을 어셈블리함으로써, 치료적으로 관련된 다양한 화학적 변형을 갖는 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드를 용액에서 효소적으로 합성할 수 있음을 보여주었다. 그 후, 절편은 함께 라이게이션되어, 생성물 올리고뉴클레오티드를 생성할 수 있으며, 이는 대규모 치료용 올리고뉴클레오티드 제조에 적합하고 확장가능한 효율적인 공정으로 불순물 및 그의 상보적 주형 둘 모두로부터 분리될 수 있다.

용액에서 올리고뉴클레오티드를 합성함으로써, 본 발명자들은 고체상 방법에 의해 부과되는 스케일 업 구속을 회피하였다. 상보적 서열의 충실도 및 상보적 서열의 길이 둘 모두를 반영하는 친화성으로 상보적 서열을 특이적으로 인식하고 상보적 서열에 결합하는 DNA의 고유의 특성을 사용함에 있어서, 본 발명자들은 크로마토그래피에 대한 필요성 없이 고순도의 올리고뉴클레오티드를 생성할 수 있었으며, 이는 생산 공정의 효율 및 공정의 확장성 둘 모두를 개선시킨다. 분리 공정 동안 주형을 비변화된 상태로 회수함으로써, 본 발명자들은 합성의 추가 라운드를 위해 주형을 재사용할 수 있어, 형성된 생성물 올리고뉴클레오티드의 모든 등가물에 대해 주형의 하나의 등가물을 제조해야 하는 경제적 결과를 회피하였다.

최종적으로, 야생형 리가제가 정상적인 DNA 및 RNA를 효과적으로 라이게이션하는 것으로 공지되어 있지만, 본 발명자들은 DNA 또는 RNA에 대한 변형이 저하된 라이게이션 효율을 야기하고, DNA 또는 RNA에 대한 다수의 변형이 라이게이션의 효율을 저하시키는 효과에 부가적이며, 이는 일부 경우에 DNA 또는 RNA 리가제가 완전히 효과적이지 못하게 할 수 있음을 보여주었다. 본 발명자들은 DNA 및 RNA 리가제의 적절한 돌연변이 및 진화에 의해, 라이게이션 효율이 회복될 수 있고, 적절하게 변형된 DNA 및 RNA 리가제가 다수의 변형을 함유하는 올리고뉴클레오티드를 합성하기 위한 효과적인 촉매임을 보여주었다.

<서열 목록>

SEQUENCE LISTING <110> GlaxoSmithKline Intellectual Property Development Limited <120> Novel processes for the production of oligonucleotides <130> PB66490 <150> 1721307.5 <151> 2017-12-19 <160> 101 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Example 1 desired product oligonucleotide sequence ("target") <400> 1 ggccaaacct cggcttacct 20 <210> 2 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 1-4, 6, 10 and 11 template oligonucleotide sequence <400> 2 tttaggtaag ccgaggtttg gcc 23 <210> 3 <211> 487 <212> PRT <213> enterobacteria phage T4 <400> 3 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 4 <211> 488 <212> PRT <213> Artificial Sequence <220> <223> Wild type T4 DNA ligase protein sequence (when fused to CBD) <400> 4 Gly Ser Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr 1 5 10 15 Lys Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu 20 25 30 Lys Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile 35 40 45 Lys Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu 50 55 60 Thr Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg 65 70 75 80 Lys Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr 85 90 95 Asp Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg 100 105 110 Asp Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro 115 120 125 Gly Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu 130 135 140 Lys Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys 145 150 155 160 Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp 165 170 175 Asp Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp 180 185 190 Leu Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile 195 200 205 His Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln 210 215 220 Val Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro 225 230 235 240 Glu Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr 245 250 255 Ala Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu 260 265 270 Lys Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu 275 280 285 Val Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg 290 295 300 Phe Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu 305 310 315 320 Ile Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr 325 330 335 Lys Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile 340 345 350 Asp Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys 355 360 365 Glu Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg 370 375 380 Lys Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly 385 390 395 400 Lys Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val 405 410 415 Lys Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr 420 425 430 Tyr Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser 435 440 445 Asp Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg 450 455 460 Leu Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly 465 470 475 480 Asp Phe His Glu Val Thr Gly Leu 485 <210> 5 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Example 2 target sequence <400> 5 ggccaaaccu cggcuuaccu 20 <210> 6 <211> 482 <212> PRT <213> Enterobacteria phase CC31 <400> 6 Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp 50 55 60 Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly 65 70 75 80 Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp 85 90 95 Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys 100 105 110 Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro 115 120 125 Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu 130 135 140 Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala 145 150 155 160 Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile 165 170 175 Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln 180 185 190 Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly 195 200 205 Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala 210 215 220 Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala 225 230 235 240 Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn 245 250 255 Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys 260 265 270 Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly 275 280 285 Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu 290 295 300 Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val 305 310 315 320 His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu 325 330 335 Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn 340 345 350 Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Thr Ile Asp 355 360 365 Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala 370 375 380 Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala 385 390 395 400 Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp 405 410 415 Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu 420 425 430 Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr 435 440 445 Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp 450 455 460 Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr 465 470 475 480 Gly Leu <210> 7 <211> 483 <212> PRT <213> Artificial Sequence <220> <223> Wild-type Enterobacteria phage CC31 DNA ligase protein sequence (when fused to CBD) <400> 7 Gly Ser Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr 1 5 10 15 Lys Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu 20 25 30 Lys Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile 35 40 45 Lys Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu 50 55 60 Asp Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr 65 70 75 80 Gly Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser 85 90 95 Asp Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg 100 105 110 Cys Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile 115 120 125 Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile 130 135 140 Glu Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly 145 150 155 160 Ala Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys 165 170 175 Ile Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys 180 185 190 Gln Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly 195 200 205 Gly Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro 210 215 220 Ala Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys 225 230 235 240 Ala Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala 245 250 255 Asn Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met 260 265 270 Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu 275 280 285 Gly Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu 290 295 300 Leu Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile 305 310 315 320 Val His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp 325 330 335 Glu Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu 340 345 350 Asn Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu Val Ile Thr Ile 355 360 365 Asp Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys 370 375 380 Ala Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys 385 390 395 400 Ala Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu 405 410 415 Asp Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val 420 425 430 Leu Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp 435 440 445 Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys 450 455 460 Asp Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val 465 470 475 480 Thr Gly Leu <210> 8 <211> 497 <212> PRT <213> Shigella phage Shf125875 <400> 8 Met Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr Lys 1 5 10 15 Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu Glu 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu Glu 50 55 60 Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala Asp 85 90 95 Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu Lys 130 135 140 Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln Phe 165 170 175 Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala Asp 180 185 190 Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn Gly 195 200 205 Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys Lys 210 215 220 Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn Glu 225 230 235 240 Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly Leu 245 250 255 Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu Gly 260 265 270 Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr Ser 275 280 285 Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala Leu 290 295 300 Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn Gln 305 310 315 320 Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr Val 325 330 335 Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr Trp 340 345 350 Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Glu Val Ile Asp 355 360 365 Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro Asn 370 375 380 Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr Thr 385 390 395 400 Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp Gly 405 410 415 Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg Glu 420 425 430 Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile Ala 435 440 445 Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly Thr 450 455 460 Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys Thr 465 470 475 480 Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr Gly 485 490 495 Leu <210> 9 <211> 498 <212> PRT <213> Artificial Sequence <220> <223> Wild-type Shigella phage Shf125875 DNA ligase protein sequence (when fused to CBD) <400> 9 Gly Ser Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr 1 5 10 15 Lys Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu 20 25 30 Glu Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile 35 40 45 Lys Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu 50 55 60 Glu Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg 65 70 75 80 Lys Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala 85 90 95 Asp Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg 100 105 110 Asp Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro 115 120 125 Gly Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu 130 135 140 Lys Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys 145 150 155 160 Ala Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln 165 170 175 Phe Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala 180 185 190 Asp Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn 195 200 205 Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys 210 215 220 Lys Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn 225 230 235 240 Glu Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly 245 250 255 Leu Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu 260 265 270 Gly Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr 275 280 285 Ser Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala 290 295 300 Leu Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn 305 310 315 320 Gln Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr 325 330 335 Val Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr 340 345 350 Trp Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Glu Val Ile 355 360 365 Asp Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro 370 375 380 Asn Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr 385 390 395 400 Thr Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp 405 410 415 Gly Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg 420 425 430 Glu Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile 435 440 445 Ala Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly 450 455 460 Thr Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys 465 470 475 480 Thr Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr 485 490 495 Gly Leu <210> 10 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 10 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg 355 360 365 Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 11 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 11 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly 355 360 365 Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 12 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 12 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys 355 360 365 Val Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 13 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 13 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Val Ile Leu Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 14 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 14 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Val Ile Lys Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 15 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 15 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Val Ile Gln Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 16 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 16 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Val Ile Val Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 17 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 17 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Val Ile Arg Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 18 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 18 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Ala Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 19 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 19 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Glu 355 360 365 Lys Ile Asp Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 20 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 20 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg 355 360 365 Val Ile Val Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 21 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 21 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys 355 360 365 Val Ile Glu Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 22 <211> 487 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (T4 backbone) protein sequence <400> 22 Met Ile Leu Lys Ile Leu Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Gln Lys Gln Ala Ile Leu Glu Lys Asn Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ser Arg Gly Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Lys Pro Gly Ile Ala Thr Gln Ser Phe Gly Met Leu Thr 50 55 60 Leu Thr Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Glu Glu Leu Thr Gly Tyr Ile Thr Asp 85 90 95 Gly Lys Lys Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Cys Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Pro Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys 130 135 140 Gly Ile Asn Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp 165 170 175 Val Arg Leu Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu 180 185 190 Leu Lys Glu Glu Leu Ile Lys Met Thr Ala Glu Ala Arg Gln Ile His 195 200 205 Pro Glu Gly Val Leu Ile Asp Gly Glu Leu Val Tyr His Glu Gln Val 210 215 220 Lys Lys Glu Pro Glu Gly Leu Asp Phe Leu Phe Asp Ala Tyr Pro Glu 225 230 235 240 Asn Ser Lys Ala Lys Glu Phe Ala Glu Val Ala Glu Ser Arg Thr Ala 245 250 255 Ser Asn Gly Ile Ala Asn Lys Ser Leu Lys Gly Thr Ile Ser Glu Lys 260 265 270 Glu Ala Gln Cys Met Lys Phe Gln Val Trp Asp Tyr Val Pro Leu Val 275 280 285 Glu Ile Tyr Ser Leu Pro Ala Phe Arg Leu Lys Tyr Asp Val Arg Phe 290 295 300 Ser Lys Leu Glu Gln Met Thr Ser Gly Tyr Asp Lys Val Ile Leu Ile 305 310 315 320 Glu Asn Gln Val Val Asn Asn Leu Asp Glu Ala Lys Val Ile Tyr Lys 325 330 335 Lys Tyr Ile Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Asp 340 345 350 Gly Leu Trp Glu Asn Ala Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys 355 360 365 Val Ile His Val Asp Leu Lys Ile Val Gly Ile Tyr Pro His Arg Lys 370 375 380 Asp Pro Thr Lys Ala Gly Gly Phe Ile Leu Glu Ser Glu Cys Gly Lys 385 390 395 400 Ile Lys Val Asn Ala Gly Ser Gly Leu Lys Asp Lys Ala Gly Val Lys 405 410 415 Ser His Glu Leu Asp Arg Thr Arg Ile Met Glu Asn Gln Asn Tyr Tyr 420 425 430 Ile Gly Lys Ile Leu Glu Cys Glu Cys Asn Gly Trp Leu Lys Ser Asp 435 440 445 Gly Arg Thr Asp Tyr Val Lys Leu Phe Leu Pro Ile Ala Ile Arg Leu 450 455 460 Arg Glu Asp Lys Thr Lys Ala Asn Thr Phe Glu Asp Val Phe Gly Asp 465 470 475 480 Phe His Glu Val Thr Gly Leu 485 <210> 23 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Enterobacteria phage CC31 backbone - clone A4) protein sequence <400> 23 Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp 50 55 60 Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly 65 70 75 80 Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp 85 90 95 Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys 100 105 110 Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro 115 120 125 Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu 130 135 140 Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala 145 150 155 160 Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile 165 170 175 Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln 180 185 190 Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly 195 200 205 Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala 210 215 220 Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala 225 230 235 240 Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn 245 250 255 Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys 260 265 270 Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly 275 280 285 Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu 290 295 300 Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val 305 310 315 320 His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu 325 330 335 Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn 340 345 350 Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg Val Ile Val Ile Asp 355 360 365 Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala 370 375 380 Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala 385 390 395 400 Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp 405 410 415 Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu 420 425 430 Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr 435 440 445 Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp 450 455 460 Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr 465 470 475 480 Gly Leu <210> 24 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Enterobacteria phage CC31 backbone) protein sequence <400> 24 Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp 50 55 60 Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly 65 70 75 80 Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp 85 90 95 Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys 100 105 110 Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro 115 120 125 Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu 130 135 140 Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala 145 150 155 160 Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile 165 170 175 Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln 180 185 190 Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly 195 200 205 Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala 210 215 220 Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala 225 230 235 240 Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn 245 250 255 Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys 260 265 270 Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly 275 280 285 Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu 290 295 300 Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val 305 310 315 320 His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu 325 330 335 Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn 340 345 350 Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Lys Val Ile Lys Ile Asp 355 360 365 Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala 370 375 380 Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala 385 390 395 400 Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp 405 410 415 Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu 420 425 430 Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr 435 440 445 Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp 450 455 460 Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr 465 470 475 480 Gly Leu <210> 25 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Enterobacteria phage CC31 backbone) protein sequence <400> 25 Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp 50 55 60 Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly 65 70 75 80 Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp 85 90 95 Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys 100 105 110 Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro 115 120 125 Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu 130 135 140 Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala 145 150 155 160 Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile 165 170 175 Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln 180 185 190 Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly 195 200 205 Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala 210 215 220 Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala 225 230 235 240 Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn 245 250 255 Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys 260 265 270 Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly 275 280 285 Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu 290 295 300 Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val 305 310 315 320 His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu 325 330 335 Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn 340 345 350 Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly Val Ile Phe Ile Asp 355 360 365 Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala 370 375 380 Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala 385 390 395 400 Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp 405 410 415 Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu 420 425 430 Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr 435 440 445 Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp 450 455 460 Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr 465 470 475 480 Gly Leu <210> 26 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Enterobacteria phage CC31 backbone) protein sequence <400> 26 Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp 50 55 60 Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly 65 70 75 80 Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp 85 90 95 Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys 100 105 110 Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro 115 120 125 Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu 130 135 140 Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala 145 150 155 160 Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile 165 170 175 Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln 180 185 190 Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly 195 200 205 Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala 210 215 220 Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala 225 230 235 240 Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn 245 250 255 Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys 260 265 270 Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly 275 280 285 Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu 290 295 300 Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val 305 310 315 320 His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu 325 330 335 Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn 340 345 350 Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Gly Val Ile Leu Ile Asp 355 360 365 Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala 370 375 380 Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala 385 390 395 400 Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp 405 410 415 Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu 420 425 430 Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr 435 440 445 Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp 450 455 460 Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr 465 470 475 480 Gly Leu <210> 27 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Enterobacteria phage CC31 backbone) protein sequence <400> 27 Met Ile Leu Asp Ile Ile Asn Glu Ile Ala Ser Ile Gly Ser Thr Lys 1 5 10 15 Glu Lys Glu Ala Ile Ile Arg Arg His Lys Asp Asn Glu Leu Leu Lys 20 25 30 Arg Val Phe Arg Met Thr Tyr Asp Gly Lys Leu Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Asp Thr Arg Pro Lys Gly Asp Ile His Leu Thr Leu Glu Asp 50 55 60 Met Leu Tyr Leu Leu Glu Glu Lys Leu Ala Lys Arg Val Val Thr Gly 65 70 75 80 Asn Ala Ala Lys Glu Lys Leu Glu Ile Ala Leu Ser Gln Thr Ser Asp 85 90 95 Ala Asp Ala Glu Val Val Lys Lys Val Leu Leu Arg Asp Leu Arg Cys 100 105 110 Gly Ala Ser Arg Ser Ile Ala Asn Lys Val Trp Lys Asn Leu Ile Pro 115 120 125 Glu Gln Pro Gln Met Leu Ala Ser Ser Tyr Asp Glu Lys Gly Ile Glu 130 135 140 Lys Asn Ile Lys Phe Pro Ala Phe Ala Gln Leu Lys Ala Asp Gly Ala 145 150 155 160 Arg Ala Phe Ala Glu Val Arg Gly Asp Glu Leu Asp Asp Val Lys Ile 165 170 175 Leu Ser Arg Ala Gly Asn Glu Tyr Leu Gly Leu Asp Leu Leu Lys Gln 180 185 190 Gln Leu Ile Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Gly Gly 195 200 205 Val Met Ile Asp Gly Glu Leu Val Tyr His Ala Ser Thr Leu Pro Ala 210 215 220 Gly Pro Leu Asp Asp Ile Phe Gly Asp Leu Pro Glu Leu Ser Lys Ala 225 230 235 240 Lys Glu Phe Lys Glu Glu Ser Arg Thr Met Ser Asn Gly Leu Ala Asn 245 250 255 Lys Ser Leu Lys Gly Thr Ile Ser Ala Lys Glu Ala Ala Gly Met Lys 260 265 270 Phe Gln Val Trp Asp Tyr Val Pro Leu Asp Val Val Tyr Ser Glu Gly 275 280 285 Lys Gln Ser Gly Phe Ala Tyr Asp Val Arg Phe Arg Ala Leu Glu Leu 290 295 300 Met Val Gln Gly Tyr Ser Gln Met Ile Leu Ile Glu Asn His Ile Val 305 310 315 320 His Asn Leu Asp Glu Ala Lys Val Ile Tyr Arg Lys Tyr Val Asp Glu 325 330 335 Gly Leu Glu Gly Ile Ile Leu Lys Asn Ile Gly Ala Phe Trp Glu Asn 340 345 350 Thr Arg Ser Lys Asn Leu Tyr Lys Phe Lys Arg Val Ile Phe Ile Asp 355 360 365 Leu Arg Ile Val Asp Ile Tyr Glu His Ser Lys Gln Pro Gly Lys Ala 370 375 380 Gly Gly Phe Tyr Leu Glu Ser Glu Cys Gly Leu Ile Lys Val Lys Ala 385 390 395 400 Gly Ser Gly Leu Lys Asp Lys Pro Gly Lys Asp Ala His Glu Leu Asp 405 410 415 Arg Thr Arg Ile Trp Glu Asn Lys Asn Asp Tyr Ile Gly Gly Val Leu 420 425 430 Glu Ser Glu Cys Asn Gly Trp Leu Ala Ala Glu Gly Arg Thr Asp Tyr 435 440 445 Val Lys Leu Phe Leu Pro Ile Ala Ile Lys Met Arg Arg Asp Lys Asp 450 455 460 Val Ala Asn Thr Phe Ala Asp Ile Trp Gly Asp Phe His Glu Val Thr 465 470 475 480 Gly Leu <210> 28 <211> 497 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Shigella phage Shf125875 backbone) protein sequence <400> 28 Met Ile Leu Asp Ile Leu Asn Gln Ile Ala Ala Ile Gly Ser Thr Lys 1 5 10 15 Thr Lys Gln Glu Ile Leu Lys Lys Asn Lys Asp Asn Lys Leu Leu Glu 20 25 30 Arg Val Tyr Arg Leu Thr Tyr Ala Arg Gly Ile Gln Tyr Tyr Ile Lys 35 40 45 Lys Trp Pro Gly Pro Gly Glu Arg Ser Gln Ala Tyr Gly Leu Leu Glu 50 55 60 Leu Asp Asp Met Leu Asp Phe Ile Glu Phe Thr Leu Ala Thr Arg Lys 65 70 75 80 Leu Thr Gly Asn Ala Ala Ile Lys Glu Leu Met Gly Tyr Ile Ala Asp 85 90 95 Gly Lys Pro Asp Asp Val Glu Val Leu Arg Arg Val Met Met Arg Asp 100 105 110 Leu Glu Val Gly Ala Ser Val Ser Ile Ala Asn Lys Val Trp Pro Gly 115 120 125 Leu Ile Gln Leu Gln Pro Gln Met Leu Ala Ser Ala Tyr Asp Glu Lys 130 135 140 Leu Ile Thr Lys Asn Ile Lys Trp Pro Ala Phe Ala Gln Leu Lys Ala 145 150 155 160 Asp Gly Ala Arg Cys Phe Ala Glu Val Arg Asp Asp Gly Val Gln Phe 165 170 175 Phe Ser Arg Ala Gly Asn Glu Tyr His Gly Leu Thr Leu Leu Ala Asp 180 185 190 Glu Leu Met Glu Met Thr Lys Glu Ala Arg Glu Arg His Pro Asn Gly 195 200 205 Val Leu Ile Asp Gly Glu Leu Val Tyr His Ser Phe Asp Ile Lys Lys 210 215 220 Ala Val Ser Ser Gly Asn Asp Leu Ser Phe Leu Phe Gly Asp Asn Glu 225 230 235 240 Glu Ser Glu Glu Val Gln Val Ala Asp Arg Ser Thr Ser Asn Gly Leu 245 250 255 Ala Asn Lys Ser Leu Gln Gly Thr Ile Ser Pro Lys Glu Ala Glu Gly 260 265 270 Met Val Leu Gln Ala Trp Asp Tyr Val Pro Leu Asp Glu Val Tyr Ser 275 280 285 Asp Gly Lys Ile Lys Gly Gln Lys Tyr Asp Val Arg Phe Ala Ala Leu 290 295 300 Glu Asn Met Ala Glu Gly Phe Lys Arg Ile Glu Pro Ile Glu Asn Gln 305 310 315 320 Leu Val His Asn Leu Asp Glu Ala Lys Val Val Tyr Lys Lys Tyr Val 325 330 335 Asp Gln Gly Leu Glu Gly Ile Ile Leu Lys Asn Arg Asp Ser Tyr Trp 340 345 350 Glu Asn Lys Arg Ser Lys Asn Leu Ile Lys Phe Lys Arg Val Ile Val 355 360 365 Ile Ala Leu Glu Val Val Gly Tyr Tyr Glu His Ser Lys Asp Pro Asn 370 375 380 Lys Leu Gly Gly Val Glu Leu Val Ser Arg Cys Arg Arg Ile Thr Thr 385 390 395 400 Asp Cys Gly Ser Gly Phe Lys Asp Thr Thr His Lys Thr Val Asp Gly 405 410 415 Val Lys Val Leu Ile Pro Leu Asp Glu Arg His Asp Leu Asp Arg Glu 420 425 430 Arg Leu Met Ala Glu Ala Arg Glu Gly Lys Leu Ile Gly Arg Ile Ala 435 440 445 Asp Cys Glu Cys Asn Gly Trp Val His Ser Lys Gly Arg Glu Gly Thr 450 455 460 Val Gly Ile Phe Leu Pro Ile Ile Lys Gly Phe Arg Phe Asp Lys Thr 465 470 475 480 Glu Ala Asp Ser Phe Glu Asp Val Phe Gly Pro Trp Ser Gln Thr Gly 485 490 495 Leu <210> 29 <211> 298 <212> PRT <213> Paramecium bursaria Chlorella virus PBCV-1 <400> 29 Met Ala Ile Thr Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Ile Glu 1 5 10 15 Asp Val Gln Phe Pro Cys Leu Ala Thr Pro Lys Ile Asp Gly Ile Arg 20 25 30 Ser Val Lys Gln Thr Gln Met Leu Ser Arg Thr Phe Lys Pro Ile Arg 35 40 45 Asn Ser Val Met Asn Arg Leu Leu Thr Glu Leu Leu Pro Glu Gly Ser 50 55 60 Asp Gly Glu Ile Ser Ile Glu Gly Ala Thr Phe Gln Asp Thr Thr Ser 65 70 75 80 Ala Val Met Thr Gly His Lys Met Tyr Asn Ala Lys Phe Ser Tyr Tyr 85 90 95 Trp Phe Asp Tyr Val Thr Asp Asp Pro Leu Lys Lys Tyr Ile Asp Arg 100 105 110 Val Glu Asp Met Lys Asn Tyr Ile Thr Val His Pro His Ile Leu Glu 115 120 125 His Ala Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn 130 135 140 Ile Thr Glu Leu Leu Gln Tyr Glu Arg Asp Val Leu Ser Lys Gly Phe 145 150 155 160 Glu Gly Val Met Ile Arg Lys Pro Asp Gly Lys Tyr Lys Phe Gly Arg 165 170 175 Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp 180 185 190 Ala Glu Ala Thr Ile Ile Ser Met Thr Ala Leu Phe Lys Asn Thr Asn 195 200 205 Thr Lys Thr Lys Asp Asn Phe Gly Tyr Ser Lys Arg Ser Thr His Lys 210 215 220 Ser Gly Lys Val Glu Glu Asp Val Met Gly Ser Ile Glu Val Asp Tyr 225 230 235 240 Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Ala Asp Gln Arg 245 250 255 Arg Asp Phe Trp Gln Asn Lys Glu Ser Tyr Ile Gly Lys Met Val Lys 260 265 270 Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Cys Pro Arg Phe Pro Val 275 280 285 Phe Ile Gly Ile Arg His Glu Glu Asp Arg 290 295 <210> 30 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5, 8 and 9 template oligonucleotide sequence <400> 30 tttggtgcga agcagactga ggc 23 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 31 tttggtgcga agcagagtga ggc 23 <210> 32 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 32 tttggtgcga agcagattga ggc 23 <210> 33 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 33 tttggtgcga agcagaatga ggc 23 <210> 34 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 34 tttggtgcga agcagtctga ggc 23 <210> 35 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 35 tttggtgcga agcagtgtga ggc 23 <210> 36 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 36 tttggtgcga agcagtttga ggc 23 <210> 37 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 37 tttggtgcga agcagtatga ggc 23 <210> 38 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 38 tttggtgcga agcagcctga ggc 23 <210> 39 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 39 tttggtgcga agcagcgtga ggc 23 <210> 40 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 40 tttggtgcga agcagcttga ggc 23 <210> 41 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 41 tttggtgcga agcagcatga ggc 23 <210> 42 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 42 tttggtgcga agcaggctga ggc 23 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 43 tttggtgcga agcagggtga ggc 23 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 44 tttggtgcga agcaggttga ggc 23 <210> 45 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Example 5 template oligonucleotide sequence <400> 45 tttggtgcga agcaggatga ggc 23 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Example 14 "20 mer" oligonucleotide sequence <400> 46 gccucagtct gcttcgcacc 20 <210> 47 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Example 7 template oligonucleotide sequence <400> 47 tttggtgcga agcagaaggt aagccgaggt ttggcc 36 <210> 48 <211> 298 <212> PRT <213> Paramecium bursaria Chlorella virus NE-JV-4 <400> 48 Met Ala Ile Thr Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Ile Glu 1 5 10 15 Asp Val Gln Phe Pro Cys Leu Ala Thr Pro Lys Ile Asp Gly Ile Arg 20 25 30 Ser Val Lys Gln Thr Gln Met Leu Ser Arg Thr Phe Lys Pro Ile Arg 35 40 45 Asn Ser Val Met Asn Arg Leu Leu Thr Glu Leu Leu Pro Glu Gly Ser 50 55 60 Asp Gly Glu Ile Ser Ile Glu Gly Ala Thr Phe Gln Asp Thr Thr Ser 65 70 75 80 Ala Val Met Thr Gly His Lys Met Tyr Asn Ala Lys Phe Ser Tyr Tyr 85 90 95 Trp Phe Asp Tyr Val Thr Asp Asp Pro Leu Lys Lys Tyr Ser Asp Arg 100 105 110 Val Glu Asp Met Lys Asn Tyr Ile Thr Ala His Pro His Ile Leu Asp 115 120 125 His Glu Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn 130 135 140 Ile Thr Glu Leu Leu Gln Tyr Glu Arg Asp Val Leu Ser Lys Gly Phe 145 150 155 160 Glu Gly Val Met Ile Arg Lys Pro Asp Gly Lys Tyr Lys Phe Gly Arg 165 170 175 Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp 180 185 190 Ala Glu Ala Thr Ile Ile Ser Met Thr Ala Leu Phe Lys Asn Thr Asn 195 200 205 Thr Lys Thr Lys Asp Asn Phe Gly Tyr Ser Lys Arg Ser Thr His Lys 210 215 220 Asn Gly Lys Val Glu Glu Asp Val Met Gly Ser Ile Glu Val Asp Tyr 225 230 235 240 Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Ala Asp Gln Arg 245 250 255 Arg Asp Phe Trp Gln Asn Lys Glu Ser Tyr Ile Gly Lys Met Val Lys 260 265 270 Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Cys Pro Arg Phe Pro Val 275 280 285 Phe Ile Gly Ile Arg His Glu Glu Asp His 290 295 <210> 49 <211> 298 <212> PRT <213> Paramecium bursaria Chlorella virus NYs1 <400> 49 Met Thr Ile Ala Lys Pro Leu Leu Ala Ala Thr Leu Glu Asn Leu Asp 1 5 10 15 Asp Val Lys Phe Pro Cys Leu Val Thr Pro Lys Ile Asp Gly Ile Arg 20 25 30 Ser Leu Lys Gln Gln His Met Leu Ser Arg Thr Phe Lys Pro Ile Arg 35 40 45 Asn Ser Val Met Asn Lys Leu Leu Ser Glu Leu Leu Pro Glu Gly Ala 50 55 60 Asp Gly Glu Ile Cys Ile Glu Asp Ser Thr Phe Gln Ala Thr Thr Ser 65 70 75 80 Ala Val Met Thr Gly His Lys Val Tyr Asp Glu Lys Phe Ser Tyr Tyr 85 90 95 Trp Phe Asp Tyr Val Val Asp Asp Pro Leu Lys Ser Tyr Thr Asp Arg 100 105 110 Val Asn Asp Met Lys Lys Tyr Val Asp Asp His Pro His Ile Leu Glu 115 120 125 His Glu Gln Val Lys Ile Ile Pro Leu Ile Pro Val Glu Ile Asn Asn 130 135 140 Ile Asp Glu Leu Ser Gln Tyr Glu Arg Asp Val Leu Ala Lys Gly Phe 145 150 155 160 Glu Gly Val Met Ile Arg Arg Pro Asp Gly Lys Tyr Lys Phe Gly Arg 165 170 175 Ser Thr Leu Lys Glu Gly Ile Leu Leu Lys Met Lys Gln Phe Lys Asp 180 185 190 Ala Glu Ala Thr Ile Ile Ser Met Ser Pro Arg Leu Lys Asn Thr Asn 195 200 205 Ala Lys Ser Lys Asp Asn Leu Gly Tyr Ser Lys Arg Ser Thr His Lys 210 215 220 Ser Gly Lys Val Glu Glu Glu Thr Met Gly Ser Ile Glu Val Asp Tyr 225 230 235 240 Asp Gly Val Val Phe Ser Ile Gly Thr Gly Phe Asp Asp Glu Gln Arg 245 250 255 Lys His Phe Trp Glu Asn Lys Asp Ser Tyr Ile Gly Lys Leu Leu Lys 260 265 270 Phe Lys Tyr Phe Glu Met Gly Ser Lys Asp Ala Pro Arg Phe Pro Val 275 280 285 Phe Ile Gly Ile Arg His Glu Glu Asp Cys 290 295 <210> 50 <211> 301 <212> PRT <213> Paramecium bursaria Chlorella virus NE-JV-1 <400> 50 Met Thr Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Phe Lys Lys Leu 1 5 10 15 Thr Val Ala Asp Val Lys Tyr Pro Val Phe Ala Thr Pro Lys Leu Asp 20 25 30 Gly Ile Arg Ala Leu Lys Ile Asp Gly Ala Phe Val Ser Arg Thr Phe 35 40 45 Lys Pro Ile Arg Asn Arg Ala Ile Ala Asp Ala Leu Gln Asp Leu Leu 50 55 60 Pro Asn Gly Ser Asp Gly Glu Ile Leu Ser Gly Ser Thr Phe Gln Asp 65 70 75 80 Ala Ser Ser Ala Val Met Thr Ala Lys Ala Gly Ile Gly Ala Asn Thr 85 90 95 Ile Phe Tyr Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Pro Tyr 100 105 110 Leu Asp Arg Met Thr Asp Met Glu Asn Tyr Leu Lys Glu Arg Pro Glu 115 120 125 Ile Leu Asn Asp Asp Arg Ile Lys Ile Val Pro Leu Ile Pro Lys Lys 130 135 140 Ile Glu Thr Lys Asp Glu Leu Asp Thr Phe Glu Lys Ile Cys Leu Asp 145 150 155 160 Gln Gly Phe Glu Gly Val Met Ile Arg Ser Gly Ala Gly Lys Tyr Lys 165 170 175 Phe Gly Arg Ser Thr Glu Lys Glu Gly Ile Leu Ile Lys Ile Lys Gln 180 185 190 Phe Glu Asp Asp Glu Ala Val Val Ile Gly Phe Thr Pro Met Gln Thr 195 200 205 Asn Thr Asn Asp Lys Ser Met Asn Glu Leu Gly Asp Met Lys Arg Ser 210 215 220 Ser His Lys Asp Gly Lys Val Asn Leu Asp Thr Leu Gly Ala Leu Glu 225 230 235 240 Val Asp Trp Asn Gly Ile Thr Phe Ser Ile Gly Thr Gly Phe Asp His 245 250 255 Ala Leu Arg Asp Lys Leu Trp Ser Glu Arg Asp Lys Leu Ile Gly Lys 260 265 270 Ile Val Lys Phe Lys Tyr Phe Ala Gln Gly Val Lys Thr Ala Pro Arg 275 280 285 Phe Pro Val Phe Ile Gly Phe Arg Asp Pro Asp Asp Met 290 295 300 <210> 51 <211> 300 <212> PRT <213> Acanthocystis turfacea Chlorella virus Canal-1 <400> 51 Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser 1 5 10 15 Val Gly Asp Leu Thr Phe Pro Val Phe Ala Thr Pro Lys Leu Asp Gly 20 25 30 Ile Arg Ala Leu Lys Val Gly Gly Thr Ile Val Ser Arg Thr Phe Lys 35 40 45 Pro Val Arg Asn Ser Ala Ile Ser Glu Val Leu Ala Ser Ile Leu Pro 50 55 60 Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Glu Ser 65 70 75 80 Thr Ser Thr Val Met Thr Ala Asp Ala Gly Leu Gly Ser Gly Thr Met 85 90 95 Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu 100 105 110 Asp Arg Ile Ala Asp Met Lys Ser Phe Thr Asp Arg His Pro Glu Ile 115 120 125 Leu Lys Asp Lys Arg Val Thr Ile Val Pro Leu Phe Pro Lys Lys Ile 130 135 140 Asp Thr Thr Glu Glu Leu His Glu Phe Glu Lys Trp Cys Leu Asp Gln 145 150 155 160 Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe 165 170 175 Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe 180 185 190 Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn 195 200 205 Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser 210 215 220 His Gln Asp Gly Lys Val Glu Leu Glu Met Leu Gly Ala Leu Asp Val 225 230 235 240 Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Arg Asp 245 250 255 Thr Arg Val Asp Leu Trp Lys Arg Arg Glu Gly Val Ile Gly Lys Ile 260 265 270 Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe 275 280 285 Pro Val Phe Leu Gly Phe Arg Asp Lys Asp Asp Met 290 295 300 <210> 52 <211> 300 <212> PRT <213> Acanthocystis turfacea Chlorella virus Br0604L <400> 52 Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Leu Ser 1 5 10 15 Val Asp Asp Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly 20 25 30 Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys 35 40 45 Pro Ile Arg Asn Thr Thr Ile Ser Lys Val Leu Thr Ser Leu Leu Pro 50 55 60 Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser 65 70 75 80 Thr Ser Thr Val Met Ser Ala Asp Ala Gly Ile Gly Ser Gly Thr Thr 85 90 95 Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu 100 105 110 Asp Arg Ile Ala Asp Ile Lys Lys Phe Ile Asp Cys Arg Pro Glu Ile 115 120 125 Leu Lys Asp Ser Arg Val Ile Ile Val Pro Leu Phe Pro Lys Lys Ile 130 135 140 Asp Thr Ala Glu Glu Leu Asn Val Phe Glu Lys Trp Cys Leu Asp Gln 145 150 155 160 Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe 165 170 175 Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe 180 185 190 Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn 195 200 205 Thr Asn Asp Lys Lys Val Asn Glu Leu Gly Glu Met Arg Arg Thr Ser 210 215 220 His Gln Asp Gly Lys Val Asp Leu Asp Met Leu Gly Ala Leu Asp Val 225 230 235 240 Asp Trp Asn Gly Ile Arg Phe Gly Ile Gly Thr Gly Phe Asp Lys Asp 245 250 255 Thr Arg Glu Asp Leu Trp Lys Arg Arg Asp Ser Ile Ile Gly Lys Ile 260 265 270 Val Lys Phe Lys Tyr Phe Ser Gln Gly Val Lys Thr Ala Pro Arg Phe 275 280 285 Pro Val Phe Leu Gly Phe Arg Asp Lys Asn Asp Met 290 295 300 <210> 53 <211> 300 <212> PRT <213> Acanthocystis turfacea Chlorella virus NE-JV-2 <400> 53 Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Leu Ser 1 5 10 15 Val Asp Asp Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly 20 25 30 Ile Arg Ala Leu Lys Ile Asp Gly Thr Ile Val Ser Arg Thr Phe Lys 35 40 45 Pro Ile Arg Asn Thr Thr Ile Ser Asn Val Leu Met Ser Leu Leu Pro 50 55 60 Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser 65 70 75 80 Thr Ser Thr Val Met Ser Ala Asp Ala Gly Ile Gly Ser Gly Thr Thr 85 90 95 Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asp Lys Gly Tyr Leu 100 105 110 Asp Arg Ile Ala Asp Met Lys Lys Phe Val Asp Ser His Pro Glu Ile 115 120 125 Leu Lys Asp Arg Arg Val Thr Ile Val Pro Leu Ile Pro Lys Lys Ile 130 135 140 Asp Thr Val Glu Glu Leu Asn Val Phe Glu Gln Trp Cys Leu Asp Gln 145 150 155 160 Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe 165 170 175 Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe 180 185 190 Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn 195 200 205 Val Asn Asp Lys Lys Met Asn Glu Leu Gly Asp Met Arg Arg Thr Ser 210 215 220 His Lys Asp Gly Lys Ile Asp Leu Glu Met Leu Gly Ala Leu Asp Val 225 230 235 240 Glu Trp Asn Gly Ile Arg Phe Gly Ile Gly Thr Gly Phe Asp Lys Asp 245 250 255 Thr Arg Glu Asp Leu Trp Lys Lys Arg Asp Ser Ile Ile Gly Lys Val 260 265 270 Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe 275 280 285 Pro Val Phe Leu Gly Phe Arg Asp Glu Asn Asp Met 290 295 300 <210> 54 <211> 300 <212> PRT <213> Acanthocystis turfacea Chlorella virus TN603.4.2 <400> 54 Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser 1 5 10 15 Val Asp Asn Leu Thr Phe Pro Val Tyr Ala Thr Pro Lys Leu Asp Gly 20 25 30 Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys 35 40 45 Pro Ile Arg Asn Thr Thr Ile Ser Lys Val Leu Ala Ser Leu Leu Pro 50 55 60 Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser 65 70 75 80 Thr Ser Thr Val Met Thr Thr Asp Ala Gly Ile Gly Ser Asp Thr Thr 85 90 95 Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asp Lys Gly Tyr Leu 100 105 110 Asp Arg Ile Ala Asp Met Lys Thr Phe Val Asp Gln His Pro Glu Ile 115 120 125 Leu Lys Asp Ser Cys Val Thr Ile Val Pro Leu Phe Pro Lys Lys Ile 130 135 140 Asp Thr Pro Glu Glu Leu His Val Phe Glu Lys Trp Cys Leu Asp Gln 145 150 155 160 Gly Phe Glu Gly Val Met Val Arg Thr Ala Gly Gly Lys Tyr Lys Phe 165 170 175 Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe 180 185 190 Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn 195 200 205 Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser 210 215 220 His Gln Asp Gly Lys Val Asp Leu Asp Met Leu Gly Ala Leu Asp Val 225 230 235 240 Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Lys Asp 245 250 255 Thr Arg Glu Asp Leu Trp Lys Gln Arg Asp Ser Ile Val Gly Lys Val 260 265 270 Val Lys Phe Lys Tyr Phe Ser Gln Gly Ile Lys Thr Ala Pro Arg Phe 275 280 285 Pro Val Phe Leu Gly Phe Arg Asp Glu Asn Asp Met 290 295 300 <210> 55 <211> 300 <212> PRT <213> Acanthocystis turfacea Chlorella virus GM0701.1 <400> 55 Met Ala Ile Gln Lys Pro Leu Leu Ala Ala Ser Leu Lys Lys Met Ser 1 5 10 15 Val Asp Asp Leu Thr Phe Pro Val Tyr Thr Thr Pro Lys Leu Asp Gly 20 25 30 Ile Arg Ala Leu Lys Ile Asp Gly Thr Leu Val Ser Arg Thr Phe Lys 35 40 45 Pro Val Arg Asn Ser Ala Ile Ser Glu Val Leu Ala Ser Leu Leu Pro 50 55 60 Asp Gly Ser Asp Gly Glu Ile Leu Ser Gly Lys Thr Phe Gln Asp Ser 65 70 75 80 Thr Ser Thr Val Met Thr Thr Asp Ala Gly Ile Gly Ser Asp Thr Thr 85 90 95 Phe Phe Trp Phe Asp Tyr Val Lys Asp Asp Pro Asn Lys Gly Tyr Leu 100 105 110 Asp Arg Ile Ala Asp Met Lys Thr Phe Ile Asp Gln His Pro Glu Met 115 120 125 Leu Lys Asp Asn His Val Thr Ile Val Pro Leu Ile Pro Lys Lys Ile 130 135 140 Asp Thr Val Glu Glu Leu Asn Ile Phe Glu Lys Trp Cys Leu Asp Gln 145 150 155 160 Gly Phe Glu Gly Val Met Val Arg Asn Ala Gly Gly Lys Tyr Lys Phe 165 170 175 Gly Arg Ser Thr Glu Lys Glu Gln Ile Leu Val Lys Ile Lys Gln Phe 180 185 190 Glu Asp Asp Glu Ala Val Val Ile Gly Val Ser Ala Leu Gln Thr Asn 195 200 205 Thr Asn Asp Lys Lys Leu Asn Gln Leu Gly Glu Met Arg Arg Thr Ser 210 215 220 His Gln Asp Gly Lys Ile Asp Leu Glu Met Leu Gly Ala Leu Asp Val 225 230 235 240 Asp Trp Asn Gly Ile Arg Phe Ser Ile Gly Thr Gly Phe Asp Arg Asp 245 250 255 Thr Arg Val Asp Leu Trp Lys Arg Arg Asp Gly Ile Val Gly Arg Thr 260 265 270 Ile Lys Phe Lys Tyr Phe Gly Gln Gly Ile Lys Thr Ala Pro Arg Phe 275 280 285 Pro Val Phe Leu Gly Phe Arg Asp Lys Asp Asp Met 290 295 300 <210> 56 <211> 287 <212> PRT <213> Synechococcus phage S-CRM01 <400> 56 Met Leu Ala Gly Asn Phe Asp Pro Lys Lys Ala Lys Phe Pro Tyr Cys 1 5 10 15 Ala Thr Pro Lys Ile Asp Gly Ile Arg Phe Leu Met Val Asn Gly Arg 20 25 30 Ala Leu Ser Arg Thr Phe Lys Pro Ile Arg Asn Glu Tyr Ile Gln Lys 35 40 45 Leu Leu Ser Lys His Leu Pro Asp Gly Ile Asp Gly Glu Leu Thr Cys 50 55 60 Gly Asp Thr Phe Gln Ser Ser Thr Ser Ala Ile Met Arg Ile Ala Gly 65 70 75 80 Glu Pro Asp Phe Lys Ala Trp Ile Phe Asp Tyr Val Asp Pro Asp Ser 85 90 95 Thr Ser Ile Leu Pro Phe Ile Glu Arg Phe Asp Gln Ile Ser Asp Ile 100 105 110 Ile Tyr Asn Gly Pro Ile Pro Phe Lys His Gln Val Leu Gly Gln Ser 115 120 125 Ile Leu Tyr Asn Ile Asp Asp Leu Asn Arg Tyr Glu Glu Ala Cys Leu 130 135 140 Asn Glu Gly Tyr Glu Gly Val Met Leu Arg Asp Pro Tyr Gly Thr Tyr 145 150 155 160 Lys Phe Gly Arg Ser Ser Thr Asn Glu Gly Ile Leu Leu Lys Val Lys 165 170 175 Arg Phe Glu Asp Ala Glu Ala Thr Val Ile Arg Ile Asp Glu Lys Met 180 185 190 Ser Asn Gln Asn Ile Ala Glu Lys Asp Asn Phe Gly Arg Thr Lys Arg 195 200 205 Ser Ser Cys Leu Asp Gly Met Val Pro Met Glu Thr Thr Gly Ala Leu 210 215 220 Phe Val Arg Asn Ser Asp Gly Leu Glu Phe Ser Ile Gly Ser Gly Leu 225 230 235 240 Asn Asp Glu Met Arg Asp Glu Ile Trp Lys Asn Lys Ser Ser Tyr Ile 245 250 255 Gly Lys Leu Val Lys Tyr Lys Tyr Phe Pro Gln Gly Val Lys Asp Leu 260 265 270 Pro Arg His Pro Val Phe Leu Gly Phe Arg Asp Pro Asp Asp Met 275 280 285 <210> 57 <211> 322 <212> PRT <213> marine sediment metagenome <400> 57 Met Asp Ala His Glu Leu Met Lys Leu Asn Glu Tyr Ala Glu Arg Gln 1 5 10 15 Asn Gln Lys Gln Lys Lys Gln Ile Thr Lys Pro Met Leu Ala Ala Ser 20 25 30 Leu Lys Asp Ile Thr Gln Leu Asp Tyr Ser Lys Gly Tyr Leu Ala Thr 35 40 45 Gln Lys Leu Asp Gly Ile Arg Ala Leu Met Ile Asp Gly Lys Leu Val 50 55 60 Ser Arg Thr Phe Lys Pro Ile Arg Asn Asn His Ile Arg Glu Met Leu 65 70 75 80 Glu Asp Val Leu Pro Asp Gly Ala Asp Gly Glu Ile Val Cys Pro Gly 85 90 95 Ala Phe Gln Ala Thr Ser Ser Gly Val Met Ser Ala Asn Gly Glu Pro 100 105 110 Glu Phe Ile Tyr Tyr Met Phe Asp Tyr Val Lys Asp Asp Ile Thr Lys 115 120 125 Glu Tyr Trp Arg Arg Thr Gln Asp Met Val Gln Trp Leu Ile Asn Gln 130 135 140 Gly Pro Thr Arg Thr Pro Gly Leu Ser Lys Leu Lys Leu Leu Val Pro 145 150 155 160 Thr Leu Ile Lys Asn Tyr Asp His Leu Lys Thr Tyr Glu Thr Glu Cys 165 170 175 Ile Asp Lys Gly Phe Glu Gly Val Ile Leu Arg Thr Pro Asp Ser Pro 180 185 190 Tyr Lys Cys Gly Arg Ser Thr Ala Lys Gln Glu Trp Leu Leu Lys Leu 195 200 205 Lys Arg Phe Ala Asp Asp Glu Ala Val Val Ile Gly Phe Thr Glu Lys 210 215 220 Met His Asn Asp Asn Glu Ala Thr Lys Asp Lys Phe Gly His Thr Val 225 230 235 240 Arg Ser Ser His Lys Glu Asn Lys Arg Pro Ala Gly Thr Leu Gly Ser 245 250 255 Leu Ile Val Arg Asp Ile Lys Thr Glu Ile Glu Phe Glu Ile Gly Thr 260 265 270 Gly Phe Asp Asp Glu Leu Arg Gln Lys Ile Trp Asp Ala Arg Pro Glu 275 280 285 Trp Asp Gly Leu Cys Val Lys Tyr Lys His Phe Ala Ile Ser Gly Val 290 295 300 Lys Glu Lys Pro Arg Phe Pro Ser Phe Ile Gly Val Arg Asp Val Glu 305 310 315 320 Asp Met <210> 58 <211> 691 <212> PRT <213> Mycobacterium tuberculosis (strain ATCC 25618/H37Rv) <400> 58 Met Ser Ser Pro Asp Ala Asp Gln Thr Ala Pro Glu Val Leu Arg Gln 1 5 10 15 Trp Gln Ala Leu Ala Glu Glu Val Arg Glu His Gln Phe Arg Tyr Tyr 20 25 30 Val Arg Asp Ala Pro Ile Ile Ser Asp Ala Glu Phe Asp Glu Leu Leu 35 40 45 Arg Arg Leu Glu Ala Leu Glu Glu Gln His Pro Glu Leu Arg Thr Pro 50 55 60 Asp Ser Pro Thr Gln Leu Val Gly Gly Ala Gly Phe Ala Thr Asp Phe 65 70 75 80 Glu Pro Val Asp His Leu Glu Arg Met Leu Ser Leu Asp Asn Ala Phe 85 90 95 Thr Ala Asp Glu Leu Ala Ala Trp Ala Gly Arg Ile His Ala Glu Val 100 105 110 Gly Asp Ala Ala His Tyr Leu Cys Glu Leu Lys Ile Asp Gly Val Ala 115 120 125 Leu Ser Leu Val Tyr Arg Glu Gly Arg Leu Thr Arg Ala Ser Thr Arg 130 135 140 Gly Asp Gly Arg Thr Gly Glu Asp Val Thr Leu Asn Ala Arg Thr Ile 145 150 155 160 Ala Asp Val Pro Glu Arg Leu Thr Pro Gly Asp Asp Tyr Pro Val Pro 165 170 175 Glu Val Leu Glu Val Arg Gly Glu Val Phe Phe Arg Leu Asp Asp Phe 180 185 190 Gln Ala Leu Asn Ala Ser Leu Val Glu Glu Gly Lys Ala Pro Phe Ala 195 200 205 Asn Pro Arg Asn Ser Ala Ala Gly Ser Leu Arg Gln Lys Asp Pro Ala 210 215 220 Val Thr Ala Arg Arg Arg Leu Arg Met Ile Cys His Gly Leu Gly His 225 230 235 240 Val Glu Gly Phe Arg Pro Ala Thr Leu His Gln Ala Tyr Leu Ala Leu 245 250 255 Arg Ala Trp Gly Leu Pro Val Ser Glu His Thr Thr Leu Ala Thr Asp 260 265 270 Leu Ala Gly Val Arg Glu Arg Ile Asp Tyr Trp Gly Glu His Arg His 275 280 285 Glu Val Asp His Glu Ile Asp Gly Val Val Val Lys Val Asp Glu Val 290 295 300 Ala Leu Gln Arg Arg Leu Gly Ser Thr Ser Arg Ala Pro Arg Trp Ala 305 310 315 320 Ile Ala Tyr Lys Tyr Pro Pro Glu Glu Ala Gln Thr Lys Leu Leu Asp 325 330 335 Ile Arg Val Asn Val Gly Arg Thr Gly Arg Ile Thr Pro Phe Ala Phe 340 345 350 Met Thr Pro Val Lys Val Ala Gly Ser Thr Val Gly Gln Ala Thr Leu 355 360 365 His Asn Ala Ser Glu Ile Lys Arg Lys Gly Val Leu Ile Gly Asp Thr 370 375 380 Val Val Ile Arg Lys Ala Gly Asp Val Ile Pro Glu Val Leu Gly Pro 385 390 395 400 Val Val Glu Leu Arg Asp Gly Ser Glu Arg Glu Phe Ile Met Pro Thr 405 410 415 Thr Cys Pro Glu Cys Gly Ser Pro Leu Ala Pro Glu Lys Glu Gly Asp 420 425 430 Ala Asp Ile Arg Cys Pro Asn Ala Arg Gly Cys Pro Gly Gln Leu Arg 435 440 445 Glu Arg Val Phe His Val Ala Ser Arg Asn Gly Leu Asp Ile Glu Val 450 455 460 Leu Gly Tyr Glu Ala Gly Val Ala Leu Leu Gln Ala Lys Val Ile Ala 465 470 475 480 Asp Glu Gly Glu Leu Phe Ala Leu Thr Glu Arg Asp Leu Leu Arg Thr 485 490 495 Asp Leu Phe Arg Thr Lys Ala Gly Glu Leu Ser Ala Asn Gly Lys Arg 500 505 510 Leu Leu Val Asn Leu Asp Lys Ala Lys Ala Ala Pro Leu Trp Arg Val 515 520 525 Leu Val Ala Leu Ser Ile Arg His Val Gly Pro Thr Ala Ala Arg Ala 530 535 540 Leu Ala Thr Glu Phe Gly Ser Leu Asp Ala Ile Ala Ala Ala Ser Thr 545 550 555 560 Asp Gln Leu Ala Ala Val Glu Gly Val Gly Pro Thr Ile Ala Ala Ala 565 570 575 Val Thr Glu Trp Phe Ala Val Asp Trp His Arg Glu Ile Val Asp Lys 580 585 590 Trp Arg Ala Ala Gly Val Arg Met Val Asp Glu Arg Asp Glu Ser Val 595 600 605 Pro Arg Thr Leu Ala Gly Leu Thr Ile Val Val Thr Gly Ser Leu Thr 610 615 620 Gly Phe Ser Arg Asp Asp Ala Lys Glu Ala Ile Val Ala Arg Gly Gly 625 630 635 640 Lys Ala Ala Gly Ser Val Ser Lys Lys Thr Asn Tyr Val Val Ala Gly 645 650 655 Asp Ser Pro Gly Ser Lys Tyr Asp Lys Ala Val Glu Leu Gly Val Pro 660 665 670 Ile Leu Asp Glu Asp Gly Phe Arg Arg Leu Leu Ala Asp Gly Pro Ala 675 680 685 Ser Arg Thr 690 <210> 59 <211> 676 <212> PRT <213> Enterococcus faecalis (strain ATCC 700802/V583) <400> 59 Met Glu Gln Gln Pro Leu Thr Leu Thr Ala Ala Thr Thr Arg Ala Gln 1 5 10 15 Glu Leu Arg Lys Gln Leu Asn Gln Tyr Ser His Glu Tyr Tyr Val Lys 20 25 30 Asp Gln Pro Ser Val Glu Asp Tyr Val Tyr Asp Arg Leu Tyr Lys Glu 35 40 45 Leu Val Asp Ile Glu Thr Glu Phe Pro Asp Leu Ile Thr Pro Asp Ser 50 55 60 Pro Thr Gln Arg Val Gly Gly Lys Val Leu Ser Gly Phe Glu Lys Ala 65 70 75 80 Pro His Asp Ile Pro Met Tyr Ser Leu Asn Asp Gly Phe Ser Lys Glu 85 90 95 Asp Ile Phe Ala Phe Asp Glu Arg Val Arg Lys Ala Ile Gly Lys Pro 100 105 110 Val Ala Tyr Cys Cys Glu Leu Lys Ile Asp Gly Leu Ala Ile Ser Leu 115 120 125 Arg Tyr Glu Asn Gly Val Phe Val Arg Gly Ala Thr Arg Gly Asp Gly 130 135 140 Thr Val Gly Glu Asn Ile Thr Glu Asn Leu Arg Thr Val Arg Ser Val 145 150 155 160 Pro Met Arg Leu Thr Glu Pro Ile Ser Val Glu Val Arg Gly Glu Cys 165 170 175 Tyr Met Pro Lys Gln Ser Phe Val Ala Leu Asn Glu Glu Arg Glu Glu 180 185 190 Asn Gly Gln Asp Ile Phe Ala Asn Pro Arg Asn Ala Ala Ala Gly Ser 195 200 205 Leu Arg Gln Leu Asp Thr Lys Ile Val Ala Lys Arg Asn Leu Asn Thr 210 215 220 Phe Leu Tyr Thr Val Ala Asp Phe Gly Pro Met Lys Ala Lys Thr Gln 225 230 235 240 Phe Glu Ala Leu Glu Glu Leu Ser Ala Ile Gly Phe Arg Thr Asn Pro 245 250 255 Glu Arg Gln Leu Cys Gln Ser Ile Asp Glu Val Trp Ala Tyr Ile Glu 260 265 270 Glu Tyr His Glu Lys Arg Ser Thr Leu Pro Tyr Glu Ile Asp Gly Ile 275 280 285 Val Ile Lys Val Asn Glu Phe Ala Leu Gln Asp Glu Leu Gly Phe Thr 290 295 300 Val Lys Ala Pro Arg Trp Ala Ile Ala Tyr Lys Phe Pro Pro Glu Glu 305 310 315 320 Ala Glu Thr Val Val Glu Asp Ile Glu Trp Thr Ile Gly Arg Thr Gly 325 330 335 Val Val Thr Pro Thr Ala Val Met Ala Pro Val Arg Val Ala Gly Thr 340 345 350 Thr Val Ser Arg Ala Ser Leu His Asn Ala Asp Phe Ile Gln Met Lys 355 360 365 Asp Ile Arg Leu Asn Asp His Val Ile Ile Tyr Lys Ala Gly Asp Ile 370 375 380 Ile Pro Glu Val Ala Gln Val Leu Val Glu Lys Arg Ala Ala Asp Ser 385 390 395 400 Gln Pro Tyr Glu Met Pro Thr His Cys Pro Ile Cys His Ser Glu Leu 405 410 415 Val His Leu Asp Glu Glu Val Ala Leu Arg Cys Ile Asn Pro Lys Cys 420 425 430 Pro Ala Gln Ile Lys Glu Gly Leu Asn His Phe Val Ser Arg Asn Ala 435 440 445 Met Asn Ile Asp Gly Leu Gly Pro Arg Val Leu Ala Gln Met Tyr Asp 450 455 460 Lys Gly Leu Val Lys Asp Val Ala Asp Leu Tyr Phe Leu Thr Glu Glu 465 470 475 480 Gln Leu Met Thr Leu Asp Lys Ile Lys Glu Lys Ser Ala Asn Asn Ile 485 490 495 Tyr Thr Ala Ile Gln Gly Ser Lys Glu Asn Ser Val Glu Arg Leu Ile 500 505 510 Phe Gly Leu Gly Ile Arg His Val Gly Ala Lys Ala Ala Lys Ile Leu 515 520 525 Ala Glu His Phe Gly Asp Leu Pro Thr Leu Ser Arg Ala Thr Ala Glu 530 535 540 Glu Ile Val Ala Leu Asp Ser Ile Gly Glu Thr Ile Ala Asp Ser Val 545 550 555 560 Val Thr Tyr Phe Glu Asn Glu Glu Val His Glu Leu Met Ala Glu Leu 565 570 575 Glu Lys Ala Gln Val Asn Leu Thr Tyr Lys Gly Leu Arg Thr Glu Gln 580 585 590 Leu Ala Glu Val Glu Ser Pro Phe Lys Asp Lys Thr Val Val Leu Thr 595 600 605 Gly Lys Leu Ala Gln Tyr Thr Arg Glu Glu Ala Lys Glu Lys Ile Glu 610 615 620 Asn Leu Gly Gly Lys Val Thr Gly Ser Val Ser Lys Lys Thr Asp Ile 625 630 635 640 Val Val Ala Gly Glu Asp Ala Gly Ser Lys Leu Thr Lys Ala Glu Ser 645 650 655 Leu Gly Val Thr Val Trp Asn Glu Gln Glu Met Val Asp Ala Leu Asp 660 665 670 Ala Ser His Phe 675 <210> 60 <211> 670 <212> PRT <213> Haemophilus influenzae (strain ATCC 51907/DSM 11121/ KW20/Rd) <400> 60 Met Thr Asn Ile Gln Thr Gln Leu Asp Asn Leu Arg Lys Thr Leu Arg 1 5 10 15 Gln Tyr Glu Tyr Glu Tyr His Val Leu Asp Asn Pro Ser Val Pro Asp 20 25 30 Ser Glu Tyr Asp Arg Leu Phe His Gln Leu Lys Ala Leu Glu Leu Glu 35 40 45 His Pro Glu Phe Leu Thr Ser Asp Ser Pro Thr Gln Arg Val Gly Ala 50 55 60 Lys Pro Leu Ser Gly Phe Ser Gln Ile Arg His Glu Ile Pro Met Leu 65 70 75 80 Ser Leu Asp Asn Ala Phe Ser Asp Ala Glu Phe Asn Ala Phe Val Lys 85 90 95 Arg Ile Glu Asp Arg Leu Ile Leu Leu Pro Lys Pro Leu Thr Phe Cys 100 105 110 Cys Glu Pro Lys Leu Asp Gly Leu Ala Val Ser Ile Leu Tyr Val Asn 115 120 125 Gly Glu Leu Thr Gln Ala Ala Thr Arg Gly Asp Gly Thr Thr Gly Glu 130 135 140 Asp Ile Thr Ala Asn Ile Arg Thr Ile Arg Asn Val Pro Leu Gln Leu 145 150 155 160 Leu Thr Asp Asn Pro Pro Ala Arg Leu Glu Val Arg Gly Glu Val Phe 165 170 175 Met Pro His Ala Gly Phe Glu Arg Leu Asn Lys Tyr Ala Leu Glu His 180 185 190 Asn Glu Lys Thr Phe Ala Asn Pro Arg Asn Ala Ala Ala Gly Ser Leu 195 200 205 Arg Gln Leu Asp Pro Asn Ile Thr Ser Lys Arg Pro Leu Val Leu Asn 210 215 220 Ala Tyr Gly Ile Gly Ile Ala Glu Gly Val Asp Leu Pro Thr Thr His 225 230 235 240 Tyr Ala Arg Leu Gln Trp Leu Lys Ser Ile Gly Ile Pro Val Asn Pro 245 250 255 Glu Ile Arg Leu Cys Asn Gly Ala Asp Glu Val Leu Gly Phe Tyr Arg 260 265 270 Asp Ile Gln Asn Lys Arg Ser Ser Leu Gly Tyr Asp Ile Asp Gly Thr 275 280 285 Val Leu Lys Ile Asn Asp Ile Ala Leu Gln Asn Glu Leu Gly Phe Ile 290 295 300 Ser Lys Ala Pro Arg Trp Ala Ile Ala Tyr Lys Phe Pro Ala Gln Glu 305 310 315 320 Glu Leu Thr Leu Leu Asn Asp Val Glu Phe Gln Val Gly Arg Thr Gly 325 330 335 Ala Ile Thr Pro Val Ala Lys Leu Glu Pro Val Phe Val Ala Gly Val 340 345 350 Thr Val Ser Asn Ala Thr Leu His Asn Gly Asp Glu Ile Glu Arg Leu 355 360 365 Asn Ile Ala Ile Gly Asp Thr Val Val Ile Arg Arg Ala Gly Asp Val 370 375 380 Ile Pro Gln Ile Ile Gly Val Leu His Glu Arg Arg Pro Asp Asn Ala 385 390 395 400 Lys Pro Ile Ile Phe Pro Thr Asn Cys Pro Val Cys Asp Ser Gln Ile 405 410 415 Ile Arg Ile Glu Gly Glu Ala Val Ala Arg Cys Thr Gly Gly Leu Phe 420 425 430 Cys Ala Ala Gln Arg Lys Glu Ala Leu Lys His Phe Val Ser Arg Lys 435 440 445 Ala Met Asp Ile Asp Gly Val Gly Gly Lys Leu Ile Glu Gln Leu Val 450 455 460 Asp Arg Glu Leu Ile His Thr Pro Ala Asp Leu Phe Lys Leu Asp Leu 465 470 475 480 Thr Thr Leu Thr Arg Leu Glu Arg Met Gly Ala Lys Ser Ala Glu Asn 485 490 495 Ala Leu Asn Ser Leu Glu Asn Ala Lys Ser Thr Thr Leu Ala Arg Phe 500 505 510 Ile Phe Ala Leu Gly Ile Arg Glu Val Gly Glu Ala Thr Ala Leu Asn 515 520 525 Leu Ala Asn His Phe Lys Thr Leu Asp Ala Leu Lys Asp Ala Asn Leu 530 535 540 Glu Glu Leu Gln Gln Val Pro Asp Val Gly Glu Val Val Ala Asn Arg 545 550 555 560 Ile Phe Ile Phe Trp Arg Glu Ala His Asn Val Ala Val Val Glu Asp 565 570 575 Leu Ile Ala Gln Gly Val His Trp Glu Thr Val Glu Val Lys Glu Ala 580 585 590 Ser Glu Asn Leu Phe Lys Asp Lys Thr Val Val Leu Thr Gly Thr Leu 595 600 605 Thr Gln Met Gly Arg Asn Glu Ala Lys Ala Leu Leu Gln Gln Leu Gly 610 615 620 Ala Lys Val Ser Gly Ser Val Ser Ser Lys Thr Asp Phe Val Ile Ala 625 630 635 640 Gly Asp Ala Ala Gly Ser Lys Leu Ala Lys Ala Gln Glu Leu Asn Ile 645 650 655 Thr Val Leu Thr Glu Glu Glu Phe Leu Ala Gln Ile Thr Arg 660 665 670 <210> 61 <211> 667 <212> PRT <213> Staphylococcus aureus <400> 61 Met Ala Asp Leu Ser Ser Arg Val Asn Glu Leu His Asp Leu Leu Asn 1 5 10 15 Gln Tyr Ser Tyr Glu Tyr Tyr Val Glu Asp Asn Pro Ser Val Pro Asp 20 25 30 Ser Glu Tyr Asp Lys Leu Leu His Glu Leu Ile Lys Ile Glu Glu Glu 35 40 45 His Pro Glu Tyr Lys Thr Val Asp Ser Pro Thr Val Arg Val Gly Gly 50 55 60 Glu Ala Gln Ala Ser Phe Asn Lys Val Asn His Asp Thr Pro Met Leu 65 70 75 80 Ser Leu Gly Asn Ala Phe Asn Glu Asp Asp Leu Arg Lys Phe Asp Gln 85 90 95 Arg Ile Arg Glu Gln Ile Gly Asn Val Glu Tyr Met Cys Glu Leu Lys 100 105 110 Ile Asp Gly Leu Ala Val Ser Leu Lys Tyr Val Asp Gly Tyr Phe Val 115 120 125 Gln Gly Leu Thr Arg Gly Asp Gly Thr Thr Gly Glu Asp Ile Thr Glu 130 135 140 Asn Leu Lys Thr Ile His Ala Ile Pro Leu Lys Met Lys Glu Pro Leu 145 150 155 160 Asn Val Glu Val Arg Gly Glu Ala Tyr Met Pro Arg Arg Ser Phe Leu 165 170 175 Arg Leu Asn Glu Glu Lys Glu Lys Asn Asp Glu Gln Leu Phe Ala Asn 180 185 190 Pro Arg Asn Ala Ala Ala Gly Ser Leu Arg Gln Leu Asp Ser Lys Leu 195 200 205 Thr Ala Lys Arg Lys Leu Ser Val Phe Ile Tyr Ser Val Asn Asp Phe 210 215 220 Thr Asp Phe Asn Ala Arg Ser Gln Ser Glu Ala Leu Asp Glu Leu Asp 225 230 235 240 Lys Leu Gly Phe Thr Thr Asn Lys Asn Arg Ala Arg Val Asn Asn Ile 245 250 255 Asp Gly Val Leu Glu Tyr Ile Glu Lys Trp Thr Ser Gln Arg Glu Ser 260 265 270 Leu Pro Tyr Asp Ile Asp Gly Ile Val Ile Lys Val Asn Asp Leu Asp 275 280 285 Gln Gln Asp Glu Met Gly Phe Thr Gln Lys Ser Pro Arg Trp Ala Ile 290 295 300 Ala Tyr Lys Phe Pro Ala Glu Glu Val Val Thr Lys Leu Leu Asp Ile 305 310 315 320 Glu Leu Ser Ile Gly Arg Thr Gly Val Val Thr Pro Thr Ala Ile Leu 325 330 335 Glu Pro Val Lys Val Ala Gly Thr Thr Val Ser Arg Ala Ser Leu His 340 345 350 Asn Glu Asp Leu Ile His Asp Arg Asp Ile Arg Ile Gly Asp Ser Val 355 360 365 Val Val Lys Lys Ala Gly Asp Ile Ile Pro Glu Val Val Arg Ser Ile 370 375 380 Pro Glu Arg Arg Pro Glu Asp Ala Val Thr Tyr His Met Pro Thr His 385 390 395 400 Cys Pro Ser Cys Gly His Glu Leu Val Arg Ile Glu Gly Glu Val Ala 405 410 415 Leu Arg Cys Ile Asn Pro Lys Cys Gln Ala Gln Leu Val Glu Gly Leu 420 425 430 Ile His Phe Val Ser Arg Gln Ala Met Asn Ile Asp Gly Leu Gly Thr 435 440 445 Lys Ile Ile Gln Gln Leu Tyr Gln Ser Glu Leu Ile Lys Asp Val Ala 450 455 460 Asp Ile Phe Tyr Leu Thr Glu Glu Asp Leu Leu Pro Leu Asp Arg Met 465 470 475 480 Gly Gln Lys Lys Val Asp Asn Leu Leu Ala Ala Ile Gln Gln Ala Lys 485 490 495 Asp Asn Ser Leu Glu Asn Leu Leu Phe Gly Leu Gly Ile Arg His Leu 500 505 510 Gly Val Lys Ala Ser Gln Val Leu Ala Glu Lys Tyr Glu Thr Ile Asp 515 520 525 Arg Leu Leu Thr Val Thr Glu Ala Glu Leu Val Glu Ile His Asp Ile 530 535 540 Gly Asp Lys Val Ala Gln Ser Val Val Thr Tyr Leu Glu Asn Glu Asp 545 550 555 560 Ile Arg Ala Leu Ile Gln Lys Leu Lys Asp Lys His Val Asn Met Ile 565 570 575 Tyr Lys Gly Ile Lys Thr Ser Asp Ile Glu Gly His Pro Glu Phe Ser 580 585 590 Gly Lys Thr Ile Val Leu Thr Gly Lys Leu His Gln Met Thr Arg Asn 595 600 605 Glu Ala Ser Lys Trp Leu Ala Ser Gln Gly Ala Lys Val Thr Ser Ser 610 615 620 Val Thr Lys Asn Thr Asp Val Val Ile Ala Gly Glu Asp Ala Gly Ser 625 630 635 640 Lys Leu Thr Lys Ala Gln Ser Leu Gly Ile Glu Ile Trp Thr Glu Gln 645 650 655 Gln Phe Val Asp Lys Gln Asn Glu Leu Asn Ser 660 665 <210> 62 <211> 652 <212> PRT <213> Streptococcus pneumoniae (strain P1031) <400> 62 Met Asn Lys Arg Met Asn Glu Leu Val Ala Leu Leu Asn Arg Tyr Ala 1 5 10 15 Thr Glu Tyr Tyr Thr Ser Asp Asn Pro Ser Val Ser Asp Ser Glu Tyr 20 25 30 Asp Arg Leu Tyr Arg Glu Leu Val Glu Leu Glu Thr Ala Tyr Pro Glu 35 40 45 Gln Val Leu Ala Asp Ser Pro Thr His Arg Val Gly Gly Lys Val Leu 50 55 60 Asp Gly Phe Glu Lys Tyr Ser His Gln Tyr Pro Leu Tyr Ser Leu Gln 65 70 75 80 Asp Ala Phe Ser Arg Glu Glu Leu Asp Ala Phe Asp Ala Arg Val Arg 85 90 95 Lys Glu Val Ala His Pro Thr Tyr Ile Cys Glu Leu Lys Ile Asp Gly 100 105 110 Leu Ser Ile Ser Leu Thr Tyr Glu Lys Gly Ile Leu Val Ala Gly Val 115 120 125 Thr Arg Gly Asp Gly Ser Ile Gly Glu Asn Ile Thr Glu Asn Leu Lys 130 135 140 Arg Val Lys Asp Ile Pro Leu Thr Leu Pro Glu Glu Leu Asp Ile Thr 145 150 155 160 Val Arg Gly Glu Cys Tyr Met Pro Arg Ala Ser Phe Asp Gln Val Asn 165 170 175 Gln Ala Arg Gln Glu Asn Gly Glu Pro Glu Phe Ala Asn Pro Arg Asn 180 185 190 Ala Ala Ala Gly Thr Leu Arg Gln Leu Asp Thr Ala Val Val Ala Lys 195 200 205 Arg Asn Leu Ala Thr Phe Leu Tyr Gln Glu Ala Ser Pro Ser Thr Arg 210 215 220 Asp Ser Gln Glu Lys Gly Leu Lys Tyr Leu Glu Gln Leu Gly Phe Val 225 230 235 240 Val Asn Pro Lys Arg Ile Leu Ala Glu Asn Ile Asp Glu Ile Trp Asn 245 250 255 Phe Ile Gln Glu Val Gly Gln Glu Arg Glu Asn Leu Pro Tyr Asp Ile 260 265 270 Asp Gly Val Val Ile Lys Val Asn Asp Leu Ala Ser Gln Glu Glu Leu 275 280 285 Gly Phe Thr Val Lys Ala Pro Lys Trp Ala Val Ala Tyr Lys Phe Pro 290 295 300 Ala Glu Glu Lys Glu Ala Gln Leu Leu Ser Val Asp Trp Thr Val Gly 305 310 315 320 Arg Thr Gly Val Val Thr Pro Thr Ala Asn Leu Thr Pro Val Gln Leu 325 330 335 Ala Gly Thr Thr Val Ser Arg Ala Thr Leu His Asn Val Asp Tyr Ile 340 345 350 Ala Glu Lys Asp Ile Arg Lys Asp Asp Thr Val Ile Val Tyr Lys Ala 355 360 365 Gly Asp Ile Ile Pro Ala Val Leu Arg Val Val Glu Ser Lys Arg Val 370 375 380 Ser Glu Glu Lys Leu Asp Ile Pro Thr Asn Cys Pro Ser Cys Asn Ser 385 390 395 400 Asp Leu Leu His Phe Glu Asp Glu Val Ala Leu Arg Cys Ile Asn Pro 405 410 415 Arg Cys Pro Ala Gln Ile Met Glu Gly Leu Ile His Phe Ala Ser Arg 420 425 430 Asp Ala Met Asn Ile Thr Gly Leu Gly Pro Ser Ile Val Glu Lys Leu 435 440 445 Phe Ala Ala Asn Leu Val Lys Asp Val Ala Asp Ile Tyr Arg Leu Gln 450 455 460 Glu Glu Asp Phe Leu Leu Leu Glu Gly Val Lys Glu Lys Ser Ala Ala 465 470 475 480 Lys Leu Tyr Gln Ala Ile Gln Ala Ser Lys Glu Asn Ser Ala Glu Lys 485 490 495 Leu Leu Phe Gly Leu Gly Ile Arg His Val Gly Ser Lys Ala Ser Gln 500 505 510 Leu Leu Leu Gln Tyr Phe His Ser Ile Glu Asn Leu Tyr Gln Ala Asp 515 520 525 Ser Glu Glu Val Ala Ser Ile Glu Ser Leu Gly Gly Val Ile Ala Lys 530 535 540 Ser Leu Gln Thr Tyr Phe Ala Thr Glu Gly Ser Glu Ile Leu Leu Arg 545 550 555 560 Glu Leu Lys Glu Thr Gly Val Asn Leu Asp Tyr Lys Gly Gln Thr Val 565 570 575 Val Ala Asp Ala Ala Leu Ser Gly Leu Thr Val Val Leu Thr Gly Lys 580 585 590 Leu Glu Arg Leu Lys Arg Ser Glu Ala Lys Ser Lys Leu Glu Ser Leu 595 600 605 Gly Ala Lys Val Thr Gly Ser Val Ser Lys Lys Thr Asp Leu Val Val 610 615 620 Val Gly Ala Asp Ala Gly Ser Lys Leu Gln Lys Ala Gln Glu Leu Gly 625 630 635 640 Ile Gln Val Arg Asp Glu Ala Trp Leu Glu Ser Leu 645 650 <210> 63 <211> 374 <212> PRT <213> Wild-type Enterobacteria phage T4 RNA ligase 1 protein sequence - 'Rnl1' <400> 63 Met Gln Glu Leu Phe Asn Asn Leu Met Glu Leu Cys Lys Asp Ser Gln 1 5 10 15 Arg Lys Phe Phe Tyr Ser Asp Asp Val Ser Ala Ser Gly Arg Thr Tyr 20 25 30 Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu Pro 35 40 45 Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu Lys 50 55 60 Pro Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Asn 65 70 75 80 Glu Asn Pro Phe Thr Met Asn Ile Asp Leu Asn Asp Val Asp Tyr Ile 85 90 95 Leu Thr Lys Glu Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly Asp 100 105 110 Glu Ile Leu Phe Lys Ser Lys Gly Ser Ile Lys Ser Glu Gln Ala Leu 115 120 125 Met Ala Asn Gly Ile Leu Met Asn Ile Asn His His Arg Leu Arg Asp 130 135 140 Arg Leu Lys Glu Leu Ala Glu Asp Gly Phe Thr Ala Asn Phe Glu Phe 145 150 155 160 Val Ala Pro Thr Asn Arg Ile Val Leu Ala Tyr Gln Glu Met Lys Ile 165 170 175 Ile Leu Leu Asn Val Arg Glu Asn Glu Thr Gly Glu Tyr Ile Ser Tyr 180 185 190 Asp Asp Ile Tyr Lys Asp Ala Thr Leu Arg Pro Tyr Leu Val Glu Arg 195 200 205 Tyr Glu Ile Asp Ser Pro Lys Trp Ile Glu Glu Ala Lys Asn Ala Glu 210 215 220 Asn Ile Glu Gly Tyr Val Ala Val Met Lys Asp Gly Ser His Phe Lys 225 230 235 240 Ile Lys Ser Asp Trp Tyr Val Ser Leu His Ser Thr Lys Ser Ser Leu 245 250 255 Asp Asn Pro Glu Lys Leu Phe Lys Thr Ile Ile Asp Gly Ala Ser Asp 260 265 270 Asp Leu Lys Ala Met Tyr Ala Asp Asp Glu Tyr Ser Tyr Arg Lys Ile 275 280 285 Glu Ala Phe Glu Thr Thr Tyr Leu Lys Tyr Leu Asp Arg Ala Leu Phe 290 295 300 Leu Val Leu Asp Cys His Asn Lys His Cys Gly Lys Asp Arg Lys Thr 305 310 315 320 Tyr Ala Met Glu Ala Gln Gly Val Ala Lys Gly Ala Gly Met Asp His 325 330 335 Leu Phe Gly Ile Ile Met Ser Leu Tyr Gln Gly Tyr Asp Ser Gln Glu 340 345 350 Lys Val Met Cys Glu Ile Glu Gln Asn Phe Leu Lys Asn Tyr Lys Lys 355 360 365 Phe Ile Pro Glu Gly Tyr 370 <210> 64 <211> 334 <212> PRT <213> Wild-type Enterobacteria phage T4 RNA ligase 2 protein sequence - 'Rnl2' <400> 64 Met Phe Lys Lys Tyr Ser Ser Leu Glu Asn His Tyr Asn Ser Lys Phe 1 5 10 15 Ile Glu Lys Leu Tyr Ser Leu Gly Leu Thr Gly Gly Glu Trp Val Ala 20 25 30 Arg Glu Lys Ile His Gly Thr Asn Phe Ser Leu Ile Ile Glu Arg Asp 35 40 45 Lys Val Thr Cys Ala Lys Arg Thr Gly Pro Ile Leu Pro Ala Glu Asp 50 55 60 Phe Phe Gly Tyr Glu Ile Ile Leu Lys Asn Tyr Ala Asp Ser Ile Lys 65 70 75 80 Ala Val Gln Asp Ile Met Glu Thr Ser Ala Val Val Ser Tyr Gln Val 85 90 95 Phe Gly Glu Phe Ala Gly Pro Gly Ile Gln Lys Asn Val Asp Tyr Cys 100 105 110 Asp Lys Asp Phe Tyr Val Phe Asp Ile Ile Val Thr Thr Glu Ser Gly 115 120 125 Asp Val Thr Tyr Val Asp Asp Tyr Met Met Glu Ser Phe Cys Asn Thr 130 135 140 Phe Lys Phe Lys Met Ala Pro Leu Leu Gly Arg Gly Lys Phe Glu Glu 145 150 155 160 Leu Ile Lys Leu Pro Asn Asp Leu Asp Ser Val Val Gln Asp Tyr Asn 165 170 175 Phe Thr Val Asp His Ala Gly Leu Val Asp Ala Asn Lys Cys Val Trp 180 185 190 Asn Ala Glu Ala Lys Gly Glu Val Phe Thr Ala Glu Gly Tyr Val Leu 195 200 205 Lys Pro Cys Tyr Pro Ser Trp Leu Arg Asn Gly Asn Arg Val Ala Ile 210 215 220 Lys Cys Lys Asn Ser Lys Phe Ser Glu Lys Lys Lys Ser Asp Lys Pro 225 230 235 240 Ile Lys Ala Lys Val Glu Leu Ser Glu Ala Asp Asn Lys Leu Val Gly 245 250 255 Ile Leu Ala Cys Tyr Val Thr Leu Asn Arg Val Asn Asn Val Ile Ser 260 265 270 Lys Ile Gly Glu Ile Gly Pro Lys Asp Phe Gly Lys Val Met Gly Leu 275 280 285 Thr Val Gln Asp Ile Leu Glu Glu Thr Ser Arg Glu Gly Ile Thr Leu 290 295 300 Thr Gln Ala Asp Asn Pro Ser Leu Ile Lys Lys Glu Leu Val Lys Met 305 310 315 320 Val Gln Asp Val Leu Arg Pro Ala Trp Ile Glu Leu Val Ser 325 330 <210> 65 <211> 389 <212> PRT <213> Wild-type Aeromonas virus Aeh1 ligase protein sequence - 'RNA3' <400> 65 Met Gln Ser Ile Lys Glu Leu Tyr Gln Asn Leu Ile Asn Leu Cys Val 1 5 10 15 Asp Asp Asn Thr Lys Phe Tyr Phe Ala Glu Thr Val Thr Ser Leu Gly 20 25 30 Thr Lys Val Arg Ile Phe Asp Tyr His Val Ala Gly Tyr Asn Asp Trp 35 40 45 Ile Arg Pro Asp Ala Met Ala Ser Arg Gly Ile Met Phe Glu Met Asn 50 55 60 Gly Glu Ile Pro Val Arg Ile Met Ser Arg Pro Met Asp Lys Phe Phe 65 70 75 80 Asn Tyr Ser Glu Val Ile Gly Trp Glu Lys Leu Glu Thr Ala Gly Asn 85 90 95 Met Lys Met Pro Asp Leu Asn Lys Ile Ala Tyr Val Ile Asp Lys Arg 100 105 110 Asp Gly Ser Leu Ile Ser Thr Tyr Leu Asp Ile Ser Gly Glu Ile Lys 115 120 125 Asn Leu Leu Leu Lys Ser Lys Ala Ser Ile Arg Ser Asn Gln Ala Asn 130 135 140 Asp Ala Ser Val Trp Leu Tyr Gln Glu Asp His Lys Asp Leu Leu Glu 145 150 155 160 Phe Cys Thr Ala Tyr Ala Glu Asn Gly Phe Thr Val Asn Met Glu Trp 165 170 175 Thr Ala Pro His Asn Gln Ile Val Leu Cys Tyr Asn Glu His Gln Leu 180 185 190 Arg Ile Leu Asn Ile Arg His Asn Glu Thr Gly Glu Tyr Val Asp Phe 195 200 205 Gly Glu Leu Gln Lys Asp Pro Thr Phe Val Lys Tyr Ala Ala Asp Phe 210 215 220 Phe Glu Val Pro Gly Asp Gly Lys Ala Trp Ile Asp Glu Val Tyr Gln 225 230 235 240 Met Thr Gly Ile Glu Gly Phe Val Val Val Met Glu Asp Tyr Gln Met 245 250 255 Phe Lys Leu Lys Thr Asp Trp Tyr Val Ala Leu His His Thr Lys Asp 260 265 270 Ser Ile Asn Asn Ser Glu Arg Leu Ile Tyr Ala Cys Ala Glu Asn Cys 275 280 285 Thr Asp Asp Leu Arg Gln Met Phe Arg Asp Asp Glu Asn Ser Leu Gln 290 295 300 Lys Ile Glu Ile Phe Asp Asn His Phe Arg Asp Val Val Met Asp Ala 305 310 315 320 Met Lys Lys Leu Thr Glu Ala Tyr Glu Lys Tyr Arg Gly Met Glu Arg 325 330 335 Arg Asp Tyr Ala Ile Asn Met Asn Asn Asp Phe Lys Asn Glu Arg His 340 345 350 Trp Phe Asn Ile Ala Met Gln Met Phe Ala Gln Arg Pro Asp Phe Ser 355 360 365 Met Thr Asp Glu Ile Val Ala Val Ile Lys Lys Tyr Pro Lys Thr Phe 370 375 380 Ile Pro Lys Gly Tyr 385 <210> 66 <211> 383 <212> PRT <213> Wild-type Klebsiella phage JD18 ligase protein sequence - 'RNA6' <400> 66 Met Leu Glu Leu Tyr Lys Asn Leu Met Asn Leu Cys Glu Ser Ser Glu 1 5 10 15 Val Ala Lys Phe Phe Tyr Lys Asp Phe Thr Gly Pro Met Asp Gly Lys 20 25 30 Phe Arg Val Phe Ser Tyr His Tyr Ala Ser Tyr Ser Glu Trp Leu Lys 35 40 45 Pro Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Asp 50 55 60 Thr Pro Ile Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu 65 70 75 80 Asn Glu Asn Pro Met Thr Met Gly Ile Asp Ile Ser Asp Val Glu Tyr 85 90 95 Ile Met Asp Lys Ala Asp Gly Ser Leu Val Ser Ser Tyr Val Asp Asp 100 105 110 Gly Tyr Leu Tyr Leu Lys Ser Lys Thr Ser Leu Tyr Ser Asp Gln Ala 115 120 125 Arg Gln Ala Ser Ala Leu Leu Asn Ser Glu Glu Tyr Ser Ser Leu His 130 135 140 Gln Val Ile Leu Glu Leu Ala Leu Asp Gly Tyr Thr Val Asn Met Glu 145 150 155 160 Phe Val Ser Pro Asn Asn Arg Val Val Leu Ala Tyr Gln Glu Pro Gln 165 170 175 Leu Phe Val Leu Asn Val Arg Asn Asn Thr Thr Gly Glu Tyr Ile Lys 180 185 190 Tyr Asp Asp Leu Tyr Ala Asn Ala Lys Ile Arg Pro Tyr Leu Ile Asn 195 200 205 Ala Tyr Gly Ile Ser Asp Pro Thr Thr Trp Val Glu Gly Val Arg Ala 210 215 220 Leu Glu Gly Val Glu Gly Tyr Ile Ala Val Leu Asn Thr Gly Gln Arg 225 230 235 240 Phe Lys Val Lys Thr Glu Trp Tyr Ser Ala Leu His His Thr Lys Asp 245 250 255 Ser Ile Thr Ser Asn Glu Arg Leu Phe Ala Ser Val Val Ser Ala Asn 260 265 270 Ser Asp Asp Leu Arg Ser Leu Phe Ala Gly Asp Glu Tyr Ala Ile Lys 275 280 285 Lys Ile Ser Ala Phe Glu Gln Ala Tyr Leu Asp Tyr Leu Gly Lys Ser 290 295 300 Leu Glu Leu Cys Gln Ser Phe Tyr Asp Glu Tyr Arg Gly Arg Ala Arg 305 310 315 320 Lys Asp Tyr Ala Ile Ala Ala Gln Lys Ala Thr Val Asn Gln Arg His 325 330 335 Leu Phe Gly Val Ile Met Asn Met Tyr Glu Gly Thr Val Asp Val Asp 340 345 350 Lys Leu Leu Lys Asp Leu Glu Arg Val Phe Leu Lys Tyr Trp Ala Gly 355 360 365 Tyr Val Pro Lys Glu Tyr Glu Lys Glu Ile Glu Ile Ser Glu Glu 370 375 380 <210> 67 <211> 384 <212> PRT <213> Wild-type Stenotrophomonas phage IME13 ligase protein sequence - 'RNA8' <400> 67 Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu 1 5 10 15 Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met 20 25 30 Gly Thr Lys Ala Arg Ile Phe Ser Tyr Phe Ile Ala Ser Tyr Thr Asp 35 40 45 Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu 50 55 60 Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys 65 70 75 80 Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr 85 90 95 Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser 100 105 110 Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Ala Ala Ile Phe 115 120 125 Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr 130 135 140 Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe 145 150 155 160 Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu 165 170 175 Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln 180 185 190 Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg 195 200 205 Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu 210 215 220 Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile 225 230 235 240 Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr 245 250 255 Ser Ser Leu His Arg Thr Lys Asp Ser Ile Asn Asn Asn Lys Ala Leu 260 265 270 Phe Gln Ser Ile Lys Glu Arg Ala Ser Asp Asp Leu Arg Gly Met Phe 275 280 285 Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala 290 295 300 Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe 305 310 315 320 Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala 325 330 335 Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln 340 345 350 Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu 355 360 365 Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg 370 375 380 <210> 68 <211> 394 <212> PRT <213> Wild-type Escherichia phage JSE ligase protein sequence - 'RNA9' <400> 68 Met Glu His Lys Leu Cys Gln Gln Lys Lys Thr Thr Lys Lys Val Leu 1 5 10 15 Ala Leu Phe Lys Asn Leu Met Ala Leu Cys Asp Gly Ser Asp Thr Phe 20 25 30 Tyr Tyr Lys Asp Glu Ile Thr Ala Met Gln Thr Arg Met Arg Ile Phe 35 40 45 Ser Tyr Leu Tyr Leu Ser Lys Pro Glu Met Trp Asn Lys Pro Asp Ala 50 55 60 Leu Glu Cys Arg Gly Ile Met Phe Glu Ile Asp Asp Lys Asp Arg Pro 65 70 75 80 Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Gly Glu 85 90 95 Asn Asp Arg Ala Arg Phe Lys Pro Glu Asp Val Glu Met Val Met Asp 100 105 110 Lys Met Asp Gly Ser Leu Val Ser Thr Tyr Ile Asp Asn Gly Tyr Val 115 120 125 Gln Leu Lys Ser Lys Ala Ala Leu Tyr Ser Ser Gln Ala Glu Arg Ala 130 135 140 Asn Gly Leu Leu Tyr Ser Glu Lys Tyr Ala Asp Leu Arg Ala Lys Ile 145 150 155 160 Ala Asp Ile Gly Ser Asp Tyr Thr Phe Asn Phe Glu Tyr Thr Ala Pro 165 170 175 Ser Asn Arg Ile Val Val Glu Tyr Ser Glu Pro Ser Leu Thr Leu Leu 180 185 190 Asn Val Arg His Asn Val Thr Gly Glu Tyr Val Pro His Gln Met Leu 195 200 205 Phe Ala Asp Ala Ile Leu Arg Pro His Leu Val Asn Ala Leu Gln Val 210 215 220 Asp Ser Ala Arg Phe Ser Asn Ile Leu Asp Glu Val Arg Thr Ala Glu 225 230 235 240 Gly Ile Glu Gly Ile Val Ala Arg Thr Lys Asp Gly Gln Met Phe Lys 245 250 255 Val Lys Ser Glu Trp Tyr Ile Gly Val His Asn Ile Lys Asn Thr Ser 260 265 270 Met Phe Pro Asn Asn Leu Ile Tyr Tyr Val Val Glu Ser Glu Thr Asp 275 280 285 Asp Leu Arg Ala Ala Tyr Glu Gly Glu Pro Glu Ala Leu Glu Arg Ile 290 295 300 Glu Leu Phe Glu Glu Ala Phe Arg Ser Ile Leu Arg Asn Ala Phe Thr 305 310 315 320 Thr Ala Thr Glu Phe Tyr Asn Ala His Ala Gly Glu Asp Arg Lys Thr 325 330 335 Tyr Ala Ser Asn Ala Thr Ile Glu Ser Arg Lys His Gly Asp Ala Gln 340 345 350 Ser Tyr Ile Phe Met Cys Leu Met Ile Ala Phe Asp Gly Leu Asp Tyr 355 360 365 Asp Arg Ile Leu Ala Ser Met Lys Thr Tyr Tyr Leu Arg Asn Tyr Lys 370 375 380 Lys Leu Ile Pro Ala Asp Lys Ile Asp Trp 385 390 <210> 69 <211> 385 <212> PRT <213> Wild-type Acinetobacter phage Acj61 ligase protein sequence - 'RNA16' <400> 69 Met Lys Glu Leu Phe Asp Asn Leu Met Ala Leu Gln Asp Pro Asn Asp 1 5 10 15 Ile Ser Lys Phe Phe Tyr Lys Asp Val Val Thr Gln Pro Gly Thr Lys 20 25 30 Cys Arg Ile Phe Ser Tyr Asn Tyr Ala Ala Tyr Ser Asp Trp Leu Leu 35 40 45 Pro Gly Ala Leu Glu Ser Arg Gly Ile Met Phe Glu Leu Asp Ala Asp 50 55 60 Asn Gln Pro Val Arg Val Met Ala Arg Pro Met Glu Lys Phe Phe Asn 65 70 75 80 Leu Glu Glu Asn Pro Phe Thr Met Asp Leu Asp Leu Ser Gln Leu Glu 85 90 95 Tyr Ala Met Thr Lys Ala Asp Gly Ser Leu Ile Ser Thr Tyr Val Asp 100 105 110 Gln Gly Tyr Leu Tyr Thr Lys Ser Lys Gly Ser Ile Ser Ser Ser Gln 115 120 125 Ala Ile Glu Ser Lys Gln Leu Leu Leu Asp Ile Asn Tyr Lys Pro Leu 130 135 140 Ala Glu Arg Ala Leu Glu Leu Ala Lys Asp Gly Phe Thr Cys Asn Phe 145 150 155 160 Glu Tyr Val Ala Pro Asn Asn Arg Ile Val Leu Asn Tyr Ala Lys Lys 165 170 175 Asp Leu Ile Leu Leu Asn Val Arg His Asn Glu Thr Gly Glu Tyr Val 180 185 190 Pro Met Ala Glu Leu Gln Lys Asp Pro Val Leu Arg Asn Tyr Leu Ile 195 200 205 Asp Val Tyr Pro Pro Arg Glu Asp Ile Asp Thr Asn Glu Met Ile Lys 210 215 220 Glu Ile Arg Glu Met Val Asp Ile Glu Gly Phe Val Phe Gln His Ala 225 230 235 240 Ser Gly Leu Lys Phe Lys Leu Lys Thr Glu Trp Tyr Ser Asn Leu His 245 250 255 Arg Val Lys Asp Thr Leu Asn Asn Ser Glu Ala Leu Phe Met Val Val 260 265 270 Val Ala Gly Gly Ser Asp Asp Met Lys Ser Leu Phe Thr Asp Asp Leu 275 280 285 Ser Arg Thr Lys Ile Glu Ser Phe Glu Thr Ala Phe Leu Asp Tyr Leu 290 295 300 Lys Lys Thr Ser Asn Phe Val Phe Asp Leu Gln Arg Gln Leu Ile Gly 305 310 315 320 Ser Asp Arg Lys Thr Tyr Ala Ile Glu Cys Gln Thr Ile Leu Arg Asn 325 330 335 Thr Asp Gln Leu Glu Leu Phe Gly Val Met Met Glu Leu Tyr Lys Gly 340 345 350 Ala Asp Gln Glu Gln Thr Ile Lys Asn Ile Asn Val Val Phe Met Lys 355 360 365 Asn Tyr Lys Lys Tyr Val Pro Ala Gly Phe Glu Thr Leu Lys Asn Glu 370 375 380 Tyr 385 <210> 70 <211> 381 <212> PRT <213> Wild-type Vibrio phage VH7D ligase protein sequence - 'RNA20' <400> 70 Met Asn Val Gln Glu Leu Tyr Lys Asn Leu Met Ser Leu Ala Asp Asp 1 5 10 15 Ala Glu Gly Lys Phe Phe Phe Ala Asp His Leu Ser Pro Leu Gly Glu 20 25 30 Lys Phe Arg Val Phe Ser Tyr His Ile Ala Ser Tyr Ser Asp Trp Leu 35 40 45 Leu Pro Gly Ala Leu Glu Ala Arg Gly Ile Met Phe Gln Leu Asp Asp 50 55 60 Asn Asp Glu Met Ile Arg Ile Val Ser Arg Pro Met Glu Lys Phe Phe 65 70 75 80 Asn Leu Asn Glu Asn Pro Phe Thr Met Glu Leu Asp Leu Thr Thr Thr 85 90 95 Val Gln Leu Met Asp Lys Ala Asp Gly Ser Leu Ile Ser Thr Tyr Leu 100 105 110 Ser Gly Glu Asn Phe Ala Leu Lys Ser Lys Thr Ser Ile Phe Ser Glu 115 120 125 Gln Ala Val Ala Ala Asn Arg Tyr Ile Lys Lys Pro Glu Asn Arg Asp 130 135 140 Leu Trp Glu Phe Cys Asp Asp Cys Thr Gln Ala Gly Leu Thr Val Asn 145 150 155 160 Met Glu Trp Cys Ala Pro Asn Asn Arg Ile Val Leu Glu Tyr Pro Glu 165 170 175 Ala Lys Leu Val Ile Leu Asn Ile Arg Asp Asn Glu Thr Gly Asp Tyr 180 185 190 Val Ser Phe Asp Asp Ile Pro Gln Ser Ala Leu Met Arg Val Lys Gln 195 200 205 Trp Leu Val Asp Glu Tyr Asp Pro Ala Thr Ala His Glu Pro Asp Phe 210 215 220 Val Glu Lys Leu Arg Asp Thr Lys Gly Ile Glu Gly Met Ile Leu Arg 225 230 235 240 Leu Ala Asn Gly Gln Ser Val Lys Ile Lys Thr Gln Trp Tyr Val Asp 245 250 255 Leu His Ser Gln Lys Asp Ser Val Asn Val Pro Lys Lys Leu Val Thr 260 265 270 Thr Ile Leu Asn Gly Asn His Asp Asp Leu Tyr Ala Leu Phe Ala Asp 275 280 285 Asp Lys Pro Thr Ile Glu Arg Ile Arg Glu Phe Asp Ser His Val Thr 290 295 300 Lys Thr Leu Thr Asn Ser Phe Asn Ala Val Arg Gln Phe Tyr Ala Arg 305 310 315 320 Asn Arg His Leu Ala Arg Lys Asp Tyr Ala Ile Ala Gly Gln Lys Val 325 330 335 Leu Lys Pro Trp Glu Phe Gly Val Ala Met Ile Ala Tyr Gln Lys Gln 340 345 350 Thr Val Glu Gly Val Tyr Glu Ser Leu Val Thr Ala Tyr Leu Lys Arg 355 360 365 Pro Glu Leu Ala Ile Pro Glu Lys Tyr Leu Asn Gly Val 370 375 380 <210> 71 <211> 382 <212> PRT <213> Wild-type Escherichia phage JS98 ligase protein sequence - 'RNA22' <400> 71 Met Ile Glu Leu Tyr Asp Asn Leu Met Thr Leu Val Lys Asn Ser Thr 1 5 10 15 Lys Ser Lys Phe Phe Phe Lys Asp Phe Gln Ser Ala Leu Gly Val Asn 20 25 30 Tyr Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Glu 35 40 45 Asp Gly Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Glu Asn 50 55 60 Gly Pro Val Arg Ile Ala Ala Arg Pro Met Gln Lys Phe Phe Asn Leu 65 70 75 80 Asp Glu Asn Pro Leu Thr Ile Gly Leu Asp Leu Ser Gln Glu Asn Ile 85 90 95 Asp Leu Val Met Ala Lys Glu Asp Gly Ser Leu Ile Ser Thr Phe Met 100 105 110 Asp Arg Gln Tyr Leu Ser Val Lys Ser Lys Gly Ser Ile His Ser Ser 115 120 125 Met Val His Asp Ser Leu Arg Phe Leu Arg Leu Pro Glu Asn Glu Ala 130 135 140 Phe Ala Ala Arg Leu Glu Glu Ile Thr Lys Ala Gly Tyr Thr Cys Asn 145 150 155 160 Leu Glu Tyr Val Ser Pro Thr Asn Arg Ile Val Leu Ala Tyr Gln Glu 165 170 175 Thr Asn Leu Ile Leu Leu Asn Val Arg Asn Asn Glu Thr Gly Glu Tyr 180 185 190 Ile Pro Tyr Ala Glu Leu Phe Lys Asp Gly Ala Leu Arg Lys His Leu 195 200 205 Val Lys Ser Tyr Glu Leu Ser Glu Gly Asp Phe Val Asp Asn Ile Arg 210 215 220 Lys Gln Glu Gly Ile Glu Gly Phe Ile Phe Val Leu Lys Asp Gly Thr 225 230 235 240 Phe Phe Lys Leu Lys Thr Ala Trp Tyr Ser Ala Leu His His Thr Lys 245 250 255 Asp Ser Ile Asn Asn Asn Glu Arg Leu Phe Glu Val Val Val Ala Gly 260 265 270 Gly Thr Asp Asp Leu Arg Gly Leu Phe Ser Thr Asp Ser Phe Ala Ile 275 280 285 Glu Lys Ile Asn Ala Phe Glu Arg Ile His Leu Asp Tyr Leu Glu Gln 290 295 300 Ser Leu Ala Leu Leu Glu Ala Ala Tyr Ser Gln Leu Lys Gly Arg Asp 305 310 315 320 Arg Lys Asp Tyr Ala Val Thr Gly Gln Leu Ile Leu Lys Asp Phe Pro 325 330 335 Gly Leu Phe Ser Ile Leu Met Gln Ala Tyr Val Asp Gly Ile Asn Tyr 340 345 350 Asp Thr Val Met Asp Gln Ile Asn Ser Val Phe Leu Lys Asn His Lys 355 360 365 Ala Gln Ile Pro Glu Lys Tyr Leu Lys Glu Ile Val Val Glu 370 375 380 <210> 72 <211> 386 <212> PRT <213> Wild-type Escherichia phage vB_EcoM_112 ligase protein sequence - 'RNA23' <400> 72 Met Val Leu Tyr Ser Lys His Lys Arg Gly Tyr Thr Met Gln Glu Leu 1 5 10 15 Phe Asn Asn Leu Met Glu Leu Cys Lys Asp Ser Gln Arg Lys Phe Phe 20 25 30 Tyr Ser Asp Asp Val Ser Ala Ser Gly Arg Thr Tyr Arg Ile Phe Ser 35 40 45 Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu Pro Asp Ala Leu Glu 50 55 60 Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu Lys Pro Val Arg Ile 65 70 75 80 Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Asn Glu Asn Pro Phe 85 90 95 Thr Met Asn Ile Asp Leu Asn Asp Val Asp Tyr Ile Leu Thr Lys Glu 100 105 110 Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly Asp Glu Ile Leu Phe 115 120 125 Lys Ser Lys Gly Ser Ile Lys Ser Glu Gln Ala Leu Met Ala Asn Gly 130 135 140 Ile Leu Met Asn Ile Asn His His Gln Leu Arg Asp Arg Leu Lys Glu 145 150 155 160 Leu Ala Glu Asp Gly Phe Thr Ala Asn Phe Glu Phe Val Ala Pro Thr 165 170 175 Asn Arg Ile Val Leu Ala Tyr Gln Glu Met Lys Ile Ile Leu Leu Asn 180 185 190 Val Arg Glu Asn Glu Thr Gly Glu Tyr Ile Ser Tyr Asp Asp Ile Tyr 195 200 205 Lys Asp Ala Ile Leu Arg Pro Tyr Leu Val Glu Arg Tyr Glu Ile Asp 210 215 220 Ser Pro Lys Trp Val Glu Glu Ala Lys Asn Ala Glu Asn Ile Glu Gly 225 230 235 240 Tyr Val Ala Val Met Lys Asp Gly Ser His Phe Lys Ile Lys Ser Asp 245 250 255 Trp Tyr Val Ser Leu His Ser Thr Lys Ser Ser Leu Asp Asn Pro Glu 260 265 270 Lys Leu Phe Lys Thr Ile Ile Asp Gly Ala Ser Asp Asp Leu Lys Ala 275 280 285 Met Tyr Ala Asp Asp Glu Tyr Ser Tyr Arg Lys Ile Glu Ala Phe Glu 290 295 300 Thr Thr Tyr Leu Lys Tyr Leu Asp Arg Ala Leu Phe Leu Val Leu Asp 305 310 315 320 Cys His Asn Lys His Cys Gly Lys Asp Arg Lys Thr Tyr Ala Met Glu 325 330 335 Ala Gln Gly Val Ala Lys Gly Ala Gly Met Asp His Leu Phe Gly Ile 340 345 350 Ile Met Ser Leu Tyr Gln Gly Tyr Asp Ser Gln Glu Lys Val Met Cys 355 360 365 Glu Ile Glu Gln Asn Phe Leu Lys Asn Tyr Lys Lys Phe Ile Pro Glu 370 375 380 Gly Tyr 385 <210> 73 <211> 392 <212> PRT <213> Wild-type Aeromonas phage CC2 ligase protein sequence - 'RNA28' <400> 73 Met Lys Glu Leu Tyr Asn Asn Leu Leu Lys Leu Thr Glu Glu His Gly 1 5 10 15 Asp Cys Phe Phe Phe Arg Asp His Trp Ser Ser Ile Gly Asn His Phe 20 25 30 Arg Val Phe Ser Tyr His Ile Ala Gly Leu Thr Gln Trp Met Leu Pro 35 40 45 Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu Ile Asn Gly Glu 50 55 60 Pro Tyr Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu Ala 65 70 75 80 Glu Arg Gln Ala Trp Asn Leu Thr Asn Ser Gly Val Val Gly Leu Asp 85 90 95 Lys Leu Glu Leu Asp Tyr Ser Asn Ile Asp Arg Tyr Glu Asp Lys Ala 100 105 110 Asp Gly Ser Leu Met Ser Ser Tyr His Phe Ile Asp Pro Glu Asp Asp 115 120 125 Asn Arg Ile Asn Tyr Met Leu Lys Ser Lys Thr Ser Ile Asn Ser Asp 130 135 140 Gln Ala Asn Asp Ala Asn Arg Trp Leu Val Asn His Thr Asp Leu Leu 145 150 155 160 Asp Phe Ile Ile Asp Cys Glu Glu Ala Gly Tyr Thr Val Asn Leu Glu 165 170 175 Trp Cys Ser Pro Lys Asn Gln Ile Val Ile Met Tyr Pro Glu Glu Ser 180 185 190 Leu Lys Ile Leu Asn Val Arg His Arg Asp Thr Gly Glu Tyr Tyr Ser 195 200 205 Asn Asn Ser Leu Ile Arg Ser Pro Val Phe Arg Lys Tyr Ala Val Asp 210 215 220 Gln Phe Met Phe Glu Glu Gly Thr Asp Val Asn Thr Ala Ile Ser Asn 225 230 235 240 Met Tyr Asn Glu Thr Gly Ile Glu Gly Tyr Ile Leu Val Met Arg Asp 245 250 255 Gly Ser Arg Val Lys Ile Lys Thr Thr Ser Tyr Val Ala Arg His Lys 260 265 270 Leu Lys Asp Ser Ile Thr Asn Asn Lys Asp Leu Val Ile Ala Val Ala 275 280 285 Gln Gly Val Ser Asp Asp Leu Arg Gln Leu Phe Leu Asp Asp Ser Leu 290 295 300 Ser Leu Thr Lys Ile Gln Glu Phe Glu Asp His Val Val Ser Val Ala 305 310 315 320 Gly Ser Thr Tyr Thr Lys Ile Arg Glu Ala His Lys Ala Cys Ala Gly 325 330 335 Met Glu Arg Arg Glu Tyr Ala Ile Ser Met Gln Asn Thr Phe Lys Gln 340 345 350 Asp Arg Met Phe Phe Asn Ile Val Met Lys Met Phe Gln Ala Pro Asp 355 360 365 Leu Glu Val Met Pro Glu Ile Met Ser Val Ile Ile Lys Tyr Pro Asp 370 375 380 Glu Phe Val Pro Thr Lys Trp Lys 385 390 <210> 74 <211> 374 <212> PRT <213> Wild-type Enterobacteria phage RB69 ligase protein sequence - 'RNA29' <400> 74 Met Glu Lys Leu Tyr Tyr Asn Leu Leu Ser Leu Cys Lys Ser Ser Ser 1 5 10 15 Asp Arg Lys Phe Phe Tyr Ser Asp Asp Val Ser Pro Ile Gly Lys Lys 20 25 30 Tyr Arg Ile Phe Ser Tyr Asn Phe Ala Ser Tyr Ser Asp Trp Leu Leu 35 40 45 Pro Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Asp Gly Glu 50 55 60 Thr Pro Leu Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu 65 70 75 80 Asn Glu Asn Pro Phe Thr Leu Ser Ile Asp Leu Asn Asp Val Lys Tyr 85 90 95 Leu Met Thr Lys Glu Asp Gly Ser Leu Val Ser Thr Tyr Leu Asp Gly 100 105 110 Asn Met Val Arg Phe Lys Ser Lys Gly Ser Ile Lys Ser Asp Gln Ala 115 120 125 Ala Ser Ala Thr Ser Ile Leu Leu Asp Ile Asn His Lys Asp Leu Ala 130 135 140 Asp Arg Leu Leu Glu Leu Cys Asn Asp Gly Phe Thr Ala Asn Phe Glu 145 150 155 160 Tyr Val Ala Pro Ser Asn Lys Ile Val Leu Thr Tyr Pro Glu Lys Arg 165 170 175 Leu Ile Leu Leu Asn Ile Arg Asp Asn Asn Thr Gly Lys Tyr Ile Glu 180 185 190 Tyr Asp Asp Ile Tyr Leu Asp Pro Val Phe Arg Lys Tyr Leu Val Asp 195 200 205 Arg Phe Glu Ala Pro Glu Gly Asp Trp Val Pro Gly Val Lys Ser Ser 210 215 220 Thr Asn Ile Glu Gly Tyr Val Ala Val Met Lys Asp Gly Ser His Phe 225 230 235 240 Lys Leu Lys Thr Asp Trp Tyr Val Ala Leu His Thr Thr Arg Asp Ser 245 250 255 Ile Ser Ser Pro Glu Lys Leu Phe Leu Ala Ile Met Asn Gly Ala Ser 260 265 270 Asp Asp Leu Lys Ala Met Tyr Ala Asp Asp Glu Phe Ser Phe Lys Lys 275 280 285 Val Glu Leu Phe Glu Lys Ala Tyr Leu Asp Phe Leu Asp Arg Ser Phe 290 295 300 Tyr Ile Cys Leu Asp Ala Tyr Asp Lys His Lys Gly Lys Asp Arg Lys 305 310 315 320 Thr Tyr Ala Ile Glu Ala Gln Ala Ile Cys Lys Gly Ala Gln Ser Pro 325 330 335 Trp Leu Phe Gly Ile Ile Met Asn Leu Tyr Gln Gly Gly Ser Lys Glu 340 345 350 Gln Met Met Thr Ala Leu Glu Ser Val Phe Ile Lys Asn His Lys Asn 355 360 365 Phe Ile Pro Glu Gly Tyr 370 <210> 75 <211> 388 <212> PRT <213> Wild-type Acinetobacter phage Ac42 ligase protein sequence - 'RNA31 <400> 75 Met Asn Glu Leu Tyr Asn Asn Leu Met Thr Leu Ile Glu Pro Gly Lys 1 5 10 15 Met Ser Arg Phe Phe Leu Arg Asp Ala Val Thr Pro Phe Gly Thr Arg 20 25 30 Val Arg Met Phe Gly Tyr Asn Tyr Ala Ser Tyr Thr Asp Trp Leu Leu 35 40 45 Pro Asp Ala Leu Glu Ala Arg Gly Ile Met Phe Glu Met Asp Glu Asn 50 55 60 Asp Gln Pro Ile Arg Val Met Ala Arg Pro Met Glu Lys Phe Phe Asn 65 70 75 80 Leu Gly Glu Asn Pro Phe Thr Ile Asp Leu Asp Leu Ser Thr Ile Glu 85 90 95 Tyr Phe Met Asp Lys Ser Asp Gly Ser Leu Ile Ser Ser Tyr Val Asp 100 105 110 Asn Asp Thr Leu Phe Met Lys Ser Lys Met Ser Ile Gly Ser Val Gln 115 120 125 Ala Val Ala Ala Arg Gln Val Ile Gln Asp Tyr Val His Arg Asp Leu 130 135 140 His Asp Arg Val Leu Glu Leu Ala Lys Asp Gly Phe Thr Cys Asn Phe 145 150 155 160 Glu Tyr Val Ala Pro Asp Asn Arg Val Val Ile Leu Tyr Pro Glu Arg 165 170 175 Ala Leu Val Leu Leu Asn Val Arg Asn Asn Glu Thr Gly Glu Tyr Val 180 185 190 His Ile Glu Glu Leu Lys Arg Asp Pro Val Leu Arg Arg Tyr Leu Val 195 200 205 Asn Asn Tyr Val Ile Asp Pro Glu Asn Phe Asp Gln Asp Thr Phe Val 210 215 220 Asn Asp Ile Tyr Gln Met Val Asp Ile Glu Gly Tyr Val Phe Arg Leu 225 230 235 240 Met Thr Gly Gln His Val Lys Ile Lys Thr Glu Trp Tyr Lys Met Leu 245 250 255 His Tyr Ala Lys Asp Thr Ile Asn Asn Asn Glu Ala Leu Phe Ala Ile 260 265 270 Thr Val Ala Ala Gln Leu Asp Asp Val Arg Ser Leu Tyr Ser Asp Asp 275 280 285 Tyr Ala Leu Gly Lys Ile Asn Lys Phe Glu Glu Val Phe Leu Gly Phe 290 295 300 Leu Asp Thr Arg Leu Pro Ile Leu Leu Asn Leu His Lys Glu Leu Asn 305 310 315 320 Gly Ser Ser Arg Lys Asp Tyr Ala Ile Lys Ser Gln Thr Tyr Phe Lys 325 330 335 Gln Ala Asn Glu Leu Tyr Leu Phe Gly Ile Phe Met Gln Met Phe Glu 340 345 350 Gly Val Pro Pro Arg Glu Gln Leu Val Glu Lys Leu Ser Glu Ala Phe 355 360 365 Met Lys Asn Tyr Lys Leu Phe Val Pro Pro Glu Tyr Asp Lys Val Val 370 375 380 Glu Tyr Asp Asn 385 <210> 76 <211> 382 <212> PRT <213> Wild-type Pectobacterium phage CBB ligase protein sequence - 'RNA33' <400> 76 Met Arg Thr Lys Gln Ile Phe Asp Asp Leu Met Asn Leu Thr Ala Lys 1 5 10 15 Asn Asp Ala Phe Met Trp Lys Asp Phe Val Ser Pro Ala Gly Gly Leu 20 25 30 Phe Arg Ile Phe Ser Tyr Arg Leu Ala Ser Tyr Ser Asp Phe Leu Glu 35 40 45 Pro Asn Ala Leu Glu Cys Arg Gly Ser Met Phe Lys Val Asp Asp Glu 50 55 60 Gly Asn Phe Val Gly Ile Ala Ser Arg Thr Pro Met Lys Phe Phe Asn 65 70 75 80 Ala Tyr Glu Asn Pro Phe Thr Met Tyr Asp Lys Asp Thr Leu Ser Ser 85 90 95 Glu Ile Ala Val Val Met Asp Lys Leu Asp Gly Ser Ile Ile Ser Thr 100 105 110 Phe Met Asp Val Asp Phe Val Val Arg Thr Lys Ser His Ala Ser Leu 115 120 125 His Ser Asp His Ala Tyr Asn Ser Thr Ala Met Leu Ile Ala Asp Lys 130 135 140 Glu Leu Tyr Asn Glu Val His Tyr Ala Glu Ser Met Gly Tyr Thr Val 145 150 155 160 Asn Met Glu Tyr Thr Ser Pro Glu Tyr Arg Ile Val Leu Pro Tyr Gln 165 170 175 Glu Asp Asn Leu Thr Val Leu Asn Leu Arg His Arg Glu Thr Gly Glu 180 185 190 Leu Leu Ile Gly Glu Arg Leu Lys Glu Phe Ser Lys Ile Leu Tyr Glu 195 200 205 Arg Ser Val Phe Ala Lys His Gly Glu Ile Asp Ala Thr Phe Pro Met 210 215 220 Lys Glu Thr Leu Lys Glu Ser Ile Asp Ala Val Arg Gly Met Ala Asp 225 230 235 240 Ile Glu Gly Tyr Val Leu Ile Leu Lys Asp Gly Arg Met Cys Lys Ile 245 250 255 Lys Thr Asp Trp Tyr Cys Ala Leu His Phe Thr Lys Asp Ser Ile Asn 260 265 270 Val Asp Ser Arg Leu Tyr Asp Ala Ile Ile Thr Gly Ala Ser Asp Asp 275 280 285 Leu Lys Gln Met Phe Ser Thr Asp Leu Tyr Ala Met Lys Lys Ile Glu 290 295 300 Lys Met Glu Gln Leu Ile Phe Ser Cys Tyr Asn Lys Leu Val His Asp 305 310 315 320 Val Glu Ser Phe Tyr Glu Glu Asn Lys His Leu Glu Arg Lys Glu Tyr 325 330 335 Ala Leu Lys Val Gln Ser Thr Leu Pro Asn Glu Leu Gly Met Pro Gly 340 345 350 Leu Ala Phe Ser Leu Tyr Ala Ser Lys Pro Val Asp Tyr Lys Gly Gln 355 360 365 Met Leu Lys Tyr Met Lys Asp Val Leu Val Asn Phe Glu Val 370 375 380 <210> 77 <211> 385 <212> PRT <213> Wild-type Aeromonas phage phiAS5 ligase protein sequence - 'RNA35 <400> 77 Met Gln Ser Ile Lys Glu Leu Tyr Gln Asn Leu Val Asn Leu Cys Val 1 5 10 15 Asp Asp Asn Thr Lys Phe Phe Phe Ser Glu Thr Val Thr Ser Leu Gly 20 25 30 Thr Lys Val Arg Ile Phe Asp Tyr His Val Ala Gly Tyr Asn Asp Trp 35 40 45 Ile Arg Pro Asp Ala Met Ala Cys Arg Gly Ile Met Phe Glu Met Asn 50 55 60 Gly Glu Ile Pro Val Arg Ile Met Ser Arg Pro Met Asp Lys Phe Phe 65 70 75 80 Asn Tyr Ser Glu Val Ile Gly Trp Glu Lys Leu Glu Thr His Gly Asn 85 90 95 Met Lys Met Pro Asp Leu Ser Lys Ile Lys Phe Val Ile Asp Lys Arg 100 105 110 Asp Gly Ser Leu Ile Ser Thr Phe Met Asp Val Asp Asn Leu Leu Leu 115 120 125 Lys Ser Lys Gly Ser Ile Arg Ser Asn Gln Ala Asn Asp Ala Ser Val 130 135 140 Trp Leu Tyr Gln Asp Asp Gln Ala Asp Leu Leu Glu Phe Cys Arg Ala 145 150 155 160 Tyr Ala Lys Glu Gly Phe Thr Val Asn Met Glu Trp Thr Ala Pro His 165 170 175 Asn Gln Ile Val Leu Cys Tyr Thr Asp His Gln Leu Arg Ile Leu Asn 180 185 190 Ile Arg His Asn Glu Thr Gly Glu Tyr Val Asp Phe Ala Glu Leu Gln 195 200 205 Lys Asp Ser Val Phe Arg Lys Tyr Ala Ala Asp Phe Tyr Glu Val Pro 210 215 220 Gln Asp Gly Ala Glu Trp Ile Lys Asn Val Tyr Gly Met Thr Gly Ile 225 230 235 240 Glu Gly Tyr Val Val Val Met Glu Asp Tyr Gln Met Phe Lys Leu Lys 245 250 255 Thr Asp Trp Tyr Val Ala Leu His His Thr Lys Asp Ser Ile Asn Asp 260 265 270 Ser Lys Arg Leu Ile Ser Ala Cys Ala Glu Asn Ala Thr Asp Asp Leu 275 280 285 Arg Gln Met Phe Arg Asp Asp Pro Asn Ser Leu Ala Lys Ile Glu Val 290 295 300 Phe Asp Ala Lys Phe Arg Asp Val Val Ser Ser Ala Met Gln Ala Leu 305 310 315 320 Thr Asn Ala Tyr Ser Lys Tyr Lys Ala Leu Glu Arg Arg Glu Tyr Ala 325 330 335 Ile Ser Met Thr Asn Glu Phe Lys Asn Glu Arg His Trp Phe Asn Ile 340 345 350 Ala Met Gln Met Phe Ser Thr Arg Pro Asp Phe Ser Leu Ala Asp Glu 355 360 365 Ile Val Ala Val Ile Lys Lys Tyr Pro Glu Lys Phe Val Pro Gln Gly 370 375 380 Tyr 385 <210> 78 <211> 376 <212> PRT <213> Wild-type Salmonella phage vB_SenMS16 ligase protein sequence - 'RNA36 <400> 78 Met Lys Glu Leu Phe Asp Asn Leu Met Asn Leu Cys Asn Asp Thr Asp 1 5 10 15 Glu Ser Arg Phe Phe Tyr Arg Asp Asp Ile Ser Pro Ser Gly Leu Lys 20 25 30 Tyr Arg Ile Phe Ser Tyr Asn Tyr Ala Ser Tyr Ser Asp Trp Leu Leu 35 40 45 Pro Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Met Ile Asp Gly 50 55 60 Val Pro Val Arg Ile Ala Ser Arg Pro Met Glu Lys Phe Phe Asn Leu 65 70 75 80 Asn Glu Thr Pro Phe Thr Met Asn Leu Asp Leu Ser Asn Ala Val His 85 90 95 Met Met Lys Lys Glu Asp Gly Ser Leu Val Ser Ser Tyr Leu Asp Gly 100 105 110 Asn Ile Leu Arg Phe Lys Ser Lys Ser Ser Leu Lys Ser Glu Gln Ala 115 120 125 Tyr Leu Ser Ser Ala Met Leu Thr Ser Ile Thr His Glu Ala Leu Leu 130 135 140 Trp Arg Leu Leu Glu Leu Ala Arg Asp Gly Phe Thr Ala Asn Phe Glu 145 150 155 160 Tyr Val Ser Pro Glu Asn Arg Ile Val Leu Ala Tyr Gln Lys Lys Asp 165 170 175 Leu Ile Leu Leu Asn Ile Arg Glu Asn Asp Thr Gly Ala Tyr Val Pro 180 185 190 Tyr Asn Glu Ile Ala Lys Asp Pro Val Leu Arg Gln Tyr Leu Val Glu 195 200 205 Ser Tyr Glu Ile Pro Glu Gly Asp Phe Val Ser Asp Ile Lys Ala Met 210 215 220 Glu Gly Ile Glu Gly Tyr Val Phe Val Met Asp Asn Gly Leu Arg Phe 225 230 235 240 Lys Leu Lys Thr Asp Trp Tyr Thr Ala Leu His His Thr Lys Asp Ser 245 250 255 Ile Thr Lys Asn Asp Arg Leu Phe Glu Val Ile Val Asn Asn Ala Ser 260 265 270 Asp Asp Leu Lys Gly Leu Phe Ser Asn Asp Ala Tyr Ser Leu Lys Lys 275 280 285 Ile Asn Lys Phe Glu Glu Val Tyr Leu Asp Tyr Leu Arg Arg Ser Leu 290 295 300 Ser Phe Ile Ser Thr Ser Tyr Gln Lys Leu Arg Gly Leu Asp Arg Lys 305 310 315 320 Thr Tyr Ala Gly Glu Ala Lys Arg Leu Ala Asp Ala Glu Arg Leu Pro 325 330 335 Phe Leu Phe Thr Ile Leu Met Leu Met Phe Asn Asp Ser Met Asp Tyr 340 345 350 Asp Thr Thr Ile Lys Lys Val Asn Glu Leu Phe Met Lys Asn Tyr Lys 355 360 365 Thr Phe Ile Pro Lys Glu Tyr Glu 370 375 <210> 79 <211> 381 <212> PRT <213> Wild-type Vibrio phage KVP40 ligase protein sequence - 'RNA39' <400> 79 Met Thr Thr Gln Glu Leu Tyr Asn His Leu Met Thr Leu Thr Glu Asp 1 5 10 15 Ala Glu Gly Lys Phe Phe Phe Ala Asp His Ile Ser Pro Leu Gly Glu 20 25 30 Lys Leu Arg Val Phe Ser Tyr His Ile Ala Ser Tyr Ser Asp Trp Leu 35 40 45 Leu Pro Gly Ala Leu Glu Ala Arg Gly Ile Met Phe Gln Leu Asp Glu 50 55 60 Gln Asp Lys Met Val Arg Ile Val Ser Arg Pro Met Glu Lys Phe Phe 65 70 75 80 Asn Leu Asn Glu Asn Pro Phe Thr Met Asp Leu Asp Leu Thr Thr Thr 85 90 95 Val Gln Leu Met Asp Lys Ala Asp Gly Ser Leu Ile Ser Thr Tyr Leu 100 105 110 Thr Gly Glu Asn Phe Ala Leu Lys Ser Lys Thr Ser Ile Phe Ser Glu 115 120 125 Gln Ala Val Ala Ala Asn Arg Tyr Ile Lys Leu Pro Glu Asn Arg Asp 130 135 140 Leu Trp Glu Phe Cys Asp Asp Leu Thr Gln Ala Gly Cys Thr Val Asn 145 150 155 160 Met Glu Trp Cys Ala Pro Asn Asn Arg Ile Val Leu Glu Tyr Pro Glu 165 170 175 Ala Lys Leu Val Ile Leu Asn Ile Arg Asp Asn Glu Thr Gly Asp Tyr 180 185 190 Val Ser Phe Asp Asp Ile Pro Leu Pro Ala Leu Met Arg Val Lys Lys 195 200 205 Trp Leu Val Asp Glu Tyr Asp Pro Glu Thr Ala His Val Asp Asp Phe 210 215 220 Val Glu Lys Leu Arg Ala Thr Lys Gly Ile Glu Gly Met Ile Leu Arg 225 230 235 240 Leu Ala Asn Gly Gln Ser Val Lys Ile Lys Thr Gln Trp Tyr Val Asp 245 250 255 Leu His Ser Gln Lys Asp Ser Val Asn Val Pro Lys Lys Leu Val Thr 260 265 270 Thr Ile Leu Asn Asn Asn His Asp Asp Leu Tyr Ala Leu Phe Ala Asp 275 280 285 Asp Lys Pro Thr Ile Asp Arg Ile Arg Glu Phe Asp Ser His Val Ser 290 295 300 Lys Thr Val Ser Ala Ser Phe His Ala Val Ser Gln Phe Tyr Val Lys 305 310 315 320 Asn Arg His Met Ser Arg Lys Asp Tyr Ala Ile Ala Gly Gln Lys Ala 325 330 335 Leu Lys Pro Trp Glu Phe Gly Val Ala Met Ile Ala Tyr Gln Lys Lys 340 345 350 Thr Val Glu Gly Val Tyr Glu Ala Leu Val Gly Ala Tyr Leu Lys Arg 355 360 365 Pro Glu Leu Leu Ile Pro Glu Lys Tyr Leu Asn Glu Ala 370 375 380 <210> 80 <211> 361 <212> PRT <213> Wild-type Campylobacter virus CP220 ligase protein sequence - 'RNA49' <400> 80 Met Asn Tyr Leu Glu Leu Lys Asn Met Ala Glu Asn Leu Lys Asp Ser 1 5 10 15 Asn Tyr Arg Ser Thr Lys Leu Asn Asn Phe Lys Phe Tyr Thr Tyr Ile 20 25 30 Phe Ser Asp Tyr Lys Asn Phe Lys Glu Asn Asn Thr Phe Phe Ile Arg 35 40 45 Gly Leu Met Ile Asp Ser Lys Ser Ile Leu Asn Lys Asp Thr Leu Ala 50 55 60 Pro Gly Ile Ser Ile Pro Met Pro Lys Phe Phe Asn Ile Asn Glu Asn 65 70 75 80 Glu Asp Trp Leu Leu Pro Asp Ser Thr Asn Leu Glu Asp Phe Thr Ile 85 90 95 Val Thr Lys Tyr Asp Gly Ser Leu Met Ile Pro Tyr Glu Tyr Asp Gly 100 105 110 Ile Lys Phe Arg Thr Lys Met Ser Ile Asp Asn Asp Gln Thr Lys Leu 115 120 125 Ala Asn Lys Tyr Ile Lys Asn Asn Pro Asp Ile Leu Asp Leu Ile Lys 130 135 140 Asn Asn Pro Asp Thr Gln Tyr Phe Phe Glu Leu Ile Ser Pro Leu Asn 145 150 155 160 Arg Ile Val Val Asp Tyr Asn Lys Thr Glu Leu Lys Leu Ile Ala Glu 165 170 175 Leu Asp Leu Arg Thr Leu Glu Phe Lys Ile His Glu Thr Asn Glu Phe 180 185 190 Asn Phe Lys Asp Leu Asn Ile Lys Thr Leu Lys Asp Leu Lys Asp Tyr 195 200 205 Ile Asn Thr Ile Ser Asn Tyr Glu Gly Val Ile Leu Gln His Lys Val 210 215 220 Thr Lys Lys Val Tyr Lys Leu Lys Thr Gln Glu Tyr Leu Asp Leu His 225 230 235 240 Asn Thr Met Thr Asn Leu Asp Leu Lys Val Ile Tyr Lys Met Ile Leu 245 250 255 Glu Glu Thr Ile Asp Asp Val Leu Pro Lys Leu Ser Pro Glu Ala Val 260 265 270 Ala Tyr Ile Asp Ser Val Ser Asn Ser Val Lys Val Lys Leu Asn Glu 275 280 285 Ile Leu Asp Ser Ile Asp Ser Asn Tyr Ile Lys Thr Lys Asp Leu Glu 290 295 300 Thr Pro Ala Leu Tyr Ile Lys Asp Leu Asn Ile Asp Pro Ile Ala Lys 305 310 315 320 Asp Cys Leu Phe Lys Leu Cys Lys Asn Lys Leu Asn Leu Asp Asp Val 325 330 335 Leu Asn Gln Val Lys Lys Ser Met Leu Lys Tyr Asn Lys Leu Arg Asp 340 345 350 Ile Lys Val Phe Leu Lys Trp Ile His 355 360 <210> 81 <211> 380 <212> PRT <213> Wild-type Pseudomonas phage phiPMW ligase protein sequence - 'RNA59' <400> 81 Met Lys Val Ile Glu Phe Leu Lys Asn Ala Pro Ser Ile Thr Asp Gly 1 5 10 15 Leu Ala Ser Leu His Leu Glu Leu Gly Ile Lys Ala Lys Ile Tyr Glu 20 25 30 Asp Glu Gly Leu Ile Val Leu Asn Tyr Ser Gln Ile Asp Ser Pro Lys 35 40 45 Thr His Pro Ile Val Gln Glu Cys Arg Gly Leu Ile Ile Asp Asn Asp 50 55 60 Leu Thr Val Val Ala Arg Pro Phe Asp Arg Phe Phe Asn Tyr Gly Glu 65 70 75 80 Ala Leu Asn Val Met Pro Glu Ile Asp Trp Glu Asn Ala Ser Ile Phe 85 90 95 Glu Lys Val Asp Gly Ser Leu Ile Lys Ile Tyr Phe His Lys Gly Arg 100 105 110 Trp Glu Val Ala Thr Arg Gly Thr Ala Phe Ala Glu Ser Glu Cys Met 115 120 125 Gly His Gly Ile Thr Phe Lys Glu Leu Val Phe Asn Ala Leu Lys Val 130 135 140 His Asp Asp Asp Gly Phe Gln Tyr Leu Met Asn Asn Ala Tyr Leu Phe 145 150 155 160 Arg Asp Thr Thr Tyr Leu Phe Glu Leu Thr Cys Val Glu Asn Arg Val 165 170 175 Val Arg His Tyr His Gly Tyr Asn Leu His Phe Leu Ala Ala Arg Asp 180 185 190 Asn Val Ser Gly Asn Tyr Ser Glu Glu Cys Arg Asp Trp Leu Arg Ser 195 200 205 Pro Asp Cys Ile Leu Tyr Gly Ile Val Lys His Pro Lys Arg Tyr Ala 210 215 220 Leu Gly Ser Ala Asp Glu Ala Leu Gln Ala Ala Lys Glu Leu Lys Asn 225 230 235 240 Leu Asp Glu Gly Phe Ile Val Tyr Gln Asn Ala Val Pro Ile Ala Lys 245 250 255 Ile Lys Ser Pro Ala Tyr Val Ala Val His His Ile Arg Gly Glu Gly 260 265 270 Leu Asn Pro Lys Arg Ile Met Glu Leu Val Leu Ser Gly Glu His Asp 275 280 285 Glu Tyr Leu Ser Tyr Phe Pro Glu Asp Arg Pro Ile Ile Gln Pro Tyr 290 295 300 Val Asp Ser Leu Leu Asp Met Leu Asn Ile Ile Ala Val Thr Tyr Pro 305 310 315 320 Arg Leu Asn Gln Ala Thr Thr Pro Lys Ala Phe Ala Ala Ala Ile Lys 325 330 335 His Ala Gly Ile Asp Lys Gln Lys Ala Ser Val Tyr Phe Met Ala Arg 340 345 350 Arg Asp Asn Lys Asp Pro Val Gln Val Phe His Gly Met Lys Thr Thr 355 360 365 Phe Lys Met Asp Met Leu Arg Lys Trp Met Met Val 370 375 380 <210> 82 <211> 317 <212> PRT <213> Wild-type Pseudomonas phage vB_PaeM_C2-10_Ab1 ligase protein sequence - 'RNA61' <400> 82 Met Pro Asn Cys Arg Ile Glu Ile Arg Arg Ser Arg Met Glu Gly Asn 1 5 10 15 Leu Asn Ile Ala Met Tyr Lys Asp Leu Ile Ala Asn Lys Leu Val Thr 20 25 30 Val Lys His Phe Asn Gly Met Ser Ile Ile Lys Tyr Ala Arg Lys Val 35 40 45 Phe Tyr Glu Asn Leu Trp Asn Glu His Pro Leu Leu Leu Glu Ala Arg 50 55 60 Gly His Val Phe Asp Gln His Ser Gly Asp Cys Ile Val Arg Pro Phe 65 70 75 80 Glu Lys Val Phe Asn Leu Gly Glu Asn Gly Ala Gly Ser Phe Leu His 85 90 95 Pro Lys Phe Arg Val Arg Leu Ile Glu Lys Val Asn Gly Phe Met Phe 100 105 110 Ser Val Thr Lys His Asn Gly Ser Leu Ile Phe Ser Thr Thr Gly Ser 115 120 125 Leu Thr Ser Asp Tyr Val Ala Leu Gly Gln Lys Tyr Val Ser Asn Asn 130 135 140 Pro Asp Asp Tyr Ile Ala Gly Phe Thr Tyr Asn Phe Glu Ile Cys Ser 145 150 155 160 Pro Asp Asp Pro His Ile Val Glu Glu Glu Glu Gly Ala Tyr Leu Ile 165 170 175 Gly Ile Arg Asp Ile Phe Thr Gly Gly Gln Leu Ser Glu Tyr Ile Leu 180 185 190 Asp Ser His Ala Leu Gly Val Thr Asp His Ser Ser Val Lys Ile Leu 195 200 205 Arg Pro Glu His Ile Glu Cys Ser Trp Glu His Ala Lys Gly Leu Leu 210 215 220 Ser Ser Cys Glu Lys Glu Gly Tyr Met Val Gln Thr Gly Leu Gly Thr 225 230 235 240 Val Lys Cys Lys Ser Thr His Tyr Leu Gly Lys Lys Phe Ile Met Arg 245 250 255 Met Gly Ser Lys Lys Val Asn Ser Met Tyr Gln Asp Pro Ala Gly Phe 260 265 270 Lys Gln Thr Leu Asp Glu Glu Phe Tyr Pro Leu Val Asp Phe Leu Val 275 280 285 Asn Glu Val Glu Glu Val Arg Phe Thr Glu Met Thr Asp Ala Gln Arg 290 295 300 Arg Leu Leu Ile Glu Thr Tyr Phe Asp Met Ala Arg Ile 305 310 315 <210> 83 <211> 368 <212> PRT <213> Wild-type Butyrivibrio proteoclasticus ligase protein sequence - 'RNA82' <400> 83 Met Lys Ser Arg Ile Leu Glu Phe Ile Lys Asn Asn Pro Asp Thr Trp 1 5 10 15 Glu Glu Lys Leu Asn Glu Lys Phe Ile Arg Thr Asn His Asn Gly Asp 20 25 30 Leu Val Cys Phe Lys Tyr Ala Thr Glu Ala Asp Phe Ser Asp Pro Leu 35 40 45 Val Cys Glu Ala Arg Gly Ile Ile Ile Asp Val Ala Gln Leu Val Val 50 55 60 Val Cys Trp Pro Phe Asp Lys Phe Phe Asn Val Gln Glu Lys Tyr Ala 65 70 75 80 Ala Asp Ile Asp Trp Asn Ser Ala Arg Val Leu Glu Lys Ile Asp Gly 85 90 95 Ser Met Ile Lys Leu Phe Trp Tyr Lys Gly Ala Trp Arg Phe Ala Thr 100 105 110 Ser Ser Thr Cys Asp Ala Lys Asp Ala Ala Ile Pro Gly Tyr Asn Glu 115 120 125 Leu Thr Tyr Ala Asp Ile Ile Ala Arg Ala Glu Asn Val Asn Glu Ile 130 135 140 Pro Phe Glu Glu Leu Asn Lys Asp Tyr Thr Tyr Ile Phe Glu Leu Val 145 150 155 160 Ser Pro Leu Ser Gln Ile Val Val Arg Tyr Glu Met Thr Glu Leu Phe 165 170 175 Phe Leu Thr Ala Arg Asn Asn Leu Thr Gly Glu Glu Leu Asp Thr Glu 180 185 190 Leu Leu Gln Phe Arg Arg Pro Arg Ser Phe Ala Leu Lys Ser Met Asn 195 200 205 Glu Cys Leu Asp Ala Ala Leu Ala Leu Asn Lys Gly Asp Glu Ile Glu 210 215 220 Asp Glu Gly Phe Val Val Val Asp Glu Lys His Asn Arg Val Lys Ile 225 230 235 240 Lys Ser Pro Ala Tyr Val Ala Met His Arg Leu Ser Thr Asn Lys Val 245 250 255 Phe Thr Val Lys Arg Met Ala Glu Phe Phe Cys Asn Gly Glu Asp Leu 260 265 270 Ser Lys Leu Ala Lys Asp Phe Pro Ala Asn Ala His Ile Ile Lys Tyr 275 280 285 Tyr Asp Trp Gln Phe Ala Glu Met Lys His Lys Ala Glu Asp Met Met 290 295 300 Leu Tyr Ser Arg Arg Leu Tyr Glu Glu Tyr Asp His Asp Arg Lys Ala 305 310 315 320 Val Ala Met Thr Ile Lys Asp Ser Pro Tyr Ala Trp Ala Gly Phe Arg 325 330 335 Ala Ile Gly Asn Asp Lys Asp Ile Thr Asp Ile Met Ala Val Leu Ala 340 345 350 Pro Ala Asn Val Glu Lys Leu Ile Val Glu Tyr Pro Glu Ile Ser Asn 355 360 365 <210> 84 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> Example 15 and 16 primer oligonucleotide sequence <400> 84 acuccucggu 10 <210> 85 <211> 11 <212> RNA <213> Artificial Sequence <220> <223> Example 15 and 16 product oligonucleotide sequence <400> 85 acuccucggu a 11 <210> 86 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Example 17 primer oligonucleotide sequence <400> 86 actcatcgat 10 <210> 87 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Example 17 product oligonucleotide sequence <400> 87 actcatcgat a 11 <210> 88 <211> 384 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein sequence <400> 88 Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu 1 5 10 15 Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met 20 25 30 Gly Thr Lys Ala Arg Ile Phe Ser His Lys Ile Ala Ser Tyr Thr Asp 35 40 45 Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu 50 55 60 Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys 65 70 75 80 Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr 85 90 95 Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser 100 105 110 Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Ser Ile Phe 115 120 125 Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr 130 135 140 Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe 145 150 155 160 Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu 165 170 175 Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln 180 185 190 Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg 195 200 205 Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu 210 215 220 Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile 225 230 235 240 Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr 245 250 255 Ser Ser Leu Gly Arg Thr Lys Phe Ser Ile Asn Asn Asn Lys Ala Leu 260 265 270 His Gln Ser Ile Lys Glu Arg Ala Ser Val Ala Leu Arg Gly Met Phe 275 280 285 Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala 290 295 300 Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe 305 310 315 320 Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala 325 330 335 Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln 340 345 350 Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu 355 360 365 Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg 370 375 380 <210> 89 <211> 384 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein sequence <400> 89 Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu 1 5 10 15 Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met 20 25 30 Gly Thr Lys Ala Arg Ile Phe Ser His Gln Ile Ala Ser Tyr Thr Asp 35 40 45 Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu 50 55 60 Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys 65 70 75 80 Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr 85 90 95 Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser 100 105 110 Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Ser Ile Phe 115 120 125 Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr 130 135 140 Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe 145 150 155 160 Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu 165 170 175 Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln 180 185 190 Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg 195 200 205 Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu 210 215 220 Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile 225 230 235 240 Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr 245 250 255 Ser Ser Leu Gly Arg Thr Lys Phe Ser Ile Asn Asn Asn Lys Ala Leu 260 265 270 His Gln Ser Ile Lys Glu Arg Ala Ser Gly Ala Leu Arg Gly Met Phe 275 280 285 Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala 290 295 300 Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe 305 310 315 320 Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala 325 330 335 Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln 340 345 350 Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu 355 360 365 Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg 370 375 380 <210> 90 <211> 384 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein sequence <400> 90 Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu 1 5 10 15 Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met 20 25 30 Gly Thr Lys Ala Arg Ile Phe Ser Tyr Phe Ile Ala Ser Tyr Thr Asp 35 40 45 Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu 50 55 60 Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys 65 70 75 80 Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr 85 90 95 Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser 100 105 110 Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Ser Ile Phe 115 120 125 Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr 130 135 140 Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe 145 150 155 160 Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu 165 170 175 Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln 180 185 190 Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg 195 200 205 Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu 210 215 220 Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile 225 230 235 240 Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr 245 250 255 Ser Ser Leu Gly Arg Thr Lys Tyr Ser Ile Asn Asn Asn Lys Ala Leu 260 265 270 Asn Gln Ser Ile Lys Glu Arg Ala Ser Val Ala Leu Arg Gly Met Phe 275 280 285 Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala 290 295 300 Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe 305 310 315 320 Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala 325 330 335 Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln 340 345 350 Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu 355 360 365 Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg 370 375 380 <210> 91 <211> 384 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein sequence <400> 91 Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu 1 5 10 15 Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met 20 25 30 Gly Thr Lys Ala Arg Ile Phe Ser His Asn Ile Ala Ser Tyr Thr Asp 35 40 45 Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu 50 55 60 Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys 65 70 75 80 Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr 85 90 95 Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser 100 105 110 Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Thr Thr Ile Phe 115 120 125 Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr 130 135 140 Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe 145 150 155 160 Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu 165 170 175 Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln 180 185 190 Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg 195 200 205 Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu 210 215 220 Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile 225 230 235 240 Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr 245 250 255 Ser Ser Leu Gly Arg Thr Lys Tyr Ser Ile Asn Asn Asn Lys Ala Leu 260 265 270 His Gln Ser Ile Lys Glu Arg Ala Ser Val Asp Leu Arg Gly Met Phe 275 280 285 Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala 290 295 300 Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe 305 310 315 320 Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala 325 330 335 Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln 340 345 350 Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu 355 360 365 Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg 370 375 380 <210> 92 <211> 384 <212> PRT <213> Artificial Sequence <220> <223> Mutant ligase (Stenotrophomonas phage IME13 backbone) protein sequence <400> 92 Met Ser Arg Thr Ile Glu Leu Phe Asn Asn Leu Met Ser Val Val Glu 1 5 10 15 Lys Ser Glu Lys Gly Asn Phe Tyr Phe Lys Asp Val Ile Thr Ser Met 20 25 30 Gly Thr Lys Ala Arg Ile Phe Ser His Lys Ile Ala Ser Tyr Thr Asp 35 40 45 Trp Leu Gln Asp Asp Ala Leu Glu Cys Arg Gly Ile Met Phe Glu Leu 50 55 60 Asn Asp Lys Asn Glu Pro Val Arg Ile Met Ala Arg Pro Met Gln Lys 65 70 75 80 Phe Phe Asn Leu Lys Glu Asn Pro Met Thr Ile Gly Leu Asp Leu Thr 85 90 95 Lys Met Ile Gly Leu Met Glu Lys Ala Asp Gly Ser Leu Ile Ser Ser 100 105 110 Tyr His Asp Gln Gly Tyr Val Tyr Leu Lys Ser Lys Ala Ala Ile Phe 115 120 125 Ser Asp Gln Ala Asn Lys Ala Met Ala Leu Leu Asn Ser Pro Ala Tyr 130 135 140 Glu Lys Leu Arg Asp Ala Ile Val Arg Ala Gly Ser Asp Phe Thr Phe 145 150 155 160 Asn Met Glu Tyr Val Gly Pro Ser Asn Arg Val Val Leu Pro Tyr Glu 165 170 175 Glu Glu Glu Leu Ile Val Leu Asn Val Arg His Asn Glu Thr Gly Gln 180 185 190 Tyr Val Glu Phe Ser Thr Leu Leu Asp Asp Pro Leu Ile Arg His Arg 195 200 205 Met Ile Gly Val Tyr Pro Cys Pro Asp Trp Ser Lys Val Thr Pro Glu 210 215 220 Glu Trp Glu Ala Ala Thr Arg Ala Glu Thr Asp Ile Glu Gly Val Ile 225 230 235 240 Gly Ile Met Pro Asp Gly Gln Leu Phe Lys Leu Lys Thr Asp Trp Tyr 245 250 255 Ser Ser Leu His Arg Thr Lys Asp Ser Ile Asn Asn Asn Lys Ala Leu 260 265 270 Phe Gln Ser Ile Lys Glu Arg Ala Ser Asp Asp Leu Arg Gly Met Phe 275 280 285 Ser Asp Asp Asn Ala Ala Leu Ala Lys Ile Glu Ala Phe Glu Ser Ala 290 295 300 Tyr Ile Asp Thr Val Ala Lys Tyr His Lys Ile Cys Ala Glu Val Phe 305 310 315 320 Leu Arg Phe Ala Arg Phe Leu Ile Val Glu Val Phe Ala Ile Glu Ala 325 330 335 Gln Ala Arg Met Lys Asp Cys Arg Tyr Leu Phe Ser Ile Val Met Gln 340 345 350 Gln Tyr Gly Arg Asp Trp Asp Gly Glu Leu Ala Val Glu Lys Ile Glu 355 360 365 Glu His Ile Ile Lys Glu Tyr Ala Thr Tyr Val Pro Met Ala Tyr Arg 370 375 380 <210> 93 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Example 26 product oligonucleotide sequence <400> 93 actcatcgat c 11 <210> 94 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Example 26 product oligonucleotide sequence <400> 94 actcatcgat t 11 <210> 95 <211> 477 <212> PRT <213> Wild type phosphatase (Pandalus borealis) protein sequence - 'SAP' <400> 95 Met Glu Glu Asp Lys Ala Tyr Trp Asn Lys Asp Ala Gln Asp Ala Leu 1 5 10 15 Asp Lys Gln Leu Gly Ile Lys Leu Arg Glu Lys Gln Ala Lys Asn Val 20 25 30 Ile Phe Phe Leu Gly Asp Gly Met Ser Leu Ser Thr Val Thr Ala Ala 35 40 45 Arg Ile Tyr Lys Gly Gly Leu Thr Gly Lys Phe Glu Arg Glu Lys Ile 50 55 60 Ser Trp Glu Glu Phe Asp Phe Ala Ala Leu Ser Lys Thr Tyr Asn Thr 65 70 75 80 Asp Lys Gln Val Thr Asp Ser Ala Ala Ser Ala Thr Ala Tyr Leu Thr 85 90 95 Gly Val Lys Thr Asn Gln Gly Val Ile Gly Leu Asp Ala Asn Thr Val 100 105 110 Arg Thr Asn Cys Ser Tyr Gln Leu Asp Glu Ser Leu Phe Thr Tyr Ser 115 120 125 Ile Ala His Trp Phe Gln Glu Ala Gly Arg Ser Thr Gly Val Val Thr 130 135 140 Ser Thr Arg Val Thr His Ala Thr Pro Ala Gly Thr Tyr Ala His Val 145 150 155 160 Ala Asp Arg Asp Trp Glu Asn Asp Ser Asp Val Val His Asp Arg Glu 165 170 175 Asp Pro Glu Ile Cys Asp Asp Ile Ala Glu Gln Leu Val Phe Arg Glu 180 185 190 Pro Gly Lys Asn Phe Lys Val Ile Met Gly Gly Gly Arg Arg Gly Phe 195 200 205 Phe Pro Glu Glu Ala Leu Asp Ile Glu Asp Gly Ile Pro Gly Glu Arg 210 215 220 Glu Asp Gly Lys His Leu Ile Thr Asp Trp Leu Asp Asp Lys Ala Ser 225 230 235 240 Gln Gly Ala Thr Ala Ser Tyr Val Trp Asn Arg Asp Asp Leu Leu Ala 245 250 255 Val Asp Ile Arg Asn Thr Asp Tyr Leu Met Gly Leu Phe Ser Tyr Thr 260 265 270 His Leu Asp Thr Val Leu Thr Arg Asp Ala Glu Met Asp Pro Thr Leu 275 280 285 Pro Glu Met Thr Lys Val Ala Ile Glu Met Leu Thr Lys Asp Glu Asn 290 295 300 Gly Phe Phe Leu Leu Val Glu Gly Gly Arg Ile Asp His Met His His 305 310 315 320 Ala Asn Gln Ile Arg Gln Ser Leu Ala Glu Thr Leu Asp Met Glu Glu 325 330 335 Ala Val Ser Met Ala Leu Ser Met Thr Asp Pro Glu Glu Thr Ile Ile 340 345 350 Leu Val Thr Ala Asp His Gly His Thr Leu Thr Ile Thr Gly Tyr Ala 355 360 365 Asp Arg Asn Thr Asp Ile Leu Asp Phe Ala Gly Ile Ser Asp Leu Asp 370 375 380 Asp Arg Arg Tyr Thr Ile Leu Asp Tyr Gly Ser Gly Pro Gly Tyr His 385 390 395 400 Ile Thr Glu Asp Gly Lys Arg Tyr Glu Pro Thr Glu Glu Asp Leu Lys 405 410 415 Asp Ile Asn Phe Arg Tyr Ala Ser Ala Ala Pro Lys His Ser Ala Thr 420 425 430 His Asp Gly Thr Asp Val Gly Ile Trp Val Asn Gly Pro Phe Ala His 435 440 445 Leu Phe Thr Gly Val Tyr Glu Glu Asn Tyr Ile Pro His Ala Leu Ala 450 455 460 Tyr Ala Ala Cys Val Gly Thr Gly Arg Thr Phe Cys Asp 465 470 475 <210> 96 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Example 27 product oligonucleotide sequence <400> 96 actcatcgat a 11 <210> 97 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Example 27 product oligonucleotide sequence <400> 97 actcatcgat aa 12 <210> 98 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Example 27 product oligonucleotide sequence <400> 98 actcatcgat aa 12 <210> 99 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Example 28 product oligonucleotide sequence <220> <221> misc_feature <222> (4)..(4) <223> n = 2' deoxyInosine <400> 99 actnagacca cg 12 <210> 100 <211> 221 <212> PRT <213> Wild type Archaeoglobus fulgidus endonuclease V endonuclease <400> 100 Met Leu Gln Met Asn Leu Glu Glu Leu Arg Arg Ile Gln Glu Glu Met 1 5 10 15 Ser Arg Ser Val Val Leu Glu Asp Leu Ile Pro Leu Glu Glu Leu Glu 20 25 30 Tyr Val Val Gly Val Asp Gln Ala Phe Ile Ser Asp Glu Val Val Ser 35 40 45 Cys Ala Val Lys Leu Thr Phe Pro Glu Leu Glu Val Val Asp Lys Ala 50 55 60 Val Arg Val Glu Lys Val Thr Phe Pro Tyr Ile Pro Thr Phe Leu Met 65 70 75 80 Phe Arg Glu Gly Glu Pro Ala Val Asn Ala Val Lys Gly Leu Val Asp 85 90 95 Asp Arg Ala Ala Ile Met Val Asp Gly Ser Gly Ile Ala His Pro Arg 100 105 110 Arg Cys Gly Leu Ala Thr Tyr Ile Ala Leu Lys Leu Arg Lys Pro Thr 115 120 125 Val Gly Ile Thr Lys Lys Arg Leu Phe Gly Glu Met Val Glu Val Glu 130 135 140 Asp Gly Leu Trp Arg Leu Leu Asp Gly Ser Glu Thr Ile Gly Tyr Ala 145 150 155 160 Leu Lys Ser Cys Arg Arg Cys Lys Pro Ile Phe Ile Ser Pro Gly Ser 165 170 175 Tyr Ile Ser Pro Asp Ser Ala Leu Glu Leu Thr Arg Lys Cys Leu Lys 180 185 190 Gly Tyr Lys Leu Pro Glu Pro Ile Arg Ile Ala Asp Lys Leu Thr Lys 195 200 205 Glu Val Lys Arg Glu Leu Thr Pro Thr Ser Lys Leu Lys 210 215 220 <210> 101 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Example 28 product oligonucleotide sequence <400> 101 gaccacg 7

Claims

이중-가닥 치료용 올리고뉴클레오티드 생성물을 생성하는 방법이며,
2개의 상보적 단일-가닥 올리고뉴클레오티드 생성물이 어닐링을 허용하는 조건 하에 혼합되고, 각각의 단일-가닥 올리고뉴클레오티드 생성물은 하기를 포함하는 방법에 의해 생성되는 것인, 방법:
a) 생성물 서열의 절편을 포함하는 올리고뉴클레오티드 (I)의 풀을 제공하는 단계이며, 생성물 서열의 적어도 하나의 절편은 적어도 하나의 변형된 뉴클레오티드 잔기를 함유하고, 각각의 절편은 효소적 합성에 의해 생성된 것인 단계;
b) 단일-가닥 올리고뉴클레오티드 생성물의 서열과 상보적인 주형 올리고뉴클레오티드 (II)를 제공하는 단계이며, 상기 주형은 생성물로부터 분리되어 향후 반응에서의 사용을 위해 재순환되는 것을 허용하는 특성을 갖는 것인 단계;
c) 주형 올리고뉴클레오티드로의 절편 올리고뉴클레오티드의 어닐링을 허용하는 조건에서 (I) 및 (II)를 접촉시키는 단계;
d) 리가제를 사용하여 절편 올리고뉴클레오티드를 연결하여 생성물을 형성하는 단계;
e) 어닐링된 주형 및 임의의 불순물 올리고뉴클레오티드 가닥이 변성되도록 조건을 변화시키고, 불순물을 분리하는 단계;
f) 어닐링된 주형 및 생성물 올리고뉴클레오티드 가닥이 변성되도록 조건을 변화시키고, 단일-가닥 올리고뉴클레오티드 생성물을 분리하는 단계, 및
g) 주형 올리고뉴클레오티드를 향후 반응에서의 사용을 위해 재순환시키는 단계.
제1항에 있어서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드가 단일-가닥 리가제(ss리가제) 또는 RNA 리가제를 사용하여 생성되는 것인 방법.
제2항에 있어서, ss리가제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법이
(i) 3' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티 및 5' 말단에 포스페이트, 티오포스페이트 또는 디티오포스페이트 모이어티를 갖는, 뉴클레오티드, 디뉴클레오티드, 트리뉴클레오티드 또는 테트라뉴클레오티드를 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가하는 단계,
(ii) 포스파타제를 사용하여 3'-포스페이트, 3'-티오포스페이트 또는 디티오포스페이트를 제거하는 단계,
(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계: 및
(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계
를 포함하는 것인 방법.
제3항에 있어서, 포스페이트 둘 중 하나 이상에서 산소가 황으로 치환된 3',5' 뉴클레오티드 비스포스페이트가 단계 (i)에서 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가되는 것인 방법.
제3항에 있어서, 단계 (i)에서 3',5' 비스티오포스페이트, 3'-포스페이트-5'-티오포스페이트, 3'-티오포스페이트-5'-포스페이트, 3',5' 비스디티오포스페이트, 3'-포스페이트-5'-디티오포스페이트 또는 3'-디티오포스페이트-5'-포스페이트가 ss리가제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가되는 것인 방법.
제1항에 있어서, 하나 이상의 또는 모든 절편 올리고뉴클레오티드가 트랜스퍼라제를 사용하여 생성되는 것인 방법.
제6항에 있어서, 트랜스퍼라제를 사용하여 절편 올리고뉴클레오티드를 생성하는 방법이
(i) 3'-OH 상에 보호기를 갖는, 뉴클레오티드-5'-트리포스페이트, 알파-티오트리포스페이트 또는 알파디티오트리포스페이트를 트랜스퍼라제를 사용하여 단일-가닥 올리고뉴클레오티드 프라이머의 3'-OH에 부가하는 단계,
(ii) 3'-OH가 재생되도록 3'-위치를 탈보호하는 단계,
(iii) 단계 (i) 및 (ii)를 반복하여 올리고뉴클레오티드를 연장시켜 절편 서열을 생성하는 단계, 및
(iv) 서열 특이적 엔도뉴클레아제를 사용하여 올리고뉴클레오티드 프라이머로부터 절편 올리고뉴클레오티드를 방출하는 단계
를 포함하는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 반연속적인 또는 연속적인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 생성물이 그램 또는 킬로그램 규모 또는 그 초과 규모로 생성되고/거나, 방법이 적어도 1L의 반응기에서 수행되는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 변성이 온도 증가, pH의 변화 또는 완충 용액 중 염 농도의 변화로부터 발생하는 것인 방법.
제10항에 있어서,
i) 주형:불순물 이중나선이 변성되도록, 및
ii) 주형:생성물 이중나선이 변성되도록
온도를 증가시키는 2개의 단계를 포함하는 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 절편이 3 내지 15개의 뉴클레오티드 길이인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 생성물의 길이가 10 내지 200개의 뉴클레오티드 길이, 20 내지 30개의 뉴클레오티드 길이, 또는 20 내지 25개의 뉴클레오티드 길이인 방법.
제13항에 있어서, 각각의 단일-가닥 올리고뉴클레오티드 생성물이 20개의 뉴클레오티드 길이이고 다음을 포함하는 3개의 절편 올리고뉴클레오티드를 포함하는 것인 방법:
(i) 7개의 뉴클레오티드 길이인 5' 절편,
6개의 뉴클레오티드 길이인 중심 절편 및
7개의 뉴클레오티드 길이인 3' 절편,
(ii) 6개의 뉴클레오티드 길이인 5' 절편,
8개의 뉴클레오티드 길이인 중심 절편 및
6개의 뉴클레오티드 길이인 3' 절편,
(iii) 5개의 뉴클레오티드 길이인 5' 절편,
10개의 뉴클레오티드 길이인 중심 절편 및
5개의 뉴클레오티드 길이인 3' 절편,
(iv) 4개의 뉴클레오티드 길이인 5' 절편,
12개의 뉴클레오티드 길이인 중심 절편 및
4개의 뉴클레오티드 길이인 3' 절편, 또는
(v) 3개의 뉴클레오티드 길이인 5' 절편,
14개의 뉴클레오티드 길이인 중심 절편 및
3개의 뉴클레오티드 길이인 3' 절편.
제1항 내지 제7항 중 어느 한 항에 있어서, 주형이 지지체 물질에 부착되는 것인 방법.
제15항에 있어서, 지지체 물질이 가용성 지지체 물질, 폴리에틸렌 글리콜, 가용성 유기 중합체, DNA, 단백질, 덴드리머, 다당류, 올리고당 또는 탄수화물인 것인 방법.
제15항에 있어서, 지지체 물질이 불용성 지지체 물질, 유리 비드, 중합체 비드, 섬유질 지지체, 막, 스트렙타비딘 코팅된 비드, 셀룰로스, 또는 반응 벽일 수 있는 반응 용기 자체의 일부인 방법.
제15항에 있어서, 주형의 다수의 반복된 카피가 연속적인 방식으로 단일 부착점을 통해 지지체 물질에 부착되는 것인 방법.
제15항에 있어서, 주형이 다수의 부착점에서 지지체 물질에 부착되는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 변형이 당 모이어티의 2' 위치에 있거나, 2'-F, 2'-OMe, 2'-MOE 및 2'-아미노로 이루어진 군으로부터 선택되거나, 또는 올리고뉴클레오티드가 PMO, LNA, PNA, BNA 또는 SPIEGELMER를 포함하는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 변형이 핵염기에 있거나, 또는 변형이 5-메틸 피리미딘, 7-데아자구아노신 및 비염기성 뉴클레오티드로 이루어진 군으로부터 선택되는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 변형이 백본에 있거나, 또는 변형이 포스포로티오에이트, 포스포르아미데이트 및 포스포로디아미데이트로 이루어진 군으로부터 선택되는 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 생성된 이중-가닥 올리고뉴클레오티드 생성물이 적어도 90% 순수하거나, 적어도 95% 순수하거나, 또는 적어도 98% 순수한 것인 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 작은 간섭 RNA(siRNA) 를 생성하는 방법.