KR20230026987A

KR20230026987A - Atp-의존성 dna 리가제

Info

Publication number: KR20230026987A
Application number: KR1020227037488A
Authority: KR
Inventors: 베른트 케텔센 스트리베르니; 테레제 솔스타트; 올라브 레인즈
Original assignee: 아크틱자임즈 에이에스
Priority date: 2020-03-31
Filing date: 2021-03-31
Publication date: 2023-02-27
Also published as: US20230125232A1; CA3173175A1; CN115916965A; WO2021198341A1; JP2023520224A; EP4127147A1

Abstract

본 발명은 리가제 분야에 관한 것이다. 보다 구체적으로, 이는 리가제를 다양한 분자생물학 기술에서 특히 유용하게 만드는 독특한 리가제 활성을 갖는 신규하고 매우 효율적인 ATP-의존성 DNA 리가제에 관한 것이다. 또한, 본 발명은 DNA 리가제를 포함하는 조성물 및 키트, 이의 제조 방법 및 용도에 관한 것이다.

Description

ATP-의존성 DNA 리가제

본 발명은 리가제 분야에 관한 것이다. 보다 구체적으로, 이는 ATP-의존성 DNA 리가제, DNA 리가제를 포함하는 키트 및 조성물, 제조 방법 및 용도에 관한 것이다.

DNA 리가제는 적절하게 정렬된 DNA 서열에서 5'-포스포릴과 3'-하이드록실 말단-기 사이의 DNA의 당-포스페이트 백본에서 포스포디에스테르 결합의 형성을 촉매작용한다. 생체 내 리가제는 닉(nick)의 복구 뿐만 아니라 DNA 복제 및 복구에 중요한 단일-가닥 및 이중-가닥 파손에서 중요한 역할을 한다.

DNA 복제 및 복구에 중요할 뿐만 아니라, T4 DNA 리가제와 같은 박테리오파지로부터 분리된 DNA 리가제는 재조합 플라스미드 작제를 위한 DNA 단편의 벡터로의 삽입, 차세대 DNA 시퀀싱 라이브러리 작제 및 dsDNA의 원형화에서의 어댑터 라이게이션을 위해 분자 생물학에서 수십 년 동안 널리 사용되어 왔다(문헌["Ligases", Enzyme Resources Guide. Promega Corporation. pp. 8-14] 참조).

DNA 리가제 효소는 보조인자 ATP 또는 NAD의 피로포스페이트 가수분해와 커플링된, 하나의 DNA 사슬의 3'-하이드록실 말단-기와 또 다른 DNA 사슬의 인접한 5'-포스포릴 말단-기의 공유 결합을 촉매작용한다(문헌[Gumport, R. I., et al., Proc. Natl. Acad. Sci. USA (1971), vol.68:2559-63]).

기질 선호도에 기초하여 리가제는 DNA 리가제 또는 RNA 리가제, 즉, 각각 DNA 또는 RNA의 포스포디에스테르 결합을 생성하는 효소로 분류될 수 있다(문헌[Tomkinson, A.E. et al, Location of the active site for enzyme-adenylate formation in DNA ligase, Proc. Natl. Acad. Sci. USA, 1991, vol.88, p.400-404]).

비대칭 제한 효소 분해에 의해 생성된 dsDNA 분자에서 사전하이브리드화된 점착-말단을 라이게이션하는 것과 같은 이중 가닥 핵산 분자에서 단일-가닥 파손을 밀봉하는 것은 라이게이션될 2개의 말단이 용액에서 자유롭게 존재하는 블런트 말단 라이게이션보다 훨씬 더 효율적이다. 라이게이션 접합부에 걸쳐 있는 상보적 핵산 분자의 존재 하에 2개의 단일 가닥 핵산 분자의 라이게이션을 촉매작용하여 2개의 말단을 매우 근접하게 하는 주형-의존적 리가제에 의해 촉매되는 라이게이션 반응은 블런트 말단 라이게이션보다 훨씬 더 빠르고 더 효율적이다.

박테리오파지 T3, T4 및 T7로부터 분리된 여러 DNA 리가제 및 RNA 리가제가 지난 수십 년 내에 분리되고 특성규명되었다(문헌[Dunn, J. J., et al., J. Mal. Biol., 148:303-30 (1981); Armstrong, J., et al., Nucleic Acids Res., 11:.7145-56 (1983); 및 Schmitt, M. P., et al., J. Mal. Biol., vol.193:479-95 (1987)]). 플라스미드 또는 올리고뉴클레오티드를 사용한 시험관 내 실험에서 T4 핵산 리가제가 다양한 효율 및 기질 특이성으로 이중-가닥 핵산에서 닉(nick)을 연결하는 것으로 밝혀졌다(문헌[Bullard, D. R., & Bowater, R. P,. Direct comparison of nick-joining activity of the nucleic acid ligases from bacteriophage T4, The Biochemical Journal, 2006, 398(1), 135-144] 참조). 연구는 T4 RNA(T4RnL) 리가제 및 T4 DNA(T4DnL) 리가제가 다양한 DNA-RNA 하이브리드를 라이게이션시킬 수 있음을 입증하였다. 백시니아 바이러스 또는 진핵생물 L 세포로부터 분리된 DNA 리가제는 DNA-RNA 하이브리드에서 닉을 밀봉하는 것으로 보고되었다(문헌[Sekiguchi, J. and Shuman, S., Ligation of RNA-containing duplexes by Vaccinia DNA ligase, Biochemistry, 1997, vol. 36, 9073-9079 및 Bedows, E. et al., L cell DNA ligase joins RNA to DNA on a DNA template, Biochemistry, 1997, vol. 16, no. 10, 2231-2235] 참조).

그러나, 라이게이션 접합부에 걸쳐 있는 상보적 DNA 분자의 존재 하에 DNA 분자를 RNA 분자의 5' 말단에 고효율로 라이게이션하는 것은 지금까지 문헌에 설명되어 있지 않다(예를 들어, 문헌[Bullard and Bowater, 2006, Sekiguchi and Shuman, 1997 및 Bedows et al., 1977] 참조).

재조합 DNA 기술에 사용하기에 적합한 여러 핵산 리가제의 존재에도 불구하고, 독특한 기질 특이적 라이게이션 특성을 갖는 추가의 고효율 리가제가 항상 필요하다.

본 발명자는 라이게이션 접합부에 걸쳐 있는 상보성 단일 가닥 DNA 주형의 존재 하에 단일 가닥 DNA 분자를 RNA 분자의 5' 말단에 고효율로 라이게이션시킬 수 있는 것으로 생화학적 특성규명에 의해 밝혀진 박테리오파지로부터 분리된 ATP-의존성 DNA 리가제의 새로운 패밀리의 클로닝 및 재조합 발현 및 분리에 의해 상기 언급된 요구를 해결하였다.

본 발명에 따른 리가제는 상기 설명된 독특한 기질 특이성에 더하여 또한 라이게이션 접합부에 걸쳐 있는 상보적 단일 가닥 DNA 주형의 존재 하에 단일 가닥 DNA 분자를 RNA 분자의 3' 말단에 고효율로 라이게이션시키는 능력을 갖는다.

제1 양태에 따르면, 본 발명은 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 제공하며, 여기서 DNA 리가제는 SEQ ID No. 1의 아미노산 서열을 포함하거나 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 SEQ ID No. 1과 적어도 75% 동일한 아미노산 서열을 포함한다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 SEQ ID No. 1과 적어도 80%, 85%, 90%, 93% 또는 95%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함한다.

제1 양태의 일 추가 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 1을 갖는 아미노산 서열로 구성된다. 이의 효소적으로 활성인 단편이 또한 제공되며, 여기서 DNA 리가제 단편은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

제1 양태의 일 추가 구현예에서, SEQ ID No. 1과 적어도 70% 동일한 아미노산 서열을 갖는 분리된 ATP-의존성 DNA 리가제는 파지, 바람직하게는, 크로노박터 파지, 펙토박테리움 파지 또는 아시네토박터 파지로부터 분리된 DNA 리가제이다.

본 발명에 따른 또 다른 구현예에서, SEQ ID No. 1(L13)과 적어도 70% 동일한 아미노산 서열을 포함하는 ATP 의존성 DNA 리가제는 SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16을 갖는 DNA 리가제 중 임의의 것으로부터 선택된다.

일 추가 양태에서, ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편이 제공되며, 여기서 상기 DNA 리가제는,

(a) SEQ ID No. 1 또는 이와 적어도 80% 동일한 아미노산 서열,

(b) SEQ ID No. 7 또는 이와 적어도 80% 동일한 아미노산 서열,

(c) SEQ ID No. 10 또는 이와 적어도 80% 동일한 아미노산 서열, 또는

(d) SEQ ID No. 16 또는 이와 적어도 80% 동일한 아미노산 서열로부터 선택된 아미노산 서열을 가지며,

여기서, DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

본 발명의 이러한 양태의 바람직한 구현예에서, ATP-의존성 DNA 리가제는 SEQ ID NOs.1, 7, 10 또는 16과 적어도 85%, 90% 또는 95%, 예를 들어, 적어도 98% 또는 99% 또는 99.5% 동일한 아미노산 서열을 갖는다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편으로서, 여기서 상기 DNA 리가제는 SEQ ID No. 1, SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16 중 어느 하나로부터 선택된 아미노산 서열을 갖는다.

제1 양태의 일 구현예에서, His-태그를 포함하는 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편으로서, 여기서 상기 DNA 리가제는 SEQ ID No. 2, SEQ ID No. 8, SEQ ID No. 11 및 SEQ ID No. 17 중 어느 하나로부터 선택된 아미노산 서열을 갖는다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 1 또는 SEQ ID No. 2의 아미노산 서열을 갖는다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 7 또는 SEQ ID No. 8의 아미노산 서열을 갖는다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 10 또는 SEQ ID No. 11의 아미노산 서열을 갖는다.

제1 양태의 일 구현예에서, 분리된 ATP-의존성 DNA 리가제는 SEQ ID No. 16 또는 SEQ ID No. 17의 아미노산 서열을 갖는다.

제1 양태의 일 구현예에 따르면, ATP-의존성 DNA 리가제는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질 상에 라이게이션된 생성물을 제공하는 전환율을 제공하는 리가제이고, 여기서 상기 이중-가닥 핵산 분자는 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산을 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체로 포함하고, 여기서 상기 전환율은 적어도 0.02, 적어도 0.03, 적어도 0.04, 적어도 0.05 또는 적어도 0.1이고, 여기서 상기 전환율은 ATP, Mg²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

제1 양태의 일 구현예에 따르면, ATP-의존성 DNA 리가제는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질 상에 라이게이션된 생성물을 제공하는 전환율을 제공하는 리가제이고, 여기서 상기 이중-가닥 핵산 분자는 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산을 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체로 포함하고, 여기서 상기 전환은 적어도 0.15, 적어도 0.2, 적어도 0.3, 적어도 0.4, 적어도 0.5, 적어도 0.8, 적어도 1.0, 적어도 1.5이고, 여기서 상기 전환율은 ATP, Mn²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

제1 양태의 일 구현예에서, ATP-의존성 DNA 리가제는 테트라펩티드 모티프 KXaaDG를 포함하고, 여기서 Xaa는 지방족 및 비극성 아미노산이고, 테트라펩티드 모티프는 아미노산 위치 159 내지 162에 상응하며, 넘버링은 SEQ ID No. 1의 아미노산 넘버링에 따른다.

일 추가 구현예에서, 지방족 및 비극성 아미노산 잔기는 메티오닌, 이소류신, 류신, 발린, 류신, 알라닌 및 글리신으로 구성된 군으로부터 선택된다.

또 다른 추가의 구현예에서, 지방족 및 비극성 아미노산 잔기는 메티오닌이다.

제1 양태의 또 다른 구현예에서, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 박테리오파지로부터 유래된다.

본 발명의 제2 양태에서, 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 인코딩하거나 상기 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 단백질을 인코딩하는 재조합 핵산 분자가 제공된다.

제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 3의 핵산 분자 또는 SEQ ID No. 3의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.

제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 9의 핵산 분자 또는 SEQ ID No. 9의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.

제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 18의 핵산 분자 또는 SEQ ID No. 18의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.

제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 코돈-최적화된 핵산 서열을 포함하거나 이로 구성된다.

제2 양태의 일 구현예에서, 재조합 핵산 분자는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 축퇴된 버전을 포함하거나 이로 구성된다.

본 발명의 제3 양태에서, 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자를 포함하거나 제2 양태에 따른 재조합 핵산 분자를 포함하는 벡터가 제공되고, 여기서 벡터는 재조합 발현 벡터, 클로닝 벡터, 플라스미드, 바이러스 벡터, 코스미드, 람다 파지 또는 박테리아 인공 염색체이다.

제3 양태의 일 구현예에서,

a) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1의 아미노산 서열 또는 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는, 핵산 분자, 또는

b) a)에서 ATP-의존성 DNA 리가제를 인코딩하는 SEQ ID No. 3의 핵산 분자 또는 SEQ ID No. 3의 코돈-최적화된 핵산 서열을 포함하는 핵산 분자를 포함하거나 이로 구성된 벡터가 제공되며,

c) 여기서, a) 또는 b)에서 ATP-의존성 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

제3 양태의 일 구현예에서,

a) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1의 아미노산 서열 또는 SEQ ID No. 1과 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열을 갖는, 핵산 분자, 또는

제3 양태의 일 구현예에서,

a) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1, SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16 중 어느 하나로부터 선택된 아미노산 서열을 갖는, 핵산 분자, 또는

b) ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자로서, 여기서 ATP-의존성 DNA 리가제가 SEQ ID No. 1 또는 이와 적어도 80% 동일한 아미노산 서열, SEQ ID No. 7 또는 이와 적어도 80% 동일한 아미노산 서열, SEQ ID No. 10 또는 이와 적어도 80% 동일한 아미노산 서열, 또는 SEQ ID No. 16 또는 이와 적어도 80% 동일한 아미노산 서열로부터 선택된 아미노산 서열을 갖는, 핵산 분자, 또는

c) a)에서 ATP-의존성 DNA 리가제를 인코딩하는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 코돈-최적화된 핵산 서열을 포함하는 핵산 분자를 포함하거나 이로 구성된 벡터가 제공되며,

d) 여기서, a) 또는 b)에서 ATP-의존성 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

제3 양태의 일 구현예에서, 벡터는 재조합 발현 벡터, 클로닝 벡터, 플라스미드, 바이러스 벡터, 코스미드, 람다 파지 또는 박테리아 인공 염색체이다.

제3 양태의 일 구현예에서, 벡터는 재조합 발현 벡터이다.

제3 양태의 일 구현예에서, 벡터는 바람직하게는 플라스미드이다.

본 발명의 제4 양태에서, 제3 양태에 따른 벡터를 포함하는 숙주 세포가 제공되며, 여기서 숙주 세포는 효모 세포, 곤충 세포, 인간 세포주 또는 박테리아 세포이다.

제4 양태의 일 구현예에서, 박테리아 세포는 바람직하게는 E. 콜리이다.

본 발명의 제5 양태에서,

a) 제1 양태 및 이의 구현예에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편의 발현에 적합한 조건하에서 제4 양태에 따른 숙주 세포를 배양하는 단계; 및

b) 숙주 세포 또는 배양 배지 또는 상층액으로부터 DNA 리가제 또는 이의 효소적으로 활성인 단편을 분리하는 단계를 포함하는 제1 양태 및 이의 구현예에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편의 분리 및 정제를 위한 방법이 제공된다.

본 발명의 제6 양태에서, 제1 양태에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 조성물이 제공된다.

제6 양태의 일 구현예에서, 조성물은 완충액을 추가로 포함한다.

완충액은 일 구현예에서 ATP 및 Mg²⁺ 또는 Mn²⁺를 포함하는 완충액일 수 있다.

완충액은 일 구현예에서 ATP 및 MgCl₂ 또는 MnCl₂를 포함하는 완충액일 수 있다.

완충액은 일 구현예에서 본 발명에 따른 ATP-의존성 DNA 리가제를 저장하기에 적합한 완충액일 수 있고, 여기서 완충액은 Tris-HCl, KCl, Mg²⁺, BSA 및 글리세롤을 포함한다.

제6 양태의 일 구현예에서, 조성물은 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 적어도 하나의 5' 포스포릴-리보핵산 분자 및 적어도 하나의 제2 상보적 데옥시리보핵산 분자를 추가로 포함하고, 여기서 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 적어도 하나의 5' 포스포릴-리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

제6 양태의 일 구현예에서, 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자는 비드 상에 고정되거나, 포획 표지, 바람직하게는 비오틴 또는 유도체화된 뉴클레오티드, 예를 들어, 염료, 바람직하게는 형광 염료를 추가로 포함하고, 여기서 비드, 포획 표지 또는 유도체화된 뉴클레오티드는 상기 제1 데옥시리보핵산 분자의 5' 말단에 부착된다.

제6 양태의 일 구현예에서, 조성물은 ATP를 포함하는 라이게이션 완충액을 추가로 포함한다.

일 추가 구현예에서, 라이게이션 완충액의 ATP의 농도는 약 0.01 mM 내지 약 10 mM ATP, 바람직하게는 약 0.05 mM 내지 약 2.5 mM ATP이다.

일 추가 구현예에서, 라이게이션 완충액은 2가 양이온을 포함한다.

일 추가 구현예에서, 라이게이션 완충액의 2가 양이온은, 예를 들어, MgCl₂ 또는 MnCl₂ 형태의 Mg²⁺ 또는 Mn²⁺이고, 여기서 Mg²⁺ 또는 Mn²⁺의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.

일 추가 구현예에서, 라이게이션 완충액의 2가 양이온은, 예를 들어, MgCl₂ 형태의 Mg²⁺이고, 여기서 Mg²⁺의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.

일 추가 구현예에서, 라이게이션 완충액의 2가 양이온은, 예를 들어, MnCl₂ 형태의 Mn²⁺이고, 여기서 Mn²⁺의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.

일 추가 구현예에서, 라이게이션 완충액은 약 0.01 mM 내지 약 10 mM ATP 및 바람직하게는 약 0.05 mM 내지 약 2.5 mM ATP의 농도의 ATP 및, 예를 들어, MgCl₂ 형태의 Mg²⁺를 포함하고, 여기서 Mg²⁺의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.

일 추가 구현예에서, 라이게이션 완충액은 약 0.01 mM 내지 약 10 mM ATP 및 바람직하게는 약 0.05 mM 내지 약 2.5 mM ATP의 농도의 ATP 및, 예를 들어, MnCl₂ 형태의 Mn²⁺를 포함하고, 여기서 Mn²⁺의 농도는 약 1 mM 내지 약 20 mM, 바람직하게는 약 5 mM 내지 약 10 mM이다.

본 발명의 제7 양태에서,

a. 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편 또는 제6 양태에 따른 ATP-의존성 DNA 리가제를 포함하는 조성물을 포함하는 제1 용기;

b. ATP 및 2가 양이온을 포함하는 라이게이션 완충액을 포함하는 제2 용기;

c. 선택적으로 5' 포스포릴-리보핵산 분자의 5' 말단에 라이게이션될 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제3 용기로서, 여기서 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 여기서 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 여기서 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재하는, 제3 용기; 및

d. 선택적으로, 키트를 사용하기 위한 설명서를 포함하는 리보핵산 분자의 말단에 데옥시리보핵산 분자를 라이게이션시키기 위한 키트가 제공된다.

제7 양태의 일 구현예에서, 키트는 3'-하이드록실-리보핵산 분자의 3' 말단에 라이게이션될 적어도 하나의 제1 5'-포스포릴-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제4 용기를 포함하며, 여기서 적어도 하나의 제2 데옥시리보핵산 분자는 3' 영역 및 5' 영역을 포함하고, 여기서 5' 영역은 제1 데옥시리보핵산 분자에 상보적이고, 3' 영역은 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 3' 영역은 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 여기서 제1 5'-포스포릴-데옥시리보핵산 및 제2 데옥시리보핵산 분자는 사전 하이브리드화된 복합체 형태로 존재할 수 있다.

일 구현예에서, 라이게이션 완충액의 ATP 및 2가 양이온의 농도는 약 0.01mM 내지 약 10mM ATP 및 바람직하게는 약 0.05mM 내지 약 2.5mM ATP이고, 2가 양이온은, 예를 들어, MgCl₂ 또는 MnCl₂의 형태의 Mg²⁺ 또는 Mn²⁺이고, 여기서 Mg²⁺ 또는 Mn²⁺의 농도는 약 1mM 내지 약 20mM, 바람직하게는 약 5mM 내지 약 10mM이다. 바람직하게는, 2가 양이온은 MnCl₂ 형태의 Mn²⁺이다.

본 발명의 추가 양태에서, 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법이 제공되고, 여기서 상기 방법은 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제6 양태에 따른 조성물과 접촉시키는 것을 포함한다.

본 발명의 제8 양태에서, 이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법이 제공되며, 여기서 상기 방법은 이중-가닥 핵산 분자에서 5'-포스포릴 리보핵산 분자의 5' 말단에 대한 3'-하이드록실-데옥시리보핵산 분자의 라이게이션을 허용하는 조건 하에 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1 양태 및 이의 구현예에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편과 접촉시키는 것을 포함하고, 여기서 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루고 있다.

상기 방법에 따른 일 구현예에서, 3'-하이드록실-데옥시리보핵산 분자는 비드 상에 고정되거나, 포획 표지, 바람직하게는 비오틴 또는 유도체화된 뉴클레오티드, 예를 들어, 염료, 바람직하게는 형광 염료를 추가로 포함하고, 여기서 비드, 포획 표지 또는 유도체화된 뉴클레오티드는 상기 3'-하이드록실-데옥시리보핵산 분자의 5' 말단에 연결된다.

상기 방법에 따른 일 구현예에서, 리보핵산(RNA) 분자는 메신저 RNA(mRNA), 리보솜 RNA(rRNA), 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA), 반복 연관 siRNA(rasiRNA)를 포함하는 군으로부터 선택된 RNA 분자이다.

상기 방법에 따른 일 구현예에서, ATP 및 2가 양이온을 포함하는 라이게이션 완충액를 첨가하는 것을 추가로 포함한다.

상기 방법에 따른 일 추가 구현예에서, ATP의 농도는 약 0.01mM 내지 약 10mM 및 바람직하게는 약 0.05mM 내지 약 2.5mM이고, 여기서 2가 양이온은, 예를 들어, MgCl₂ 또는 MnCl₂의 형태의 Mg²⁺ 또는 Mn²⁺이고, 여기서 Mg²⁺ 또는 Mn²⁺의 농도는 약 1mM 내지 약 20mM, 바람직하게는 약 5mM 내지 약 10mM이다. 바람직하게는, 2가 양이온은 MnCl₂ 형태의 Mn²⁺이다.

상기 방법에 따른 일 구현예에서, 핵산 단편의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 라이게이션을 달성하기 위해 6시간 미만 내에, 예를 들어, 1시간 미만 내에, 예를 들어, 45분 미만 내에 또는 바람직하게는 30분 내에, 더욱 바람직하게는 15분 내에 ATP 의존성 DNA 리가제를 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자와 함께 인큐베이션하는 것을 추가로 포함한다.

상기 방법에 따른 일 구현예에서, 상기 방법은 시험관 내 전사의 목적을 위한 RNA 분자의 5' 말단에 프로모터 요소 및/또는 번역 인핸서 요소를 포함하는 cDNA 분자 합성에서 주형으로 작용하는 DNA 요소의 라이게이션인, 공지된 또는 공지되지 않은 서열의 RNA 분자를 포획하기 위한 RNA 5'-말단 어댑터 라이게이션에 사용된다.

본 발명의 제9 양태는 시험관 내 전사의 목적을 위한 RNA 분자의 5' 말단에 프로모터 요소 및/또는 번역 인핸서 요소를 포함하는 cDNA 분자 합성에서 주형으로 작용하는 DNA 요소의 라이게이션인, 공지된 또는 공지되지 않은 서열의 RNA 분자를 포획하기 위한 RNA 5'-말단 어댑터 라이게이션을 위한 제1 양태에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제6 양태에 따른 ATP-의존성 DNA 리가제를 포함하는 조성물의 용도를 제공한다.

본 발명의 제10 양태에서, 데옥시리보핵산 분자를 리보핵산 분자의 5' 말단 및 3' 말단에 라이게이션시키기 위한 방법이 제공되며, 상기 방법은,

a. 리보핵산 분자의 집단을 포함하는 샘플을 제공하는 단계로서, 여기서 리보핵산 분자 중 하나 이상이 5' 포스포릴-말단 기 및 3'-하이드록실-말단 기를 포함하는, 단계;

b. 적어도 하나의 제2 데옥시리보핵산의 존재 하에 리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시키는 단계로서, 여기서 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 여기서 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 여기서 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 단계; 및

c. 3' 영역 및 5' 영역을 포함하는 적어도 하나의 추가의 제2 데옥시리보핵산의 존재 하에 적어도 하나의 다른 5' 포스포릴-데옥시리보핵산 분자를 단계 b의 리보핵산 분자의 3'-말단에 라이게이션시키는 단계로서, 여기서 5' 영역이 5' 포스포릴-데옥시리보핵산 분자에 상보적이고, 3' 영역이 단계 b에서 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나, 3' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합시키기 위해 축퇴된 서열이고, 여기서 5' 포스포릴-데옥시리보핵산 및 추가의 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태일 수 있는, 단계를 포함하며;

여기서, 단계 b 및 c의 라이게이션 반응은 제1 양태에 따른 ATP-의존성 리가제에 의해 촉매작용되고, 단계 b 및 c의 라이게이션 반응은 동시에 또는 순차적으로 수행된다.

제10 양태의 일 구현예에서, 샘플은 ATP 및 2가 양이온, 바람직하게는 Mn²⁺ 또는 Mg²⁺를 추가로 포함한다.

본 발명의 추가 양태는 RNA 라이브러리 작제에서 제10 양태의 방법의 용도를 제공한다.

도 1: 본 발명의 T4 DNA 리가제 및 L13 리가제의 아미노산 서열을 비교하는 서열 정렬.
도 2a-c: 상이한 박테리오파지로부터 유래된 본 발명에 따른 DNA 리가제의 다중 서열 정렬. 모든 서열은 지금까지 확인된 모든 리가제에 대한 공통 모티프인 KXDG 아데닐화 부위를 포함한다.
도 3a: 문헌[Bullard and Bowater, 2006]에 설명된 실험 설정에 기반한 리가제 활성을 측정하기 위한 일반적인 실험 설정을 예시한다.
도 3b: 다른 공지된 리가제와 비교한 AZ L13의 기질 특이성. 리가제 AZ L13 및 상업적 기준 효소(AZ T4 DNA 리가제(ArcticZymes), T4 Rnl 1(NEB), T4 Rnl 2(NEB), T3 DNA 리가제(NEB), T7 DNA 리가제(NEB))의 효소 활성을 시험하기 위해 8개의 상이한 닉킹된 기질 세트를 사용하였다. 사용된 기질은 각각 데옥시리보핵산(DNA) 올리고 단독(기질 S1), 리보핵산(RNA) 올리고 단독(기질 S2) 또는 데옥시리보핵산(DNA) 올리고 및 리보핵산(RNA) 올리고의 혼합물(기질 S3 내지 S8)로 구성될 수 있는 3개의 올리고의 어셈블리이다. 양성 리가제 활성은 도 1b에 도시된 바와 같이 형광 표지된 핵산 올리고의 길이를 증가시킨다. 밴드는 라이게이션되지 않은 단일-가닥 8-mer 올리고뉴클레오티드 생성물인 하부 밴드 및 라이게이션된 단일-가닥 20-mer 올리고뉴클레오티드 생성물인 상부 밴드로 표시된다.
도 4: DNA 올리고가 본 발명의 ATP-의존성 DNA L13 리가제 효소를 사용하여 DNA 라이게이션 주형의 존재 하에 RNA의 5'-말단에 라이게이션되는 본 발명의 양태를 도시하며, 여기서 DNA 주형 서열은 반-축퇴성이어서 서열의 혼합물을 포함한다. 여기서, 반-축퇴된 DNA 주형의 한 영역은 제1 DNA 올리고에 상보적이고, 다른 영역은 공지되지 않은 서열의 RNA 분자를 포획하거나 상이한 대립유전자로부터의 RNA 분자를 포획하기 위해 상이한 5-모노포스포릴화 RNA 올리고에 대한 비특이적 하이브리드화를 위한 하나 이상의 축퇴된 뉴클레오티드를 포함하고, 여기서, RNA 올리고 내의 일부 뉴클레오티드 위치는 상이한 대립유전자에서 상이하다. 대립유전자는 동일한 유전자를 나타내는 유전자 변이체이다. N은 A, C, G 또는 T를 나타낸다.
도 5: RNA 분자의 푸울이 모노포스포릴화된 RNA 분자 및 5'-변형, 예를 들어, 5' 캡 또는 삼중 포스페이트 기를 포함하는 RNA 분자의 혼합물을 포함하는 도 4에 설명된 양태의 구현예를 도시한다. 5' 변형을 포함하는 RNA 분자는 라이게이션에서 제외될 것이다.
도 6: 모노포스포릴화된 RNA 분자에 라이게이션될 DNA 분자가 본 도면에서 비오틴 태그로 예시된 5' 태그를 포함하는 도 4에 설명된 본 발명의 양태의 대안적 구현예를 도시한다. 포획은, 예를 들어, 컬럼 또는 자성 비드에 커플링된 비오틴 태그 및 스트렙타비딘을 사용하여 수행될 수 있다.
도 7: 방법이 특정 mRNA 종을 포획하는 도 4에 설명된 본 발명의 양태의 대안적인 구현예를 도시한다. 상기 설명된 바와 같이, mRNA의 5'-모노포스포릴화된 말단에만 DNA 올리고의 선택적 라이게이션이 존재한다. mRNA는 일반적으로 캡핑되고 인산화되지 않아 설명된 L13 리가제를 사용한 라이게이션을 방지할 것이다. 포스파타제에 의한 모든 5'-포스페이트 함유 RNA 종의 탈인산화 및 이후 mRNA의 탈-캡핑은 DNA의 3'-말단에 대한 라이게이션을 위한 mRNA 5'-말단을 제조할 것이다. 포획은 비오틴 태그 및 스트렙타비딘을 사용하여 수행될 수 있다.
도 8: 직접 세포 유리 ivTT(시험관 내 전사-번역)에서 사용하기 위해 프로모터가 탈-캡핑된 mRNA에 태깅되는 본 발명의 양태의 대안적인 구현예를 예시한다. 도 4에 설명된 바와 같은 비특이적 하이브리드화를 위해 축퇴된 영역을 갖는 DNA 주형을 사용한 mRNA의 5'-모노포스포릴화된 말단에서의 DNA 올리고의 선택적 라이게이션. 비-mRNA RNA 종의 탈인산화 및 mRNA의 탈-캡핑. 5'-인산화된 mRNA는 축퇴된 영역 및 프로모터 서열을 함유하는 5'-DNA 어댑터로 태깅될 것이다. 제1 가닥 cDNA 합성은 cDNA가 시험관 내 전사/번역 기술에서 직접 사용될 수 있도록 하는 RNA 중합효소 결합 부위를 포함하는 mRNA의 RNA 중합효소-판독가능한 카피를 야기할 것이다.
도 9a: 본 발명에 따른 ATP-의존성 DNA 리가제(AZ L13)의 야생형 아미노산 서열 SEQ ID No 1.
도 9b: 본 발명에 따른 ATP-의존성 DNA 리가제(AZ L13)의 His-태깅된 아미노산 서열 SEQ ID No 2.
도 9c: 도 9a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 3).
도 10a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel1)의 아미노산 서열 SEQ ID No 7.
도 10b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel1)의 His-태깅된 아미노산 서열 SEQ ID No 8.
도 10c: 도 10a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 9).
도 11a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel2)의 아미노산 서열 SEQ ID No 10.
도 11b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel2)의 His-태깅된 아미노산 서열 SEQ ID No 11.
도 11c: 도 11a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 12).
도 12a: ATP-의존성 DNA 리가제(L13rel3)의 아미노산 서열 SEQ ID No 13.
도 12b: 도 12a의 ATP-의존성 DNA 리가제(L13rel3)의 His-태깅된 아미노산 서열 SEQ ID No 14.
도 12c: 도 12a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 15).
도 13a: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel4)의 아미노산 서열 SEQ ID No 16.
도 13b: 본 발명에 따른 ATP-의존성 DNA 리가제(L13rel4)의 His-태깅된 아미노산 서열 SEQ ID No 17.
도 13b: 도 13a의 아미노산 서열을 인코딩하는 야생형 뉴클레오티드 서열(SEQ ID No 18).
도 14a-b: 백시니아 DNA 리가제 및 본 발명의 L13 리가제의 아미노산 서열을 비교하는 서열 정렬.

하기 설명에서, 당업자에게 본 발명의 보다 완전한 이해를 제공하기 위해 본 발명의 다양한 실시예 및 구현예가 제시된다. 다양한 구현예의 맥락에서 그리고 첨부된 도면을 참조하여 설명된 특정 세부사항은 제한으로 해석되도록 의도되지 않는다.

달리 구체적으로 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 유전학, 생화학, 및 분자생물학 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.

상기 언급된 바와 같이, 본 발명자는 라이게이션 접합부에 걸쳐 있는 상보적 제2 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5' 말단에 라이게이션될 제1 3'-하이드록실-데옥시리보핵산 분자를 포함하는 이중 가닥 핵산 복합체 내의 단일 가닥 파손을 라이게이션시키는 능력을 갖는 신규한 ATP-의존성 DNA 리가제(L13)를 확인하였다(예시를 위해 도 3a 참조).

본 발명자는 또한 박테리오파지로부터 원래 분리된 추가의 DNA 리가제를 확인하였고, 여기서 추가의 DNA 리가제는 SEQ ID No. 1을 갖는 L13 리가제의 아미노산 서열과 적어도 70%, 예를 들어, 적어도 75% 동일한 아미노산 서열을 갖고, 여기서 추가의 DNA 리가제는 L13과 유사한 효소 활성 및 기질 특이성을 갖는다.

추가의 DNA 리가제는 SEQ ID No. 7의 아미노산 서열 및 SEQ ID No. 9의 cDNA 서열을 갖는 L13rel1이다.

추가의 DNA 리가제는 SEQ ID No. 10 SEQ ID No. 12의 아미노산 서열을 갖는 L13rel2이다.

추가의 DNA 리가제는 SEQ ID No. 16 SEQ ID No. 18의 아미노산 서열을 갖는 L13rel4이다.

본 발명에 따른 리가제는 상기 설명된 독특한 기질 특이성에 더하여 또한 라이게이션 접합부에 걸쳐 있는 상보적 제2 데옥시리보핵산 분자의 존재 하에 3'-하이드록실 말단-기를 포함하는 RNA 분자의 3' 말단에 라이게이션될 5' 포스포릴 말단-기를 포함하는 제1 DNA 분자를 포함하는 이중 가닥 핵산 복합체에서 단일-가닥 파손을 고효율로 라이게이션시키는 능력을 갖는다.

제2 데옥시리보핵산과 함께 라이게이션 반응에 사용되는 제1 3'-하이드록실-데옥시리보핵산 분자, 5' 포스포릴-리보핵산 분자 또는 이들의 일부는 바람직하게는 단일 가닥이고, 3'-하이드록실-데옥시리보핵산 분자 및 5' 포스포릴-리보핵산 분자는 라이게이션 접합부에 걸쳐 있는 제2 데옥시리보핵산 분자의 적어도 일부에 부분적으로 또는 전체적으로 상보적일 수 있다.

"상보적 핵산 서열이 서로 결합한다"는 사실은 DNA 및 RNA의 특성이다. 상보성은 핵염기: 아데닌(A), 티민(T) 또는 (RNA에서 우라실), 구아닌(G) 및 시토신(C) 사이의 뚜렷한 상호작용에 의해 달성된다.

용어 "3'-하이드록실-데옥시리보핵산 분자"는 이의 3' 말단에 유리 하이드록실 기(OH-기)를 갖는다. 데옥시리보핵산 분자의 뉴클레오티드는 표준 뿐만 아니라 비표준 뉴클레오티드일 수 있다. 비표준 뉴클레오티드의 비제한적인 예는 이노신, 크산토신, 이소-구아노신, 이소-시티딘, 디아미노피리미딘, 및 데옥시-우리딘을 포함한다. 데옥시리보핵산 분자는 변형된 또는 유도체화된 뉴클레오티드를 포함할 수 있다. 데옥시리보스 또는 염기 모이어티에 대한 변형의 비제한적인 예는 아세틸 기, 아미노 기, 카르복실 기, 카르복시메틸 기, 하이드록실 기, 메틸 기, 포스포릴 기, 및 티올 기의 첨가(또는 제거)를 포함한다. 유도체화된 뉴클레오티드의 적합한 예는 공유 부착된 염료, 예를 들어, 형광 염료 또는 켄칭 염료, 또는 다른 분자, 예를 들어, 비오틴, 디곡시게닌, 또는 자성 입자를 갖는 것들을 포함한다(도 6 및 7 참조).

3'-하이드록실-데옥시리보핵산 분자는 이의 5' 말단에서 미세유체 장치 또는 다른 반응 챔버에서 자성 비드, 유리 또는 실리카 기질 또는 표면에 연결될 수 있다. 3'-하이드록실-데옥시리보핵산 분자가 직접적으로 또는 간접적으로 커플링될 수 있는 추가의 고체-상태 기질은 아크릴아미드, 셀룰로스, 니트로셀룰로스, 유리 또는 당업자에게 공지된 다른 널리 공지된 기질을 포함한다.

3'-하이드록실-데옥시리보핵산 분자의 길이는 라이게이션 생성물의 길이 및 이의 요망되는 특징에 따라 달라질 수 있고 달라질 것이다. 일반적으로, 3'-하이드록실-데옥시리보핵산 분자는 실시예 2에 제시된 바와 같이 적어도 약 8개의 뉴클레오티드이지만, 길이가 15개 뉴클레오티드 및 최대 100개 뉴클레오티드의 범위일 수 있다.

RNA의 5' 어댑터 라이게이션

용어 "상보적 제2 데옥시리보핵산 분자" 또는 "상보적 라이게이션 주형"은 라이게이션 반응의 효율을 개선시키기 위해 사용되는 데옥시리보핵산(DNA) 분자로서 이해되어야 한다. 5' 포스포릴-리보핵산 분자의 5'-말단에서 제1 3'-하이드록실-데옥시리보핵산 분자의 라이게이션은 상기 설명된 바와 같이 라이게이션 주형으로도 불리는 이러한 제2 데옥시리보핵산 분자의 존재 하에 수행된다. 이러한 제2 데옥시리보핵산 분자는 리보핵산 분자에 상보적이고 이와 하이브리드화되는 5' 영역 및 제1 데옥시리보핵산 분자에 상보적이고 이와 하이브리드화되는 3' 영역의 2개의 별개의 영역을 포함한다(도 3a 참조).

"상보적 제2 데옥시리보핵산 분자"는 정확한 상보물일 수 있거나 이의 2개의 표적 서열의 거의 정확한 상보물일 수 있다. 라이게이션 주형은 제1 3'-하이드록실-데옥시리보핵산 분자 및 리보핵산 분자 둘 모두에 하이브리드화되기 때문에, 이는 3'-하이드록실-데옥시리보핵산 분자가 5' 포스포릴-리보핵산 분자의 5' 말단에 근접하게 되도록 라이게이션 접합부에 걸쳐 있다. 제2 데옥시리보핵산 분자는 또한 3'-하이드록실-데옥시리보핵산 분자에 대해 설명된 바와 유사한 표준, 비표준, 변형 또는 유도체화된 뉴클레오티드를 포함할 수 있다.

일반적으로, 상보적 제2 데옥시리보핵산 분자는 길이가 적어도 약 10개 뉴클레오티드, 바람직하게는 길이가 적어도 약 20개 뉴클레오티드일 것이며, 라이게이션 주형의 약 절반은 리보핵산 분자에 대해 상보성을 갖고 나머지 절반은 제1 3'-하이드록실-데옥시리보핵산 분자에 대해 상보성을 갖는다. 당업자는 상보적 제2 데옥시리보핵산 분자가, 예를 들어, 적어도 약 25 또는 30 또는 35 또는 40 또는 45 또는 최대 약 100개의 뉴클레오티드가 더 길 수 있음을 이해할 것이다.

추가 구현예에서, 제2 데옥시리보핵산 분자는 RNA의 5' 말단 어댑터 라이게이션에서 사용하기 위한 반-축퇴성 라이게이션 주형일 수 있으며, 이는 제1 3'-하이드록실-데옥시리보핵산 분자와 하이브리드화되는 3' 영역, 및 뉴클레오티드의 무작위 혼합물을 포함하는 축퇴성 5' 영역을 포함하여, 각각의 주형은 상이한 대립유전자로부터의 RNA 집단에서 별개의 RNA와 하이브리드화될 수 있다. 당업자는 축퇴 영역을 포함하는 뉴클레오티드의 수가 가능한 주형 조합의 수, 및 이에 따라 하이브리드화될 수 있는 RNA의 수를 결정한다는 것을 이해할 것이다. 5' RNA 어댑터 라이게이션의 예시 목적을 위해 주형이 반-축퇴된 도 4 내지 8을 참조한다.

RNA의 3' 어댑터 라이게이션

대안적 구현예에서, "상보적 제2 데옥시리보핵산 분자" 또는 "상보적 라이게이션 주형"은 라이게이션 반응의 효율을 개선시키기 위해 사용되는 데옥시리보핵산(DNA) 분자로서 이해되어야 한다. 3' 하이드록실-리보핵산 분자의 3'-말단에서 제1 5'-포스포릴-데옥시리보핵산 분자의 라이게이션은 상기 설명된 바와 같이 라이게이션 주형으로도 불리는 이러한 제2 데옥시리보핵산 분자의 존재 하에 수행된다. 이러한 제2 데옥시리보핵산 분자는 리보핵산 분자에 상보적이고 이와 하이브리드화되는 3' 영역 및 제1 데옥시리보핵산 분자에 상보적이고 이와 하이브리드화되는 5' 영역의 2개의 별개의 영역을 포함한다.

추가 구현예에서, 제2 데옥시리보핵산 분자는 RNA의 3' 말단 어댑터 라이게이션에서 사용하기 위한 반-축퇴성 라이게이션 주형일 수 있으며, 이는 제1 5'-포스포릴-데옥시리보핵산 분자와 하이브리드화되는 5' 영역, 및 뉴클레오티드의 무작위 혼합물을 포함하는 축퇴성 3' 영역을 포함하여, 각각의 주형은 상이한 대립유전자로부터의 RNA 집단에서 별개의 RNA와 하이브리드화될 수 있다. 당업자는 축퇴 영역을 포함하는 뉴클레오티드의 수가 가능한 주형 조합의 수, 및 이에 따라 하이브리드화될 수 있는 RNA의 수를 결정한다는 것을 이해할 것이다. 예시 목적으로, 주형이 반-축퇴된 도 4 내지 8에 도시된 5' RNA 어댑터 라이게이션을 참조한다.

특정 구현예에서, 제1 3'-하이드록실-데옥시리보핵산 분자 또는 5' 포스포릴-데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자는 리보핵산 분자를 포함하는 샘플을 첨가하기 전에 어댑터 분자로서 본원에 설명된 듀플렉스를 형성하기 위해 사전-하이브리드화된다(5' RNA 어댑터 라이게이션의 예시를 위해 도 4 내지 8 참조).

용어 "하이브리드되다"는 이러한 맥락에서 5' 제1 데옥시리보핵산 및 3' 리보핵산의 2개의 단일 가닥 영역에 선택적으로 결합하고 이들이 결합되도록 병치시키기 위해 제2 데옥시리보핵산 상의 상보적 또는 대략 상보적인 염기의 특이적 어닐링에 충분한 당 분야에 공지된 하이브리드화 조건의 선택으로 이해되어야 한다.

ATP-의존성 DNA 리가제는 후보 리가제에 대한 검색에서 메타게노믹 뉴클레오티드 서열 데이터를 포함하는 공개적으로 이용 가능한 UniProt KB 데이터베이스(UniProtKB/Swiss-Prot UniProt release 2015_06)를 마이닝함으로써 본 발명자에 의해 확인되었다. 놀랍게도, 이들은 상기 설명된 독특한 리가제 활성을 갖는 NCBI 등록 번호 및 Locus 식별 번호 YP_009015226.1을 갖는 크로노박터 사카자키이(Cronobacter sakazakii) 박테리오파지 CR9로부터 원래 분리된 본 발명에 따른 ATP-의존성 DNA 리가제를 인코딩하는 서열을 발견하였다. 크로노박터 파지 CR9의 완전한 유전체 서열은 NCBI 등록 번호 JQ691611을 갖는다. YP_009015226.1의 아미노산 서열은 유전체 서열의 개념적 번역에 의해 추정 리가제로서 인식된다(YP_009015226.1에 대한 NCBI 뉴클레오티드 및 단백질 데이터베이스의 서열에 대한 정보 참조). 데이터베이스에 따르면 서열은 확인되지 않았다. 따라서, 본 발명자는 본 발명에 따른 ATP-의존성 리가제에 대한 최적화된 발현 시스템을 최초로 클로닝하고 개발하였다.

상기 언급된 크로노박터 파지 CR9의 기원 국가는 불분명하다. 항목 JQ691611에 대한 NCBI 데이터베이스의 정보에 따르면, 크로노박터 사카자키이 박테리오파지 CR9의 유전체 서열은 서울대학교(1 Gwanak-ro, Gwanak-gu, Seoul 151-921, South Korea)의 식품 동물 생명공학과에 의해 제공되었다.

핵산 분자를 RNA 분자의 5' 말단에 라이게이션하는 능력은 고전적 클로닝 및 깁슨(Gibson) 접근법을 사용한 클로닝(Gibson, D.G. et al., Enzymatic assembly of DNA molecules up to several hundred kilobases, Nature Methods, 2009,vol.6, page 343-345), 라이브러리 제조 동안의 어댑터 라이게이션(예를 들어, illumine, Head, S.R. et al., Library construction for next-generation sequencing: overviews and challenges, Biotechniques, 2014, vo..56, no. 2, p. 1-31), DNA 합성, 라이게이션에 의한 시퀀싱(예를 들어, SOLiD)(Voelkerding, K.V. et al. Next-Generation Sequencing: from basic research to diagnostics, Clinical Chemistry, 2009, vol55, no.4, p.641-658), 리가제 연쇄 반응(J; Czajka, J; Luo, J; Barany, F; Batt, CA (Feb 1994). "Ligase chain reaction (LCR)--overview and applications". PCR Methods and Applications. 3 (4): S51-64), SNP 검출(Etter, P.D. et al., SNP discovery and genotyping for evolutionary genetics using RAD sequencing, Methods Mol. Biol., 2011, vol.772, p.157-178) 및 RNA의 5'-말단 라벨링과 같은 많은 분자생물학 기술에서 바람직하다.

일반적으로, RNA의 5'-어댑터 라이게이션은 5'-RNA 분자를 라이게이션하거나, 예를 들어, T4 RNA 리가제를 사용하여 하이브리드 DNA-RNA 분자를 RNA 분자의 5' 말단에 라이게이션함으로써 수행된다. 그러나, RNA는 분해되기 쉽기 때문에 DNA와 비교하여 RNA로 작업하는 것은 덜 유리하다. 따라서, 일부 맥락에서 DNA 분자를 RNA 분자의 5' 말단에 라이게이션하는 것이 바람직할 수 있다.

또한, 본 발명에 따른 리가제는 상기 설명된 독특한 기질 특이성에 더하여 또한 라이게이션 접합부에 걸쳐 있는 상보적 DNA 주형의 존재 하에 DNA 분자를 RNA 분자의 3' 말단에 고효율로 라이게이션시키는 능력을 갖는다. 따라서, 하나의 효소가 RNA 분자의 5' 말단 및 3' 말단 둘 모두에서 DNA 어댑터 분자를 라이게이션시키는 것을 가능하게 한다.

RNA 분자의 3' 말단 및 5' 말단에서의 어댑터 라이게이션은 단일 단계 또는 별도의 단계로 수행될 수 있다.

따라서, 본 발명에 따른 리가제는 "이중-라이게이션된" RNA 단편(즉, 5' 및 3' 말단 둘 모두에서 라이게이션된 어댑터를 함유하는 RNA 단편)을 필요로 하는 어댑터 라이게이션 공정에 사용될 수 있다. 예를 들어, 널리 사용되는 Illumina 시퀀싱 플랫폼에 의해 요구되는 차세대 시퀀싱(NGS)을 위한 라이브러리 구성에 일반적으로 사용되는 공정은, 예를 들어, 문헌[Steven R. Head et al., Library construction for next-generation sequencing: Overviews and challenges, Biotechniques, Published online 2014 Feb 1, 2014; 56(2):61, doi: 10.2144/000114133]을 참조한다.

3' 말단 및 5' 말단에서 어댑터 라이게이션을 위해 준비된 RNA 단편은 바람직하게는 본 발명에 따른 RNA 분자의 3' 말단 및 5' 말단에서의 어댑터 라이게이션의 예시를 위해 효율적인 라이게이션이 일어나도록 5' 포스포릴 말단-기 및 3' 하이드록실-말단 기를 포함해야 한다(도면...을 참조한다).

mRNA 및 긴 비-코딩 RNA와 같은 긴 RNA 분자는 단편화될 필요가 있을 수 있다. RNA의 단편화를 위한 공정은 당업자에게 공지되어 있으며, 예를 들어, NEBNext® RNase III RNA 단편화 모듈 및 NEBNext® Magnesium RNA 단편화 모듈을 참조한다. NEBNext RNase III

RNA 단편화 모듈은 긴 이중 가닥 RNA를 5' 및 3' 말단 라이게이션 반응에 직접 사용될 수 있는 5' 포스페이트 및 3' 하이드록실 말단을 갖는 RNA 단편으로 절단하는 리보-엔도뉴클레아제를 사용한다. 그러나, NEBNext® Magnesium RNA Fragmentation 모듈은 2가 금속 이온(Mg+) 및 열을 사용하여 RNA를 단편화하고; 5' 하이드록실 및 3' 포스페이트 말단을 갖는 RNA 단편을 생성한다. 이러한 후자의 경우, RNA 단편의 말단은 5' 포스페이트 및 3' 하이드록실 말단을 포함하는 단편을 획득하기 위해 변형되어야 한다.

놀랍게도, 본원에 설명된 바와 같이 박테리오파지, 보다 구체적으로 크로노박터 파지로부터 획득된 ATP-의존성 DNA 리가제는 ATP 및 이가 양이온의 존재 하에 라이게이션 접합부에 걸쳐 있는 상보적 DNA 분자의 존재 하에 단일 가닥 영역을 갖는 DNA 분자를 RNA의 5' 말단에 고효율로 라이게이션시키는 것으로 밝혀졌다.

본 발명에 따른 ATP-의존성 DNA 리가제는 다른 공지된 리가제와 낮은 서열 동일성을 갖고, 널리 공지된 T4 DNA 리가제 효소에 대해 30% 미만의 서열 동일성을 갖는다(도 1 참조).

상기 설명된 바와 같이, 동봉된 DNA 리가제의 한 가지 특성은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 3'-하이드록실-데옥시리보핵산 분자를 5' 포스포릴-리보핵산 분자의 5' 말단에 고효율로 라이게이션하는 능력이다.

리가제가 상이한 기질의 서브셋을 라이게이션시킬 수 있다는 것은 문헌에 잘 설명되어 있다, 예를 들어, 문헌[Bullard, D. R., & Bowater, R. P., Direct comparison of nick-joining activity of the nucleic acid ligases from bacteriophage T4. The Biochemical Journal, 2006, 398(1), 135-144)] 참조. 본 발명에 따른 DNA 리가제는 또한 기질의 서브셋을 고효율로 라이게이션시킬 수 있으며(도 3b(AZ L13) 참조), 여기서 AZ L13은 기질 1, 6, 7 및 8을 고효율로 및 기질 3 및 5를 저효율로 라이게이션시킬 수 있음이 명백하다.

용어 고효율은 6시간 미만 내, 예를 들어, 1시간 미만 내, 예를 들어, 45분 미만 내 또는 바람직하게는 30분 내 또는 15분 내에 폴리뉴클레오티드의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 라이게이션을 달성하기 위해 당업자에게 공지된 표준 온도 및 완충액 조건 하에 이중 가닥 핵산 분자 내의 단일 가닥 파손을 라이게이션시키는 효소의 능력에 관한 것이다. 표준 완충액 및 온도 조건의 예는 표 2a 및 표 2b 및 실시예 2에 설명되어 있다.

본 발명에 따른 라이게이션 효율 또는 라이게이션 속도 또는 전환율은 당업자에게 공지된 상이한 방법을 사용하여 계산될 수 있다. 예를 들어, 라이게이션 효율은 도 3b에 제시된 바와 같이 라이게이션 생성물을 검출함으로써 계산될 수 있고, 여기서 70% 효율은 ((라이게이션된 생성물)/(라이게이션된 생성물 + 라이게이션되지 않은 생성물)) * 100 = 70을 의미한다. 70%의 라이게이션된 생성물 + 라이게이션되지 않은 생성물은 라이게이션된 생성물로서 존재한다. 이는 도 3b에 제시된 바와 같이 겔 상의 상이한 밴드의 강도를 측정하고 설명된 바와 같이 효율을 계산함으로써 실험적으로 검출될 수 있다. 라이게이션 생성물 및 라이게이션되지 않은 생성물을 나타내는 겔 상의 밴드의 강도는 영상화 기술, 예를 들어, Alpha Imager(AlphaImager HP 시스템)를 사용하여 측정될 수 있다.

본 발명의 DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 DNA 주형의 존재 하에 DNA 분자를 RNA 분자의 5' 말단에 라이게이션시키는 이의 능력에서 T4 DNA 리가제, T3DnL,SplintR 또는 백시니아 바이러스로부터의 DNA 리가제에 비해 개선된 라이게이션 효율을 가지며, 여기서 개선된 라이게이션 효율은 T4 DNA 리가제, T3DnL,SplintR 또는 백시니아 바이러스로부터의 DNA 리가제의 라이게이션 효율에 비해 적어도 2 내지 100배이다. T4 DNA 리가제, T3DnL,SplintR 또는 백시니아 바이러스로부터의 DNA 리가제와 비교하여 본 발명의 DNA 리가제의 증가된 라이게이션 효율은 적어도 2배 초과, 적어도 5배 초과, 적어도 10배 초과, 적어도 12배 초과, 적어도 15배 초과, 적어도 20배 초과 또는 적어도 100배 초과이다.

본 발명에 따른 효소 활성에 대한 척도로서의 전환율은 분당 효소 pmol 당 라이게이션된 기질 pmol로 표현될 수 있다.

기질의 전환율 및 라이게이션 %는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질을 사용하여 측정되며, 여기서 이중-가닥 핵산 분자는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체화된 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산을 포함한다(도 3b에 따른 S8 기질).

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.02, 적어도 0.03, 적어도 0.04, 적어도 0.05 또는 적어도 0.1이고, 여기서 전환율은 ATP, Mg²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.02이고, 여기서 전환율은 ATP, Mg²⁺ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.02 내지 0.1이고, 여기서 전환율은 ATP, Mg²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.02 내지 0.1이고, 여기서 전환율은 ATP, Mg²⁺ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.15, 적어도 0.2, 적어도 0.3, 적어도 0.4, 적어도 0.5, 적어도 0.8, 적어도 1.0, 적어도 1.5 이고, 여기서 전환율은 ATP, Mn²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 적어도 0.15이고, 여기서 전환율은 ATP, Mn²⁺ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.15 내지 2.0이고, 여기서 전환율은 ATP, Mn²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따르면, 상기 설명된 기질(S8)에 대한 전환율은 0.15 내지 2.0이고, 여기서 전환율은 ATP, Mn²⁺ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 25℃ 내지 30℃에서 분당 효소 pmol 당 기질 pmol로서 결정된다.

본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mg²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 25%를 라이게이션시킬 수 있다.

본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mg²⁺ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 25%를 라이게이션시킬 수 있다.

본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mn²⁺ 및 0.2 pmol 내지 15 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 50%, 바람직하게는 적어도 60%를 라이게이션시킬 수 있다.

본 발명에 따른 ATP 의존성 DNA 리가제는 25℃에서 15분 내에 ATP, Mn²⁺ 및 0.2 pmol 내지 10 pmol의 본 발명에 따른 DNA 리가제를 포함하는 라이게이션 완충액에서 상기 설명된 기질(S8)의 적어도 50%, 바람직하게는 적어도 60%를 라이게이션시킬 수 있다.

따라서, 본 발명의 일 양태에 따르면, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편이 제공되며, 여기서 상기 ATP-의존성 DNA 리가제는 SEQ ID No. 1의 아미노산 서열을 포함하거나 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, DNA 리가제는 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있다.

DNA 리가제의 "이의 효소적 단편"이라는 표현은 SEQ ID No. 1에 도시된 바와 같은 아미노산 서열을 갖는 리가제의 촉매 활성이 트렁케이션된 형태에서 유지되는 DNA 리가제를 의미하는 것으로 이해되어야 한다. 실시예 2는 리가제 활성을 측정하기에 적합한 검정을 제공한다.

일 구현예에서, 본 발명에 따른 DNA 리가제 또는 이의 효소적 단편은 SEQ ID No.1과 적어도 75%, 80%, 85%, 90%, 92%, 94%, 95%, 98% 또는 99% 또는 바람직하게는 적어도 85% 또는 94% 동일한 아미노산 서열을 포함한다.

일부 구현예에서, SEQ ID No. 1과 적어도 70% 동일한 아미노산 서열을 포함하는 ATP 의존성 DNA 리가제는 하기를 갖는 서열로부터 선택될 수 있다:

NCBI 등록 번호 ARB11687.1,

NCBI 등록 번호 YP_007392649.1,

NCBI 등록 번호 KAB3178420.1,

NCBI 등록 번호 YP_006383262.1,

NCBI 등록 번호 YP_009042486.1,

NCBI 등록 번호 ATS93644.1,

NCBI 등록 번호 QEG12338.1,

NCBI 등록 번호 AXN57775.1 또는

NCBI 등록 번호 WP_133670648.1.

일 구현예에서, 본 발명에 따른 DNA 리가제 또는 이의 효소적 단편은 SEQ ID No.1과 적어도 75% 동일한 아미노산 서열을 포함한다.

본 발명에 따른 또 다른 구현예에서, SEQ ID No. 1(L13)과 적어도 70% 동일한 아미노산 서열을 포함하는 ATP 의존성 DNA 리가제는 표 1의 DNA 리가제 중 임의의 것으로부터 선택된다:

표 1

또한, 표 1의 상기 서열 중 임의의 것의 효소적 단편이 포함된다.

NCBI 등록 번호 YP_009846950.1을 갖는 L13Rel3은 SEQ ID No. 1(L13)과 단지 39% 동일한 아미노산 서열을 포함하는 애어로모나스 파지 4로부터의 추정 DNA 리가제이다. 아미노산 서열 및 cDNA 서열은 도 12a 내지 12c 및 SEQ ID No: 13 내지 15에 제시되어 있다. L13Rel3은 본 발명에 따른 DNA-의존적 리가제의 L13-클러스터에 속하지 않고, 리가제는 이중-가닥 핵산 분자에서 단일-가닥 파손을 포함하는 기질에 대한 감소된 효소 활성을 가지며, 여기서 이중-가닥 핵산 분자는 본 발명에 따른 L13 ATP-의존성 DNA 리가제에 비해 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체화된 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산(도 3b에 따른 S8 기질)을 포함한다.

상기 서열에 비한 SEQ ID No. 1의 다중 서열 정렬은 도 2a-c에 제시되어 있다. 서열은 지금까지 조사된 모든 리가제에 의해 공유된 KXaaDG 모티프를 포함하는 여러 보존된 도메인을 공유한다는 것이 도 2a-c로부터 명백하며, 여기서 리신 잔기는 핵산에 결합하는 아데닐화된 효소 중간체를 형성하는데 관여한다(Tomkinson, et al., Bioessays, 19(10):893-901 (1997), Shuman, et al., Virology, 211(1):73-83 (1995), and Luo, et al., Nucleic Acids Res, 24(15):3079-3085 (1996)).

SEQ ID No. 1의 변이체는 SEQ ID No. 1의 상기 아미노산의 하나 이상의 아미노산이 보존적 치환을 겪은 아미노산 서열을 포함한다. 바람직하게는, 이러한 치환은 본 발명의 DNA 리가제의 변형된 형태가 비변형된 형태와 동일한 효소 활성을 갖는다는 점에서 침묵 치환이다.

본 발명의 DNA 리가제는 변형된 형태, 예를 들어, DNA 리가제의 분리, 가용화 및/또는 정제 또는 확인을 위한 공정에 유용한 아미노산 태그를 갖는 융합 단백질로 제공될 수 있다. 이러한 아미노산 태그는 폴리 히스티딘(His) 태그를 포함하나, 이에 제한되지 않는다. 본 발명의 폴리-히스티딘 태깅된 DNA 리가제의 예는 SEQ ID No. 2에 언급되어 있다. 본 발명의 다른 폴리-히스티딘 태깅된 DNA 리가제는 SEQ ID No. 8, SEQ ID No. 11 및 SEQ ID No. 17에 언급되어 있다.

또한, 본 발명은 또한 본 발명의 DNA 리가제 및 이의 효소적 단편을 인코딩하는 핵산 분자를 제공한다. SEQ ID No. 1의 아미노산 서열에 상응하는 핵산 서열은 SEQ ID No. 3에 개시되어 있다.

SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16의 아미노산 서열에 상응하는 추가의 핵산 분자는 SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18에 개시된다.

본 발명의 핵산은 상기 핵산 분자 또는 변이체 핵산 분자를 포함할 수 있다. 변이체 핵산 분자는 구조적으로 상이한 뉴클레오티드가 유전자 코드가 축퇴된다는 사실로 인해 동일한 기능 또는 수율을 수행할 수 있는 분자를 포함한다. 유전자 코드의 축퇴성은 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 핵산 분자가 생성된 리가제의 효소적 활성에 영향을 미치지 않으면서 SEQ ID No. 1, SEQ ID No. 7, SEQ ID No. 10 및 SEQ ID No. 16에 의해 제공된 바와 같은 아미노산 분자를 인코딩하는 많은 핵산 분자 중 단지 하나임을 의미한다. 이후, SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18에 개시된 핵산 분자는 E. 콜리 숙주 세포에서 발현을 최적화하기 위해 코돈 최적화될 수 있다.

또한, SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 핵산을 포함하거나 이로 구성된 핵산 분자가 개시된다. 이러한 핵산 분자는 핵산 벡터, 예를 들어, 플라스미드, 재조합 발현 벡터, 바이러스 벡터, 코스미드, 람다 파지 벡터 또는 박테리아 인공 염색체 벡터일 수 있다. 바람직한 벡터는 박테리아 세포에서 리가제의 클로닝 및/또는 발현에 사용하기 위한 플라스미드와 같은 벡터이다.

또한, 본 발명의 다른 구현예에서, DNA 리가제 및 His-태그를 포함하는 폴리펩티드를 인코딩하는 핵산 분자가 제공된다. His-태그를 인코딩하는 핵산 분자는 생성된 DNA 리가제의 활성에 영향을 미치지 않으면서 본 발명의 핵산 서열에 첨가될 수 있다.

또한, 숙주 세포로부터 DNA 리가제 효소의 분비를 제공하는 신호 펩티드를 인코딩하는 핵산 분자는 또한 본 발명의 핵산 서열에 연결될 수 있다.

본원에서 사용되는 바와 같이, 단백질 및 핵산 분자 또는 이의 단편 둘 모두와 관련하여, "서열 동일성"을 언급할 때, 제2 서열과 적어도 x%의 동일성을 갖는 서열은 x%가 둘 모두의 서열이 제2 아미노산 또는 뉴클레오티드 서열의 총 길이에 비해 전체 정렬을 통해 최적으로 정렬될 때 제2 서열의 매칭된 아미노산 또는 뉴클레오티드와 동일한 제1 서열 내의 아미노산 또는 뉴클레오티드의 수를 나타내는 것을 의미한다. 둘 모두의 서열은 x가 최대일 때 최적으로 정렬된다. 동일성 백분율의 정렬 및 결정은 수동으로 또는 자동으로 수행될 수 있다.

당업자는 서열 동일성 백분율을 결정하는 목적을 위한 정렬이, 예를 들어, 디폴트 파라미터를 갖는 Clustal W(Thomson et al., 1994, Nucleic Acid Res., 22, pp 4673-4680) https://www.ebi.ac.uk/Tools/msa/clustalw2/ 또는 NCBI BLAST(미국 국립생물공학 정보 센터(NCBI), USA로부터)와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 다양한 방식으로 달성될 수 있음을 인지할 것이다.

본 발명의 DNA 리가제의 제조

본 발명의 DNA 리가제 및 이의 효소적 단편 또는 리가제를 인코딩하는 핵산 분자는 박테리오파지, 예를 들어, 크로노박터 파지, 펙토박테리움 파지, 또는 아시네토박터 파지와 같은 천연 공급원으로부터 분리될 수 있다.

대안적으로, 효소는 숙주 세포에서 재조합적으로 생산되고 이로부터 분리 및 정제될 수 있다. 숙주 세포는 본 발명의 DNA 리가제를 인코딩하는 유전자를 자연적으로 발현하는 유기체가 아니거나, 이로부터 유래하지 않고, 즉 숙주 세포는 이종성 숙주 세포, 예를 들어, 효모 세포, 곤충 세포, 인간 세포주 또는 박테리아 세포, 바람직하게는 E. 콜리이다.

본 발명에 따른 DNA 리가제 또는 이의 효소적 단편을 인코딩하는 핵산 서열은 유전체 DNA로부터 PCR을 사용하여 증폭되거나, cDNA로서 분리되거나, GENEWIZ, Thermo Fisher Scientific의 GeneArt 또는 Genscript와 같은 상업적 공급업체에 의해 주문될 수 있다.

상기 설명된 바와 같이, DNA 리가제 또는 이의 효소적 단편을 인코딩하는 핵산 서열은 이종성 숙주 세포에서 증가된 단백질 생산을 위해 코돈 최적화될 수 있다. 코돈-최적화를 돕기 위한 다양한 소프트웨어 프로그램은 당 분야에 널리 공지되어 있다. CodonW는 사용될 수 있는 오픈 소스 소프트웨어 프로그램의 예이다. 바람직하게는, 문헌[Raab, D., Graf, M., Notka, F., Sch

dl, T., & Wagner, R. (2010). The GeneOptimizer Algorithm: Using a sliding window approach to cope with the vast sequence space in multiparameter DNA sequence optimization. Systems and Synthetic Biology, 4(3), 215-225]에 설명된 GeneOptimizer 알고리즘이 E. 콜리 숙주 세포에서 본 발명의 DNA 리가제의 발현을 위한 코돈 최적화된 DNA 서열을 생성하는 데 사용된다.

널리 공지된 재조합 유전자 발현 시스템을 사용하여 다양한 숙주 세포 시스템에서 이종성 발현에 의해 DNA 서열로부터 단백질을 발현시키기 위한 다양한 이용 가능한 분자 기술이 존재한다. 예를 들어, 본 발명에 따른 ATP-의존성 DNA 리가제를 인코딩하거나 이의 효소적 단편을 인코딩하는 핵산 분자는 선택된 숙주 세포에 대해 적절한 발현에 필요한 전사 및 번역 요소를 포함하는 적합한 발현 벡터에 삽입될 수 있다. 일반적으로 사용되는 발현 벡터의 예는 플라스미드 또는 바이러스이다.

관심 유전자의 신뢰할 수 있는 전사를 보장하기 위해, 발현 벡터는 강한 프로모터를 포함할 수 있고, 박테리오파지 T5 및 T7은 E. 콜리에서의 발현을 위한 강한 프로모터의 예이다. 프로모터는 화학적 스위치를 포함함으로써 조절될 수 있다. E. 콜리에서 사용하기 위한 유도성 프로모터의 예는 이소로필-베타-D-티오갈락토시드(IPTG)에 의해 유도된 통상적으로 사용되는 lac 프로모터(Hansen LH, Knudsen S,

SJ, "The effect of the lacY gene on the induction of IPTG inducible promoters, studied in Escherichia coli and Pseudomonas fluorescens", Curr. Microbiol. 1998, 36 (6): 341-7) 또는 톨루익산으로 유도될 수 있는 프로모터를 포함하는 XylS/Pm 발현 카세트(Gawin, A. et al., The XylS/Pm regulator/promoter system and its use in fundamental studies of bacterial gene expression, recombinant protein production and metabolic engineering, Microb. Biotechnol., 2017, Vol.10, No.4, p 702-718)이다. 슈도모나스 푸티다(Pseudomonas putida)로부터 유래된 XylS/Pm 조절제/프로모터 시스템은 E. 콜리 및 다른 박테리아에서 유전자 및 유전자 클러스터의 조절된 저- 및 고-수준 재조합 발현에 널리 사용된다.

본 발명의 추가 양태는 적합한 이종성 세포에서 상기 설명된 바와 같은 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적 단편의 발현 방법이다. 숙주 세포는 박테리아 또는 효모 세포일 수 있다. 바람직하게는, 효소의 발현은 박테리아 숙주 세포, 더욱 바람직하게는 E. 콜리, BL21(DE3) 세포에서 일어난다.

본 발명의 DNA 리가제를 포함하는 상기 설명된 발현 벡터의 형질전환은 당업자에게 널리 공지된 방법에 의해, 예를 들어, 화학적으로 적격한 세포를 사용함으로써 수행될 수 있다.

상기 설명된 바와 같이, 본 발명의 DNA 리가제는 재조합 DNA 기술을 사용하여 합성될 수 있다. 대안적으로, DNA 리가제는 무세포 발현 시스템 또는 DNA 리가제의 화학적 합성을 사용하여 생산될 수 있다.

세포 배양 배지로의 분비를 위한 신호전달 펩티드를 포함하는 리가제 효소는 당 분야에 공지되고 문헌에 잘 설명된 임의의 기술을 사용하여 숙주 세포 배양 배지로부터 분리 및 정제될 수 있다. 이러한 기술 또는 임의의 조합의 예는 침전, 초여과, 상이한 크로마토그래피 기술, 예를 들어, 크기-배제 크로마토그래피, 고정화된 금속 친화성 컬럼 크로마토그래피 및/또는 면역흡착 크로마토그래피를 포함할 수 있다.

세포 내에서 생산된 본 발명의 DNA 리가제 효소는 또한 당업자에게 널리 공지된 기술을 사용하여 분리되고 정제될 수 있다. E. 콜리 세포로부터 세포 용해질의 제조를 위한 방법의 예는 균질화, 초음파처리 또는 리소자임을 사용한 효소적 용해이다. DNA 리가제가 용해된 세포로부터 방출된 후, 효소는 임의의 정제 방법, 예를 들어, 크기-배제 크로마토그래피, 고정된 금속 친화성 컬럼 크로마토그래피 및/또는 면역흡착 크로마토그래피에 적용될 수 있다.

상기 언급된 바와 같이, 본 발명의 DNA 리가제는 효소의 분리, 정제 및/또는 확인을 용이하게 하기 위해 c-말단 His-태그를 포함할 수 있다. 본 발명의 폴리히스티딘 태깅된 DNA 리가제는 SEQ ID No. 2, SEQ ID No. 8, SEQ ID No. 11 및 SEQ ID No. 17에 도시되어 있다.

따라서, 본 발명의 또 다른 양태에 따르면, 하기 단계를 포함하는 본 발명에 따른 DNA 리가제 또는 이의 효소적으로 활성인 단편의 분리 및 정제를 위한 방법이 제공된다:

a) 본 발명에 따른 ATP-의존성 DNA 리가제를 발현시키기에 적합한 조건 하에 숙주 세포를 배양하는 단계;

b) 숙주 세포 또는 배양 배지 또는 상층액으로부터 DNA 리가제를 분리하는 단계.

본 발명에 따른 정제된 ATP-의존성 DNA 리가제 효소 또는 이의 효소적 단편은 최종적으로, 예를 들어, 10 mM Tris-HCl pH 7.5(25℃), 0.3 M KCl, 5 mM MgCl₂, 0.2 mg/ml BSA 및 50% 글리세롤을 포함하는 완충액에 저장될 수 있다. 리가제를 저장하기에 적합한 대안적인 완충액은 당업자에게 공지되어 있다.

본 발명의 DNA 리가제를 포함하는 조성물 및 키트

또한, 제1 양태에 따른 ATP-의존성 DNA 리가제 및 라이게이션 단계를 수행하기 위해 하나 이상의 추가의 필요한 시약, 예를 들어, 라이게이션 완충액을 포함하는 조성물 및 키트가 개시된다. 라이게이션을 수행하기 위한 적합한 라이게이션 완충액 및 반응 조건은 하기 표 2a 또는 2b에 설명되어 있다.

전형적으로, 본 발명의 분리된 ATP-의존성 DNA 리가제는 수성 완충액에 배치될 것이며, 유사하게 본 발명의 분리된 ATP-의존성 DNA 리가제를 포함하는 조성물은 또한 수성 완충액을 포함할 것이다. 본 발명에 따른 수성 완충액은 pH가 약 7 내지 약 8.5, 바람직하게는 pH가 약 7.5인 Tris, MES Bis-Tris, 포스페이트 또는 HEPES 완충액과 같은 표준 완충액을 포함한다. 수성 완충액은 바람직하게는 효소를 안정화시키기 위해 BSA 및 글리세롤을 추가로 포함할 수 있다.

본 발명의 DNA 리가제는 라이게이션 단계를 수행하기 위해 보조인자로서 ATP를 이용하는 ATP-의존성 DNA 리가제이며, 효소 반응의 개요에 대해서는 단락 "배경"을 참조한다. 또한, 반응의 ATP-의존성은 반응이 촉매작용을 위해 다중 2가 양이온, 예를 들어, Mg²⁺ 또는 Mn²⁺ 이온을 필요로 하고, 필수 2가 양이온, 바람직하게는 Mg²⁺, 더욱 바람직하게는 Mn²⁺가 필요함을 나타낸다.

따라서, 일 구현예에서, 라이게이션 완충액은 ATP를 포함한다. 상기 ATP의 농도는 약 0.01mM 내지 약 10mM 및 바람직하게는 약 0.05mM 내지 약 2.5mM 및 더욱 바람직하게는 약 1mM이다.

추가 구현예에서, 라이게이션 완충액은 2가 양이온을 포함한다. 상기 2가 양이온은, 예를 들어, MgCl₂ 또는 MnCl₂의 형태의 Mg²⁺ 또는 Mn²⁺이다.

추가 구현예에서, 라이게이션 완충액에서 2가 양이온의 농도는 1mM 내지 20mM, 바람직하게는 5mM 내지 15mM, 및 더욱 바람직하게는 약 10mM이다.

라이게이션 완충액은 환원제를 추가로 포함할 수 있다. 적합한 환원제의 비제한적인 예는 디티오트레이톨 및 [베타]-머캅토에탄올을 포함한다.

추가 구현예에서, 라이게이션은 20℃ 내지 35℃ 및 바람직하게는 25℃ 내지 30℃의 온도에서 수행된다.

또한, 추가의 양태에는 본 발명에 따른 임의의 분리된 ATP-의존성 DNA 리가제를 포함하는 키트가 개시된다. 키트는 최적의 라이게이션을 위한 라이게이션 완충액을 추가로 포함할 수 있다. 키트는 또한 본 발명에 따른 개시된 ATP-의존성 DNA 리가제를 사용하여 라이게이션 단계를 수행하는 방법에 대한 서면 설명을 포함할 수 있다. 적합한 조건은 실시예 2에 설명되어 있으며, 이는 키트에 또는 리가제 효소와 함께 제공될 수 있다. 표 2a 및 2b는 본 발명의 DNA 리가제를 사용한 최적의 라이게이션을 위한 반응 혼합물의 예를 제공한다.

표 2a

표 2b

표 2a 또는 표 2b의 반응 혼합물을 30℃에서 30분 동안 인큐베이션된다. 대안적으로, 표 2a 또는 표 2b의 반응 혼합물을 25℃에서 15분 동안 인큐베이션된다. 표 2a 또는 2b의 반응 혼합물은 MnCl₂ 또는 MgCl₂를 포함할 수 있다.

본 발명의 DNA 리가제의 용도

본 발명의 또 다른 양태에서, 이중 가닥 핵산 분자에서 단일 가닥 파손을 라이게이션하기 위한 방법이 제공되며, 상기 방법은 이중-가닥 핵산 분자에서 5'-포스포릴 리보핵산 분자의 5' 말단에 3'-하이드록실-데옥시리보핵산 분자의 라이게이션을 허용하는 조건하에서 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자를 제1 양태에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편과 접촉시키는 것을 포함하고, 여기서 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산은 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루고 있다.

일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13 리가제이다.

일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13rel1 리가제이다.

일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13rel2 리가제이다.

일 구현예에서, 본 발명에 따른 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편은 L13rel4 리가제이다.

본 발명에 따른 단일 가닥-파손은 닉 및 갭 둘 모두를 포함한다.

5'-포스포릴-리보핵산 분자는 5' 말단에 포스페이트 기를 포함하는 RNA 분자이다. 일 구현예에서, 리보핵산 분자는 메신저 RNA(mRNA), 마이크로RNA(miRNA), 짧은 간섭 RNA(siRNA), 반복 연관 siRNA(rasiRNA)를 포함하는 군으로부터 선택된 리보핵산(RNA) 분자일 수 있다.

본 발명에 사용하기에 적합한 작은 RNA-함유 샘플의 공급원은 적용에 따라 달라질 수 있고 달라질 것이다. 성숙한 작은 RNA를 포함하는 샘플은 동물, 식물, 진균, 원생생물, 바이러스, 박테리아, 또는 고세균으로부터 유래될 수 있다.

임의의 상기 언급된 공급원으로부터 유래된 샘플은 본질적으로 순수한 RNA 분자의 제조물로부터 세포의 미정제 추출물의 범위일 수 있다. 일 구현예에서, 샘플은 작은 RNA 분자의 분리된 제조물일 수 있다. 또 다른 구현예에서, 샘플은 세포로부터 추출된 총 RNA의 분리된 제조물일 수 있다. 또 다른 구현예에서, 샘플은 핵산, 단백질, 지질, 및 탄수화물을 포함하는 세포질 세포 추출물일 수 있다. 또 다른 구현예에서, 샘플은 온전한 세포일 수 있다. 또 다른 구현예에서, 작은 RNA를 포함하는 샘플은 시험관 내 전사 반응 또는 화학적 합성 반응일 수 있다. 총 RNA 또는 작은 RNA는 당 분야에 널리 공지된 상업적으로 이용 가능한 키트 또는 기술을 사용하여 세포, 세포 추출물, 또는 시험관 내 반응으로부터 분리 및 정제될 수 있으며, 예를 들어, 문헌[Ausubel et al. (2003) Current Protocols in Molecular Biology, John Wiley & Sons, New York, NY, 또는 Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY]을 참조한다.

라이게이션 반응에 첨가된 샘플에서 작은 RNA의 양은 RNA-함유 샘플의 공급원에 따라 달라질 수 있고 달라질 것이다. 일반적으로, 임의의 양의 RNA가 사용될 수 있다.

메신저 RNA(mRNA)는 일반적으로 전구체 메신저 RNA와 같은 일부 일차 전사체의 5' 말단에서 특별히 변경된 뉴클레오티드인 5-프라임 캡(5' 캡)을 갖는다. mRNA 캡핑으로 공지된 이 과정은 고도로 조절되며 단백질 합성 동안 번역을 겪을 수 있는 안정하고 성숙한 메신저 RNA의 생성에 필수적이다. 미토콘드리아 mRNA 및 클로로플라스틱 mRNA는 캡핑되지 않는다. 라이게이션이 일어나기 위해, mRNA는 먼저 캡핑을 제거한 후 5' 말단에서 인산화될 필요가 있을 수 있다. 예시를 위해 도 7을 참조한다. 적합한 캡핑 제거 효소는 당업자에게 공지되어 있다. 도 6은 5'캡을 포함하는 mRNA가 라이게이션되지 않은 상황을 예시한다.

방법을 수행하기 위한 적합한 조건의 예는 상기 표 2 및 실시예 2에 설명되어 있다.

상기 방법에 따른 일 구현예에서, 6시간 미만 내, 예를 들어, 1시간 미만 내, 예를 들어, 45분 미만 내 또는 바람직하게는 30분 내, 예를 들어, 15분 내에 폴리뉴클레오티드의 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 100% 라이게이션을 달성하기 위해 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자와 함께 ATP 의존성 DNA 리가제를 인큐베이션하는 것을 추가로 포함한다.

상기 방법의 대안적 구현예에서, 3'-하이드록실-데옥시리보핵산 분자는 비드 상에 고정되거나, 포획 표지, 바람직하게는 비오틴 또는 유도체화된 뉴클레오티드, 예를 들어, 염료, 바람직하게는 형광 염료를 추가로 포함하고, 여기서 비드, 포획 표지 또는 유도체화된 뉴클레오티드는 상기 데옥시리보핵산 분자의 5' 말단에 연결된다.

라이게이션 생성물을 검출하기 위한 검정은 당업자에게 공지되어 있다. 라이게이션 생성물을 검출하는 전통적인 방법의 예는 변성 겔 전기영동, 서열 증폭, 및 용융 곡선 분석을 포함한다.

실시예

본 발명은 이제 상기 도면 및 표 7의 생물학적 서열을 참조하여 비제한적인 실시예에 의해 설명될 것이다.

본 발명의 ATP-의존성 DNA 리가제(L13)는 후보 리가제에 대한 공개 데이터베이스를 마이닝하는 서열-기반 메타게노믹 접근법에 의해 발견되었다. 상기 언급된 바와 같이, 본 발명의 DNA 리가제는 원래 크로노박터 파지 CR9로부터 분리되었고, 이의 DNA 및 단백질 서열은 NCBI 참조 서열: YP_009015226.1로부터 획득될 수 있다. 본 발명에 따른 추가의 바람직한 ATP-의존성 DNA 리가제는 원래 크로노박터 파지 CR8로부터 분리되었으며 이의 DNA 및 단백질 서열은 NCBI 참조 서열: YP_009042486.1로부터 획득될 수 있고(L13rel1); 원래 펙토박테리움 파지 phiTE로부터 분리되었으며 이의 DNA 및 단백질 서열은 NCBI 참조 서열: YP_007392649.1로부터 획득될 수 있고(L13rel2); 원래 아시네토박터 파지 ABPH49로부터 분리되었으며 이의 DNA 및 단백질 서열은 NCBI 참조 서열: AXN57775.1로부터 획득될 수 있는(L13rel4), L13 리가제와 적어도 70%의 아미노산 서열 동일성을 갖는 DNA 리가제 L13의 동족체 DNA 리가제이다.

실시예 1: 클로닝, 발현 및 정제

선택된 서열을 E. 콜리에서의 발현을 위해 코돈-최적화하고, C-말단 His-태그를 갖는 발현 벡터 pVB-1A0B1(Vectron Biosolutions)에 클로닝하고, E. 콜리 BL21(DE3)로 형질전환시켰다.

클로닝

L13 또는 L13rel1, L13rel2, L13rel3 또는 L13rel4 중 임의의 것의 코딩 서열은 GeneOptimizer 알고리즘(Raab, D., Graf, M., Notka, F., Sch

dl, T., & Wagner, R. (2010). The GeneOptimizer Algorithm: Using a sliding window approach to cope with the vast sequence space in multiparameter DNA sequence optimization. Systems and Synthetic Biology, 4(3), 215-225. http://doi.org/10.1007/s11693-010-9062-3)을 사용하여 E. 콜리에서의 발현을 위해 코돈 최적화되었으며, GeneArt 유전자 합성 서비스를 사용하여 Thermo Fisher Scientific으로부터 주문되었다. 유전자 코딩 서열의 측면에 C-말단 GSG 링커 및 His-태그를 코딩한 후 정지-코돈, N-말단 PciI 및 NdeI 제한 부위 및 다운스트림 클로닝 접근법을 위한 C-말단 XhoI 제한 부위를 코딩하는 추가 서열 정보가 첨가되었다. NdeI 및 XhoI 제한 부위를 발현 벡터 pVB-1A0B1(Vectron Biosolutions, Trondheim, Norway)로 클로닝하기 위해 사용하였다. pVB 벡터 패밀리는 톨루익산으로 유도될 수 있는 프로모터를 포함하는 XylS/Pm 발현 카세트를 갖는 RK2 플라스미드에 기반한 독점적인 E. 콜리 발현 벡터 백본으로 구성된다. 슈도모나스 푸티다(Pseudomonas putida) TOL 플라스미드 pWW0로부터 유래하는 XylS/Pm 조절제/프로모터 시스템은 대장균(E. 콜리) 및 다른 박테리아의 유전자 및 유전자 클러스터의 조절된 저수준 및 고수준 재조합 발현에 널리 사용되며, 이는 문헌[Gawin, A. et al., The XylS/Pm regulator/promoter system and its use in fundamental studies of bacterial gene expression, recombinant protein production and metabolic engineering, Microb. Biotechnol., 2017, Vol.10, No.4, p 702-718]에 설명되어 있다.

DNA 리가제의 발현 및 정제

SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12, SEQ ID No. 15 또는 SEQ ID No. 18로부터 선택된 코돈 최적화된 핵산 분자를 Vectron Biosolutions로부터의 발현 벡터 pVB-1A0B1 내로 클로닝하고, BL21(DE3) 세포로 형질전환시켰다. 세포를 Terrific Broth(TB) 배지를 갖는 2.5 L Ultra Yield(Thomson) 플라스크에서 성장시켰고; 1% 밤새 전배양물을 100 μg/ml 암피실린을 함유하는 1 L TB 배지로 옮기고, OD600이 5-6에 도달할 때까지 37℃, 220 rpm에서 인큐베이션하였다. 온도를 15℃로 감소시키고, 온도가 ≤20℃일 때 세포를 2 mM 톨루익산으로 유도하였다. 세포를 밤새(ON) 인큐베이션하고, 원심분리에 의해 수확하고, -20℃에서 동결시켰다.

동결된 세포 펠렛에 용해 완충액(50 mM Tris-HCl(25℃에서 pH 8.5), 10 mM 이미다졸, 0.5 M NaCl, 5 mM MgCl2, 0.5 % Tween 20, 5% 글리세롤, 1 mg/ml 리소자임 및 400 U/ml HL-SAN)을 120의 OD600으로 첨가하고, 15℃에서 90 rpm으로 밤새 인큐베이션하였다. 용해질을 20 000 g에서 20분 동안 원심분리하고 정제 전에 여과하였다.

33.4 ml의 Ni-세파로스 6 FF로 패킹된 HiScale 26/20 컬럼을 사용하여 제1 정제 단계를 수행하였다. 용해질의 적용 후, 컬럼을 증가하는 농도의 이미다졸로 용리시키기 전에 IMAC 세척 완충액(50 mM Tris-HCl(25℃에서 pH 7.5), 20 mM 이미다졸, 5 mM MgCl2 및 0.5 M NaCl)으로 세척하였다. 제2 정제 단계에서, 34.5 ml의 Q-세파로스 FF 수지로 패킹된 HiScale 26/20 컬럼을 사용하였다. 제1 정제 단계로부터의 희석된 용리액의 적용 후, 컬럼을 Q 세척 완충액(20 mM Tris-HCl pH 7.5(25℃ 및 50 mM KCl)으로 세척하고, His-태깅된 L13 효소를 Q-용리 완충액(20 mM Tris-HCl pH 7.5(25℃), 10 mM MgCl2 및 0.2 M NaCl)을 사용하여 컬럼으로부터 용리시켰다. 정제된 L13 리가제 효소를 최종적으로 10 mM Tris-HCl pH 7.5(25℃), 0.3 M KCl, 5 mM MgCl2, 0.2 mg/ml BSA 및 50% 글리세롤에 저장하였다.

실시예 2A: 기질 특이성을 측정하기 위한 리가제 활성 검정

실험 설정

상이한 기질에 대한 리가제 활성은 불러드 및 보워터(Bullard and Bowater)의 절차에 따라 검정될 수 있다(Bullard, D. R., & Bowater, R. P. (2006). Direct comparison of nick-joining activity of the nucleic acid ligases from bacteriophage T4. The Biochemical Journal, 398(1), 135-144). 이중-가닥 기질을 사용하여 라이게이션 활성을 분석하는 시험관 내 검정을 수행하였고, 이는 문헌[Bullard and Bowater 2006]에 설명된 변형된 설정에 기초하였다. 올리고뉴클레오티드는 Metabion(독일)에서 구입하였다. 이중-가닥 기질을 각각의 올리고의 30 μM 용액을 사용하여 상보적 20-mer 핵산 주형 올리고에 하나의 8-mer 핵산 올리고 및 하나의 12-mer 핵산 올리고를 어닐링함으로써 생성시켰다. 어닐링 단계를 100 μl TE 완충액(10mM Tris/HCl, pH 8, 및 0.5mM EDTA)에서 수행하였고, 3개의 올리고를 포함하는 완충액을 95℃로 5분 동안 가열하고 실온에서 16시간 동안 냉각시켰다. 8-mer 올리고의 5'뉴클레오티드 잔기는 플루오레세인 염료 분자 6-FAM(IUPAC 명칭 3',6'-디하이드록시스피로[이소벤조푸란-1(3H),9'-[9H]크산텐]-3-온; CAS 번호 2321-07-5)으로 표지되고, 12-mer 올리고는 5'-모노포스포릴화된 핵산 잔기를 포함한다. 각각의 이중-가닥 기질은 리보핵산 올리고뉴클레오티드 단독 또는 데옥시리보핵산 올리고뉴클레오티드 단독 또는 리보핵산 올리고뉴클레오티드와 데옥시리보핵산 올리고뉴클레오티드의 혼합물로 나타내어, 하기 표 3 및 도 3a 및 3b에 도시된 바와 같은 이중-가닥 기질의 총 8개의 상이한 조성을 초래하였다.

8-mer 올리고*)

5'-GGCCAGTG-3' (SEQ ID No. 4)

12-mer 올리고*)

5'-AATTCGAGCTCG-3' (SEQ ID No. 5)

20-mer 올리고*)

5'-CGAGCTCGAATTCACTGGCC-3' (SEQ ID No. 6)

T는 RNA 올리고에서 U로 대체된다.

표 3: 니킹된 기질의 제조를 위한 올리고 조합

도 3a에 도시된 바와 같이 각 효소의 라이게이션 활성을 측정하는 종점 시험관 내 검정에 닉킹된 이중-가닥 20개 염기쌍(bp) 기질을 사용하였다. 모든 라이게이션 반응에 사용되는 완충액은 55mM Tris/HCl(pH 7.4), 10mM MgCl₂, 10.5mM DTT 25mM KCl 및 1mM ATP를 포함한다. 종점 라이게이션 반응을 하기와 같이 수행하였다: 총 부피 5 μl의 70 pmol의 리가제, 상기 설명된 바와 같은 45 pmol의 이중-가닥 올리고 핵산 기질. 반응 혼합물을 30℃에서 30분 동안 인큐베이션한 후, 5 μl의 포름아미드 정지 용액(95% 포름아미드, 10mM EDTA, 브롬-페놀-블루)을 사용하여 정지시켰다. 실험의 마지막에, 샘플을 5분 동안 95℃로 가열하고, 20% 폴리아크릴아미드-우레아 겔 1X TBE(89mM Tris, 89mM 붕산 및 2mM EDTA)에서 변성 조건 하에 분석하였다. 반응 생성물(도 3b 참조)을 Bio-Rad Pharos 시스템을 사용하여 겔 상에서 시각화하였다. ImageLab(BioRad)을 사용하여 정량화를 수행하였다.

다른 상업적으로 이용 가능한 리가제와 비교하여 L13 DNA 리가제의 라이게이션 활성을 도 1b에 예시된 바와 같이 분석하였다. 놀랍게도, L13 DNA 리가제는 기질 8(S8)에서 단일-가닥 파손을 고효율로 라이게이션시킬 수 있는 유일한 리가제였다. 기질 S8은 시험된 상업적으로 이용 가능한 리가제 효소에 대한 불량한 기질이었다.

실시예 2B: 대안적인 S8 유사 기질에 대한 리가제 활성 검정

대안적인 S8 기질에 대한 L13 DNA 리가제의 라이게이션 활성을 시험하였다. SEQ ID No 19, 20 및 21을 갖는 서열을 포함하는 닉킹된 이중-가닥 43 염기쌍(bp) 기질을 L13의 라이게이션 활성을 측정하는 종점 시험관 내 검정에 사용하였다. 모든 라이게이션 반응에 사용되는 완충액은 50mM Tris/HCl(pH 7.5), 10mM MgCl₂, 10mM DTT, <46 mM KCl 및 0.1mM ATP를 포함한다. 종점 라이게이션 반응을 하기와 같이 수행하였다: 총 부피 10 μl의 상이한 양의 L13 리가제, 상기 설명된 바와 같은 9 pmol의 이중-가닥 올리고 핵산 기질. 반응 혼합물을 25℃에서 15분 동안 인큐베이션한 후, 5 μl의 포름아미드 정지 용액(95% 포름아미드, 10mM EDTA, 브롬-페놀-블루)을 사용하여 정지시켰다. 실험의 마지막에, 샘플을 5분 동안 95℃로 가열하고, 20% 폴리아크릴아미드-우레아 겔 1X TBE(89mM Tris, 89mM 붕산 및 2mM EDTA)에서 변성 조건 하에 분석하였다. 반응 생성물을 Bio-Rad Pharos 시스템을 사용하여 겔 상에서 시각화하였다. ImageLab(BioRad)을 사용하여 정량화를 수행하였다.

실험으로부터의 결과는 하기 표 3에 도시되어 있으며, 이는 L13 리가제가 또한 실시예 2A와 비교하여 상이한 핵산 서열을 포함하는 이중 가닥 DNA-RNA 하이브리드에서 닉을 고효율로 라이게이션시킬 수 있음을 명백히 입증한다.

대안적인 S8 - 기질

20-mer 5'-FAM-표지된 DNA 올리고

5'-GGCCAGTGAATTCGAGCTCG-3' (SEQ ID No. 19)

23-mer RNA 올리고 5'-P

5'-P-ACUGAUAGAAGUUCCCGAAACAG-3' (SEQ ID No. 20)

43-mer DNA 올리고

5'-CTGTTTCGGGAACTTCTATCAGTCGAGCTCGAATTCACTGGCC-3' (SEQ ID No.21)

표 3

실시예 3: L13, L13rel1, L13rel2, L13rel3 및 L13rel4의 리가제 활성

이 실시예에서, 본 발명의 상이한 리가제의 리가제 활성을 시험하였다. 결과는 표 4 및 표 5에 제시되어 있으며, 이는 L13, L13rel1, L13rel2 및 L13rel4 효소가 S8 기질에 대한 유사한 라이게이션 효율, 즉, 라이게이션 접합부에 걸쳐 있는 DNA 분자의 존재 하에 RNA 분자의 5'-말단에 DNA 분자를 라이게이션시키는 라이게이션 효율을 갖는 것을 입증한다.

표 4

검정 조건 1: 50 mM Tris/HCl pH 7.5, 10mM MgCl2, 10 mM DTT, 25mM KCl, 1mM ATP, 11.4 pmol 리가제, 9 pmol S8 기질, 총 부피 20 μl. 30℃에서 30분 인큐베이션.

검정 조건 2: 50 mM Tris/HCl pH 7,5, 10mM MgCl₂, 10 mM DTT, 25mM KCl, 1mM ATP, 7 pmol 리가제, 18 pmol S8 기질, 총 부피 20 μl. 25℃에서 15분 인큐베이션.

표 5

검정 조건: 50 mM Tris/HCl pH 7.5, 10 mM MnCl₂, 10 mM DTT, 25mM KCl, 1mM ATP, 11.4 pmol 리가제, 18 pmol S8 기질, 총 부피 20 μl. 25℃에서 15분 인큐베이션.

실시예 4: 백시니아 DNA 리가제와 비교한 L13 DNA 리가제의 리가제 활성

본 발명의 L13 DNA 리가제의 효능을 종래 기술의 백시니아 바이러스로부터의 DNA 리가제와 비교하였다(백시니아 DNA 리가제의 단백질 서열은 등록 번호 YP_233058.1로 NCBI 데이터베이스에 도시되어 있다). 표 6은 실험으로부터의 결과를 도시한다. 효소 활성을 실시예 2a에 따라 18 pmol S8 기질을 사용하여 시험하였다; MnCl₂ 또는 MgCl₂를 포함하는 라이게이션 완충액 및 20 μl의 반응 부피. 라이게이션을 25℃에서 15분 동안 실행하고, 라이게이션된 기질 % 및 전환율을 계산하였다.

표 6

표 6에 제시된 데이터는 라이게이션 접합부에 걸쳐 있는 DNA 분자의 존재 하에 DNA 분자를 RNA 분자의 5'-말단에 라이게이션시키는데 있어서 L13이 백시니아 DNA 리가제와 비교하여 더 효율적인 리가제임을 분명히 입증한다(기질 S8의 경우, 실시예 2 참조).

표 7

SEQUENCE LISTING <110> ArcticZymes <120> Ligases <130> P27155PC00 <160> 21 <170> PatentIn version 3.5 <210> 1 <211> 458 <212> PRT <213> L13 wild type amino acid sequence <400> 1 Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser 1 5 10 15 Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly 20 25 30 Leu Lys Gln Ala Phe Gln Ile Ala Tyr Ser Lys Glu Leu Asn Phe Phe 35 40 45 Val Arg Gly Leu Lys Val Gln Ser Leu Pro Gly Leu Arg Ser Leu Ser 50 55 60 Glu Ser Val Glu Met Leu Val Lys Asn Ile Ala Gly Arg Val Tyr Thr 65 70 75 80 Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys Glu 85 90 95 Glu Pro Asp Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys Gly 100 105 110 Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr Glu 115 120 125 Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg Lys 130 135 140 Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu Tyr 145 150 155 160 Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg Ser 165 170 175 Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala Leu 180 185 190 Met Lys Ala Ala Val Ala Glu Asp Gly Thr Ala Lys Pro Tyr Val Ala 195 200 205 His Gly Glu Gly Leu Val Ile Asp Pro Asp Gly Leu His Gly Val Met 210 215 220 Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile 225 230 235 240 Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Arg Val Thr Met Asp 245 250 255 Glu Tyr Ile Ala Arg Lys Ser Lys Arg Pro Tyr Ser Glu Arg Arg Leu 260 265 270 Ser Ala Gln Gly Leu Ala Trp Trp Val Glu Asp Pro Asp His Met Gln 275 280 285 Phe Val Lys Gly Arg Gln Ile Asn Ser Leu Lys Glu Ala Ile Asp His 290 295 300 Phe Ile Glu Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu 305 310 315 320 Ala Glu Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu 325 330 335 Lys Asn Glu Phe Asp Val Asp Leu Val Val Val Gly Thr Thr Pro His 340 345 350 Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg Asp 355 360 365 Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg 370 375 380 Lys Lys Pro Ala Glu Tyr Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala 385 390 395 400 Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu 405 410 415 Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Val 420 425 430 Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp 435 440 445 Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu 450 455 <210> 2 <211> 467 <212> PRT <213> L13 amino acid sequence with His-tag <400> 2 Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser 1 5 10 15 Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly 20 25 30 Leu Lys Gln Ala Phe Gln Ile Ala Tyr Ser Lys Glu Leu Asn Phe Phe 35 40 45 Val Arg Gly Leu Lys Val Gln Ser Leu Pro Gly Leu Arg Ser Leu Ser 50 55 60 Glu Ser Val Glu Met Leu Val Lys Asn Ile Ala Gly Arg Val Tyr Thr 65 70 75 80 Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys Glu 85 90 95 Glu Pro Asp Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys Gly 100 105 110 Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr Glu 115 120 125 Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg Lys 130 135 140 Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu Tyr 145 150 155 160 Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg Ser 165 170 175 Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala Leu 180 185 190 Met Lys Ala Ala Val Ala Glu Asp Gly Thr Ala Lys Pro Tyr Val Ala 195 200 205 His Gly Glu Gly Leu Val Ile Asp Pro Asp Gly Leu His Gly Val Met 210 215 220 Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile 225 230 235 240 Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Arg Val Thr Met Asp 245 250 255 Glu Tyr Ile Ala Arg Lys Ser Lys Arg Pro Tyr Ser Glu Arg Arg Leu 260 265 270 Ser Ala Gln Gly Leu Ala Trp Trp Val Glu Asp Pro Asp His Met Gln 275 280 285 Phe Val Lys Gly Arg Gln Ile Asn Ser Leu Lys Glu Ala Ile Asp His 290 295 300 Phe Ile Glu Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu 305 310 315 320 Ala Glu Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu 325 330 335 Lys Asn Glu Phe Asp Val Asp Leu Val Val Val Gly Thr Thr Pro His 340 345 350 Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg Asp 355 360 365 Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg 370 375 380 Lys Lys Pro Ala Glu Tyr Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala 385 390 395 400 Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu 405 410 415 Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Val 420 425 430 Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp 435 440 445 Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu Gly Ser Gly His His His 450 455 460 His His His 465 <210> 3 <211> 1377 <212> DNA <213> L13 cDNA sequence <400> 3 atgtcaaacg taacgagtat tctcgcagag ttgtctgcaa cccgatccct gaaggagaag 60 gaagcgatcc tgcgagcaaa tgcggataat gacggcctta aacaagcctt ccagatcgca 120 tattccaaag aactgaactt cttcgttcgc ggactgaagg ttcaatccct gccagggttg 180 cgttccctgt ccgaaagtgt ggaaatgttg gtgaagaaca tcgccgggcg agtgtatact 240 ggtgacgacg ccaagtcgta catgacccaa ctggtgcaga cctgcgaaga gccggatacg 300 ctcctgaaga tcatcaaccg cgatctggag tgcggcatcc agacgactct gaccaacaag 360 gtgtggaaag acctgatcac ggagcctccg taccagagct ataccctgtt caaagaggat 420 ctgttgcgta agttcaacta caagggcgct ttctccgacg agaagatgga cggcttgtat 480 gctgacatca tggtgtggcc tgagcaggtc atttatcgct ctcgctccgg caaggaactg 540 aacttccgtg ctccggagaa cgtggaacgt gcgctgatga aggcggctgt tgccgaggat 600 ggaacagcga agccatacgt tgctcacggc gaaggtctgg ttattgatcc ggacggcctg 660 cacggcgtta tggaacgtgc tgaaggcaac ggttatctga accaagaccc ggaagacatc 720 gatcgtaacc gtgttcgact ggtgatttgg gaccgtgtga ctatggacga gtatatcgcc 780 cgcaagtcga agcgtccgta cagtgaacgc cgtctgtcag cgcagggtct cgcatggtgg 840 gttgaagatc ctgatcacat gcagttcgtt aagggccgtc agatcaacag cctcaaagag 900 gcgatcgacc acttcatcga gatgcgtctc cagaagaaag aaggcaccgt cttgaaagag 960 gccgagatgc cttggggcga caacaagacg aagaaaggcg tcaagttgaa gaacgagttc 1020 gatgtggatc tggtcgttgt cgggacaacc ccgcacaaga aagatcctgc cctgatcgga 1080 tcactgatct gtcagactcg tgacggccta ctggaagtcg gcgttggctc cggcctgacc 1140 gatgcgcttc gtaagaagcc agcggaatac ttcatcgggc agatcatcac gatcaaggcc 1200 aacgacatca cgaagtcgga gaccaaagag cttcagtctc tgttcttgcc tcgtttgaac 1260 tacaagttcg tcgagatccg catggacaag accgtggcta acagtcttcc agaagtgatc 1320 gaagcctctg attctctgct ggatctcctg cgggcaattg cggaggactt ggaatga 1377 <210> 4 <211> 8 <212> DNA <213> 8-mer DNA oligo <400> 4 ggccagtg 8 <210> 5 <211> 12 <212> RNA <213> 12-mer RNA oligo <400> 5 aauucgagcu cg 12 <210> 6 <211> 20 <212> DNA <213> 20-mer DNA oligo <400> 6 cgagctcgaa ttcactggcc 20 <210> 7 <211> 455 <212> PRT <213> L13Rel1 <400> 7 Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser 1 5 10 15 Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly 20 25 30 Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe 35 40 45 Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu 50 55 60 Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr 65 70 75 80 Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys 85 90 95 Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys 100 105 110 Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr 115 120 125 Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg 130 135 140 Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu 145 150 155 160 Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg 165 170 175 Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Glu Ile Glu Gln Arg 180 185 190 Leu Met Gln Ala Ala Glu Asn Arg Gly Ala Phe Val Ala His Gly Glu 195 200 205 Gly Leu Val Ile Asp Asp Asp Gly Leu His Gly Val Met Glu Arg Ala 210 215 220 Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp Ile Asp Arg Asp 225 230 235 240 Leu Val Arg Leu Val Ile Trp Asp Ile Val Thr Met Glu Glu Tyr Ile 245 250 255 Ala Arg Lys Ser Lys Thr Asp Tyr Ala Asp Arg Arg Ile Glu Ala Asp 260 265 270 Leu Leu Val Gln Glu Val Asp Arg Arg Tyr Asn Phe Arg Met Val Thr 275 280 285 Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile Glu 290 295 300 Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Lys Met 305 310 315 320 Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu Lys Asn Glu 325 330 335 Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys Asp 340 345 350 Pro Ser Leu Val Gly Ala Leu Ile Cys Arg Thr Arg Asp Gly Leu Leu 355 360 365 Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg Lys Lys Pro 370 375 380 Ala Asp Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp Ile 385 390 395 400 Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg Leu 405 410 415 Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Lys Ala Asn Ser 420 425 430 Leu Glu Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp Leu Leu Arg 435 440 445 Ala Ile Ala Glu Asp Leu Glu 450 455 <210> 8 <211> 464 <212> PRT <213> L13Rel1amino acid sequence with His-tag <400> 8 Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser 1 5 10 15 Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly 20 25 30 Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe 35 40 45 Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu 50 55 60 Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr 65 70 75 80 Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys 85 90 95 Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys 100 105 110 Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Ile Thr 115 120 125 Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg 130 135 140 Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu 145 150 155 160 Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg 165 170 175 Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Glu Ile Glu Gln Arg 180 185 190 Leu Met Gln Ala Ala Glu Asn Arg Gly Ala Phe Val Ala His Gly Glu 195 200 205 Gly Leu Val Ile Asp Asp Asp Gly Leu His Gly Val Met Glu Arg Ala 210 215 220 Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp Ile Asp Arg Asp 225 230 235 240 Leu Val Arg Leu Val Ile Trp Asp Ile Val Thr Met Glu Glu Tyr Ile 245 250 255 Ala Arg Lys Ser Lys Thr Asp Tyr Ala Asp Arg Arg Ile Glu Ala Asp 260 265 270 Leu Leu Val Gln Glu Val Asp Arg Arg Tyr Asn Phe Arg Met Val Thr 275 280 285 Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile Glu 290 295 300 Met Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Lys Met 305 310 315 320 Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys Leu Lys Asn Glu 325 330 335 Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys Asp 340 345 350 Pro Ser Leu Val Gly Ala Leu Ile Cys Arg Thr Arg Asp Gly Leu Leu 355 360 365 Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ala Leu Arg Lys Lys Pro 370 375 380 Ala Asp Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp Ile 385 390 395 400 Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg Leu 405 410 415 Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr Lys Ala Asn Ser 420 425 430 Leu Glu Glu Val Ile Glu Ala Ser Asp Ser Leu Leu Asp Leu Leu Arg 435 440 445 Ala Ile Ala Glu Asp Leu Glu Gly Ser Gly His His His His His His 450 455 460 <210> 9 <211> 1368 <212> DNA <213> L13Rel1 cDNA <400> 9 atgtcaaacg taacgagtat tctcgcagag ttgtctgcaa cccgatccct caaggagaag 60 gaagcgatcc tgcgggctaa tgccgataac gatggcctaa aacaagcctt cgctgttgca 120 tattccaaag aactgaactt tttcgtccga ggactgcggg ttccattctt cacggctggt 180 cttaccccgc tatctgaaag cgtagatctg ctggtgaaga acatcgcagg gcgagtttac 240 acgggtgatg atgccaagtc gtacatgact caactggtac agacctgcga ggagccgggt 300 acactcctga agatcatcaa ccgagatctg gagtgcggca tccagaccac tctaaccaac 360 aaggtgtgga aagacctgat cactgagcct ccgtaccaga gttacaccct gttcaaagag 420 gatctgctgc gtaagttcaa ctacaagggc gctttctccg acgagaaaat ggacggcctg 480 tatgcggaca tcatggtgtg gcctgagcag gtgatctacc gttcccgctc cgggaaggaa 540 ctgaacttcc gtgcgccgga agagatcgag cagcgcctga tgcaggcggc agaaaaccgt 600 ggggcctttg tggcacacgg cgaaggtctg gttatcgacg atgacggcct gcatggtgtg 660 atggaacgtg ctgagggcaa cggatacctg aaccaagacc cggcagacat cgatcgtgat 720 ctggtgcgcc tggtgatctg ggacatcgtg acgatggaag agtacatcgc acgtaagtcg 780 aagaccgact acgctgatcg tcgtatcgag gcggatctgc tggtgcagga agtcgatcgc 840 cgttacaact tccgtatggt cacgggccgc aagatcaaca gcctgaagga agctatcgat 900 cacttcatcg aaatgcgcct ccagaagaaa gaaggcaccg tcctcaaaga ggcgaagatg 960 ccgtggggcg acaacaagac gaagaaaggc gtcaagttga agaacgagtt cgatgttgat 1020 ctggaagtcg tggcgacgac gccgcacaag aaagatccga gcctcgtcgg cgcactgatc 1080 tgtcgtactc gtgacggcct gctggaagtt ggcgtcggct ccggcttgac ggacgcgctt 1140 cgtaagaagc cagcggactt cttcatcggg cagatcatca cgatcaaggc caacgacatc 1200 acgaagtcgg aaaccaaaga gcttcagtct ctgttcctgc ctcgtctgaa ctacaagttc 1260 gtcgagatcc gtatggacaa gaccaaggct aacagcctgg aagaggtgat cgaggcatct 1320 gactccctgc tggatctgct gcgggctatt gcggaggatc tggaatga 1368 <210> 10 <211> 459 <212> PRT <213> L13Rel2 amino acid sequence <400> 10 Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser 1 5 10 15 Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly 20 25 30 Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe 35 40 45 Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu 50 55 60 Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr 65 70 75 80 Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys 85 90 95 Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys 100 105 110 Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Val Thr 115 120 125 Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg 130 135 140 Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu 145 150 155 160 Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg 165 170 175 Asp Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala 180 185 190 Leu Met Gln Ala Ala Val Asp Asp Asp Gly Thr Ala Lys Pro Tyr Val 195 200 205 Ala His Gly Glu Gly Leu Val Ile Asp Pro Asn Gly Leu His Gly Val 210 215 220 Met Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp 225 230 235 240 Ile Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Tyr Val Thr Met 245 250 255 Asp Glu Tyr Ile Val Arg Lys Ser Lys Arg Pro Tyr Ile Ser Arg Arg 260 265 270 Leu Ser Ala Gln Gly Leu Ala Ala Trp Val Glu Asp Lys Glu His Met 275 280 285 Gln Phe Val Lys Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp 290 295 300 His Phe Ile Glu Val Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys 305 310 315 320 Glu Ala Asp Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys 325 330 335 Leu Lys Asn Glu Phe Asp Val Asp Leu Glu Val Val Gly Thr Ile Arg 340 345 350 His Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg 355 360 365 Asp Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ser Leu 370 375 380 Arg Lys Lys Pro Ala Glu Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys 385 390 395 400 Ala Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe 405 410 415 Leu Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr 420 425 430 Val Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu 435 440 445 Gly Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu 450 455 <210> 11 <211> 468 <212> PRT <213> L13Rel2 amino acid sequence with His-tag <400> 11 Met Ser Asn Val Thr Ser Ile Leu Ala Glu Leu Ser Ala Thr Arg Ser 1 5 10 15 Leu Lys Glu Lys Glu Ala Ile Leu Arg Ala Asn Ala Asp Asn Asp Gly 20 25 30 Leu Lys Gln Ala Phe Ala Val Ala Tyr Ser Lys Glu Leu Asn Phe Phe 35 40 45 Val Arg Gly Leu Arg Val Pro Phe Phe Thr Ala Gly Leu Thr Pro Leu 50 55 60 Ser Glu Ser Val Asp Leu Leu Val Lys Asn Ile Ala Gly Arg Val Tyr 65 70 75 80 Thr Gly Asp Asp Ala Lys Ser Tyr Met Thr Gln Leu Val Gln Thr Cys 85 90 95 Glu Glu Pro Gly Thr Leu Leu Lys Ile Ile Asn Arg Asp Leu Glu Cys 100 105 110 Gly Ile Gln Thr Thr Leu Thr Asn Lys Val Trp Lys Asp Leu Val Thr 115 120 125 Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Lys Glu Asp Leu Leu Arg 130 135 140 Lys Phe Asn Tyr Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly Leu 145 150 155 160 Tyr Ala Asp Ile Met Val Trp Pro Glu Gln Val Ile Tyr Arg Ser Arg 165 170 175 Asp Gly Lys Glu Leu Asn Phe Arg Ala Pro Glu Asn Val Glu Arg Ala 180 185 190 Leu Met Gln Ala Ala Val Asp Asp Asp Gly Thr Ala Lys Pro Tyr Val 195 200 205 Ala His Gly Glu Gly Leu Val Ile Asp Pro Asn Gly Leu His Gly Val 210 215 220 Met Glu Arg Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Ala Asp 225 230 235 240 Ile Asp Arg Asn Arg Val Arg Leu Val Ile Trp Asp Tyr Val Thr Met 245 250 255 Asp Glu Tyr Ile Val Arg Lys Ser Lys Arg Pro Tyr Ile Ser Arg Arg 260 265 270 Leu Ser Ala Gln Gly Leu Ala Ala Trp Val Glu Asp Lys Glu His Met 275 280 285 Gln Phe Val Lys Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp 290 295 300 His Phe Ile Glu Val Arg Leu Gln Lys Lys Glu Gly Thr Val Leu Lys 305 310 315 320 Glu Ala Asp Met Pro Trp Gly Asp Asn Lys Thr Lys Lys Gly Val Lys 325 330 335 Leu Lys Asn Glu Phe Asp Val Asp Leu Glu Val Val Gly Thr Ile Arg 340 345 350 His Lys Lys Asp Pro Ala Leu Ile Gly Ser Leu Ile Cys Gln Thr Arg 355 360 365 Asp Gly Leu Leu Glu Val Gly Val Gly Ser Gly Leu Thr Asp Ser Leu 370 375 380 Arg Lys Lys Pro Ala Glu Phe Phe Ile Gly Gln Ile Ile Thr Ile Lys 385 390 395 400 Ala Asn Asp Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe 405 410 415 Leu Pro Arg Leu Asn Tyr Lys Phe Val Glu Ile Arg Met Asp Lys Thr 420 425 430 Val Ala Asn Ser Leu Pro Glu Val Ile Glu Ala Ser Asp Ser Leu Leu 435 440 445 Gly Leu Leu Arg Ala Ile Ala Glu Asp Leu Glu Gly Ser Gly His His 450 455 460 His His His His 465 <210> 12 <211> 1380 <212> DNA <213> L13Rel2 cDNA <400> 12 atgtcaaacg taacgagtat tctcgcagag ttgtctgcaa cccgatccct gaaggagaag 60 gaagcgatcc tgcgagccaa tgccgataac gacggcctaa aacaagcctt cgctgttgca 120 tattccaaag aactgaactt tttcgtccga ggactgcggg ttcccttctt cacggctggt 180 cttactccgc tgtctgaaag cgtggatctg ctggtgaaga acatcgcagg gcgagtttac 240 acgggcgatg atgcgaagtc gtacatgact caactggtac agacctgcga ggagccgggc 300 acacttctga agatcatcaa ccgagatctg gagtgcggca tccagacaac tctgaccaac 360 aaggtgtgga aggatctggt cacggagcct ccgtaccaga gctataccct gttcaaagag 420 gatctgctgc gtaagttcaa ctataagggc gctttctctg acgagaagat ggacggcctg 480 tatgcggaca tcatggtgtg gcctgagcag gtcatctatc gatcacgcga cggcaaggaa 540 ctgaacttcc gcgccccaga gaacgtggaa cgtgccctga tgcaagctgc ggttgacgac 600 gatggcacag caaaaccata cgtagctcac ggtgaaggtc tggttattga tccgaatggc 660 ctgcatgggg ttatggaacg cgcagagggc aacggctacc tgaaccaaga tccagcagac 720 atcgatcgaa atcgtgttcg actggtgatc tgggactatg tgacgatgga cgagtatatc 780 gtccgtaagt ccaagcgacc gtacatcagt cgtcgtctgt cagcgcaggg cctcgccgca 840 tgggttgaag ataaagagca catgcagttc gtgaagggta gaaagatcaa cagcctcaaa 900 gaggcaatcg accacttcat cgaggtgcgt ctccagaaga aagaggggac ggtcctcaaa 960 gaggcagaca tgccgtgggg cgacaacaag acgaagaaag gtgtcaagtt gaagaatgag 1020 ttcgatgtgg atctggaagt tgtcggcacg atccgacaca agaaagaccc ggcattgatt 1080 ggatccctaa tctgccaaac tcgtgatggg ttattggagg ttggtgttgg ttctggactt 1140 acagattcgc tccgtaagaa accagcggag ttctttatcg ggcagatcat cacgatcaag 1200 gcaaacgaca tcacgaagtc ggagactaaa gagcttcagt cgctgttcct gccccgcctc 1260 aactacaagt tcgttgagat ccgcatggac aagaccgttg caaacagcct accggaagtg 1320 atcgaggcgt ctgactccct tctgggtctg ttgcgggcaa ttgcggagga tctggaatga 1380 <210> 13 <211> 457 <212> PRT <213> L13Rel3 amino acid sequence <400> 13 Met Lys Lys Val Val Asp Ile Ile Lys Glu Leu Arg Ser Thr Ser Ser 1 5 10 15 Arg Asn Glu Lys Glu Ala Ile Leu Thr Thr Asn Lys Asp Asn Glu Thr 20 25 30 Leu Lys Lys Val Phe Tyr Leu Ala Tyr Asp Pro Ser Ile Asn Phe Tyr 35 40 45 Ile Lys Ser Ile Pro Tyr Glu Asp Asn Trp Lys His Gly Glu Tyr Phe 50 55 60 Glu Tyr Asp Glu Asn Asp Glu Phe Glu Ile Leu Phe Asp Val Leu Glu 65 70 75 80 Thr Ile Tyr Ser Arg Glu Leu Thr Gly Asn Lys Ala Ile Ser Phe Leu 85 90 95 Thr Gly Val Leu Ser Glu Arg Ser Thr Glu Met Gln Glu Leu Ile Cys 100 105 110 Asn Ile Val Lys Lys Asp Leu Asp Cys Gly Val Gln Thr Thr Thr Ile 115 120 125 Asn Lys Ile Trp Lys Gly Leu Ile Thr Asp Pro Pro Tyr Met Gly Tyr 130 135 140 Gln Leu Phe Ser Glu Lys Leu Ile Lys Ser Phe Lys Leu Pro Cys Tyr 145 150 155 160 Ser Gln Ile Lys Leu Asp Gly Leu Tyr Ala Asp Val Phe Val Met Lys 165 170 175 Asp Ser Val Ser Tyr Arg Ser Arg Ser Gly Ile Asn Cys Lys Phe Lys 180 185 190 Leu Pro Asp Asn Val Glu Glu Lys Leu Leu Asn Leu Ser Gln Phe Ser 195 200 205 Asp Val Glu Phe Val Leu His Cys Glu Ala Leu Val Arg Lys Gly Glu 210 215 220 Ser Phe Thr Glu Phe Glu Glu Arg Lys Ile Gly Asn Gly Tyr Leu Asn 225 230 235 240 Ser Asp Glu Ser Asp Pro Gly Lys Val Val Ile Val Ile Trp Asp Val 245 250 255 Val Gly Ile Asp Glu Tyr Asn Asn Arg Lys Ser Thr Glu Asp Tyr Ser 260 265 270 Glu Arg Phe Asn Leu Val Glu Lys Ile Val Glu Tyr Val Asp Thr Pro 275 280 285 His Val Gln Met Val Glu Ser Arg Phe Cys Asn Ala Thr Gln Asp Val 290 295 300 Ile Asp His Phe Val Glu Ser Arg Ser Lys Gly Met Glu Gly Thr Val 305 310 315 320 Ile Lys Ser Pro Lys Leu Lys Trp Lys Asp Gly Lys Val Lys Asp Gly 325 330 335 Leu Lys Leu Lys Asn Glu Phe Val Val Glu Met Lys Ile Ile Gly Phe 340 345 350 Gln Glu His Ser Lys Arg Ser Gly Gln Ile Gly Ala Ile Phe Val Glu 355 360 365 Ser Glu Asp Gly Val Val Lys Cys Lys Val Gly Ser Gly Leu Thr Asp 370 375 380 Ala Gln Arg Lys Lys Phe Phe Leu Thr Gln Asp Glu Met Ile Gly Lys 385 390 395 400 Ile Val Thr Val Lys Gly Asn Asp Leu Val Thr Asn Glu Leu Lys Gln 405 410 415 Asp Arg His Ser Val Phe Leu Pro Arg Phe Val Glu Val Arg Asp Asp 420 425 430 Lys Thr Val Ala Asp Met Phe Asp Lys Ile Met Ala Thr Lys Asp Ser 435 440 445 Ile Ile Asp Leu Leu Lys Asn Ile Lys 450 455 <210> 14 <211> 466 <212> PRT <213> L13Rel3 amino acid sequence with His-tag <400> 14 Met Lys Lys Val Val Asp Ile Ile Lys Glu Leu Arg Ser Thr Ser Ser 1 5 10 15 Arg Asn Glu Lys Glu Ala Ile Leu Thr Thr Asn Lys Asp Asn Glu Thr 20 25 30 Leu Lys Lys Val Phe Tyr Leu Ala Tyr Asp Pro Ser Ile Asn Phe Tyr 35 40 45 Ile Lys Ser Ile Pro Tyr Glu Asp Asn Trp Lys His Gly Glu Tyr Phe 50 55 60 Glu Tyr Asp Glu Asn Asp Glu Phe Glu Ile Leu Phe Asp Val Leu Glu 65 70 75 80 Thr Ile Tyr Ser Arg Glu Leu Thr Gly Asn Lys Ala Ile Ser Phe Leu 85 90 95 Thr Gly Val Leu Ser Glu Arg Ser Thr Glu Met Gln Glu Leu Ile Cys 100 105 110 Asn Ile Val Lys Lys Asp Leu Asp Cys Gly Val Gln Thr Thr Thr Ile 115 120 125 Asn Lys Ile Trp Lys Gly Leu Ile Thr Asp Pro Pro Tyr Met Gly Tyr 130 135 140 Gln Leu Phe Ser Glu Lys Leu Ile Lys Ser Phe Lys Leu Pro Cys Tyr 145 150 155 160 Ser Gln Ile Lys Leu Asp Gly Leu Tyr Ala Asp Val Phe Val Met Lys 165 170 175 Asp Ser Val Ser Tyr Arg Ser Arg Ser Gly Ile Asn Cys Lys Phe Lys 180 185 190 Leu Pro Asp Asn Val Glu Glu Lys Leu Leu Asn Leu Ser Gln Phe Ser 195 200 205 Asp Val Glu Phe Val Leu His Cys Glu Ala Leu Val Arg Lys Gly Glu 210 215 220 Ser Phe Thr Glu Phe Glu Glu Arg Lys Ile Gly Asn Gly Tyr Leu Asn 225 230 235 240 Ser Asp Glu Ser Asp Pro Gly Lys Val Val Ile Val Ile Trp Asp Val 245 250 255 Val Gly Ile Asp Glu Tyr Asn Asn Arg Lys Ser Thr Glu Asp Tyr Ser 260 265 270 Glu Arg Phe Asn Leu Val Glu Lys Ile Val Glu Tyr Val Asp Thr Pro 275 280 285 His Val Gln Met Val Glu Ser Arg Phe Cys Asn Ala Thr Gln Asp Val 290 295 300 Ile Asp His Phe Val Glu Ser Arg Ser Lys Gly Met Glu Gly Thr Val 305 310 315 320 Ile Lys Ser Pro Lys Leu Lys Trp Lys Asp Gly Lys Val Lys Asp Gly 325 330 335 Leu Lys Leu Lys Asn Glu Phe Val Val Glu Met Lys Ile Ile Gly Phe 340 345 350 Gln Glu His Ser Lys Arg Ser Gly Gln Ile Gly Ala Ile Phe Val Glu 355 360 365 Ser Glu Asp Gly Val Val Lys Cys Lys Val Gly Ser Gly Leu Thr Asp 370 375 380 Ala Gln Arg Lys Lys Phe Phe Leu Thr Gln Asp Glu Met Ile Gly Lys 385 390 395 400 Ile Val Thr Val Lys Gly Asn Asp Leu Val Thr Asn Glu Leu Lys Gln 405 410 415 Asp Arg His Ser Val Phe Leu Pro Arg Phe Val Glu Val Arg Asp Asp 420 425 430 Lys Thr Val Ala Asp Met Phe Asp Lys Ile Met Ala Thr Lys Asp Ser 435 440 445 Ile Ile Asp Leu Leu Lys Asn Ile Lys Gly Ser Gly His His His His 450 455 460 His His 465 <210> 15 <211> 1374 <212> DNA <213> L13Rel3 cDNA <400> 15 atgaaaaagg ttgtagatat tattaaagaa cttcgttcga cttcttctcg taatgagaag 60 gaagcaatct tgactacaaa taaagacaat gaaaccctaa agaaagtttt ctaccttgct 120 tatgacccga gtatcaactt ttatattaaa agtattccat atgaagataa ttggaaacac 180 ggggaatatt ttgagtatga tgagaatgat gagtttgaga ttttgtttga tgttcttgaa 240 acaatttact ctcgtgaact gacagggaat aaagcaattt cttttttgac tggtgttttg 300 tcagaacggt caactgagat gcaagaacta atttgcaata ttgtcaagaa agatttggat 360 tgtggtgtcc agacaactac aattaataaa atatggaaag gcttgattac cgatccgcca 420 tatatgggtt atcagttgtt cagtgaaaaa ctaattaaaa gtttcaaact tccgtgttac 480 tcacaaatta aacttgatgg tctgtatgct gacgtatttg taatgaaaga ttctgttagt 540 tatcgttcac gaagtggtat taattgcaag ttcaaacttc cagataatgt agaagaaaaa 600 cttcttaatt tgtcacagtt cagcgatgtt gaatttgtcc tacactgcga ggctcttgtc 660 cgcaaaggtg agagttttac agagtttgag gaacgcaaaa ttggcaatgg atacttgaat 720 agtgatgaat ctgatccagg gaaagttgtt attgttatct gggatgttgt tggtattgat 780 gaatataaca atcgtaagtc aacagaagat tatagtgaac gttttaatct tgtagaaaag 840 attgtagaat acgttgacac accgcatgtt cagatggtag aatctcgttt ctgcaatgca 900 acacaagacg tcattgatca ttttgtagaa tcacgttcta aaggcatgga aggaactgta 960 atcaaatcac ctaaacttaa atggaaagat ggtaaagtta aagatggttt gaagctcaaa 1020 aatgaatttg tagttgagat gaaaattatt ggtttccaag aacatagtaa aagatctgga 1080 cagattggtg caatctttgt agaatctgaa gatggtgttg ttaagtgtaa agttggtagt 1140 ggtttgactg atgcacaacg caaaaaattc ttcttgacac aagatgaaat gattggtaag 1200 attgtaacag tgaaaggaaa tgatttggta actaacgaat tgaaacaaga tcgacatagt 1260 gtcttcttgc cacgttttgt tgaagtccgt gatgataaaa ctgttgctga tatgtttgac 1320 aaaattatgg caacaaaaga cagtattatt gatttgttga aaaatattaa ataa 1374 <210> 16 <211> 457 <212> PRT <213> L13Rel4 amino acid sequence <400> 16 Met Thr Lys Ser Val Thr Glu Ile Leu Asn Glu Leu Arg Ala Thr Ser 1 5 10 15 Ser Lys Asn Glu Lys Glu Arg Ile Ile Arg Glu Asn Ala Asp His Asp 20 25 30 Gly Leu Arg Glu Ala Phe Arg Val Ala Tyr Ser Lys Glu Leu Asn Phe 35 40 45 Phe Val Arg Gly Val Lys Asn Thr Tyr Gln Asn Pro Gly Leu Arg Pro 50 55 60 Leu Ser Asp Ser Ile Asn Asp Leu Val Thr Asn Ile Ala Gly Arg Leu 65 70 75 80 Tyr Thr Gly Asp Glu Ala Lys Ser Tyr Met Gln Gln Leu Ile Gly Leu 85 90 95 Cys Glu Glu Pro Asp Thr Leu Val Ala Ile Ile Asn Arg Asp Leu Glu 100 105 110 Cys Gly Val Gln Thr Thr Ile Thr Asn Lys Val Trp Lys Asp Leu Ile 115 120 125 Thr Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Thr Glu Lys Leu Leu 130 135 140 Arg Lys Phe Asn Phe Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly 145 150 155 160 Leu Tyr Ala Asp Ile Met Val Trp Pro Asp Gln Val Ile Tyr Arg Ser 165 170 175 Arg Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Gln Ala Val Glu Asp 180 185 190 Ala Leu Met Ser Ala Ala Cys Thr Arg Gly Pro Phe Val Ala His Gly 195 200 205 Glu Gly Leu Val Ile Asp Pro Thr Ala Arg His Gly Val Met Glu Arg 210 215 220 Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile Asp Arg 225 230 235 240 Asn Arg Val Arg Leu Val Val Trp Asp Met Val Asp Met Asp Asp Tyr 245 250 255 Ile Ala Arg Lys Ser Lys Val Glu Tyr Tyr Ile Arg Arg Asp Asn Thr 260 265 270 Ser Phe Leu Val Ala Glu Val Asp Val Leu Glu His Phe Gln Met Val 275 280 285 Arg Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile 290 295 300 Glu Met Arg Gln Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Asp 305 310 315 320 Met Leu Trp Gly Asp Asn Lys Thr Lys Lys Gly Ile Lys Leu Lys Asn 325 330 335 Glu Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys 340 345 350 Lys Glu Gly Trp Val Gly Ala Leu Ile Cys Gln Thr Arg Asp Gly Leu 355 360 365 Leu Glu Val Gly Ala Gly Ser Gly Leu Thr Asp Ala Leu Arg Gly Lys 370 375 380 Ser Pro Asp Tyr Phe Val Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp 385 390 395 400 Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg 405 410 415 Leu Asn Tyr Lys Phe Val Glu Ile Arg Arg Asp Lys Ser Ile Ala Asn 420 425 430 Ser Leu Glu Glu Val Ile Gln Ala Ala Asp Ser Leu Leu Glu Leu Leu 435 440 445 Arg Lys Ile Ala Glu Asp Val Asp Lys 450 455 <210> 17 <211> 466 <212> PRT <213> L13Rel4 amino acid sequence with His-tag <400> 17 Met Thr Lys Ser Val Thr Glu Ile Leu Asn Glu Leu Arg Ala Thr Ser 1 5 10 15 Ser Lys Asn Glu Lys Glu Arg Ile Ile Arg Glu Asn Ala Asp His Asp 20 25 30 Gly Leu Arg Glu Ala Phe Arg Val Ala Tyr Ser Lys Glu Leu Asn Phe 35 40 45 Phe Val Arg Gly Val Lys Asn Thr Tyr Gln Asn Pro Gly Leu Arg Pro 50 55 60 Leu Ser Asp Ser Ile Asn Asp Leu Val Thr Asn Ile Ala Gly Arg Leu 65 70 75 80 Tyr Thr Gly Asp Glu Ala Lys Ser Tyr Met Gln Gln Leu Ile Gly Leu 85 90 95 Cys Glu Glu Pro Asp Thr Leu Val Ala Ile Ile Asn Arg Asp Leu Glu 100 105 110 Cys Gly Val Gln Thr Thr Ile Thr Asn Lys Val Trp Lys Asp Leu Ile 115 120 125 Thr Glu Pro Pro Tyr Gln Ser Tyr Thr Leu Phe Thr Glu Lys Leu Leu 130 135 140 Arg Lys Phe Asn Phe Lys Gly Ala Phe Ser Asp Glu Lys Met Asp Gly 145 150 155 160 Leu Tyr Ala Asp Ile Met Val Trp Pro Asp Gln Val Ile Tyr Arg Ser 165 170 175 Arg Ser Gly Lys Glu Leu Asn Phe Arg Ala Pro Gln Ala Val Glu Asp 180 185 190 Ala Leu Met Ser Ala Ala Cys Thr Arg Gly Pro Phe Val Ala His Gly 195 200 205 Glu Gly Leu Val Ile Asp Pro Thr Ala Arg His Gly Val Met Glu Arg 210 215 220 Ala Glu Gly Asn Gly Tyr Leu Asn Gln Asp Pro Glu Asp Ile Asp Arg 225 230 235 240 Asn Arg Val Arg Leu Val Val Trp Asp Met Val Asp Met Asp Asp Tyr 245 250 255 Ile Ala Arg Lys Ser Lys Val Glu Tyr Tyr Ile Arg Arg Asp Asn Thr 260 265 270 Ser Phe Leu Val Ala Glu Val Asp Val Leu Glu His Phe Gln Met Val 275 280 285 Arg Gly Arg Lys Ile Asn Ser Leu Lys Glu Ala Ile Asp His Phe Ile 290 295 300 Glu Met Arg Gln Gln Lys Lys Glu Gly Thr Val Leu Lys Glu Ala Asp 305 310 315 320 Met Leu Trp Gly Asp Asn Lys Thr Lys Lys Gly Ile Lys Leu Lys Asn 325 330 335 Glu Phe Asp Val Asp Leu Glu Val Val Ala Thr Thr Pro His Lys Lys 340 345 350 Lys Glu Gly Trp Val Gly Ala Leu Ile Cys Gln Thr Arg Asp Gly Leu 355 360 365 Leu Glu Val Gly Ala Gly Ser Gly Leu Thr Asp Ala Leu Arg Gly Lys 370 375 380 Ser Pro Asp Tyr Phe Val Gly Gln Ile Ile Thr Ile Lys Ala Asn Asp 385 390 395 400 Ile Thr Lys Ser Glu Thr Lys Glu Leu Gln Ser Leu Phe Leu Pro Arg 405 410 415 Leu Asn Tyr Lys Phe Val Glu Ile Arg Arg Asp Lys Ser Ile Ala Asn 420 425 430 Ser Leu Glu Glu Val Ile Gln Ala Ala Asp Ser Leu Leu Glu Leu Leu 435 440 445 Arg Lys Ile Ala Glu Asp Val Asp Lys Gly Ser Gly His His His His 450 455 460 His His 465 <210> 18 <211> 1371 <212> DNA <213> L13Rel4 cDNA <400> 18 atgaccaagt cagtaactga gatccttaac gagctgcgtg caacctcgtc taagaacgaa 60 aaagagcgaa tcatccgtga gaatgctgat catgacggcc tgcgtgaagc atttcgtgta 120 gcttactcga aagagttgaa cttctttgtg cgtggcgtga agaacaccta ccagaacccg 180 ggcctgcgcc ctctttcgga cagcatcaac gatctggtaa cgaacatcgc tggccgcctg 240 tacaccggcg acgaagccaa gtcgtacatg cagcagctga tcggcttgtg tgaagagcct 300 gatacgctgg tggcgatcat caaccgcgat ctggagtgtg gtgtacagac aaccatcacc 360 aacaaagtgt ggaaggacct gatcaccgag cctccgtacc agagctacac gctgttcacc 420 gagaagttgc tgcgtaagtt caacttcaag ggcgctttct ccgatgagaa aatggacggt 480 ctgtatgcag acatcatggt atggcctgat caggttatct atcgctcacg atctggtaaa 540 gagctgaact tccgtgcccc acaggcagtg gaagatgcgc tgatgtcggc ggcctgcact 600 cgaggcccat tcgtggcaca cggtgaaggt ctggttatcg atccgacagc acgtcatggt 660 gttatggaac gtgcagaggg taacggctat ctgaaccaag atcctgaaga catcgaccga 720 aaccgggtcc gacttgttgt ctgggacatg gttgacatgg acgattacat cgcccgcaag 780 tcgaaagtcg aatattacat tcgtcgtgac aacaccagct tcttggttgc agaggtggat 840 gttcttgagc atttccagat ggttcgtggt cgtaagatca acagcctgaa agaggcgatc 900 gaccacttca tcgaaatgcg acagcagaag aaggaaggga cggtactcaa agaagctgat 960 atgttgtggg gtgacaacaa gaccaagaag ggtatcaaac tgaagaatga gtttgacgtc 1020 gatctggaag ttgttgcgac gacacctcac aagaagaagg aaggttgggt gggcgctctg 1080 atctgtcaga cacgtgatgg tctgcttgag gttggtgccg gttctggatt gacagatgca 1140 ctgcgtggca agtcaccaga ctacttcgtc ggccagatca tcacgatcaa ggcgaacgac 1200 atcacgaaat ctgagacgaa agaactccag tctctgttcc tgccacgact caactacaag 1260 tttgttgaga tccgccggga caagagcatc gccaacagtc tggaagaagt tatccaagct 1320 gctgactcac tgctggaact gctgcgtaaa attgcggagg atgtggataa a 1371 <210> 19 <211> 20 <212> DNA <213> 20-mer DNA oligo <400> 19 ggccagtgaa ttcgagctcg 20 <210> 20 <211> 23 <212> RNA <213> 23-mer RNA oligo <400> 20 acugauagaa guucccgaaa cag 23 <210> 21 <211> 43 <212> DNA <213> 43-mer DNA oligo <400> 21 ctgtttcggg aacttctatc agtcgagctc gaattcactg gcc 43

Claims

분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편으로서, 상기 DNA 리가제가 SEQ ID No. 1의 아미노산 서열을 포함하거나 SEQ ID No. 1과 적어도 70%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하고, 상기 DNA 리가제가 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있는, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
제1항에 있어서, DNA 리가제가 SEQ ID No. 1과 적어도 75%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
제1항에 있어서, DNA 리가제가,
(a) SEQ ID No. 1 또는 이와 적어도 80% 동일한 아미노산 서열,
(b) SEQ ID No. 7 또는 이와 적어도 80% 동일한 아미노산 서열,
(c) SEQ ID No. 10 또는 이와 적어도 80% 동일한 아미노산 서열, 또는
(d) SEQ ID No. 16 또는 이와 적어도 80% 동일한 아미노산 서열로부터 선택된 아미노산 서열을 갖고,
상기 DNA 리가제가 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자의 존재 하에 5' 포스포릴-리보핵산 분자의 5'-말단에 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있는,
분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 DNA 리가제가 SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 7, SEQ ID No. 8, SEQ ID No. 10, SEQ ID No. 11, SEQ ID No. 16 및 SEQ ID No. 17 중 어느 하나로부터 선택된 아미노산 서열을 갖는, 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편.
제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 인코딩하거나 상기 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 단백질을 인코딩하는 재조합 핵산 분자.
제5항에 있어서, 상기 핵산 분자가 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 코돈-최적화된 서열을 포함하거나 이로 구성되는 재조합 핵산 분자.
제5항에 있어서, 상기 핵산 분자가 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18 중 어느 하나로부터 선택된 핵산 분자 또는 SEQ ID No. 3, SEQ ID No. 9, SEQ ID No. 12 및 SEQ ID No. 18의 축퇴된 버전을 포함하거나 이로 구성되는 재조합 핵산 분자.
제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편을 인코딩하는 핵산 분자를 포함하거나 제5항 내지 제7항 중 어느 한 항에 따른 핵산 분자를 포함하거나 이로 구성된 벡터로서, 상기 벡터가 재조합 발현 벡터, 클로닝 벡터, 플라스미드, 바이러스 벡터, 코스미드, 람다 파지 또는 박테리아 인공 염색체인, 벡터.
제8항에 따른 벡터를 포함하는 숙주 세포로서, 상기 세포가 효모 세포, 곤충 세포, 인간 세포주 또는 박테리아 세포인, 숙주 세포.
제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편을 포함하는 조성물.
제10항에 있어서, 조성물이 완충액을 추가로 포함하고, 바람직하게는 상기 완충액이 ATP 및 2가 양이온을 포함하고, 상기 2가 양이온이 바람직하게는 Mn²⁺ 또는 Mg²⁺인, 조성물.
제10항 또는 제11항에 있어서, 조성물이 라이게이션될 핵산 분자를 포함하는 샘플에 적용하기 위한 용액인 조성물.
제10항 내지 제12항 중 어느 한 항에 있어서, 조성물이 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 적어도 하나의 5' 포스포릴-리보핵산 분자 및 적어도 하나의 제2 상보적 데옥시리보핵산 분자를 추가로 포함하고, 상기 DNA 리가제가 라이게이션 접합부에 걸쳐 있는 적어도 하나의 상보적 데옥시리보핵산 분자의 존재 하에 적어도 하나의 5' 포스포릴-리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시킬 수 있는, 조성물.
a. 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적 단편 또는 제10항에 따른 조성물을 포함하는 제1 용기;
b. ATP 및 2가 양이온을 포함하는 라이게이션 완충액을 포함하는 제2 용기;
c. 선택적으로 5'-포스포릴-리보핵산 분자의 5' 말단에 라이게이션될 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제3 용기로서, 상기 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 상기 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 상기 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 상기 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 제3 용기; 및
d. 선택적으로, 키트를 사용하기 위한 설명서를 포함하는,
데옥시리보핵산 분자를 리보핵산 분자의 말단에 라이게이션시키기 위한 키트.
제14항에 있어서, 키트가 3'-하이드록실-리보핵산 분자의 3' 말단에 라이게이션될 적어도 하나의 제1 5'-포스포릴-데옥시리보핵산 분자, 및 적어도 하나의 제2 데옥시리보핵산 분자를 포함하는 제4 용기를 포함하며, 상기 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 상기 5' 영역이 제1 5'-포스포릴-데옥시리보핵산 분자에 상보적이고, 상기 3' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 상기 3' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 제1 5'-포스포릴-데옥시리보핵산 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 키트.
이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법으로서, 상기 방법이 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항 또는 제11항에 따른 조성물과 접촉시키는 단계를 포함하는, 방법.
이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법으로서, 상기 방법이 이중 가닥 핵산 분자에서 5'-포스포릴 리보핵산 분자의 5' 말단에 대한 3'-하이드록실-데옥시리보핵산 분자의 라이게이션을 허용하는 조건 하에 단일 가닥 파손을 포함하는 이중 가닥 핵산 분자를 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항에 따른 조성물과 접촉시키는 단계를 포함하고, 상기 3'-하이드록실-데옥시리보핵산 분자 및 5'-포스포릴 리보핵산이 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루는, 방법.
이중-가닥 핵산 분자에서 단일-가닥 파손을 라이게이션시키기 위한 방법으로서, 상기 방법이 이중 가닥 핵산 분자에서 리보핵산 분자의 3'-말단에 대한 5' 포스포릴-데옥시리보핵산 분자의 라이게이션을 허용하는 조건 하에 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자를 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항에 따른 조성물과 접촉시키는 단계를 포함하고, 상기 5' 포스포릴-데옥시리보핵산 분자 및 리보핵산 분자가 라이게이션 접합부에 걸쳐 있는 상보적 데옥시리보핵산 분자와 복합체를 이루는, 방법.
제17항 또는 제18항에 있어서, 단일 가닥 파손을 포함하는 이중-가닥 핵산 분자가 샘플에 포함되고, 상기 샘플이 ATP 및 2가 양이온, 바람직하게는 Mn²⁺ 또는 Mg²⁺를 추가로 포함하는, 방법.
시험관 내 전사의 목적을 위한 RNA 분자의 5' 말단에 프로모터 요소 및/또는 번역 인핸서 요소를 포함하는 cDNA 분자 합성에서 주형으로 작용하는 DNA 요소의 라이게이션인, 공지된 또는 공지되지 않은 서열의 RNA 분자를 포획하기 위한 RNA 5'-말단 어댑터 라이게이션을 위한 제1항 내지 제4항 중 어느 한 항에 따른 분리된 ATP-의존성 DNA 리가제 또는 이의 효소적으로 활성인 단편 또는 제10항에 따른 조성물의 용도.
리보핵산 분자의 5' 말단 및 3' 말단에 데옥시리보핵산 분자를 라이게이션시키기 위한 방법으로서, 상기 방법이,
a. 리보핵산 분자의 집단을 포함하는 샘플을 제공하는 단계로서, 상기 리보핵산 분자 중 하나 이상이 5' 포스포릴-말단 기 및 3'-하이드록실-말단 기를 포함하는, 단계;
b. 적어도 하나의 제2 데옥시리보핵산의 존재 하에 리보핵산 분자의 5' 말단에 적어도 하나의 제1 3'-하이드록실-데옥시리보핵산 분자를 라이게이션시키는 단계로서, 상기 적어도 하나의 제2 데옥시리보핵산 분자가 3' 영역 및 5' 영역을 포함하고, 상기 3' 영역이 제1 데옥시리보핵산 분자에 상보적이고, 상기 5' 영역이 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나 상기 5' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 제1 데옥시리보핵산 분자 및 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 단계; 및
c. 3' 영역 및 5' 영역을 포함하는 적어도 하나의 추가의 제2 데옥시리보핵산의 존재 하에 적어도 하나의 다른 5' 포스포릴-데옥시리보핵산 분자를 단계 b의 리보핵산 분자의 3'-말단에 라이게이션시키는 단계로서, 상기 5' 영역이 5' 포스포릴-데옥시리보핵산 분자에 상보적이고, 상기 3' 영역이 단계 b에서 공지된 서열을 포함하는 리보핵산 분자에 상보적인 서열이거나, 상기 3' 영역이 공지되지 않은 서열을 갖거나 상이한 서열을 포함하는 리보핵산 분자에 결합하기 위해 축퇴된 서열이고, 상기 5' 포스포릴-데옥시리보핵산 및 추가의 제2 데옥시리보핵산 분자가 사전 하이브리드화된 복합체 형태로 존재할 수 있는, 단계를 포함하며;
상기 단계 b 및 c의 라이게이션 반응이 제1항 내지 제3항 중 어느 한 항에 따른 ATP-의존성 리가제 또는 제9항의 조성물에 의해 촉매작용되고, 단계 b 및 c의 라이게이션 반응이 동시에 또는 순차적으로 수행되는,
방법.
제21항에 있어서, 샘플이 ATP 및 2가 양이온, 바람직하게는 Mn²⁺ 또는 Mg²⁺를 추가로 포함하는 방법.