KR20240045297A

KR20240045297A - 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체 효소

Info

Publication number: KR20240045297A
Application number: KR1020247008368A
Authority: KR
Inventors: 마지 타부가 보라-가스케; 오스카 알비조; 릴리안 자스민 밀러; 악시니야 류베노바 펫코바; 마크 허프만; 아구스티나 로드리게즈-그라닐로
Original assignee: 코덱시스, 인코포레이티드
Priority date: 2021-08-13
Filing date: 2022-08-10
Publication date: 2024-04-05
Also published as: AU2022327169A1; WO2023019178A1; IL310621A; CA3229280A1; CN117813376A

Abstract

본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법도 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.

Description

조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체 효소

본원은 2021년 8월 13일에 출원된 미국 가출원 번호 제63/232,725호에 대한 우선권을 주장하며, 이는 모든 목적을 위해 이의 전체 내용이 본원에 참조로 포함된다.

발명의 분야

본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT) 효소, NDT 활성을 갖는 폴리펩티드, 및 이들 효소를 코딩하는 폴리뉴클레오티드, 뿐만 아니라 이들 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. NDT 효소를 생산하는 방법이 또한 제공된다. 본 발명은 NDT 효소를 포함하는 조성물 및 조작된 NDT 효소를 사용하는 방법을 추가로 제공한다. 본 발명은 약제학적 화합물의 생산에 있어서 특정 용도를 발견하였다.

서열 목록, 표 또는 컴퓨터 프로그램에 대한 참조

서열 목록의 공식 사본은 "CX2-175WO1_ST26.xml"의 파일명으로, 2022년 8월 9일의 작성되고, 344킬로바이트의 크기를 갖는 XML로 명세서와 동시에 제출되었다. 서열 목록은 명세서의 일부이며 본원에 참조로 그 전체가 포함된다.

인간 면역결핍 바이러스(HIV)로 명명된 레트로바이러스는 감염된 개체의 면역 체계의 점진적인 파괴와 중추 및 말초 신경계의 퇴행을 수반하는 복합 질환인 후천성 면역 결핍 증후군(AIDS)의 병인체이다. 레트로바이러스 복제의 일반적인 특징은 바이러스 복제에 필요한 HIV 서열의 DNA 카피를 생성하기 위해 바이러스로 코딩된 역전사효소에 의한 바이러스 RNA 게놈의 역전사이다. MK-8591(Merck)과 같은 일부 화합물은 역전사 억제제로 알려져 있으며 AIDS 및 유사한 질병의 치료에서의 용도가 발견되었다. HIV 역전사효소를 억제하는 것으로 알려진 일부 화합물이 있지만, 이 효소를 억제하여 AIDS의 효과를 개선하는 데 더 효과적인 추가 화합물이 관련 기술분야에서 여전히 필요하다.

MK-8591(아래에 설명된 화합물(1))과 같은 뉴클레오시드 유사체는 DNA 합성에 사용되는 천연 뉴클레오시드와의 유사성으로 인해 HIV 역전사 효소의 효과적인 억제제이다. 역전사 효소에 의한 이들 유사체의 결합은 역전사 효소의 진행성을 억제함으로써 DNA 합성을 정지시킨다. 효소의 정지는 DNA 분자의 조기 종료를 초래하여 효과가 없게 만든다. 그러나, 표준 화학적 합성 기술을 통한 뉴클레오시드 유사체 생산은 화학적 복잡성으로 인해 어려움을 겪을 수 있다.

본 발명은 뉴클레오시드 교환에 의한 뉴클레오시드 유사체 및 관련 화합물의 합성을 위한 신규 생체촉매 및 관련 사용 방법을 제공한다. 본 개시내용의 생체촉매는 락토바실러스 루테리(Lactobacillus reuteri)로부터의 야생형 유전자의 조작된 폴리펩티드 변이체이며, 이는 서열번호: 2의 아미노산 서열(이는 N-말단 히스티딘(6개 잔기) 태그도 포함함)을 갖는 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩한다. M104A의 서열번호: 2와 비교하여 잔기 차이를 포함하는 야생형 뉴클레오시드 데옥시리보실트랜스퍼라제의 변이체(서열번호: 4)를 단백질 공학의 출발점으로 사용하였다. 이들 조작된 폴리펩티드는 알키닐 데옥시우리딘 및 관련 화합물을 유용한 항바이러스 특성을 갖는 뉴클레오시드 유사체로 전환시키는 것을 촉매할 수 있다.

본 발명은 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열 또는 이의 기능적 단편을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 상기 폴리펩티드 서열에 적어도 하나의 치환 또는 치환 세트를 포함하는 폴리펩티드를 포함하며, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4, 14, 및/또는 126을 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 가지며, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 15, 17, 18, 18/19/22/91/104, 18/19/22/ 104, 18/22/62/91/104, 19/91/104, 19/104, 20, 20/63/101/104, 20/101, 20/101/104, 20/104, 22, 22/ 62, 22/62/91/104, 22/91, 22/91/104, 22/91/108, 22/104, 22/108, 30, 50, 53, 55/133, 56, 61, 62/ 104, 72, 75, 76, 91/104, 93, 101/104, 104, 104/139, 108, 109, 114, 134, 136 및 138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨져 있다. 일부 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 가지며, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 15F, 15L, 17L, 18A/19G/22W/91M/104G, 18A/19G/22W/104G, 18G/19G/22W/91M/104G, 18G/22W/62H/91M/104G, 18S, 19G/91M/104G, 19G/104G, 20E/101G, 20E/101G/104T, 20E/101G/104V, 20E/101N/104S, 20P/104G, 20S, 20S/63G/101G/104S, 20S/101A/104T, 20S/101G/104G, 20S/101G/104S, 20S/101N/104G, 20S/104G, 20S/104S, 22W, 22W/62H, 22W/62H/91M/104G, 22W/91M, 22W/ 91M/104G, 22W/91M/108V, 22W/104G, 22W/108V, 30I, 30L, 50E, 53V, 55R/133Q, 56H, 61A, 62H/104G, 72H, 72I, 72L, 72V, 75H, 76G, 91M/104G, 93C, 101N/104T, 104G, 104S, 104S/139T, 108A, 108M, 109A, 109S, 109T, 114V, 134G, 136A, 및 138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨진다. 일부 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 가지며, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 V15F, V15L, F17L, C18A/A19G/F22W/L91M/A104G, C18A/A19G/F22W/A104G, C18G/A19G/F22W/L91M/A104G, C18G/F22W/D62H/L91M/A104G, C18S, A19G/L91M/A104G, A19G/A104G, G20E/D101G, G20E/D101G/A104T, G20E/D101G/A104V, G20E/D101N/A104S, G20P/A104G, G20S, G20S/E63G/D101G/A 104S, G20S/D101A/A104T, G20S/D101G/A104G, G20S/D101G/A104S, G20S/D101N/A104G, G20S/A104G, G20S/A104S, F22W, F22W/D62H, F22W/D62H/L91M/A104G, F22W/L91M, F22W/L91M/A104G, F22W/L91M/L108V, F22W/A104G, F22W/L108V, Y30I, Y30L, V50E, Q53V, Q55R/L133Q, Y56H, V61A, D62H/A104G, E72H, E72I, E72L, E72V, T75H, A7 6G, L91M /A104G, A93C, D101N/A104T, A104G, A104S, A104S/A139T, L108A, L108M, G109A, G109S, G109T, L114V, M134G, W136A, 및 I138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 4와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 4와 적어도 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.

일부 실시양태에서, 본 발명은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성인 폴리펩티드 서열을 갖는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22/75/108, 22/108, 22/108/109, 50/61, 50/75, 53/108/109, 61, 61/108/109, 75/108, 75/108/114, 108, 108/109, 및 108/138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 실시양태에서, 본 발명은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성인 폴리펩티드 서열을 갖는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22W/75H/108M, 22W/108M, 22W/108M/109A, 22W/108M/109S, 50E/61A, 50E/75H, 53V/108M/109S, 61A, 61A/108M/109S, 75H/108M, 75H/108M/114V, 108M, 108M/109T, 및 108M/138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 실시양태에서, 본 발명은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성인 폴리펩티드 서열을 갖는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 F22W, F22W/T75H, F22W/T75H/L108M, F22W/A76G, F22W/L108M, F22W/L108M/G109A, F22W/L108M/G109S, F22W/L108M/G109T, F22W/G109A, V50E/T75H, Q53H/I138H, Q53V/L108M/G109S, Q53V/L108M/G109T, Q53V/L108M/I138H, V61A, V61A/A76G, V61A/L108M/G109S, T75H/L108M, T75H/L108M/I138H, L108M, L108M/G109T, L108M/I138H, 및 I138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨져 있다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.

일부 추가의 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하고, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22/108/109, 31/76, 50/75, 61/108/109, 75, 108, 108/109, 및 108/138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하고, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 22W/108M/109S, 31D/76G, 50E/75H, 61A/108M/109S, 75H, 108M, 108M/109T, 및 108M/138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하고, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 F22W/L108M/G109S, E31D/A76G, V50E/T75H, V61A/L108M/G109S, T75H, L108M, L108M/G109T, 및 L108M/I138H로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 14와 적어도 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.

일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 12/35/61/69, 12/35/61/157, 20, 20/50/149, 20/149/157, 28/39/61, 28/61, 35, 35/39/61에서 선택된 순서 /149/157, 35/50/149/157, 35/69, 35/157, 39/50, 39/61, 39/61/149, 39/69/149/157, 39/149, 39/157 , 50/61/149, 61/69, 61/69/149, 61/69/157, 61/157, 69/149/157, 149, 및 149/157로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 12T/35C/61A/69T, 12T/35C/61A/157T, 20N, 20N/50F/149D, 20N/149D/157T, 28R/39C/61A, 28R/61A, 35C, 35C/39C/61A/149S/157T, 35C/50F/149D/157T, 35C/69T, 35C/157T, 39C/50F, 39C/61A, 39C/61A/149D, 39C/69T/149D/157T, 39C/149S, 39C/157T, 50F/61A/149S, 61A/69I, 61A/69L, 61A/69L/149D, 61A/69M, 61A/69T, 61A/69T/157T, 61A/157T, 69T/149D/157T, 149D, 및 149D/157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 S12T/N35C/V61A/Q69T, S12T/N35C/V61A/S157T, E20N, E20N/V50F/P149D, E20N/P149D/S157T, K28R/A39C/V61A, K28R/V61A, N35C, N35C/A39C/V61A/P149S/S157T, N35C/V50F/P149D/S157T, N35C/Q69T, N35C/S157T, A39C/V50F, A39C/V61A, A39C/V61A/P149D, A39C/Q69T/P149D/S157T, A39C/P149S, A39C/S157T, V50F/V61A/P149S, V61A/Q69I, V61A/Q69L, V61A/Q69L/P149D, V61A/Q69M, V61A/Q69T, V61A/Q69T/S157T, V61A/S157T, Q69T/P149D/S157T, P149D, 및 P149D/S157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.

일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 20/50/149 및 39/157로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 20N/50F/149D 및 39C/157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 추가의 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드는 E20N/V50F/P149D 및 A39C/S157T로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하며, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨진다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다. 일부 실시양태에서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 126과 적어도 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열을 포함한다.

일부 추가의 실시양태에서, 본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 표 5-1, 6-1, 6-2, 7-1, 및/또는 7-2에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상 동일한 폴리펩티드 서열을 포함한다.

일부 추가의 실시양태에서, 본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열식별번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함한다. 일부 추가의 실시양태에서, 본 발명은 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열식별번호: 4, 14, 및/또는 126에 제시된 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체를 포함한다.

본 발명은 또한 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 서열번호: 6-214의 짝수 번호에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일한 폴리펩티드 서열을 포함한다.

본 발명은 추가로 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 제공하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 야생형 락토바실러스 루테리 뉴클레오시드 데옥시리보실트랜스퍼라제에 비해 적어도 하나의 개선된 특성을 포함한다. 일부 실시양태에서, 개선된 특성은 기질에 대한 개선된 활성을 포함한다. 일부 추가 실시양태에서, 기질은 화합물(2) 및/또는 화합물(3)을 포함한다. 일부 추가 실시양태에서, 개선된 특성은 화합물(1)의 개선된 생산을 포함한다. 일부 추가 실시양태에서, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 정제된다. 본 발명은 또한 본원에 제공된 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 적어도 하나 포함하는 조성물을 제공한다.

본 발명은 또한 본원에 제공된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열을 제공한다. 일부 실시양태에서, 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함하며, 여기서 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리뉴클레오티드 서열은 하나 이상의 위치에 적어도 하나의 치환을 포함한다. 일부 추가의 실시양태에서, 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열은 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리뉴클레오티드 서열을 포함한다. 또 다른 일부 추가 실시양태에서, 폴리뉴클레오티드 서열은 제어 서열에 작동가능하게 연결된다. 일부 추가 실시양태에서, 폴리뉴클레오티드 서열은 코돈 최적화된다. 일부 추가 실시양태에서, 폴리뉴클레오티드 서열은 서열번호: 5-213의 홀수 번호에 있는 폴리뉴클레오티드 서열을 포함한다.

본 발명은 또한 본원에 제공된 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 발현 벡터를 제공한다. 본 발명은 본원에 제공된 적어도 하나의 발현 벡터를 포함하는 숙주 세포를 추가로 제공한다. 일부 실시양태에서, 본 발명은 본원에 제공된 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 숙주 세포를 제공한다.

본 발명은 또한 숙주 세포에서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 생산하는 방법을 제공하는데, 이 방법은 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 생산되기에 적합한 조건 하에서 본원에 제공된 숙주 세포를 배양하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 배양물 및/또는 숙주 세포로부터 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 회수하는 단계를 추가로 포함한다. 일부 추가 실시양태에서, 상기 방법은 상기 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 정제하는 단계를 추가로 포함한다.

다르게 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 일반적으로, 본원에 사용된 명명법과 아래에 기술된 세포 배양, 분자 유전학, 미생물학, 유기 화학, 분석 화학 및 핵산 화학의 실험실 절차는 관련 기술분야에 잘 알려져 있고 일반적으로 사용되는 것들이다. 이러한 기술은 잘 알려져 있으며, 관련 기술분야의 기술자에게 잘 알려진 수많은 텍스트 및 참고 논문에 설명되어 있다. 화학 합성 및 화학 분석에서의 표준 기술 또는 이의 변형이 사용된다. 본원의 위 및 아래에 언급된 모든 특허, 특허 출원, 논문 및 간행물은 참조로 본원에 명시적으로 포함된다.

본원에 기술된 것과 유사하거나 등가인 임의의 적합한 방법 및 재료가 본 발명의 실시에 사용되지만, 일부 방법 및 재료가 본원에 기술되어 있다. 본 발명은 설명된 특정 방법론, 프로토콜 및 시약에 제한되지 않는 것으로 이해되어야 하며, 이는 관련 기술분야의 통상의 기술자가 사용하는 상황에 따라 달라질 수 있기 때문이다. 따라서, 바로 아래에 정의된 용어들은 본 발명 전체를 참조하여 더욱 완전하게 설명된다.

전술한 일반적인 설명과 다음의 상세한 설명은 단지 예시적이고 설명하기 위한 것이며 본 발명을 제한하지 않음이 이해되어야 한다. 여기에 사용된 섹션 제목은 구성 목적으로만 사용되며 설명된 주제를 제한하는 것으로 해석되어서는 안된다. 숫자 범위에는 범위를 정의하는 숫자가 포함된다. 따라서, 본원에 개시된 모든 수치 범위는 그러한 더 좁은 수치 범위가 본원에 모두 명시적으로 기재된 것처럼 더 넓은 수치 범위 내에 속하는 모든 더 좁은 수치 범위를 포괄하도록 의도된다. 또한, 본원에 개시된 모든 최대(또는 최소) 수치 제한은 그러한 더 낮은(또는 더 높은) 수치 제한이 본원에 명시적으로 기록된 것처럼 모든 더 낮은(또는 더 높은) 수치 제한을 포함하도록 의도된다.

약어 및 정의

유전적으로 코딩된 아미노산에 사용되는 약어는 통상적이며 다음과 같다: 알라닌(Ala 또는 A), 아르기닌(Arg 또는 R), 아스파라긴(Asn 또는 N), 아스파르테이트(Asp 또는 D), 시스테인(Cys) 또는 C), 글루타메이트(Glu 또는 E), 글루타민(Gln 또는 Q), 히스티딘(His 또는 H), 이소류신(Ile 또는 I), 류신(Leu 또는 L), 라이신(Lys 또는 K), 메티오닌(Met 또는 M), 페닐알라닌(Phe 또는 F), 프롤린(Pro 또는 P), 세린(Ser 또는 S), 트레오닌(Thr 또는 T), 트립토판(Trp 또는 W), 티로신(Tyr 또는 Y), 및 발린(Val 또는 V).

3글자 약어가 사용되는 경우, "L" 또는 "D"가 특별히 앞에 없거나 약어가 사용되는 문맥에서 명확하지 않는 한, 아미노산은 α-탄소(Cα)에 대해 L- 또는 D-배위 일 수 있다. 예를 들어, "Ala"는 α-탄소에 대한 배위를 지정하지 않고 알라닌을 지정하는 반면, "D-Ala" 및 "L-Ala"는 각각 D-알라닌 및 L-알라닌을 지정한다. 한 글자 약어가 사용되는 경우, 대문자는 α-탄소에 대한 L-배위의 아미노산을 나타내고 소문자는 α-탄소에 대한 D-배위의 아미노산을 나타낸다. 예를 들어, "A"는 L-알라닌을 나타내고 "a"는 D-알라닌을 나타낸다. 폴리펩티드 서열이 한 글자 또는 세 글자 약어(또는 이들의 혼합물)의 문자열로 제시되는 경우, 서열은 일반적인 관례에 따라 아미노(N)에서 카르복시(C) 방향으로 제시된다.

유전적으로 코딩하는 뉴클레오시드에 사용되는 약어는 통상적이며 다음과 같다: 아데노신(A); 구아노신(G); 시티딘(C); 티미딘(T); 및 우리딘(U). 상세하게 기술되지 않는 한, 약칭된 뉴클레오시드는 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드일 수 있다. 뉴클레오시드는 개별 기준으로 또는 집합 기준으로 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드로 지정될 수 있다. 핵산 서열이 한 글자 약어의 문자열로 표시되는 경우, 일반적인 관례에 따라 서열이 5'에서 3' 방향으로 표시되고, 포스페이트는 표시되지 않는다.

본 발명과 관련하여, 본원의 설명에 사용된 기술 및 과학 용어는 달리 구체적으로 정의되지 않는 한, 관련 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 의미를 가질 것이다. 따라서, 다음의 용어들은 다음과 같은 의미를 갖도록 의도된다.

본원에 사용된 바와 같이, 단수형 "a", "an" 및 "the"는 문맥상 달리 명확하게 나타내지 않는 한 복수형을 포함한다. 따라서, 예를 들어 "폴리펩티드"에 대한 언급은 하나 이상의 폴리펩티드를 포함한다.

유사하게, "포함하다", "포함한다", "포함하는", "포함한다" 및 "포함하는"은 상호교환 가능하며 제한하려는 의도가 아니다. 따라서, 본원에 사용된 용어 "포함하는" 및 그 동족어는 포괄적인 의미로 사용된다(즉, "포함하는"이라는 용어 및 이의 상응하는 동족어와 대등함).

다양한 실시양태의 설명이 "포함하는"이라는 용어를 사용하는 경우, 관련 기술분야의 통상의 기술자는 일부 특정한 경우에 실시예가 "본질적으로 구성되는" 또는 "로 구성되는"이라는 언어를 사용하여 대안적으로 설명될 수 있음을 이해할 것임이 추가로 이해되어야 한다.

본원에 사용된 용어 "약"은 특정 값에 대해 허용 가능한 오차를 의미한다. 일부 경우에 "약"은 주어진 값 범위의 0.05%, 0.5%, 1.0%, 또는 2.0% 이내를 의미한다. 일부 경우에, "약"은 주어진 값의 1, 2, 3 또는 4 표준 편차 이내를 의미한다.

본원에 사용된 바와 같이, "EC" 번호는 국제 생화학 및 분자생물학 연맹(NC-IUBMB) 명명법 위원회의 효소 명명법을 의미한다. IUBMB 생화학적 분류는 효소가 촉매하는 화학 반응을 기반으로 한 효소의 수치적 분류 시스템이다.

본원에 사용된 바와 같이, "ATCC"는 생물저장소 컬렉션이 유전자 및 균주를 포함하는 American Type Culture Collection을 의미한다.

본원에 사용된 바와 같이, "NCBI"는 미국 국립생물정보센터(National Center for Biological Information) 및 여기에 제공된 서열 데이터베이스를 의미한다.

본원에 사용된 바와 같이, 본원에서 "뉴클레오시드 데옥시리보실트랜스퍼라제 변이체", "뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드" 및 "NDT"와 상호교환적으로 사용되는 "뉴클레오시드 데옥시리보실트랜스퍼라제"("NDT") 효소는 유리 퓨린 또는 피리미딘 염기(또는 염기 유사체) 및 2'-데옥시리보뉴클레오시드의 퓨린 또는 피리미딘 염기(또는 염기 유사체) 사이의 가역적 뉴클레오시드 교환을 촉매하는 효소이다. 한 가지 비제한적인 예는 알키닐-데옥시우리딘(화합물(2))과 2-플루오로-아데닌(화합물(3))의 NDT 촉매된 뉴클레오시드 교환에 의한 화합물(1)의 알키닐 데옥시아데노신 생성물의 합성이다. 본원에 사용된 바와 같이, "뉴클레오시드 데옥시리보실트랜스퍼라제"는 자연 발생 효소와 조작된 효소를 모두 포함할 수 있다.

"단백질", "폴리펩티드" 및 "펩티드"는 길이 또는 번역 후 변형(예를 들어 글리코실화 또는 인산화)에 관계없이, 아미드 결합에 의해 공유결합 연결된 적어도 2개의 아미노산의 중합체를 나타내기 위해 본원에서 상호교환적으로 사용된다. 이 정의에는 D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물뿐만 아니라, D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물을 포함하는 중합체가 포함된다.

"아미노산"은 일반적으로 알려진 3문자 기호 또는 IUPAC-IUB 생화학 명명법 위원회에서 권장하는 1문자 기호로 본원에서 지칭된다. 마찬가지로 뉴클레오티드도 이들의 일반적으로 허용되는 단일 문자 코드로 지칭될 수 있다.

본원에 사용된 바와 같이, "친수성 아미노산 또는 잔기"는 Eisenberg 등(문헌: Eisenberg et al., J. Mol. Biol., 179:125-142 [1984])의 정규화된 공통 소수성 척도에 따라서 제로(0)보다 작은 소수성을 나타내는 측쇄를 갖는 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 친수성 아미노산에는 L-Thr(T), L- Ser(S), L-His(H), L-Glu(E), L-Asn(N), L-Gln(Q), L-Asp(D), L-Lys(K) 및 L-Arg(R)이 포함된다.

본원에 사용된 바와 같이, "산성 아미노산 또는 잔기"는 아미노산이 펩티드 또는 폴리펩티드에 포함될 때 약 6 미만의 pKa 값을 나타내는 측쇄를 갖는 친수성 아미노산 또는 잔기를 지칭한다. 산성 아미노산은 일반적으로 수소 이온의 손실로 인해 생리학적 pH에서 음으로 하전된 측쇄를 갖는다. 유전적으로 코딩된 산성 아미노산에는 L-Glu(E) 및 L-Asp(D)가 포함된다.

본원에 사용된 바와 같이, "염기성 아미노산 또는 잔기"는 아미노산이 펩티드 또는 폴리펩티드에 포함될 때 약 6 초과의 pKa 값을 나타내는 측쇄를 갖는 친수성 아미노산 또는 잔기를 지칭한다. 염기성 아미노산은 일반적으로 하이드로늄 이온과의 회합으로 인해 생리학적 pH에서 양으로 하전된 측쇄를 갖는다. 유전적으로 코딩된 염기성 아미노산에는 L-Arg(R) 및 L-Lys(K)가 포함된다.

본원에 사용된 바와 같이, "극성 아미노산 또는 잔기"는 생리학적 pH에서는 전하가 없지만, 2개의 원자에 의해 함께 공유되는 전자쌍이 2개의 원자 중 하나에 의해 더 밀접하게 유지되는 결합을 적어도 하나 갖는 측쇄를 갖는 친수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 극성 아미노산에는 L-Asn(N), L-Gln(Q), L-Ser(S) 및 L-Thr(T)가 포함된다.

본원에 사용된 바와 같이, "소수성 아미노산 또는 잔기"는 Eisenberg 등(문헌: Eisenberg et al., J. Mol. Biol., 179:125-142 [1984])의 정규화된 공통 소수성 척도에 따라서 제로(0)보다 큰 소수성을 나타내는 측쇄를 갖는 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 소수성 아미노산에는 L-Pro(P), L-Ile(I), L-Phe(F), L-Val(V), L-Leu(L), L-Trp(W), L-Met(M), L-Ala(A) 및 L-Tyr(Y)가 포함된다.

본원에 사용된 바와 같이, "방향족 아미노산 또는 잔기"는 적어도 하나의 방향족 또는 헤테로방향족 고리를 포함하는 측쇄를 갖는 친수성 또는 소수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 방향족 아미노산에는 L-Phe(F), L-Tyr(Y) 및 L-Trp(W)가 포함된다. 헤테로방향족 질소 원자의 pKa로 인해 L-His(H)가 때때로 염기성 잔기로 분류되거나 측쇄가 헤테로방향족 고리를 포함하므로 방향족 잔기로 분류되지만, 본원에서 히스티딘은 친수성 잔기 또는 "구속된 잔기"(아래 참조)로 분류된다.

본원에 사용된 바와 같이, "구속된 아미노산 또는 잔기"는 구속된 기하학적 구조를 갖는 아미노산 또는 잔기를 지칭한다. 여기서, 구속된 잔기에는 L-Pro(P) 및 L-His(H)가 포함된다. 히스티딘은 상대적으로 작은 이미다졸 고리를 갖고 있기 때문에 구속된 기하학적 구조를 가지고 있다. 프롤린은 5원 고리를 갖고 있기 때문에 구속된 기하학적 구조를 가지고 있다.

본원에 사용된 바와 같이, "비극성 아미노산 또는 잔기"는 생리학적 pH에서 전하를 띠지 않고 두 원자가 공유하는 전자쌍이 일반적으로 두 원자 각각에 의해 동일하게 유지되는 결합을 갖는 측쇄(즉, 측쇄는 극성이 아님)를 갖는 소수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 비극성 아미노산에는 L-Gly(G), L-Leu(L), L-Val(V), L-Ile(I), L-Met(M) 및 L-Ala(A)가 포함된다.

본원에 사용된 바와 같이, "지방족 아미노산 또는 잔기"는 지방족 탄화수소 측쇄를 갖는 소수성 아미노산 또는 잔기를 지칭한다. 유전적으로 코딩된 지방족 아미노산에는 L-Ala(A), L-Val(V), L-Leu(L) 및 L-Ile(I)이 포함된다. 시스테인(또는 "L-Cys" 또는 "[C]")은 다른 L-Cys(C) 아미노산 또는 다른 술파닐- 또는 술프히드릴-함유 아미노산과 이황화 가교를 형성할 수 있다는 점에서 특이한 것으로 알려져 있다. "시스테인 유사 잔기"에는 시스테인 및 이황화 가교 형성에 사용할 수 있는 술프히드릴 잔기를 함유하는 기타 아미노산이 포함된다. L Cys(C)(및 -SH 함유 측쇄를 갖는 기타 아미노산)의 환원된 유리 -SH 또는 산화된 이황화 가교 형태로 펩티드에 존재하는 능력은 L-Cys(C)가 펩티드에 순 소수성 또는 친수성 특성에 기여하는지 여부에 영향을 준다. L-Cys(C)는 Eisenberg의 정규화된 공통 척도(Eisenberg et al., 1984, 상기 참조)에 따라 0.29의 소수성을 나타내지만, 본 개시내용의 목적을 위해 L-Cys(C)는 자신만의 고유 그룹으로 분류되는 것으로 이해되어야 한다.

본원에 사용된 바와 같이, "작은 아미노산 또는 잔기"는 총 3개 이하의 탄소 및/또는 헤테로원자( 탄소 및 수소 제외)로 구성된 측쇄를 갖는 아미노산 또는 잔기를 지칭한다. 작은 아미노산 또는 잔기는 위의 정의에 따라 지방족, 비극성, 극성 또는 산성의 작은 아미노산 또는 잔기로 추가로 분류될 수 있다. 유전적으로 코딩된 작은 아미노산에는 L-Ala(A), L-Val(V), L-Cys(C), L-Asn(N), L-Ser(S), L-Thr(T) 및 L-Asp(D)가 포함된다.

본원에 사용된 바와 같이, "히드록실 함유 아미노산 또는 잔기"는 히드록실(-OH) 부분을 함유하는 아미노산을 지칭한다. 유전적으로 코딩된 히드록실 함유 아미노산에는 L-Ser(S), L-Thr(T) 및 L-Tyr(Y)가 포함된다.

본원에 사용된 바와 같이, "폴리뉴클레오티드" 및 "핵산"은 함께 공유적으로 연결된 2개 이상의 뉴클레오티드를 지칭한다. 폴리뉴클레오티드는 전체적으로 리보뉴클레오티드(즉, RNA)로 구성되거나, 전체적으로 2' 데옥시리보뉴클레오티드(즉, DNA)로 구성되거나, 리보- 및 2' 데옥시리보뉴클레오티드의 혼합물로 구성될 수 있다. 뉴클레오시드는 일반적으로 표준 포스포디에스테르 연결을 통해 함께 연결되지만, 폴리뉴클레오티드는 하나 이상의 비표준 연결을 포함할 수 있다. 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있거나, 단일 가닥 영역과 이중 가닥 영역을 모두 포함할 수 있다. 더욱이, 폴리뉴클레오티드는 전형적으로 자연 발생 코딩 핵염기(즉, 아데닌, 구아닌, 우라실, 티민 및 시토신)로 구성되지만, 이는 예를 들어 이노신과 같은 하나 이상의 변형 및/또는 합성 핵염기, 예컨대, 예를 들어 이노신, 잔틴, 하이포잔틴 등을 포함할 수 있다. 일부 실시양태에서, 이러한 변형 또는 합성 핵염기는 아미노산 서열을 코딩하는 핵염기이다.

본원에 사용된 바와 같이, "뉴클레오시드"는 핵염기(즉, 질소성 염기), 및 5-탄당(예: 리보스 또는 데옥시리보스)을 포함하는 글리코실아민을 지칭한다. 뉴클레오시드의 비제한적인 예에는 시티딘, 우리딘, 아데노신, 구아노신, 티미딘 및 이노신이 포함된다. 대조적으로, 용어 "뉴클레오티드"는 핵염기, 5-탄당, 및 하나 이상의 인산염기를 포함하는 글리코실아민을 지칭한다. 일부 실시양태에서, 뉴클레오시드는 키나제에 의해 인산화되어 뉴클레오티드를 생성할 수 있다.

본원에 사용된 바와 같이, "뉴클레오시드 디포스페이트"는 핵염기(즉, 질소성 염기), 5-탄당(예를 들어, 리보스 또는 데옥시리보스) 및 디포스페이트(즉, 피로포스페이트) 모이어티를 포함하는 글리코실아민을 지칭한다. 본원의 일부 실시양태에서, "뉴클레오시드 디포스페이트"는 "NDP"로 약칭된다. 뉴클레오시드 디포스페이트의 비제한적인 예에는 시티딘 디포스페이트(CDP), 우리딘 디포스페이트(UDP), 아데노신 디포스페이트(ADP), 구아노신 디포스페이트(GDP), 티미딘 디포스페이트(TDP), 및 이노신 디포스페이트(IDP)가 포함된다. "뉴클레오시드" 및 "뉴클레오티드"라는 용어는 일부 상황에서는 상호교환적으로 사용될 수 있다.

본원에 사용된 바와 같이, "코딩 서열"은 단백질의 아미노산 서열을 코딩하는 핵산(예를 들어, 유전자)의 부분을 지칭한다.

본원에 사용된 바와 같이, "생체촉매", "생체촉매적", "생체내변환" 및 "생합성"은 유기 화합물에 대한 화학 반응을 수행하기 위한 효소의 사용을 지칭한다.

본원에 사용된 바와 같이, "야생형" 및 "자연 발생형"은 자연에서 발견되는 형태를 지칭한다. 예를 들어, 야생형 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연의 공급원으로부터 단리될 수 있고 인간 조작에 의해 의도적으로 변형되지 않은 유기체에 존재하는 서열이다.

본원에 사용된 바와 같이, 세포, 핵산, 또는 폴리펩티드와 관련하여 사용될 때 "재조합", "조작된", "변이체", 및 "비-천연 발생"은 자연에 존재하지 않는 방식으로 변형된 물질의 자연적 또는 본래의 형태의 물질, 또는 이에 상응하는 물질을 지칭하다. 일부 실시양태에서, 세포, 핵산 또는 폴리펩티드는 자연 발생 세포, 핵산 또는 폴리펩티드와 동일하지만, 합성 물질로부터 및/또는 재조합 기술을 사용한 조작에 의해 생산되거나 유래된다. 비제한적 예에는 무엇보다도 세포의 본래(비재조합) 형태 내에서 발견되지 않는 유전자를 발현하는 재조합 세포 또는 다른 수준에서 달리 발현되는 본래의 유전자를 발현하는 재조합 세포가 포함된다.

용어 "서열 동일성 퍼센트(%)"는 폴리뉴클레오티드 또는 폴리펩티드 사이의 비교를 지칭하기 위해 본원에서 사용되며, 비교 창을 통해 최적으로 정렬된 2개의 서열을 비교함으로써 결정되고, 여기서 비교창의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 두 서열의 최적 정렬을 위해 기준 서열과 비교하여 첨가 또는 결실(즉, 갭)를 포함할 수 있다. 백분율은 일치하는 위치의 수를 산출하기 위해 두 서열 모두에서 동일한 핵산 염기 또는 아미노산 잔기가 발생하는 위치의 수를 결정하고, 일치하는 위치의 수를 비교 창 내의 위치의 총 수로 나누어 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산할 수 있다. 대안적으로, 동일한 핵산 염기 또는 아미노산 잔기가 두 서열 모두에서 발생하거나 핵산 염기 또는 아미노산 잔기가 갭으로 정렬되어 일치하는 위치의 수를 산출하는 위치의 수를 결정하고, 일치하는 위치 수를 비교 창의 전체 위치 수로 나누어 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 백분율을 계산할 수 있다. 관련 기술분야의 기술자는 2개의 서열을 정렬하는데 이용 가능한 다수의 확립된 알고리즘이 있음을 알고 있다. 비교를 위한 서열의 최적 정렬은 Smith 및 Waterman의 국소 상동성 알고리즘(Smith and Waterman, Adv. Appl. Math., 2:482 [1981]), Needleman 및 Wunsch의 상동성 정렬 알고리즘(Needleman and Wunsch, J. Mol. Biol., 48:443 [1970]), Pearson 및 Lipman의 유사성 방법 검색(Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]), 이러한 알고리즘의 컴퓨터화된 구현(예를 들어, GCG 위스콘신 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA)에 의해, 또는 관련 기술분야에 알려진 육안 검사를 포함하지만 이에 제한되지 않는 임의의 적합한 방법에 의해 수행될 수 있다. 서열 동일성 및 서열 유사성 백분율을 결정하는데 적합한 알고리즘의 예는 Altschul 등에 의해 기술된 BLAST 및 BLAST 2.0 알고리즘(각각 Altschul et al., J. Mol. Biol., 215: 403-410 [1990]; 및 Altschul et al., Nucl. Acids Res., 3389-3402 [1977])을 포함하지만 이에 제한되지 않는다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터 웹사이트를 통해 공개적으로 제공된다. 이 알고리즘은 먼저 쿼리 서열에서 길이 W의 짧은 단어를 식별하여 높은 점수의 서열 쌍(HSP)을 식별하는 작업을 포함하며, 이는 데이터베이스 서열에서 동일한 길이의 단어와 정렬될 때 일부 양수 임계값 점수 T와 일치하거나 이를 만족시킨다. T는 이웃 단어 점수 임계값으로 지칭된다(상기 Altschul 등, 참조). 이러한 초기 이웃 단어 적중은 이를 포함하는 더 긴 HSP를 찾기 위한 검색을 시작하기 위한 시드 역할을 한다. 그런 다음 단어 적중은 누적 정렬 점수가 증가할 수 있는 한 각 서열을 따라 양방향으로 확장된다. 누적 점수는 뉴클레오티드 서열의 경우 매개변수 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 >0) 및 N(일치하지 않는 잔기에 대한 페널티 점수; 항상 <0)을 사용하여 계산된다. 아미노산 서열의 경우, 점수 매트릭스를 사용하여 누적 점수를 계산한다. 다음과 같은 경우 각 방향의 단어 적중 확장이 중단된다: 누적 정렬 점수가 최대 달성 값에서 수량 X만큼 떨어질 때; 하나 이상의 음의 점수 잔기 정렬의 누적으로 인해 누적 점수가 0 이하가 될 때; 또는 두 서열 중 하나의 끝에 도달했을 때. BLAST 알고리즘 매개변수 W, T, 및 X는 정렬의 민감도와 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 기본값으로 단어 길이(W) 11, 기대치(E) 10, M=5, N=-4, 및 두 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 기본값으로 단어 길이(W) 3, 기대값(E) 10, 및 BLOSUM62 점수 매트릭스(Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915[1989] 참조)를 사용한다. 서열 정렬 및 % 서열 동일성의 예시적인 결정은 제공된 기본 매개변수를 사용하여 GCG 위스콘신 소프트웨어 패키지(Accelrys, Madison WI)의 BESTFIT 또는 GAP 프로그램을 사용할 수 있다.

본원에 사용된 바와 같이, "기준 서열"은 서열 및/또는 활성 비교를 위한 기초로 사용되는 정의된 서열을 지칭한다. 기준 서열은 더 큰 서열의 하위세트, 예를 들어 전장 유전자 또는 폴리펩티드 서열의 절편일 수 있다. 일반적으로, 기준 서열은 길이가 적어도 20개의 뉴클레오티드 또는 아미노산 잔기, 길이가 적어도 25개의 잔기, 길이가 적어도 50개의 잔기, 길이가 적어도 100개의 잔기 또는 전체 길이의 핵산 또는 폴리펩티드이다. 2개의 폴리뉴클레오티드 또는 폴리펩티드는 각각 (1) 2개의 서열 간에 유사한 서열(즉, 완전한 서열의 일부)을 포함할 수 있고, (2) 2개의 서열 간에 분기되는 서열을 추가로 포함할 수 있으므로, 2개(또는 그 이상) 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 비교는 전형적으로 서열 유사성의 국소 영역을 확인하고 비교하기 위해 "비교 창"을 통해 2개의 폴리뉴클레오티드 또는 폴리펩티드의 서열을 비교함으로써 수행된다. 일부 실시양태에서, "기준 서열"은 1차 아미노산 서열에 기초할 수 있으며, 여기서 기준 서열은 1차 서열에 하나 이상의 변화를 가질 수 있는 서열이다.

본원에 사용된 바와 같이, "비교 창"은 적어도 약 20개의 연속 뉴클레오티드 위치 또는 아미노산 잔기의 개념적 절편을 지칭하며, 여기서 서열은 적어도 20개의 연속 뉴클레오티드 또는 아미노산의 기준 서열과 비교될 수 있으며 비교 창의 서열 부분은 두 서열의 최적 정렬을 위해 기준 서열(첨가 또는 결실을 포함하지 않음)과 비교하여 20% 이하의 첨가 또는 결실(즉, 갭)를 포함할 수 있다. 비교 창은 20개의 연속 잔기보다 길 수 있으며, 선택적으로 30, 40, 50, 100개 또는 더 긴 창을 포함한다.

본원에 사용된 바와 같이, 주어진 아미노산 또는 폴리뉴클레오티드 서열의 번호매김과 관련하여 사용된 "에 대응하는", "에 대한 참조" 및 "에 상대적인"은 주어진 아미노산 또는 폴리뉴클레오티드 서열이 기준 서열과 비교될 때 특정 기준 서열의 잔기의 번호매김을 지칭한다. 즉, 주어진 중합체의 잔기 번호 또는 잔기 위치는 주어진 아미노산 또는 폴리뉴클레오티드 서열 내의 잔기의 실제 수치적 위치보다는 기준 서열과 관련하여 지정된다. 예를 들어, 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 것과 같은 주어진 아미노산 서열은 두 서열 사이의 잔기 일치를 최적화하기 위해 갭을 도입함으로써 기준 서열에 정렬될 수 있다. 이러한 경우, 갭이 존재하더라도 주어진 아미노산 또는 폴리뉴클레오티드 서열의 잔기 번호매김은 정렬된 기준 서열을 기준으로 이루어진다

본원에 사용된 바와 같이, "실질적 동일성"은 적어도 20개 잔기 위치의 비교 창, 빈번하게는 적어도 30 내지 50개 잔기의 창에 걸쳐 기준 서열과 비교하여, 적어도 80% 서열 동일성, 적어도 85% 동일성, 적어도 89 내지 95% 서열 동일성, 또는 보다 일반적으로 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭하며, 여기서 서열 동일성 백분율은 기준 서열을 비교 창에 걸쳐 기준 서열의 총 20% 이하인 결실 또는 첨가를 포함하는 서열과 비교함으로써 계산된다. 폴리펩티드에 적용되는 일부 특정 실시양태에서, 용어 "실질적 동일성"은 기본값 갭 가중치를 사용하는 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬될 때 2개의 폴리펩티드 서열이 적어도 80%, 바람직하게는 적어도 89%의 서열 동일성, 적어도 95% 서열 동일성 또는 그 이상(예를 들어, 99% 서열 동일성)을 공유한다는 것을 의미한다. 일부 실시양태에서, 비교되는 서열에서 동일하지 않은 잔기 위치는 보존적 아미노산 치환과 다르다.

본원에 사용된 바와 같이, "아미노산 차이" 및 "잔기 차이"는 기준 서열의 상응하는 위치에 있는 아미노산 잔기와 비교하여 폴리펩티드 서열의 위치에 있는 아미노산 잔기의 차이를 지칭한다. 어떤 경우에는, 기준 서열에 N 말단 히스티딘 태그가 있고, 번호 매기기에는 N 말단 히스티딘 잔기가 포함된다. 아미노산 차이의 위치는 일반적으로 본원에서 "Xn"으로 지칭되며, 여기서 n은 잔기 차이의 기초가 되는 기준 서열의 상응하는 위치를 나타낸다. 예를 들어, "서열번호: 4와 비교하여 위치 X93의 잔기 차이"는 서열번호: 4의 위치 93에 상응하는 폴리펩티드 위치의 아미노산 잔기의 차이를 지칭한다. 따라서, 서열번호: 4의 기준 폴리펩티드가 위치 93에 세린을 갖는 경우, "서열번호: 4와 비교하여 위치 X93의 잔기 차이"는 서열번호: 4의 위치 93에 상응하는 폴리펩티드의 위치에서 세린 이외의 임의의 잔기의 아미노산 치환을 지칭한다. 본원의 대부분의 경우, 특정 위치의 특정 아미노산 잔기 차이는 "XnY"로 표시되며, 여기서 "Xn"은 위에서 설명한 대로 해당 위치를 지정하고, "Y"는 조작된 폴리펩티드에서 발견된 아미노산의 단일 문자 식별자이다(즉, 참조 폴리펩티드와 다른 잔기). 일부 경우(예를 들어, 실시예에 제시된 표에서), 본 발명은 또한 통상적인 표기법 "AnB"로 표시되는 특정 아미노산 차이를 제공하며, 여기서 A는 기준 서열에서 잔기의 단일 문자 식별자이고, "n"은 기준 서열의 잔기 위치 번호이며, B는 조작된 폴리펩티드 서열의 잔기 치환에 대한 단일 문자 식별자이다. 일부 예에서, 본 발명의 폴리펩티드는 기준 서열과 비교하여 하나 이상의 아미노산 잔기 차이를 포함할 수 있으며, 이는 기준 서열과 비교하여 잔기 차이가 존재하는 특정 위치의 목록으로 표시된다. 하나 이상의 아미노산이 폴리펩티드의 특정 잔기 위치에 사용될 수 있는 일부 실시양태에서, 사용될 수 있는 다양한 아미노산 잔기는 "/"로 구분된다(예를 들어, X307H/X307P 또는 X307H/P). 슬래시는 또한 주어진 변종 내의 다중 치환을 나타내는 데 사용될 수 있다(즉, 조합 변종과 같이 주어진 서열에 하나 이상의 치환이 존재함). 일부 실시양태에서, 본 발명은 보존적 또는 비보존적 아미노산 치환을 포함하는 하나 이상의 아미노산 차이를 포함하는 조작된 폴리펩티드 서열을 포함한다. 일부 추가의 실시양태에서, 본 발명은 보존적 및 비보존적 아미노산 치환을 둘 다 포함하는 조작된 폴리펩티드 서열을 제공한다.

본원에 사용된 바와 같이, "보존적 아미노산 치환"은 잔기를 유사한 측쇄를 갖는 다른 잔기로 치환하는 것을 지칭하며, 따라서 일반적으로 폴리펩티드 내 아미노산을 동일하거나 유사한 부류로 정의된 아미노산으로 치환하는 것을 포함한다. 예로서 제한 없이, 일부 실시양태에서, 지방족 측쇄를 갖는 아미노산은 또 다른 지방족 아미노산(예를 들어, 알라닌, 발린, 류신, 및 이소류신)으로 치환되고; 히드록실 측쇄를 갖는 아미노산은 히드록실 측쇄를 갖는 또 다른 아미노산(예를 들어, 세린 및 트레오닌)으로 치환되며; 방향족 측쇄를 갖는 아미노산이 방향족 측쇄를 갖는 다른 아미노산(예를 들어, 페닐알라닌, 티로신, 트립토판, 및 히스티딘)으로 치환되고; 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 또 다른 아미노산(예를 들어, 라이신 및 아르기닌)으로 치환되며; 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 또 다른 아미노산(예를 들어, 아스파르트산 또는 글루탐산)으로 치환되고/되거나; 소수성 또는 친수성 아미노산은 각각 다른 소수성 또는 친수성 아미노산으로 대체된다.

본원에 사용된 바와 같이, "비보존적 치환"은 폴리펩티드 내의 아미노산이 측쇄 특성이 상당히 다른 아미노산으로 치환되는 것을 지칭한다. 비보존적 치환은 정의된 그룹 내보다는 정의된 그룹 사이의 아미노산을 사용할 수 있으며 (a) 치환 영역의 펩티드 백본 구조(예: 글리신의 경우 프롤린) (b) 전하 또는 소수성, 또는 (c) 측쇄의 대부분에 영향을 준다. 예를 들어 제한 없이, 예시적인 비보존적 치환은 산성 아미노산을 염기성 또는 지방족 아미노산으로; 방향족 아미노산을 작은 아미노산으로; 그리고 친수성 아미노산을 소수성 아미노산으로 치환하는 것일 수 있다.

본원에 사용된 바와 같이, "결실"은 기준 폴리펩티드로부터 하나 이상의 아미노산을 제거함으로써 폴리펩티드에 대한 변형을 지칭한다. 결실은 효소 활성을 유지하고/하거나 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 효소의 향상된 특성을 유지하면서 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산, 기준 효소를 구성하는 아미노산 총 수의 최대 10%, 아미노산 총 수의 최대 20% 제거를 포함할 수 있다. 결실은 폴리펩티드의 내부 부분 및/또는 말단 부분으로 지시될 수 있다. 다양한 실시양태에서, 결실은 연속적인 절편을 포함할 수 있거나 불연속적일 수 있다. 결실은 일반적으로 아미노산 서열에서 "-"로 표시된다.

본원에 사용된 바와 같이, "삽입"은 참조 폴리펩티드에 하나 이상의 아미노산을 첨가함으로써 폴리펩티드에 대한 변형을 지칭한다. 삽입은 폴리펩티드의 내부 부분에 있을 수도 있거나, 카르복시 또는 아미노 말단에 있을 수도 있다. 본원에 사용된 바와 같은 삽입에는 관련 기술분야에 공지된 융합 단백질이 포함된다. 삽입은 아미노산의 연속적인 절편일 수 있거나 자연 발생 폴리펩티드 내 하나 이상의 아미노산에 의해 분리될 수 있다.

용어 "아미노산 치환 세트" 또는 "치환 세트"는 기준 서열과 비교하여 폴리펩티드 서열의 아미노산 치환 그룹을 지칭한다. 치환 세트는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 아미노산 치환을 가질 수 있다. 일부 실시양태에서, 치환 세트는 실시예에 제공된 표에 나열된 임의의 변이 뉴클레오시드 데옥시리보실트랜스퍼라제에 존재하는 아미노산 치환 세트를 지칭한다.

"기능적 단편" 및 "생물학적 활성 단편"은 아미노-말단 및/또는 카르복시-말단 결실(들) 및/또는 내부 결실을 갖지만 나머지 아미노산 서열은 비교되는 서열(예를 들어, 본 발명의 전장 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제)의 상응하는 위치와 동일하고 전장 폴리펩티드의 활성을 실질적으로 모두 유지하는 폴리펩티드를 지칭하기 위해 상호교환적으로 사용된다.

본원에 사용된 바와 같이, "단리된 폴리펩티드"는 자연적으로 동반되는 다른 오염물(예를 들어, 단백질, 지질 및 폴리뉴클레오티드)로부터 실질적으로 분리된 폴리펩티드를 지칭한다. 이 용어는 자연 발생 환경 또는 발현 시스템(예: 숙주 세포 내에서 또는 시험관 내 합성을 통해)에서 제거되거나 정제된 폴리펩티드를 포함한다. 재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드는 세포 내에 존재할 수도 있고, 세포 배지에 존재할 수도 있거나, 용해물 또는 단리된 제제와 같은 다양한 형태로 제조될 수도 있다. 따라서, 일부 실시양태에서, 재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드는 단리된 폴리펩티드일 수 있다.

본원에 사용된 바와 같이, "실질적으로 순수한 폴리펩티드" 또는 "정제된 단백질"은 폴리펩티드 종이 존재하는 우세한 종인 조성물을 지칭하며(즉, 몰 또는 중량 기준으로 이는 조성물에서 임의의 다른 개별 거대분자 종보다 더 풍부하다), 이는 일반적으로 대상 종이 몰 또는 중량%로 존재하는 거대분자 종의 적어도 약 50%를 차지하는 경우 실질적으로 정제된 조성물이다. 그러나, 일부 실시양태에서, 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함하는 조성물은 50% 미만(예를 들어, 약 10%, 약 20%, 약 30%, 약 40%, 또는 약 50%)으로 순수한 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함한다. 일반적으로, 실질적으로 순수한 뉴클레오시드 데옥시리보실트랜스퍼라제 조성물은 조성물에 존재하는 모든 거대분자 종의 몰 또는 중량%로 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 및 약 98% 이상을 포함한다. 일부 실시양태에서, 대상 종은 본질적인 균질성으로 정제되며(즉, 오염 종은 기존의 검출 방법에 의해 조성물에서 검출될 수 없음). 여기서 조성물은 본질적으로 단일 거대분자 종으로 구성된다. 용매 종, 소분자(<500 달톤), 및 원소 이온 종은 거대분자 종으로 간주되지 않는다. 일부 실시양태에서, 단리된 재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.

본원에 사용된 바와 같이, "개선된 효소 특성"은 효소의 적어도 하나의 개선된 특성을 지칭한다. 일부 실시양태에서, 본 발명은 기준 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드 및/또는 야생형 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드, 및/또는 또 다른 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드와 비교하여 임의의 효소 특성의 개선을 나타내는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 제공한다. 따라서, "개선" 수준을 결정하고 야생형, 뿐만 아니라 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함한, 다양한 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드간에 비교를 할 수 있다. 개선된 특성에는 단백질 발현 증가, 열활성 증가, 열안정성 증가, pH 활성 증가, 안정성 증가, 효소 활성 증가, 기질 특이성 또는 친화성 증가, 특이적 활성 증가, 기질 또는 최종-생성물 억제에 대한 내성 증가, 화학적 안정성 증가, 화학선택성 개선, 용매 안정성 개선, 산성 pH에 대한 내성 증가, 단백질 분해 활성에 대한 내성 증가(즉, 단백질 분해에 대한 민감성 감소), 응집 감소, 용해도 증가, 및 온도 프로파일 변경과 같은 특성이 포함되지만 이에 제한되지 않는다. 추가의 실시양태에서, 상기 용어는 뉴클레오시드 데옥시리보실트랜스퍼라제 효소의 적어도 하나의 개선된 특성과 관련하여 사용된다. 일부 실시양태에서, 본 발명은 기준 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드 및/또는 야생형 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드, 및/또는 또 다른 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드와 비교하여 임의의 효소 특성의 개선을 나타내는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 제공한다. 따라서, "개선" 수준을 결정하고 야생형, 뿐만 아니라 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함한, 다양한 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드간에 비교를 할 수 있다.

본원에 사용된 바와 같이, "증가된 효소 활성" 및 "향상된 촉매 활성"은 조작된 폴리펩티드의 개선된 특성을 지칭하며, 이는 특이적 활성(예를 들어 생산된 생성물/시간/중량 단백질) 또는 기준 효소와 비교하여 기질의 생성물로의 전환율(예: 특정 양의 효소를 사용하여 특정 기간 동안 기질의 출발량에서 생성물로의 전환율)에서의 증가로 표시될 수 있다. 일부 실시양태에서, 상기 용어는 기준 뉴클레오시드 데옥시리보실트랜스퍼라제 효소와 비교하여 특이적 활성(예를 들어, 생산된 생성물/시간/중량 단백질)의 증가 또는 기질의 생성물로의 전환율(%)(예를 들어, 특정 양의 뉴클레오시드 데옥시리보실트랜스퍼라제를 사용하여 특정 기간 동안 기질의 시작 양을 생성물로 전환시키는 백분률)의 증가로 나타낼 수 있는, 본원에 제공된 조작된 p 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드의 개선된 특성을 지칭한다. 일부 실시양태에서, 상기 용어는 본원에 제공된 개선된 뉴클레오시드 데옥시리보실트랜스퍼라제 효소와 관련하여 사용된다. 본 발명의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 효소 활성을 결정하는 예시적인 방법이 실시예에 제공되어 있다. K _m , V _max 또는 k _cat 의 고전적인 효소 특성을 포함하여 효소 활성과 관련된 모든 특성이 영향을 받을 수 있으며, 이러한 변화로 인해 효소 활성이 증가할 수 있다. 예를 들어, 효소 활성의 개선은 자연 발생 뉴클레오시드 데옥시리보실트랜스퍼라제 또는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드가 유래된 또 다른 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제보다 상응하는 야생형 효소의 효소 활성의 약 1.1배에서부터 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배, 150배, 200배 또는 그 이상의 효소 활성까지 될 수 있다.

본원에 사용된 바와 같이, "전환"은 기질(들)의 상응하는 생성물(들)로의 효소적 전환(또는 생체내변환)을 지칭한다. "전환율(%)"은 특정 조건 하에서 일정 기간 내에 생성물로 전환되는 기질의 비율을 나타낸다. 따라서, 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드의 "효소 활성" 또는 "활성"은 특정 기간 동안 기질에서 생성물로의 "전환율(%)"로 표현될 수 있다.

"일반성 특성"(또는 "일반성 효소")을 갖는 효소는 부모 서열과 비교하여 광범위한 기질에 대해 개선된 활성을 나타내는 효소를 지칭한다. 일반성 효소는 가능한 모든 기질에 대해 향상된 활성을 반드시 나타내는 것은 아니다. 일부 실시양태에서, 본 발명은 광범위한 입체적 및 전자적으로 다양한 기질에 대해 부모 유전자에 비해 유사하거나 향상된 활성을 입증한다는 점에서 일반성을 갖는 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체를 제공한다. 또한, 본원에 제공된 일반성 효소는 대사산물/생성물의 생산을 증가시키기 위해 광범위한 다양한 분자에 걸쳐 개선되도록 조작되었다.

용어 "엄격한 하이브리드화 조건"은 핵산 하이브리드가 안정한 조건을 지칭하기 위해 본원에서 사용된다. 관련 기술분야의 기술자에게 공지된 바와 같이, 하이브리드의 안정성은 하이브리드의 용융 온도(T _m )에 반영된다. 일반적으로 하이브리드의 안정성은 이온 강도, 온도, G/C 함량, 및 카오트로픽제의 존재 여부에 따라 달라진다. 폴리뉴클레오티드의 T _m 값은 용융 온도를 예측하기 위한 공지된 방법을 사용하여 계산할 수 있다(예를 들어, 문헌: Baldino et al., Meth. Enzymol., 168:761-777 [1989]; Bolton et al., Proc. Natl. Acad. Sci. USA 48:1390 [1962]; Bresslauer et al., Proc. Natl. Acad. Sci. USA 83:8893-8897 [1986]; Freier et al., Proc. Natl. Acad. Sci. USA 83:9373- 9377 [1986]; Kierzek et al., Biochem., 25:7840-7846 [1986]; Rychlik et al., Nucl. Acids Res., 18:6409-6412 [1990] (erratum, Nucl. Acids Res., 19:698 [1991]); Sambrook et al., supra); Suggs et al., 1981, in Developmental Biology Using Purified Genes, Brown et al. [eds.], pp. 683-693, Academic Press, Cambridge, MA [1981]; 및 Wetmur, Crit. Rev. Biochem. Mol. Biol. 26:227-259 [1991] 참조). 일부 실시양태에서, 폴리뉴클레오타이드는 본원에 개시된 폴리펩티드를 코딩하고 정의된 조건, 예컨대 적당히 엄격한 조건 또는 매우 엄격한 조건 하에서 본 발명의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 효소를 코딩하는 서열의 상보체에 하이브리화된다.

본원에 사용된 바와 같이, "하이브리화 엄격성"은 핵산의 하이브리드화에서 세척 조건과 같은 하이브리드화 조건에 관한 것이다. 일반적으로 하이브리드화 반응은 낮은 엄격도 조건에서 수행된 후 다양하지만 더 높은 엄격도의 세척이 수행된다. "중간 정도 엄격한 하이브리드화"라는 용어는 표적 DNA가 표적 DNA에 대해 약 60% 동일성, 바람직하게는 약 75% 동일성, 약 85% 동일성, 표적-폴리뉴클레오티드에 대해 약 90% 초과 동일성을 갖는 상보적 핵산에 결합하도록 허용하는 조건을 지칭한다. 예시적인 적당히 엄격한 조건은 42℃에서 50% 포름아미드, 5×Denhart 용액, 5×SSPE, 0.2% SDS에서의 하이브리드화에 이어, 42℃에서 0.2×SSPE, 0.2% SDS로 세척하는 것과 대등한 조건이다. "높은 엄격성 하이브리드화"는 일반적으로 정의된 폴리뉴클레오티드 서열에 대한 용액 조건 하에서 결정된 열 용융 온도 T _m 으로부터 약 10℃이하인 조건을 지칭한다. 일부 실시양태에서, 높은 엄격성 조건은 65℃의 0.018M NaCl에서 안정한 하이브리드를 형성하는 핵산 서열만의 하이브리드화를 허용하는 조건을 지칭한다(즉, 하이브리드가 65℃의 0.018M NaCl에서 안정하지 않은 경우, 본원에서 고려되는 바와 같이, 높은 엄격도 조건 하에서는 안정하지 않을 것이다). 높은 엄격성 조건은 예를 들어 42℃에서 50% 포름아미드, 5× Denhart 용액, 5×SSPE, 0.2% SDS와 대등한 조건에서 하이브리드화한 후, 0.1×SSPE, 및 65℃에서 0.1% SDS로 세척하여 제공될 수 있다. 또 다른 높은 엄격성 조건은 65℃에서 0.1%(w/v) SDS를 함유한 5X SSC에서 하이브리드화하고 65℃에서 0.1% SDS를 함유한 0.1x SSC에서 세척하는 것과 대등한 조건에서 하이브리드화하는 것이다. 다른 매우 엄격한 하이브리드화 조건은 물론 중간 정도의 엄격한 조건도 위에 인용된 참조 문헌에 설명되어 있다.

본원에 사용된 바와 같이, "코돈 최적화"는 코딩된 단백질이 관심 유기체에서 효율적으로 발현되도록 특정 유기체에서 우선적으로 사용되는 코돈에 대한 단백질을 코딩하는 폴리뉴클레오티드의 코돈의 변화를 지칭한다. 대부분의 아미노산이 "동의어" 또는 "동의적" 코돈이라고 불리는 여러 코돈으로 표시된다는 점에서 유전자 코드가 퇴화되었지만, 특정 유기체에 의한 코돈 사용은 무작위가 아니며 특정 코돈 삼중항에 편향되어 있다는 것은 잘 알려져 있다. 이러한 코돈 사용률 편향은 주어진 유전자, 공통 기능 또는 조상 기원의 유전자, 고도로 발현된 단백질 대 낮은 카피수 단백질, 유기체 게놈의 응집체 단백질 코딩 영역과 관련하여 더 높을 수 있다. 일부 실시양태에서, 뉴클레오시드 데옥시리보실트랜스퍼라제 효소를 코딩하는 폴리뉴클레오타이드는 발현을 위해 선택된 숙주 유기체에서의 최적 생산을 위해 코돈 최적화될 수 있다.

본원에 사용된 바와 같이, "바람직한", "최적" 및 "높은 코돈 사용률 편향" 코돈은 단독으로 또는 조합하여 사용될 때 동일한 아미노산을 코딩하는 다른 코돈보다 단백질 코딩 영역에서 더 높은 빈도로 사용되는 코돈에 대해 상호교환적으로 지칭한다. 바람직한 코돈은 단일 유전자에서의 코돈 사용빈도, 공통 기능 또는 기원의 유전자 세트, 고도로 발현된 유전자, 전체 유기체의 응집체 단백질 코딩 영역에서의 코돈 빈도, 관련 유기체의 응집체 단백질에서의 코돈 빈도, 또는 이의 조합과 관련하여 결정될 수 있다. 유전자 발현 수준에 따라 빈도가 증가하는 코돈은 일반적으로 발현에 최적인 코돈이다. 예를 들어 군집 분석 또는 대응 분석(예를 들어, 문헌: GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, Peden, University of Nottingham; McInerney, Bioinform., 14:372-73 [1998]; Stenico et al., Nucl. Acids Res., 222437-46 [1994]; 및 Wright, Gene 87:23-29 [1990] 참조)을 사용하는 다변량 분석을 포함하여, 특정 유기체에서 코돈 빈도(예: 코돈 사용률, 상대 동의어 코돈 사용) 및 코돈 선호도, 및 유전자에 사용되는 코돈의 유효 수를 결정하기 위한 다양한 방법이 알려져 있다. 코돈 사용률 표는 다양한 유기체에 대해 이용 가능하다(예를 들어, 문헌: Wada et al., Nucl. Acids Res., 20:2111-2118 [1992]; Nakamura et al., Nucl. Acids Res., 28:292 [2000]; Duret, et al., 상기; Henaut and Danchin, in Escherichia coli and Salmonella , Neidhardt, et al.(eds.), ASM Press, Washington D.C., p. 2047-2066 [1996] 참조). 코돈 사용률를 얻기 위한 데이터 소스는 단백질을 코딩할 수 있는 임의의 이용 가능한 뉴클레오티드 서열에 의존할 수 있다. 이러한 데이터 세트에는 실제로 발현된 단백질을 코딩하는 것으로 알려진 핵산 서열(예: 완전한 단백질 코딩 서열-CDS), 발현된 서열 태그(ESTS), 또는 게놈 서열의 예측된 코딩 영역이 포함된다(예를 들어, 문헌: Mount, Bioinformatics: Sequence and Genome Analysis, Chapter 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. [2001]; Uberbacher, Meth. Enzymol., 266:259-281 [1996]; 및 Tiwari et al., Comput. Appl. Biosci., 13: 263-270 [1997] 참조).

본원에 사용된 바와 같이, "제어 서열"은 본 발명의 폴리뉴클레오티드 및/또는 폴리펩티드의 발현에 필요하거나 유리한 모든 성분을 포함한다. 각각의 제어 서열은 폴리펩티드를 코딩하는 핵산 서열에 대해 고유하거나 외래일 수 있다. 이러한 제어 서열에는 리더, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터 서열, 신호 펩티드 서열, 개시 서열 및 전사 종결자가 포함되나 이에 제한되지 않는다. 최소한, 제어 서열에는 프로모터와 전사 및 번역 정지 신호가 포함된다. 제어 서열에는 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 제어 서열의 연결을 촉진하는 특정 제한 부위를 도입할 목적으로 링커가 제공될 수 있다.

"작동가능하게 연결된"은 제어 서열이 관심 폴리뉴클레오티드에 대한 위치에 적절하게 배치되어(즉, 기능적 관계로) 제어 서열이 관심 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 지시하거나 조절하도록 하는 구성으로 본원에서 정의된다.

"프로모터 서열"은 코딩 서열과 같은 관심 폴리뉴클레오티드의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열을 지칭한다. 프로모터 서열은 관심 폴리뉴클레오티드의 발현을 매개하는 전사 제어 서열을 함유한다. 프로모터는 돌연변이체, 절단형 및 하이브리드 프로모터를 포함하여 선택된 숙주 세포에서 전사 활성을 나타내는 임의의 핵산 서열일 수 있고, 숙주 세포에 동종 또는 이종인 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 얻어질 수 있다.

"적절한 반응 조건"이라는 어구는 본 발명의 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드가 기질을 원하는 생성물 화합물로 전환시킬 수 있는, 효소 전환 반응 용액에서의 조건(예를 들어, 효소 부하량, 기질 부하량, 온도, pH, 완충제, 공용매 등의 범위)을 지칭한다. 일부 예시적인 "적절한 반응 조건"이 본원에 제공된다.

본원에 사용된 바와 같은, "화합물 부하량" 또는 "효소 부하량"과 같은 "부하량"은 반응 시작 시 반응 혼합물 중 성분의 농도 또는 양을 지칭한다.

본원에 사용된 바와 같이, 효소 전환 반응 과정의 맥락에서 "기질"은 본원에 제공된 조작된 효소(예를 들어 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드)에 의해 작용받는 화합물 또는 분자를 지칭한다.

본원에 사용된 바와 같이, 반응으로부터 생성물(예를 들어, 데옥시리보스 포스페이트 유사체)의 수율 "증가"는 반응 동안 존재하는 특정 성분(예를 들어, 뉴클레오시드 데옥시리보실트랜스퍼라제 효소)이 동일한 기질과 다른 치환기를 사용하여 동일한 조건에서 수행되지만 관심 있는 성분이 없는 반응과 비교하여 더 많은 생성물을 생산하게 할 때 발생한다.

반응을 촉매하는 데 참여하는 다른 효소와 비교하여 특정 효소의 양이 약 2%, 약 1%, 또는 약 0.1%(중량/중량) 미만인 경우 반응은 특정 효소가 "실질적으로 없다"고 한다.

본원에 사용된 바와 같이, 액체(예를 들어, 배양 브로쓰)를 "분별"한다는 것은 분리 공정(예를 들어, 염 침전, 컬럼 크로마토그래피, 크기 배제, 및 여과) 또는 이러한 공정의 조합을 적용하여 원하는 단백질이 초기 액체 제품보다 용액에서 총 단백질의 더 큰 비율을 차지하는 용액을 제공하는 것을 의미한다.

본원에 사용된 바와 같이, "출발 조성물"은 적어도 하나의 기질을 포함하는 임의의 조성물을 지칭한다. 일부 실시양태에서, 출발 조성물은 임의의 적합한 기질을 포함한다.

본원에 사용된 바와 같이, 효소 전환 공정의 맥락에서 "생성물"은 기질에 대한 효소 폴리펩티드의 작용으로부터 생성되는 화합물 또는 분자를 지칭한다.

본원에 사용된 바와 같이, 본원에서 사용되는 바와 같은 "평형화"는 화학 또는 효소 반응의 순방향 속도 상수와 역방향 속도 상수에 의해 결정되는 바와 같이, 입체이성질체의 상호전환을 포함하여 화학 또는 효소 반응(예를 들어 두 종 A 및 B의 상호전환)에서 화학종의 정상 상태 농도를 초래하는 공정을 지칭한다.

본원에 사용된 바와 같이, "알킬"은 직쇄 또는 분지형의, 탄소 원자 1 내지 18개, 보다 바람직하게는 탄소 원자 1 내지 8개, 가장 바람직하게는 탄소 원자 1 내지 6개의 포화 탄화수소 기를 지칭한다. 특정 수의 탄소 원자를 갖는 알킬은 괄호 안에 표시된다(예: (C1-C4)알킬은 탄소 원자 1 내지 4개의 알킬을 나타냄).

본원에 사용된 바와 같이, "알케닐"은 적어도 하나의 이중 결합을 함유하지만 선택적으로 하나 이상의 이중 결합을 함유하는 직쇄 또는 분지형 탄소 원자 2 내지 12개의 기를 지칭한다.

본원에 사용된 바와 같이, "알키닐"은 적어도 하나의 삼중 결합을 함유하지만 선택적으로 하나 이상의 삼중결합을 함유하고, 추가로 선택적으로 하나 이상의 이중 결합된 모이어티를 함유하는 직쇄 또는 분지형의 2 내지 12개 탄소 원자의 기를 지칭한다.

본원에 사용된 바와 같이, "헤테로알킬, "헤테로알케닐", 및 헤테로알키닐"은 하나 이상의 탄소 원자가 각각 독립적으로 동일하거나 다른 헤테로원자 또는 헤테로원자 기로 대체된 본원에 정의된 알킬, 알케닐 및 알키닐을 지칭한다. 탄소 원자를 대체할 수 있는 헤테로원자 및/또는 헤테로원자 기에는 이들의 조합을 포함하여, -O-, -S-, -S-O-, -NRα-, -PH-, -S(O)-, -S(O)2-, -S(O)NRα-, -S(O)2NRα- 등이 포함되지만 이에 제한되지 않으며, 여기서 각 Rα는 독립적으로 수소, 알킬, 헤테로알킬, 사이클로알킬, 헤테로사이클로알킬, 아릴, 및 헤테로아릴 중에서 선택된다.

본원에 사용된 바와 같이, "알콕시"는 -ORβ기를 지칭하며 여기서, Rβ는 본원에 정의된 선택적으로 치환된 알킬기를 포함하며 알킬기는 상기 정의된 바와 같다.

본원에 사용된 바와 같이, "아릴"은 단일 고리(예를 들어, 페닐) 또는 다중 축합 고리(예를 들어, 나프틸 또는 안트릴)를 갖는 6 내지 12개의 탄소 원자의 불포화 방향족 카르보사이클릭기를 지칭한다. 예시적인 아릴에는 페닐, 피리딜, 나프틸 등이 포함된다.

본원에 사용된 바와 같이, "아미노"는 -NH2기를 지칭한다. 치환된 아미노는 -NHRδ, NRδRδ 및 NRδRδRδ기를 지칭하며, 여기서 각 Rδ는 치환되거나 비치환된 알킬, 사이클로알킬, 사이클로헤테로알킬, 알콕시, 아릴, 헤테로아릴, 헤테로아릴알킬, 아실, 알콕시카르보닐, 술파닐, 술피닐, 술포닐 등으로부터 독립적으로 선택된다. 전형적인 아미노기에는 디메틸아미노, 디에틸아미노, 트리메틸암모늄, 트리에틸암모늄, 메틸술포닐아미노, 푸라닐-옥시-술프아미노 등이 포함되지만 이에 제한되지 않는다.

본원에 사용된 바와 같이, "옥소"는 =O를 지칭한다.

본원에 사용된 바와 같이, "옥시"는 에테르 및 에스테르를 포함하여, 다양한 옥시기를 형성하기 위해 다양한 치환기를 가질 수 있는 2가 기 -O-를 지칭한다.

본원에 사용된 바와 같이, "카르복시"는 -COOH를 지칭한다.

본원에 사용된 바와 같이, "카르보닐"은 산, 산 할로겐화물, 알데히드, 아미드, 에스테르 및 케톤을 포함하여 다양한 카르보닐기를 형성하기 위해 다양한 치환기를 가질 수 있는 -C(O)-를 지칭한다.

본원에 사용된 바와 같이, "알킬옥시카르보닐"은 -C(O)ORε를 지칭하며, 여기서 Rε는 선택적으로 치환될 수 있는 본원에 정의된 바와 같은 알킬기이다.

본원에 사용된 바와 같이, "아미노카르보닐"은 -C(O)NH2를 지칭한다. 치환된 아미노카르보닐은 -C(O)NRδRδ를 지칭하며, 여기서 아미노기 NRδRδ는 본원에 정의된 바와 같다.

본원에 사용된 바와 같이, "할로겐" 및 "할로"는 플루오로, 클로로, 브로모 및 요오도를 지칭한다.

본원에 사용된 바와 같이, "히드록시"는 -OH를 지칭한다.

본원에 사용된 바와 같이, "시아노"는 -CN을 지칭한다.

본원에 사용된 바와 같이, "헤테로아릴"은 고리 내에 탄소 원자 1 내지 10개 및 산소, 질소 및 황으로부터 선택된 헤테로원자 1 내지 4개의 방향족 헤테로사이클릭기를 지칭한다. 이러한 헤테로아릴기는 단일 고리(예: 피리딜 또는 푸릴) 또는 다중 축합 고리(예: 인돌리지닐 또는 벤조티에닐)를 가질 수 있다.

본원에 사용된 바와 같이, "헤테로아릴알킬"은 헤테로아릴로 치환된 알킬(즉, 헤테로아릴-알킬-기)을 지칭하며, 알킬 모이어티에서 1 내지 6개의 탄소 원자를 갖고, 헤에토아릴 모이어티에서 5 내지 12개의 고리 원자를 갖는 것이 바람직하다. 이러한 헤테로아릴알킬기의 예로는 피리딜메틸 등이 있다.

본원에 사용된 바와 같이, "헤테로아릴알케닐"은 헤테로아릴로 치환된 알케닐(즉, 헤테로아릴-알케닐-기)을 지칭하며, 알케닐 모이어티에 2 내지 6개의 탄소 원자 및 헤테로아릴 모이어티에 5 내지 12개의 고리 원자를 갖는 것이 바람직하다.

본원에 사용된 바와 같은, "헤테로아릴알키닐"은 헤테로아릴로 치환된 알키닐(즉, 헤테로아릴-알키닐-기)을 지칭하며, 알키닐 모이어티에 2 내지 6개의 탄소 원자 및 헤테로아릴 모이어티에 5 내지 12개의 고리 원자를 갖는 것이 바람직하다.

본원에 사용된 바와 같이, "헤테로사이클", "헤테로사이클릭", 및 상호교환적으로 "헤테로사이클로알킬"은 단일 고리 또는 다중 축합 고리를 가지며, 2 내지 10개의 탄소 고리 원자 및 고리 내에 질소, 황 또는 산소로부터 선택된 헤테로 고리 원자를 1 내지 4개 갖는 포화 또는 불포화기를 지칭한다. 이러한 헤테로사이클릭기는 단일 고리(예를 들어, 피페리디닐 또는 테트라히드로푸릴) 또는 다중 축합 고리(예를 들어, 인돌리닐, 디히드로벤조푸란 또는 퀴누클리디닐)를 가질 수 있다. 헤테로사이클의 예에는 푸란, 티오펜, 티아졸, 옥사졸, 피롤, 이미다졸, 피라졸, 피리딘, 피라진, 피리미딘, 피리다진, 인돌리진, 이소인돌, 인돌, 인다졸, 퓨린, 퀴놀리진, 이소퀴놀린, 퀴놀린, 프탈라진, 나프틸피리딘, 퀴녹살린, 퀴나졸린, 신놀린, 프테리딘, 카르바졸, 카르볼린, 페난트리딘, 아크리딘, 페난트롤린, 이소티아졸, 페나진, 이속사졸, 페녹사진, 페노티아진, 이미다졸리딘, 이미다졸린, 피페리딘, 피페라진, 피롤리딘, 인돌린 등이 포함되지만 이에 제한되지 않는다.

본원에 사용된 바와 같이, "~원 고리"는 임의의 사이클릭 구조를 포함하는 것을 의미한다. "~원"이라는 용어 앞의 숫자는 고리를 구성하는 골격 원자의 수를 나타낸다. 따라서, 예를 들어 사이클로헥실, 피리딘, 피란 및 티오피란은 6원 고리이고 사이클로펜틸, 피롤, 푸란 및 티오펜은 5원 고리이다.

달리 명시하지 않는 한, 상기 기에서 수소가 차지하는 위치는 히드록시, 옥소, 니트로, 메톡시, 에톡시, 알콕시, 치환된 알콕시, 트리플루오로메톡시, 할로알콕시, 플루오로, 클로로, 브로모, 요오도, 할로, 메틸, 에틸, 프로필, 부틸, 알킬, 알케닐, 알키닐, 치환된 알킬, 트리플루오로메틸, 할로알킬, 히드록시알킬, 알콕시알킬, 티오, 알킬티오, 아실, 카르복시, 알콕시카르보닐, 카르복스아미도, 치환된 카르복스아미도, 알킬술포닐, 알킬술피닐, 알킬술포닐아미노, 술폰아미도, 치환된 술폰아미도, 시아노, 아미노, 치환된 아미노, 알킬아미노, 디알킬아미노, 아미노알킬, 아실아미노, 아미디노, 아미독시모, 히드록사모일, 페닐, 아릴, 치환된 아릴, 아릴옥시, 아릴알킬, 아릴알케닐, 아릴알키닐, 피리딜, 이미다졸릴, 헤테로아릴, 치환된 헤테로아릴, 헤테로아릴옥시, 헤테로아릴알킬, 헤테로아릴알케닐, 헤테로아릴알키닐, 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 치환된 사이클로알킬, 사이클로알킬옥시, 피롤리디닐, 피페리디닐, 모르폴리노, 헤테로사이클, (헤테로사이클)옥시 및 (헤테로사이클)알킬로 예시되지만, 이들로 제한되지 않는 치환기로 추가로 치환될 수 있으며; 바람직한 헤테로원자는 산소, 질소 및 황이다. 이러한 치환기에 개방 원자가가 존재하는 경우 이들은 알킬, 사이클로알킬, 아릴, 헤테로아릴 및/또는 헤테로사이클기로 추가로 치환될 수 있고, 이러한 개방 원자가가 탄소에 존재하는 경우 할로겐 및 산소-, 질소-, 또는 황-결합된 치환기에 의해 추가로 치환될 수 있으며, 이러한 개방 원자가가 여러 개 존재하는 경우, 이러한 그룹은 결합을 직접 형성하거나 새로운 헤테로원자, 바람직하게는 산소, 질소, 또는 황에 대한 결합을 형성함으로써 연결되어 고리를 형성할 수 있는 것으로 이해된다. 수소를 치환기로 대체하는 것이 본 발명의 분자에 허용될 수 없는 불안정성을 도입하지 않고 달리 화학적으로 타당하다면 상기 치환이 이루어질 수 있다는 것이 추가로 이해된다.

본원에 사용된 바와 같이, 용어 "배양"은 임의의 적합한 조건(예를 들어, 액체, 겔 또는 고체 배지 사용) 하에서 미생물 세포 집단을 성장시키는 것을 지칭한다.

재조합 폴리펩티드는 관련 기술분야에 공지된 임의의 적합한 방법을 사용하여 생산될 수 있다. 관심 있는 야생형 폴리펩티드를 코딩하는 유전자는 플라스미드와 같은 벡터에서 클로닝될 수 있고, 이. 콜리 등과 같은 원하는 숙주에서 발현될 수 있다. 재조합 폴리펩티드의 변이체는 관련 기술분야에 공지된 다양한 방법에 의해 생성될 수 있다. 실제로, 관련 기술분야의 기술자에게 잘 알려진 다양한 돌연변이 유발 기술이 존재한다. 또한, 돌연변이 유발 키트는 많은 상업용 분자생물학 공급업체에서도 구입할 수 있다. 정의된 아미노산의 특정 치환(부위 지시), 유전자의 국소 영역에서의 특정 또는 무작위 돌연변이(위치 특이적), 또는 전체 유전자에 대한 무작위 돌연변이 유발(예: 포화 돌연변이 유발)을 수행하는 방법을 사용할 수 있다. PCR을 이용한 단일 가닥 DNA 또는 이중 가닥 DNA의 부위 지시 돌연변이 유발, 카세트 돌연변이 유발, 유전자 합성, 오류가 발생하기 쉬운 PCR, 셔플링, 및 화학적 포화 돌연변이 유발, 또는 관련 기술분야에 공지된 임의의 다른 적합한 방법을 포함하지만 제한되지 않는, 효소 변이체를 생성하기 위한 수많은 적합한 방법이 관련 기술분야에 알려져 있다. 돌연변이 유발 및 지시된 진화 방법은 효소 코딩 폴리뉴클레오티드에 쉽게 적용되어 발현, 스크리닝 및 검정할 수 있는 변이체 라이브러리를 생성할 수 있다. 임의의 적합한 돌연변이 유발 및 지시된 진화 방법은 본 발명에 사용되며 관련 기술분야에 잘 알려져 있다(예를 들어, 미국 특허 제5,605,793호, 제5,811,238호, 제5,830,721호, 제5,834,252호, 제5,837,458호, 제5,928,905호, 제6,096,548호, 제6,117,679호, 제6,132,970호, 제6,165,793호, 제6,180,406호, 제6,251,674호, 제6,265,201호, 제6,277,638호, 제6,287,861호, 제6,287,862호, 제6,291,242호, 제6,297,053호, 제6,303,344호, 제6,309,883호, 제6,319,713호, 제6,319,714호, 제6,323,030호, 제6,326,204호, 제6,335,160호, 제6,335,198호, 제6,344,356호, 제6,352,859호, 제6,355,484호, 제6,358,740호, 제6,358,742호, 제6,365,377호, 제6,365,408호, 제6,368,861호, 제6,372,497호, 제6,337,186호, 제6,376,246호, 제6,379,964호, 제6,387,702호, 제6,391,552호, 제6,391,640호, 제6,395,547호, 제6,406,855호, 제6,406,910호, 제6,413,745호, 제6,413,774호, 제6,420,175호, 제6,423,542호, 제6,426,224호, 제6,436,675호, 제6,444,468호, 제6,455,253호, 제6,479,652호, 제6,482,647호, 제6,483,011호, 제6,484,105호, 제6,489,146호, 제6,500,617호, 제6,500,639호, 제6,506,602호, 제6,506,603호, 제6,518,065호, 제6,519,065호, 제6,521,453호, 제6,528,311호, 제6,537,746호, 제6,573,098호, 제6,576,467호, 제6,579,678호, 제6,586,182호, 제6,602,986호, 제6,605,430호, 제6,613,514호, 제6,653,072호, 제6,686,515호, 제6,703,240호, 제6,716,631호, 제6,825,001호, 제6,902,922호, 제6,917,882호, 제6,946,296호, 제6,961,664호, 제6,995,017호, 제7,024,312호, 제7,058,515호, 제7,105,297호, 제7,148,054호, 제7,220,566호, 제7,288,375호, 제7,384,387호, 제7,421,347호, 제7,430,477호, 제7,462,469호, 제7,534,564호, 제7,620,500호, 제7,620,502호, 제7,629,170호, 제7,702,464호, 제7,747,391호, 제7,747,393호, 제7,751,986호, 제7,776,598호, 제7,783,428호, 제7,795,030호, 제7,853,410호, 제7,868,138호, 제7,783,428호, 제7,873,477호, 제7,873,499호, 제7,904,249호, 제7,957,912호, 제7,981,614호, 제8,014,961호, 제8,029,988호, 제 8,048,674호, 제8,058,001호, 제8,076,138호, 제8,108,150호, 제8,170,806호, 제8,224,580호, 제8,377,681호, 제8,383,346호, 제8,457,903호, 제8,504,498호, 제8,589,085호, 제8,762,066호, 제8,768,871호, 제9,593,326호, 및 미국은 물론 PCT 및 미국 외 대응 국가의 모든 관련 특허; Ling et al, Anal. Biochem., 254(2):157-78 [1997]; Dale et al.,Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al.,Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wellset al., Gene, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christianet al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. 미국, 94:4504-4509 [1997]; Crameriet al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; 및 WO 2009/152336를 참조하며, 모두 본원에 참조로 포함된다).

일부 실시양태에서, 돌연변이 유발 처리 후 얻은 효소 클론은 효소 제제를 정의된 온도(또는 다른 분석 조건)에 적용하고 열 처리 또는 다른 적합한 분석 조건 후에 남아 있는 효소 활성의 양을 측정하여 스크리닝된다. 그런 다음, 폴리펩티드를 코딩하는 폴리뉴클레오티드를 함유하는 클론을 유전자로부터 분리하고, 서열을 분석하여 뉴클레오티드 서열 변화(있는 경우)를 확인하고, 숙주 세포에서 효소를 발현하는 데 사용한다. 발현 라이브러리로부터 효소 활성을 측정하는 것은 관련 기술분야에 공지된 임의의 적합한 방법(예를 들어, HPLC 분석과 같은 표준 생화학 기술)을 사용하여 수행될 수 있다.

변이체가 생성된 후, 임의의 원하는 특성(예를 들어, 높거나 증가된 활성, 또는 낮거나 감소된 활성, 증가된 열 활성, 증가된 열 안정성, 및/또는 산성 pH 안정성 등)에 대해 스크리닝될 수 있다. 일부 실시양태에서, "재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드"(본원에서는 "조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드", "변이체 뉴클레오시드 데옥시리보실트랜스퍼라제 효소", "뉴클레오시드 데옥시리보실트랜스퍼라제 변이체" 및 "뉴클레오시드 데옥시리보실트랜스퍼라제 조합 변이체"라고도 함)가 용도를 발견하게 된다. 일부 실시양태에서, "재조합 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드"("조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드", "변이체 뉴클레오시드 데옥시리보실트랜스퍼라제 효소", "뉴클레오시드 데옥시리보실트랜스퍼라제 변이체" 및 "뉴클레오시드 데옥시리보실트랜스퍼라제 조합 변이체"라고도 함)가 용도를 발견하게 된다.

본원에 사용된 바와 같이, "벡터"는 DNA 서열을 세포 내로 도입하기 위한 DNA 작제물이다. 일부 실시양태에서, 벡터는 DNA 서열에 코딩된 폴리펩티드의 적합한 숙주에서의 발현을 달성할 수 있는 적합한 제어 서열에 작동가능하게 연결된 발현 벡터이다. 일부 실시양태에서, "발현 벡터"는 숙주 세포에서 발현을 유도하기 위해 DNA 서열(예를 들어, 이식유전자)에 작동가능하게 연결된 프로모터 서열을 가지며, 일부 실시양태에서는 전사 종결자 서열도 포함한다.

본원에 사용된 바와 같이, 용어 "발현"은 전사, 전사후 변형, 번역, 및 번역후 변형을 포함하지만 이에 제한되지 않는 폴리펩티드 생산에 관련된 모든 단계를 포함한다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.

본원에 사용된 바와 같이, 용어 "생산하다"는 세포에 의한 단백질 및/또는 다른 화합물의 생산을 지칭한다. 이 용어는 전사, 전사후 변형, 번역, 및 번역후 변형을 포함하지만 이에 제한되지 않는 폴리펩티드 생산에 관련된 모든 단계를 포괄하는 것으로 의도된다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.

본원에 사용된 바와 같이, 아미노산 또는 뉴클레오티드 서열(예를 들어, 프로모터 서열, 신호 펩티드, 종결자 서열 등)은 두 서열이 자연에서 회합되지 않은 경우 작동가능하게 연결된 또 다른 서열에 대해 "이종"이다. 예를 들어, "이종 폴리뉴클레오티드"는 실험실 기술에 의해 숙주 세포 내로 도입되는 임의의 폴리뉴클레오티드이며, 숙주 세포로부터 제거되어 실험실 조작을 거친 후 숙주 세포 내로 재도입되는 폴리뉴클레오티드를 포함한다.

본원에 사용된 바와 같이, 용어 "숙주 세포" 및 "숙주 균주"는 본원에 제공된 DNA(예를 들어, 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체를 코딩하는 폴리뉴클레오티드)를 포함하는 발현 벡터용으로 적합한 숙주를 지칭한다. 일부 실시양태에서, 숙주 세포는 관련 기술분야에 공지된 재조합 DNA 기술을 사용하여 작제된 벡터로 형질전환되거나 형질감염된 원핵 또는 진핵 세포이다.

용어 "유사체"는 기준 폴리펩티드와의 서열 동일성이 70%초과이지만 100% 미만(예를 들어, 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 초과의 서열 동일성)인 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 호모아르기닌, 오르니틴 및 노르발린뿐만 아니라 자연 발생 아미노산을 포함하지만 이에 제한되지 않는 하나 이상의 비천연 발생 아미노산 잔기를 함유하는 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 또한 하나 이상의 D-아미노산 잔기 및 2개 이상의 아미노산 잔기 사이의 비펩티드 연결을 포함한다. 유사체라는 용어는 다른 화합물의 구조와 유사하지만 하나 이상의 차이점이 있는 화학 구조, 예를 들어 천연 치환기 또는 기가 비천연 치환기 또는 기로 치환되는 것을 포함할 수 있는 화학 구조를 지칭하는 데에도 사용될 수 있다.

"유효량"이라는 용어는 원하는 결과를 생성하기에 충분한 양을 의미한다. 관련 기술분야의 기술자는 일상적인 실험을 사용하여 유효량이 얼마인지 결정할 수 있다.

"단리된" 및 "정제된"이라는 용어는 분자(예를 들어, 단리된 핵산, 폴리펩티드 등) 또는 자연적으로 회합되어 있는 적어도 하나의 다른 성분으로부터 제거된 다른 성분을 지칭하는 데 사용된다. "정제된”이라는 용어는 절대적인 순도를 요구하는 것이 아니라 상대적인 정의를 의도한다.

본원에 사용된 바와 같이, "입체선택성"은 하나의 입체이성질체의 화학적 또는 효소적 반응에서 다른 것보다 우선적인 형성을 지칭한다. 입체선택성은 하나의 입체이성질체의 형성이 다른 것보다 선호되는 부분적일 수도 있고, 단지 하나의 입체이성질체만 형성되는 완전할 수도 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성, 즉 두 거울상이성질체의 합계에서 하나의 거울상이성질체의 분율(일반적으로 백분율로 보고됨)으로 지칭된다. 이는 일반적으로 [주 거울상 이성질체 - 소수 거울상 이성질체]/[주 거울상 이성질체 + 소수 거울상 이성질체] 공식에 따라 계산된 거울상 이성질체 과량("e.e.")으로서 관련 기술분야에 일반적으로 보고된다(일반적으로 백분율로 보고됨). 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성, 즉 두 개의 부분입체이성질체의 혼합물에서 하나의 부분입체이성질체의 분율(일반적으로 백분율로 보고됨)로 지칭되며, 일반적으로 부분입체이성질체 과량("d.e.")으로 보고된다. 거울상이성질체 과량 및 부분입체이성질체 과량은 입체이성질체 과량의 유형이다.

본원에 사용된 바와 같이, "위치선택성" 및 "위치선택적 반응"은 결합 생성 또는 파괴의 한 방향이 다른 모든 가능한 방향보다 우선적으로 발생하는 반응을 지칭한다. 반응은 구별이 완전한 경우 완전히(100%) 위치선택적일 수 있고, 한 부위에서의 반응 생성물이 다른 부위에서의 반응 생성물보다 우세한 경우 실질적으로 위치선택적(적어도 75%), 또는 부분적 위치선택적(×%, 여기서 백분율은 관심 반응에 의존적인 세트이다)일 수 있다.

본원에 사용된 바와 같이, "화학선택성"은 한 생성물이 화학적 또는 효소적 반응에서 다른 생성물보다 우선적으로 형성되는 것을 지칭한다.

본원에 사용된 바와 같이, "pH 안정"은 높거나 낮은 pH(예를 들어, 4.5 내지 6 또는 8 내지 12)에 일정 기간(예: 0.5-24시간) 동안 노출된 후에도 처리되지 않은 효소와 비교하여 유사한 활성(예를 들어, 60% 내지 80% 이상)을 유지하는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.

본원에 사용된 바와 같이, "열안정"은 일정 기간 동안(예를 들어, 0.5-24시간) 승온(예를 들어, 40-80℃)에 노출된 후에도 동일한 상승된 온도에 노출된 야생형 효소와 비교하여 유사한 활성(예를 들어 60% 내지 80% 이상)을 유지하는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.

본원에 사용된 바와 같이, "용매 안정"은 다양한 농도(예를 들어, 5-99%)의 용매(에탄올, 이소프로필 알코올, 디메틸술폭사이드[DMSO], 테트라히드로푸란, 2-메틸테트라히드로푸란, 아세톤, 톨루엔, 부틸 아세테이트, 메틸 3급-부틸 에테르 등)에 일정 기간(예: 0.5-24시간) 동안 노출된 후 동일한 농도의 동일한 용매에 노출된 야생형 효소와 비교하여 유사한 활성(예를 들어 60% 내지 80% 이상)을 유지하는 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.

본원에 사용된 바와 같이, "열안정성 및 용매안정성"은 열안정성 및 용매안정성 둘 다인 뉴클레오시드 데옥시리보실트랜스퍼라제 폴리펩티드를 지칭한다.

본원에 사용된 바와 같이, "선택적" 및 "선택적으로"는 이후에 설명되는 사건 또는 상황이 발생할 수도 있고 발생하지 않을 수도 있고, 설명이 사건 또는 상황이 발생하는 경우와 발생하지 않는 경우를 포함한다는 것을 의미한다. 관련 기술분야의 기술자는 하나 이상의 선택적인 치환기를 함유하는 것으로 기술된 임의의 분자와 관련하여 입체적으로 실용적인 및/또는 합성적으로 가능한 화합물만이 포함되는 것을 의미함을 이해할 것이다.

본원에 사용된 바와 같이, "선택적으로 치환된"은 용어 또는 일련의 화학 그룹 내의 모든 후속 변형자를 지칭한다. 예를 들어, "선택적으로 치환된 아릴알킬"이라는 용어에서, 분자의 "알킬" 부분 및 "아릴" 부분은 치환될 수도 있고 치환되지 않을 수도 있으며, "선택적으로 치환된 알킬, 사이클로알킬, 아릴 및 헤테로아릴" 시리즈의 경우, 알킬, 사이클로알킬, 아릴 및 헤테로아릴기는 서로 독립적으로 치환되거나 치환되지 않을 수 있다.

발명의 상세한 설명

일부 실시양태에서, 본 발명은 화합물(1)의 비천연 뉴클레오시드 유사체(아래에 도시됨, MK-8591로도 알려짐)의 시험관내 효소 합성에 유용한 효소를 제공한다. 본 발명은 뉴클레오시드 유사체를 생산하기 위한 생체촉매 효소의 사용을 다루기 위해 개발되었다. 그러나 이 접근법의 한 가지 과제는 야생형 효소가 이러한 화합물의 합성에 필요한 비천연 기질에 대해 제한된 활성을 갖는다는 것이다.

비천연 뉴클레오시드는 암 및 바이러스 감염 치료를 위한 약물을 포함하여 많은 중요한 종류의 약물에 필수적인 구성 요소이다. 시판 중이거나 임상 시험 중인 뉴클레오시드 유사체 약물은 적어도 12가지가 있다(Jordheim et al., Nat. Rev. Drug Discovery 12:447-464 [2013]). 화합물(1)의 비천연 뉴클레오시드는 강력한 항바이러스 활성을 가지며 인간 면역결핍 바이러스 및 기타 질병의 치료에 유용할 수 있다.

그러나, 화합물(1)의 전통적인 화학적 합성은 비효율적이며, 매우 낮은 수율로 12개 이상의 단계가 필요하다. 최근에는, 수율을 향상시키고, 합성 단계 수를 줄이며, 입체 선택성을 향상시키고, 독성 폐기물을 줄이기 위해 제약 중간체를 합성하는 데 생체촉매 방법이 사용되었다.

비천연 뉴클레오시드를 합성하기 위한 여러 생체촉매 방법이 제안되었다(Fresco-Taboada et al. Appl Microbiol Biotechnol 97, 3773-3785 (2013)). 한 가지 접근법은 퓨린 뉴클레오시드 포스포릴라제와 피리미딘 뉴클레오시드 포스포릴라제 또는 우리딘 포스포릴라제로 구성된 두 가지 효소 시스템을 사용하는 것이다. 그러나, 뉴클레오시드 디옥시리보실트랜스퍼라제(NDT) 효소는 단일 단계 공정을 허용할 수 있다. NDT는 유리 퓨린 또는 피리미딘 염기와 2'-데옥시리보뉴클레오시드의 퓨린 또는 피리미딘 염기 사이의 뉴클레오시드 교환을 촉매하는 것으로 알려져 있다. 따라서, 알키닐-데옥시우리딘(화합물(2))과 2-플루오로-아데닌(화합물 (3))의 NDT 촉매 뉴클레오시드 교환에 의한 화합물(1)의 알키닐 데옥시아데노신 생성물의 합성은 전통적인 화학 방법에 대한 매력적인 대안을 제시할 수 있다. 아래의 반응식 1을 참조한다.

반응식 1. 화합물(1)의 제안된 생체촉매 합성

그러나, 비천연 알키닐 기질인 화합물 (2)에 대한 야생형 NDT의 활성은 제한적이다. NDT 동족체의 여러 결정 구조를 사용할 수 있다(Lactobacillus helveticus, PDB 코드, 1S2L, 및 Lactobacillus leichmannii, PDB 코드, 1F8X, 특히). 이러한 결정 구조를 조사한 결과 기질 결합 포켓에 있는 잔기의 돌연변이가 알키닐 기질을 수용할 수 있음을 알 수 있다.

NDT 결합 포켓에 있는 비천연 기질의 제한된 수용으로 인해, 기질 특이성이 변경되고 비천연 뉴클레오시드 유사체의 생성이 개선된 조작된 NDT가 필요하다. 본 발명은 이러한 필요성을 해결하고 산업 조건 하에서 이러한 반응에 사용하기에 적합한 조작된 NDT를 제공한다.

조작된 NDT 폴리펩티드

본 발명은 조작된 NDT 폴리펩티드, 폴리펩티드를 코딩하는 폴리뉴클레오티드, 폴리펩티드 제조 방법, 및 폴리펩티드 사용 방법을 제공한다. 설명이 폴리펩티드에 관한 경우, 폴리펩티드를 코딩하는 폴리뉴클레오티드도 설명하는 것으로 이해되어야 한다.

일부 실시양태에서, 본 발명은 야생형 NDT 효소와 비교하여 개선된 특성을 갖는 조작된 비천연 발생 NDT 효소를 제공한다. 일부 실시양태에서, 조작된 NDT 효소는 화합물(2)의 알키닐 데옥시우리딘을 포함하여, 비천연 뉴클레오시드 유사체 및 중간체에 대한 향상된 기질 특이성을 포함한다. 일부 실시양태에서, NDT 효소는 화합물(2)에 대한 증가된 활성을 포함한다. 일부 실시양태에서, NDT 효소는 야생형 또는 기준 효소와 비교하여 증가된 열안정성을 포함한다. 일부 실시양태에서, NDT 효소는 야생형 또는 기준 효소와 비교하여 증가된 입체선택성을 포함한다. 일부 실시양태에서, NDT 효소는 야생형 또는 기준 효소와 비교하여 산업적으로 관련된 공정 조건 하에서 증가된 활성을 포함한다.

본 발명의 예시적인 비천연 발생(또는 조작된) 폴리펩티드에 대한 구조 및 기능 정보는 화합물(2) 및 화합물(3)의 화합물(1)로의 전환을 기반으로 하며, 그 결과는 하기 표 5-1, 6-1, 6-2, 7-1, 및/또는 7-2에 기재되어 있고, 실시예에 추가로 기재되어 있다. 이들 표의 홀수 번호 서열 식별자(즉, 서열번호)는 이들 표의 짝수 번호 서열번호에 의해 제공되는 아미노산 서열을 코딩하는 뉴클레오티드 서열을 지칭한다. 예시적인 서열은 본 발명에 수반되는 전자 서열 목록 파일에 제공되며, 이는 본원에 참조로 포함된다. 아미노산 잔기 차이는 표시된 바와 같이 서열번호 4, 14, 및/또는 126의 기준 서열과의 비교에 기초한다.

조작된 폴리펩티드의 상기 기재된 개선된 특성이 폴리펩티드의 농도 또는 양, 기질, 완충제, pH, 및/또는 온도 및 반응 시간을 포함하는 조건과 관련하여 결정될 수 있는 일부 적합한 반응 조건이 본원에 제공된다. 일부 실시양태에서, 적합한 반응 조건은 하기 및 실시예에 기술된 검정 조건을 포함한다.

관련 기술분야의 기술자에게 명백한 바와 같이, 전술한 잔기 위치 및 각 잔기 위치에 대한 특정 아미노산 잔기는 무엇보다도 효소 활성, 기질/생성물 선호도, 입체 선택성, 기질/생성물 내성 및 증가된 온도, 용매 및/또는 pH와 같은 다양한 조건 하에서의 안정성을 포함하여, 원하는 개선된 특성을 갖는 NDT 폴리펩티드를 합성하기 위해 개별적으로 또는 다양한 조합으로 사용될 수 있다.

관련 기술분야의 기술자가 이해하는 바와 같이, 일부 실시양태에서, 선택된 것 중 하나 또는 선택된 잔기 차이 중 하나 또는 조합은 조작된 NDT에서 핵심 특징으로서 일정하게 보존(즉, 유지)될 수 있고, 다른 잔기 위치에서의 추가적인 잔기 차이는 서열에 통합되어 개선된 특성을 갖는 추가적인 조작된 NDT 폴리펩티드를 생성시킬 수 있다. 따라서, 위의 잔기 차이 중 하나 또는 하위세트를 포함하는 임의의 조작된 NDT에 대해, 본 발명은 잔기 차이 중 하나 또는 하위세트와, 추가적으로 본원에 개시된 다른 잔기 위치에서의 하나 이상의 잔기 차이를 포함하는 다른 조작된 NDT를 고려하는 것으로 이해되어야 한다.

위에서 언급한 바와 같이, 조작된 NDT 폴리펩티드는 기질(예를 들어, 화합물(2) 및 화합물(3))을 생성물(예를 들어, 화합물(1))로 전환시킬 수 있다. 일부 실시양태에서, 조작된 NDT 폴리펩티드는 서열번호: 4, 14, 및/또는 126의 기준 폴리펩티드의 활성에 비해 적어도 1.2배, 1.45배, 2.5배, 3배, 4배, 5배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배 이상의 활성으로 기질 화합물을 생성물 화합물로 전환시킬 수 있다.

일부 실시양태에서, 서열번호: 4, 14, 및/또는 126에 비해 적어도 1.45배의 활성으로 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 6-214의 짝수 번호 서열로부터 선택된 아미노산 서열을 포함한다.

일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 1.45배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 80%인 아미노산 서열을 포함한다.

일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 3.5배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 80%인 아미노산 서열을 포함한다.

일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 1.45배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 95%인 아미노산 서열을 포함한다.

일부 실시양태에서, 기질 화합물을 생성물 화합물로 전환시킬 수 있는 조작된 NDT 폴리펩티드는 서열번호: 4에 비해 적어도 3.5배의 활성을 가지며, 서열번호: 4와 비교하여 위치 X20, X101, 및/또는 X104에 하나 이상의 치환이 있는, 서열번호: 4와 서열 동일성이 적어도 95%인 아미노산 서열을 포함한다.

일부 실시양태에서, 본 발명은 또한 조작된 NDT 폴리펩티드의 기능적 NDT 활성 및/또는 개선된 특성을 유지하는, 본원에 기술된 임의의 조작된 NDT 폴리펩티드의 단편을 포함하는 조작된 NDT 폴리펩티드를 제공한다. 따라서, 일부 실시양태에서, 본 발명은 NDT 활성(예를 들어, 적합한 반응 조건 하에서 화합물(2) 및 화합물(3)을 화합물 (1)로 전환시킬 수 있음)을 갖는 폴리펩티드 단편을 제공하며, 여기서 상기 단편은 서열번호: 6-214의 짝수 번호 서열 식별자를 갖는 예시적인 조작된 폴리펩티드와 같은, 본 발명의 조작된 폴리펩티드의 전장 아미노산 서열의 적어도 80%, 90%, 95%, 98%, 또는 99%를 포함한다.

일부 실시양태에서, 본 발명의 조작된 NDT 폴리펩티드는 서열번호: 6-214의 짝수 번호 서열 식별자를 갖는 예시적인 조작된 폴리펩티드 서열과 같이 본원에 기술된 조작된 NDT 폴리펩티드 서열 중 어느 하나와 비교하여 결실을 포함하는 아미노산 서열을 포함한다. 따라서, 본 발명의 조작된 NDT 폴리펩티드의 각각의 모든 실시양태에 대해, 아미노산 서열은 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산 결실, NDT 폴리펩티드의 아미노산 총수의 최대 10%, 아미노산 총수의 최대 15%, 아미노산 총수의 최대 20%, 또는 아미노산 총수의 최대 30%를 포함하며, 여기서 본원에 기술된 조작된 NDT 폴리펩티드의 관련 기능적 활성 및/또는 개선된 특성은 유지된다. 일부 실시양태에서, 결실은 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55 또는 1-60개의 아미노산 잔기를 포함할 수 있다. 일부 실시양태에서, 결실의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, 50, 55 또는 60개의 아미노산 잔기일 수 있다. 일부 실시양태에서, 결실은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24, 25 또는 30개의 아미노산 잔기의 결실을 포함할 수 있다.

일부 실시양태에서, 본 발명은 서열번호: 6-214의 짝수 번호 서열 식별자를 갖는 예시적인 조작된 폴리펩티드 서열과 같이, 본원에 기술된 조작된 NDT 폴리펩티드 서열 중 어느 하나와 비교하여 삽입을 포함하는 아미노산 서열을 갖는 조작된 NDT 폴리펩티드를 제공한다. 따라서, 본 발명의 조작된 NDT 폴리펩티드의 각각의 모든 실시양태에 대해, 아미노산 서열은 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산을 포함할 수 있고, 여기서 본원에 기술된 조작된 NDT 폴리펩티드의 관련 기능적 활성 및/또는 개선된 특성은 유지된다. 삽입은 아미노 또는 카르복시 말단 또는 NDT 폴리펩티드의 내부 부분에서 이루어질 수 있다.

일부 실시양태에서, 본 발명의 폴리펩티드는 조작된 폴리펩티드가 다른 폴리펩티드, 예컨대, 예를 들어 비제한적으로, 항체 태그(예를 들어, myc 에피토프), 정제 서열(예: 금속 결합을 위한 His 태그), 및 세포 국소화 신호(예: 분비 신호)에 융합된 융합 폴리펩티드의 형태이다. 따라서, 본원에 기술된 조작된 폴리펩티드는 다른 폴리펩티드와의 융합과 함께 또는 융합 없이 사용될 수 있다.

본원에 기술된 조작된 NDT 폴리펩티드는 유전적으로 코딩된 아미노산으로 제한되지 않는다. 따라서, 유전적으로 코딩된 아미노산 이외에, 본원에 기술된 폴리펩티드는 전체 또는 부분적으로 자연 발생 및/또는 합성 비-코딩된 아미노산으로 구성될 수 있다. 본원에 기술된 폴리펩티드가 포함될 수 있는 일반적으로 접하는 비-코딩된 아미노산에는 유전적으로 코딩된 아미노산의 D-입체이성질체; 2,3-디아미노프로피온산(Dpr); α-아미노이소부티르산(Aib); ε-아미노헥사노산(Aha); δ-아미노발레르산(Ava); N-메틸글리신 또는 사르코신(MeGly 또는 Sar); 오르니틴(Orn); 시트룰린(Cit); t-부틸알라닌(Bua); t-부틸글리신(Bug); N-메틸이소류신(MeIle); 페닐글리신(Phg); 사이클로헥실알라닌(Cha); 노르류신(Nle); 나프틸알라닌(Nal); 2-클로로페닐알라닌(Ocf); 3-클로로페닐알라닌(Mcf); 4-클로로페닐알라닌(Pcf); 2-플루오로페닐알라닌(Off); 3-플루오로페닐알라닌(Mff); 4-플루오로페닐알라닌(Pff); 2-브로모페닐알라닌(Obf); 3-브로모페닐알라닌(Mbf); 4-브로모페닐알라닌(Pbf); 2-메틸페닐알라닌(Omf); 3-메틸페닐알라닌(Mmf); 4-메틸페닐알라닌(Pmf); 2-니트로페닐알라닌(Onf); 3-니트로페닐알라닌(Mnf); 4-니트로페닐알라닌(Pnf); 2-시아노페닐알라닌(Ocf); 3-시아노페닐알라닌(Mcf); 4-시아노페닐알라닌(Pcf); 2-트리플루오로메틸페닐알라닌(Otf); 3-트리플루오로메틸페닐알라닌(Mtf); 4-트리플루오로메틸페닐알라닌(Ptf); 4-아미노페닐알라닌(Paf); 4-요오도페닐알라닌(Pif); 4-아미노메틸페닐알라닌(Pamf); 2,4-디클로로페닐알라닌(Opef); 3,4-디클로로페닐알라닌(Mpcf); 2,4-디플루오로페닐알라닌(Opff); 3,4-디플루오로페닐알라닌(Mpff); 피리드-2-일알라닌(2pAla); 피리드-3-일알라닌(3pAla); 피리드-4-일알라닌(4pAla); 나프트-1-일알라닌(1nAla); 나프트-2-일알라닌(2nAla); 티아졸릴알라닌(taAla); 벤조티에닐알라닌(bAla); 티에닐알라닌(tAla); 푸릴알라닌(fAla); 호모페닐알라닌(hPhe); 호모티로신(hTyr); 호모트립토판(hTrp); 펜타플루오로페닐알라닌(5ff); 스티릴칼라닌(sAla); 아우트릴알라닌(aAla); 3,3-디페닐알라닌(Dfa); 3-아미노-5-페닐펜탄산(Afp); 페니실라민(Pen); 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산 (Tic); 2-티에닐알라닌(Thi); 메티오닌 술폭시드(Mso); N(w)-니트로아르기닌(nArg); 호모라이신(hLys); 포스포노메틸페닐알라닌(pmPhe); 포스포세린(pSer); 포스포트레오닌(pThr); 호모아스파르트산(hAsp); 호모글루탐산(hGlu); 1-아미노사이클로펜트-(2 또는 3)-엔-4 카르복실산; 피페콜산(PA), 아제티딘-3-카르복실산(ACA); 1-아미노사이클로펜탄-3-카르복실산; 알릴글리신(aOly); 프로파르길글리신(pgGly); 호모알라닌(hAla); 노르발린(nVal); 호모류신(hLeu), 호모발린(hVal); 호모이소류신(hIle); 호모아르기닌(hArg); N-아세틸 라이신(AcLys); 2,4 디아미노부티르산(Dbu); 2,3-디아미노부티르산(Dab); N-메틸발린(MeVal); 호모시스테인(hCys); 호모세린(hSer); 히드록시프롤린(Hyp)과 호모프롤린(hPro)이 포함되지만, 이들로 제한되는 것은 아니다. 본원에 기술된 폴리펩티드가 포함될 수 있는 추가적인 비-코딩 아미노산은 관련 기술분야의 기술자에게 명백할 것이다. 이들 아미노산은 L 또는 D 배열일 수 있다.

관련 기술분야의 기술자는 측쇄 보호기를 보유하는 아미노산 또는 잔기가 또한 본원에 기술된 폴리펩티드를 포함할 수 있음을 인식할 것이다. 이러한 경우 방향족 범주에 속하는 보호된 아미노산의 비제한적 예에는 Arg(tos), Cys(메틸벤질), Cys(니트로피리딘술페닐), Glu(δ-벤질에스테르), Gln(크산틸), Asn(N-δ-크산틸), His(bom), His(벤질), His(tos), Lys(fmoc), Lys(tos), Ser(O-벤질), Thr(O-벤질) 및 Tyr(O-벤질)이 포함되지만(괄호 안에 나열된 보호기), 이들로 제한되지 않는다.

본원에 기재된 폴리펩티드가 구성될 수 있는 형태적으로 제한된 비-코딩 아미노산에는 N-메틸 아미노산(L-배열); 1-아미노사이클로펜트-(2 또는 3)-엔-4-카르복실산; 피페콜산; 아제티딘-3-카르복실산; 호모프롤린(hPro); 및 1 아미노사이클로펜탄-3-카르복실산이 포함되지만, 이들로 제한되지 않는다.

일부 실시양태에서, 조작된 폴리펩티드는 막, 수지, 고체 담체, 또는 기타 고체상 물질과 같은 고체 지지체 상에 제공될 수 있다. 고체 지지체는 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시, 및 폴리아크릴아미드와 같은 유기 중합체뿐만 아니라 이들의 공중합체 및 그래프트로 구성될 수 있다. 고체 지지체는 유리, 실리카, 제어된 공극 유리(CPG), 역상 실리카 또는 금이나 백금과 같은 금속과 같은 무기물일 수도 있다. 고체 지지체의 구조는 비드, 구형, 입자, 과립, 겔, 막 또는 표면의 형태일 수 있다. 표면은 평면형, 실질적으로 평면형 또는 비평면형일 수 있다. 고체 지지체는 다공성 또는 비다공성일 수 있으며 팽윤 또는 비팽창 특성을 가질 수 있다. 고체 지지체는 웰, 함몰 또는 기타 용기, 베슬, 피쳐 또는 위치의 형태로 구성될 수 있다.

일부 실시양태에서, NDT 활성을 갖는 조작된 폴리펩티드는 기준 폴리펩티드(예를 들어, 서열번호: 4, 14, 및/또는 126)와 비교하여 이들이 개선된 활성, 거울상선택성, 입체선택성, 및/또는 기타 개선된 특성을 갖도록 고체 지지체에 결합되거나 고정화된다. 이러한 실시양태에서, 고정화된 폴리펩티드는 기질 화합물의 원하는 생성물로의 생체촉매적 전환을 촉진할 수 있고, 반응이 완료된 후 쉽게 유지되고(예를 들어, 폴리펩티드가 고정된 비드를 유지함으로써) 후속 반응에서 재사용되거나 재활용될 수 있다. 이러한 고정화 효소 공정은 추가적인 효율성과 비용 절감을 가능하게 한다. 따라서, 본 발명의 조작된 NDT 폴리펩티드를 사용하는 임의의 방법은 고체 지지체 상에 결합되거나 고정화된 동일한 NDT 폴리펩티드를 사용하여 수행될 수 있음이 추가로 고려된다.

조작된 NDT 폴리펩티드는 비공유적으로 또는 공유적으로 결합될 수 있다. 고체 지지체(예를 들어, 수지, 막, 비드, 유리 등)에 대한 효소의 접합 및 고정화를 위한 다양한 방법은 해당 분야에 잘 알려져 있다. 특히, PCT 공개 공보 제WO2012/177527 A1호에는 고정화된 폴리펩티드를 제조하는 방법이 개시되어 있으며, 여기서 폴리펩티드는 소수성 상호작용 또는 공유 결합에 의해 수지에 물리적으로 부착되고 적어도 최대 100% 유기 용매를 포함하는 용매 시스템에서 안정하다. 고체 지지체(예를 들어, 수지, 막, 비드, 유리 등)에 대한 효소의 접합 및 고정화를 위한 다른 방법은 관련 분야에 잘 알려져 있다(예를 들어, 문헌: Yi et al., Proc. Biochem., 42: 895-898 [2007]; Martin 등, Appl. Microbiol. Biotechnol., 76: 843-851 [2007]; Koszelewski 등, J. Mol. Cat. B: Enz., 63: 39-44 [2010]; Truppo 등, Org. Proc. Res. Development, 온라인 출판: dx.doi.org/10.1021/op200157c; 및 Mateo 등, Biotechnol. Prog., 18:629-34 [2002] 등을 참조한다).

본 발명의 조작된 NDT 폴리펩티드를 고정시키는 데 유용한 고체 지지체에는 에폭사이드 작용기를 갖는 폴리메타크릴레이트, 아미노 에폭사이드 작용기를 갖는 폴리메타크릴레이트, 스티렌/DVB 공중합체 또는 옥타데실 작용기를 갖는 폴리메타크릴레이트를 포함하는 비드 또는 수지가 포함되지만, 이에 제한되지 않는다. 본 발명의 조작된 NDT 폴리펩티드를 고정시키는 데 유용한 예시적인 고체 지지체에는 다음과 같은 다양한 유형의 SEPABEAD: EC-EP, EC-HFA/ S, EXA252, EXE119 및 EXE120를 포함하여, 키토산 비드, Eupergit C, 및 SEPABEAD(Mitsubishi)가 포함되지만, 이에 제한되지 않는다.

일부 실시양태에서, 조작된 NDT 폴리펩티드는 폴리펩티드가 위치상으로 구별되는 위치에 배열되어 있는 어레이의 형태로 제공된다. 일부 실시양태에서, 위치적으로 구별되는 위치는 96개-웰 플레이트와 같은 고체 지지체중의 웰이다. 복수의 지지체는 시약의 로봇식 운반을 위해, 또는 검출 방법 및/또는 기구에 의해 주소 지정이 가능한 다양한 위치의 어레이에 구성될 수 있다. 이러한 어레이는 폴리펩티드에 의한 전환을 위한 다양한 기질 화합물을 테스트하는 데 사용될 수 있다.

일부 실시양태에서, 본원에 기재된 조작된 폴리펩티드는 키트 형태로 제공된다. 키트 내의 폴리펩티드는 개별적으로 또는 다수의 폴리펩티드로서 존재할 수 있다. 키트에는 효소 반응을 수행하기 위한 시약, 폴리펩티드의 활성을 평가하기 위한 기질, 뿐만 아니라 생성물을 검출하기 위한 시약이 추가로 포함될 수 있다. 키트에는 또한 시약 디스펜서와 키트 사용 지침이 포함될 수 있다. 일부 실시양태에서, 본 발명의 키트는 서로 다른 주소 지정 가능 위치에 다수의 서로 다른 조작된 NDT 폴리펩티드를 포함하는 어레이를 포함하며, 여기서 서로 다른 폴리펩티드는 각각 적어도 하나의 서로 다른 개선된 효소 특성을 갖는 기준 서열의 서로 다른 변이체이다. 복수의 조작된 폴리펩티드를 포함하는 이러한 어레이 및 이의 사용 방법은 공지되어 있다(예를 들어, WO2009/008908A2 참조).

조작된 NDT 효소를 사용하는 방법

일부 실시양태에서, 본원에 기술된 NDT 효소는 화합물(2) 및 화합물(3)을 화합물(1)로 전환시키는 공정에서 용도를 찾는다. 일부 실시양태에서, 뉴클레오시드 교환 반응을 수행하는 방법은 단일 단계 또는 원포트 합성을 포함한다.

임의의 적합한 반응 조건이 본 발명에 사용된다. 일부 실시양태에서, 뉴클레오시드 교환 반응을 수행하기 위해 조작된 폴리펩티드의 개선된 특성을 분석하는 방법이 사용된다. 일부 실시양태에서, 반응 조건은 조작된 NDT의 농도 또는 양, 기질(들), 완충액(들), 용매(들), pH, 온도 및 반응 시간을 포함한 조건, 및/또는 고체 지지체상에 고정화된 조작된 NDT에 대한 조건과 관련하여, 아래 및 실시예에 추가로 설명되는 바와 같이 수정된다.

일부 실시양태에서, 반응 조건을 보충하기 위해 추가적인 반응 성분 또는 추가적인 기술이 활용된다. 일부 실시양태에서, 여기에는 효소의 불활성화를 안정화 또는 방지하고, 생성물 억제를 감소시키며, 반응 평형을 원하는 생성물 형성으로 이동시키기 위한 조치를 취하는 것이 포함된다.

본원에 제공되고 실시예에 예시된 실시양태에서, 공정에 사용될 수 있는 다양한 범위의 적합한 반응 조건에는 기질 부하량, 보조 기질 부하량, 환원제, 2가 전이 금속, pH, 온도, 완충액, 용매 시스템, 폴리펩티드 부하량 및 반응 시간이 포함되지만 이에 제한되지 않는다. 본원에 기술된 조작된 NDT 폴리펩티드를 사용하여 기질 화합물을 생성물 화합물로 생체촉매적으로 전환하는 공정을 수행하기 위한 추가의 적합한 반응 조건은 농도, pH, 온도 및 용매 조건의 실험적 반응 조건 하에서 조작된 NDT 폴리펩티드 및 기질 화합물을 접촉시키고, 생성물 화합물을 검출하는 것을 포함하지만, 이들로 제한되지 않는 통상의 실험에 의해 본원에 제공되는 지침면에서 용이하게 최적화될 수 있다.

반응 혼합물 중 기질 화합물은 예를 들어 원하는 생성물 화합물의 양, 기질 농도가 효소 활성에 미치는 영향, 반응 조건 하에서 효소의 안정성 및 기질의 생성물로의 기질 전환율을 고려하여 변화될 수 있다. 일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 내지 약 200 g/ℓ, 1 내지 약 200 g/ℓ, 5 내지 약 150 g/ℓ, 약 10 내지 약 100 g/ℓ, 20 내지 약 100 g/ℓ 또는 약 50 내지 약 100 g/ℓ의 기질 화합물인 화합물(2)를 포함한다. 일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 g/ℓ, 적어도 약 1 g/ℓ, 적어도 약 5 g/ℓ, 적어도 약 10 g/ℓ, 적어도 약 15 g/, 적어도 약 20 g/ℓ, 적어도 약 30 g/ℓ, 적어도 약 50 g/ℓ, 적어도 약 75 g/ℓ, 적어도 약 100 g/ℓ, 적어도 약 150 g/ℓ 또는 적어도 약 200 g/ℓ 또는 그 이상의 기질 화합물 부하량을 포함한다. 본원에 제공된 기질 부하량에 대한 값은 화합물(2)의 분자량을 기준으로 하지만; 등몰량의 다양한 2'-데옥시리보뉴클레오시드 유사체도 공정에 사용될 수 있다는 점도 고려된다.

일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 내지 약 200 g/ℓ, 1 내지 약 200 g/ℓ, 5 내지 약 150 g/ℓ, 약 10 내지 약 100 g/ℓ, 20 내지 약 100 g/ℓ 또는 약 50 내지 약 100 g/ℓ의 기질 화합물, 화합물(3) 부하량을 포함한다. 일부 실시양태에서, 적합한 반응 조건은 적어도 약 0.5 g/ℓ, 적어도 약 1 g/ℓ, 적어도 약 5 g/ℓ, 적어도 약 10 g/ℓ, 적어도 약 15 g/ℓ, 적어도 약 20 g/ℓ, 적어도 약 30 g/ℓ, 적어도 약 50 g/ℓ, 적어도 약 75 g/ℓ, 적어도 약 100 g/ℓ, 적어도 약 150 g/ℓ 또는 적어도 약 200 g/ℓ, 또는 그 이상의 기질 화합물 부하량을 포함한다. 본원에 제공된 기질 부하량에 대한 값은 화합물(3)의 분자량을 기준으로 하지만; 등몰량의 다양한 퓨린 염기 유사체가 공정에 사용될 수 있다는 점도 고려된다.

본원에 기술된 NDT 매개 공정을 수행함에 있어서, 조작된 폴리펩티드는 세포 추출물 및/또는 그러한 세포의 용해물로서, 정제된 효소, 부분적으로 정제된 효소, 효소를 코딩하는 유전자(들)로 형질전환된 전체 세포의 형태, 및/또는 고체 지지체 상에 고정된 효소로서 반응 혼합물에 첨가될 수 있다. 조작된 NDT 효소 또는 세포 추출물, 이의 용해물 및 분리된 효소를 코딩하는 유전자(들)로 형질전환된 전체 세포는 고체(예: 동결건조, 분무 건조 등) 또는 반고체(예: 조질 페이스트)를 비롯한 다양한 형태로 사용될 수 있다. 세포 추출물 또는 세포 용해물은 침전(황산암모늄, 폴리에틸렌이민, 열 처리 등)에 이어 동결건조 전 탈염 과정(예: 한외여과, 투석 등)을 통해 부분적으로 정제될 수 있다. 임의의 효소 제제(전체 세포 제제 포함)는 예를 들어 글루타르알데히드와 같은 공지된 가교제를 사용한 가교결합 또는 고체상(예를 들어 Eupergit C 등)에 고정화에 의해 안정화될 수 있다.

조작된 NDT 폴리펩티드를 코딩하는 유전자(들)는 동일한 숙주 세포 내로 별도로 또는 함께 숙주 세포로 형질전환될 수 있다. 예를 들어, 일부 실시양태에서 숙주 세포의 한 세트는 하나의 조작된 NDT 폴리펩티드를 코딩하는 유전자(들)로 형질전환될 수 있고 다른 세트는 또 다른 조작된 NDT 폴리펩티드를 코딩하는 유전자(들)로 형질전환될 수 있다. 형질전환된 세포의 두 세트 모두 전체 세포 형태, 또는 그로부터 유래된 용해물 또는 추출물의 형태로 반응 혼합물에서 함께 활용될 수 있다. 다른 실시양태에서, 숙주 세포는 다수의 조작된 NDT 폴리펩티드를 코딩하는 유전자(들)로 형질전환될 수 있다. 일부 실시양태에서, 조작된 폴리펩티드는 분비된 폴리펩티드의 형태로 발현될 수 있고, 분비된 폴리펩티드를 함유하는 배양 배지는 NDT 반응을 위해 사용될 수 있다.

일부 실시양태에서, 본원에 개시된 조작된 NDT 폴리펩티드의 개선된 활성 및/또는 기질 선택성은 더 낮은 농도의 조작된 폴리펩티드로 더 높은 전환율을 달성할 수 있는 방법을 제공한다. 공정의 일부 실시양태에서, 적합한 반응 조건은 기질 화합물 부하량의 약 0.03%(w/w), 0.05%(w/w), 0.1%(w/w), 0.15%(w/w), 0.2%(w/w), 0.3%(w/w), 0.4%(w/w), 0.5%(w/w), 1%(w/w), 2%(w/w), 5%(w/w), 10%(w/w), 20%(w/w) 이상의 조작된 폴리펩티드 양을 포함한다.

일부 실시양태에서, 조작된 폴리펩티드는 약 0.01 g/ℓ 내지 약 15 g/ℓ; 약 0.05 g/ℓ 내지 약 15 g/ℓ; 약 0.1 g/ℓ 내지 약 10 g/ℓ; 약 1 g/ℓ 내지 약 8 g/ℓ; 약 0.5 g/ℓ 내지 약 10 g/ℓ; 약 1 g/ℓ 내지 약 10 g/ℓ; 약 0.1 g/ℓ 내지 약 5 g/ℓ; 약 0.5 g/ℓ 내지 약 5 g/ℓ; 또는 약 0.1 g/ℓ 내지 약 2 g/ℓ로 존재한다. 일부 실시양태에서, NDT 폴리펩티드는 약 0.01 g/ℓ, 0.05 g/ℓ, 0.1 g/ℓ, 0.2 g/ℓ, 0.5 g/ℓ, 1 g/ℓ, 2 g/ℓ, 5 g/ℓ, 10 g/ℓ 또는 15 g/ℓ로 존재한다.

반응 과정 동안, 반응 혼합물의 pH가 변할 수 있다. 반응 혼합물의 pH는 원하는 pH 또는 원하는 pH 범위 내에서 유지될 수 있다. 이는 반응 전 및/또는 도중에 산이나 염기를 첨가하여 수행할 수 있다. 대안적으로, 완충액을 사용하여 pH를 조절할 수도 있다. 따라서, 일부 실시양태에서, 반응 조건은 완충제를 포함한다. 원하는 pH 범위를 유지하는 데 적합한 완충액은 관련 기술분야에 공지되어 있으며, 예를 들어 붕산염, 시트레이트 인산염, 인산염, 2-(N-모르폴리노)에탄술폰산(MES), 3-(N-모르폴리노)프로판술폰산(MOPS), 아세테이트, 트리에탄올아민(TEoA), 2-아미노-2-히드록시메틸-프로판-1,3-디올(Tris) 등을 포함하지만 이에 제한되지 않는다. 일부 실시양태에서, 완충제는 시트레이트 포스페이트 완충제이다. 공정의 일부 실시양태에서, 적합한 반응 조건은 약 0.01 내지 약 0.4 M, 0.05 내지 약 0.4 M, 0.1 내지 약 0.3 M, 또는 약 0.1 내지 약 0.2 M의 완충제(예를 들어, 시트레이트 포스페이트) 농도를 포함한다. 일부 실시양태에서, 반응 조건은 약 0.01, 0.02, 0.03, 0.04, 0.05, 0.07, 0.1, 0.12, 0.14, 0.16, 0.18, 0.2, 0.3 또는 0.4M의 완충제(예를 들어, 시트레이트 포스페이트) 농도를 포함한다.

일부 실시양태에서, 반응 조건은 습식 유기 용매를 포함한다. 적합한 습식 유기 용매는 관련 기술분야에 공지되어 있으며, 예를 들어 습식 이소프로필 알코올, 습식 톨루엔 및 습식 메틸 3급 부틸 에테르를 포함하지만 이에 제한되지 않는다.

공정의 실시양태에서, 반응 조건은 적합한 pH를 포함할 수 있다. 원하는 pH 또는 원하는 pH 범위는 산이나 염기, 적절한 완충제, 또는 완충제와 산이나 염기 첨가의 조합을 사용하여 유지될 수 있다. 반응 혼합물의 pH는 반응 전 및/또는 반응 과정 중에 제어될 수 있다. 일부 실시양태에서, 적합한 반응 조건은 pH 약 4 내지 약 10, pH 약 5 내지 약 10, pH 약 5 내지 약 9, pH 약 6 내지 약 9, 또는 pH 약 6 내지 약 8의 용액을 포함한다. 일부 실시양태에서, 반응 조건은 약 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5 또는 10의 용액 pH를 포함한다.

본원의 공정의 실시양태에서, 예를 들어 더 높은 온도에서의 반응 속도의 증가 및 반응 시간 동안 효소의 활성을 고려하여 반응 조건에 적합한 온도가 사용될 수 있다. 따라서, 일부 실시양태에서, 적합한 반응 조건은 약 10℃ 내지 약 60℃, 약 10℃ 내지 약 55℃, 약 15℃ 내지 약 60℃, 약 20℃ 내지 60℃, 약 20℃ 내지 약 55℃, 약 25℃ 내지 약 55℃ 또는 약 30℃ 내지 약 50℃의 온도를 포함한다. 일부 실시양태에서, 적합한 반응 조건은 약 10℃, 15℃, 20℃, 25℃, 30℃, 35℃, 40℃, 45℃, 50℃, 55℃ 또는 60℃의 온도를 포함한다. 일부 실시양태에서, 효소 반응 동안의 온도는 반응 과정 전반에 걸쳐 특정 온도로 유지될 수 있다. 일부 실시양태에서, 효소 반응 동안의 온도는 반응 과정 동안의 온도 프로파일에 따라 조정될 수 있다.

일부 실시양태에서, 적합한 반응 조건은 약 20 g/ℓ의 기질 알키닐 데옥시우리딘(화합물(2)), 약 15 g/ℓ의 기질 2-F-아데닌(화합물(3)), 약 0.05 g /ℓ의 NDT 폴리펩티드, 100mM 시트레이트 포스페이트, 약 pH 6, 및 약 45℃이다.

일부 실시양태에서, 반응 조건은 반응을 안정화하거나 향상시키기 위한 계면활성제를 포함할 수 있다. 계면활성제는 비이온성, 양이온성, 음이온성 및/또는 양친매성 계면활성제를 포함할 수 있다. 예시적인 계면활성제에는 예를 들어 노닐 페녹시폴리에톡실에탄올(NP40), 트리톤 X-100, 폴리옥시에틸렌-스테아릴아민, 세틸트리메틸암모늄 브로마이드, 나트륨 올레일아미도황산염, 폴리옥시에틸렌-소르비탄모노스테아레이트, 헥사데실디메틸아민 등이 포함되지만 이에 제한되지 않는다. 반응을 안정화하거나 향상시킬 수 있는 임의의 계면활성제가 이용될 수 있다. 반응에 사용되는 계면활성제의 농도는 일반적으로 0.1 내지 50 ㎎/㎖, 특히 1 내지 20 ㎎/㎖일 수 있다.

일부 실시양태에서, 반응 조건은 반응 용액이 혼합되거나 살포되는 경우와 같이 반응 용액에서 거품의 형성을 감소시키거나 방지하는 데 도움이 되는 소포제를 포함할 수 있다. 소포제에는 비극성 오일(예: 미네랄, 실리콘 등), 극성 오일(예: 지방산, 알킬 아민, 알킬 아미드, 알킬 황산염 등) 및 소수성(예: 처리된 실리카, 폴리프로필렌 등)이 포함되며, 이들 중 일부는 계면활성제로도 기능한다. 예시적인 소포제에는 Y-30®(Dow Corning), 폴리글리콜 공중합체, 옥시/에톡실화 알코올, 및 폴리디메틸실록산이 포함된다. 일부 실시양태에서, 약 0.001%(v/v) 내지 약 5%(v/v), 약 0.01%(v/v) 내지 약 5%(v/v), 약 0.1%(v/v) 내지 약 5%(v/v), 또는 약 0.1%(v/v) 내지 약 2%(v/v)로 존재할 수 있다. 일부 실시양태에서, 소포제는 반응을 촉진하기 위한 목적에 따라 약 0.001%(v/v), 약 0.01%(v/v), 약 0.1%(v/v), 약 0.5%(v/v), 약 0.001%(v/v), 1%(v/v), 약 2%(v/v), 약 3%(v/v), 약 4%(v/v), 또는 약 5%(v/v) 또는 그 이상으로 존재할 수 있다.

뉴클레오시드 교환 반응에 사용되는 반응물의 양은 일반적으로 원하는 생성물의 양 및 그에 따라 사용되는 기질의 양에 따라 달라질 것이다. 관련 기술분야의 기술자는 원하는 수준의 생산성 및 생산 규모에 맞춰 이들 양을 변화시키는 방법을 쉽게 이해할 것이다.

일부 실시양태에서, 반응물의 첨가 순서는 중요하지 않다. 반응물은 용매(예를 들어, 단상 용매, 2상 수성 공용매 시스템 등)에 동시에 첨가될 수 있거나, 대안적으로 반응물의 일부는 별도로 첨가될 수 있고 일부는 다른 시점에 함께 첨가될 수 있다.

고체 반응물(예를 들어, 효소, 염 등)은 분말(예를 들어, 동결건조, 분무 건조 등), 용액, 에멀젼, 현탁액 등을 포함한, 다양한 서로 다른 형태로 반응에 제공될 수 있다. 반응물은 관련 기술분야의 기술자에게 공지된 방법 및 장비를 사용하여 용이하게 동결건조되거나 분무 건조될 수 있다. 예를 들어, 단백질 용액을 작은 분취량으로 -80℃에서 냉동한 다음 미리 냉각된 동결 건조 챔버에 첨가한 다음, 진공을 적용할 수 있다.

수성 공용매 시스템을 사용할 때 혼합 효율을 향상시키기 위해, NDT 효소 및 보조인자를 먼저 첨가하고 수성 상에 혼합할 수 있다. 이어서, 유기상을 첨가하고 혼합한 후, PPM 효소 기질, 기타 효소(예를 들어 SP, DERA 및 PNP), 및 공동 기질을 첨가할 수 있다. 대안적으로, PPM 효소 기질은 수성 상에 첨가되기 전에 유기 상에 미리 혼합될 수 있다.

뉴클레오시드 교환 공정은 일반적으로 기질의 생성물로의 추가 전환이 반응 시간에 따라 크게 변하지 않을 때까지(예를 들어, 기질의 10% 미만이 전환되거나, 기질의 5% 미만이 전환됨) 진행되도록 허용된다. 일부 실시양태에서, 기질이 생성물로 완전하게 또는 거의 완전하게 전환될 때까지 반응이 진행되도록 허용된다. 기질에서 생성물로의 전환은 유도체화 여부에 관계없이 기질 및/또는 생성물을 검출함으로써 공지된 방법을 사용하여 모니터링할 수 있다. 적합한 분석 방법에는 가스 크로마토그래피, HPLC, MS 등이 포함된다.

공정의 일부 실시양태에서, 적합한 반응 조건은 적어도 약 5 g/ℓ, 10 g/ℓ, 20 g/ℓ, 30 g/ℓ, 40 g/ℓ, 50 g/ℓ, 60 g/ℓ, 70 g/ℓ, 100 g/ℓ, 또는 그 이상의 기질 부하량을 포함하며, 이 방법은 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 또는 그 이상의 기질을 생성물 화합물로 약 48시간 이하, 약 36시간 이하, 약 24시간 이하, 또는 약 3시간 이하 내에 전환시킨다.

조작된 NDT 폴리펩티드를 사용하여 기질 화합물을 생성물 화합물로 전환시키는 방법의 추가 실시양태에서, 적합한 반응 조건은 반응 용액에 초기 기질 부하량을 포함시킬 수 있으며, 이어서 반응 용액을 폴리펩티드와 접촉시킨다. 이어서, 이 반응 용액에 추가 기질 화합물을 시간 경과에 따른 연속 또는 회분식 첨가로서 적어도 약 1 g/ℓ/h, 적어도 약 2 g/ℓ/h, 적어도 약 4 g/ℓ/h, 적어도 약 6g/ℓ/h의 속도로 추가로 보충한다. 따라서, 이들 적합한 반응 조건에 따라, 폴리펩티드는 적어도 약 20g/ℓ, 30g/ℓ, 또는 40g/ℓ의 초기 기질 부하량을 갖는 용액에 첨가된다. 상기 폴리펩티드를 첨가한 후, 적어도 약 30g/ℓ, 40g/ℓ, 50g/ℓ, 60g/ℓ, 70g/ℓ, 100g/ℓ, 150g/ℓ, 200g/ℓ 또는 그 이상의 훨씬 더 높은 최종 기질 부하량에 도달할 때까지 약 2g/ℓ/h, 4g/ℓ/h, 또는 6g/ℓ/h의 속도로 추가 기질을 용액에 계속해서 첨가한다. 따라서, 본 공정의 일부 실시양태에서, 적합한 반응 조건은 초기 기질 부하량이 적어도 약 20g/ℓ, 30g/ℓ 또는 40g/ℓ인 용액에 폴리펩티드를 첨가한 후, 적어도 약 30 g/ℓ, 40 g/ℓ, 50g/ℓ, 60g/ℓ, 70g/ℓ, 100g/ℓ 또는 그 이상의 훨씬 더 높은 최종 기질 부하량에 도달할 때까지 약 2g/ℓ/h, 4g/ℓ/h, 또는 6g/ℓ/h의 속도로 추가 기질을 용액에 추가로 첨가하는 것을 포함한다. 이러한 기질 보충 반응 조건은 기질의 적어도 약 50%, 60%, 70%, 80%, 90% 또는 그 이상의 생성물로의 기질의 전환율을 높게 유지하면서 더 높은 기질 부하량을 달성할 수 있게 한다.

일부 실시양태에서, 반응 조건을 보충하기 위해 추가 반응 성분 또는 추가 기술이 수행된다. 여기에는 효소의 불활성화를 안정화 또는 방지하고, 생성물 억제를 감소시키고/시키거나 반응 평형을 생성물 형성으로 전환시키기 위한 조치를 취하는 것이 포함될 수 있다.

추가 실시양태에서, 기질 화합물을 생성물 화합물로 전환시키기 위한 임의의 상기 기재된 방법은 추출; 단리; 정제; 및/또는 생성물 화합물의 결정화로부터 선택되는 하나 이상의 단계를 추가로 포함할 수 있다. 상기 개시된 공정에 의해 생성된 생체촉매 반응 혼합물로부터 생성물을 추출, 단리, 정제 및/또는 결정화하기 위한 방법, 기법 및 프로토콜은 관련 기술분야의 기술자에게 공지되어 있고/있거나 일상적인 실험을 통해 접근할 수 있다. 또한, 예시적인 방법이 아래 실시예에 제공된다.

본 발명의 다양한 특징 및 구체예는 다음의 대표적인 실시예에 예시되어 있으며, 이는 예시를 위한 것이지 제한하려는 것이 아니다.

조작된 폴리펩티드를 코딩하는 조작된 NDT 폴리뉴클레오티드, 발현 벡터 및 숙주 세포

본 발명은 본원에 기술된 조작된 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공한다. 일부 실시양태에서, 폴리뉴클레오타이드는 유전자 발현을 제어하는 하나 이상의 이종 조절 서열에 작동가능하게 연결되어 상기 폴리펩티드를 발현할 수 있는 재조합 폴리뉴클레오타이드를 생성한다. 일부 실시양태에서, 조작된 효소 폴리펩티드(들)를 코딩하는 적어도 하나의 이종 폴리뉴클레오티드를 함유하는 발현 작제물은 상응하는 효소 폴리펩티드(들)를 발현하기 위해 적절한 숙주 세포 내로 도입된다.

관련 기술분야의 기술자에게 명백한 바와 같이, 단백질 서열의 이용가능성 및 다양한 아미노산에 상응하는 코돈에 대한 지식은 대상 폴리펩티드를 코딩할 수 있는 모든 폴리뉴클레오티드에 대한 설명을 제공한다. 동일한 아미노산이 대체 또는 동의어 코돈에 의해 코딩되는 유전자 코드의 축퇴성으로 인해 극도로 많은 수의 핵산이 만들어질 수 있으며, 이들 모두는 조작된 효소(예: NDT) 폴리펩티드를 코딩한다. 따라서, 본 발명은 가능한 코돈 선택에 기초하여 조합을 선택함으로써 본원에 기술된 효소 폴리펩티드를 코딩하는 제조될 수 있는 효소 폴리뉴클레오티드의 각각 및 모든 가능한 변이를 생산하기 위한 방법 및 조성물을 제공하며, 이러한 모든 변이는 실시예(예를 들어, 다양한 표)에 제시된 아미노산 서열을 포함하여 본원에 기술된 임의의 폴리펩티드에 대해 구체적으로 개시되어 있는 것으로 고려되어야 한다.

일부 실시양태에서, 코돈은 바람직하게는 단백질 생산을 위해 선택된 숙주 세포에 의한 활용을 위해 최적화된다. 예를 들어, 박테리아에서 사용되는 선호 코돈은 일반적으로 박테리아에서의 발현에 사용된다. 결과적으로, 조작된 효소 폴리펩티드를 코딩하는 코돈 최적화된 폴리뉴클레오티드는 전체 길이 코딩 영역 내 코돈 위치의 약 40%, 50%, 60%, 70%, 80%, 90% 또는 90% 초과에서 바람직한 코돈을 함유한다.

일부 실시양태에서, 효소 폴리뉴클레오티드는 본원에 개시된 특성을 갖는 효소 활성을 갖는 조작된 폴리펩티드를 코딩하며, 여기서 상기 폴리펩티드는 본원에 제공된 서열 번호로부터 선택된 기준 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 동일성을 갖는 아미노산 서열, 또는 임의의 변이체(예를 들어, 실시예에 제공된 것)의 아미노산 서열, 및 기준 폴리뉴클레오티드(들)과 비교하여 하나 이상의 잔기 차이, 또는 실시예에 개시된 바와 같은 임의의 변이체의 아미노산 서열(예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 아미노산 잔기 위치)을 포함한다. 일부 실시양태에서, 기준 폴리펩티드 서열은 서열번호: 4, 14 및/또는 126으로부터 선택된다.

일부 실시양태에서, 폴리뉴클레오티드는 매우 엄격한 조건 하에서 본원에 제공된 임의의 폴리뉴클레오티드 서열, 이의 상보체, 또는 본원에 제공된 임의의 변이체 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열로부터 선택된 기준 폴리뉴클레오티드 서열에 하이브리드화할 수 있다. 일부 실시양태에서, 매우 엄격한 조건 하에서 하이브리드화할 수 있는 폴리뉴클레오타이드는 기준 서열과 비교하여 하나 이상의 잔기 차이가 있는 아미노산 서열을 포함하는 효소 폴리펩티드를 코딩한다.

일부 실시양태에서, 본원의 임의의 조작된 효소 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드는 효소 폴리펩티드의 발현을 촉진하기 위해 다양한 방식으로 조작된다. 일부 실시양태에서, 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드는 효소 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 조절하기 위해 하나 이상의 제어 서열이 존재하는 발현 벡터를 포함한다. 벡터에 삽입하기 전에 단리된 폴리뉴클레오티드를 조작하는 것은 활용되는 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 활용하여 폴리뉴클레오타이드 및 핵산 서열을 변형하는 기술은 관련 분야에 잘 알려져 있다. 일부 실시양태에서, 제어 서열에는 특히 프로모터, 리더 서열, 폴리아데닐화 서열, 프로펩티드 서열, 신호 펩티드 서열, 및 전사 종결자가 포함된다. 일부 실시양태에서, 적합한 프로모터는 숙주 세포 선택에 기초하여 선택된다. 박테리아 숙주 세포의 경우, 본 개시내용의 핵산 작제물의 전사를 지시하기 위한 적합한 프로모터는 이. 콜리lac 오페론, 스트렙토마이세스 코엘리콜로(Streptomyces coelicolor) 아가라제 유전자 (dagA), 바실러스 서브틸리스(Bacillus subtilis) 레벤수크라제 유전자 (sacB), 바실러스 리체니포르미스(Bacillus licheniformis) 알파-아밀라제 유전자 (amyL), 바실러스 스테아로써모필루스(Bacillus stearothermophilus) 말토겐 아밀라제 유전자 (amyM), 바실러스 아밀로쿠에파시엔스(Bacillus amyloliquefaciens) 알파-아밀라제 유전자 (amyQ), 바실러스 리체니포르미스(Bacillus licheniformis) 페니실리나제 유전자 (penP), 바실러스 서브틸리스(Bacillus subtilis) xylA 및 xylB 유전자, 및 원핵 베타-락타마제 유전자 (예를 들어, 문헌: Villa-Kamaroff et al., Proc. Natl Acad. Sci. USA 75: 3727-3731 [1978] 참조)로부터 얻은 프로모터, 뿐만 아니라 tac 프로모터 (예를 들어, 문헌: DeBoer et al., Proc. Natl Acad. Sci. USA 80: 21-25 [1983] 참조)가 포함되나, 이들로 제한되는 것은 아니다. 사상균 숙주 세포에 대한 예시적인 프로모터에는 아스퍼길러스 오리자에(Aspergillus oryzae)TAKA 아밀라제, 리조무코르 미헤이(Rhizomucor miehei) 아스파르트산 프로테이나제, 아스퍼길러스 니거(Aspergillus niger) 중성 알파-아밀라제, 아스퍼길러스 니거 산 안정한 알파-아밀라제, 아스퍼길러스 니거 또는 아스퍼길러스 아와모리(Aspergillus awamori) 글루코아밀라제 (glaA), 리조무코르 미헤이 리파제, 아스퍼길러스 오리자에 알칼리성 프로테아제, 아스퍼길러스 오리자에 트리오스 포스페이트 이소머라제, 아스퍼길러스 니둘란스(Aspergillus nidulans) 아세트아미다제, 및 푸사리움 옥시포룸(Fusarium oxysporum) 트립신-유사 프로테아제(예를 들어, WO 96/00787 참조)에 대한 유전자로부터 얻은 프로모터, 뿐만 아니라 NA2-tpi 프로모터 (아스퍼길러스 니거 중성 알파-아밀라제와 아스퍼길러스 오리자에 트리오스 포스페이트 이소머라제에 대한 유전자로부터의 프로모터의 하이브리드), 및 이들의 돌연변이체, 절단형 및 하이브리드 프로모터가 포함되지만, 이들로 제한되는 것은 아니다. 예시적인 효모 세포 프로모터는 사카로마이세스 세레비시아에 에놀라제 (ENO-1), 사카로마이세스 세레비시아에 갈락토키나제 (GAL1), 사카로마이세스 세레비시아에 알코올 데하이드로게나제/글리세르알데히드-3-포스페이트 데하이드로게나제 (ADH2/GAP), 및 사카로마이세스 세레비시아제 3-포스포글리세레이트 키나제에 대한 유전자로부터 유래될 수 있다. 효모 숙주 세포에 대한 다른 유용한 프로모터는 관련 기술분야에 공지되어 있다(예를 들어, Romanos et al., Yeast 8:423-488 [1992] 참조).

일부 실시양태에서, 제어 서열은 또한 적합한 전사 종결자 서열(즉, 전사를 종결시키기 위해 숙주 세포에 의해 인식되는 서열)이다. 일부 실시양태에서, 종결자 서열은 효소 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 기능적인 임의의 적합한 종결자가 본 발명에 사용된다. 사상균 숙주 세포에 대한 예시적인 전사 종결자는 아스퍼길러스 오리자에 TAKA 아밀라제, 아스퍼길러스 니거 글루코아밀라제, 아스퍼길러스 니둘란스 안트라닐레이트 신타제, 아스퍼길러스 니거 알파-글루코시다제, 및 푸사리움 옥시포룸 트립신 유사 프로테아제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 예시적인 종결자는 사카로마이세스 세레비시아에 에놀라제, 사카로마이세스 세레비시아에 시토크롬 C(CYC1), 및 사카로마이세스 세레비시아에 글리세르알데히드-3-포스페이트 데하이드로게나제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 다른 유용한 종결자는 관련 기술분야에 공지되어 있다(예를 들어, Romanos et al., 상기 문헌 참조).

일부 실시양태에서, 제어 서열은 또한 적합한 리더 서열(즉, 숙주 세포에 의한 번역에 중요한 mRNA의 비번역된 영역)이다. 일부 실시양태에서, 리더 서열은 효소 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 기능적인 임의의 적합한 리더 서열이 본 발명에 사용된다. 사상균 숙주 세포의 예시적인 리더는 아스퍼길러스 오리자에 TAKA 아밀라제 및 아스퍼길러스 니둘란스 트리오스 포스페이트 이소머라제에 대한 유전자로부터 얻어진다. 효모 숙주 세포에 적합한 리더는 사카로마이세스 세레비시아에 에놀라제(ENO-1), 사카로마이세스 세레비시아에 3-포스포글리세레이트 키나제, 사카로마이세스 세레비시아에 알파 인자, 및 사카로마이세스 세레비시아에 알코올 데하이드로게나제/글리세르알데히드-3-인산 데하이드로게나제(ADH2/GAP)에 대한 유전자로부터 얻어진다.

일부 실시양태에서, 제어 서열은 또한 폴리아데닐화 서열(즉, 핵산 서열의 3' 말단에 작동가능하게 연결되고, 전사될 때 숙주 세포에 의해 폴리아데노신 잔기를 전사된 mRNA에 첨가하는 신호로서 인식되는 서열)이다. 선택된 숙주 세포에서 기능적인 임의의 적합한 폴리아데닐화 서열이 본 발명에 사용된다. 사상균 숙주 세포에 대한 예시적인 폴리아데닐화 서열에는 아스퍼길러스 오리자에 TAKA 아밀라제, 아스퍼길러스 니거 글루코아밀라제, 아스퍼길러스 니둘란스 안트라닐레이트 신타제, 푸사리움 옥시포룸 트립신 유사 프로테아제, 및 아스퍼길러스 니거 알파-글루코시다제에 대한 유전자가 포함되지만 이에 제한되지 않는다. 효모 숙주 세포에 유용한 폴리아데닐화 서열은 알려져 있다(예를 들어, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995] 참조).

일부 실시양태에서, 제어 서열은 또한 신호 펩티드(즉, 폴리펩티드의 아미노 말단에 연결된 아미노산 서열을 코딩하고 코딩된 폴리펩티드를 세포의 분비 경로로 지시하는 코딩 영역)이다. 일부 실시양태에서, 핵산 서열의 코딩 서열의 5' 말단은 분비된 폴리펩티드를 코딩하는 코딩 영역의 절편과 번역 판독 프레임에서 자연적으로 연결된 신호 펩티드 코딩 영역을 본질적으로 함유한다. 대안적으로, 일부 실시양태에서, 코딩 서열의 5' 말단은 코딩 서열에 대해 외래인 신호 펩티드 코딩 영역을 함유한다. 발현된 폴리펩티드를 선택된 숙주 세포의 분비 경로로 지시하는 임의의 적합한 신호 펩티드 코딩 영역은 조작된 폴리펩티드(들)의 발현에 사용된다. 박테리아 숙주 세포에 대한 효과적인 신호 펩티드 코딩 영역은 신호 펩티드 코딩 영역으로 바실러스 NClB 11837 말토겐 아밀라제, 바실러스 스테아로써모필러스 알파-아밀라제, 바실러스 리체니포르미스 서브틸리신, 바실러스 리체니포르미스 베타-락타마제, 바실러스 스테아로써모필러스 중성 프로테아제(nprT, nprS, nprM), 및 바실러스 서브틸리스 prsA에 대한 유전자로부터 얻은 것들을 포함하지만, 이들로 제한되지 않는다. 추가의 신호 펩티드는 관련 기술분야에 공지되어 있다(예를 들어, Simonen and Palva, Microbiol. Rev., 57:109-137 [1993] 참조). 일부 실시양태에서, 사상균 숙주 세포에 대한 효과적인 신호 펩티드 코딩 영역에는 아스퍼길러스 오리자에 TAKA 아밀라제, 아스퍼길러스 니거 중성 아밀라제, 아스퍼길러스 니거 글루코아밀라제, 리조무코르 미헤이 아스파르트 프로테이나제, 휴미콜라 인솔렌스(Humicola insolens) 셀룰라제, 및 휴미콜라 라누기노사(Humicola lanuginosa ) 리파제에 대한 유전자로부터 얻은 신호 펩티드 코딩 영역이 포함되지만, 이들로 제한되지 않는다. 효모 숙주 세포에 유용한 신호 펩티드에는 사카로마이세스 세레비시아제 알파-인자 및 사카로마이세스 세레비시아에 인버타제에 대한 유전자의 신호 펩티드가 포함되지만 이에 제한되지는 않는다.

일부 실시양태에서, 제어 서열은 또한 폴리펩티드의 아미노 말단에 위치하는 아미노산 서열을 코딩하는 프로펩티드 코딩 영역이기도 하다. 생성된 폴리펩티드는 "전효소", "프로폴리펩티드" 또는 "자이모겐"으로 지칭된다. 프로폴리펩티드는 프로폴리펩티드로부터 프로펩티드의 촉매적 또는 자가촉매적 절단에 의해 성숙한 활성 폴리펩티드로 전환될 수 있다. 프로펩티드 코딩 영역은 바실러스 서브틸리스 알칼리성 프로테아제(aprE), 바실러스 서브틸리스 중성 프로테아제(nprT), 사카로마이세스 세레비시아 알파-인자, 리조무코르 미헤이 아스파르틱 프로테이나제, 및 미셀리오프토라 써모필라(Myceliophthora thermophila) 락타제에 대한 유전자를 포함하지만 이에 제한되지 않는 임의의 적합한 공급원으로부터 얻을 수 있다(예를 들어, WO 95/33836 참조). 신호 펩티드 및 프로펩티드 영역 둘 모두가 폴리펩티드의 아미노 말단에 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단 옆에 위치하고, 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단 옆에 위치한다.

일부 실시양태에서, 조절 서열도 활용된다. 이들 서열은 숙주 세포의 성장과 관련된 폴리펩티드 발현의 조절을 촉진한다. 조절 시스템의 예로는 조절 화합물의 존재를 포함하여 화학적 또는 물리적 자극에 반응하여 유전자 발현이 켜지거나 꺼지는 시스템이 있다. 원핵 숙주 세포에서, 적합한 조절 서열에는 lac, tac 및 trp 작동인자 시스템이 포함되지만 이에 제한되지 않는다. 효모 숙주 세포에서 적합한 조절 시스템에는 ADH2 시스템 또는 GAL1 시스템이 포함되지만 이에 제한되지 않는다. 사상균에서 적합한 조절 서열에는 TAKA 알파-아밀라제 프로모터, 아스퍼길러스 니거 글루코아밀라제 프로모터, 및 아스퍼길러스 오리자에 글루코아밀라제 프로모터가 포함되지만 이에 제한되지 않는다.

또 다른 양태에서, 본 발명은 조작된 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 프로모터 및 종결자와 같은 하나 이상의 발현 조절 영역, 복제 기원 등과 이들이 도입될 숙주의 유형에 따라 포함하는 재조합 발현 벡터에 관한 것이다. 일부 실시양태에서, 본원에 기술된 다양한 핵산 및 제어 서열은 함께 연결되어 이러한 부위에서 효소 폴리펩티드를 코딩하는 핵산 서열의 삽입 또는 치환을 가능하게 하는 하나 이상의 편리한 제한 부위를 포함하는 재조합 발현 벡터를 생성한다. 대안적으로, 일부 실시양태에서, 본 발명의 핵산 서열은 핵산 서열 또는 상기 서열을 포함하는 핵산 작제물을 발현을 위한 적절한 벡터에 삽입함으로써 발현된다. 발현 벡터의 생성과 관련된 일부 실시양태에서, 코딩 서열은 코딩 서열이 발현을 위한 적절한 제어 서열과 작동가능하게 연결되도록 벡터에 위치한다.

재조합 발현 벡터는 재조합 DNA 절차에 편리하게 적용되어 효소 폴리뉴클레오티드 서열의 발현을 가져올 수 있는 임의의 적합한 벡터(예를 들어, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 일반적으로 벡터가 도입될 숙주 세포와 벡터의 호환성에 따라 달라진다. 벡터는 선형 또는 폐쇄형 원형 플라스미드일 수 있다.

일부 실시양태에서, 발현 벡터는 자율 복제 벡터이다(즉, 염색체외 실체로서 존재하는 벡터, 그의 복제는 염색체 복제와 무관함, 예를 들어 플라스미드, 염색체외 요소, 미니염색체 또는 인공 염색체). 벡터에는 자가 복제를 보장하는 수단이 포함될 수 있다. 일부 대안적인 실시양태에서, 벡터는 숙주 세포에 도입될 때 게놈에 통합되고, 통합된 염색체(들)와 함께 복제되는 벡터이다. 더욱이, 일부 실시양태에서, 숙주 세포의 게놈 내로 도입될 전체 DNA 및/또는 트랜스포존을 함께 함유하는 단일 벡터 또는 플라스미드, 또는 2개 이상의 벡터 또는 플라스미드가 활용된다.

일부 실시양태에서, 발현 벡터는 형질전환된 세포의 용이한 선택을 허용하는 하나 이상의 선택 가능한 마커를 함유한다. "선택 가능한 마커"는 살생물제 또는 바이러스 내성, 중금속에 대한 내성, 영양요구주에 대한 원영양성 등을 제공하는 생성물을 갖는 유전자이다. 박테리아 선택 가능한 마커의 예에는 바실러스 서브틸리스 또는 바실러스 리케니포르미스로부터의 dal 유전자, 또는 암피실린, 카나마이신, 클로르암페니콜 또는 테트라사이클린 내성과 같은 항생제 내성을 부여하는 마커가 포함되지만 이에 제한되지 않는다. 효모 숙주 세포에 적합한 마커에는 ADE2, HIS3, LEU2, LYS2, MET3, TRP1, 및 URA3이 포함되지만 이에 제한되지 않는다. 사상균 숙주 세포에 사용하기 위한 선택 가능한 마커에는 amdS(아세트아미다제, 예를 들어 에이. 니둘란스 또는 에이. 오리자에 유래), argB(오르니틴 카르바모일트랜스퍼라제), bar(포스피노트리신 아세틸트랜스퍼라제; 예를 들어 에스. 하이그로스코피쿠스(S. hygroscopicus)유래), hph(하이그로마이신 포스포트랜스퍼라제), niaD(질산염 환원효소), pyrG(오로티딘-5'-포스페이트 데카르복실라제, 예를 들어 에이. 니둘란스 또는 에이. 오리자에 유래), sC(황산염 아데닐트랜스퍼라제), 및 trpC(안트라닐레이트 신타제)뿐만 아니라 이의 등가물이 포함되지만 이에 제한되지 않는다.

또 다른 양태에서, 본 발명은 본 발명의 적어도 하나의 조작된 효소 폴리펩티드를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하며, 폴리뉴클레오티드(들)는 상기 숙주 세포에서 조작된 효소(들)의 발현을 위한 하나 이상의 제어 서열에 작동가능하게 연결된다. 본 발명의 발현 벡터에 의해 코딩된 폴리펩티드를 발현하는데 사용하기에 적합한 숙주 세포는 관련 기술분야에 잘 알려져 있고, 박테리아 세포, 예컨대 이. 콜리(E. coli), 비브리오 플루비알리스(Vibrio fluvialis), 스트렙토마이세스(Streptomyces) 및 살모넬라 타이피무리움(Salmonella typhimurium) 세포; 진균 세포, 예컨대 효모 세포 (예, 사카로마이세스 세레비지아에 또는 피키아 파스토리스 (ATCC Accession No. 201178)); 곤충 세포, 예컨대 드로스필라(Drosophila) S2 및 스포도프테라(Spodoptera) Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 Bowes 흑색종 세포; 및 식물 세포가 포함되지만, 이들로 제한되지 않는다. 예시적인 숙주 세포에는 또한 다양한 대장균 균주(예를 들어, W3110(ΔfhuA) 및 BL21)가 포함된다. 박테리아 선택 가능한 마커의 예에는 바실러스 서브틸리스 또는 바실러스 리케니포르미스로부터의 dal 유전자, 또는 암피실린, 카나마이신, 클로르암페니콜 및/또는 테트라사이클린 내성과 같은 항생제 내성을 부여하는 마커가 포함되지만 이에 국한되지 않는다.

일부 실시양태에서, 본 발명의 발현 벡터는 벡터의 숙주 세포 게놈 내로의 통합 또는 게놈과 무관한 세포 내 벡터의 자율 복제를 허용하는 요소(들)를 함유한다. 숙주 세포 게놈으로의 통합을 포함하는 일부 실시양태에서, 벡터는 상동성 또는 비상동성 재조합에 의해 벡터를 게놈으로 통합하기 위해 폴리펩티드를 코딩하는 핵산 서열 또는 벡터의 임의의 다른 요소에 의존한다.

일부 대안적인 실시양태에서, 발현 벡터는 상동성 재조합에 의한 숙주 세포의 게놈으로의 통합을 지시하기 위한 추가적인 핵산 서열을 함유한다. 추가 핵산 서열은 벡터가 염색체(들)의 정확한 위치(들)에서 숙주 세포 게놈에 통합될 수 있도록 한다. 정확한 위치에서 통합 가능성을 증가시키기 위해, 통합 요소는 바람직하게는 충분한 수의 뉴클레오티드, 예를 들어 100 내지 10,000개의 염기쌍, 바람직하게는 400 내지 10,000개의 염기쌍, 가장 바람직하게는 800 내지 10,000개의 염기쌍을 함유하며, 이는 상응하는 표적 서열과 고도로 상동성이어서 상동성 재조합 가능성을 향상시킨다. 통합 요소는 숙주 세포 게놈의 표적 서열과 상동성인 임의의 서열일 수 있다. 더욱이, 통합 요소는 비-코딩 또는 코딩 핵산 서열일 수 있다. 한편, 벡터는 비상동성 재조합에 의해 숙주 세포의 게놈에 통합될 수 있다.

자율 복제를 위해, 벡터는 벡터가 해당 숙주 세포에서 자율적으로 복제할 수 있게 하는 복제 기원을 추가로 포함할 수 있다. 박테리아 복제 기원의 예는 P15A ori 또는 플라스미드 pBR322, pUC19, pACYCl77(플라스미드에 P15A ori가 있음)의 복제 기원 또는 이. 콜리에서 복제를 허용하는 pACYC184 및 바실러스에서 복제를 허용하는 pUB110, pE194, 또는 pTA1060이다. 효모 숙주 세포에 사용하기 위한 복제 기원의 예는 2 마이크론 복제 기원, ARS1, ARS4, ARS1과 CEN3의 조합, 및 ARS4와 CEN6의 조합이다. 복제 기원은 숙주 세포에서 온도에 민감하게 기능하도록 하는 돌연변이를 갖는 것일 수 있다(예를 들어, Ehrlich, Proc. Natl. Acad. Sci. USA 75:1433 [1978] 참조).

일부 실시양태에서, 본 발명의 핵산 서열의 1개 이상의 카피가 숙주 세포에 삽입되어 유전자 생성물의 생산을 증가시킨다. 핵산 서열의 카피 수의 증가는 상기 서열 중 적어도 하나의 추가 카피를 숙주 세포 게놈에 통합하거나 증폭 가능한 선택 마커 유전자를 핵산 서열과 함께 포함시킴으로써 얻을 수 있으며, 여기서 세포는 선택 가능한 마커의 증폭된 카피를 포함하며, 이에 따라 핵산 서열의 추가적인 카피는 적절한 선별제의 존재 하에서 세포를 배양함으로써 선별될 수 있다.

본 발명에 사용하기 위한 다수의 발현 벡터는 시판된다. 적합한 상업적 발현 벡터에는 포유동물 숙주 세포에서의 발현을 위한 CMV 프로모터 및 hGH 폴리아데닐화 부위 및 pBR322 복제 기원 및 이. 콜리에서의 증폭을 위한 암피실린 내성 마커를 포함하는 p3xFLAGTM™ 발현 벡터(Sigma-Aldrich Chemicals)가 포함되지만 이에 제한되지 않는다. 다른 적합한 발현 벡터에는 pBluescriptII SK(-) 및 pBK-CMV(Stratagene), 및 pBR322(Gibco BRL), pUC(Gibco BRL), pREP4, pCEP4(Invitrogen) 또는 pPoly로부터 유래된 플라스미드가 포함되지만, 이들로 제한되지 않는다(참조: 예를 들어, Lathe et al., Gene 57:193-201 [1987]).

따라서, 일부 실시양태에서, 적어도 하나의 변이체 NDT를 코딩하는 서열을 포함하는 벡터는 벡터의 증식 및 변이체 NDT(들)의 발현을 허용하기 위해 숙주 세포로 형질전환된다. 일부 실시양태에서, 변이체 NDT는 번역 후 변형되어 신호 펩티드를 제거하고 일부 경우에는 분비 후에 절단될 수 있다. 일부 실시양태에서, 상기 기재된 형질전환 숙주 세포는 변이체 NDT(들)의 발현을 허용하는 조건 하에 적합한 영양 배지에서 배양된다. 적절한 보충제를 함유하는 최소 또는 복합 배지를 포함하지만 이에 제한되지 않는 숙주 세포 배양에 유용한 임의의 적합한 배지가 본 발명에 사용된다. 일부 실시양태에서, 숙주 세포는 HTP 배지에서 성장된다. 적합한 배지는 다양한 상업용 공급업체로부터 구입하거나 공개된 제조법(예: American Type Culture Collection 카탈로그)에 따라 제조할 수 있다.

또 다른 양태에서, 본 발명은 본원에 제공된 개선된 NDT 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하며, 폴리뉴클레오티드는 숙주 세포에서 NDT 효소의 발현을 위한 하나 이상의 제어 서열에 작동가능하게 연결되어 있다. 본 발명의 발현 벡터에 의해 코딩된 NDT 폴리펩티드를 발현하는데 사용하기 위한 숙주 세포는 관련 기술분야에 잘 알려져 있고, 이에 제한되지 않지만 박테리아 세포, 예컨대 대장균, 바실러스 메가테리움(Bacillus megaterium), 락토바실러스 케피르(Lactobacillus kefir), 스트렙토마이세스(Streptomyces) 및 살모넬라 티피무리움(Salmonella typhimurium) 세포; 진균 세포, 예컨대 효모 세포(예, 사카로마이세스 세레비지아에 또는 피키아 파스토리스(ATCC 수탁번호 제201178호); 곤충 세포, 예컨대 드로소필라 S2 및 스포도프테라 Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 Bowes 흑색종 세포; 및 식물세포를 포함한다. 상기 숙주 세포에 대한 적절한 배양 배지 및 성장 조건은 관련 기술분야에 잘 알려져 있다.

NDT의 발현을 위한 폴리뉴클레오티드는 관련 기술분야에 공지된 다양한 방법에 의해 세포 내로 도입될 수 있다. 기술에는 무엇보다도 전기천공, 생물학적 입자 충격, 리포솜 매개 형질감염, 염화칼슘 형질감염 및 원형질체 융합이 포함된다. 폴리뉴클레오티드를 세포 내로 도입하는 다양한 방법은 관련 기술분야의 기술자에게 공지되어 있다.

일부 실시양태에서, 숙주 세포는 진핵 세포이다. 적합한 진핵 숙주 세포에는 진균 세포, 조류 세포, 곤충 세포, 및 식물 세포가 포함되나 이에 제한되지는 않는다. 적합한 진균 숙주 세포에는 자낭균류(Ascomycota), 담자균류(Basidiomycota), 중수균류(Deuteromycota), 접합균류(Zygomycota), 불완전균류( Fungi imperfecti)가 포함되나 이에 제한되지 않는다. 일부 실시양태에서, 진균 숙주 세포는 효모 세포 및 사상균 세포이다. 본 발명의 사상균 숙주 세포는 세분류인 진균류(Eumycotina) 및 난균류(Oomycota)의 모든 사상 형태를 포함한다. 사상균은 키틴, 셀룰로오스 및 기타 복합 다당류로 구성된 세포벽을 가진 영양 균사체가 특징이다. 본 발명의 사상균 숙주 세포는 형태학적으로 효모와 구별된다.

본 발명의 일부 실시양태에서, 사상균 숙주 세포는 아클리야(Achlya), 아크레모니움(Acremonium), 아스퍼길러스, 아우레오바시디움(Aureobasidium), 베르칸데라(Bjerkandera), 세리포리오프시스(Ceriporiopsis), 세팔로스포리움(Cephalosporium), 크라이소스포리움(Chrysosporium), 코클리오볼루스(Cochliobolus), 코리나스쿠스(Corynascus), 크리포넥트리아(Cryphonectria), 크립토코커스(Cryptococcus), 코프리누스(Coprinus), 코리올루스(Coriolus), 디플로디아(Diplodia), 엔도티스(Endothis), 푸사리움(Fusarium), 지베렐라(Gibberella), 글리오클라디움(Gliocladium), 휴미콜라(Humicola), 하이포크레아(Hypocrea), 마이셀리오프토라(Myceliophthora), 뮤코르(Mucor), 뉴로스포라(Neurospora), 페니실리움(Penicillium), 포도스포라(Podospora), 플레비아(Phlebia), 피로마이세스(Piromyces), 피리쿨라리아(Pyricularia), 리조뮤코르(Rhizomucor), 리조푸스(Rhizopus), 쉬조필룸(Schizophyllum), 스키탈리디움(Scytalidium), 스포로트리쿰(Sporotrichum), 탈라로마이세스(Talaromyces), 테르모아스쿠스(Thermoascus), 티엘라비아(Thielavia), 트라메테스(Trametes), 톨리포클라디움(Tolypocladium), 트리코데르마(Trichoderma), 베르티실리움(Verticillium), 및/또는 볼바리엘라(Volvariella), 및/또는 유성생식형, 또는 무성생식형, 이들의 통속명, 기본명, 또는 분류학상 등가물을 포함하지만, 이들로 제한되지 않는, 임의의 적합한 유전자 및 종 중 하나이다.

본 발명의 일부 실시양태에서, 숙주 세포는 칸디다(Candida), 한세눌라(Hansenula), 사카로마이세스, 쉬조사카로마이세스(Schizosaccharomyces), 피키아, 클루이베로마이세스(Kluyveromyces) 또는 야로위아(Yarrowia) 종의 세포를 포함하지만 이에 제한되지 않는 효모 세포이다. 본 발명의 일부 실시양태에서, 효모 세포는 한세눌라 폴리모르파(Hansenula polymorpha), 사카로마이세스 세레비지아에, 사카로마이세스 칼스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 쉬조사카로마이세스 폼베(Schizosaccharomyces pombe), 피키아 파스토리스, 피키아 핀란디카(Pichia finlandica), 피키아 트레할로필라(Pichia trehalophila), 피키아 코다마에(Pichia kodamae), 피키아 멤브라나에파시엔스(Pichia membranaefaciens), 피키아 오푼티아에(Pichia opuntiae), 피키아 써모톨레란스(Pichia thermotolerans), 피키아 살리크타리아(Pichia salictaria), 피키아 퀘르쿠움(Pichia quercuum), 피키아 피페리(Pichia pijperi), 피키아 스티피티스(Pichia stipitis), 피키아 메탄올리카(Pichia methnolica), 피키아 안구스타(Pichia angusta), 클루이베로마이세스 락티스(Kluyveromyces lactis), 칸디다 알비칸스(Candida albicans), 또는 야로위아 리폴리티카(Yarrowia liplytica)이다.

본 발명의 일부 실시양태에서, 숙주 세포는 클라미도모나스(예를 들어, C. reinhardtii) 및 포르미디움(P. sp. ATCC29409)과 같은 조류 세포이다.

일부 다른 실시양태에서, 숙주 세포는 원핵 세포이다. 적합한 원핵 세포에는 그람 양성, 그람 음성 및 그람 가변 박테리아 세포가 포함되지만 이에 제한되지 않는다. 임의의 적합한 박테리아 유기체가 본 발명에서 사용되며, 여기에는 아그로박테리움(Agrobacterium), 알리사이클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르트로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부크네라(Buchnera), 캄페스트리스(Campestris), 캄필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로코쿠스(Coprococcus), 에쉐리키아(Escherichia), 엔테로코커스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실러스(Geobacillus), 해모필러스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 일리오박터(Ilyobacter), 마이크로코커스(Micrococcus), 마이크로박테리움(Microbacterium), 메소리조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판토에아(Pantoea), 슈도모나스(Pseudomonas), 프로클로로코커스(Prochlorococcus), 로도박터(Rhodobacter), 로도슈도모나스(Rhodopseudomonas), 로도슈도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴리움(Rhodospirillum), 로도코커스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스, 스트렙토코커스(Streptococcus), 시네코커스(Synecoccus), 사카로모노스포라(Saccharomonospora), 스태필로코커스(Staphylococcus), 세라티아(Serratia), 살모넬라, 쉬겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네초코커스(Thermosynechococcus), 써모코커스(Thermococcus), 우레아플라스마(Ureaplasma), 크산토모나스(Xanthomonas), 크실렐라(Xylella), 예르시니아(Yersinia) 및 자이모모나스(Zymomonas)가 포함되지만, 이들로 제한되지 않는다. 일부 실시양태에서, 박테리아 숙주 균주는 인간에게 비-병원성이다. 일부 실시양태에서, 박테리아 숙주 균주는 산업용 균주이다. 수많은 산업용 박테리아 균주가 알려져 있고 본 발명에 적합하다. 본 발명의 일부 실시양태에서, 박테리아 숙주 세포는 아그로박테리움 종(예를 들어, 에이. 라디오박터(A. radiobacter), 에이. 리조게네스(A. rhizogenes) 및 에이. 루비(A. rubi))이다. 본 발명의 일부 실시양태에서, 박테리아 숙주 세포는 아르트로박터(Arthrobacter) 종 (예를 들어, 에이. 아우레센스(A. aurescens), 에이. 시트레우스(A. citreus), 에이. 글로비포르미스(A. globiformis), 에이. 하이드로카르보글루타미쿠스(A. hydrocarboglutamicus), 에이. 마이소렌스(A. mysorens), 에이. 니코티아나에(A. nicotianae), 에이. 파라피네우스(A. paraffineus), 에이. 프로토폰니아에(A. protophonniae), 에이. 로세오파라피누스(A. roseoparqffinus), 에이. 술푸레오스(A. sulfureus), 및 에이. 우레아파시엔스(A. ureafaciens))이다. 본 발명의 일부 실시양태에서, 박테리아 숙주 세포는 바실러스 종(예를 들어, 비. 투링겐시스(B. thuringensis), 비. 안트라시스(B. anthracis), 비. 메가테리움, 비. 서브틸리스, 비. 렌투스(B. lentus), 비. 시르쿨란스(B. circulans), 비. 푸밀루스, 비. 라우투스(B. lautus), 비. 코아굴란스(B.coagulans), 비. 브레비스(B. brevis), 비. 피르무스(B. firmus), 비. 알카오피우스(B. alkaophius), 비. 리체니포르미스, 비. 클라우시이(B. clausii), 비. 스테아로써모필루스, 비. 할로두란스(B. halodurans), 및 비. 아밀로리퀘파시엔스(B. amyloliquefaciens))이다. 일부 실시양태에서, 숙주 세포는 다음: 비. 서브틸리스, 비. 푸밀루스, 비. 리체니포르미스. 비. 메가테리움, 비. 클라우시이, 비. 스테아로써모필루스, 또는 비. 아밀로리퀘파시엔스를 포함하지만 이에 제한되지 않는 산업용 바실러스 균주이다. 일부 실시양태에서, 바실러스 숙주 세포는 다음: 비. 서브틸리스, 비. 리체니포르미스, 비.메가테리움, 비. 스테아로써모필루스, 및/또는 비. 아밀로리퀘파시엔스이다. 일부 실시양태에서, 박테리아 숙주 세포는 클로스트리디움 종(예를 들어, 씨. 아세토부틸리쿰(C. acetobutylicum), 씨. 테타니(C. tetani) E88, 씨. 리투세부렌세(C. lituseburense), 씨. 사카로부틸리쿰(C. saccharobutylicum), 씨. 페르프링겐스(C. perfringens), 및 씨. 베이예링키이(C. beijerinckii))이다. 일부 실시양태에서, 박테리아 숙주 세포는 코리네박테리움 종(예를 들어, 씨. 글루타미쿰(C. glutamicum) 및 씨. 아세토아시도필룸(C. acetoacidophilum))이다. 일부 실시양태에서 박테리아 숙주 세포는 에스케리키아 종(예를 들어, 이. 콜리)이다. 일부 실시양태에서, 숙주 세포는 에스케리키아 콜리 W3110이다. 일부 실시양태에서, 박테리아 숙주 세포는 에르위니아 종(예를 들어, 이. 우레도보라(E. uredovora), 이. 카로토보라(E. carotovora), 이. 아나나스(E. ananas), 이. 허비콜라(E. herbicola), 이. 푼크타타(E. punctata), 및 이. 테레우스(E. terreus))이다. 일부 실시양태에서, 박테리아 숙주 세포는 판토에아(Pantoea) 종(예를 들어, 피. 시트레아(P. citrea), 및 피. 아글로메란스(P. agglomerans))이다. 일부 실시양태에서 박테리아 숙주 세포는 슈도모나스 종(예를 들어, 피. 푸티다(P. putida), 피. 아레우기노사(P. aeruginosa), 피. 메발로니이(P. mevalonii), 및 P. sp. D-0l 10)이다. 일부 실시양태에서, 박테리아 숙주 세포는 스트렙토코커스 종(예를 들어, 에스. 에퀴시밀레스(S. equisimiles), 에스. 피오게네스(S. pyogenes), 및 에스. 우베리스(S. uberis))이다. 일부 실시양태에서, 박테리아 숙주 세포는 스트렙토마이세스 종(예를 들어, 에스. 암보파시엔스(S. ambofaciens), 에스. 아크로모게네스(S. achromogenes), 에스. 아베르미틸리스(S. avermitilis), 에스. 코엘리콜라(S. coelicolor), 에스. 아우레파시엔스(S. aureofaciens), 에스. 아우레우스(S. aureus), 에스. 풍기시디쿠스(S. fungicidicus), 에스. 그리세우스(S. griseus), 및 에스. 리비단스(S. lividans))이다. 일부 실시양태에서, 박테리아 숙주 세포는 자이모모나스 종(예를 들어, 제트. 모빌리스(Z. mobilis), 및 제트. 리폴리티카(Z. lipolytica))이다.

본 발명에 사용되는 많은 원핵 및 진핵 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 농업 연구청 특허 배양 컬렉션, 북부 지역 연구 센터(NRRL)와 같은 다수의 배양 컬렉션으로부터 대중에게 쉽게 입수할 수 있다.

일부 실시양태에서, 숙주 세포는 단백질 분비, 단백질 안정성 및/또는 단백질의 발현 및/또는 분비에 바람직한 기타 특성을 개선하는 특징을 갖도록 유전적으로 변형된다. 유전적 변형은 유전공학 기술 및/또는 고전적인 미생물학적 기술(예: 화학적 또는 UV 돌연변이 유발 및 후속 선택)을 통해 달성될 수 있다. 실제로, 일부 실시양태에서, 재조합 변형과 고전적 선택 기술의 조합이 숙주 세포를 생산하는 데 사용된다. 재조합 기술을 사용하여, 핵산 분자는 숙주 세포 및/또는 배양 배지 내에서 NDT 변이체의 수율을 증가시키는 방식으로 도입, 결실, 억제 또는 변형될 수 있다. 예를 들어, Alp1 기능의 녹아웃은 프로테아제가 결핍된 세포를 초래하고, pyr5 기능의 녹아웃은 피리미딘 결핍 표현형을 갖는 세포를 초래한다. 한 유전 공학적 접근 방식에서는 상동 재조합을 사용하여 생체 내에서 유전자를 특이적으로 표적화하여 코딩된 단백질의 발현을 억제함으로써 표적 유전자 변형을 유도한다. 대안적 접근법에서는 siRNA, 안티센스 및/또는 리보자임 기술이 유전자 발현을 억제하는 데서의 용도가 발견되었다. 단백질을 코딩하는 유전자의 전부 또는 일부의 결실 및 유전자 생성물의 발현 또는 활성을 방해하는 부위 특이적 돌연변이 유발을 포함하지만 이에 제한되지 않는, 세포에서 단백질의 발현을 감소시키기 위한 다양한 방법이 공지되어 있다(예를 들어, Chaveroche et al., Nucl. Acids Res., 28:22 e97 [2000]; Cho et al., Molec. Plant Microbe Interact., 19:7-15 [2006]; Maruyama and Kitamoto, Biotechnol Lett., 30:1811-1817 [2008]; Takahashi et al., Mol. Gen. Genom., 272: 344-352 [2004]; 및 You et al., Arch. Microbiol., 191:615-622 [2009]를 참조하며, 이들 모두는 본원에 참고로 포함된다). 무작위 돌연변이 유발 후 원하는 돌연변이에 대한 스크리닝 또한 용도가 발견되었다(예를 들어, Combier et al., FEMS Microbiol. Lett., 220:141-8 [2003]; 및 Firon et al., Eukary. Cell 2:247-55 [2003] 참조, 이 둘 모두 참조로 포함됨).

숙주 세포 내로 벡터 또는 DNA 작제물 도입은 인산칼슘 형질감염, DEAE-덱스트란 매개 형질감염, PEG 매개 형질전환, 전기천공 또는 관련 기술분야에 공지된 다른 기술을 포함하나 이에 제한되지 않는 관련 기술분야에 공지된 임의의 적합한 방법을 사용하여 달성될 수 있다. 일부 실시양태에서, 에스케리키아 콜리 발현 벡터 pCK100900i(본원에 참고로 포함된 미국 특허 제9,714,437호 참조)가 사용된다.

일부 실시양태에서, 본 발명의 조작된 숙주 세포(즉, "재조합 숙주 세포")는 프로모터 활성화, 형질전환체 선택, 또는 NDT 폴리뉴클레오티드 증폭을 위해 적절하게 변형된 통상적인 영양 배지에서 배양된다. 온도, pH 등과 같은 배양 조건은 발현을 위해 선택된 숙주 세포에 대해 이전에 사용된 조건이며, 관련 기술분야의 기술자에게 잘 알려져 있다. 언급한 바와 같이, 박테리아, 식물, 동물(특히 포유류) 및 고세균 기원의 세포를 포함하여 많은 세포의 배양 및 생산에 대해 많은 표준 참고자료와 텍스트를 이용할 수 있다.

일부 실시양태에서, 본 발명의 변이체 NDT 폴리펩티드를 발현하는 세포는 회분식 또는 연속 발효 조건 하에서 성장된다. 고전적인 "회분식 발효"는 폐쇄형 시스템으로, 배지의 조성이 발효 초기에 설정되고 발효 중에 인위적으로 변경되지 않는다. 회분식 시스템의 변형은 본 발명에서도 사용되는 "유가식 발효(fed-batch fermentation)"이다. 이 변형에서는 발효가 진행됨에 따라 기질이 점차적으로 추가된다. 유가식 시스템은 이화물질 억제가 세포의 대사를 억제할 가능성이 있고 배지에 기질의 양을 제한하는 것이 바람직한 경우에 유용하다. 회분식 및 유가식 발효는 일반적이며 관련 기술분야에 잘 알려져 있다. "연속 발효"는 정의된 발효 배지가 생물반응기에 연속적으로 추가되고 동일한 양의 조절된 배지가 처리를 위해 동시에 제거되는 개방형 시스템이다. 연속 발효는 일반적으로 세포가 주로 대수기 성장에 있는 일정한 고밀도로 배양을 유지한다. 연속 발효 시스템은 안정적인 성장 조건을 유지하기 위해 노력한다. 연속 발효 공정을 위한 영양분 및 성장 인자를 조절하는 방법뿐만 아니라 생성물 형성 속도를 최대화하는 기술은 산업 미생물학 분야에 잘 알려져 있다.

본 발명의 일부 실시양태에서, 무세포 전사/번역 시스템은 변이체 NDT(들)을 생성하는데 사용된다. 몇몇 시스템이 상업적으로 이용 가능하며 이 방법은 관련 분야의 기술자에게 잘 알려져 있다.

본 발명은 변이체 NDT 폴리펩티드 또는 이의 생물학적 활성 단편을 제조하는 방법을 제공한다. 일부 실시양태에서, 상기 방법은 서열번호: 4, 14, 및/또는 126과 적어도 약 70%(또는 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%)의 서열 동일성을 포함하는 아미노산 서열을 코딩하며, 본원에 제공된 바와 같은 적어도 하나의 돌연변이를 포함하는 폴리뉴클레오티드로 형질전환된 숙주 세포를 제공하는 단계; 숙주 세포가 코딩된 변이체 NDT 폴리펩티드를 발현하는 조건 하에 배양 배지에서 상기 형질전환된 숙주 세포를 배양하는 단계; 및 선택적으로 발현된 변이체 NDT 폴리펩티드를 회수 또는 단리하고/하거나 발현된 변이체 NDT 폴리펩티드를 함유하는 배양 배지를 회수 또는 단리하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 코딩된 NDT 폴리펩티드를 발현한 후 형질전환된 숙주 세포를 선택적으로 용해시키고, 선택적으로 세포 용해물로부터 발현된 변이체 NDT 폴리펩티드를 회수 및/또는 단리하는 단계를 추가로 제공한다. 본 발명은 또한 변이체 NDT 폴리펩티드의 생산에 적합한 조건 하에서 변이체 NDT 폴리펩티드로 형질전환된 숙주 세포를 배양하는 단계 및 변이체 NDT 폴리펩티드를 회수하는 단계를 포함하는 변이 NDT 폴리펩티드를 제조하는 방법을 제공한다. 일반적으로 NDT 폴리펩티드의 회수 또는 단리는 본원에 기술된 것을 포함하여 관련 분야에 잘 알려진 단백질 회수 기술을 사용하여 숙주 세포 배양 배지, 숙주 세포 또는 둘 모두로부터 이루어진다. 일부 실시양태에서, 숙주 세포는 원심분리에 의해 수확되고, 물리적 또는 화학적 수단에 의해 파괴되며, 생성된 조 추출물은 추가 정제를 위해 유지된다. 단백질 발현에 사용되는 미생물 세포는 동결-해동 순환, 초음파 처리, 기계적 파괴, 및/또는 세포 용해제의 사용을 포함하지만 이에 제한되지 않는 임의의 편리한 방법뿐만 아니라 관련 분야의 기술자에게 잘 알려진 많은 다른 적합한 방법에 의해 파괴될 수 있다.

숙주 세포에서 발현된 조작된 NDT 효소는 리소자임 처리, 초음파 처리, 여과, 염석, 초원심분리, 및 크로마토그래피를 비롯한 단백질 정제를 위해 관련 분야에 공지된 기술 중 하나 이상을 사용하여 세포 및/또는 배양 배지로부터 회수될 수 있다. E. coli와 같은 박테리아로부터 단백질을 용해하고 고효율로 추출하는 데 적합한 솔루션은 CelLytic B^TM(Sigma-Aldrich)이라는 상표명으로 시판되고 있다. 따라서, 일부 실시양태에서, 생성된 폴리펩티드는 회수/분리되고 선택적으로 관련 분야에 공지된 다수의 방법에 의해 정제된다. 예를 들어, 일부 실시양태에서, 폴리펩티드는 원심분리, 여과, 추출, 분무 건조, 증발, 크로마토그래피(예를 들어, 이온 교환, 친화성, 소수성 상호작용, 크로마토포커싱, 및 크기 배제), 또는 침전을 포함하지만 이에 제한되지 않는 통상의 절차에 의해 영양 배지로부터 단리된다. 일부 실시양태에서, 성숙한 단백질의 배열을 완성하는데 있어서 원하는 대로 단백질 재폴딩 단계가 사용된다. 또한, 일부 실시양태에서, 고성능 액체 크로마토그래피(HPLC)가 최종 정제 단계에 사용된다. 예를 들어, 일부 실시양태에서, 관련 분야에 공지된 방법이 본 발명에 사용된다(예를 들어, Parry et al., Biochem. J., 353:117 [2001]; 및 Hong et al., Appl. Microbiol. Biotechnol., 73:1331 [2007] 참조; 둘 다 본원에서 참고로 포함됨). 실제로, 관련 분야에 공지된 임의의 적합한 정제 방법이 본 발명에 사용된다.

NDT 폴리펩티드를 단리하기 위한 크로마토그래피 기술에는 역상 크로마토그래피, 고성능 액체 크로마토그래피, 이온 교환 크로마토그래피, 겔 전기영동, 및 친화성 크로마토그래피가 포함되지만 이에 제한되지 않는다. 특정 효소를 정제하기 위한 조건은 부분적으로 관련 분야의 기술자에게 공지된 바와 같이 순 전하, 소수성, 친수성, 분자량, 분자 모양 등과 같은 요인에 따라 달라질 것이다.

일부 실시양태에서, 친화성 기술은 개선된 NDT 효소를 단리하는 데 사용된다. 친화성 크로마토그래피 정제를 위해 NDT 폴리펩티드에 특이적으로 결합하는 임의의 항체가 사용될 수 있다. 항체 생산을 위해 토끼, 마우스, 래트 등을 포함하지만 이에 제한되지 않는 다양한 숙주 동물에 NDT를 주사하여 면역화할 수 있다. NDT 폴리펩티드는 측쇄 작용기 또는 측쇄 작용기에 부착된 링커에 의해 BSA와 같은 적합한 담체에 부착될 수 있다. 면역학적 반응을 증가시키기 위해 숙주 종에 따라 프로인트(완전 및 불완전), 수산화알루미늄과 같은 미네랄 겔, 리소레시틴과 같은 표면 활성 물질, 플루로닉 폴리올, 폴리음이온, 펩티드, 오일 에멀젼, 키홀 림펫 헤모시아닌, 디니트로페놀 및 BCG(Bacillus Calmette Guerin) 및 코리네박테리움 파르붐(Corynebacterium parvum)을 포함하지만 이들로 제한되지 않는, 다양한 애주번트가 숙주 종에 따라 면역학적 반응을 증가시키기 위하여 사용될 수 있다.

일부 실시양태에서, NDT 변이체는 효소를 발현하는 세포의 형태로, 조추출물로서, 또는 단리되거나 정제된 제제로서 제조되고 사용된다. 일부 실시양태에서 NDT 변이체는 동결건조물, 분말 형태(예: 아세톤 분말)로 제조되거나 효소 용액으로 제조된다. 일부 실시양태에서, NDT 변이체는 실질적으로 순수한 제제의 형태이다.

일부 실시양태에서, NDT 폴리펩티드는 임의의 적합한 고체 기판에 부착된다. 고체 기판에는 고체상, 표면, 및/또는 막이 포함되지만 이에 제한되지 않는다. 고체 지지체에는 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시, 및 폴리아크릴아미드와 같은 유기 중합체뿐만 아니라 이들의 공중합체 및 그래프트가 포함되지만 이에 제한되지 않는다. 고체 지지체는 유리, 실리카, 제어된 공극 유리(CPG), 역상 실리카 또는 금이나 백금과 같은 금속과 같은 무기물일 수도 있다. 기질의 구조는 비드, 구형, 입자, 과립, 겔, 막 또는 표면의 형태일 수 있다. 표면은 평면형, 실질적으로 평면형 또는 비평면형일 수 있다. 고체 지지체는 다공성 또는 비다공성일 수 있으며 팽윤 또는 비팽창 특성을 가질 수 있다. 고체 지지체는 웰, 함몰 또는 기타 용기, 베슬, 피쳐 또는 위치의 형태로 구성될 수 있다. 복수의 지지체는 시약의 로봇식 운반을 위해 또는 검출 방법 및/또는 기구에 의해 주소 지정이 가능한 다양한 위치의 어레이에 구성될 수 있다.

일부 실시양태에서, NDT 변이체를 정제하기 위해 면역학적 방법이 사용된다. 한 가지 접근법에서, 야생형 또는 변이체 NDT 폴리펩티드(예를 들어, 서열번호: 4, 14, 및/또는 126 중 어느 하나를 포함하는 폴리펩티드, 및/또는 이의 변이체, 및/또는 면역원성 단편에 대해)에 대해 발생된 항체를 통상적인 방법을 사용하여 비드에 고정시키고, 변이체 NDT가 결합된 조건 하에서 세포 배양 배지와 혼합하여 침전시킨다. 관련된 접근법으로, 면역크로마토그래피가 사용된다.

일부 실시양태에서, 변이체 NDT는 비효소 부분을 포함하는 융합 단백질로서 발현된다. 일부 실시양태에서, 변이체 NDT 서열은 정제 촉진 도메인에 융합된다. 본원에 사용된 바와 같이, 용어 "정제 촉진 도메인"은 융합된 폴리펩티드의 정제를 매개하는 도메인을 지칭한다. 적합한 정제 도메인에는 금속 킬레이팅 펩티드, 고정화된 금속에서 정제를 허용하는 히스티딘-트립토판 모듈, 글루타티온(예: GST)과 결합하는 서열, 헤마글루티닌(HA) 태그(인플루엔자 헤마글루티닌 단백질로부터 유래되는 에피토프에 해당함; 예를 들어, Wilson et al., Cell 37:767 [1984] 참조), 말토스 결합 단백질 서열, FLAGS 연장/친화성 정제 시스템(예를 들어, Immunex Corp에서 입수 가능한 시스템)에 활용되는 FLAG 에피토프 등이 포함되지만 이에 제한되지 않는다. 본원에 기술된 조성물 및 방법에 사용하기 위해 고려되는 하나의 발현 벡터는 엔테로키나제 절단 부위에 의해 분리된 폴리히스티딘 영역에 융합된 본 발명의 폴리펩티드를 포함하는 융합 단백질의 발현을 제공한다, 히스티딘 잔기는 IMIAC(고정된 금속 이온 친화성 크로마토그래피; 예를 들어, 문헌: Porath et al., Prot. Exp. Purif., 3:263-281 [1992] 참조)에서 정제를 촉진하는 반면, 엔테로키나제 절단 부위는 융합 단백질로부터 NDT 폴리펩티드 변이체를 분리하기 위한 수단을 제공한다. pGEX 벡터(Promega)는 또한 글루타티온 S-트랜스퍼라제(GST)와의 융합 단백질로서 외래 폴리펩티드를 발현하는데 사용될 수 있다. 일반적으로, 이러한 융합 단백질은 가용성이며 리간드-아가로스 비드(예: GST 융합의 경우 글루타티온-아가로스)에 흡착한 후 유리 리간드가 있는 경우 용출하여 용해된 세포로부터 쉽게 정제될 수 있다.

따라서, 또 다른 양태에서, 본 발명은 조작된 효소 폴리펩티드를 생산하는 방법을 제공하며, 여기서 이 방법은 조작된 효소 폴리펩티드를 코딩하는 폴리뉴클레오티드를 발현할 수 있는 숙주 세포를 폴리펩티드의 발현에 적합한 조건 하에서 배양하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 본원에 기재된 바와 같이 효소 폴리펩티드를 단리 및/또는 정제하는 단계를 추가로 포함한다.

숙주 세포에 대한 적절한 배양 배지 및 성장 조건은 관련 분야에 잘 알려져 있다. 효소 폴리펩티드의 발현을 위한 폴리뉴클레오티드를 세포 내로 도입하기 위한 임의의 적합한 방법이 본 발명에 사용될 것으로 고려된다. 적합한 기술에는 전기천공법, 생물학적 입자 충격, 리포솜 매개 형질감염, 염화칼슘 형질감염, 및 원형질체 융합이 포함되지만 이에 제한되지 않는다.

본 발명의 다양한 특징 및 실시양태는 하기 대표적인 실시예에 예시되어 있으며, 이는 예시를 위한 것이지 제한하려는 것이 아니다.

실험

실험 및 달성된 결과를 포함하여, 다음 실시예는 단지 설명의 목적으로 제공되며 본 발명을 제한하는 것으로 해석되어서는 안 된다. 실제로 아래에 설명된 많은 시약 및 장비에 적합한 다양한 공급원이 있다. 본 발명이 임의의 시약 또는 장비 품목에 대한 임의의 특정 공급원으로 제한되도록 의도되지는 않는다.

하기 실험 개시내용에서, 다음 약어가 적용된다: M(몰); mM(밀리몰), uM 및 μM(마이크로몰); nM(나노몰); mol(몰); gm 및 g(그램); ㎎(밀리그램); ug 및 ㎍(마이크로그램); L 및 ℓ(리터); ㎖ 및 mL(밀리리터); ㎝(센티미터); ㎜(밀리미터); um 및 ㎛(마이크로미터); sec. (초); min(s) (분); h(s) 및 hr(s) (시간); U(단위); MW(분자량); rpm(분당 회전수); psi 및 PSI(평방 인치당 파운드); ℃(섭씨 온도); RT 및 rt(실온); CV(변동계수); CAM 및 캠(클로르암페니콜); PMBS(폴리믹신 B 황산염); IPTG(이소프로필 β-D-1-티오갈락토피라노시드); LB(용원성 브로쓰); TB(참 좋은 브로쓰); SFP(진탕 플라스크 분말); CDS(코딩 서열); DNA(데옥시리보핵산); RNA(리보핵산); nt(뉴클레오티드; 폴리뉴클레오티드); aa(아미노산, 폴리펩티드); 이. 콜리 W3110(일반적으로 사용되는 실험실용 이. 콜리 균주, Coli Genetic Stock Center[CGSC], New Haven, CT에서 구입 가능); HTP(고처리량); HPLC(고압 액체 크로마토그래피); HPLC-UV(HPLC-자외선 검출기); 1H NMR(양성자 핵자기공명 분광법); FIOPC(양성 대조군에 비해 배수 개선); Sigma 및 Sigma-Aldrich(Sigma-Aldrich, St. Louis, MO); Difco(Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Microfluidics(Microfluidics, Westwood, MA); Life Technologies(Life Technologies, Fisher Scientific의 일부, Waltham, MA); Amresco(Amresco, LLC, Solon, OH); Carbosynth(영국 버크셔 소재 Carbosynth, Ltd.), Varian(Varian Medical Systems, 캘리포니아주 팔로 알토); Agilent(Agilent Technologies, Inc., Santa Clara, CA), Infors(Infors USA Inc., Annapolis Junction, MD); 및 Thermotron(Thermotron, Inc., Holland, MI).

실시예 1

재조합 NDT 유전자를 함유하는 이. 콜리 발현 숙주

본 발명의 변이체를 생성하는 데 사용된 진화된 뉴클레오시드 데옥시리보실트랜스퍼라제(NDT)의 부모 유전자는 락토바실러스 루테리 NDT(서열번호: 1)였다. NDT-코딩 유전자를 발현 벡터 pCK110900(미국 특허 공개공보 제2006/0195947호의 도 3 참조)에 클로닝하고, lacl 억제인자의 제어 하에 lac 프로모터에 작동가능하게 연결시켰다. 발현 벡터에는 P15a 복제 기원과 클로르암페니콜 저항성 유전자도 포함되어 있다. 생성된 플라스미드는 관련 분야에 공지된 표준 방법을 사용하여 E. coli W3110으로 형질전환되었다. 관련 분야에 공지된 바와 같이(예를 들어, 미국 특허 제8,383,346호 및 WO2010/144103 참조), 세포를 클로르암페니콜 선택에 적용하여 형질전환체를 단리하였다.

실시예 2

HTP NDT-함유 습식 세포 펠릿의 제조

단일클론 콜로니로부터 재조합 NDT 코딩 유전자를 함유한 이. 콜리 세포를 96개-웰 얕은 웰 미세적정 플레이트의 웰에 있는 1% 포도당과 30 ㎍/㎖ 클로르암페니콜(CAM)을 함유한 190㎕ LB에 접종하였다. 플레이트를 O₂ 투과성 씰로 밀봉하고, 배양물을 20℃, 200rpm 및 85% 습도에서 밤새 성장시켰다. 그런 다음, 각 세포 배양액 20㎕를 380㎕ TB 및 30 ㎍/㎖ CAM이 포함된 96개-웰 깊은 웰 플레이트의 웰로 옮겼다. 깊은 웰 플레이트를 O₂ 투과성 씰로 밀봉하고 OD₆₀₀ 0.6-0.8에 도달할 때까지 30℃, 250rpm 및 85% 습도에서 배양하였다. 이어서, 세포 배양물을 IPTG에 의해 최종 농도 1mM로 유도하고 원래 사용된 것과 동일한 조건 하에서 밤새 배양하였다. 그런 다음 4℃, 4,000rpm에서 10분 동안 원심분리를 사용하여 세포를 펠렛화하였다. 상청액을 버리고 펠릿을 -80℃에서 냉동시킨 후 용해시켰다.

실시예 3

HTP NDT-함유 세포 용해물의 제조

먼저, 실시예 2에 기술된 바와 같이 생성된 세포 펠릿을 50mM 시트레이트, pH 6, 1g/ℓ 리소자임 및 0.5g/ℓ PMBS를 함유하는 200㎕ 용해 완충액을 첨가하여 용해시켰다. 그 다음, 세포 펠릿을 벤치탑 진탕기에서 실온에서 2시간 동안 진탕시켰다. 플레이트를 4℃에서 15분 동안 4,000rpm으로 원심분리하여 세포 잔해물을 제거하였다. 그런 다음 상청액을 생체촉매 반응에 사용하여 활성 수준을 결정하였다.

실시예 4

진탕 플라스크(SF) 배양물로부터 동결건조된 용해물의 제조

진탕 플라스크 절차는 조작된 NDT 폴리펩티드 진탕 플라스크 분말(SFP)을 생성하는 데 사용될 수 있으며, 이는 2차 스크리닝 분석 및/또는 본원에 기술된 생체촉매 공정에서의 사용에 유용하다. 효소의 진탕 플라스크 분말(SFP) 제제는 HTP 분석에 사용되는 세포 용해물과 비교하여 조작된 효소의 더욱 정제된 제제(예: 총 단백질의 최대 30%)를 제공하며 또한 보다 농축된 효소 용액의 사용을 허용한다. 이를 시작하기 위해 위에서 설명한 대로 성장한 선택된 HTP 배양물을 1% 글루코오스와 30㎍/㎖ CAM이 포함된 LB 한천 플레이트에 플레이팅하고 37℃에서 밤새 성장시켰다. 각 배양물로부터의 단일 콜로니를 1% 글루코오스 및 30㎍/㎖ CAM이 포함된 6㎖의 LB로 옮겼다. 배양물을 30℃및 250rpm에서 18시간 동안 성장시켰다. 배양물을 30㎍/㎖ CAM을 함유하는 250㎖의 TB에 대략 1:50으로 계대배양하여 최종 OD₆₀₀이 0.05가 되도록 하였다. 배양물을 30℃ 및 250rpm에서 약 3.25시간 동안 0.6-0.8 사이의 OD₆₀₀으로 성장시킨 후 IPTG를 사용하여 최종 농도 1mM로 유도하였다. 그런 다음 배양물을 30℃ 및 250rpm에서 20시간 동안 성장시켰다. 배양물을 원심분리 병에 옮기고 7,000 rpm에서 7-10분 동안 원심분리하였다. 상청액을 버리고 펠릿을 -80℃에서 최소 2시간 동안 또는 사용할 준비가 될 때까지 동결시켰다. 냉동 펠릿을 30㎖의 20mM TRIS-HCl pH 7.5에 재현탁시키고 Microfluidizer^®프로세서 시스템(Microfluidics)을 사용하여 18,000psi에서 용해시켰다. 용해물을 펠렛화하고(60분 동안 10,000rpm), 상청액을 냉동 및 동결건조시켜 진탕 플레이크(SF) 효소를 생성하였다.

실시예 5

화합물(1)의 향상된 생산을 위한 서열번호: 4로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝

화합물(1)의 향상된 생산을 위한 변이체 스크리닝 결과를 기초로 서열번호: 4를 부모 효소로 선택하였다. 조작된 유전자의 라이브러리는 잘 확립된 기술(예: 포화 돌연변이 유발, 및 이전에 확인된 유익한 돌연변이의 재조합)을 사용하여 생성되었다. 각 유전자에 의해 코딩된 폴리펩티드는 실시예 2에 설명된 대로 HTP에서 생성되었으며, 실시예 3에 설명된 대로 가용성 용해물이 생성되었다.

서열번호: 4의 화합물(1)을 생산하기 위하여 폴리펩티드를 코딩하는 조작된 폴리뉴클레오티드(즉, 서열번호: 3)를 사용하여 표 5-1의 추가 조작된 폴리펩티드를 생성하였다. 이들 폴리펩티드는 출발 폴리펩티드와 비교하여 개선된 생성물 형성을 나타냈다. 조작된 폴리펩티드는 아래 표 5-2에 설명된 HTP 분석 및 분석 방법과 함께 상기 설명된 지시된 진화 방법을 사용하여 서열번호: 4의 "백본" 아미노산 서열로부터 생성되었다.

지시된 진화는 서열번호: 3에 제시된 폴리뉴클레오티드로 시작되었다. 이어서 조작된 폴리펩티드를 출발 "백본" 유전자 서열로서 선택하였다. 조작된 폴리펩티드의 라이브러리는 잘 알려진 다양한 기술(예: 포화 돌연변이 유발, 이전에 확인된 유익한 아미노산 차이의 재조합)을 사용하여 생성되었으며 위의 반응식 1에 나타낸 바와 같이, HTP 분석 및 화합물(2)를 화합물(1)로 전환시키는 폴리펩티드의 능력을 측정하는 분석 방법을 사용하여 스크리닝하였다.

효소 분석은 5% v/v HTP 용해물, 20 g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 50 mM 시트레이트 완충액, pH 6을 포함하는 100㎕ 총 부피/웰의 96개-웰 형식으로 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.

18-22시간 후, 1:1 1M KOH:DMSO 혼합물 150㎕를 첨가하였다. 플레이트를 밀봉하고 잠깐 원심분리하여 모든 액체를 가라앉히고, 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시켰다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. HPLC 실행 매개변수는 아래 표 5-2에 설명되어 있다. 서열번호: 4보다 개선된 변이체가 표 5-1에 수록되어 있다.

실시예 6

화합물(1)의 향상된 생산을 위한 서열번호: 14로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝

화합물(1)의 향상된 생산을 위한 변이체 스크리닝 결과를 기초로 서열번호: 14를 부모 효소로 선택하였다. 조작된 유전자의 라이브러리는 잘 확립된 기술(예: 포화 돌연변이 유발, 및 이전에 확인된 유익한 돌연변이의 재조합)을 사용하여 생성되었다. 각 유전자에 의해 코딩된 폴리펩티드는 실시예 2에 설명된 대로 HTP에서 생성되었으며, 실시예 3에 설명된 대로 가용성 용해물이 생성되었다.

서열번호: 14의 화합물(1)을 생산하기 위하여 폴리펩티드를 코딩하는 조작된 폴리뉴클레오티드(즉, 서열번호: 13)를 사용하여 표 6-1의 추가 조작된 폴리펩티드를 생성하였다. 이들 폴리펩티드는 출발 폴리펩티드와 비교하여 개선된 생성물 형성을 나타냈다. 조작된 폴리펩티드는 아래 표 6-2에 설명된 HTP 분석 및 분석 방법과 함께 상기 설명된 지시된 진화 방법을 사용하여 서열번호: 14의 "백본" 아미노산 서열로부터 생성되었다.

지시된 진화는 서열번호: 13에 제시된 폴리뉴클레오티드로 시작되었다. 이어서 조작된 폴리펩티드를 출발 "백본" 유전자 서열로서 선택하였다. 조작된 폴리펩티드의 라이브러리는 잘 알려진 다양한 기술(예: 포화 돌연변이 유발, 이전에 확인된 유익한 아미노산 차이의 재조합)을 사용하여 생성되었으며 위의 반응식 1에 나타낸 바와 같이, HTP 분석 및 화합물(2)를 화합물(1)로 전환시키는 폴리펩티드의 능력을 측정하는 분석 방법을 사용하여 스크리닝하였다.

효소 분석은 0.1% v/v HTP 용해물, 20 g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트 완충액, pH 6을 포함하는 100 ㎕ 총 부피/웰의 96개-웰 형식으로 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.

18-22시간 후, 1:1 1M KOH:DMSO 혼합물 150㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리시켜 모든 액체를 가라 앉혔다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. HPLC 실행 매개변수는 아래 표 6-2에 설명되어 있다. 서열번호: 14보다 개선된 변이체가 표 6-1에 수록되어 있다.

50 g/ℓ의 화합물(2)를 사용하여 여러 변이체도 테스트하였다. 효소 분석은 96개-웰 형식으로 총 용적 100㎕/웰로 수행되었다. 분석은 0.1% v/v HTP 용해물, 50g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트 완충액, pH 6을 사용하여 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.

18-22시간 후, 1:1 1M KOH:DMSO 혼합물 150㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리하여 모든 액체를 가라앉힌다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다.

실시예 7

화합물(1)의 향상된 생산을 위한 서열번호: 126으로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝

화합물(1)의 향상된 생산을 위한 변이체 스크리닝 결과를 기초로 서열번호: 126을 부모 효소로 선택하였다. 조작된 유전자의 라이브러리는 잘 확립된 기술(예: 포화 돌연변이 유발, 및 이전에 확인된 유익한 돌연변이의 재조합)을 사용하여 생성되었다. 각 유전자에 의해 코딩된 폴리펩티드는 실시예 2에 설명된 대로 HTP에서 생성되었으며, 실시예 3에 설명된 대로 가용성 용해물이 생성되었다.

서열번호: 126의 화합물(1)을 생산하기 위하여 폴리펩티드를 코딩하는 조작된 폴리뉴클레오티드(즉, 서열번호: 125)를 사용하여 표 7-1의 추가 조작된 폴리펩티드를 생성하였다. 이들 폴리펩티드는 출발 폴리펩티드와 비교하여 개선된 생성물 형성을 나타냈다. 조작된 폴리펩티드는 아래 표 7-2에 설명된 HTP 분석 및 분석 방법과 함께 상기 설명된 지시된 진화 방법을 사용하여 서열번호: 126의 "백본" 아미노산 서열로부터 생성되었다.

지시된 진화는 서열번호: 125에 제시된 폴리뉴클레오티드로 시작되었다. 이어서 조작된 폴리펩티드를 출발 "백본" 유전자 서열로서 선택하였다. 조작된 폴리펩티드의 라이브러리는 잘 알려진 다양한 기술(예: 포화 돌연변이 유발, 이전에 확인된 유익한 아미노산 차이의 재조합)을 사용하여 생성되었으며 위의 반응식 1에 나타낸 바와 같이, HTP 분석 및 화합물(2)를 화합물(1)로 전환시키는 폴리펩티드의 능력을 측정하는 분석 방법을 사용하여 스크리닝하였다.

효소 분석은 0.025% v/v HTP 용해물, 20 g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트/포스페이트 완충액, pH 6을 포함하는 100 ㎕ 총 부피/웰의 96개-웰 형식으로 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.

18-22시간 후, 1:1 1M KOH:DMSO 혼합물 200㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리시켜 모든 액체를 가라 앉혔다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. 서열번호: 126보다 개선된 변이체가 표 7-1에 수록되어 있다.

50 g/ℓ의 화합물(2)를 사용하여 여러 변이체도 테스트하였다. 효소 분석은 96개-웰 형식으로 총 용적 100㎕/웰로 수행되었다. 분석은 0.025% v/v HTP 용해물, 50g/ℓ 알키닐 데옥시우리딘(화합물(2)), 1.2 몰 당량의 2-F-아데닌(화합물(3)), 및 최종 농도 100 mM 시트레이트/포스페이트 완충액, pH 6을 사용하여 수행되었다. 플레이트를 18-22시간 동안 500rpm으로 진탕시키면서 45℃에서 배양하였다.

18-22시간 후, 1:1 1M KOH:DMSO 혼합물 200㎕를 첨가하였다. 플레이트를 밀봉하고 샘플을 미세역가 플레이트 진탕기에서 실온에서 10분 동안 진탕시킨 다음, 잠깐 원심분리하여 모든 액체를 가라앉힌다. 켄칭된 샘플을 HPLC 분석 전에 75:25의 0.1 M 트리에탄올아민, pH 7.5:아세토니트릴 혼합물에 20배 추가로 희석하였다. 서열번호: 126보다 개선된 변이체가 표 7-2에 수록되어 있다.

본원에 인용된 모든 간행물, 특허, 특허 출원 및 기타 문서는 각각의 개별 간행물, 특허, 특허 출원 또는 기타 문서가 개별적으로 다음과 같이 표시된 것과 동일한 정도로 모든 목적을 위해 전체 내용이 모든 목적을 위해 참조로 포함되었다.

다양한 특정 실시예가 예시되고 설명되었지만, 본 발명(들)의 사상 및 범위를 벗어나지 않고 다양한 변경이 이루어질 수 있음이 이해될 것이다.

Claims

서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 폴리펩티드 서열 또는 이의 기능적 단편을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제로서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 적어도 하나의 치환 또는 치환 세트를 포함하며 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4, 14, 및/또는 126을 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 폴리펩티드 서열은 서열번호: 4와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 20/101/104, 15, 17, 18, 18/19/22/91/104, 18/19/22/104, 18/22/62/91/104, 19/91/104, 19/104, 20, 20/63/101/104, 20/101, 20/104, 22, 22/62, 22/62/91/104, 22/91, 22/91/104, 22/91/108, 22/104, 22/108, 30, 50, 53, 55/133, 56, 61, 62/104, 72, 75, 76, 91/104, 93, 101/104, 104, 104/139, 108, 109, 114, 134, 136, 및 138로부터 선택된 상기 폴리펩티드 서열의 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 4를 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 상기 폴리펩티드 서열은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 상기 폴리펩티드 서열은 22/75/108, 22/108, 22/108/109, 50/61, 50/75, 53/108/109, 61, 61/108/109, 75/108, 75/108/114, 108, 108/109, 및 108/138로부터 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 14와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 22/108/109, 31/76, 50/75, 61/108/109, 75, 108, 108/109, 및 108/138로부터 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 14를 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 12/35/61/69, 12/35/61/157, 20, 20/50/149, 20/149/157, 28/39/61, 28/61, 35, 35/39/61/149/157, 35/50/149/157, 35/69, 35/157, 39/50, 39/61, 39/61/149, 39/69/149/157, 39/149, 39/157, 50/61/149, 61/69, 61/69/149, 61/69/157, 61/157, 69/149/157, 149, 및 149/157로부터 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 서열번호: 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리펩티드 서열은 20/50/149 및 39/157 중에서 선택된 하나 이상의 위치에 적어도 하나의 치환 또는 치환 세트를 포함하고, 여기서, 상기 폴리펩티드 서열의 아미노산 위치는 서열번호: 126을 참조하여 번호가 매겨지는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 표 5-1, 6-1, 6-2, 7-1, 및/또는 7-2에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 4, 14, 및/또는 126과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 14 또는 126에 제시된 변이체 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 6-214의 짝수 번호 서열에 제시된 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 변이체의 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 서열번호: 6-214의 짝수 번호 서열 중 적어도 하나에 제시된 폴리펩티드 서열을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 야생형 락토바실러스 루테리(Lactobacillus reuteri) 뉴클레오시드 데옥시리보실트랜스퍼라제에 비해 적어도 하나의 개선된 특성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제12항에 있어서, 상기 개선된 특성이 기질에 대한 개선된 활성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제13항에 있어서, 상기 기질이 화합물(2)를 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제12항에 있어서, 상기 개선된 특성이 화합물(1)의 개선된 생성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제12항에 있어서, 상기 개선된 특성이 화합물(2)에 대한 개선된 기질 특이성을 포함하는 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항에 있어서, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제는 정제된 것인 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제.
제1항의 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 포함하는 조성물.
제1항의 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열.
적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 코딩하는 폴리뉴클레오티드 서열로서, 상기 폴리뉴클레오티드 서열은 서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함하며, 상기 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제의 폴리뉴클레오티드 서열은 하나 이상의 위치에 적어도 하나의 치환을 포함하는 폴리뉴클레오티드 서열.
서열번호: 3, 13, 및/또는 125와 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 포함하는 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제 또는 이의 기능적 단편을 코딩하는 폴리뉴클레오티드 서열.
제19항에 있어서, 상기 폴리뉴클레오티드 서열이 제어 서열에 작동가능하게 연결된 폴리뉴클레오티드 서열.
제19항에 있어서, 상기 폴리뉴클레오티드 서열이 코돈 최적화된 폴리뉴클레오티드 서열.
제19항에 있어서, 상기 폴리뉴클레오티드 서열이 서열번호: 5-213의 홀수 번호 서열에 제시된 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 서열.
제19항의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 발현 벡터.
제25항의 적어도 하나의 발현 벡터를 포함하는 숙주 세포.
제19항의 적어도 하나의 폴리뉴클레오티드 서열을 포함하는 숙주 세포.
제1항의 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제가 생산되도록 적합한 조건 하에서 숙주 세포를 배양하는 단계를 포함하는, 숙주 세포에서 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 생산하는 방법.
제28항에 있어서, 배양물 및/또는 숙주 세포로부터 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 회수하는 단계를 추가로 포함하는 방법.
제28항에 있어서, 상기 적어도 하나의 조작된 뉴클레오시드 데옥시리보실트랜스퍼라제를 정제하는 단계를 추가로 포함하는 방법.