KR20200014836A

KR20200014836A - 고 처리량 트랜스포존 돌연변이유발

Info

Publication number: KR20200014836A
Application number: KR1020197038684A
Authority: KR
Inventors: 피터 켈리; 피터 엔야트
Original assignee: 지머젠 인코포레이티드
Priority date: 2017-06-06
Filing date: 2018-06-06
Publication date: 2020-02-11
Also published as: JP2020524494A; EP3635111A1; CA3064607A1; CN110869502A; US20200102554A1; WO2018226810A1

Abstract

본 발명은 미생물 표현형의 교란을 위한 균주 라이브러리를 개발하기 위해 생체 내 트랜스포존 돌연변이유발을 이용하는 고 처리량(HTP) 미생물 게놈 공학 방법에 관한 것이다.

Description

고 처리량 트랜스포존 돌연변이유발

이 출원과 관련된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며, 본 명세서에 참조로서 포함된다. 서열 목록이 포함된 텍스트 파일의 이름은 ZYMR_014_01WO_SeqList_ST25.txt이다. 텍스트 파일은 약 14KB이며 2018년 6월6일에 작성되었으며 EFS-Web을 통해 전자 파일로 제출된다.

인간은 수천 년 동안 미생물 세포 생합성 경로의 힘을 이용하여 관심있는 제품을 생산하는데, 이런 제품의 가장 오래된 예는 알코올, 식초, 치즈 및 요구르트를 포함한다. 이런 제품은 오늘날에도 여전히 많은 수요가 있으며 미생물에 의해 생산 가능한 제품의 레퍼토리가 계속 증가하고 있다. 유전 공학 기술의 도래는 과학자들이 다양한 생물체로 새로운 생합성 경로를 디자인하고 프로그램하여 광범위한 산업, 의료 및 소비자 제품을 생산하게 하였다. 사실은, 미생물 세포 배양은 이제 소분자, 항생제, 백신, 살충제, 효소, 연료 및 산업 화학물질에 이르는 제품을 생산하는데 사용된다.

현대의 산업 미생물에 의해 생산되는 다수의 제품을 고려하면, 소정의 미생물이 표적 제품을 생산할 수 있는 속도 및 효율을 향상시키기 위해 엔지니어가 엄청난 압력을 받고 있는다는 것은 놀랄 일이 아니다.

관련된 미생물을 "개량"함으로써 생물학적-기반 산업 공정의 경제를 개량하기 위해 다양한 접근법이 사용되어왔다. 예를 들어, 많은 산업은 미생물 배양물의 부모 균주가 화학물질 또는 자외선에 대한 노출을 통해 지속적으로 돌연변이되고 뒤이어 생산성, 수율 및 역가와 같은 성능 개량에 대해 선별되는 미생물 균주 개량 프로그램에 의존한다. 이런 돌연변이유발 과정은 균주가 제품 성능을 적절하게 증가시킬 때까지 광범위하게 반복된다. 다음의 "개량된" 균주는 상업적 생산에 이용된다.

그러나, 전통적인 돌연변이유발 과정을 통한 개량된 산업 미생물 균주의 동정은 시간 소모적이고 비효율적이다. 이 과정은, 본질적으로, 위험하고, 비효율적이고, 느리다.

따라서, 유익한 돌연변이를 발견하고 통합하는 과정을 크게 가속화시키는 미생물을 조작하는 새로운 방법에 대한 요구가 당업계에 존재한다.

본 발명은 당업계에서 현재 실시되는 느리고 비효율적인 방법에 비해 극적인 개선을 제공하는, 미생물 게놈 공학의 고 처리량(HTP) 방법을 제공함으로써 당업계의 이런 요구를 해결한다.

HTP 미생물 게놈 공학 플랫폼은 개선된 숙주 표현형을 초래하는 유전자 교란의 빠르고 효율적인 동정을 허용하는 미생물 균주 라이브러리를 유도하기 위해 HTP 툴세트를 사용한다. 예를 들어, 본 발명에 기술된 HTP 미생물 게놈 공학 플랫폼은 숙주 미생물의 게놈을 교란시키는 생체 내 트랜스포존 돌연변이유발을 이용하고, 이는 숙주 표현형을 개선시키기 위해 이용될 수 있는 다양한 미생물 균주 라이브러리의 생성을 가능하게 한다.

개시된 HTP 게놈 공학 플랫폼은 연산적으로 구동되고 분자 생물학, 자동화 및 진보된 기계 학습 프로토콜을 통합한다. 이런 통합 플랫폼은 특히 과학적 통찰력과 반복적인 패턴 인식에서 유도된 HTP 유전자 디자인 라이브러리를 제작하기 위해 HTP 분자 도구 세트를 사용한다.

상기한 바와 같이, 교시된 HTP 유전자 디자인 라이브러리는 미생물에서 테스트하기 위한 특정 게놈 변경의 라이브러리를 제공함으로써 게놈 공학 과정의 동인으로서 기능한다. 특정 라이브러리 또는 라이브러리의 조합을 이용하여 조작된 미생물은 최종 결과, 예를 들어, 관심 생성물의 생산을 위한 HTP 방식으로 효율적으로 선별된다. 미생물에서 테스트하기 위한 특정 게놈 변경을 정의하기 위해 HTP 유전자 디자인 라이브러리를 이용하고 이어서 변경을 제공하는 숙주 미생물 게놈을 선별하는 이런 방법은 효율적이고 반복적인 방식으로 수행된다. 일부 양태에서, 게놈 공학 캠페인의 반복 주기 또는 "라운드"는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100회 이상의 반복/사이클/라운드일 수 있다.

따라서, 일부 양태에서, 본 발명은 HTP 유전 공학의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825, 850, 875, 900, 925, 950, 975, 1000 이상의 "라운드"(예를 들어, SNP 스왑, PRO 스왑, STOP 스왑, 트랜스포존 돌연변이유발 또는 이들의 조합의 라운드)를 실행하는 방법을 교시한다.

일부 실시태양에서, 본 발명은 각각의 후속적인 HTP 유전 공학 라운드가 이전 라운드의 유전 공학에서 확인된 유전적 변이를 기초로 하는 선형 접근법을 교시한다. 다른 실시태양에서, 본 발명은 각각의 후속적인 HTP 유전 공학 라운드가 미리 실행된 분석 및 별도의 HTP 유전 공학 브랜치를 포함하는 유전 공학의 임의의 이전 라운드에서 확인된 유전자 변이를 기초로 하는 비선형 접근법을 교시한다.

이런 반복 사이클로부터의 데이터는 대규모 데이터 분석 및 패턴 인식을 가능하게 하며, 이는 통합 플랫폼에 의해 이용되어 HTP 유전자 디자인 라이브러리 구현의 후속 라운드를 통지한다. 결과적으로, 교시된 플랫폼에서 이용된 HTP 유전자 디자인 라이브러리는 대규모 데이터 패턴 인식 알고리즘의 이점을 누리고 미생물 공학의 각각의 반복적인 라운드를 통해 더욱 유익해지는 매우 역동적인 도구이다.

일부 실시태양에서, 본 발명의 유전자 디자인 라이브러리는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825, 850, 875, 900, 925, 950, 975, 1000회 이상의 개별적인 유전자 변화(예를 들어, PRO 스왑 라이브러리 또는 트랜스포존 기능 획득(transposon gain-of-function) 라이브러리에서 프로모터:유전자 조합의 적어도 X 번호를 포함한다).

일부 실시태양에서, 본 발명은 다음 단계를 포함하여 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 고 처리량(HTP) 방법을 교시한다: a) 트랜스포존 돌연변이유발을 사용하여 동일한 미생물 균주 배경을 갖는 초기의 복수의 미생물의 게놈을 교란시켜 독특한 유전자 변이를 갖는 개별 미생물 균주를 포함하는 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계; b) 원하는 표현형을 위한 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; c) 선행 단계에서 선별된 적어도 2개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계; d) 원하는 표현형을 위한 후속 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; e) 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 선행 HTP 유전자 디자인 미생물 균주 라이브러리의 적어도 2개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성한다.

일부 실시태양에서, 본 발명은 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제조하는 방법을 교시하며, 결합된 유전자 변이의 각각은 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리 또는 선행 단계의 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리로부터 유도된다.

일부 실시태양에서, 후속 복수의 미생물에서의 유전자 변이의 조합은 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리 또는 선행 단계의 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리에서 유전자 변이의 가능한 모든 조합의 서브세트를 포함할 것이다.

일부 실시태양에서, 본 발명은 후속 HTP 유전자 디자인 미생물 균주 라이브러리가 초기 HTP 유전자 디자인 미생물 균주 라이브러리 또는 선행 단계의 HTP 유전자 디자인 미생물 균주 라이브러리에서 유전자 변이로부터 유도된 부분 조합 미생물 균주 라이브러리라는 것을 교시한다.

예를 들어, 이전의 HTP 유전자 디자인 미생물 균주 라이브러리가 유전자 변이 A, B, C 및 D만을 갖는다면, 상기 변이의 부분 조합은 각각 AB, AC 또는 AD의 독특한 유전자 변이 조합(돌연변이가 나타나는 순서는 중요하지 않음)을 포함하는 3개 미생물을 포함하는 후속 HTP 유전자 디자인 미생물 균주 라이브러리를 포함할 수 있다. 선형 단계의 HTP 유전자 디자인 라이브러리의 유전자 변이로부터 유도된 완전한 조합 미생물 균주 라이브러리는 각각 AB, AC, AD, BC, BD 또는 CD의 독특한 유전자 변이 조합을 포함하는 6개의 미생물을 포함할 것이다.

일부 실시태양에서, 본 발명의 방법은 랜덤 돌연변이유발, 표적 서열 삽입, 표적 서열 결실, 표적 서열 치환, 트랜스포존 돌연변이유발 또는 이의 임의의 조합으로 이루어진 그룹으로부터 선택된 적어도 하나의 방법을 이용하여 게놈을 교란시키는 것을 교시한다.

본 발명의 방법의 일부 실시태양에서, 초기 복수의 미생물은 산업용 생산 균주 미생물로부터 유도된 독특한 유전자 변이를 포함한다.

본 발명의 방법의 일부 실시태양에서, 초기 복수의 미생물은 S₁Gen₁으로 표시된 산업용 생산 균주 미생물 및 S_nGen_n으로 표시된 이로부터 유도된 임의의 수의 후속 미생물 세대를 포함한다.

일부 실시태양에서, 본 발명은 원하는 표현형을 획득하도록 미생물을 진화시키기 위한 게놈 공학의 트랜스포존 돌연변이유발 방법을 교시하며, 상기 방법은 a) 트랜스포사제 효소 및 DNA 페이로드 서열을 제공하는 단계를 포함한다. 일부 실시태양에서, 트랜스포사제 효소 및 DNA 페이로드 서열은 트랜스포사제-DNA 페이로드 복합체를 형성한다. 일부 실시태양에서, 트랜스포존 돌연변이유발은 트랜스포존이 복수의 미생물의 게놈 내로 무작위 삽입되게 한다. 일부 실시태양에서, 트랜스포사제는 EZ-Tn5 트랜스포존 시스템으로부터 유래된다. 일부 실시태양에서, DNA 페이로드 서열은 트랜스포사제에 의해 인식될 수 있는 모자이크 요소(ME)에 의해 플랭킹된다. DNA 페이로드의 특정 서열은 표적 게놈으로의 트랜스포존 삽입의 기능 상실 또는 기능 획득 효과에 대해 바이어스되도록 변할 수 있다.

일부 실시태양에서, 트랜스포존 돌연변이유발은 기능 상실(LoF) 또는 기능 획득(GoF) 표현형을 야기한다. 일부 실시태양에서, DNA 페이로드는 기능 상실(LoF) 트랜스포존 또는 기능 획득(GoF) 트랜스포존일 수 있다. 일부 실시태양에서, DNA 페이로드는 선택 마커를 포함한다. 일부 실시태양에서, 선별 마커는 항생제 내성이다. 일부 실시태양에서, DNA 페이로드는 역 선택 마커를 포함한다. 일부 실시태양에서, 역 선택 마커는 선택 가능한 마커를 함유하는 DNA 페이로드의 루프-아웃을 용이하게 하는데 사용되며, 이는 마커 리사이클링 및 추가 엔지니어링 라운드를 가능하게 한다. 일부 실시태양에서, GoF 트랜스포존은 GoF 요소를 포함한다. 일부 실시태양에서, GoF 트랜스포존은 프로모터 서열 및/또는 용해도 태그 서열을 포함한다. 일부 실시태양에서, GoF 트랜스포존은 항생제 마커 및 강력한 프로모터를 포함한다. 일부 실시태양에서, 방법은 b) 트랜스포사제 및 DNA 페이로드 서열을 조합하여 복합체를 형성하는 단계, 및 c) 트랜스포사제-DNA 페이로드 복합체를 미생물 균주로 형질전환시켜 미생물 균주의 게놈에서 DNA 페이로드 서열의 무작위 통합을 초래하는 단계를 추가로 포함한다. 일부 실시태양에서, DNA 페이로드의 무작위 통합을 포함하는 균주는 초기 트랜스포존 돌연변이유발 라이브러리를 형성한다.

일부 실시태양에서, 방법은 d) 원하는 표현형에 대한 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계를 추가로 포함한다. 일부 실시태양에서, 방법은 e) 각각 이전 단계에서 선별된 2개 이상의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속하는 복수의 미생물을 제공함으로써, 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계를 추가로 포함한다. 일부 실시태양에서, 방법은 f) 원하는 표현형에 대한 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계를 추가로 포함한다. 일부 실시태양에서, 방법은 g) 단계 e)-f)를 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 1회 이상 반복하는 단계를 추가로 포함하며, 이때 각각의 후속 반복은 선행 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 적어도 2개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 보유하는 개별 미생물 균주를 포함하는 새로운 트랜스포존 돌연변이유발 미생물을 생성한다.

일부 실시태양에서, 본 발명은 (a) (1) 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 나타내는 입력 및 (2) 상응하는 성능 측정을 포함하는 트레이닝 세트로 채워진 예측 모델에 접근하는 단계; (b) 이런 유전자 변화를 포함하는 후보 미생물 균주에 상응하는 테스트 입력을 유전자 변화를 나타내는 예측 모델에 적용하는 단계; (c) 예측 모델에 적어도 부분적으로 기초하여 후보 미생물 균주의 표현형 성능을 예측하는 단계; (d) 적어도 부분적으로 이들의 예측된 성능에 기초하여 후보 미생물 균주의 제 1 서브세트를 선택하는 단계; (e) 후보 미생물 균주의 제 1 서브세트의 측정된 표현형 성능을 얻는 단계; (f) 적어도 부분적으로 측정된 표현형 성능에 기초하여 후보 미생물 균주의 제 2 서브세트를 선택하는 단계; (g) 예측 모델의 트레이닝 세트에 (1) 후보 미생물 균주의 선택된 제 2 서브세트에 상응하는 입력과 함께 (2) 후보 미생물 균주의 선택된 제 2 서브세트의 상응하는 측정된 성능을 첨가하는 단계; 및 (h) 적어도 하나의 후보 미생물 균주의 측정된 표현형 성능이 성능 메트릭을 만족시킬 때까지 (b)-(g)를 반복하는 단계에 의해 후보 미생물 균주의 디자인을 반복적으로 개량하는 것을 교시한다. 일부 경우에, 예측 모델에 대한 테스트 입력의 첫 번째 적용 동안, 테스트 입력에 의해 나타낸 유전 자 변화는 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 포함한다; 테스트 입력의 후속 적용 동안, 테스트 입력에 의해 나타낸 유전자 변화는 후보 미생물 균주의 이전에 선택된 제 2 서브세트 내의 후보 미생물 균주에 대한 유전자 변화를 포함한다.

일부 실시태양에서, 제 1 서브세트의 선택은 상위성 효과(epistatic effect)에 기초할 수 있다. 이것은 제 1 서브세트의 제 1 선택 동안: 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 나타내는 복수의 각각의 입력의 적용에 응답하여 하나 이상의 배경 미생물 균주의 성능 측정 사이의 비유사도를 결정하는 단계; 및 적어도 2개의 후보 미생물 균주에 포함된 유전자 변화의 적용에 응답하여 하나 이상의 배경 미생물 균주의 성능 측정의 비평행성의 정도에 적어도 부분적으로 기초하여 적어도 2개의 후보 미생물 균주를 제 1 서브세트에 포함시키기 위해 선택하는 단계에 의해 성취될 수 있다.

일부 실시태양에서, 본 발명은 후보 미생물 균주의 반복적 개량에 상위성 효과를 적용하는 것을 교시하고, 상기 방법은 적어도 하나의 미생물 배경 균주에 대해 이루어진 상응하는 유전자 변화에 응답하여 측정된 성능을 나타내는 데이터를 얻는 단계; 적어도 2개의 유전자 변화의 상응하는 반응 성능 측정 사이의 비유사도도에 적어도 부분적으로 기초하여 적어도 2개의 유전자 변화를 선택하는 단계, 여기서 비유사도는 상이한 생물학적 경로를 통해 상응하는 반응성 측정에 영향을 미치는 정도에 관한 것이다; 및 선택된 유전자 변화를 포함한 미생물 배경 균주에 대한 유전자 변화를 디자인하는 단계를 포함한다. 일부 경우에, 적어도 2개의 선택된 유전자 변화가 디자인되는 미생물 배경 균주는 측정된 반응성 성능을 나타내는 데이터가 얻어진 적어도 하나의 미생물 배경 균주와 동일하다.

일부 실시태양에서, 본 발명은 단일 유형의 유전자 미생물 라이브러리만을 사용하는 HTP 균주 개량 방법을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 트랜스포존 돌연변이유발 라이브러리만을 사용하는 HTP 균주 개량 방법을 교시한다.

다른 실시태양에서, 본 발명은 둘 이상의 유형의 유전자 미생물 라이브러리를 사용하는 HTP 균주 개량 방법을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 SNP 스왑 및 트랜스포존 돌연변이유발 라이브러리를 조합하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 본 발명은 PRO 스왑 및 트랜스포존 돌연변이유발 라이브러리를 조합하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 본 발명은 STOP 스왑 및 트랜스포존 돌연변이유발 라이브러리를 조합하는 HTP 균주 개량 방법을 교시한다. 또 다른 실시태양에서, 본 발명의 HTP 균주 개량 방법은 하나 이상의 전통적인 균주 개량 방법과 조합될 수 있다.

일부 실시태양에서, 본 발명의 HTP 균주 개량 방법은 개량된 숙주 세포를 초래한다. 즉, 본 발명는 하나 이상의 숙주 세포 특성을 개량시키는 방법을 교시한다. 일부 실시태양에서, 개량된 숙주 세포 특성은 숙주 세포에 의해 생성된 관심 생성물의 부피 생산성, 비 생산성, 수율 또는 역가로 이루어진 그룹으로부터 선택된다. 일부 실시태양에서, 개량된 숙주 세포 특성은 부피 생산성이다. 일부 실시태양에서, 개량된 숙주 세포 특성은 비 생산성이다. 일부 실시태양에서, 개량된 숙주 세포 특성은 수율이다.

일부 실시태양에서, 본 발명의 HTP 균주 개량 방법은 HTP 균주 개량 방법을 적용하지 않는 대조군 숙주 세포에 비해 적어도 하나의 숙주 세포 특성에서 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 150%, 200%, 250%, 300% 이상의 개량(예를 들어, 임의의 범위 및 그 안의 하부범위를 포함하는 관심 생체분자의 수율 또는 생산성의 X% 개량)을 나타내는 숙주 세포를 초래한다. 일부 실시태양에서, 본 발명의 HTP 균주 개량 방법은 SNP 스왑, PRO 스왑, STOP 스왑, 트랜스포존 돌연변이유발 및 이의 조합으로 이루어진 그룹으로부터 선택된다.

일부 실시태양에서, 본 발명의 트랜스포존 돌연변이유발 방법은 트랜스포존 돌연변이유발 방법을 적용하지 않는 대조군 숙주 세포에 비해 적어도 하나의 숙주 세포 특성에서 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 150%, 200%, 250%, 300% 이상의 개량(예를 들어, 임의의 범위 및 그 안의 하부범위를 포함하는 관심 생체분자의 수율 또는 생산성의 X% 개선)을 나타내는 숙주 세포를 초래한다.

본 발명의 내용 중에 포함되어 있다.

도 1은 다양성 풀의 변화를 증가시키기 위한 본 발명의 DNA 재조합 방법을 도시한다. 관련 종으로부터의 게놈 영역과 같은 DNA 절편은 물리적 또는 효소적/화학적 수단을 통해 절단될 수 있다. 절단된 DNA 영역은 용융되고 재어닐링되게 하여, 중첩된 유전 영역은 중합효소 신장 반응을 준비한다. 후속 용융/신장 반응은 하나 이상의 출발 서열로부터의 원소를 포함하는 키메라 DNA로 재조합될 때까지 수행된다.
도 2는 선택된 서열 변형(예를 들어, 스왑을 위한 100개 SNP)을 갖는 새로운 숙주 생물을 생성하기 위한 본 발명의 방법을 개략적으로 도시한다. 간략하게, 이 방법은 (1) 원하는 DNA 삽입물은 어셈블리 반응에서 하나 이상의 합성된 올리고를 조합함으로써 디자인되고 생성하고, (2) DNA 삽입물은 형질전환 플라스미드에 클로닝하고, (3) 완성된 플라스미드는 원하는 생산 균주로 옮겨지고, 여기서 이들은 숙주 균주 게놈 속으로 통합된다, 및 (4) 선별 마커 및 기타 원하지 않는 DNA 요소는 숙주 균주에서 루프 아웃된다. 각 DNA 어셈블리 단계는 증폭 및 서열화를 위해 대장균 박테리아 속에 플라스미드를 클로닝하는 것과 같은 추가 품질 관리(QC) 단계를 필요로 할 수 있다.
도 3은 본 발명의 형질전환 플라스미드의 조립 및 숙주 유기체 속으로 이의 통합을 도시한다. 삽입체 DNA는 하나 이상의 합성된 올리고를 어셈블리 반응에서 결합함으로써 생성된다. 원하는 서열을 함유하는 DNA 삽입체는 게놈의 표적 부위와 상 동성을 갖는 DNA 영역에 인접해있다. 이런 상동성 영역은 게놈 통합을 용이하게 하고, 일단 통합되면, 후속 단계에서 벡터 백본 DNA를 루핑 아웃(looping-out)하기 위해 디자인된 직접 반복 영역을 형성한다. 조립된 플라스미드는 삽입체 DNA 및 임의적으로, 하나 이상의 선택 마커를 함유한다.
도 4a-b는 본 발명의 실시태양의 하나의 DNA 어셈블리, 형질전환 및 균주 선별 단계를 도시한다. 도 4a는 DNA 단편을 구축하고, 상기 DNA 단편을 벡터 속에 클로닝하고, 상기 벡터를 숙주 균주로 형질전환시키고, 역 선택을 통해 선택 서열을 루핑 아웃하는 단계를 도시한다. 도 4b는 선택된 숙주 균주의 고 처리량 배양, 선별 및 평가를 위한 단계를 도시한다. 이 도면은 또한 배양 탱크에서 선택된 균주의 배양, 선택 및 평가하는 임의적 단계를 도시한다.
도 5는 본 발명의 자동화 시스템의 한 실시태양을 도시한다. 본 발명은 숙주 유기체를 클로닝, 형질전환, 배양, 선별 및/또는 서열화할 수 있는 다양한 모듈을 갖는 자동화 로봇 시스템의 사용을 교시한다.
도 6은 제 2 라운드 HTP 공학 PRO 스왑 프로그램의 결과를 도시한다. 제 1 PRO 스왑 라운드 동안 확인된 상위 프로모터::유전자 조합은 본 발명의 방법에 따라 분석하여 숙주 성능에 대한 부가적 또는 조합적 유익한 효과를 나타낼 수 있는 상기 돌연변이의 조합을 동정하였다. 따라서 제 2 라운드 PRO 스왑 돌연변이체는 다양한 프로모터::유전자 돌연변이의 쌍 조합을 포함한다. 생성된 제 2 라운드 돌연변이체는 선택된 생체분자의 숙주 세포 수율의 차이에 대해 선별되었다. 유익한 효과를 나타내는 것으로 예측되었던 돌연변이의 조합 쌍은 원으로 강조된다.
도 7은 상관 측정을 사용하여 계산된 유사성 행렬이다. 이 행렬은 SNP 변종 사이의 기능적 유사성의 표현이다. 낮은 기능적 유사성을 갖는 SNP의 통합은 더 높은 기능적 유사성을 갖는 SNP의 통합과는 대조적으로 균주 성능을 향상시키는 더 높은 가능성을 갖는 것으로 예상된다.
도 8a-b는 상위성 매핑 실험의 결과를 도시한다. 낮은 기능적 유사성을 갖는 SNP와 PRO 스왑의 조합은 변형률 성능을 개량한다. 도 8a는 모든 SNP/PRO 스왑의 기능적 유사성에 의해 덩어리진 수상돌기를 도시한다. 도 8b는 생산 수율로 측정된 통합 SNP의 숙주 균주 성능을 도시한다. 클러스터 거리가 클수록 숙주 균주의통합 성능이 향상된다.
도 9a-b는 다양성 풀에서 균주 변형들 사이의 SNP 차이를 도시한다. 도 9a는 본 실험의 균주 사이의 관계를 도시한다. 균주 A는 야생형 숙주 균주이다. 균주 B는 중간 처리된 균주이다. 균주 C는 산업용 생산 균주이다. 도 9b는 각각의 균주에서 독특하고 공유된 SNP의 수를 나타내는 그래프이다.
도 10은 고려중인 입력 데이터에 대한 상대 변형 성능 분포를 도시한다. 상대적 성능이 0이면 가공 변형률이 인 - 플레이트 기본 변형률에 동일하게 잘 수행되었음을 나타낸다. 여기에 설명 된 공정은 제로보다 상당히 높게 수행 할 수 있는 변형을 식별하도록 디자인되었다.
도 11은 프로모터 스왑 과정에서 사용될 예시적 유전자 표적을 도시한다.
도 12는 확인된 유전자 표적에 대한 프로모터 스왑 공정을 수행하기 위해 사용되는 예시적인 프로모터 라이브러리를 예시한다. PRO 스왑(즉, 프로모터 스왑) 공정에서 사용된 프로모터는 P₁-P₈이며, 이들의 서열 및 동일성은 표 1에서 찾을 수 있다.
도 13은 프로모터 스와핑 유전자 결과는 표적이 되는 특정 유전자에 의존한다는 것을 도시한다.
도 14는 상위 100개의 예측된 균주 디자인에 대한 변화의 구성을 도시한다. x 축은 잠정적인 유전자 변화의 풀을 열거하고(dss 돌연변이는 SNP 스왑이고 Pcg 돌연변이는 PRO 스왑이다), y축은 순위 순서를 표시한다. 검은색 셀은 후보 디자인의 특정 변경 사항이 있음을 나타내고 흰색 셀은 변경 사항이 없음을 나타낸다. 이 특정 예에서 상위 100개 디자인은 pcg3121_pgi, pcg1860_pyc, dss_339 및 pcg0007_39_lysa 변경 사항을 포함한다. 또한 최상위 후보 디자인은 dss_034, dss_009 변경 사항을 포함한다.
도 15는 본 발명의 실시태양의 하나의 DNA 어셈블리 및 형질전환 단계를 도시한다. 흐름도는 DNA 단편을 제작하고, 상기 DNA 단편을 벡터로 클로닝하고, 상기 벡터를 숙주로 형질전환시키고, 역 선택을 통해 선택 서열을 반복하는 단계를 도시한다.
도 16은 선택된 숙주 균주의 고 처리량 배양, 선별 및 평가를 위한 단계를 도시한다. 이 도면은 또한 배양 탱크에서 선택된 균주를 배양, 선별 및 평가하는 선택적 단계를 도시한다.
도 17은 본 발명의 프로모터 래더에 따른 조절성 발현의 범위를 나타내는 예시적인 프로모터의 발현 프로파일을 도시한다. 프로모터 A 발현은 박테리아 배양의 유도기에서 최고조인 반면, 프로모터 B 및 C는 각각 대수기 및 정상기에서 최고조이다.
도 18는 본 발명의 프로모터 래더에 따른 조절 발현의 범위를 나타내는 예시적인 프로모터의 발현 프로파일을 도시한다. 프로모터 A 발현은 선택된 기질의 첨가시 즉시 최고조가 되지만, 기질의 농도가 감소함에 따라 감지할 수 없는 수준으로 신속하게 회복된다. 프로모터 B 발현은 선택된 기질의 첨가시 즉시 최고조가 되지만, 기질에서 상응하는 감소와 함께 감지할 수 없는 수준으로 천천히 낮아진다. 프로모터 C 발현은 선택된 기질의 첨가시에 최고조가 되지만, 기질이 소비된 후에도 배양 전체에 걸쳐 높게 발현된 상태로 유지된다.
도 19는 본 발명의 프로모터 래더에 따른 구성적 발현 수준의 범위를 나타내는 예시적인 프로모터의 발현 프로파일을 도시한다. 프로모터 A는 가장 낮은 발현을 나타내고, 각각 프로모터 B 및 C의 발현 수준이 증가된다.
도 20은 균주 개량을 위한 본 발명의 LIMS 시스템의 한 실시태양을 도시한다.
도 21은 본 발명의 LIMS 시스템의 실시태양의 클라우드 컴퓨팅 구현을 도시한다.
도 22는 본 발명의 반복적인 예측 균주 디자인 작업 흐름의 한 실시태양을 도시한다.
도 23은 본 발명의 실시태양에 따른 컴퓨터 시스템의 한 실시태양을 도시한다.
도 24는 본 발명의 실시태양에 따른, 미생물 균주의 디자인을 위한 돌연변이의 선택에서의 상위성 효과의 고려를 예시하는 흐름도이다.
도 25는 에스. 스피노사(S. spinosa)에서 트랜스포존 돌연변이유발에 대한 플라스미드의 선형지도를 도시한다. 기능 상실(LoF) 트랜스포존, 기능 획득(GoF) 트랜스포존 및 기능 획득(GoF) 재활용 트랜스포존이 도시된다.

다음의 용어는 당해 기술 분야에서 통상의 지식을 가진 자에 의해 잘 이해되는 것으로 생각되지만, 다음 정의는 본 발명에 개시된 주제의 설명을 용이하게 하기 위해 제시된다.

용어 하나("a" 또는 "an")는 그 실체 중 하나 이상을 의미하며, 즉 복수의 지시대상을 의미할 수 있다. 이와 같이, 용어 "하나", "하나 이상" 및 "적어도 하나"라는 본 발명에서 상호 교환적으로 사용된다. 또한, 부정관사에 의한 "한 요소"에 대한 언급은, 내용이 분명하게는 요소의 하나 및 단지 하나가 존재하는 것을 요구하지 않는 한, 하나 이상의 요소가 존재하는 가능성을 배제하지 않는다.

본 발명에 사용된 용어 "세포 생물", "미세유기체" 또는 "미생물"은 광범위하게 이해되어야 한다. 이 용어들은 상호 교환적으로 사용되며, 두 원핵생물 영역인 박테리아와 고세균뿐만 아니라 특정 진핵생물 균류 및 원생 생물을 포함하나 이에 제한되지 않는다. 일부 실시태양에서, 본 발명은 본 발명에 제공된 목록/표 및 도면의 "미세유기체"또는 "세포유기체"또는 "미생물"을 의미한다. 이런 특성화는 표와 도면의 확인된 분류학적 속과 확인된 분류학적 종뿐만 아니라 상기 표 또는 도면의 임의의 유기체의 다양한 신규하고 새로운 확인된 또는 디자인된 균주를 의미할 수 있다. 동일한 특성화는 실시예에서와 같이, 명세서의 다른 부분에서 이런 용어의 인용에 대해서도 마찬가지이다.

용어 "원핵 생물"은 당업계에 공지되어 있으며 핵 또는 다른 세포 기관을 함유하지 않는 세포를 의미한다. 원핵생물은 일반적으로 두 영역, 박테리아와 고세균의 하나로 분류된다. 고세균과 박테리아 영역의 유기체 사이의 명확한 차이는 16S 리보솜 RNA에서 뉴클레오타이드 염기 서열의 근본적인 차이에 기초한다.

용어 "고세균는 전형적으로 특이한 환경에서 발견되고 세포벽에서 리보솜 단백질의 수 및 뮤라민산의 부족을 포함하는 몇몇 기준에 의해 나머지 원핵 생물과 구별되는 멘도시쿠테스(Mendosicutes) 문의 유기체의 범주를 의미한다. ssrRNA 분석에 기초하여, 고세균은 두 계통발생학적으로 다른 그룹으로 구성된다: 크렌고세균(Crenarchaeota) 및 유리고세균(Euryarchaeota). 생리학을 기초로, 고세균은 세 가지 유형으로 구성될 수 있다: 메테인 생성균(methanogens)(메테인을 생성하는 원핵 생물); 고염성 세균(extreme halophiles)(매우 높은 농도의 염(NaCl)에서 사는 원핵 생물; 및 고온성(초고온성) 세균(extreme(hyper) thermophilus)(초고온에서 사는 원핵 생물). 박테리아와 구별되는 통일된 고세균의 특징(즉, 세포벽, 에스터-연결 막 지질 등에 뮤레인 없음)이외에, 이런 원핵 생물은 이들의 특정한 서식 환경에 적응시키는 특이한 구조 또는 생화학적 특성을 나타낸다. 크렌고세균은 주로 초고온성 황 의존성 원핵 생물로 이루어지며 유리고세균은 메테인 생성균과 고염성 세균을 함유한다.

"박테리아" 또는 "진정세균(eubacteria)"는 원핵 생물의 영역을 의미한다. 박테리아는 다음과 같이 적어도 11개의 구별된 그룹을 포함한다: (1) 그람 양성 (그람+) 박테리아, 2개위 주요 세부구분이 존재한다: (1) 높은 G+C 그룹(액티노마이세테스, 마이코박테리아, 마이르코콕커스, 기타) (2) 낮은 G+C 그룹(바실러스, 클로스트리디아, 락토바실러스, 스타필로콕키, 스트렙토콕키, 마이코플라스마스); (2) 프로테오박테리아, 예를 들어, 보라색 광합성 + 비 광합성 그람 음성 박테리아 (대부분의 "일반적인" 그람 음성 박테리아 포함); (3) 사이아노박테리아, 예를 들면, 산소성 광영양생물; (4) 스피로체테스 및 관련 종; (5) 플랭크토마이세스; (6) 박테로이데스, 플라보박테리아; (7) 클라마이디아; (8) 녹색 황 박테리아; (9) 녹색 비 황 박테리아(또한 혐기성 광영양식물); (10) 방사성 저항성 마이크로콕키 및 동족; (11) 써모토가(Thermotoga) 및 써모시포 써모필레스(Thermosipho thermophiles).

"진핵 생물"은 세포가 막 내에 둘러싸인 핵 및 다른 소기관을 함유하는 임의의 유기체이다. 진핵 생물은 분류군(Eukarya 또는 Eukaryota)에 속한다. 진핵 생물 세포를 원핵 생물(박테리아와 고세균)와 구분시키는 정의하는 특징은 막으로 둘러싸인 유전자 물질, 특히 유전자 물질을 함유하고 핵막에 의해 둘러싸인 핵을 가진다는 것이다.

용어 "유전자 변형된 숙주 세포", "재조합 숙주 세포" 및 "재조합 균주"는 본 발명에서 상호 교환적으로 사용되고 본 발명의 클로닝 및 형질전환 방법에 의해 유전자 변형된 숙주 세포를 의미한다. 따라서, 이 용어는 유전자 변경, 변형 또는 조작되어, 숙주 세포가 유도된 자연 발생 유기체와 비교하여 변경, 변형 또는 상이한 유전자형 및/또는 표현형을 나타내는(예를 들어, 유전자 변형이 미생물의 핵산 서열 암호화에 영향을 미칠 때) 숙주 세포(예를 들어, 박테리아, 효모 세포, 곰팡이 세포, CHO, 인간 세포 등)를 포함한다. 일부 실시태양에서, 이 용어는 문제의 특정 재조합 숙주 세포뿐만 아니라 이런 숙주 세포의 자손 또는 잠재적 자손을 의미하는 것으로 이해된다.

용어 "야생형 미생물"또는 "야생형 숙주 세포"는 자연에서 발생하는 세포, 즉 유전자 변형되지 않은 세포를 기술한다.

용어 "유전자 조작된"은 (예를 들어, 핵산의 삽입, 결실, 돌연변이 또는 치환에 의한) 숙주 세포의 게놈의 임의적 조작을 의미할 수 있다.

용어 "대조군" 또는 "대조군 숙주 세포"는 유전자 변형 또는 실험적 치료의 효과를 측정하기 위한 적절한 비교기 숙주 세포를 의미한다. 일부 실시태양에서, 대조군 숙주 세포는 야생형 세포이다. 다른 실시태양에서, 대조군 숙주 세포는 치료 숙주 세포를 분화시키는 유전자 변형(들)을 제외하고, 유전자 변형된 숙주 세포와 유전적으로 동일하다. 일부 실시태양에서, 본 발명은 대조군 숙주 세포(예를 들어, 균주 개량 프로그램의 기초로 사용된 S₁ 균주)로서의 부모 균주의 사용을 교시한다. 다른 실시태양에서, 숙주 세포는 치료 숙주 세포에서 테스트되는 특정 프로모터 또는 SNP가 결여된 유전적으로 동일한 세포일 수 있다.

본 발명에 사용된 용어 "대립 유전자(들)"은 유전자의 하나 이상의 대안 형태의 임의의 것을 의미하며, 이의 모두 대립 유전자는 적어도 하나의 형질 또는 특성과 관련된다. 이배체 세포에서, 소정의 유전자의 두 대립 유전자는 한 쌍의 상동 염색체 상에 상응하는 유전자좌를 차지한다.

본 발명에 사용된 용어 "유전자좌"(복수 유전자좌)는 예를 들어 유전자 또는 유전자 마커가 발견되는 염색체 상의 특정 장소 또는 장소들 또는 위치를 의미한다.

본 발명에 사용된 용어 "유전적으로 연결된"은 교차를 통해 분리하기가 어려워 번식 동안 높은 비율로 공동유전되는 2개 이상의 형질을 의미한다.

본 발명에 사용된 바와 같이 "재조합"또는 "재조합 사건"은 염색체 교차 또는 독립된 분류를 의미한다.

본 발명에 사용된 바와 같이 용어 "표현형"은 개체의 유전적 구성(즉, 유전자형)과 환경 사이의 상호작용으로부터 기인하는 개별 세포, 세포 배양, 유기체 또는 유기체의 그룹의 관찰 가능한 특성을 의미한다.

본 발명에 사용된 바와 같이, 핵산 서열 또는 단백질 서열을 기술할 때 용어 "키메라" 또는 "재조합체"는 적어도 2개의 이종 폴리 뉴클레오타이드 또는 2개의 이종 폴리펩티드를 단일 거대분자 속에 연결하거나 적어도 하나의 천연 핵산 또는 단백질 서열의 하나 이상의 요소를 재배열하는 핵산 또는 단백질 서열을 의미한다. 예를 들어, 용어 "재조합체"는 예를 들어, 화학적 합성 또는 유전 공학 기술에 의한 핵산의 분리된 단편의 조작에 의해 서열의 2개의 분리된 단편의 인공적 조합을 의미할 수 있다.

본 발명에 사용된 바와 같이 "합성 뉴클레오타이드 서열" 또는 "합성 폴리뉴클레오타이드 서열"은 자연에서 발생하는 것으로 알려지지 않았거나 자연 발생적이지 않은 뉴클레오타이드 서열이다. 일반적으로, 이런 합성 뉴클레오타이드 서열은 임의의 다른 자연 발생 뉴클레오타이드 서열과 비교할 때 적어도 하나의 뉴클레오타이드 차이를 포함할 것이다.

본 발명에 사용된 용어 "핵산"은 임의의 길이의 중합체 형태의 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드 또는 이의 유사체를 의미한다. 이 용어는 분자의 1 차 구조를 의미하며, 따라서 이중 나선 및 단일 가닥의 DNA뿐 아니라 이중 및 단일 가닥의 RNA를 포함한다. 또한, 메틸화 및/또는 캡핑된 핵산과 같은 변형된 핵산, 변형된 염기를 함유하는 핵산, 골격 변형 등과 같은 변형 핵산을 포함한다. 용어 "핵산" 및 "뉴클레오타이드 서열"은 상화 교환적으로 사용된다.

본 발명에 사용된 용어 "유전자"는 생물학적 기능과 관련된 DNA의 임의의 단편을 의미한다. 따라서, 유전자는 암호화 서열 및/또는 그의 발현에 요구되는 조절 서열을 포함하나 이에 제한되지 않는다. 유전자는 또한, 예를 들어, 다른 단백질에 대한 인식 서열을 형성하는 비 발현 DNA 단편을 포함할 수 있다. 유전자는 관심 공급원으로부터의 클로닝 또는 공지되거나 예측된 서열 정보로부터의 합성을 포함하는 다양한 공급원으로부터 얻을 수 있고, 원하는 파라미터를 갖도록 디자인된 서열을 포함할 수 있다.

본 발명에 사용된 용어 "상동 기관(homologous)" 또는 "동족체 (homologue)"또는 "오르쏘로그(ortholog)"는 당업계에 공지되어 있고 공통 조상 또는 가족 구성원을 공유하고 서열 동일성의 정도에 기초하여 결정되는 관련 서열을 의미한다. 용어 "상동성", "상동 기관", "실질적으로 유사" 및 "상응하게 실질적으로"는 본 발명에서 상호 교환적으로 사용된다. 이들은 하나 이상의 뉴클레오타이드 염기의 변화가 유전자 발현을 중재하거나 특정 표현형을 생성시키는 핵산 단편의 능력에 영향을 미치지 않는 핵산 단편을 의미한다. 이런 용어는 또한 초기의 변형되지 않은 단편에 비해 생성된 핵산 단편의 기능적 특성을 실질적으로 변화시키지 않는 하나 이상의 뉴클레오타이드의 결실 또는 삽입과 같은 본 발명의 핵산 단편의 변형을 의미한다. 따라서, 당업자가 알 수 있는 바와 같이, 본 발명은 특정 예시적인 서열 이상을 포함하는 것으로 이해된다. 이런 용어는 한 종, 아종, 품종, 품종 또는 균주에서 발견된 유전자 및 다른 종, 아종, 품종, 품종 또는 균주에서 상응하는 또는 동등한 유전자 사이의 관계를 기술한다. 본 발명을 위해서, 상동성 서열이 비교된다. "상동 서열"또는 "상동체"또는 "오르쏘로그"는 기능적으로 관련이 있다고 생각되고, 믿거나 알려진다. 기능적 관계는 (a) 서열 동일성 및/또는 (b) 동일하거나 유사한 생물학적 기능을 포함하나 이에 제한되지 않는 다수의 방식 중 임의의 하나로 표시될 수 있다. 바람직하게는, (a) 및 (b) 모두가 표시된다. 상동성은 Current Protocols in Molecular Biology(F.M. Ausubel et al., eds., 1987) Supplement 30, 섹션 7.718, 표 7.71에서 논의된 바와 같은 당해분야에서 용이하게 이용 가능한 소프트웨어 프로그램을 사용하여 결정될 수있다. 일부 정렬 프로그램은 맥벡터(MacVector)(Oxford Molecular Ltd, Oxford, U.K.), ALIGN 플러스(Plus)(Scientific and Educational Software, Pennsylvania) 및 AlignX(Vector NTI, Invitrogen, Carlsbad, CA)이다. 다른 정렬 프로그램은 기본 매개변수를 사용하여 시퀀처(Sequencher)(Gene Codes, Ann Arbor, Michigan)이다.

본 발명에 사용된 용어 "내인성" 또는 "내인성 유전자"는 숙주 세포 게놈 내에서 자연적으로 발견되는 위치에서 자연 발생 유전자를 의미한다. 본 발명과 관련하여, 이종 프로모터를 내인성 유전자에 작동 가능하게 연결시키는 것은 이 유전자가 자연적으로 존재하는 위치에서 기존 유전자 앞에 이종성 프로모터 서열을 유전적으로 삽입하는 것을 의미한다. 본 발명에 기재된 내인성 유전자는 본 발명의 방법 중 어느 하나에 따라 돌연변이된 자연 발생 유전자의 대립 유전자를 포함할 수있다.

본 발명에 사용된 용어 "외인성"는 용어 "이종성(heterologous)"과 상호 교환적으로 사용되고, 자연 공급원 이외의 일부 공급원으로부터 유도하는 물질을 의미한다. 예를 들어, 용어 "외인성 단백질" 또는 "외인성 유전자"는 비 자연 공급원 또는 위치의 단백질 또는 유전자 및 생물학적 시스템에 공급된 단배질 또는 유전자를 의미한다.

본 발명에 사용된 용어 "뉴클레오타이드 변화"는 당업계에서 잘 알려진 바와 같이, 예를 들어 뉴클레오타이드 치환, 결실 및/또는 삽입을 의미한다. 예를 들어 돌연변이는 침묵 치환, 추가 또는 결실을 생성하나 암호화된 단백질의 특성 또는 활성 또는 단백질이 어떻게 만들어지는지를 변형하지 않는 변경을 함유한다.

본 발명에서 사용된 용어 "단백질 변형"은 당업계에 잘 알려진 바와 같이, 예를 들어 아미노산 치환, 아미노산 변형, 결실 및 또는 삽입을 의미한다.

본 발명에 사용된 용어 핵산 또는 폴리펩타이드의 "적어도 일부" 또는 "단편"은 전장 분자를 포함하는 전장 분자의 이런 서열 또는 임의의 더 큰 단편의 최소 크기 특성을 갖는 부분을 의미한다. 본 발명의 폴리뉴클레오타이드 단편은 유전자 조절 요소의 생물학적 활성 부분을 암호화할 수있다. 유전자 조절 요소의 생물학적 활성 부분은 유전자 조절 요소를 포함하는 본 발명의 폴리뉴클레오타이드 중 하나의 일부를 분리하고 본 발명에 기재된 바와 같은 활성을 평가함으로써 제조될 수 있다. 유사하게, 폴리펩타이드의 일부는 전장 폴리펩타이드까지 이르는 4개 아미노산, 5개 아미노산, 6개 아미노산, 7개 아미노산 등일 수 있다. 사용될 부분의 길이는 특정 용도에 따라 다를 것이다. 하이브리드화 프로브로서 유용한 핵산의 일부는 12개 뉴클레오타이드 정도로 짧을 수 있으며; 일부 실시태양에서, 이것은 20개 뉴클레오타이드이다. 에피토프로서 유용한 폴리펩티드의 일부는 4개의 아미노산 정도로 짧을 수 있다. 전장 폴리펩타이드의 기능을 수행하는 폴리펩타이드의 일부는 일반적으로 4개 이상의 아미노산보다 길 수 있다.

변이체 폴리뉴클레오타이드는 또한 DNA 셔플링과 같은 돌연변이 및 재조합 절차로부터 유도된 서열을 포함한다. 그러한 DNA 셔플링을위한 전략은 당업계에 공지되어있다. 예를 들어, Stemmer(1994) PNAS 91:10747-10751; Stemmer(1994) Nature 370:389-391; Crameri et al.(1997) Nature Biotech. 15:436-438; Moore et al.(1997) J. Mol. Biol. 272:336-347; Zhang et al.(1997) PNAS 94:4504-4509; Crameri et al.(1998) Nature 391:288-291; 및 미국 특허 제5,605,793호 및 제5,837,458호 참조.

본 발명에 개시된 폴리뉴클레오타이드의 PCR 증폭을 위해, 임의의 관심 유기체로부터 추출된 cDNA 또는 게놈 DNA로부터의 상응하는 DNA 서열을 증폭시키기 위한 PCR 반응에 사용하기 위해 올리고뉴클레오타이드 프라이머가 디자인될 수 있다. PCR 프라이머 및 PCR 클로닝을 디자인하기 위한 방법은 당업계에 일반적으로 공지되어 있으며, Sambrook et al.(2001) Molecular Cloning: A Laboratory Manual (3^rd ed., Cold Spring Harbor Laboratory Press, Plainview, New York). See also Innis et al., eds. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, New York); Innis and Gelfand, eds. (1995) PCR Strategies (Academic Press, New York); and Innis and Gelfand, eds. (1999) PCR Methods Manual (Academic Press, New York)에 개시된다. PCR의 공지된 방법은 쌍을 이룬 프라이머, 네스티드 프라이머, 단일 특이적 프라이머, 축퇴성 프라이머, 유전자 특이적 프라이머, 벡터 특이적 프라이머, 부분적 불일치 프라이머 등을 사용하는 방법을 포함하나 이에 제한되지 않는다.

본 발명에 사용된 용어 "프라이머"는 DNA 중합효소를 부착시키는 증폭 표적에 대한 어닐링을 행할 수 있어, 프라이머 연장 생성물의 합성이 유도되는 조건하에 놓일 때, 즉, 뉴클레오타이드 및 DNA 중합효소와 같은 중합화제의 존재하에서 및 적절한 온도 및 pH에서 DNA 합성의 개시점으로서 작용하는 올리고뉴클레오타이드를 의미한다. (증폭) 프라이머는 증폭 효율을 최대화하기 위해 바람직하게는 단일 가닥이다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오타이드이다. 프라이머는 중합화제의 존재 하에서 증량 생성물의 합성을 시작하기에 충분히 길어야한다. 프라이머의 정확한 길이는 프라이머의 온도 및 조성(A/T 대 G/C 함량)을 포함하는 많은 요소에 따라 달라질 것이다. 한 쌍의 양방향성 프라이머는 PCR 증폭과 같은 DNA 증폭 기술 분야에서 일반적으로 사용되는 것과 같은 하나의 순방향 및 역방향 프라이머로 구성된다.

본 발명에 사용된 용어 "프로모터"는 암호화 서열 또는 기능성 RNA의 발현을 제어할 수있는 DNA 서열을 의미한다. 일부 실시태양에서, 프로모터 서열은 근위 및 더 원위 상류 요소로 구성되고, 후자의 요소는 종종 인핸서로 의미된다. 따라서, "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이며, 프로모터의 선천적인 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다. 프로모터는 천연 유전자로부터 완전히 유도되거나 자연계에서 발견되는 다른 프로모터로부터 유도된 상이한 요소로 구성되거나 심지어 합성 DNA 단편을 포함할 수 있다. 상이한 프로모터가 상이한 조직 또는 세포 유형, 또는 상이한 발달 단계 또는 상이한 환경 조건에 대한 반응으로 유전자의 발현을 지시할 수 있음은 당업자에게 이해된다. 또한, 대부분의 경우에, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 일부 변이체의 DNA 단편은 동일한 프로모터 활성을 가질 수 있다는 것이 추가로 인식된다.

본 발명에서 사용된 용어 "재조합 구조체", "발현 구조체", "키메라 구조체", "구조체" 및 "재조합 DNA 구조체"는 본 발명에서 상호 교환적으로 사용된다. 재조합 구조체는 천연에서 함께 발견되지 않는 조절 및 암호화 서열과 같은 핵산 단편의 인위적인 조합을 포함한다. 예를 들어, 키메라 구조체는 상이한 공급원으로부터 유도된 조절 서열 및 암호화 서열, 또는 동일한 공급원으로부터 유도되지만 자연계에서 발견되는 것과 상이한 방식으로 배열된 조절 서열 및 암호화 서열을 포함할 수 있다. 이러한 구조체는 그 자체로 사용되거나 벡터와 함께 사용될 수 있다. 벡터가 사용되는 경우 벡터의 선택은 당업자에게 주지된 바와 같이 숙주 세포를 형질 전환하는데 사용될 방법에 의존한다. 예를 들어, 플라스미드 벡터가 사용될 수 있다. 당업자는 본 발명의 분리된 핵산 단편을 포함하는 숙주 세포를 성공적으로 형질전환, 선별 및 증식시키기 위해 벡터 상에 존재해야 하는 유전자 요소를 잘 알고 있다. 당업자는 또한 상이한 독립적인 형질전환 사건이 발현의 상이한 수준 및 패턴을 유도한다는 것을 인식할 것이며(Jones et al., (1985) EMBO J. 4 : 2411-2418; De Almeida et al., (1989) Mol. Gen Genetics 218 : 78-86), 따라서 다수의 사건은 원하는 발현 수준 및 패턴을 나타내는 라인을 수득하기 위해 선별돼야한다. 이러한 선별은 다른 것들 중에서, DNA의 서던 분석, mRNA 발현의 노던 분석, 단백질 발현의 면역 블로 팅 분석 또는 표현형 분석에 의해 실행될 수 있다. 벡터는 자율적으로 복제하거나 숙주 세포의 염색체에 통합될 수있는 플라스미드, 바이러스, 박테리오파지, 프로-바이러스, 파지미드, 트랜스포존, 인공 염색체 등일 수있다. 벡터는 또한 자율적으로 복제하지 않는 네이키드 RNA 폴리뉴클레오타이드, 네이키드 DNA 폴리뉴클레오타이드, 동일한 가닥 내의 DNA 및 RNA 모두로 구성된 폴리뉴클레오타이드, 폴리-라이신-컨쥬게이드된 DNA 또는 RNA, 펩타이드-컨쥬게이드된 DNA 또는 RNA, 리포좀-컨쥬게이드된 DNA 등일 수 있다. 본 발명에 사용된 용어 "발현"은 기능적 최종 산물, 예를 들어 mRNA 또는 단백질(전구체 또는 성숙)의 생산을 의미한다.

"작동 가능하게 연결된"은 추가 폴리뉴클레오타이드의 전사를 초래하는 추가의 올리고뉴클레오타이드 또는 폴리뉴클레오타이드에 의한 본 발명에 따른 프로모터 폴리뉴클레오타이드의 순차적 배열을 의미한다.

본 발명에서 사용된 용어 "관심 생성물" 또는 "생체분자"는 원료로부터 미생물에 의해 생성된 임의의 생성물을 의미한다. 일부 경우에, 관심 생성물은 소분자, 효소, 펩타이드, 아미노산, 유기산, 합성 화합물, 연료, 알코올 등일 수 있다. 예를 들어, 관심 생성물 또는 생체분자는 임의의 1차 또는 2차 세포외 대사산물일 수 있다. 1차 대사산물은 특히 에탄올, 시트르산, 락트산, 글루탐산, 글루탐산염, 라이신, 트레오닌, 트립토판 및 다른 아미노산, 비타민, 폴리사카라이드 등일 수 있다. 2차 대사산물은 특히 페니실린과 같은 항생물질 또는 사이클로스포린 A와 같은 면역 억제제, 지베렐린과 같은 식물 호르몬, 로바스타틴과 같은 스타틴 약물, 그리세오풀빈과 같은 살균제 등일 수 있다. 관심 생성물 또는 생체분자는 또한 카탈라아제, 아밀라아제, 펙티나아제, 글루코오스 아이소머라제, 셀룰라아제, 헤미셀룰라아제, 리파아제, 락타아제, 스트렙토 키나아제 및 여러 다른 것을 포함하는 미생물 효소와 같은 미생물에 의해 생성된 임의의 세포내 성분일 수 있다. 세포내 성분은 또한 인슐린, B형 간염 백신, 인터페론, 과립구 콜로니-자극 인자, 스트렙토키나아제 및 기타와 같은 재조합 단백질을 포함할 수 있다.

용어 "탄소원"은 일반적으로 세포 성장을 위한 탄소원으로 사용되기에 적합한 물질을 의미한다. 탄소원은 바이오매스 가수분해물, 전분, 수크로오스, 셀룰로오스, 헤미셀룰로오스, 자일로오스 및 리그닌뿐만 아니라 이들 기질의 단량체 성분을 포함하나 이에 제한되지 않는다. 탄소원은 폴리머, 탄수화물, 산, 알코올, 알데하이드, 케톤, 아미노산, 펩타이드 등을 포함하나 이에 제한되지 않는 다양한 형태의 다양한 유기 화합물을 포함할 수 있다. 이들은, 예를 들어, 글루코오스, 덱스트로스(D-글루코오스), 말토오스, 올리고사카라이드, 폴리사카라이드, 포화 또는 불포화 지방산, 숙시네이트, 락테이트, 아세테이트, 에탄올 등, 또는 이의 혼합물과 같은 다양한 모노사카라이드를 포함한다. 광합성 유기체는 광합성의 산물로서 탄소원을 추가로 생산할 수 있다. 일부 실시태양에서, 탄소원은 바이오매스 가수분해물 및 글루코오스로부터 선택될 수 있다.

용어 "공급원료"는 미생물 또는 발효 공정에 공급되는 원료 또는 원료의 혼합물로서 다른 생성물이 제조될 수 있는 것으로 정의된다. 예를 들어, 바이오매스 또는 바이오매스에서 유도된 탄소 화합물과 같은 탄소 공급원은 발효 공정에서 관심 생성물(예를 들어, 소분자, 펩타이드, 합성 화합물, 연료, 알코올 등)을 생산하는 미생물의 공급원료이다. 그러나, 공급원료는 탄소 공급원 이외의 영양분을 함 유할 수 있다.

용어 "체적 생산성" 또는 "생산 속도"는 단위 시간당 매질의 부피당 형성된 생성물의 양으로 정의된다. 체적 생산성은 시간당 리터 당 그램(g/L/h)으로 보고될 수 있다.

용어 "비 생산성"은 생성물의 형성 속도로 정의된다. 비 생산성은 본 발명에서 시간당 세포 건조 중량의 그래당 그램 생성물(g/g CDW/h)의 비 생산성으로서 더 정의된다. 소정의 미생물에 대한 OD₆₀₀에 대한 CDW의 관계를 사용하여, 비 생산성은 시간당 600nm(OD)(g/L/h/OD)에서 배양액의 광학 밀도당 배양 배지당 그램 생성물로 표현될 수 있다.

용어 "수율"은 원료의 단위 중량당 수득된 생성물의 양으로 정의되며 g 기질 당 g 생성물(g/g)로 표현될 수 있다. 수율은 이론적 수율의 백분율로 표현될 수있다. "이론적 수율"은 생성물을 제조하는데 사용된 신진대사 경로의 화학양론에 따라 결정된 소정량의 기질당 생성될 수 있는 최대 생성물로 정의된다.

용어 "역가(titre 또는 titer)"는 용액의 강도 또는 용액 속의 물질의 농도로 정의된다. 예를 들어, 발효액에서 관심 생성물(예를 들어, 소분자, 펩타이드, 합성 화합물, 연료, 알코올 등)의 역가는 발효액 1 리터당 용액 속 관심 제품의 g(g/L)로 기술된다.

용어 "총 적가"는 용액 속의 관심 생성물, 적용 가능한 경우 기체상의 관심 생성물, 공정으로부터 제거되고 공정에서 최초 부피 또는 공정에서 작동 부피에 따라 회수된 임의의 관심 생성물을 포함하나 이에 제한되지 않는 공정에서 생산된 모든 관심 생성물의 합으로 정의된다.

본 발명에 사용된 용어 "HTP 유전 디자인 라이브러리" 또는 "라이브러리"는 본 발명에 따른 유전자 교란의 집합을 의미한다. 일부 실시태양에서, 본 발명의 라이브러리는 i) 데이터베이스 또는 다른 컴퓨터 파일에서 서열 정보의 집합, ii) 상기한 일련의 유전자 요소를 암호화하는 유전자 구조체의 집합, 또는 iii) 상기 유전자 요소를 포함하는 숙주 세포 균주로서 입증될 수 있다. 일부 실시태양에서, 본 발명의 라이브러리는 개별 요소의 집합(예를 등러, PRO 스왑 라이브러리를 위한 프로모터 집합 또는 STOP 스왑 라이브러리 또는 트랜스포존 돌연변이유발 라이브러리를 위한 터미네이터 집합)을 의미할 수 있다. 다른 실시태양에서, 본 발명의 라이브러리는 프로모터::유전자, 유전자:터미네이터, 또는 유전자 결실 또는 교란 또는 심지어 프로모터:유전자:터미네이터의 조합과 같은 유전자 요소의 조합을 의미할 수 있다. 일부 실시태양에서, 본 발명의 라이브러리는 숙주 유기체에서 라이브러리의 각 구성원을 적용하는 효과와 관련된 메타 데이터를 추가로 포함한다. 예를 들어, 본 발명에서 사용된 라이브러리는 특정 종에서 하나 이상의 표현형에 대한 이들 조합의 얻어진 효과와 함께 프로모터::유전자 서열 조합의 집합을 포함할 수 있으며, 따라서 미래 프로모터 스왑에 상기 조합을 사용하는 미래 예측 가치를 개량시킨다.

본 발명에서 사용된 용어 "SNP"는 작은 핵 다형성(들)을 의미한다. 일부 실시태양에서, 본 발명의 SNP는 광범위하게 해석되어야하며, 단일 뉴클레오타이드 다형성, 서열 삽입, 결실, 역전 및 다른 서열 치환을 포함한다. 본 발명에서 사용된 용어 "비 동의" 또는 비 동의 SNP "는 숙주 세포 단백질에서 암호화 변화를 유도하는 돌연변이를 의미한다

게놈 공학의 "고 처리량(HTP)" 방법은 상기 방법의 적어도 하나의 단계를 수행하기 위한 자동화 장비(예를 들어, 액체 핸들러 또는 플레이트 핸들러 머신)의 적어도 하나의 부품의 이용을 필요로 할 수 있다.

용어 "트랜스포존"은 공여체 폴리뉴클레오타이드, 예를 들어 벡터로부터 여기될 수 있고 표적 부위, 예를 들어 세포의 게놈 DNA에 통합될 수 있는 폴리뉴클레오타이드를 의미한다. 트랜스포존은 트랜스포존의 말단에 위치한 시스-작용 뉴클레오타이드 서열에 의해 플랭킹된 핵산 서열을 포함하는 폴리뉴클레오타이드를 포함할 수 있다. 적어도 하나의 시스-작용 뉴클레오타이드 서열이 핵산 서열의 5'에 위치되고 적어도 하나의 시스-작용 뉴클레오타이드가 핵산 서열의 3'에 위치하는 경우, 핵산 서열은 시스-작용 뉴클레오타이드 서열에 의해 "플랭킹"된다. 시스-작용 뉴클레오타이드 서열에 의해 플랭킹된 핵산 서열은 본 발명에서 "플랭킹된 서열"로 지칭될 수 있다. 시스-작용 뉴클레오타이드 서열은 트랜스포존이 결합하는 트랜스포존의 각 말단에서 적어도 하나의 반전된 반복체를 포함한다. "플랭킹 서열" 또는 "트랜스포존 페이로드"는 플랭킹된 서열이 치환에 의해 삽입되는 암호화 영역 근처 또는 암호화 영역에 의해 발현된 생성물의 발현 수준 또는 성질에 이의 삽입이 영향을 미칠 핵산 서열이다. 발현된 생성물의 성질이 변경될 때, 핵산은 "파괴적 서열(disruptive sequence)"로 지칭된다. 발현 수준이 변경될 때, 핵산은 "정서적 서열(affective sequence)"로 지칭된다. 본 발명의 트랜스포존은 하나 이상의 삽입 돌연변이원을 포함할 수 있으며, 이는 파괴적 및/또는 정서적 서열일 수 있다.

본 발명에 사용된 용어 "Pro 스왑"은 전체 숙주 균주 표현형에 유리한 효과를 생성하기 위해 최적의 발현 특성을 갖는 프로모터를 선택하는 방법을 지칭한다. 일부 실시태did에서, 이들 방법은 다양한 발현 강도 또는 우수한 조절 특성을 나타내는 숙주 세포 내에서 하나 이상의 프로모터를 확인 및/또는 하나 이상의 프로모터의 변이체를 생성하는 방법을 포함한다. 이들 확인된 및/또는 생성된 프로모터의 특정 조합은 프로모터 래더로서 함께 그룹화될 수 있다.

본 발명에 사용된 용어 "SNP 스왑"은 균주에 걸친 개별적인 작은 핵 다형성 뉴클레오타이드 돌연변이(즉, SNP)의 체계적인 도입 또는 제거를 지칭한다. 일부 실시태양에서,이 과정을 통해 조작된 생성 미생물은 HTP 유전자 디자인 라이브러리를 형성한다. 일부 실시태양에서, SNP 스와핑은 확인된 유리한 성능 효과를 갖는 표적 SNP "빌딩 블록"의 최적 조합을 갖는 숙주 유기체의 재구성을 포함한다. 따라서, 일부 실시태양에서, SNP 스와핑은 다수의 유리한 돌연변이를 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다수의 변화로서 단일 균주 배경으로 통합시키는 것을 포함한다. 다수의 변화는 특정 세트의 정의된 변화 또는 부분적으로 무작위 화된 조합의 돌연변이 라이브러리일 수 있다. 다른 실시태양에서, SNP 스와핑은 또한 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 균주로부터 유해한 것으로 확인된 다중 돌연변이를 제거하는 것을 수반한다. 다수의 변화는 특정 세트의 정의된 변화 또는 부분적으로 무작위화된 조합의 돌연변이 라이브러리일수 있다. 일부 실시태양에서, 본 발명의 SNP 스와핑은 유리한 SNP의 첨가 및 유해 및/또는 중성 돌연변이의 제거 둘 다를 포함한다.

본 발명에 사용된 용어 "STOP 스왑"은 세포 유전자 전사의 최적화를 통해 (예를 들어 유전자 터미네이터 서열의 조정을 통한 전사의 조정을 통해) 숙주 세포 생산성을 개선시키는 방법을 지칭한다. 일부 실시태양에서, 본 발명은 전체 숙주 균주 생산성에 유리한 효과를 생성하기 위해 최적의 발현 특성을 갖는 종결 서열( "터미네이터")을 선택하는 방법을 교시한다. 일부 실시태양에서, 이 방법은 다양한 발현 강도(예를 들어, 터미네이터 래더)를 나타내는 숙주 세포 내에서 하나 이상의 터미네이터를 확인 및/또는 하나 이상의 터미네이터의 변이체를 생성하는 것을 포함한다. 이들 확인된 및/또는 생성된 터미네이터의 특정한 조합은 터미네이터 래더로서 함께 그룹화될 수 있다.

균주 개량의 전통적인 방법

균주 개량에 대한 전통적인 접근법은 크게 두 가지 유형의 접근법으로 분류 될 수 있다: 지시된(directed) 균주 조작 및 무작위 돌연변이유발.

균주 개량의 지시된 조작 방법은 특정 유기체의 소수의 유전자 요소의 계획된 교란을 필요로 한다. 이러한 접근법은 전형적으로 특정 생합성 또는 발달 프로그램을 조절하는데 중점을 두고 있으며, 상기 경로에 영향을 미치는 유전적 및 대사적 요인에 대한 사전 지식에 의존한다. 이의 가장 간단한 실시태양에서, 지시된 조작은 하나의 유기체로부터 동일하거나 상이한 종의 다른 유기체로 특성화된 형질(예를 들어, 유전자, 프로모터, 또는 측정 가능한 표현형을 생산할 수 있는 다른 유전 요소)의 전달을 필요로 한다.

균주 조작에 대한 무작위 접근법은 성능 개량을 확인하기 위한 광범위한 선별과 함께 부모 균주의 무작위 돌연변이유발을 필요로 한다. 이러한 무작위 돌연변이를 일으키기 위한 접근법은 자외선 복사에너지 또는 에틸 메테인설포네이트와 같은 돌연변이유발 화학물질에 대한 노출을 포함한다. 무작위적이며 매우 예측할 수 없음을 통해, 균주 개량에 대한 이런 전통적인 접근법은 보다 지시된 유전자 조작에 비해 몇 가지 장점을 가졌다. 첫째, 많은 산업 유기체는 유전자 및 대사성 레파토리의 관점에서 특성이 좋지 않아서(좋지 않게 유지되어), 불가능한 것은 아니지만 대안적인 직접적인 개량 접근법을 어렵게 만들었다.

둘째, 비교적 특성이 규명된 시스템에서도, 산업 성능 개량을 초래하는 유전자형 변화는 예측하기 어렵고, 때때로 알려지고 알려지지 않은 기능의 많은 유전자에서 누적 돌연변이를 필요로 하는 상위성 표현형으로만 나타난다.

또한, 수년 동안, 소정의 산업용 유기체에서 직접적인 게놈 돌연변이를 만드는데 필요한 유전자 도구는 이용할 수 없거나 사용이 매우 느리고 및/또는 어려웠다.

그러나, 종래의 균주 개량 프로그램의 확장된 적용은 소정의 균주 계보에서 점진적으로 감소된 이득을 가져오고, 궁극적으로는 추가 균주 효율에 대한 소진된 가능성을 야기한다. 유익한 무작위 돌연변이는 상대적으로 드문 경우이며 큰 선별 풀과 높은 돌연변이율을 필요로 한다. 이것은 필연적으로 "개량된" 균주에서 많은 중립적인 및/또는 해로운(또는 부분적으로 해로운) 돌연변이의 부주의한 누적을 초래하여, 궁극적으로 미래 효율성 향상에 대한 장애물을 형성한다.

전통적인 누적 개량 접근법의 다른 한계는 임의의 균주 메트릭에 대한 임의의 특정 돌연변이의 효과에 대한 정보가 거의 또는 전혀 없다는 것이다. 이것은 근본적으로 유익한 돌연변이를 결합 및 통합하거나 중립적이거나 해로운 돌연변이유발성 "수하물(baggage)"을 제거하는 연구자의 능력을 제한한다.

돌연변이성 계통 내에서 균주 간의 돌연변이를 무작위로 재조합시키는 다른 접근법 및 기술이 존재한다. 예를 들어, DNA 셔플링, 진화 또는 분자 육종으로 때때로 불리는 반복적 서열 재조합에 대한 몇몇 포맷 및 예가 미국 특허출원, Ser. No. 08/198,431, filed Feb. 17, 1994, Serial No. PCT/US95/02126, filed, Feb. 17, 1995, Ser. No. 08/425,684, filed Apr. 18, 1995, Ser. No. 08/537,874, filed Oct. 30, 1995, Ser. No. 08/564,955, filed Nov. 30, 1995, Ser. No. 08/621,859, filed. Mar. 25, 1996, Ser. No. 08/621,430, filed Mar. 25, 1996, Serial No. PCT/US96/05480, filed Apr. 18, 1996, Ser. No. 08/650,400, filed May 20, 1996, Ser. No. 08/675,502, filed Jul. 3, 1996, Ser. No. 08/721, 824, filed Sep. 27, 1996, and Ser. No. 08/722,660 filed Sep. 27, 1996; Stemmer,　Science　270:1510 (1995); Stemmer et al.,　Gene164:49-53 (1995); Stemmer,　Bio/Technology　13:549-553 (1995); Stemmer, Proc. Natl. Acad. Sci. U.S.A.　91:10747-10751 (1994); Stemmer,　Nature370:389-391 (1994); Crameri et al.,　Nature Medicine　2(1):1-3 (1996); Crameri et al.,　Nature Biotechnology　14:315-319 (1996)에 기술되며, 이의 각각은 모든 목적을 위해 그 전문이 본 발명에 참조로 포함된다.

이들은 돌연변이 균주를 통한 게놈 재조합을 용이하게 하는 원형질 융합 및 전체 게놈 셔플링과 같은 기술을 포함한다. 효모 및 사상균류와 같은 일부 산업용 미생물의 경우, 자연 교배 주기가 쌍을 이루는 방식의 게놈 재조합에도 이용될 수 있다. 이런 방식으로, 해로운 돌연변이는 부모 균주에 의한 돌연변이체를 "백-크로싱"하여 제거될 수 있고 유익한 돌연변이가 강화될 수 있다. 또한, 두 가지 다른 균주 계통의 유익한 돌연변이가 잠재적으로 결합될 수 있어서, 단일 균주 계통을 자체로 돌연변이시킴으로써 얻을 수 있는 것보다 추가적인 개량 가능성을 형성할 수 있다. 그러나, 이런 접근법은 본 발명의 방법을 사용하여 피하게 되는 많은 제한을 받는다.

예를 들어, 상기한 바와 같은 전통적인 재조합 접근법은 느리고 돌연변이를 교환하기 위한 비교적 적은 수의 랜덤 재조합 크로스오버 사건에 의존하며, 따라서 임의의 소정의 주기 또는 시간 기간에서 시도될 수 있는 조합의 수에 제한이 있다. 또한, 선행 기술의 자연 재조합 사건은 본질적으로 무작위이지만, 이들은 또한 게놈 위치 편향에 영향을 받는다.

가장 중요한 것은, 전통적인 접근법은 개개의 돌연변이의 영향에 대한 정보를 거의 제공하지 않으며, 재조합 돌연변이의 무작위적인 분포로 인해 많은 특정 조합이 생성 및 평가될 수 없다.

종래의 균주 개량 프로그램과 관련된 여러 상기한 문제를 극복하기 위해, 본 발명은 계산적으로 구동되고 분자 생물학, 자동화, 데이터 분석 및 기계 학습 프로토콜을 통합하는 독특한 HTP 게놈 공학 플랫폼을 개시한다. 이 통합 플랫폼은 HTP 유전자 디자인 라이브러리를 구축하는데 사용되는 한 벌의 HTP 분자 도구 세트를 사용한다. 이러한 유전자 디자인 라이브러리는 아래에 자세히 설명될 것이다.

교시된 HTP 플랫폼 및 이의 독특한 미생물 유전자 디자인 라이브러리는 미생물 균주 개발 및 진화의 패러다임을 근본적으로 변화시킨다. 예를 들어, 산업용 미생물 균주를 개발하는 전통적인 돌연변이유발 기반의 방법은 수년간의 무작위 돌연변이유발 동안 축적된 중대한 돌연변이유발성 부하에 의해 부담을 진 미생물을 결국 유발할 것이다.

이러한 문제점을 해결하는(즉, 이들 미생물에 의해 축적된 유전자 수하물을 제거하는) 능력은 수십 년 동안 미생물 연구자들을 회피하였다. 그러나, 본 발명에 개시된 HTP 플랫폼을 이용하여, 이들 산업용 균주는 "재활"될 수 있고 해로운 유전 자 돌연변이가 확인되고 제거될 수 있다. 부합하게, 유익한 것으로 확인된 유전자 돌연변이는 유지될 수 있고 일부 경우에 개량될 수 있다. 생성된 미생물 균주는 이들의 부모의 균주와 비교하여 우수한 표현형 형질(예를 들어, 관심 화합물의 개량된 생산)을 나타낸다.

또한, 본 발명에서 교시된 HTP 플랫폼은 개별 돌연변이가 미생물 균주 성능에 미치는 효과를 확인, 특징화 및 정량화할 수 있다. 이 정보, 즉 소정의 유전자 변화 x가 숙주 세포 표현형 y에 대해 갖는 효과(예를 들어, 화합물 또는 관심 생성물의 생산)는 생성될 수 있고, 이후에 논의되는 미생물 HTP 유전자 디자인 라이브러리에 저장될 수 있다. 즉, 각 유전자 순열에 대한 서열 정보 및 숙주 세포 표현형에 대한 이의 효과는 하나 이상의 데이터베이스에 저장되며, 후속 분(예를 들어, 아래에서 논의되는 바와 같이 상위성 매핑)에 이용가능하다. 본 발명은 또한 유전자 삽입 구조체의 형태로, 또는 상기 유전자 순열을 함유하는 하나 이상의 숙주 세포 생물체의 형태로 귀중한 유전자 순열을 물리적으로 보호/저장하는 방법을 교시한다(예를 들어, 이하에서 논의되는 라이브러리 참조).

이들 HTP 유전 디자인 라이브러리를 정교한 데이터 분석 및 기계 학습 과정과 통합된 반복적 과정에 결합시키면 숙주 세포를 개량하기 위한 극적으로 상이한 방법론이 나타난다. 따라서, 교시된 플랫폼은 숙주 세포 균주를 개발하는 이전에 논의된 전통적인 방법과 근본적으로 상이하다. 교시된 HTP 플랫폼은 이전 방법과 관련된 많은 단점을 겪지 않는다. HTP 분자 도구 세트와 아래 논의된 유도된 유전자 디자인 라이브러리를 참조하면 이러한 장점과 다른 장점이 분명해질 것이다.

유전자 디자인 및 미생물 조작: 한 벌의 HTP 분자 도구 및 HTP 유전자 디자인 라이브러리를 이용하는 균주 개량에 대한 체계적인 조합 접근법

상기한 바와 같이, 본 발명은 균주를 통한 유전자 변화의 반복적인 체계적 도입 및 제거를 통해 미생물을 조작하기 위한 신규한 HTP 플랫폼 및 유전자 디자인 전략을 제공한다. 이 플랫폼은 HTP 유전자 디자인 라이브러리의 생성을 가능하게 하고 소정의 숙주 균주 속에 유전자 변이의 효율적 수행을 허용하는 한 벌의 분자 도구에 의해 지원된다.

본 발명의 HTP 유전자 디자인 라이브러리는 특정 미생물 균주 배경 속에 도입될 수 있는 가능한 유전자 변형의 공급원으로 작용한다. 이러한 방식으로, HTP 유전자 디자인 라이브러리는 소정의 미생물 균주의 초기 또는 추가 조작에 적용될 수 있는 유전자 다양성의 저장소 또는 유전자 교란의 집합이다. 숙주 균주에 대한 실행을 위한 유전자 디자인을 프로그래밍하는 기술은 본 발명에 참조로 인용된 "Microbial Strain Design System and Methods for Improved Large Scale Production of Engineered Nucleotide Sequences,"이라는 명칭의 계류중인 미국 특허 출원, Serial No. 15/140,296에 기술된다.

이 플랫폼에서 이용되는 HTP 분자 도구 세트는 특히 (1) 프로모터 스왑 (PRO 스왑), (2) SNP 스왑, (3) 개시/중지 코돈 교환, (4) STOP 스왑, (5) 서열 최적화 및 (6) 트랜스포존 돌연변이유발 또는 이의 조합을 포함할 수 있다. 본 발명의 HTP 방법은 또한 (7) 상위성 매핑 프로토콜을 포함하는 HTP 도구 세트의 통합/조합 사용을 지시하는 방법을 교시한다. 상기한 바와 같이, 이 한 벌의 분자 도구는 단독 또는 조합으로 HTP 유전자 디자인 숙주 세포 라이브러리의 형성을 가능하게 한다.

입증된 바와 같이, 상기한 HTP 미생물 조작 플랫폼의 내용에서 상기한 HTP 유전자 디자인 라이브러리의 이용은 유익한 "원인성" 돌연변이 또는 유전자 절편의 확인 및 통합 및 수동적 또는 해로운 돌연변이 또는 유전자 절편의 확인 및 제거를 가능하게 한다. 이 새로운 접근법은 전통적인 무작위 돌연변이유발 또는 지시된 유전자 조작으로는 달성할 수 없었던 균주 성능의 신속한 개량을 가능하게 한다. 유전자 부담의 제거 또는 유전자 부담이 없는 균주로의 유익한 변화의 통합은 추가적인 개량을 가능하게 할 수 있는 추가 무작위 돌연변이유발을 위한 새롭고 강력한 출발점을 제공한다.

일부 실시태양에서, 본 발명은 직교 유익한 변화가 돌연변이유발성 균주 계통의 다양한 이산 분지를 통해 확인됨에 따라, 이들은 또한 더 나은 실행 균주로 신속하게 통합될 수 있음을 교시한다. 이러한 돌연변이는 지시된 유전 공학 기술로 얻은 개량을 가진 균주와 같이 돌연변이유발 계통의 일부가 아닌 균주로 통합될 수 있다.

일부 실시태양에서, 본 발명은 발현 및 비 발현 유전 요소를 포함하는 다수의 이종 게놈 영역에 걸친 돌연변이의 게놈 전체 조합 효과를 분석하고 수집된 정보(예를 들어, 실험 결과)를 사용하여 균주 향상을 일으키는 것으로 예상된 돌연변이 조합을 예측한다는 점에서 공지된 균주 개량 접근법과 상이하다.

일부 실시태양에서, 본 발명은 i) 산업용 미생물 및 개시된 발명을 통한 개량에 순종하는 다른 숙주 세포, ii) 하류 분석을 위한 다양성 풀 생성, iii) 고 처리량 선별 및 대형 변이체 풀의 서열화를 위한 방법 및 하드웨어 iv) 게놈 전체 돌연변이의 시너지 효과의 기계 학습 계산 분석 및 예측을 위한 방법 및 하드웨어, 및 v) 고 처리량 균주 조작을 위한 방법.

다음 분자 도구 및 라이브러리는 예시적인 미생물의 예에 의해 논의된다. 당업자는 본 발명의 HTP 분자 툴이 진핵생물 세포 및 고차원 생명 형태를 포함하는 임의의 숙주 세포와 양립할 수 있다는 것을 인식할 것이다.

미생물 조작 플랫폼에서 이용되는 다양한 HTP 유전자 디자인 라이브러리의 생성을 가능하게 하는 확인된 HTP 분자 도구 세트의 각각은 이제 논의될 것이다.

1. 프로모터 스왑: 프로모터 스왑 미생물 균주 라이브러리의 유도를 위한 분자 도구

일부 실시태양에서, 본 발명은 전체 숙주 균주 표현형에 유익한 효과를 나타내기 위해 최적 발현 특성(예를 들어, 수율 또는 생산성)을 갖는 프로모터를 선별하는 방법을 교시한다.

예를 들어, 일부 실시태양에서, 본 발명은 다양한 발현 강도(예를 들어, 아래에서 논의된 프로모터 래더) 또는 뛰어난 조절 특성(예를 들어, 선택된 유전자에 대한 엄격한 조절 제어)을 나타내는 하나 이상의 프로모터를 확인 및/또는 숙주 세포 내에서 하나 이상의 프로모터의 변이체를 생성시키는 방법을 교시한다. 이들 확인된 및/또는 생성된 프로모터의 특정 조합은 프로모터 래더로서 함께 그룹화될 수 있으며, 이는 보다 상세히 이하에서 설명된다.

당해 프로모터 래더는 소정의 관심 유전자와 결합된다. 따라서, 프로모터 P₁-P₈(다양한 발현 강도를 나타내는 것으로 확인된 및/또는 생성된 8개의 프로모터를 나타냄)이 있고 프로모터 래더를 미생물에서 관심 단일 유전자와 결합시킨다면(즉, 소정의 표적 유전자에 작동 가능하게 연결된 소정의 프로모터에 의해 미생물을 유전적으로 조작한다), 8개 프로모터의 각 조합의 효과는 조작된 미생물이 표적 유전자와 결합된 특정 프로모터(들)를 제외하고 그렇지 않다면 동일한 유전자 배경을 갖는 것을 고려하여, 각 조합적 노력으로부터 생성되는 각각의 조작된 균주를 특성화함으로써 확인될 수 있다.

이 과정을 통해 조작되어 생성된 미생물은 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성되는 실제의 물리적 미생물 균주 집합을 의미할 수 있으며, 각각의 구성원 균주는 그렇지 않다면 동일한 유전자 배경으로 특정 표적 유전자에 작동 가능하게 연결된 소정의 프로모터를 나타내며, 상기 라이브러리는 "프로모터 스왑 미생물 균주 라이브러리"로 불린다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란의 집합-이 경우 소정의 유전자에 작동 가능하게 연결된 소정의 프로모터 x)을 의미할 수 있으며-상기 집합은 "프로모터 스왑 라이브러리"로 불린다.

또한, 미생물을 조작하기 위해 프로모터 P₁-P₈을 포함하는 동일한 프로모터 래더를 이용할 수 있으며, 여기서 8개의 프로모터의 각각은 10개의 상이한 유전자 표적에 작동 가능하게 연결된다. 이 절차의 결과는 관심 표적 유전자에 작동 가능하게 연결된 특정 프로모터를 제외하고, 그렇지 않다면 유전적으로 동일하게 간주되는 80개의 미생물이 될 것이다. 이런 80개 미생물은 적절하게 선별되고 특징화되고 다른 HTP 유전자 디자인 라이브러리를 생성한다. HTP 유전자 디자인 라이브러리에서 미생물 균주의 특성화는 관계형 데이터베이스, 객체 지향 데이터베이스 또는 고도로 분산된 NoSQL 데이터베이스를 포함하여 임의의 데이터 저장 구조물에 저장될 수 있는 정보와 데이터를 생성한다. 이 데이터/정보는, 예를 들어, 소정의 유전자 표적에 작동 가능하게 연결된 경우 소정의 프로모터(예를 들어, P₁-P₈) 효과일 수 있다. 이 데이터/정보는 또한 둘 이상의 프로모터 P₁-P₈을 소정의 유전자 표적에 작동 가능하게 연결시킴으로써 초래하는 광범위한 세트의 조합적 효과일 수 있다.

8개 프로모터 및 10개 표적 유전자의 상기 예는 개념이 다양한 발현 강도 및 임의의 소정 수의 표적 유전자의 제시에 기초하여 함께 그룹화된 임의의 소정의 수의 프로모터와 함께 적용될 수 있기 때문에, 단지 예시적이다. 당업자는 또한 임의의 유전자 표적 앞에서 둘 이상의 프로모터를 작동 가능하게 연결시키는 능력을 인식할 것이다. 따라서, 일부 실시태양에서, 본 발명은 프로모터 래더로부터의 1, 2, 3개 이상의 프로모터가 하나 이상의 유전자에 작동 가능하게 연결된 프로모터 스왑 라이브러리를 교시한다.

요약하면, 유기체에서 다양한 유전자의 발현을 유도하는 다양한 프로모터를 이용하면 관심 형질을 최적화하는 강력한 수단이다. 본 발명자들이 개발한 프로모터 스와핑의 분자 도구는 적어도 하나의 조건하에서 적어도 하나의 유전자좌의 발현을 변화시키는 것으로 입증된 프로모터 서열의 래더를 사용한다. 그런 다음 이 래더는 고 처리량 게놈 공학을 사용하여 유기체에서 유전자 그룹에 체계적으로 적용된다. 이 유전자 그룹은 여러 가지 방법의 임의의 하나를 기초로 한 관심 형질에 영향을 줄 가능성을 갖는 것으로 결정된다. 이것은 공지된 기능에 기초한 선택 또는 관심 형질에 대한 영향 또는 이전에 결정된 유익한 유전자 다양성에 기초한 알고리즘 선택을 포함할 수 있다. 일부 실시태양에서, 유전자의 선택은 소정의 숙주 내 모든 유전자를 포함할 수 있다. 다른 실시태양에서, 유전자의 선택은 무작위로 선택된 소정의 숙주 내 모든 유전자의 서브세트일 수 있다.

유전자에 연결된 프로모터 서열을 함유하는 생물의 생성된 HTP 유전자 디자인 미생물 균주 라이브러리는 고 처리량 선별 모델에서 성능에 대해 평가되고, 증가 된 성능을 유도하는 프로모터-유전자 연관이 결정되고, 정보가 데이터베이스에 저장된다. 유전자 교란의 집합(즉, 소정의 유전자 y에 작동 가능하게 연결된 소정의 프로모터 x)은 "프로모터 스왑 라이브러리"를 형성하며, 이는 미생물 공학 처리에 이용될 잠재적인 유전자 교란의 공급원으로서 이용될 수 있다. 시간이 지남에 따라, 유전자 교란의 더 큰 세트가 더 큰 다양성의 숙주 세포 배경에 대해 실행되기 때문에, 각 라이브러리는 임의의 관심 배경에 대한 표적화된 변화를 더욱 정확하고 예측되게 디자인하는데 사용될 수 있는 실험적으로 확인된 데이터의 모음으로서 더욱 강력해진다.

유기체에서 유전자의 전사 수준은 유기체 행동에 영향을 미치는 제어의 핵심 포인트이다. 전사는 번역(단백질 발현)과 밀접하게 연관되며, 어떤 단백질은 유기체의 행동을 결정하는 양에서 발현된다. 세포는 수천 가지의 서로 다른 유형의 단백질을 발현하며, 이러한 단백질은 복잡한 복합적인 방식으로 상호작용하여 기능을 생성한다. 단백질 세트의 발현 수준을 체계적으로 변화시킴으로써, 기능이 복잡성으로 인해 예측하기 어렵도록 변형될 수 있다. 일부 변경은 성능을 증가시킬 수 있고 성능을 평가하기 위한 메커니즘과 연관되어, 이 기술은 개량된 기능을 가진 유기체의 생성을 가능하게 한다.

소분자 합성 경로의 상황에서, 효소는 기질로 시작하여 관심 소형 분자로 끝나는 직선 또는 가지 사슬에 있는 소형 분자 기질 및 생성물을 통해 상호작용한다. 이러한 상호작용이 순차적으로 연결되기 때문에, 이 시스템은 분산된 제어를 나타내며, 하나의 효소의 발현을 증가시키면 다른 효소가 속도 제한될 때까지만 경로 유속을 증가시킬 수 있다.

대사 조절 분석(MCA)은, 실험 데이터 및 제 1 원리로부터, 어느 효소 또는 효소들이 속도를 제한하는지를 결정하는 방법이다. 그러나, MCA는 새로운 속도 제한 효소를 결정하기 위한 각 발현 수준 변경 후에 광범위한 실험이 필요하기 때문에 제한적이다. 프로모터 스와핑은 이러한 상황에서 유리한데, 이는 이 경로에서 각 효소에 대한 프로모터 래더의 적용을 통해, 제한 효소가 발견되고, 속도 제한이 되는 새로운 효소를 찾기 위해 동일한 과정을 수행될 수 있기 때문이다. 또한, 기능에 대한 판독은 관심 소형 분자의 더 나은 생산이기 때문에, 어떤 효소가 제한되는지 결정하는 실험은 생산을 늘리는 공학과 동일하여, 개발 시간을 단축시킨다. 일부 실시태양에서, 본 발명은 다중 단위 효소의 개별 서브유닛을 암호화하는 유전자에 대한 PRO 스왑의 적용을 교시한다. 또 다른 실시태양에서, 본 발명은 개개의 효소 또는 전체 생합성 경로를 조절할 책임이 있는 유전자에 PRO 스왑 기술을 적용하는 방법을 교시한다.

일부 실시태양에서, 본 발명의 프로모터 스왑 도구는 선택된 유전자 표적의 최적 발현을 확인하는데 사용된다. 일부 실시태양에서, 프로모터 스왑의 목표는 대사 경로 또는 유전자 경로에서 병목을 감소시키기 위해 표적 유전자의 발현을 증가시키는 것일 수 있다. 다른 실시태양에서, 프로모터 스왑의 목표는 상기 표적 유전자의 발현이 요구되지 않을 때 숙주 세포에서 불필요한 에너지 소비를 피하기 위해 표적 유전자의 발현을 감소시키는 것일 수 있다.

전사, 수송 또는 신호 전달과 같은 다른 세포 시스템의 상황에서, 다양한 합리적인 방법이 사용되어 어떤 단백질이 발현 변화의 표적이고 그 변화가 무엇이어야하는지를 선험적으로 시험하고 밝혀낼 수 있다. 이러한 합리적인 방법은 성능 개량을 위해 테스트해야하는 교란의 수를 줄이지만, 상당한 비용이 든다. 유전자 결실 연구는 이의 존재가 특정 기능에 필수적인 단백질을 확인하고 중요한 유전자는 과다 발현될 수 있다. 단백질 상호작용의 복잡성으로 인해, 성능을 향상시키는데 종종 효과가 없다. 세포에서 단백질 수준의 함수로서, 첫 번째 원칙으로부터, 전사 또는 신호전달 행동을 기술하려고 시도하는 다양한 유형의 모델이 개발되었다. 이러한 모델은 종종 발현 변화가 상이한 기능이나 개량된 기능으로 이어질 수 있는 표적을 제안한다. 이 모델의 기초가 되는 가설은 단순하고 매개변수는 측정하기가 어려워서, 특히 비-모델 유기체에 대해 이런 모델이 한 예측은 종종 부정확하다. 유전자 삭제와 모델링 모두에 의해, 어떻게 특정 유전자에 영향을 미치는 지를 결정하는데 필요한 실험은 성능을 개량시키는 변화를 만드는 후속 작업과는 상이하다. 프로모터 스와핑은 이러한 어려움을 회피하는데, 이는 특정 교란의 중요성을 강조하는 구성된 균주가 이미 개량된 균주이기 때문이다.

따라서, 특정 실시태양에서, 프로모터 스와핑은 다음을 포함하는 다단계 공정이다:

1. "래더"로서 작용하는 "x" 프로모터의 세트를 선택하는 단계. 이상적으로 이런 프로모터는 다수의 게놈 유전자좌 전체에서 매우 가변적인 발현을 유도하는 것으로 나타났지만, 유일한 요구조건은 일부 유전자 발현을 교란시키는 것이다.

2. 표적화하기 위한 "n" 유전자의 세트를 선택하는 단계. 이 세트는 게놈의 모든 오픈 리딩 프레임(ORF) 또는 ORF의 서브세트일 수 있다. 서브세트는 기능과 관련된 ORF에 대한 주석을 사용하고, 이전에 입증된 유익한 교란(이전 프로모터 스왑 또는 이전 SNP 스왑)에 대한 관계에 의해, 이전에 생성된 교란 사이의 상위성 상호작용에 기초한 알고리즘 선택에 의해, 표적에 대한 유익한 ORF에 관한 가설에 기초한 다른 선택 기준 또는 무작위 선택을 통해 선택될 수 있다. 다른 실시태양에서, "n" 표적 유전자는 비-암호화 RNA를 포함하는 비-단백질 암호화 유전자를 포함할 수 있다.

3. 다음과 같은 유전자 변형을 신속하게- 및 일부 실시태양에서, 병렬-수행하는 고 처리량 균주 조작 단계: 천연 프로모터가 표적 유전자 n의 앞에 존재하고 이의 서열이 알려질 때, 천연 프로모터를 래더에 있는 x 프로모터의 각각으로 대체한다. 천연 프로모터가 존재하지 않거나 이의 서열이 알려지지 않을 때, 유전자 n의 앞에 있는 래더에 x 프로모터의 각각을 삽입한다(예를 들어, 도 21 참조). 이러한 방식으로, 균주의 "라이브러리"(HTP 유전자 디자인 라이브러리라고도 불림)가 구성되며, 라이브러리의 각 구성원은 그렇지 않으면 동일한 유전자 상황에서, n 표적에 작동 가능하게 연결된 x 프로모터의 한 예이다. 상기한 바와 같이, 프로모터의 조합이 삽입되어 라이브러리가 구성되는 조합 가능성의 범위를 확장시킬 수 있다.

4. 하나 이상의 메트릭에 대한 성능이 최적화되는 성능을 나타내는 상황에서 균주의 라이브러리의 고 처리량 선별 단계.

이 기본 과정은 특히 다음과 같은 방법으로 균주 성능에 추가 개량을 제공하는데 확장될 수 있다: (1) 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 단일 균주 배경 속에 다수의 유익한 교란을 통합하는 단계. 다중 교란은 정의된 변경의 특정 세트 또는 부분적으로 무작위화된 조합 라이브러리의 변화일 수 있다. 예를 들어, 표적 세트가 한 경로의 모든 유전자인 경우, 이전 라이브러리 균주의 개량된 구성원 또는 구성원들 속으로 교란의 라이브러리의 순차적 재생은 어느 유전자가 임의의 소정의 반복에서 속도를 제한하는지와 관계없이 한 경로에서 각 유전자의 발현 수준을 최적화할 수 있다; (2) 각 교란의 상호작용에 기초하여 최적의 교란 세트를 예측하기 위해 그 데이터를 사용하는 알고리즘 속에 라이브러리의 개별 및 조합 생성으로부터 성능 데이터를 제공하는 단계; 및 (3) 위의 두 접근법의 조합을 실행하는 단계(도 12 참조).

상기 논의된 분자 도구 또는 기술은 프로모터 스와핑으로서 특징화되지만, 프로모터에 제한되지 않으며 표적 세트의 발현 수준을 체계적으로 변화시키는 다른 서열 변화를 포함할 수 있다. 한 세트의 유전자의 발현 수준을 변화시키는 다른 방법은 다음을 포함할 수 있다: a) 리보좀 결합 부위의 래더(또는 진핵생물에서 코작 서열); b) 각각의 표적의 개시 코돈을 각각의 다른 개시 코돈으로 대체하는 단계(즉, 아래 논의된 개시/정지 코돈 교환); c) 다양한 mRNA 안정화 또는 불안정화 서열을 전사체의 5' 또는 3' 말단 또는 임의의 다른 위치에 부착하는 단계; d) 단백질 내의 임의의 위치에 다양한 단백질 안정화 또는 불안정화 서열을 부착하는 단계.

이 접근법은 산업용 미생물에 의해 본 발명에서 예시되었지만, 원하는 형질이 유전자 돌연변이 집단에서 동정될 수 있는 임의의 유기체에 적용 가능하다. 예를 들어, 이것은 CHO 세포, 효모, 곤충 세포, 조류뿐만 아니라 식물과 같은 다세포 유기체의 성능을 개량시키는데 사용될 수 있다.

2. SNP 스왑 : SNP 스왑 미생물 균주 라이브러리 유도를 위한 분자 도구

특정 실시태양에서, SNP 스와핑은 미생물 균주를 개량하기 위한 무작위 돌연변이유발 접근법이 아니라 오히려 균주 전체에서 개별 소핵 다형질 뉴클레오타이드 돌연변이(즉, SNP)의 체계적 도입 또는 제거(즉, "SNP 스와핑")를 필요로 한다.

이 과정을 통해 조작된 미생물은 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성된 실제의 물리적 미생물 균주 집합을 의미할 수 있으며, 각각의 구성원 균주는 그렇지 않으면 동일한 유전자 배경에서 소정의 SNP의 존재 또는 부재를 나타내며, 상기 라이브러리는 "SNP 스왑 미생물 균주 라이브러리"로 불린다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란의 집합을 의미할 수 있으며-이 경우 소정의 SNP가 존재하거나 존재하지 않는다-상기 집합은 "SNP 스왑 라이브러리"로 불린다.

일부 실시태양에서, SNP 스와핑은 확인된 유익한 성능 효과를 가진 표적 SNP "빌딩 블록"의 최적 조합에 의한 숙주 유기체의 재구성을 필요로 한다. 따라서, 일부 실시태양에서, SNP 스와핑은 다수의 유익한 돌연변이를 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 단일 균주 배경 속에 다수의 유익한 교란을 통합하는 단계를 필요로 한다. 다중 변화는 정의된 변화의 특정한 세트 또는 돌연변이의 부분적으로 무작위화된 라이브러리일 수 있다.

다른 실시태양에서, SNP 스와핑은 또한 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 균주로부터 유해한 것으로 확인된 다중 돌연변이를 제거하는 단계를 필요로 한다. 다중 변화는 정의된 변화의 특정한 세트 또는 돌연변이의 부분적으로 무작위화된 라이브러리일 수 있다. 일부 실시태양에서, 본 발명의 SNP 스와핑 방법은 유익한 SNP의 첨가 및 유해 및/또는 중성 돌연변이의 제거를 모두 포함한다.

SNP 스와핑은 개량된 관심 형질에 대한 돌연변이유발 및 선택에 영향을 받은 균주의 계통에서 유익한 및 유해한 돌연변이 둘 다를 확인하고 이용하기 위한 강력한 도구이다. SNP 스와핑은 돌연변이유발성 계통에서 개별 돌연변이의 영향을 체계적으로 결정하기 위해 고 처리량 게놈 공학 기술을 사용한다. 게놈 서열은 알려진 성능 개량을 갖는 돌연변이유발성 계통의 하나 이상의 세대에 걸쳐 균주에 대해 결정된다. 고 처리량 게놈 공학은 초기 계통 균주에서 개량된 균주로부터 돌연변이를 반복하고, 및/또는 나중 균주의 돌연변이를 초기 균주 서열로 되돌리는데 체계적으로 사용된다. 이들 균주의 성능을 평가하고 개량된 관심 표현형에 대한 각각의 개별 돌연변이의 기여가 결정될 수 있다. 상기한 바와 같이, 이 과정으로부터 초래된 미생물 균주는 분석되고/특성화되어, 숙주 균주 전체에서 미생물 균주 개량을 알릴 수 있는 SNP 스왑 유전자 디자인 라이브러리의 기초를 형성한다.

유해한 돌연변이의 제거는 즉각적인 성능 개량을 제공할 수 있고, 돌연변이유발 부담이 없는 균주 배경에 유익한 돌연변이의 통합은 균주 성능을 신속하고 크게 개량시킬 수 있다. SNP 스와핑 과정을 통해 생산된 다양한 미생물 균주는 HTP 유전자 디자인 SNP 스와핑 라이브러리를 형성하는데, 이는 다양한 추가/삭제/또는 통합된 SNP를 포함하지만 그렇지 않으면 동일한 유전자 배경을 가진 미생물 균주이다.

이전에 논의된 바와 같이, 성능 개량을 위한 무작위 돌연변이유발 및 후속 선별은 산업용 균주 개량을 위해 일반적으로 사용되는 기술이며, 대규모 제조에 현재 사용되는 많은 균주가 수년의 기간, 때때로 10년에 걸쳐 반복적으로 이 공정을 사용하여 개발되었다. UV 복사에너지 또는 에틸 메테인설포네이트와 같은 돌연변이유발 화학물질에 대한 노출과 같은 게놈 돌연변이를 생성하는 무작위 접근법은 다음과 같은 이유로 산업용 균주 개량에 바람직한 방법이었다: 1) 산업용 유기체는 유전적으로 또는 대사적으로 특성이 좋지 않을 수 있으므로 지시된 개량 접근법에 대한 표적 선택을 어렵거나 불가능하게 한다; 2) 비교적 잘 특성화된 시스템에서도, 산업용 성능 개선을 초래하는 변화는 예측하기 어렵고 알려진 기능이 없는 유전자의 교란을 필요로 할 수 있다. 3) 소정의 산업용 유기체에서 지시된 게놈 돌연변이를 만들기 위한 유전자 도구는 사용할 수 없거나 매우 느리거나 및/또는 사용하기 어렵다.

그러나, 상기 방법의 상기 이점에도 불구하고, 다수의 공지된 단점이 있다. 유익한 돌연변이는 비교적 드문 사건이며, 고정된 선별 용량으로 이러한 돌연변이를 찾기 위해서는, 돌연변이 속도가 충분히 높아야 한다. 이것이 원치 않는 중성 및 부분적으로 해로운 돌연변이가 유익한 변화와 함께 균주에 통합되는 것을 초래한다. 시간이 지남에 따라 이런 '돌연변이유발 부담'은 증가되어, 전반적인 견고함과 성장 속도와 같은 주요 형질이 결핍된 균주를 초래한다. 궁극적으로 '돌연변이유발 부담'은 무작위 돌연변이유발을 통한 성능의 개량을 얻기가 점차 더 어렵거나 불가능하게 한다. 적절한 도구가 없다면, 균주 계통의 다른 및 유사한 부문에서 발견된 유익한 돌연변이를 통합하는 것은 불가능하다.

SNP 스와핑은 돌연변이유발 계통 내의 균주를 비교할 때 관찰된 일부 또는 모든 돌연변이를 체계적으로 반복하거나 회귀시킴으로써 이러한 제한을 극복하는 접근법이다. 이 방법으로 유익한('원인성') 돌연변이가 확인되고 통합될 수 있으며 및/또는 해로운 돌연변이가 확인되고 제거될 수 있다. 이것은 추가 무작위 돌연변이유발 또는 표적화된 유전자 공학에 의해 달성될 수 없는 균주 성능의 신속한 개량을 허용한다.

유전자 부담의 제거 또는 유전자 부담이 없는 균주로의 유익한 변화의 통합은 추가 개량을 가능하게 할 수 있는 추가의 무작위 돌연변이유발을 위한 새롭고 견고한 출발점을 제공한다.

또한, 수직 유익한 변화가 돌연변이유발성 균주 계통의 다양하고, 구별된 분지를 통해 확인되므로, 이들 균주는 보다 우수한 실행 균주로 신속하게 통합될 수있다. 이런 돌연변이는 지시된 유전 공학에 의해 얻은 개량을 가진 균주와 같이 돌연변이유발 계통의 일부가 아닌 균주로 통합될 수 있다.

돌연변이유발 계통 내에서 균주 간의 돌연변이를 무작위로 재조합시키는 다른 접근법 및 기술이 존재한다. 이들은 원형질체 융합 및 돌연변이 균주 전체에서 게놈 재조합을 촉진하는 전체 게놈 셔플링과 같은 기술을 포함한다. 효모 및 사상 균류와 같은 일부 산업용 미생물의 경우, 자연 교배 주기가 쌍을 이루는 게놈 재조합에 이용될 수 있다. 이런 식으로, 해로운 돌연변이는 부모 균주에 의한 "백-크로싱(back-crossing)"에 의해 제거될 수 있고 유익한 돌연변이는 통합될 수 있다. 지시된 돌연변이 변화가 요구되는 경우, 본 발명의 SNP 스와핑 방법이 사용될 수 있다.

예를 들어, 이런 접근법은 돌연변이를 교환하기 위해 상대적으로 적은 수의 무작위 재조합 크로스오버 사건에 의존하기 때문에, 균주 성능을 최적화하기 위해 재조합 및 선별의 많은 사이클을 필요로 할 수 있다. 또한, 자연 재조합 사건은 본질적으로 무작위이지만, 이것은 게놈 위치 편향에 영향을 받고 일부 돌연변이는 해결하기 어려울 수 있다. 이런 접근법은 추가 게놈 시퀀싱 및 분석 없이 개별 돌연변이의 영향에 대한 정보도 거의 제공하지 않는다. SNP 스와핑은 무작위적인 접근 방식이 아니기 때문에 이러한 근본적인 한계를 극복하기보다는 오히려 균주 전체에서 개별 돌연변이의 체계적인 도입 또는 제거이기 때문에 이런 근보적인 제한을 극복한다.

일부 실시태양에서, 본 발명은 다양성 풀의 유기체들 사이에 존재하는 SNP 서열 다양성을 확인하는 방법을 교시한다. 다양성 풀은 분석을 위해 사용된 소정의 수 n의 미생물일 수 있으며, 상기 미생물의 게놈은 "다양성 풀"을 나타낸다.

특정 양태에서, 다양성 풀은 특정 시점(S₁Gen₁)에서 "기준선" 또는 "표준" 유전자 서열을 갖는 본래의 부모 균주(S₁) 및 상기 S₁ 균주로부터 유도/성장되고 S₁의 기준선 게놈과 관련하여 다른 게놈(S_2- _n Gen_2- _n )을 갖는 임의의 수의 후속 자손 균주(S_2- _n )일 수 있다.

예를 들어, 일부 실시태양에서, 본 발명은 다양성 풀에서 미생물 게놈을 서열화하여 각 균주에 존재하는 SNP를 확인하는 것을 교시한다. 한 실시태양에서, 다양성 풀의 균주는 역사적인 미생물 생산 균주이다. 따라서, 본 발명의 다양성 풀은 예를 들어 산업용 표준 균주 및 전통적인 균주 개량 프로그램을 통해 생산된 하나 이상의 돌연변이 산업용 균주를 포함할 수 있다.

일부 실시태양에서, 다양성 풀 내의 SNP는 "표준 균주"를 참조하여 결정된다. 일부 실시태양에서, 표준 균주는 야생형 균주이다. 다른 실시태양에서, 표준 균주는 임의의 돌연변이유발을 받기 전에 원래의 산업용 균주이다. 표준 균주는 실무자에 의해 정의될 수 있으며 원래의 야생형 균주 또는 원래의 산업용 균주일 필요는 없다. 기본 균주는 단순히 "기본", "표준" 또는 원래의 유전자 배경으로 간주 될 수 있는 것의 대표이며, 이로 인해 상기 표준 균주로부터 유도되거나 개발된 후속 균주는 비교될 것이다.

다양성 풀 내의 모든 SNPS가 확인되면, 본 발명은 개별적으로 및/또는 그룹으로 SNP의 효과(예를 들어, 관심 표현형의 생성)를 묘사(즉, 정량화 및 특성화)하기 위한 SNP 스와핑 및 선별 방법을 교시한다.

일부 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2-n Gen _2-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 표준 균주(S₁Gen₁) 또는 야생형 균주에 도입하는 단계("웨이브 업")를 포함한다.

다른 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2-n Gen _2-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 제거하는 단계("웨이브 다운")를 포함한다.

일부 실시태양에서, 하나 이상의 SNP 변화(도입 또는 제거)를 포함하는 각각의 생성된 균주는 본 발명의 하나 이상의 기준(예를 들어, 관심 화학물질 또는 생성물의 생산)하에서 배양되고 분석된다. 분석된 각 숙주 균주로부터의 데이터는 특정 SNP 또는 숙주 균주에 존재하는 SNP 그룹과 관련되거나 연관되며 미래 사용을 위해 기록된다. 따라서, 본 발명은 임의의 수의 관심 미생물 유전자 또는 표현형 형질에 대한 소정의 SNP의 효과를 확인할 수 있는 크고 고도로 주석화된 HTP 유전자 디자인 미생물 균주 라이브러리의 생성을 가능하게 한다. 이런 HTP 유전자 디자인 라이브러리에 저장된 정보는 HTP 게놈 공학 플랫폼의 기계 학습 알고리즘에 정보를 제공하고 과정의 미래 반복을 지시하여, 궁극적으로 매우 바람직한 특성/형질을 갖는 진화된 유기체를 유도한다.

3. 개시/정지 코돈 교환: 개시/정지 코돈 미생물 균주 라이브러리 유도를 위한 분자 도구

일부 실시태양에서, 본 발명은 개시 및 정지 코돈 변이체를 스와핑하는 방법을 교시한다. 예를 들어, 에스. 크레비시애(S. cerevisiae) 및 포유동물에 대한 전형적인 정지 코돈은 각각 TAA(UAA) 및 TGA(UGA)이다. 단핵구 식물의 전형적인 정지 코돈은 TGA(UGA)인 반면, 곤충과 대장균은 보통 TAA(UAA)를 정지 코돈으로 사용한다(Dalphin et al.(1996) Nucl. Acids Res. 24: 216-218). 다른 실시태양에서, 본 발명은 TAG(UAG) 정지 코돈의 사용을 교시한다.

본 발명은 스와핑 개시 코돈을 유사하게 교시한다. 일부 실시태양에서, 본 발명은 대부분의 유기체(특히, 진핵생물)에 의해 이용되는 ATG(AUG) 개시 코돈의 사용을 교시한다. 일부 실시태양에서, 본 발명은 원핵 생물이 ATG(AUG)를 가장 많이 사용하고 이어서 GTG(GUG) 및 TTG(UUG)를 사용하는 것을 교시한다.

다른 실시태양에서, 본 발명은 ATG 개시 코돈을 TTG로 대체시키는 것을 교시한다. 일부 실시태양에서, 본 발명은 ATG 개시 코돈을 GTG로 대체시키는 것을 교시한다. 일부 실시태양에서, 본 발명은 GTG 개시 코돈을 ATG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 GTG 개시 코돈을 TTG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TTG 개시 코돈을 ATG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TTG 개시 코돈을 GTG로 대체하는 것을 교시한다.

다른 실시태양에서, 본 발명은 TAA 정지 코돈을 TAG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TAA 정지 코돈을 TGA로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TGA 정지 코돈을 TAA로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TGA 정지 코돈을 TAG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TAG 정지 코돈을 TAA로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TAG 정지 코돈을 TGA로 대체시키는 것을 교시한다.

4. 스왑 중지: 최적화된 서열 미생물 균주 라이브러리 유도를 위한 분자 도구

일부 실시태양에서, 본 발명은 세포 유전자 전사의 최적화를 통해 숙주 세포 생산성을 개량시키는 방법을 교시한다. 유전자 전사는 전사 개시(RNAp 모집 및 전사 복합체 형성), 신장(가닥 합성/확장) 및 전사 종결(RNAp 분리 및 종결)을 포함하는 여러 별개의 생물학적 현상의 결과이다. (예를 들어, 프로모터를 변화시키거나 조절 전사 인자를 유도함으로써) 유전자의 전사 조절을 통한 유전자 발현의 제어에 많은 관심이 집중되었지만, 유전자 터미네이터 서열의 조절을 통한 전사의 조절에 대해서는 비교적 적은 노력이 있었다 .

전사가 유전자 발현 수준에 영향을 미치는 가장 명백한 방법은 프로모터 또는 인핸서 강도 및 트랜스 활성화 인자의 조합에 의해 조절될 수있는 Pol II 개시 속도를 이용하는 것이다(Kadonaga, JT. 2004 "Regulation of RNA polymerase II transcription by sequence-specific DNA binding factors" Cell. 2004 Jan 23; 116(2):247-57). 진핵생물에서, 연신율은 교차 스플라이싱에 영향을 줌으로써 유전자 발현 양상을 결정할 수있다(Cramer P. et　al., 1997 "Functional association between promoter structure and transcript alternative splicing." Proc Natl Acad Sci U S A. 1997 Oct 14; 94(21):11456-60). 유전자에 대한 실패한 종결은 Pol II에 대한 프로모터의 접근성을 감소시킴으로써 하류 유전자의 발현을 손상시킬 수 있다(Greger IH. et　al., 2000 "Balancing transcriptional interference and initiation on the GAL7 promoter of Saccharomyces cerevisiae." Proc Natl Acad Sci U S A. 2000 Jul 18; 97(15):8415-20). 전사 간섭으로 알려진 이 과정은 특히 진핵 생물과 관련이 있는데 이는 이들이 종종 밀접하게 이격된 유전자를 갖기 때문이다.

종결 서열은 또한 서열이 속하는 유전자의 발현에 영향을 미칠 수 있다. 예를 들어, 연구들은 진핵생물에서 비효율적인 전사 종결은 비접합 pre-mRNA의 축적을 초래한다는 것을 보여준다(West, S., and Proudfoot, N.J., 2009 "Transcriptional Termination Enhances Protein Expression in Human Cells" Mol Cell. 2009 Feb 13; 33(3-9); 354-364 참조). 다른 연구들은 또한 3'말단 처리가 비효율적인 종결에 의해 지연될 수 있다는 것을 보여주었다(West, S et　al., 2008 "Molecular dissection of mammalian RNA polymerase II transcriptional termination." Mol Cell. 2008 Mar 14; 29(5):600-10.). 전사 종결은 또한 합성 부위로부터 전사체를 방출함으로써 mRNA 안정성에 영향을 미칠 수 있다.

진핵생물에서 전사 메커니즘의 종결

진핵생물에서 전사 종결은 RNA 폴리머라제 II와 관련된 단백질 인자에 의해 인식되는 터미네이터 신호를 통해 작동한다. 일부 실시태양에서, 절단 및 폴리아데닐화 특이성 인자(CPSF) 및 절단 자극 인자(CstF)는 RNA 폴리머라제 II의 카복실 말단 도메인으로부터 폴리-A 신호로 전달된다. 일부 실시태양에서, CPSF 및 CstF 인자는 또한 종결 부위에 다른 단백질을 모집하고, 그런 후에 전사 복합체로부터 전사체를 절단하고 mRNA를 유리시킨다. 종결은 또한 mRNA 전사체의 폴리아데닐화를 유발한다. 입증된 진핵생물 종결 인자 및 보존된 구조의 예시적 예는 본 문서의 뒷부분에서 논의된다.

원핵생물에서 전사의 종결

원핵생물에서, Rho-비의존성 및 Rho-의존성 종결로 불리는 두 주요 메카니즘이 전사 종결을 매개한다. Rho-의존성 종결 신호는 외부의 전사 종결 인자를 필요로하지 않는데, 이는 일련의 우리딘(U) 잔기와 함께 이들 서열로부터 전사된 RNA에서 스템-루프 구조의 형성이 전사 복합체로부터 RNA 사슬의 방출을 촉진하기 때문이다. 한편, Rho 의존성 종결은 Rho라 불리는 전사 종결 인자 및 mRNA 상의 시스 작용 물질을 필요로 한다. Rho에 대한 초기 결합 위치인 Rho 활용 (rut) 위치는 높은 실제 터미네이터 서열의 상류에서 합성되는 RNA에서 사이티딘/낮은 구아노신 함량 및 비교적 적은 2차 구조를 특징으로 하는 확장된(~70개 뉴클레오타이드, 때때로 80-100개 뉴클레오타이드) 단일 가닥 영역이다. 폴리머라제 일시 중지 위치와 마주칠 때, 종결이 일어나고 전사체는 Rho의 헬라카제 활성에 의해 방출된다.

터미네이터 스와핑(STOP 스왑)

일부 실시태양에서, 본 발명은 전체 숙주 균주 생산성에 유익한 효과를 생성하기위한 최적 발현 성질을 갖는 종결 서열("터미네이터")을 선택하는 방법을 교시한다.

예를 들어, 일부 실시태양에서, 본 발명은 다양한 발현 강도(예를 들어, 하기 논의되는 터미네이터 래더)를 나타내는 하나 이상의 터미네이터를 확인하고 및/또는 숙주 세포 내에서 하나 이상의 터미네이터의 변이체를 생성하는 방법을 교시한다. 이들 확인된 및/또는 생성된 터미네이터의 특정 조합은 터미네이터 래더로서 함께 그룹화될 수 있으며, 이는 보다 상세히 이하에서 설명된다.

당해 터미네이터 래더는 소정의 관심 유전자와 결합된다. 따라서, 터미네이터 T₁-T₈(다양한 발현 강도를 나타내는 것으로 확인된 및/또는 생성된 8개의 터미네이터를 나타냄)이 있고 터미네이터 래더를 숙주 세포에서 관심 단일 유전자와 결합시킨다면(즉, 소정의 표적 유전자에 작동 가능하게 연결된 소정의 터미네이터에 의해 숙주 세포 유전적으로 조작한다), 8개 터미네이터의 각 조합의 효과는 조작된 숙주 세포가 표적 유전자와 결합된 특정 프로모터(들)를 제외하고 그렇지 않다면 동일한 유전자 배경을 갖는 것을 고려하여, 각 조합적 노력으로부터 생성되는 각각의 조작된 균주를 특성화함으로써 확인될 수 있다. 이 과정을 통해 조작되어 생성된 숙주 세포는 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성되는 실제의 물리적 미생물 균주 집합을 의미할 수 있으며, 각각의 구성원 균주는 그렇지 않다면 동일한 유전자 배경으로 특정 표적 유전자에 작동 가능하게 연결된 소정의 터미네이터를 나타내며, 상기 라이브러리는 "터미네이터 스왑 미생물 균주 라이브러리" 또는 "STOP 스왑 미생물 균주 라이브러리"로 불린다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란의 집합을 의미할 수 있으며-이 경우 소정의 유전자 y에 작동 가능하게 연결된 소정의 터미네이터 x-상기 집합은 "STOP 스왑 라이브러리"로 불린다.

또한, 미생물을 조작하기 위해 프로모터 T₁-T₈을 포함하는 동일한 터미네이터 래더를 이용할 수 있으며, 8개의 터미네이터 각각은 10개의 상이한 유전자 표적에 작동 가능하게 연결된다. 이 절차의 결과는 관심 표적 유전자에 작동 가능하게 연결된 특정 터미네이터를 제외하고, 그렇지 않으면 유전적으로 동일하게 간주되는 80개의 숙주 세포 균주일 것이다. 이런 80개의 숙주 균주는 적절하게 선별되고 특성화될 수 있으며 다른 HTP 유전자 디자인 라이브러리를 생성할 수 있다. HTP 유전자 디자인 라이브러리에 미생물 균주의 특성화는 관계형 데이터베이스, 객체 지향 데이터베이스 또는 고도로 분산된 NoSQL 데이터베이스를 포함하나 이에 제한되지 않는 임의의 데이터베이스에 저장될 수 있는 정보와 데이터를 생성한다. 이런 데이터/정보는, 예를 들어, 소정의 유전자 표적에 작동 가능하게 연결될 때 소정의 터미네이터(예를 들어, T₁-T₈) 효과를 포함할 수 있다. 이 데이터/정보는 또한 둘 이상의 프로모터 T₁-T₈을 소정의 유전자 표적에 작동 가능하게 연결시킴으로써 초래되는 보다 광범위한 세트의 조합 효과일 수 있다.

상기 8개의 터미네이터 및 10개의 표적 유전자의 예는 단지 예시적인데, 이는 개념이 다양한 발현 강도 및 소정 수의 표적 유전자의 표시에 기초하여 함께 그룹화된 임의의 소정의 수의 프로모터와 함께 적용될 수 있기 때문이다.

요약하면, 다양한 터미네이터를 이용하여 유기체에서 다양한 유전자의 발현을 조절하는 것은 관심 형질을 최적화하는 강력한 도구이다. 본 발명자에 의해 개발된 터미네이터 스와핑의 분자 도구는 하나 이상의 조건하에서 적어도 하나의 유전자좌의 발현을 변화시키는 것으로 입증된 터미네이터 서열의 래더를 사용한다. 그런 후에 이 래더는 고 처리량 게놈 기술을 사용하여 유기체에서 한 유전자 그룹에 체계적으로 적용된다. 이 유전자 그룹은 여러 가지 방법 중 하나를 기반으로 관심 형질에 영향을 주는 높은 가능성을 갖는 것으로 결정된다. 이들은 알려진 기능에 기초한 선택 또는 관심 형질에 대한 영향 또는 이전에 결정된 유익한 유전자 다양성에 기초한 알고리즘 선택을 포함할 수 있다.

유전자에 연결된 터미네이터 서열을 함유하는 유기체의 생성된 HTP 유전자 디자인 미생물 라이브러리는 고 처리량 선별 모델에서의 성능에 대해 평가되고, 증가된 성능을 유도하는 프로모터-유전자 연관이 결정되고 정보는 데이터베이스에 저장된다. 유전자 교란의 집합(즉 소정의 유전자 y에 연결된 소정이 터미네이터 x)은 "터미네이터 스왑 라이브러리"를 형성하며, 이것은 미생물 조작 처리에 이용될 잠재적인 유전자 변형의 공급원으로 이용될 수 있다. 시간이 지남에 따라, 더 큰 세트의 유전자 교란이 더 큰 다양성의 미생물 배경에 대해 실행되기 때문에, 각 라이브러리는 임의의 관심 배경에 대한 표적화된 변화를 더욱 정확하고 예측되게 디자인하는데 사용될 수 있는 실험적으로 확인된 데이터의 모음으로서 더욱 강력해진다. 즉 일부 실시태양에서, 본 발명은 본 발명의 유전자 디자인 라이브러리의 임의의 것과 관련된 메타 데이터 내에 삽입된 이전의 실험 결과에 기초한 숙주 세포 속으로의 하나 이상의 유전자 변화를 도입하는 것을 교시한다.

따라서, 특정 실시태양에서, 터미네이터 스와핑은 다음을 포함하는 다단계 공정이다:

1. "래더"로서 작용하는 "x" 터미네이터의 세트를 선택하는 단계. 이상적으로 이런 터미네이터는 다수의 게놈 유전자좌 전체에서 매우 가변적인 발현을 유도하는 것으로 나타났지만, 유일한 요구조건은 일부 유전자 발현을 교란시키는 것이다.

2. 표적화하기 위한 "n" 유전자의 세트를 선택하는 단계. 이 세트는 게놈의 모든 오픈 리딩 프레임(ORF) 또는 ORF의 서브세트일 수 있다. 서브세트는 기능과 관련된 ORF에 대한 주석을 사용하고, 이전에 입증된 유익한 교란(이전 프로모터 스왑 STOP 스왑 또는 SNP 스왑)에 대한 관계에 의해, 이전에 생성된 교란 사이의 상위성 상호작용에 기초한 알고리즘 선택에 의해, 표적에 대한 유익한 ORF에 관한 가설에 기초한 다른 선택 기준 또는 무작위 선택을 통해 선택될 수 있다. 다른 실시태양에서, "n" 표적 유전자는 비-암호화 RNA를 포함하는 비-단백질 암호화 유전자를 포함할 수 있다.

3. 다음과 같은 유전자 변형을 신속하게- 및 일부 실시태양에서, 병렬-수행하는 고 처리량 균주 조작 단계: 천연 터미네이터가 표적 유전자 n의 3' 말단에 존재하고 이의 서열이 알려질 때, 천연 터미네이터를 래더에 있는 x 터미네이터의 각각으로 대체한다. 천연 터미네이터가 존재하지 않거나 이의 서열이 알려지지 않을 때, 유전자 정지 코돈 이후 래더에 x 터미네이터의 각각을 삽입한다.

이러한 방식으로, 균주의 "라이브러리"(HTP 유전자 디자인 라이브러리라고도 불림)가 구성되며, 라이브러리의 각 구성원은 그렇지 않으면 동일한 유전자 상황에서, n 표적에 작동 가능하게 연결된 x 터미네이터의 한 예이다. 상기한 바와 같이, 터미네이터의 조합이 삽입되어 라이브러리가 구성되는 조합 가능성의 범위를 확장시킬 수 있다.

이 기본 과정은 특히 다음과 같은 방법으로 균주 성능에 추가 개량을 제공하는데 확장될 수 있다: (1) 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 단일 균주 배경 속에 다수의 유익한 교란을 통합하는 단계. 다중 교란은 정의된 변경의 특정 세트 또는 부분적으로 무작위화된 조합 라이브러리의 변화일 수 있다. 예를 들어, 표적 세트가 한 경로의 모든 유전자인 경우, 이전 라이브러리 균주의 개량된 구성원 또는 구성원들 속으로 교란의 라이브러리의 순차적 재생은 어느 유전자가 임의의 소정의 반복에서 속도를 제한하는지와 관계없이 한 경로에서 각 유전자의 발현 수준을 최적화할 수 있다; (2) 각 교란의 상호작용에 기초하여 최적의 교란 세트를 예측하기 위해 그 데이터를 사용하는 알고리즘 속에 라이브러리의 개별 및 조합 생성으로부터 성능 데이터를 제공하는 단계; 및 (3) 위의 두 접근법의 조합을 실행하는 단계.

5. 순서 최적화: 최적화된 서열 미생물 균주 라이브러리 유도를 위한 분자 도구

한 실시태양에서, 제공된 본 발명의 방법은 숙주 유기체에 의해 발현된 하나 이상의 유전자를 최적화하는 코돈을 포함한다. 다양한 숙주에서 발현을 향상시키기 위해 코돈을 최적화하는 방법은 당해 분야에 공지되어 있고, 문헌에 기술된다(그 전체가 본 발명에 참조로 포함된 미국 특허출원 공개공보 제2007/0292918호 참조). 특정 원핵 또는 진핵 숙주(Murray et al. (1989) Nucl. Acids Res.17 : 477-508 참조)에 의해 선호되는 코돈을 함유하는 최적화된 암호화 서열은, 예를 들어, 번역 속도를 증가시키거나 또는 최적화되지 않은 서열로부터 생산된 전사체와 비교할 때, 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사체를 생성하도록 제조된다.

단백질 발현은 전사, mRNA 프로세싱 및 안정성 및 번역 개시에 영향을 미치는 인자를 포함하는 다수의 인자에 의해 지배된다. 따라서 최적화는 임의의 특정 유전자의 많은 서열 특징의 임의의 것을 처리할 수 있다. 특정 예로서, 드문 코돈 유도 번역 일시 중지는 감소된 단백질 발현을 초래할 수 있다. 드문 코돈 유도 번역 일시 중지는 숙주 유기체에서 거의 사용되지 않는 관심 폴리뉴클레오타이드에서 코돈의 존재를 포함하며 이용가능한 tRNA 풀에서의 희소성 때문에 단백질 번역에 부정적인 영향을 미칠 수 있다.

대안적인 번역 개시는 또한 감소된 이종 단백질 발현을 초래할 수 있다. 대안적인 번역 개시는 의도하지 않게 리보솜 결합 부위(RBS)로서 기능할 수 있는 모티프를 함유하는 합성 폴리뉴클레오타이드 서열을 포함할 수 있다. 이런 위치는 유전자 내부 위치로부터 잘린 단백질의 번역을 시작할 수 있다. 정제 과정에서 제거하기 어려울 수 있는 절단된 단백질을 생산할 가능성을 줄이는 한 가지 방법은 최적화된 폴리뉴클레오타이드 서열로부터 추정된 내부 RBS 서열을 제거하는 것을 포함한다.

반복체-유도된 폴리머라제의 슬리파지(slippage)는 감소된 이종 단백질 발현을 초래할 수 있다. 반복체-유도된 폴리머라제의 슬리파지는 프레임변이 돌연변이를 초래할 수 있는 DNA 폴리머라제의 슬리파지 또는 스터터링(stuttering)을 유발하는 것으로 밝혀진 뉴클레오타이드 서열 반복을 필요로 한다. 이러한 반복체는 또한 RNA 폴리머라제의 슬리파지를 유발할 수 있다. 높은 G+C 함량 편향을 갖는 유기체에서, G 또는 C 뉴클레오타이드 반복체로 구성된 더 높은 등급의 반복체가 존재할 수 있다. 따라서, RNA 폴리머라제의 슬리파지를 유도하는 가능성을 줄이는 한 가지 방법은 G 또는 C 뉴클레오타이드의 연장된 반복체를 변경하는 것을 포함한다.

2차 구조를 간섭하면 또한 감소된 이종 단백질 발현을 초래할 수 있다. 2차 구조는 RBS 서열 또는 개시 코돈을 격리할 수 있고 단백질 발현의 감소와 상관관계가있다. 스템루프 구조는 또한 전사 일시 중지 및 약화에 관여할 수 있다. 최적화 된 폴리뉴클레오타이드 서열은 RBS 내에 최소 2차 구조 및 뉴클레오타이드 서열의 유전자 암호화 영역을 함유하여 개량된 전사 및 번역을 가능하게 한다.

예를 들어, 최적화 공정은 숙주에 의해 발현되는 원하는 아미노산 서열을 확인함으로써 시작될 수있다. 아미노산 서열로부터 후보 폴리뉴클레오타이드 또는 DNA 서열이 디자인될 수 있다. 합성 DNA 서열의 디자인 동안, 코돈 사용의 빈도는 숙주 발현 유기체의 코돈 사용과 비교될 수 있고 드문 숙주 코돈은 합성 서열로부터 제거될 수있다. 또한, 합성 후보 DNA 서열은 바람직하지 않은 효소 제한 부위를 제거하고 원하는 신호 서열, 링커 또는 비번역 영역을 추가 또는 제거하기 위해 변형될 수 있다. 합성 DNA 서열은 G/C 반복체 및 스템-루프 구조와 같이 번역 과정을 방해할 수 있는 2차 구조의 존재에 대해 분석될 수 있다.

6. 트랜스포존 돌연변이유발 다양성 라이브러리: 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 유도를 위한 분자 도구

본 트랜스포존 돌연변이유발 HTP 분자 도구는 두 가지 문제를 해결한다: 첫째, 유전자형-표현형 관계에 대한 이해가 부족하다. 잘 연구된 유기체에서도, 게놈 환경의 많은 부분이 잘 이해되지 않고 있다. 또한, 잘 이해된 유전자 요소는 예기치 않은 방식으로 상호작용할 수 있다. 둘째, 느리게 성장하는 또는 유전적으로 저항성 유기체, 특히 큰 게놈을 가진 유기체로, 가능한 모든 유전자 표적에 대해 표적화된 유전자 교란을 수행하는 것은 시간 및/또는 비용이 많이 든다

이들 문제점을 해결하기 위해, 본 발명은 생체 내 트랜스포존 돌연변이유발을 사용하여 숙주 유기체의 유전자 요소를 용이하고 무작위적으로 조절/교란/조작하는 방법을 제공한다.

트랜스포존 돌연변이유발은 상이한 유전자 교란/변화(예를 들어, 기능의 획득 또는 기능의 상실)를 보유하는 라이브러리를 생성하고 숙주의 표현형을 추가로 개선하기 위해 새로운 유전자 표적을 연루시키는 데 사용될 수 있다.

이론에 구속되지 않고, 일반적으로 트랜스포존은 짧은(전형적으로 50 bp 미만) 트랜스포존-특이적 말단 DNA 서열을 갖는 것을 특징으로 한다. 대부분의 경우, 이런 말단 서열은 동일하거나 밀접하게 관련된 서열의 반전된 버전이다. 트랜스포 사제는 말단 역전된 반복 서열에 특이적으로 결합하여 트랜스포사제-DNA 시냅스 복합체를 형성하고, 이는 전위 사건에 촉매작용을 미친다. 트랜스포존은 임의의 원하는 DNA 서열(예를 들어, 임의의 페이로드 유전자, 선별 마커, 프로모터, 프라이머 결합 부위, 부위-특이적 재조합 부위, T7 RNA 폴리머라제 프로모터, 리포터 유전자, 터미네이터 등)을 추가로 포함할 수 있다.

본 발명에 기술된 특정 도구는 미생물 균주에서 유전자의 기존의 다형체에 관한 것이지만, 미생물 균주의 성능을 개선시키는 데 유용한 신규한 돌연변이를 생성하지는 않는다. 본 발명은 페이로드 DNA를 게놈에 무작위로 통합하여 숙주 균주의 개선된 특징을 유도하는 돌연변이에 대해 추가로 스크리닝될 수 있는 트랜스포존 돌연변이유발 시스템을 교시하며, 이는 결국 전체 숙주 균주 표현형에 유리한 효과를 유발한다(예를 들어, 수율 또는 생산성).

예를 들어, 일부 실시태양에서, 본 발명은 트랜스포존 돌연변이유발 과정에 의해 생성된 숙주 세포 게놈 내에서 돌연변이/변형/삽입/결실(즉, 유전자 교란)을 생성하는 방법을 교시한다. 이 과정에서 생성된 임의의 특정 게놈 변경은 트랜스포존 돌연변이유발 라이브러리(트랜스포존 돌연변이유발 다양성 라이브러리로도 불림)로서 함께 그룹화될 수 있으며, 이는 아래에서 더 상세히 설명된다.

이 과정을 통해 조작된 생성 미생물은 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성된 실제 물리적 미생물 균주 집합을 지칭할 수 있으며, 각 구성원 균주는 트랜스포존 돌연변이유발에 의해 생성된 주어진 돌연변이/변형/삽입/결실(즉, 유전자 교란)을 나타내고, 그렇지 안다면 동일한 유전자 배경에서, 균주 라이브러리는 "트랜스포존 돌연변이유발 미생물 균주 라이브러리"로 지칭된다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란 - 이 경우 트랜스포존 돌연변이유발에 의해 생성된 소정의 교란의 집합을 지칭할 수 있으며, 이 집합은 "트랜스포존 돌연변이유발 라이브러리"로 지칭된다.

트랜스포존 돌연변이유발 미생물 균주 라이브러리로부터의 미생물에 추가의 라운드의 HTP를 적용할 수 있다. 트랜스포존 돌연변이유발 미생물 균주 라이브러리로부터의 미생물을 적절히 스크리닝하고 특징화하여 또 다른 HTP 유전자 디자인 라이브러리를 생성할 수 있다. HTP 유전자 디자인 라이브러리에서 미생물 균주의 특징화는 관계형 데이터베이스, 객체 지향 데이터베이스 또는 고도로 분산된 NoSQL 데이터베이스를 포함하여 모든 데이터 저장 구조에 저장할 수 있는 정보와 데이터를 생성한다. 이 데이터/정보는, 예를 들어, 숙주 세포에서 분자의 생성 또는 숙주 세포 성장에 대한 유전자 교란의 영향일 수 있다. 이 데이터/정보는 또한 둘 이상의 유전적 교란으로 인한 조합 효과의 광범위한 세트일 수 있다.

목적하는 표현형(예를 들어, 트립토판 수율)을 추가로 개선하기 위해 트랜스포존 돌연변이유발 미생물 균주 라이브러리에 추가 라운드의 순환 공학(cyclical engineering)을 수행할 수 있다. 추가적인 공학 라운드는 트랜스포존 돌연변이유발 또는 SNP 스왑, PRO 스왑 또는 랜덤 돌연변이유발과 같은 본 발명에 기술된 다른 라이브러리 유형으로 구성될 수 있다. 개선된 균주는 개선된 성능을 갖는 변이체를 확인하기 위해 원하는 표현형에 대해 스크리닝될 수 있고, 또한 뚜렷한 유리한 돌연변이의 부가 효과를 통해 추가로 개선된 균주를 생성하도록 개선된 표현형을 나타내는 다른 균주 변이체와 통합될 수 있다.

당업자는 트랜스포존 돌연변이유발에 의해 생성된 유전자 교란을 임의의 다른 유전자 교란과 통합시키는 능력을 인식할 것이다. 따라서, 일부 실시태양에서, 본 발명은 트랜스포존 돌연변이유발에 의해 생성된 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 그 이상의 유전자 교란을 갖는 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 교시한다.

요약하면, 유기체에서 트랜스포존 돌연변이유발에 의해 생성된 다양한 돌연변이/변경/삽입/결실(유전자 교란으로도 지칭됨)을 이용하는 것은 관심의 특성을 최적화하는 강력한 도구이다. 본 발명자들에 의해 개발된 HTP 라이브러리를 생성하기 위해 트랜스포존 돌연변이유발을 이용하는 분자 도구는 관심 형질에 다양한 영향을 미치는 돌연변이/변형/삽입/결실의 집합을 사용한다. 이 집합은 고 처리량 게놈 조작을 사용하여 유기체에 체계적으로 적용된다. 이 돌연변이/변형/삽입/결실 그룹은 다수의 방법 중 어느 하나에 기초하여 관심 특성에 영향을 미칠 가능성이 높은 것으로 결정된다. 이들은 알려진 기능을 기반으로 한 선택 또는 관심 특성에 미치는 영향 또는 이전에 결정된 유익한 유전자 다양성을 기반으로 하는 알고리즘 선택을 포함할 수 있다. 일부 실시태양에서, 돌연변이/변형/삽입/결실의 선택은 주어진 숙주에서 모든 유전자를 포함할 수 있다. 다른 실시태양에서, 돌연변이/변경/삽입/결실의 선택은 무작위로 선택된 주어진 숙주에서 모든 유전자의 서브 세트일 수 있다. 다른 실시태양에서, 돌연변이/변경/삽입/결실의 선택은 주어진 분자의 합성에 관여하는 모든 유전자의 서브 세트일 수 있다.

트랜스포존 돌연변이유발에 의해 생성된 유전자 교란을 함유하는 유기체의 최종 HTP 유전자 디자인 미생물 균주 라이브러리는 고 처리량 스크리닝 모델에서 성능에 대해 평가하고, 성능을 증가시키는 유전자 교란이 결정되고 데이터베이스에 정보가 저장된다. 유전자 교란(예를 들어, 돌연변이/변경/삽입/결실)의 집합은 "트랜스포존 돌연변이유발 라이브러리"를 형성하며, 이는 미래의 미생물 조작 처리에서 잠재적 유전자 변경의 원천으로 사용될 수 있다. 시간이 지남에 따라, 더 많은 숙주 세포 배경에 대해 더 큰 세트의 유전자 교란이 구현됨에 따라, 각 라이브러리는 임의의 관심 배경에 대한 표적화된 변경을 보다 정확하고 예측 가능하게 디자인하는 데 사용될 수 있는 실험적으로 확인된 데이터의 모음으로 더욱 강력해진다.

일부 실시태양에서, 본 발명의 트랜스포존 돌연변이유발 라이브러리는 유전자 표적의 최적 발현을 확인하기 위해 사용될 수 있다. 일부 실시태양에서, 목표는 대사 또는 유전자 경로에서 병목 현상을 감소시키기 위해 표적 유전자의 활성을 증가시키는 것일 수 있다. 다른 실시태양에서, 목표는 표적 유전자의 발현이 요구되지 않을 때 숙주 세포에서 불필요한 에너지 소비를 피하기 위해 표적 유전자의 활성을 감소시키는 것일 수 있다.

따라서, 특정 실시태양에서, 트랜스포존 돌연변이유발은 다음을 포함하는 다단계 과정이다:

1. 돌연변이유발을 위한 트랜스포존 시스템을 선택하고 주어진 미생물 균주에 시스템을 적용하여 트랜스포존에 의해 야기된 돌연변이(또는 다른 유전자 교란, 그러나 돌연변이는 이러한 시놉시스에서 간략화를 위해 사용됨)를 생성한다. 이상적으로, 시스템은 선택된 미생물 균주의 게놈으로 트랜스포존을 무작위로 통합시키는 것으로 나타났다. 이런 통합은 어떤 식으로든 유전자 발현을 교란시킨다.

2. 게놈에 트랜스포존이 통합된 균주를 신속하게 선택하기 위한 고 처리량 균주 조작. 이러한 방식으로, 균주의 "라이브러리"(HTP 유전자 디자인 라이브러리, 즉 트랜스포존 돌연변이유발 미생물 균주 라이브러리로도 지칭됨)가 구성되며, 여기서 라이브러리의 각 구성원은 그렇지 않다며 동일한 유전자 문맥에서 트랜스포존 돌연변이를 포함하는 균주이다. 전술한 바와 같이, 돌연변이 조합은 통합되어, 라이브러리가 제작되는 조합 가능성의 범위를 확장시킬 수 있다.

3. 하나 이상의 매트릭스에 대한 그들의 성능이 최적화되는 성능을 나타내는 상황에서 균주 라이브러리의 고 처리량 스크리닝.

이 기본 과정은 특히, (1) 다수의 유익한 교란(예를 들어, 돌연변이)을 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 여러 변경으로서 하나의 균주 배경으로 통합하는 단계. 다중 교란 (예를 들어, 돌연변이)은, 돌연변이에 의해 변형된 유전자 기능에 관계없이, 특정 세트의 정의된 변화 또는 부분적으로 무작위화된 조합의 변화 라이브러리일 수 있다; (2) 라이브러리의 개별 및 조합 생성으로 인한 성능 데이터를 각 교란의 상호작용에 기초하여 최적의 교란 세트를 예측하는 데 사용하는 알고리즘으로 공급하는 단계; 및 (3) 상기 두 가지 접근법의 조합을 구현하는 단계에 의해 균주 성능의 추가 개선을 제공하도록 확장될 수 있다.

일부 실시태양에서, 트랜스포존은 GC-풍부 영역에서의 삽입을 선호한다. 일부 실시태양에서, 트랜스포존은 삽입 부위에서 GC-염기를 필요로 한다. 일부 실시태양에서, 트랜스포존은 삽입 부위에서 AT-풍부 영역을 선호한다. 일부 실시태양에서, 트랜스포존은 삽입 부위에서 AT-염기를 필요로 한다.

일부 실시태양에서, 트랜스포존 페이로드는 트랜스포존이 세포에서 암호화 영역 내에 또는 암호화 영역에 핵산 서열을 삽입할 때 암호화 영역에 의해 발현되는 생성물의 성질을 변경할 수 있는 비 암호화 DNA 서열을 포함한다. 세포에 존재하는 암호화 영역에 의해 발현된 생성물의 성질을 변경시킬 임의의 뉴클레오타이드 서열이 사용될 수 있다.

일부 실시태양에서, 트랜스포존 페이로드는 트랜스포존이 세포에서 암호화 영역 근처에 삽입될 때 암호화 영역의 발현 수준을 변경할 수 있는 비 암호화 DNA 서열을 포함한다. 이 영향성 서열은 암호화 영역의 발현 수준을 증가시키거나 감소시킬 수 있다. 세포에 존재하는 암호화 영역의 발현 수준을 변화시키는 임의의 뉴클레오타이드 서열이 사용될 수 있다.

일부 실시태양에서, 하나 이상의 비-암호화 또는 암호화 DNA 서열은 프로모터, 터미네이터 서열, 정지 코돈, 최적화된 코돈, 스플라이스 수용체 부위, 스플 라이스 공여자 부위, 사일런서 요소, SNP, 용해도 태그, 바코드, 인핸서, 매트릭스 부착 서열, 전사 결합 부위, 프레임-시프트 돌연변이, 선택 가능한 마커 및 역 선택 가능한 마커를 포함하나 이에 제한되지 않는다.

일부 실시태양에서, 트랜스포존 페이로드는 선택 가능한 마커를 포함한다. 본 발명에 사용될 수 있는 선택 가능한 마커는 약물 내성 마커(예를 들어, 하이그로 마이신, 카나마이신, 베타-락타마제 내성, 퓨로마이신 또는 네오마이신 유사체 G418), 검출 가능한 마커(예를 들어, 형광 단백질, 루시퍼라제, 클로람페니콜 아세틸 트랜스페라제 및 베타-갈락토시다제), mFabI, 클로람페니콜 내성 및 영양 요구성 마커(예를 들어, URA, LYS, cscA)를 포함하나 이에 제한되지 않는다.

일부 실시태양에서, 트랜스포존 페이로드는 URA3/5-FOA 역 선택 가능한 가능한 시스템, sacB, tetAR, rpsL, ccdB, pheS 및 티미딘 키나아제를 포함하나 이에 제한되지 않는 역 선택 가능한 가능한 마커를 포함한다.

트랜스포존 페이로드는 다양한 표현형 반응을 이끌어 내기 위해 변화될 수 있다. 예를 들어, 기능 상실(LoF) 라이브러리에서, 페이로드에는 성공적인 트랜스포존 통합 사건을 선택할 수 있는 마커를 포함할 수 있다. 다른 예에서, 기능 획득 라이브러리에서, 페이로드는 프로모터 또는 용해도 태그를 포함할 수 있다. 다른 실시태양에서, 페이로드는 선택 가능한 마커를 포함하는 페이로드의 일부의 루프 아웃을 용이하게 하는 역 선택 가능한 마커를 포함할 수 있어서, 직렬 트랜스포존 돌연변이유발을 허용한다.

일부 실시태양에서, 트랜스포존은 높은 전위 빈도를 가진다. 일부 실시태양에서, 트랜스포존은 포화된 돌연변이유발을 달성할 수 있도록 (예를 들어, 게놈의 모든 유전자에 적어도 한 번 삽입), 높은 전위 빈도를 가진다.

임의의 적절한 트랜스포존 시스템이 본 발명에서 사용될 수 있다. 일부 실시태양에서, 트랜스포존은 컷-앤-페이스트(cut-and-paste) 트랜스포존이다. 일부 실시태양에서, 트랜스포존은 복제성 트랜스포존이다. 일부 실시태양에서, 트랜스포존은 전위가 역전사를 수반하는 과정을 통해 달성되는 레트로 요소이다. 일부 실시태양에서, 트랜스포존 및 트랜스포사제 시스템은 Tn1, Tn2, Tn3, Tn4, Tn5, Tn6, Tn7, Tn10, 마리너, 히마르 1, Tol2, 프로그 프린스, P-요소, 패스포트, Tn4001, Ty1, Ty2, Ty3, Ty4, Ty5, 합성 트랜스포존, 슬리핑 뷰티, 피기백 또는 이의 유도체를 포함하나 이에 제한되지 않는 그룹으로부터 선택된다. 일부 실시태양에서, 트랜스포존 시스템은 Tn5 트랜스포존 시스템이다.

일부 실시태양에서, 트랜스포존은 둘 이상의 트랜스포존 페이로드로 구성된 복합 트랜스포존이다. 일부 실시태양에서, 하나 이상의 트랜스포존 페이로드는 트랜스포사제와 복합체를 이룬다. 일부 실시태양에서, 복합 트랜스포존 페이로드 및 트랜스포사제는 생체 내 전위를 허용한다. 일부 실시태양에서, 복합 트랜스포사제는 폴리펩타이드이다. 일부 실시태양에서, 복합 트랜스포사제는 트랜스포사제 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 일부 실시태양에서, 복합 트랜스 포사제는 Tn5 트랜스포사제이다.

일부 실시태양에서, 트랜스포존은 부위-특이적 통합을 매개하는 폴리뉴클레오타이드를 포함한다. 본 발명에 사용될 수 있는 부위-특이적 통합 서열은 LoxP(Cre 재조합 효소와 함께 사용) 및 FRT(FLP 재조합 효소와 함께 사용)를 포함하나 이에 제한되지 않는다.

일부 실시태양에서, 트랜스포존은 게놈에 무작위로 삽입된다. 일부 실시태양에서, 트랜스포존은 게놈에 무작위로 삽입되어 기능 상실 돌연변이를 야기한다. 일부 실시태양에서, 트랜스포존은 유전자의 프로모터에 삽입된다. 일부 실시태양에서, 트랜스포존은 오픈 리드 프레임에 무작위로 삽입되고 파괴된 유전자의 전사 또는 번역(예를 들어, 기능 상실 돌연변이)을 방지한다. 일부 실시태양에서, 트랜스포존은 유전자의 상류 조절 요소에 삽입된다. 일부 실시태양에서, 트랜스포존은 유전자에 근접한 부위에 무작위로 삽입되고 유전자 발현(예를 들어, 기능 획득 돌연변이)을 증가시킨다. 일부 실시태양에서, 트랜스포존은 유전자의 프로모터 또는 상류 조절 요소에 삽입되어 기능 획득 돌연변이를 일으킨다. 일부 실시태양에서, 트랜스포존은 유전자의 프로모터 또는 상류 조절 요소에 삽입되어 기능 상실 돌연변이를 일으킨다. 일부 실시태양에서, 트랜스포존은 유전자에 삽입되어 조기 종결 돌연변이를 일으킨다. 일부 실시태양에서, 조기 종결 돌연변이는 기능 상실 돌연변이를 일으킨다.

일부 실시태양에서, 트랜스포존은 삽입 부위에서 게놈 DNA에 통합된다. 일부 실시태양에서, 트랜스포존은 미생물 유기체에 의해 안정적으로 유전된다.

일부 실시태양에서, 트랜스포존은 게놈의 삽입 부위에 하나 이상의 DNA 서열 (예를 들어, 트랜스포존 페이로드)을 삽입한다. 일부 실시태양에서, 트랜스포존은 하나 이상의 파괴적 서열 및/또는 하나 이상의 정서적 서열, 또는 이들의 조합을 포함한다.

일부 실시태양에서, 트랜스포존은 게놈 DNA의 일부를 결실시킨다. 일부 실시태양에서, 게놈 DNA의 일부의 결실은 DNA의 Cre-촉매화된 절단을 통해 달성된다.

트랜스포존은 임의의 적절한 벡터를 사용하여 세포로 전달될 수 있다. 일부 실시태양에서, 벡터는 적어도 1개의 트랜스포존, 적어도 2개의 트랜스포존, 적어도 3개의 트랜스포존, 적어도 4개의 트랜스포존, 적어도 5개의 트랜스포존, 적어도 6개의 트랜스포존, 적어도 7개의 트랜스포존, 적어도 8개의 트랜스포존, 적어도 9개의 트랜스포존, 10개의 트랜스포존 또는 그 이상을 포함할 수 있다.

일부 실시태양에서, 벡터는 트랜스포사제를 암호화하는 암호화 영역을 포함한다. 본 발명에 사용된 용어 "트랜스포사제"는 트랜스포존의 역 반복체 또는 직접 반복체에 결합하고 공여체 폴리뉴클레오타이드(예를 들어 벡터)로부터 트랜스포존의 절제 및 그에 따른 트랜스포존의 세포의 DNA 게놈으로의 통합을 촉진하는 폴리펩타이드를 지칭한다. 트랜스포사제는 폴리펩타이드로서 존재할 수 있다. 대안적으로, 트랜스포사제는 트랜스포사제를 암호화하는 암호화 서열을 포함하는 폴리뉴클레오타이드로서 존재할 수 있다. 폴리뉴클레오타이드는 RNA(예를 들어 mRNA) 또는 DNA일 수 있다. 트랜스포사제를 암호화하는 폴리뉴클레오타이드는 벡터 상에 있거나 염색체에 존재할 수 있다. 트랜스포사제가 트랜스포사제를 암호화하는 암호화 서열로서 존재하는 경우, 본 발명의 일부 양태에서, 암호화 서열은 트랜스포존을 포함하는 동일한 폴리뉴클레오타이드(예를 들어, 벡터) 상에 존재할 수 있다(즉, 시스). 일부 실시태양에서, 트랜스포사제 암호화 서열은 제 2 폴리뉴클레오타이드(예를 들어 벡터) 상에 존재할 수 있는데, 즉 트랜스로 존재할 수 있다.

본 발명은 본 발명에 개시된 트랜스포존 및 벡터를 사용하는 방법을 제공한다. 벡터는 당업계에 공지된 임의의 적절한 수단을 사용하여 표적 세포로 형질 전환, 평가 및 복제될 수 있다. 상기 방법은 표현형이 변했는지 여부를 결정하기 위해 세포를 관찰하는 단계를 포함할 수 있다.

개시된 방법은 세포에 존재하는 트랜스포존의 위치를 맵핑하는 단계를 포함할 수 있다. 일부 실시태양에서, 삽입 영역은 서열 분석에 의해 식별될 수 있다. 서열 분석은 PCR-기반 기술(예를 들어, 역 PCR 또는 링커-매개 PCR 기술)을 포함하나 이에 제한되지 않는 당업계의 임의의 적절한 수단에 의해 수행될 수 있다. 일부 실시태양에서, 서열 분석은 임의의 프라이머와 결합된 트랜스포존-특이적 프라이머(Tn 프라이머)를 사용하여 트랜스포존 경계 중 하나를 PCR-증폭시키고, 이어서 트랜스포존 말단 서열에 바로 인접한 표적 DNA를 확인하기 위해 서열 분석된다. 일부 실시태양에서, 서열 분석은 미생물 게놈에서 공지된 서열로 디자인된 트랜스포존-특이적 프라이머 및 프라이머들의 사용을 포함한다(예를 들어, "풋프린팅(footprinting)"). 일부 실시태양에서, 서열 분석은 혼성화에 의해 확인될 수 있는 트랜스포존(예를 들어, 특정 20-mer 또는 바코드)에 내장된 고유 서열을 분석함으로써 수행될 수 있다. 일부 실시태양에서, 서열 분석은 마이크로어레이 분석을 포함한다. 일부 실시태양에서, 서열 분석은 제 위치 혼성화를 포함한다. 일부 실시태양에서, 서열 분석은 트랜스포존 내에서 제한 부위를 절단할 수 있는 제한 엔도뉴클레아제를 사용한다.

7. 상위성 매핑 - 유익한 유전자 통합을 가능하게 하는 예측 분석 도구

일부 실시태양에서, 본 발명은 유익한 유전자 변형을 예측하고 숙주 세포 내로 결합시키는 상위성 매핑 방법을 교시한다. 유전자 변형은 상기한 HTP 분자 도구 세트(예를 들어, 프로모터 스왑, SNP 스왑, 개시/정지 코돈 교환, 서열 최적화, 트랜스포존 돌연변이유발)의 임의의 것에 의해 일어날 수 있고 이러한 유전자 변형의 효과는 유도된 HTP 유전자 디자인 미생물 균주 라이브러리의 특성화로부터 알 수 있다. 따라서, 본 발명에서 사용된 용어 상위성 매핑은 숙주 성능의 증가를 초래할 수 있는유전자 변형의 조합(예를 들어 유익한 SNP 또는 유익한 프로모터/표적 유전자 결합 또는 트랜스포존 돌연변이유발 캠페인에 의한 유익한 돌연변이)의 조합을 확인하는 방법을 포함한다.

실시태양에서, 본 발명의 상위성 맵핑 방법은 2개의 상이한 작용기로부터의 유익한 돌연변이의 조합이 동일한 작용기로부터의 돌연변이의 조합과 비교하여, 숙주 성능을 개량시키가 더 쉽다는 아이디어에 기초한다. 예를 들어, Costanzo, The Genetic Landscape of a Cell, Science, Vol. 327, Issue 5964, Jan. 22, 2010, pp. 425-431 참조(전문이 본 발명에 참조로 포함).

동일한 작용기로부터의 돌연변이는 동일한 메카니즘에 의해 작용할 가능성이 더 높으며, 따라서 전체 숙주 성능에 대해 음성 또는 중성 상위성을 나타내기가 더 쉽다. 대조적으로, 상이한 작용기로부터의 돌연변이는 독립적인 메카니즘에 의해 작동하기 쉽고, 이로 인해 개량된 숙주 성능 및 일부 경우에 상승 효과를 유도할 수 있다.

따라서, 일부 실시태양에서, 본 발명은 상이한 작용기에 속하는 것으로 예측되는 SNP를 확인하기 위해 SNP 돌연변이를 분석하는 방법을 교시한다. 일부 실시태양에서, SNP 작용기 유사성은 돌연변이 상호작용 프로파일의 코사인 유사성(상관 계수와 유사, 도 8a 참조)을 계산함으로써 결정된다. 본 발명은 또한 돌연변이 유사성 행렬(도 7 참조) 또는 덴드로그램(도 8a 참조)을 통한 SNP의 비교를 예시한다. 동일한 개념이 트랜스포존 돌연변이유발에 의해 발생된 유전자 교란에 적용될 수 있다.

따라서, 상위성 매핑 절차는 하나 이상의 유전자 배경에 상기 돌연변이의 효율적이고 효과적인 통합을 위해 하나 이상의 유전자 배경에 적용된 다양성의 유전 돌연변이를 그룹화 및/또는 순위화하는 방법을 제공한다.

양태에서, 통합은 표적 생체분자의 생산을 위해 최적화된 신규 균주를 생성하는 목적으로 수행된다. 교시된 상위성 매핑 절차를 통해, 돌연변이의 기능적 그룹화를 확인하는 것이 가능하며 이런 기능적 그룹화는 바람직하지 않은 상위성 효과를 최소화하는 통합 전략을 가능하게 한다.

상기한 바와 같이, 산업용 발효에 사용하기 위한 미생물의 최적화는 중요하고 경제, 사회 및 자연계에 대한 광범위하게 관련된 어려운 문제이다. 전통적으로, 미생물 조작은 무작위 돌연변이유발의 느리고 불확실한 과정을 통해 수행되었다. 이런 접근법은 인위적으로 부과된 선택 압력에 적응할 수 있는 세포의 자연적 진화 능력을 활용한다. 이런 접근법은 유익한 돌연변이의 희귀성, 근본적인 적합함 환경의 견고함에 의해 제한되며 보다 일반적으로 세포 및 분자 생물학의 최신기술을 충분히 활용하지 못한다.

현대의 접근법은 기계적 수준에서 세포 기능의 새로운 이해 및 특정 표현형 말단에 대해 표적화된 유전자 조작을 수행하는 새로운 분자 생물학 도구를 활용한다. 실제로, 이런 합리적인 접근법은 생물학의 근본적인 복잡성에 의해 혼란스럽게 된다. 인과관계 매커니즘은, 특히 관찰된 유익한 효과가 있는 2개 이상의 변화를 결합하려고 시도할 때 잘 이해되지 않는다. 때로는 순 긍정적인 결과가 예상보다 낮을 수도 있고 경우에 따라 예상보다 높을 수도 있지만, 유전자 변화의 이런 통합은 긍정적인 결과(원하는 표현형 활동의 증가로 측정됨)를 가져온다. 다른 경우, 이런 조합은 순 중성 효과 또는 순 부정적인 효과를 일으킨다. 이 현상은 상위성으로 불리고 미생물 공학(및 일반적으로 유전자 공학)에 대한 근본적인 도전 중 하나이다.

상기한 바와 같이, 본 HTP 게놈 공학 플랫폼은 전통적인 미생물 공학 접근법과 관련된 많은 문제점을 해결한다. 현재의 HTP 플랫폼은 자동화 기술을 사용하여 한 번에 수백 또는 수천 개의 유전자 변이를 실행한다. 특정 양태에서, 상기한 합리적인 접근법과는 달리, 개시된 HTP 플랫폼은 전문이 본 발명에 참조로 포함된 Microbial Strain Design System And Methods For Improved Large-Scale Production Of Engineered Nucleotide Sequences 이란 제목의 미국 특허 출원 제15/140,296호에 개시된 바와 같이 수천 개의 돌연변이체의 병렬 건설을 가능하게 하여 관련 게놈 공간의 큰 서브세트를 보다 효과적으로 탐사할 수 있게 한다. 공학적 염기 서열의 개선 된 대규모 생산을위한 시스템 및 방법으로서, 본 명세서에서 그 전체가 참고로 인용된다. "모든 것"을 시도함으로써, 현재의 HTP 플랫폼은 제한된 생물학적 이해에 의해 유도된 어려움을 회피한다.

그러나, 동시에, 본 HTP 플랫폼은 게놈 공간의 조합 폭발성 크기 및 유전자 상호작용의 복잡성을 고려하여 생성된 데이터 세트를 해석하는 계산 기술의 효과에 의해 근본적으로 제한되는 문제에 직면한다. 원하는 결과를 산출하는 조합의 비 무작위 선택을 최대화하는 방식으로 광대한 조합 공간의 서브세트를 탐구하는 기술이 필요하다.

다소 유사한 HTP 접근법이 효소 최적화의 경우에 효과적이라는 것이 증명되었다. 이 틈새 문제에서, 관심 게놈 서열(약 1000 염기)은 일부 복잡한 물리적 구성을 가진 단백질 사슬을 암호화한다. 정확한 구성은 구성 원자 구성요소 사이의 집단적 전자기 상호작용에 의해 결정된다. 짧은 게놈 서열과 물리적으로 구속된 접힘 문제의 조합은 탐욕 최적화 전략(greedy optimization strategies)에 특히 적합하다. 즉, 모든 잔기에서 서열을 개별적으로 돌연변이시키고, 생성된 돌연변이를 뒤섞어 서열 활성 반응 모델링과 양립가능한 해상도로 로컬 서열 공간을 효과적으로 샘플링하는 것이 가능하다.

그러나, 생체 분자에 대한 완전한 게놈 최적화를 위해, 이런 잔기-중심 접근법은 몇 가지 중요한 이유 때문에 불충분하다. 첫째, 생체 분자에 대한 게놈 최적화와 관련된 관련 서열 공간의 기하 급수적인 증가 때문이다. 둘째, 생체분자 합성에서 조절, 발현 및 대사 상호작용의 추가된 복잡성 때문이다. 본 발명자들은 교시 된 상위성 매핑 절차를 통해 이러한 문제점을 해결하였다.

상기 돌연변이를 하나 이상의 유전자 배경 속에 더 효율적이고 효과적으로 통합하기 위해서 돌연변이의 집합 사이의 상위성 상호작용을 모델링하는 교시된 방법은 획기적이며 당업계에서 매우 필요하다.

상위성 매핑 절차를 기술할 때, 용어 "더 효율적" 및 "더 효과적인"은 특정 표현형 목표와 관련하여 통합 균주 사이의 바람직하지 않은 상위성 상호작용의 회피를 의미한다.

상기 과정이 일반적으로 상기에 상세하게 설명되었으므로, 더 구체적인 워크 플로우 예가 이제 설명될 것이다.

먼저, M 돌연변이 및 하나 이상의 유전자 배경(예를 들어, 부모 박테리아 균주)의 라이브러리로 시작한다. 라이브러리의 선택이나 유전자 배경의 선택은 여기에 설명된 방법에 특이적이지 않다. 그러나 특정 구현예에서, 돌연변이의 라이브러리는 SNP 스왑 라이브러리, 프로모터 스왑 라이브러리, 트랜스포존 돌연변이유발 라이브러리 또는 본 발명에 설명된 임의의 다른 돌연변이 라이브러리 또는 이의 임의의 조합을 독점적으로 또는 조합하여 포함할 수 있다.

한 구현예에서, 단일 유전자 배경만이 제공된다. 이 경우, 구별된 유전자 배경(미생물 돌연변이)의 집합이 이 단일 배경에서 먼저 생성될 것이다. 이것은 소정의 배경에 돌연변이의 기본 라이브러리(또는 이의 일부 서브세트)를 적용, 예를 들어, 특정 SNP의 HTP 유전 디자인 라이브러리 또는 특정 프로모터의 HTP 유전 디자인 라이브러리의 특정 유전자 배경에 대해 적용함으로써 달성되어 본 발명에 포함된 소정의 HTP 유전자 디자인 라이브러리로부터의 특정 유전자 변형을 제외하고는 동일한 유전자 배경을 가진 미생물 돌연변이 개체군(아마도 100 또는 1,000)을 생성할 수 있다. 아래에서 상세히 설명하는 바와 같이, 이 실시태양은 조합 라이브러리 또는 쌍을 이루는 라이브러리를 유도할 수 있다.

또 다른 구현예에서, 구별된 알려진 유전자 배경의 집합이 간단히 주어질 수있다. 아래에서 상세히 설명되는 바와 같이, 이 실시태양은 조합 라이브러리의 서브세트를 유도할 수 있다.

한 특정 구현예에서, 이런 배경 사이의 유전자 배경 및 유전자 다양성의 수 (돌연변이 또는 서열 편집 거리 등의 수로 측정)는 이 방법의 효과를 최대화하도록 결정된다.

유전자 배경은 천연, 고유한 또는 야생형 균주 또는 돌연변이된 조작 균주일 수 있다. N개의 구별된 배경 균주는 벡터 b로 나타낼 수 있다. 한 실시예에서, 배경 b는 N개의 돌연변이된 배경 균주 b = m₀b₀ = (m₁b₀, m₂b₀, ... m_Nb₀)를 형성하기 위해 N개의 일차 돌연변이 m₀ = (m₁, m₂, ... m_N)을 야생형 배경 균주 b₀에 적용하여 형성된 조작된 배경을 나타낼 수 있으며, 여기서, m_ib₀는 배경 균주 b₀에 대한 돌연변이 m_i의 적용을 나타낸다.

각각의 경우에(즉, 하나의 제공된 유전자 배경 또는 유전자 배경의 집합), 결과는 N개의 유전적으로 구별된 배경의 집합이다. 관련 표현형은 각 배경에 대해 측정된다.

둘째, M 돌연변이 m₁의 집합에서 각 돌연변이는 N개의 배경 균주 b의 집합 내의 각 배경에 적용되어 M × N 돌연변이체의 집합을 형성한다. N개의 배경이 그 자체로 돌연변이 m₀의 기본 세트(위에 설명된 대로)를 적용하여 얻은 구현예에서, 돌연변이체의 생성된 집합은 때로는 조합 라이브러리 또는 쌍을 이루는 라이브러리로 불릴 수 있다. 공지된 배경의 집합이 명시적으로 제공되는 다른 구현예에서, 돌연변이체의 생성된 세트는 조합 라이브러리의 서브세트로 불릴 수 있다. 조작된 배경 벡터의 생성과 유사하게, 실시태양에서, 입력 인터페이스(202)는 돌연변이 벡터 m₁과 배경 벡터 b 및 교차 곱과 같은 특정 연산을 수신한다.

상기 조작된 배경 예를 계속하면, MxN 조합 라이브러리를 형성하는 것은 m₁ x m₀b₀에 의해 형성되는 행렬로 표현될 수 있으며, b의 N 배경에 적용된 m₁의 교차 곱 b = m₀b₀, m₁에서 각 돌연변이는 b 내의 각 배경 균주에 적용된다. 생성된 MxN 행렬의 각 i번째 행은 m₁ 내 i번째 돌연변이의 배경 집합 b 내의 모든 균주에 대한 적용을 나타낸다. 하나의 실시태양에서, m₁ = m₀이고 행렬은 출발 균주 b₀에 동일한 돌연변이의 쌍을 이루는 적용을 나타낸다. 이 경우 행렬은 대각선(M = N) 근처에서 대칭이며 대각선은 동일한 돌연변이의 2회 적용을 나타내기 때문에 모든 분석에서 무시될 수 있다.

실시태양에서, MxN 행렬을 형성하는 것은 입력 인터페이스(202)에 복합 표현 m₁ x m₀b₀을 입력함으로써 달성될 수 있다. 표현의 구성요소 벡터는 하나 이상의 DNA 명세를 통해 명시적으로 지정된 요소로 직접 입력되거나 인터프리터(204)에 의한 해석 동안 벡터의 검색을 가능하게 하기 위해 라이브러리(206)에 대한 호출로서 입력될 수있다. 인터프리터(204), 실행 엔진(207), 주문 배치 엔진(208) 및 공장(210)을 통해 "Microbial Strain Design System and Methods for Improved Large Scale Production of Engineered Nucleotide Sequences,"이라는 제목의 미국 특허출원 제15/140,296호에 개시된 바와 같이, LIMS 시스템(200)은 입력 표현에 의해 지정된 미생물 균주를 생성한다.

셋째, 도 24의 흐름도를 참조하면, 분석 장비(214)(도 20)는 MxN 조합 라이브러리 행렬(4202) 내의 각각의 돌연변이체에 대한 표현형 반응을 측정한다. 이와 같이, 응답의 집합은 MxN 응답 행렬 R로 해석될 수 있다. R의 각 요소는 r_ij = y(m_i, m_j)로 나타낼 수 있으며, 여기서 y는 돌연변이 m_i에 의해 돌연변이된 조작된 집합 b 내의 배경 균주 b_j의 응답(성능)을 나타낸다. 단순성과 실용성을 위해, m₁ = m₀인 쌍을 이루는 돌연변이를 가정한다. 돌연변이의 세트가 상을 이루는 돌연변이 라이브러리를 나타내는 경우, 생성된 행렬은 유전자 상호작용 행렬 또는 보다 구체적으로 돌연변이 상호작용 행렬로 불릴 수 있다.

당업자는, 일부 실시태양에서, 상위성 효과 및 예측 균주 디자인과 관련된 작업이, 예를 들어 분석 장비(214) 또는 인간의 구현에 의한 LIMS 시스템(200)의 자동화 수단을 통해 또는 자동화 및 수동 수단의 조합을 통해 완전히 수행될 수 있다는 것을 인식할 것이다. 작업이 완전히 자동화되지 않으면, 예를 들어, 분석 장비 (214)와 같은 LIMS 시스템(200)의 요소는, 예를 들어, 자신의 작업 능력을 통해 결과를 생성하기 보다는 작업의 인간 수행 결과를 수신할 수 있다. 본 발명의 다른 곳에서 기술된 바와 같이, 분석 장비(214)와 같은 LIMS 시스템(200)의 구성요소는 전체적으로 또는 부분적으로 하나 이상의 컴퓨터 시스템에 의해 구현될 수 있다. 일부 실시태양에서, 특히 예측 균주 디자인과 관련된 작업이 자동 및 수동 수단의 조합에 의해 수행되는 경우, 분석 장비(214)는 컴퓨터 하드웨어, 소프트웨어 또는 펌웨어(또는 이들의 조합)뿐만 아니라 아래 표 3에 열거된 것과 같은 인간 작업자에 의해 작동된 장비, 예를 들어 "성능 평가" 범주에 나열된 장비를 포함할 수 있다.

넷째, 분석 장비(212)는 응답 행렬을 정규화한다. 정규화는 편향을 제거하고 및/또는 이 방법에 특이적인 효과의 관련 부분을 분리할 목적으로 측정된 응답 값을 조정하는 수동 및/또는 자동화 프로세스로 구성된다. 도 24와 관련하여, 제 1 단계(4202)는 정규화된 측정 데이터를 얻는 단계를 포함할 수 있다. 일반적으로, 예측 균주 디자인 및 상위성 매핑에 관한 청구항에서, "성능 측정" 또는 "측정 된 성능" 등의 용어는 일부 방식으로 처리되지 않거나 처리딘 측정 데이터, 예를 들어, 정규화된 데이터를 반영하는 메트릭을 기술하는데 사용될 수 있다. 특정 구현예에서, 정규화는 측정된 응답 값으로부터 이전에 측정된 배경 응답을 뺌으로써 수행될 수 있다. 그 구현예에서, 생성된 응답 요소는 r_ij = y(m_i, m_j) - y(m_j)로서 형성될 수 있으며, 여기서 y(m_j)는 1차 돌연변이 m_j의 부모 균주 b₀에 대한 적용에 의해 유발된 조직돤 집합 b 내의 조작된 배경 균주 b_j의 반응이다. 정규화된 응답 행렬의 각 행은 상응하는 돌연변이에 대한 응답 프로파일로 취급된다는 것에 유의한다. 즉, i번째 행은 j = 1 내지 N에 대한 모든 배경 균주 b_j에 적용된 상응하는 돌연변이 m_i의 상대적 효과를 기술한다.

쌍을 이루는 돌연변이의 예와 관련하여, 2개의 돌연변이로부터 생성된 균주의 성능/반응은 개별적으로 돌연변이의 각각에 대한 균주의 성능/반응보다 크거나, 작거나 같을 수 있다. 이 효과는 "상위성"으로 알려져 있으며, 일부 실시태양에서, e_ij = y(m_i, m_j) - (y(m_i) + y(m_j)로 나타낼 수있다. 이런 수학 표현의 변형이 가능하며, 예를 들어 개별 변화가 생물학적으로 어떻게 상화작용하는지에 따라 달라질 수 있다. 상기한 바와 같이, 동일한 작용기로부터의 돌연변이는 동일한 메카니즘에 의해 작동하기 쉽고, 따라서 전체 숙주 성능에 대해 음성 또는 중성 상위성을 나타내기 쉽다. 반대로, 상이한 작용기로부터의 돌연변이는 독립적인 메카니즘에 의해 작동하기 쉽고, 이는 예를 들어 여분의 돌연변이 효과를 감소시킴으로써 개량된 숙주 수행을 유도할 수 있다. 따라서, 유사하지 않은 반응을 일으키는 돌연변이는 유사한 반응을 일으키는 돌연변이보다 부가적인 방식으로 결합하기 쉽다. 이것은 다음 단계에서 유사성 계산을 유도한다.

다섯째로, 분석 장비(214)는 응답들 사이의 유사성-쌍을 이루는 돌연변이 실시예에서, 응답 행렬(4204) 내에서 i번째 돌연변이와 j번째(예를 들어, 1차) 돌연변이의 영향 사이의 유사성을 측정한다. R의 i번째 행은 N개의 배경 균주에 대한 i번째 돌연변이 m_i의 성능 영향을 나타내며, 이의 각각은 자체로 상기한 대로 조작된 돌연변이의 결과일 수 있다는 것을 상기한다. 따라서 i번째와 j번째 돌연변이의 영향 사이의 유사성은 유사성 행렬 S를 형성하기 위해 각각 i번째와 j번째 행, ρ_i및 ρ_j 사이의 유사성 s_ij로 각각 나타낼 수 있으며, 이의 예는 도 15에 예시된다. 유사성은 교차-상관관계 또는 절대 코사인 유사성, 예를 들어 s_ij = abs(cos(ρ_i, ρ_j)과 같은 많은 공지된 기술을 사용하여 측정될 수 있다.

코사인 유사성과 같은 메트릭에 대한 대안 또는 보완으로서, 응답 프로파일은 클러스터링되어 유사성의 등급을 결정할 수 있다. 클러스터링은 적절한 거리 측정(예를 들어, 유클리드(Euclidean), 해밍(Hamming) 등)과 함께 거리 기반 클러스터링 알고리즘(예를 들어, k- 평균, 계층적 응집 등)의 사용에 의해 수행될 수 있다. 대안적으로, 클러스터링은 적절한 유사성 척도(예를 들어, 코사인, 상관관계 등)를 갖는 유사성 기반 클러스터링 알고리즘(예를 들어, 스펙트럼, 최소-커트 등)을 사용하여 수행될 수 있다. 물론, 거리 측정은 임의의 수의 표준 기능 작업(예를 들어, 지수 함수)을 통해 유사성 측정치로 매핑될 수 있고 그 반대의 경우도 가능하다. 일 구현예에서, 계층적 응집 클러스터링은 절대 코사인 유사성과 함께 사용될 수 있다. (도 8a 참조).

클러스터링의 한 예로서, C를 k개의 구별된 클러스터로의 돌연변이 m_i의 클러스터링이라하자. C를 클러스터 멤버십 행렬이라 하며, 여기서 c_ij는 돌연변이 i가 클러스터 j에 속하는 정도, 0과 1 사이의 값이다. 돌연변이 i와 j의 사이의 클러스터 기반 유사성은 C_ixC_j(C의 i번째 및 j번째 행의 도트 곱)으로 제공된다. 일반적으로, 클러스터 기반의 유사성 행렬은 CC^T(즉, C 곱 C-트랜스포즈)로 제공된다. 하드 클러스터링의 경우(돌연변이가 정확하게 하나의 클러스터에 속한다), 두 돌연변이 사이의 유사성은 동일한 클러스터에 속하면 1이고 그렇지 않은 경우 0이다.

Costanzo, The Genetic Landscape of a Cell, Science, Vol. 327, Issue 5964, Jan. 22, 2010, pp. 425-431(그 전문이 본 명세서에서 참조로 포함됨)에 기술된 바와 같이, 돌연변이 반응 프로파일의 이런 클러스터링은 세포의 근본적인 기능적 조직의 대강의 매핑에 관한 것이다. 즉, 함께 집단화되는 돌연변이는 근본적인 생물학적 과정이나 대사 경로와 관련되는 경향이 있다. 이런 돌연변이는 본 명발명에서는 "작용기"라고 부른다. 이 방법의 주요 관측은 두 돌연변이가 동일한 생물학적 과정 또는 경로에 의해 작동한다면, 관측된 효과(및 주목할만하게 관찰된 이점)가 중복될 수 있다는 것이다. 반대로, 2개의 돌연변이가 구별된 메커니즘에 의해 작동한다면, 유익한 효과가 중복될 가능성이 적을 것이다.

여섯째, 상위성 효과에 기초하여, 분석 장비(214)는 비유사 응답을 유도하는 돌연변이의 쌍을 선택하는데, 예를 들어 도 24(4206)에 도시된 바와 같이(예를 들어, 도 7 및 도 8a) 이들의 코사인 유사성 메트릭이 유사성 임계치 아래로 떨어지거나 이들의 반응이 충분히 분리된 클러스터들 내에 있다. 이들의 비유사성에 근거하여, 선택된 쌍의 돌연변이는 유사한 쌍보다 배경 균주로 통합되어야 한다.

충분히 비유사한 응답을 유도하는 선택된 쌍의 돌연변이에 기초하여, LIMS 시스템(예를 들어, 인터프리터(204), 실행 엔진(207), 주문 배치기(208) 및 공장(210)의 모든 또는 일부 조합)이 그 선택된 돌연변이(4208)를 가진 미생물 균주를 디자인하는데 사용될 수 있다. 실시태양에서, 이하 및 본 발명의 다른 곳에서 기술된 바와 같이, 상위성 효과는 균주 선택을 가중하거나 여과하기 위해 예측 모델 속에서 형성될 수 있거나 예측 모델과 함께 사용될 수있다.

일부 바람직한 예측 모델을 통해 특정 배경 속에 라이브러리로부터의 돌연변이의 집합을 통합함으로써 얻어진 가상의 균주의 성능(즉, 점수)을 추정할 수 있다고 가정한다. 교시된 방법에서 이용된 대표적인 예측 모델은 "Computational Analysis and Prediction of Effects of Genome-Wide Genetic Design Criteria."의 더 큰 섹션에서 발견된 "Predictive Strain Design"란 제목의 이하 섹션에 제공된다.

선형 회귀와 같은 예측 균주 디자인 기술을 사용하는 경우, 분석 장비(214)는 단지 충분하게 비유사한 돌연변이를 유지하기 위해 회귀 결과를 필터링하여 낮은 유사성 척도를 가진 돌연변이에 모델을 제한할 수 있다. 대안적으로, 예측 모델은 유사성 행렬로 가중될 수 있다. 예를 들어, 일부 실시태양은 제안된 돌연변이의 상호의존성을 특성화하기 위해 유사성 행렬을 사용하여 가중된 최소 제곱 회귀(weighted least squares regression)를 이용할 수 있다. 한 예로서, 가중치 부여는 회귀 모델에 "커널" 트릭을 적용함으로써 수행될 수 있다. ("커널 트릭"이 많은 기계 학습 모델링 접근법에 일반적이기 때문에, 이런 재-가중 전략은 선형 회귀에 제한되지 않는다.)

이런 방법은 당업자에게 공지되어 있다. 실시태양에서, 커널은 요소 1 - w ^* s_ij를 갖는 행렬이고, 여기서 1은 단위 행렬의 요소이고, w는 0과 1 사이의 실수 값이다. w = 0일 때, 이것은 표준 회귀 모델로 감소한다. 실제로, w의 값은 쌍을 이루는 조합 구조체 및 이의 관련 효과 y (mi, mj)에 대해 평가될 때 예측 모델의 정확성(r2 값 또는 루트 평균 제곱 에러(RMSE))에 연결될 것이다. 하나의 간단한 구현예에서, w는 w = 1-r²로 정의된다. 이 경우, 모델이 완전히 예측 가능한 경우, w = 1-r² = 0이고 통합은 예측 모델만을 기반으로 하며 통합은 상위성 매핑 절차만 기반으로 한다. 각각의 반복 동안, 정확도를 평가하여 모델 성능이 개량되는지 여부를 결정할 수 있다.

본 발명에 기재된 상위성 매핑 절차는 어느 모델이 분석 장비(214)에 의해 사용되는지에 의존하지 않는 것이 명백해야 한다. 이런 예측 모델을 고려하면, 조합 통합을 통해 돌연변이 라이브러리에 접근할 수 있는 모든 가상의 균주를 점수매기고 순위를 매기는 것이 가능하다.

일부 실시태양에서, 상위성 효과를 설명하기 위해, 비유사한 돌연변이 반응 프로파일은 예측 모델로부터 각 가상 균주와 연관된 점수 및 순위를 증대하기 위해 분석 모델(214)에 의해 사용될 수 있다. 이 절차는 대체로 점수의 재-가중화로서 생각될 수 있어서 비유사한 응답 프로파일을 가진 후보 균주(예를 들어, 클러스터의 다양성으로부터 얻은 균주)를 지지할 수 있다. 하나의 간단한 구현예에서, 균주는 비유사성 임계값을 만족하지 않거나 동일한 클러스터(적당한 가중치를 가짐)로부터 얻은 구성 돌연변이의 수만큼 감소된 점수를 가질 수 있다. 한 특정 구현예에서, 가상 균주의 성능 평가는 (다시 적당한 가중치에 의해) 가상의 균주와 관련된 구성 돌연변이의 모든 쌍과 관련된 유사성 행렬의 항의 합계만큼 감소될 수 있다.가상 균주는 이러한 증가된 점수를 사용하여 순위가 다시 매겨질 수 있다. 실제로, 이런 재-가중 계산은 초기 점수 추정과 함께 수행될 수 있다.

결과는 혼동하는 상위성 상호작용을 보다 효과적으로 피하기 위해 증가된 점수 및 순위를 가진 가상 균주의 집합이다. 가상 균주는 이 시점에서 만들어질 수 있거나 후속 분석이나 사용을 위해 다른 계산 방법으로 넘겨질 수 있다.

당업자는 본 발명에 기술된 바와 같이 상위성 매핑 및 반복적인 예측 균주 디자인이 단지 쌍을 이루는 돌연변이를 사용하는 것에 제한되지 않고 배경 균주에 더 많은 돌연변이를 동시에 적용하는 것으로 확장될 수 있음을 인식할 것이다. 다른 실시태양에서, 추가적인 돌연변이가 본 발명에 기재된 예측 방법에 따라 선택된 돌연변이를 사용하여 이미 돌연변이된 균주에 순차적으로 적용될 수 있다. 다른 실시태양에서, 상위성 효과는 서로 약간 다른 다수의 균주 배경에 동일한 유전자 변이를 적용하고 돌연변이된 균주 배경 사이에 양성 반응 프로파일에 임의의 유의한 차이가 있음을 나타냄으로써 귀속된다.

유전자 디자인에 순응하는 유기체

개시된 HTP 게놈 공학 플랫폼은 산업용 미생물 세포 배양물(예를 들어, 코리 네박테리움(Corynebacterium), A. 니거(A. niger), 및 사카로폴리스포라 에스피피(Saccharopolyspora spp))로 예시되지만, 원하는 형질이 유전자 돌연변이 집단에서 확인될 수 있는 임의의 숙주 세포 유기체에 적용 가능하다.

따라서, 본 발명에 사용된 용어 "미생물"은 광범위하게 해석되어야 한다. 미생물은 두 가지 원핵생물 영역인 박테리아와 고세균뿐만 아니라 특정 진핵생물 균류와 원생 생물을 포함한다. 그러나, 특정 양태에서, 곤충, 식물 및 동물과 같은 "보다 높은" 진핵생물이 본 발명에 교시된 방법에서 이용될 수 있다.

적합한 숙주 세포는 박테리아 세포, 조류 세포, 식물 세포, 균류 세포, 곤충 세포 및 포유류 세포를 포함하나 이에 제한되지 않는다. 한 예시적인 실시태양에서, 적합한 숙주 세포는 대장균(예를 들어, 매사추세츠주, 입스위치의 뉴잉글랜드 바이오랩스(New England BioLabs)로부터 구입가능한 SHuffle™ competent E. coli)을 포함한다.

대장균 종의 적합한 숙주 균주는 장독소성 대장균(ETEC), 장병원성 대장균(EPEC), 장내습성 대장균(EIEC), 장출혈성 대장균(EHEC), 요로병원성 대장균(UPEC), 베로톡신생성 대장균, 대장균 O157:H7, 대장균 O104:H4, 대장균 O121, 대장균 O104:H21, 대장균 K1 및 대장균 NC101을 포함한다.

일부 실시태양에서, 본 발명은 대장균 균주 NCTC 12757, NCTC 12779, NCTC 12790, NCTC 12796, NCTC 12811, ATCC　11229, ATCC　25922, ATCC　8739, DSM 30083, BC 5849, BC 8265, BC 8267, BC 8268, BC 8270, BC 8271, BC 8272, BC 8273, BC 8276, BC 8277, BC 8278, BC 8279, BC 8312, BC 8317, BC 8319, BC 8320, BC 8321, BC 8322, BC 8326, BC 8327, BC 8331, BC 8335, BC 8338, BC 8341, BC 8344, BC 8345, BC 8346, BC 8347, BC 8348, BC 8863, 및 BC 8864의 게놈 조작을 교시한다.

일부 실시태양에서, 본 발명은 균주 BC 4734 (O26:H11), BC 4735 (O157:H-), BC 4736, BC 4737 (n.d.), BC 4738 (O157:H7), BC 4945 (O26:H-), BC 4946 (O157:H7), BC 4947 (O111:H-), BC 4948 (O157:H), BC 4949 (O5), BC 5579 (O157:H7), BC 5580 (O157:H7), BC 5582 (O3:H), BC 5643 (O2:H5), BC 5644 (O128), BC 5645 (O55:H-), BC 5646 (O69:H-), BC 5647 (O101:H9), BC 5648 (O103:H2), BC 5850 (O22:H8), BC 5851 (O55:H-), BC 5852 (O48:H21), BC 5853 (O26:H11), BC 5854 (O157:H7), BC 5855 (O157:H-), BC 5856 (O26:H-), BC 5857 (O103:H2), BC 5858 (O26:H11), BC 7832, BC 7833 (O raw form:H-), BC 7834 (ONT:H-), BC 7835 (O103:H2), BC 7836 (O57:H-), BC 7837 (ONT:H-), BC 7838, BC 7839 (O128:H2), BC 7840 (O157:H-), BC 7841 (O23:H-), BC 7842 (O157:H-), BC 7843, BC 7844 (O157:H-), BC 7845 (O103:H2), BC 7846 (O26:H11), BC 7847 (O145:H-), BC 7848 (O157:H-), BC 7849 (O156:H47), BC 7850, BC 7851 (O157:H-), BC 7852 (O157:H-), BC 7853 (O5:H-), BC 7854 (O157:H7), BC 7855 (O157:H7), BC 7856 (O26:H-), BC 7857, BC 7858, BC 7859 (ONT:H-), BC 7860 (O129:H-), BC 7861, BC 7862 (O103:H2), BC 7863, BC 7864 (O raw form:H-), BC 7865, BC 7866 (O26:H-), BC 7867 (O raw form:H-), BC 7868, BC 7869 (ONT:H-), BC 7870 (O113:H-), BC 7871 (ONT:H-), BC 7872 (ONT:H-), BC 7873, BC 7874 (O raw form:H-), BC 7875 (O157:H-), BC 7876 (O111:H-), BC 7877 (O146:H21), BC 7878 (O145:H-), BC 7879 (O22:H8), BC 7880 (O raw form:H-), BC 7881 (O145:H-), BC 8275 (O157:H7), BC 8318 (O55:K-:H-), BC 8325 (O157:H7), 및 BC 8332 (ONT), BC 8333와 같은 베로톡신생성 대장균(VTEC)을 교시한다.

일부 실시태양에서, 본 발명은 균주 BC 8246 (O152:K-:H-), BC 8247 (O124:K(72):H3), BC 8248 (O124), BC 8249 (O112), BC 8250 (O136:K(78):H-), BC 8251 (O124:H-), BC 8252 (O144:K-:H-), BC 8253 (O143:K:H-), BC 8254 (O143), BC 8255 (O112), BC 8256 (O28a.e), BC 8257 (O124:H-), BC 8258 (O143), BC 8259 (O167:K-:H5), BC 8260 (O128a.c.:H35), BC 8261 (O164), BC 8262 (O164:K-:H-), BC 8263 (O164), 및 BC 8264 (O124)와 같은 장침입성 대장균(EIEC)을 교시한다.

일부 실시태양에서, 본 발명은 균주 BC 5581 (O78:H11), BC 5583 (O2:K1), BC 8221 (O118), BC 8222 (O148:H-), BC 8223 (O111), BC 8224 (O110:H-), BC 8225 (O148), BC 8226 (O118), BC 8227 (O25:H42), BC 8229 (O6), BC 8231 (O153:H45), BC 8232 (O9), BC 8233 (O148), BC 8234 (O128), BC 8235 (O118), BC 8237 (O111), BC 8238 (O110:H17), BC 8240 (O148), BC 8241 (O6H16), BC 8243 (O153), BC 8244 (O15:H-), BC 8245 (O20), BC 8269 (O125a.c:H-), BC 8313 (O6:H6), BC 8315 (O153:H-), BC 8329, BC 8334 (O118:H12), 및 BC 8339와 같은 장독소성 대장균(ETEC)을 교시한다.

일부 실시태양에서, 본 발명은 균주 BC 7567 (O86), BC 7568 (O128), BC 7571 (O114), BC 7572 (O119), BC 7573 (O125), BC 7574 (O124), BC 7576 (O127a), BC 7577 (O126), BC 7578 (O142), BC 7579 (O26), BC 7580 (OK26), BC 7581 (O142), BC 7582 (O55), BC 7583 (O158), BC 7584 (O-), BC 7585 (O-), BC 7586 (O-), BC 8330, BC 8550 (O26), BC 8551 (O55), BC 8552 (O158), BC 8553 (O26), BC 8554 (O158), BC 8555 (O86), BC 8556 (O128), BC 8557 (OK26), BC 8558 (O55), BC 8560 (O158), BC 8561 (O158), BC 8562 (O114), BC 8563 (O86), BC 8564 (O128), BC 8565 (O158), BC 8566 (O158), BC 8567 (O158), BC 8568 (O111), BC 8569 (O128), BC 8570 (O114), BC 8571 (O128), BC 8572 (O128), BC 8573 (O158), BC 8574 (O158), BC 8575 (O158), BC 8576 (O158), BC 8577 (O158), BC 8578 (O158), BC 8581 (O158), BC 8583 (O128), BC 8584 (O158), BC 8585 (O128), BC 8586 (O158), BC 8588 (O26), BC 8589 (O86), BC 8590 (O127), BC 8591 (O128), BC 8592 (O114), BC 8593 (O114), BC 8594 (O114), BC 8595 (O125), BC 8596 (O158), BC 8597 (O26), BC 8598 (O26), BC 8599 (O158), BC 8605 (O158), BC 8606 (O158), BC 8607 (O158), BC 8608 (O128), BC 8609 (O55), BC 8610 (O114), BC 8615 (O158), BC 8616 (O128), BC 8617 (O26), BC 8618 (O86), BC 8619, BC 8620, BC 8621, BC 8622, BC 8623, BC 8624 (O158), 및 BC 8625 (O158)과 같은 장병원성 대장균(EPEC)을 교시한다.

일부 실시태양에서, 본 발명은 또한 시겔라 플렉네리(Shigella flexneri), 시겔라 디스센테리에(Shigella dysenteriae), 시겔라 보이디(Shigella boydii) 및 시겔라 소네이(Shigella sonnei)를 포함하는 시겔라 유기체의 조작 방법을 교시한다.

본 발명의 다른 적합한 숙주 유기체는 코리네박테리움 속의 미생물을 포함한다. 일부 실시태양에서, 바람직한 코리네박테리움 균주/종은 기탁된 유형 균주가 DSM44549인 C. 에피센스(C. efficiens), 기탁된 유형 균주가 ATCC13032인 C. 글루타미쿰(C. glutamicum) 및 기탁된 유형 균주가 ATCC6871인 C. 암모니아게네스(C. ammoniagenes)를 포함한다. 일부 실시태양에서, 본 발명의 바람직한 숙주는 C. 글루타미쿰이다.

특히 코리네박테리움 글루타미쿰 종의 코리네박테리움 속의 적합한 숙주 균주는 특히 공지된 야생형 균주이다: 코리네박테리움 글루타미쿰 ATCC13032, 코리네박테리움 아세토글루타미쿰 ATCC15806, 코리네박테리움 아세토아시도필럼 ATCC13870, 코리네박테리움 멜라세콜라 ATCC17965, 코리네박테리움 써모아미노게 네스 FERM BP- 1539, 브레비박테리움 플라붐 ATCC14067, 브레비박테리움 락토페르멘툼 ATCC13869 및 브레비박테리움 다이바리카툼 ATCC14020; 및 예를 들어, L-리신 생산 균주로부터 제조된 L-아미노산 생산 돌연변이체 또는 균주: 코리네박테리움 글루타미쿰 FERM-P 1709, 브레비박테리움 플라붐 FERM P-1708, 브레비박테리움 락토페르멘툼 FERM P 1712, 코리네박테리움 글루타미쿰 FERM-P 6463, 코리네박테리움 글루타미쿰 FERM-P 6464, 코리네박테리움 글루타미쿰 DM58-1, 코리네박테리움 글루타미쿰 DG52-5, 코리네박테리움 글루타미쿰 DSM5714 및 코리네박테리움 글루타미 쿰 DSM12866.

용어 "마이크로콕쿠스 글루타미쿠스"는 C. 글루타미쿰에도 사용되어왔다. C. 에피시엔스 종의 일부 대표는 또한 예를 들어, 균주 FERM BP-1539와 같은 종래 기술에서 C. 써모아미노게네스로 불려왔다.

일부 실시태양에서, 본 발명의 숙주 세포는 진핵생물 세포이다. 적합한 진핵생물 숙주 세포는 곰팡이 세포, 조류 세포, 곤충 세포, 동물 세포 및 식물 세포를 포함하나 이에 제한되지 않는다. 적합한 균류 숙주 세포는 아세코코타 (Ascomycota), 담자균(Basidiomycota), 신생 균주(Deuteromycota), 접합체 진균 (Zygomycota), 진균 무균(Fungi imperfecti)을 포함하나 이에 제한되지 않는다. 특정 바람직한 숙주 세포는 효모 세포 및 사상 균류 세포를 포함한다. 적합한 사상 균류 숙주 세포는 예를 들어 유마이코티나(Eumycotina) 및 오마이코타(Oomycota) 세분의 임의의 섬유상 형태를 포함한다. (예를 들어, 참조로 본 발명에 포함된 Hawksworth et al., In Ainsworth and Bisby's Dictionary of The Fungi, 8^th　edition, 1995, CAB International, University Press, Cambridge, UK 참조). 사상 균류는 키틴, 셀룰로오스 및 다른 복합 다당류로 구성된 세포벽을 갖는 식물성 균사체를 특징으로 한다. 사상 균류 숙주 세포는 효모와 형태학적으로 구별된다.

특정 예시적이고 비 제한적인 실시 양태에서, 사상 균류 숙주 세포는 아칠라(Achlya), 아크레모늄(Acremonium), 아스퍼길루스(Aspergillus), 아우레오바시듐(Aureobasidium), 브제르칸데라(Bjerkandera), 세리포리오프시스(Ceriporiopsis), 세팔로스포리움(Cephalosporium), 크리소스포리움(Chrysosporium), 코칠리오볼루스(Cochliobolus), 코리나스쿠스(Corynascus), 크리포넥트리아(Cryphonectria), 크립토콕쿠스(Cryptococcus), 코프리누스(Coprinus), 코리오루스(Coriolus), 디플로디아(Diplodia), 엔도디스(Endothis), 프사리움(Fusarium), 지베렐라(Gibberella), 글리오클라디움(Gliocladium), 휴미콜라(Humicola), 하이포크레아(Hypocrea), 마이셀리오프토라(Myceliophthora)(예를 들어, Myceliophthora thermophila), 무코르(Mucor), 네우로스포라(Neurospora), 페니실리움(Penicillium), 포도스포라(Podospora), 필레비아(Phlebia), 피로마이세스(Piromyces), 피리쿨라리아(Pyricularia), 리히조무코르(Rhizomucor), 리히조푸스(Rhizopus), 스키조필룸(Schizophyllum), 스키탈리듐(Scytalidium), 스포로트리츔(Sporotrichum), 탈라로마이세스(Talaromyces), 써모아스쿠스(Thermoascus), 티에라비아(Thielavia), 트라마테스(Tramates), 폴리포클라듐(Tolypocladium), 트라이코데마(Trichoderma), 베르티실리움(Verticillium), 볼바리엘라(Volvariella), 또는 텔레오모르프(teleomorphs), 또는 아나모르프(anamorphs), 이의 동의어 또는 분류학적 동등물의 종의 세포일 수 있다. 한 실시태양에서, 사상 균류는 A. 니거(A. niger) 그룹의 A. 니둘란스(A. nidulans), A. 오리재(A. oryzae), A. 소재(A. sojae) 및 아스페르길리(Aspergilli)로 이루어진 그룹으로부터 선택된다. 한 실시태양에서, 사상 균류는 아스페르루스 니거(Aspergillus niger)이다.

다른 실시태양에서, 균류 종의 특정 돌연변이체는 본 발명에 제공된 방법 및 시스템에 사용된다. 한 실시태양에서, 본 발명에 제공된 고 처리량 및/또는 자동화 된 방법 및 시스템에 적합한 균류 종의 특정 돌연변이체가 사용된다. 이런 돌연변이체의 예는 매우 잘 원형질인 균주; 주로 또는 더욱 바람직하게는, 단일 핵을 갖는 원형질체만을 생산하는 균주; 미세적정 플레이트에서 효율적으로 재생하는 균주, 빠르게 재생하는 균주 및/또는 폴리뉴클레오타이드(예를 들어, DNA) 분자를 효율적으로 흡수하는 균주, 단일 클론의 분리를 방지하고 및/또는 배양액의 점도를 증가시키도록 복잡하게 되지 않는 배양액에서 균사를 생산하는 세포와 같은 저점도의 배양액을 생산하는 균주, 무작위 통합(예를 들어, 무능력하게된 비 상동성 말단 결합 경로) 또는 이들의 조합을 감소시킨 균주일 수 있다.

또 다른 실시태양에서, 본 발명에 제공된 방법 및 시스템에서 사용하기 위한 특정 돌연변이체 균주는 예를 들어, 우리딘-요구 돌연변이체 균주와 같은 선별가능한 마커 유전자가 없는 균주일 수 있다. 이들 돌연변이체 균주는 각각 pyrG 또는 pyrE 유전자에 의해 코딩되는 오로티딘 5 포스페이트 디카르복실라제(OMPD) 또는 오로테이트 p-리보실 트랜스퍼라제(OPRT)에서 결핍될 수 있다(T. Goosen et al., Curr Genet. 1987, 11 : 499 503 J. Begueret et al, Gene., 1984, 32: 487 92).

한 실시태양에서, 본 발명에 제공된 방법 및 시스템에서 사용하기 위한 특정 돌연변이체 균주는 보다 짧은 균사 및 보다 효모 유사 외관을 특징으로 하는 소형 세포 형태를 갖는 균주이다.

적합한 효모 숙주 세포는 칸디다(Candida), 한세누라(Hansenula), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces,), 피키아(Pichia), 클루베로마이세스(Kluyveromyces) 및 야로비아(Yarrowia)를 포함하나 이에 제한되지 않는다. 일부 실시태양에서, 효모 세포는 한세누라 폴리모르파(Hansenula polymorpha), 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 사카로마이세스 칼스베르젠시스(Saccaromyces carlsbergensis), 사카로마이세스 다이아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris), 피치아 핀란디카(Pichia finlandica), 피치아 트레할로필라(Pichia trehalophila), 피치아 코다매(Pichia kodamae), 피치아 멤브라네파시엔스(Pichia membranaefaciens), 피치아 오프니티애(Pichia opuntiae), 피치아 써모톨레란스(Pichia thermotolerans), 피치아 살릭타리아(Pichia salictaria), 피치아 쿠에르쿰(Pichia quercuum), 피치아 피제페리(Pichia pijperi), 피치아 스티피티스(Pichia stipitis), 피치아 메타놀리카(Pichia methanolica), 피치아 안구스타(Pichia angusta), 클루이베로마이세스 락티스(Kluyveromyces lactis), 칸디다 일비칸스(Candida albicans), 또는 야로비아 리폴리티카(Yarrowia lipolytica)를 포함하나 이에 제한되지 않는다.

특정 실시태양에서, 숙주 세포는 클라미도모나스(Chlamydomonas)(예를 들어, C. 레인하르티(C. Reinhardtii)) 및 포름디움(Phormidium)과 같은 조류 세포 (P. sp. ATCC29409)이다.

다른 실시태양에서, 숙주 세포는 원핵생물 세포이다. 적합한 원핵생물 세포는 그람 양성, 그람 음성 및 그람 가변 박테리아 세포를 포함한다. 상기 숙주 세포는 아그로박테리움(Agrobacterium), 알리시로바실러스(Alicyclobacillus), 아나베아나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부케네라(Buchnera), 캠프스트리스(Campestris), 캠필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로콕쿠스(Coprococcus), 에스체리치아(Escherichia), 엔테로콕쿠스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실루스(Geobacillus), 해모필루스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실루스(Lactobacillus), 락토콕커스(Lactococcus), 일로박터(Ilyobacter), 마이크로콕쿠스(Micrococcus), 마이크로박테리움(Microbacterium), 메소르히조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판도에아(Pantoea), 수도모나스(Pseudomonas), 프로클로로콕쿠스(Prochlorococcus), 로도박터(Rhodobacter), 로도수도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴룸(Rhodospirillum), 로도콕쿠스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토콕쿠스(Streptococcus), 시네콕쿠스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로콕쿠스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네코콕쿠스(Thermosynechococcus), 써모콕쿠스(Thermococcus), 우레아플라즈마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 예르시니아(Yersinia) 및 지모모나스(Zymomonas)의 종일 수 있으나 이에 제한되지 않는다. 일부 실시태양에서, 숙주 세포는 코리네박테리움 글루타미쿰이다.

일부 실시태양에서, 박테리아 숙주 균주는 산업용 균주이다. 수많은 박테리아 산업용 균주가 알려져 있고 본 발명에 기술된 방법 및 조성물에 적합하다.

일부 실시태양에서, 박테리아 숙주 세포는 아그로박테리움 종(예를 들어, A. radiobacter, A. rhizogenes, A. rubi), 아테로박터 종(예를 들어, A. aurescens, A. citreus, A. globformis, A. hydrocarboglutamicus, A. mysorens, A. nicotianae, A. paraffineus, A. protophonniae, A. roseoparaffinus, A. sulfureus, A. ureafaciens), 바실루스 종(예를 들어, B. thuringiensis, B. anthracis, B. megaterium, B. subtilis, B. lentus, B. circulars, B. pumilus, B. lautus, B. coagulans, B. brevis, B. firmus, B. alkaophius, B. licheniformis, B. clausii, B. stearothermophilus, B. halodurans 및　B. amyloliquefaciens)이다. 특정 실시태양에서, 숙주 세포는 B. 서브틸리스, B. 푸밀루스, B. 리체니포르미스, B. 메가테륨, B. 클라우실, B. 스테아로써모필루스, 및B. 아밀로리퀴에파시엔스를 포함하나 이에 제한되지 않는 산업용 바실루스일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 클로스트리디움 종(예를 들어, C. acetobutylicum, C. tetani　E88,　C. lituseburense, C. saccharobutylicum, C. perfringens, C. beijerinckii)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 코리네박테리움 종(예를 들어, C. glutamicum, C. acetoacidophilum)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 에스체리아치아 종(예를 들어, E. coli)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 에르위니아 종(예를 들어, E. uredovora, E. carotovora, E. ananas, E. herbicola, E. punctata, E. terreus)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 판토에아 종(예를 들어, P. citrea, P. agglomerans)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 수도모나스 종(예를 들어, P. putida, P. aeruginosa, P. mevalonii)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 스트렙토콕쿠스 종(예를 들어, S. ambofaciens, S. achromogenes, S. avermitilis, S. coelicolor, S. aureofaciens, S. aureus, S. fungicidicus, S. griseus, S. lividans)일 것이다. 일부 실시태양에서, 숙주 세포는 자이모모나스 종(예를 들어, Z. mobilis, Z. lipolytica) 등일 것이다.

본 발명은 또한 포유류 세포, 예를 들어 인간(293, WI38, PER.C6 및 보우즈 (Bowes) 흑색종 세포를 포함), 생쥐(3T3, NS0, NS1, Sp2/0을 포함), 햄스터(CHO, BHK), 원숭이(COS, FRhL, Vero) 및 하이브리도마 세포주를 포함하는 다양한 동물 세포 유형과 함께 사용하기에 적합하다.

다양한 실시태양에서, 원핵생물 및 진핵생물 균주 모두를 포함하는 본 발명의 실시에 사용될 수 있는 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)와 같은 여러 배양 컬렉션으로부터 대중에게 쉽게 접근될 수 있다.

일부 실시태양에서, 본 발명의 방법은 다세포 유기체에도 적용 가능하다. 예를 들어, 플랫폼은 작물의 성능을 개량시키는데 사용될 수 있다. 유기체는 그라미니애(Gramineae), 페투코이데애(Fetucoideae), 포아코이데애(Poacoideae), 아그로스티스(Agrostis), 필레움(Phleum), 닥틸리스(Dactylis), 소르검(Sorgum), 세타리아(Setaria), 제아(Zea), 오리자(Oryza), 트라이티쿰(Triticum), 세칼레(Secale), 아베나(Avena), 호르데움(Hordeum), 삭카룸(Saccharum), 포아(Poa), 페스투카(Festuca), 스테노타프룸(Stenotaphrum), 사이노돈(Cynodon), 코익스(Coix), 올리레애(Olyreae), 파레애(Phareae), 콤포시태(Compositae) 또는 레구미노새(Leguminosae)와 같은 복수의 식물을 포함할 수 있다. 예를 들어, 식물은 옥수수, 쌀, 콩, 면화, 밀, 호밀, 귀리, 보리, 완두콩, 콩, 렌즈콩, 땅콩, 참마콩, 동부, 벨벳콩, 클로버, 알팔파, 자주개자리, 루핀, 살갈퀴, 등나무, 완두콩, 사탕수수, 수수, 해바라기, 카놀라 등일 수 있다. 마찬가지로, 유기체는 비-인간 포유류, 어류, 곤충 등과 같은 복수의 동물을 포함할 수 있다.

유전 디자인 및 HTP 미생물 공학 플랫폼에서 활용을 위한 유전자 다양성 풀 생성

일부 실시태양에 있어서, 본 발명의 방법은 유전자 디자인으로서 특징화된다. 본 발명에 사용된 용어 유전자 디자인은 새로운 우수한 숙주 세포를 디자인하고 생성하기 위해 특정 유전자, 유전자의 일부, 프로모터, 종결 코돈, 5'UTR, 3'UTR 또는 다른 DNA 서열의 가장 최적의 변이체의 확인 및 선택을 통한 숙주 유기체 게놈의 재구성 또는 변형을 의미한다.

일부 실시태양에서, 본 발명의 유전자 디자인 방법의 제 1 단계는 새로운 숙주 게놈이 재구성될 수 있는 복수의 서열 변형을 갖는 초기 유전자 다양성 풀 집단을 얻는 것이다.

일부 실시태양에서, 본 발명에 교시된 유전자 디자인 방법의 후속 단계는 상기한 HTP 분자 도구 세트(예를 들어, SNP 스와핑 또는 프로모터 스와핑 또는 트랜스포존 돌연변이유발)의 하나 이상을 사용하여 HTP 유전자 디자인 라이브러리를 구축한 다음, 숙주 세포에서의 테스트를 위한 특정 게놈 변형의 라이브러리를 제공함으로써 게놈 공학 과정의 동인으로서 작용하는 것이다.

현존하는 야생형 균주로부터의 다양성 풀 사용하기

일부 실시태양에서, 본 발명은 소정의 야생형 집단의 미생물 중에서 존재하는 서열 다양성을 확인하는 방법을 교시한다. 따라서, 다양성 풀은 분석을 위해 사용된 소정의 수 n개의 야생형 미생물일 수 있으며, 상기 미생물의 게놈은 "다양성 풀"을 나타낸다.

일부 실시태양에서, 다양성 풀은 상기 야생형 미생물 중 자연적 유전자 변이에 존재하는 현존하는 다양성의 결과일 수 있다. 이 변이는 소정의 숙주 세포의 균주 변이체로부터 얻을 수 있고 미생물이 완전히 다른 종인 결과일 수도 있다. 유전자 변이는 자연 발생 여부와 상관없이 균주의 유전자 서열에서 어떠한 차이도 포함할 수 있다. 일부 실시태양에서, 유전자 변이는 다른 것들 중에서 SNP 스왑, PRO 스왑, 개시/정지 코돈 스왑 또는 STOP 스왑을 포함할 수 있다.

현존하는 산업용 균주 변이체로부터의 다양성 풀 사용하기

본 발명의 다른 실시태양에서, 다양성 풀은 전통적인 균주 개량 과정 동안 생성된 균주 변이체(예를 들어, 무작위 돌연변이를 통해 생성되고 수년 동안 개량된 수율을 위해 선택된 하나 이상의 숙주 유기체 균주)이다. 따라서, 일부 실시태양에서, 다양성 풀 또는 숙주 유기체는 역사적 생산 균주의 집합을 포함할 수 있다.

다양성 풀은 특정 시점(S₁Gen₁)에서 "기준선" 유전자 서열을 갖는 본래의 부모 균주(S₁) 및 상기 S₁ 균주로부터 유도/성장되고 S₁의 기준선 게놈과 관련하여 다른 게놈(S_2- _n Gen_2- _n )을 갖는 임의의 수의 후속 자손 균주(S_2- _n 로 일반화될 수 있는 S₂, S₃, S₄, S₅, 등)일 수 있다.

다양성 풀 내의 모든 SNPS가 확인되면, 본 발명은 개별적으로 및/또는 그룹으로 SNP의 효과(예를 들어, 관심 표현형의 생성)를 묘사(즉, 정량화 및 특성화)하기 위한 SNP 스와핑 및 선별 방법을 교시한다. 따라서, 상기한 바와 같이, 교시된 플랫폼에서의 초기 단계는 복수의 서열 변이체, 예를 들어 SNP를 가진 초기 유전자 다양성 풀 집단을 얻는 것을 수 있다. 그런 후에, 교시된 플랫폼의 후속 단계는 상기한 HTP 분자 도구 세트(예를 들어, SNP 스와핑 또는 프로모터 스와핑)의 하나 이상을 사용하여 HTP 유전자 디자인 라이브러리를 구축한 다음, 숙주 세포에서의 시험을위한 특정 게놈 변형의 라이브러리를 제공함으로써 게놈 공학 과정의 동인으로서 작용하는 것이다.

일부 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2-n Gen _2-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 표준 균주(S₁Gen₁) 또는 야생형 균주에 도입하는 단계를 포함한다.

다른 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2-n Gen _2-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 제거하는 단계를 포함한다.

돌연변이유발을 통해 다양성 풀 만들기

일부 실시태양에서, 세포의 소정의 다양성 집단에서 관심 돌연변이는 돌연변이유발 화학물질 또는 방사선을 포함하는 돌연변이 균주를 위한 임의의 수단에 의해 인위적으로 생성될 수 있다. 용어 "돌연변이유발"은 본 발명에서 세포질 핵산 물질에서 하나 이상의 유전자 변형을 유도하는 방법을 의미하기 위해 사용된다.

용어 "유전자 변형"은 DNA의 임의의 변경을 말한다. 대표적인 유전자 변형은 뉴클레오타이드 삽입, 결실, 치환 및 이들의 조합을 포함하며, 단일 염기만큼 작거나 수만 염기만큼 클 수 있다. 따라서, 용어 "유전자 변형"은 뉴클레오타이드 서열의 역전 및 염색체의 영역을 포함하는 DNA의 위치 또는 배향이 변경되는 다른 염색체 재배열을 포함한다. 염색체 재배열은 염색체 내 재배치 또는 염색체 간 재배치를 포함할 수 있다.

한 실시태양에서, 현재 청구된 주제에 사용된 돌연변이유발 방법은 실질적으로 무작위라서 유전자 돌연변이가 돌연변이유발될 핵산 물질 내의 임의의 이용 가능한 뉴클레오타이드 위치에서 발생할 수 있다. 달리 말하면, 한 실시태양에서, 돌연변이유발은 특정 뉴클레오타이드 서열에서 발생의 우선성성 또는 증가 빈도를 나타내지 않는다.

본 발명의 방법은 자외선, X-레이 방사선, 감마선 방사선, N-에틸-N-나이트로소우레아(ENU), 메틸나이트로우레아(MNU), 프로카바진(PRC), 트라이에틸렌 멜라민(TMS), 아크릴아마이드 모노머(AA), 클로람부실(CHL), 멜팔란(MLP), 사이클로포스파미드(CPP), 다이에틸 설페이트(DES), 에틸 메테인 설포네이트(EMS), 메틸 메테인 설포네이트(MMS), 6-머캡토퓨린(6-MP), 마이토마이신-C(MMC), N-메틸-N'-나이트로-N-나이트로소구아니딘(MNNG), 3H₂O 및 우레탄(UR)(예를 들어, Rinchik, 1991; Marker et al., 1997; and Russell, 1990 참조). 추가적인 돌연변이유발 인자는 http://www.iephb.nw.ru/~spirov/hazard/mutagen_lst.html에 기재된 것을 포함하여 당업자에게 주지되어 있다.

용어 "돌연변이유발"은 또한 세포 기능을 변경(예를 들어, 표적화된 돌연변이에 의해) 또는 세포 기능을 조절하여 돌연변이유발의 속도, 품질 또는 범위를 향상시키는 방법을 포함한다. 예를 들어, 세포는 DNA 수리, 돌연변이원 대사, 돌연변이원 감수성, 게놈 안정성 또는 이들의 조합에서 기능장애 또는 결핍이 되도록 변형되거나 조절될 수 있다. 따라서 정상적으로 게놈 안정성을 유지하는 유전자 기능의 파괴는 돌연변이유발을 향상시키는데 사용될 수 있다. 파괴의 대표 표적은 DNA 리가아제 I(Bentley et al, 2002) 및 카제인 키나아제 I(미국 특허 제6,060,296 호)를 포함하나 이에 제한되지 않는다.

일부 실시태양에서, 부위-특이적 돌연변이유발(예를 들어, 변형기 부위 유도 돌연변이유발 키트(Clontech)와 같은 상업적으로 구입할 수 있는 키트를 사용한 프라이머-유도 돌연변이유발)를 사용하여 핵산 서열 전체에 걸쳐 순서대로 다수의 변화를 일으킨다 본 발명의 절단 효소를 코딩하는 핵산을 생성한다.

하나 이상의 돌연변이유발 인자에 노출시 유전자 돌연변이의 빈도는 치료의 투여량 및/또는 반복을 변화시킴으로써 조절될 수 있으며, 특정 용도에 맞게 조절될 수 있다.

따라서, 일부 실시태양에서, 본 발명에 사용된 "돌연변이유발"은 본 발명에 기술된 기술의 임의의 것에 의한 오류 경향성 PCR 돌연변이유발, 올리고뉴클레오타이드 유도 돌연변이유발, 부위 유발성 돌연변이유발 및 반복적인 서열 재조합을 포함하는 돌연변이를 유도하기 기술 분야에 공지된 모든 기술을 포함한다.

다양성을 생성하기 위한 단일 유전자좌 돌연변이

일부 실시태양에서, 본 발명은 게놈 DNA의 선택된 부분을 도입, 결실 또는 치환함으로써 세포 집단을 돌연변이하는 것을 교시한다. 따라서, 일부 실시태양에서, 본 발명은 돌연변이를 특정 유전자좌에 대한 돌연변이를 표적화하는 방법을 교시한다. 다른 실시태양에서, 본 발명은 표적 DNA 영역을 선택적으로 편집하기 위해 ZFNs, TALENS 또는 CRISPR과 같은 유전자 편집 기술의 사용을 교시한다.

다른 실시태양에서, 본 발명은 숙주 유기체의 외부에서 선택된 DNA 영역을 돌연변이시킨 다음 돌연변이된 서열을 숙주로 유기체 속에 역삽입하는 것을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 다양한 발현 성질을 갖는 다양한 프로모터 변이체를 생성하기 위해 천연 또는 합성 프로모터를 돌연변이하는 것을 교시한다(이하 프로모터 래더 참조). 다른 실시태양에서, 본 발명은 ProSAR(Fox et al, 2007. 본 발명에 참조로 포함된 "Improving catalytic function by ProSAR-driven enzyme evolution." Nature Biotechnology Vol 25 (3) 338-343)와 같은 단일 유전자 최적화 기술과 양립된다.

일부 실시태양에서, DNA의 선택된 영역은 천연 변이체의 유전자 셔플링 또는 합성 올리고체, 플라스미드-플라스미드 재조합, 바이러스 플라스미드 재조합, 바이러스-바이러스 재조합에 의한 셔플링을 통해 시험관 내에서 생성된다. 다른 실시태양에서, 게놈 영역은 에러-유발PCR(error-prone PCR)(예를 들어, 도 1 참조)을 통해 생성된다.

일부 실시태양에서, 선택된 유전자 영역에서의 돌연변이 생성은 "재조립 PCR"에 의해 달성된다. 간략하게, 올리고뉴클레오타이드 프라이머 (올리고)는 관심 핵산 서열의 단편의 PCR 증폭을 위해 합성되어, 올리고뉴클레오타이드의 서열은 두 단편의 교차점과 겹쳐진다. 겹쳐진 영역은 전형적으로 약 10 내지 100개 뉴클레오타이드 길이이다. 단편의 각각은 이런 프라이머 세트로 증폭된다. 그런 다음 PCR 제품은 재조립 프로토콜에 따라 "재조립"된다. 요약하면, 어셈블리 프로토콜에서, PCR 생성물은 먼저, 예를 들어, 겔 전기영동 또는 크기 배제 크로마토그래피에 의해 프라이머로부터 정제된다. 정제된 생성물은 함께 혼합되고 추가 프라이머가 없이 중합 효소 및 데옥시뉴클레오시드 트라이포스페이트(dNTP's) 및 적절한 버퍼 염의 존재하에서 약 1-10 사이클의 변성, 재어닐링 및 확장이 실시된다("셀프-프라이밍"). 유전자에 인접한 프라이머로 후속 PCR이 사용되어 완전히 재조합되고 뒤섞인 유전자의 수율을 증폭시킨다.

본 발명의 일부 실시태양에서, 위에서 논의한 것과 같은 돌연변이된 DNA 영역이 돌연변이체 서열에 대해 농축되어 다중 돌연변이체 스펙트럼, 즉 돌연변이의 가능한 조합이 보다 효율적으로 표본추출된다. 일부 실시태양에서, 돌연변이된 서열은 재조립 반응 이전에 시험관 내에서 친화성-정제 물질을 증폭시키는 바람직한 단계 의해 mutS 단백질 친화성 매트릭스를 통해 확인된다(Wagner et al., Nucleic Acids Res. 23(19):3944-3948 (1995); Su et al., Proc. Natl. Acad. Sci. (U.S.A.), 83:5057-5061(1986)). 이 증폭된 물질은 이후 본 발명의 후반부에서 설명하는 바와 같이 조립 또는 재조립 PCR 반응에 투입된다.

프로모터 래더

프로모터는 유전자가 전사되는 속도를 조절하고 다양한 방식으로 전사에 영향을 미칠 수 있다. 예를 들어, 구조성 프로모터는 내부 또는 외부 세포 조건에 관계없이 일정한 비율로 관련 유전자의 전사를 지시하지만, 조절 가능한 프로모터는 내부 및/또는 외부 세포, 예를 들어, 성장 속도, 온도, 특정 환경 화학물질에 대한 반응 등에 따라 유전자가 전사되는 속도를 증가 또는 감소시킨다. 프로모터는 정상적인 세포 컨텍스트로부터 격리될 수 있으며 사실상 모든 유전자의 발현을 조절하도록 조작되어 세포 성장, 생산 수율 및/또는 기타 관심 표현형의 효과적인 변형을 가능하게 한다.

일부 실시태양에서, 본 발명은 하류 유전자 디자인 방법에서 사용하기 위한 프로모터 래더 라이브러리를 생산하는 방법을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 하나 이상의 프로모터를 확인하고 및/또는 다양한 발현 강도 또는 우수한 조절 특성을 나타내는 숙주 세포 내 하나 이상의 프로모터의 변이체를 생성하는 방법을 교시한다. 이들 확인된 및/또는 생성된 프로모터의 특정 조합은 프로모터 래더로서 함께 그룹화될 수 있으며, 이는 보다 상세히 후술된다.

일부 실시태양에서, 본 발명은 프로모터 래더의 사용을 교시한다. 일부 실시태양에서, 본 발명의 프로모터 래더는 연속 범위의 발현 프로파일을 나타내는 프로모터를 포함한다. 예를 들어, 일부 실시태양에서, 프로모터 래더는 자극, 또는 구성성 발현을 통해 다양한 발현 강도를 나타내는 자연, 고유 또는 야생형 프로모터를 확인함으로써 생성된다(예를 들어, 도 12 및 도 17-19). 이러한 확인된 프로모터는 프로모터 래더로서 함께 그룹화될 수 있다.

다른 실시태양에서, 본 발명은 상이한 조건에 걸쳐 다양한 발현 프로파일을 나타내는 프로모터 래더의 생성을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 발효의 상이한 단계에 전체에서 퍼진 발현 피크를 갖는 프로모터의 래더를 생성하는 것을 교시한다(예를 들어, 도 17 참조). 다른 실시태양에서, 본 발명은 특정 자극에 반응하여 상이한 발현 피크 동역학을 갖는 프로모터의 래더를 생성하는 것을 교시한다(도 18 참조). 당업자는 본 개시의 조절 프로모터 래더가 임의의 하나 이상의 조절 프로파일을 나타낼 수 있다는 것을 인식할 것이다.

일부 실시태양에서, 본 발명의 프로모터 래더는 연속적인 범위의 반응에 걸쳐 예측 가능한 방식으로 유전자 발현을 교란시키도록 디자인되었다. 일부 실시태양에서, 프로모터 래더의 연속 특성은 균주 개량 프로그램에 추가의 예측력을 제공한다. 예를 들어, 일부 실시태양에서, 선택된 대사 경로의 스와핑 프로모터 또는 종결 서열은 가장 최적의 발현 비율 또는 프로파일을 확인하는 숙주 세포 성능 곡선을 생성할 수 있다; 부적절한 환경에서 불필요한 과발현이나 잘못된 발현을 피하면서 표적 유전자가 더 이상 특정 반응이나 유전자 캐스케이드에 대한 제한 요소가 되지 않는 균주를 생산한다. 일부 실시태양에서, 프로모터 래더는 원하는 프로파일을 나타내는 자연, 고유 또는 야생형 프로모터를 확인함으로써 생성된다. 다른 실시태양에서, 프로모터 래더는 자연 발생 프로모터를 돌연변이시켜 다수의 돌연변이 프로모터 서열을 유도함으로써 생성된다. 이들 돌연변이된 프로모터의 각각은 표적 유전자 발현에 대한 효과에 대해 시험된다. 일부 실시태양에서, 편집된 프로모터는 다양한 조건에 걸쳐 발현 활성에 대해 시험되어 각 프로모터 변이체의 활성이 문서화/특징화/주석처리되고 데이터베이스에 저장된다. 생성된 편집된 프로모터 변이체는 뒤이어 그 발현의 강도에 기초하여 배열된 프로모터 래더로 조직화된다(예를 들어, 상부 근처의 고도로 발현된 변이체 및 하부 근처의 약화된 발현에 의해, 따라서 "래더"라는 용어를 유도한다).

일부 실시태양에서, 본 발명은 확인된 자연 발생 프로모터 및 돌연변이된 변이체 프로모터의 조합인 프로모터 래더를 교시한다.

일부 실시태양에서, 본 발명은 하기 기준을 모두 만족하는: 1) 구조성 프로모터의 래더를 나타내며; 2) 이상적으로 100개 염기쌍 미만의 짧은 DNA 서열에 의해 암호화될 수 있는 자연, 고유 또는 야생형 프로모터를 확인하는 방법을 교시한다. 일부 실시태양에서, 본 발명의 구조성 프로모터는 2개의 선택된 성장 조건 (전형적으로, 산업용 재배 동안 경험된 조건들 간에 비교됨)에 걸쳐 일정한 유전자 발현을 나타낸다. 일부 실시태양에서, 본 발명의 프로모터는 ~60 염기쌍 코어 프로모터 및 26-40 염기쌍 길이의 5' UTR로 구성될 것이다.

일부 실시태양에서, 상기 확인된 자연 발생 프로모터 서열 중 하나 이상이 유전자 편집을 위해 선택된다. 일부 실시태양에서, 자연 프로모터는 상기 임의의 돌연변이 방법을 통해 편집된다. 다른 실시태양에서, 본 발명의 프로모터는 원하는 서열을 갖는 새로운 프로모터 변이체를 합성함으로써 편집된다.

2015년 12월 07일에 출원된 미국 특허 출원 제 62/264,232호의 전체 개시 내용은 모든 목적을 위해 그 전문이 본 발명에 참고로 포함된다

본 발명의 프로모터의 비 제한적인 리스트가 하기 표 1에 제공된다. 프로모터 서열의 각각은 이종 프로모터 또는 이종 프로 프로모터 뉴클레오타이드로 불릴 수 있다.

본 발명의 선택된 프로모터 서열

SEQ ID No.	프로모터 짧은 명칭	프로모터 명칭
1	P1	Pcg0007_lib_39
2	P2	Pcg0007
3	P3	Pcg1860
4	P4	Pcg0755
5	P5	Pcg0007_265
6	P6	Pcg3381
7	P7	Pcg0007_119
8	P8	Pcg3121

일부 실시태양에서, 본 발명의 프로모터는 상기 표 1로부터의 프로모터와 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 또는 75% 서열 동일성을 나타낸다.

터미네이터 래더

일부 실시태양에서, 본 발명은 3' 위치에서 하나 이상의 전사 종결 서열을 RNA 암호화 요소의 말단에 제공함으로써 유전적으로 조작된 숙주 균주를 개량시키는 방법을 교시한다. 일부 실시태양에서, 본 발명은 종결 서열의 첨가가 유전적으로 조작된 숙주에서 선택된 유전자의 RNA 전사 효율을 개선시킨다는 것을 교시한다. 다른 실시태양에서, 본 발명은 종결 서열의 첨가가 유전적으로 조작된 숙주에서 선택된 유전자의 RNA 전사 효율을 감소시킨다는 것을 교시한다. 따라서, 일부 실시태양에서, 본 발명의 터미네이터 래더는 다양한 전사 효율을 나타내는 터미네이터 서열(예를 들어, 하나의 약한 터미네이터, 하나의 평균 터미네이터 및 하나의 강한 프로모터)을 나타내는 일련의 터미네이터 서열을 포함한다.

전사 종결 서열은 임의의 뉴클레오타이드 서열일 수 있으며, 이는 임의의 뉴클레오타이드 서열일 수 있으며, 이는 오픈 리딩 프레임을 암호화하는 뉴클레오타이드 서열의 전사 하류에 위치될 때, 오픈 리딩 프레임의 전사 종료를 일으킨다. 이런 서열은 당업계에 공지되어 있으며 원핵생물, 진핵생물 또는 파지 기원일 수 있다. 터미네이터 서열의 예로는 PTH-터미네이터, pET-T7 터미네이터, T3-Tφ 터미네이터, pBR322-P4 터미네이터, 수포성 스트라마티스 바이러스 터미네이터, rrnB-T1 터미네이터, rrnC 터미네이터, TTadc 전사 터미네이터 및 Matα(α 인자) 전사 터미네이터, 고유 α-인자 전사 종결 서열, ADR1 전사 종결 서열, ADH2 전사 종결 서열 및 GAPD 전사 종결 서열과 같은 효모-인식 종결 서열을 포함하나 이에 제한되지 않는다. 전사 종결 서열의 포괄적인 목록은 http://partsregistry.org/Terminators/Catalog에서 구입할 수 있는 iGEM 레지스트리에서 발견될 수 있다.

일부 실시태양에서, 전사 종결 서열은 폴리머라제-특이적이거나 비특이적일 수 있지만, 본 실시태양에서 사용하기 위해 선택된 전사 터미네이터는 선택된 프로모터와 '기능적 조합'을 형성해야 하는데, 이는 터미네이터 서열이 프로모터에서 개시되는 RNA 폴리머라제의 유형에 의한 전사를 종결시킬 수 있어야 한다는 것을 의미한다. 예를 들어, 일부 실시태양에서, 본 발명은 진핵생물 RNA pol II 프로모터 및 진핵생물 RNA pol II 터미네이터, T7 프로모터 및 T7 터미네이터, T3 프로모터 및 T3 터미네이터, 효모- 인식 프로모터 및 효모-인식 종결 서열 등은 일반적으로 기능적 조합을 형성할 것임을 교시한다. 사용된 전사 종결 서열의 상동성은 또한 전사가 소정의 프로모터로부터 종결되는 효율에 기초하여 선택될 수 있다. 예를 들어, 이종성 전사 터미네이터 서열은 RNA 암호화 요소의 전사 하류에 제공되어 소정의 프로모터로부터 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 종결 효율을 달성할 수 있다.

일부 실시태양에서, 조작된 발현 구조체로부터의 RNA 전사 효율은 3' 위치에 2개 이상의 헤어핀을 포함하는 2차 구조를 형성하는 핵산 서열을 RNA 암호화 요소의 말단에 제공함으로써 개선될 수 있다. 특정 이론에 얽매이기를 원하지 않으며, 2차 구조는 전사 신장 복합체를 불안정화시키고 폴리머라제가 DNA 주형으로부터 분리되게 하여, 비 기능성 서열의 비생산적인 전사를 최소화하고 목적하는 RNA의 전사를 증가시킨다. 따라서, 2개 이상의 인접한 헤어핀을 포함하는 2차 구조를 형성하는 종료 서열이 제공될 수 있다. 일반적으로, 헤어핀은 자체가 접혀서 암이 단일 가닥 루프에 의해 연결되는 쌍을 이루는 스템 영역을 형성할 수 있는 회문식 뉴클레오타이드 서열에 의해 형성될 수 있다. 일부 실시태양에서, 종결 서열은 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 인접한 헤어핀을 포함한다. 일부 실시태양에서, 인접한 헤어핀은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 쌍을 이루지 않는 뉴클레오타이드에 의해 분리된다. 일부 실시태양에서, 헤어핀 스템은 길이가 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 염기쌍 길이를 포함한다. 특정 실시태양에서, 헤어핀 스템은 12 내지 30개 염기쌍 길이이다. 특정 실시태양에서, 종결 서열은 약 9 내지 25개 염기쌍을 포함하는 스템 영역을 갖는 둘 이상의 중간 크기의 헤어핀을 포함한다. 일부 실시태양에서, 헤어핀은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오타이드의 루프 형성 영역을 포함한다. 일부 실시태양에서, 루프 형성 영역은 4-8개 뉴클레오타이드를 포함한다. 특정 이론에 얽매이기를 원하지 않으며, 2차 구조의 안정성은 종단 효율과 관련될 수 있다. 헤어핀의 안정성은 길이, 불일치(mismatches) 또는 이를 함유하는 돌출(bulges)의 수 및 쌍을 이루는 영역의 염기 구성에 의해 결정된다. 구아닌과 시토신 사이의 결합은 3개의 수소 결합을 가지며 2개만 있는 아데닌-티민 결합에 비해 더 안정하다. 헤어핀 형성 회문식 뉴클레오타이드 서열의 G/C 함량은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 이상일 수 있다. 일부 실시태양에서, 헤어핀 형성 회문식 뉴클레오타이드 서열의 G/C 함량은 적어도 80%이다. 일부 실시태양에서, 종결 서열은 원핵생물, 진핵생물 또는 파지 기원의 하나 이상의 전사 종결 서열로부터 유도된다. 일부 실시태양에서, 일련의 4, 5, 6, 7, 8, 9, 10개 이상의 아데닌(A)을 암호화하는 뉴클레오타이드 서열은 종결 서열에 대해 3'에 제공된다.

일부 실시태양에서, 본 발명은 일련의 탠덤 종결 서열의 사용을 교시한다. 일부 실시태양에서, 일련의 2, 3, 4, 5, 6, 7개 이상의 첫 번째 전사 터미네이터 서열은 dsRNA 암호화 요소의 최종 뉴클레오타이드에 대해 직접 3' 또는 dsRNA 암호화 요소의 최종 뉴클레오타이드에 대해 적어도 1-5, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50, 50-100, 100-150, 150-200 , 200-300, 300-400, 400-500, 500-1,000개 이상의 뉴클레오타이드 3'의 거리에 놓일 수 있다. 탠덤 전사 터미네이터 서열 사이의 뉴클레오타이드의 수는 변할 수 있으며, 예를 들어, 전사 터미네이터 서열은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50개 이상의 뉴클레오타이드에 의해 분리될 수 있다. 일부 실시태양에서, 전사 터미네이터 서열은 구조 예측 알고리즘에 의해 결정된 바와 같이 이들의 예측된 2차 구조에 기초하여 선택될 수 있다. 구조 예측 프로그램은 당업계에 주지되어 있으며, 예를 들어, CLC 메인 워크벤치(Main Workbench)를 포함한다.

당업자는 본 발명의 방법이 임의의 종결 서열과 양립할 수 있음을 인식할 것이다. 일부 실시태양에서, 본 발명은 Pfeifer-Sancar et al. 2013. "Comprehensive analysis of the Corynebacterium glutamicum transcriptome using an improved RNAseq technique" Pfeifer-Sancar et al. BMC Genomics 2013, 14:888로부터 개시된 주석된 코리네박테리움 글루타미쿰 터미네이터의 사용을 교시한다. 다른 실시태양에서, 본 발명은 http://partsregistry.org/Terminators/Catalog에서 구입할 수 있는 iGEM 레지스트리에서 발견된 전사 종결 서열의 사용을 교한다. 본 발명의 전사 터미네이터 서열의 포괄적인 목록이 하기 표 1.1에 제공된다.

[표 1.1]

본 발명의 종결 서열의 포괄적인 목록.

가설-주도 다양성 풀과 언덕 오르기(Hill Climbing)

본 발명의 HTP 게놈 조작 방법은 숙주 세포 성능에서 상당한 이득을 달성하기 위해 사전 유전자 지식을 필요로 하지 않는다는 것을 교시한다. 실제로, 본 발명은 무작위 돌연변이유발 및 이미 존재하는 숙주 세포 변이체들 사이의 유전자 다양성의 확인(예를 들어, 야생형 숙주 세포와 산업 변이체 사이의 비교)을 포함하는 여러 기능적으로 불가지론적인 접근법을 통해 다양성 풀을 생성하는 방법을 교시한다.

그러나, 일부 실시태양에서, 본 발명은 또한 하류 HTP 조작에 사용될 유전자 다양성 돌연변이를 디자인하는 가설-주도적 방법을 교시한다. 즉, 일부 실시태양에서, 본 발명은 선택된 돌연변이의 지시된 디자인을 교시한다. 일부 실시태양에서, 지시된 돌연변이는 본 발명의 조작 라이브러리(예컨대, SNP 스왑, PRO 스왑 또는 STOP 스왑)에 포함된다.

일부 실시태양에서, 본 발명은 유전자 주석, 가설된(또는 확인된) 유전자 기능, 또는 게놈 내의 위치에 기초한 지시된 돌연변이의 생성을 교시한다. 본 발명의 다양성 풀은 숙주 세포의 성능이 증가된 문헌에 관련된 특정 대사 경로 또는 유전자 경로에 관여한다고 가설된 유전자의 돌연변이를 포함할 수 있다. 다른 실시태양에서, 본 발명의 다양성 풀은 또한 개량된 숙주 성능과 관련된 오페론에 존재하는 유전자에 대한 돌연변이를 포함할 수 있다. 또 다른 실시태양에서, 본 발명의 다양성 풀은 알고리즘 예측 기능 또는 다른 유전자 주석에 기초한 유전자에 대한 돌연변이를 포함할 수 있다.

일부 실시태양에서, 본 발명은 가설 주도 돌연변이의 표적을 우선순위화하기위한 "껍질"에 기초한 접근법을 교시한다. 표적 우선순위화를 위한 껍질 비유는 단지 소수의 1차 유전자가 숙주 세포의 성능(예를 들어, 단일 생체분자의 생산)의 특정 측면의 대부분을 담당한다는 가설에 기초한다. 이들 1차 유전자는 껍질의 코어에 위치되고, 제 2 층에서 2차 효과 유전자, 3차 껍질에서 3차 효과 및 ... 등이 이어진다. 예를 들어, 한 실시태양에서, 껍질의 코어는 선택된 대사 경로 내의 중요한 생합성 효소를 암호화하는 유전자를 포함할 수 있다. 제 2 껍질 상에 위치하는 유전자는 생성물 전환 또는 피드백 신호 전달을 담당하는 생합성 경로 내의 다른 효소를 암호화하는 유전자를 포함할 수 있다. 이러한 예시적인 은유하에서의 제 3층 유전자는 생합성 경로의 발현을 조절하거나 숙주 세포 내에서 일반적인 탄소 플럭스를 조절하는 조절 유전자를 포함할 것이다.

본 발명은 또한 모든 확인된 돌연변이로부터 성능 이득을 최적화하기 위한 "언덕 오르기(hill climb)" 방법을 교시한다. 일부 실시태양에서, 본 발명은 HTP 다양성 라이브러리에서 무작위, 자연 또는 가설-주도 돌연변이는 숙주 세포 성능과 관련된 유전자의 확인을 초래할 수 있음을 교시한다. 예를 들어, 본 방법은 유전자 암호화 서열 상에 또는 그 부근에 위치한 하나 이상의 유익한 SNP를 확인할 수 있다. 이 유전자는 숙주 세포 성능과 관련이 있을 수 있으며, 이의 확인은 유기체의 조합 유전자 돌연변이 공간에서 성능 "언덕"의 발견과 유사할 수 있다.

일부 실시태양에서, 본 발명은 SNP 돌연변이로 구현된 확인된 언덕 주변의 조합 공간을 탐색하는 방법을 교시한다. 즉, 일부 실시태양에서, 본 발명은 그 유전자 노드로부터 얻어진 성능 이득(즉, 언덕 오르기)을 최적화하기 위해 확인된 유전자 및 관련 조절 서열의 교란을 교시한다. 따라서, 본 발명의 방법에 따르면, 유전자는 무작위 돌연변이유발에서 유도된 다양성 라이브러리에서 먼저 확인될 수 있지만, 나중에 동일한 유전자 내 다른 서열의 지시된 돌연변이를 통해 균주 개량 프로그램에서 사용하기 위해 개량될 수 있다.

언덕 오르기의 개념은 또한 단일 유전자 서열을 둘러싸는 조합 공간의 탐색을 넘어 확장될 수 있다. 일부 실시태양에서, 특정 유전자의 돌연변이는 숙주 세포 성능에 대한 특정 대사 경로 또는 유전자 경로의 중요성을 나타낼 수 있다. 예를 들어, 일부 실시태양에서, 단일 RNA 분해 유전자에서 돌연변이가 현저한 숙주 성능 증가를 초래한다는 발견은 숙주 유기체로부터 추가적인 성능 이득을 추출하기 위한 수단으로서 관련 RNA 분해 유전자를 돌연변이시키는 기초로서 사용될 수 있다. 당업자는 지시된 유전자 디자인에 대한 상기 껍질 및 언덕 오르기 접근법의 변형을 인식할 것이다. 고 처리량 선별.

세포 배양 및 발효

본 발명의 세포는 임의의 바람직한 생합성 반응 또는 선택을 위해 적절하게 변형된 통상적인 영양 배지에서 배양될 수 있다. 일부 실시태양에서, 본 발명은 프로모터를 활성화시키기 위해 배지를 유도하는 배양을 교시한다. 일부 실시태양에서, 본 발명은 형질전환체(예를 들어, 항생제)의 선택 제제 또는 억제 조건(예를 들어, 높은 에탄올 조건)하에 성장하기에 적합한 유기체의 선택 제제를 포함하는 선택 제제를 갖는 배지를 교시한다. 일부 실시태양에서, 본 발명은 세포 성장을 위해 최적화된 배지에서 세포 배양물을 성장시키는 것을 교시한다. 다른 실시태양에서, 본 발명은 생산 수율에 최적화된 배지에서 세포 배양물을 성장시키는 것을 교시한다. 일부 실시태양에서, 본 발명은 세포 성장을 유도할 수 있는 배지에서 배양 물을 배양하는 것을 교시하며 최종 생성물 생산을 위한 필수 전구체(예를 들어, 에탄올 생산을 위한 높은 수준의 당)를 포함한다.

온도, pH 등과 같은 배양 조건은 발현을 위해 선택된 숙주 세포와 함께 사용하기에 적합한 것들이며, 당업자에게 명백할 것이다. 언급한 바와 같이, 박테리아, 식물, 동물(포유류 포함) 및 고세균 기원 세포를 포함하는 많은 세포의 배양 및 생산에 대한 많은 참고 자료가 이용될 수 있다. 예를 들어, Sambrook, Ausubel (all supra), as well as Berger, Guide to Molecular Cloning Techniques, Methods in Enzymology　volume 152 Academic Press, Inc., San Diego, CA; and　 Freshney (1994)　Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York and the references cited therein; Doyle and Griffiths (1997)　Mammalian Cell Culture: Essential Techniques　John Wiley and Sons, NY; Humason (1979) Animal Tissue Techniques, fourth edition W.H. Freeman and Company; and Ricciardelle et al., (1989)　In Vitro Cell Dev. Biol.　25:1016-1024, all of which are incorporated herein by reference. For plant cell culture and regeneration, Payne et al. (1992)　Plant Cell and Tissue Culture in Liquid Systems　John Wiley & Sons, Inc. New York, N.Y.; Gamborg and Phillips (eds) (1995)　Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg N.Y.); Jones, ed. (1984)　Plant Gene Transfer and Expression Protocols, Humana Press, Totowa, N.J. and　Plant Molecular Biology　(1993) R. R. D. Croy, Ed. Bios Scientific Publishers, Oxford, U.K. ISBN 0 12 198370 6 참조하고, 이의 전문은 참조로 본 발명에 포함된다. 일반적으로 세포 배양 배지는 Atlas and Parks (eds.)　The Handbook of Microbiological Media　(1993) CRC Press, Boca Raton, Fla에서 설명되며, 이는 참조로 본 발명에 포함된다. 세포 배양에 대한 추가 정보는 Life Science Research Cell Culture Catalogue　from Sigma-Aldrich, Inc (St Louis, Mo.) ("Sigma-LSRCCC") 및, 예를 들어,　The Plant Culture Catalogue　and supplement also from Sigma-Aldrich, Inc (St Louis, Mo.) ("Sigma-PCCS")와 같은 구입가능한 상업용 논문에서 발견되며, 이의 전부는 참조로 본 발명에 포함된다.

사용될 배양 배지는 적절한 방식으로 각각의 균주의 요구를 충족시켜야한다. 다양한 유기체에 대한 배양 배지에 대한 설명은 American Bacteriology Society (Washington D.C., USA, 1981)의 "General Bacteriology Methods for Manual"에 제공된다.

또한, 본 발명은 a) 적절한 배지에서 본 발명에 따른 미생물을 배양하여 발효액을 생성하는 단계; b) a)의 발효액 및/또는 미생물의 세포에 관심 생성물을 농축시키는 단계를 포함하여 관심 생성물의 발효성 제조를 위한 방법을 추가로 제공한다.

일부 실시태양에서, 본 발명은 생산된 미생물이 원하는 유기-화학적 화합물을 생산하기 위한, 예를 들어 WO 05/021772에 기술된 바와 같이 연속적으로 또는 배치 공정(배치 배양) 또는 페드 배치(fed-batch) 또는 반복된 페드 배치에서 불연속적으로 배양될 수 있음을 교시한다. 알려진 배양 방법에 관한 일반적인 내용은 Chmiel(Bioprozeβtechnik. 1: Einfuhrung in die Bioverfahrenstechnik (Gustav Fischer Verlag, Stuttgart, 1991))에 의한 교과서 또는 Storhas(Bioreaktoren and periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994))에 의한 교과서에서 이용할 수 있다.

일부 실시태양에서, 본 발명의 세포는 배치 또는 연속 발효 조건하에 성장된다.

고전적인 배치 발효는 폐쇄된 시스템이며, 배지의 조성물은 발효의 시작시에 설정되고 발효 동안 인공적인 변형을 겪지 않는다. 배치 시스템의 변형은 본 발명에서 사용되는 페드 배치 발효이다. 이 변형에서, 기질은 발효가 진행됨에 따라 증분으로 첨가된다. 페드 배치 시스템은 이화생성물 억제가 세포의 신진대사를 억제 할 가능성이 있고 배지에 제한된 양의 기질을 갖는 것이 바람직한 경우에 유용하다. 배치 및 페드 배치 발효는 일반적이고 당업계에 일반적으로 주지되어 있다.

연속 발효는 정의된 발효 배지가 생물 반응기에 연속적으로 첨가되고 동일한 양의 조건 배지가 관심의 목적하는 생체분자 생성물의 가공 및 수확을 위해 동시에 제거되는 시스템이다. 일부 실시태양에서, 연속 발효는 일반적으로 세포가 주로 대수기 성장하는 일정한 고밀도로 배양물을 유지시킨다. 일부 실시태양에서, 연속 발효는 일반적으로 정지기 또는 늦은 대수기/정지기 성장시에 배양물을 유지시킨다. 연속 발효 시스템은 정지기 성장 조건을 유지하기 위해 노력한다.

연속 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라 생성물 형성의 속도를 최대화하기 위한 기술은 산업용 미생물학 분야에 잘 알려져 있다.

예를 들어, 본 발명의 배양물에 대한 탄소원의 비 제한적인 목록은 당 및 수화물, 예를 들어 글루코오스, 수크로오스, 락토오스, 프룩토오스, 말토오스, 당밀, 사탕무 또는 사탕수수 가공에 의한 수크로오스-함유 용액, 전분, 전분 가수분해물 및 셀룰로오스; 오일 및 지방, 예를 들어, 대두유, 해바라기유, 땅콩유 및 코코넛 지방; 지방산, 예를 들어 팔미트산, 스테아르산 및 리놀레산; 알코올, 예를 들어 글리세롤, 메탄올 및 에탄올; 및 유기산, 예를 들어 아세트산 또는 젖산을 포함한다.

본 발명의 배양물을 위한 질소 공급원의 비 제한적인 목록은 펩톤, 효모 추출물, 고기 추출물, 맥아 추출물, 옥수수 침지액, 콩가루 및 우레아와 같은 유기 질소 함유 화합물; 또는 황산 암모늄, 염화 암모늄, 인산 암모늄, 탄산 암모늄 및 질산 암모늄과 같은 무기 화합물을 포함한다. 질소원은 개별적으로 또는 혼합물로서 사용될 수 있다.

본 발명의 배양물을 위한 가능한 인 공급원의 비 제한적인 목록은 인산, 인산 이수소 칼륨 또는 인산 수소 이칼륨 또는 상응하는 나트륨 함유 염을 포함한다.

배양 배지는 추가로 성장에 필수적인, 나트륨, 칼륨, 마그네슘, 칼슘 및 철과 같은 금속의 염화물 또는 황산염 형태의 염을 포함한다.

마지막으로, 아미노산, 예를 들어 호모 세린 및 비타민, 예를 들어 티아민, 바이오틴 또는 판토텐산과 같은 필수 성장 인자가 상기 언급된 물질에 추가로 사용될 수 있다.

일부 실시태양에서, 배양물의 pH는 수산화 나트륨, 수산화 칼륨, 암모니아 또는 수성 암모니아; 또는 인산 또는 황산과 같은 산성 화합물을 포함하나 이에 제한되지 않는 임의의 산 또는 염기, 또는 완충 염에 의해 적절한 방식으로 조절될 수 있다. 일부 실시태양에서, pH는 일반적으로 6.0 내지 8.5, 바람직하게는 6.5 내지 8의 값으로 조절된다.

일부 실시태양에서, 본 발명의 배양물은 소포제, 예를 들어 지방산 폴리글리콜 에스터를 포함할 수 있다. 일부 실시태양에서, 본 발명의 배양물은 예를 들어 항생제와 같은 적합한 선택 물질을 첨가함으로써 배양물의 플라스미드를 안정화시키도록 변형된다.

일부 실시태양에서, 배양은 호기성 조건하에 수행된다. 이러한 조건을 유지하기 위해, 예를 들어 공기와 같은 산소 또는 산소 함유 기체 혼합물이 배양물 내로 도입된다. 과산화수소가 풍부한 액체를 사용하는 것도 가능하다. 발효는, 적절한 경우에, 상승된 압력, 예를 들어 0.03 내지 0.2 MPa의 상승된 압력에서 수행된다. 배양의 온도는 통상 20℃ 내지 45℃, 바람직하게는 25℃ 내지 40℃, 특히 바람직하게는 30℃ 내지 37℃이다. 배치 또는 페드 배치 공정에서, 배양은 바람직하게는 회수하고자 하는 관심의 목적하는 생성물(예를 들어, 유기-화학적 화합물)의 양이 형성될 때까지 계속된다. 이 목표는 일반적으로 10시간 내지 160시간 이내에 달성될 수 있다. 연속 공정에서, 더 긴 배양 시간이 가능하다. 미생물의 활성은 발효 배지 및/또는 상기 미생물의 세포에서 관심 생성물의 농축(축적)을 초래한다.

일부 실시태양에서, 배양은 혐기성 조건하에 수행된다.

선별

일부 실시태양에서, 본 발명은 고 처리량 초기 선별을 교시한다. 다른 실시태양에서, 본 발명은 또한 성능 데이터의 견고한 탱크-기반 검증을 교시한다(도 4b 참조).

일부 실시태양에서, 고 처리량 선별 공정은 생물 반응기에서의 균주의 성능을 예측하도록 디자인된다. 상기한 바와 같이, 배양 조건은 생물체에 적합하고 생물 반응기 조건을 반영하도록 선택된다. 개별 콜로니를 집어 96웰 플레이트로 옮기고 적당한 시간 동안 배양한다. 이어서 세포를 종자 배양 또는 생산 배양을 위해 새로운 96웰 플레이트로 옮긴다. 배양액은 다양한 시간 동안 배양되어, 다중 측정이 실행될 수 있다. 다중 측정은 생성물, 바이 매스 또는 생물 반응기에서 균주의 성능을 예측하는 다른 특성의 측정을 포함할 수 있다. 고 처리량의 배양 결과는 생물 반응기 성능을 예측하는데 사용된다.

일부 실시태양에서, 탱크-기반 성능 검증은 고 처리량 선별에 의해 분리된 균주의 성능을 확인하기 위해 사용된다. 발효 공정/조건은 고객 사이트에서 얻는다. 생산성 또는 수율과 같은 관련 균주 성능 특성에 대한 벤치 스케일 발효 반응기(예를 들어, 본 발명의 표 3에 개시된 반응기)를 사용하여 후보 균주를 선별한다.

생성물 회수 및 정량화

관심 생성물의 생산을 위한 선별 방법은 당업자에게 공지되어 있으며 본 명세서 전반에 걸쳐 논의된다. 이러한 방법은 본 발명의 균주를 선별할 때 사용될 수있다.

일부 실시태양에서, 본 발명은 비 분비된 세포내 생성물을 생산하도록 디자인된 균주를 개량시키는 방법을 교시한다. 예를 들어, 본 발명은 세포내 효소, 오일, 약제 또는 다른 가치있는 작은 분자 또는 펩타이드를 생성하는 세포 배양물의 견고성, 수율, 효율 또는 전반적인 바람직함을 개선시키는 방법을 교시한다. 비 분비된 세포내 생성물의 회수 또는 분리는 용해 및 본 발명에 기술된 것을 포함하여 당해 분야에 주지된 회수 기술에 의해 달성될 수 있다.

예를 들어, 일부 실시태양에서, 본 발명의 세포는 원심 분리, 여과, 침전 또는 다른 방법에 의해 수확될 수 있다. 이어서, 수확된 세포는 동결-해동 사이클링, 초음파 처리, 기계적 파쇄 또는 세포 용해제의 사용, 또는 당업자에게 공지된 다른 방법을 포함하는 임의의 편리한 방법으로 파괴된다.

관심의 생성된 생성물, 예를 들면, 폴리펩타이드는 당업계에 공지된 다수의 방법 중 임의의 방법에 의해 회수/분리될 수 있으며 임의로 정제될 수 있다. 예를 들어, 생성물 폴리 펩타이드는 원심 분리, 여과, 추출, 분무 건조, 증발, 크로마토 그래피(예를 들어, 이온 교환, 친화성, 소수성 상호작용, 크로마토포커싱 및 크기 배제) 또는 침전을 포함하나 이에 제한되지 않는 통상적인 절차에 의해 영양 배지로부터 분리될 수 있다. 최종적으로, 고성능 액체 크로마토 그래피(HPLC)가 최종 정제 단계에서 사용될 수 있다. (예를 들어, Purification of intracellular protein as described in Parry et al., 2001, Biochem. J.353:117, and Hong et al., 2007, Appl. Microbiol. Biotechnol.　73:1331, 참조, 모두는 참조로 본 발명에 포함된다).

상기한 참조문헌 이외에, 다양한 정제 방법은, 예를 들어, Sandana (1997)　Bioseparation of Proteins, Academic Press, Inc.; Bollag et al. (1996)　Protein Methods,　2^ndEdition, Wiley-Liss, NY; Walker (1996)　The Protein Protocols HandbookHumana Press, NJ; Harris and Angal (1990)　Protein Purification Applications: A Practical Approach, IRL Press at Oxford, Oxford, England; Harris and Angal　Protein Purification Methods: A Practical Approach, IRL Press at Oxford, Oxford, England; Scopes (1993)　Protein Purification: Principles and Practice　3^rdEdition, Springer Verlag, NY; Janson and Ryden (1998)　Protein Purification: Principles, High Resolution Methods and Applications, Second Edition, Wiley-VCH, NY; and Walker (1998)　Protein Protocols on CD-ROM, Humana Press, NJ에 개시된 것들을 포함하여 당업계에 주지되어 있으며, 이의 전부는 본 발명에 참조로 포함된다.

일부 실시태양에서, 본 발명은 분비된 생성물을 생산하도록 디자인된 균주를 개량시키는 방법을 교시한다. 예를 들어, 본 발명은 귀중한 작은 분자 또는 펩타이드를 생산하는 세포 배양물의 견고성, 수율, 효율 또는 전반적인 바람직함을 개선시키는 방법을 교시한다.

일부 실시태양에서, 면역학적 방법을 사용하여 본 발명의 세포에 의해 생산된 분비된 또는 분비되지 않은 생성물을 검출 및/또는 정제하는데 사용될 수 있다. 한 예시적 접근법에서, 통상적인 방법을 사용하여 생성물 분자(예를 들어, 인슐린 폴리펩타이드 또는 이의 면역원성 단편에 대해)에 대해 생성된 항체는 비드 상에 고정화되고, 엔도글루카나아제가 결합되고 침전되는 조건하에 세포 배양 배지와 혼합된다. 일부 실시태양에서, 본 발명은 효소-결합 면역흡착 분석법(ELISA)의 사용을 교시한다.

다른 관련 실시태양에서, 면역크로마토그래피가 미국 특허 제5,002,303호, 미국 특허 제5,591,645호, 미국 특허 제4,855,240호, 미국 특허 제4,435,504호, 미국 특허 제4,980,298호 및 Se-Hwan Paek, et al., "Development of rapid One-Step Immunochromatographic assay, Methods", 22, 53-60, 2000에 개시된 바와 같이 사용되며, 이의 각각은 참조로 본 발명에 포함된다. 일반적인 면역크로마토그래피는 2개의 항체를 사용하여 표본을 검출한다. 제 1 항체는 시험 용액 중에 또는 시험 용액을 떨어뜨린 다공성 막으로 제조된 대략 직사각형 형태의 시험편의 말단 부분에 존재한다. 이 항체는 라텍스 입자 또는 금 콜로이드 입자(이 항체는 이하에서 표지 항체로 불릴 것이다)로 표지한다. 떨어뜨린 시험 용액이 검출될 표본을 포함하는 경우, 표지된 항체는 표본을 인식하여 표본과 결합한다. 표본과 표지된 항체의 복합체는 모세관 현상에 의해 여과지로 만들어지고 표지된 항체를 포함하는 말단의 반대편 말단에 부착된 흡수체를 향하여 흐른다. 이 흐름 동안, 표본과 표지 항체의 복합체가 다공질 막의 중간에 존재하는 제 2 항체(이하에서 태핑 항체로 불릴 것이다)에 의해 인식되어 포획되고, 그 결과, 복합체는 가시광 신호로서 다공성 막 상의 검출부 상에 나타내고 검출된다.

일부 실시태양에서, 본 발명의 선별 방법은 측광 검출 기술(흡수, 형광)에 기초한다. 예를 들어, 일부 실시태양에서, 검출은 항체에 결합된 GFP와 같은 형광 단 검출기의 존재에 기초할 수 있다. 다른 실시태양에서, 측광 검출은 세포 배양 물로부터의 원하는 생성물 상의 축적에 기초할 수 있다. 일부 실시태양에서, 생성물은 배양물의 UV 또는 상기 배양물로부터의 추출물을 통해 검출될 수 있다.

당업자는 본 발명의 방법이 관심의 임의의 바람직한 생체분자 생성물을 생산하는 숙주 세포와 양립할 수 있음을 인식할 것이다. 하기 표 2는 본 발명의 범위 내에 포함되는 생성물 카테고리, 생체분자 및 숙주 세포의 비 제한적 목록을 제공한다. 이들 실시예는 설명의 목적으로 제공되며, 어떠한 방식으로도 본 개시된 기술의 응용가능성을 제한하려는 것이 아니다.

본 발명의 숙주 세포 및 관심 생성물의 비 제한적 목록.

생성물 카테고리	생성물	숙주 카테고리	숙주
아미노산	리신	박테리아	Corynebacterium glutamicum
아미노산	메티오닌	박테리아	Escherichia coli
아미노산	MSG	박테리아	Corynebacterium glutamicum
아미노산	트레오닌	박테리아	Escherichia coli
아미노산	트레오닌	박테리아	Corynebacterium glutamicum
아미노산	트립토판	박테리아	Corynebacterium glutamicum
효소	효소 (11)	사상 진균	Trichoderma reesei
효소	효소 (11)	진균	Myceliopthora thermophila (C1)
효소	효소 (11)	사상 진균	Aspergillus oryzae
효소	효소 (11)	사상 진균	Aspergillus niger
효소	효소 (11)	박테리아	Bacillus subtilis
효소	효소 (11)	박테리아	Bacillus licheniformis
효소	효소 (11)	박테리아	Bacillus clausii
향신료 & 향료	아가우드	효모	Saccharomyces cerevisiae
향신료 & 향료	암브록스	효모	Saccharomyces cerevisiae
향신료 & 향료	누트카톤	효모	Saccharomyces cerevisiae
향신료 & 향료	파출리 오일	효모	Saccharomyces cerevisiae
향신료 & 향료	사프론	효모	Saccharomyces cerevisiae
향신료 & 향료	샌달우드 오일	효모	Saccharomyces cerevisiae
향신료 & 향료	발렌센	효모	Saccharomyces cerevisiae
향신료 & 향료	바닐린	효모	Saccharomyces cerevisiae
식품	CoQ10/유비퀴놀l	효모	Schizosaccharomyces pombe
식품	오메가 3 지방산	미세조류	Schizochytrium
식품	오메가 6 지방산	미세조류	Schizochytrium
식품	비타민 B12	박테리아	Propionibacterium freudenreichii
식품	비타민 B2	사상 진균	Ashbya gossypii
식품	비타민 B2	박테리아	Bacillus subtilis
식품	에리쓰리톨	효모-유사 진균	Torula coralline
식품	에리쓰리톨	효모-유사 진균	Pseudozyma tsukubaensis
식품	에리쓰리톨	효모-유사 진균	Moniliella pollinis
식품	스테비올 글리코시드	효모	Saccharomyces cerevisiae
하이드로콜로이드	디우탄 검	박테리아	Sphingomonas sp
하이드로콜로이드	젤란 검	박테리아	Sphingomonas elodea
하이드로콜로이드	잔탄 검	박테리아	Xanthomonas campestris
중간체	1,3-PDO	박테리아	Escherichia coli
중간체	1,4-BDO	박테리아	Escherichia coli
중간체	부타다이엔	박테리아	Cupriavidus necator
중간체	n-부탄올	박테리아 (절대혐기성 미생물)	Clostridium acetobutylicum
유기산	시트르산	사상 진균	Aspergillus niger
유기산	시트르산	효모	Pichia guilliermondii
유기산	글루콘산	사상 진균	Aspergillus niger
유기산	이타콘산	사상 진균	Aspergillus terreus
유기산	락트산	박테리아	Lactobacillus
유기산	락트산	박테리아	Geobacillus thermoglucosidasius
유기산	LCDAs - DDDA	효모	Candida
폴리케타이드/Ag	스피노사드	박테리아	Saccharopolyspora spinosa
폴리케타이드/Ag	스피네토람	박테리아	Saccharopolyspora spinosa

선택 기준 및 목표

본 발명의 방법에 적용되는 선택 기준은 균주 개량 프로그램의 특정 목표에 따라 달라질 것이다. 본 발명은 임의의 프로그램 목표를 충족시키도록 조정될 수 있다. 예를 들어, 일부 실시태양에서, 프로그램 목표는 즉각적인 시간 제한없이 반응의 단일 배치 수율을 최대화하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 특정 생성물을 생산하거나 특정 비율의 생성물을 생산하기 위해 생합성 수율을 재조정하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 폴리머의 탄소 사슬을 길게하는 것과 같이 생성물의 화학적 구조를 변형시키는 것일 수 있다. 일부 실시태양에서, 프로그램 목표는 수율, 역가, 생산성, 부산물 제거, 공정 이상현상에 대한 내성, 최적 성장 온도 및 성장율과 같은 성능 특성을 개선하는 것일 수 있다. 일부 실시태양에서, 프로그램 목표는 미생물에 의해 생성된 관심 생성물의 부피 생산성, 비 생산성, 수율 또는 역가에 의해 측정된 바와 같이 개량된 숙주 성능이다.

다른 실시태양에서, 프로그램 목표는 투입량 당 최종 생성물 수율(예를 들어, 수크로오스의 파운드당 생산된 총 에탄올의 양)의 관점에서 상업적 균주의 합성 효율을 최적화하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 예를 들어 배치 완료율 또는 연속 배양 시스템에서의 수율로 측정된 합성 속도를 최적화하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 특정 파지에 대한 균주 저항성을 증가시키거나, 그렇지 않으면 배양 조건 하에서 균주 생력/강건성을 증가시키는 것일 수 있다.

일부 실시태양에서, 균주 개량 프로젝트는 하나 이상의 목표에 종속될 수 있다. 일부 실시태양에서, 변형 프로젝트의 목표는 품질, 신뢰성 또는 전반적인 수익성에 달려있다. 일부 실시태양에서, 본 발명은 상기한 균주 특성의 하나 이상을 가진 관련된 선택된 돌연변이 또는 돌연변이 그룹을 교시한다.

당업자는 특정 프로젝트 목표를 달성하기 위해 어떻게 균주 선택 기준을 맞춤하는지를 인식할 것이다. 예를 들어, 반응 포화시 균주의 단일 배치 최대 수율의 선택은 높은 단일 배치 수율을 가진 균주를 확인하는데 적절할 수 있다. 다양한 온도 및 조건에서 수율의 일관성에 기반한 선택은 견고성 및 신뢰성이 증가된 균주를 확인하는데 적절할 수 있다.

일부 실시태양에서, 초기 고 처리량 단계 및 탱크-기반 검증에 대한 선택 기준은 동일할 것이다. 다른 실시태양에서, 탱크-기반 선택은 추가 및/또는 상이한 선택 기준하에서 작동할 수 있다. 예를 들어, 일부 실시태양에서, 고 처리량 균주 선택은 단일 배치 반응 완료 수율에 기초할 수 있지만, 탱크-기반 선택은 반응 속도에 대한 수율에 기초한 선택을 포함하도록 확대될 수 있다.

서열화

일부 실시태양에서, 본 발명은 본 발명에 기재된 유기체의 전체-게놈 서열화를 교시한다. 다른 실시태양에서, 본 발명은 또한 본 발명의 방법에 대한 품질 조절제로서의 플라스미드, PCR 생성물 및 다른 올리고의 서열화를 교시한다. 크고 작은 프로젝트를 위한 서열화 방법은 당업자에게 주지되어 있다.

일부 실시태양에서, 핵산을 서열화하는 임의의 고 처리량 기술이 본 발명의 방법에 사용될 수 있다. 일부 실시태양에서, 본 발명은 전체 게놈 서열화를 교시한다. 다른 실시태양에서, 본 발명은 유전자 변이를 확인하기위한 앰플리콘 서열화 울트라 딥 서열화를 교시한다. 일부 실시태양에서, 본 발명은 또한 태그맨테이션 (tagmentation)을 포함하는 신규한 라이브러리 제조 방법을 교시한다(WO/2016/073690 참조). DNA 서열화 기술은 표지된 터미네이터 또는 프라이머를 사용하는 고전적인 다이데옥시 서열화 반응(생거 방법) 및 슬라브 또는 모세관에서의 겔 분리; 가역적으로 종결된 표지된 뉴클레오타이드를 사용하는 합성에 의한 서열화, 열서열화; 454 서열화; 표지된 올리고 뉴클레오타이드 프로브의 라이브러리에 대한 대립유전자 특이적 혼성화; 결찰이 뒤따르는 표지된 클론의 라이브러리에 대한 대립유전자 특이적 혼성화를 사용하는 합성에 의한 서열화; 중합 단계 동안 표지된 뉴클레오타이드의 혼입의 실시간 모니터링; 폴로니 서열화; 및 SOLiD 서열화를 포함한다.

본 발명의 한 양태에서, 연속적으로 서열화되는 고체 표면상의 개별 분자를 공간적으로 분리하는 단계를 포함하는 서열화의 고 처리량 방법이 사용된다. 이런 고체 표면은 비다공성 표면(솔렉사 서열화, 예를 들어, Bentley et al, Nature, 456: 53-59 (2008) or Complete Genomics　sequencing, e.g. Drmanac et al, Science, 327: 78-81 (2010)), 비드-또는 입자 결합 주형을 포함할 수 있는 웰의 어레이(454 서열화, 예를 들어, Margulies et al, Nature, 437: 376-380 (2005) or Ion Torrent　sequencing, U.S. patent publication 2010/0137143 or 2010/0304982), 미세가공된 막(SMRT 서열화, 예를 들어, Eid et al, Science, 323: 133-138 (2009)) 또는 비드 어레이(폴로니 서열화 또는 SOLiD 서열화, 예를 들어, Kim et al, Science, 316: 1481-1414 (2007))를 포함할 수 있다.

다른 실시태양에서, 본 발명의 방법은 분리된 분자가 고체 표면상에서 공간적으로 분리되기 전 또는 후에 분리된 분자를 증폭시키는 단계를 포함한다. 사전 증폭은 에멀젼 PCR, 또는 롤링 써클 증폭과 같은 에멀젼-기초 증폭을 포함할 수 있다. 또한 벤틀레이 등(상기) 및 제조사 지시(예를 들어, TruSeq™ Sample Preparation Kit and Data Sheet,　Illumina, Inc., San Diego, Calif., 2010); 및 추가로 참조로 포함된 다음 참조문헌: 미국 특허 제6,090,592호; 제6,300,070호; 제7,115,400호; 및 EP0972081B1에 기술된 바와 같이 개별 주형 분자가 고체 표면상에서 공간적으로 분리된 후, 브리지 PCR에 의해 평행하게 증촉되어 분리된 클론 집단 또는 클러스터를 형성한 후, 서열화되는 솔렉사-기초 서열화가 교시된다.

한 실시태양에서, 고체 표면상에 배치되고 증폭된 개개의 분자는 cm²당 적어도 10⁵ 클러스터의 밀도; 또는 cm²당 적어도 5x10⁵의 밀도; 또는 cm²당 적어도 10⁶ 클러스터의 밀도로 클러스터를 형성한다. 한 실시태양에서, 상대적으로 높은 에러율을 갖는 서열화 화학 반응이 사용된다. 이런 실시태양에서, 이런 화학 반응에 의해 생산된 평균 품질 점수는 서열 판독 길이의 단조 감소 함수이다. 한 실시태양에서, 이런 감소는 서열 판독의 0.5%가 1-75 위치에서 적어도 하나의 오차를 가지며; 서열 판독의 1%가 76-100 위치에서 적어도 하나의 오차를 가지며; 서열 판독의 2%가 101-125 위치에서 적어도 하나의 오차를 갖는 것에 상응한다.

게놈-전체 유전자 디자인 기준의 효과의 전산 분석 및 예측

일부 실시태양에서, 본 발명은 소정의 숙주 균주에 포함되는 특정 유전자 변형의 효과를 예측하는 방법을 교시한다. 추가의 양태에서, 본 발명은 숙주가 특정 표현형 형질 또는 균주 매개변수를 갖기 위해 소정의 숙주 균주에 포함되어야 하는 제안된 유전자 변형을 생성하는 방법을 제공한다. 소정의 양태에서, 본 발명은 신규 숙주 균주를 디자인하는데 이용될 수 있는 예측 모델을 제공한다.

일부 실시태양에서, 본 발명은 선별의 각 라운드의 수행 결과를 분석하는 방법 및 다음 선별 라운드에서 균주 성능을 향상시키도록 예측된 새로운 제안된 게놈-전체 서열 변형을 생성하는 방법을 교시한다.

일부 실시태양에서, 본 발명은 시스템이 이전의 선별 결과에 기초하여 숙주 균주에 대해 제안된 서열 변형을 생성하는 것을 교시한다. 일부 실시태양에서, 본 시스템의 권고는 직전 선별 검사의 결과에 기초한다. 다른 실시태양에서, 본 시스템의 권고는 하나 이상의 선별 검사의 누적 결과에 기초한다.

일부 실시태양에서, 본 시스템의 권고는 이전에 개발된 HTP 유전자 디자인 라이브러리에 기초한다. 예를 들어, 일부 실시태양에서, 본 시스템은 이전의 선별로부터의 결과를 저장하고, 그 결과를 동일 또는 상이한 숙주 유기체에서 상이한 프로젝트에 적용하도록 디자인된다.

다른 실시태양에서, 본 시스템의 권고는 과학적인 통찰력에 기초한다. 예를 들어, 일부 실시태양에서, 권고는 (주석된 유전자 데이터베이스 및 관련 문헌과 같은 출처로부터의) 유전자의 공지된 특성, 코돈 최적화, 전사 미끄러짐, uORF 또는 다른 가설 주도 서열 및 숙주 최적화에 기초한다.

일부 실시태양에서, 시스템 또는 예측 모델에 의해 권장되는 숙주 균주에 대해 제안된 서열 변형은 다음을 포함하는 개시된 분자 도구 세트의 하나 이상을 이용함으로써 수행된다: (1) 프로모터 스왑, (2) SNP 스왑, (3) 코돈 교환 개시/중지, (4) 서열 최적화, (5) 스왑 중지, (6), 트랜스포존 돌연변이유발, (7) 상위성 매핑.

본 발명에 기술된 HTP 유전자 공학 플랫폼은 임의의 특정 미생물 또는 표현형 형질에 대해 불가지론적이다(예를 들어, 특정 화합물의 생산). 즉, 본 발명에서 교시된 플랫폼 및 방법은 숙주 세포가 임의의 바람직한 표현형 형질을 갖도록 조작하기 위해 임의의 숙주 세포와 함께 사용될 수 있다. 또한, 하나의 새로운 숙주 세포를 생성하기 위해 사용된 소정의 HTP 유전자 공학 공정으로부터 얻은 교훈은, 교시된 방법 동안 발생하는 무수한 공정 매개변수의 저장, 특징화 및 분석의 결과로서, 임의의 수의 다른 숙주 세포에 적용할 수 있다.

상위성 맵핑 섹션에서 언급된 바와 같이, HTP 유전자 디자인 라이브러리로부터의 돌연변이의 집합을 일부 바람직한 예측 모델을 통해 특정 배경으로 통합시킴으로써 얻어진 가상 균주의 성능(별칭, 점수)을 추정하는 것이 가능하다. 이런 예측 모델을 감안할 때, 조합 통합을 통해 돌연변이 라이브러리에 접근할 수 있는 모든 가상 균주를 채점하고 순위를 매기는 것이 가능하다. 아래 섹션은 본 HTP 플랫폼에서 사용되는 특정 모델에 대해 간략히 설명한다.

예측 균주 디자인

본 발명에 기술 된 것은 유전자 변화 및 균주 성능을 기술하는 방법, 균주에서 변화의 구성에 기초하여 균주 성능을 예측하는 방법, 높은 예측된 성능을 갖는 후보 디자인을 추천하는 방법, 및 2차 고려사항, 예를 들어, 현존하는 균주에 대한 유사성, 상위성 또는 예측의 신뢰를 최적화를 위해 예측을 필터링하는 방법을 포함하는 예측 균주 디자인에 접근법이 본 발명에 기술된다.

균주 디자인 모델에 대한 입력

한 실시태양에서, 설명의 용이함을 위해, 입력 데이터는 두 구성요소: (1) 유전자 변화의 세트 및 (2) 상대적 균주 성능을 포함할 수 있다. 당업자는 이 모델이 다양한 입력을 고려하면서 과적합에 대한 상반되는 고려사항을 염두하면서 용이하게 확장될 수 있음을 인식할 것이다. 유전자 변화 이외에, 조절될 수 있는 입력 매개변수(독립변수)의 일부는 세포 유형(속, 종, 균주, 계통 발생 특성 등) 및 발효가 세포에 의해 수행되는 동안 공정 매개변수(예를 들어, 환경 조건, 취급 장비, 개조 기술, 등)이다.

유전자 변화의 세트는 HTP 유전자 디자인 라이브러리라 불리는 유전자 교란의 이전에 논의된 집합으로부터 유래될 수 있다. 상대적 균주 성능은 임의의 소정의 파라미터 또는 관심 표현형 특성(예를 들어, 화합물, 소분자 또는 관심 생성물의 생산)에 기초하여 평가될 수 있다.

세포 유형은 원핵생물 및 진핵생물 시스템, 속, 종, 균주, 조직 배양(vs. 분산 세포) 등과 같은 일반적인 카테고리에서 특정될 수 있다. 조절될 수 있는 공정 파라미터는 온도, 압력, 반응기 구성 및 배지 조성물을 포함할 수 있다. 반응기 구성의 예는 반응기의 부피, 공정이 배치인지 또는 연속적인지 여부, 및 연속적이면 체적 유량 등을 포함한다. 또한, 세포가 존재하는 구조를 특정할 수 있다. 배지 조성물의 예는 전해질, 영양소, 폐기물, 산, pH 등의 농도를 포함한다.

예측 균주 모델을 만드는 데 사용되는 초기 선형 회귀 모델에서 사용될 선택된 HTP 유전자 디자인 라이브러리로부터의 유전자 변화 세트

예측 균주 디자인 모델을 생성하기 위해, 동일한 미생물 종의 균주의 유전자 변화가 먼저 선택된다. 각 유전자 변화의 이력이 또한 제공된다(예를 들어, 이 균주 계보에서 가장 최근의 변형 - "마지막 변화"를 나타낸다). 따라서, 이 균주의 성능을 부모의 성능과 비교하는 것은 "최종 변화" 돌연변이의 성능에 관한 데이터 포인트를 나타낸다.

제조된 균주 성능 평가

교시된 모델의 목적은 균주에 도입된 유전자 변화의 구성에 기초하여 균주 성능을 예측하는 것이다. 비교를 위한 표준을 구축하기 위해, 균주 성능은 분석 플레이트당 균주당 평균 성능을 먼저 계산함으로써 공통 기준 균주에 대해 상대적으로 계산된다. 그런 후에 상대적인 성능은 동일한 플레이트 내에서 조작된 균주 및 공통 기준 균주 사이의 평균 성능에 차이로 계산된다. 계산을 플레이트 내 비교로 제한하면 고려중인 샘플 모두가 동일한 실험 조건을 얻을 수 있음을 보장한다.

도 10은 입력 데이터에 대한 상대적 균주 성능의 분포가 고려되는 한 실시예를 도시한다. 이것은 코리네박테리움에서 수행되었다. 0의 상대적 성능은 조작된 균주가 인-플레이트 기본 또는 "참조" 균주에 동일하게 잘 수행되었음을 나타낸다. 0보다 크게 수행할 수 있는 균주를 확인하는 예측 모델의 능력이 중요하다. 더구나, 그리고 더 일반적으로, 임의의 소정의 균주는 일부 기준에 의해 이의 부모보다 우월한지 여부가 중요하다. 실제로, 기준은 부모 수준 이상의 일부 임계값을 충족하거나 초과하는 생성물 역가일 수 있으며, 원하는 방향으로 부모와 통계적으로 유의미한 차이를 갖는 것은 대신에 또는 추가로 사용될 수도 있다. 기본 또는 "참조" 균주의 역할은 단순히 플레이트 내 또는 플레이트 간의 비교를 위한 추가된 표준화 요소로서 작용하는 것이다.

염두에 두어야 할 개념은 부모 균주 및 기준 균주의 차이점이다. 부모 균주는 돌연변이유발의 현재 라운드에 사용된 배경이다. 기준 균주는 특히 플레이트 간의 비교를 용이하게 하기 위해 모든 플레이트에서 사용되는 대조군 균주이며 일반적으로 위에 언급된 "기본 균주"입니다. 그러나 기본 균주(예를 들어, 야생형 또는 산업용 균주는 전체 성능을 벤치마크하는데 사용된다)는 소정의 라운드의 균주 개량에서 돌연변이유발 표적이라는 의미에서 반드시 "기본"이 아니기 때문에, 보다 설명적인 용어는 "기준 균주"이다.

요약하면, 기본/기준 균주는 제조된 균주의 성능을 벤치마크하는데 사용되는 반면, 부모 균주는 관련 유전자 배경에서 특이적 유전자 변화의 성능을 벤치마크하는데 사용된다.

선형 회귀 분석에 의한 제조된 균주의 성능 순위 매김

개시된 모델의 목적은 제조된 균주에 도입된 유전자 변화의 구성의 함수로서, 상대적 균주 성능을 기술함으로써, 제조된 균주의 성능을 순위매기기 위한 것이다. 본 발명 전반에 걸쳐 논의된 바와 같이, 다양한 HTP 유전자 디자인 라이브러리는 조작된 균주에 도입되는 가능한 유전자 변화(예를 들어, 유전자 교란/변경)의 레퍼토리를 제공한다. 선형 회귀는 현재 설명된 전형적인 예측 모델의 기초이다.

유전자 변화 및 상대적 성능에 대한 이들의 효과는 회귀-기반 모델링에 대한 예시적인 입력이다. 균주 성능은 균주에 포함된 유전자 변화의 구성의 함수로서 공통 기본 균주에 상대적으로 평가된다.

제조된 균주를 특징화하는 선형 회귀

선형 회귀는 구현 및 해석의 용이함 때문에 기술된 HTP 게놈 공학 플랫폼에 대한 매력적인 방법이다. 얻어진 회귀 계수는 각 유전자 변화의 존재에 기인한 상대적 균주 성능의 평균 증가 또는 감소로 해석될 수 있다.

예를 들어, 일부 실시태양에서, 이 기술은 원래 프로모터를 다른 프로모터로 변경하면 평균 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 이상 단위만큼 상대적 균주 성능을 개량시키고, 따라서 어떠한 음성 상위성 상호작용의 부재시에 잠재적으로 매우 바람직한 변화라고 결론 내리게 한다(참고: 입력은 단위가 없는 정규화 값).

따라서, 교시된 방법은 선형 회귀 모델을 사용하여 다양한 교시된 라이브러리로부터의 그들의 게놈에 도입된 다양한 유전자 교란을 갖는 제조된 균주를 기술하고/특성화하고 순위를 매긴다.

예측 디자인 모델링

구축된 균주로부터의 데이터를 사용하는 상기한 선형 회귀 모델은 아직 제조되지 않은 균주에 대한 성능 예측을 수행하는데 사용될 수 있다.

절차는 다음과 같이 요약될 수 있다: 가능한 모든 형태의 유전자 변화를 인 실리코로 생성한다 → 회귀 모델을 사용하여 상대적인 균주 성능을 예측한다 → 성능에 의해 후보 균주 디자인을 순서화한다. 따라서 회귀 모델을 이용하여 아직 제조되지 않은 균주의 성능을 예측함으로써, 이 방법은 더 적은 실험을 수행하는 동시에 고성능 균주의 생산을 가능하게 한다.

구성 생성

아직 제조되지 않은 균주의 성능을 예측하기 위한 모델을 구축하는 경우, 첫 번째 단계는 일련의 디자인 후보를 생산하는 것이다. 이것은 균주의 유전자 변화의 총 수를 고정한 다음, 가능한 모든 유전자 변화의 조합을 정의함으로써 이루어진다. 예를 들어, 잠재적 유전자 변화/교란의 총 수를 29(예를 들어, 유전자 교란의 영역이 29인 한 29개 가능한 SNP 또는 29개 상이한 프로모터 또는 이의 임의의 조합)으로 설정한 후 29개 잠재적 유전자 변화의 모든 가능한 3-구성원 조합을 디자인하도록 결정할 수 있으며, 이것이 3,654개 후보 균주 디자인을 생성할 것이다.

상기한 3,654개 후보 균주에 대한 문맥을 제공하기 위해, n!/((n-r)! * r!)을 사용하여 n개의 가능한 구성원으로부터 크기 r의 비 중복 그룹의 수를 계산할 수 있다고 생각한다. r = 3이면 n = 29는 3,654를 제공한다. 따라서, 29개 잠재적 변화의 모든 가능한 3개 구성원 조합을 디자인하면, 결과는 3,654개 후보 균주이다. 29개 잠재적 유전자 변화가 도 14의 x축에 제공된다.

새로운 균주 디자인의 성능 예측

입력으로서 조합 구성으로 위에서 구축된 선형 회귀 분석을 사용하여, 각각의 후보 디자인의 예상된 상대 성능을 예측할 수 있다. 예를 들어, 상위 100개 예상 균주 디자인에 대한 변화의 조성물은 2차원 맵에 요약될 수 있고, 여기서 x축은 잠재적 유전자 변화의 풀(29개 가능한 유전자 변화)을 열거하고, y축은 순위 순서를 도시한다. 검은 색 셀은 후보 디자인에 특정 변화의 존재를 나타내는 데 사용될 수 있고 흰색 셀은 변화의 부존재를 나타내는 데 사용될 수 있다. 도 14 참조.

예측 정확도는 새로운 관찰이 모델을 반복적으로 재훈련하고 재구성하는데 사용됨에 따라 시간이 지남에 따라 증가해야 한다. 본 발명자에 의한 연구 결과는 예측 모델이 반복적으로 재훈련되고 개량될 수 있는 방법을 설명한다. 모델 예측의 품질은 예측된 값과 관찰된 값 사이의 연관성의 강도를 나타내는 상관 계수 또는 평균 모델 오차의 척도인 평균 제곱근 오차를 포함하는 여러 방법을 통해 평가될 수 있다. 모델 평가에 선택된 메트릭을 사용하여, 시스템은 모델이 재훈련되어야 할 때에 대한 규칙을 정의할 수 있다.

상기 모델에 대한 몇 가지 설명되지 않은 가정은 다음을 포함한다: (1) 상위성 상호작용이 없다; (2) 예측 모델을 구축하기 위해 사용된 유전자 변화/교란은 유전자 변형의 제안된 조합으로서 모두 동일한 배경에서 만들어진다.

2차 기능에 대한 필터링

상기 설명된 예는 예측된 숙주 세포 성능에 기초한 선형 회귀 예측에 초점을 두었다. 일부 실시태양에서, 본 선형 회귀 방법은 포화 바이오매스, 저항성 또는 다른 측정가능한 숙주 세포 특징과 같은 비-생체분자 인자에도 적용될 수 있다. 따라서, 본 발명의 방법은 또한 제조할 후보자의 우선순위를 정할 때 예측된 성능 이외의 다른 특징을 고려하는 것을 교시한다. 추가적인 관련 데이터가 있다고 가정하면, 비선형 항도 회귀 모델에 포함된다.

기존의 균주와의 밀접성

이미 제조된 것과 유사한 예측된 균주는 상위 예측 후보가 아니더라도 시간 및 비용을 절감할 수 있다

변화의 다양성

상기한 모델을 구축할 때, 유전자 변화가 상위성 상화작용의 존재에 의해 진정으로 부가적일 것을 확신할 수 없다(선형 회귀에 의해 가정되고 상기 가정으로 언급됨). 그러므로, 유전자 변화 비유사성의 지식은 긍정적인 가산성의 가능성을 증가시키는데 사용될 수 있다. 예를 들어, 상위 균주로부터의 변화가 동일한 대사 경로에 있고 유사한 성능 특성을 갖는 것을 아는 경우, 그 정보는 변화의 비유사한 구성을 가진 다른 상위 균주를 선택하는데 사용될 수 있다. 상위성 매핑에 관한 위의 섹션에서 설명한 바와 같이, 예측된 최고의 유전자 변화는 상당히 비유사한 응답 프로파일을 가진 돌연변이에 대한 선택을 제한하기 위해 필터링될 수 있다. 대안적으로, 선형 회귀는 예측을 가중하기 위해 유사성 매트릭스를 사용하는 가중된 최소 자승 회귀(weighted least squares regression)일 수 있다.

예측된 성능의 다양성

마지막으로, 예측 모델을 검증하고 후속적으로 개량하기 위해, 중간 또는 나쁜 예측된 성능을 가진 균주를 디자인하도록 선택할 수 있다.

반복 균주 디자인 최적화

실시태양에서, 주문 배치 엔진(208)은 공장(210)에 공장 주문을 하여 상위 후보 돌연변이를 포함하는 미생물 균주를 제조한다. 피드백-루프 방식에서, 결과는 분석 장비(214)에 의해 분석되어 어느 미생물이 원하는 표현형 특성을 나타내는지를 결정할 수있다(314). 분석 단계 동안, 변형된 균주 배양물은 평가되어 성능, 즉 산업적 규모로 생산되는 능력을 포함하는 원하는 표현형 특성의 발현을 측정한다. 예를 들어, 분석 단계는, 다른 것들 중에서, 콜로니 건강의 지표로서 미생물 콜로니 성장을 측정하기 위해 플레이트의 이미지 데이터를 사용한다. 분석 장비(214)는 유전자 변화를 표현형 성능과 상관시키고 결과적인 유전자형-표현형 상관 데이터를 라이브러리(206)에 저장될 라이브러리에 저장하여 장래의 미생물 생산을 알려주는데 사용된다.

특히, 충분히 높게 측정된 성능을 실제로 초래하는 후보 변화는 데이터베이스의 행으로서 추가될 수 있다. 이러한 방식으로, 최고의 성능 돌연변이가 감독된 기계 학습 방식으로 예측 균주 디자인 모델에 추가된다.

LIMS는 이전의 공장 가동으로부터 개발된 상관관계에 기초하여 디자인/제조/테스트/분석 사이클을 반복한다. 후속 사이클 동안, 단독으로 또는 인간 조작자와 함께 분석 장비(214)는 상관관계 데이터를 사용하여 유전자 변형을 미세하게 조정하여 더 미세한 정교성(granularity)으로 더 나은 표현형 성능을 달성하도록 입력 인터페이스(202)로 다시 입력하기 위한 기본 균주로서 최고의 후보를 선택할 수 있다. 이러한 방식으로, 본 발명의 실시태양의 실험실 정보 관리 시스템은 품질 개선 피드백 루프를 구현한다.

요약하면, 도 22의 흐름도를 참조하면, 반복 예측 균주 디자인 작업 흐름은 다음과 같이 기술될 수 있다:

● 입력과 출력 변수의 훈련 세트, 예를 들어, 입력으로 유전자 변화 및 출력으로 성능 특성을 생성한다(3302). 생성은 이전의 유전자 변화 및 이러한 유전자 변화를 포함하는 미생물 균주의 상응하는 측정된 성능에 기초하여 분석 장비(214)에 의해 수행될 수 있다.

● 훈련 세트를 기반으로 초기 모델(예를 들어, 선형 회귀 모델)을 개발한다(3304). 이는 분석 장비(214)에 의해 수행될 수 있다.

● 디자인 후보 균주를 생성한다(3306)

● 한 실시태양에서, 분석 장비(214)는 변화의 조합의 형태로, 배경 균주에 대해 행해지는 유전자 변화의 수를 고정시킬 수 있다. 이런 변화를 나타내기 위해, 분석 장비(214)는 변화의 조합을 나타내는 하나 이상의 DNA 세부사항 표현을 해석자(204)에 제공할 수 있다. (이런 유전자 변화 또는 이런 변화를 포함하는 미생물 균주는 "테스트 입력"으로 불릴 수 있다) 해석자(204)는 하나 이상의 DNA 세부사항을 해석하고, 실행 엔진(207)은 DNA 세부사항을 실행하여 이런 변화에 대한 개별 후보 후보자 디자인 균주를 나타내는 분석된 출력으로 DNA 세부사항을 채운다.

● 모델에 기초하여, 분석 장비(214)는 각각의 후보 디자인 균주의 예상 성능을 예측한다(3308).

● 분석 장비(214)는 최고의 예측된 성능을 가진 제한된 수, 예를 들어, 100개의 후보 디자인을 선택한다(3310).

● 상위성 매핑과 관련하여 본 발명의 다른 곳에서 설명된 바와 같이, 분석 장비(214)는 예를 들어, 상위성 효과에 대한 상위 디자인을 필터링하거나, 예측 모델 속에 상위성을 고려하여 상위성과 같은 2차 효과를 설명할 수 있다.

● 주문 배치 엔진(208)에 의해 생성된 공장 주문에 기초하여 필터링된 후보 균주를(공장(210)에서)제조한다(3312).

● 분석 장비(214)는 선택된 균주의 실제 성능을 측정하고 우수한 실제 성능을 기초로 제한된 수의 선택된 균주를 선택하고(3314), 디자인 변화와 이의 얻어진 성능을 예측 모델에 추가한다 (3316).

● 분석 장비(214)는 새로운 디자인 후보 균주의 생성으로 다시 반복하고(3306), 정지 조건이 만족될 때까지 반복을 지속한다. 정지 조건은, 예를 들어, 수율, 성장률 또는 역가와 같은 성능 메트릭을 만족시키는 적어도 하나의 미생물 균주의 측정된 성능을 포함할 수 있다.

상기 예에서, 변형 디자인의 반복 최적화는 기계 학습을 구현하기 위해 피드백 및 선형 회귀를 사용한다. 일반적으로, 기계 학습은 제한된 수의 표지된 데이터의 예를 사용하고 알려지지 않은 데이터에 동일한 작업을 실행하여 정보 작업의 수행(예를 들어, 분류 또는 회귀)시에, 매개 변수, 기술 또는 기타 기능과 같은 성능 기준의 최적화로 기술될 수 있다. 상기 선형 회귀 예와 같은 감독된 기계 학습에서, 기계(예를 들어, 컴퓨팅 디바이스)는 예를 들어 훈련 데이터에 의해 나타난 패턴, 카테고리, 통계적 관계 또는 다른 속성을 확인함으로써 학습한다. 그런 다음 학습 결과는 새로운 데이터가 동일한 패턴, 카테고리, 통계적 관계 또는 기타 속성을 나타낼 것인지를 예측하는데 사용된다.

본 발명의 실시태양은 훈련 데이터가 이용가능할 때 다른 감독된 기계 학습 기술을 사용할 수 있다. 훈련 데이터가 없는 경우, 실시태양은 감독되지 않은 기계 학습을 채택할 수 있다. 대안적으로, 실시태양은 소량의 표지된 데이터 및 다량의 비표지된 데이터를 사용하는 반-감독된 기계 학습을 채택할 수 있다. 실시태양은 또한 기계 학습 모델의 성능을 최적화하기 위해 가장 관련이 있는 특징의 서브세트를 선택하기 위해 특징 선택을 채택할 수 있다. 선형 회귀에 대한 대안으로서 또는 선형 회귀에 추가로 선택된 기계 학습 접근법의 유형에 따라, 실시태양은, 예를 들어, 로지스틱 회귀, 신경망, 지지 벡터 기계(SVM), 결정 트리, 숨겨진 마르코프 모델, 베이지안 네트워크, 그램 슈미트, 보강-기반 학습, 계층적 클러스터링을 포함하는 클러스터 기반 학습, 유전자 알고리즘 및 당업계에 공지된 임의의 다른 적절한 학습 기계를 채택할 수 있다. 특히, 실시태양은 로지스틱 회귀를 이용하여 분류 자체와 함께 분류(예를 들어, 상이한 기능 그룹으로 유전자의 분류)의 확률을 제공할 수 있다. 예를 들어, Shevade, A simple and efficient algorithm for gene selection using sparse logistic regression, Bioinformatics, Vol. 19, No. 17 2003, pp. 2246-2253, Leng, et al., Classification using functional data analysis for temporal gene expression data, Bioinformatics, Vol. 22, No. 1, Oxford University Press (2006), pp. 68-76를 참조하고, 이의 전부는 전문이 참조로 본 발명에 포함된다.

실시태양은, 특히 심층 신경망(DNN)으로 알려진 형태로 기계 학습 작업을 수행함에 있어 인기가 증가하고 있는 것으로 밝혀진 그래픽 처리 장치(GPU) 가속 아키텍처를 채택할 수 있다. 본 발명의 실시태양은 GPU 기반 딥 러닝 인터페이스: A Performance and Power Analysis, NVidia Whitepaper, November 2015, Dahl, et al., Multi-task Neural Networks for QSAR Predictions, Dept. of Computer Science, Univ. of Toronto, June 2014 (arXiv:1406.1231 [stat.ML])에 기술된 것과 같은 GPU-기반 기계 학습을 채택할 수 있고, 이의 전부는 전문이 참조로 본 발명에 포함된다. 본 발명의 실시태양에 적용할 수 있는 기계 학습 기술은 다른 참조문헌 중에서, Libbrecht, et al., Machine learning applications in genetics and genomics, Nature Reviews: Genetics, Vol. 16, June 2015, Kashyap, et al., Big Data Analytics in Bioinformatics: A Machine Learning Perspective, Journal of Latex Class Files, Vol. 13, No. 9, Sept. 2014, Prompramote, et al., Machine Learning in Bioinformatics, Chapter 5 of Bioinformatics Technologies, pp. 117-153, Springer Berlin Heidelberg 2005에서 발견될 수 있고, 이의 전부는 전문이 참조로 본 발명에 포함된다.

반복적인 예측 균주 디자인: 실시예

다음은 위에서 설명한 반복적인 예측 균주 디자인 작업 흐름의 예시적인 응용을 제공한다.

훈련 입력 및 출력 변수의 초기 세트가 준비되었다. 이 세트는 정의된 유전자 구성을 가진 1864개의 고유한 조작 균주로 구성되었다. 각 균주는 5 내지 15개의 조작된 변화를 포함하였다. 총 336개의 고유한 유전자 변화가 훈련에 존재하였다.

초기 예측 컴퓨터 모델이 개발되었다. 구현은 일반 선형 모델(4차 다항 커널에 의한 커널 릿지 회귀)을 사용하였다. 구현은 두 가지 뚜렷한 표현형(수율 및 생산성)을 만든다. 아래 도시된 바와 같이, 이들 표현형은 가중치 합계로 결합되어 순위에 대한 단일 점수를 얻는다. 다양한 모델 매개 변수, 예를 들어, 정규화 인자는 지정된 훈련 데이터에 대해 k 배 교차 검증을 통해 조정되었다.

상기 구현은 상기 상위성 매핑 섹션에 기술된 바와 같이 상호작용 효과의 어떠한 명백한 분석도 포함하지 않는다. 그러나, 당업자가 이해할 수 있는 바와 같이, 구현된 일반 선형 모델은 암시적으로 커널의 2차, 3차 및 4차 항을 통해 상호작용 효과를 포착할 수 있다.

모델은 훈련 세트에 대해 훈련된다. 훈련 후에, 훈련 데이터에 대한 수율 모델의 현저한 품질 적합성이 입증될 수 있다.

그런 후에 후보 균주가 생성된다. 이 실시태양은 부모 균주에 대한 새로운 유전자 변화의 도입과 관련된 일련의 제조 제약을 포함한다. 여기서, 후보자는 단순히 변화의 원하는 수의 함수로 간주되지 않는다. 대신에, 분석 장비(214)는, 출발점으로서, 고성능 메트릭("종자 균주")을 갖는 것으로 알려진 이전에 디자인된 균주의 집합을 선택한다. 분석 장비(214)는 각각의 종자 균주에 유전자 변화를 개별적으로 적용한다. 도입된 유전자 변화는 종자 균주에 이미 존재하는 것들을 포함하지 않는다. 다양한 기술적, 생물학적 또는 다른 이유로, opca_4와 같은 특정 돌연변이가 명시적으로 요구되거나 dss_422가 명시적으로 배재된다.

모델에 기초하여, 분석 장비(214)는 후보 균주 디자인의 성능을 예측하였다. 분석 장비(214)는 관심있는 두 표현형에 대한 예측된 성능(수율 및 생산성)에 기초하여 후보를 "최상"에서 "최악"으로 순위를 매긴다. 특히, 분석 장비(214)는 가중 합을 사용하여 후보 균주에 점수를 매긴다:

점수 = 0.8 * 수율/ 최대(수율) + 0.2 * 생산성/최대(생산성),

여기서 수율은 후보 균주에 대한 예측된 수율을 나타내고,

최대(수율)는 모든 후보 균주에 대한 최대 수율을 나타내며,

생산성은 후보 균주의 생산성을 나타내며,

최대(생산성)은 모든 후보 균주에 대한 최대 생산성을 나타낸다.

분석 장비(214)는 용량 제약 및 작업 제약 모두를 부과함으로써 후보의 랭킹 된 목록으로부터 최종 세트의 권고를 생성한다. 일부 실시태양에서, 용량 제한은 48개 컴퓨터 생성 후보 디자인 균주와 같이 소정의 수로 설정될 수 있다.

훈련된 모델(위에 설명됨)은 각각의 후보 균주의 예상된 성능(수율 및 생산성에 대해)을 예측하는 데 사용될 수 있다. 분석 장비(214)는 위에 제공된 스코어링 함수를 사용하여 후보 균주의 순위를 매길 수 있다. 용량 및 작업 제약이 적용되어 48개 후보 균주의 필터된 세트를 생산하였다.

필터된 후보 균주는 주문 배치 엔진(208)에 의해 생성된 공장 주문에 기초하여 (공장(210)에서) 제조한다(3312). 순서는 후보 균주에 해당하는 DNA 세부사항에 기초할 수 있다.

실제로, 제조 공정은 예측된 실패율을 가지므로 균주의 무작위로 세트가 제조되지 않는다.

분석 장비(214)는 실제 수율 및 생산성 성능을 측정하는 데 사용될 수 있다. 분석 장비(214)는 3개의 기준; 모델 정확성; 균주 성능 개량; 인간 전문가가 생성 한 디자인에 대한 동등성(또는 개량)에 기초하여 모델 및 권장 균주를 평가할 수 있다.

수율 및 생산성 표현형은 권장 균주에 대해 측정하고 모델에 의해 예측된 값과 비교할 수 있다.

다음으로, 분석 장비(214)는 각각의 권장 균주에 대한 부모 균주로부터의 성능 변화율을 계산한다.

예측 정확도는 예측된 값과 관측된 값 간의 연관성을 나타내는 상관 계수 또는 평균 모델 오차의 척도인 평균 제곱근 오차를 포함하는 여러 방법을 통해 평가될 수 있다.

여러 라운드의 실험에 걸쳐, 모델 예측은 표류할 수 있고, 새로운 유전자 변화가 예측 정확도를 향상시키기 위해 훈련 입력에 추가될 수 있다. 이 실시예의 경우, 디자인 변경과 이의 결과로 얻은 성능이 예측 모델에 추가되었다(3316).

서비스로서의 게놈 디자인 및 공학

본 발명의 실시태양에서, 도 21의 LIMS 시스템 소프트웨어(3210)는 도 21의 클라우드 컴퓨팅 시스템(3202)에서 구현되어, 다수의 사용자가 본 발명의 실시태양에 따라 미생물 균주를 디자인 및 제조할 수 있게 한다. 도 21은 본 발명의 실시태양에 따른 클라우드 컴퓨팅 환경(3204)을 도시한다. 도 21에 도시된 것과 같은 클라이언트 컴퓨터(3206)는 인터넷과 같은 네트워크(3208)를 통해 LIMS 시스템에 접근한다. 실시태양에서, LIMS 시스템 애플리케이션 소프트웨어(3210)는 클라우드 컴퓨팅 시스템(3202)에 상주한다. LIMS 시스템은 도 21에 도시된 유형의 하나 이상의 프로세서를 사용하는 하나 이상의 컴퓨팅 시스템을 사용할 수 있다. 클라우드 컴퓨팅 시스템 자체는 네트워크를 통해 LIMS 시스템 어플리케이션(3210)을 클라이언트 컴퓨터(3206)에 인터페이스하는 네트워크 인터페이스(3212)를 포함한다. 네트워크 인터페이스(3212)는 클라이언트 컴퓨터(3206)에서 클라이언트 애플리케이션이 LIMS 시스템 소프트웨어(3210)에 접근할 수 있게 하는 어플리케이션 프로그래핑 인터페이스(API)를 포함할 수 있다. 특히, API를 통해, 네트워크 컴퓨터(3026)는 입력 인터페이스(202), 해석자(204), 실행 엔진(207), 주문 배치 엔진(208), 공장(210)을 구동하는 소프트웨어뿐만 아니라 테스트 장비(212) 및 분석 장비(214)를 제한 없이 포함하는 LIMS 시스템(200)의 구성요소에 접근할 수 있다. 서비스로서 소프트웨어(SaaS) 소프트웨어 모듈(3214)은 클라이언트 컴퓨터(3206)에 서비스로서 LIMS 시스템 소프트웨어(3210)을 제공한다. 클라우드 관리 모듈(3216)은 클라이언트 컴퓨터들(3206)에 의해 LIMS 시스템(3210)에 대한 접근을 관리한다. 클라우드 관리 모듈(3216)은 당업계에 공지된 멀티테넌트 애플리케이션, 가상화 또는 다른 아키텍처를 사용하는 클라우드 아키텍처가 여러 사용자에게 서비스를 제공하는 것을 가능하게 한다.

게놈 자동화

본 발명의 방법의 자동화는 다중 테스트 균주 변이체로부터의 표적 생성물의 높은 처리량의 표현형 선별 및 확인을 동시에 가능하게 한다.

상기한 게놈 공학 예측 모델링 플랫폼은 수백 및 수천 개의 돌연변이체 균주가 고 처리량 방식으로 구축된다는 사실에 전제된다. 아래에 설명된 로봇 및 컴퓨터 시스템은 이런 고 처리량 공정이 수행될 수있는 구조적 메커니즘입니다.

일부 실시태양에서, 본 발명은 숙주 세포 생산성을 개선하거나 산업 균주를 재활시키는 방법을 교시한다. 이 공정의 일부로서, 본 개시는 DNA를 조립하고, 새로운 균주를 제조하고, 플레이트에서 배양물을 선별하고, 탱크 발효 모델에서 배양 물을 선별하는 방법을 교시한다. 일부 실시태양에서, 본 발명은 새로운 숙주 균주를 생성하고 테스트하는 상기한 방법의 하나 이상이 자동화 로봇에 의해 보조되는 것을 교시한다.

HTP 로봇 시스템

일부 실시태양에서, 본 발명의 자동화 방법은 로봇 시스템을 포함한다. 본 발명에 개략된 시스템은 일반적으로 96- 또는 384-웰 미세 역가 플레이트의 사용에 관한 것이지만, 당업자라면 알 수 있듯이, 임의의 수의 상이한 플레이트 또는 구성이 사용될 수 있다. 또한, 본 발명에 개략된 단계의 일부 또는 전부는 자동화될 수 있고, 따라서, 예를 들어, 시스템은 완전히 또는 부분적으로 자동화될 수 있다.

일부 실시태양에서, 본 발명의 자동화 시스템은 하나 이상의 작업 모듈을 포함한다. 예를 들어, 일부 실시태양에서, 본 발명의 자동화 시스템은 DNA 합성 모듈, 벡터 클로닝 모듈, 균주 변형 모듈, 선별 모듈 및 서열화 모듈을 포함한다 (도 5 참조).

당업자가 알 수 있는 바와 같이, 자동화 시스템은 액체 핸드러; 하나 이상의 로봇 암; 마이크로플레이트의 위치 결정을 위한 플레이트 핸들러; 플레이트 씰러 (plate sealers), 플레이트 피어서(plate piercers), 비 교차 오염 플레이트상의 웰을 위한 뚜껑을 제거하고 대체하는 자동화 뚜껑 처리기; 일회용 팁에 의해 샘플 배급을 위한 일회용 팁 어셈블리; 샘플 분배를 위한 세척 가능한 팁 어셈블리; 96 웰 로딩 블록; 통합 열 순환기; 냉각된 시약 랙; 미세적정 플레이트 피펫 위치(선택적으로 냉각됨); 플레이트와 팁을 위한 스태킹 타워; 마그네틱 비드 가공 스테이션; 여과 시스템; 플레이트 교반기; 바코드 판독기 및 애플리케이터; 및 컴퓨터 시스템을 포함하나 이에 제한되지 않는 매우 다양한 구성요소를 포함할 수 있다.

일부 실시태양에서, 본 발명의 로봇 시스템은 유전자 표적화 및 재조합 분야의 공정에서의 모든 단계를 수행하기 위한 고 처리량 피펫팅을 가능하게 하는 자동화된 액체 및 입자 취급을 포함한다. 이것은 흡인, 분배, 혼합, 희석, 세척, 정확한 체적 이동과 같은 액체 및 입자 조작; 피펫 팁의 회수 및 폐기; 단일 샘플 흡인으로 다중 전달을 위한 동일한 부피의 반복적 피펫팅을 포함한다. 이런 조작은 교차 오염이 없는 액체, 입자, 세포 및 유기체 전달이다. 이 장비는 필터, 막 및/또는 도터 플레이트에 대한 마이크로 플레이트 샘플의 자동화 반복, 고밀도 전달, 전체 플레이트 연속 희석 및 고용량 작업을 수행한다.

일부 실시태양에서, 본 발명의 맞춤형 자동화 액체 처리 시스템은 TECAN 머신(예를 들어, 맞춤형 TECAN Freedom Evo)이다.

일부 실시태양에서, 본 발명의 자동화 시스템은 다중 웰 플레이트, 딥 웰 플레이트, 정사각형 플레이트, 시약 트로프, 테스트 튜브, 미니 튜브, 마이크로퓨즈 튜브, 냉동 튜브, 필터, 마이크로 어레이 칩, 광섬유, 비드, 아가로스 및 아크릴 아마이드 겔을 위한 플랫폼과 양립가능하며 다른 고상 매트릭스 또는 플랫폼은 업그레이드 가능한 모듈식 데크에 수용된다. 일부 실시태양에서, 본 발명의 자동화 시스템은 공급원 및 출력 샘플, 시약, 샘플 및 시약 희석액, 분석 플레이트, 샘플 및 시약 저장조, 피펫 팁 및 활성 팁 세척 스테이션을 배치하기 위한 다중 위치 작업 표면을 위한 적어도 하나의 모듈 데크를 포함한다.

일부 실시태양에서, 본 발명의 자동화 시스템은 고 처리량 전기 천공 시스템을 포함한다. 일부 실시태양에서, 고효율 전기 천공 시스템은 96 또는 384-웰 플레이트에서 세포를 형질전환시킬 수 있다. 일부 실시태양에서, 고효율 전기 천공 시스템은 VWR® 고 처리량 전기 천공 시스템, BTX™, Bio-Rad® Gene Pulser MXcell™ 또는 다른 다중-웰 전기 천공 시스템을 포함한다.

일부 실시태양에서, 통합된 열 순환기 및/또는 열 조절기는 0℃ 내지 100℃에서 샘플을 배양하는 정확한 온도 제어를 제공하도록 제어된 블록 또는 플랫폼과 같은 열 교환기의 온도를 안정화하는데 사용된다.

일부 실시태양에서, 본 발명의 자동화 시스템은 액체, 입자, 세포 또는 다중 세포 유기체를 로봇 공학적으로 조작할 수 있는 단일 또는 다중 자기 프로브, 친 화성 프로브, 리플리케이터 또는 피펫터를 갖는 교환 가능한 머신-헤드(단일 또는 다중 채널)과 양립가능하다. 다중 웰 또는 다중 튜브 자기 분리기 및 여과 스테이션은 단일 또는 다중 샘플 형식으로 액체, 입자, 세포 및 유기체를 조작한다.

일부 실시태양에서, 본 발명의 자동화 시스템은 카메라 비전 및/또는 분광계 시스템과 양립가능하다. 따라서, 일부 실시태양에서, 본 발명의 자동화 시스템은 진행중인 세포 배양물에서 색 및 흡수 변화를 검출 및 기록할 수 있다.

일부 실시태양에서, 본 발명의 자동화 시스템은 시스템이 다수의 애플리케이션을 수행할 수 있게 하는 다중 하드웨어 애드온(add-on)으로 융통성 있고 적응할 수 있도록 디자인된다. 소프트웨어 프로그램 모듈은 방법의 생성, 수정 및 실행을 허용한다. 시스템의 진단 모듈은 설정, 장비 정렬 및 모터 작동을 허용한다. 맞춤형 도구, 랩웨어 및 액체 및 입자 전달 패턴은 다양한 응용 프로그램이 프로그램되고 실행되게 한다. 데이터베이스는 방법 및 매개변수 저장을 허용한다. 로봇 및 컴퓨터 인터페이스는 장비 간의 통신을 허용한다.

따라서, 일부 실시태양에서, 본 발명은 도 15 및 16에 도시된 바와 같이 고 처리량 균주 공학 플랫폼을 교시한다.

당업자는 본 발명의 HTP 공학 방법을 수행할 수 있는 다양한 로봇 플랫폼을 인식할 것이다. 아래의 표 3은 도 15 및 16에서 기술된 바와 같이 본 발명의 HTP 공학 단계의 각 단계를 수행할 수 있는 과학적 장비의 포괄적 목록을 제공한다.

[표 3]

본 발명의 HTP 공학 방법과 양립가능한 과학 장비의 포괄적 목록.

컴퓨터 시스템 하드웨어

도 23은 본 발명의 실시태양에 따라 비 일시적 컴퓨터 판독 가능 매체(예를 들어, 메모리)에 저장된 프로그램 코드를 실행하는데 사용될 수 있는 컴퓨터 시스템(800)의 한 예를 도시한다. 컴퓨터 시스템은 애플리케이션에 따라 인간 사용자 및/또는 다른 컴퓨터 시스템과 인터페이스하기 위해 사용될 수 있는 입력/출력 서브 시스템(802)을 포함한다. I/O 서브 시스템(802)은 예를 들어, 입력을 위한 키보드, 마우스, 그래픽 사용자 인터페이스, 터치 스크린, 또는 다른 인터페이스, 및 예를 들어 애플리케이션 프로그램 인터페이스(APIs)를 포함하는 출력을 위한 LED 또는 다른 평면 디스플레이를 포함할 수 있다. LIMS 시스템의 구성요소와 같은 본 발명의 실시태양의 다른 요소는 컴퓨터 시스템(800)과 같은 컴퓨터 시스템으로 구현될 수 있다.

프로그램 코드는 2차 메모리(810) 또는 메인 메모리(808) 또는 둘 다에서 의 영구 저장장치와 같은 비 일시적인 매체에 저장될 수 있다. 메인 메모리 808)는 랜덤 액세스 메모리(RAM)와 같은 휘발성 메모리 또는 리드 온리 메모리(ROM)와 같은 비 휘발성 메모리뿐만 아니라 명령들 및 데이터에 대한보다 빠른 접근를 위한 상이한 수준의 캐시 메모리를 포함할 수 있다. 2차 메모리는 솔리드 스테이트 드라이브, 하드 디스크 드라이브 또는 광 디스크와 같은 영구 저장장치를 포함할 수 있다. 하나 이상의 프로세서(804)는 하나 이상의 비 일시적인 매체로부터 프로그램 코드를 판독하고 컴퓨터 시스템이 본 실시태양에 의해 수행된 방법을 완성할 수 있도록 코드를 실행한다. 당업자는 프로세서(들)가 소스 코드를 섭취하고 소스 코드를 프로세서(들)(804)의 하드웨어 게이트 레벨에서 이해할 수 있는 머신 코드로 해석 또는 컴파일할 수 있다는 것을 이해할 것이다. 프로세서(들)(804)은 컴퓨팅 집약적인 작업을 처리하기 위한 그래픽 처리 장치(GPU)를 포함할 수 있다. 특히, 기계 학습에서, 하나 이상의 CPU(804)는 하나 이상의 GPU(804)로 대량의 데이터 처리를 오프로드할 수 있다.

프로세서(들)(804)는 네트워크 인터페이스 카드, WiFi 트랜시버 등과 같은 하나 이상의 통신 인터페이스(807)를 통해 외부 네트워크와 통신할 수 있다. 버스 (805)는 I/O 서브시스템(802), 프로세서(들)(804), 주변 장치(806), 통신 인터페이스(807), 메모리(808) 및 영구 저장장치(810)와 통신가능하게 연결된다. 본 발명의 실시태양은 이런 대표적 아키텍처에 제한되지 않는다. 대안적 실시태양은 상이한 배열 및 유형의 구성요소, 예를 들어 입출력 구성요소 및 메모리 서브시스템을 위한 개별 버스를 사용할 수 있다.

당업자는 본 발명의 실시태양의 요소의 일부 또는 전부 및 이들의 수반되는 작업이 컴퓨터 시스템(800)의 하나 이상의 프로세서 및 하나 이상의 메모리를 포함하는 하나 이상의 컴퓨터 시스템에 의해 전체적으로 또는 부분적으로 구현될 수 있다는 것을 이해할 것이다. 특히, LIMS 시스템(200)의 요소 및 본 발명에 기술된 임의의 로봇 및 다른 자동화 시스템 또는 장치는 컴퓨터로 구현될 수 있다. 일부 요소 및 기능은 국소적으로 구현될 수 있고, 다른 것들은 예를 들어, 클라이언트- 서버 방식과 같은, 상이한 서버를 통해 네트워크 도처에 분산된 방식으로 구현될 수 있다. 특히 도 21과 같이, 서버 측 작업은 서비스로서 소프트웨어(SaaS) 방식으로 여러 클라이언트에 이용될 수 있다.

본 내용에서 구성요소라는 용어는 소프트웨어, 하드웨어 또는 펌웨어(또는 이들의 임의의 조합) 구성요소를 포괄적으로 의미한다. 구성요소는 일반적으로 지정된 입력(들)을 사용하여 유용한 데이터 또는 다른 출력을 생성할 수 있는 기능적 구성요소이다. 구성요소는 자급식일 수 있거나 아닐 수 있다. 애플리케이션 프로그램("애플리케이션"이라고도 함)은 하나 이상의 구성요소를 포함할 수 있으며 구성요소는 하나 이상의 애플리케이션 프로그램을 포함할 수 있다.

일부 실시태양은 다른 모듈 또는 애플리케이션 구성요소와 함께 구성요소의 일부, 전부를 포함하거나 하나도 포함하지 않는다. 여전히, 다양한 실시태양은 이들 구성요소의 둘 이상을 단일 모듈에 통합하고 및/또는 이들 구성요소의 하나 이상의 기능의 일부를 다른 구성요소와 연관시킬 수 있다.

용어 "메모리"는 정보를 저장하기 위해 사용되는 임의의 장치 또는 메커니즘일 수 있다. 본 발명의 일부 실시태양에 따르면, 메모리는 휘발성 메모리, 비 휘발성 메모리 및 동적 메모리의 임의의 유형을 포함하나 이에 제한되는 것은 아니다. 예를 들어, 메모리는 랜덤 액세스 메모리, 메모리 저장 장치, 광학 메모리 장치, 자기 매체, 플로피 디스크, 자기 테이프, 하드 드라이브, SIMMs, SDRAM, DIMMs, RDRAM, DDR RAM, SODIMMS, 지울 수 있는 프로그램가능한 리드 온리 메모리(EPROMs), 전기적으로 지울 수 있는 프로그램가능한 리드 온리 메모리(EEPROMs), 컴팩트 디스크, DVDs 및/또는 이와 동일한 종류일 수 있다. 일부 실시태양에 따르면, 메모리는 하나 이상의 디스크 드라이브, 플래시 드라이브, 데이터베이스, 로컬 캐시 메모리, 프로세서 캐시 메모리, 관계형 데이터베이스, 플랫 데이터베이스, 서버, 클라우드 기반 플랫폼 및/또는 이와 동일한 종류를 포함할 수 있다. 또한, 당업자는 정보를 저장하기 위한 많은 부가적인 장치 및 기술이 메모리로서 사용될 수 있다는 것을 이해할 것이다.

메모리는 프로세서 상의 하나 이상의 애플리케이션 또는 모듈을 실행하기 위한 명령을 저장하는데 사용될 수 있다. 예를 들어, 일부 실시태양에서 메모리는 본 발명에 개시된 하나 이상의 모듈 및/또는 애플리케이션의 기능을 실행하는데 필요한 명령의 전부 또는 일부를 수용하기 위해 사용될 수 있다.

유전자 디자인 예측을 기반으로 하는 HTP 미생물 균주 공학: 예시적 작업 흐름

일부 실시태양에서, 본 발명은 본 발명의 전산 분석 시스템의 권고에 기초한 새로운 숙주 유기체의 지시된 공학을 교시한다.

일부 실시태양에서, 본 발명은 모든 유전자 디자인 및 클로닝 방법과 양립할 수 있다. 즉, 일부 실시태양에서, 본 발명은 폴리머라제 연쇄 반응, 제한 효소 절단, 결찰, 상동성 재조합, RT PCR 및 당업계에 일반적으로 공지된 다른 기술과 같은 전통적인 클로닝 기술의 사용을 교시하고 예를 들어 참조로 본 발명에 포함된 Sambrook et al. (2001) Molecular Cloning: A Laboratory Manual(3^rd ed., Cold Spring Harbor Laboratory Press, Plainview, New York에 기술된다.

일부 실시태양에서, 복제된 서열은 본 발명에서 교시된 임의의 HTP 유전자 디자인 라이브러리, 예를 들면: 프로모터 스왑 라이브러리로부터의 프로모터, SNP 스왑 라이브러리로부터의 SNP, 개시/중지 코돈 변화 라이브러리로부터의 개시 또는 중지 코돈, STOP 스왑 라이브러리의 터미네이터, 서열 최적화 라이브러리로부터의 서열 최적화 또는 트랜스포존 돌연변이유발 라이브러리로부터의 트래스포존의 임의의 것으로부터 가능성을 포함할 수 있다.

또한, 특정 구조체에 포함되어야 하는 정확한 서열 조합은 상위성 맵핑 기능에 의해 통지될 수 있다.

다른 실시태양에서, 복제된 서열은 합리적인 디자인(가설-주도적) 및/또는 과학 출판물과 같은 다른 소스에 기초한 서열에 기초한 서열을 또한 포함할 수 있다.

일부 실시태양에서, 본 발명은 i) 맞춤형 SNP 특이적 DNA를 생성하는 단계, ii) SNP 특이적 플라스미드를 조립하는 단계, (iii) SNP 특이적 DNA로 표적 숙주 세포를 형질전환시키는 단계, 및 iv) 모든 선택 마커를 루프아웃하는 단계를 포함하는 지시된 공학의 방법을 교시한다(도 2 참조).

도 4a는 DNA의 획득 및 조립, 벡터의 조립, 숙주 세포의 형질전환 및 선택 마커의 제거를 포함하는 본 발명의 균주 공학 방법의 일반적인 작업 흐름을 도시한다.

특정 DNA 올리고 뉴클레오타이드 제조

일부 실시태양에서, 본 발명은 숙주 세포 유기체의 DNA 절편을 삽입 및/또는 교체 및/또는 변경 및/또는 삭제하는 것을 교시한다. 일부 양태에서, 본 발명에 교시된 방법은 숙주 유기체의 게놈 속에 포함될 관심 올리고뉴클레오타이드(즉, 표적 DNA 절편)를 제조하는 것을 포함한다. 일부 실시태양에서, 본 발명의 표적 DNA 절편은 공지된 주형으로부터의 복제 또는 절단, 돌연변이 또는 DNA 합성을 포함하여 당업계에 공지된 임의의 방법을 통해 얻을 수있다. 일부 실시태양에서, 본 발명은 표적 DNA 서열(예를 들어, GeneArt™, GeneMaker™,　GenScript™, Anagen™, Blue Heron™, Entelechon™, GeNOsys, Inc., 또는 Qiagen™)을 생산하기 위한 상업적으로 구입가능한 유전자 합성 생성물과 양립가능하다.

일부 실시태양에서, 표적 DNA 절편은 숙주 유기체의 선택된 DNA 영역에 SNP를 포함시키도록(예를 들어, 유익한 SNP를 첨가하여) 디자인된다. 다른 실시태양에서, DNA 절편은 숙주 유기체의 DNA로부터 SNP를 제거하도록(예를 들어, 해로운 또는 중성 SNP를 제거하도록) 디자인된다.

일부 실시태양에서, 본 발명의 방법에서 사용된 올리고뉴클레오타이드는 당 업계에 공지된 효소적 또는 화학적 합성 방법 중 임의의 방법을 사용하여 합성될 수 있다. 올리고뉴클레오타이드는 제어된 공극 유리(CPG), 폴리스티렌 비드 또는 CPG를 함유할 수 있는 열가소성 폴리머로 구성된 막과 같은 고체 지지체 상에서 합성될 수 있다. 올리고 뉴클레오타이드는 미세유체역학(Tian et al., Mol. BioSyst., 5, 714-722 (2009)) 또는 둘 다의 조합을 제공하는 공지된 기술(Jacobsen et al., 미국 특허 출원 제 2011/0172127호 참조)을 사용하여 병렬 마이크로스케일로 어레이 상에서 합성될 수 있다.

어레이 상에 또는 미세유체역학을 통한 합성은 보다 낮은 시약 사용을 통해 비용을 감소시킴으로써 통상적인 고체 지지체 합성에 비해 이점을 제공한다. 유전자 합성에 필요한 규모는 작아서, 어레이 또는 미세유체역학을 통해 합성된 올리고 뉴클레오타이드 생성물의 규모가 허용가능하다. 그러나, 합성된 올리고뉴클레오타이드는 고체 지지체 합성을 사용할 때보다 품질이 떨어진다(이하의 Tian 참조; 또한 Staehler et al., U.S. Pat. App. No. 2010/0216648 참조).

퍼옥시 음이온 탈보호를 사용하여 1980년대에 처음으로 기술되었기 때문에 종래의 4단계 포스포아미다이트 화학에서 많은 발전이 이루어져왔다(예를 들어, Sierzchala, et al.　J. Am. Chem. Soc.,　125, 13427-13441 (2003) using peroxy anion deprotection; Hayakawa et al., U.S. Pat. No. 6,040,439 for alternative protecting groups; Azhayev et al,　Tetrahedron　57, 4977-4986 (2001) for universal supports; Kozlov et al.,　Nucleosides, Nucleotides, and Nucleic Acids,　24 (5-7), 1037-1041 (2005) for improved synthesis of longer oligonucleotides through the use of large-pore CPG; and Damha et al.,　NAR,　18, 3813-3821 (1990) for improved derivatization 참조)

합성 유형에 관계없이, 생성된 올리고뉴클레오타이드는 보다 긴 올리고뉴클레오타이드를 위한 더 작은 빌딩 블록을 형성할 수 있다. 일부 실시태양에서, 더 작은 올리고뉴클레오타이드는 폴리머라제 연쇄 조립(PCA), 리가아제 연쇄 반응 (LCR) 및 열역학적으로 균형 잡힌 인사이드-아웃 합성(TBIO)과 같은 당업계에 공지 된 프로토콜을 사용하여 함께 결합될 수 있다(Czar et al. Trends in Biotechnology, 27, 63-71 (2009) 참조). PCA에서, 원하는 긴 제품의 전체 길이에 걸쳐있는 올리고뉴클레오타이드는 어닐링되고 여러 사이클(일반적으로 약 55 사이클)에서 연장되어 전장 생성물을 최종적으로 얻는다. LCR은 리가아제 효소를 사용하여 제 3 올리고뉴클레오타이드에 모두 어닐링되는 두 올리고뉴클레오타이드에 연결시킨다. TBIO 합성은 목적 생성물의 중심에서 시작하여 유전자의 5' 말단에서 포워드 가닥과 상동성이고 유전자의 3' 말단에서 리버스 가닥과 상동성인 중첩 올리고뉴클레오타이드를 사용함으로써 점진적으로 양방향으로 연장된다.

더 큰 이중 가닥 DNA 단편을 합성하는 다른 방법은 상위-가닥 PCR(TSP)을 통해 더 작은 올리고뉴클레오타이드를 조합하는 것이다. 이 방법에서, 복수의 올리고뉴클레오타이드는 원하는 생성물의 전체 길이에 걸쳐 있고 인접한 올리고뉴클레오타이드(들)에 중첩 영역을 포함한다. 증폭은 범용 포워드 및 리버스 프라이머로 수행될 수 있으며, 증폭의 다중 사이클을 통해 전장 이중 가닥 DNA 생성물이 형성된다. 이런 생성물은 선택적인 오류 보정 및 원하는 이중 가닥 DNA 단편 최종 생성물을 생성하는 추가 증폭을 진행될 수 있다.

TSP의 한 방법에서, 전장의 원하는 생성물을 형성하도록 결합되어질 더 작은 올리고뉴클레오타이드의 세트는 40-200 염기 길이이고 적어도 약 15-20 염기만큼 서로 중첩된다. 실제적인 목적을 위해, 중첩 영역은 올리고뉴클레오타이드의 특정 어닐링을 보장할만큼 충분히 길어야 하고 사용된 반응 온도에서 어닐링하기에 충분한 높은 용융 온도(T_m)를 가져야 한다. 중첩은 소정의 올리고뉴클레오타이드가 인접한 올리고뉴클레오타이드에 의해 완전히 중첩되는 지점까지 연장될 수 있다. 중첩의 양은 최종 생성물의 품질에 영향을 미치지 않는 것으로 보입니다. 어셈블리의 첫 번째 및 마지막 올리고뉴클레오타이드 빌딩 블록은 포워드 및 리버스 증폭 프라이머에 대한 결합 위치를 포함해야 한다. 하나의 실시태양에서, 첫 번째 및 마지막 올리고뉴클레오타이드의 최종 말단 서열은 보편적 프라이머의 사용을 허용하도록 상보성의 동일한 서열을 포함한다.

맞춤형 플라스미드 조립/복제

일부 실시태양에서, 본 발명은 숙주 유기체의 게놈에 원하는 표적 DNA 부분(예를 들어, 특정 SNP 또는 트랜스포존을 포함)을 삽입할 수 있는 벡터를 제조하는 방법을 교시한다. 일부 실시태양에서, 본 발명은 표적 DNA, 상동성 암 및 적어도 하나의 선택 마커를 포함하는 벡터를 복제하는 방법을 교시한다(도 3 참조).

일부 실시태양에서, 본 발명은 숙주 유기체로의 형질전환에 적합한 임의의 벡터와 양립가능하다. 일부 실시태양에서, 본 발명은 숙주 세포와 양립가능한 셔틀 벡터의 사용을 교시한다. 한 실시태양에서, 본 발명에 제공된 방법에서 사용하기 위한 셔틀 벡터는 대장균 및/또는 코리네박테리움 숙주 세포와 양립가능한 셔틀 벡터이다. 본 발명에 제공된 방법에서 사용하기 위한 셔틀 벡터는 본 발명에 기술된 바와 같은 선택 및/또는 역-선택을 위한 마커를 포함할 수 있다. 표지는 당업계에 공지된 및/또는 본 발명에 제공된 임의의 마커일 수 있다. 셔틀 벡터는 당업계에 공지된 바와 같은 상기 셔틀 벡터의 어셈블리에 유용한 임의의 조절 서열(들) 및/또는 서열을 추가로 포함할 수 있다. 셔틀 벡터는 예를 들어 대장균 또는 C. 글루 타미쿰과 같은 본 발명에 제공된 바와 같은 숙주 세포에서 증식에 필요할 수 있는 임의의 복제 기점을 추가로 포함할 수 있다. 조절 서열은 숙주 세포의 유전자 기구에 의해 사용된 프로모터, 개시, 중지, 신호, 분비 및/또는 종결 서열과 같은 당업계에 공지되거나 본 발명에 제공되는 임의의 조절 서열일 수 있다. 특정 예에서, 표적 DNA는 상업용 벡터(예를 들어, DNA2.0 맞춤형 또는 GATEWAY® 벡터)와 같은 임의의 저장소 또는 카탈로그 생성물로부터 얻을 수 있는 벡터, 구조체 또는 플라스미드에 삽입될 수 있다.

일부 실시태양에서, 본 발명의 조립/복제 방법은 다음 조립 전략: i) II형 통상적인 복제, ii) II형 S-매개 또는 "골든 게이트" 복제(예를 들어, Engler, C., R. Kandzia, and S. Marillonnet. 2008 "A one pot, one step, precision　cloning method with high-throughput capability". PLos One 3:e3647; Kotera, I., and T. Nagai. 2008 "A high-throughput and single-tube recombination of crude PCR products using a DNA polymerase inhibitor and type IIS　restriction enzyme." J Biotechnol 137:1-7.; Weber, E., R. Gruetzner, S. Werner, C. Engler, and S. Marillonnet. 2011 Assembly of Designer TAL Effectors by　Golden Gate　Cloning. PloS One 6:e19722 참조), iii) GATEWAY® 재조합, iv) TOPO® 복제, 엑소뉴클레아제 매개 어셈블리(Aslanidis and de Jong 1990. "Ligation-independent　cloning　of PCR products (LIC-PCR)." Nucleic Acids Research, Vol. 18, No. 20 6069), v) 상동성 재조합, vi) 비 상동성 말단 결합, vii) 깁슨 어셈블리(Gibson et al., 2009 "Enzymatic assembly of DNA molecules up to several hundred kilobases" Nature Methods 6, 343-345) 또는 이의 조합의 적어도 하나를 사용할 수 있다. 모듈형 IIS 기반 조립 전략은 PCT 공개공보 WO 2011/154147에 개시되며, 그 내용은 본 발명에 참고로 포함된다.

일부 실시태양에서, 본 발명은 하나 이상의 선별 마커를 갖는 벡터의 클로닝을 교시한다. 다양한 선택 마커 유전자는 선택적 압력하에서 원핵생물 세포(예를 들어, 암피실린, 카나마이신, 테트라사이클린, 클로람페니콜, 제오신, 스펙티노마이신/스트렙토마이신) 또는 진핵생물 세포(예컨대, 제네티신, 네오마이신, 하이그로마이신, 푸로마이신, 블라스티시딘, 제오신)에서 선택을 위한 항생제 저항을 암호화하는 것이 당업계에 주지되어 있다. 다른 마커 시스템은 성공적으로 형질유도된 숙주 세포에서 발현된 녹색 또는 적색 형광 단백질과 같은 X-gal 또는 형광 리포터(fluorescent reporter)의 존재하에서 양성 클론을 선택하기 위해 박테리아에서 사용된 주지된 청색/백색 선별 시스템과 같은 원하거나 원하지 않는 세포의 선별 및 확인을 허용한다. 대다수가 원핵생물 시스템에서만 기능하는 선택 마커의 또 다른 부류는 생산자 세포를 죽이는 독성 유전자 생성물을 발현하는 "사멸 유전자"라고도하는 역 선택가능한 마커 유전자에 관한 것이다. 이러한 유전자의 예는 sacB, rpsL (strA), tetAR, pheS, thyA, gata-1 또는 ccdB를 포함하며, 그 기능은 (Reyrat et al. 1998 "Counterselectable Markers: Untapped Tools for Bacterial Genetics and Pathogenesis." Infect Immun. 66(9): 4011-4017)에 설명된다.

원형질체화 방법

한 실시태양에서, 본 발명에 제공된 방법 및 시스템은 사상균류 세포로부터의 원형질체의 생성을 이용한다. 원형질체의 제조에 적합한 절차는 예를 들어 EP 238,023 및 Yelton et al.(1984, Proc. Natl. Acad. Sci. USA 81:1470-1474)에 기술된 것을 포함하는 당업계에 공지된 임의의 방법일 수 있다. 한 실시태양에서, 원형질체는 사상균류 세포의 배양물을 하나 이상의 용균 효소 또는 이의 혼합물로 처리함으로써 생성된다. 용균 효소는 베타-글루카나아제 및/또는 폴리갈락투로나제일 수 있다. 한 실시태양에서, 원형질체 생성용 효소 혼합물은 비노테이스트(VinoTaste) 농축물이다. 효소 처리 후, 원형질체는 예를 들어 원심분리와 같은 당업계에 공지된 방법을 사용하여 분리될 수 있다.

전 배양 및 실제 원형질화 단계는 원형질체의 수 및 형질전환 효율을 최적화하도록 변형될 수 있다. 예를 들어, 접종물 크기, 접종물 방법, 전 배양 배지, 전 배양 시간, 배양 전 온도, 혼합 조건, 세척 완충액 조성물, 희석 비, 용균 효소 처리 동안 완충제 조성물 사용된 용균 효소의 형태 및/또는 농도, 용균 효소에 의한 배양 시간, 원형질체 세척 절차 및/또는 완충액, 실제 형질전환 동안 원형질체 및/또는 폴리뉴클레오타이드 및/또는 형질전환 시약의 농도, 형질전환 동안 물리적 매개변수, 얻어진 형질전환체까지의 형질전환 이후 절차의 변형이 존재할 수 있다.

원형질체는 삼투압 안정화 완충액에 재현탁될 수 있다. 이런 완충액의 조성물은 종, 응용분야 및 필요에 따라 달라질 수 있다. 그러나, 전형적으로, 이런 완충액은 0.5 내지 2M 사이의 수크로오스, 시트레이트, 만니톨 또는 소르비톨과 같은 유기 성분을 함유한다. 더욱 바람직하게는 0.75 내지 1.5 M; 가장 바람직하게는 1M이다. 그렇지 않으면 이들 완충액은 KCl, MgSO₄, NaCl 또는 MgCl₂와 같은 무기 삼투압 안정화 성분을 0.1 내지 1.5M의 농도로 함유한다. 바람직하게는 0.2 내지 0.8M; 보다 바람직하게는 0.3 내지 0.6M, 가장 바람직하게는 0.4M이다. 가장 바람직한 안정화 완충액은 STC(소르비톨, 0.8M, CaCl₂, 25mM, 트리스, 25mM, pH 8.0) 또는 KCl- 시트레이트(KCl, 0.3-0.6M; 시트레이트, 0.2%(w/v))이다. 원형질체는 1 x 10⁵내지 1 x 10¹⁰ cells/ml 사이의 농도로 사용될 수 있다. 바람직하게는, 농도는 1 x 10⁶ 내지 1 x 10⁹이고; 보다 바람직하게는 농도는 1 x 10⁷ 내지 5 x 10⁸이고; 가장 바람직하게는 농도는 1 x 10⁸ cells/ml이다. DNA는 0.01 내지 10㎍; 바람직하게는 0.1 내지 5㎍; 보다 더 바람직하게는 0.25 내지 2㎍; 가장 바람직하게는 0.5 내지 1㎍의 농도로 사용된다. 형질감염의 효율을 높이기 위해 운반체 DNA(연어 정자 DNA 또는 비 암호화 벡터 DNA)가 형질전환 혼합물에 첨가될 수 있다.

한 실시태양에서, 생성 및 후속 분리 후에, 원형질체는 하나 이상의 동결방지제와 혼합된다. 동결방지제는 글리콜, 다이메틸 설폭사이드(DMSO), 폴리올, 당, 2-메틸-2,4-펜테인다이올(MPD), 폴리바이닐피롤리돈(PVP), 메틸셀룰로오스, C-결합 부동액 당단백질(C-AFGP) 또는 이의 조합일 수 있다. 본 발명에 제공된 방법 및 시스템에서 동결방지제로서 사용하기 위한 글리콜은 에틸렌 글리콜, 프로필렌 글리콜, 폴리프로필렌 글리콜(PEG), 글리세롤 또는 이들의 조합으로부터 선택될 수 있다. 본 발명에 제공된 방법 및 시스템에서 동결방지제로서 사용하기 위한 폴리올은 프로페인-1,2-다이올, 프로페인-1,3-다이올, 1,1,1-트리스-(하이드록시메틸)에테인(THME) 및 2-에틸-2-(하이드록시메틸)-프로페인-1,3-다이올(EHMP) 또는 이의 조합으로부터 선택될 수 있다. 본 발명에 제공된 방법 및 시스템에서 동결방지제로서 사용하기위한 당은 트레할로오스, 수크로오스, 글루코오스, 라피노오스, 덱스트로오스 또는 이의 조합으로부터 선택될 수 있다. 한 실시태양에서, 원형질체는 DMSO와 혼합된다. DMSO는 적어도, 최대, 미만, 초과, 동일 또는 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 12.5%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 또는 75% w/v 또는 v/v의 최종 농도로 원형질체와 혼합될 수 있다. 원형질체/동결방지제(예를 들어, DMSO) 혼합물은 저장 전에 미세역가 플레이트에 분배될 수 있다. 원형질체/동결방지제(예를 들어, DMSO) 혼합물은 예를 들어 -20℃ 또는 -80℃와 같이 본 발명에 제공된 바와 같이 장기간 보존(예를 들어, 몇 시간, 일(들), 주(들), 달(들), 년(들))을 위해 본 발명에 제공된 임의의 온도로 저장될 수 있다. 한 실시태양에서, 추가의 동결방지제(예를 들어, PEG)가 원형질체/DMSO 혼합물에 첨가된다. 또 다른 실시태양에서, 추가의 동결 방지제(예를 들어, PEG)는 저장 전에 원형질체/DMSO 혼합물에 첨가된다. PEG는 본 발명에 제공된 임의의 PEG일 수 있으며 본 발명에 제공된 바와 같이 임의의 농도(예를 들어, w/v 또는 v/v)로 첨가될 수 있다.

원형질체 형질전환 방법

하나의 실시태양에서, 본 발명에 제공된 방법 및 시스템은 본 발명에 기술된 바와 같이 사상균류 세포로부터 유도된 원형질체에 대한 핵산의 전달을 필요로 한다. 또 다른 실시태양에서, 본 발명에 제공된 방법 및 시스템에 의해 이용되는 형질전환은 본질적으로 고 처리량이고 및/또는 본 발명에 기술된 바와 같이 부분적으로 또는 완전히 자동화된다. 이 실시태양에 추가하여, 형질전환은 본 발명에 기술된 바와 같이 구조체 또는 발현 구조체를 미세적정 플레이트에 첨가하고 본 발명에 제공된 방법에 의해 생성된 원형질체를 미세적정 플레이트의 각 웰에 분취함으로써 수행된다. 원형질체의 형질전환/형질감염을 위한 적절한 절차는, 예를 들어, 국제 특허 출원 PCT/NL99/00618, PCT/EP99/202516, Finkelstein and Ball (eds.), Biotechnology of filamentous fungi, technology and products, Butterworth-Heinemann (1992), Bennett and Lasure (eds.) More Gene Manipulations in fungi, Academic Press (1991), Turner, in: Puhler (ed), Biotechnology, second completely revised edition, VHC (1992) protoplast fusion, 및 EP635574B에 기술된 the Ca-PEG mediated protoplast transformation에 기술된 것을 포함하는 당업계에 공지된 임의의 것일 수 있다. 대안적으로, 사상균류 숙주 세포 또는 이로부터 유도된 원형질체의 형질전환은 또한, 예를 들어 Chakraborty 및 Kapoor, Nucleic Acids Res. 18:6737(1990)에 의해 기술된 전기천공과 같은 전기천공, 예를 들어 Christiansen et al., Curr. Genet. 29:100 102 (1995); Durand et al., Curr. Genet. 31:158 161 (1997); and Barcellos et al., Can. J. Microbiol. 44:1137 1141 (1998)에 기술된 DNA의 아그로박테리움 투메파시엔스 매개 형질전환, 탄도 도입 또는 예를 들어 미국특허 제5,516,670호 및 제5,753,477호에 기술된 세포의 "자기-탄도" 형질감염에 의해 실행될 수 있다. 한 실시태양에서, 본 발명에 제공된 방법 및 시스템에서 사용되는 형질전환 절차는, 예를 들어 PEG 매개 형질전환과 같이 본 발명에 제공되는 바와 같이 고 처리량 및/또는 자동화될 수 있는 것이다.

본 발명에 기술된 방법을 사용하여 생성된 원형질체의 형질전환은 당업계에 공지된 임의의 형질전환 시약의 사용을 통해 촉진될 수 있다. 적절한 형질전환 시약은 폴리에틸렌 글리콜(PEG), FUGENE® HD(Roche), Lipofectamine® 또는 OLIGOFECTAMINE®(Invitrogen), TRANSPASS®D1(New England Biolabs), LYPOVEC® 또는 LIPOGEN®(Invivogen)으로부터 선택될 수 있다. 한 실시태양에서, PEG가 가장 바람직한 형질전환/형질감염 시약이다. PEG는 다른 분자량으로 이용할 수 있으며 다른 농도로 사용될 수 있다. 바람직하게는 PEG 4000은 10% 내지 60%, 보다 바람직하게는 20% 내지 50%, 가장 바람직하게는 30%로 사용된다. 한 실시태양에서, PEG는 본 발명에 기술된 바와 같이 저장 전에 원형질체에 첨가된다.

숙주 세포의 형질전환

일부 실시태양에서, 본 발명의 벡터는 형질전환, 형질감염, 형질도입, 바이러스 감염, 유전자 총 또는 Ti 매개 유전자 전달을 포함하는 임의의 다양한 기술을 사용하여 숙주 세포에 도입될 수 있다(Christie , PJ, and Gordon, JE, 2014 "Agrobacterium Ti Plasmids"Microbiol SPectr. 2014; 2 (6); 10.1128 참조). 특정 방법은 인산 칼슘 형질감염, DEAE-덱스트란 매개 형질감염, 리포펙션 또는 전기천공을 포함한다(Davis, L., Dibner, M., Battey, I. 1986 "Basic Methods in Molecular Biology"). 형질전환의 다른 방법은 예를 들어, 아세트산 리튬 형질전환 및 전기천공을 포함한다. 예를 들어, Gietz et al.,　Nucleic Acids Res.　27:69-74 (1992); Ito et al.,　J. Bacterol.　153:163-168 (1983); and Becker and Guarente,　Methods in Enzymology　194:182-187 (1991) 참조. 일부 실시태양에서, 형질전환된 숙주 세포는 재조합 숙주 균주로 불린다.

일부 실시태양에서, 본 발명은 본 발명의 96-웰 플레이트 로봇 플랫폼 및 액체 처리 기계를 사용하는 세포의 고 처리량 형질전환을 교시한다.

일부 실시태양에서, 본 발명은 상기한 바와 같이 하나 이상의 선택 마커로 형질전환된 세포를 선별하는 것을 교시한다. 이런 한 실시태양에서, 카나마이신 내성 마커(KanR)를 포함하는 벡터로 형질전환된 세포는 유효량의 카나마이신 항생제를 함유하는 배지 상에 덮인다. 카나마이신-레이스(kanamycin-laced) 배지에서 볼 수 있는 콜로니 형성 단위는 벡터 카세트를 게놈에 통합시킨 것으로 추정된다. 원하는 서열의 삽입은 PCR, 제한 효소 분석 및/또는 관련 삽입 위치의 서열화를 통해 확인될 수 있다.

선택된 서열의 루핑 아웃

일부 실시태양에서, 본 발명은 숙주 유기체로부터 DNA의 선택된 영역을 루핑 아웃하는 방법을 교시한다. 루핑 아웃 방법은 Nakashima et al. 2014 "Bacterial Cellular Engineering by Genome Editing and Gene Silencing." Int. J. Mol. Sci. 15(2), 2773-2793에 기술될 수 있다. 일부 실시태양에서, 본 발명은 양성 형질전환 체로부터 선택 마커를 루핑 아웃하는 것을 교시한다. 루핑 아웃 결실 기술은 당해 분야에 공지되어 있으며 (Tear et al. 2014 "Excision of Unstable Artificial Gene-Specific inverted Repeats Mediates Scar-Free Gene Deletions in Escherichia coli." Appl. Biochem. Biotech. 175:1858-1867)에 기술된다. 본 발명에서 제공된 방법에 사용된 루핑 아웃 방법은 단일-교차 상동성 재조합 또는 이중-교차 상동성 재조합을 사용하여 수행될 수 있다. 한 실시태양에서, 본 발명에 기술된 바와 같이 선택된 영역을 루핑하는 것은 본 발명에 기술된 바와 같이 단일-교차 상동성 재조합을 사용하는 것을 수반할 수 있다.

먼저, 루프 아웃 벡터가 (예를 들어 상동성 재조합, CRISPR 또는 다른 유전자 편집 기술을 통해) 숙주 유기체의 게놈 내의 선택된 표적 영역 내로 삽입된다. 한 실시태양에서, 단일-교차 상동성 재조합이 도 3에 도시된 바와 같은 원형 플라스미드 또는 벡터를 루프-인시키기 위해 원형 플라스미드 또는 벡터와 숙주 세포 게놈 사이에 사용된다. 삽입된 벡터는 현존하는 또는 숙주 서열 근처에 도입된 직접 반복체인 서열을 갖도록 디자인되어, 직접 반복체가 루핑 및 결실이 예정된 DNA의 영역에 인접하게 된다. 일단 삽입되면, 루프 아웃 플라스미드 또는 벡터는 선택 영역의 결실을 위해 역 선택될 수 있다.

당업자는 루프 아웃 절차의 설명이 게놈으로부터 원하지 않는 영역을 삭제하는 하나의 예시적인 방법을 나타내는 것을 인식할 것이다. 실제로, 본 발명의 방법은 CRISPR, TALENS, FOK 또는 다른 엔도뉴클레아제를 통한 유전자 편집을 포함하나 이에 제한되지 않는 게놈 결실에 대한 임의의 방법과 양립될 수 있다. 당업자는 상 동성 재조합 기술을 통해 게놈의 원하지 않는 영역을 대체할 수 있는 능력을 인식할 것이다

실시예

하기 실시예는 본 발명의 다양한 실시태양을 설명하기 위해 제공되며 어떠한 방식으로든 본 발명을 제한하려는 것은 아니다. 청구항의 범위에 의해 정의된 바와 같이, 본 발명의 취지 내에 포함되는 변경 및 다른 용도는 당업자에 의해 인식될 것이다.

아래에서 단지 독자를 돕기 위해 내용의 간략한 표가 제공된다. 이런 표의 내용의 어떤 것도 본 출원의 실시예 또는 설명의 범위를 제한하지 않는다.

실시예 부분에 대한 내용의 표

실시예 #	제목	간략한 설명
1	HTP 게놈 공학 - 사카로폴리스포라 스피노사(Saccharopolyspora spinosa)에서 균주 성능을 향상시키기 위해 트랜스포존 돌연변이유발 라이브러리 구현	스피노신을 생산하는 사카로폴리스포라 스피노사의 성능을 개선하기 위한 트랜스포존 돌연변이유발 기술의 구현을 기술한다.
2	HTP 게놈 공학 - 대장균에서 균주 성능을 향상시키기 위해 트랜스포존 돌연변이유발 라이브러리 구현	대장균에서 트랜스포존 돌연변이유발 라이브러리를 생성하기 위한 트랜스포존 돌연변이유발 기술의 구현을 기술한다.

실시예 1 - HTP 게놈 공학 - 사카로폴리스포라에서 균주 성능을 개선시키기 위한 트랜스포존 돌연변이유발 라이브러리의 구현

이 실시예는 에스. 스피노사(S. spinosa)에서 생체 내 트랜스포존 돌연변이 발에 의해 균주 라이브러리를 생성하는 방법을 기술한다. 개선된 표현형을 나타내는 균주(예를 들어, 스피노신과 같은 특정 화합물의 역가)를 식별하기 위해 최종 라이브러리를 선별할 수 있다.

균주는 순환 공학의 라운드에서 또는 균주 성능에 기여하는 유전자형을 해독하기 위해 추가로 사용될 수 있다. 라이브러리 내의 균주는 또한 하나 이상의 원하는 화합물의 생산이 증가된 개선된 균주를 생성하기 위해 상이한 유전자 교란을 갖는 다른 균주와의 통합에 사용될 수 있다.

따라서, 본 발명은 에스. 스피노사에서 EZ-Tn5 트랜스포솜 시스템(Epicenter Bio)을 사용하여 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 방법을 설명한다. 트랜스포사제 효소는 먼저 모자이크 요소(ME) 서열에 의해 플랭킹된 DNA 페이로드 서열과 복합체화되고 최종 단백질-DNA 복합체는 세포로 형질전환된다. 이것이 DNA 페이로드의 유기체의 게놈 DNA로의 무작위로 통합을 초래한다.

도입될 페이로드에 따라, 기능 상실(LoF) 라이브러리 또는 기능 획득(GoF) 라이브러리가 생산될 수 있다.

기능 상실(LoF) 트랜스포존 라이브러리 - 다양한 표현형 반응을 이끌어 내기 위해 페이로드의 서열이 변경될 수 있다. 기능 상실(LoF) 라이브러리의 기본 경우, 이 페이로드는 성공적인 트랜스포존 통합 이벤트의 선택을 가능하게 하는 마커를 포함한다.

트랜스포존 돌연변이유발 라이브러리를 생성하기 위해 Tn5 트랜스포사제 시스템(EZ-Tn5; EpiCentre®)을 사용하여 미생물 내에서 생체 내로 무작위 기능 상실 돌연변이가 이루어질 수 있다. EZ-Tn5 트랜스포사제 시스템은 안정적이고 전기천공에 의해 살아있는 미생물에 도입될 수 있다. 세포 내에서, 트랜스포존 시스템은 숙주 세포에서 Mg2+에 의해 활성화되고 트랜스포존은 숙주의 게놈 DNA에 무작위로 삽입된다.

기능 획득(GoF) 트랜스포존 라이브러리 - GoF 라이브러리를 생성하기 위해, 예를 들어, 프로모터 요소 또는 용해도 태그(이 경우에, 기능 획득 용해도 태그 트랜스포존으로 불림)와 같은 추가 특징 및 선택 가능한 마커를 함유하는 페이로드의 일부의 루프-아웃을 용이하게 하는 역 선택 가능한 마커를 혼입시킴으로써, 기본 경우에 따라 제작된 유전자 페이로드의 더욱 복잡한 구현은 일련의 트랜스포존 돌연변이유발을 허용한다(이 경우에, 기능 획득 재활용 트랜스포존으로 불림). 이러한 구현은 숙주 표현형을 개선시키는 다양한 라이브러리의 생성을 가능하게 한다.

본 발명의 트랜스포존에 대한 비 제한적인 예시적인 구조체가 도 25에 도시되어 있으며, 대표적인 기능 상실(LoF) 트랜스포존, 기능 획득(GoF) 트랜스포존, 기능 획득 재활용 트랜스포존 및 기능 획득 용해도 태그 트랜스포존의 서열은 각각 SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO:. 19, 및 SEQ ID NO: 20로서 제공된다.

이들 트랜스포존은 트랜스포사제와 복합체를 형성하여 세포로 형질전환될 수 있다. 생성된 세포는 DNA 페이로드의 무작위 통합을 가져 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 형성할 것이다. 라이브러리는 본 발명에 기술된 HTP 절차에 따라 추가로 선별될 수 있고 표현형 개선에 대해 평가될 수 있다. 트랜스포존 통합으로 인해, 원하는 표현형을 갖는 균주는 본 발명에 기술된 임의의 방법에 따라 추가 특징화 및 추가 조작을 위해 분리될 수 있다.

예를 들어, LoF 트랜스포존 라이브러리 및 GoF 트랜스포존 라이브러리를 부모 균주에 대해 선별할 수 있고, 성능 데이터(스피노신의 역가)를 분석할 수 있다. 이 라이브러리에서 생성된 새로운 균주 중 일부는 부모 균주에 비해 개선된 성능을 가질 것이다.

본 발명에 기술된 방법은 2가지 주요 문제를 해결한다. 첫째, 잘 연구된 유기체에서도, 게놈 환경의 많은 부분이 잘 이해되지 않는다. 또한 잘 이해된 유전자 요소가 예상치 못한 방식으로 상호 작용할 수 있다는 것이 주목되었다. 이를 위해, 본 발명은 표현형 교란의 유발을 위한 효과적인 유전 공학 방법을 제공한다. 둘째, 느리게 성장하거나 유전적 저항성 유기체, 특히 큰 게놈을 가진 유기체에서, 모든 가능한 유전자 표적에 대해 표적화된 유전자 교란을 수행하는 것은 시간 또는 비용이 많이들 수 있다. 본 발명은 교란된 게놈을 갖는 균주를 생성하는 효과적인 방법을 제공하며, 이는 균주에서 목적하는 화합물을 생산하는 데 있어서 개선된 성능을 야기할 수 있다. 따라서, 본 발명은 생체 내 트랜스포존 돌연변이유발을 사용하여 숙주 유기체의 유전자 요소를 쉽고 무작위적으로 조절하는 방법에 의해 이러한 문제점을 해결한다. 이러한 방식으로, 상이한 돌연변이(기능 획득 및 기능 상실)를 수반하는 균주 라이브러리를 매우 신속하게 만들 수 있으며 숙주의 표현형을 추가로 개선시키기 위해 새로운 유전자 표적과 관련될 수 있다.

실시예 2 - HTP 게놈 공학 - 대장균에서 균주 성능을 개선시키기 위한 트랜스포존 돌연변이유발 라이브러리의 구현

트랜스포존 돌연변이유발은 대장균 무작위 균주 라이브러리를 생성하여 균주를 개선시키기 위해 수행될 수 있다. 이들 균주 라이브러리는 개선된 성능을 갖는 돌연변이체를 확인하기 위해 트립토판 수율과 같은 원하는 표현형에 대해 선별될 수 있다.

대장균 돌연변이체 라이브러리는 EZ-Tn5 트랜스포존 시스템을 적용함으로써 생성될 수 있다. 간단히 말하면, EZ-Tn5 트랜스포사제는 모자이크 요소 서열에 의해 플랭킹된 페이로드 DNA와 배양되어 DNA와 EZ-Tn5 트랜스포사제를 복합체화하여 트랜스포솜을 형성한다. 이어서, DNA/단백질 트랜스포솜 복합체는 전기천공법을 통해 대장균으로 형질전환되고, EZ-Tn5 트랜스포사제는 페이로드 DNA가 대장균 게놈에 무작위로 통합되어 균주 변이체의 무작위 라이브러리를 생성시킨다.

페이로드 DNA의 특이적 서열은 표적 게놈으로의 트랜스포존 삽입의 기능 상실(LoF) 또는 기능 획득(GoF) 효과 중 하나를 향해 바이어스되도록 추가로 변할 수 있다. 기능 상실은 DNA 페이로드에 항생제 선별 마커를 포함시킴으로써 달성될 수 있다. 항생제 마커는 생산적인 트랜스포존 삽입으로 세포를 선택할 수 있게 한다. DNA 페이로드의 삽입은 파괴된 유전자의 번역을 방지하는 오픈 리딩 프레임의 파괴를 포함하나 이에 제한되지 않는 다양한 방식으로 삽입되는 DNA의 기능을 방해할 수 있다.

기능 획득은 DNA 페이로드에 항생제 마커 및 강력한 프로모터를 포함시킴으로써 달성할 수 있다. 항생제 마커는 생산적인 트랜스포존 삽입으로 세포의 선택을 가능하게 한다. DNA 페이로드의 삽입은 강한 프로모터의 작용을 통해 삽입 부위에 근접한 유전자의 발현을 증가시킬 수 있다.

기능 상실 또는 기능 획득 DNA 페이로드의 중 하나는 마커 재순환 및 추가 조작 라운드를 가능하게 하는 선택 가능한 마커 이외에 역 선택 가능한 마커를 추가로 포함할 수 있다.

이 트랜스포존 돌연변이유발을 통해 생성된 균주 변이체의 라이브러리는 원하는 표현형에 대해 선별될 수 있다. 균주는 부모 균주에 비해 개선된 원하는 표현형을 갖는 균주를 확인하기 위해 높은 처리량으로 배양되고 테스트될 수 있다.

개선된 균주 변이체는 원하는 표현형(예를 들어, 트립토판 수율)을 추가로 개선하기 위해 추가의 라운드의 순환 공학에 적용될 수 있다. 추가적인 엔지니어링 라운드는 트랜스포존 돌연변이유발 또는 SNP 스왑, PRO 스왑 또는 랜덤 돌연변이유발과 같은 본 발명에 기술된 다른 라이브러리 유형으로 이루어질 수 있다. 개선된 균주는 또한 뚜렷한 유익한 돌연변이의 부가 효과를 통해 추가로 개선된 균주를 생산하기 위해 개선된 표현형을 나타내는 다른 균주 변이체와 통합될 수 있다.

이러한 유형의 변환은 순환 공학에서 선별을 위한 고품질 라이브러리를 제작하는 데 드는 비용을 감소시킨다. 대장균에 적용된 트랜스포존 돌연변이유발은 단일 반응에서 수천 개의 게놈 넓은 기능 손실 또는 기능 돌연변이체의 획득을 가능하게 한다. 대안적인 방법은 단일 크로스오버 상동 재조합(SCHR)을 통해 균주를 조작하기 위해 수천 개의 할당된 플라스미드를 힘들게 제작하는 것이다. 다른 대안적인 방법은 람다 레드 재조합을 통해 균주를 조작하기 위해 수천 개의 지정된 선형 단편을 제작하는 것이다. 이들 대안적 방법은 의도된 페이로드 DNA 및 표적 게놈 상의 특정 위치로 재조합을 지시하는 서열 상동성을 함유하는 각각의 돌연변이체에 대해 고유한 DNA 단편을 생성할 필요가 있기 때문에 비싸다. 반대로, 트랜스포존 돌연변이유발은 단일 DNA 페이로드를 사용하여 표적 게놈으로의 무작위 통합을 통해 다양성이 생성된다.

번호를 매긴 발명의 실시태양

첨부된 청구항에도 불구하고, 본 발명은 이하의 번호를 매긴 실시태양에 대해 설정한다:

트랜스포존 돌연변이유발 라이브러리를 사용하고 생성하는 방법:

1. 다음 단계를 포함하여 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 고 처리량(HTP) 방법:

a. 트랜스포존 돌연변이유발을 사용하여 동일한 미생물 균주 배경을 갖는 초기의 복수의 미생물의 게놈을 교란시켜 독특한 유전자 변이를 갖는 개별 미생물 균주를 포함하는 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계;

b. 원하는 표현형을 위한 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 균주를 선별 및 선택하는 단계;

c. 선행 단계에서 선별된 적어도 2개의 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계;

d. 원하는 표현형을 위한 후속 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계;

e. 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 선행 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리 중 적어도 2개의 개별 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 갖는 개별 균주를 포함하는 새로운 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성한다.

2. 제 1 실시태양에 있어서,

트랜스포존 돌연변이유발은 트랜스포사제 효소 및 DNA 페이로드 서열을 제공하는 단계를 포함하는 게놈 공학의 HTP 방법.

3. 제 1 또는 제 2 실시태양에 있어서,

트랜스포사제 효소 및 DNA 페이로드 서열은 트랜스포사제-DNA 페이로드 복합체를 형성하는 게놈 공학의 HTP 방법.

4. 제 1 내지 제 3 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 복수의 미생물의 게놈 내로 트랜스포존의 무작위 삽입을 초래하는 게놈 공학의 HTP 방법.

5. 제 1 내지 제 4 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 기능 상실(LoF) 표현형을 유발하는 게놈 공학의 HTP 방법.

6. 제 1 내지 제 4 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 기능 획득(GoF) 표현형을 유발하는 게놈 공학의 HTP 방법.

7. 제 1 내지 제 4 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 기능 획득(GoF) 요소를 함유하는 DNA 페이로드 서열을 게놈에 삽입하는 게놈 공학의 HTP 방법.

8. 제 7 실시태양에 있어서,

기능 획득 요소는 프로모터, 용해도 태그 요소, 및 역 선택 가능한 가능한 마커로 이루어진된 그룹으로부터 선택되는 게놈 공학의 HTP 방법.

9. 제 1 내지 제 5 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 기능 상실(LoF) 요소를 함유하는 DNA 페이로드 복합체를 삽입하는 게놈 공학의 HTP 방법.

10. 제 9 실시태양에 있어서,

기능 상실 요소는 마커인 게놈 공학의 HTP 방법.

11. 제 1 내지 제 10 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 하나는 기능 획득(GoF) 요소를 포함하고, 다른 하나는 기능 상실(LoF) 요소를 포함하는 적어도 2개의 트랜스포사제-DNA 페이로드 복합체로 복수의 미생물을 형질전환시키는 단계를 포함하는 게놈 공학의 HTP 방법.

12. 제 1 내지 제 11 실시태양 중 어느 하나에 있어서,

트랜스포존 돌연변이유발은 EZ-Tn5 트랜스포존 돌연변이유발 시스템을 사용하는 게놈 공학의 HTP 방법.

13. 제 1 내지 제 12 실시태양 중 어느 하나에 있어서,

게놈은 트랜스포존 돌연변이유발 및 SNP 스왑, 프로모터 스왑, 정지 스왑, 서열 최적화, 또는 이들의 임의의 조합 중 하나 이상을 이용함으로써 교란되는 게놈 공학의 HTP 방법.

14. 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 방법으로서,

a) 트랜스포존을 하나 이상의 기본 미생물 균주의 미생물 세포 집단에 도입하는 단계; 및

b) 무작위로 통합된 트랜스포존을 포함하는 적어도 하나의 미생물 균주를 선택하여 복수의 개별 균주의 각 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계를 포함하며, 여기서 독특한 유전자 변이의 각각은 하나 이상의 무작위로 통합된 트랜스포존을 포함하는 방법.

15. 제 14 실시태양에 있어서,

c) 기본 미생물 균주의 표현형 성능과 비교하여 측정된 표현형 변수의 성능의 증가를 나타내는 트랜스포존 돌연변이유발 미생물 균주 라이브러리로부터 균주를 선택하는 단계를 추가로 포함하는 방법.

16. 제 14 또는 제 15 실시태양에 있어서,

트랜스포존이 트랜스포존의 기본 미생물 균주의 게놈으로 생체 내 전위를 허용하는 트랜스포존 및 트랜스포사제 단백질의 복합체를 사용하여 기본 미생물 균주에 도입되는 방법.

17. 제 14 내지 제 16 실시태양 중 어느 하나에 있어서,

트랜스포사제 단백질은 EZ-Tn5 트랜스포솜 시스템으로부터 유도되는 방법.

18. 제 14 내지 제 17 실시태양 중 어느 하나에 있어서,

트랜스포존은 기능 상실(LoF) 트랜스포존 또는 기능 획득(GoF) 트랜스포존인 방법.

19. 제 18 실시태양에 있어서,

기능 상실 트랜스포존은 마커를 포함하는 방법.

20. 제 19 실시태양에있어서,

마커는 역 선택 가능한 마커인 방법.

21. 제 18 실시태양에 있어서,

기능 획득 트랜스포존은 용해도 태그, 프로모터 또는 역 선택 마커를 포함하는 방법.

22. 다음 단계를 포함하여 생산 미생물 균주의 표현형 성능을 개선하기 위한 HTP 트랜스포존 돌연변이유발 방법:

a. 트랜스포존 돌연변이유발에 의해 기본 미생물 균주의 게놈을 조작함으로써, 복수의 개별 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 균주를 포함하는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계, 여기서 각각의 독특한 유전자 변이는 하나 이상의 트랜스포존을 포함한다;

b. 기준 균주에 대한 표현형 성능 개선을 위해 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별하고 선택함으로써 표현형 성능 개선을 제공하는 독특한 유전자 변이를 확인하는 단계;

c. 선행 단계에서 선별된 적어도 2개의 개별 균주에 존재하는 유전자 변이로부터 고유한 유전자 변이의 조합을 각각 포함하는 후속하는 복수의 미생물 균주를 제공하여, 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계;

d. 기준 미생물 균주에 대한 표현형 성능 개선을 위해 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 균주를 선별 및 선택함으로써, 추가 표현형 성능 개선을 제공하는 유전자 변이의 독특한 조합을 확인하는 단계; 및

e. 균주가 생산 미생물 균주의 표현형 성능과 비교하여 원하는 수준의 개선 된 표현형 성능을 나타낼 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 새로운 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하고, 새로운 라이브러리에서 각 미생물 균주는 선행 라이브러리의 적어도 2개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 유전자 변이를 포함한다.

23. 제 22 실시태양에 있어서,

후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 부분 조합 라이브러리인 HTP 트랜스포존 돌연변이유발 방법.

24. 제 22 실시태양에 있어서,

후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 완전한 조합 라이브러리의 서브 세트인 HTP 트랜스포존 돌연변이유발 방법.

25. 제 22 또는 제 23 실시태양에 있어서,

후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 선행 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 부분 조합 라이브러리인 HTP 트랜스포존 돌연변이유발 방법.

26. 제 22 또는 제 24 실시태양에 있어서,

후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 선행 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 완전한 조합 라이브러리의 서브 세트인 HTP 트랜스포존 돌연변이유발 방법.

27. 제 22 내지 제 26 실시태양 중 어느 하나에 있어서,

단계 c)-d)는 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 미생물 균주의 표현형 성능이 생산 미생물 균주의 표현형 성능과 비교하여 측정된 표현형 변수에서 적어도 10% 증가를 나타낼 때까지 반복되는 HTP 트랜스포존 돌연변이유발 방법.

28. 제 22 내지 제 27 실시태양 중 어느 하나에 있어서,

단계 c)-d)는 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 미생물 균주의 표현형 성능이 생산 미생물 균주의 표현형 성능과 비교하여 측정된 표현형 변수에서 적어도 1배 증가를 나타낼 때까지 반복되는 HTP 트랜스포존 돌연변이유발 방법.

29. 제 22 내지 제 28 실시태양 중 어느 하나에 있어서,

단계 e)의 개선된 표현형 성능은: 소분자, 효소, 펩티드, 아미노산, 유기산, 합성 화합물, 연료, 알코올, 1차 세포외 대사 산물, 2차 세포외 대사 산물, 세포내 성분 분자 및 이들의 조합으로 이루어진 그룹으로부터 선택된 관심 생성물의 부피 생산성, 관심 생성물의 비생산성, 관심 생성물의 수율, 관심 생성물의 역가, 관심 생성물의 증가되거나 보다 효율적인 생산으로 이루어진 그룹으로부터 선택되는 HTP 트랜스포존 돌연변이유발 방법.

30. 제 22 내지 제 29 실시태양 중 어느 하나에 있어서,

트랜스포존은 기능 상실(LoF) 트랜스포존 또는 기능 획득(GoF) 트랜스포존인 HTP 트랜스포존 돌연변이유발 방법.

31. 제 30 실시태양에 있어서,

기능 상실 트랜스포존은 마커 또는 역 선택 가능한 마커를 함유하는 HTP 트랜스포존 돌연변이유발 방법.

32. 제 30 실시태양에 있어서,

기능 획득 트랜스포존은 프로모터, 용해도 태그 또는 역 선택 가능한 마커를 포함하는 HTP 트랜스포존 돌연변이유발 방법.

33. 제 9 실시태양에있어서,

마커는 역 선택 가능한 마커인 게놈 공학의 HTP 방법.

번호를 매긴 실시태양에서 상기 방법은 원핵생물 또는 진핵생물에서 실행될 수 있다. 예를 들어, 상기 방법은 다음 속으로부터의 숙주 세포에서 수행될 수 있다: 아그로박테리움(Agrobacterium), 알리시로바실러스(Alicyclobacillus), 아나베아나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부케네라(Buchnera), 캠프스트리스(Campestris), 캠필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로콕쿠스(Coprococcus), 에스체리치아(Escherichia), 엔테로콕쿠스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실루스(Geobacillus), 해모필루스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실루스(Lactobacillus), 락토콕커스(Lactococcus), 일로박터(Ilyobacter), 마이크로콕쿠스(Micrococcus), 마이크로박테리움(Microbacterium), 메소르히조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판도에아(Pantoea), 수도모나스(Pseudomonas), 프로클로로콕쿠스(Prochlorococcus), 로도박터(Rhodobacter), 로도수도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴룸(Rhodospirillum), 로도콕쿠스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토콕쿠스(Streptococcus), 시네콕쿠스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로콕쿠스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네코콕쿠스(Thermosynechococcus), 써모콕쿠스(Thermococcus), 우레아플라즈마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 예르시니아(Yersinia) 및 지모모나스(Zymomonas).

본 발명의 서열

SEQ ID NO:	설명	SEQ ID NO:	설명
1	Pcg0007_lib_39로부터 유래된 발현 프로모터	11	cg0371 터미네이터
2	Pcg0007로부터 유래된 발현 프로모터	12	cg0480 터미네이터
3	Pcg1860로부터 유래된 발현 프로모터	13	cg0494 터미네이터
4	Pcg0755로부터 유래된 발현 프로모터	14	cg0564 터미네이터
5	Pcg0007_265로부터 유래된 발현 프로모터	15	cg0610 터미네이터
6	Pcg3381로부터 유래된 발현 프로모터	16	cg0695 터미네이터
7	Pcg0007_119로부터 유래된 발현 프로모터	17	기능 상실(LoF) 트랜스포존
8	Pcg3121로부터 유래된 발현 프로모터	18	기능 획득(GoF) 트랜스포존
9	cg0001 터미네이터	19	기능 획득 재활용 트랜스포존
10	cg0007 터미네이터	20	기능 획득 용해도 태그 트랜스포존

본 발명에 인용된 모든 참고문헌, 기사, 간행물, 특허, 특허 간행물 및 특허 출원은 모든 목적을 위해 그 전문이 참조로 포함된다. 그러나 본 발명에 언급된 모든 참고문헌, 기사, 출판물, 특허, 특허 간행물 및 특허 출원은 세계 어느 나라에서든 유효한 선행 기술을 구성하거나 보통의 일반 지식의 일부를 구성한다는 인정 또는 어떠한 형태의 제안으로 간주되어서는 안 된다.

또한, 다음 특정 출원은 참조로 본 발명에 포함된다: 미국 출원 No. 15/396,230 (U.S. Pub. No. US 2017/0159045 A1); PCT/US2016/065465 (WO 2017/100377 A1); U.S. App. No. 15/140,296 (US 2017/0316353 A1); PCT/US2017/029725 (WO 2017/189784 A1); PCT/US2016/065464 (WO 2017/100376 A2); U.S. Prov. App. No. 62/431,409; U.S. Prov. App. No. 62/264,232; and U.S. Prov. App. No. 62/368,786.

SEQUENCE LISTING <110> Zymergen Inc. Kelly, Peter Enyeart, Peter <120> HTP Transposon Mutagenesis <130> ZYMR-014/01US 327574-2060 <140> filed herewith <141> 2018-06-06 <150> US 62/515,965 <151> 2017-06-06 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007_lib_39 <400> 1 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtat tatggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 2 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007 <400> 2 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtaa gatggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 3 <211> 93 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg1860 <400> 3 cttagctttg acctgcacaa atagttgcaa attgtcccac atacacataa agtagcttgc 60 gtatttaaaa ttatgaacct aaggggttta gca 93 <210> 4 <211> 98 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0755 <400> 4 aataaattta taccacacag tctattgcaa tagaccaagc tgttcagtag ggtgcatggg 60 agaagaattt cctaataaaa actcttaagg acctccaa 98 <210> 5 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007_265 <400> 5 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtac gctggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 6 <211> 86 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg3381 <400> 6 cgccggataa atgaattgat tattttaggc tcccagggat taagtctagg gtggaatgca 60 gaaatatttc ctacggaagg tccgtt 86 <210> 7 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007_119 <400> 7 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgttg catggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 8 <211> 87 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg3121 <400> 8 gtggctaaaa cttttggaaa cttaagttac ctttaatcgg aaacttattg aattcgggtg 60 aggcaactgc aactctggac ttaaagc 87 <210> 9 <211> 25 <212> DNA <213> Unknown <220> <223> cg0001 Terminator <400> 9 gacccatctt cggatgggtc ttttt 25 <210> 10 <211> 30 <212> DNA <213> Unknown <220> <223> cg0007 Terminator <400> 10 cccgcccctg gaattctggg ggcgggtttt 30 <210> 11 <211> 24 <212> DNA <213> Unknown <220> <223> cg0371 Terminator <400> 11 ccggtaactt ttgtaagttg ccgg 24 <210> 12 <211> 27 <212> DNA <213> Unknown <220> <223> cg0480 Terminator <400> 12 cccctcagaa gcgattctga ggggttt 27 <210> 13 <211> 28 <212> DNA <213> Unknown <220> <223> cg0494 Terminator <400> 13 gcaccgcctt tcggggcggt gctttttt 28 <210> 14 <211> 28 <212> DNA <213> Unknown <220> <223> cg0564 Terminator <400> 14 ggccccatgc tttgcatggg gtcttttt 28 <210> 15 <211> 30 <212> DNA <213> Unknown <220> <223> cg0610 Terminator <400> 15 gcacttacct taactggtag gtgctttttt 30 <210> 16 <211> 24 <212> DNA <213> Unknown <220> <223> cg0695 Terminator <400> 16 acccggtcac cagaccgggt cttt 24 <210> 17 <211> 1048 <212> DNA <213> Artificial Sequence <220> <223> Loss of Function transposon <400> 17 ctgtctctta tacacatctc cggaattgcc agctggggcg ccctctggta aggttgggaa 60 gccctgcaaa gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc 120 aagatctgat caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca 180 cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 240 aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 300 tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 360 gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 420 aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 480 tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 540 ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 600 ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 660 cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 720 tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 780 ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 840 tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 900 tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaatcgatag 960 ccgccccgca gggcgctccg caggccgctt ccggaccact ccggaagcgg ccgtgcggtc 1020 ggaggtacca gatgtgtata agagacag 1048 <210> 18 <211> 1352 <212> DNA <213> Artificial Sequence <220> <223> Gain of function transposon <400> 18 ctgtctctta tacacatctc cggaattgcc agctggggcg ccctctggta aggttgggaa 60 gccctgcaaa gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc 120 aagatctgat caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca 180 cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 240 aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 300 tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 360 gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 420 aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 480 tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 540 ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 600 ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 660 cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 720 tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 780 ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 840 tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 900 tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaatcgatag 960 ccgccccgca gggcgctccg caggccgctt ccggaccact ccggaagcgg ccgtgcggtc 1020 ggaggtaccg gtaccagccc gacccgagca cgcgccggca cgcctggtcg atgtcggacc 1080 ggagttcgag gtacgcggct tgcaggtcca ggaaggggac gtccatgcga gtgtccgttc 1140 gagtggcggc ttgcgcccga tgctagtcgc ggttgatcgg cgatcgcagg tgcacgcggt 1200 cgatcttgac ggctggcgag aggtgcgggg aggatctgac cgacgcggtc cacacgtggc 1260 accgcgatgc tgttgtgggc acaatcgtgc cggttggtag gatccccacc caacgcaccc 1320 caggaggtcc catagatgtg tataagagac ag 1352 <210> 19 <211> 3068 <212> DNA <213> Artificial Sequence <220> <223> Gain of Function recyclable transposon <400> 19 ctgtctctta tacacatctg gtaccagccc gacccgagca cgcgccggca cgcctggtcg 60 atgtcggacc ggagttcgag gtacgcggct tgcaggtcca ggaaggggac gtccatgcga 120 gtgtccgttc gagtggcggc ttgcgcccga tgctagtcgc ggttgatcgg cgatcgcagg 180 tgcacgcggt cgatcttgac ggctggcgag aggtgcgggg aggatctgac cgacgcggtc 240 cacacgtggc accgcgatgc tgttgtgggc acaatcgtgc cggttggtag gatccccacc 300 caacgcaccc caggaggtcc cataagaggt atatattacc ggaattgcca gctggggcgc 360 cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttcttg ccgccaagga 420 tctgatggcg caggggatca agatctgatc aagagacagg atgaggatcg tttcgcatga 480 ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 540 atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 600 aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg 660 acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 720 acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 780 tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 840 ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 900 agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 960 atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg 1020 aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 1080 gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 1140 cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 1200 tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 1260 agttcttctg atgcgcggcc ggacccgcac acacccgctc cagacgccca cgcaaggaga 1320 cccatgaaca tcaagaagtt cgccaagcgg gcgaccgtcc tgaccttcac caccgccctg 1380 ctcgcgggcg gggccaccca ggccttcgcc aaggagaaca cccagaagcc ctacaaggag 1440 acgtacgggg tgtcgcacat cacccgccac gacatgctcc agatccccaa gcagcagcag 1500 agcgagaagt accaggtccc gcagttcgac cagtccacca tcaagaacat cgaatcggcc 1560 aagggcctcg acgtgtggga ctcctggccc ctgcagaacg ccgacggcac cgtggccgag 1620 tacaacgggt accacgtggt gttcgccctg gcgggctccc ccaaggacgc cgacgacacc 1680 tcgatctaca tgttctacca gaaggtcggc gacaacagca tcgactcctg gaagaacgcg 1740 ggccgcgtct tcaaggacag cgacaagttc gacgcgaacg acgagatcct gaaggagcag 1800 acccaggagt ggtccggctc cgccaccttc acgtccgacg gcaagatccg gctcttctac 1860 acggacttct ccggcacgca ctacgggaag cagagcctca ccacggcgca ggtcaacgtg 1920 tcgaagtccg acgacaccct caagatcaac ggcgtggagg accacaagac gatcttcgac 1980 ggcgacggca agacctacca gaacgtgcag cagttcatcg acgagggcaa ctacacgtcg 2040 ggcgacaacc acacgctgcg cgacccccac tacgtggagg acaaggggca caagtacctg 2100 gtcttcgagg ccaacaccgg caccgacaac ggctaccagg gcgaggaatc cctgttcaac 2160 aaggcgtact acggcggcag cacgaacttc ttccgcaagg agagccagaa gctccagcag 2220 tcggccaaga agcgggacgc cgagctcgcc aacggcgcgc tgggcatggt ggagctgaac 2280 gacgactaca cgctgaagaa ggtcatgaag ccgctcatca cctccaacac cgtgacggac 2340 gagatcgagc gggcgaacgt cttcaagatg aacggcaagt ggtacctgtt caccgactcc 2400 cgcggctcca agatgaccat cgacggcatc aactcgaacg acatctacat gctgggttac 2460 gtctccaaca gcctgaccgg gccgtacaag ccgctcaaca agaccggcct ggtgctccag 2520 atgggcctgg acccgaacga cgtcaccttc acctactccc acttcgcggt gccccaggcg 2580 aagggcaaca acgtggtcat cacctcgtac atgacgaacc ggggcttctt cgaggacaag 2640 aaggccacct tcgccccctc cttcctgatg aacatcaagg gcaagaagac ctccgtggtg 2700 aagaacagca tcctggagca gggccagctc accgtcaaca actgaggtac cagcccgacc 2760 cgagcacgcg ccggcacgcc tggtcgatgt cggaccggag ttcgaggtac gcggcttgca 2820 ggtccaggaa ggggacgtcc atgcgagtgt ccgttcgagt ggcggcttgc gcccgatgct 2880 agtcgcggtt gatcggcgat cgcaggtgca cgcggtcgat cttgacggct ggcgagaggt 2940 gcggggagga tctgaccgac gcggtccaca cgtggcaccg cgatgctgtt gtgggcacaa 3000 tcgtgccggt tggtaggatc cccacccaac gcaccccagg aggtcccata gatgtgtata 3060 agagacag 3068 <210> 20 <211> 1716 <212> DNA <213> Artificial Sequence <220> <223> Gain of function - solubility tag transposon <400> 20 ctgtctctta tacacatctc cggaattgcc agctggggcg ccctctggta aggttgggaa 60 gccctgcaaa gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc 120 aagatctgat caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca 180 cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 240 aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 300 tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 360 gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 420 aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 480 tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 540 ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 600 ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 660 cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 720 tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 780 ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 840 tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 900 tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaatcgatag 960 ccgccccgca gggcgctccg caggccgctt ccggaccact ccggaagcgg ccgtgcggtc 1020 ggaggtacca tgtcccctat actaggttat tggaaaatta agggccttgt gcaacccact 1080 cgacttcttt tggaatatct tgaagaaaaa tatgaagagc atttgtatga gcgcgatgaa 1140 ggtgataaat ggcgaaacaa aaagtttgaa ttgggtttgg agtttcccaa tcttccttat 1200 tatattgatg gtgatgttaa attaacacag tctatggcca tcatacgtta tatagctgac 1260 aagcacaaca tgttgggtgg ttgtccaaaa gagcgtgcag agatttcaat gcttgaagga 1320 gcggttttgg atattagata cggtgtttcg agaattgcat atagtaaaga ctttgaaact 1380 ctcaaagttg attttcttag caagctacct gaaatgctga aaatgttcga agatcgttta 1440 tgtcataaaa catatttaaa tggtgatcat gtaacccatc ctgacttcat gttgtatgac 1500 gctcttgatg ttgttttata catggaccca atgtgcctgg atgcgttccc aaaattagtt 1560 tgttttaaaa aacgtattga agctatccca caaattgata agtacttgaa atccagcaag 1620 tatatagcat ggcctttgca gggctggcaa gccacgtttg gtggtggcga ccatcctcca 1680 aaatcggatc tggttccaga tgtgtataag agacag 1716

Claims

다음 단계를 포함하여 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 고 처리량(HTP) 방법:
a. 트랜스포존 돌연변이유발을 사용하여 동일한 미생물 균주 배경을 갖는 초기의 복수의 미생물의 게놈을 교란시켜 독특한 유전자 변이를 갖는 개별 미생물 균주를 포함하는 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계;
b. 원하는 표현형을 위한 초기 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 균주를 선별 및 선택하는 단계;
c. 선행 단계에서 선별된 적어도 2개의 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계;
d. 원하는 표현형을 위한 후속 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계;
e. 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 선행 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리 중 적어도 2개의 개별 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 갖는 개별 균주를 포함하는 새로운 HTP 유전자 디자인 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성한다.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 트랜스포사제 효소 및 DNA 페이로드 서열을 제공하는 단계를 포함하는 HTP 방법.
제 2 항에 있어서,
트랜스포사제 효소 및 DNA 페이로드 서열은 트랜스포사제-DNA 페이로드 복합체를 형성하는 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 복수의 미생물의 게놈 내로 트랜스포존의 무작위 삽입을 초래하는 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 기능 상실(LoF) 표현형을 유발하는 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 기능 획득(GoF) 표현형을 유발하는 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 기능 획득(GoF) 요소를 함유하는 DNA 페이로드 서열을 게놈에 삽입하는 HTP 방법.
제 7 항에 있어서,
기능 획득 요소는 프로모터, 용해도 태그 요소, 및 역 선택 가능한 가능한 마커로 이루어진된 그룹으로부터 선택되는 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 기능 상실(LoF) 요소를 함유하는 DNA 페이로드 복합체를 삽입하는 HTP 방법.
제 9 항에 있어서,
기능 상실 요소는 마커인 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 하나는 기능 획득(GoF) 요소를 포함하고, 다른 하나는 기능 상실(LoF) 요소를 포함하는 적어도 2개의 트랜스포사제-DNA 페이로드 복합체로 복수의 미생물을 형질전환시키는 단계를 포함하는 HTP 방법.
제 1 항에 있어서,
트랜스포존 돌연변이유발은 EZ-Tn5 트랜스포존 돌연변이유발 시스템을 사용하는 HTP 방법.
제 1 항에 있어서,
게놈은 트랜스포존 돌연변이유발 및 SNP 스왑, 프로모터 스왑, 정지 스왑, 서열 최적화, 또는 이들의 임의의 조합 중 하나 이상을 이용함으로써 교란되는 HTP 방법.
제 1 항에 있어서,
미생물은 원핵생물인 HTP 방법.
제 1 항에 있어서,
미생물은 다음으로 이루어진 그룹으로부터 선택된 속으로부터인 게놈 공학의 HTP 방법: 아그로박테리움(Agrobacterium), 알리시로바실러스(Alicyclobacillus), 아나베아나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부케네라(Buchnera), 캠프스트리스(Campestris), 캠필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로콕쿠스(Coprococcus), 에스체리치아(Escherichia), 엔테로콕쿠스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실루스(Geobacillus), 해모필루스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실루스(Lactobacillus), 락토콕커스(Lactococcus), 일로박터(Ilyobacter), 마이크로콕쿠스(Micrococcus), 마이크로박테리움(Microbacterium), 메소르히조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판도에아(Pantoea), 수도모나스(Pseudomonas), 프로클로로콕쿠스(Prochlorococcus), 로도박터(Rhodobacter), 로도수도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴룸(Rhodospirillum), 로도콕쿠스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토콕쿠스(Streptococcus), 시네콕쿠스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로콕쿠스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네코콕쿠스(Thermosynechococcus), 써모콕쿠스(Thermococcus), 우레아플라즈마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 예르시니아(Yersinia) 및 지모모나스(Zymomonas).
제 1 항에 있어서,
미생물은 사카로폴리스포라 스피노사(Saccharopolyspora spinosa)인 게놈 공학의 HTP 방법.
제 1 항에 있어서,
미생물은 대장균인 게놈 공학의 HTP 방법.
제 1 항에 있어서,
미생물은 진핵생물인 게놈 공학의 HTP 방법.
트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 방법으로서,
a) 트랜스포존을 하나 이상의 기본 미생물 균주의 미생물 세포 집단에 도입하는 단계; 및
b) 무작위로 통합된 트랜스포존을 포함하는 적어도 하나의 미생물 균주를 선택하여 복수의 개별 균주의 각 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계를 포함하며, 여기서 독특한 유전자 변이의 각각은 하나 이상의 무작위로 통합된 트랜스포존을 포함하는 방법.
제 19 항에 있어서,
c) 기본 미생물 균주의 표현형 성능과 비교하여 측정된 표현형 변수의 성능의 증가를 나타내는 트랜스포존 돌연변이유발 미생물 균주 라이브러리로부터 균주를 선택하는 단계를 추가로 포함하는 방법.
제 19 항에 있어서,
트랜스포존이 트랜스포존의 기본 미생물 균주의 게놈으로 생체 내 전위를 허용하는 트랜스포존 및 트랜스포사제 단백질의 복합체를 사용하여 기본 미생물 균주에 도입되는 방법.
제 19 항에 있어서,
트랜스포사제 단백질은 EZ-Tn5 트랜스포솜 시스템으로부터 유도되는 방법.
제 19 항에 있어서,
트랜스포존은 기능 상실(LoF) 트랜스포존 또는 기능 획득(GoF) 트랜스포존인 방법.
제 23 항에 있어서,
기능 상실 트랜스포존은 마커를 포함하는 방법.
제 24 항에 있어서,
마커는 역 선택 가능한 마커인 방법.
제 23 항에 있어서,
기능 획득 트랜스포존은 용해도 태그, 프로모터 또는 역 선택 마커를 포함하는 방법.
제 19 항에 있어서,
미생물 균주는 원핵생물인 방법.
제 19 항에 있어서,
미생물 균ㅈ는 다음으로 이루어진 그룹으로부터 선택되는 속으로부터인 방법: 아그로박테리움(Agrobacterium), 알리시로바실러스(Alicyclobacillus), 아나베아나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부케네라(Buchnera), 캠프스트리스(Campestris), 캠필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로콕쿠스(Coprococcus), 에스체리치아(Escherichia), 엔테로콕쿠스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실루스(Geobacillus), 해모필루스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실루스(Lactobacillus), 락토콕커스(Lactococcus), 일로박터(Ilyobacter), 마이크로콕쿠스(Micrococcus), 마이크로박테리움(Microbacterium), 메소르히조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판도에아(Pantoea), 수도모나스(Pseudomonas), 프로클로로콕쿠스(Prochlorococcus), 로도박터(Rhodobacter), 로도수도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴룸(Rhodospirillum), 로도콕쿠스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토콕쿠스(Streptococcus), 시네콕쿠스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로콕쿠스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네코콕쿠스(Thermosynechococcus), 써모콕쿠스(Thermococcus), 우레아플라즈마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 예르시니아(Yersinia) 및 지모모나스(Zymomonas).
제 19 항에 있어서,
미생물은 사카로폴리스포라 스피노사(Saccharopolyspora spinosa)인 방법.
제 19 항에 있어서,
미생물은 대장균인 방법.
제 19 항에 있어서,
미생물은 진핵생물인 방법.
다음 단계를 포함하여 생산 미생물 균주의 표현형 성능을 개선하기 위한 HTP 트랜스포존 돌연변이유발 방법:
a. 트랜스포존 돌연변이유발에 의해 기본 미생물 균주의 게놈을 조작함으로써, 복수의 개별 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 균주를 포함하는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계, 여기서 각각의 독특한 유전자 변이는 하나 이상의 트랜스포존을 포함한다;
b. 기준 균주에 대한 표현형 성능 개선을 위해 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 미생물 균주를 선별하고 선택함으로써 표현형 성능 개선을 제공하는 독특한 유전자 변이를 확인하는 단계;
c. 선행 단계에서 선별된 적어도 2개의 개별 균주에 존재하는 유전자 변이로부터 고유한 유전자 변이의 조합을 각각 포함하는 후속하는 복수의 미생물 균주를 제공하여, 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하는 단계;
d. 기준 미생물 균주에 대한 표현형 성능 개선을 위해 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 개별 균주를 선별 및 선택함으로써, 추가 표현형 성능 개선을 제공하는 유전자 변이의 독특한 조합을 확인하는 단계; 및
e. 균주가 생산 미생물 균주의 표현형 성능과 비교하여 원하는 수준의 개선 된 표현형 성능을 나타낼 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 새로운 트랜스포존 돌연변이유발 미생물 균주 라이브러리를 생성하고, 새로운 라이브러리에서 각 미생물 균주는 선행 라이브러리의 적어도 2개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 유전자 변이를 포함한다.
제 32 항에 있어서,
후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 부분 조합 라이브러리인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 초기 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 완전한 조합 라이브러리의 서브 세트인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 선행 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 부분 조합 라이브러리인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리는 선행 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 완전한 조합 라이브러리의 서브 세트인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
단계 c)-d)는 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 미생물 균주의 표현형 성능이 생산 미생물 균주의 표현형 성능과 비교하여 측정된 표현형 변수에서 적어도 10% 증가를 나타낼 때까지 반복되는 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
단계 c)-d)는 후속 트랜스포존 돌연변이유발 미생물 균주 라이브러리의 미생물 균주의 표현형 성능이 생산 미생물 균주의 표현형 성능과 비교하여 측정된 표현형 변수에서 적어도 1배 증가를 나타낼 때까지 반복되는 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
단계 e)의 개선된 표현형 성능은: 소분자, 효소, 펩티드, 아미노산, 유기산, 합성 화합물, 연료, 알코올, 1차 세포외 대사 산물, 2차 세포외 대사 산물, 세포내 성분 분자 및 이들의 조합으로 이루어진 그룹으로부터 선택된 관심 생성물의 부피 생산성, 관심 생성물의 비생산성, 관심 생성물의 수율, 관심 생성물의 역가, 관심 생성물의 증가되거나 보다 효율적인 생산으로 이루어진 그룹으로부터 선택되는 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
트랜스포존은 기능 상실(LoF) 트랜스포존 또는 기능 획득(GoF) 트랜스포존인 HTP 트랜스포존 돌연변이유발 방법.
제 40 항에 있어서,
기능 상실 트랜스포존은 마커 또는 역 선택 가능한 마커를 함유하는 HTP 트랜스포존 돌연변이유발 방법.
제 40 항에 있어서,
기능 획득 트랜스포존은 프로모터, 용해도 태그 또는 역 선택 가능한 마커를 포함하는 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에있어서,
생산 미생물 균주는 원핵생물인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
생산 미생물 균주는 다음으로 이루어진 그룹으로부터 선택된 속으로부터인 HTP 트랜스포존 돌연변이유발 방법: 아그로박테리움(Agrobacterium), 알리시로바실러스(Alicyclobacillus), 아나베아나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부케네라(Buchnera), 캠프스트리스(Campestris), 캠필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로콕쿠스(Coprococcus), 에스체리치아(Escherichia), 엔테로콕쿠스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실루스(Geobacillus), 해모필루스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실루스(Lactobacillus), 락토콕커스(Lactococcus), 일로박터(Ilyobacter), 마이크로콕쿠스(Micrococcus), 마이크로박테리움(Microbacterium), 메소르히조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판도에아(Pantoea), 수도모나스(Pseudomonas), 프로클로로콕쿠스(Prochlorococcus), 로도박터(Rhodobacter), 로도수도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴룸(Rhodospirillum), 로도콕쿠스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토콕쿠스(Streptococcus), 시네콕쿠스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로콕쿠스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네코콕쿠스(Thermosynechococcus), 써모콕쿠스(Thermococcus), 우레아플라즈마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 예르시니아(Yersinia) 및 지모모나스(Zymomonas).
제 32 항에 있어서,
생산 미생물 균주는 사카로폴리스포라 스피노사(Saccharopolyspora spinosa)인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
생산 미생물 균주는 대장균인 HTP 트랜스포존 돌연변이유발 방법.
제 32 항에 있어서,
생산 미생물 균주는 진핵생물인 HTP 트랜스포존 돌연변이유발 방법.
제 9 항에 있어서,
마커는 역 선택 가능한 마커인 게놈 공학의 HTP 방법.