KR20190090081A

KR20190090081A - Htp 게놈 공학 플랫폼에 의한 미생물 균주 개량

Info

Publication number: KR20190090081A
Application number: KR1020197021794A
Authority: KR
Inventors: 자흐 서버; 에릭 제데디아 딘; 쇼운 맨체스터; 캐서린 쥐. 고라; 마이클 플래쉬맨; 에린 쉘만; 애론 킴볼; 쇼운 시카; 바바라 프레웬; 토마스 트레이너; 케네쓰 에스. 브루노
Original assignee: 지머젠 인코포레이티드
Priority date: 2015-12-07
Filing date: 2016-12-07
Publication date: 2019-07-31
Also published as: CA3088654A1; JP7119048B2; CN108027849B; CN111223527A; JP6605042B2; CA3088654C; EP3387571A4; CA3007840A1; CN108027849A; JP2020115890A; CA3105722C; WO2017100377A1; JP2018523968A; JP2022066521A; EP3387571B1; CN111223527B; JP6715374B2; ES2928728T3; CA3007840C; KR102006320B1

Abstract

본 발명은 연산으로 구동되고 분자 생물학, 자동화 및 고급 기계 학습 프로토콜을 통합하는 HTP 미생물 게놈 공학 플랫폼을 제공한다. 이 통합 플랫폼은 특히 과학적 통찰력과 반복적인 패턴 인식에서 유도된 HTP 유전자 디자인 라이브러리를 제작하기 위해 HTP 분자 도구 세트를 사용한다. 본 발명에 설명된 HTP 게놈 공학 플랫폼은 미생물 균주 숙주에 영향을 미치지 않으므로 분류군에 걸쳐 실행될 수 있다. 또한, 개시된 플랫폼은 관심 임의의 미생물 숙주 파라미터를 조절하거나 개량시키도록 실행될 수 있다.

Description

HTP 게놈 공학 플랫폼에 의한 미생물 균주 개량{Microbial Strain Improvement by a HTP Genomic Engineering Platform}

본 발명은 고 처리량(HTP) 미생물 게놈 공학에 관한 것이다. 공개된 HTP 게놈 공학 플랫폼은 연산으로 구동되며 분자 생물학, 자동화 및 고급 기계 학습 프로토콜을 통합한다. 이 통합 플랫폼은 특히 과학적 통찰력과 반복적인 패턴 인식에서 유도된 HTP 유전자 설계 라이브러리를 제작하기 위해 HTP 분자 도구 세트를 사용한다.

이 출원과 관련된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며, 본 명세서에 참조로서 포함된다. 서열 목록이 포함된 텍스트 파일의 이름은 ZYMR_001_01WO_SeqList_ST25.txt이다. 텍스트 파일은 약 5KB이며 2016년 12월7일에 작성되었으며 EFS-Web을 통해 전자 파일로 제출된다.

인간은 수천 년 동안 미생물 세포 생합성 경로의 힘을 이용하여 관심있는 제품을 생산하는데, 이런 제품의 가장 오래된 예는 알코올, 식초, 치즈 및 요구르트를 포함한다. 이런 제품은 오늘날에도 여전히 많은 수요가 있으며 미생물에 의해 생산 가능한 제품의 레퍼토리가 계속 증가하고 있다. 유전 공학 기술의 도래는 과학자들이 다양한 생물체로 새로운 생합성 경로를 디자인하고 프로그램하여 광범위한 산업, 의료 및 소비자 제품을 생산하게 하였다. 사실은, 미생물 세포 배양은 이제 소분자, 항생제, 백신, 살충제, 효소, 연료 및 산업 화학물질에 이르는 제품을 생산하는데 사용된다.

현대의 산업 미생물에 의해 생산되는 다수의 제품을 고려하면, 소정의 미생물이 표적 제품을 생산할 수 있는 속도 및 효율을 향상시키기 위해 엔지니어가 엄청난 압력을 받고 있는다는 것은 놀랄 일이 아니다.

관련된 미생물을 "개량"함으로써 생물학적-기반 산업 공정의 경제를 개량하기 위해 다양한 접근법이 사용되어왔다. 예를 들어, 많은 제약 및 화학 산업은 미생물 배양물의 부모 균주가 화학물질 또는 자외선에 대한 노출을 통해 지속적으로 돌연변이되고 뒤이어 생산성, 수율 및 역가와 같은 성능 개량에 대해 선별되는 미생물 균주 개량 프로그램에 의존한다. 이런 돌연변이유발 과정은 균주가 제품 성능을 적절하게 증가시킬 때까지 광범위하게 반복된다. 다음의 "개량된" 균주는 상업적 생산에 이용된다.

상기에서 언급한 바와 같이, 돌연변이유발을 통한 개량된 산업 미생물 균주의 동정은 시간 소모적이고 비효율적이다. 이 과정은, 본질적으로, 계획성이 없으며 제품 생산에 바람직한 결과를 가진 돌연변이 발생에 의존한다.

전통적인 미생물 균주 개량 프로그램은 비효율적일뿐만 아니라, 이 공정은 또한 높은 수준의 유해한 돌연변이유발성 부하를 갖는 산업용 균주를 유도할 수 있다. 이러한 유형의 프로그램에 적용되는 산업용 균주에서 돌연변이의 축적은 중요해질수 있으며 결과적으로 성능 개량율에 궁극적인 정체를 초래할 수 있다.

따라서, 종래의 균주 개량 프로그램에 내재된 상기한 단점을 겪지 않고 유익한 돌연변이를 발견하고 통합하는 공정을 크게 가속화시키는 산업용 미생물을 조작하는 새로운 방법에 대한 기술이 절실히 필요하다.

또한, 미생물 균주 개량 분야에서 현재 사용되는 낡고 해로운 공정에 의해 개발된 산업용 균주를 "재건"시키는 방법이 절실히 필요하다.

본 발명은 전통적인 미생물 균주 개량 프로그램과 관련된 많은 문제점을 겪지 않는 고 처리량(HTP) 미생물 게놈 공학 플랫폼을 제공한다.

또한, 본 발명에 교시된 HTP 플랫폼은 수십 년의 무작위 돌연변이유발에 기초한 균주 개량 프로그램을 통해 비 유익한 돌연변이를 축적하는 산업용 미생물을 재건시킬 수 있다.

개시된 HTP 게놈 공학 플랫폼은 연산적으로 구동되고 분자 생물학, 자동화 및 진보된 기계 학습 프로토콜을 통합한다. 이런 통합 플랫폼은 특히 과학적 통찰력과 반복적인 패턴 인식에서 유도된 HTP 유전자 디자인 라이브러리를 제작하기 위해 HTP 분자 도구 세트를 사용한다.

교시된 HTP 유전자 디자인 라이브러리는 미생물에서 테스트하기 위한 특정 게놈 변경의 라이브러리를 제공함으로써 게놈 공학 과정의 동인으로서 기능한다. 특정 라이브러리 또는 라이브러리의 조합을 이용하여 조작된 미생물은 최종 결과, 예를 들어, 관심 제품의 생산을 위한 HTP 방식으로 효율적으로 선별된다. 미생물에서 테스트하기 위한 특정 게놈 변경을 정의하기 위해 HTP 유전자 디자인 라이브러리를 이용하고 이어서 변경을 제공하는 숙주 미생물 게놈을 선별하는 이런 방법은 효율적이고 반복적인 방식으로 수행된다. 일부 양태에서, 게놈 공학 캠페인의 반복 주기 또는 "라운드"는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100회 이상의 반복/사이클/라운드일 수 있다.

따라서, 일부 양태에서, 본 발명은 HTP 유전 공학의 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825, 850, 875, 900, 925, 950, 975, 1000 이상의 "라운드"(예를 들어, SNP 스왑, PRO 스왑, STOP 스왑 또는 이들의 조합의 라운드)를 실행하는 방법을 교시한다.

일부 실시태양에서, 본 발명은 각각의 후속적인 HTP 유전 공학 라운드가 이전 라운드의 유전 공학에서 확인된 유전적 변이를 기초로 하는 선형 접근법을 교시한다. 다른 실시태양에서, 본 발명은 각각의 후속적인 HTP 유전 공학 라운드가 미리 실행된 분석 및 별도의 HTP 유전 공학 브랜치를 포함하는 유전 공학의 임의의 이전 라운드에서 확인된 유전자 변이를 기초로 하는 비선형 접근법을 교시한다.

이런 반복 사이클로부터의 데이터는 대규모 데이터 분석 및 패턴 인식을 가능하게 하며, 이는 통합 플랫폼에 의해 이용되어 HTP 유전자 디자인 라이브러리 구현의 후속 라운드를 통지한다. 결과적으로, 교시된 플랫폼에서 이용된 HTP 유전자 디자인 라이브러리는 대규모 데이터 패턴 인식 알고리즘의 이점을 누리고 미생물 공학의 각각의 반복적인 라운드를 통해 더욱 유익해지는 매우 역동적인 도구이다.

일부 실시태양에서, 본 발명의 유전자 디자인 라이브러리는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 525, 550, 575, 600, 625, 650, 675, 700, 725, 750, 775, 800, 825, 850, 875, 900, 925, 950, 975, 1000회 이상의 개별적인 유전자 변화(예를 들어, PRO 스왑 라이브러리에서 프로모터:유전자 조합의 적어도 X 번호를 포함한다).

일부 실시태양에서, 본 발명은 미생물 균주에 대한 HTP 균주 개량 방법의 적용을 설명하는 예시적인 실시예 및 본문을 제공한다. 일부 실시태양에서, 본 발명의 균주 개량 방법은 임의의 숙주 세포에 적용가능하다.

일부 실시태양에서, 본 발명은 다음 단계를 포함하여 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 고 처리량(HTP) 방법을 교시한다: a) 동일한 미생물 균주 배경을 갖는 초기의 복수의 미생물의 게놈을 교란시켜 독특한 유전자 변이를 갖는 개별 미생물 균주를 포함하는 초기 HTP 유전자 디자인 미생물 균주 라이브러리를 생성하는 단계; b) 원하는 표현형을 위한 초기 HTP 유전자 디자인 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; c) 선행 단계에서 선별된 적어도 두 개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 HTP 유전자 디자인 미생물 균주 라이브러리를 생성하는 단계; d) 원하는 표현형을 위한 후속 HTP 유전자 디자인 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; e) 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 선행 HTP 유전자 디자인 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 HTP 유전자 디자인 미생물 균주 라이브러리를 생성한다.

일부 실시태양에서, 본 발명은 초기 HTP 유전자 디자인 미생물 균주 라이브러리가 프로모터 스왑 미생물 균주 라이브러리, SNP 스왑 미생물 균주 라이브러리, 개시/정지 코돈 미생물 균주 라이브러리, 최적화된 서열 미생물 균주 라이브러리, 터미네이터 스왑 미생물 균주 라이브러리, 또는 이들의 임의의 조합으로 이루어진 그룹으로부터 선택된 적어도 하나인 것을 교시한다.

일부 실시태양에서, 본 발명은 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제조하는 방법을 교시하며, 결합된 유전자 변이의 각각은 초기 HTP 유전자 디자인 미생물 균주 라이브러리 또는 선행 단계의 HTP 유전자 디자인 미생물 균주 라이브러리로부터 유도된다.

일부 실시태양에서, 후속 복수의 미생물에서의 유전자 변이의 조합은 초기 HTP 유전자 디자인 미생물 균주 라이브러리 또는 선행 단계의 HTP 유전자 디자인 미생물 균주 라이브러리에서 유전자 변이의 가능한 모든 조합의 서브세트를 포함할 것이다.

일부 실시태양에서, 본 발명은 후속 HTP 유전자 디자인 미생물 균주 라이브러리가 초기 HTP 유전자 디자인 미생물 균주 라이브러리 또는 선행 단계의 HTP 유전자 디자인 미생물 균주 라이브러리에서 유전자 변이로부터 유도된 완전한 조합 미생물 균주 라이브러리라는 것을 교시한다.

예를 들어, 이전의 HTP 유전자 디자인 미생물 균주 라이브러리가 유전자 변이 A, B, C 및 D만을 갖는다면, 상기 변이의 부분 조합은 각각 AB, AC 또는 AD의 독특한 유전자 변이 조합(돌연변이가 나타나는 순서는 중요하지 않음)을 포함하는 3개 미생물을 포함하는 후속 HTP 유전자 디자인 미생물 균주 라이브러리를 포함할 수 있다. 선행 단계의 HTP 유전자 디자인 라이브러리의 유전자 변이로부터 유도된 완전한 조합 미생물 균주 라이브러리는 각각 AB, AC, AD, BC, BD 또는 CD의 독특한 유전자 변이 조합을 포함하는 6개의 미생물을 포함할 것이다.

일부 실시태양에서, 본 발명의 방법은 랜덤 돌연변이유발, 표적 서열 삽입, 표적 서열 결실, 표적 서열 교체, 또는 이의 임의의 조합으로 이루어진 그룹으로부터 선택된 적어도 하나의 방법을 이용하여 게놈을 교란시키는 것을 교시한다.

본 발명의 방법의 일부 실시태양에서, 초기 복수의 미생물은 산업용 생산 균주 미생물로부터 유도된 독특한 유전자 변이를 포함한다.

본 발명의 방법의 일부 실시태양에서, 초기 복수의 미생물은 S₁Gen₁으로 표시된 산업용 생산 균주 미생물 및 S_nGen_n으로 표시된 이로부터 유도된 임의의 수의 후속 미생물 세대를 포함한다.

일부 실시태양에서, 본 발명은 다음 단계를 포함하는 SNP 스왑 미생물 균주 라이브러리를 생성하는 방법을 교시한다: a) 기준 미생물 균주 및 제 2 미생물 균주를 제공하는 단계, 여기서 제 2 미생물 균주는 기준 미생물 균주에 존재하지 않는 단일 뉴클레오타이드 다형성, DNA 삽입 및 DNA 결실로부터 선택된 복수의 확인된 유전자 변이를 포함한다; b) 기준 미생물 균주 또는 제 2 미생물의 게놈을 교란시켜 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 SNP 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 각각의 독특한 유전자 변이는 기준 미생물 균주와 제 2 미생물 균주 사이의 복수의 확인된 유전자 변이로부터 선택된 단일 유전자 변이에 상응한다.

SNP 스왑 라이브러리의 일부 실시태양에서, 기준 미생물 균주의 게놈은 제 2 미생물 균주에서 발견되는 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 첨가하도록 교란된다.

본 발명의 SNP 스왑 라이브러리 방법의 일부 실시태양에서, 제 2 미생물 균주의 게놈은 기준 미생물 균주에서 발견되지 않은 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 제거하도록 교란된다.

일부 실시태양에서, SNP 스왑 라이브러리의 유전자 변이는 기준 미생물 균주와 제 2 미생물 균주 사이에서 확인된 모든 유전자 변이의 서브세트를 포함할 것이다.

일부 실시태양에서, SNP 스왑 라이브러리의 유전자 변이는 기준 미생물 균주와 제 2 미생물 균주 사이에서 확인된 모든 유전자 변이를 포함할 것이다.

일부 실시태양에서, 본 발명은 다음 단계를 포함하는 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법을 교시한다: a) 부모 계통의 미생물 균주 및 이로부터 유도된 산업용 미생물 균주를 제공하는 단계, 여기서 산업용 미생물 균주는 부모 계통 미생물 균주에 존재하지 않는 단일 뉴클레오타이드 다형성, DNA 삽입 및 DNA 결실로부터 선택된 복수의 확인된 유전자 변이를 포함한다; b) 부모 계통 미생물 균주 또는 산업용 미생물 균주의 게놈을 교란시켜 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 SNP 스왑 미생물 균주 라이브러리를 생성하는 단계, 여기서 상기 독특한 유전자 변이의 각각은 부모 계통 미생물 균주와 산업용 미생물 균주 사이의 복수의 확인된 유전자 변이로부터 선택된 단일 유전자 변이에 해당한다; c) 기준 미생물 균주에 대한 표현형 성능 개량을 위한 초기 SNP 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하여 상기 미생물 균주에 표현형 성능 개량을 부여하는 독특한 유전자 변이를 확인하는 단계; d) 선행 단계에서 선별된 적어도 2개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 SNP 스왑 미생물 균주 라이브러리를 생성하는 단계; e) 기준 미생물 균주에 대한 표현형 성능 개량을 위한 후속 SNP 스왑 미생물 균주 라이브러리의 개별 미생물 균주 선별 및 선택하여 상기 미생물 균주에 추가 표현형 성능 개량을 부여하는 유전자 변이의 독특한 조합을 확인하는 단계; 및 f) 미생물 균주가 산업용 미생물 균주의 표현형 성능에 비해 원하는 수준의 개량된 표현형 성능을 나타낼 때까지 선형 또는 비선형 방식으로 단계 d)-e)를 1회 이상 반복하는 단계, 각각의 후속 반복은 선행 SNP 스왑 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 SNP 스왑 미생물 균주 라이브러리를 생성한다.

일부 실시태양에서, 본 발명은 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법을 교시하며, 여기서 부모 계통 미생물 균주의 게놈은 산업용 미생물 균주에서 발견되는 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 첨가하도록 교란된다.

일부 실시태양에서, 본 발명은 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법을 교시하며, 여기서 산업 미생물 균주의 게놈은 부모 계통 미생물 균주에서 발견되지 않는 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 제거하도록 교란된다.

일부 실시태양에서, 본 발명은 프로모터 스왑 미생물 균주 라이브러리를 생성하는 방법을 교시하며, 이 방법은 다음 단계를 포함한다: a) 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 프로모터 래더를 제공하는 단계, 여기서 상기 프로모터 래더는 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 프로모터를 포함한다; b) 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 프로모터 스왑 미생물 균주 라이브러리를 생성하는 단계, 여기서 상기 독특한 유전자 변이의 각각은 기본 미생물 균주에 내인성인 표적 유전자의 하나에 작동가능하게 연결된 프로모터 래더로부터의 프로모터의 하나를 포함한다.

일부 실시태양에서, 본 발명은 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 프로모터 스왑 방법을 교시하며, 이 방법은 다음 단계를 포함한다: a) 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 프로모터 래더를 제공하는 단계, 여기서 상기 프로모터 래더는 상기 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 프로모터를 포함한다; b) 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 프로모터 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 독특한 유전자 변이의 각각은 기본 미생물 균주에 내인성인 표적 유전자의 하나에 작동가능하게 연결된 프로모터 래더로부터의 프로모터의 하나를 포함한다; c) 원하는 표현형에 대한 초기 프로모터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; d) 선행 단계에서 선별된 적어도 두 개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 프로모터 스왑 미생물 균주 라이브러리를 생성하는 단계; e) 원하는 표현형에 대한 후속 프로모터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; f) 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 1회 이상 단계 d)-e)를 반복하는 단계, 여기서 각각의 후속 반복은 선행 프로모터 스왑 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 프로모터 스왑 미생물 균주 라이브러리를 생성한다.

일부 실시태양에서, 본 발명은 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 방법을 교시하며, 이 방법은 다음 단계를 포함한다: a) 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 터미네이터 래더를 제공하는 단계, 여기서 상기 터미네이터 래더는 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 터미네이터를 포함한다; b) 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 독특한 유전자 변이의 각각은 터미네이터 래더로부터의 터미네이터의 하나 이상에 작동가능하게 연결된 기본 미생물 균주에 내인성인 표적 유전자의 하나를 포함한다.

일부 실시태양에서, 본 발명은 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 터미네이터 스왑 방법을 교시하며, 이 방법은 다음 단계를 포함한다: a) 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 터미네이터 래더를 제공하는 단계; 여기서 상기 터미네이터 래더는 상기 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 터미네이터를 포함한다; b) 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 독특한 유전자 변이의 각각은 터미네이터 래더로부터의 터미네이터의 하나 이상에 작동가능하게 연결된 기본 미생물 균주에 내인성인 표적 유전자의 하나를 포함한다; c) 원하는 표현형에 대한 초기 터미네이터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; d) 선행 단계에서 선별된 적어도 두 개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 단계; e) 원하는 표현형에 대한 후속 터미네이터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; f) 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 1회 이상 단계 d)-e)를 반복하는 단계, 여기서 각각의 후속 반복은 선행 터미네이터 스왑 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 터미네이터 스왑 미생물 균주 라이브러리를 생성한다.

일부 실시태양에서, 본 발명은 (a) (1) 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 나타내는 입력 및 (2) 상응하는 성능 측정을 포함하는 트레이닝 세트로 채워진 예측 모델에 접근하는 단계; (b) 이런 유전자 변화를 포함하는 후보 미생물 균주에 상응하는 테스트 입력을 유전자 변화를 나타내는 예측 모델에 적용하는 단계; (c) 예측 모델에 적어도 부분적으로 기초하여 후보 미생물 균주의 표현형 성능을 예측하는 단계; (d) 적어도 부분적으로 이들의 예측된 성능에 기초하여 후보 미생물 균주의 제 1 서브세트를 선택하는 단계; (e) 후보 미생물 균주의 제 1 서브세트의 측정된 표현형 성능을 얻는 단계; (f) 적어도 부분적으로 측정된 표현형 성능에 기초하여 후보 미생물 균주의 제 2 서브세트를 선택하는 단계; (g) 예측 모델의 트레이닝 세트에 (1) 후보 미생물 균주의 선택된 제 2 서브세트에 상응하는 입력과 함께 (2) 후보 미생물 균주의 선택된 제 2 서브세트의 상응하는 측정된 성능을 첨가하는 단계; 및 (h) 적어도 하나의 후보 미생물 균주의 측정된 표현형 성능이 성능 메트릭을 만족시킬 때까지 (b)-(g)를 반복하는 단계에 의해 후보 미생물 균주의 디자인을 반복적으로 개량하는 것을 교시한다. 일부 경우에, 예측 모델에 대한 테스트 입력의 첫 번째 적용 동안, 테스트 입력에 의해 나타낸 유전 자 변화는 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 포함한다; 테스트 입력의 후속 적용 동안, 테스트 입력에 의해 나타낸 유전자 변화는 후보 미생물 균주의 이전에 선택된 제 2 서브세트 내의 후보 미생물 균주에 대한 유전자 변화를 포함한다.

일부 실시태양에서, 제 1 서브세트의 선택은 상위성 효과(epistatic effect)에 기초할 수 있다. 이것은 제 1 서브세트의 제 1 선택 동안: 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 나타내는 복수의 각각의 입력의 적용에 응답하여 하나 이상의 배경 미생물 균주의 성능 측정 사이의 비유사도를 결정하는 단계; 및 적어도 2개의 후보 미생물 균주에 포함된 유전자 변화의 적용에 응답하여 하나 이상의 배경 미생물 균주의 성능 측정의 비평행성의 정도에 적어도 부분적으로 기초하여 적어도 2개의 후보 미생물 균주를 제 1 서브세트에 포함시키기 위해 선택하는 단계에 의해 성취될 수 있다.

일부 실시태양에서, 본 발명은 후보 미생물 균주의 반복적 개량에 상위성 효과를 적용하는 것을 교시하고, 상기 방법은 적어도 하나의 미생물 배경 균주에 대해 이루어진 상응하는 유전자 변화에 응답하여 측정된 성능을 나타내는 데이터를 얻는 단계; 적어도 2개의 유전자 변화의 상응하는 반응 성능 측정 사이의 비유사도도에 적어도 부분적으로 기초하여 적어도 2개의 유전자 변화를 선택하는 단계, 여기서 비유사도는 상이한 생물학적 경로를 통해 상응하는 반응성 측정에 영향을 미치는 정도에 관한 것이다; 및 선택된 유전자 변화를 포함한 미생물 배경 균주에 대한 유전자 변화를 디자인하는 단계를 포함한다. 일부 경우에, 적어도 2개의 선택된 유전자 변화가 디자인되는 미생물 배경 균주는 측정된 반응성 성능을 나타내는 데이터가 얻어진 적어도 하나의 미생물 배경 균주와 동일하다.

일부 실시태양에서, 본 발명은 단일 유형의 유전자 미생물 라이브러리만을 사용하는 HTP 균주 개량 방법을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 SNP 스왑 라이브러리만을 사용하는 HTP 균주 개량 방법을 교시한다. 다른 실시태양에서, 본 발명은 PRO 스왑 라이브러리만을 사용하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 본 발명은 STOP 스왑 라이브러리만을 이용하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 본 발명은 단지 개시/정지 코돈 스왑 라이브러리를 사용하는 HTP 균주 개량 방법을 교시한다.

다른 실시태양에서, 본 발명은 둘 이상의 유형의 유전자 미생물 라이브러리를 사용하는 HTP 균주 개량 방법을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 SNP 스왑 및 PRO 스왑 라이브러리를 조합하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 본 발명는 SNP 스왑 및 STOP 스왑 라이브러리를 조합하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 본 발명은 PRO 스왑 및 STOP 스왑 라이브러리를 조합하는 HTP 균주 개량 방법을 교시한다.

다른 실시태양에서, 본 발명은 다중 유형의 유전자 미생물 라이브러리를 사용하는 HTP 균주 개량 방법을 교시한다. 일부 실시태양에서, 유전자 미생물 라이브러리는 조합되어 조합 돌연변이(예를 들어, 하나 이상의 유전자에 적용된 프로모터/터미네이터 조합 래더)를 생성한다. 또 다른 실시태양에서, 본 발명의 HTP 균주 개량 방법은 하나 이상의 전통적인 균주 개량 방법과 조합될 수 있다.

일부 실시태양에서, 본 발명의 HTP 균주 개량 방법은 개량된 숙주 세포를 초래한다. 즉, 본 발명는 하나 이상의 숙주 세포 특성을 개량시키는 방법을 교시한다. 일부 실시태양에서, 개량된 숙주 세포 특성은 숙주 세포에 의해 생성된 관심 생성물의 부피 생산성, 비 생산성, 수율 또는 역가로 이루어진 그룹으로부터 선택된다. 일부 실시태양에서, 개량된 숙주 세포 특성은 부피 생산성이다. 일부 실시태양에서, 개량된 숙주 세포 특성은 비 생산성이다. 일부 실시태양에서, 개량된 숙주 세포 특성은 수율이다.

일부 실시태양에서, 본 발명의 HTP 균주 개량 방법은 HTP 균주 개량 방법을 적용하지 않는 대조군 숙주 세포에 비해 적어도 하나의 숙주 세포 특성에서 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 150%, 200%, 250%, 300% 이상의 개량(예를 들어, 임의의 범위 및 그 사이의 하부범위를 포함하는 관심 생체분자의 수율 또는 생산성의 X% 개량)을 나타내는 숙주 세포를 초래한다. 일부 실시태양에서, 본 발명의 HTP 균주 개량 방법은 SNP 스왑, PRO 스왑, STOP 스왑 및 이의 조합으로 이루어진 그룹으로부터 선택된다.

따라서, 일부 실시태양에서, 본 개시의 SNP 스왑 방법은 SNP 스왑 방법을 적용하지 않는 대조군 숙주 세포에 비해 적어도 하나의 숙주 세포 특성에서 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 150%, 200%, 250%, 300% 이상의 개량(예를 들어, 임의의 범위 및 그 사이의 하부범위를 포함하는 관심 생체분자의 수율 또는 생산성의 X% 개량)을 나타내는 숙주 세포를 초래한다.

따라서, 일부 실시태양에서, 본 발명의 PRO 스왑 방법은 PRO 스왑 방법을 적용하지 않는 대조군 숙주 세포에 비해 적어도 하나의 숙주 세포 특성에서 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, 150%, 200%, 250%, 300% 이상의 개량(예를 들어, 임의의 범위 및 그 사이의 하부범위를 포함하는 관심 생체분자의 수율 또는 생산성의 X% 개량)을 나타내는 숙주 세포를 초래한다.

본 발명의 내용 중에 포함되어 있다.

도 1은 다양성 풀의 변화를 증가시키기 위한 본 발명의 DNA 재조합 방법을 도시한다. 관련 종으로부터의 게놈 영역과 같은 DNA 절편은 물리적 또는 효소적/화학적 수단을 통해 절단될 수 있다. 절단된 DNA 영역은 용융되고 재어닐링되게 하여, 중첩된 유전 영역은 중합효소 신장 반응을 준비한다. 후속 용융/신장 반응은 하나 이상의 출발 서열로부터의 원소를 포함하는 키메라 DNA로 재조합될 때까지 수행된다.
도 2는 선택된 서열 변형(예를 들어, 스왑을 위한 100개 SNP)을 갖는 새로운 숙주 생물을 생성하기 위한 본 발명의 방법을 개략적으로 도시한다. 간략하게, 이 방법은 (1) 원하는 DNA 삽입물은 어셈블리 반응에서 하나 이상의 합성된 올리고를 조합함으로써 디자인되고 생성하고, (2) DNA 삽입물은 형질전환 플라스미드에 클로닝하고, (3) 완성된 플라스미드는 원하는 생산 균주로 옮겨지고, 여기서 이들은 숙주 균주 게놈 속으로 통합된다, 및 (4) 선별 마커 및 기타 원하지 않는 DNA 요소는 숙주 균주에서 루프 아웃된다. 각 DNA 어셈블리 단계는 증폭 및 서열화를 위해 대장균 박테리아 속에 플라스미드를 클로닝하는 것과 같은 추가 품질 관리(QC) 단계를 필요로 할 수 있다.
도 3은 본 발명의 형질전환 플라스미드의 조립 및 숙주 유기체 속으로 이의 통합을 도시한다. 삽입체 DNA는 하나 이상의 합성된 올리고를 어셈블리 반응에서 결합함으로써 생성된다. 원하는 서열을 함유하는 DNA 삽입체는 게놈의 표적 부위와 상 동성을 갖는 DNA 영역에 인접해있다. 이런 상동성 영역은 게놈 통합을 용이하게 하고, 일단 통합되면, 후속 단계에서 벡터 백본 DNA를 루핑 아웃(looping-out)하기 위해 디자인된 직접 반복 영역을 형성한다. 조립된 플라스미드는 삽입체 DNA 및 임의적으로, 하나 이상의 선택 마커를 함유한다.
도 4는 숙주 균주로부터 DNA의 선택된 영역을 루핑 아웃하기 위한 절차를 도시한다. 삽입된 DNA 및 숙주 게놈의 직접 반복 영역은 재조합 이벤트에서 "루프 아웃(loop out)"될 수 있다. 선택 마커에 대해 선택된 세포 계수기는 직접 반복 영역에 의해 인접된 루프 DNA의 결실을 함유한다.
도 5는 본 발명의 균주 개량 공정의 한 실시태양을 도시한다. 유전자 변형(Genetic Design)을 함유하는 숙주 균주 서열은 다양한 균주 배경(Strain Build)에서의 균주 성능 향상에 대해 테스트된다. 유익한 돌연변이를 나타내는 균주를 분석하고(Hit ID 및 분석) 데이터는 추가 분석을 위해 라이브러리에 저장된다 (예를 들어, 다른 것들 중에서 SNP 스왑 라이브러리, PRO 스왑 라이브러리 및 이의 조합). 본 발명의 선택 기준은 추가 반복 분석을 위해 하나 이상의 라이브러리로부터의 요소를 조합시키는 예상된 효과에 기초하여 새로운 제안된 숙주 균주 서열을 생성한다.
도 6은 본 발명의 실시태양의 하나의 DNA 어셈블리, 형질전환 및 균주 선별 단계를 도시한다. 도 6a는 DNA 단편을 구축하고, 상기 DNA 단편을 벡터 속에 클로닝하고, 상기 벡터를 숙주 균주로 형질전환시키고, 카운터 선택을 통해 선택 서열을 루핑 아웃하는 단계를 도시한다. 도 6b는 선택된 숙주 균주의 고 처리량 배양, 선별 및 평가를 위한 단계를 도시한다. 이 도면은 또한 배양 탱크에서 선택된 균주의 배양, 선택 및 평가하는 임의적 단계를 도시한다.
도 7은 본 발명의 자동화 시스템의 한 실시태양을 도시한다. 본 발명은 숙주 유기체를 클로닝, 형질전환, 배양, 선별 및/또는 서열화할 수 있는 다양한 모듈을 갖는 자동화 로봇 시스템의 사용을 교시한다.
도 8은 본 발명의 숙주 균주 개량 프로그램의 실시태양의 개관을 도시한다.
도 9는 약 320만 염기 쌍을 포함하는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)의 게놈을 나타낸 것이다.
도 10은 본 발명의 형질전환 실험의 결과를 도시한다. 0.5kb 내지 5.0kb 범위의 DNA 삽입체는 코리네박테리움 글루타미쿰의 게놈의 다양한 위치(상대 위치 1-24로 나타냄)에 삽입하기 위해 표적화되었다. 밝은 색은 성공적인 통합을 나타내며 어두운 색은 삽입 실패를 나타낸다.
도 11은 제 2 라운드 HTP 공학 PRO 스왑 프로그램의 결과를 도시한다. 제 1 PRO 스왑 라운드 동안 확인된 상위 프로모터::유전자 조합은 본 발명의 방법에 따라 분석하여 숙주 성능에 대한 부가적 또는 조합적 유익한 효과를 나타낼 수 있는 상기 돌연변이의 조합을 동정하였다. 따라서 제 2 라운드 PRO 스왑 돌연변이 체는 다양한 프로모터::유전자 돌연변이의 쌍 조합을 포함한다. 생성된 제 2 라운드 돌연변이체는 선택된 생체분자의 숙주 세포 수율의 차이에 대해 선별되었다. 유익한 효과를 나타내는 것으로 예측되었던 돌연변이의 조합 쌍은 원으로 강조된다.
도 12는 대장균으로 형질전환된 플라스미드에 대한 성공적인 플라스미드 어셈블리를 테스트하는 실험 결과를 도시한다. 4개의 콜로니를 선택하는 것은 1 및 2kb 삽입 서열을 함유하는 플라스미드에 대해 13% 실패율을 달성하기에 충분하다. 더 큰 삽입은 일관된 결과를 얻기 위해 추가 콜로니 선별을 필요로 할 수 있다.
도 13은 삽입 벡터에 의한 코리네박테리움 글루타미쿰의 성공적인 형질전환을 테스트하는 실험의 결과를 도시한다. 2 및 5kb의 DNA 삽입체 크기는 높은 변형률과 낮은 어셈블리 실패율을 나타내었다.
도 14는 코리네박테리움 글루타미쿰에서 루프 아웃 선택의 결과를 도시한다. 형질전환된 박테리아의 수크로오스 내성은 sacB 선별 마커의 루프 아웃을 나타낸다. DNA 삽입체 크기는 루프 아웃 효율에 영향을 미치지 않는 것으로 보인다.
도 15는 상관 측정을 사용하여 계산된 유사성 행렬이다. 이 행렬은 SNP 변종 사이의 기능적 유사성의 표현이다. 낮은 기능적 유사성을 갖는 SNP의 통합은 더 높은 기능적 유사성을 갖는 SNP의 통합과는 대조적으로 균주 성능을 향상시키는 더 높은 가능성을 갖는 것으로 예상된다.
도 16a-b는 상위성 매핑 실험의 결과를 도시한다. 낮은 기능적 유사성을 갖는 SNP와 PRO 스왑의 조합은 변형률 성능을 개량한다. 도 16a는 모든 SNP/PRO 스왑의 기능적 유사성에 의해 덩어리진 수상돌기를 도시한다. 도 16b는 생산 수율로 측정된 통합 SNP의 숙주 균주 성능을 도시한다. 클러스터 거리가 클수록 숙주 균주의통합 성능이 향상된다.
도 17a-b는 다양성 풀에서 균주 변형들 사이의 SNP 차이를 도시한다. 도 17a는 본 실험의 균주 사이의 관계를 도시한다. 균주 A는 야생형 숙주 균주이다. 균주 B는 중간 처리된 균주이다. 균주 C는 산업용 생산 균주이다. 도 17b는 각각의 균주에서 독특하고 공유된 SNP의 수를 나타내는 그래프이다.
도 18은 본 발명의 방법에 따른 제 1 라운드 SNP 스와핑 실험을 도시한다. (1) C로부터의 모든 SNP는 개별적으로 및/또는 조합적으로 기본 A 균주에 클로닝될 것이다(A에서 C로 "웨이브 업"). (2) C로부터의 모든 SNP는 상업적 균주 C로부터 개별적으로 및/또는 조합적으로 제거될 것이다(C에서 A로 "웨이브 다운"). (3) B로부터의 모든 SNP는 개별적으로 및/또는 결합하여 기본 A 균주 속으로 클로닝될 것이다. (4) B로부터의 모든 SNP는 개별적으로 및/또는 조합적으로 상업적 균주 B로부터제거될 것이다(B에서 A로 웨이브 다운). (5) C에 고유한 모든 SNP는 개별적으로 및/또는 조합적으로 상업적 균주 B에 클로닝될 것이다(B에서 C로 웨이브 업). (6) C에 고유한 모든 SNP는 개별적으로 및/또는 조합적으로 상업적 균주 C로부터 제거될 것이다(C에서 B로 웨이브 다운).
도 19는 프로모터 스왑 공정에서 사용될 예시적인 유전자 표적을 예시한다.
도 20은 확인된 유전자 표적에 대한 프로모터 스왑 공정을 수행하기 위해 사용되는 예시적인 프로모터 라이브러리를 예시한다. PRO 스왑(즉, 프로모터 스왑) 공정에서 사용된 프로모터는 P₁-P₈이며, 이들의 서열 및 동일성은 표 1에서 찾을 수있다.
도 21은 프로모터 스와핑 유전자 결과가 표적화되는 특정 유전자에 의존한다는 것을 예시한다.
도 22는 라이신 수율에 성능에 현저하게 영향을 미치는 변형을 보여주는 예시적인 HTP 프로모터 스와핑 데이터를 도시한다. X축은 프로모터 스왑 유전자 디자인 미생물 균주 라이브러리 내의 상이한 균주를 나타내고, Y축은 각 균주에 대한 상대적 라이신 수율 값을 포함한다. 그래프 상의 각 문자는 PRO 스왑 표적 유전자를 나타낸다. 각 데이터 점은 복제물을 나타낸다. 데이터는 본 발명에 기술된 바와 같이 HTP 적용에 적합한 분자 도구(즉, PRO 스왑)가 관심 화합물 또는 분자의 생산을 위한 미생물 균주 성능을 효율적으로 생성하고 최적화할 수 있음을 입증한다. 이 경우, 관심 화합물은 라이신이었다; 그러나, 교시된 PRO 스왑 분자 도구는 임의의 관심 화합물의 생산을 최적화 및/또는 증가시키는 데 사용될 수 있다. 당업자는 어떻게 표적 유전자를 선택하고, 원하는 화합물의 생산을 암호화한 다음, 교시된 PRO 스왑 절차를 사용하는 방법을 이해할 것이다. 당업자는 본 발명에 제공된 상세한 설명과 함께 본 발명에 교시된 라이신 수율 증가를 예시하는 입증된 데이터가 PRO 스왑 분자 툴이 HTP 게놈 공학에서 광범위하게 적용가능한 진보가 되게 할 수 있다는 것을 쉽게 이해할 것이다.
도 23은 고려중인 입력 데이터에 대한 상대 변형 성능 분포를 도시한다. 상대적 성능이 0이면 가공 변형률이 인 - 플레이트 기본 변형률에 동일하게 잘 수행되었음을 나타낸다. 여기에 설명 된 공정은 제로보다 상당히 높게 수행 할 수 있는 변형을 식별하도록 디자인되었다.
도 24는 묘사된 균주에 편입된 각각의 유전자 변화와 관련된 상대적 균주 성능의 평균 변화(증가 또는 감소)를 나타내는 선형 회귀 계수 값을 도시한다.
도 25는 상위 100개의 예측된 균주 디자인에 대한 변화의 구성을 도시한다. x 축은 잠정적인 유전자 변화의 풀을 열거하고(dss 돌연변이는 SNP 스왑이고 Pcg 돌연변이는 PRO 스왑이다), y축은 순위 순서를 표시한다. 검은색 셀은 후보 디자인의 특정 변경 사항이 있음을 나타내고 흰색 셀은 변경 사항이 없음을 나타낸다. 이 특정 예에서 상위 100개 디자인은 pcg3121_pgi, pcg1860_pyc, dss_339 및 pcg0007_39_lysa 변경 사항을 포함한다. 또한 최상위 후보 디자인은 dss_034, dss_009 변경 사항을 포함한다.
도 26은 본 발명의 실시태양의 하나의 DNA 어셈블리 및 형질전환 단계를 도시한다. 흐름도는 DNA 단편을 제작하고, 상기 DNA 단편을 벡터로 클로닝하고, 상기 벡터를 숙주로 형질전환시키고, 카운터 선택을 통해 선택 서열을 반복하는 단계를 도시한다.
도 27은 선택된 숙주 균주의 고 처리량 배양, 선별 및 평가를 위한 단계를 도시한다. 이 도면은 또한 배양 탱크에서 선택된 균주를 배양, 선별 및 평가하는 선택적 단계를 도시한다.
도 28은 본 발명의 프로모터 래더에 따른 조절성 발현의 범위를 나타내는 예시적인 프로모터의 발현 프로파일을 도시한다. 프로모터 A 발현은 박테리아 배양의 유도기에서 최고조인 반면, 프로모터 B 및 C는 각각 대수기 및 정상기에서 최고조이다.
도 29는 본 발명의 프로모터 래더에 따른 조절 발현의 범위를 나타내는 예시적인 프로모터의 발현 프로파일을 도시한다. 프로모터 A 발현은 선택된 기질의 첨가시 즉시 최고조가 되지만, 기질의 농도가 감소함에 따라 감지할 수 없는 수준으로 신속하게 회복된다. 프로모터 B 발현은 선택된 기질의 첨가시 즉시 최고조가 되지만, 기질에서 상응하는 감소와 함께 감지할 수 없는 수준으로 천천히 낮아진다. 프로모터 C 발현은 선택된 기질의 첨가시에 최고조가 되지만, 기질이 소비된 후에도 배양 전체에 걸쳐 높게 발현된 상태로 유지된다.
도 30은 본 발명의 프로모터 래더에 따른 구성적 발현 수준의 범위를 나타내는 예시적인 프로모터의 발현 프로파일을 도시한다. 프로모터 A는 가장 낮은 발현을 나타내고, 각각 프로모터 B 및 C의 발현 수준이 증가된다.
도 31은 균주 개량을 위한 본 발명의 LIMS 시스템의 한 실시태양을 도시한다.
도 32는 본 발명의 LIMS 시스템의 실시태양의 클라우드 컴퓨팅 구현을 도시한다.
도 33은 본 발명의 반복적인 예측 균주 디자인 작업 흐름의 한 실시태양을 도시한다.
도 34는 본 발명의 실시태양에 따른 컴퓨터 시스템의 한 실시태양을 도시한다.
도 35는 본 발명의 한 실시태양에 따른 DNA 어셈블리와 관련된 작업 흐름을 도시한다. 이 과정은 4 단계로 나뉘어진다: 부분 생성, 플라스미드 어셈블리, 플라스미드 QC 및 형질전환을 위한 플라스미드 준비. 부품 생성 동안, 실험실 정보 관리 시스템(LIMS)에 의해 고안된 올리고는 올리고 서열 판매자로부터 주문받고 PCR을 통해 숙주 유기체로부터 표적 서열을 증폭하는데 사용된다. 이러한 PCR 부분은 세척하여 오염물을 제거하고 단편 분석, 관찰된 단편 크기 대 이론적 단편 크기의 인 실리코(in silico) 품질 관리 비교 및 DNA 정량화에 의해 성공에 대해 평가된다. 부분은 어셈블리 벡터와 함께 효모로 형질전환되고 동종 재조합을 통해 플라스미드로 조립된다. 조립된 플라스미드는 효모로부터 분리되고, 후속 조립 품질 제어 및 증폭을 위해 대장균으로 형질전환된다. 플라스미드 조립 품질 관리 동안, 각 플라스미드의 여러 복제물을 분리하고, 롤링 서클 증폭(Rolling Circle Amplification(RCA))을 사용하여 증폭되고, 효소 분해 및 단편 분석에 의해 올바른 조립에 대해 평가된다. QC 과정 동안 확인된 올바르게 조립된 플라스미드는 영구적 인 원료를 생성하기 위해 히트 픽(hit picked)되고 플라스미드 DNA는 표적 숙주 유기체로 변형되기 전에 추출되고 정량화된다.
도 36은 두 시점에 걸쳐 두 매질에서 터미네이터 T1-T8의 효과를 특징으로하는 실험의 결과를 나타낸다. 조건 A와 C는 BHI 매질에 대한 두 시점을 나타내며, B와 D 점은 HTP 테스트 매체에 대한 두 시점을 나타낸다.
도 37은 본 발명의 HTP 공학 방법론에 대한 UV 돌연변이유발과 같은 전통적인 균주 개량 접근법의 유효성을 비교하는 실험 결과를 나타낸다. UV 돌연변이의 대다수는 숙주 세포 성능에 현저한 증가를 일으키지 않았다. 대조적으로, 본 발명의 PRO 스왑 방법은 숙주 세포 성능의 1.2 내지 2배 증가를 나타내는 높은 비율의 돌연변이를 생성하였다.
도 38은 제 1 라운드 HTP 공학 SNP 스왑 프로그램의 결과를 도시한다. 186개의 개별적인 SNP 돌연변이는 확인되었고 기본 균주에 개별적으로 클로닝되었다. 생성된 돌연변이를 선택된 생체분자의 숙주 세포 수율의 차이에 대해 선별되었다.
도 39는 제 2 라운드 HTP 공학 SNP 스왑 프로그램의 결과를 도시한다. 1 라운드 SNP 스왑 프로그램으로부터의 176개의 개별 SNP 돌연변이는 1 라운드 SNP 프로그램 동안 확인된 유익한 SNP를 함유하는 제 2 라운드 숙주 세포 균주 속에 개별적으로 클로닝하였다. 생성된 돌연변이는 두 개의 돌연변이 조합 쌍의 효과를 나타낸다. 선택된 생체분자에 대한 숙주 세포 수율(Y 축)과 생산성(X 축)의 차이에 대한 선별 결과가 도시된다.
도 40은 탱크 발효 검증 실험의 결과를 도시한다. 제 2 라운드의 HTP SNP 스왑으로부터 상위 돌연변이 쌍은 발효 탱크에서 배양되었다. 선택된 생체분자(즉, 라이신)에 대한 숙주 세포 수율 및 생산성 결과가 도시된다. 볼 수 있듯이, 발명자는 특정 PRO 스왑 돌연변이체(zwf)가 기본 균주와 비교하여(즉, 기본 균주를 기본 균주 + zwf와 비교) 선택된 생체분자의 증가된 수율을 나타내었다는 것을 결정하기 위해 PRO 스왑 절차를 사용하였다. 그런다음, 본 발명자는 다른 라운드의 유전 공학을 수행하였고, 여기서 SNP 스왑 절차는 상기 PRO 스왑 돌연변이체와 조합할 때, 생체분자의 수율에 영향을 줄 수 있는 유익한 SNP 돌연변이를 결정하기 위해 사용되었다. PRO 스왑 절차와 SNP 스왑 절차의 조합은 이전의 PRO 스왑 전용 돌연변이 체보다 더 높은 수율을 갖는 돌연변이체를 생성하였다(즉, 기본 균주 + zwf + SNP121을 이전에 논의된 기본 균주 + zwf와 비교함). 이 도면은 본 발명의 PRO 스왑 및 SNP 스왑 절차를 조합하여 성취될 수 있는 수익의 극적인 개량을 예시한다. 양태들에서, PRO 스왑 게놈 공학 캠페인과 SNP 스왑 게놈 공학 캠페인을 조합하면 기본 균주에 비해, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9% 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50% 이상의 인자만큼 관심 생체분자/생성물의 수율 및/또는 생산성을 증가시킬 수 있다.
도 41은 제 1 라운드 HTP 공학 PRO 스왑 프로그램의 결과를 도시한다. 숙주 성능과 관련된 것으로 생각되는 선택된 유전자는 본 발명의 방법에 따라 제 1 라운드 PRO 스왑 라이브러리를 생성하기 위해 프로모터 래더와 결합되었다. 생성된 돌연변이체를 선택된 생체분자(즉, 라이신)의 숙주 세포 수율의 차이에 대해 선별하였다.
도 42는 본 발명의 실시태양에 따른, 미생물 균주의 디자인을 위한 돌연변이의 선택에서의 상위성 효과의 고려를 예시하는 흐름도이다.
도 43a-b는 본 발명의 방법에 따른 A.niger 형질전환 및 검증의 결과를 도시한다. 도 43a는 A. niger 형질전환 체의 96-웰 배지판의 사진이다. 형질전환된 배양물은 세포가 흑색 대신에 밝은 노란색으로 나타내게 하는 aygA에 돌연변이를 포함한다(형질전환된 웰은 흰색으로 동글게 표시된다). 도 43b는 형질전환된 A. niger 돌연변이체의 차세대 서열화의 결과를 도시한다. X축은 형질전환되지 않은 부모 균주와 표적 DNA의 서열 동일성을 나타낸다. Y축은 예상된 돌연변이와 표적 DNA의 서열 동일성을 나타낸다. 차트의 하부 오른쪽 부근의 데이터 포인트는 부모 균주와 높은 유사성을 나타내며 예상된 형질전환된 서열과 낮은 유사성을 나타낸다. 차트의 상부 왼쪽 부근의 데이터 포인트는 예상된 형질전환된 서열과 높은 유사성 및 부모 균주와 낮은 동일성을 나타낸다. 중간에 있는 데이터 포인트는 다중 핵을 가진 이질핵체를 나타낸다.
도 44a-b는 A. Niger의 SNP 스왑 구현예를 예시한다. 도 44a는 SNP 스왑의 각 SNP에 대해 디자인된 유전자 편집을 예시한다. 이 도면은 pyrG 유전자가 aygA 야생형 유전자에 대한 유전자좌에 도입되는 동시형질전환을 추가로 예시한다. 도 44b는 A. niger 형질전환체를 선별하기 위한 96-웰 배지판의 두 사진이다. 밝은 노란색 콜로니는 aygA 유전자가 성공적으로 파괴된 형질전환체를 나타낸다.
도 45는 차세대 서열화 결과에 기초하여 성공한 A. niger 돌연변이 형질전환체(상부 박스)를 확인하는 품질 관리(QC) 차트를 도시한다. 배양판으로부터 선택된 전체 29.2%의 노란색 콜로니는 예상된 SNP 유전자 변화를 나타낸다.
도 46은 형질전환된 A. niger 돌연변이체의 차세대 서열화 결과를 도시한다. X축은 형질전환되지 않은 부모 균주와 표적 DNA의 서열 동일성을 나타낸다. Y축은 예상된 돌연변이와 표적 DNA의 서열 동일성을 나타낸다. 차트의 하부 오른쪽 부근의 데이터 포인트는 부모 균주와 높은 유사성을 나타내며 예상된 형질전환된 서열과 낮은 유사성을 나타낸다. 차트의 상부 왼쪽 부근의 데이터 포인트는 예상된 형질전환된 서열과 높은 유사성 및 부모 균주와 낮은 동일성을 나타낸다. 중간에 있는 데이터 포인트는 다중 핵을 가진 이질핵체를 나타낸다.
도 47은 본 발명의 수율 모델에 대한 훈련 데이터의 예측된 성능 대 측정된 성능에 대한 점선 도표이다. 기본 모델은 커널 릿지 회귀 모델(4차 다항 커널을 가짐)이다. 이 모델은 1864개의 독특한 유전자 구조체 및 관련 표현형 성능에 대해 트레이닝된다. 적합 모델의 0.52의 r2 값을 가진다.
도 48은 본 발명의 예측 알고리즘에 의해 생성된 후보 디자인의 유전자 구성을 도시한다. 이런 후보 디자인은 HTP 구축 및 분석을 위해 제출되었다. 후보 디자인은 부모 균주 id와 도입된 돌연변이(들)의 조합으로 정의된다.
도 49은 본 발명의 예측 알고리즘에 의해 생성되고 본 발명의 HTP 구축 방법에 따라 구축된 후보 디자인의 예측된 성능 대 측정된 성능에 대한 점선 도표이다. 이 도면은 모델이 허용가능한 정확도 내에서 후보 균주 성능을 예측할 수 있음을 나타낸다.
도 50은 부모 균주에 대한 후보 균주의 수율의 변화율을 나타내는 박스 및 휘스커 도표이다. Y축에서, 0.01의 값은 1%에 해당한다. 이 도면은 컴퓨터 모델에 의해 디자인된 균주(밝은 회색)는 상응하는 부모 균주보다 측정가능한 개량을 달성 함을 나타낸다. 또한, 이 도면은 이런 모델 기본 균주 개량이 인간 전문가가 디자인한 균주에 의해 달성된 개량과 크기 면에서 필적할만하다는 것을 나타낸다.
도 51은 컴퓨터 모델에 의해 디자인된 균주(어두운 회색) 및 인간 전문가에 의해 디자인된 균주(밝은 회색)에 대한 수율 성능 분포를 예시한다. 컴퓨터 디자인 균주는 중앙값 이득을 가진 더 긴밀한 분포를 나타내었다.
도 52는 컴퓨터에 의해 생성된 후보 균주(밝은 회색) 또는 인간 전문가에 의해 생성된 후보 균주(어두운 회색)의 절대 수율을 나타내는 박스 및 휘스커 도표이다. 결과는 부모 균주에 의해 합계된다.

다음의 용어는 당해 기술 분야에서 통상의 지식을 가진 자에 의해 잘 이해되는 것으로 생각되지만, 다음 정의는 본 발명에 개시된 주제의 설명을 용이하게 하기 위해 제시된다.

용어 하나("a" 또는 "an")는 그 실체 중 하나 이상을 의미하며, 즉 복수의 지시대상을 의미할 수 있다. 이와 같이, 용어 "하나", "하나 이상" 및 "적어도 하나"라는 본 발명에서 상호 교환적으로 사용된다. 또한, 부정관사에 의한 "한 요소"에 대한 언급은, 내용이 분명하게는 요소의 하나 및 단지 하나가 존재하는 것을 요구하지 않는 한, 하나 이상의 요소가 존재하는 가능성을 배제하지 않는다.

본 발명에 사용된 용어 "세포 생물", "미세유기체"또는 "미생물"은 광범위하게 이해되어야 한다. 이 용어들은 상호 교환적으로 사용되며, 두 원핵생물 영역인 박테리아와 고세균뿐만 아니라 특정 진핵생물 균류 및 원생 생물을 포함하나 이에 제한되지 않는다. 일부 실시태양에서, 본 발명은 본 발명에 제공된 목록/표 및 도면의 "미세유기체"또는 "세포유기체"또는 "미생물"을 의미한다. 이런 특성화는 표와 도면의 확인된 분류학적 속과 확인된 분류학적 종뿐만 아니라 상기 표 또는 도면의 임의의 유기체의 다양한 신규하고 새로운 확인된 또는 디자인된 균주를 의미할 수 있다. 동일한 특성화는 실시예에서와 같이, 명세서의 다른 부분에서 이런 용어의 인용에 대해서도 마찬가지이다.

용어 "원핵 생물"은 당업계에 공지되어 있으며 핵 또는 다른 세포 기관을 함유하지 않는 세포를 의미한다. 원핵생물은 일반적으로 두 영역, 박테리아와 고세균의 하나로 분류된다. 고세균과 박테리아 영역의 유기체 사이의 명확한 차이는 16S 리보솜 RNA에서 뉴클레오타이드 염기 서열의 근본적인 차이에 기초한다.

용어 "고세균는 전형적으로 특이한 환경에서 발견되고 세포벽에서 리보솜 단백질의 수 및 뮤라민산의 부족을 포함하는 몇몇 기준에 의해 나머지 원핵 생물과 구별되는 멘도시쿠테스(Mendosicutes) 문의 유기체의 범주를 의미한다. ssrRNA 분석에 기초하여, 고세균은 두 계통발생학적으로 다른 그룹으로 구성된다: 크렌고세균(Crenarchaeota) 및 유리고세균(Euryarchaeota). 생리학을 기초로, 고세균은 세 가지 유형으로 구성될 수 있다: 메테인 생성균(methanogens)(메테인을 생성하는 원핵 생물); 고염성 세균(extreme halophiles)(매우 높은 농도의 염(NaCl)에서 사는 원핵 생물; 및 고온성(초고온성) 세균(extreme(hyper) thermophilus)(초고온에서 사는 원핵 생물). 박테리아와 구별되는 통일된 고세균의 특징(즉, 세포벽, 에스터-연결 막 지질 등에 뮤레인 없음)이외에, 이런 원핵 생물은 이들의 특정한 서식 환경에 적응시키는 특이한 구조 또는 생화학적 특성을 나타낸다. 크렌고세균은 주로 초고온성 황 의존성 원핵 생물로 이루어지며 유리고세균은 메테인 생성균과 고염성 세균을 함유한다.

"박테리아" 또는 "진정세균(eubacteria)"는 원핵 생물의 영역을 의미한다. 박테리아는 다음과 같이 적어도 11개의 구별된 그룹을 포함한다: (1) 그람 양성 (그람+) 박테리아, 2개위 주요 세부구분이 존재한다: (1) 높은 G+C 그룹(액티노마이세테스, 마이코박테리아, 마이르코콕커스, 기타) (2) 낮은 G+C 그룹(바실러스, 클로스트리디아, 락토바실러스, 스타필로콕키, 스트렙토콕키, 마이코플라스마스); (2) 프로테오박테리아, 예를 들어, 보라색 광합성 + 비 광합성 그람 음성 박테리아 (대부분의 "일반적인" 그람 음성 박테리아 포함); (3) 사이아노박테리아, 예를 들면, 산소성 광영양생물; (4) 스피로체테스 및 관련 종; (5) 플랭크토마이세스; (6) 박테로이데스, 플라보박테리아; (7) 클라마이디아; (8) 녹색 황 박테리아; (9) 녹색 비 황 박테리아(또한 혐기성 광영양식물); (10) 방사성 저항성 마이크로콕키 및 동족; (11) 써모토가(Thermotoga) 및 써모시포 써모필레스(Thermosipho thermophiles).

"진핵 생물"은 세포가 막 내에 둘러싸인 핵 및 다른 소기관을 함유하는 임의의 유기체이다. 진핵 생물은 분류군(Eukarya 또는 Eukaryota)에 속한다. 진핵 생물 세포를 원핵 생물(박테리아와 고세균)와 구분시키는 정의하는 특징은 막으로 둘러싸인 유전자 물질, 특히 유전자 물질을 함유하고 핵막에 의해 둘러싸인 핵을 가진다는 것이다.

용어 "유전자 변형된 숙주 세포", "재조합 숙주 세포"및 및 "재조합 균주"는 본 발명에서 상호 교환적으로 사용되고 본 발명의 클로닝 및 형질전환 방법에 의해 유전자 변형된 숙주 세포를 의미한다. 따라서, 이 용어는 유전자 변경, 변형 또는 조작되어, 숙주 세포가 유도된 자연 발생 유기체와 비교하여 변경, 변형 또는 상이한 유전자형 및/또는 표현형을 나타내는(예를 들어, 유전자 변형이 미생물의 핵산 서열 암호화에 영향을 미칠 때) 숙주 세포(예를 들어, 박테리아, 효모 세포, 곰팡이 세포, CHO, 인간 세포 등)를 포함한다. 일부 실시태양에서, 이 용어는 문제의 특정 재조합 숙주 세포뿐만 아니라 이런 숙주 세포의 자손 또는 잠재적 자손을 의미하는 것으로 이해된다.

용어 "야생형 미생물"또는 "야생형 숙주 세포"는 자연에서 발생하는 세포, 즉 유전자 변형되지 않은 세포를 기술한다.

용어 "유전자 조작된"은 (예를 들어, 삽입, 결실, 돌연변이 또는 핵산의 대체에 의한) 숙주 세포의 게놈의 임의적 조작을 의미할 수 있다.

용어 "대조군"또는 "대조군 숙주 세포"는 유전자 변형 또는 실험적 치료의 효과를 측정하기 위한 적절한 비교기 숙주 세포를 의미한다. 일부 실시태양에서, 대조군 숙주 세포는 야생형 세포이다. 다른 실시태양에서, 대조군 숙주 세포는 치료 숙주 세포를 분화시키는 유전자 변형(들)을 제외하고, 유전자 변형된 숙주 세포와 유전적으로 동일하다. 일부 실시태양에서, 본 발명은 대조군 숙주 세포(예를 들어, 균주 개량 프로그램의 기초로 사용된 S₁ 균주)로서의 부모 균주의 사용을 교시한다. 다른 실시태양에서, 숙주 세포는 치료 숙주 세포에서 테스트되는 특정 프로모터 또는 SNP가 결여된 유전적으로 동일한 세포일 수 있다.

본 발명에 사용된 용어 "대립 유전자(들)"은 유전자의 하나 이상의 대안 형태의 임의의 것을 의미하며, 이의 모두 대립 유전자는 적어도 하나의 형질 또는 특성과 관련된다. 이배체 세포에서, 소정의 유전자의 두 대립 유전자는 한 쌍의 상동 염색체 상에 상응하는 유전자좌를 차지한다.

본 발명에 사용된 용어 "유전자좌"(복수 유전자좌)는 예를 들어 유전자 또는 유전자 마커가 발견되는 염색체 상의 특정 장소 또는 장소들 또는 위치를 의미한다.

본 발명에 사용된 용어 "유전적으로 연결된"은 교차를 통해 분리하기가 어려워 번식 동안 높은 비율로 공동유전되는 2개 이상의 형질을 의미한다.

본 발명에 사용된 바와 같이 "재조합"또는 "재조합 사건"은 염색체 교차 또는 독립된 분류를 의미한다.

본 발명에 사용된 바와 같이 용어 "표현형"은 개체의 유전적 구성(즉, 유전자형)과 환경 사이의 상호작용으로부터 기인하는 개별 세포, 세포 배양, 유기체 또는 유기체의 그룹의 관찰 가능한 특성을 의미한다.

본 발명에 사용된 바와 같이, 핵산 서열 또는 단백질 서열을 기술할 때 용어 "키메라" 또는 "재조합체"는 적어도 2개의 이종 폴리 뉴클레오타이드 또는 2개의 이종 폴리펩티드를 단일 거대분자 속에 연결하거나 적어도 하나의 천연 핵산 또는 단백질 서열의 하나 이상의 요소를 재배열하는 핵산 또는 단백질 서열을 의미한다. 예를 들어, 용어 "재조합체"는 예를 들어, 화학적 합성 또는 유전 공학 기술에 의한 핵산의 분리된 단편의 조작에 의해 서열의 두 개의 분리된 단편의 인공적 조합을 의미할 수 있다.

본 발명에 사용된 바와 같이 "합성 뉴클레오타이드 서열"또는 "합성 폴리뉴클레오타이드 서열"은 자연에서 발생하는 것으로 알려지지 않았거나 자연 발생적이지 않은 뉴클레오타이드 서열이다. 일반적으로, 이런 합성 뉴클레오타이드 서열은 임의의 다른 자연 발생 뉴클레오타이드 서열과 비교할 때 적어도 하나의 뉴클레오타이드 차이를 포함할 것이다.

본 발명에 사용된 용어 "핵산"은 임의의 길이의 중합체 형태의 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드 또는 이의 유사체를 의미한다. 이 용어는 분자의 1 차 구조를 의미하며, 따라서 이중 나선 및 단일 가닥의 DNA뿐 아니라 이중 및 단일 가닥의 RNA를 포함한다. 또한, 메틸화 및/또는 캡핑된 핵산과 같은 변형된 핵산, 변형된 염기를 함유하는 핵산, 골격 변형 등과 같은 변형 핵산을 포함한다. 용어 "핵산" 및 "뉴클레오타이드 서열"은 상화 교환적으로 사용된다.

본 발명에 사용된 용어 "유전자"는 생물학적 기능과 관련된 DNA의 임의의 단편을 의미한다. 따라서, 유전자는 암호화 서열 및/또는 그의 발현에 요구되는 조절 서열을 포함하나 이에 제한되지 않는다. 유전자는 또한, 예를 들어, 다른 단백질에 대한 인식 서열을 형성하는 비 발현 DNA 단편을 포함할 수 있다. 유전자는 관심 공급원으로부터의 클로닝 또는 공지되거나 예측된 서열 정보로부터의 합성을 포함하는 다양한 공급원으로부터 얻을 수 있고, 원하는 파라미터를 갖도록 디자인된 서열을 포함할 수 있다.

본 발명에 사용된 용어 "상동 기관(homologous)"또는 "동족체 (homologue)"또는 "오르쏘로그(ortholog)"는 당업계에 공지되어 있고 공통 조상 또는 가족 구성원을 공유하고 서열 동일성의 정도에 기초하여 결정되는 관련 서열을 의미한다. 용어 "상동성", "상동 기관", "실질적으로 유사" 및 "상응하게 실질적으로"는 본 발명에서 상호 교환적으로 사용된다. 이들은 하나 이상의 뉴클레오타이드 염기의 변화가 유전자 발현을 중재하거나 특정 표현형을 생성시키는 핵산 단편의 능력에 영향을 미치지 않는 핵산 단편을 의미한다. 이런 용어는 또한 초기의 변형되지 않은 단편에 비해 생성된 핵산 단편의 기능적 특성을 실질적으로 변화시키지 않는 하나 이상의 뉴클레오타이드의 결실 또는 삽입과 같은 본 발명의 핵산 단편의 변형을 의미한다. 따라서, 당업자가 알 수 있는 바와 같이, 본 발명은 특정 예시적인 서열 이상을 포함하는 것으로 이해된다. 이런 용어는 한 종, 아종, 품종, 품종 또는 균주에서 발견된 유전자 및 다른 종, 아종, 품종, 품종 또는 균주에서 상응하는 또는 동등한 유전자 사이의 관계를 기술한다. 본 발명을 위해서, 상동성 서열이 비교된다. "상동 서열"또는 "상동체"또는 "오르쏘로그"는 기능적으로 관련이 있다고 생각되고, 믿거나 알려진다. 기능적 관계는 (a) 서열 동일성 및/또는 (b) 동일하거나 유사한 생물학적 기능을 포함하나 이에 제한되지 않는 다수의 방식 중 임의의 하나로 표시될 수 있다. 바람직하게는, (a) 및 (b) 모두가 표시된다. 상동성은 Current Protocols in Molecular Biology(F.M. Ausubel et al., eds., 1987) Supplement 30, 섹션 7.718, 표 7.71에서 논의된 바와 같은 당해분야에서 용이하게 이용 가능한 소프트웨어 프로그램을 사용하여 결정될 수있다. 일부 정렬 프로그램은 맥벡터(MacVector)(Oxford Molecular Ltd, Oxford, U.K.), ALIGN 플러스(Plus)(Scientific and Educational Software, Pennsylvania) 및 AlignX(Vector NTI, Invitrogen, Carlsbad, CA)이다. 다른 정렬 프로그램은 기본 매개변수를 사용하여 시퀀처(Sequencher)(Gene Codes, Ann Arbor, Michigan)이다.

본 발명에 사용된 용어 "내인성"또는 "내인성 유전자"는 숙주 세포 게놈 내에서 자연적으로 발견되는 위치에서 자연 발생 유전자를 의미한다. 본 발명과 관련하여, 이종 프로모터를 내인성 유전자에 작동 가능하게 연결시키는 것은 이 유전자가 자연적으로 존재하는 위치에서 기존 유전자 앞에 이종성 프로모터 서열을 유전적으로 삽입하는 것을 의미한다. 본 발명에 기재된 내인성 유전자는 본 발명의 방법 중 어느 하나에 따라 돌연변이된 자연 발생 유전자의 대립 유전자를 포함할 수있다.

본 발명에 사용된 용어 "외인성"는 용어 "이종성(heterologous)"과 상호 교환적으로 사용되고, 자연 공급원 이외의 일부 공급원으로부터 유도하는 물질을 의미한다. 예를 들어, 용어 "외인성 단백질" 또는 "외인성 유전자"는 비 자연 공급원 또는 위치의 단백질 또는 유전자 및 생물학적 시스템에 공급된 단배질 또는 유전자를 의미한다.

본 발명에 사용된 용어 "뉴클레오타이드 변화"는 당업계에서 잘 알려진 바와 같이, 예를 들어 뉴클레오타이드 치환, 결실 및/또는 삽입을 의미한다. 예를 들어 돌연변이는 침묵 치환, 추가 또는 결실을 생성하나 암호화된 단백질의 특성 또는 활성 또는 단백질이 어떻게 만들어지는지를 변형하지 않는 변경을 함유한다.

본 발명에서 사용된 용어 "단백질 변형"은 당업계에 잘 알려진 바와 같이, 예를 들어 아미노산 치환, 아미노산 변형, 결실 및 또는 삽입을 의미한다.

본 발명에 사용된 용어 핵산 또는 폴리펩타이드의 "적어도 일부" 또는 "단편"은 전장 분자를 포함하는 전장 분자의 이런 서열 또는 임의의 더 큰 단편의 최소 크기 특성을 갖는 부분을 의미한다. 본 발명의 폴리뉴클레오타이드 단편은 유전자 조절 요소의 생물학적 활성 부분을 암호화할 수있다. 유전자 조절 요소의 생물학적 활성 부분은 유전자 조절 요소를 포함하는 본 발명의 폴리뉴클레오타이드 중 하나의 일부를 분리하고 본 발명에 기재된 바와 같은 활성을 평가함으로써 제조될 수 있다. 유사하게, 폴리펩타이드의 일부는 전장 폴리펩타이드까지 이르는 4개 아미노산, 5개 아미노산, 6개 아미노산, 7개 아미노산 등일 수 있다. 사용될 부분의 길이는 특정 용도에 따라 다를 것이다. 하이브리드화 프로브로서 유용한 핵산의 일부는 12개 뉴클레오타이드 정도로 짧을 수 있으며; 일부 실시태양에서, 이것은 20개 뉴클레오타이드이다. 에피토프로서 유용한 폴리펩티드의 일부는 4개의 아미노산 정도로 짧을 수 있다. 전장 폴리펩타이드의 기능을 수행하는 폴리펩타이드의 일부는 일반적으로 4개 이상의 아미노산보다 길 수 있다.

변이체 폴리뉴클레오타이드는 또한 DNA 셔플링과 같은 돌연변이 및 재조합 절차로부터 유도된 서열을 포함한다. 그러한 DNA 셔플링을위한 전략은 당업계에 공지되어있다. 예를 들어, Stemmer(1994) PNAS 91:10747-10751; Stemmer(1994) Nature 370:389-391; Crameri et al.(1997) Nature Biotech. 15:436-438; Moore et al.(1997) J. Mol. Biol. 272:336-347; Zhang et al.(1997) PNAS 94:4504-4509; Crameri et al.(1998) Nature 391:288-291; 및 미국 특허 제5,605,793호 및 제5,837,458호 참조.

본 발명에 개시된 폴리뉴클레오티드의 PCR 증폭을 위해, 임의의 관심 유기체로부터 추출된 cDNA 또는 게놈 DNA로부터의 상응하는 DNA 서열을 증폭시키기 위한 PCR 반응에 사용하기 위해 올리고뉴클레오타이드 프라이머가 디자인될 수 있다. PCR 프라이머 및 PCR 클로닝을 디자인하기 위한 방법은 당업계에 일반적으로 공지되어 있으며, Sambrook et al.(2001) Molecular Cloning: A Laboratory Manual (3^rd ed., Cold Spring Harbor Laboratory Press, Plainview, New York). See also Innis et al., eds. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, New York); Innis and Gelfand, eds. (1995) PCR Strategies (Academic Press, New York); and Innis and Gelfand, eds. (1999) PCR Methods Manual (Academic Press, New York)에 개시된다. PCR의 공지된 방법은 쌍을 이룬 프라이머, 네스티드 프라이머, 단일 특이적 프라이머, 축퇴성 프라이머, 유전자 특이적 프라이머, 벡터 특이적 프라이머, 부분적 불일치 프라이머 등을 사용하는 방법을 포함하나 이에 제한되지 않는다.

본 발명에 사용된 용어 "프라이머"는 DNA 중합효소를 부착시키는 증폭 표적에 대한 어닐링을 행할 수 있어, 프라이머 연장 생성물의 합성이 유도되는 조건하에 놓일 때, 즉, 뉴클레오타이드 및 DNA 중합효소와 같은 중합화제의 존재하에서 및 적절한 온도 및 pH에서 DNA 합성의 개시점으로서 작용하는 올리고뉴클레오티드를 의미한다. (증폭) 프라이머는 증폭 효율을 최대화하기 위해 바람직하게는 단일 가닥이다. 바람직하게는, 프라이머는 올리고데옥시리보뉴클레오티드이다. 프라이머는 중합화제의 존재 하에서 증량 생성물의 합성을 시작하기에 충분히 길어야한다. 프라이머의 정확한 길이는 프라이머의 온도 및 조성(A/T 대 G/C 함량)을 포함하는 많은 요소에 따라 달라질 것이다. 한 쌍의 양방향성 프라이머는 PCR 증폭과 같은 DNA 증폭 기술 분야에서 일반적으로 사용되는 것과 같은 하나의 순방향 및 역방향 프라이머로 구성된다.

본 발명에 사용된 용어 "프로모터"는 암호화 서열 또는 기능성 RNA의 발현을 제어할 수있는 DNA 서열을 의미한다. 일부 실시태양에서, 프로모터 서열은 근위 및 더 원위 상류 요소로 구성되고, 후자의 요소는 종종 인핸서로 의미된다. 따라서, "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이며, 프로모터의 선천적인 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다. 프로모터는 천연 유전자로부터 완전히 유도되거나 자연계에서 발견되는 다른 프로모터로부터 유도된 상이한 요소로 구성되거나 심지어 합성 DNA 단편을 포함할 수 있다. 상이한 프로모터가 상이한 조직 또는 세포 유형, 또는 상이한 발달 단계 또는 상이한 환경 조건에 대한 반응으로 유전자의 발현을 지시할 수 있음은 당업자에게 이해된다. 또한, 대부분의 경우에, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 일부 변이체의 DNA 단편은 동일한 프로모터 활성을 가질 수 있다는 것이 추가로 인식된다.

본 발명에서 사용된 용어 "재조합 구조체", "발현 구조체", "키메라 구조체", "구조체" 및 "재조합 DNA 구조체"는 본 발명에서 상호 교환적으로 사용된다. 재조합 구조체는 천연에서 함께 발견되지 않는 조절 및 암호화 서열과 같은 핵산 단편의 인위적인 조합을 포함한다. 예를 들어, 키메라 구조체는 상이한 공급원으로부터 유도된 조절 서열 및 암호화 서열, 또는 동일한 공급원으로부터 유도되지만 자연계에서 발견되는 것과 상이한 방식으로 배열된 조절 서열 및 암호화 서열을 포함할 수 있다. 이러한 구조체는 그 자체로 사용되거나 벡터와 함께 사용될 수 있다. 벡터가 사용되는 경우 벡터의 선택은 당업자에게 주지된 바와 같이 숙주 세포를 형질 전환하는데 사용될 방법에 의존한다. 예를 들어, 플라스미드 벡터가 사용될 수 있다. 당업자는 본 발명의 분리된 핵산 단편을 포함하는 숙주 세포를 성공적으로 형질전환, 선별 및 증식시키기 위해 벡터 상에 존재해야 하는 유전자 요소를 잘 알고 있다. 당업자는 또한 상이한 독립적인 형질전환 사건이 발현의 상이한 수준 및 패턴을 유도한다는 것을 인식할 것이며(Jones et al., (1985) EMBO J. 4 : 2411-2418; De Almeida et al., (1989) Mol. Gen Genetics 218 : 78-86), 따라서 다수의 사건은 원하는 발현 수준 및 패턴을 나타내는 라인을 수득하기 위해 선별돼야한다. 이러한 선별은 다른 것들 중에서, DNA의 서던 분석, mRNA 발현의 노던 분석, 단백질 발현의 면역 블로 팅 분석 또는 표현형 분석에 의해 실행될 수 있다. 벡터는 자율적으로 복제하거나 숙주 세포의 염색체에 통합될 수있는 플라스미드, 바이러스, 박테리오파지, 프로-바이러스, 파지미드, 트랜스포존, 인공 염색체 등일 수있다. 벡터는 또한 자율적으로 복제하지 않는 네이키드 RNA 폴리뉴클레오타이드, 네이키드 DNA 폴리뉴클레오타이드, 동일한 가닥 내의 DNA 및 RNA 모두로 구성된 폴리뉴클레오타이드, 폴리-라이신-컨쥬게이드된 DNA 또는 RNA, 펩타이드-컨쥬게이드된 DNA 또는 RNA, 리포좀-컨쥬게이드된 DNA 등일 수 있다. 본 발명에 사용된 용어 "발현"은 기능적 최종 산물, 예를 들어 mRNA 또는 단백질(전구체 또는 성숙)의 생산을 의미한다.

"작동 가능하게 연결된"은 추가 폴리뉴클레오타이드의 전사를 초래하는 추가의 올리고뉴클레오타이드 또는 폴리뉴클레오티드에 의한 본 발명에 따른 프로모터 폴리뉴클레오타이드의 순차적 배열을 의미한다.

본 발명에서 사용된 용어 "관심 생성물" 또는 "생체분자"는 원료로부터 미생물에 의해 생성된 임의의 생성물을 의미한다. 일부 경우에, 관심 생성물은 소분자, 효소, 펩타이드, 아미노산, 유기산, 합성 화합물, 연료, 알코올 등일 수 있다. 예를 들어, 관심 생성물 또는 생체분자는 임의의 1차 또는 2차 세포외 대사산물일 수 있다. 1차 대사산물은 특히 에탄올, 시트르산, 락트산, 글루탐산, 글루탐산염, 라이신, 트레오닌, 트립토판 및 다른 아미노산, 비타민, 폴리사카라이드 등일 수 있다. 2차 대사산물은 특히 페니실린과 같은 항생물질 또는 사이클로스포린 A와 같은 면역 억제제, 지베렐린과 같은 식물 호르몬, 로바스타틴과 같은 스타틴 약물, 그리세오풀빈과 같은 살균제 등일 수 있다. 관심 생성물 또는 생체분자는 또한 카탈라아제, 아밀라아제, 펙티나아제, 글루코오스 아이소머라제, 셀룰라아제, 헤미셀룰라아제, 리파아제, 락타아제, 스트렙토 키나아제 및 여러 다른 것을 포함하는 미생물 효소와 같은 미생물에 의해 생성된 임의의 세포내 성분일 수 있다. 세포내 성분은 또한 인슐린, B형 간염 백신, 인터페론, 과립구 콜로니-자극 인자, 스트렙토키나아제 및 기타와 같은 재조합 단백질을 포함할 수 있다.

용어 "탄소원"은 일반적으로 세포 성장을 위한 탄소원으로 사용되기에 적합한 물질을 의미한다. 탄소원은 바이오매스 가수분해물, 전분, 수크로오스, 셀룰로오스, 헤미셀룰로오스, 자일로오스 및 리그닌뿐만 아니라 이들 기질의 단량체 성분을 포함하나 이에 제한되지 않는다. 탄소원은 폴리머, 탄수화물, 산, 알코올, 알데하이드, 케톤, 아미노산, 펩타이드 등을 포함하나 이에 제한되지 않는 다양한 형태의 다양한 유기 화합물을 포함할 수 있다. 이들은, 예를 들어, 글루코오스, 덱스트로스(D-글루코오스), 말토오스, 올리고사카라이드, 폴리사카라이드, 포화 또는 불포화 지방산, 숙시네이트, 락테이트, 아세테이트, 에탄올 등, 또는 이의 혼합물과 같은 다양한 모노사카라이드를 포함한다. 광합성 유기체는 광합성의 산물로서 탄소원을 추가로 생산할 수 있다. 일부 실시태양에서, 탄소원은 바이오매스 가수분해물 및 글루코오스로부터 선택될 수 있다.

용어 "공급원료"는 미생물 또는 발효 공정에 공급되는 원료 또는 원료의 혼합물로서 다른 생성물이 제조될 수 있는 것으로 정의된다. 예를 들어, 바이오매스 또는 바이오매스에서 유도된 탄소 화합물과 같은 탄소 공급원은 발효 공정에서 관심 생성물(예를 들어, 소분자, 펩타이드, 합성 화합물, 연료, 알코올 등)을 생산하는 미생물의 공급원료이다. 그러나, 공급원료는 탄소 공급원 이외의 영양분을 함 유할 수 있다.

용어 "체적 생산성" 또는 "생산 속도"는 단위 시간당 매질의 부피당 형성된 생성물의 양으로 정의된다. 체적 생산성은 시간당 리터 당 그램(g/L/h)으로 보고될 수 있다.

용어 "비 생산성"은 생성물의 형성 속도로 정의된다. 비 생산성은 본 발명에서 시간당 세포 건조 중량의 그래당 그램 생성물(g/g CDW/h)의 비 생산성으로서 더 정의된다. 소정의 미생물에 대한 OD₆₀₀에 대한 CDW의 관계를 사용하여, 비 생산성은 시간당 600nm(OD)(g/L/h/OD)에서 배양액의 광학 밀도당 배양 배지당 그램 생성물로 표현될 수 있다.

용어 "수율"은 원료의 단위 중량당 수득된 생성물의 양으로 정의되며 g 기질 당 g 생성물(g/g)로 표현될 수 있다. 수율은 이론적 수율의 백분율로 표현될 수있다. "이론적 수율"은 생성물을 제조하는데 사용된 신진대사 경로의 화학양론에 따라 결정된 소정량의 기질당 생성될 수 있는 최대 생성물로 정의된다.

용어 "역가(titre 또는 titer)"는 용액의 강도 또는 용액 속의 물질의 농도로 정의된다. 예를 들어, 발효액에서 관심 생성물(예를 들어, 소분자, 펩타이드, 합성 화합물, 연료, 알코올 등)의 역가는 발효액 1 리터당 용액 속 관심 제품의 g(g/L)로 기술된다.

용어 "총 적가"는 용액 속의 관심 생성물, 적용 가능한 경우 기체상의 관심 생성물, 공정으로부터 제거되고 공정에서 최초 부피 또는 공정에서 작동 부피에 따라 회수된 임의의 관심 생성물을 포함하나 이에 제한되지 않는 공정에서 생산된 모든 관심 생성물의 합으로 정의된다.

본 발명에 사용된 용어 "HTP 유전 디자인 라이브러리" 또는 "라이브러리"는 본 발명에 따른 유전자 교란의 집합을 의미한다. 일부 실시태양에서, 본 발명의 라이브러리는 i) 데이터베이스 또는 다른 컴퓨터 파일에서 서열 정보의 집합, ii) 상기한 일련의 유전자 요소를 암호화하는 유전자 구조체의 집합, 또는 iii) 상기 유전자 요소를 포함하는 숙주 세포 균주로서 입증될 수 있다. 일부 실시태양에서, 본 발명의 라이브러리는 개별 요소의 집합(예를 등러, PRO 스왑 라이브러리를 위한 프로모터 집합 또는 STOP 스왑 라이브러리를 위한 터미네이터 집합)을 의미할 수 있다. 다른 실시태양에서, 본 발명의 라이브러리는 프로모터::유전자, 유전자:터미네이터, 또는 심지어 프로모터:유전자:터미네이터의 조합과 같은 유전자 요소의 조합을 의미할 수 있다. 일부 실시태양에서, 본 발명의 라이브러리는 숙주 유기체에서 라이브러리의 각 구성원을 적용하는 효과와 관련된 메타 데이터를 추가로 포함한다. 예를 들어, 본 발명에서 사용된 라이브러리는 특정 종에서 하나 이상의 표현형에 대한 이들 조합의 얻어진 효과와 함께 프로모터::유전자 서열 조합의 집합을 포함할 수 있으며, 따라서 미래 프로모터 스왑에 상기 조합을 사용하는 미래 예측 가치를 개량시킨다.

본 발명에서 사용된 용어 "SNP"는 작은 핵 다형성(들)을 의미한다. 일부 실시태양에서, 본 발명의 SNP는 광범위하게 해석되어야하며, 단일 뉴클레오타이드 다형성, 서열 삽입, 결실, 역전 및 다른 서열 치환을 포함한다. 본 발명에서 사용된 용어 "비 동의" 또는 비 동의 SNP "는 숙주 세포 단백질에서 암호화 변화를 유도하는 돌연변이를 의미한다

게놈 공학의 "고 처리량(HTP)" 방법은 상기 방법의 적어도 하나의 단계를 수행하기 위한 자동화 장비(예를 들어, 액체 핸들러 또는 플레이트 핸들러 머신)의 적어도 하나의 부품의 이용을 필요로 할 수 있다.

균주 개량의 전통적인 방법

균주 개량에 대한 전통적인 접근법은 크게 두 가지 유형의 접근법으로 분류 될 수 있다: 지시된(directed) 균주 조작 및 무작위 돌연변이유발.

균주 개량의 지시된 조작 방법은 특정 유기체의 소수의 유전자 요소의 계획된 교란을 필요로 한다. 이러한 접근법은 전형적으로 특정 생합성 또는 발달 프로그램을 조절하는데 중점을 두고 있으며, 상기 경로에 영향을 미치는 유전적 및 대사적 요인에 대한 사전 지식에 의존한다. 이의 가장 간단한 실시태양에서, 지시된 조작은 하나의 유기체로부터 동일하거나 상이한 종의 다른 유기체로 특성화된 형질(예를 들어, 유전자, 프로모터, 또는 측정 가능한 표현형을 생산할 수 있는 다른 유전 요소)의 전달을 필요로 한다.

균주 조작에 대한 무작위 접근법은 성능 개량을 확인하기 위한 광범위한 선별과 함께 부모 균주의 무작위 돌연변이유발을 필요로 한다. 이러한 무작위 돌연변이를 일으키기 위한 접근법은 자외선 복사에너지 또는 에틸 메테인설포네이트와 같은 돌연변이유발 화학물질에 대한 노출을 포함한다. 무작위적이며 매우 예측할 수 없음을 통해, 균주 개량에 대한 이런 전통적인 접근법은 보다 지시된 유전자 조작에 비해 몇 가지 장점을 가졌다. 첫째, 많은 산업 유기체는 유전자 및 대사성 레파토리의 관점에서 특성이 좋지 않아서(좋지 않게 유지되어), 불가능한 것은 아니지만 대안적인 직접적인 개량 접근법을 어렵게 만들었다.

둘째, 비교적 특성이 규명된 시스템에서도, 산업 성능 개량을 초래하는 유전자형 변화는 예측하기 어렵고, 때때로 알려지고 알려지지 않은 기능의 많은 유전자에서 누적 돌연변이를 필요로 하는 상위성 표현형으로만 나타난다.

또한, 수년 동안, 소정의 산업용 유기체에서 직접적인 게놈 돌연변이를 만드는데 필요한 유전자 도구는 이용할 수 없거나 사용이 매우 느리고 및/또는 어려웠다.

그러나, 종래의 균주 개량 프로그램의 확장된 적용은 소정의 균주 계보에서 점진적으로 감소된 이득을 가져오고, 궁극적으로는 추가 균주 효율에 대한 소진된 가능성을 야기한다. 유익한 무작위 돌연변이는 상대적으로 드문 경우이며 큰 선별 풀과 높은 돌연변이율을 필요로 한다. 이것은 필연적으로 "개량된" 균주에서 많은 중립적인 및/또는 해로운(또는 부분적으로 해로운) 돌연변이의 부주의한 누적을 초래하여, 궁극적으로 미래 효율성 향상에 대한 장애물을 형성한다.

전통적인 누적 개량 접근법의 다른 한계는 임의의 균주 메트릭에 대한 임의의 특정 돌연변이의 효과에 대한 정보가 거의 또는 전혀 없다는 것이다. 이것은 근본적으로 유익한 돌연변이를 결합 및 통합하거나 중립적이거나 해로운 돌연변이유발성 "수하물(baggage)"을 제거하는 연구자의 능력을 제한한다.

돌연변이성 계통 내에서 균주 간의 돌연변이를 무작위로 재조합시키는 다른 접근법 및 기술이 존재한다. 예를 들어, DNA 셔플링, 진화 또는 분자 육종으로 때때로 불리는 반복적 서열 재조합에 대한 몇몇 포맷 및 예가 미국 특허출원, Ser. No. 08/198,431, filed Feb. 17, 1994, Serial No. PCT/US95/02126, filed, Feb. 17, 1995, Ser. No. 08/425,684, filed Apr. 18, 1995, Ser. No. 08/537,874, filed Oct. 30, 1995, Ser. No. 08/564,955, filed Nov. 30, 1995, Ser. No. 08/621,859, filed. Mar. 25, 1996, Ser. No. 08/621,430, filed Mar. 25, 1996, Serial No. PCT/US96/05480, filed Apr. 18, 1996, Ser. No. 08/650,400, filed May 20, 1996, Ser. No. 08/675,502, filed Jul. 3, 1996, Ser. No. 08/721, 824, filed Sep. 27, 1996, and Ser. No. 08/722,660 filed Sep. 27, 1996; Stemmer,　Science　270:1510 (1995); Stemmer et al.,　Gene164:49-53 (1995); Stemmer,　Bio/Technology　13:549-553 (1995); Stemmer, Proc. Natl. Acad. Sci. U.S.A.　91:10747-10751 (1994); Stemmer,　Nature370:389-391 (1994); Crameri et al.,　Nature Medicine　2(1):1-3 (1996); Crameri et al.,　Nature Biotechnology　14:315-319 (1996)에 기술되며, 이의 각각은 모든 목적을 위해 그 전문이 본 발명에 참조로 포함된다.

이들은 돌연변이 균주를 통한 게놈 재조합을 용이하게 하는 원형질 융합 및 전체 게놈 셔플링과 같은 기술을 포함한다. 효모 및 사상균류와 같은 일부 산업용 미생물의 경우, 자연 교배 주기가 쌍을 이루는 방식의 게놈 재조합에도 이용될 수 있다. 이런 방식으로, 해로운 돌연변이는 부모 균주에 의한 돌연변이체를 "백-크로싱"하여 제거될 수 있고 유익한 돌연변이가 강화될 수 있다. 또한, 두 가지 다른 균주 계통의 유익한 돌연변이가 잠재적으로 결합될 수 있어서, 단일 균주 계통을 자체로 돌연변이시킴으로써 얻을 수 있는 것보다 추가적인 개량 가능성을 형성할 수 있다. 그러나, 이런 접근법은 본 발명의 방법을 사용하여 피하게 되는 많은 제한을 받는다.

예를 들어, 상기한 바와 같은 전통적인 재조합 접근법은 느리고 돌연변이를 교환하기 위한 비교적 적은 수의 랜덤 재조합 크로스오버 사건에 의존하며, 따라서 임의의 소정의 주기 또는 시간 기간에서 시도될 수 있는 조합의 수에 제한이 있다. 또한, 선행 기술의 자연 재조합 사건은 본질적으로 무작위이지만, 이들은 또한 게놈 위치 편향에 영향을 받는다.

가장 중요한 것은, 전통적인 접근법은 개개의 돌연변이의 영향에 대한 정보를 거의 제공하지 않으며, 재조합 돌연변이의 무작위적인 분포로 인해 많은 특정 조합이 생성 및 평가될 수 없다.

종래의 균주 개량 프로그램과 관련된 여러 상기한 문제를 극복하기 위해, 본 발명은 계산적으로 구동되고 분자 생물학, 자동화, 데이터 분석 및 기계 학습 프로토콜을 통합하는 독특한 HTP 게놈 공학 플랫폼을 개시한다. 이 통합 플랫폼은 HTP 유전자 디자인 라이브러리를 구축하는데 사용되는 한 벌의 HTP 분자 도구 세트를 사용한다. 이러한 유전자 디자인 라이브러리는 아래에 자세히 설명될 것이다.

교시된 HTP 플랫폼 및 이의 독특한 미생물 유전자 디자인 라이브러리는 미생물 균주 개발 및 진화의 패러다임을 근본적으로 변화시킨다. 예를 들어, 산업용 미생물 균주를 개발하는 전통적인 돌연변이유발 기반의 방법은 수년간의 무작위 돌연변이유발 동안 축적된 중대한 돌연변이유발성 부하에 의해 부담을 진 미생물을 결국 유발할 것이다.

이러한 문제점을 해결하는(즉, 이들 미생물에 의해 축적된 유전자 수하물을 제거하는) 능력은 수십 년 동안 미생물 연구자들을 회피하였다. 그러나, 본 발명에 개시된 HTP 플랫폼을 이용하여, 이들 산업용 균주는 "재활"될 수 있고 해로운 유전 자 돌연변이가 확인되고 제거될 수 있다. 부합하게, 유익한 것으로 확인된 유전자 돌연변이는 유지될 수 있고 일부 경우에 개량될 수 있다. 생성된 미생물 균주는 이들의 부모의 균주와 비교하여 우수한 표현형 형질(예를 들어, 관심 화합물의 개량된 생산)을 나타낸다.

또한, 본 발명에서 교시된 HTP 플랫폼은 개별 돌연변이가 미생물 균주 성능에 미치는 효과를 확인, 특징화 및 정량화할 수 있다. 이 정보, 즉 소정의 유전자 변화 x가 숙주 세포 표현형 y에 대해 갖는 효과(예를 들어, 화합물 또는 관심 생성물의 생산)는 생성될 수 있고, 이후에 논의되는 미생물 HTP 유전자 디자인 라이브러리에 저장될 수 있다. 즉, 각 유전자 순열에 대한 서열 정보 및 숙주 세포 표현형에 대한 이의 효과는 하나 이상의 데이터베이스에 저장되며, 후속 분(예를 들어, 아래에서 논의되는 바와 같이 상위성 매핑)에 이용가능하다. 본 발명은 또한 유전자 삽입 구조체의 형태로, 또는 상기 유전자 순열을 함유하는 하나 이상의 숙주 세포 생물체의 형태로 귀중한 유전자 순열을 물리적으로 보호/저장하는 방법을 교시한다(예를 들어, 이하에서 논의되는 라이브러리 참조).

이들 HTP 유전 디자인 라이브러리를 정교한 데이터 분석 및 기계 학습 과정과 통합된 반복적 과정에 결합시키면 숙주 세포를 개량하기 위한 극적으로 상이한 방법론이 나타난다. 따라서, 교시된 플랫폼은 숙주 세포 균주를 개발하는 이전에 논의된 전통적인 방법과 근본적으로 상이하다. 교시된 HTP 플랫폼은 이전 방법과 관련된 많은 단점을 겪지 않는다. HTP 분자 도구 세트와 아래 논의된 유도된 유전자 디자인 라이브러리를 참조하면 이러한 장점과 다른 장점이 분명해질 것이다.

유전자 디자인 및 미생물 조작: 한 벌의 HTP 분자 도구 및 HTP 유전자 디자인 라이브러리를 이용하는 균주 개량에 대한 체계적인 조합 접근법

상기한 바와 같이, 본 발명은 균주를 통한 유전자 변화의 반복적인 체계적 도입 및 제거를 통해 미생물을 조작하기 위한 신규한 HTP 플랫폼 및 유전자 디자인 전략을 제공한다. 이 플랫폼은 HTP 유전자 디자인 라이브러리의 생성을 가능하게 하고 소정의 숙주 균주 속에 유전자 변이의 효율적 수행을 허용하는 한 벌의 분자 도구에 의해 지원된다.

본 발명의 HTP 유전자 디자인 라이브러리는 특정 미생물 균주 배경 속에 도입될 수 있는 가능한 유전자 변형의 공급원으로 작용한다. 이러한 방식으로, HTP 유전자 디자인 라이브러리는 소정의 미생물 균주의 초기 또는 추가 조작에 적용될 수 있는 유전자 다양성의 저장소 또는 유전자 교란의 집합이다. 숙주 균주에 대한 실행을 위한 유전자 디자인을 프로그래밍하는 기술은 본 발명에 참조로 인용된 "Microbial Strain Design System and Methods for Improved Large Scale Production of Engineered Nucleotide Sequences,"이라는 명칭의 계류중인 미국 특허 출원, Serial No. 15/140,296에 기술된다.

이 플랫폼에서 이용되는 HTP 분자 도구 세트는 특히 (1) 프로모터 스왑 (PRO 스왑), (2) SNP 스왑, (3) 개시/중지 코돈 교환, (4) STOP 스왑 및 (5) 서열 최적화를 포함할 수 있다. 본 발명의 HTP 방법은 또한 (6) 상위성 매핑 프로토콜을 포함하는 HTP 도구 세트의 통합/조합 사용을 지시하는 방법을 교시한다. 상기한 바와 같이, 이 한 벌의 분자 도구는 단독 또는 조합으로 HTP 유전자 디자인 숙주 세포 라이브러리의 형성을 가능하게 한다.

입증된 바와 같이, 상기한 HTP 미생물 조작 플랫폼의 내용에서 상기한 HTP 유전자 디자인 라이브러리의 이용은 유익한 "원인성" 돌연변이 또는 유전자 절편의 확인 및 통합 및 수동적 또는 해로운 돌연변이 또는 유전자 절편의 확인 및 제거를 가능하게 한다. 이 새로운 접근법은 전통적인 무작위 돌연변이유발 또는 지시된 유전자 조작으로는 달성할 수 없었던 균주 성능의 신속한 개량을 가능하게 한다. 유전자 부담의 제거 또는 유전자 부담이 없는 균주로의 유익한 변화의 통합은 추가적인 개량을 가능하게 할 수 있는 추가 무작위 돌연변이유발을 위한 새롭고 강력한 출발점을 제공한다.

일부 실시태양에서, 본 발명은 직교 유익한 변화가 돌연변이유발성 균주 계통의 다양한 이산 분지를 통해 확인됨에 따라, 이들은 또한 더 나은 실행 균주로 신속하게 통합될 수 있음을 교시한다. 이러한 돌연변이는 지시된 유전 공학 기술로 얻은 개량을 가진 균주와 같이 돌연변이유발 계통의 일부가 아닌 균주로 통합될 수 있다.

일부 실시태양에서, 본 발명은 발현 및 비 발현 유전 요소를 포함하는 다수의 이종 게놈 영역에 걸친 돌연변이의 게놈 전체 조합 효과를 분석하고 수집된 정보(예를 들어, 실험 결과)를 사용하여 균주 향상을 일으키는 것으로 예상된 돌연변이 조합을 예측한다는 점에서 공지된 균주 개량 접근법과 상이하다.

일부 실시태양에서, 본 발명은 i) 산업용 미생물 및 개시된 발명을 통한 개량에 순종하는 다른 숙주 세포, ii) 하류 분석을 위한 다양성 풀 생성, iii) 고 처리량 선별 및 대형 변이체 풀의 서열화를 위한 방법 및 하드웨어 iv) 게놈 전체 돌연변이의 시너지 효과의 기계 학습 계산 분석 및 예측을 위한 방법 및 하드웨어, 및 v) 고 처리량 균주 조작을 위한 방법.

다음 분자 도구 및 라이브러리는 예시적인 미생물의 예에 의해 논의된다. 당업자는 본 발명의 HTP 분자 툴이 진핵생물 세포 및 고차원 생명 형태를 포함하는 임의의 숙주 세포와 양립할 수 있다는 것을 인식할 것이다.

미생물 조작 플랫폼에서 이용되는 다양한 HTP 유전자 디자인 라이브러리의 생성을 가능하게 하는 확인된 HTP 분자 도구 세트의 각각은 이제 논의될 것이다.

1. 프로모터 스왑 : 프로모터 스왑 미생물 균주 라이브러리의 유도를 위한 분자 도구

일부 실시태양에서, 본 발명은 전체 숙주 균주 표현형에 유익한 효과를 나타내기 위해 최적 발현 특성(예를 들어, 수율 또는 생산성)을 갖는 프로모터를 선별하는 방법을 교시한다.

예를 들어, 일부 실시태양에서, 본 발명은 다양한 발현 강도(예를 들어, 아래에서 논의된 프로모터 래더) 또는 뛰어난 조절 특성(예를 들어, 선택된 유전자에 대한 엄격한 조절 제어)을 나타내는 하나 이상의 프로모터를 확인 및/또는 숙주 세포 내에서 하나 이상의 프로모터의 변이체를 생성시키는 방법을 교시한다. 이들 확인된 및/또는 생성된 프로모터의 특정 조합은 프로모터 래더로서 함께 그룹화될 수 있으며, 이는 보다 상세히 이하에서 설명된다.

당해 프로모터 래더는 소정의 관심 유전자와 결합된다. 따라서, 프로모터 P₁-P₈(다양한 발현 강도를 나타내는 것으로 확인된 및/또는 생성된 8개의 프로모터를 나타냄)이 있고 프로모터 래더를 미생물에서 관심 단일 유전자와 결합시킨다면(즉, 소정의 표적 유전자에 작동 가능하게 연결된 소정의 프로모터에 의해 미생물을 유전적으로 조작한다), 8개 프로모터의 각 조합의 효과는 조작된 미생물이 표적 유전자와 결합된 특정 프로모터(들)를 제외하고 그렇지 않다면 동일한 유전자 배경을 갖는 것을 고려하여, 각 조합적 노력으로부터 생성되는 각각의 조작된 균주를 특성화함으로써 확인될 수 있다.

이 과정을 통해 조작되어 생성된 미생물은 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성되는 실제의 물리적 미생물 균주 집합을 의미할 수 있으며, 각각의 구성원 균주는 그렇지 않다면 동일한 유전자 배경으로 특정 표적 유전자에 작동 가능하게 연결된 소정의 프로모터를 나타내며, 상기 라이브러리는 "프로모터 스왑 미생물 균주 라이브러리"로 불린다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란의 집합-이 경우 소정의 유전자에 작동 가능하게 연결된 소정의 프로모터 x)을 의미할 수 있으며-상기 집합은 "프로모터 스왑 라이브러리"로 불린다.

또한, 미생물을 조작하기 위해 프로모터 P₁-P₈을 포함하는 동일한 프로모터 래더를 이용할 수 있으며, 여기서 8개의 프로모터의 각각은 10개의 상이한 유전자 표적에 작동 가능하게 연결된다. 이 절차의 결과는 관심 표적 유전자에 작동 가능하게 연결된 특정 프로모터를 제외하고, 그렇지 않다면 유전적으로 동일하게 간주되는 80개의 미생물이 될 것이다. 이런 80개 미생물은 적절하게 선별되고 특징화되고 다른 HTP 유전자 디자인 라이브러리를 생성한다. HTP 유전자 디자인 라이브러리에서 미생물 균주의 특성화는 관계형 데이터베이스, 객체 지향 데이터베이스 또는 고도로 분산된 NoSQL 데이터베이스를 포함하여 임의의 데이터 저장 구조물에 저장될 수 있는 정보와 데이터를 생성한다. 이 데이터/정보는, 예를 들어, 소정의 유전자 표적에 작동 가능하게 연결된 경우 소정의 프로모터(예를 들어, P₁-P₈) 효과일 수 있다. 이 데이터/정보는 또한 둘 이상의 프로모터 P₁-P₈을 소정의 유전자 표적에 작동 가능하게 연결시킴으로써 초래하는 광범위한 세트의 조합적 효과일 수 있다.

8개 프로모터 및 10개 표적 유전자의 상기 예는 개념이 다양한 발현 강도 및 임의의 소정 수의 표적 유전자의 제시에 기초하여 함께 그룹화된 임의의 소정의 수의 프로모터와 함께 적용될 수 있기 때문에, 단지 예시적이다. 당업자는 또한 임의의 유전자 표적 앞에서 둘 이상의 프로모터를 작동 가능하게 연결시키는 능력을 인식할 것이다. 따라서, 일부 실시태양에서, 본 발명은 프로모터 래더로부터의 1, 2, 3개 이상의 프로모터가 하나 이상의 유전자에 작동 가능하게 연결된 프로모터 스왑 라이브러리를 교시한다.

요약하면, 유기체에서 다양한 유전자의 발현을 유도하는 다양한 프로모터를 이용하면 관심 형질을 최적화하는 강력한 수단이다. 본 발명자들이 개발한 프로모터 스와핑의 분자 도구는 적어도 하나의 조건하에서 적어도 하나의 유전자좌의 발현을 변화시키는 것으로 입증된 프로모터 서열의 래더를 사용한다. 그런 다음 이 래더는 고 처리량 게놈 공학을 사용하여 유기체에서 유전자 그룹에 체계적으로 적용된다. 이 유전자 그룹은 여러 가지 방법의 임의의 하나를 기초로 한 관심 형질에 영향을 줄 가능성을 갖는 것으로 결정된다. 이것은 공지된 기능에 기초한 선택 또는 관심 형질에 대한 영향 또는 이전에 결정된 유익한 유전자 다양성에 기초한 알고리즘 선택을 포함할 수 있다. 일부 실시태양에서, 유전자의 선택은 소정의 숙주 내 모든 유전자를 포함할 수 있다. 다른 실시태양에서, 유전자의 선택은 무작위로 선택된 소정의 숙주 내 모든 유전자의 서브세트일 수 있다.

유전자에 연결된 프로모터 서열을 함유하는 생물의 생성된 HTP 유전자 디자인 미생물 균주 라이브러리는 고 처리량 선별 모델에서 성능에 대해 평가되고, 증가 된 성능을 유도하는 프로모터-유전자 연관이 결정되고, 정보가 데이터베이스에 저장된다. 유전자 교란의 집합(즉, 소정의 유전자 y에 작동 가능하게 연결된 소정의 프로모터 x)은 "프로모터 스왑 라이브러리"를 형성하며, 이는 미생물 공학 처리에 이용될 잠재적인 유전자 교란의 공급원으로서 이용될 수 있다. 시간이 지남에 따라, 유전자 교란의 더 큰 세트가 더 큰 다양성의 숙주 세포 배경에 대해 실행되기 때문에, 각 라이브러리는 임의의 관심 배경에 대한 표적화된 변화를 더욱 정확하고 예측되게 디자인하는데 사용될 수 있는 실험적으로 확인된 데이터의 모음으로서 더욱 강력해진다.

유기체에서 유전자의 전사 수준은 유기체 행동에 영향을 미치는 제어의 핵심 포인트이다. 전사는 번역(단백질 발현)과 밀접하게 연관되며, 어떤 단백질은 유기체의 행동을 결정하는 양에서 발현된다. 세포는 수천 가지의 서로 다른 유형의 단백질을 발현하며, 이러한 단백질은 복잡한 복합적인 방식으로 상호작용하여 기능을 생성한다. 단백질 세트의 발현 수준을 체계적으로 변화시킴으로써, 기능이 복잡성으로 인해 예측하기 어렵도록 변형될 수 있다. 일부 변경은 성능을 증가시킬 수 있고 성능을 평가하기 위한 메커니즘과 연관되어, 이 기술은 개량된 기능을 가진 유기체의 생성을 가능하게 한다.

소분자 합성 경로의 상황에서, 효소는 기질로 시작하여 관심 소형 분자로 끝나는 직선 또는 가지 사슬에 있는 소형 분자 기질 및 생성물을 통해 상호작용한다. 이러한 상호작용이 순차적으로 연결되기 때문에, 이 시스템은 분산된 제어를 나타내며, 하나의 효소의 발현을 증가시키면 다른 효소가 속도 제한될 때까지만 경로 유속을 증가시킬 수 있다.

대사 조절 분석(MCA)은, 실험 데이터 및 제 1 원리로부터, 어느 효소 또는 효소들이 속도를 제한하는지를 결정하는 방법이다. 그러나, MCA는 새로운 속도 제한 효소를 결정하기 위한 각 발현 수준 변경 후에 광범위한 실험이 필요하기 때문에 제한적이다. 프로모터 스와핑은 이러한 상황에서 유리한데, 이는 이 경로에서 각 효소에 대한 프로모터 래더의 적용을 통해, 제한 효소가 발견되고, 속도 제한이 되는 새로운 효소를 찾기 위해 동일한 과정을 수행될 수 있기 때문이다. 또한, 기능에 대한 판독은 관심 소형 분자의 더 나은 생산이기 때문에, 어떤 효소가 제한되는지 결정하는 실험은 생산을 늘리는 공학과 동일하여, 개발 시간을 단축시킨다. 일부 실시태양에서, 본 발명은 다중 단위 효소의 개별 서브유닛을 암호화하는 유전자에 대한 PRO 스왑의 적용을 교시한다. 또 다른 실시태양에서, 본 발명은 개개의 효소 또는 전체 생합성 경로를 조절할 책임이 있는 유전자에 PRO 스왑 기술을 적용하는 방법을 교시한다.

일부 실시태양에서, 본 발명의 프로모터 스왑 도구는 선택된 유전자 표적의 최적 발현을 확인하는데 사용된다. 일부 실시태양에서, 프로모터 스왑의 목표는 대사 경로 또는 유전자 경로에서 병목을 감소시키기 위해 표적 유전자의 발현을 증가시키는 것일 수 있다. 다른 실시태양에서, 프로모터 스왑의 목표는 상기 표적 유전자의 발현이 요구되지 않을 때 숙주 세포에서 불필요한 에너지 소비를 피하기 위해 표적 유전자의 발현을 감소시키는 것일 수 있다.

전사, 수송 또는 신호 전달과 같은 다른 세포 시스템의 상황에서, 다양한 합리적인 방법이 사용되어 어떤 단백질이 발현 변화의 표적이고 그 변화가 무엇이어야하는지를 선험적으로 시험하고 밝혀낼 수 있다. 이러한 합리적인 방법은 성능 개량을 위해 테스트해야하는 교란의 수를 줄이지만, 상당한 비용이 든다. 유전자 결실 연구는 이의 존재가 특정 기능에 필수적인 단백질을 확인하고 중요한 유전자는 과다 발현될 수 있다. 단백질 상호작용의 복잡성으로 인해, 성능을 향상시키는데 종종 효과가 없다. 세포에서 단백질 수준의 함수로서, 첫 번째 원칙으로부터, 전사 또는 신호전달 행동을 기술하려고 시도하는 다양한 유형의 모델이 개발되었다. 이러한 모델은 종종 발현 변화가 상이한 기능이나 개량된 기능으로 이어질 수 있는 표적을 제안한다. 이 모델의 기초가 되는 가설은 단순하고 매개변수는 측정하기가 어려워서, 특히 비-모델 유기체에 대해 이런 모델이 한 예측은 종종 부정확하다. 유전자 삭제와 모델링 모두에 의해, 어떻게 특정 유전자에 영향을 미치는 지를 결정하는데 필요한 실험은 성능을 개량시키는 변화를 만드는 후속 작업과는 상이하다. 프로모터 스와핑은 이러한 어려움을 회피하는데, 이는 특정 교란의 중요성을 강조하는 구성된 균주가 이미 개량된 균주이기 때문이다.

따라서, 특정 실시태양에서, 프로모터 스와핑은 다음을 포함하는 다단계 공정이다:

1. "래더"로서 작용하는 "x" 프로모터의 세트를 선택하는 단계. 이상적으로 이런 프로모터는 다수의 게놈 유전자좌 전체에서 매우 가변적인 발현을 유도하는 것으로 나타났지만, 유일한 요구조건은 일부 유전자 발현을 교란시키는 것이다.

2. 표적화하기 위한 "n" 유전자의 세트를 선택하는 단계. 이 세트는 게놈의 모든 오픈 리딩 프레임(ORF) 또는 ORF의 서브세트일 수 있다. 서브세트는 기능과 관련된 ORF에 대한 주석을 사용하고, 이전에 입증된 유익한 교란(이전 프로모터 스왑 또는 이전 SNP 스왑)에 대한 관계에 의해, 이전에 생성된 교란 사이의 상위성 상호작용에 기초한 알고리즘 선택에 의해, 표적에 대한 유익한 ORF에 관한 가설에 기초한 다른 선택 기준 또는 무작위 선택을 통해 선택될 수 있다. 다른 실시태양에서, "n" 표적 유전자는 비-암호화 RNA를 포함하는 비-단백질 암호화 유전자를 포함할 수 있다.

3. 다음과 같은 유전자 변형을 신속하게- 및 일부 실시태양에서, 병렬-수행하는 고 처리량 균주 조작 단계: 천연 프로모터가 표적 유전자 n의 앞에 존재하고 이의 서열이 알려질 때, 천연 프로모터를 래더에 있는 x 프로모터의 각각으로 대체한다. 천연 프로모터가 존재하지 않거나 이의 서열이 알려지지 않을 때, 유전자 n의 앞에 있는 래더에 x 프로모터의 각각을 삽입한다(예를 들어, 도 21 참조). 이러한 방식으로, 균주의 "라이브러리"(HTP 유전자 디자인 라이브러리라고도 불림)가 구성되며, 라이브러리의 각 구성원은 그렇지 않으면 동일한 유전자 상황에서, n 표적에 작동 가능하게 연결된 x 프로모터의 한 예이다. 상기한 바와 같이, 프로모터의 조합이 삽입되어 라이브러리가 구성되는 조합 가능성의 범위를 확장시킬 수 있다.

4. 하나 이상의 메트릭에 대한 성능이 최적화되는 성능을 나타내는 상황에서 균주의 라이브러리의 고 처리량 선별 단계.

이 기본 과정은 특히 다음과 같은 방법으로 균주 성능에 추가 개량을 제공하는데 확장될 수 있다: (1) 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 단일 균주 배경 속에 다수의 유익한 교란을 통합하는 단계. 다중 교란은 정의된 변경의 특정 세트 또는 부분적으로 무작위화된 조합 라이브러리의 변화일 수 있다. 예를 들어, 표적 세트가 한 경로의 모든 유전자인 경우, 이전 라이브러리 균주의 개량된 구성원 또는 구성원들 속으로 교란의 라이브러리의 순차적 재생은 어느 유전자가 임의의 소정의 반복에서 속도를 제한하는지와 관계없이 한 경로에서 각 유전자의 발현 수준을 최적화할 수 있다; (2) 각 교란의 상호작용에 기초하여 최적의 교란 세트를 예측하기 위해 그 데이터를 사용하는 알고리즘 속에 라이브러리의 개별 및 조합 생성으로부터 성능 데이터를 제공하는 단계; 및 (3) 위의 두 접근법의 조합을 실행하는 단계(도 20 참조).

상기 논의된 분자 도구 또는 기술은 프로모터 스와핑으로서 특징화되지만, 프로모터에 제한되지 않으며 표적 세트의 발현 수준을 체계적으로 변화시키는 다른 서열 변화를 포함할 수 있다. 한 세트의 유전자의 발현 수준을 변화시키는 다른 방법은 다음을 포함할 수 있다: a) 리보좀 결합 부위의 래더(또는 진핵생물에서 코작 서열); b) 각각의 표적의 개시 코돈을 각각의 다른 개시 코돈으로 대체하는 단계(즉, 아래 논의된 개시/정지 코돈 교환); c) 다양한 mRNA 안정화 또는 불안정화 서열을 전사체의 5' 또는 3' 말단 또는 임의의 다른 위치에 부착하는 단계; d) 단백질 내의 임의의 위치에 다양한 단백질 안정화 또는 불안정화 서열을 부착하는 단계.

이 접근법은 산업용 미생물에 의해 본 발명에서 예시되었지만, 원하는 형질이 유전자 돌연변이 집단에서 동정될 수 있는 임의의 유기체에 적용 가능하다. 예를 들어, 이것은 CHO 세포, 효모, 곤충 세포, 조류뿐만 아니라 식물과 같은 다세포 유기체의 성능을 개량시키는데 사용될 수 있다.

2. SNP 스왑 : SNP 스왑 미생물 균주 라이브러리 유도를 위한 분자 도구

특정 실시태양에서, SNP 스와핑은 미생물 균주를 개량하기 위한 무작위 돌연변이유발 접근법이 아니라 오히려 균주 전체에서 개별 소핵 다형질 뉴클레오타이드 돌연변이(즉, SNP)의 체계적 도입 또는 제거(즉, "SNP 스와핑")를 필요로 한다.

이 과정을 통해 조작된 미생물은 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성된 실제의 물리적 미생물 균주 집합을 의미할 수 있으며, 각각의 구성원 균주는 그렇지 않으면 동일한 유전자 배경에서 소정의 SNP의 존재 또는 부재를 나타내며, 상기 라이브러리는 "SNP 스왑 미생물 균주 라이브러리"로 불린다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란의 집합을 의미할 수 있으며-이 경우 소정의 SNP가 존재하거나 존재하지 않는다-상기 집합은 "SNP 스왑 라이브러리"로 불린다.

일부 실시태양에서, SNP 스와핑은 확인된 유익한 성능 효과를 가진 표적 SNP "빌딩 블록"의 최적 조합에 의한 숙주 유기체의 재구성을 필요로 한다. 따라서, 일부 실시태양에서, SNP 스와핑은 다수의 유익한 돌연변이를 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 단일 균주 배경 속에 다수의 유익한 교란을 통합하는 단계를 필요로 한다. 다중 변화는 정의된 변화의 특정한 세트 또는 돌연변이의 부분적으로 무작위화된 라이브러리일 수 있다.

다른 실시태양에서, SNP 스와핑은 또한 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 균주로부터 유해한 것으로 확인된 다중 돌연변이를 제거하는 단계를 필요로 한다. 다중 변화는 정의된 변화의 특정한 세트 또는 돌연변이의 부분적으로 무작위화된 라이브러리일 수 있다. 일부 실시태양에서, 본 발명의 SNP 스와핑 방법은 유익한 SNP의 첨가 및 유해 및/또는 중성 돌연변이의 제거를 모두 포함한다.

SNP 스와핑은 개량된 관심 형질에 대한 돌연변이유발 및 선택에 영향을 받은 균주의 계통에서 유익한 및 유해한 돌연변이 둘 다를 확인하고 이용하기 위한 강력한 도구이다. SNP 스와핑은 돌연변이유발성 계통에서 개별 돌연변이의 영향을 체계적으로 결정하기 위해 고 처리량 게놈 공학 기술을 사용한다. 게놈 서열은 알려진 성능 개량을 갖는 돌연변이유발성 계통의 하나 이상의 세대에 걸쳐 균주에 대해 결정된다. 고 처리량 게놈 공학은 초기 계통 균주에서 개량된 균주로부터 돌연변이를 반복하고, 및/또는 나중 균주의 돌연변이를 초기 균주 서열로 되돌리는데 체계적으로 사용된다. 이들 균주의 성능을 평가하고 개량된 관심 표현형에 대한 각각의 개별 돌연변이의 기여가 결정될 수 있다. 상기한 바와 같이, 이 과정으로부터 초래된 미생물 균주는 분석되고/특성화되어, 숙주 균주 전체에서 미생물 균주 개량을 알릴 수 있는 SNP 스왑 유전자 디자인 라이브러리의 기초를 형성한다.

유해한 돌연변이의 제거는 즉각적인 성능 개량을 제공할 수 있고, 돌연변이유발 부담이 없는 균주 배경에 유익한 돌연변이의 통합은 균주 성능을 신속하고 크게 개량시킬 수 있다. SNP 스와핑 과정을 통해 생산된 다양한 미생물 균주는 HTP 유전자 디자인 SNP 스와핑 라이브러리를 형성하는데, 이는 다양한 추가/삭제/또는 통합된 SNP를 포함하지만 그렇지 않으면 동일한 유전자 배경을 가진 미생물 균주이다.

이전에 논의된 바와 같이, 성능 개량을 위한 무작위 돌연변이유발 및 후속 선별은 산업용 균주 개량을 위해 일반적으로 사용되는 기술이며, 대규모 제조에 현재 사용되는 많은 균주가 수년의 기간, 때때로 10년에 걸쳐 반복적으로 이 공정을 사용하여 개발되었다. UV 복사에너지 또는 에틸 메테인설포네이트와 같은 돌연변이유발 화학물질에 대한 노출과 같은 게놈 돌연변이를 생성하는 무작위 접근법은 다음과 같은 이유로 산업용 균주 개량에 바람직한 방법이었다: 1) 산업용 유기체는 유전적으로 또는 대사적으로 특성이 좋지 않을 수 있으므로 지시된 개량 접근법에 대한 표적 선택을 어렵거나 불가능하게 한다; 2) 비교적 잘 특성화된 시스템에서도, 산업용 성능 개선을 초래하는 변화는 예측하기 어렵고 알려진 기능이 없는 유전자의 교란을 필요로 할 수 있다. 3) 소정의 산업용 유기체에서 지시된 게놈 돌연변이를 만들기 위한 유전자 도구는 사용할 수 없거나 매우 느리거나 및/또는 사용하기 어렵다.

그러나, 상기 방법의 상기 이점에도 불구하고, 다수의 공지된 단점이 있다. 유익한 돌연변이는 비교적 드문 사건이며, 고정된 선별 용량으로 이러한 돌연변이를 찾기 위해서는, 돌연변이 속도가 충분히 높아야 한다. 이것이 원치 않는 중성 및 부분적으로 해로운 돌연변이가 유익한 변화와 함께 균주에 통합되는 것을 초래한다. 시간이 지남에 따라 이런 '돌연변이유발 부담'은 증가되어, 전반적인 견고함과 성장 속도와 같은 주요 형질이 결핍된 균주를 초래한다. 궁극적으로 '돌연변이유발 부담'은 무작위 돌연변이유발을 통한 성능의 개량을 얻기가 점차 더 어렵거나 불가능하게 한다. 적절한 도구가 없다면, 균주 계통의 다른 및 유사한 부문에서 발견된 유익한 돌연변이를 통합하는 것은 불가능하다.

SNP 스와핑은 돌연변이유발 계통 내의 균주를 비교할 때 관찰된 일부 또는 모든 돌연변이를 체계적으로 반복하거나 회귀시킴으로써 이러한 제한을 극복하는 접근법이다. 이 방법으로 유익한('원인성') 돌연변이가 확인되고 통합될 수 있으며 및/또는 해로운 돌연변이가 확인되고 제거될 수 있다. 이것은 추가 무작위 돌연변이유발 또는 표적화된 유전자 공학에 의해 달성될 수 없는 균주 성능의 신속한 개량을 허용한다.

유전자 부담의 제거 또는 유전자 부담이 없는 균주로의 유익한 변화의 통합은 추가 개량을 가능하게 할 수 있는 추가의 무작위 돌연변이유발을 위한 새롭고 견고한 출발점을 제공한다.

또한, 수직 유익한 변화가 돌연변이유발성 균주 계통의 다양하고, 구별된 분지를 통해 확인되므로, 이들 균주는 보다 우수한 실행 균주로 신속하게 통합될 수있다. 이런 돌연변이는 지시된 유전 공학에 의해 얻은 개량을 가진 균주와 같이 돌연변이유발 계통의 일부가 아닌 균주로 통합될 수 있다.

돌연변이유발 계통 내에서 균주 간의 돌연변이를 무작위로 재조합시키는 다른 접근법 및 기술이 존재한다. 이들은 원형질체 융합 및 돌연변이 균주 전체에서 게놈 재조합을 촉진하는 전체 게놈 셔플링과 같은 기술을 포함한다. 효모 및 사상 균류와 같은 일부 산업용 미생물의 경우, 자연 교배 주기가 쌍을 이루는 게놈 재조합에 이용될 수 있다. 이런 식으로, 해로운 돌연변이는 부모 균주에 의한 "백-크로싱(back-crossing)"에 의해 제거될 수 있고 유익한 돌연변이는 통합될 수 있다. 그러나, 이런 접근법은 본 발명의 SNP 스와핑 방법을 사용하여 우회되는 많은 제한을 받는다.

예를 들어, 이런 접근법은 돌연변이를 교환하기 위해 상대적으로 적은 수의 무작위 재조합 크로스오버 사건에 의존하기 때문에, 균주 성능을 최적화하기 위해 재조합 및 선별의 많은 사이클을 필요로 할 수 있다. 또한, 자연 재조합 사건은 본질적으로 무작위이지만, 이것은 게놈 위치 편향에 영향을 받고 일부 돌연변이는 해결하기 어려울 수 있다. 이런 접근법은 추가 게놈 시퀀싱 및 분석 없이 개별 돌연변이의 영향에 대한 정보도 거의 제공하지 않는다. SNP 스와핑은 무작위적인 접근 방식이 아니기 때문에 이러한 근본적인 한계를 극복하기보다는 오히려 균주 전체에서 개별 돌연변이의 체계적인 도입 또는 제거이기 때문에 이런 근보적인 제한을 극복한다.

일부 실시태양에서, 본 발명은 다양성 풀의 유기체들 사이에 존재하는 SNP 서열 다양성을 확인하는 방법을 교시한다. 다양성 풀은 분석을 위해 사용된 소정의 수 n의 미생물일 수 있으며, 상기 미생물의 게놈은 "다양성 풀"을 나타낸다.

특정 양태에서, 다양성 풀은 특정 시점(S₁Gen₁)에서 "기준선" 또는 "표준" 유전자 서열을 갖는 본래의 부모 균주(S₁) 및 상기 S₁ 균주로부터 유도/성장되고 S₁의 기준선 게놈과 관련하여 다른 게놈(S_2- _n Gen₂ _- _n )을 갖는 임의의 수의 후속 자손 균주(S_2- _n )일 수 있다.

예를 들어, 일부 실시태양에서, 본 발명은 다양성 풀에서 미생물 게놈을 서열화하여 각 균주에 존재하는 SNP를 확인하는 것을 교시한다. 한 실시태양에서, 다양성 풀의 균주는 역사적인 미생물 생산 균주이다. 따라서, 본 발명의 다양성 풀은 예를 들어 산업용 표준 균주 및 전통적인 균주 개량 프로그램을 통해 생산된 하나 이상의 돌연변이 산업용 균주를 포함할 수 있다.

일부 실시태양에서, 다양성 풀 내의 SNP는 "표준 균주"를 참조하여 결정된다. 일부 실시태양에서, 표준 균주는 야생형 균주이다. 다른 실시태양에서, 표준 균주는 임의의 돌연변이유발을 받기 전에 원래의 산업용 균주이다. 표준 균주는 실무자에 의해 정의될 수 있으며 원래의 야생형 균주 또는 원래의 산업용 균주일 필요는 없다. 기본 균주는 단순히 "기본", "표준" 또는 원래의 유전자 배경으로 간주 될 수 있는 것의 대표이며, 이로 인해 상기 표준 균주로부터 유도되거나 개발된 후속 균주는 비교될 것이다.

다양성 풀 내의 모든 SNPS가 확인되면, 본 발명은 개별적으로 및/또는 그룹으로 SNP의 효과(예를 들어, 관심 표현형의 생성)를 묘사(즉, 정량화 및 특성화)하기 위한 SNP 스와핑 및 선별 방법을 교시한다.

일부 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2- _n Gen ₂ _-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 표준 균주(S₁Gen₁) 또는 야생형 균주에 도입하는 단계("웨이브 업")를 포함한다.

다른 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2- _n Gen ₂ _-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 제거하는 단계("웨이브 다운")를 포함한다.

일부 실시태양에서, 하나 이상의 SNP 변화(도입 또는 제거)를 포함하는 각각의 생성된 균주는 본 발명의 하나 이상의 기준(예를 들어, 관심 화학물질 또는 생성물의 생산)하에서 배양되고 분석된다. 분석된 각 숙주 균주로부터의 데이터는 특정 SNP 또는 숙주 균주에 존재하는 SNP 그룹과 관련되거나 연관되며 미래 사용을 위해 기록된다. 따라서, 본 발명은 임의의 수의 관심 미생물 유전자 또는 표현형 형질에 대한 소정의 SNP의 효과를 확인할 수 있는 크고 고도로 주석화된 HTP 유전자 디자인 미생물 균주 라이브러리의 생성을 가능하게 한다. 이런 HTP 유전자 디자인 라이브러리에 저장된 정보는 HTP 게놈 공학 플랫폼의 기계 학습 알고리즘에 정보를 제공하고 과정의 미래 반복을 지시하여, 궁극적으로 매우 바람직한 특성/형질을 갖는 진화된 유기체를 유도한다.

3. 개시/정지 코돈 교환: 개시/정지 코돈 미생물 균주 라이브러리 유도를 위한 분자 도구

일부 실시태양에서, 본 발명은 개시 및 정지 코돈 변이체를 스와핑하는 방법을 교시한다. 예를 들어, 에스. 크레비시애(S. cerevisiae) 및 포유동물에 대한 전형적인 정지 코돈은 각각 TAA(UAA) 및 TGA(UGA)이다. 단핵구 식물의 전형적인 정지 코돈은 TGA(UGA)인 반면, 곤충과 대장균은 보통 TAA(UAA)를 정지 코돈으로 사용한다(Dalphin et al.(1996) Nucl. Acids Res. 24: 216-218). 다른 실시태양에서, 본 발명은 TAG(UAG) 정지 코돈의 사용을 교시한다.

본 발명은 스와핑 개시 코돈을 유사하게 교시한다. 일부 실시태양에서, 본 발명은 대부분의 유기체(특히, 진핵생물)에 의해 이용되는 ATG(AUG) 개시 코돈의 사용을 교시한다. 일부 실시태양에서, 본 발명은 원핵 생물이 ATG(AUG)를 가장 많이 사용하고 이어서 GTG(GUG) 및 TTG(UUG)를 사용하는 것을 교시한다.

다른 실시태양에서, 본 발명은 ATG 개시 코돈을 TTG로 대체시키는 것을 교시한다. 일부 실시태양에서, 본 발명은 ATG 개시 코돈을 GTG로 대체시키는 것을 교시한다. 일부 실시태양에서, 본 발명은 GTG 개시 코돈을 ATG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 GTG 개시 코돈을 TTG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TTG 개시 코돈을 ATG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TTG 개시 코돈을 GTG로 대체하는 것을 교시한다.

다른 실시태양에서, 본 발명은 TAA 정지 코돈을 TAG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TAA 정지 코돈을 TGA로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TGA 정지 코돈을 TAA로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TGA 정지 코돈을 TAG로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TAG 정지 코돈을 TAA로 대체하는 것을 교시한다. 일부 실시태양에서, 본 발명은 TAG 정지 코돈을 TGA로 대체시키는 것을 교시한다.

4. 스왑 중지: 최적화된 서열 미생물 균주 라이브러리 유도를 위한 분자 도구

일부 실시태양에서, 본 발명은 세포 유전자 전사의 최적화를 통해 숙주 세포 생산성을 개량시키는 방법을 교시한다. 유전자 전사는 전사 개시(RNAp 모집 및 전사 복합체 형성), 신장(가닥 합성/확장) 및 전사 종결(RNAp 분리 및 종결)을 포함하는 여러 별개의 생물학적 현상의 결과이다. (예를 들어, 프로모터를 변화시키거나 조절 전사 인자를 유도함으로써) 유전자의 전사 조절을 통한 유전자 발현의 제어에 많은 관심이 집중되었지만, 유전자 터미네이터 서열의 조절을 통한 전사의 조절에 대해서는 비교적 적은 노력이 있었다 .

전사가 유전자 발현 수준에 영향을 미치는 가장 명백한 방법은 프로모터 또는 인핸서 강도 및 트랜스 활성화 인자의 조합에 의해 조절될 수있는 Pol II 개시 속도를 이용하는 것이다(Kadonaga, JT. 2004 "Regulation of RNA polymerase II transcription by sequence-specific DNA binding factors" Cell. 2004 Jan 23; 116(2):247-57). 진핵생물에서, 연신율은 교차 스플라이싱에 영향을 줌으로써 유전자 발현 양상을 결정할 수있다(Cramer P. et　al., 1997 "Functional association between promoter structure and transcript alternative splicing." Proc Natl Acad Sci U S A. 1997 Oct 14; 94(21):11456-60). 유전자에 대한 실패한 종결은 Pol II에 대한 프로모터의 접근성을 감소시킴으로써 하류 유전자의 발현을 손상시킬 수 있다(Greger IH. et　al., 2000 "Balancing transcriptional interference and initiation on the GAL7 promoter of Saccharomyces cerevisiae." Proc Natl Acad Sci U S A. 2000 Jul 18; 97(15):8415-20). 전사 간섭으로 알려진 이 과정은 특히 진핵 생물과 관련이 있는데 이는 이들이 종종 밀접하게 이격된 유전자를 갖기 때문이다.

종결 서열은 또한 서열이 속하는 유전자의 발현에 영향을 미칠 수 있다. 예를 들어, 연구들은 진핵생물에서 비효율적인 전사 종결은 비접합 pre-mRNA의 축적을 초래한다는 것을 보여준다(West, S., and Proudfoot, N.J., 2009 "Transcriptional Termination Enhances Protein Expression in Human Cells" Mol Cell. 2009 Feb 13; 33(3-9); 354-364 참조). 다른 연구들은 또한 3'말단 처리가 비효율적인 종결에 의해 지연될 수 있다는 것을 보여주었다(West, S et　al., 2008 "Molecular dissection of mammalian RNA polymerase II transcriptional termination." Mol Cell. 2008 Mar 14; 29(5):600-10.). 전사 종결은 또한 합성 부위로부터 전사체를 방출함으로써 mRNA 안정성에 영향을 미칠 수 있다.

진핵생물에서 전사 메커니즘의 종결

진핵생물에서 전사 종결은 RNA 폴리머라제 II와 관련된 단백질 인자에 의해 인식되는 터미네이터 신호를 통해 작동한다. 일부 실시태양에서, 절단 및 폴리아데닐화 특이성 인자(CPSF) 및 절단 자극 인자(CstF)는 RNA 폴리머라제 II의 카복실 말단 도메인으로부터 폴리-A 신호로 전달된다. 일부 실시태양에서, CPSF 및 CstF 인자는 또한 종결 부위에 다른 단백질을 모집하고, 그런 후에 전사 복합체로부터 전사체를 절단하고 mRNA를 유리시킨다. 종결은 또한 mRNA 전사체의 폴리아데닐화를 유발한다. 입증된 진핵생물 종결 인자 및 보존된 구조의 예시적 예는 본 문서의 뒷부분에서 논의된다.

원핵생물에서 전사의 종결

원핵생물에서, Rho-비의존성 및 Rho-의존성 종결로 불리는 두 주요 메카니즘이 전사 종결을 매개한다. Rho-의존성 종결 신호는 외부의 전사 종결 인자를 필요로하지 않는데, 이는 일련의 우리딘(U) 잔기와 함께 이들 서열로부터 전사된 RNA에서 스템-루프 구조의 형성이 전사 복합체로부터 RNA 사슬의 방출을 촉진하기 때문이다. 한편, Rho 의존성 종결은 Rho라 불리는 전사 종결 인자 및 mRNA 상의 시스 작용 물질을 필요로 한다. Rho에 대한 초기 결합 위치인 Rho 활용 (rut) 위치는 높은 실제 터미네이터 서열의 상류에서 합성되는 RNA에서 사이티딘/낮은 구아노신 함량 및 비교적 적은 2차 구조를 특징으로 하는 확장된(~70개 뉴클레오타이드, 때때로 80-100개 뉴클레오타이드) 단일 가닥 영역이다. 폴리머라제 일시 중지 위치와 마주칠 때, 종결이 일어나고 전사체는 Rho의 헬라카제 활성에 의해 방출된다.

터미네이터 스와핑(STOP 스왑)

일부 실시태양에서, 본 발명은 전체 숙주 균주 생산성에 유익한 효과를 생성하기위한 최적 발현 성질을 갖는 종결 서열("터미네이터")을 선택하는 방법을 교시한다.

예를 들어, 일부 실시태양에서, 본 발명은 다양한 발현 강도(예를 들어, 하기 논의되는 터미네이터 래더)를 나타내는 하나 이상의 터미네이터를 확인하고 및/또는 숙주 세포 내에서 하나 이상의 터미네이터의 변이체를 생성하는 방법을 교시한다. 이들 확인된 및/또는 생성된 터미네이터의 특정 조합은 터미네이터 래더로서 함께 그룹화될 수 있으며, 이는 보다 상세히 이하에서 설명된다.

당해 터미네이터 래더는 소정의 관심 유전자와 결합된다. 따라서, 터미네이터 T₁-T₈(다양한 발현 강도를 나타내는 것으로 확인된 및/또는 생성된 8개의 터미네이터를 나타냄)이 있고 터미네이터 래더를 숙주 세포에서 관심 단일 유전자와 결합시킨다면(즉, 소정의 표적 유전자에 작동 가능하게 연결된 소정의 터미네이터에 의해 숙주 세포 유전적으로 조작한다), 8개 터미네이터의 각 조합의 효과는 조작된 숙주 세포가 표적 유전자와 결합된 특정 프로모터(들)를 제외하고 그렇지 않다면 동일한 유전자 배경을 갖는 것을 고려하여, 각 조합적 노력으로부터 생성되는 각각의 조작된 균주를 특성화함으로써 확인될 수 있다. 이 과정을 통해 조작되어 생성된 숙주 세포는 HTP 유전자 디자인 라이브러리를 형성한다.

HTP 유전자 디자인 라이브러리는 이 과정을 통해 형성되는 실제의 물리적 미생물 균주 집합을 의미할 수 있으며, 각각의 구성원 균주는 그렇지 않다면 동일한 유전자 배경으로 특정 표적 유전자에 작동 가능하게 연결된 소정의 터미네이터를 나타내며, 상기 라이브러리는 "터미네이터 스왑 미생물 균주 라이브러리" 또는 "STOP 스왑 미생물 균주 라이브러리"로 불린다.

또한, HTP 유전자 디자인 라이브러리는 유전자 교란의 집합을 의미할 수 있으며-이 경우 소정의 유전자 y에 작동 가능하게 연결된 소정의 터미네이터 x-상기 집합은 "STOP 스왑 라이브러리"로 불린다.

또한, 미생물을 조작하기 위해 프로모터 T₁-T₈을 포함하는 동일한 터미네이터 래더를 이용할 수 있으며, 8개의 터미네이터 각각은 10개의 상이한 유전자 표적에 작동 가능하게 연결된다. 이 절차의 결과는 관심 표적 유전자에 작동 가능하게 연결된 특정 터미네이터를 제외하고, 그렇지 않으면 유전적으로 동일하게 간주되는 80개의 숙주 세포 균주일 것이다. 이런 80개의 숙주 균주는 적절하게 선별되고 특성화될 수 있으며 다른 HTP 유전자 디자인 라이브러리를 생성할 수 있다. HTP 유전자 디자인 라이브러리에 미생물 균주의 특성화는 관계형 데이터베이스, 객체 지향 데이터베이스 또는 고도로 분산된 NoSQL 데이터베이스를 포함하나 이에 제한되지 않는 임의의 데이터베이스에 저장될 수 있는 정보와 데이터를 생성한다. 이런 데이터/정보는, 예를 들어, 소정의 유전자 표적에 작동 가능하게 연결될 때 소정의 터미네이터(예를 들어, T₁-T₈) 효과를 포함할 수 있다. 이 데이터/정보는 또한 둘 이상의 프로모터 T₁-T₈을 소정의 유전자 표적에 작동 가능하게 연결시킴으로써 초래되는 보다 광범위한 세트의 조합 효과일 수 있다.

상기 8개의 터미네이터 및 10개의 표적 유전자의 예는 단지 예시적인데, 이는 개념이 다양한 발현 강도 및 소정 수의 표적 유전자의 표시에 기초하여 함께 그룹화된 임의의 소정의 수의 프로모터와 함께 적용될 수 있기 때문이다.

요약하면, 다양한 터미네이터를 이용하여 유기체에서 다양한 유전자의 발현을 조절하는 것은 관심 형질을 최적화하는 강력한 도구이다. 본 발명자에 의해 개발된 터미네이터 스와핑의 분자 도구는 하나 이상의 조건하에서 적어도 하나의 유전자좌의 발현을 변화시키는 것으로 입증된 터미네이터 서열의 래더를 사용한다. 그런 후에 이 래더는 고 처리량 게놈 기술을 사용하여 유기체에서 한 유전자 그룹에 체계적으로 적용된다. 이 유전자 그룹은 여러 가지 방법 중 하나를 기반으로 관심 형질에 영향을 주는 높은 가능성을 갖는 것으로 결정된다. 이들은 알려진 기능에 기초한 선택 또는 관심 형질에 대한 영향 또는 이전에 결정된 유익한 유전자 다양성에 기초한 알고리즘 선택을 포함할 수 있다.

유전자에 연결된 터미네이터 서열을 함유하는 유기체의 생성된 HTP 유전자 디자인 미생물 라이브러리는 고 처리량 선별 모델에서의 성능에 대해 평가되고, 증가된 성능을 유도하는 프로모터-유전자 연관이 결정되고 정보는 데이터베이스에 저장된다. 유전자 교란의 집합(즉 소정의 유전자 y에 연결된 소정이 터미네이터 x)은 "터미네이터 스왑 라이브러리"를 형성하며, 이것은 미생물 조작 처리에 이용될 잠재적인 유전자 변형의 공급원으로 이용될 수 있다. 시간이 지남에 따라, 더 큰 세트의 유전자 교란이 더 큰 다양성의 미생물 배경에 대해 실행되기 때문에, 각 라이브러리는 임의의 관심 배경에 대한 표적화된 변화를 더욱 정확하고 예측되게 디자인하는데 사용될 수 있는 실험적으로 확인된 데이터의 모음으로서 더욱 강력해진다. 즉 일부 실시태양에서, 본 발명은 본 발명의 유전자 디자인 라이브러리의 임의의 것과 관련된 메타 데이터 내에 삽입된 이전의 실험 결과에 기초한 숙주 세포 속으로의 하나 이상의 유전자 변화를 도입하는 것을 교시한다.

따라서, 특정 실시태양에서, 터미네이터 스와핑은 다음을 포함하는 다단계 공정이다:

1. "래더"로서 작용하는 "x" 터미네이터의 세트를 선택하는 단계. 이상적으로 이런 터미네이터는 다수의 게놈 유전자좌 전체에서 매우 가변적인 발현을 유도하는 것으로 나타났지만, 유일한 요구조건은 일부 유전자 발현을 교란시키는 것이다.

2. 표적화하기 위한 "n" 유전자의 세트를 선택하는 단계. 이 세트는 게놈의 모든 오픈 리딩 프레임(ORF) 또는 ORF의 서브세트일 수 있다. 서브세트는 기능과 관련된 ORF에 대한 주석을 사용하고, 이전에 입증된 유익한 교란(이전 프로모터 스왑 STOP 스왑 또는 SNP 스왑)에 대한 관계에 의해, 이전에 생성된 교란 사이의 상위성 상호작용에 기초한 알고리즘 선택에 의해, 표적에 대한 유익한 ORF에 관한 가설에 기초한 다른 선택 기준 또는 무작위 선택을 통해 선택될 수 있다. 다른 실시태양에서, "n" 표적 유전자는 비-암호화 RNA를 포함하는 비-단백질 암호화 유전자를 포함할 수 있다.

3. 다음과 같은 유전자 변형을 신속하게- 및 일부 실시태양에서, 병렬-수행하는 고 처리량 균주 조작 단계: 천연 터미네이터가 표적 유전자 n의 3' 말단에 존재하고 이의 서열이 알려질 때, 천연 터미네이터를 래더에 있는 x 터미네이터의 각각으로 대체한다. 천연 터미네이터가 존재하지 않거나 이의 서열이 알려지지 않을 때, 유전자 정지 코돈 이후 래더에 x 터미네이터의 각각을 삽입한다.

이러한 방식으로, 균주의 "라이브러리"(HTP 유전자 디자인 라이브러리라고도 불림)가 구성되며, 라이브러리의 각 구성원은 그렇지 않으면 동일한 유전자 상황에서, n 표적에 작동 가능하게 연결된 x 터미네이터의 한 예이다. 상기한 바와 같이, 터미네이터의 조합이 삽입되어 라이브러리가 구성되는 조합 가능성의 범위를 확장시킬 수 있다.

이 기본 과정은 특히 다음과 같은 방법으로 균주 성능에 추가 개량을 제공하는데 확장될 수 있다: (1) 반복 과정에서 한 번에 하나씩 또는 단일 단계에서 다중 변화로서 단일 균주 배경 속에 다수의 유익한 교란을 통합하는 단계. 다중 교란은 정의된 변경의 특정 세트 또는 부분적으로 무작위화된 조합 라이브러리의 변화일 수 있다. 예를 들어, 표적 세트가 한 경로의 모든 유전자인 경우, 이전 라이브러리 균주의 개량된 구성원 또는 구성원들 속으로 교란의 라이브러리의 순차적 재생은 어느 유전자가 임의의 소정의 반복에서 속도를 제한하는지와 관계없이 한 경로에서 각 유전자의 발현 수준을 최적화할 수 있다; (2) 각 교란의 상호작용에 기초하여 최적의 교란 세트를 예측하기 위해 그 데이터를 사용하는 알고리즘 속에 라이브러리의 개별 및 조합 생성으로부터 성능 데이터를 제공하는 단계; 및 (3) 위의 두 접근법의 조합을 실행하는 단계.

5. 순서 최적화: 최적화된 서열 미생물 균주 라이브러리 유도를 위한 분자 도구

한 실시태양에서, 제공된 본 발명의 방법은 숙주 유기체에 의해 발현된 하나 이상의 유전자를 최적화하는 코돈을 포함한다. 다양한 숙주에서 발현을 향상시키기 위해 코돈을 최적화하는 방법은 당해 분야에 공지되어 있고, 문헌에 기술된다(그 전체가 본 발명에 참조로 포함된 미국 특허출원 공개공보 제2007/0292918호 참조). 특정 원핵 또는 진핵 숙주(Murray et al. (1989) Nucl. Acids Res.17 : 477-508 참조)에 의해 선호되는 코돈을 함유하는 최적화된 암호화 서열은, 예를 들어, 번역 속도를 증가시키거나 또는 최적화되지 않은 서열로부터 생산된 전사체와 비교할 때, 더 긴 반감기와 같은 바람직한 특성을 갖는 재조합 RNA 전사체를 생성하도록 제조된다.

단백질 발현은 전사, mRNA 프로세싱 및 안정성 및 번역 개시에 영향을 미치는 인자를 포함하는 다수의 인자에 의해 지배된다. 따라서 최적화는 임의의 특정 유전자의 많은 서열 특징의 임의의 것을 처리할 수 있다. 특정 예로서, 드문 코돈 유도 번역 일시 중지는 감소된 단백질 발현을 초래할 수 있다. 드문 코돈 유도 번역 일시 중지는 숙주 유기체에서 거의 사용되지 않는 관심 폴리뉴클레오타이드에서 코돈의 존재를 포함하며 이용가능한 tRNA 풀에서의 희소성 때문에 단백질 번역에 부정적인 영향을 미칠 수 있다.

대안적인 번역 개시는 또한 감소된 이종 단백질 발현을 초래할 수 있다. 대안적인 번역 개시는 의도하지 않게 리보솜 결합 부위(RBS)로서 기능할 수 있는 모티프를 함유하는 합성 폴리뉴클레오타이드 서열을 포함할 수 있다. 이런 위치는 유전자 내부 위치로부터 잘린 단백질의 번역을 시작할 수 있다. 정제 과정에서 제거하기 어려울 수 있는 절단된 단백질을 생산할 가능성을 줄이는 한 가지 방법은 최적화된 폴리뉴클레오티드 서열로부터 추정된 내부 RBS 서열을 제거하는 것을 포함한다.

반복체-유도된 폴리머라제의 슬리파지(slippage)는 감소된 이종 단백질 발현을 초래할 수 있다. 반복체-유도된 폴리머라제의 슬리파지는 프레임변이 돌연변이를 초래할 수 있는 DNA 폴리머라제의 슬리파지 또는 스터터링(stuttering)을 유발하는 것으로 밝혀진 뉴클레오티드 서열 반복을 필요로 한다. 이러한 반복체는 또한 RNA 폴리머라제의 슬리파지를 유발할 수 있다. 높은 G+C 함량 편향을 갖는 유기체에서, G 또는 C 뉴클레오타이드 반복체로 구성된 더 높은 등급의 반복체가 존재할 수 있다. 따라서, RNA 폴리머라제의 슬리파지를 유도하는 가능성을 줄이는 한 가지 방법은 G 또는 C 뉴클레오타이드의 연장된 반복체를 변경하는 것을 포함한다.

2차 구조를 간섭하면 또한 감소된 이종 단백질 발현을 초래할 수 있다. 2차 구조는 RBS 서열 또는 개시 코돈을 격리할 수 있고 단백질 발현의 감소와 상관관계가있다. 스템루프 구조는 또한 전사 일시 중지 및 약화에 관여할 수 있다. 최적화 된 폴리뉴클레오타이드 서열은 RBS 내에 최소 2차 구조 및 뉴클레오타이드 서열의 유전자 암호화 영역을 함유하여 개량된 전사 및 번역을 가능하게 한다.

예를 들어, 최적화 공정은 숙주에 의해 발현되는 원하는 아미노산 서열을 확인함으로써 시작될 수있다. 아미노산 서열로부터 후보 폴리뉴클레오타이드 또는 DNA 서열이 디자인될 수 있다. 합성 DNA 서열의 디자인 동안, 코돈 사용의 빈도는 숙주 발현 유기체의 코돈 사용과 비교될 수 있고 드문 숙주 코돈은 합성 서열로부터 제거될 수있다. 또한, 합성 후보 DNA 서열은 바람직하지 않은 효소 제한 부위를 제거하고 원하는 신호 서열, 링커 또는 비번역 영역을 추가 또는 제거하기 위해 변형될 수 있다. 합성 DNA 서열은 G/C 반복체 및 스템-루프 구조와 같이 번역 과정을 방해할 수 있는 2차 구조의 존재에 대해 분석될 수 있다.

6. 상위성 매핑 - 유익한 유전자 통합을 가능하게 하는 예측 분석 도구

일부 실시태양에서, 본 발명은 유익한 유전자 변형을 예측하고 숙주 세포 내로 결합시키는 상위성 매핑 방법을 교시한다. 유전자 변형은 상기한 HTP 분자 도구 세트(예를 들어, 프로모터 스왑, SNP 스왑, 개시/정지 코돈 교환, 서열 최적화)의 임의의 것에 의해 일어날 수 있고 이러한 유전자 변형의 효과는 유도된 HTP 유전자 디자인 미생물 균주 라이브러리의 특성화로부터 알 수 있다. 따라서, 본 발명에서 사용된 용어 상위성 매핑은 숙주 성능의 증가를 초래할 수 있는유전자 변형의 조합(예를 들어 유익한 SNP 또는 유익한 프로모터/표적 유전자 결합)의 조합을 확인하는 방법을 포함한다.

실시태양에서, 본 발명의 상위성 맵핑 방법은 2개의 상이한 작용기로부터의 유익한 돌연변이의 조합이 동일한 작용기로부터의 돌연변이의 조합과 비교하여, 숙주 성능을 개량시키가 더 쉽다는 아이디어에 기초한다. 예를 들어, Costanzo, The Genetic Landscape of a Cell, Science, Vol. 327, Issue 5964, Jan. 22, 2010, pp. 425-431 참조(전문이 본 발명에 참조로 포함).

동일한 작용기로부터의 돌연변이는 동일한 메카니즘에 의해 작용할 가능성이 더 높으며, 따라서 전체 숙주 성능에 대해 음성 또는 중성 상위성을 나타내기가 더 쉽다. 대조적으로, 상이한 작용기로부터의 돌연변이는 독립적인 메카니즘에 의해 작동하기 쉽고, 이로 인해 개량된 숙주 성능 및 일부 경우에 상승 효과를 유도할 수 있다. 예를 들어, 도 19를 참조하면, lysA 및 zwf는 라이신 생산을 달성하기 위해 상이한 경로에서 작용하는 유전자이다. 이러한 유전자의 개별적인 성능의 비유사성에 기초하여, 이들 유전자를 사용하는 유전자 변화는 부가적 통합 효과를 가져와야한다. 이는 도 16b 및 실시예 6에 나타낸 바와 같이 lysA 및 zwf의 조합의 통합 효과의 실제 측정에서 입증되었다.

따라서, 일부 실시태양에서, 본 발명은 상이한 작용기에 속하는 것으로 예측되는 SNP를 확인하기 위해 SNP 돌연변이를 분석하는 방법을 교시한다. 일부 실시태양에서, SNP 작용기 유사성은 돌연변이 상호작용 프로파일의 코사인 유사성(상관 계수와 유사, 도 16a 참조)을 계산함으로써 결정된다. 본 발명은 또한 돌연변이 유사성 행렬(도 15 참조) 또는 덴드로그램(도 16a 참조)을 통한 SNP의 비교를 예시한다.

따라서, 상위성 매핑 절차는 하나 이상의 유전자 배경에 상기 돌연변이의 효율적이고 효과적인 통합을 위해 하나 이상의 유전자 배경에 적용된 다양성의 유전 돌연변이를 그룹화 및/또는 순위화하는 방법을 제공한다.

양태에서, 통합은 표적 생체분자의 생산을 위해 최적화된 신규 균주를 생성하는 목적으로 수행된다. 교시된 상위성 매핑 절차를 통해, 돌연변이의 기능적 그룹화를 확인하는 것이 가능하며 이런 기능적 그룹화는 바람직하지 않은 상위성 효과를 최소화하는 통합 전략을 가능하게 한다.

상기한 바와 같이, 산업용 발효에 사용하기 위한 미생물의 최적화는 중요하고 경제, 사회 및 자연계에 대한 광범위하게 관련된 어려운 문제이다. 전통적으로, 미생물 조작은 무작위 돌연변이유발의 느리고 불확실한 과정을 통해 수행되었다. 이런 접근법은 인위적으로 부과된 선택 압력에 적응할 수 있는 세포의 자연적 진화 능력을 활용한다. 이런 접근법은 유익한 돌연변이의 희귀성, 근본적인 적합함 환경의 견고함에 의해 제한되며 보다 일반적으로 세포 및 분자 생물학의 최신기술을 충분히 활용하지 못한다.

현대의 접근법은 기계적 수준에서 세포 기능의 새로운 이해 및 특정 표현형 말단에 대해 표적화된 유전자 조작을 수행하는 새로운 분자 생물학 도구를 활용한다. 실제로, 이런 합리적인 접근법은 생물학의 근본적인 복잡성에 의해 혼란스럽게 된다. 인과관계 매커니즘은, 특히 관찰된 유익한 효과가 있는 두 개 이상의 변화를 결합하려고 시도할 때 잘 이해되지 않는다. 때로는 순 긍정적인 결과가 예상보다 낮을 수도 있고 경우에 따라 예상보다 높을 수도 있지만, 유전자 변화의 이런 통합은 긍정적인 결과(원하는 표현형 활동의 증가로 측정됨)를 가져온다. 다른 경우, 이런 조합은 순 중성 효과 또는 순 부정적인 효과를 일으킨다. 이 현상은 상위성으로 불리고 미생물 공학(및 일반적으로 유전자 공학)에 대한 근본적인 도전 중 하나이다.

상기한 바와 같이, 본 HTP 게놈 공학 플랫폼은 전통적인 미생물 공학 접근법과 관련된 많은 문제점을 해결한다. 현재의 HTP 플랫폼은 자동화 기술을 사용하여 한 번에 수백 또는 수천 개의 유전자 변이를 실행한다. 특정 양태에서, 상기한 합리적인 접근법과는 달리, 개시된 HTP 플랫폼은 전문이 본 발명에 참조로 포함된 Microbial Strain Design System And Methods For Improved Large-Scale Production Of Engineered Nucleotide Sequences 이란 제목의 미국 특허 출원 제15/140,296호에 개시된 바와 같이 수천 개의 돌연변이체의 병렬 건설을 가능하게 하여 관련 게놈 공간의 큰 서브세트를 보다 효과적으로 탐사할 수 있게 한다. 공학적 염기 서열의 개선 된 대규모 생산을위한 시스템 및 방법으로서, 본 명세서에서 그 전체가 참고로 인용된다. "모든 것"을 시도함으로써, 현재의 HTP 플랫폼은 제한된 생물학적 이해에 의해 유도된 어려움을 회피한다.

그러나, 동시에, 본 HTP 플랫폼은 게놈 공간의 조합 폭발성 크기 및 유전자 상호작용의 복잡성을 고려하여 생성된 데이터 세트를 해석하는 계산 기술의 효과에 의해 근본적으로 제한되는 문제에 직면한다. 원하는 결과를 산출하는 조합의 비 무작위 선택을 최대화하는 방식으로 광대한 조합 공간의 서브세트를 탐구하는 기술이 필요하다.

다소 유사한 HTP 접근법이 효소 최적화의 경우에 효과적이라는 것이 증명되었다. 이 틈새 문제에서, 관심 게놈 서열(약 1000 염기)은 일부 복잡한 물리적 구성을 가진 단백질 사슬을 암호화한다. 정확한 구성은 구성 원자 구성요소 사이의 집단적 전자기 상호작용에 의해 결정된다. 짧은 게놈 서열과 물리적으로 구속된 접힘 문제의 조합은 탐욕 최적화 전략(greedy optimization strategies)에 특히 적합하다. 즉, 모든 잔기에서 서열을 개별적으로 돌연변이시키고, 생성된 돌연변이를 뒤섞어 서열 활성 반응 모델링과 양립가능한 해상도로 로컬 서열 공간을 효과적으로 샘플링하는 것이 가능하다.

그러나, 생체 분자에 대한 완전한 게놈 최적화를 위해, 이런 잔기-중심 접근법은 몇 가지 중요한 이유 때문에 불충분하다. 첫째, 생체 분자에 대한 게놈 최적화와 관련된 관련 서열 공간의 기하 급수적인 증가 때문이다. 둘째, 생체분자 합성에서 조절, 발현 및 대사 상호작용의 추가된 복잡성 때문이다. 본 발명자들은 교시 된 상위성 매핑 절차를 통해 이러한 문제점을 해결하였다.

상기 돌연변이를 하나 이상의 유전자 배경 속에 더 효율적이고 효과적으로 통합하기 위해서 돌연변이의 집합 사이의 상위성 상호작용을 모델링하는 교시된 방법은 획기적이며 당업계에서 매우 필요하다.

상위성 매핑 절차를 기술할 때, 용어 "더 효율적" 및 "더 효과적인"은 특정 표현형 목표와 관련하여 통합 균주 사이의 바람직하지 않은 상위성 상호작용의 회피를 의미한다.

상기 과정이 일반적으로 상기에 상세하게 설명되었으므로, 더 구체적인 워크 플로우 예가 이제 설명될 것이다.

먼저, M 돌연변이 및 하나 이상의 유전자 배경(예를 들어, 부모 박테리아 균주)의 라이브러리로 시작한다. 라이브러리의 선택이나 유전자 배경의 선택은 여기에 설명된 방법에 특이적이지 않다. 그러나 특정 구현예에서, 돌연변이의 라이브러리는 SNP 스왑 라이브러리, 프로모터 스왑 라이브러리 또는 본 발명에 설명된 임의의 다른 돌연변이 라이브러리를 독점적으로 또는 조합하여 포함할 수 있다.

한 구현예에서, 단일 유전자 배경만이 제공된다. 이 경우, 구별된 유전자 배경(미생물 돌연변이)의 집합이 이 단일 배경에서 먼저 생성될 것이다. 이것은 소정의 배경에 돌연변이의 기본 라이브러리(또는 이의 일부 서브세트)를 적용, 예를 들어, 특정 SNP의 HTP 유전 디자인 라이브러리 또는 특정 프로모터의 HTP 유전 디자인 라이브러리의 특정 유전자 배경에 대해 적용함으로써 달성되어 본 발명에 포함된 소정의 HTP 유전자 디자인 라이브러리로부터의 특정 유전자 변형을 제외하고는 동일한 유전자 배경을 가진 미생물 돌연변이 개체군(아마도 100 또는 1,000)을 생성할 수 있다. 아래에서 상세히 설명하는 바와 같이, 이 실시태양은 조합 라이브러리 또는 쌍을 이루는 라이브러리를 유도할 수 있다.

또 다른 구현예에서, 구별된 알려진 유전자 배경의 집합이 간단히 주어질 수있다. 아래에서 상세히 설명되는 바와 같이, 이 실시태양은 조합 라이브러리의 서브세트를 유도할 수 있다.

한 특정 구현예에서, 이런 배경 사이의 유전자 배경 및 유전자 다양성의 수 (돌연변이 또는 서열 편집 거리 등의 수로 측정)는 이 방법의 효과를 최대화하도록 결정된다.

유전자 배경은 천연, 고유한 또는 야생형 균주 또는 돌연변이된 조작 균주일 수 있다. N개의 구별된 배경 균주는 벡터 b로 나타낼 수 있다. 한 실시예에서, 배경 b는 N개의 돌연변이된 배경 균주 b = m₀b₀ = (m₁b₀, m₂b₀, ... m_Nb₀)를 형성하기 위해 N개의 일차 돌연변이 m₀ = (m₁, m₂, ... m_N)을 야생형 배경 균주 b₀에 적용하여 형성된 조작된 배경을 나타낼 수 있으며, 여기서, m_ib₀는 배경 균주 b₀에 대한 돌연변이 m_i의 적용을 나타낸다.

각각의 경우에(즉, 하나의 제공된 유전자 배경 또는 유전자 배경의 집합), 결과는 N개의 유전적으로 구별된 배경의 집합이다. 관련 표현형은 각 배경에 대해 측정된다.

둘째, M 돌연변이 m₁의 집합에서 각 돌연변이는 N개의 배경 균주 b의 집합 내의 각 배경에 적용되어 M × N 돌연변이체의 집합을 형성한다. N개의 배경이 그 자체로 돌연변이 m₀의 기본 세트(위에 설명된 대로)를 적용하여 얻은 구현예에서, 돌연변이체의 생성된 집합은 때로는 조합 라이브러리 또는 쌍을 이루는 라이브러리로 불릴 수 있다. 공지된 배경의 집합이 명시적으로 제공되는 다른 구현예에서, 돌연변이체의 생성된 세트는 조합 라이브러리의 서브세트로 불릴 수 있다. 조작된 배경 벡터의 생성과 유사하게, 실시태양에서, 입력 인터페이스(202)는 돌연변이 벡터 m₁과 배경 벡터 b 및 교차 곱과 같은 특정 연산을 수신한다.

상기 조작된 배경 예를 계속하면, MxN 조합 라이브러리를 형성하는 것은 m₁ x m₀b₀에 의해 형성되는 행렬로 표현될 수 있으며, b의 N 배경에 적용된 m₁의 교차 곱 b = m₀b₀, m₁에서 각 돌연변이는 b 내의 각 배경 균주에 적용된다. 생성된 MxN 행렬의 각 i번째 행은 m₁ 내 i번째 돌연변이의 배경 집합 b 내의 모든 균주에 대한 적용을 나타낸다. 하나의 실시태양에서, m₁ = m₀이고 행렬은 출발 균주 b₀에 동일한 돌연변이의 쌍을 이루는 적용을 나타낸다. 이 경우 행렬은 대각선(M = N) 근처에서 대칭이며 대각선은 동일한 돌연변이의 2회 적용을 나타내기 때문에 모든 분석에서 무시될 수 있다.

실시태양에서, MxN 행렬을 형성하는 것은 입력 인터페이스(202)에 복합 표현 m₁ x m₀b₀을 입력함으로써 달성될 수 있다. 표현의 구성요소 벡터는 하나 이상의 DNA 명세를 통해 명시적으로 지정된 요소로 직접 입력되거나 인터프리터(204)에 의한 해석 동안 벡터의 검색을 가능하게 하기 위해 라이브러리(206)에 대한 호출로서 입력될 수있다. 인터프리터(204), 실행 엔진(207), 주문 배치 엔진(208) 및 공장(210)을 통해 "Microbial Strain Design System and Methods for Improved Large Scale Production of Engineered Nucleotide Sequences,"이라는 제목의 미국 특허출원 제15/140,296호에 개시된 바와 같이, LIMS 시스템(200)은 입력 표현에 의해 지정된 미생물 균주를 생성한다.

셋째, 도 42를 참조하면, 분석 장비(214)는 MxN 조합 라이브러리 행렬(4202) 내의 각각의 돌연변이체에 대한 표현형 반응을 측정한다. 이와 같이, 응답의 집합은 MxN 응답 행렬 R로 해석될 수 있다. R의 각 요소는 r_ij = y(m_i, m_j)로 나타낼 수 있으며, 여기서 y는 돌연변이 m_i에 의해 돌연변이된 조작된 집합 b 내의 배경 균주 b_j의 응답(성능)을 나타낸다. 단순성과 실용성을 위해, m₁ = m₀인 쌍을 이루는 돌연변이를 가정한다. 돌연변이의 세트가 상을 이루는 돌연변이 라이브러리를 나타내는 경우, 생성된 행렬은 유전자 상호작용 행렬 또는 보다 구체적으로 돌연변이 상호작용 행렬로 불릴 수 있다.

당업자는, 일부 실시태양에서, 상위성 효과 및 예측 균주 디자인과 관련된 작업이, 예를 들어 분석 장비(214) 또는 인간의 구현에 의한 LIMS 시스템(200)의 자동화 수단을 통해 또는 자동화 및 수동 수단의 조합을 통해 완전히 수행될 수 있다는 것을 인식할 것이다. 작업이 완전히 자동화되지 않으면, 예를 들어, 분석 장비 (214)와 같은 LIMS 시스템(200)의 요소는, 예를 들어, 자신의 작업 능력을 통해 결과를 생성하기 보다는 작업의 인간 수행 결과를 수신할 수 있다. 본 발명의 다른 곳에서 기술된 바와 같이, 분석 장비(214)와 같은 LIMS 시스템(200)의 구성요소는 전체적으로 또는 부분적으로 하나 이상의 컴퓨터 시스템에 의해 구현될 수 있다. 일부 실시태양에서, 특히 예측 균주 디자인과 관련된 작업이 자동 및 수동 수단의 조합에 의해 수행되는 경우, 분석 장비(214)는 컴퓨터 하드웨어, 소프트웨어 또는 펌웨어(또는 이들의 조합)뿐만 아니라 아래 표 5에 열거된 것과 같은 인간 작업자에 의해 작동된 장비, 예를 들어 "성능 평가" 범주에 나열된 장비를 포함할 수 있다.

넷째, 분석 장비(212)는 응답 행렬을 정규화한다. 정규화는 편향을 제거하고 및/또는 이 방법에 특이적인 효과의 관련 부분을 분리할 목적으로 측정된 응답 값을 조정하는 수동 및/또는 자동화 프로세스로 구성된다. 도 42와 관련하여, 제 1 단계(4202)는 정규화된 측정 데이터를 얻는 단계를 포함 할 수 있다. 일반적으로, 예측 균주 디자인 및 상위성 매핑에 관한 청구항에서, "성능 측정" 또는 "측정 된 성능" 등의 용어는 일부 방식으로 처리되지 않거나 처리딘 측정 데이터, 예를 들어, 정규화된 데이터를 반영하는 메트릭을 기술하는데 사용될 수 있다. 특정 구현예에서, 정규화는 측정된 응답 값으로부터 이전에 측정된 배경 응답을 뺌으로써 수행될 수 있다. 그 구현예에서, 생성된 응답 요소는 r_ij = y(m_i, m_j) - y(m_j)로서 형성될 수 있으며, 여기서 y(m_j)는 1차 돌연변이 m_j의 부모 균주 b₀에 대한 적용에 의해 유발된 조직돤 집합 b 내의 조작된 배경 균주 b_j의 반응이다. 정규화된 응답 행렬의 각 행은 상응하는 돌연변이에 대한 응답 프로파일로 취급된다는 것에 유의한다. 즉, i번째 행은 j = 1 내지 N에 대한 모든 배경 균주 b_j에 적용된 상응하는 돌연변이 m_i의 상대적 효과를 기술한다.

쌍을 이루는 돌연변이의 예와 관련하여, 2개의 돌연변이로부터 생성된 균주의 성능/반응은 개별적으로 돌연변이의 각각에 대한 균주의 성능/반응보다 크거나, 작거나 같을 수 있다. 이 효과는 "상위성"으로 알려져 있으며, 일부 실시태양에서, e_ij = y(m_i, m_j) - (y(m_i) + y(m_j)로 나타낼 수있다. 이런 수학 표현의 변형이 가능하며, 예를 들어 개별 변화가 생물학적으로 어떻게 상화작용하는지에 따라 달라질 수 있다. 상기한 바와 같이, 동일한 작용기로부터의 돌연변이는 동일한 메카니즘에 의해 작동하기 쉽고, 따라서 전체 숙주 성능에 대해 음성 또는 중성 상위성을 나타내기 쉽다. 반대로, 상이한 작용기로부터의 돌연변이는 독립적인 메카니즘에 의해 작동하기 쉽고, 이는 예를 들어 여분의 돌연변이 효과를 감소시킴으로써 개량된 숙주 수행을 유도할 수 있다. 따라서, 유사하지 않은 반응을 일으키는 돌연변이는 유사한 반응을 일으키는 돌연변이보다 부가적인 방식으로 결합하기 쉽다. 이것은 다음 단계에서 유사성 계산을 유도한다.

다섯째로, 분석 장비(214)는 응답들 사이의 유사성-쌍을 이루는 돌연변이 실시예에서, 응답 행렬(4204) 내에서 i번째 돌연변이와 j번째(예를 들어, 1차) 돌연변이의 영향 사이의 유사성을 측정한다. R의 i번째 행은 N개의 배경 균주에 대한 i번째 돌연변이 m_i의 성능 영향을 나타내며, 이의 각각은 자체로 상기한 대로 조작된 돌연변이의 결과일 수 있다는 것을 상기한다. 따라서 i번째와 j번째 돌연변이의 영향 사이의 유사성은 유사성 행렬 S를 형성하기 위해 각각 i번째와 j번째 행, ρ_i및 ρ_j 사이의 유사성 s_ij로 각각 나타낼 수 있으며, 이의 예는 도 15에 예시된다. 유사성은 교차-상관관계 또는 절대 코사인 유사성, 예를 들어 s_ij = abs(cos(ρ_i, ρ_j)과 같은 많은 공지된 기술을 사용하여 측정될 수 있다.

코사인 유사성과 같은 메트릭에 대한 대안 또는 보완으로서, 응답 프로파일은 클러스터링되어 유사성의 등급을 결정할 수 있다. 클러스터링은 적절한 거리 측정(예를 들어, 유클리드(Euclidean), 해밍(Hamming) 등)과 함께 거리 기반 클러스터링 알고리즘(예를 들어, k- 평균, 계층적 응집 등)의 사용에 의해 수행될 수 있다. 대안적으로, 클러스터링은 적절한 유사성 척도(예를 들어, 코사인, 상관관계 등)를 갖는 유사성 기반 클러스터링 알고리즘(예를 들어, 스펙트럼, 최소-커트 등)을 사용하여 수행될 수 있다. 물론, 거리 측정은 임의의 수의 표준 기능 작업(예를 들어, 지수 함수)을 통해 유사성 측정치로 매핑될 수 있고 그 반대의 경우도 가능하다. 일 구현예에서, 계층적 응집 클러스터링은 절대 코사인 유사성과 함께 사용될 수 있다. (도 16a 참조).

클러스터링의 한 예로서, C를 k개의 구별된 클러스터로의 돌연변이 m_i의 클러스터링이라하자. C를 클러스터 멤버십 행렬이라 하며, 여기서 c_ij는 돌연변이 i가 클러스터 j에 속하는 정도, 0과 1 사이의 값이다. 돌연변이 i와 j의 사이의 클러스터 기반 유사성은 C_ixC_j(C의 i번째 및 j번째 행의 도트 곱)으로 제공된다. 일반적으로, 클러스터 기반의 유사성 행렬은 CC^T(즉, C 곱 C-트랜스포즈)로 제공된다. 하드 클러스터링의 경우(돌연변이가 정확하게 하나의 클러스터에 속한다), 두 돌연변이 사이의 유사성은 동일한 클러스터에 속하면 1이고 그렇지 않은 경우 0이다.

Costanzo, The Genetic Landscape of a Cell, Science, Vol. 327, Issue 5964, Jan. 22, 2010, pp. 425-431(그 전문이 본 명세서에서 참조로 포함됨)에 기술된 바와 같이, 돌연변이 반응 프로파일의 이런 클러스터링은 세포의 근본적인 기능적 조직의 대강의 매핑에 관한 것이다. 즉, 함께 집단화되는 돌연변이는 근본적인 생물학적 과정이나 대사 경로와 관련되는 경향이 있다. 이런 돌연변이는 본 명발명에서는 "작용기"라고 부른다. 이 방법의 주요 관측은 두 돌연변이가 동일한 생물학적 과정 또는 경로에 의해 작동한다면, 관측된 효과(및 주목할만하게 관찰된 이점)가 중복될 수 있다는 것이다. 반대로, 두 개의 돌연변이가 구별된 메커니즘에 의해 작동한다면, 유익한 효과가 중복될 가능성이 적을 것이다.

여섯째, 상위성 효과에 기초하여, 분석 장비(214)는 비유사 응답을 유도하는 돌연변이의 쌍을 선택하는데, 예를 들어 도 42(4206)에 도시된 바와 같이(예를 들어, 도 15 및 도 16a) 이들의 코사인 유사성 메트릭이 유사성 임계치 아래로 떨어지거나 이들의 반응이 충분히 분리된 클러스터들 내에 있다. 이들의 비유사성에 근거하여, 선택된 쌍의 돌연변이는 유사한 쌍보다 배경 균주로 통합되어야 한다.

충분히 비유사한 응답을 유도하는 선택된 쌍의 돌연변이에 기초하여, LIMS 시스템(예를 들어, 인터프리터(204), 실행 엔진(207), 주문 배치기(208) 및 공장(210)의 모든 또는 일부 조합)이 그 선택된 돌연변이(4208)를 가진 미생물 균주를 디자인하는데 사용될 수 있다. 실시태양에서, 이하 및 본 발명의 다른 곳에서 기술된 바와 같이, 상위성 효과는 균주 선택을 가중하거나 여과하기 위해 예측 모델 속에서 형성될 수 있거나 예측 모델과 함께 사용될 수있다.

일부 바람직한 예측 모델을 통해 특정 배경 속에 라이브러리로부터의 돌연변이의 집합을 통합함으로써 얻어진 가상의 균주의 성능(즉, 점수)을 추정할 수 있다고 가정한다. 교시된 방법에서 이용된 대표적인 예측 모델은 "Computational Analysis and Prediction of Effects of Genome-Wide Genetic Design Criteria."의 더 큰 섹션에서 발견된 "Predictive Strain Design"란 제목의 이하 섹션에 제공된다.

선형 회귀와 같은 예측 균주 디자인 기술을 사용하는 경우, 분석 장비(214)는 단지 충분하게 비유사한 돌연변이를 유지하기 위해 회귀 결과를 필터링하여 낮은 유사성 척도를 가진 돌연변이에 모델을 제한할 수 있다. 대안적으로, 예측 모델은 유사성 행렬로 가중될 수 있다. 예를 들어, 일부 실시태양은 제안된 돌연변이의 상호의존성을 특성화하기 위해 유사성 행렬을 사용하여 가중된 최소 제곱 회귀(weighted least squares regression)를 이용할 수 있다. 한 예로서, 가중치 부여는 회귀 모델에 "커널" 트릭을 적용함으로써 수행될 수 있다. ("커널 트릭"이 많은 기계 학습 모델링 접근법에 일반적이기 때문에, 이런 재-가중 전략은 선형 회귀에 제한되지 않는다.)

이런 방법은 당업자에게 공지되어 있다. 실시태양에서, 커널은 요소 1 - w ^* s_ij를 갖는 행렬이고, 여기서 1은 단위 행렬의 요소이고, w는 0과 1 사이의 실수 값이다. w = 0일 때, 이것은 표준 회귀 모델로 감소한다. 실제로, w의 값은 쌍을 이루는 조합 구조체 및 이의 관련 효과 y (mi, mj)에 대해 평가될 때 예측 모델의 정확성(r2 값 또는 루트 평균 제곱 에러(RMSE))에 연결될 것이다. 하나의 간단한 구현예에서, w는 w = 1-r²로 정의된다. 이 경우, 모델이 완전히 예측 가능한 경우, w = 1-r² = 0이고 통합은 예측 모델만을 기반으로 하며 통합은 상위성 매핑 절차만 기반으로 한다. 각각의 반복 동안, 정확도를 평가하여 모델 성능이 개량되는지 여부를 결정할 수 있다.

본 발명에 기재된 상위성 매핑 절차는 어느 모델이 분석 장비(214)에 의해 사용되는지에 의존하지 않는 것이 명백해야 한다. 이런 예측 모델을 고려하면, 조합 통합을 통해 돌연변이 라이브러리에 접근할 수 있는 모든 가상의 균주를 점수매기고 순위를 매기는 것이 가능하다.

일부 실시태양에서, 상위성 효과를 설명하기 위해, 비유사한 돌연변이 반응 프로파일은 예측 모델로부터 각 가상 균주와 연관된 점수 및 순위를 증대하기 위해 분석 모델(214)에 의해 사용될 수 있다. 이 절차는 대체로 점수의 재-가중화로서 생각될 수 있어서 비유사한 응답 프로파일을 가진 후보 균주(예를 들어, 클러스터의 다양성으로부터 얻은 균주)를 지지할 수 있다. 하나의 간단한 구현예에서, 균주는 비유사성 임계값을 만족하지 않거나 동일한 클러스터(적당한 가중치를 가짐)로부터 얻은 구성 돌연변이의 수만큼 감소된 점수를 가질 수 있다. 한 특정 구현예에서, 가상 균주의 성능 평가는 (다시 적당한 가중치에 의해) 가상의 균주와 관련된 구성 돌연변이의 모든 쌍과 관련된 유사성 행렬의 항의 합계만큼 감소될 수 있다.가상 균주는 이러한 증가된 점수를 사용하여 순위가 다시 매겨질 수 있다. 실제로, 이런 재-가중 계산은 초기 점수 추정과 함께 수행될 수 있다.

결과는 혼동하는 상위성 상호작용을 보다 효과적으로 피하기 위해 증가된 점수 및 순위를 가진 가상 균주의 집합이다. 가상 균주는 이 시점에서 만들어질 수 있거나 후속 분석이나 사용을 위해 다른 계산 방법으로 넘겨질 수 있다.

당업자는 본 발명에 기술된 바와 같이 상위성 매핑 및 반복적인 예측 균주 디자인이 단지 쌍을 이루는 돌연변이를 사용하는 것에 제한되지 않고 배경 균주에 더 많은 돌연변이를 동시에 적용하는 것으로 확장될 수 있음을 인식할 것이다. 다른 실시태양에서, 추가적인 돌연변이가 본 발명에 기재된 예측 방법에 따라 선택된 돌연변이를 사용하여 이미 돌연변이된 균주에 순차적으로 적용될 수 있다. 다른 실시태양에서, 상위성 효과는 서로 약간 다른 다수의 균주 배경에 동일한 유전자 변이를 적용하고 돌연변이된 균주 배경 사이에 양성 반응 프로파일에 임의의 유의한 차이가 있음을 나타냄으로써 귀속된다.

유전자 디자인에 순응하는 유기체

개시된 HTP 게놈 공학 플랫폼은 산업용 미생물 세포 배양물(예를 들어, 코리 네박테리움(Corynebacterium) 및 A. 니거(A. niger))로 예시되지만, 원하는 형질이 유전자 돌연변이 집단에서 확인될 수 있는 임의의 숙주 세포 유기체에 적용 가능하다.

따라서, 본 발명에 사용된 용어 "미생물"은 광범위하게 해석되어야 한다. 미생물은 두 가지 원핵생물 영역인 박테리아와 고세균뿐만 아니라 특정 진핵생물 균류와 원생 생물을 포함한다. 그러나, 특정 양태에서, 곤충, 식물 및 동물과 같은 "보다 높은" 진핵생물이 본 발명에 교시된 방법에서 이용될 수 있다.

본 발명은 원핵(실시예 1-9) 및 진핵(실시예 10-11) 숙주 세포 모두에 대한 실시예를 제공한다

적합한 숙주 세포는 박테리아 세포, 조류 세포, 식물 세포, 균류 세포, 곤충 세포 및 포유류 세포를 포함하나 이에 제한되지 않는다. 한 예시적인 실시태양에서, 적합한 숙주 세포는 대장균(예를 들어, 매사추세츠주, 입스위치의 뉴잉글랜드 바이오랩스(New England BioLabs)로부터 구입가능한 SHuffle™ competent E. coli)을 포함한다.

본 발명의 다른 적합한 숙주 유기체는 코리네박테리움 속의 미생물을 포함한다. 일부 실시태양에서, 바람직한 코리네박테리움 균주/종은 기탁된 유형 균주가 DSM44549인 C. 에피센스(C. efficiens), 기탁된 유형 균주가 ATCC13032인 C. 글루타미쿰(C. glutamicum) 및 기탁된 유형 균주가 ATCC6871인 C. 암모니아게네스(C. ammoniagenes)를 포함한다. 일부 실시태양에서, 본 발명의 바람직한 숙주는 C. 글루타미쿰이다.

특히 코리네박테리움 글루타미쿰 종의 코리네박테리움 속의 적합한 숙주 균주는 특히 공지된 야생형 균주이다: 코리네박테리움 글루타미쿰 ATCC13032, 코리네박테리움 아세토글루타미쿰 ATCC15806, 코리네박테리움 아세토아시도필럼 ATCC13870, 코리네박테리움 멜라세콜라 ATCC17965, 코리네박테리움 써모아미노게 네스 FERM BP- 1539, 브레비박테리움 플라붐 ATCC14067, 브레비박테리움 락토페르멘툼 ATCC13869 및 브레비박테리움 다이바리카툼 ATCC14020; 및 예를 들어, L-리신 생산 균주로부터 제조된 L-아미노산 생산 돌연변이체 또는 균주: 코리네박테리움 글루타미쿰 FERM-P 1709, 브레비박테리움 플라붐 FERM P-1708, 브레비박테리움 락토페르멘툼 FERM P 1712, 코리네박테리움 글루타미쿰 FERM-P 6463, 코리네박테리움 글루타미쿰 FERM-P 6464, 코리네박테리움 글루타미쿰 DM58-1, 코리네박테리움 글루타미쿰 DG52-5, 코리네박테리움 글루타미쿰 DSM5714 및 코리네박테리움 글루타미 쿰 DSM12866.

용어 "마이크로콕쿠스 글루타미쿠스"는 C. 글루타미쿰에도 사용되어왔다. C. 에피시엔스 종의 일부 대표는 또한 예를 들어, 균주 FERM BP-1539와 같은 종래 기술에서 C. 써모아미노게네스로 불려왔다.

일부 실시태양에서, 본 발명의 숙주 세포는 진핵생물 세포이다. 적합한 진핵생물 숙주 세포는 곰팡이 세포, 조류 세포, 곤충 세포, 동물 세포 및 식물 세포를 포함하나 이에 제한되지 않는다. 적합한 균류 숙주 세포는 아세코코타 (Ascomycota), 담자균(Basidiomycota), 신생 균주(Deuteromycota), 접합체 진균 (Zygomycota), 진균 무균(Fungi imperfecti)을 포함하나 이에 제한되지 않는다. 특정 바람직한 숙주 세포는 효모 세포 및 사상 균류 세포를 포함한다. 적합한 사상 균류 숙주 세포는 예를 들어 유마이코티나(Eumycotina) 및 오마이코타(Oomycota) 세분의 임의의 섬유상 형태를 포함한다. (예를 들어, 참조로 본 발명에 포함된 Hawksworth et al., In Ainsworth and Bisby's Dictionary of The Fungi, 8^th　edition, 1995, CAB International, University Press, Cambridge, UK 참조). 사상 균류는 키틴, 셀룰로오스 및 다른 복합 다당류로 구성된 세포벽을 갖는 식물성 균사체를 특징으로 한다. 사상 균류 숙주 세포는 효모와 형태학적으로 구별된다.

특정 예시적이고 비 제한적인 실시 양태에서, 사상 균류 숙주 세포는 아칠라(Achlya), 아크레모늄(Acremonium), 아스퍼길루스(Aspergillus), 아우레오바시듐(Aureobasidium), 브제르칸데라(Bjerkandera), 세리포리오프시스(Ceriporiopsis), 세팔로스포리움(Cephalosporium), 크리소스포리움(Chrysosporium), 코칠리오볼루스(Cochliobolus), 코리나스쿠스(Corynascus), 크리포넥트리아(Cryphonectria), 크립토콕쿠스(Cryptococcus), 코프리누스(Coprinus), 코리오루스(Coriolus), 디플로디아(Diplodia), 엔도디스(Endothis), 프사리움(Fusarium), 지베렐라(Gibberella), 글리오클라디움(Gliocladium), 휴미콜라(Humicola), 하이포크레아(Hypocrea), 마이셀리오프토라(Myceliophthora)(예를 들어, Myceliophthora thermophila), 무코르(Mucor), 네우로스포라(Neurospora), 페니실리움(Penicillium), 포도스포라(Podospora), 필레비아(Phlebia), 피로마이세스(Piromyces), 피리쿨라리아(Pyricularia), 리히조무코르(Rhizomucor), 리히조푸스(Rhizopus), 스키조필룸(Schizophyllum), 스키탈리듐(Scytalidium), 스포로트리츔(Sporotrichum), 탈라로마이세스(Talaromyces), 써모아스쿠스(Thermoascus), 티에라비아(Thielavia), 트라마테스(Tramates), 폴리포클라듐(Tolypocladium), 트라이코데마(Trichoderma), 베르티실리움(Verticillium), 볼바리엘라(Volvariella), 또는 텔레오모르프(teleomorphs), 또는 아나모르프(anamorphs), 이의 동의어 또는 분류학적 동등물의 종의 세포일 수 있다. 한 실시태양에서, 사상 균류는 A. 니거(A. niger) 그룹의 A. 니둘란스(A. nidulans), A. 오리재(A. oryzae), A. 소재(A. sojae) 및 아스페르길리(Aspergilli)로 이루어진 그룹으로부터 선택된다. 한 실시태양에서, 사상 균류는 아스페르루스 니거(Aspergillus niger)이다.

다른 실시태양에서, 균류 종의 특정 돌연변이체는 본 발명에 제공된 방법 및 시스템에 사용된다. 한 실시태양에서, 본 발명에 제공된 고 처리량 및/또는 자동화 된 방법 및 시스템에 적합한 균류 종의 특정 돌연변이체가 사용된다. 이런 돌연변이체의 예는 매우 잘 원형질인 균주; 주로 또는 더욱 바람직하게는, 단일 핵을 갖는 원형질체만을 생산하는 균주; 미세적정 플레이트에서 효율적으로 재생하는 균주, 빠르게 재생하는 균주 및/또는 폴리뉴클레오타이드(예를 들어, DNA) 분자를 효율적으로 흡수하는 균주, 단일 클론의 분리를 방지하고 및/또는 배양액의 점도를 증가시키도록 복잡하게 되지 않는 배양액에서 균사를 생산하는 세포와 같은 저점도의 배양액을 생산하는 균주, 무작위 통합(예를 들어, 무능력하게된 비 상동성 말단 결합 경로) 또는 이들의 조합을 감소시킨 균주일 수 있다.

또 다른 실시태양에서, 본 발명에 제공된 방법 및 시스템에서 사용하기 위한 특정 돌연변이체 균주는 예를 들어, 우리딘-요구 돌연변이체 균주와 같은 선별가능한 마커 유전자가 없는 균주일 수 있다. 이들 돌연변이체 균주는 각각 pyrG 또는 pyrE 유전자에 의해 코딩되는 오로티딘 5 포스페이트 디카르복실라제(OMPD) 또는 오로테이트 p-리보실 트랜스퍼라제(OPRT)에서 결핍될 수 있다(T. Goosen et al., Curr Genet. 1987, 11 : 499 503 J. Begueret et al, Gene., 1984, 32: 487 92).

한 실시태양에서, 본 발명에 제공된 방법 및 시스템에서 사용하기 위한 특정 돌연변이체 균주는 보다 짧은 균사 및 보다 효모 유사 외관을 특징으로 하는 소형 세포 형태를 갖는 균주이다.

적합한 효모 숙주 세포는 칸디다(Candida), 한세누라(Hansenula), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces ,), 피키아(Pichia), 클루베로마이세스(Kluyveromyces) 및 야로비아(Yarrowia)를 포함하나 이에 제한되지 않는다. 일부 실시태양에서, 효모 세포는 한세누라 폴리모르파(Hansenula polymorpha), 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 사카로마이세스 칼스베르젠시스(Saccaromyces carlsbergensis), 사카로마이세스 다이아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 피치아 파스토리스(Pichia pastoris), 피치아 핀란디카(Pichia finlandica), 피치아 트레할로필라(Pichia trehalophila), 피치아 코다매(Pichia kodamae), 피치아 멤브라네파시엔스(Pichia membranaefaciens), 피치아 오프니티애(Pichia opuntiae), 피치아 써모톨레란스(Pichia thermotolerans), 피치아 살릭타리아(Pichia salictaria), 피치아 쿠에르쿰(Pichia quercuum), 피치아 피제페리(Pichia pijperi), 피치아 스티피티스(Pichia stipitis), 피치아 메타놀리카(Pichia methanolica), 피치아 안구스타(Pichia angusta), 클루이베로마이세스 락티스(Kluyveromyces lactis), 칸디다 일비칸스(Candida albicans), 또는 야로비아 리폴리티카(Yarrowia lipolytica)를 포함하나 이에 제한되지 않는다.

특정 실시태양에서, 숙주 세포는 클라미도모나스(Chlamydomonas)(예를 들어, C. 레인하르티(C. Reinhardtii)) 및 포름디움(Phormidium)과 같은 조류 세포 (P. sp. ATCC29409)이다.

다른 실시태양에서, 숙주 세포는 원핵생물 세포이다. 적합한 원핵생물 세포는 그람 양성, 그람 음성 및 그람 가변 박테리아 세포를 포함한다. 상기 숙주 세포는 아그로박테리움(Agrobacterium), 알리시로바실러스(Alicyclobacillus), 아나베아나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써무스(Acidothermus), 아르쓰로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움(Brevibacterium), 부티리비브리오(Butyrivibrio), 부케네라(Buchnera), 캠프스트리스(Campestris), 캠필로박터(Camplyobacter), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로콕쿠스(Coprococcus), 에스체리치아(Escherichia), 엔테로콕쿠스(Enterococcus), 엔테로박터(Enterobacter), 에르위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움(Flavobacterium), 게오바실루스(Geobacillus), 해모필루스(Haemophilus), 헬리코박터(Helicobacter), 클레브시엘라(Klebsiella), 락토바실루스(Lactobacillus), 락토콕커스(Lactococcus), 일로박터(Ilyobacter), 마이크로콕쿠스(Micrococcus), 마이크로박테리움(Microbacterium), 메소르히조비움(Mesorhizobium), 메틸로박테리움(Methylobacterium), 마이코박테리움(Mycobacterium), 네이세리아(Neisseria), 판도에아(Pantoea), 수도모나스(Pseudomonas), 프로클로로콕쿠스(Prochlorococcus), 로도박터(Rhodobacter), 로도수도모나스(Rhodopseudomonas), 로세부리아(Roseburia), 로도스피릴룸(Rhodospirillum), 로도콕쿠스(Rhodococcus), 세네데스무스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토콕쿠스(Streptococcus), 시네콕쿠스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로콕쿠스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테메쿨라(Temecula), 써모시네코콕쿠스(Thermosynechococcus), 써모콕쿠스(Thermococcus), 우레아플라즈마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 예르시니아(Yersinia) 및 지모모나스(Zymomonas)의 종일 수 있으나 이에 제한되지 않는다. 일부 실시태양에서, 숙주 세포는 코리네박테리움 글루타미쿰이다.

일부 실시태양에서, 박테리아 숙주 균주는 산업용 균주이다. 수많은 박테리아 산업용 균주가 알려져 있고 본 발명에 기술된 방법 및 조성물에 적합하다.

일부 실시태양에서, 박테리아 숙주 세포는 아그로박테리움 종(예를 들어, A. radiobacter, A. rhizogenes , A. rubi), 아테로박터 종(예를 들어, A. aurescens , A. citreus , A. globformis , A. hydrocarboglutamicus , A. mysorens , A. nicotianae, A. paraffineus , A. protophonniae , A. roseoparaffinus , A. sulfureus, A. ureafaciens), 바실루스 종(예를 들어, B. thuringiensis , B. anthracis, B. megaterium , B. subtilis , B. lentus , B. circulars, B. pumilus , B. lautus , B. coagulans , B. brevis , B. firmus , B. alkaophius , B. licheniformis, B. clausii , B. stearothermophilus , B. halodurans 및　B. amyloliquefaciens)이다. 특정 실시태양에서, 숙주 세포는 B. 서브틸리스, B. 푸밀루스, B. 리체니포르미스, B. 메가테륨, B. 클라우실, B. 스테아로써모필루스, 및B. 아밀로리퀴에파시엔스를 포함하나 이에 제한되지 않는 산업용 바실루스일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 클로스트리디움 종(예를 들어, C. acetobutylicum, C. tetani 　E88,　C. lituseburense , C. saccharobutylicum , C. perfringens, C. beijerinckii)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 코리네박테리움 종(예를 들어, C. glutamicum , C. acetoacidophilum)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 에스체리아치아 종(예를 들어, E. coli)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 에르위니아 종(예를 들어, E. uredovora, E. carotovora , E. ananas , E. herbicola , E. punctata , E. terreus)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 판토에아 종(예를 들어, P. citrea, P. agglomerans)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 수도모나스 종(예를 들어, P. putida , P. aeruginosa , P. mevalonii)일 것이다. 일부 실시태양에서, 숙주 세포는 산업용 스트렙토콕쿠스 종(예를 들어, S. ambofaciens , S. achromogenes , S. avermitilis , S. coelicolor , S. aureofaciens , S. aureus , S. fungicidicus , S. griseus , S. lividans)일 것이다. 일부 실시태양에서, 숙주 세포는 자이모모나스 종(예를 들어, Z. mobilis, Z. lipolytica) 등일 것이다.

본 발명은 또한 포유류 세포, 예를 들어 인간(293, WI38, PER.C6 및 보우즈 (Bowes) 흑색종 세포를 포함), 생쥐(3T3, NS0, NS1, Sp2/0을 포함), 햄스터(CHO, BHK), 원숭이(COS, FRhL, Vero) 및 하이브리도마 세포주를 포함하는 다양한 동물 세포 유형과 함께 사용하기에 적합하다.

다양한 실시태양에서, 원핵생물 및 진핵생물 균주 모두를 포함하는 본 발명의 실시에 사용될 수 있는 균주는 American Type Culture Collection(ATCC), Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH(DSM), Centraalbureau Voor Schimmelcultures(CBS), 및 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center(NRRL)와 같은 여러 배양 컬렉션으로부터 대중에게 쉽게 접근될 수 있다.

일부 실시태양에서, 본 발명의 방법은 다세포 유기체에도 적용 가능하다. 예를 들어, 플랫폼은 작물의 성능을 개량시키는데 사용될 수 있다. 유기체는 그라미니애(Gramineae), 페투코이데애(Fetucoideae), 포아코이데애(Poacoideae), 아그로스티스(Agrostis), 필레움(Phleum), 닥틸리스(Dactylis), 소르검(Sorgum), 세타리아(Setaria), 제아(Zea), 오리자(Oryza), 트라이티쿰(Triticum), 세칼레(Secale), 아베나(Avena), 호르데움(Hordeum), 삭카룸(Saccharum), 포아(Poa), 페스투카(Festuca), 스테노타프룸(Stenotaphrum), 사이노돈(Cynodon), 코익스(Coix), 올리레애(Olyreae), 파레애(Phareae), 콤포시태(Compositae) 또는 레구미노새(Leguminosae)와 같은 복수의 식물을 포함할 수 있다. 예를 들어, 식물은 옥수수, 쌀, 콩, 면화, 밀, 호밀, 귀리, 보리, 완두콩, 콩, 렌즈콩, 땅콩, 참마콩, 동부, 벨벳콩, 클로버, 알팔파, 자주개자리, 루핀, 살갈퀴, 등나무, 완두콩, 사탕수수, 수수, 해바라기, 카놀라 등일 수 있다. 마찬가지로, 유기체는 비-인간 포유류, 어류, 곤충 등과 같은 복수의 동물을 포함할 수 있다.

유전 디자인 및 HTP 미생물 공학 플랫폼에서 활용을 위한 유전자 다양성 풀 생성

일부 실시태양에 있어서, 본 발명의 방법은 유전자 디자인으로서 특징화된다. 본 발명에 사용된 용어 유전자 디자인은 새로운 우수한 숙주 세포를 디자인하고 생성하기 위해 특정 유전자, 유전자의 일부, 프로모터, 종결 코돈, 5'UTR, 3'UTR 또는 다른 DNA 서열의 가장 최적의 변이체의 확인 및 선택을 통한 숙주 유기체 게놈의 재구성 또는 변형을 의미한다.

일부 실시태양에서, 본 발명의 유전자 디자인 방법의 제 1 단계는 새로운 숙주 게놈이 재구성될 수 있는 복수의 서열 변형을 갖는 초기 유전자 다양성 풀 집단을 얻는 것이다.

일부 실시태양에서, 본 발명에 교시된 유전자 디자인 방법의 후속 단계는 상기한 HTP 분자 도구 세트(예를 들어, SNP 스와핑 또는 프로모터 스와핑)의 하나 이상을 사용하여 HTP 유전자 디자인 라이브러리를 구축한 다음, 숙주 세포에서의 시험을위한 특정 게놈 변형의 라이브러리를 제공함으로써 게놈 공학 과정의 동인으로서 작용하는 것이다.

현존하는 야생형 균주로부터의 다양성 풀 사용하기

일부 실시태양에서, 본 발명은 소정의 야생형 집단의 미생물 중에서 존재하는 서열 다양성을 확인하는 방법을 교시한다. 따라서, 다양성 풀은 분석을 위해 사용된 소정의 수 n개의 야생형 미생물일 수 있으며, 상기 미생물의 게놈은 "다양성 풀"을 나타낸다.

일부 실시태양에서, 다양성 풀은 상기 야생형 미생물 중 자연적 유전자 변이에 존재하는 현존하는 다양성의 결과일 수 있다. 이 변이는 소정의 숙주 세포의 균주 변이체로부터 얻을 수 있고 미생물이 완전히 다른 종인 결과일 수도 있다. 유전자 변이는 자연 발생 여부와 상관없이 균주의 유전자 서열에서 어떠한 차이도 포함할 수 있다. 일부 실시태양에서, 유전자 변이는 다른 것들 중에서 SNP 스왑, PRO 스왑, 개시/정지 코돈 스왑 또는 STOP 스왑을 포함할 수 있다.

현존하는 산업용 균주 변이체로부터의 다양성 풀 사용하기

본 발명의 다른 실시태양에서, 다양성 풀은 전통적인 균주 개량 과정 동안 생성된 균주 변이체(예를 들어, 무작위 돌연변이를 통해 생성되고 수년 동안 개량된 수율을 위해 선택된 하나 이상의 숙주 유기체 균주)이다. 따라서, 일부 실시태양에서, 다양성 풀 또는 숙주 유기체는 역사적 생산 균주의 집합을 포함할 수 있다.

다양성 풀은 특정 시점(S₁Gen₁)에서 "기준선" 유전자 서열을 갖는 본래의 부모 균주(S₁) 및 상기 S₁ 균주로부터 유도/성장되고 S₁의 기준선 게놈과 관련하여 다른 게놈(S_2- _n Gen₂ _- _n )을 갖는 임의의 수의 후속 자손 균주(S_2- _n 로 일반화될 수 있는 S₂, S₃, S₄, S₅, 등)일 수 있다.

다양성 풀 내의 모든 SNPS가 확인되면, 본 발명은 개별적으로 및/또는 그룹으로 SNP의 효과(예를 들어, 관심 표현형의 생성)를 묘사(즉, 정량화 및 특성화)하기 위한 SNP 스와핑 및 선별 방법을 교시한다. 따라서, 상기한 바와 같이, 교시된 플랫폼에서의 초기 단계는 복수의 서열 변이체, 예를 들어 SNP를 가진 초기 유전자 다양성 풀 집단을 얻는 것을 수 있다. 그런 후에, 교시된 플랫폼의 후속 단계는 상기한 HTP 분자 도구 세트(예를 들어, SNP 스와핑 또는 프로모터 스와핑)의 하나 이상을 사용하여 HTP 유전자 디자인 라이브러리를 구축한 다음, 숙주 세포에서의 시험을위한 특정 게놈 변형의 라이브러리를 제공함으로써 게놈 공학 과정의 동인으로서 작용하는 것이다.

일부 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2- _n Gen ₂ _-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 표준 균주(S₁Gen₁) 또는 야생형 균주에 도입하는 단계를 포함한다.

다른 실시태양에서, 본 발명의 SNP 스와핑 방법은 돌연변이된 균주(예를 들어, S _2- _n Gen ₂ _-n 으로부터 균주)에서 확인된 하나 이상의 SNP를 제거하는 단계를 포함한다.

돌연변이유발을 통해 다양성 풀 만들기

일부 실시태양에서, 세포의 소정의 다양성 집단에서 관심 돌연변이는 돌연변이유발 화학물질 또는 방사선을 포함하는 돌연변이 균주를 위한 임의의 수단에 의해 인위적으로 생성될 수 있다. 용어 "돌연변이유발"은 본 발명에서 세포질 핵산 물질에서 하나 이상의 유전자 변형을 유도하는 방법을 의미하기 위해 사용된다.

용어 "유전자 변형"은 DNA의 임의의 변경을 말한다. 대표적인 유전자 변형은 뉴클레오티드 삽입, 결실, 치환 및 이들의 조합을 포함하며, 단일 염기만큼 작거나 수만 염기만큼 클 수 있다. 따라서, 용어 "유전자 변형"은 뉴클레오타이드 서열의 역전 및 염색체의 영역을 포함하는 DNA의 위치 또는 배향이 변경되는 다른 염색체 재배열을 포함한다. 염색체 재배열은 염색체 내 재배치 또는 염색체 간 재배치를 포함할 수 있다.

한 실시태양에서, 현재 청구된 주제에 사용된 돌연변이유발 방법은 실질적으로 무작위라서 유전자 돌연변이가 돌연변이유발될 핵산 물질 내의 임의의 이용 가능한 뉴클레오타이드 위치에서 발생할 수 있다. 달리 말하면, 한 실시태양에서, 돌연변이유발은 특정 뉴클레오타이드 서열에서 발생의 우선성성 또는 증가 빈도를 나타내지 않는다.

본 발명의 방법은 자외선, X-레이 방사선, 감마선 방사선, N-에틸-N-나이트로소우레아(ENU), 메틸나이트로우레아(MNU), 프로카바진(PRC), 트라이에틸렌 멜라민(TMS), 아크릴아마이드 모노머(AA), 클로람부실(CHL), 멜팔란(MLP), 사이클로포스파미드(CPP), 다이에틸 설페이트(DES), 에틸 메테인 설포네이트(EMS), 메틸 메테인 설포네이트(MMS), 6-머캡토퓨린(6-MP), 마이토마이신-C(MMC), N-메틸-N'-나이트로-N-나이트로소구아니딘(MNNG), 3H₂O 및 우레탄(UR)(예를 들어, Rinchik, 1991; Marker et al., 1997; and Russell, 1990 참조). 추가적인 돌연변이유발 인자는 http://www.iephb.nw.ru/~spirov/hazard/mutagen_lst.html에 기재된 것을 포함하여 당업자에게 주지되어 있다.

용어 "돌연변이유발"은 또한 세포 기능을 변경(예를 들어, 표적화된 돌연변이에 의해) 또는 세포 기능을 조절하여 돌연변이유발의 속도, 품질 또는 범위를 향상시키는 방법을 포함한다. 예를 들어, 세포는 DNA 수리, 돌연변이원 대사, 돌연변이원 감수성, 게놈 안정성 또는 이들의 조합에서 기능장애 또는 결핍이 되도록 변형되거나 조절될 수 있다. 따라서 정상적으로 게놈 안정성을 유지하는 유전자 기능의 파괴는 돌연변이유발을 향상시키는데 사용될 수 있다. 파괴의 대표 표적은 DNA 리가아제 I(Bentley et al, 2002) 및 카제인 키나아제 I(미국 특허 제6,060,296 호)를 포함하나 이에 제한되지 않는다.

일부 실시태양에서, 부위-특이적 돌연변이유발(예를 들어, 변형기 부위 유도 돌연변이유발 키트(Clontech)와 같은 상업적으로 구입할 수 있는 키트를 사용한 프라이머-유도 돌연변이유발)를 사용하여 핵산 서열 전체에 걸쳐 순서대로 다수의 변화를 일으킨다 본 발명의 절단 효소를 코딩하는 핵산을 생성한다.

하나 이상의 돌연변이유발 인자에 노출시 유전자 돌연변이의 빈도는 치료의 투여량 및/또는 반복을 변화시킴으로써 조절될 수 있으며, 특정 용도에 맞게 조절될 수 있다.

따라서, 일부 실시태양에서, 본 발명에 사용된 "돌연변이유발"은 본 발명에 기술된 기술의 임의의 것에 의한 오류 경향성 PCR 돌연변이유발, 올리고뉴클레오티드 유도 돌연변이유발, 부위 유발성 돌연변이유발 및 반복적인 서열 재조합을 포함하는 돌연변이를 유도하기 기술 분야에 공지된 모든 기술을 포함한다.

다양성을 생성하기 위한 단일 유전자좌 돌연변이

일부 실시태양에서, 본 발명은 게놈 DNA의 선택된 부분을 도입, 결실 또는 치환함으로써 세포 집단을 돌연변이하는 것을 교시한다. 따라서, 일부 실시태양에서, 본 발명은 돌연변이를 특정 유전자좌에 대한 돌연변이를 표적화하는 방법을 교시한다. 다른 실시태양에서, 본 발명은 표적 DNA 영역을 선택적으로 편집하기 위해 ZFNs, TALENS 또는 CRISPR과 같은 유전자 편집 기술의 사용을 교시한다.

다른 실시태양에서, 본 발명은 숙주 유기체의 외부에서 선택된 DNA 영역을 돌연변이시킨 다음 돌연변이된 서열을 숙주로 유기체 속에 역삽입하는 것을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 다양한 발현 성질을 갖는 다양한 프로모터 변이체를 생성하기 위해 천연 또는 합성 프로모터를 돌연변이하는 것을 교시한다(이하 프로모터 래더 참조). 다른 실시태양에서, 본 발명은 ProSAR(Fox et al, 2007. 본 발명에 참조로 포함된 "Improving catalytic function by ProSAR-driven enzyme evolution." Nature Biotechnology Vol 25 (3) 338-343)와 같은 단일 유전자 최적화 기술과 양립된다.

일부 실시태양에서, DNA의 선택된 영역은 천연 변이체의 유전자 셔플링 또는 합성 올리고체, 플라스미드-플라스미드 재조합, 바이러스 플라스미드 재조합, 바이러스-바이러스 재조합에 의한 셔플링을 통해 시험관 내에서 생성된다. 다른 실시태양에서, 게놈 영역은 에러-유발PCR(error-prone PCR)(예를 들어, 도 1 참조)을 통해 생성된다.

일부 실시태양에서, 선택된 유전자 영역에서의 돌연변이 생성은 "재조립 PCR"에 의해 달성된다. 간략하게, 올리고뉴클레오타이드 프라이머 (올리고)는 관심 핵산 서열의 단편의 PCR 증폭을 위해 합성되어, 올리고뉴클레오타이드의 서열은 두 단편의 교차점과 겹쳐진다. 겹쳐진 영역은 전형적으로 약 10 내지 100개 뉴클레오타이드 길이이다. 단편의 각각은 이런 프라이머 세트로 증폭된다. 그런 다음 PCR 제품은 재조립 프로토콜에 따라 "재조립"된다. 요약하면, 어셈블리 프로토콜에서, PCR 생성물은 먼저, 예를 들어, 겔 전기영동 또는 크기 배제 크로마토그래피에 의해 프라이머로부터 정제된다. 정제된 생성물은 함께 혼합되고 추가 프라이머가 없이 중합 효소 및 데옥시뉴클레오시드 트라이포스페이트(dNTP's) 및 적절한 버퍼 염의 존재하에서 약 1-10 사이클의 변성, 재어닐링 및 확장이 실시된다("셀프-프라이밍"). 유전자에 인접한 프라이머로 후속 PCR이 사용되어 완전히 재조합되고 뒤섞인 유전자의 수율을 증폭시킨다.

본 발명의 일부 실시태양에서, 위에서 논의한 것과 같은 돌연변이된 DNA 영역이 돌연변이체 서열에 대해 농축되어 다중 돌연변이체 스펙트럼, 즉 돌연변이의 가능한 조합이 보다 효율적으로 표본추출된다. 일부 실시태양에서, 돌연변이된 서열은 재조립 반응 이전에 시험관 내에서 친화성-정제 물질을 증폭시키는 바람직한 단계 의해 mutS 단백질 친화성 매트릭스를 통해 확인된다(Wagner et al., Nucleic Acids Res. 23(19):3944-3948 (1995); Su et al., Proc. Natl. Acad. Sci. (U.S.A.), 83:5057-5061(1986)). 이 증폭된 물질은 이후 본 발명의 후반부에서 설명하는 바와 같이 조립 또는 재조립 PCR 반응에 투입된다.

프로모터 래더

프로모터는 유전자가 전사되는 속도를 조절하고 다양한 방식으로 전사에 영향을 미칠 수 있다. 예를 들어, 구조성 프로모터는 내부 또는 외부 세포 조건에 관계없이 일정한 비율로 관련 유전자의 전사를 지시하지만, 조절 가능한 프로모터는 내부 및/또는 외부 세포, 예를 들어, 성장 속도, 온도, 특정 환경 화학물질에 대한 반응 등에 따라 유전자가 전사되는 속도를 증가 또는 감소시킨다. 프로모터는 정상적인 세포 컨텍스트로부터 격리될 수 있으며 사실상 모든 유전자의 발현을 조절하도록 조작되어 세포 성장, 생산 수율 및/또는 기타 관심 표현형의 효과적인 변형을 가능하게 한다.

일부 실시태양에서, 본 발명은 하류 유전자 디자인 방법에서 사용하기 위한 프로모터 래더 라이브러리를 생산하는 방법을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 하나 이상의 프로모터를 확인하고 및/또는 다양한 발현 강도 또는 우수한 조절 특성을 나타내는 숙주 세포 내 하나 이상의 프로모터의 변이체를 생성하는 방법을 교시한다. 이들 확인된 및/또는 생성된 프로모터의 특정 조합은 프로모터 래더로서 함께 그룹화될 수 있으며, 이는 보다 상세히 후술된다.

일부 실시태양에서, 본 발명은 프로모터 래더의 사용을 교시한다. 일부 실시태양에서, 본 발명의 프로모터 래더는 연속 범위의 발현 프로파일을 나타내는 프로모터를 포함한다. 예를 들어, 일부 실시태양에서, 프로모터 래더는 자극, 또는 구성성 발현을 통해 다양한 발현 강도를 나타내는 자연, 고유 또는 야생형 프로모터를 확인함으로써 생성된다(예를 들어, 도 20 및 도 28-30). 이러한 확인된 프로모터는 프로모터 래더로서 함께 그룹화될 수 있다.

다른 실시태양에서, 본 발명은 상이한 조건에 걸쳐 다양한 발현 프로파일을 나타내는 프로모터 래더의 생성을 교시한다. 예를 들어, 일부 실시태양에서, 본 발명은 발효의 상이한 단계에 전체에서 퍼진 발현 피크를 갖는 프로모터의 래더를 생성하는 것을 교시한다(예를 들어, 도 28 참조). 다른 실시태양에서, 본 발명은 특정 자극에 반응하여 상이한 발현 피크 동역학을 갖는 프로모터의 래더를 생성하는 것을 교시한다(도 29 참조). 당업자는 본 개시의 조절 프로모터 래더가 임의의 하나 이상의 조절 프로파일을 나타낼 수 있다는 것을 인식할 것이다.

일부 실시태양에서, 본 발명의 프로모터 래더는 연속적인 범위의 반응에 걸쳐 예측 가능한 방식으로 유전자 발현을 교란시키도록 디자인되었다. 일부 실시태양에서, 프로모터 래더의 연속 특성은 균주 개량 프로그램에 추가의 예측력을 제공한다. 예를 들어, 일부 실시태양에서, 선택된 대사 경로의 스와핑 프로모터 또는 종결 서열은 가장 최적의 발현 비율 또는 프로파일을 확인하는 숙주 세포 성능 곡선을 생성할 수 있다; 부적절한 환경에서 불필요한 과발현이나 잘못된 발현을 피하면서 표적 유전자가 더 이상 특정 반응이나 유전자 캐스케이드에 대한 제한 요소가 되지 않는 균주를 생산한다. 일부 실시태양에서, 프로모터 래더는 원하는 프로파일을 나타내는 자연, 고유 또는 야생형 프로모터를 확인함으로써 생성된다. 다른 실시태양에서, 프로모터 래더는 자연 발생 프로모터를 돌연변이시켜 다수의 돌연변이 프로모터 서열을 유도함으로써 생성된다. 이들 돌연변이된 프로모터의 각각은 표적 유전자 발현에 대한 효과에 대해 시험된다. 일부 실시태양에서, 편집된 프로모터는 다양한 조건에 걸쳐 발현 활성에 대해 시험되어 각 프로모터 변이체의 활성이 문서화/특징화/주석처리되고 데이터베이스에 저장된다. 생성된 편집된 프로모터 변이체는 뒤이어 그 발현의 강도에 기초하여 배열된 프로모터 래더로 조직화된다(예를 들어, 상부 근처의 고도로 발현된 변이체 및 하부 근처의 약화된 발현에 의해, 따라서 "래더"라는 용어를 유도한다).

일부 실시태양에서, 본 발명은 확인된 자연 발생 프로모터 및 돌연변이된 변이체 프로모터의 조합인 프로모터 래더를 교시한다.

일부 실시태양에서, 본 발명은 하기 기준을 모두 만족하는: 1) 구조성 프로모터의 래더를 나타내며; 2) 이상적으로 100개 염기쌍 미만의 짧은 DNA 서열에 의해 암호화될 수 있는 자연, 고유 또는 야생형 프로모터를 확인하는 방법을 교시한다. 일부 실시태양에서, 본 발명의 구조성 프로모터는 두 개의 선택된 성장 조건 (전형적으로, 산업용 재배 동안 경험된 조건들 간에 비교됨)에 걸쳐 일정한 유전자 발현을 나타낸다. 일부 실시태양에서, 본 발명의 프로모터는 ~60 염기쌍 코어 프로모터 및 26-40 염기쌍 길이의 5' UTR로 구성될 것이다.

일부 실시태양에서, 상기 확인된 자연 발생 프로모터 서열 중 하나 이상이 유전자 편집을 위해 선택된다. 일부 실시태양에서, 자연 프로모터는 상기 임의의 돌연변이 방법을 통해 편집된다. 다른 실시태양에서, 본 발명의 프로모터는 원하는 서열을 갖는 새로운 프로모터 변이체를 합성함으로써 편집된다.

2015년 12월 07일에 출원된 미국 특허 출원 제 62/264,232호의 전체 개시 내용은 모든 목적을 위해 그 전문이 본 발명에 참고로 포함된다

본 발명의 프로모터의 비 제한적인 리스트가 하기 표 1에 제공된다. 프로모터 서열의 각각은 이종 프로모터 또는 이종 프로 프로모터 뉴클레오타이드로 불릴 수 있다.

본 발명의 선택된 프로모터 서열

SEQ ID No.	프로모터 짧은 명칭	프로모터 명칭
1	P1	Pcg0007_lib_39
2	P2	Pcg0007
3	P3	Pcg1860
4	P4	Pcg0755
5	P5	Pcg0007_265
6	P6	Pcg3381
7	P7	Pcg0007_119
8	P8	Pcg3121

일부 실시태양에서, 본 발명의 프로모터는 상기 표로부터의 프로모터와 적어도 100%, 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76%, 또는 75% 서열 동일성을 나타낸다. 터미네이터 래더

일부 실시태양에서, 본 발명은 3' 위치에서 하나 이상의 전사 종결 서열을 RNA 암호화 요소의 말단에 제공함으로써 유전적으로 조작된 숙주 균주를 개량시키는 방법을 교시한다. 일부 실시태양에서, 본 발명은 종결 서열의 첨가가 유전적으로 조작된 숙주에서 선택된 유전자의 RNA 전사 효율을 개선시킨다는 것을 교시한다. 다른 실시태양에서, 본 발명은 종결 서열의 첨가가 유전적으로 조작된 숙주에서 선택된 유전자의 RNA 전사 효율을 감소시킨다는 것을 교시한다. 따라서, 일부 실시태양에서, 본 발명의 터미네이터 래더는 다양한 전사 효율을 나타내는 터미네이터 서열(예를 들어, 하나의 약한 터미네이터, 하나의 평균 터미네이터 및 하나의 강한 프로모터)을 나타내는 일련의 터미네이터 서열을 포함한다.

전사 종결 서열은 임의의 뉴클레오타이드 서열일 수 있으며, 이는 임의의 뉴클레오티드 서열일 수 있으며, 이는 오픈 리딩 프레임을 암호화하는 뉴클레오타이드 서열의 전사 하류에 위치될 때, 오픈 리딩 프레임의 전사 종료를 일으킨다. 이런 서열은 당업계에 공지되어 있으며 원핵생물, 진핵생물 또는 파지 기원일 수 있다. 터미네이터 서열의 예로는 PTH-터미네이터, pET-T7 터미네이터, T3-Tφ 터미네이터, pBR322-P4 터미네이터, 수포성 스트라마티스 바이러스 터미네이터, rrnB-T1 터미네이터, rrnC 터미네이터, TTadc 전사 터미네이터 및 Matα(α 인자) 전사 터미네이터, 고유 α-인자 전사 종결 서열, ADR1 전사 종결 서열, ADH2 전사 종결 서열 및 GAPD 전사 종결 서열과 같은 효모-인식 종결 서열을 포함하나 이에 제한되지 않는다. 전사 종결 서열의 포괄적인 목록은 http://partsregistry.org/Terminators/Catalog에서 구입할 수 있는 iGEM 레지스트리에서 발견될 수 있다.

일부 실시태양에서, 전사 종결 서열은 폴리머라제-특이적이거나 비특이적일 수 있지만, 본 실시태양에서 사용하기 위해 선택된 전사 터미네이터는 선택된 프로모터와 '기능적 조합'을 형성해야 하는데, 이는 터미네이터 서열이 프로모터에서 개시되는 RNA 폴리머라제의 유형에 의한 전사를 종결시킬 수 있어야 한다는 것을 의미한다. 예를 들어, 일부 실시태양에서, 본 발명은 진핵생물 RNA pol II 프로모터 및 진핵생물 RNA pol II 터미네이터, T7 프로모터 및 T7 터미네이터, T3 프로모터 및 T3 터미네이터, 효모- 인식 프로모터 및 효모-인식 종결 서열 등은 일반적으로 기능적 조합을 형성할 것임을 교시한다. 사용된 전사 종결 서열의 상동성은 또한 전사가 소정의 프로모터로부터 종결되는 효율에 기초하여 선택될 수 있다. 예를 들어, 이종성 전사 터미네이터 서열은 RNA 암호화 요소의 전사 하류에 제공되어 소정의 프로모터로부터 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99%의 종결 효율을 달성할 수 있다.

일부 실시태양에서, 조작된 발현 구조체로부터의 RNA 전사 효율은 3' 위치에 2개 이상의 헤어핀을 포함하는 2차 구조를 형성하는 핵산 서열을 RNA 암호화 요소의 말단에 제공함으로써 개선될 수 있다. 특정 이론에 얽매이기를 원하지 않으며, 2차 구조는 전사 신장 복합체를 불안정화시키고 폴리머라제가 DNA 주형으로부터 분리되게 하여, 비 기능성 서열의 비생산적인 전사를 최소화하고 목적하는 RNA의 전사를 증가시킨다. 따라서, 2개 이상의 인접한 헤어핀을 포함하는 2차 구조를 형성하는 종료 서열이 제공될 수 있다. 일반적으로, 헤어핀은 자체가 접혀서 암이 단일 가닥 루프에 의해 연결되는 쌍을 이루는 스템 영역을 형성할 수 있는 회문식 뉴클레오타이드 서열에 의해 형성될 수 있다. 일부 실시태양에서, 종결 서열은 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 인접한 헤어핀을 포함한다. 일부 실시태양에서, 인접한 헤어핀은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 쌍을 이루지 않는 뉴클레오타이드에 의해 분리된다. 일부 실시태양에서, 헤어핀 스템은 길이가 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 이상의 염기쌍 길이를 포함한다. 특정 실시태양에서, 헤어핀 스템은 12 내지 30개 염기쌍 길이이다. 특정 실시태양에서, 종결 서열은 약 9 내지 25개 염기쌍을 포함하는 스템 영역을 갖는 둘 이상의 중간 크기의 헤어핀을 포함한다. 일부 실시태양에서, 헤어핀은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오타이드의 루프 형성 영역을 포함한다. 일부 실시태양에서, 루프 형성 영역은 4-8개 뉴클레오타이드를 포함한다. 특정 이론에 얽매이기를 원하지 않으며, 2차 구조의 안정성은 종단 효율과 관련될 수 있다. 헤어핀의 안정성은 길이, 불일치(mismatches) 또는 이를 함유하는 돌출(bulges)의 수 및 쌍을 이루는 영역의 염기 구성에 의해 결정된다. 구아닌과 시토신 사이의 결합은 3개의 수소 결합을 가지며 2개만 있는 아데닌-티민 결합에 비해 더 안정하다. 헤어핀 형성 회문식 뉴클레오타이드 서열의 G/C 함량은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 이상일 수 있다. 일부 실시태양에서, 헤어핀 형성 회문식 뉴클레오타이드 서열의 G/C 함량은 적어도 80%이다. 일부 실시태양에서, 종결 서열은 원핵생물, 진핵생물 또는 파지 기원의 하나 이상의 전사 종결 서열로부터 유도된다. 일부 실시태양에서, 일련의 4, 5, 6, 7, 8, 9, 10개 이상의 아데닌(A)을 암호화하는 뉴클레오타이드 서열은 종결 서열에 대해 3'에 제공된다.

일부 실시태양에서, 본 발명은 일련의 탠덤 종결 서열의 사용을 교시한다. 일부 실시태양에서, 일련의 2, 3, 4, 5, 6, 7개 이상의 첫 번째 전사 터미네이터 서열은 dsRNA 암호화 요소의 최종 뉴클레오타이드에 대해 직접 3' 또는 dsRNA 암호화 요소의 최종 뉴클레오타이드에 대해 적어도 1-5, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50, 50-100, 100-150, 150-200 , 200-300, 300-400, 400-500, 500-1,000개 이상의 뉴클레오타이드 3'의 거리에 놓일 수 있다. 탠덤 전사 터미네이터 서열 사이의 뉴클레오타이드의 수는 변할 수 있으며, 예를 들어, 전사 터미네이터 서열은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50개 이상의 뉴클레오타이드에 의해 분리될 수 있다. 일부 실시태양에서, 전사 터미네이터 서열은 구조 예측 알고리즘에 의해 결정된 바와 같이 이들의 예측된 2차 구조에 기초하여 선택될 수 있다. 구조 예측 프로그램은 당업계에 주지되어 있으며, 예를 들어, CLC 메인 워크벤치(Main Workbench)를 포함한다.

당업자는 본 발명의 방법이 임의의 종결 서열과 양립할 수 있음을 인식할 것이다. 일부 실시태양에서, 본 발명은 Pfeifer-Sancar et al. 2013. "Comprehensive analysis of the Corynebacterium glutamicum transcriptome using an improved RNAseq technique" Pfeifer-Sancar et al. BMC Genomics 2013, 14:888로부터 개시된 주석된 코리네박테리움 글루타미쿰 터미네이터의 사용을 교시한다. 다른 실시태양에서, 본 발명은 http://partsregistry.org/Terminators/Catalog에서 구입할 수 있는 iGEM 레지스트리에서 발견된 전사 종결 서열의 사용을 교한다. 본 발명의 전사 터미네이터 서열의 포괄적인 목록이 하기 표 1.1에 제공된다.

[표 1.1]

본 발명의 종결 서열의 포괄적인 목록.

가설-주도 다양성 풀과 언덕 오르기(Hill Climbing)

본 발명은 본 개시의 HTP 게놈 조작 방법은 숙주 세포 성능에서 상당한 이득을 달성하기 위해 사전 유전자 지식을 필요로 하지 않는다는 것을 교시한다. 실제로, 본 발명은 무작위 돌연변이유발 및 이미 존재하는 숙주 세포 변이체들 사이의 유전자 다양성의 확인(예를 들어, 야생형 숙주 세포와 산업 변이체 사이의 비교)을 포함하는 여러 기능적으로 불가지론적인 접근법을 통해 다양성 풀을 생성하는 방법을 교시한다.

그러나, 일부 실시태양에서, 본 발명은 또한 하류 HTP 조작에 사용될 유전자 다양성 돌연변이를 디자인하는 가설-주도적 방법을 교시한다. 즉, 일부 실시태양에서, 본 발명은 선택된 돌연변이의 지시된 디자인을 교시한다. 일부 실시태양에서, 지시된 돌연변이는 본 발명의 조작 라이브러리(예컨대, SNP 스왑, PRO 스왑 또는 STOP 스왑)에 포함된다.

일부 실시태양에서, 본 발명은 유전자 주석, 가설된(또는 확인된) 유전자 기능, 또는 게놈 내의 위치에 기초한 지시된 돌연변이의 생성을 교시한다. 본 발명의 다양성 풀은 숙주 세포의 성능이 증가된 문헌에 관련된 특정 대사 경로 또는 유전자 경로에 관여한다고 가설된 유전자의 돌연변이를 포함할 수 있다. 다른 실시태양에서, 본 발명의 다양성 풀은 또한 개량된 숙주 성능과 관련된 오페론에 존재하는 유전자에 대한 돌연변이를 포함할 수 있다. 또 다른 실시태양에서, 본 발명의 다양성 풀은 알고리즘 예측 기능 또는 다른 유전자 주석에 기초한 유전자에 대한 돌연변이를 포함할 수 있다.

일부 실시태양에서, 본 발명은 가설 주도 돌연변이의 표적을 우선순위화하기위한 "껍질"에 기초한 접근법을 교시한다. 표적 우선순위화를 위한 껍질 비유는 단지 소수의 1차 유전자가 숙주 세포의 성능(예를 들어, 단일 생체분자의 생산)의 특정 측면의 대부분을 담당한다는 가설에 기초한다. 이들 1차 유전자는 껍질의 코어에 위치되고, 제 2 층에서 2차 효과 유전자, 3차 껍질에서 3차 효과 및 ... 등이 이어진다. 예를 들어, 한 실시태양에서, 껍질의 코어는 선택된 대사 경로 내의 중요한 생합성 효소를 암호화하는 유전자를 포함할 수 있다. 제 2 껍질 상에 위치하는 유전자는 생성물 전환 또는 피드백 신호 전달을 담당하는 생합성 경로 내의 다른 효소를 암호화하는 유전자를 포함할 수 있다. 이러한 예시적인 은유하에서의 제 3층 유전자는 생합성 경로의 발현을 조절하거나 숙주 세포 내에서 일반적인 탄소 플럭스를 조절하는 조절 유전자를 포함할 것이다.

본 발명은 또한 모든 확인된 돌연변이로부터 성능 이득을 최적화하기 위한 "언덕 오르기(hill climb)" 방법을 교시한다. 일부 실시태양에서, 본 발명은 HTP 다양성 라이브러리에서 무작위, 자연 또는 가설-주도 돌연변이는 숙주 세포 성능과 관련된 유전자의 확인을 초래할 수 있음을 교시한다. 예를 들어, 본 방법은 유전자 암호화 서열 상에 또는 그 부근에 위치한 하나 이상의 유익한 SNP를 확인할 수 있다. 이 유전자는 숙주 세포 성능과 관련이 있을 수 있으며, 이의 확인은 유기체의 조합 유전자 돌연변이 공간에서 성능 "언덕"의 발견과 유사할 수 있다.

일부 실시태양에서, 본 발명은 SNP 돌연변이로 구현된 확인된 언덕 주변의 조합 공간을 탐색하는 방법을 교시한다. 즉, 일부 실시태양에서, 본 발명은 그 유전자 노드로부터 얻어진 성능 이득(즉, 언덕 오르기)을 최적화하기 위해 확인된 유전자 및 관련 조절 서열의 교란을 교시한다. 따라서, 본 발명의 방법에 따르면, 유전자는 무작위 돌연변이유발에서 유도된 다양성 라이브러리에서 먼저 확인될 수 있지만, 나중에 동일한 유전자 내 다른 서열의 지시된 돌연변이를 통해 균주 개량 프로그램에서 사용하기 위해 개량될 수 있다.

언덕 오르기의 개념은 또한 단일 유전자 서열을 둘러싸는 조합 공간의 탐색을 넘어 확장될 수 있다. 일부 실시태양에서, 특정 유전자의 돌연변이는 숙주 세포 성능에 대한 특정 대사 경로 또는 유전자 경로의 중요성을 나타낼 수 있다. 예를 들어, 일부 실시태양에서, 단일 RNA 분해 유전자에서 돌연변이가 현저한 숙주 성능 증가를 초래한다는 발견은 숙주 유기체로부터 추가적인 성능 이득을 추출하기 위한 수단으로서 관련 RNA 분해 유전자를 돌연변이시키는 기초로서 사용될 수 있다. 당업자는 지시된 유전자 디자인에 대한 상기 껍질 및 언덕 오르기 접근법의 변형을 인식할 것이다. 고 처리량 선별.

세포 배양 및 발효

본 발명의 세포는 임의의 바람직한 생합성 반응 또는 선택을 위해 적절하게 변형된 통상적인 영양 배지에서 배양될 수 있다. 일부 실시태양에서, 본 발명은 프로모터를 활성화시키기 위해 배지를 유도하는 배양을 교시한다. 일부 실시태양에서, 본 발명은 형질전환체(예를 들어, 항생제)의 선택 제제 또는 억제 조건(예를 들어, 높은 에탄올 조건)하에 성장하기에 적합한 유기체의 선택 제제를 포함하는 선택 제제를 갖는 배지를 교시한다. 일부 실시태양에서, 본 발명은 세포 성장을 위해 최적화된 배지에서 세포 배양물을 성장시키는 것을 교시한다. 다른 실시태양에서, 본 발명은 생산 수율에 최적화된 배지에서 세포 배양물을 성장시키는 것을 교시한다. 일부 실시태양에서, 본 발명은 세포 성장을 유도할 수 있는 배지에서 배양 물을 배양하는 것을 교시하며 최종 생성물 생산을 위한 필수 전구체(예를 들어, 에탄올 생산을 위한 높은 수준의 당)를 포함한다.

온도, pH 등과 같은 배양 조건은 발현을 위해 선택된 숙주 세포와 함께 사용하기에 적합한 것들이며, 당업자에게 명백할 것이다. 언급한 바와 같이, 박테리아, 식물, 동물(포유류 포함) 및 고세균 기원 세포를 포함하는 많은 세포의 배양 및 생산에 대한 많은 참고 자료가 이용될 수 있다. 예를 들어, Sambrook, Ausubel (all supra), as well as Berger, Guide to Molecular Cloning Techniques, Methods in Enzymology　volume 152 Academic Press, Inc., San Diego, CA; and　 Freshney (1994)　Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York and the references cited therein; Doyle and Griffiths (1997)　Mammalian Cell Culture: Essential Techniques　John Wiley and Sons, NY; Humason (1979) Animal Tissue Techniques, fourth edition W.H. Freeman and Company; and Ricciardelle et al., (1989)　In Vitro Cell Dev . Biol .　25:1016-1024, all of which are incorporated herein by reference. For plant cell culture and regeneration, Payne et al. (1992)　Plant Cell and Tissue Culture in Liquid Systems　John Wiley & Sons, Inc. New York, N.Y.; Gamborg and Phillips (eds) (1995)　Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg N.Y.); Jones, ed. (1984)　Plant Gene Transfer and Expression Protocols, Humana Press, Totowa, N.J. and　Plant Molecular Biology　(1993) R. R. D. Croy, Ed. Bios Scientific Publishers, Oxford, U.K. ISBN 0 12 198370 6 참조하고, 이의 전문은 참조로 본 발명에 포함된다. 일반적으로 세포 배양 배지는 Atlas and Parks (eds.)　The Handbook of Microbiological Media　(1993) CRC Press, Boca Raton, Fla에서 설명되며, 이는 참조로 본 발명에 포함된다. 세포 배양에 대한 추가 정보는 Life Science Research Cell Culture Catalogue　from Sigma-Aldrich, Inc (St Louis, Mo.) ("Sigma-LSRCCC") 및, 예를 들어,　The Plant Culture Catalogue　and supplement also from Sigma-Aldrich, Inc (St Louis, Mo.) ("Sigma-PCCS")와 같은 구입가능한 상업용 논문에서 발견되며, 이의 전부는 참조로 본 발명에 포함된다.

사용될 배양 배지는 적절한 방식으로 각각의 균주의 요구를 충족시켜야한다. 다양한 유기체에 대한 배양 배지에 대한 설명은 American Bacteriology Society (Washington D.C., USA, 1981)의 "General Bacteriology Methods for Manual"에 제공된다.

또한, 본 발명은 a) 적절한 배지에서 본 발명에 따른 미생물을 배양하여 발효액을 생성하는 단계; b) a)의 발효액 및/또는 미생물의 세포에 관심 생성물을 농축시키는 단계를 포함하여 관심 생성물의 발효성 제조를 위한 방법을 추가로 제공한다.

일부 실시태양에서, 본 발명은 생산된 미생물이 원하는 유기-화학적 화합물을 생산하기 위한, 예를 들어 WO 05/021772에 기술된 바와 같이 연속적으로 또는 배치 공정(배치 배양) 또는 페드 배치(fed-batch) 또는 반복된 페드 배치에서 불연속적으로 배양될 수 있음을 교시한다. 알려진 배양 방법에 관한 일반적인 내용은 Chmiel(Bioprozeβtechnik. 1: Einfuhrung in die Bioverfahrenstechnik (Gustav Fischer Verlag, Stuttgart, 1991))에 의한 교과서 또는 Storhas(Bioreaktoren and periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994))에 의한 교과서에서 이용할 수 있다.

일부 실시태양에서, 본 발명의 세포는 배치 또는 연속 발효 조건하에 성장된다.

고전적인 배치 발효는 폐쇄된 시스템이며, 배지의 조성물은 발효의 시작시에 설정되고 발효 동안 인공적인 변형을 겪지 않는다. 배치 시스템의 변형은 본 발명에서 사용되는 페드 배치 발효이다. 이 변형에서, 기질은 발효가 진행됨에 따라 증분으로 첨가된다. 페드 배치 시스템은 이화생성물 억제가 세포의 신진대사를 억제 할 가능성이 있고 배지에 제한된 양의 기질을 갖는 것이 바람직한 경우에 유용하다. 배치 및 페드 배치 발효는 일반적이고 당업계에 일반적으로 주지되어 있다.

연속 발효는 정의된 발효 배지가 생물 반응기에 연속적으로 첨가되고 동일한 양의 조건 배지가 관심의 목적하는 생체분자 생성물의 가공 및 수확을 위해 동시에 제거되는 시스템이다. 일부 실시태양에서, 연속 발효는 일반적으로 세포가 주로 대수기 성장하는 일정한 고밀도로 배양물을 유지시킨다. 일부 실시태양에서, 연속 발효는 일반적으로 정지기 또는 늦은 대수기/정지기 성장시에 배양물을 유지시킨다. 연속 발효 시스템은 정지기 성장 조건을 유지하기 위해 노력한다.

연속 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라 생성물 형성의 속도를 최대화하기 위한 기술은 산업용 미생물학 분야에 잘 알려져 있다.

예를 들어, 본 발명의 배양물에 대한 탄소원의 비 제한적인 목록은 당 및 수화물, 예를 들어 글루코오스, 수크로오스, 락토오스, 프룩토오스, 말토오스, 당밀, 사탕무 또는 사탕수수 가공에 의한 수크로오스-함유 용액, 전분, 전분 가수분해물 및 셀룰로오스; 오일 및 지방, 예를 들어, 대두유, 해바라기유, 땅콩유 및 코코넛 지방; 지방산, 예를 들어 팔미트산, 스테아르산 및 리놀레산; 알코올, 예를 들어 글리세롤, 메탄올 및 에탄올; 및 유기산, 예를 들어 아세트산 또는 젖산을 포함한다.

본 발명의 배양물을 위한 질소 공급원의 비 제한적인 목록은 펩톤, 효모 추출물, 고기 추출물, 맥아 추출물, 옥수수 침지액, 콩가루 및 우레아와 같은 유기 질소 함유 화합물; 또는 황산 암모늄, 염화 암모늄, 인산 암모늄, 탄산 암모늄 및 질산 암모늄과 같은 무기 화합물을 포함한다. 질소원은 개별적으로 또는 혼합물로서 사용될 수 있다.

본 발명의 배양물을 위한 가능한 인 공급원의 비 제한적인 목록은 인산, 인산 이수소 칼륨 또는 인산 수소 이칼륨 또는 상응하는 나트륨 함유 염을 포함한다.

배양 배지는 추가로 성장에 필수적인, 나트륨, 칼륨, 마그네슘, 칼슘 및 철과 같은 금속의 염화물 또는 황산염 형태의 염을 포함한다.

마지막으로, 아미노산, 예를 들어 호모 세린 및 비타민, 예를 들어 티아민, 바이오틴 또는 판토텐산과 같은 필수 성장 인자가 상기 언급된 물질에 추가로 사용될 수 있다.

일부 실시태양에서, 배양물의 pH는 수산화 나트륨, 수산화 칼륨, 암모니아 또는 수성 암모니아; 또는 인산 또는 황산과 같은 산성 화합물을 포함하나 이에 제한되지 않는 임의의 산 또는 염기, 또는 완충 염에 의해 적절한 방식으로 조절될 수 있다. 일부 실시태양에서, pH는 일반적으로 6.0 내지 8.5, 바람직하게는 6.5 내지 8의 값으로 조절된다.

일부 실시태양에서, 본 발명의 배양물은 소포제, 예를 들어 지방산 폴리글리콜 에스터를 포함할 수 있다. 일부 실시태양에서, 본 발명의 배양물은 예를 들어 항생제와 같은 적합한 선택 물질을 첨가함으로써 배양물의 플라스미드를 안정화시키도록 변형된다.

일부 실시태양에서, 배양은 호기성 조건하에 수행된다. 이러한 조건을 유지하기 위해, 예를 들어 공기와 같은 산소 또는 산소 함유 기체 혼합물이 배양물 내로 도입된다. 과산화수소가 풍부한 액체를 사용하는 것도 가능하다. 발효는, 적절한 경우에, 상승된 압력, 예를 들어 0.03 내지 0.2 MPa의 상승된 압력에서 수행된다. 배양의 온도는 통상 20℃ 내지 45℃, 바람직하게는 25℃ 내지 40℃, 특히 바람직하게는 30℃ 내지 37℃이다. 배치 또는 페드 배치 공정에서, 배양은 바람직하게는 회수하고자 하는 관심의 목적하는 생성물(예를 들어, 유기-화학적 화합물)의 양이 형성될 때까지 계속된다. 이 목표는 일반적으로 10시간 내지 160시간 이내에 달성될 수 있다. 연속 공정에서, 더 긴 배양 시간이 가능하다. 미생물의 활성은 발효 배지 및/또는 상기 미생물의 세포에서 관심 생성물의 농축(축적)을 초래한다.

일부 실시태양에서, 배양은 혐기성 조건하에 수행된다.

선별

일부 실시태양에서, 본 발명은 고 처리량 초기 선별을 교시한다. 다른 실시태양에서, 본 발명은 또한 성능 데이터의 견고한 탱크-기반 검증을 교시한다(도 6b 참조).

일부 실시태양에서, 고 처리량 선별 공정은 생물 반응기에서의 균주의 성능을 예측하도록 디자인된다. 상기한 바와 같이, 배양 조건은 생물체에 적합하고 생물 반응기 조건을 반영하도록 선택된다. 개별 콜로니를 집어 96웰 플레이트로 옮기고 적당한 시간 동안 배양한다. 이어서 세포를 종자 배양 또는 생산 배양을 위해 새로운 96웰 플레이트로 옮긴다. 배양액은 다양한 시간 동안 배양되어, 다중 측정이 실행될 수 있다. 다중 측정은 생성물, 바이 매스 또는 생물 반응기에서 균주의 성능을 예측하는 다른 특성의 측정을 포함할 수 있다. 고 처리량의 배양 결과는 생물 반응기 성능을 예측하는데 사용된다.

일부 실시태양에서, 탱크-기반 성능 검증은 고 처리량 선별에 의해 분리된 균주의 성능을 확인하기 위해 사용된다. 발효 공정/조건은 고객 사이트에서 얻는다. 생산성 또는 수율과 같은 관련 균주 성능 특성에 대한 벤치 스케일 발효 반응기(예를 들어, 본 발명의 표 5에 개시된 반응기)를 사용하여 후보 균주를 선별한다.

생성물 회수 및 정량화

관심 생성물의 생산을 위한 선별 방법은 당업자에게 공지되어 있으며 본 명세서 전반에 걸쳐 논의된다. 이러한 방법은 본 발명의 균주를 선별할 때 사용될 수있다.

일부 실시태양에서, 본 발명은 비 분비된 세포내 생성물을 생산하도록 디자인된 균주를 개량시키는 방법을 교시한다. 예를 들어, 본 발명은 세포내 효소, 오일, 약제 또는 다른 가치있는 작은 분자 또는 펩타이드를 생성하는 세포 배양물의 견고성, 수율, 효율 또는 전반적인 바람직함을 개선시키는 방법을 교시한다. 비 분비된 세포내 생성물의 회수 또는 분리는 용해 및 본 발명에 기술된 것을 포함하여 당해 분야에 주지된 회수 기술에 의해 달성될 수 있다.

예를 들어, 일부 실시태양에서, 본 발명의 세포는 원심 분리, 여과, 침전 또는 다른 방법에 의해 수확될 수 있다. 이어서, 수확된 세포는 동결-해동 사이클링, 초음파 처리, 기계적 파쇄 또는 세포 용해제의 사용, 또는 당업자에게 공지된 다른 방법을 포함하는 임의의 편리한 방법으로 파괴된다.

관심의 생성된 생성물, 예를 들면, 폴리펩타이드는 당업계에 공지된 다수의 방법 중 임의의 방법에 의해 회수/분리될 수 있으며 임의로 정제될 수 있다. 예를 들어, 생성물 폴리 펩타이드는 원심 분리, 여과, 추출, 분무 건조, 증발, 크로마토 그래피(예를 들어, 이온 교환, 친화성, 소수성 상호작용, 크로마토포커싱 및 크기 배제) 또는 침전을 포함하나 이에 제한되지 않는 통상적인 절차에 의해 영양 배지로부터 분리될 수 있다. 최종적으로, 고성능 액체 크로마토 그래피(HPLC)가 최종 정제 단계에서 사용될 수 있다. (예를 들어, Purification of intracellular protein as described in Parry et al., 2001, Biochem . J.353:117, and Hong et al., 2007, Appl . Microbiol . Biotechnol .　73:1331, 참조, 모두는 참조로 본 발명에 포함된다).

상기한 참조문헌 이외에, 다양한 정제 방법은, 예를 들어, Sandana (1997)　Bioseparation of Proteins, Academic Press, Inc.; Bollag et al. (1996)　Protein Methods,　2^ndEdition, Wiley-Liss, NY; Walker (1996)　The Protein Protocols HandbookHumana Press, NJ; Harris and Angal (1990)　Protein Purification Applications: A Practical Approach, IRL Press at Oxford, Oxford, England; Harris and Angal　Protein Purification Methods: A Practical Approach, IRL Press at Oxford, Oxford, England; Scopes (1993)　Protein Purification: Principles and Practice　3^rdEdition, Springer Verlag, NY; Janson and Ryden (1998)　Protein Purification: Principles, High Resolution Methods and Applications, Second Edition, Wiley-VCH, NY; and Walker (1998)　Protein Protocols on CD-ROM, Humana Press, NJ에 개시된 것들을 포함하여 당업계에 주지되어 있으며, 이의 전부는 본 발명에 참조로 포함된다.

일부 실시태양에서, 본 발명은 분비된 생성물을 생산하도록 디자인된 균주를 개량시키는 방법을 교시한다. 예를 들어, 본 발명은 귀중한 작은 분자 또는 펩타이드를 생산하는 세포 배양물의 견고성, 수율, 효율 또는 전반적인 바람직함을 개선시키는 방법을 교시한다.

일부 실시태양에서, 면역학적 방법을 사용하여 본 발명의 세포에 의해 생산된 분비된 또는 분비되지 않은 생성물을 검출 및/또는 정제하는데 사용될 수 있다. 한 예시적 접근법에서, 통상적인 방법을 사용하여 생성물 분자(예를 들어, 인슐린 폴리펩타이드 또는 이의 면역원성 단편에 대해)에 대해 생성된 항체는 비드 상에 고정화되고, 엔도글루카나아제가 결합되고 침전되는 조건하에 세포 배양 배지와 혼합된다. 일부 실시태양에서, 본 발명은 효소-결합 면역흡착 분석법(ELISA)의 사용을 교시한다.

다른 관련 실시태양에서, 면역크로마토그래피가 미국 특허 제5,002,303호, 미국 특허 제5,591,645호, 미국 특허 제4,855,240호, 미국 특허 제4,435,504호, 미국 특허 제4,980,298호 및 Se-Hwan Paek, et al., "Development of rapid One-Step Immunochromatographic assay, Methods", 22, 53-60, 2000에 개시된 바와 같이 사용되며, 이의 각각은 참조로 본 발명에 포함된다. 일반적인 면역크로마토그래피는 2개의 항체를 사용하여 표본을 검출한다. 제 1 항체는 시험 용액 중에 또는 시험 용액을 떨어뜨린 다공성 막으로 제조된 대략 직사각형 형태의 시험편의 말단 부분에 존재한다. 이 항체는 라텍스 입자 또는 금 콜로이드 입자(이 항체는 이하에서 표지 항체로 불릴 것이다)로 표지한다. 떨어뜨린 시험 용액이 검출될 표본을 포함하는 경우, 표지된 항체는 표본을 인식하여 표본과 결합한다. 표본과 표지된 항체의 복합체는 모세관 현상에 의해 여과지로 만들어지고 표지된 항체를 포함하는 말단의 반대편 말단에 부착된 흡수체를 향하여 흐른다. 이 흐름 동안, 표본과 표지 항체의 복합체가 다공질 막의 중간에 존재하는 제 2 항체(이하에서 태핑 항체로 불릴 것이다)에 의해 인식되어 포획되고, 그 결과, 복합체는 가시광 신호로서 다공성 막 상의 검출부 상에 나타내고 검출된다.

일부 실시태양에서, 본 발명의 선별 방법은 측광 검출 기술(흡수, 형광)에 기초한다. 예를 들어, 일부 실시태양에서, 검출은 항체에 결합된 GFP와 같은 형광 단 검출기의 존재에 기초할 수 있다. 다른 실시태양에서, 측광 검출은 세포 배양 물로부터의 원하는 생성물 상의 축적에 기초할 수 있다. 일부 실시태양에서, 생성물은 배양물의 UV 또는 상기 배양물로부터의 추출물을 통해 검출될 수 있다.

당업자는 본 발명의 방법이 관심의 임의의 바람직한 생체분자 생성물을 생산하는 숙주 세포와 양립할 수 있음을 인식할 것이다. 하기 표 2는 본 발명의 범위 내에 포함되는 생성물 카테고리, 생체분자 및 숙주 세포의 비 제한적 목록을 제공한다. 이들 실시예는 설명의 목적으로 제공되며, 어떠한 방식으로도 본 개시된 기술의 응용가능성을 제한하려는 것이 아니다.

본 발명의 숙주 세포 및 관심 생성물의 비 제한적 목록.

생성물 카테고리	생성물	숙주 카테고리	숙주
아미노산	리신	박테리아	Corynebacterium glutamicum
아미노산	메티오닌	박테리아	Escherichia coli
아미노산	MSG	박테리아	Corynebacterium glutamicum
아미노산	트레오닌	박테리아	Escherichia coli
아미노산	트레오닌	박테리아	Corynebacterium glutamicum
아미노산	트립토판	박테리아	Corynebacterium glutamicum
효소	효소 (11)	사상 진균	Trichoderma reesei
효소	효소 (11)	진균	Myceliopthora thermophila (C1)
효소	효소 (11)	사상 진균	Aspergillus oryzae
효소	효소 (11)	사상 진균	Aspergillus niger
효소	효소 (11)	박테리아	Bacillus subtilis
효소	효소 (11)	박테리아	Bacillus licheniformis
효소	효소 (11)	박테리아	Bacillus clausii
향신료 & 향료	아가우드	효모	Saccharomyces cerevisiae
향신료 & 향료	암브록스	효모	Saccharomyces cerevisiae
향신료 & 향료	누트카톤	효모	Saccharomyces cerevisiae
향신료 & 향료	파출리 오일	효모	Saccharomyces cerevisiae
향신료 & 향료	사프론	효모	Saccharomyces cerevisiae
향신료 & 향료	샌달우드 오일	효모	Saccharomyces cerevisiae
향신료 & 향료	발렌센	효모	Saccharomyces cerevisiae
향신료 & 향료	바닐린	효모	Saccharomyces cerevisiae
식품	CoQ10/유비퀴놀l	효모	Schizosaccharomyces pombe
식품	오메가 3 지방산	미세조류	Schizochytrium
식품	오메가 6 지방산	미세조류	Schizochytrium
식품	비타민 B12	박테리아	Propionibacterium freudenreichii
식품	비타민 B2	사상 진균	Ashbya gossypii
식품	비타민 B2	박테리아	Bacillus subtilis
식품	에리쓰리톨	효모-유사 진균	Torula coralline
식품	에리쓰리톨	효모-유사 진균	Pseudozyma tsukubaensis
식품	에리쓰리톨	효모-유사 진균	Moniliella pollinis
식품	스테비올 글리코시드	효모	Saccharomyces cerevisiae
하이드로콜로이드	디우탄 검	박테리아	Sphingomonas sp
하이드로콜로이드	젤란 검	박테리아	Sphingomonas elodea
하이드로콜로이드	잔탄 검	박테리아	Xanthomonas campestris
중간체	1,3-PDO	박테리아	Escherichia coli
중간체	1,4-BDO	박테리아	Escherichia coli
중간체	부타다이엔	박테리아	Cupriavidus necator
중간체	n-부탄올	박테리아 (절대혐기성 미생물)	Clostridium acetobutylicum
유기산	시트르산	사상 진균	Aspergillus niger
유기산	시트르산	효모	Pichia guilliermondii
유기산	글루콘산	사상 진균	Aspergillus niger
유기산	이타콘산	사상 진균	Aspergillus terreus
유기산	락트산	박테리아	Lactobacillus
유기산	락트산	박테리아	Geobacillus thermoglucosidasius
유기산	LCDAs - DDDA	효모	Candida
폴리케타이드/Ag	스피노사드	효모	Saccharopolyspora spinosa
폴리케타이드/Ag	스피네토람	효모	Saccharopolyspora spinosa

선택 기준 및 목표 본 발명의 방법에 적용되는 선택 기준은 균주 개량 프로그램의 특정 목표에 따라 달라질 것이다. 본 발명은 임의의 프로그램 목표를 충족시키도록 조정될 수 있다. 예를 들어, 일부 실시태양에서, 프로그램 목표는 즉각적인 시간 제한없이 반응의 단일 배치 수율을 최대화하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 특정 생성물을 생산하거나 특정 비율의 생성물을 생산하기 위해 생합성 수율을 재조정하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 폴리머의 탄소 사슬을 길게하는 것과 같이 생성물의 화학적 구조를 변형시키는 것일 수 있다. 일부 실시태양에서, 프로그램 목표는 수율, 역가, 생산성, 부산물 제거, 공정 이상현상에 대한 내성, 최적 성장 온도 및 성장율과 같은 성능 특성을 개선하는 것일 수 있다. 일부 실시태양에서, 프로그램 목표는 미생물에 의해 생성된 관심 생성물의 부피 생산성, 비 생산성, 수율 또는 역가에 의해 측정된 바와 같이 개량된 숙주 성능이다.

다른 실시태양에서, 프로그램 목표는 투입량 당 최종 생성물 수율(예를 들어, 수크로오스의 파운드당 생산된 총 에탄올의 양)의 관점에서 상업적 균주의 합성 효율을 최적화하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 예를 들어 배치 완료율 또는 연속 배양 시스템에서의 수율로 측정된 합성 속도를 최적화하는 것일 수 있다. 다른 실시태양에서, 프로그램 목표는 특정 파지에 대한 균주 저항성을 증가시키거나, 그렇지 않으면 배양 조건 하에서 균주 생력/강건성을 증가시키는 것일 수 있다.

일부 실시태양에서, 균주 개량 프로젝트는 하나 이상의 목표에 종속될 수 있다. 일부 실시태양에서, 변형 프로젝트의 목표는 품질, 신뢰성 또는 전반적인 수익성에 달려있다. 일부 실시태양에서, 본 발명은 상기한 균주 특성의 하나 이상을 가진 관련된 선택된 돌연변이 또는 돌연변이 그룹을 교시한다.

당업자는 특정 프로젝트 목표를 달성하기 위해 어떻게 균주 선택 기준을 맞춤하는지를 인식할 것이다. 예를 들어, 반응 포화시 균주의 단일 배치 최대 수율의 선택은 높은 단일 배치 수율을 가진 균주를 확인하는데 적절할 수 있다. 다양한 온도 및 조건에서 수율의 일관성에 기반한 선택은 견고성 및 신뢰성이 증가된 균주를 확인하는데 적절할 수 있다.

일부 실시태양에서, 초기 고 처리량 단계 및 탱크-기반 검증에 대한 선택 기준은 동일할 것이다. 다른 실시태양에서, 탱크-기반 선택은 추가 및/또는 상이한 선택 기준하에서 작동할 수 있다. 예를 들어, 일부 실시태양에서, 고 처리량 균주 선택은 단일 배치 반응 완료 수율에 기초할 수 있지만, 탱크-기반 선택은 반응 속도에 대한 수율에 기초한 선택을 포함하도록 확대될 수 있다.

서열화

일부 실시태양에서, 본 발명은 본 발명에 기재된 유기체의 전체-게놈 서열화를 교시한다. 다른 실시태양에서, 본 발명은 또한 본 발명의 방법에 대한 품질 조절제로서의 플라스미드, PCR 생성물 및 다른 올리고의 서열화를 교시한다. 크고 작은 프로젝트를 위한 서열화 방법은 당업자에게 주지되어 있다.

일부 실시태양에서, 핵산을 서열화하는 임의의 고 처리량 기술이 본 발명의 방법에 사용될 수 있다. 일부 실시태양에서, 본 발명은 전체 게놈 서열화를 교시한다. 다른 실시태양에서, 본 발명은 유전자 변이를 확인하기위한 앰플리콘 서열화 울트라 딥 서열화를 교시한다. 일부 실시태양에서, 본 발명은 또한 태그맨테이션 (tagmentation)을 포함하는 신규한 라이브러리 제조 방법을 교시한다(WO/2016/073690 참조). DNA 서열화 기술은 표지된 터미네이터 또는 프라이머를 사용하는 고전적인 다이데옥시 서열화 반응(생거 방법) 및 슬라브 또는 모세관에서의 겔 분리; 가역적으로 종결된 표지된 뉴클레오타이드를 사용하는 합성에 의한 서열화, 열서열화; 454 서열화; 표지된 올리고 뉴클레오타이드 프로브의 라이브러리에 대한 대립유전자 특이적 혼성화; 결찰이 뒤따르는 표지된 클론의 라이브러리에 대한 대립유전자 특이적 혼성화를 사용하는 합성에 의한 서열화; 중합 단계 동안 표지된 뉴클레오티드의 혼입의 실시간 모니터링; 폴로니 서열화; 및 SOLiD 서열화를 포함한다.

본 발명의 한 양태에서, 연속적으로 서열화되는 고체 표면상의 개별 분자를 공간적으로 분리하는 단계를 포함하는 서열화의 고 처리량 방법이 사용된다. 이런 고체 표면은 비다공성 표면(솔렉사 서열화, 예를 들어, Bentley et al, Nature, 456: 53-59 (2008) or Complete Genomics　sequencing, e.g. Drmanac et al, Science, 327: 78-81 (2010)), 비드-또는 입자 결합 주형을 포함할 수 있는 웰의 어레이(454 서열화, 예를 들어, Margulies et al, Nature, 437: 376-380 (2005) or Ion Torrent　sequencing, U.S. patent publication 2010/0137143 or 2010/0304982), 미세가공된 막(SMRT 서열화, 예를 들어, Eid et al, Science, 323: 133-138 (2009)) 또는 비드 어레이(폴로니 서열화 또는 SOLiD 서열화, 예를 들어, Kim et al, Science, 316: 1481-1414 (2007))를 포함할 수 있다.

다른 실시태양에서, 본 발명의 방법은 분리된 분자가 고체 표면상에서 공간적으로 분리되기 전 또는 후에 분리된 분자를 증폭시키는 단계를 포함한다. 사전 증폭은 에멀젼 PCR, 또는 롤링 써클 증폭과 같은 에멀젼-기초 증폭을 포함할 수 있다. 또한 벤틀레이 등(상기) 및 제조사 지시(예를 들어, TruSeq™ Sample Preparation Kit and Data Sheet,　Illumina, Inc., San Diego, Calif., 2010); 및 추가로 참조로 포함된 다음 참조문헌: 미국 특허 제6,090,592호; 제6,300,070호; 제7,115,400호; 및 EP0972081B1에 기술된 바와 같이 개별 주형 분자가 고체 표면상에서 공간적으로 분리된 후, 브리지 PCR에 의해 평행하게 증촉되어 분리된 클론 집단 또는 클러스터를 형성한 후, 서열화되는 솔렉사-기초 서열화가 교시된다.

한 실시태양에서, 고체 표면상에 배치되고 증폭된 개개의 분자는 cm²당 적어도 10⁵ 클러스터의 밀도; 또는 cm²당 적어도 5x10⁵의 밀도; 또는 cm²당 적어도 10⁶ 클러스터의 밀도로 클러스터를 형성한다. 한 실시태양에서, 상대적으로 높은 에러율을 갖는 서열화 화학 반응이 사용된다. 이런 실시태양에서, 이런 화학 반응에 의해 생산된 평균 품질 점수는 서열 판독 길이의 단조 감소 함수이다. 한 실시태양에서, 이런 감소는 서열 판독의 0.5%가 1-75 위치에서 적어도 하나의 오차를 가지며; 서열 판독의 1%가 76-100 위치에서 적어도 하나의 오차를 가지며; 서열 판독의 2%가 101-125 위치에서 적어도 하나의 오차를 갖는 것에 상응한다.

게놈-전체 유전자 디자인 기준의 효과의 전산 분석 및 예측

일부 실시태양에서, 본 발명은 소정의 숙주 균주에 포함되는 특정 유전자 변형의 효과를 예측하는 방법을 교시한다. 추가의 양태에서, 본 발명은 숙주가 특정 표현형 형질 또는 균주 매개변수를 갖기 위해 소정의 숙주 균주에 포함되어야 하는 제안된 유전자 변형을 생성하는 방법을 제공한다. 소정의 양태에서, 본 발명은 신규 숙주 균주를 디자인하는데 이용될 수 있는 예측 모델을 제공한다.

일부 실시태양에서, 본 발명은 선별의 각 라운드의 수행 결과를 분석하는 방법 및 다음 선별 라운드에서 균주 성능을 향상시키도록 예측된 새로운 제안된 게놈-전체 서열 변형을 생성하는 방법을 교시한다.

일부 실시태양에서, 본 발명은 시스템이 이전의 선별 결과에 기초하여 숙주 균주에 대해 제안된 서열 변형을 생성하는 것을 교시한다. 일부 실시태양에서, 본 시스템의 권고는 직전 선별 검사의 결과에 기초한다. 다른 실시태양에서, 본 시스템의 권고는 하나 이상의 선별 검사의 누적 결과에 기초한다.

일부 실시태양에서, 본 시스템의 권고는 이전에 개발된 HTP 유전자 디자인 라이브러리에 기초한다. 예를 들어, 일부 실시태양에서, 본 시스템은 이전의 선별로부터의 결과를 저장하고, 그 결과를 동일 또는 상이한 숙주 유기체에서 상이한 프로젝트에 적용하도록 디자인된다.

다른 실시태양에서, 본 시스템의 권고는 과학적인 통찰력에 기초한다. 예를 들어, 일부 실시태양에서, 권고는 (주석된 유전자 데이터베이스 및 관련 문헌과 같은 출처로부터의) 유전자의 공지된 특성, 코돈 최적화, 전사 미끄러짐, uORF 또는 다른 가설 주도 서열 및 숙주 최적화에 기초한다.

일부 실시태양에서, 시스템 또는 예측 모델에 의해 권장되는 숙주 균주에 대해 제안된 서열 변형은 다음을 포함하는 개시된 분자 도구 세트의 하나 이상을 이용함으로써 수행된다: (1) 프로모터 스왑, (2) SNP 스왑, (3) 코돈 교환 개시/중지, (4) 서열 최적화, (5) 스왑 중지, (5) 상위성 매핑.

본 발명에 기술된 HTP 유전자 공학 플랫폼은 임의의 특정 미생물 또는 표현형 형질에 대해 불가지론적이다(예를 들어, 특정 화합물의 생산). 즉, 본 발명에서 교시된 플랫폼 및 방법은 숙주 세포가 임의의 바람직한 표현형 형질을 갖도록 조작하기 위해 임의의 숙주 세포와 함께 사용될 수 있다. 또한, 하나의 새로운 숙주 세포를 생성하기 위해 사용된 소정의 HTP 유전자 공학 공정으로부터 얻은 교훈은, 교시된 방법 동안 발생하는 무수한 공정 매개변수의 저장, 특징화 및 분석의 결과로서, 임의의 수의 다른 숙주 세포에 적용할 수 있다.

상위성 맵핑 섹션에서 언급된 바와 같이, HTP 유전자 디자인 라이브러리로부터의 돌연변이의 집합을 일부 바람직한 예측 모델을 통해 특정 배경으로 통합시킴으로써 얻어진 가상 균주의 성능(별칭, 점수)을 추정하는 것이 가능하다. 이런 예측 모델을 감안할 때, 조합 통합을 통해 돌연변이 라이브러리에 접근할 수 있는 모든 가상 균주를 채점하고 순위를 매기는 것이 가능하다. 아래 섹션은 본 HTP 플랫폼에서 사용되는 특정 모델에 대해 간략히 설명한다.

예측 균주 디자인

본 발명에 기술 된 것은 유전자 변화 및 균주 성능을 기술하는 방법, 균주에서 변화의 구성에 기초하여 균주 성능을 예측하는 방법, 높은 예측된 성능을 갖는 후보 디자인을 추천하는 방법, 및 2차 고려사항, 예를 들어, 현존하는 균주에 대한 유사성, 상위성 또는 예측의 신뢰를 최적화를 위해 예측을 필터링하는 방법을 포함하는 예측 균주 디자인에 접근법이 본 발명에 기술된다.

균주 디자인 모델에 대한 입력

한 실시태양에서, 설명의 용이함을 위해, 입력 데이터는 두 구성요소: (1) 유전자 변화의 세트 및 (2) 상대적 균주 성능을 포함할 수 있다. 당업자는 이 모델이 다양한 입력을 고려하면서 과적합에 대한 상반되는 고려사항을 염두하면서 용이하게 확장될 수 있음을 인식할 것이다. 유전자 변화 이외에, 조절될 수 있는 입력 매개변수(독립변수)의 일부는 세포 유형(속, 종, 균주, 계통 발생 특성 등) 및 발효가 세포에 의해 수행되는 동안 공정 매개변수(예를 들어, 환경 조건, 취급 장비, 개조 기술, 등)이다.

유전자 변화의 세트는 HTP 유전자 디자인 라이브러리라 불리는 유전자 교란의 이전에 논의된 집합으로부터 유래될 수 있다. 상대적 균주 성능은 임의의 소정의 파라미터 또는 관심 표현형 특성(예를 들어, 화합물, 소분자 또는 관심 생성물의 생산)에 기초하여 평가될 수 있다.

세포 유형은 원핵생물 및 진핵생물 시스템, 속, 종, 균주, 조직 배양(vs. 분산 세포) 등과 같은 일반적인 카테고리에서 특정될 수 있다. 조절될 수 있는 공정 파라미터는 온도, 압력, 반응기 구성 및 배지 조성물을 포함할 수 있다. 반응기 구성의 예는 반응기의 부피, 공정이 배치인지 또는 연속적인지 여부, 및 연속적이면 체적 유량 등을 포함한다. 또한, 세포가 존재하는 구조를 특정할 수 있다. 배지 조성물의 예는 전해질, 영양소, 폐기물, 산, pH 등의 농도를 포함한다.

예측 균주 모델을 만드는데 사용되는 초기 선형 회귀 모델에서 사용될 선택된 HTP 유전자 디자인 라이브러리로부터의 유전자 변화 세트

유전자 변화의 표로부터의 기입의 예시적인 세트는 하기 표3에 나타난다. 각 행은 변화의 메커니즘, 예를 들어, 프로모터 스왑 또는 SNP 스왑에 관한 메타데이터뿐만 아니라 균주 7000051473의 유전자 변화를 나타낸다. aceE, zwf 및 pyc는 모두 구연산 순환과 관련이 있다.

이 경우, 균주 7000051473은 총 7개의 변화를 갖는다. "최종 변화"는 이 균주에서 변화가 이런 균주 계통에서 가장 최근의 변형을 나타냄을 의미한다. 따라서, 이 균주의 성능을 부모의 성능과 비교하는 것은 "최종 변화" 돌연변이의 성능에 관한 데이터 포인트를 나타낸다.

균주 7000051473에 대한 균주 디자인 기입 표

균주	명칭	라이브러리	변화	from	to	최종_변화
7000051473	dlc19_42	proswp	pcg3121	cg1144	pcg3121_cg1144	1
7000051473	dlc19_42	scswp	acee atg>ttg	ttg	acee_atg	0
7000051473	dlc19_42	snpswp	dss_033	NA	na	0
7000051473	dlc19_42	snpswp	dss_084	NA	t	0
7000051473	dlc19_42	snpswp	dss_316	NA	na	0
7000051473	dlc19_42	proswp	pcg0007_39	zwf	pcg0007_39_zwf	0
7000051473	dlc19_42	proswp	pcg1860	pyc	pcg1860_pyc	0

제조된 균주 성능 평가 교시된 모델의 목적은 균주에 도입된 유전자 변화의 구성에 기초하여 균주 성능을 예측하는 것이다. 비교를 위한 표준을 구축하기 위해, 균주 성능은 분석 플레이트당 균주당 평균 성능을 먼저 계산함으로써 공통 기준 균주에 대해 상대적으로 계산된다. 그런 후에 상대적인 성능은 동일한 플레이트 내에서 조작된 균주 및 공통 기준 균주 사이의 평균 성능에 차이로 계산된다. 계산을 플레이트 내 비교로 제한하면 고려중인 샘플 모두가 동일한 실험 조건을 얻을 수 있음을 보장한다.

도 23은 고려중인 입력 데이터에 대한 상대적 균주 성능의 분포를 도시한다. 0의 상대적 성능은 조작된 균주가 인-플레이트 기본 또는 "참조" 균주에 동일하게 잘 수행되었음을 나타낸다. 0보다 크게 수행할 수 있는 균주를 확인하는 예측 모델의 능력이 중요하다. 더구나, 그리고 더 일반적으로, 임의의 소정의 균주는 일부 기준에 의해 이의 부모보다 우월한지 여부가 중요하다. 실제로, 기준은 부모 수준 이상의 일부 임계값을 충족하거나 초과하는 생성물 역가일 수 있으며, 원하는 방향으로 부모와 통계적으로 유의미한 차이를 갖는 것은 대신에 또는 추가로 사용될 수도 있다. 기본 또는 "참조" 균주의 역할은 단순히 플레이트 내 또는 플레이트 간의 비교를 위한 추가된 표준화 요소로서 작용하는 것이다.

염두에 두어야 할 개념은 부모 균주 및 기준 균주의 차이점이다. 부모 균주는 돌연변이유발의 현재 라운드에 사용된 배경이다. 기준 균주는 특히 플레이트 간의 비교를 용이하게 하기 위해 모든 플레이트에서 사용되는 대조군 균주이며 일반적으로 위에 언급된 "기본 균주"입니다. 그러나 기본 균주(예를 들어, 야생형 또는 산업용 균주는 전체 성능을 벤치마크하는데 사용된다)는 소정의 라운드의 균주 개량에서 돌연변이유발 표적이라는 의미에서 반드시 "기본"이 아니기 때문에, 보다 설명적인 용어는 "기준 균주"이다.

요약하면, 기본/기준 균주는 제조된 균주의 성능을 벤치마크하는데 사용되는 반면, 부모 균주는 관련 유전자 배경에서 특이적 유전자 변화의 성능을 벤치마크하는데 사용된다.

선형 회귀 분석에 의한 제조된 균주의 성능 순위 매김

개시된 모델의 목적은 제조된 균주에 도입된 유전자 변화의 구성의 함수로서, 상대적 균주 성능을 기술함으로써, 제조된 균주의 성능을 순위매기기 위한 것이다. 본 발명 전반에 걸쳐 논의된 바와 같이, 다양한 HTP 유전자 디자인 라이브러리는 조작된 균주에 도입되는 가능한 유전자 변화(예를 들어, 유전자 교란/변경)의 레퍼토리를 제공한다. 선형 회귀는 현재 설명된 전형적인 예측 모델의 기초이다.

아래의 표는 회귀-기반 모델링에 대한 예시적인 입력을 포함한다. 균주 성능은 균주에 포함된 유전자 변화의 구성의 함수로서 공통 기본 균주에 상대적으로 평가된다.

각 열 머리글은 유전자 변화를 나타내고, "1"은 변화의 존재를 나타내는 반면 "0"은 변화가 없음을 나타낸다. "DSS"는 특정 라이브러리의 SNP 스왑(상대 _perf 뒤의 처음 3 열)을 나타낸다. 마지막 3 열은 프로모터 스왑이며, pcgXXXX는 특정 프로모터를 나타내고, 마지막 3 글자는 프로모터가 적용되는 유전자를 나타낸다. 유전자는 중심 대사와 관련이 있다. 프로모터는 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)에서 유도된다(따라서 "cg" 표기). 이용된 프로모터에 관한 추가 정보는 표 1에서 발견될 수 있고, 프로모터 P1-P8 및 본 출원의 서열 목록을 기재하고 있다. 또한, 각 프로모터 P1-P8에 대한 상세한 정보는 참조로 본 발명에 포함된 2015년 12월 7일 출원되고 "코리네박테리움 글루타미쿰으로부터의 프로모터"라는 명칭의 미국 가출원 제 62/264,232호에서 발견될 수 있다. 아래 표에서 참조를 쉽게 하기 위해, pcg3121 = P8; pcg0755 = P4; 및 pcg1860 = P3.

유전자 변화와 상대적인 성능에 대한 이의 효과의 요약.

상대적_perf	dss_033	dss_034	dss_056	pcg3121_pgi	pcg0755_zwf	pcg1860_pyc
0.1358908	0	0	0	0	0	1
-1.8946985	1	0	0	1	0	1
-0.0222045	0	0	0	1	0	0
0.6342183	1	0	1	0	0	0
-0.0803285	1	1	0	0	0	0
2.6468117	0	0	0	1	0	0

제조된 균주를 특징화하는 선형 회귀 선형 회귀는 구현 및 해석의 용이함 때문에 기술된 HTP 게놈 공학 플랫폼에 대한 매력적인 방법이다. 얻어진 회귀 계수는 각 유전자 변화의 존재에 기인한 상대적 균주 성능의 평균 증가 또는 감소로 해석될 수 있다.

예를 들어, 도 24에서 볼 수 있는 바와 같이, 이 기술은 pgi 프로모터를 pcg3121로 변경하면 평균 약 5 단위만큼 상대적 균주 성능을 개량시키고, 따라서 어떠한 음성 상위성 상호작용의 부재시에 잠재적으로 매우 바람직한 변화라고 결론 내리게 한다(참고: 입력은 단위가 없는 정규화 값).

따라서, 교시된 방법은 선형 회귀 모델을 사용하여 다양한 교시된 라이브러리로부터의 그들의 게놈에 도입된 다양한 유전자 교란을 갖는 제조된 균주를 기술하고/특성화하고 순위를 매긴다.

예측 디자인 모델링

구축된 균주로부터의 데이터를 사용하는 상기한 선형 회귀 모델은 아직 제조되지 않은 균주에 대한 성능 예측을 수행하는데 사용될 수 있다.

절차는 다음과 같이 요약될 수 있다: 가능한 모든 형태의 유전자 변화를 인 실리코로 생성한다 → 회귀 모델을 사용하여 상대적인 균주 성능을 예측한다 → 성능에 의해 후보 균주 디자인을 순서화한다. 따라서 회귀 모델을 이용하여 아직 제조되지 않은 균주의 성능을 예측함으로써, 이 방법은 더 적은 실험을 수행하는 동시에 고성능 균주의 생산을 가능하게 한다.

구성 생성

아직 제조되지 않은 균주의 성능을 예측하기 위한 모델을 구축하는 경우, 첫 번째 단계는 일련의 디자인 후보를 생산하는 것이다. 이것은 균주의 유전자 변화의 총 수를 고정한 다음, 가능한 모든 유전자 변화의 조합을 정의함으로써 이루어진다. 예를 들어, 잠재적 유전자 변화/교란의 총 수를 29(예를 들어, 유전자 교란의 영역이 29인 한 29개 가능한 SNP 또는 29개 상이한 프로모터 또는 이의 임의의 조합)으로 설정한 후 29개 잠재적 유전자 변화의 모든 가능한 3-구성원 조합을 디자인하도록 결정할 수 있으며, 이것이 3,654개 후보 균주 디자인을 생성할 것이다.

상기한 3,654개 후보 균주에 대한 문맥을 제공하기 위해, n!/((n-r)! * r!)을 사용하여 n개의 가능한 구성원으로부터 크기 r의 비 중복 그룹의 수를 계산할 수 있다고 생각한다. r = 3이면 n = 29는 3,654를 제공한다. 따라서, 29개 잠재적 변화의 모든 가능한 3개 구성원 조합을 디자인하면, 결과는 3,654개 후보 균주이다. 29개 잠재적 유전자 변화가 도 25의 x축에 제공된다.

새로운 균주 디자인의 성능 예측

입력으로서 조합 구성으로 위에서 구축된 선형 회귀 분석을 사용하여, 각각의 후보 디자인의 예상된 상대 성능을 예측할 수 있다. 도 25는 상위 100개 예상 균주 디자인에 대한 변화의 조성물을 요약한다. x축은 잠재적 유전자 변화의 풀(29개 가능한 유전자 변화)을 열거하고, y축은 순위 순서를 도시한다. 검은 색 셀은 후보 디자인에 특정 변화의 존재를 나타내고 흰색 셀은 변화의 부존재를 나타낸다. 이 특정 예에서, 모든 상위 100개 디자인은 변화 pcg3121_pgi, pcg1860_pyc, dss_339 및 pcg0007_39_lysa을 포함한다. 또한 상위 후보 디자인은 변화 dss_034, dss_009를 포함한다.

예측 정확도는 새로운 관찰이 모델을 반복적으로 재훈련하고 재구성하는데 사용됨에 따라 시간이 지남에 따라 증가해야 한다. 본 발명자에 의한 연구 결과는 예측 모델이 반복적으로 재훈련되고 개량될 수 있는 방법을 설명한다. 도 47은 관찰된 측정 값과 모델 예측을 비교한다. 모델 예측의 품질은 예측된 값과 관찰된 값 사이의 연관성의 강도를 나타내는 상관 계수 또는 평균 모델 오차의 척도인 평균 제곱근 오차를 포함하는 여러 방법을 통해 평가될 수 있다. 모델 평가에 선택된 메트릭을 사용하여, 시스템은 모델이 재훈련되어야 할 때에 대한 규칙을 정의할 수 있다.

상기 모델에 대한 몇 가지 설명되지 않은 가정은 다음을 포함한다: (1) 상위성 상호작용이 없다; (2) 예측 모델을 구축하기 위해 사용된 유전자 변화/교란(예를 들어, 도 24에 예시된 제조된 균주 데이터로부터 또는 어떤 데이터 세트도 모델을 구축하는데 참조로 사용된다)은 유전자 변형의 제안된 조합으로서 모두 동일한 배경에서 만들어진다(예를 들어, 도 25에 예시된 바와 같이).

2차 기능에 대한 필터링

상기 설명된 예는 예측된 숙주 세포 성능에 기초한 선형 회귀 예측에 초점을 두었다. 일부 실시태양에서, 본 선형 회귀 방법은 포화 바이오매스, 저항성 또는 다른 측정가능한 숙주 세포 특징과 같은 비-생체분자 인자에도 적용될 수 있다. 따라서, 본 발명의 방법은 또한 제조할 후보자의 우선순위를 정할 때 예측된 성능 이외의 다른 특징을 고려하는 것을 교시한다. 추가적인 관련 데이터가 있다고 가정하면, 비선형 항도 회귀 모델에 포함된다.

기존의 균주와의 밀접성

이미 제조된 것과 유사한 예측된 균주는 상위 예측 후보가 아니더라도 시간 및 비용을 절감할 수 있다

변화의 다양성

상기한 모델을 구축할 때, 유전자 변화가 상위성 상화작용의 존재에 의해 진정으로 부가적일 것을 확신할 수 없다(선형 회귀에 의해 가정되고 상기 가정으로 언급됨). 그러므로, 유전자 변화 비유사성의 지식은 긍정적인 가산성의 가능성을 증가시키는데 사용될 수 있다. 예를 들어 위의 상위 균주로부터의 변화 dss_034 및 dss_009(SNP 스왑임)가 동일한 대사 경로에 있고 유사한 성능 특성을 갖는 것을 아는 경우, 그 정보는 변화의 비유사한 구성을 가진 다른 상위 균주를 선택하는데 사용될 수 있다. 상위성 매핑에 관한 위의 섹션에서 설명한 바와 같이, 예측된 최고의 유전자 변화는 상당히 비유사한 응답 프로파일을 가진 돌연변이에 대한 선택을 제한하기 위해 필터링될 수 있다. 대안적으로, 선형 회귀는 예측을 가중하기 위해 유사성 매트릭스를 사용하는 가중된 최소 자승 회귀(weighted least squares regression)일 수 있다.

예측된 성능의 다양성

마지막으로, 예측 모델을 검증하고 후속적으로 개량하기 위해, 중간 또는 나쁜 예측된 성능을 가진 균주를 디자인하도록 선택할 수 있다.

반복 균주 디자인 최적화

상기 실시예에 대해 설명한 바와 같이, 상위 100 개의 변형 디자인은 모두 변화 pcg3121_pgi, pcg1860_pyc, dss_339 및 pcg0007_39_lysa를 포함한다. 또한, 상위 후보 균주 디자인은 변화 dss_034, dss_009를 포함한다.

실시태양에서, 주문 배치 엔진(208)은 공장(210)에 공장 주문을 하여 상위 후보 돌연변이를 포함하는 미생물 균주를 제조한다. 피드백-루프 방식에서, 결과는 분석 장비(214)에 의해 분석되어 어느 미생물이 원하는 표현형 특성을 나타내는지를 결정할 수있다(314). 분석 단계 동안, 변형된 균주 배양물은 평가되어 성능, 즉 산업적 규모로 생산되는 능력을 포함하는 원하는 표현형 특성의 발현을 측정한다. 예를 들어, 분석 단계는, 다른 것들 중에서, 콜로니 건강의 지표로서 미생물 콜로니 성장을 측정하기 위해 플레이트의 이미지 데이터를 사용한다. 분석 장비(214)는 유전자 변화를 표현형 성능과 상관시키고 결과적인 유전자형-표현형 상관 데이터를 라이브러리(206)에 저장될 라이브러리에 저장하여 장래의 미생물 생산을 알려주는데 사용된다.

특히, 충분히 높게 측정된 성능을 실제로 초래하는 후보 변화는 상기 표 4와 같은 표에 데이터베이스의 행으로서 추가될 수 있다. 이러한 방식으로, 최고의 성능 돌연변이가 감독된 기계 학습 방식으로 예측 균주 디자인 모델에 추가된다.

LIMS는 이전의 공장 가동으로부터 개발된 상관관계에 기초하여 디자인/제조/테스트/분석 사이클을 반복한다. 후속 사이클 동안, 단독으로 또는 인간 조작자와 함께 분석 장비(214)는 상관관계 데이터를 사용하여 유전자 변형을 미세하게 조정하여 더 미세한 정교성(granularity)으로 더 나은 표현형 성능을 달성하도록 입력 인터페이스(202)로 다시 입력하기 위한 기본 균주로서 최고의 후보를 선택할 수 있다. 이러한 방식으로, 본 발명의 실시태양의 실험실 정보 관리 시스템은 품질 개선 피드백 루프를 구현한다.

요약하면, 도 33의 흐름도를 참조하면, 반복 예측 균주 디자인 작업 흐름은 다음과 같이 기술될 수 있다:

● 입력과 출력 변수의 훈련 세트, 예를 들어, 입력으로 유전자 변화 및 출력으로 성능 특성을 생성한다(3302). 생성은 이전의 유전자 변화 및 이러한 유전자 변화를 포함하는 미생물 균주의 상응하는 측정된 성능에 기초하여 분석 장비(214)에 의해 수행될 수 있다.

● 훈련 세트를 기반으로 초기 모델(예를 들어, 선형 회귀 모델)을 개발한다(3304). 이는 분석 장비(214)에 의해 수행될 수 있다.

● 디자인 후보 균주를 생성한다(3306)

○ 한 실시태양에서, 분석 장비(214)는 변화의 조합의 형태로, 배경 균주에 대해 행해지는 유전자 변화의 수를 고정시킬 수 있다. 이런 변화를 나타내기 위해, 분석 장비(214)는 변화의 조합을 나타내는 하나 이상의 DNA 세부사항 표현을 해석자(204)에 제공할 수 있다. (이런 유전자 변화 또는 이런 변화를 포함하는 미생물 균주는 "테스트 입력"으로 불릴 수 있다) 해석자(204)는 하나 이상의 DNA 세부사항을 해석하고, 실행 엔진(207)은 DNA 세부사항을 실행하여 이런 변화에 대한 개별 후보 후보자 디자인 균주를 나타내는 분석된 출력으로 DNA 세부사항을 채운다.

● 모델에 기초하여, 분석 장비(214)는 각각의 후보 디자인 균주의 예상 성능을 예측한다(3308).

● 분석 장비(214)는 최고의 예측된 성능을 가진 제한된 수, 예를 들어, 100개의 후보 디자인을 선택한다(3310).

○ 상위성 매핑과 관련하여 본 발명의 다른 곳에서 설명된 바와 같이, 분석 장비(214)는 예를 들어, 상위성 효과에 대한 상위 디자인을 필터링하거나, 예측 모델 속에 상위성을 고려하여 상위성과 같은 2차 효과를 설명할 수 있다.

● 주문 배치 엔진(208)에 의해 생성된 공장 주문에 기초하여 필터링된 후보 균주를(공장(210)에서)제조한다(3312).

● 분석 장비(214)는 선택된 균주의 실제 성능을 측정하고 우수한 실제 성능을 기초로 제한된 수의 선택된 균주를 선택하고(3314), 디자인 변화와 이의 얻어진 성능을 예측 모델에 추가한다 (3316). 선형 회귀 예에서, 디자인 변화 및 이의 관련 성능의 세트를 표 4에 새로운 행으로 추가한다.

● 분석 장비(214)는 새로운 디자인 후보 균주의 생성으로 다시 반복하고(3306), 정지 조건이 만족될 때까지 반복을 지속한다. 정지 조건은, 예를 들어, 수율, 성장률 또는 역가와 같은 성능 메트릭을 만족시키는 적어도 하나의 미생물 균주의 측정된 성능을 포함할 수 있다.

상기 예에서, 변형 디자인의 반복 최적화는 기계 학습을 구현하기 위해 피드백 및 선형 회귀를 사용한다. 일반적으로, 기계 학습은 제한된 수의 표지된 데이터의 예를 사용하고 알려지지 않은 데이터에 동일한 작업을 실행하여 정보 작업의 수행(예를 들어, 분류 또는 회귀)시에, 매개 변수, 기술 또는 기타 기능과 같은 성능 기준의 최적화로 기술될 수 있다. 상기 선형 회귀 예와 같은 감독된 기계 학습에서, 기계(예를 들어, 컴퓨팅 디바이스)는 예를 들어 훈련 데이터에 의해 나타난 패턴, 카테고리, 통계적 관계 또는 다른 속성을 확인함으로써 학습한다. 그런 다음 학습 결과는 새로운 데이터가 동일한 패턴, 카테고리, 통계적 관계 또는 기타 속성을 나타낼 것인지를 예측하는데 사용된다.

본 발명의 실시태양은 훈련 데이터가 이용가능할 때 다른 감독된 기계 학습 기술을 사용할 수 있다. 훈련 데이터가 없는 경우, 실시태양은 감독되지 않은 기계 학습을 채택할 수 있다. 대안적으로, 실시태양은 소량의 표지된 데이터 및 다량의 비표지된 데이터를 사용하는 반-감독된 기계 학습을 채택할 수 있다. 실시태양은 또한 기계 학습 모델의 성능을 최적화하기 위해 가장 관련이 있는 특징의 서브세트를 선택하기 위해 특징 선택을 채택할 수 있다. 선형 회귀에 대한 대안으로서 또는 선형 회귀에 추가로 선택된 기계 학습 접근법의 유형에 따라, 실시태양은, 예를 들어, 로지스틱 회귀, 신경망, 지지 벡터 기계(SVM), 결정 트리, 숨겨진 마르코프 모델, 베이지안 네트워크, 그램 슈미트, 보강-기반 학습, 계층적 클러스터링을 포함하는 클러스터 기반 학습, 유전자 알고리즘 및 당업계에 공지된 임의의 다른 적절한 학습 기계를 채택할 수 있다. 특히, 실시태양은 로지스틱 회귀를 이용하여 분류 자체와 함께 분류(예를 들어, 상이한 기능 그룹으로 유전자의 분류)의 확률을 제공할 수 있다. 예를 들어, Shevade, A simple and efficient algorithm for gene selection using sparse logistic regression, Bioinformatics, Vol. 19, No. 17 2003, pp. 2246-2253, Leng, et al., Classification using functional data analysis for temporal gene expression data, Bioinformatics, Vol. 22, No. 1, Oxford University Press (2006), pp. 68-76를 참조하고, 이의 전부는 전문이 참조로 본 발명에 포함된다.

실시태양은, 특히 심층 신경망(DNN)으로 알려진 형태로 기계 학습 작업을 수행함에 있어 인기가 증가하고 있는 것으로 밝혀진 그래픽 처리 장치(GPU) 가속 아키텍처를 채택할 수 있다. 본 발명의 실시태양은 GPU 기반 딥 러닝 인터페이스: A Performance and Power Analysis, NVidia Whitepaper, November 2015, Dahl, et al., Multi-task Neural Networks for QSAR Predictions, Dept. of Computer Science, Univ. of Toronto, June 2014 (arXiv:1406.1231 [stat.ML])에 기술된 것과 같은 GPU-기반 기계 학습을 채택할 수 있고, 이의 전부는 전문이 참조로 본 발명에 포함된다. 본 발명의 실시태양에 적용할 수 있는 기계 학습 기술은 다른 참조문헌 중에서, Libbrecht, et al., Machine learning applications in genetics and genomics, Nature Reviews: Genetics, Vol. 16, June 2015, Kashyap, et al., Big Data Analytics in Bioinformatics: A Machine Learning Perspective, Journal of Latex Class Files, Vol. 13, No. 9, Sept. 2014, Prompramote, et al., Machine Learning in Bioinformatics, Chapter 5 of Bioinformatics Technologies, pp. 117-153, Springer Berlin Heidelberg 2005에서 발견될 수 있고, 이의 전부는 전문이 참조로 본 발명에 포함된다.

반복적인 예측 균주 디자인: 실시예

다음은 위에서 설명한 반복적인 예측 균주 디자인 작업 흐름의 예시적인 응용을 제공한다.

훈련 입력 및 출력 변수의 초기 세트가 준비되었다. 이 세트는 정의된 유전자 구성을 가진 1864개의 고유한 조작 균주로 구성되었다. 각 균주는 5 내지 15개의 조작된 변화를 포함하였다. 총 336개의 고유한 유전자 변화가 훈련에 존재하였다.

초기 예측 컴퓨터 모델이 개발되었다. 구현은 일반 선형 모델(4차 다항 커널에 의한 커널 릿지 회귀)을 사용하였다. 구현은 두 가지 뚜렷한 표현형(수율 및 생산성)을 만든다. 아래 도시된 바와 같이, 이들 표현형은 가중치 합계로 결합되어 순위에 대한 단일 점수를 얻는다. 다양한 모델 매개 변수, 예를 들어, 정규화 인자는 지정된 훈련 데이터에 대해 k 배 교차 검증을 통해 조정되었다.

상기 구현은 상기 상위성 매핑 섹션에 기술된 바와 같이 상호작용 효과의 어떠한 명백한 분석도 포함하지 않는다. 그러나, 당업자가 이해할 수 있는 바와 같이, 구현된 일반 선형 모델은 암시적으로 커널의 2차, 3차 및 4차 항을 통해 상호작용 효과를 포착할 수 있다.

모델은 훈련 세트에 대해 훈련되었다. 적합 모델은 수율에 대해 0.52의 R² 값(결정 계수) 및 생산성에 대해 0.67의 R² 값을 가진다. 도 47은 훈련 데이터에 댄한 수율 모델의 현저한 품질 적합성을 나타낸다.

후보 균주가 생성되었다. 이 예는 부모 균주에 대한 새로운 유전자 변화의 도입과 관련된 일련의 제조 제약을 포함한다(이 예에서, 단지 하나의 새로운 돌연변이가 한 번에 하나의 균주 속으로 조작되었다). 여기서, 후보자는 단순히 변화의 원하는 수의 함수로 간주되지 않는다. 대신에, 분석 장비(214)는, 출발점으로서, 고성능 메트릭("종자 균주")을 갖는 것으로 알려진 이전에 디자인된 균주의 집합을 선택하였다. 분석 장비(214)는 각각의 종자 균주에 유전자 변화를 개별적으로 적용하였다. 도입된 유전자 변화는 종자 균주에 이미 존재하는 것들을 포함하지 않았다. 다양한 기술적, 생물학적 또는 다른 이유로, opca_4와 같은 특정 돌연변이가 명시적으로 요구되거나 dss_422가 명시적으로 배재되었다. 모델에 의해 특징화된 166개의 이용 가능한 종자 균주 및 336개의 변화를 사용하여, 6239개의 신규 후보 균주가 디자인되었다.

모델에 기초하여, 분석 장비(214)는 후보 균주 디자인의 성능을 예측하였다. 분석 장비(214)는 관심있는 두 표현형에 대한 예측된 성능(수율 및 생산성)에 기초하여 후보를 "최상"에서 "최악"으로 순위를 매겼다. 특히, 분석 장비(214)는 가중 합을 사용하여 후보 균주에 점수를 매겼다:

점수 = 0.8 * 수율/ 최대(수율) + 0.2 * 생산성/최대(생산성),

여기서 수율은 후보 균주에 대한 예측된 수율을 나타내고,

최대(수율)는 모든 후보 균주에 대한 최대 수율을 나타내며,

생산성은 후보 균주의 생산성을 나타내며,

최대(생산성)은 모든 후보 균주에 대한 최대 생산성을 나타낸다.

분석 장비(214)는 용량 제약 및 작업 제약 모두를 부과함으로써 후보의 랭킹 된 목록으로부터 최종 세트의 권고를 생성하였다. 이 실시예에서, 용량 제한은 48개 컴퓨터 생성 후보 디자인 균주에서 설정되었다. 작업 제약으로 인해, 이 실시예에서 단지 하나의 종자 균주가 96-웰 플레이트의 컬럼당 사용되었다. 이것은 종자 균주를 선택한 후, 그 균주에 최대 8개 변화가 만들어질 수 있지만, 단지 6개 종자 균주가 임의의 소정의 주간에 선택될 수 있다.

훈련된 모델(위에 설명됨)은 각각의 후보 균주의 예상된 성능(수율 및 생산성에 대해)을 예측하는데 사용되었다. 분석 장비(214)는 위에 제공된 스코어링 함수를 사용하여 후보 균주를 평가하였다. 용량 및 작업 제약이 적용되어 48개 후보 균주의 필터된 세트를 생산하였다. 이 필터된 후보 균주의 이 세트는 도 48에 묘사된다.

필터된 후보 균주는 주문 배치 엔진(208)에 의해 생성된 공장 주문에 기초하여 (공장 (210)에서) 제조되었다(3312). 순서는 후보 균주에 해당하는 DNA 세부사항에 기초하였다.

실제로, 제조 공정은 예측된 실패율을 가지므로 균주의 무작위로 세트가 제조되지 않는다. 이런 제조 사이클의 경우, 약 20%의 후보 균주가 제조에 실패하여 37개의 제조된 균주를 생성하였다.

분석 장비(214)는 실제 수율 및 생산성 성능을 측정하는데 사용될 수 있다. 분석 장비(214)는 3개의 기준; 모델 정확성; 균주 성능 개량; 인간 전문가가 생성 한 디자인에 대한 동등성(또는 개량)에 기초하여 모델 및 권장 균주를 평가하였다.

수율 및 생산성 표현형은 권장 균주에 대해 측정하고 모델에 의해 예측된 값과 비교하였다. 도 49에 도시된 바와 같이, 모델은 유용한 예측 이용성을 나타낸다. 특히, 권장 균주에 대한 예측 수율 값은 상응하는 관찰에 의해 0.59의 피어슨-r 상관 계수를 가진다.

다음으로, 분석 장비(214)는 각각의 권장 균주에 대한 부모 균주로부터의 성능 변화율을 계산하였다. 이 데이터는 도 50에 표시된다(밝은 회색). 본 발명자는 많은 예측 균주가 사실상 직계 부모에 비해 예상 성능 이득을 나타냄을 발견하였다. 특히, 최상의 예측된 균주는 직계 부모에 비해 6% 수율 개선을 나타내었다.

상기한 모델-기반 균주 디자인 공정과 병행하여, 48개 균주의 집합은 인간 전문가에 의해 독립적으로 디자인되었다. 이런 균주 중, 37개는 성공적으로 제조 및 시험되었다. 이 데이터는 모델 기반 균주 디자인은 인적 전문가가 디자인된 균주와 비교하여 수행되었음을 입증하였다. 이들 전문가는 본 발명의 양수인이 고용하거나 그렇지 않다면 근무시키고 본 발명의 실시태양에 익숙한 고도로 숙련된(예를 들어, Ph.D. 수준의) 과학자들이다. 두 가지 방법을 비교하기 위해, 본 발명자는 먼저 각 그룹의 성능 분포를 조사하였다(도 51). 이 실험에서, 모델-기반 균주의 평균 수율은 인간 전문가가 생성한 디자인에 대해 1% 증가를 나타내었다.

그런 다음, 본 발명자는 배경에 의해 그룹화된 인간 전문가 디자인 및 컴퓨터 모델 디자인 균주, 즉 새로운 균주와 동일한 균주를 비교하였다(도 52). 또한, 발명자는 컴퓨터 생성 디자인이 인간 전문가가 생성한 디자인과 필적하게, 일부 경우에 따라 더 우수하게 수행하고, 더 적은 가변성을 나타내는 경향이 있다는 것을 발견하였다. 마지막으로, 발명자는 인간 전문가의 부모 균주 및 모델-디자인된 균주에 대한 백분율 변화를 비교하였다(도 50). 다시 말하지만, 이 집단들은 필적하는 이득을 나타내었다.

표로 나타낸 요약된 통계에 대해 표 4.1을 참조.

[표 4.1]

예측 모델 및 인간 전문가 참조에 의해 디자인된 균주에 대해 측정된 성능 통계.

예측 → 제조 → 테스트 사이클의 각 라운드가 끝날 때, 발명자는 모델 예측의 품질을 평가하고 새로운 데이터를 반복적으로 이전 모델에 통합하는 것에 관심을 가졌다. 이전 모델 평가의 경우, 발명가는 모델 예측을 실험 측정과 비교하여 예측 정확도를 측정하는데 중점을 두었다. 예측 정확도는 예측된 값과 관측된 값 간의 연관성을 나타내는 상관 계수 또는 평균 모델 오차의 척도인 평균 제곱근 오차를 포함하는 여러 방법을 통해 평가될 수 있다.

여러 라운드의 실험에 걸쳐, 모델 예측은 표류할 수 있고, 새로운 유전자 변화가 예측 정확도를 향상시키기 위해 훈련 입력에 추가될 수 있다. 이 실시예의 경우, 디자인 변경과 이의 결과로 얻은 성능이 예측 모델에 추가되었다(3316).

서비스로서의 게놈 디자인 및 공학

본 발명의 실시태양에서, 도 31의 LIMS 시스템 소프트웨어(3210)는 도 32의 클라우드 컴퓨팅 시스템(3202)에서 구현되어, 다수의 사용자가 본 발명의 실시태양에 따라 미생물 균주를 디자인 및 제조할 수 있게 한다. 도 32는 본 발명의 실시태양에 따른 클라우드 컴퓨팅 환경(3204)을 도시한다. 도 34에 도시된 것과 같은 클라이언트 컴퓨터(3206)는 인터넷과 같은 네트워크(3208)를 통해 LIMS 시스템에 접근한다. 실시태양에서, LIMS 시스템 애플리케이션 소프트웨어(3210)는 클라우드 컴퓨팅 시스템(3202)에 상주한다. LIMS 시스템은 도 34에 도시된 유형의 하나 이상의 프로세서를 사용하는 하나 이상의 컴퓨팅 시스템을 사용할 수 있다. 클라우드 컴퓨팅 시스템 자체는 네트워크를 통해 LIMS 시스템 어플리케이션(3210)을 클라이언트 컴퓨터(3206)에 인터페이스하는 네트워크 인터페이스(3212)를 포함한다. 네트워크 인터페이스(3212)는 클라이언트 컴퓨터(3206)에서 클라이언트 애플리케이션이 LIMS 시스템 소프트웨어(3210)에 접근할 수 있게 하는 어플리케이션 프로그래핑 인터페이스(API)를 포함할 수 있다. 특히, API를 통해, 네트워크 컴퓨터(3026)는 입력 인터페이스(202), 해석자(204), 실행 엔진(207), 주문 배치 엔진(208), 공장(210)을 구동하는 소프트웨어뿐만 아니라 테스트 장비(212) 및 분석 장비(214)를 제한 없이 포함하는 LIMS 시스템(200)의 구성요소에 접근할 수 있다. 서비스로서 소프트웨어(SaaS) 소프트웨어 모듈(3214)은 클라이언트 컴퓨터(3206)에 서비스로서 LIMS 시스템 소프트웨어(3210)을 제공한다. 클라우드 관리 모듈(3216)은 클라이언트 컴퓨터들(3206)에 의해 LIMS 시스템(3210)에 대한 접근을 관리한다. 클라우드 관리 모듈(3216)은 당업계에 공지된 멀티테넌트 애플리케이션, 가상화 또는 다른 아키텍처를 사용하는 클라우드 아키텍처가 여러 사용자에게 서비스를 제공하는 것을 가능하게 한다.

게놈 자동화

본 발명의 방법의 자동화는 다중 테스트 균주 변이체로부터의 표적 생성물의 높은 처리량의 표현형 선별 및 확인을 동시에 가능하게 한다.

상기한 게놈 공학 예측 모델링 플랫폼은 수백 및 수천 개의 돌연변이체 균주가 고 처리량 방식으로 구축된다는 사실에 전제된다. 아래에 설명된 로봇 및 컴퓨터 시스템은 이런 고 처리량 공정이 수행될 수있는 구조적 메커니즘입니다.

일부 실시태양에서, 본 발명은 숙주 세포 생산성을 개선하거나 산업 균주를 재활시키는 방법을 교시한다. 이 공정의 일부로서, 본 개시는 DNA를 조립하고, 새로운 균주를 제조하고, 플레이트에서 배양물을 선별하고, 탱크 발효 모델에서 배양 물을 선별하는 방법을 교시한다. 일부 실시태양에서, 본 발명은 새로운 숙주 균주를 생성하고 테스트하는 상기한 방법의 하나 이상이 자동화 로봇에 의해 보조되는 것을 교시한다.

일부 실시태양에서, 본 발명은도 6에 도시된 바와 같이 고 처리량 균주 공학 플랫폼을 교시한다.

HTP 로봇 시스템

일부 실시태양에서, 본 발명의 자동화 방법은 로봇 시스템을 포함한다. 본 발명에 개략된 시스템은 일반적으로 96- 또는 384-웰 미세 역가 플레이트의 사용에 관한 것이지만, 당업자라면 알 수 있듯이, 임의의 수의 상이한 플레이트 또는 구성이 사용될 수 있다. 또한, 본 발명에 개략된 단계의 일부 또는 전부는 자동화될 수 있고, 따라서, 예를 들어, 시스템은 완전히 또는 부분적으로 자동화될 수 있다.

일부 실시태양에서, 본 발명의 자동화 시스템은 하나 이상의 작업 모듈을 포함한다. 예를 들어, 일부 실시태양에서, 본 발명의 자동화 시스템은 DNA 합성 모듈, 벡터 클로닝 모듈, 균주 변형 모듈, 선별 모듈 및 서열화 모듈을 포함한다 (도 7 참조).

당업자가 알 수 있는 바와 같이, 자동화 시스템은 액체 핸드러; 하나 이상의 로봇 암; 마이크로플레이트의 위치 결정을 위한 플레이트 핸들러; 플레이트 씰러 (plate sealers), 플레이트 피어서(plate piercers), 비 교차 오염 플레이트상의 웰을 위한 뚜껑을 제거하고 대체하는 자동화 뚜껑 처리기; 일회용 팁에 의해 샘플 배급을 위한 일회용 팁 어셈블리; 샘플 분배를 위한 세척 가능한 팁 어셈블리; 96 웰 로딩 블록; 통합 열 순환기; 냉각된 시약 랙; 미세적정 플레이트 피펫 위치(선택적으로 냉각됨); 플레이트와 팁을 위한 스태킹 타워; 마그네틱 비드 가공 스테이션; 여과 시스템; 플레이트 교반기; 바코드 판독기 및 애플리케이터; 및 컴퓨터 시스템을 포함하나 이에 제한되지 않는 매우 다양한 구성요소를 포함할 수 있다.

일부 실시태양에서, 본 발명의 로봇 시스템은 유전자 표적화 및 재조합 분야의 공정에서의 모든 단계를 수행하기 위한 고 처리량 피펫팅을 가능하게 하는 자동화된 액체 및 입자 취급을 포함한다. 이것은 흡인, 분배, 혼합, 희석, 세척, 정확한 체적 이동과 같은 액체 및 입자 조작; 피펫 팁의 회수 및 폐기; 단일 샘플 흡인으로 다중 전달을 위한 동일한 부피의 반복적 피펫팅을 포함한다. 이런 조작은 교차 오염이 없는 액체, 입자, 세포 및 유기체 전달이다. 이 장비는 필터, 막 및/또는 도터 플레이트에 대한 마이크로 플레이트 샘플의 자동화 반복, 고밀도 전달, 전체 플레이트 연속 희석 및 고용량 작업을 수행한다.

일부 실시태양에서, 본 발명의 맞춤형 자동화 액체 처리 시스템은 TECAN 머신(예를 들어, 맞춤형 TECAN Freedom Evo)이다.

일부 실시태양에서, 본 발명의 자동화 시스템은 다중 웰 플레이트, 딥 웰 플레이트, 정사각형 플레이트, 시약 트로프, 테스트 튜브, 미니 튜브, 마이크로퓨즈 튜브, 냉동 튜브, 필터, 마이크로 어레이 칩, 광섬유, 비드, 아가로스 및 아크릴 아마이드 겔을 위한 플랫폼과 양립가능하며 다른 고상 매트릭스 또는 플랫폼은 업그레이드 가능한 모듈식 데크에 수용된다. 일부 실시태양에서, 본 발명의 자동화 시스템은 공급원 및 출력 샘플, 시약, 샘플 및 시약 희석액, 분석 플레이트, 샘플 및 시약 저장조, 피펫 팁 및 활성 팁 세척 스테이션을 배치하기 위한 다중 위치 작업 표면을 위한 적어도 하나의 모듈 데크를 포함한다.

일부 실시태양에서, 본 발명의 자동화 시스템은 고 처리량 전기 천공 시스템을 포함한다. 일부 실시태양에서, 고효율 전기 천공 시스템은 96 또는 384-웰 플레이트에서 세포를 형질전환시킬 수 있다. 일부 실시태양에서, 고효율 전기 천공 시스템은 VWR® 고 처리량 전기 천공 시스템, BTX™, Bio-Rad® Gene Pulser MXcell™ 또는 다른 다중-웰 전기 천공 시스템을 포함한다.

일부 실시태양에서, 통합된 열 순환기 및/또는 열 조절기는 0℃ 내지 100℃에서 샘플을 배양하는 정확한 온도 제어를 제공하도록 제어된 블록 또는 플랫폼과 같은 열 교환기의 온도를 안정화하는데 사용된다.

일부 실시태양에서, 본 발명의 자동화 시스템은 액체, 입자, 세포 또는 다중 세포 유기체를 로봇 공학적으로 조작할 수 있는 단일 또는 다중 자기 프로브, 친 화성 프로브, 리플리케이터 또는 피펫터를 갖는 교환 가능한 머신-헤드(단일 또는 다중 채널)과 양립가능하다. 다중 웰 또는 다중 튜브 자기 분리기 및 여과 스테이션은 단일 또는 다중 샘플 형식으로 액체, 입자, 세포 및 유기체를 조작한다.

일부 실시태양에서, 본 발명의 자동화 시스템은 카메라 비전 및/또는 분광계 시스템과 양립가능하다. 따라서, 일부 실시태양에서, 본 발명의 자동화 시스템은 진행중인 세포 배양물에서 색 및 흡수 변화를 검출 및 기록할 수 있다.

일부 실시태양에서, 본 발명의 자동화 시스템은 시스템이 다수의 애플리케이션을 수행할 수 있게 하는 다중 하드웨어 애드온(add-on)으로 융통성 있고 적응할 수 있도록 디자인된다. 소프트웨어 프로그램 모듈은 방법의 생성, 수정 및 실행을 허용한다. 시스템의 진단 모듈은 설정, 장비 정렬 및 모터 작동을 허용한다. 맞춤형 도구, 랩웨어 및 액체 및 입자 전달 패턴은 다양한 응용 프로그램이 프로그램되고 실행되게 한다. 데이터베이스는 방법 및 매개변수 저장을 허용한다. 로봇 및 컴퓨터 인터페이스는 장비 간의 통신을 허용한다.

따라서, 일부 실시태양에서, 본 발명은 도 26에 도시된 바와 같이 고 처리량 균주 공학 플랫폼을 교시한다.

당업자는 본 발명의 HTP 공학 방법을 수행할 수 있는 다양한 로봇 플랫폼을 인식할 것이다. 아래의 표 5는 도 26에서 기술된 바와 같이 본 발명의 HTP 공학 단계의 각 단계를 수행할 수 있는 과학적 장비의 포괄적 목록을 제공한다.

[표 5]

본 발명의 HTP 공학 방법과 양립가능한 과학 장비의 포괄적 목록.

컴퓨터 시스템 하드웨어

도 34는 본 발명의 실시태양에 따라 비 일시적 컴퓨터 판독 가능 매체(예를 들어, 메모리)에 저장된 프로그램 코드를 실행하는데 사용될 수 있는 컴퓨터 시스템(800)의 한 예를 도시한다. 컴퓨터 시스템은 애플리케이션에 따라 인간 사용자 및/또는 다른 컴퓨터 시스템과 인터페이스하기 위해 사용될 수 있는 입력/출력 서브 시스템(802)을 포함한다. I/O 서브 시스템(802)은 예를 들어, 입력을 위한 키보드, 마우스, 그래픽 사용자 인터페이스, 터치 스크린, 또는 다른 인터페이스, 및 예를 들어 애플리케이션 프로그램 인터페이스(APIs)를 포함하는 출력을 위한 LED 또는 다른 평면 디스플레이를 포함할 수 있다. LIMS 시스템의 구성요소와 같은 본 발명의 실시태양의 다른 요소는 컴퓨터 시스템(800)과 같은 컴퓨터 시스템으로 구현될 수 있다.

프로그램 코드는 2차 메모리(810) 또는 메인 메모리(808) 또는 둘 다에서 의 영구 저장장치와 같은 비 일시적인 매체에 저장될 수 있다. 메인 메모리 808)는 랜덤 액세스 메모리(RAM)와 같은 휘발성 메모리 또는 리드 온리 메모리(ROM)와 같은 비 휘발성 메모리뿐만 아니라 명령들 및 데이터에 대한보다 빠른 접근를 위한 상이한 수준의 캐시 메모리를 포함할 수 있다. 2차 메모리는 솔리드 스테이트 드라이브, 하드 디스크 드라이브 또는 광 디스크와 같은 영구 저장장치를 포함할 수 있다. 하나 이상의 프로세서(804)는 하나 이상의 비 일시적인 매체로부터 프로그램 코드를 판독하고 컴퓨터 시스템이 본 실시태양에 의해 수행된 방법을 완성할 수 있도록 코드를 실행한다. 당업자는 프로세서(들)가 소스 코드를 섭취하고 소스 코드를 프로세서(들)(804)의 하드웨어 게이트 레벨에서 이해할 수 있는 머신 코드로 해석 또는 컴파일할 수 있다는 것을 이해할 것이다. 프로세서(들)(804)은 컴퓨팅 집약적인 작업을 처리하기 위한 그래픽 처리 장치(GPU)를 포함할 수 있다. 특히, 기계 학습에서, 하나 이상의 CPU(804)는 하나 이상의 GPU(804)로 대량의 데이터 처리를 오프로드할 수 있다.

프로세서(들)(804)는 네트워크 인터페이스 카드, WiFi 트랜시버 등과 같은 하나 이상의 통신 인터페이스(807)를 통해 외부 네트워크와 통신할 수 있다. 버스 (805)는 I/O 서브시스템(802), 프로세서(들)(804), 주변 장치(806), 통신 인터페이스(807), 메모리(808) 및 영구 저장장치(810)와 통신가능하게 연결된다. 본 발명의 실시태양은 이런 대표적 아키텍처에 제한되지 않는다. 대안적 실시태양은 상이한 배열 및 유형의 구성요소, 예를 들어 입출력 구성요소 및 메모리 서브시스템을 위한 개별 버스를 사용할 수 있다.

당업자는 본 발명의 실시태양의 요소의 일부 또는 전부 및 이들의 수반되는 작업이 컴퓨터 시스템(800)의 하나 이상의 프로세서 및 하나 이상의 메모리를 포함하는 하나 이상의 컴퓨터 시스템에 의해 전체적으로 또는 부분적으로 구현될 수 있다는 것을 이해할 것이다. 특히, LIMS 시스템(200)의 요소 및 본 발명에 기술된 임의의 로봇 및 다른 자동화 시스템 또는 장치는 컴퓨터로 구현될 수 있다. 일부 요소 및 기능은 국소적으로 구현될 수 있고, 다른 것들은 예를 들어, 클라이언트- 서버 방식과 같은, 상이한 서버를 통해 네트워크 도처에 분산된 방식으로 구현될 수 있다. 특히 도 32와 같이, 서버 측 작업은 서비스로서 소프트웨어(SaaS) 방식으로 여러 클라이언트에 이용될 수 있다.

본 내용에서 구성요소라는 용어는 소프트웨어, 하드웨어 또는 펌웨어(또는 이들의 임의의 조합) 구성요소를 포괄적으로 의미한다. 구성요소는 일반적으로 지정된 입력(들)을 사용하여 유용한 데이터 또는 다른 출력을 생성할 수 있는 기능적 구성요소이다. 구성요소는 자급식일 수 있거나 아닐 수 있다. 애플리케이션 프로그램("애플리케이션"이라고도 함)은 하나 이상의 구성요소를 포함할 수 있으며 구성요소는 하나 이상의 애플리케이션 프로그램을 포함할 수 있다.

일부 실시태양은 다른 모듈 또는 애플리케이션 구성요소와 함께 구성요소의 일부, 전부를 포함하거나 하나도 포함하지 않는다. 여전히, 다양한 실시태양은 이들 구성요소의 둘 이상을 단일 모듈에 통합하고 및/또는 이들 구성요소의 하나 이상의 기능의 일부를 다른 구성요소와 연관시킬 수 있다.

용어 "메모리"는 정보를 저장하기 위해 사용되는 임의의 장치 또는 메커니즘일 수 있다. 본 발명의 일부 실시태양에 따르면, 메모리는 휘발성 메모리, 비 휘발성 메모리 및 동적 메모리의 임의의 유형을 포함하나 이에 제한되는 것은 아니다. 예를 들어, 메모리는 랜덤 액세스 메모리, 메모리 저장 장치, 광학 메모리 장치, 자기 매체, 플로피 디스크, 자기 테이프, 하드 드라이브, SIMMs, SDRAM, DIMMs, RDRAM, DDR RAM, SODIMMS, 지울 수 있는 프로그램가능한 리드 온리 메모리(EPROMs), 전기적으로 지울 수 있는 프로그램가능한 리드 온리 메모리(EEPROMs), 컴팩트 디스크, DVDs 및/또는 이와 동일한 종류일 수 있다. 일부 실시태양에 따르면, 메모리는 하나 이상의 디스크 드라이브, 플래시 드라이브, 데이터베이스, 로컬 캐시 메모리, 프로세서 캐시 메모리, 관계형 데이터베이스, 플랫 데이터베이스, 서버, 클라우드 기반 플랫폼 및/또는 이와 동일한 종류를 포함할 수 있다. 또한, 당업자는 정보를 저장하기 위한 많은 부가적인 장치 및 기술이 메모리로서 사용될 수 있다는 것을 이해할 것이다.

메모리는 프로세서 상의 하나 이상의 애플리케이션 또는 모듈을 실행하기 위한 명령을 저장하는데 사용될 수 있다. 예를 들어, 일부 실시태양에서 메모리는 본 발명에 개시된 하나 이상의 모듈 및/또는 애플리케이션의 기능을 실행하는데 필요한 명령의 전부 또는 일부를 수용하기 위해 사용될 수 있다.

유전자 디자인 예측을 기반으로 하는 HTP 미생물 균주 공학: 예시적 작업 흐름

일부 실시태양에서, 본 발명은 본 발명의 전산 분석 시스템의 권고에 기초한 새로운 숙주 유기체의 지시된 공학을 교시한다.

일부 실시태양에서, 본 발명은 모든 유전자 디자인 및 클로닝 방법과 양립할 수 있다. 즉, 일부 실시태양에서, 본 발명은 폴리머라제 연쇄 반응, 제한 효소 절단, 결찰, 상동성 재조합, RT PCR 및 당업계에 일반적으로 공지된 다른 기술과 같은 전통적인 클로닝 기술의 사용을 교시하고 예를 들어 참조로 본 발명에 포함된 Sambrook et al. (2001) Molecular Cloning: A Laboratory Manual(3^rd ed., Cold Spring Harbor Laboratory Press, Plainview, New York에 기술된다.

일부 실시태양에서, 복제된 서열은 본 발명에서 교시된 임의의 HTP 유전자 디자인 라이브러리, 예를 들면: 프로모터 스왑 라이브러리로부터의 프로모터, SNP 스왑 라이브러리로부터의 SNP, 개시/중지 코돈 변화 라이브러리로부터의 개시 또는 중지 코돈, STOP 스왑 라이브러리의 터미네이터 또는 서열 최적화 라이브러리로부터의 서열 최적화의 임의의 것으로부터 가능성을 포함할 수 있다.

또한, 특정 구조체에 포함되어야 하는 정확한 서열 조합은 상위성 맵핑 기능에 의해 통지될 수 있다.

다른 실시태양에서, 복제된 서열은 합리적인 디자인(가설-주도적) 및/또는 과학 출판물과 같은 다른 소스에 기초한 서열에 기초한 서열을 또한 포함할 수 있다.

일부 실시태양에서, 본 발명은 i) 맞춤형 SNP 특이적 DNA를 생성하는 단계, ii) SNP 특이적 플라스미드를 조립하는 단계, (iii) SNP 특이적 DNA로 표적 숙주 세포를 형질전환시키는 단계, 및 iv) 모든 선택 마커를 루프아웃하는 단계를 포함하는 지시된 공학의 방법을 교시한다(도 2 참조).

도 6a는 DNA의 획득 및 조립, 벡터의 조립, 숙주 세포의 형질전환 및 선택 마커의 제거를 포함하는 본 발명의 균주 공학 방법의 일반적인 작업 흐름을 도시한다.

특정 DNA 올리고 뉴클레오타이드 제조

일부 실시태양에서, 본 발명은 숙주 세포 유기체의 DNA 절편을 삽입 및/또는 교체 및/또는 변경 및/또는 삭제하는 것을 교시한다. 일부 양태에서, 본 발명에 교시된 방법은 숙주 유기체의 게놈 속에 포함될 관심 올리고뉴클레오타이드(즉, 표적 DNA 절편)를 제조하는 것을 포함한다. 일부 실시태양에서, 본 발명의 표적 DNA 절편은 공지된 주형으로부터의 복제 또는 절단, 돌연변이 또는 DNA 합성을 포함하여 당업계에 공지된 임의의 방법을 통해 얻을 수있다. 일부 실시태양에서, 본 발명은 표적 DNA 서열(예를 들어, GeneArt™, GeneMaker™,　GenScript™, Anagen™, Blue Heron™, Entelechon™, GeNOsys, Inc., 또는 Qiagen™)을 생산하기 위한 상업적으로 구입가능한 유전자 합성 생성물과 양립가능하다.

일부 실시태양에서, 표적 DNA 절편은 숙주 유기체의 선택된 DNA 영역에 SNP를 포함시키도록(예를 들어, 유익한 SNP를 첨가하여) 디자인된다. 다른 실시태양에서, DNA 절편은 숙주 유기체의 DNA로부터 SNP를 제거하도록(예를 들어, 해로운 또는 중성 SNP를 제거하도록) 디자인된다.

일부 실시태양에서, 본 발명의 방법에서 사용된 올리고뉴클레오타이드는 당 업계에 공지된 효소적 또는 화학적 합성 방법 중 임의의 방법을 사용하여 합성될 수 있다. 올리고뉴클레오타이드는 제어된 공극 유리(CPG), 폴리스티렌 비드 또는 CPG를 함유할 수 있는 열가소성 폴리머로 구성된 막과 같은 고체 지지체 상에서 합성될 수 있다. 올리고 뉴클레오타이드는 미세유체역학(Tian et al., Mol. BioSyst., 5, 714-722 (2009)) 또는 둘 다의 조합을 제공하는 공지된 기술(Jacobsen et al., 미국 특허 출원 제 2011/0172127호 참조)을 사용하여 병렬 마이크로스케일로 어레이 상에서 합성될 수 있다.

어레이 상에 또는 미세유체역학을 통한 합성은 보다 낮은 시약 사용을 통해 비용을 감소시킴으로써 통상적인 고체 지지체 합성에 비해 이점을 제공한다. 유전자 합성에 필요한 규모는 작아서, 어레이 또는 미세유체역학을 통해 합성된 올리고 뉴클레오타이드 생성물의 규모가 허용가능하다. 그러나, 합성된 올리고뉴클레오타이드는 고체 지지체 합성을 사용할 때보다 품질이 떨어진다(이하의 Tian 참조; 또한 Staehler et al., U.S. Pat. App. No. 2010/0216648 참조).

퍼옥시 음이온 탈보호를 사용하여 1980년대에 처음으로 기술되었기 때문에 종래의 4단계 포스포아미다이트 화학에서 많은 발전이 이루어져왔다(예를 들어, Sierzchala, et al.　J. Am. Chem . Soc .,　125, 13427-13441 (2003) using peroxy anion deprotection; Hayakawa et al., U.S. Pat. No. 6,040,439 for alternative protecting groups; Azhayev et al,　Tetrahedron　57, 4977-4986 (2001) for universal supports; Kozlov et al.,　Nucleosides, Nucleotides, and Nucleic Acids,　24 (5-7), 1037-1041 (2005) for improved synthesis of longer oligonucleotides through the use of large-pore CPG; and Damha et al.,　NAR ,　18, 3813-3821 (1990) for improved derivatization 참조)

합성 유형에 관계없이, 생성된 올리고뉴클레오타이드는 보다 긴 올리고뉴클레오타이드를 위한 더 작은 빌딩 블록을 형성할 수 있다. 일부 실시태양에서, 더 작은 올리고뉴클레오타이드는 폴리머라제 연쇄 조립(PCA), 리가아제 연쇄 반응 (LCR) 및 열역학적으로 균형 잡힌 인사이드-아웃 합성(TBIO)과 같은 당업계에 공지 된 프로토콜을 사용하여 함께 결합될 수 있다(Czar et al. Trends in Biotechnology, 27, 63-71 (2009) 참조). PCA에서, 원하는 긴 제품의 전체 길이에 걸쳐있는 올리고뉴클레오티드는 어닐링되고 여러 사이클(일반적으로 약 55 사이클)에서 연장되어 전장 생성물을 최종적으로 얻는다. LCR은 리가아제 효소를 사용하여 제 3 올리고뉴클레오타이드에 모두 어닐링되는 두 올리고뉴클레오타이드에 연결시킨다. TBIO 합성은 목적 생성물의 중심에서 시작하여 유전자의 5' 말단에서 포워드 가닥과 상동성이고 유전자의 3' 말단에서 리버스 가닥과 상동성인 중첩 올리고뉴클레오타이드를 사용함으로써 점진적으로 양방향으로 연장된다.

더 큰 이중 가닥 DNA 단편을 합성하는 다른 방법은 상위-가닥 PCR(TSP)을 통해 더 작은 올리고뉴클레오티드를 조합하는 것이다. 이 방법에서, 복수의 올리고뉴클레오타이드는 원하는 생성물의 전체 길이에 걸쳐 있고 인접한 올리고뉴클레오티드(들)에 중첩 영역을 포함한다. 증폭은 범용 포워드 및 리버스 프라이머로 수행될 수 있으며, 증폭의 다중 사이클을 통해 전장 이중 가닥 DNA 생성물이 형성된다. 이런 생성물은 선택적인 오류 보정 및 원하는 이중 가닥 DNA 단편 최종 생성물을 생성하는 추가 증폭을 진행될 수 있다.

TSP의 한 방법에서, 전장의 원하는 생성물을 형성하도록 결합되어질 더 작은 올리고뉴클레오타이드의 세트는 40-200 염기 길이이고 적어도 약 15-20 염기만큼 서로 중첩된다. 실제적인 목적을 위해, 중첩 영역은 올리고뉴클레오타이드의 특정 어닐링을 보장할만큼 충분히 길어야 하고 사용된 반응 온도에서 어닐링하기에 충분한 높은 용융 온도(T_m)를 가져야 한다. 중첩은 소정의 올리고뉴클레오타이드가 인접한 올리고뉴클레오타이드에 의해 완전히 중첩되는 지점까지 연장될 수 있다. 중첩의 양은 최종 생성물의 품질에 영향을 미치지 않는 것으로 보입니다. 어셈블리의 첫 번째 및 마지막 올리고뉴클레오타이드 빌딩 블록은 포워드 및 리버스 증폭 프라이머에 대한 결합 위치를 포함해야 한다. 하나의 실시태양에서, 첫 번째 및 마지막 올리고뉴클레오티드의 최종 말단 서열은 보편적 프라이머의 사용을 허용하도록 상보성의 동일한 서열을 포함한다.

맞춤형 플라스미드 조립/복제

일부 실시태양에서, 본 발명은 숙주 유기체의 게놈에 원하는 표적 DNA 부분(예를 들어, 특정 SNP를 포함)을 삽입할 수 있는 벡터를 제조하는 방법을 교시한다. 일부 실시태양에서, 본 발명은 표적 DNA, 상동성 암 및 적어도 하나의 선택 마커를 포함하는 벡터를 복제하는 방법을 교시한다(도 3 참조).

일부 실시태양에서, 본 발명은 숙주 유기체로의 형질전환에 적합한 임의의 벡터와 양립가능하다. 일부 실시태양에서, 본 발명은 숙주 세포와 양립가능한 셔틀 벡터의 사용을 교시한다. 한 실시태양에서, 본 발명에 제공된 방법에서 사용하기 위한 셔틀 벡터는 대장균 및/또는 코리네박테리움 숙주 세포와 양립가능한 셔틀 벡터이다. 본 발명에 제공된 방법에서 사용하기 위한 셔틀 벡터는 본 발명에 기술된 바와 같은 선택 및/또는 역-선택을 위한 마커를 포함할 수 있다. 표지는 당업계에 공지된 및/또는 본 발명에 제공된 임의의 마커일 수 있다. 셔틀 벡터는 당업계에 공지된 바와 같은 상기 셔틀 벡터의 어셈블리에 유용한 임의의 조절 서열(들) 및/또는 서열을 추가로 포함할 수 있다. 셔틀 벡터는 예를 들어 대장균 또는 C. 글루 타미쿰과 같은 본 발명에 제공된 바와 같은 숙주 세포에서 증식에 필요할 수 있는 임의의 복제 기점을 추가로 포함할 수 있다. 조절 서열은 숙주 세포의 유전자 기구에 의해 사용된 프로모터, 개시, 중지, 신호, 분비 및/또는 종결 서열과 같은 당업계에 공지되거나 본 발명에 제공되는 임의의 조절 서열일 수 있다. 특정 예에서, 표적 DNA는 상업용 벡터(예를 들어, DNA2.0 맞춤형 또는 GATEWAY® 벡터)와 같은 임의의 저장소 또는 카탈로그 생성물로부터 얻을 수 있는 벡터, 구조체 또는 플라스미드에 삽입될 수 있다.

일부 실시태양에서, 본 발명의 조립/복제 방법은 다음 조립 전략: i) II형 통상적인 복제, ii) II형 S-매개 또는 "골든 게이트" 복제(예를 들어, Engler, C., R. Kandzia, and S. Marillonnet. 2008 "A one pot, one step, precision　cloning method with high-throughput capability". PLos One 3:e3647; Kotera, I., and T. Nagai. 2008 "A high-throughput and single-tube recombination of crude PCR products using a DNA polymerase inhibitor and type IIS　restriction enzyme." J Biotechnol 137:1-7.; Weber, E., R. Gruetzner, S. Werner, C. Engler, and S. Marillonnet. 2011 Assembly of Designer TAL Effectors by　Golden Gate　Cloning. PloS One 6:e19722 참조), iii) GATEWAY® 재조합, iv) TOPO® 복제, 엑소뉴클레아제 매개 어셈블리(Aslanidis and de Jong 1990. "Ligation-independent　cloning　of PCR products (LIC-PCR)." Nucleic Acids Research, Vol. 18, No. 20 6069), v) 상동성 재조합, vi) 비 상동성 말단 결합, vii) 깁슨 어셈블리(Gibson et al., 2009 "Enzymatic assembly of DNA molecules up to several hundred kilobases" Nature Methods 6, 343-345) 또는 이의 조합의 적어도 하나를 사용할 수 있다. 모듈형 IIS 기반 조립 전략은 PCT 공개공보 WO 2011/154147에 개시되며, 그 내용은 본 발명에 참고로 포함된다.

일부 실시태양에서, 본 발명은 하나 이상의 선별 마커를 갖는 벡터의 클로닝을 교시한다. 다양한 선택 마커 유전자는 선택적 압력하에서 원핵생물 세포(예를 들어, 암피실린, 카나마이신, 테트라사이클린, 클로람페니콜, 제오신, 스펙티노마이신/스트렙토마이신) 또는 진핵생물 세포(예컨대, 제네티신, 네오마이신, 하이그로마이신, 푸로마이신, 블라스티시딘, 제오신)에서 선택을 위한 항생제 저항을 암호화하는 것이 당업계에 주지되어 있다. 다른 마커 시스템은 성공적으로 형질유도된 숙주 세포에서 발현된 녹색 또는 적색 형광 단백질과 같은 X-gal 또는 형광 리포터(fluorescent reporter)의 존재하에서 양성 클론을 선택하기 위해 박테리아에서 사용된 주지된 청색/백색 선별 시스템과 같은 원하거나 원하지 않는 세포의 선별 및 확인을 허용한다. 대다수가 원핵생물 시스템에서만 기능하는 선택 마커의 또 다른 부류는 생산자 세포를 죽이는 독성 유전자 생성물을 발현하는 "사멸 유전자"라고도하는 역 선택가능한 마커 유전자에 관한 것이다. 이러한 유전자의 예는 sacB, rpsL (strA), tetAR, pheS, thyA, gata-1 또는 ccdB를 포함하며, 그 기능은 (Reyrat et al. 1998 "Counterselectable Markers: Untapped Tools for Bacterial Genetics and Pathogenesis." Infect Immun. 66(9): 4011-4017)에 설명된다.

원형질체화 방법

한 실시태양에서, 본 발명에 제공된 방법 및 시스템은 사상균류 세포로부터의 원형질체의 생성을 이용한다. 원형질체의 제조에 적합한 절차는 예를 들어 EP 238,023 및 Yelton et al.(1984, Proc. Natl. Acad. Sci. USA 81:1470-1474)에 기술된 것을 포함하는 당업계에 공지된 임의의 방법일 수 있다. 한 실시태양에서, 원형질체는 사상균류 세포의 배양물을 하나 이상의 용균 효소 또는 이의 혼합물로 처리함으로써 생성된다. 용균 효소는 베타-글루카나아제 및/또는 폴리갈락투로나제일 수 있다. 한 실시태양에서, 원형질체 생성용 효소 혼합물은 비노테이스트(VinoTaste) 농축물이다. 효소 처리 후, 원형질체는 예를 들어 원심분리와 같은 당업계에 공지된 방법을 사용하여 분리될 수 있다.

전 배양 및 실제 원형질화 단계는 원형질체의 수 및 형질전환 효율을 최적화하도록 변형될 수 있다. 예를 들어, 접종물 크기, 접종물 방법, 전 배양 배지, 전 배양 시간, 배양 전 온도, 혼합 조건, 세척 완충액 조성물, 희석 비, 용균 효소 처리 동안 완충제 조성물 사용된 용균 효소의 형태 및/또는 농도, 용균 효소에 의한 배양 시간, 원형질체 세척 절차 및/또는 완충액, 실제 형질전환 동안 원형질체 및/또는 폴리뉴클레오타이드 및/또는 형질전환 시약의 농도, 형질전환 동안 물리적 매개변수, 얻어진 형질전환체까지의 형질전환 이후 절차의 변형이 존재할 수 있다.

원형질체는 삼투압 안정화 완충액에 재현탁될 수 있다. 이런 완충액의 조성물은 종, 응용분야 및 필요에 따라 달라질 수 있다. 그러나, 전형적으로, 이런 완충액은 0.5 내지 2M 사이의 수크로오스, 시트레이트, 만니톨 또는 소르비톨과 같은 유기 성분을 함유한다. 더욱 바람직하게는 0.75 내지 1.5 M; 가장 바람직하게는 1M이다. 그렇지 않으면 이들 완충액은 KCl, MgSO₄, NaCl 또는 MgCl₂와 같은 무기 삼투압 안정화 성분을 0.1 내지 1.5M의 농도로 함유한다. 바람직하게는 0.2 내지 0.8M; 보다 바람직하게는 0.3 내지 0.6M, 가장 바람직하게는 0.4M이다. 가장 바람직한 안정화 완충액은 STC(소르비톨, 0.8M, CaCl₂, 25mM, 트리스, 25mM, pH 8.0) 또는 KCl- 시트레이트(KCl, 0.3-0.6M; 시트레이트, 0.2%(w/v))이다. 원형질체는 1 x 10⁵내지 1 x 10¹⁰ cells/ml 사이의 농도로 사용될 수 있다. 바람직하게는, 농도는 1 x 10⁶ 내지 1 x 10⁹이고; 보다 바람직하게는 농도는 1 x 10⁷ 내지 5 x 10⁸이고; 가장 바람직하게는 농도는 1 x 10⁸ cells/ml이다. DNA는 0.01 내지 10㎍; 바람직하게는 0.1 내지 5㎍; 보다 더 바람직하게는 0.25 내지 2㎍; 가장 바람직하게는 0.5 내지 1㎍의 농도로 사용된다. 형질감염의 효율을 높이기 위해 운반체 DNA(연어 정자 DNA 또는 비 암호화 벡터 DNA)가 형질전환 혼합물에 첨가될 수 있다.

한 실시태양에서, 생성 및 후속 분리 후에, 원형질체는 하나 이상의 동결방지제와 혼합된다. 동결방지제는 글리콜, 다이메틸 설폭사이드(DMSO), 폴리올, 당, 2-메틸-2,4-펜테인다이올(MPD), 폴리바이닐피롤리돈(PVP), 메틸셀룰로오스, C-결합 부동액 당단백질(C-AFGP) 또는 이의 조합일 수 있다. 본 발명에 제공된 방법 및 시스템에서 동결방지제로서 사용하기 위한 글리콜은 에틸렌 글리콜, 프로필렌 글리콜, 폴리프로필렌 글리콜(PEG), 글리세롤 또는 이들의 조합으로부터 선택될 수 있다. 본 발명에 제공된 방법 및 시스템에서 동결방지제로서 사용하기 위한 폴리올은 프로페인-1,2-다이올, 프로페인-1,3-다이올, 1,1,1-트리스-(하이드록시메틸)에테인(THME) 및 2-에틸-2-(하이드록시메틸)-프로페인-1,3-다이올(EHMP) 또는 이의 조합으로부터 선택될 수 있다. 본 발명에 제공된 방법 및 시스템에서 동결방지제로서 사용하기위한 당은 트레할로오스, 수크로오스, 글루코오스, 라피노오스, 덱스트로오스 또는 이의 조합으로부터 선택될 수 있다. 한 실시태양에서, 원형질체는 DMSO와 혼합된다. DMSO는 적어도, 최대, 미만, 초과, 동일 또는 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 12.5%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 또는 75% w/v 또는 v/v의 최종 농도로 원형질체와 혼합될 수 있다. 원형질체/동결방지제(예를 들어, DMSO) 혼합물은 저장 전에 미세역가 플레이트에 분배될 수 있다. 원형질체/동결방지제(예를 들어, DMSO) 혼합물은 예를 들어 -20℃ 또는 -80℃와 같이 본 발명에 제공된 바와 같이 장기간 보존(예를 들어, 몇 시간, 일(들), 주(들), 달(들), 년(들))을 위해 본 발명에 제공된 임의의 온도로 저장될 수 있다. 한 실시태양에서, 추가의 동결방지제(예를 들어, PEG)가 원형질체/DMSO 혼합물에 첨가된다. 또 다른 실시태양에서, 추가의 동결 방지제(예를 들어, PEG)는 저장 전에 원형질체/DMSO 혼합물에 첨가된다. PEG는 본 발명에 제공된 임의의 PEG일 수 있으며 본 발명에 제공된 바와 같이 임의의 농도(예를 들어, w/v 또는 v/v)로 첨가될 수 있다.

원형질체 형질전환 방법

하나의 실시태양에서, 본 발명에 제공된 방법 및 시스템은 본 발명에 기술된 바와 같이 사상균류 세포로부터 유도된 원형질체에 대한 핵산의 전달을 필요로 한다. 또 다른 실시태양에서, 본 발명에 제공된 방법 및 시스템에 의해 이용되는 형질전환은 본질적으로 고 처리량이고 및/또는 본 발명에 기술된 바와 같이 부분적으로 또는 완전히 자동화된다. 이 실시태양에 추가하여, 형질전환은 본 발명에 기술된 바와 같이 구조체 또는 발현 구조체를 미세적정 플레이트에 첨가하고 본 발명에 제공된 방법에 의해 생성된 원형질체를 미세적정 플레이트의 각 웰에 분취함으로써 수행된다. 원형질체의 형질전환/형질감염을 위한 적절한 절차는, 예를 들어, 국제 특허 출원 PCT/NL99/00618, PCT/EP99/202516, Finkelstein and Ball (eds.), Biotechnology of filamentous fungi, technology and products, Butterworth-Heinemann (1992), Bennett and Lasure (eds.) More Gene Manipulations in fungi, Academic Press (1991), Turner, in: Puhler (ed), Biotechnology, second completely revised edition, VHC (1992) protoplast fusion, 및 EP635574B에 기술된 the Ca-PEG mediated protoplast transformation에 기술된 것을 포함하는 당업계에 공지된 임의의 것일 수 있다. 대안적으로, 사상균류 숙주 세포 또는 이로부터 유도된 원형질체의 형질전환은 또한, 예를 들어 Chakraborty 및 Kapoor, Nucleic Acids Res. 18:6737(1990)에 의해 기술된 전기천공과 같은 전기천공, 예를 들어 Christiansen et al., Curr. Genet. 29:100 102 (1995); Durand et al., Curr. Genet. 31:158 161 (1997); and Barcellos et al., Can. J. Microbiol. 44:1137 1141 (1998)에 기술된 DNA의 아그로박테리움 투메파시엔스 매개 형질전환, 탄도 도입 또는 예를 들어 미국특허 제5,516,670호 및 제5,753,477호에 기술된 세포의 "자기-탄도" 형질감염에 의해 실행될 수 있다. 한 실시태양에서, 본 발명에 제공된 방법 및 시스템에서 사용되는 형질전환 절차는, 예를 들어 PEG 매개 형질전환과 같이 본 발명에 제공되는 바와 같이 고 처리량 및/또는 자동화될 수 있는 것이다.

본 발명에 기술된 방법을 사용하여 생성된 원형질체의 형질전환은 당업계에 공지된 임의의 형질전환 시약의 사용을 통해 촉진될 수 있다. 적절한 형질전환 시약은 폴리에틸렌 글리콜(PEG), FUGENE® HD(Roche), Lipofectamine® 또는 OLIGOFECTAMINE®(Invitrogen), TRANSPASS®D1(New England Biolabs), LYPOVEC® 또는 LIPOGEN®(Invivogen)으로부터 선택될 수 있다. 한 실시태양에서, PEG가 가장 바람직한 형질전환/형질감염 시약이다. PEG는 다른 분자량으로 이용할 수 있으며 다른 농도로 사용될 수 있다. 바람직하게는 PEG 4000은 10% 내지 60%, 보다 바람직하게는 20% 내지 50%, 가장 바람직하게는 30%로 사용된다. 한 실시태양에서, PEG는 본 발명에 기술된 바와 같이 저장 전에 원형질체에 첨가된다.

숙주 세포의 형질전환

일부 실시태양에서, 본 발명의 벡터는 형질전환, 형질감염, 형질도입, 바이러스 감염, 유전자 총 또는 Ti 매개 유전자 전달을 포함하는 임의의 다양한 기술을 사용하여 숙주 세포에 도입될 수 있다(Christie , PJ, and Gordon, JE, 2014 "Agrobacterium Ti Plasmids"Microbiol SPectr. 2014; 2 (6); 10.1128 참조). 특정 방법은 인산 칼슘 형질감염, DEAE-덱스트란 매개 형질감염, 리포펙션 또는 전기천공을 포함한다(Davis, L., Dibner, M., Battey, I. 1986 "Basic Methods in Molecular Biology"). 형질전환의 다른 방법은 예를 들어, 아세트산 리튬 형질전환 및 전기천공을 포함한다. 예를 들어, Gietz et al.,　Nucleic Acids Res.　27:69-74 (1992); Ito et al.,　J. Bacterol.　153:163-168 (1983); and Becker and Guarente,　Methods in Enzymology　194:182-187 (1991) 참조. 일부 실시태양에서, 형질전환된 숙주 세포는 재조합 숙주 균주로 불린다.

일부 실시태양에서, 본 발명은 본 발명의 96-웰 플레이트 로봇 플랫폼 및 액체 처리 기계를 사용하는 세포의 고 처리량 형질전환을 교시한다.

일부 실시태양에서, 본 발명은 상기한 바와 같이 하나 이상의 선택 마커로 형질전환된 세포를 선별하는 것을 교시한다. 이런 한 실시태양에서, 카나마이신 내성 마커(KanR)를 포함하는 벡터로 형질전환된 세포는 유효량의 카나마이신 항생제를 함유하는 배지 상에 덮인다. 카나마이신-레이스(kanamycin-laced) 배지에서 볼 수 있는 콜로니 형성 단위는 벡터 카세트를 게놈에 통합시킨 것으로 추정된다. 원하는 서열의 삽입은 PCR, 제한 효소 분석 및/또는 관련 삽입 위치의 서열화를 통해 확인될 수 있다.

선택된 서열의 루핑 아웃

일부 실시태양에서, 본 발명은 숙주 유기체로부터 DNA의 선택된 영역을 루핑 아웃하는 방법을 교시한다. 루핑 아웃 방법은 Nakashima et al. 2014 "Bacterial Cellular Engineering by Genome Editing and Gene Silencing." Int. J. Mol. Sci. 15(2), 2773-2793에 기술될 수 있다. 일부 실시태양에서, 본 발명은 양성 형질전환 체로부터 선택 마커를 루핑 아웃하는 것을 교시한다. 루핑 아웃 결실 기술은 당해 분야에 공지되어 있으며 (Tear et al. 2014 "Excision of Unstable Artificial Gene-Specific inverted Repeats Mediates Scar-Free Gene Deletions in Escherichia coli." Appl. Biochem. Biotech. 175:1858-1867)에 기술된다. 본 발명에서 제공된 방법에 사용된 루핑 아웃 방법은 단일-교차 상동성 재조합 또는 이중-교차 상동성 재조합을 사용하여 수행될 수 있다. 한 실시태양에서, 본 발명에 기술된 바와 같이 선택된 영역을 루핑하는 것은 본 발명에 기술된 바와 같이 단일-교차 상동성 재조합을 사용하는 것을 수반할 수 있다.

먼저, 루프 아웃 벡터가 (예를 들어 상동성 재조합, CRISPR 또는 다른 유전자 편집 기술을 통해) 숙주 유기체의 게놈 내의 선택된 표적 영역 내로 삽입된다. 한 실시태양에서, 단일-교차 상동성 재조합이 도 3에 도시된 바와 같은 원형 플라스미드 또는 벡터를 루프-인시키기 위해 원형 플라스미드 또는 벡터와 숙주 세포 게놈 사이에 사용된다. 삽입된 벡터는 현존하는 또는 숙주 서열 근처에 도입된 직접 반복체인 서열을 갖도록 디자인되어, 직접 반복체가 루핑 및 결실이 예정된 DNA의 영역에 인접하게 된다. 일단 삽입되면, 루프 아웃 플라스미드 또는 벡터는 선택 영역의 결실을 위해 역 선택될 수 있다(예를 들어, 도 4 참조; 선택 유전자에 대한 내성의 결핍).

당업자는 루프 아웃 절차의 설명이 게놈으로부터 원하지 않는 영역을 삭제하는 하나의 예시적인 방법을 나타내는 것을 인식할 것이다. 실제로, 본 발명의 방법은 CRISPR, TALENS, FOK 또는 다른 엔도뉴클레아제를 통한 유전자 편집을 포함하나 이에 제한되지 않는 게놈 결실에 대한 임의의 방법과 양립될 수 있다. 당업자는 상 동성 재조합 기술을 통해 게놈의 원하지 않는 영역을 대체할 수 있는 능력을 인식할 것이다

실시예

하기 실시예는 본 발명의 다양한 실시태양을 설명하기 위해 제공되며 어떠한 방식으로든 본 발명을 제한하려는 것은 아니다. 청구항의 범위에 의해 정의된 바와 같이, 본 발명의 취지 내에 포함되는 변경 및 다른 용도는 당업자에 의해 인식될 것이다.

아래에서 단지 독자를 돕기 위해 내용의 간략한 표가 제공된다. 이런 표의 내용의 어떤 것도 본 출원의 실시예 또는 설명의 범위를 제한하지 않는다.

[표 5.1]

실시예 부분에 대한 내용의 표

실시예 1: 코리네박테리움의 HTP 형질전환 & SNP 라이브러리 생성의 입증

이 실시예는 본 발명의 HTP 유전자 공학 방법의 실시태양를 예시한다. 숙주 세포는 다양한 크기의 다양한 SNP 서열로 형질전환되며, 모두 게놈의 다른 영역을 표적으로 한다. 결과는 본 발명의 방법이 숙주 세포의 전체 게놈을 통해 임의의 종류의 신속한 유전자 변화를 일으킬 수 있음을 입증한다.

A . 형질전환 벡터의 클로닝

다양한 SNP를 코리네박테리움 글루타미쿰(ATCC21300)로부터 무작위로 선택하고 효모 상동성 재조합 클로닝 기술을 사용하여 코리네박테리움 클로닝 벡터에 클로닝하여 "맞춤형 플라스미드 조립/복제" 섹션에 기술되고 도 3에 예시된 것과 같이 각각의 SNP가 직접 반복체 영역에 인접한 벡터를 조립하였다.

이 실시예를 위한 SNP 카세트는 0.5Kb, 1Kb, 2Kb 및 5Kb의 상동성 직접 반복체 암 길이의 범위를 포함하도록 디자인되었다. 또한, SNP 카세트는 아래에서 보다 상세히 기술하는 바와 같이, 게놈의 다양한 구별된 영역을 표적으로 하는 상동성 재조합을 위해 디자인되었다.

C. 글루타미쿰 게놈의 크기는 3,282,708 bp이다(도 9 참조). 게놈은 임의로 24개의 동일한 크기의 유전자 영역으로 나뉘었고 SNP 카세트는 24개 영역의 각각을 표적으로 하도록 디자인되었다. 따라서, 총 96개의 구별된 플라스미드를 이 실시 예를 위해 클로닝하였다(4개 상이한 삽입체 크기 x 24개 구별된 게놈 영역).

각 DNA 삽입체는 상업적으로 공급된 올리고 및 주형으로서 상기한 숙주 균주 게놈 DNA를 사용하여 상동 영역의 PCR 증폭에 의해 생산하였다. 게놈에 도입될 SNP는 올리고 꼬리에서 암호화되었다. 효모에서 상동성 재조합을 사용하여 벡터 백본에 PCR 단편을 조립하였다.

벡터 속으로 각 SNP 및 상동성 암의 클로닝을 도 6, 도 3 및 표 5에 기술된 HTP 공학 작업 흐름에 따라 수행하였다.

B. 조립된 클론의 대장균으로의 형질전환

벡터는 정확하게 조립된 클론을 확인하고 코리네박테리움 형질전환을 위한 벡터 DNA를 증폭시키기 위해 표준 열충격 형질전환 기술을 사용하여 대장균으로 처음에 형질전환시켰다.

예를 들어, 형질전환된 대장균을 조립 성공 여부에 대해 테스트하였다. 각각의 대장균 형질전환 플레이트로부터 4개의 콜로니를 배양하고 PCR을 통해 정확한 조립에 대해 테스트하였다. 이 공정을 24개의 형질전환 위치의 각각 및 4개의 상이한 삽입체 크기(즉, 이 실시예의 모든 96개의 변형물)에 대해 반복하였다. 이 실험의 결과는 각 처리(삽입체 크기 및 게놈 위치)에 대해 테스트된 4개의 콜로니 중에서 확인된 정확한 콜로니의 수로 나타내었다(도 12 참조). 더 긴 5kb 삽입체는 더 짧은 대응체(n = 96)과 비교하여 조립 효율에서 감소를 나타내었다.

C. 조립된 클론의 코리네박테리움으로의 형질전환

확인된 클론을 전기천공을 통해 코리네 박테리움 글루타미쿰 숙주 세포로 형질전환시켰다. 각각의 형질전환에 대해, DNA의 μg당 콜로니 형성 단위(CFU)의 수를 삽입체 크기의 함수로 측정하였다(도 13 참조). 코리네 게놈 통합은 또한 상동성 암 길이의 함수로 분석되었으며, 그 결과는 더 짧은 암은 더 낮은 효율을 가졌다는 것을 나타내었다(도 13 참조).

게놈 통합 효율은 또한 C. 글루타미쿰 형질전환체에서 표적화된 게놈 위치에 대해 분석하였다. 게놈 위치 1과 2는 게놈의 나머지에 비해 약간 낮은 통합 효율을 나타내었다(도 10 참조).

D. 선택 마커 루핑 아웃

삽입체 카세트의 성공적인 통합을 갖는 것으로 확인된 코리네박테리움의 배양물을 sacb 선택 유전자의 루프 아웃 선택에 대항하기 위해 5% 수크로오스를 함유하는 배지에서 배양하였다. 다양한 상동성 직접 반복체 암에 대한 수크오로스 저항 빈도는 암 길이에 따라 크게 변하지 않았다(도 14 참조). 이런 결과는 루프 아웃 효율이 0.5kb 내지 5kb의 상동성 암 길이에 걸쳐 일정하게 유지된다는 것을 암시하였다.

루프 아웃 이벤트를 추가로 검증하기 위해, 수크로오스 내성을 나타내는 콜로니를 배양하고 서열화를 통해 분석하였다.

삽입체 게놈 영역의 서열화에 대한 결과는 하기 표 6에 요약된다.

루프-아웃 평가 빈도

결과	빈도(샘플링 오차 95% 신뢰도)
성공적인 루프 아웃	13% (9%/20%)
여전히 존재하는 루프	42% (34%/50%)
혼합된 판독	44% (36%/52%)

서열화 결과는 루프 아웃에서 10-20%의 효율성을 나타내었다. 실제 루프 아웃은 아마도 삽입체 서열에 따라 다소 달라진다. 그러나 10-20개 수크오로스 내성 콜로니를 선택하면 성공률을 높인다.E. 요약

하기 표 7은 본 발명의 HTP 게놈 공학 방법의 효율에 대한 정량적인 평가를 제공한다. 효모 상동성 방법론을 위한 구조체 조립 속도는 10개의 테스트된 콜리너의 거의 9개에서 예상된 DNA 구조체를 생산하였다. 2kb의 상동성 암을 갖는 SNP 구조체의 코리네 형질전환은 DNA의 마이크로 그램 당 평균 51개의 콜로니 형성 단위 (CFU/μg)를 생산하였고, 상기 콜로니의 98%는 정확하게 통합된 SNP 삽입체를 나타내었다(표적화 효율). 루프 아웃 효율은 수크로오스에 노출될 때 저항성이 되는 세포의 0.2%에서 유지되었고, 이들의 13%가 루프 아웃된 서열을 정확하게 나타내었다.

코리네박테리움 글루타미쿰 균주 공학에 대한 요약 결과

QC 단계	2 kb 상동성 암에 대한 결과
구조체 조립 성공	87%
코리네 형질전환 효율	51 CFU/㎍ DNA (+/- 15)
표적화 효율	98%
루프 아웃 효율	0.2% (+/- 0.03%)

실시예 2: HTP 게놈 공학 - 산업용 미생물 균주를 재생/개량하기 위한 SNP 라이브러리의 실행이 실시예는 본 발명의 HTP 균주 개량 프로그램의 SNP 스왑 라이브러리의 여러 양태를 예시한다. 구체적으로, 이 실시예는 현재 존재하는 산업용 균주를 재건하기 위한 여러 계획된 접근법을 예시한다. 이 실시예는 "기본", "중간" 및 산업용 균주 사이에 존재할 수 있는 여러 유전자 차이에 의해 생성된 표현형 솔루션 공간을 탐색하는 웨이브 업 및 웨이브 다운 접근법을 기술한다.

A. 다양성 풀에서 SNP 확인

본 발명의 방법을 사용하는 예시적인 균주 개량 프로그램을 본 발명에서 "C"로 불리는 산업용 생산 미생물 균주에 대해 수행하였다. 이 프로그램에 대한 다양성 풀 균주는 A, B 및 C로 표시된다. 균주 A는 임의의 돌연변이유발 이전의 원래 생산 숙주 균주를 나타내었다. 균주 C는 전통적인 균주 개량 프로그램을 통해 수년간 돌연변이유발 및 선택을 거친 현재의 산업용 균주를 나타내었다. 균주 B는 돌연변이유발을 일으킨 "중층" 균주를 나타내며, C 균주의 전신이었다(도 17a 참조).

균주 A, B, 및 C를 서열화하고 이의 게놈을 균주 간의 유전자 차이에 대해 분석하였다. 총 332개의 비 유사 SNP를 확인하였다. 이 중, 133개의 SNP는 C에 고유한 것이고 153개는 B와 C에 의해 공유되며 46개는 B 균주에 고유하다(도 17b 참조). 이 SNP는 하류 균주 개량 사이클를 위한 다양성 풀로 사용될 것이다.

B. SNP 스와핑 분석

실시예 2의 파트 A에서 다양성 풀로부터 확인된 SNP를 분석하여 숙주 세포 성능에 대한 이들의 영향을 결정할 것이다. 균주 성능의 초기 "학습" 라운드는 아래에 설명된 6 단계로 세분화되고 도 18에 도표로 표시된다.

첫째, C로부터의 모든 SNP는 개별적으로 및/또는 조합적으로 기본 A 균주 내로 클로닝될 것이다. 이것은 최소 286개 개별 형질전환체를 나타낼 것이다. 이 형질전환체의 목적은 유익한 SNP를 확인하는 것이 될 것이다.

둘째, C로부터의 모든 SNP는 상업적 균주 C로부터 개별적으로 및/또는 조합 적으로 제거될 것이다. 이것은 최소 286개의 개별 형질전환체를 나타낼 것이다. 이런 형질전환체의 목적은 중립적 및 해로운 SNP를 확인하는 것이 될 것이다. 추가 선택적 단계 3-6은 아래에 기술된다. 2개의 유전자 시점(기본 균주 A 및 산업용 균주 C)으로부터 SNPS를 첨가 및 제거하는 제 1 및 제 2 단계는 "웨이브 업"(기본 균주에 대한 SNP의 첨가, 첫 번째 단계) 및 "웨이브 다운"(산업용 균주로부터 SNP 제거, 두 번째 단계)를 포함하는 "웨이브"로 본 발명에서 불린다. 웨이브 개념은 SNPS의 추가 첨가/제거로 확장된다.

셋째, B로부터의 모든 SNP는 개별적으로 및/또는 조합적으로 기본 A 균주 내로 클로닝될 것이다. 이것은 최소 199개의 개별 형질전환체를 나타낼 것이다. 이런 형질전환체의 목적은 유익한 SNP를 확인하는 것이 될 것다. 형질전환체의 일부는 첫 번째 단계에서 생산된 형질전환체에 대한 검증 데이터로서 사용될 것이다.

넷째, B로부터의 모든 SNP는 상업적 균주 B로부터 개별적으로 및/또는 조합 적으로 제거될 것이다. 이것은 최소 199개의 개별 형질전환체를 나타낼 것이다. 이 형질전환체의 목적은 중립적 및 해로운 SNP를 확인하는 것이 될 것이다. 형질전환체의 일부는 두 번째 단계에서 생산된 형질전환체에 대한 검증 데이터로서 사용될 것이다.

다섯째, C에 고유한 모든 SNP(즉, B에 존재하지 않음)는 상업용 B 균주 내로 개별적으로 및 /또는 조합적으로 클로닝될 것이다. 이것은 최소 46개의 개별 형질전환체를 나타낼 것이다. 이 형질전환체의 목적은 유익한 SNP를 확인하는 것이 될 것이다. 형질전환체의 일부는 첫 번째 및 세 번째 단계에서 생산된 형질전환체에 대한 검증 데이터로서 사용될 것이다.

여섯째, C에 고유한 모든 SNP는 상업용 균주 C로부터 개별적으로 및/또는 조합적으로 제거될 것이다. 이것은 최소 46개의 개별 형질전환체를 나타낼 것이다. 이 형질전환체의 목적은 중립적 및 해로운 SNP를 확인하는 것이 될 것이다. 형질전환체의 일부는 두 번째 및 네 번째 단계에서 생산된 형질전환체에 대한 검증 데이터로서 사용될 것이다.

이들 각각의 단계로부터 수집된 데이터는 유익한, 중립적인 또는 유해한 것으로 각 SNP를 분류하는데 사용된다.

C. 유익한 SNP 조합을 결정하기 위한 상위성 매핑의 사용

실시예 2의 파트 B에서 확인된 유익한 SNP는 결합시 숙주 성능을 개량시킬 가능성이 있는 SNP를 확인하기 위해 본 발명의 상위성 매핑 방법을 통해 분석될 것이다.

새로운 조작된 균주 변형체는 상위성 매핑 예측에 따라 SNP 조합을 테스트하기 위해 실시예 1의 공학 방법을 사용하여 생성될 것이다. SNPs 통합은 순차적으로 발생할 수 있으며, 또는 다중 가지에 걸쳐 대안으로적 발생할 수 있으므로 하나 이상의 개량된 균주가 유익한 SNP의 서브세트와 함께 존재할 수 있다. 중립적 또는 해로운 SNP 수하물 없이 유익한 SNP의 최적 조합을 함유하는 최종 균주가 생산될 때까지, SNP 통합은 여러 균주 개량 라운드 동안 지속될 것이다

실시예 3: HTP 게놈 공학 - 코리네박테리움에서 라이신 생산의 균주 성능을 개량시키는 SNP 스왑 라이브러리의 실행

이 실시예는 코리네박테리움에서의 라이신 생산의 수율 및 생산성 향상을 목적으로 실시예 2의 SNP 스왑 HTP 디자인 균주 개량 프로그램의 일부의 예시적인 실행을 제공한다.

이 실시예의 섹션 B는 본 발명의 HTP 균주 개량 프로그램의 돌연변이 통합 단계를 추가로 예시한다. 따라서, 본 실시예는 본 발명의 HTP 균주 개량 방법의 제 1, 제 2 및 제 3 라운드 통합에 대한 실험 결과를 제공한다.

제 2 및 제 3 라운드 통합에 대한 돌연변이는 개별 유전자 라이브러리 스왑으로부터 유도된다. 따라서 이런 결과는 다중 가지 병렬 트랙이 수행될 HTP 변형 프로그램에 대한 능력 및 본 발명의 유전자 디자인 라이브러리의 다양한 형태와 관련된 메타 데이터 속에 삽입될 수 있는 유익한 돌연변이의 "메모리"를 예시한다.

상기한 바와 같이, 제공된 기본 참고 균주(균주 A) 및 제 2 "조작된" 균주(균주 C)의 게놈을 서열화하고 모든 유전자 차이를 확인하였다. 기본 균주는 UV 돌연변이유발을 거치지 않은 코리네박테리움 글루타미쿰 변이체이었다. 조작된 균주는 전통적인 돌연변이 개량 프로그램의 여러 라운드 후 기본 균주로부터 생산된 C. 글루타미쿰 균주이었다. 이 실시예는 균주 A와 C 사이에서 확인된 186개의 구별된 비 유사한 SNP 차이에 대한 SNP 스왑 결과를 제공한다.

A. HTP 공학 및 고 처리량 선별

본 발명의 클로닝 및 형질전환 방법에 따라, 186개의 확인된 SNP 각각을 개별적으로 다시 기본 균주에 첨가하였다. 단일 SNP를 포함하는 각각의 새롭게 생성된 균주를 생성물 역가 성능을 평가하도록 디자인된 소규모 배양물에서 라이신 수율에 대해 테스트하였다. 소규모 배양은 산업용 규모의 배양 배지를 사용하여 수행하였다. 생성물 역가는 표준 비색 분석법으로 탄소 배출(즉, 단일 배치 수율을 나타냄)시 광학적으로 측정되었다. 간단히, 농축 분석 혼합물을 제조하고 발효 샘플에 첨가하여서 시약의 최종 농도는 160 mM 인산 나트륨 완충액, 0.2 mM Amplex Red, 0.2 U/mL 호오스래디쉬 퍼옥시다아제(Horseradish Peroxidase) 및 및 0.005U/mL 라이신 옥시다제이었다. 반응을 종점으로 진행시키고 560nm 파장에서 Tecan M1000 플레이트 분광 광도계를 사용하여 광학 밀도를 측정하였다. 실험 결과는 아래 표 8에 요약되어 있으며 도 38에 도시된다.

라이신 생산을 위한 SNP 스왑 균주 공학에 대한 요약 결과

SNP	N	평균 라이신 수율 (기준 균주와 비교된 A ₅₆₀ 의 변화)	표준 오차	기준에 대한 % 변화	% 변화 오차
DSS_033	4	0.1062	0.00888	11.54348	2.895652
DSS_311	2	0.03603	0.01256	3.916304	4.095652
DSS_350	1	0.03178	0.01777	3.454348	5.794565
DSS_056	3	0.02684	0.01026	2.917391	3.345652
DSS_014	4	0.02666	0.00888	2.897826	2.895652
DSS_338	3	0.02631	0.01026	2.859783	3.345652
DSS_128	1	0.02584	0.01777	2.808696	5.794565
DSS_038	4	0.02467	0.00888	2.681522	2.895652
DSS_066	4	0.02276	0.00888	2.473913	2.895652
DSS_108	2	0.02216	0.01256	2.408696	4.095652
DSS_078	4	0.02169	0.00888	2.357609	2.895652
DSS_017	3	0.02102	0.01026	2.284783	3.345652
DSS_120	3	0.01996	0.01026	2.169565	3.345652
DSS_064	4	0.01889	0.00888	2.053261	2.895652
DSS_380	4	0.01888	0.00888	2.052174	2.895652
DSS_105	3	0.0184	0.01026	2	3.345652
DSS_407	1	0.01831	0.01777	1.990217	5.794565
DSS_018	2	0.01825	0.01256	1.983696	4.095652
DSS_408	3	0.01792	0.01026	1.947826	3.345652
DSS_417	3	0.01725	0.01026	1.875	3.345652
DSS_130	3	0.01724	0.01026	1.873913	3.345652
DSS_113	4	0.0172	0.00888	1.869565	2.895652
DSS_355	3	0.01713	0.01026	1.861957	3.345652
DSS_121	3	0.01635	0.01026	1.777174	3.345652
DSS_097	2	0.0162	0.01256	1.76087	4.095652
DSS_107	3	0.01604	0.01026	1.743478	3.345652
DSS_110	2	0.01524	0.01256	1.656522	4.095652
DSS_306	4	0.01501	0.00888	1.631522	2.895652
DSS_316	1	0.01469	0.01777	1.596739	5.794565
DSS_325	4	0.01436	0.00888	1.56087	2.895652
DSS_016	4	0.01416	0.00888	1.53913	2.895652
DSS_324	4	0.01402	0.00888	1.523913	2.895652
DSS_297	4	0.01391	0.00888	1.511957	2.895652
DSS_118	2	0.01371	0.01256	1.490217	4.095652
DSS_100	2	0.01326	0.01256	1.441304	4.095652
DSS_019	1	0.01277	0.01777	1.388043	5.794565
DSS_131	3	0.01269	0.01026	1.379348	3.345652
DSS_394	4	0.01219	0.00888	1.325	2.895652
DSS_385	3	0.01192	0.01026	1.295652	3.345652
DSS_395	1	0.01162	0.01777	1.263043	5.794565
DSS_287	4	0.01117	0.00888	1.21413	2.895652
DSS_418	2	0.01087	0.01256	1.181522	4.095652
DSS_290	3	0.01059	0.01026	1.151087	3.345652
DSS_314	2	0.01036	0.01256	1.126087	4.095652
DSS_073	4	0.00986	0.00888	1.071739	2.895652
DSS_040	4	0.00979	0.00888	1.06413	2.895652
DSS_037	4	0.00977	0.00888	1.061957	2.895652
DSS_341	1	0.00977	0.01777	1.061957	5.794565
DSS_302	4	0.00939	0.00888	1.020652	2.895652
DSS_104	4	0.00937	0.00888	1.018478	2.895652
DSS_273	2	0.00915	0.01256	0.994565	4.095652
DSS_322	4	0.00906	0.00888	0.984783	2.895652
DSS_271	3	0.00901	0.01026	0.979348	3.345652
DSS_334	2	0.00898	0.01256	0.976087	4.095652
DSS_353	4	0.00864	0.00888	0.93913	2.895652
DSS_391	4	0.00764	0.00888	0.830435	2.895652
DSS_372	1	0.00737	0.01777	0.801087	5.794565
DSS_007	1	0.00729	0.01777	0.792391	5.794565
DSS_333	2	0.0072	0.01256	0.782609	4.095652
DSS_402	4	0.00718	0.00888	0.780435	2.895652
DSS_084	1	0.0069	0.01777	0.75	5.794565
DSS_103	3	0.00676	0.01026	0.734783	3.345652
DSS_362	1	0.00635	0.01777	0.690217	5.794565
DSS_012	2	0.00595	0.01256	0.646739	4.095652
DSS_396	2	0.00574	0.01256	0.623913	4.095652
DSS_133	3	0.00534	0.01026	0.580435	3.345652
DSS_065	3	0.00485	0.01026	0.527174	3.345652
DSS_284	2	0.00478	0.01256	0.519565	4.095652
DSS_301	3	0.00465	0.01026	0.505435	3.345652
DSS_281	4	0.00461	0.00888	0.501087	2.895652
DSS_405	2	0.00449	0.01256	0.488043	4.095652
DSS_361	3	0.00438	0.01026	0.476087	3.345652
DSS_342	4	0.00434	0.00888	0.471739	2.895652
DSS_053	3	0.00422	0.01026	0.458696	3.345652
DSS_074	4	0.00422	0.00888	0.458696	2.895652
DSS_079	4	0.00375	0.00888	0.407609	2.895652
DSS_381	3	0.0036	0.01026	0.391304	3.345652
DSS_294	1	0.00336	0.01777	0.365217	5.794565
DSS_313	2	0.00332	0.01256	0.36087	4.095652
DSS_388	2	0.00305	0.01256	0.331522	4.095652
DSS_392	4	0.00287	0.00888	0.311957	2.895652
DSS_319	4	0.00282	0.00888	0.306522	2.895652
DSS_310	4	0.00263	0.00888	0.28587	2.895652
DSS_344	3	0.00259	0.01026	0.281522	3.345652
DSS_025	4	0.00219	0.00888	0.238043	2.895652
DSS_412	1	0.00204	0.01777	0.221739	5.794565
DSS_300	3	0.00188	0.01026	0.204348	3.345652
DSS_299	2	0.00185	0.01256	0.201087	4.095652
DSS_343	4	0.00184	0.00888	0.2	2.895652
DSS_330	3	0.00153	0.01026	0.166304	3.345652
DSS_416	4	0.00128	0.00888	0.13913	2.895652
DSS_034	3	0.00128	0.01026	0.13913	3.345652
DSS_291	2	0.00102	0.01256	0.11087	4.095652
DSS_115	4	0.00063	0.00888	0.068478	2.895652
DSS_288	4	0.00044	0.00888	0.047826	2.895652
DSS_309	4	0.00008	0.00888	0.008696	2.895652
DSS_125	3	0	0.01026	0	3.345652
DSS_358	3	-0.00015	0.01026	-0.0163	3.345652
DSS_099	2	-0.00015	0.01256	-0.0163	4.095652
DSS_111	4	-0.00017	0.00888	-0.01848	2.895652
DSS_359	3	-0.00022	0.01026	-0.02391	3.345652
DSS_015	4	-0.00043	0.00888	-0.04674	2.895652
DSS_060	3	-0.0007	0.01026	-0.07609	3.345652
DSS_098	2	-0.00088	0.01256	-0.09565	4.095652
DSS_379	4	-0.00089	0.00888	-0.09674	2.895652
DSS_356	4	-0.0009	0.00888	-0.09783	2.895652
DSS_278	4	-0.00095	0.00888	-0.10326	2.895652
DSS_368	4	-0.001	0.00888	-0.1087	2.895652
DSS_351	1	-0.0015	0.01777	-0.16304	5.794565
DSS_296	1	-0.0015	0.01777	-0.16304	5.794565
DSS_119	3	-0.00156	0.01026	-0.16957	3.345652
DSS_307	3	-0.00163	0.01026	-0.17717	3.345652
DSS_077	4	-0.00167	0.00888	-0.18152	2.895652
DSS_030	3	-0.00188	0.01026	-0.20435	3.345652
DSS_370	2	-0.00189	0.01256	-0.20543	4.095652
DSS_375	2	-0.00212	0.01256	-0.23043	4.095652
DSS_280	3	-0.00215	0.01026	-0.2337	3.345652
DSS_345	4	-0.00225	0.00888	-0.24457	2.895652
DSS_419	1	-0.00234	0.01777	-0.25435	5.794565
DSS_298	2	-0.00249	0.01256	-0.27065	4.095652
DSS_367	3	-0.0026	0.01026	-0.28261	3.345652
DSS_072	3	-0.00268	0.01026	-0.2913	3.345652
DSS_366	4	-0.00272	0.00888	-0.29565	2.895652
DSS_063	4	-0.00283	0.00888	-0.30761	2.895652
DSS_092	3	-0.00292	0.01026	-0.31739	3.345652
DSS_347	4	-0.0033	0.00888	-0.3587	2.895652
DSS_114	4	-0.0034	0.00888	-0.36957	2.895652
DSS_303	3	-0.00396	0.01026	-0.43043	3.345652
DSS_276	4	-0.00418	0.00888	-0.45435	2.895652
DSS_083	1	-0.00446	0.01777	-0.48478	5.794565
DSS_031	2	-0.00456	0.01256	-0.49565	4.095652
DSS_328	3	-0.00463	0.01026	-0.50326	3.345652
DSS_039	4	-0.00475	0.00888	-0.5163	2.895652
DSS_331	4	-0.00475	0.00888	-0.5163	2.895652
DSS_117	4	-0.00485	0.00888	-0.52717	2.895652
DSS_382	4	-0.00506	0.00888	-0.55	2.895652
DSS_323	4	-0.00507	0.00888	-0.55109	2.895652
DSS_041	2	-0.00527	0.01256	-0.57283	4.095652
DSS_069	4	-0.00534	0.00888	-0.58043	2.895652
DSS_308	3	-0.00534	0.01026	-0.58043	3.345652
DSS_365	3	-0.00536	0.01026	-0.58261	3.345652
DSS_403	3	-0.00594	0.01026	-0.64565	3.345652
DSS_376	1	-0.00648	0.01777	-0.70435	5.794565
DSS_293	3	-0.00652	0.01026	-0.7087	3.345652
DSS_286	1	-0.00672	0.01777	-0.73043	5.794565
BS.2C	139	-0.00694	0.00151	-0.75435	0.492391
DSS_410	1	-0.00724	0.01777	-0.78696	5.794565
DSS_312	2	-0.00725	0.01256	-0.78804	4.095652
DSS_336	1	-0.00747	0.01777	-0.81196	5.794565
DSS_327	2	-0.00748	0.01256	-0.81304	4.095652
DSS_127	4	-0.00801	0.00888	-0.87065	2.895652
DSS_332	3	-0.0085	0.01026	-0.92391	3.345652
DSS_054	2	-0.00887	0.01256	-0.96413	4.095652
DSS_024	2	-0.00902	0.01256	-0.98043	4.095652
DSS_106	3	-0.0096	0.01026	-1.04348	3.345652
DSS_400	4	-0.00964	0.00888	-1.04783	2.895652
DSS_346	3	-0.00976	0.01026	-1.06087	3.345652
DSS_320	1	-0.01063	0.01777	-1.15543	5.794565
DSS_275	4	-0.01066	0.00888	-1.1587	2.895652
DSS_371	3	-0.01111	0.01026	-1.20761	3.345652
DSS_277	1	-0.01315	0.01777	-1.42935	5.794565
DSS_282	3	-0.01326	0.01026	-1.4413	3.345652
DSS_393	3	-0.01379	0.01026	-1.49891	3.345652
DSS_378	3	-0.01461	0.01026	-1.58804	3.345652
DSS_289	3	-0.01563	0.01026	-1.69891	3.345652
DSS_317	1	-0.01565	0.01777	-1.70109	5.794565
DSS_062	4	-0.01626	0.00888	-1.76739	2.895652
DSS_340	1	-0.01657	0.01777	-1.80109	5.794565
DSS_109	2	-0.01706	0.01256	-1.85435	4.095652
DSS_011	2	-0.0178	0.01256	-1.93478	4.095652
DSS_089	4	-0.01844	0.00888	-2.00435	2.895652
DSS_059	1	-0.01848	0.01777	-2.0087	5.794565
DSS_112	2	-0.01959	0.01256	-2.12935	4.095652
DSS_043	2	-0.0213	0.01256	-2.31522	4.095652
DSS_413	1	-0.02217	0.01777	-2.40978	5.794565
DSS_305	4	-0.0227	0.00888	-2.46739	2.895652
DSS_045	4	-0.02289	0.00888	-2.48804	2.895652
DSS_082	2	-0.0231	0.01256	-2.51087	4.095652
DSS_272	1	-0.02311	0.01777	-2.51196	5.794565
DSS_390	4	-0.02319	0.00888	-2.52065	2.895652
DSS_010	3	-0.02424	0.01026	-2.63478	3.345652
DSS_357	2	-0.02525	0.01256	-2.74457	4.095652
DSS_085	4	-0.03062	0.00888	-3.32826	2.895652
DSS_044	3	-0.04088	0.01026	-4.44348	3.345652
DSS_315	2	-0.0501	0.01256	-5.44565	4.095652
DSS_080	2	-0.13519	0.01256	-14.6946	4.095652

B. 두 번째 라운드 HTP 공학 및 고 처리량 선별 - 선택된 PRO 스왑 히트와 SNP 스왑 라이브러리의 통합본 발명의 HTP 방법의 장점 중 하나는 각 SNP/프로모터/터미네이터/개시 코돈의 숙주 세포 표현형에 대한 영향과 관련된 정보와 함께 HTP 유전 디자인 라이브러리를 저장하는 능력이다. 본 발명자들은 생합성 수율에 긍정적인 영향을 가진 C. 글루타미쿰에서 몇 가지 zwf 프로모터 스왑을 확인한 프로모터 스왑 실험을 이전에 수행하였다(도 22의 표적 "N"에 대한 결과 참조).

본 발명자들은 실시예 5로부터의 이전에 확인된 zwf 프로모터 스왑 중의 하나를 또한 포함하도록 본 실시예의 기본 균주 A를 변형시켰다. 표 8에서 상기한 초기 선별로부터 확인된 상위 176개의 SNP를 이 새로운 기본 균주 속에 재도입하여 새로운 SNP 스왑 유전자 디자인 미생물 라이브러리를 생성하였다. 이전 단계에서와 같이, 단일 SNP를 포함하는 각각 새로 생성된 균주를 라이신 수율에 대해 테스트하였다. 선택된 SNP 돌연변이체 균주는 상기한 비색 방법을 사용하여 24시간에서 라이신 생산을 측정함으로써 생산성 프록시에 대해 테스트하였다. 이 단계의 결과는 아래 표 9에 요약되어 있으며 도 39에 도시된다.

라이신 생산을 위한 SNP 스왑 균주 공학을 위한 2차 라운드 선별

균주 ID	SNP	24hr 동안 N	96hr 동안 N	평균 24hr (A ₅₆₀ )	평균 96hr (A ₅₆₀ )	표준 오차 24hr	표준 오차 96hr
7000006318	BS2C_P0007_39zwf	20	2	0.49	0.82	0.00	0.02
7000008538	DSS_002	4	2	0.53	0.78	0.01	0.02
7000008539	DSS_003	4		0.56		0.01
7000008541	DSS_005	4		0.27		0.01
7000008542	DSS_006	4		0.49		0.01
7000008547	DSS_011	4		0.55		0.01
7000008548	DSS_012	4		0.58		0.01
7000008549	DSS_013	4		0.56		0.01
7000008550	DSS_014	4		0.52		0.01
7000008551	DSS_015	4		0.54		0.01
7000008552	DSS_016	4	2	0.50	0.84	0.01	0.02
7000008553	DSS_017	4		0.44		0.01
7000008555	DSS_019	4	4	0.46	0.84	0.01	0.01
7000008557	DSS_021	4	4	0.46	0.86	0.01	0.01
7000008559	DSS_023	4	2	0.55	0.86	0.01	0.02
7000008561	DSS_025	4		0.54		0.01
7000008562	DSS_026	2		0.46		0.01
7000008564	DSS_028	4		0.51		0.01
7000008565	DSS_029	4	4	0.48	0.87	0.01	0.01
7000008566	DSS_030	4	4	0.47	0.85	0.01	0.01
7000008567	DSS_031	4		0.56		0.01
7000008569	DSS_033	4	4	0.46	0.86	0.01	0.01
7000008570	DSS_034	2	2	0.53	0.85	0.01	0.02
7000008573	DSS_037	4		0.54		0.01
7000008574	DSS_038	4		0.53		0.01
7000008575	DSS_039	4		0.55		0.01
7000008576	DSS_040	4		0.57		0.01
7000008577	DSS_041	4		0.45		0.01
7000008578	DSS_042	4	4	0.52	0.87	0.01	0.01
7000008579	DSS_043	4	4	0.45	0.87	0.01	0.01
7000008580	DSS_044	4	2	0.50	0.85	0.01	0.02
7000008581	DSS_045	4		0.47		0.01
7000008582	DSS_046	4	2	0.61	0.85	0.01	0.02
7000008583	DSS_047	4	2	0.61	0.82	0.01	0.02
7000008586	DSS_050	4		0.57		0.01
7000008587	DSS_051	4		0.56		0.01
7000008588	DSS_052	4	2	0.49	0.85	0.01	0.02
7000008589	DSS_053	4	4	0.45	0.85	0.01	0.01
7000008590	DSS_054	4	4	0.45	0.88	0.01	0.01
7000008592	DSS_056	4		0.42		0.01
7000008596	DSS_060	4	2	0.55	0.87	0.01	0.02
7000008597	DSS_061	4	2	0.37	0.86	0.01	0.02
7000008598	DSS_062	4	4	0.45	0.87	0.01	0.01
7000008601	DSS_065	4	4	0.47	0.88	0.01	0.01
7000008602	DSS_066	4		0.47		0.01
7000008604	DSS_068		2		0.51		0.02
7000008605	DSS_069	4	4	0.47	0.88	0.01	0.01
7000008606	DSS_070	4		0.55		0.01
7000008607	DSS_071	4	2	0.56	0.84	0.01	0.02
7000008608	DSS_072	4	2	0.54	0.83	0.01	0.02
7000008609	DSS_073	4	2	0.47	0.84	0.01	0.02
7000008610	DSS_074	4	2	0.51	0.83	0.01	0.02
7000008612	DSS_076	4	4	0.48	0.76	0.01	0.01
7000008613	DSS_077	4	4	0.46	0.87	0.01	0.01
7000008614	DSS_078	4	2	0.44	0.87	0.01	0.02
7000008615	DSS_079	4	2	0.47	0.90	0.01	0.02
7000008616	DSS_080	4	2	0.48	0.81	0.01	0.02
7000008619	DSS_083	4	2	0.59	0.86	0.01	0.02
7000008620	DSS_084	4	2	0.70	0.89	0.01	0.02
7000008621	DSS_085	4	4	0.49	0.89	0.01	0.01
7000008622	DSS_086	4	2	0.48	0.82	0.01	0.02
7000008624	DSS_088	4	2	0.47	0.88	0.01	0.02
7000008625	DSS_089	4	4	0.45	0.89	0.01	0.01
7000008626	DSS_090	4	4	0.47	0.87	0.01	0.01
7000008627	DSS_091	4		0.46		0.01
7000008629	DSS_093	4	4	0.50	0.87	0.01	0.01
7000008630	DSS_094	4	2	0.57	0.86	0.01	0.02
7000008634	DSS_098	4	2	0.53	0.85	0.01	0.02
7000008636	DSS_100	4		0.52		0.01
7000008637	DSS_101	4	2	0.49	0.85	0.01	0.02
7000008640	DSS_104	4	2	0.51	0.84	0.01	0.02
7000008645	DSS_109	4		0.51		0.01
7000008646	DSS_110	4	2	0.57	0.86	0.01	0.02
7000008648	DSS_112	4	2	0.54	0.86	0.01	0.02
7000008651	DSS_115	4		0.49		0.01
7000008652	DSS_116	4	2	0.52	0.82	0.01	0.02
7000008653	DSS_117	4	2	0.50	0.84	0.01	0.02
7000008657	DSS_121	4	2	0.78	0.88	0.01	0.02
7000008659	DSS_123	4		0.54		0.01
7000008663	DSS_127	4		0.58		0.01
7000008665	DSS_129	4		0.48		0.01
7000008666	DSS_130	4		0.56		0.01
7000008669	DSS_133	4		0.50		0.01
7000008670	DSS_271	4	2	0.52	0.86	0.01	0.02
7000008672	DSS_273	4		0.56		0.01
7000008677	DSS_278	2		0.46		0.01
7000008678	DSS_279	4		0.55		0.01
7000008681	DSS_282	4		0.51		0.01
7000008683	DSS_284	4		0.59		0.01
7000008684	DSS_285	4		0.51		0.01
7000008685	DSS_286	4		0.56		0.01
7000008687	DSS_288	4		0.46		0.01
7000008688	DSS_289	4		0.57		0.01
7000008689	DSS_290	4		0.47		0.01
7000008693	DSS_294	4	2	0.52	0.63	0.01	0.02
7000008696	DSS_297	4	2	0.52	0.86	0.01	0.02
7000008697	DSS_298	4		0.58		0.01
7000008699	DSS_300	4		0.48		0.01
7000008700	DSS_301	4		0.58		0.01
7000008701	DSS_302	4		0.47		0.01
7000008702	DSS_303	3		0.46		0.01
7000008703	DSS_304	3		0.48		0.01
7000008705	DSS_306	4	2	0.53	0.80	0.01	0.02
7000008708	DSS_309	4		0.56		0.01
7000008709	DSS_310	4		0.56		0.01
7000008711	DSS_312	4		0.55		0.01
7000008712	DSS_313	4		0.51		0.01
7000008718	DSS_319	4	2	0.50	0.82	0.01	0.02
7000008720	DSS_321	4		0.56		0.01
7000008722	DSS_323	2	2	0.48	0.85	0.01	0.02
7000008723	DSS_324	4		0.55		0.01
7000008724	DSS_325	4		0.50		0.01
7000008725	DSS_326	3		0.46		0.01
7000008726	DSS_327	3		0.47		0.01
7000008730	DSS_331	4		0.56		0.01
7000008731	DSS_332	4	4	0.47	0.89	0.01	0.01
7000008732	DSS_333	4	4	0.47	0.87	0.01	0.01
7000008733	DSS_334	4		0.45		0.01
7000008734	DSS_335	2		0.47		0.01
7000008735	DSS_336	4		0.47		0.01
7000008739	DSS_340	4		0.46		0.01
7000008740	DSS_341	4	2	0.46	0.89	0.01	0.02
7000008741	DSS_342	4		0.56		0.01
7000008742	DSS_343	4		0.55		0.01
7000008743	DSS_344	4	4	0.48	0.87	0.01	0.01
7000008746	DSS_347	4	4	0.48	0.85	0.01	0.01
7000008747	DSS_348	4	4	0.46	0.86	0.01	0.01
7000008749	DSS_350	4	2	0.29	0.74	0.01	0.02
7000008752	DSS_353	4	2	0.46	0.85	0.01	0.02
7000008753	DSS_354	4	4	0.45	0.87	0.01	0.01
7000008755	DSS_356	4	4	0.46	0.86	0.01	0.01
7000008756	DSS_357	4	4	0.46	0.86	0.01	0.01
7000008758	DSS_359	2	2	0.45	0.85	0.01	0.02
7000008760	DSS_361	4	2	0.46	0.84	0.01	0.02
7000008761	DSS_362	4		0.44		0.01
7000008763	DSS_364	4		0.44		0.01
7000008764	DSS_365	4		0.46		0.01
7000008765	DSS_366	4		0.55		0.01
7000008766	DSS_367	4		0.55		0.01
7000008767	DSS_368	4	2	0.44	0.86	0.01	0.02
7000008770	DSS_371	4	2	0.47	0.88	0.01	0.02
7000008771	DSS_372	4	2	0.46	0.83	0.01	0.02
7000008772	DSS_373	4	2	0.46	0.88	0.01	0.02
7000008774	DSS_375	4		0.45		0.01
7000008776	DSS_377	4		0.45		0.01
7000008777	DSS_378	4		0.57		0.01
7000008778	DSS_379	4		0.54		0.01
7000008779	DSS_380	4	2	0.46	0.87	0.01	0.02
7000008781	DSS_382	4	2	0.46	0.84	0.01	0.02
7000008782	DSS_383	4		0.48		0.01
7000008783	DSS_384	4	2	0.47	0.82	0.01	0.02
7000008784	DSS_385	4	2	0.46	0.83	0.01	0.02
7000008786	DSS_387	3		0.43		0.01
7000008787	DSS_388	3		0.47		0.01
7000008788	DSS_389	4	2	0.46	0.89	0.01	0.02
7000008790	DSS_391	4		0.57		0.01
7000008791	DSS_392	4		0.44		0.01
7000008795	DSS_396	4	2	0.46	0.82	0.01	0.02
7000008799	DSS_400	4		0.47		0.01
7000008800	DSS_401	4	2	0.46	0.86	0.01	0.02
7000008801	DSS_402	4		0.54		0.01
7000008805	DSS_406	4	2	0.47	0.85	0.01	0.02
7000008807	DSS_408	4		0.45		0.01
7000008810	DSS_411	4	2	0.46	0.87	0.01	0.02
7000008812	DSS_413	3		0.47		0.01
7000008813	DSS_414	4	2	0.45	0.84	0.01	0.02
7000008815	DSS_416	4	2	0.45	0.87	0.01	0.02
7000008816	DSS_417	4		0.46		0.01
7000008818	DSS_419	4	2	0.47	0.84	0.01	0.02
7000008820	DSS_421	4	2	0.45	0.79	0.01	0.02
7000008821	DSS_422	4		0.44		0.01

이 2차 라운드의 SNP 스왑의 결과는 기본 균주 수율 및 zwf 프로모터 스왑 돌연변이를 포함하는 기본 균주에서 라이신의 생산성을 증가시킬 수 있는 몇 가지 SNP를 확인하였다(예를 들어, 도 39의 오른쪽 위 코너의 SNP 084 및 SNP 121 참조).C. 탱크 배양 검증

상기 HTP 단계 동안 확인된 상위 SNP를 함유하는 균주를 중간 크기 테스트 발효 탱크 속에 배양하였다. 간단히 말해서, 각 균주의 작은 100ml 배양물을 밤 동안 성장시켰고, 테스트 발효 탱크에서 5 리터 배양물을 동일한 양의 접종물과 접종하는데 사용하였다. OD600 측정 후에 동일한 세포 밀도를 포함하도록 접종물을 표준화하였다.

생성된 탱크 배양물을 채취하기 전에 3일 동안 진행시켰다. 수율 및 생산성 측정은 발효를 통해 다양한 지점에서 탱크에서 채취한 시료에서 기질 및 생성물 역가로부터 계산하였다. 샘플은 적절한 표준을 사용하여 고압 액체 크로마토 그래피에 의해 특정 소분자 농도에 대해 분석되었다. 이 실험의 결과는 아래 표 10에 요약되어 있으며 도 40에 도시된다.

SNP 스왑 미생물의 탱크 검증

균주	N	평균 수율 ( % )(생산된 라이신 g/소비된 글루코오스 g)	표준 오차	평균 생산성 (g/L/h)	표준 오차
기본 균주	1	41.1502	0.59401	3.29377	0.24508
기본 균주 + zwf	7	48.2952	0.22451	2.73474	0.10005
기본 균주 + zwf + SNP121	2	50.325	0.42003	4.51397	0.1733
기본 균주 + zwf + pyc + lysA	5	52.191	0.26565	4.15269	0.12254

소규모 고 처리량 배양에 의해 예측된 바와 같이, 조합된 zwf 프로모터 스왑 및 SNP 121을 포함하는 균주에 대한 보다 큰 탱크 배양물은 기본 기준 균주에 비해 수율 및 생산성에서 현저한 증가를 나타내었다. 예를 들어 이 균주의 생산성은 기본 균주의 생산성 3.29g/L/h와 비교하여 4.5g/L/h로 상승하였다(단지 2 라운드의 SNP 스왑에서 생산성 37.0% 증가).실시예 4: HTP 게놈 공학 - 산업용 미생물 균주를 개량하기 위한 프로모터 스왑 라이브러리의 실행

이전의 실시예는 산업용 균주의 재건을 위한 본 발명의 HTP 균주 개량 프로그램의 능력을 입증하였다. 실시예 2 및 3은 다양한 기본, 중간 및 산업용 균주 내에서 기존 유전자 다양성을 탐구하는 SNP 스왑 기술 및 라이브러리의 실행을 기술하였다

이 실시예는 본 발명의 PRO 스왑 기술을 사용하는 HTP 균주 개량 프로그램의 실시태양을 도시한다. 실시예 3과는 달리, 이 실시예는 PRO 스왑 라이브러리 생성을 통한 새로운 돌연변이 생성을 위한 방법을 교시한다.

A. 프로모터 스와핑을 위한 표적의 확인

상기한 바와 같이, 프로모터 스와핑은 표적에 대한 "n" 유전자의 세트를 선택하는 단계를 포함하는 다단계 공정이다.

이 실시예에서, 본 발명자는 본 발명의 프로모터 래더 방법을 통해 조절하는 23개의 잠재적 경로 유전자의 그룹을 확인하였다(분자 라이신을 생산하는 예시적인 대사 경로에서 과발현하는 19개 유전자 및 하향조절하는 4+ 전환 유전자). (도 19 참조).

B. 프로모터 래더의 생성

프로모터 스왑 공정의 실행에서 다른 단계는 "래더"로서 작용하는 "x" 프로모터의 한 세트의 선택이다. 이상적으로 이 프로모터는 여러 게놈 유전자좌 전체에서 매우 다양한 발현을 유도하는 것으로 나타났지만, 유일한 요구 사항은 이들이 어떤 방식으로 유전자 발현을 교란한다는 것이다.

특정 실시태양에서, 이런 프로모터 래더는 관심 표적 유전자와 관련된 천연, 고유 또는 야생형 프로모터를 확인하고 상기 프로모터를 돌연변이시켜 다중 돌연변이 프로모터 서열을 유도함으로써 생성된다. 이들 돌연변이 프로모터의 각각은 표적 유전자 발현에 대한 효과에 대해 테스트된다. 일부 실시태양에서, 편집된 프로모터는 다양한 조건에 걸쳐 발현 활성에 대해 테스트되어, 각 프로모터 변이체의 활성이 문서화/특징화/주석 처리되고 데이터베이스에 저장된다. 생성된 편집된 프로모터 변이체는 뒤이어 그 발현의 강도에 기초하여 배열된 "래더"로 조직화된다(예를 들어, 상부 근처의 고도로 발현된 변이체 및 하부 근처의 약화된 발현에 의해, 따라서 "래더"라는 용어를 유도한다).

본 예시적인 실시태양에서, 본 발명자는 도 19에서 확인된 각각의 표적 유전자에 대한 프로모터 래더: ORF 조합을 생성하였다.

C. 래더로부터의 프로모터를 표적 유전자와 연결

프로모터 스왑 공정의 실현에서 다른 단계는 특정 표적 유전자와 관련된 프로모터 래더로부터의 소정의 프로모터를 포함하는 다양한 균주의 HTP 공학이다.

고유 프로모터가 표적 유전자 n의 앞에 존재하고 이의 서열이 알려진 경우, 래더에서 x 프로모터의 각각에 의한 고유 프로모터의 대체가 수행될 수 있다. 고유 프로모터가 존재하지 않거나 이의 서열이 알려지지 않은 경우, 유전자 n 앞에 있는 래더에 x 프로모터의 각각의 삽입이 실행될 수 있다. 이러한 방식으로, 균주의 라이브러리가 구축되고, 여기서 라이브러리의 각 구성원은 그렇지 않으면 동일한 유전자 상황에서 n 표적에 작동 가능하게 연결된 x 프로모터의 예이다(예를 들어, 도 20 참조).

D. 균주의 HTP 선별

프로모터 스왑 공정에서 최종 단계는 상기한 라이브러리에서 균주의 HTP 선별이다. 유도된 균주의 각각은 그렇지 않으면 동일한 유전자 배경에서, n 표적에 연결된 x 프로모터의 예를 나타낸다.

하나 이상의 메트릭에 대한 성능이 특징화되는 시나리오에서, 각 균주의 HTP 선별을 실행함으로써, 발명자는 소정의 메트릭에 대해 어떤 프로모터/표적 유전자 결합이 가장 유익한 지를 결정할 수 있다(예를 들어, 관심 분자의 생산의 최적화). 도 20(관심 유전자에 대한 프로모터 P1-P8 효과) 참조.

도 19-22에 도시된 예시적인 실시태양에서, 본 발명자는 라이신의 생산을 최적화하기 위해 프로모터 스왑 공정을 사용하였다. 상기한 Pro SWAP 방법의 응용은 아래의 실시예 5에 기술된다.

실시예 5: HTP 게놈 공학 - 라이신 생산을 위한 균주 성능을 개량시키기 위한 PRO 스왑 라이브러리의 실현.

아래 섹션은 실시예 4에 기술된 바와 같이, 본 발명의 PRO 스왑 HTP 디자인 균주 개량 프로그램 도구의 예시적 실행을 제공한다. 이 실시예에서, 코리네박테리움 균주에 라이신의 숙주 세포 수율을 증가시키기 위해 본 발명의 PRO 스왑 방법을 적용하였다.

A. 프로모터 스왑

프로모터 스왑을 실시예 4에 기술된 바와 같이 수행하였다. 도 19의 라이신 생합성 경로로부터의 선택된 유전자를 프로모터 P1-P8을 사용하여 프로모터 스왑에 표적화하였다.

B. HTP 공학 및 고 처리량 선별

프로모터 스왑의 HTP 공학을 실시예 1 및 3에 기술된 바와 같이 수행하였다. 생성된 프로모터 스왑 균주의 HTP 선별을 실시예 3에 기술된 바와 같이 수행하였다. 전체 145회 PRO 스왑을 수행하였다. 실험 결과는 아래 표 11에 요약되어 있으며 도 41에 도시된다.

라이신 PRO 스왑 라이브러리의 HTP 선별

균주	프로모터-표적	N	평균(A ₅₆₀ )	표준 오차	기본으로부터 수율 변화 %
7000007713	Pcg1860-asd	8	0.84595	0.00689	3.927615
7000007736	Pcg0755-asd	4	0.84036	0.00974	3.240866
7000007805	Pcg0007_119-asd	8	0.82493	0.00689	1.345242
7000007828	Pcg3121-asd	8	0.8246	0.00689	1.3047
7000007759	Pcg0007_265-asd	8	0.81155	0.00689	-0.29853
7000007782	Pcg3381-asd	8	0.8102	0.00689	-0.46438
7000007712	Pcg1860-ask	8	0.83958	0.00689	3.14504
7000007735	Pcg0755-ask	8	0.81673	0.00689	0.337846
7000007827	Pcg3121-ask	8	0.81498	0.00689	0.122853
7000007804	Pcg0007_119-ask	8	0.81492	0.00689	0.115482
7000007758	Pcg0007_265-ask	8	0.80381	0.00689	-1.24942
7000007781	Pcg3381-ask	8	0.80343	0.00689	-1.2961
7000007780	Pcg3381-aspB	8	0.84072	0.00689	3.285093
7000007803	Pcg0007_119-aspB	8	0.82106	0.00689	0.8698
7000007809	Pcg0007_119-cg0931	8	0.83446	0.00689	2.516032
7000007717	Pcg1860-cg0931	4	0.83129	0.00974	2.126588
7000007763	Pcg0007_265-cg0931	4	0.82628	0.00974	1.511094
7000007671	Pcg0007_39-cg0931	8	0.82554	0.00689	1.420182
7000007740	Pcg0755-cg0931	8	0.81921	0.00689	0.642522
7000007694	Pcg0007-cg0931	8	0.80444	0.00689	-1.17202
7000007691	Pcg0007-dapA	8	0.8299	0.00689	1.955822
7000007783	Pcg3381-dapA	8	0.80951	0.00689	-0.54915
7000007760	Pcg0007_265-dapA	8	0.76147	0.00689	-6.45102
7000007806	Pcg0007_119-dapA	8	0.35394	0.00689	-56.5174
7000007761	Pcg0007_265-dapB	8	0.84157	0.00689	3.389518
7000007738	Pcg0755-dapB	4	0.84082	0.00974	3.297378
7000007692	Pcg0007-dapB	8	0.83088	0.00689	2.076218
7000007784	Pcg3381-dapB	8	0.82474	0.00689	1.3219
7000007715	Pcg1860-dapB	8	0.82232	0.00689	1.024595
7000007830	Pcg3121-dapB	8	0.81236	0.00689	-0.19902
7000007807	Pcg0007_119-dapB	4	0.69622	0.00974	-14.4672
7000007762	Pcg0007_265-dapD	8	0.84468	0.00689	3.771591
7000007808	Pcg0007_119-dapD	8	0.83869	0.00689	3.035701
7000007785	Pcg3381-dapD	8	0.83397	0.00689	2.455834
7000007670	Pcg0007_39-dapD	8	0.81698	0.00689	0.368559
7000007831	Pcg3121-dapD	4	0.8155	0.00974	0.186737
7000007693	Pcg0007-dapD	8	0.8117	0.00689	-0.28011
7000007716	Pcg1860-dapD	8	0.79044	0.00689	-2.89196
7000007739	Pcg0755-dapD	8	0.78694	0.00689	-3.32195
7000007787	Pcg3381-dapE	8	0.83814	0.00689	2.968132
7000007833	Pcg3121-dapE	8	0.83721	0.00689	2.853878
7000007741	Pcg0755-dapE	8	0.83263	0.00689	2.291211
7000007810	Pcg0007_119-dapE	8	0.83169	0.00689	2.175729
7000007718	Pcg1860-dapE	8	0.81855	0.00689	0.561439
7000007672	Pcg0007_39-dapE	8	0.80932	0.00689	-0.5725
7000007765	Pcg0007_265-dapF	8	0.8327	0.00689	2.299811
7000007788	Pcg3381-dapF	8	0.82942	0.00689	1.896853
7000007811	Pcg0007_119-dapF	8	0.82926	0.00689	1.877196
7000007696	Pcg0007-dapF	8	0.82099	0.00689	0.861201
7000007719	Pcg1860-dapF	8	0.82067	0.00689	0.821888
7000007673	Pcg0007_39-dapF	8	0.82062	0.00689	0.815745
7000007789	Pcg3381-ddh	8	0.84817	0.00689	4.200349
7000007835	Pcg3121-ddh	8	0.82141	0.00689	0.912799
7000007812	Pcg0007_119-ddh	8	0.82093	0.00689	0.853829
7000007674	Pcg0007_39-ddh	8	0.81494	0.00689	0.117939
7000007720	Pcg1860-ddh	8	0.81473	0.00689	0.09214
7000007766	Pcg0007_265-ddh	8	0.81427	0.00689	0.035627
7000007743	Pcg0755-ddh	8	0.80655	0.00689	-0.9128
7000007697	Pcg0007-ddh	8	0.80621	0.00689	-0.95457
7000007779	Pcg3381-fbp	8	0.85321	0.00689	4.819529
7000007802	Pcg0007_119-fbp	4	0.81425	0.00974	0.03317
7000007710	Pcg1860-fbp	4	0.40253	0.00974	-50.5479
7000007687	Pcg0007-fbp	8	0.14881	0.00689	-81.7182
7000007825	Pcg3121-fbp	4	0.12471	0.00974	-84.679
7000007733	Pcg0755-fbp	4	0.08217	0.00974	-89.9052
7000007746	Pcg0755-hom	8	0.81925	0.00689	0.647436
7000007792	Pcg3381-hom	4	0.77674	0.00974	-4.57505
7000007723	Pcg1860-hom	8	0.71034	0.00689	-12.7325
7000007838	Pcg3121-hom	8	0.559	0.00689	-31.3251
7000007800	Pcg0007_119-icd	8	0.83236	0.00689	2.258041
7000007823	Pcg3121-icd	8	0.83155	0.00689	2.15853
7000007777	Pcg3381-icd	8	0.82844	0.00689	1.776456
7000007708	Pcg1860-icd	8	0.82384	0.00689	1.211332
7000007662	Pcg0007_39-icd	12	0.82008	0.00562	0.749404
7000007685	Pcg0007-icd	8	0.81257	0.00689	-0.17322
7000007754	Pcg0007_265-icd	4	0.81172	0.00974	-0.27765
7000007698	Pcg0007-lysA	4	0.8504	0.00974	4.474311
7000007675	Pcg0007_39-lysA	8	0.84414	0.00689	3.705251
7000007836	Pcg3121-lysA	4	0.83545	0.00974	2.637657
7000007767	Pcg0007_265-lysA	8	0.83249	0.00689	2.274012
7000007813	Pcg0007_119-lysA	8	0.83096	0.00689	2.086046
7000007790	Pcg3381-lysA	8	0.8118	0.00689	-0.26782
7000007676	Pcg0007_39-lysE	8	0.84394	0.00689	3.68068
7000007699	Pcg0007-lysE	4	0.83393	0.00974	2.45092
7000007768	Pcg0007_265-lysE	8	0.83338	0.00689	2.383351
7000007837	Pcg3121-lysE	4	0.83199	0.00974	2.212585
7000007791	Pcg3381-lysE	8	0.81476	0.00689	0.095825
7000007814	Pcg0007_119-lysE	8	0.81315	0.00689	-0.10197
7000007775	Pcg3381-odx	8	0.82237	0.00689	1.030738
7000007752	Pcg0007_265-odx	8	0.81118	0.00689	-0.34399
7000007729	Pcg0755-odx	8	0.81103	0.00689	-0.36242
7000007683	Pcg0007-odx	8	0.80507	0.00689	-1.09462
7000007706	Pcg1860-odx	4	0.79332	0.00974	-2.53815
7000007660	Pcg0007_39-odx	8	0.79149	0.00689	-2.76297
7000007798	Pcg0007_119-odx	8	0.77075	0.00689	-5.31094
7000007821	Pcg3121-odx	4	0.74788	0.00974	-8.12059
7000007822	Pcg3121-pck	8	0.85544	0.00689	5.093491
7000007776	Pcg3381-pck	8	0.8419	0.00689	3.43006
7000007799	Pcg0007_119-pck	8	0.83851	0.00689	3.013588
7000007753	Pcg0007_265-pck	8	0.82738	0.00689	1.646232
7000007730	Pcg0755-pck	4	0.81785	0.00974	0.475442
7000007661	Pcg0007_39-pck	8	0.80976	0.00689	-0.51844
7000007684	Pcg0007-pck	8	0.79007	0.00689	-2.93742
7000007707	Pcg1860-pck	8	0.71566	0.00689	-12.0789
7000007840	Pcg3121-pgi	4	1.01046	0.00974	24.13819
7000007817	Pcg0007_119-pgi	7	0.99238	0.00736	21.917
7000007794	Pcg3381-pgi	7	0.99008	0.00736	21.63444
7000007771	Pcg0007_265-pgi	8	0.94665	0.00689	16.29893
7000007725	Pcg1860-pgi	8	0.85515	0.00689	5.057864
7000007702	Pcg0007-pgi	4	0.8056	0.00974	-1.02951
7000007658	Pcg0007_39-ppc	4	0.85221	0.00974	4.696676
7000007750	Pcg0007_265-ppc	8	0.84486	0.00689	3.793705
7000007727	Pcg0755-ppc	8	0.84166	0.00689	3.400575
7000007773	Pcg3381-ppc	4	0.82883	0.00974	1.824369
7000007796	Pcg0007_119-ppc	8	0.82433	0.00689	1.27153
7000007704	Pcg1860-ppc	8	0.81736	0.00689	0.415244
7000007819	Pcg3121-ppc	8	0.79898	0.00689	-1.8428
7000007732	Pcg0755-ptsG	8	0.84055	0.00689	3.264208
7000007709	Pcg1860-ptsG	8	0.81075	0.00689	-0.39682
7000007663	Pcg0007_39-ptsG	8	0.80065	0.00689	-1.63763
7000007778	Pcg3381-ptsG	8	0.23419	0.00689	-71.229
7000007801	Pcg0007_119-ptsG	8	0.17295	0.00689	-78.7525
7000007824	Pcg3121-ptsG	8	0.16035	0.00689	-80.3005
7000007705	Pcg1860-pyc	8	0.85143	0.00689	4.60085
7000007728	Pcg0755-pyc	8	0.79803	0.00689	-1.95951
7000007659	Pcg0007_39-pyc	8	0.75539	0.00689	-7.19797
7000007751	Pcg0007_265-pyc	8	0.73664	0.00689	-9.50146
7000007682	Pcg0007-pyc	4	0.73142	0.00974	-10.1428
7000007774	Pcg3381-pyc	4	0.66667	0.00974	-18.0975
7000007797	Pcg0007_119-pyc	4	0.52498	0.00974	-35.5046
7000007820	Pcg3121-pyc	8	0.52235	0.00689	-35.8277
7000007841	Pcg3121-tkt	8	0.82565	0.00689	1.433696
7000007818	Pcg0007_119-tkt	8	0.81674	0.00689	0.339075
7000007749	Pcg0755-tkt	8	0.81496	0.00689	0.120396
7000007703	Pcg0007-tkt	4	0.76763	0.00974	-5.69424
7000007795	Pcg3381-tkt	8	0.72213	0.00689	-11.2841
7000007772	Pcg0007_265-tkt	8	0.68884	0.00689	-15.3738
7000007701	Pcg0007-zwf	4	0.95061	0.00974	16.78542
7000007747	Pcg0755-zwf	8	0.92595	0.00689	13.75587
7000007770	Pcg0007_265-zwf	8	0.9029	0.00689	10.9241
7000007724	Pcg1860-zwf	8	0.79309	0.00689	-2.5664
7000007839	Pcg3121-zwf	4	0.13379	0.00974	-83.5635
7000000017	-	116	0.92115	0.00181	13.16617
7000006284	-	128	0.81398	0.00172	0
7000005754	-	64	0.79489	0.00243	-2.34527

가시화될 때, 프로모터 스왑 라이브러리 선별의 결과는 측정되는 성능 메트릭과 가장 밀접하게 상관되는 유전자 표적을 확인하는 역할을 한다. 이 경우, 유전자 표적 pgi, zwf, ppc, pck, fbp 및 ddh는 프로모터 스왑이 기본 균주에 비해 수율에 큰 이득을 나타내는 유전자로 확인되었다.표 11의 선택된 균주를 상기한 바와 같이 작은 플레이트에서 재배양하고 라이신 수율에 대해 테스트하였다. 이런 2차 선별로부터의 결과는 도 22에 제공된다.

실시예 6: 상위성 매핑 - 유익한 돌연변이 통합을 예측하기 위한 알고리즘 도구

이 실시예는 본 발명의 HTP 균주 개량 프로그램의 일부로서 이용되는 예측 모델링 기술의 한 실시태양을 기술한다. (상기한 바와 같은 유전자 디자인 라이브러리의 사용을 통한) 잠재적으로 유익한 돌연변이의 초기 확인 후, 본 발명은 2차, 3차, 4차 및 추가의 후속 라운드의 HTP 균주 개량에서 유익한 돌연변이의 통합 방법을 교시한다. 일부 실시태양에서, 본 발명은 돌연변이 통합이 상기 돌연변이 각각의 개별적인 성능에 기초할 수 있음을 교시한다. 다른 실시태양에서, 본 발명은 둘 이상의 돌연변이가 단일 숙주 세포 내로 통합되는 경우에 부가적 또는 상승 효과를 나타낼 가능성을 예측하는 방법을 교시한다. 아래 실시예는 본 발명의 예측 도구의 실시태양을 도시한다.

실시예 3 및 5의 SNP 스왑 및 프로모터 스와핑(PRO 스왑) 라이브러리로부터의 선택된 돌연변이를 분석하여 균주 숙주 성능 개량으로 이어질 가능성이 가장 높은 SNP/PRO 스왑 조합을 확인하였다.

SNP 스와핑 라이브러리 서열을 본 발명의 "상위성 매핑" 섹션에 기재된 바와 같이 코사인 유사성 매트릭스를 사용하여 서로 비교하였다. 분석 결과는 각 SNP/PRO 스왑 조합에 대해 기능적 유사성 점수를 산출하였다. 모든 SNP/PRO 스왑 사이의 기능적 유사성의 시각적 표현은 도 15의 히트 맵에 도시된다. 생성된 기능적 유사성 점수는 각 SNP/PRO 스왑의 각각 사이의 유사성 거리를 도시하는 덴드로 그램을 개발하는데 사용하였다(도 16a).

동일하거나 유사한 작용기로부터의 돌연변이(즉, 높은 기능적 유사성을 갖는 SNP/PRO 스왑)는 동일한 메카니즘에 의해 작동하기 쉽고, 따라서 조합된 경우 전체적인 숙주 성능에 대해 음성 또는 중성의 상위성을 나타낼 가능성이 더 높다. 대조적으로, 상이한 작용기로부터의 돌연변이는 독립적인 메카니즘에 의해 작동하기 쉽고, 따라서 숙주 성능에 유익한 첨가제 또는 조합 효과를 나타낼 가능성이 더 높다.

상위성에 대한 생물학적 경로의 효과를 설명하기 위해, 다양한 기능적 유사성을 나타내는 SNP 및 PRO 스왑을 조합하고 숙주 균주에 대해 테스트하였다. 3개의 SNP/PRO 스왑 조합을 실시예 1에 기술된 바와 같이 코리네박테리움 글루타미쿰의 게놈에 조작하였다: i) Pcg0007 :: zwf PRO 스왑 + Pcg1860 :: pyc PRO 스왑, ii) Pcg0007 :: zwf PRO 스왑 + SNP 309 및 iv ) Pcg0007 :: zwf PRO 스왑 + Pcg0007 :: lysA PRO 스왑 (기능적 유사성 관계에 대해 도 15 및 16a 참조).

SNP/PRO 스왑 조합을 함유하는 각각의 숙주 세포의 성능을 실시예 3에 기술된 바와 같이 테스트하고, zwf PRO 스왑만을 함유하는 대조군 숙주 세포의 성능과 비교하였다. 하기 표 12 및 표 13은 각각의 균주의 숙주 세포 수율(96 시간 측정) 및 생산성(24시간 측정)의 결과를 요약한다.

24시간에서 상위성 매핑 실험을 위한 라이신 누적.

SNP/ PRO 스왑	평균 라이신 (A ₅₆₀ )	StDev
6318 (zwf)	0.51	0.03
8126 (zwf+ lysA)	0.88	0.06
8156 (zwf+ pyc)	0.53	0.01
8708 (zwf+ SNP 309)	0.56	0.00

96시간에서 상위성 매핑 실험을 위한 라이신 누적.

SNP/ PRO 스왑	평균 라이신 (A ₅₆₀ )	StDev
6318 (zwf)	0.83	0.01
8126 (zwf + lysA)	0.94	0.02
8156 (zwf+ pyc)	0.83	0.06

각 SNP/PRO 스왑 조합에 대한 숙주 수율 성능 결과는 또한 도 16b에 도시된다. 보다 낮은 기능적 유사성을 나타내는 SNP/PRO 스왑을 조합한 숙주 균주는 조합된 SNP가 24시간 및 96시간 측정 모두에서 보다 높은 기능적 유사성을 나타내는 균주를 능가하였다.따라서, 상위성 매핑 절차는 디자인된 유전자 변화의 효과적인 및/또는 긍정적인 통합을 예측/프로그래밍/통지하는데 유용하다. 상위성 매핑 절차로부터의 분석적 통찰력은 미생물 균주 개발의 후속 라운드를 안내할 수 있는 예측성 규칙 세트의 생성을 허용한다. 상위성 라이브러리로부터 얻은 예측성 통찰력은 미생물 유형 및 표적 분자 유형에 걸쳐 사용될 수 있다.

실시예 7: HTP 게놈 공학 - Pro 스왑 돌연변이 통합 및 다중 인자 조합 테스팅

이전의 실시예는 적은 수의 미리 선택된 PRO 스왑 돌연변이를 SNP 스왑 라이브러리와 통합하기 위한 방법을 설명하였다(실시예 3). 다른 실시예는 부가적 또는 상승적 유익한 숙주 세포 성질을 나타낼 가능성이 가장 큰 돌연변이 통합을 선택하는 상위성 방법을 설명하였다(실시예 6). 이 실시예는 다수의 유전자/유전자 디자인 라이브러리 조합(예를 들어, PRO 스왑 라이브러리 x SNP 라이브러리 또는 PRO 스왑 라이브러리 내의 조합)의 조합적 통합에 의해 생성된 큰 솔루션 공간을 효과적으로 탐색하는 본 발명의 HTP 방법의 능력을 설명한다.

본 발명의 HTP 균주 개량 방법의 이러한 예시적인 적용에서, 실시예 5의 숙주 성능에 긍정적 효과를 갖는 것으로 확인된 프로모터 스왑은 원래의 PRO 스왑 라이브러리와 2차 조합으로 통합된다. PRO 스왑 돌연변이를 통합하는 결정은 각 돌연변이의 수율 또는 생산성에 대한 전반적인 효과와 두 돌연변이의 조합이 첨가물 효과 또는 시너지 효과를 창출 할 가능성에 근거했다.

예를 들어, 본 출원인은 실시예 6의 상위성 매핑 결과에 기초하여 Pcg0007 :: zwf 및 Pcg0007 :: lysA를 조합하는 그들의 선택을 언급한다.

A. PRO 스왑 균주 공학을 위한 통합 라운드

균주를 이전 실시예 1에서 기술한 바와 같이 형질전환시켰다. 간단하게, 원하는 PRO 스왑 돌연변이를 이미 함유하고 있는 균주를 제 2 원하는 PRO 스왑 돌연변이로 다시 형질전환시켰다. 전체적으로, 실시예 5로부터의 145개의 테스트된 PRO 스왑은 53개의 제 2 라운드 통합 균주로 통합되었으며, 각각은 유리한 첨가제 또는 상승 효과를 나타낼 것으로 예상되는 2개의 PRO 스왑 돌연변이를 포함한다.

생성된 제 2 라운드 균주를 실시예 3에 기술된 바와 같이 다시 선별하였다.이 실험으로부터의 결과를 하기 표 14에 요약하고 도 11에 도시한다.

제 2 라운드 통합된 라이신 PRO 스왑 라이브러리의 HTP 선별

균주 ID	번호	PRO 스왑 1	PRO 스왑 2	평균 수율 (A ₅₆₀ )	표준 편차
7000008489	4	Pcg0007-lysA	Pcg3121-pgi	1.17333	0.020121
7000008530	8	Pcg1860-pyc	Pcg0007-zwf	1.13144	0.030023
7000008491	7	Pcg0007-lysA	Pcg0007-zwf	1.09836	0.028609
7000008504	8	Pcg3121-pck	Pcg0007-zwf	1.09832	0.021939
7000008517	8	Pcg0007_39-ppc	Pcg0007-zwf	1.09502	0.030777
7000008502	4	Pcg3121-pck	Pcg3121-pgi	1.09366	0.075854
7000008478	4	Pcg3381-ddh	Pcg0007-zwf	1.08893	0.025505
7000008465	4	Pcg0007_265-dapB	Pcg0007-zwf	1.08617	0.025231
7000008535	8	Pcg0007-zwf	Pcg3121-pgi	1.06261	0.019757
7000008476	6	Pcg3381-ddh	Pcg3121-pgi	1.04808	0.084307
7000008510	8	Pcg3121-pgi	Pcg1860-pyc	1.04112	0.021087
7000008525	8	Pcg1860-pyc	Pcg0007_265-dapB	1.0319	0.034045
7000008527	8	Pcg1860-pyc	Pcg0007-lysA	1.02278	0.043549
7000008452	5	Pcg1860-asd	Pcg0007-zwf	1.02029	0.051663
7000008463	4	Pcg0007_265-dapB	Pcg3121-pgi	1.00511	0.031604
7000008524	8	Pcg1860-pyc	Pcg1860-asd	1.00092	0.026355
7000008458	4	Pcg3381-aspB	Pcg1860-pyc	1.00043	0.020083
7000008484	8	Pcg3381-fbp	Pcg1860-pyc	0.99686	0.061364
7000008474	8	Pcg3381-ddh	Pcg3381-fbp	0.99628	0.019733
7000008522	8	Pcg0755-ptsG	Pcg3121-pgi	0.99298	0.066021
7000008528	8	Pcg1860-pyc	Pcg3121-pck	0.99129	0.021561
7000008450	4	Pcg1860-asd	Pcg3121-pgi	0.98262	0.003107
7000008448	8	Pcg1860-asd	Pcg3381-fbp	0.97814	0.022285
7000008494	8	Pcg0007_39-lysE	Pcg3381-fbp	0.97407	0.027018
7000008481	8	Pcg3381-fbp	Pcg0007-lysA	0.9694	0.029315
7000008497	8	Pcg0007_39-lysE	Pcg1860-pyc	0.9678	0.028569
7000008507	8	Pcg3121-pgi	Pcg3381-fbp	0.96358	0.035078
7000008501	8	Pcg3121-pck	Pcg0007-lysA	0.96144	0.018665
7000008486	8	Pcg0007-lysA	Pcg0007_265-dapB	0.94523	0.017578
7000008459	8	Pcg0007_265-dapB	Pcg1860-asd	0.94462	0.023847
7000008506	2	Pcg3121-pgi	Pcg0007_265-dapD	0.94345	0.014014
7000008487	8	Pcg0007-lysA	Pcg3381-ddh	0.94249	0.009684
7000008498	8	Pcg3121-pck	Pcg1860-asd	0.94154	0.016802
7000008485	8	Pcg0007-lysA	Pcg1860-asd	0.94135	0.013578
7000008499	8	Pcg3121-pck	Pcg0007_265-dapB	0.93805	0.013317
7000008472	8	Pcg3381-ddh	Pcg1860-asd	0.93716	0.012472
7000008511	8	Pcg0007_39-ppc	Pcg1860-asd	0.93673	0.015697
7000008514	8	Pcg0007_39-ppc	Pcg0007-lysA	0.93668	0.027204
7000008473	8	Pcg3381-ddh	Pcg0007_265-dapB	0.93582	0.030377
7000008461	7	Pcg0007_265-dapB	Pcg3381-fbp	0.93498	0.037862
7000008512	8	Pcg0007_39-ppc	Pcg0007_265-dapB	0.93033	0.017521
7000008456	8	Pcg3381-aspB	Pcg3121-pck	0.92544	0.020075
7000008460	8	Pcg0007_265-dapB	Pcg0007_265-dapD	0.91723	0.009508
7000008492	8	Pcg0007_39-lysE	Pcg3381-aspB	0.91165	0.012988
7000008493	8	Pcg0007_39-lysE	Pcg0007_265-dapD	0.90609	0.031968
7000008453	8	Pcg3381-aspB	Pcg0007_265-dapB	0.90338	0.013228
7000008447	8	Pcg1860-asd	Pcg0007_265-dapD	0.89886	0.028896
7000008455	8	Pcg3381-aspB	Pcg0007-lysA	0.89531	0.027108
7000008454	6	Pcg3381-aspB	Pcg3381-ddh	0.87816	0.025807
7000008523	8	Pcg0755-ptsG	Pcg1860-pyc	0.87693	0.030322
7000008520	8	Pcg0755-ptsG	Pcg3381-fbp	0.87656	0.018452
7000008533	4	Pcg0007-zwf	Pcg3381-fbp	0.84584	0.017012
7000008519	8	Pcg0755-ptsG	Pcg0007_265-dapD	0.84196	0.025747

상위성 모델에 의해 예측된 바와 같이, Pcg0007 :: zwf 및 Pcg0007 :: lysA 돌연변이를 포함하는 제 2 라운드 PRO 스왑 균주는 Pcg0007 :: lysA 단독에 비해 수율의 거의 30% 개량 및 기본 균주에 비해 35.5% 개량으로 가장 높은 수율 개선 중 하나를 나타내었다(도 11에서 원으로 표시된 데이터 점 참조).단일 및 이중 통합 돌연변이의 솔루션 공간을 탐색하기 위한 HTP 방법은 또한 제 3, 제 4 및 후속 돌연변이 통합에 적용될 수 있다. 예를 들어, 상기 표 14에 도시되고 본 발명의 상위성 방법에 의해 확인된 바와 같이 2개의 변화 통합에서 확인된 상위 히트 중에서 선택된 zwf, pyc 및 lysa에 상응하는 개시된 3개 변화 통합 균주에 주목하였다. 이 3개의 통합 균주는 부모 또는 부모 + zwf와 비교하여 현저히 개선된 것으로 탱크에서 추가로 검증되었다(상기 표 10 및 도 40 참조).

실시예 8: HTP 게놈 공학 - 산업용 숙주 균주를 개량하기 위한 터미네이터 라이브러리의 실행

본 실시예는 STOP 스왑을 포함하는 추가의 HTP 유전자 디자인 라이브러리에 본 발명의 HTP 방법을 적용한다. 본 실시예는 보다 복잡한 유전자 디자인 라이브러리(예를 들어, 프로모터 및 터미네이터 모두를 포함하는 PRO-STOP 스왑 라이브러리)를 생성하기 위해 기본 유전자 디자인 라이브러리(예를 들어, PRO 스왑, SNP 스왑, STOP 스왑 등)로부터의 요소를 조합하는 본 발명의 능력을 추가로 설명한다. 일부 실시태양에서, 본 발명은 이전에 개시된 유전자 디자인 라이브러리 중 임의의 것을 조합하여 유도된 것들을 포함하는 임의의 및 모든 가능한 유전자 디자인 라이브러리를 교시한다.

이 실시예에서, 유전자 발현에 대한 본 발명의 STOP 스왑 방법의 효과를 입증하기 위해 소규모 실험을 수행하였다. 본 발명의 터미네이터 T1-T8은 아래 기술된 바와 같이 2개의 고유 코리네박테리움 글루타미쿰 프로모터의 하나와 쌍을 이루고, 형광 단백질의 발현에 영향을 미치는 능력에 대해 분석되었다.

A. DNA 구조체의 조립

터미네이터 T1-T8은 황색 형광 단백질(YFP)을 발현하는 2개의 고유 코리네박테리움 글루타미쿰 프로모터(예를 들어, Pcg0007 또는 Pcg0047)의 하나와 쌍을 이뤘다. DNA 증폭 및 조립을 용이하게 하기 위해, 최종 프로모터-YFP-터미네이터 서열을 두 부분으로 합성하였다; i) 벡터 상동성 암, ii) 선택된 프로모터, iii) 및 YFP 유전자의 2/3으로 암호화된 제 1 부분(5'에서 3'로). iv) YFP 유전자의 다음 2/3, v) 선택된 터미네이터 및 vi) 두 번째 벡터 상동성 암으로 암호화된 두 번째 부분(5'에서 3'로). 각 부분을 합성 올리고뉴클레오티드를 사용하여 증폭시키고 겔 정제시켰다. 겔 정제된 앰플리콘은 효모 상동성 재조합을 사용하여 벡터 백본으로 조립하였다.

B. 조립된 클론의 대장균으로의 형질전환

프로모터-YFP-터미네이터 서열을 함유하는 벡터를 정확하게 조립된 클론을 확인하고 코리네박테리움 형질전환을 위한 벡터 DNA를 증폭시키기 위해 각각 대장균으로 개별적으로 형질전환시켰다. 올바르게 조립된 벡터는 제한 효소 분해 및 생거 서열화에 의해 확인되었다. 양성 클론은 나중에 사용할 수 있도록 -20℃에서 저장하였다.

C. 조립된 클론의 코리네박테리움으로의 형질전환

확인된 벡터 클론을 개별적으로 전기천공을 통해 코리네박테리움 글루타미쿰 숙주 세포로 형질전환시켰다. 각각의 벡터는 이종 황색 형광 단백질의 발현을 허용하지만 숙주 세포에 유해하지 않은 것으로 경험적으로 결정된 코리네박테리움 글루 타미쿰 게놈 내의 중성적 통합 위치에 통합되도록 디자인되었다. 통합을 용이하게하기 위해, 발현 벡터는 원하는 통합 위치에 약 2kbp의 서열 상동성(즉, 상동성 암)을 추가로 포함하며 이에 의해 상기 각각의 유전자 카세트가 상동성 암의 하류에 삽입되었다. 게놈 속으로의 통합은 단일 교차 통합으로 발생하였다. 형질전환 코리네박테리움을 PCR을 통한 정확한 통합에 대해 테스트하였다. 이 과정은 각 유전자 구조체에 대해 수행된 각각의 형질전환에 대해 반복하였다.

D. 코리네박테리움에서 개별 터미네이터 구조체의 평가

프로모터-YFP-터미네이터 구조체를 함유하는 각각의 코리네박테리움 형질전환체의 표현형을 발현을 평가하기 위해 2개의 시점에서 2가지 배지 유형(뇌 심장 주입-BHI 및 HTP 테스트 배지)에서 테스트하였다. 간단히 말해서, 4 내지 6개의 PCR 확인된 형질전환체를 선택하고 96 웰 형태의 선택 배지에서 배양하였다. 초기 배양물을 선택적 BHI 배지 또는 선택적 종자 배지로 나누었다. 48시간 후, 종자 배지의 배양물을 선택적 HTP 테스트 배지 또는 BHI 배지에 접종하고, 성장 곡선의 상이한 부분을 나타내는 2개의 시점에서 분석하였다. 접종 후 HTP 테스트 배양 배지에 대한 시점은 접종 후 48시간 및 96시간이었다. 접종 후 48시간 및 72시간에 선택적 BHI 배지의 배양물을 분석하였다.

배양물 분석은 벤치탑(benchtop) 유동 세포 계측기를 사용하여 수행하였다. 간단히 말해, 배양물을 200㎕의 인산염 완충 식염수(PBS)로 1:100 희석시켰다. 각 배양물에 대해, 3000 내지 5000개의 개별 사건(즉, 세포)을 황색 형광에 대하여 분석하였다. 벤치탑 유동 세포 계측기는 각 "사건"의 노란색 형광의 히스토그램을 그려 각 웰 내에서 중간 형광을 계산한다. 도 36은 각 구조체(4-6개 생물학적 복제물을 가로질러)에 대한 중간 형광의 평균을 도시한다. 오류 막대는 각 데이터 점의 95% 신뢰 구간을 나타낸다. 조건 A-D는 각각 단일 배지 및 단일 시점을 의미한다. 따라서 조건 A와 B는 BHI 매체에 대한 두 시점을 나타내는 반면 C와 D 점은 HTP 테스트 배지에 대한 두 시점을 나타낸다. 임의의 단위(예를 들어, AU)는 벤치탑 유동 세포 계측기에 의해 기록된 중간 형광을 나타낸다.

그 결과는 STOP 스왑 유전자 디자인 라이브러리의 터미네이터 1-8은 연속된 범위의 YFP 발현을 초래한다는 것을 보여준다. 따라서, 이러한 터미네이터는 본 발명의 HTP 방법에 따라, 미래의 유전자 디자인 라이브러리로 실행될 수 있는 터미네이터 래더를 형성한다.

실시예 9: HTP 도구 세트와 전통적인 UV 돌연변이 비교.

이 실시예는 종래의 돌연변이 균주 개량 프로그램에 비해 본 발명의 HTP 유전자 디자인 라이브러리의 이점을 입증한다. 본 명세서의 이 부분에서 실험은 전통적인 UV 돌연변이유발에 비해 본 발명의 HTP 방법을 통해 달성된 표현형 개량의 개량된 크기 및 속도를 정량화한다.

본 발명은 숙주 세포의 균주 개량 프로그램을 촉진시키는 새로운 방법을 교시한다. 일부 실시태양에서, 본 발명의 HTP 균주 개량 프로그램은 유전자 교란을 생성하고 확인하는 HTP 도구 세트의 능력에 의존한다. 본 발명자는 본 발명의 프로모터 스왑 기술을 전통적인 UV 돌연변이 접근법과 비교하는 작은 평행 트랙 균주 개량 프로그램을 수행함으로써 HTP 도구 세트의 이점을 정량화하려고 시도했다.

관심 생화학 대사산물을 생산하는 기본 기준 균주를 UV 및 프로모터 스왑 유전자 교란 모두의 출발점으로 선택하였다.

A. UV 돌연변이

기본 균주의 배양물을 10의 OD₆₀₀으로 정규화된 OD인 배양물에서 BHI 배지에서 성장시켰다. 이 배양물을 멸균 페트리 접시에 분취하고 소형 자기 교반 막대를 사용하여 교반하였다. 그런 후에 254 nm 파장의 UV 트랜스 일루미네이터를 배양물 위로 뒤집어 5분 및 9분의 UV 노출시에 분취량을 채취하였다. 이들 샘플을 연속적으로 10배 희석하고, 각 희석액을 BHI 배지 Q-트레이 상에 씌웠다. 이들 Q-트레이로부터, 자동화된 콜로니 추출 장치를 사용하여 각 UV 노출점으로부터 약 2500개의 콜로니를 추출하고 성능을 하기와 같이 평가하였다.

B. 프로모터 스왑

PRO 스왑 구조체를 표 1에 기술된 P1, P3, P4 및 P8로부터 선택된 프로모터의 전부 또는 서브세트를 사용하여 15개 유전자 표적에 대한 기본 균주에서 생성하였다. 관심 생성물의 생합성의 최종 단계는 잠재적으로 속도 제한 보조인자 S-아데노실메티오닌을 사용하는 O-메틸트랜스페라제 효소에 의해 촉매된다. 따라서 PRO 스왑에 대한 유전자 표적은 이 보조인자 또는 상류 대사산물의 생합성에 직접적으로 관여한다는 근거에서 선택되었다.

C. UV 및 프로모터 스왑 라이브러리 평가

이 실시예를 위해 성장된 각 코리네박테리움 균주의 표현형을 선택된 생체 분자를 생산하는 능력에 대해 테스트하였다. 간단히 말하자면, 각 PRO 스왑 균주로부터의 4개 내지 6개 서열 확인된 콜로니 및 각 UV 균주에 대한 단일 콜로니를 선택하고 생산 액체 배지에서 96-웰 형식의 선택 배지에서 증식시켰다.

96-웰 마이크로웰 플레이트에서 바이오매스 증식 후, 세포 덩어리를 96-웰 마이크로웰 플레이트에 있는 기질을 함유하는 발효 배지에 첨가하고 생물전환을 24시간 동안 진행시켰다. 24시에 채취한 시료로부터 고성능 액체 크로마토그래피를 사용하여 각 균주에 대한 생성물의 역가를 측정하였다. 각 유전자 교란(UV 및 PRO 스왑)에 대한 적정 결과를 분석하였다. 각각의 복제물에 대한 결과는 상기 균주의 전반적인 성능을 나타내도록 평균화되고 할당되었다. 그런 후에 균주는 기본 균주의 수율에 대한 비율로 표현된 측정된 수율에 대한 각 돌연변이의 효과에 기초한 범주로 분류되었다.

도 37은 i) 수율의 변화가 없음, ii) 수율에 대한 1.2 내지 1.4배 개량, iii) 수율에 대한 1.4 내지 1.6배 개량 iv) 수율에 대한 1.6 내지 1.8배 개량, 또는 iv) 수율에 대한 1.8 내지 2배 개량을 나타낸 각 균주 개량 기술에 대한 균주의 숫자로 나타내어진 이 실험의 결과를 요약한다.

결과는 종래의 UV 돌연변이 접근법에 비해 본 발명의 HTP 도구 세트의 이점을 예시한다. 예를 들어, 도 37의 결과는 PRO 스왑 균주가 수율에 더 높은 비율의 긍정적 변화를 나타내었고, 따라서 균주를 현저히 개량시킬 수있는 돌연변이를 제공할 가능성이 더 높았다는 것을 입증한다. 가장 눈에 띄는 것은 PRO 스왑 라이브러리에서 1.6, 1.8 및 2배 증가를 나타내는 높은 개량 균주의 높은 발생률이었으며 UV 라이브러리의 개량은 거의 확인되지 않거나 확인되지 않았다.

결과는 또한 본 발명의 PRO 스왑 방법의 가속화된 속도의 개량을 강조하기 때문에 중요하다. 실제로, PRO 스왑 라이브러리의 결과는 100개 미만의 프로모터::유전자 교란에 기초로 하는 반면, UV 돌연변이 결과는 4000개 초과의 돌연변이 균주의 선별을 포함하였다. 따라서, 본 발명의 방법은 성능에서 높은 이득을 갖는 균주를 부여할 수 있는 유전자 교란을 확인하기 전에 선별되어야 하는 돌연변이체의 수를 현저하게 감소시킨다.

실시예 10: 진핵생물에서 HTP 공학 방법의 적용

이전의 실시예는 원핵생물 세포에 대한 HTP 균주 개량 프로그램의 적용을 예시한다. 이 실시예는 진핵생물 세포에 동일한 기술의 적용가능성을 입증한다. 구체적으로, 실시예 10 및 11은 시트르산의 산업적 생산을 위한 아스페르길루스 니거에 대한 SNP 스왑 균주 개량 프로그램을 기술한다.

A. 아스페르길루스 니거 원형질체 형성 및 형질전환

아스페르길루스 니거의 진핵생물 진균 균주, ATCC 1015의 대량(500ml)의 원형질체를 베타-글루카나아제 활성을 함유하는 상업적으로 구입가능한 효소 혼합물을 사용하여 생성시켰다. 원형질체를 원심분리에 의해 효소 혼합물로부터 분리하였고 궁극적으로 염화칼슘을 함유하는 완충액에 재현탁시켰다.

원형질체를 분취하고 다이메틸 설폭사이드 및 폴리에틸렌 글리콜(PEG)의 현탁액을 함유하는 용기에서 영하 80℃로 동결시켰다. 일부 실시태양에서, 본 발명은 각 웰에서 25-50 마이크로리터의 원형질체를 함유하는 96-웰 미세적정 플레이트의 원료가 이 기술을 사용하여 대규모 게놈 편집 캠페인을 위한 큰 배치로 제조되고 동결시킬 수 있음을 교시한다.

전통적인 PEG 칼슘 매개 형질 전환은 96 웰 내의 원형질체-PEG 혼합물과 DNA를 조합한 자동화 액체 핸들러에 의해 수행되었다. 추가적인 자동화 된 액체 취급 단계를 사용하여 변형 후 선택적 배지로 형질전환시켰다.

B. 형질전환체의 자동화된 선별

하기에 보다 상세히 설명하는 바와 같이, A. 니거 세포는 우라실의 부재하에서 형질전환된 세포가 성장할 수 있게 하는 기능적 pyrG 유전자로 형질전환되었다. 이 실시예의 pyrG 유전자는 A. 니거의 야생형 aygA 유전자의 위치에 포함되도록 추가로 디자인되어, 자연 발생 aygA 유전자에 돌연변이를 포함시켰다. aygA 유전자를 파괴하면 황색 포자 색이 추가로 생성되어, 형질전환체를 확인하기 위한 2차 선별 방법을 제공한다.

우라실 없는 선택 배지 상에서 성장한 형질전환체를 분리하고 제 2 미세적정 플레이트의 개별 웰에 넣었다. 제 2 미세적정 플레이트의 형질전환체를 2 내지 3일 동안 성장시키고 포자성화시킨 다음, 물 및 소량의 세제로 이루어진 액체에 재현 탁시켜 저장 및 하류 자동화 선별에 적합한 포자 원료를 생성시켰다.

상기한 포자 원료의 각각의 작은 분취액을 사용하여 액체 배지를 제 3 96개 웰 PCR 플레이트에 접종하였다. 이 작은 배양물은 밤새 고정 배양기에서 성장되어 노란색-색소 함유 포자가 발아하여 선택 및 하류 단계에 보다 잘 적응하는 균사를 형성한다.

배양 단계 후, 제 3 PCR 플레이트의 균사를 상업적으로 구입 가능한 완충액을 첨가하고 99℃까지 20분 동안 배양물을 가열하여 용해시켰다. 그런 후에 플레이트를 원심분리하여 세포/세포기관 펠렛으로부터 DNA 현탁액 상등액을 분리하였다. 그런 후에 DNA 추출물을 PCR 분석에 사용하여 원하는 DNA 돌연변이를 포함하는 세포주를 확인하였다.

C. SNP의 통합을 위한 공동 형질전환-SNP의 디자인

아스페르길루스 니거 유전자 aygA의 DNA 서열을 수득하고 적절한 판독 프레임을 결정하였다. 4개의 구별된 유형의 돌연변이가 디자인되었고, 통합되면 널 돌연변이(null mutation)가 일어날 수 있다.

돌연변이는 프레임 내 정지 코돈, 작은 2개의 염기쌍 결실, 3개의 염기쌍 통합 및 더 큰 100개 염기쌍 결실을 포함하는 단일 염기쌍 변화를 포함하고 이들 모두는 적절하게 통합되면 aygA 활성을 제거할 것이다. aygA 활성이 결핍된 균주는 황색 포자의 표현형을 갖는다. 이 디자인은 깁슨 어셈블리를 사용하여 구조체를 만드는데 사용된 한 세트의 올리고머를 예측하는 인 실리코 구조체로서 생성되었다.

D. 공동-형질질환에 의한 SNP의 통합

상기한 형질전환 접근법을 사용하여, 작은 변화를 함유하는 앰플리콘을 아스 페르길루스 니거 균주 1015의 게놈에 포함시켰다. 이전에 논의된 바와 같이, 아스 페르길루스 니거의 균주는 비 기능성 pyrG 유전자를 포함하고, 따라서 외인성 우라실의 부재시에 성장할 수 없었다. pyrG 유전자를 성공적으로 통합한 세포는 이제 우라실의 부재시에 성장할 수 있었다. 이 pyrG + 형질전환체 중, aygA 유전자에 작은 돌연변이가 통합된 분리물은 황색 포자의 표현형을 나타내었다.(도 43a). 돌연변이의 존재는 SNP 교환을 표적으로 하는 영역을 함유하는 작은 앰플리콘의 서열화를 통해 또한 탐지된다(도 43b).

실시예 11: HTP 게놈 공학 - 진핵생물 아스페르길루스 니거 ATCC11414에서 시트르산 생산을 개량시키는 HTP SNP 라이브러리 균주 개량 프로그램의 실행

상기 실시예 10은 고 처리량 방식으로 본 발명의 유전자 공학 기술을 자동화하는 기술을 기술한다. 이 실시예는 아스페르길루스 니거 ATCC11414의 특정 HTP 균주 개량에 상기 기술을 적용한다.

아스페르길루스 니거는 발효를 통한 시트르산의 대규모 생산에 사용되는 사상 균류의 종이다. 이 종의 여러 균주는 분리되어 시트르산 및 기타 유기산의 생산을 위한 다양한 능력을 갖는 것을 입증되었다. 본 발명의 HTP 균주 공학 방법은 원인성 대립 유전자를 조합하고 유해한 대립 유전자를 제거하여 시트르산 생산을 개량시키는데 사용될 수 있다.

A. 천연 A. 니거 균주 변이체로부터의 SNP를 위한 유전자 디자인 라이브러리 라이브러리의 확인.

A. 니거 균주 ATCC 1015는 20세기 초반에 시트르산 생산자로 확인되었다. ATCC 11414로 명명된 이 균주의 분리물은 부모에 비해 증가된 시트르산 수율을 나타내는 것으로 이후에 밝혀졌다. 예를 들어, A. 니거 균주 ATCC 1015는 질산 암모늄을 함유하지만 철 및 망간 양이온이 결핍된 배지에서 140g의 글루코오스로부터 7g의 시트르산을 평균적으로 생산한다. 한편, 분리물 균주 ATCC 11414는 동일한 조건 하에서 10배의 수율 증가(70g의 시트르산)를 나타내었다. 더욱이, 균주 ATCC 11414 포자는 발아되어 1015 균주의 포자보다 시트르산 생산 배지에서 더 잘 자란다.

이들 표현형 차이에 대한 잠재적인 유전자 원인을 확인하기 위해, ATCC 1015 및 ATCC 11414 균주 모두의 게놈을 서열화하고 분석하였다. 최종 분석은 1015 및 11414 균주를 구별하는 42개의 SNP를 확인하였다.

B. 원인성 대립 유전자 교환

원형질체는 형질전환을 위해 ATCC 1015 균주("기본 균주")로부터 제조하였다. 그런 후에 상기한 42개 SNP의 각각을 본 발명의 유전자 편집 기술을 통해 기본 균주 속에 개별적으로 도입되었다("웨이브 업" 도 44a). 각 SNP는 상기한 바와 같이 기능적 pyrG 및 aygA 유전자 돌연변이와 함께 형질전환되었다. aygA 유전자좌를 표적으로 하는 성공적인 유전자를 갖는 형질전환체는 황색 포자를 생산하였다(도 44b).

C. 성공적인 통합을 위한 선별

추정 SNP를 함유하는 형질전환체를 분리하고 포자 원료를 상기한 바와 같이 증식시켰다. 추정 SNP를 함유하는 DNA 영역을 포함하는 앰플리콘을 차세대 서열화로 분석하였다. 이 접근법을 사용하여 부모 DNA의 존재하에서도 각 형질전환체 내에서 성공적인 통합 사건을 결정할 수 있다. 이 능력은 동일한 세포에서 상이한 유전자형을 갖는 핵을 포함하는 이핵체(heterokaryon)로서 성장할 수 있는 곰팡이에서의 표적을 결정하는데 필수적이다.

형질전환체를 원하는 SNP 변화의 존재에 대해 추가로 확증하였다. 황색 포자의 표현형을 가진 공동 형질전환체는 또한 대략 30%의 분리물에 시트르산 SNP의 적절한 통합을 함유하였다(도 45 및 46).

본 발명자들은 시트르산 생산에 유익한 SNP를 확인하기 위해 생성된 SNP 스왑 미생물 균주 라이브러리를 표현형적으로 선별할 것을 예상한다. 본 발명자들은 증가된 구연산 생성을 갖는 A. 니거 균주를 유도하기 위해 본 발명에 기술된 게놈 공학의 HTP 방법과 관련하여 이 정보를 이용할 것이다.

본 발명의 추가 실시태양

본 발명에 의해 고려된 다른 주제는 이하의 번호를 매긴 실시태양에서 기술된다:

1. 다음 단계를 포함하여 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 고 처리량(HTP) 방법:

a. 동일한 미생물 균주 배경을 갖는 초기의 복수의 미생물의 게놈을 교란시켜 독특한 유전자 변이를 갖는 개별 미생물 균주를 포함하는 초기 HTP 유전자 디자인 미생물 균주 라이브러리를 생성하는 단계;

b. 원하는 표현형을 위한 초기 HTP 유전자 디자인 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계;

c. 선행 단계에서 선별된 적어도 두 개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 HTP 유전자 디자인 미생물 균주 라이브러리를 생성하는 단계;

d. 원하는 표현형을 위한 후속 HTP 유전자 디자인 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계;

e. 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 단계 c)-d)를 1회 이상 반복하는 단계, 여기서 각각의 후속 반복은 선행 HTP 유전자 디자인 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 HTP 유전자 디자인 미생물 균주 라이브러리를 생성한다.

2. 제 1 실시태양에 따른 게놈 공학의 HTP 방법으로서, 초기 HTP 유전자 디자인 미생물 균주 라이브러리는 프로모터 스왑 미생물 균주 라이브러리, SNP 스왑 미생물 균주 라이브러리, 개시/정지 코돈 미생물 균주 라이브러리, 최적화된 서열 미생물 균주 라이브러리, 터미네이터 스왑 미생물 균주 라이브러리, 또는 이들의 임의의 조합으로 이루어진 그룹으로부터 선택된 적어도 하나를 포함한다.

3. 제 1-2 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 후속 HTP 유전자 디자인 미생물 균주 라이브러리는 초기 HTP 유전자 디자인 미생물 균주 라이브러리의 완전한 조합 미생물 균주 라이브러리이다.

4. 제 1-2 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 후속 HTP 유전자 디자인 미생물 균주 라이브러리는 초기 HTP 유전자 디자인 미생물 균주 라이브러리의 완전한 조합 미생물 균주 라이브러리의 서브세트이다.

5. 제 1-2 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 후속 HTP 유전자 디자인 미생물 균주 라이브러리는 선행 HTP 유전자 디자인 미생물 균주 라이브러리의 완전한 조합 미생물 균주 라이브러리이다.

6. 제 1-5 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 후속 HTP 유전자 디자인 미생물 균주 라이브러리는 선행 HTP 유전자 디자인 미생물 균주 라이브러리의 완전한 조합 미생물 균주 라이브러리의 조합이다.

7. 제 1-5 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 게놈을 교란시키는 단계는 랜덤 돌연변이유발, 표적 서열 삽입, 표적 서열 결실, 표적 서열 교체, 및 이의 임의의 조합으로 이루어진 그룹으로부터 선택된 적어도 하나의 방법을 사용하는 단계를 포함한다.

8. 제 1-6 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 초기 복수의 미생물은 산업용 생산 균주 미생물로부터 유도된 독특한 유전자 변이를 포함한다.

9. 제 1-6 실시태양의 임의의 하나에 따른 게놈 공학의 HTP 방법으로서, 초기 복수의 미생물은 S₁Gen₁으로 표시된 산업용 생산 균주 미생물 및 S_nGen_n으로 표시된 이로부터 유도된 임의의 수의 후속 미생물 세대를 포함한다.

10. 다음 단계를 포함하는 SNP 스왑 미생물 균주 라이브러리를 생성하는 방법:

a. 기준 미생물 균주 및 제 2 미생물 균주를 제공하는 단계, 여기서 제 2 미생물 균주는 기준 미생물 균주에 존재하지 않는 단일 뉴클레오타이드 다형성, DNA 삽입 및 DNA 결실로부터 선택된 복수의 확인된 유전자 변이를 포함한다; 및

b. 기준 미생물 균주 또는 제 2 미생물의 게놈을 교란시켜 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 SNP 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 각각의 독특한 유전자 변이는 기준 미생물 균주와 제 2 미생물 균주 사이의 복수의 확인된 유전자 변이로부터 선택된 단일 유전자 변이에 상응한다.

11. 제 10 실시태양에 따른 SNP 스왑 미생물 균주 라이브러리를 생성하는 방법으로서, 기준 미생물 균주의 게놈은 제 2 미생물 균주에서 발견되는 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 첨가하도록 교란된다.

12. 제 10 실시태양에 따른 SNP 스왑 미생물 균주 라이브러리를 생성하는 방법으로서, 제 2 미생물 균주의 게놈은 기준 미생물 균주에서 발견되지 않은 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 제거하도록 교란된다.

13. 제 10-12 실시태양에 따른 SNP 스왑 미생물 균주 라이브러리를 생성하는 방법으로서, 독특한 유전자 변이를 갖는 생성된 복수의 개별 미생물 균주는 기준 미생물 균주와 제 2 미생물 균주 사이의 모든 확인된 유전자 변이의 완전한 조합 라이브러리를 포함한다.

14. 제 10-12 실시태양에 따른 SNP 스왑 미생물 균주 라이브러리를 생성하는 방법으로서, 독특한 유전자 변이를 갖는 생성된 복수의 개별 미생물 균주는 기준 미생물 균주와 제 2 미생물 균주 사이의 모든 확인된 유전자 변이의 완전한 조합 라이브러리의 서브세트를 포함한다.

15. 다음 단계를 포함하는 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법:

a. 부모 계통의 미생물 균주 및 이로부터 유도된 산업용 미생물 균주를 제공하는 단계, 여기서 산업용 미생물 균주는 부모 계통 미생물 균주에 존재하지 않는 단일 뉴클레오타이드 다형성, DNA 삽입 및 DNA 결실로부터 선택된 복수의 확인된 유전자 변이를 포함한다;

b. 부모 계통 미생물 균주 또는 산업용 미생물 균주의 게놈을 교란시켜 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 SNP 스왑 미생물 균주 라이브러리를 생성하는 단계, 여기서 상기 독특한 유전자 변이의 각각은 부모 계통 미생물 균주와 산업용 미생물 균주 사이의 복수의 확인된 유전자 변이로부터 선택된 단일 유전자 변이에 해당한다;

c. 기준 미생물 균주에 대한 표현형 성능 개량을 위한 초기 SNP 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하여 상기 개별 미생물 균주에 표현형 성능 개량을 부여하는 독특한 유전자 변이를 확인하는 단계;

d. 선행 단계에서 선별된 적어도 2개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 SNP 스왑 미생물 균주 라이브러리를 생성하는 단계;

e. 기준 미생물 균주에 대한 표현형 성능 개량을 위한 후속 SNP 스왑 미생물 균주 라이브러리의 개별 미생물 균주 선별 및 선택하여 상기 미생물 균주에 추가 표현형 성능 개량을 부여하는 유전자 변이의 독특한 조합을 확인하는 단계; 및

f. 미생물 균주가 산업용 미생물 균주의 표현형 성능에 비해 원하는 수준의 개량된 표현형 성능을 나타낼 때까지 선형 또는 비선형 방식으로 단계 d)-e)를 1회 이상 반복하는 단계, 각각의 후속 반복은 선행 SNP 스왑 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 독특한 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 SNP 스왑 미생물 균주 라이브러리를 생성한다.

15.1. 제 15 실시태양에 따른 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법으로서, 확인된 유전자 변이는 프로모터 스왑 라이브러리로부터의 인공적인 프로모터 스왑 유전자 변이를 추가로 포함한다.

16. 제 15-15.1 실시태양에 따른 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법으로서, 독특한 유전자 변이를 갖는 생성된 복수의 개별 미생물 균주는 기준 미생물 균주와 제 2 미생물 균주 사이의 모든 확인된 유전자 변이의 완전한 조합 라이브러리를 포함한다.

17. 제 15-15.1 실시태양에 따른 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법으로서, 독특한 유전자 변이를 갖는 생성된 복수의 개별 미생물 균주는 기준 미생물 균주와 제 2 미생물 균주 사이의 모든 확인된 유전자 변이의 완전한 조합 라이브러리의 서브세트를 포함한다.

18. 제 15-17 실시태양에 따른 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법으로서, 유전자 변이의 독특한 조합을 갖는 생성된 후속 복수의 개별 미생물 균주는 선행 단계에서 선별된 개별 미생물 균주에 존재하는 모든 유전자 변이의 완전한 조합 라이브러리의 서브세트를 포함한다.

19. 제 15-18 실시태양에 따른 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법으로서, 부모 계통 미생물 균주의 게놈은 산업용 미생물 균주에서 발견되는 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 첨가하도록 교란된다.

20. 제 15-18 실시태양에 따른 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키는 방법으로서, 산업용 미생물 균주의 게놈은 부모 계통 미생물 균주에서 발견되지 않은 확인된 단일 뉴클레오타이드 다형성, DNA 삽입 또는 DNA 결실의 하나 이상을 제거하도록 교란된다.

21. 다음 단계를 포함하는 프로모터 스왑 미생물 균주 라이브러리를 생성하는 방법:

a. 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 프로모터 래더를 제공하는 단계, 여기서 상기 프로모터 래더는 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 프로모터를 포함한다; 및

b. 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 프로모터 스왑 미생물 균주 라이브러리를 생성하는 단계, 여기서 상기 독특한 유전자 변이의 각각은 기본 미생물 균주에 내인성인 표적 유전자의 하나에 작동가능하게 연결된 프로모터 래더로부터의 프로모터의 하나 이상을 포함한다.

22. 다음 단계를 포함하는 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 프로모터 스왑 방법:

a. 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 프로모터 래더를 제공하는 단계, 여기서 상기 프로모터 래더는 상기 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 프로모터를 포함한다;

b. 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 프로모터 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 독특한 유전자 변이의 각각은 기본 미생물 균주에 내인성인 표적 유전자의 하나에 작동가능하게 연결된 프로모터 래더로부터의 프로모터의 하나 이상을 포함한다;

c. 원하는 표현형에 대한 초기 프로모터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계;

d. 선행 단계에서 선별된 적어도 두 개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 프로모터 스왑 미생물 균주 라이브러리를 생성하는 단계;

e. 원하는 표현형에 대한 후속 프로모터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; 및

f. 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 1회 이상 단계 d)-e)를 반복하는 단계, 여기서 각각의 후속 반복은 선행 프로모터 스왑 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 프로모터 스왑 미생물 균주 라이브러리를 생성한다.

23. 제 22 실시태양에 따른 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 프로모터 스왑 방법으로서, 유전자 변이의 독특한 조합을 갖는 생성된 후속 복수의 개별 미생물 균주는 선행 단계에서 선별된 개별 미생물 균주에 존재하는 모든 유전자 변이의 완전한 조합 라이브러리의 서브세트를 포함한다.

23.1 제 22 실시태양에 따른 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 프로모터 스왑 방법으로서, 유전자 변이의 독특한 조합을 갖는 생성된 후속 복수의 개별 미생물 균주는 선행 단계에서 선별된 개별 미생물 균주에 존재하는 모든 유전자 변이의 완전한 조합 라이브러리를 포함한다.

24. 다음 단계를 포함하는 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 방법:

a. 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 터미네이터 래더를 제공하는 단계, 여기서 상기 터미네이터 래더는 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 터미네이터를 포함한다;

b. 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 독특한 유전자 변이의 각각은 터미네이터 래더로부터의 터미네이터의 하나 이상에 작동가능하게 연결된 기본 미생물 균주에 내인성인 표적 유전자의 하나를 포함한다.

25. 다음 단계를 포함하는 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 터미네이터 스왑 방법:

a. 기본 미생물 균주에 내인성인 복수의 표적 유전자 및 터미네이터 래더를 제공하는 단계; 여기서 상기 터미네이터 래더는 상기 기본 미생물 균주에서 상이한 발현 프로파일을 나타내는 복수의 터미네이터를 포함한다;

b. 기본 미생물 균주의 게놈을 조작하여 상기 복수의 개별 미생물 균주의 각각의 균주 내에서 발견된 독특한 유전자 변이를 갖는 복수의 개별 미생물 균주를 포함하는 초기 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 단계, 상기 독특한 유전자 변이의 각각은 터미네이터 래더로부터의 터미네이터의 하나 이상에 작동가능하게 연결된 기본 미생물 균주에 내인성인 표적 유전자의 하나를 포함한다;

c. 원하는 표현형에 대한 초기 터미네이터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계;

d. 선행 단계에서 선별된 적어도 두 개의 개별 미생물 균주에 존재하는 유전자 변이로부터 선택된 유전자 변이의 독특한 조합을 각각 포함하는 후속 복수의 미생물을 제공하여 후속 터미네이터 스왑 미생물 균주 라이브러리를 생성하는 단계;

e. 원하는 표현형에 대한 후속 터미네이터 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하는 단계; 및

f. 미생물이 원하는 표현형을 획득할 때까지 선형 또는 비선형 방식으로 1회 이상 단계 d)-e)를 반복하는 단계, 여기서 각각의 후속 반복은 선행 터미네이터 스왑 미생물 균주 라이브러리의 적어도 두 개의 개별 미생물 균주 중에서 선택된 유전자 변이의 조합인 유전자 변이를 제공하는 개별 미생물 균주를 포함하는 새로운 터미네이터 스왑 미생물 균주 라이브러리를 생성한다.

26. 제 25 실시태양에 따른 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 프로모터 스왑 방법으로서, 유전자 변이의 독특한 조합을 갖는 생성된 후속 복수의 개별 미생물 균주는 선행 단계에서 선별된 개별 미생물 균주에 존재하는 모든 유전자 변이의 완전한 조합 라이브러리의 서브세트를 포함한다.

26.1 제 25 실시태양에 따른 원하는 표현형을 획득하기 위해 미생물을 진화시키는 게놈 공학의 프로모터 스왑 방법으로서, 유전자 변이의 독특한 조합을 갖는 생성된 후속 복수의 개별 미생물 균주는 선행 단계에서 선별된 개별 미생물 균주에 존재하는 모든 유전자 변이의 완전한 조합 라이브러리를 포함한다.

27. 원하는 표현형을 획득하기 위해 미생물을 진화시키기 위한 고 처리량(HTP) 게놈 공학 시스템으로서,

하나 이상의 프로세서; 및

하나 이상의 프로세서의 적어도 하나에 동작 가능하게 결합되고, 하나 이상의 프로세서의 적어도 하나에 의해 실행될 때, 시스템이 다음 단계를 실행하게 하는 저장된 명령어를 갖는 하나 이상의 메모리를 포함하는 고 처리량 게놈 공학 시스템:

28. 원하는 표현형을 획득하기 위해 미생물을 진화시키기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

29. SNP 스왑 미생물 균주 라이브러리를 생성하는 시스템으로서

하나 이상의 프로세서; 및

하나 이상의 프로세서의 적어도 하나에 동작 가능하게 결합되고, 하나 이상의 프로세서의 적어도 하나에 의해 실행될 때, 시스템이 다음 단계를 실행하게 하는 저장된 명령어를 갖는 하나 이상의 메모리를 포함하는 시스템:

30. SNP 스왑 미생물 균주 라이브러리를 생성하기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

31. 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키기 위한 시스템으로서,

하나 이상의 프로세서; 및

c. 기준 미생물 균주에 대한 표현형 성능 개량을 위한 초기 SNP 스왑 미생물 균주 라이브러리의 개별 미생물 균주를 선별 및 선택하여 상기 미생물 균주에 표현형 성능 개량을 부여하는 독특한 유전자 변이를 확인하는 단계;

32. 산업용 미생물 균주의 표현형 성능을 재건 및 개량시키기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

33. 프로모터 스왑 미생물 균주 라이브러리를 생성하기 위한 시스템으로서,

하나 이상의 프로세서; 및

34. 프로모터 스왑 미생물 균주 라이브러리를 생성하기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

35, 원하는 표현형을 획득하기 위해 프로모터 스왑을 통해 미생물을 진화시키는 게놈 공학 시스템으로서,

하나 이상의 프로세서; 및

36. 원하는 표현형을 획득하기 위해 프로모터 스왑을 통해 미생물을 진화시키기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

37. 터미네이터 스왑 미생물 균주 라이브러리를 생성하기 위한 시스템으로서, 하나 이상의 프로세서; 및

38. 터미네이터 스왑 미생물 균주 라이브러리를 생성하기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

39. 원하는 표현형을 획득하기 위해 터미네이터 스왑을 통해 미생물을 진화시키는 게놈 공학 시스템으로서,

하나 이상의 프로세서; 및

40. 원하는 표현형을 획득하기 위해 터미네이터 스왑을 통해 미생물을 진화시키기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

41. 다음 단계를 포함하는 후보 미생물 균주의 디자인을 반복적으로 개량하기 위한 컴퓨터 실행 방법:

a. (1) 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 나타내는 입력 및 (2) 상응하는 성능 측정치를 포함하는 훈련 세트로 채워진 예측 모델에 접근하는 단계;

b. 유전자 변화를 나타내는 예측 모델에 테스트 입력을 적용하는 단계로서, 테스트 입력은 유전자 변화를 포함하는 후보 미생물 균주에 상응한다;

c. 예측 모델에 적어도 부분적으로 기초하여 후보 미생물 균주의 표현형 성능을 예측하는 단계;

d. 적어도 부분적으로 예측된 성능에 기초하여 후보 미생물 균주의 제 1 서브세트를 선택하는 단계;

e. 후보 미생물 균주의 제 1 서브세트의 측정된 표현형 성능을 얻는 단계;

f. 측정된 표현형 성능에 적어도 부분적으로 기초하여 후보 미생물 균주의 제 2 서브세트를 선택하는 단계;

g. (1) 후보 미생물 균주의 선택된 제 2 서브세트에 상응하는 입력과 함께 (2) 후보 미생물 균주의 선택된 제 2 서브세트의 상응하는 측정된 성능을 예측 모델의 훈련 세트에 추가하는 단계; 및

h. (b)-(g)를 반복하는 단계.

42. 제 41 실시태양의 방법으로서, (b)-(g)를 반복하는 단계는 적어도 하나의 후보 미생물 균주의 측정된 표현형 성능이 성능 메트릭을 만족시킬 때까지 (b)-(g)를 반복하는 단계를 포함한다.

43. 제 41 실시태양의 방법으로서,

예측 모델에 테스트 입력을 처음 적용하는 동안, 테스트 입력에 의해 나타나는 유전자 변화는 하나 이상의 배경 미생물 균주에 대한 유전자 변화를 포함한다; 및

테스트 입력의 후속 적용 동안, 테스트 입력에 의해 나타나는 유전자 변화는 이전에 선택된 후보 미생물 균주의 제 2 서브세트 내의 후보 미생물 균주에 대한 유전자 변화를 포함한다.

44. 제 41 실시태양의 방법으로서, 후보 미생물 균주의 제 1 서브세트의 선택은 상위성 효과에 적어도 부분적으로 기초한다.

45. 제 44 실시태양의 방법으로서, 상위성 효과에 적어도 부분적으로 기초한 제 1 서브 세트의 선택은 다음 단계를 포함한다:

제 1 서브세트의 제 1 선택 동안:

하나 이상의 배경 미생물 균주에 대한 유전자 변화를 나타내는 복수의 각각의 입력의 적용에 응답하여 하나 이상의 배경 미생물 균주의 성능 측정 사이의 비유사도를 결정하는 단계; 및

적어도 두 개의 후보 미생물 균주에 포함된 유전자 변화의 적용에 응답하여 하나 이상의 배경 미생물 균주의 성능 측정의 비유사도에 적어도 부분적으로 기초하여 적어도 두 개의 후보 미생물 균주를 제 1 서브세트에 포함시키는 것을 선택하는 단계.

46. 제 45 실시태양의 방법으로서,

제 1 서브세트의 후속 선택 동안:

유전자 변화를 나타내는 복수의 각각의 입력의 적용에 응답하여 이전의 제 1 서브세트 후보 미생물 균주의 성능 측정 사이의 비유사도를 결정하는 단계, 여기서 이전의 제 1 서브세트 후보 미생물 균주는 제 1 서브세트의 이전 선택 동안 선택된 균주이다; 및

적어도 두 개의 후보 미생물 균주에 포함된 유전자 변화의 적용에 응답하여 이전의 제 1 서브세트 후보 미생물 균주의 성능 측정의 비유사도에 적어도 부분적으로 기초하여 적어도 두 개의 후보 미생물 균주를 제 1 서브세트에 포함시키는 것을 선택하는 단계.

47. 후보 미생물 균주의 디자인을 반복적으로 개량하기 위한 시스템으로서,

하나 이상의 프로세서; 및

h. (b)-(g)를 반복하는 단계.

48. 제 47 실시태양의 시스템으로서, 하나 이상의 프로세서의 적어도 하나에 의해 실행될 때, 명령어가 시스템이 적어도 하나의 후보 미생물 균주의 측정된 표현형 성능이 성능 메트릭을 만족시킬 때까지 (b)-(g)를 반복하게 한다.

49. 제 47 실시태양의 시스템으로서,

50. 제 47 실시태양의 시스템으로서,

후보 미생물 균주의 제 1 서브세트의 선택은 상위성 효과에 적어도 부분적으로 기초한다.

51. 제 50 실시태양의 시스템으로서,

하나 이상의 프로세서의 적어도 하나에 의해 실행될 때, 명령어가, 제 1 서브세트의 제 1 선택 동안, 시스템이 다음 단계를 실행하게 하는 시스템:

52. 제 51 실시태양의 시스템으로서,

하나 이상의 프로세서의 적어도 하나에 의해 실행될 때, 명령어가, 제 1 서브세트의 후속 선택 동안, 시스템이 다음 단계를 실행하게 하는 시스템:

53. 후보 미생물 균주의 디자인을 반복적으로 개량하기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

h. (b)-(g)를 반복하는 단계.

54. 제 53 실시태양의 컴퓨터 판독가능한 매체로서,

실행될 때, 명령어가 하나 이상의 프로세서의 적어도 하나가 적어도 하나의 후보 미생물 균주의 측정된 표현형 성능이 성능 메트릭을 만족시킬 때까지 (b)-(g)를 반복하게 하는 컴퓨터 판독가능한 매체.

55. 제 53 실시태양의 컴퓨터 판독가능한 매체로서,

테스트 입력의 후속 적용 동안, 테스트 입력에 의해 나타나는 유전자 변화는 이전에 선택된 후보 미생물 균주의 제 2 서브세트 내의 후보 미생물 균주에 대한 유전자 변화를 포함하는 컴퓨터 판독가능한 매체.

56. 제 53 실시태양의 컴퓨터 판독가능한 매체로서, 후보 미생물 균주의 제 1 서브세트의 선택은 상위성 효과에 적어도 부분적으로 기초하는 컴퓨터 판독가능한 매체.

57. 제 56 실시태양의 컴퓨터 판독가능한 매체로서,

실행될 때, 명령어가, 제 1 서브세트의 제 1 선택 동안, 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 컴퓨터 판독가능한 매체:

58. 제 53 실시태양의 컴퓨터 판독가능한 매체로서,

실행될 때, 명령어가, 제 1 서브세트의 후속 선택 동안, 하나 이상의 프로세서의 적어도 하나가 다음 단계를 실행하게 하는 컴퓨터 판독가능한 매체:

59. 다음 단계를 포함하는 후보 미생물 균주의 반복적인 개량에 상위성 효과를 적용하기 위한 컴퓨터 실행 방법:

적어도 하나의 미생물 배경 균주에 대해 행해진 상응하는 유전자 변화에 응답하여 측정된 성능을 나타내는 데이터를 얻는 단계;

적어도 두 개의 유전자 변화의 상응하는 반응성 측정 사이의 비유사도에 적어도 부분적으로 기초하여 적어도 두 개의 유전자 변화를 선택하는 단계,

상기 비유사도는 상기 적어도 두 개의 유전자 변화가 상이한 생물학적 경로를 통한 이들의 상응하는 반응성 성능 측정에 영향을 미치는 정도와 관련된다; 및

선택된 유전자 변화를 포함하는 미생물 배경 균주에 대한 유전자 변화를 디자인하는 단계.

60. 제 59 실시태양의 방법으로서, 적어도 두 개의 선택된 유전자 변화가 디자인되는 미생물 배경 균주는 측정된 반응 성능을 나타내는 데이터가 얻어진 적어도 하나의 미생물 배경 균주와 동일하다.

61. 후보 미생물 균주의 반복적인 개량에 상위성 효과를 적용하기 위한 시스템으로서,

하나 이상의 프로세서; 및

62. 제 61 실시태양의 시스템으로서, 적어도 두 개의 선택된 유전자 변화가 디자인되는 미생물 배경 균주는 측정된 반응 성능을 나타내는 데이터가 얻어진 적어도 하나의 미생물 배경 균주와 동일하다.

63. 후보 미생물 균주의 반복적인 개량에 상위성 효과를 적용하기 위한 명령어를 저장하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체로서, 하나 이상의 컴퓨팅 장치에 의해 실행될 때, 명령어가 하나 이상의 컴퓨팅 장치의 적어도 하나가 다음 단계를 실행하게 하는 하나 이상의 비 일시적 컴퓨터 판독가능한 매체:

64. 제 63 실시태양의 컴퓨터 판독가능한 매체로서, 적어도 두 개의 선택된 유전자 변화가 디자인되는 미생물 배경 균주는 측정된 반응 성능을 나타내는 데이터가 얻어진 적어도 하나의 미생물 배경 균주와 동일하다.

본 발명에 인용된 모든 참고문헌, 기사, 간행물, 특허, 특허 간행물 및 특허 출원은 모든 목적을 위해 그 전문이 참조로 포함된다. 그러나 본 발명에 언급된 모든 참고문헌, 기사, 출판물, 특허, 특허 간행물 및 특허 출원은 세계 어느 나라에서든 유효한 선행 기술을 구성하거나 보통의 일반 지식의 일부를 구성한다는 인정 또는 어떠한 형태의 제안으로 간주되어서는 안 된다.

SEQUENCE LISTING <110> Zymergen, Inc. Dean, Jed Serber, Zach Manchester, Shawn Gora, Kasia Flashman, Michael Shellman, Erin <120> MICROBIAL STRAIN IMPROVEMENT BY A HTP GENOMIC ENGINEERING PLATFORM <130> ZYMR-001/01WO 327574-2016 <150> US 62/368,786 <151> 2016-07-29 <150> US 15/140,296 <151> 2016-04-27 <150> US 62/264,232 <151> 2015-12-07 <160> 16 <170> PatentIn version 3.5 <210> 1 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007_lib_39 <400> 1 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtat tatggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 2 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007 <400> 2 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtaa gatggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 3 <211> 93 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg1860 <400> 3 cttagctttg acctgcacaa atagttgcaa attgtcccac atacacataa agtagcttgc 60 gtatttaaaa ttatgaacct aaggggttta gca 93 <210> 4 <211> 98 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0755 <400> 4 aataaattta taccacacag tctattgcaa tagaccaagc tgttcagtag ggtgcatggg 60 agaagaattt cctaataaaa actcttaagg acctccaa 98 <210> 5 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007_265 <400> 5 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgtac gctggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 6 <211> 86 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg3381 <400> 6 cgccggataa atgaattgat tattttaggc tcccagggat taagtctagg gtggaatgca 60 gaaatatttc ctacggaagg tccgtt 86 <210> 7 <211> 97 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg0007_119 <400> 7 tgccgtttct cgcgttgtgt gtggtactac gtggggacct aagcgtgttg catggaaacg 60 tctgtatcgg ataagtagcg aggagtgttc gttaaaa 97 <210> 8 <211> 87 <212> DNA <213> Unknown <220> <223> Expression promoter derived from Pcg3121 <400> 8 gtggctaaaa cttttggaaa cttaagttac ctttaatcgg aaacttattg aattcgggtg 60 aggcaactgc aactctggac ttaaagc 87 <210> 9 <211> 25 <212> DNA <213> Unknown <220> <223> cg0001 Terminator <400> 9 gacccatctt cggatgggtc ttttt 25 <210> 10 <211> 30 <212> DNA <213> Unknown <220> <223> cg0007 Terminator <400> 10 cccgcccctg gaattctggg ggcgggtttt 30 <210> 11 <211> 24 <212> DNA <213> Unknown <220> <223> cg0371 Terminator <400> 11 ccggtaactt ttgtaagttg ccgg 24 <210> 12 <211> 27 <212> DNA <213> Unknown <220> <223> cg0480 Terminator <400> 12 cccctcagaa gcgattctga ggggttt 27 <210> 13 <211> 28 <212> DNA <213> Unknown <220> <223> cg0494 Terminator <400> 13 gcaccgcctt tcggggcggt gctttttt 28 <210> 14 <211> 28 <212> DNA <213> Unknown <220> <223> cg0564 Terminator <400> 14 ggccccatgc tttgcatggg gtcttttt 28 <210> 15 <211> 30 <212> DNA <213> Unknown <220> <223> cg0610 Terminator <400> 15 gcacttacct taactggtag gtgctttttt 30 <210> 16 <211> 24 <212> DNA <213> Unknown <220> <223> cg0695 Terminator <400> 16 acccggtcac cagaccgggt cttt 24

Claims

개선된 표현형 성능을 갖도록 숙주 세포를 조작하기 위한 고 처리량(high-throughput) 방법으로서,
a. 하나 이상의 유전자 변형 입력 변수들 및 하나 이상의 측정된 표현형 성능 출력 변수들을 포함하는 훈련 데이터 세트에 접근하는 단계,
i. 여기서 하나 이상의 유전자 변형 입력 변수들은 하나 이상의 라이브러리들의 적용을 통해 숙주 세포에 도입된 하나 이상의 유전자 변형들을 나타내며,
ii. 여기서 하나 이상의 측정된 표현형 성능 출력 변수들은 도입된 유전자 변형들과 관련된 하나 이상의 표현형 성능 측정치들을 나타낸다;
b. 훈련 데이터 세트로 채워진 예측 기계 학습 모델을 개발하는 단계;
c. 하나 이상의 유전자 변형들을 포함하는 디자인 후보 숙주 세포들의 풀을 인 실리코(in silico)로 생성하는 단계;
d. 예측 기계 학습 모델을 이용하여 디자인 후보 숙주 세포들의 풀의 각 구성원의 예상되는 표현형 성능을 예측하는 단계,
i. 여기서 적어도 하나의 디자인 후보 숙주 세포가 단계 (a)의 유전자 변형들 중에서 유전자 변형들의 통합된 조합을 포함하며, 게놈 서열에서, 상기 조합은 단계 (d)가 수행되는 시점에서 표현형 성능을 개선하기 위해 특징지어지지 않고,
ii. 여기서 기계 학습 모델에 의해 예측된 예상되는 표현형 성능은 단계 (a)의 도입된 유전자 변형들 및 이들의 관련된 표현형 성능 측정치들에 기초한다; 및
e. 조작된 숙주 세포들을 생성하는데 사용하기 위한 디자인 후보 숙주 세포들의 서브세트를 제공하는 단계를 포함하는 것인 고 처리량 방법.
제 1 항에 있어서,
하나 이상의 라이브러리들은 프로모터 스왑 라이브러리, SNP 스왑 라이브러리, 개시/정지 코돈 라이브러리, 최적화된 서열 라이브러리, 터미네이터 스왑 라이브러리, 및 이들의 조합들로 이루어진 그룹으로부터 선택된 것인 방법.
제 1 항에 있어서,
예측 기계 학습 모델은 상위성 효과(epistatic effect)를 포함하는 것인 방법.
제 1 항에 있어서,
예측 기계 학습 모델은 선형 회귀, 커널 릿지 회귀, 로지스틱 회귀, 신경망, 지지 벡터 기계(SVM), 결정 트리, 숨겨진 마르코프 모델, 베이지안 네트워크, 그램-슈미트 프로세스, 보강-기반 학습, 클러스터 기반 학습, 계층적 클러스터링, 유전자 알고리즘, 또는 이들의 조합들 중 적어도 하나를 포함하는 것인 방법.
제 1 항에 있어서,
예측 기계 학습 모델은 감독된, 반-감독된 또는 감독되지 않은 것인 방법.
제 1 항에 있어서,
하나 이상의 유전자 변형들은 단일 뉴클레오타이드 다형성, 뉴클레오타이드 서열 삽입, 뉴클레오타이드 서열 결실, 및 뉴클레오타이드 서열 대체로 이루어진 그룹으로부터 선택된 적어도 하나의 유전자 변형을 포함하는 것인 방법.
제 1 항에 있어서,
하나 이상의 유전자 변형들은 내인성 표적 유전자에 작동가능하게 연결된 프로모터 래더로부터의 하나 이상의 이종 프로모터들을 포함하는 것인 방법.
제 1 항에 있어서,
개선된 표현형 성능은 관심 생성물의 증가된 또는 보다 효율적인 생산이며, 상기 관심 생성물은 소분자, 효소, 단백질, 펩타이드, 아미노산, 유기산, 합성 화합물, 연료, 알코올, 1차 세포외 대사산물, 2차 세포외 대사산물, 세포내 성분 분자 및 이들의 조합들로 이루어진 그룹으로부터 선택되는 것인 방법.
제 8 항에 있어서,
개선된 표현형 성능은 라이신 또는 시트르산의 증가된 또는 보다 효율적인 생산인 방법.
제 1 항에 있어서,
조작된 숙주 세포들을 생성하기 위해 디자인 후보 숙주 세포들의 서브세트의 적어도 하나의 구성원을 제조하는 단계 (f)를 포함하며, 여기서 (a)-(f)는 조작된 숙주 세포가 원하는 수준의 개선된 표현형 성능을 나타낼 때까지 반복되는 것인 방법.
유전자 변형들의 유익한 조합들을 갖도록 숙주 세포를 조작하는 방법으로서,
a. i) 숙주 세포에 도입된 적어도 하나의 유전자 변형을 나타내는 적어도 하나의 유전자 변형 입력 변수, 및 ii) 도입된 유전자 변형과 관련된 적어도 하나의 표현형 성능 측정치를 나타내는 적어도 하나의 측정된 표현형 성능 출력 변수를 포함하는 훈련 데이터 세트로 예측 기계 학습 모델을 채우는 단계;
b. 적어도 하나의 유전자 변형을 포함하는 디자인 후보 숙주 세포들의 풀을 인 실리코(in silico)로 생성하는 단계;
c. 예측 기계 학습 모델을 이용하여 단계 (c)가 수행되는 시점에서 표현형 성능을 개선하기 위해 특징지어지지 않은 단계 (a)로부터 선택된 유전자 변형들의 조합을 포함하는 디자인 후보 숙주 세포들의 풀의 구성원들의 예상되는 표현형 성능을 예측하는 단계; 및
d. 단계 (c)의 디자인 후보 숙주 세포들의 풀의 구성원을 제조하는 단계를 포함하는 것인 숙주 세포를 조작하는 방법.
제 11 항에 있어서,
예측 기계 학습 모델은 선형 회귀, 커널 릿지 회귀, 로지스틱 회귀, 신경망, 지지 벡터 기계(SVM), 결정 트리, 숨겨진 마르코프 모델, 베이지안 네트워크, 그램-슈미트 프로세스, 보강-기반 학습, 클러스터 기반 학습, 계층적 클러스터링, 유전자 알고리즘, 또는 이들의 조합들 중 적어도 하나를 포함하는 것인 방법.
제 11 항에 있어서,
예측 기계 학습 모델은 상위성 효과(epistatic effect)를 포함하는 것인 방법.
제 11 항에 있어서,
예측 기계 학습 모델은 감독된, 반-감독된 또는 감독되지 않은 것인 방법.
제 11 항에 있어서,
적어도 하나의 유전자 변형은 단일 뉴클레오타이드 다형성, 뉴클레오타이드 서열 삽입, 뉴클레오타이드 서열 결실, 및 뉴클레오타이드 서열 대체로 이루어진 그룹으로부터 선택되는 것인 방법.
제 11 항에 있어서,
적어도 하나의 유전자 변형은 내인성 표적 유전자에 작동가능하게 연결된 프로모터 래더로부터의 하나 이상의 이종 프로모터들을 포함하는 것인 방법.
제 11 항에 있어서,
개선된 표현형 성능은 관심 생성물의 증가된 또는 보다 효율적인 생산이며, 상기 관심 생성물은 소분자, 효소, 단백질, 펩타이드, 아미노산, 유기산, 합성 화합물, 연료, 알코올, 1차 세포외 대사산물, 2차 세포외 대사산물, 세포내 성분 분자 및 이들의 조합들로 이루어진 그룹으로부터 선택되는 것인 방법.
제 17 항에 있어서,
개선된 표현형 성능은 라이신 또는 시트르산의 증가된 또는 보다 효율적인 생산인 방법.
제 11 항에 있어서,
(a)-(d)는 제조된 디자인 후보 숙주 세포들의 풀의 구성원이 원하는 수준의 개선된 표현형 성능을 나타낼 때까지 반복되는 것인 방법.