KR101420991B1 - 테르펜 합성효소 변이체들을 개발하는 방법들 - Google Patents
테르펜 합성효소 변이체들을 개발하는 방법들 Download PDFInfo
- Publication number
- KR101420991B1 KR101420991B1 KR1020137023002A KR20137023002A KR101420991B1 KR 101420991 B1 KR101420991 B1 KR 101420991B1 KR 1020137023002 A KR1020137023002 A KR 1020137023002A KR 20137023002 A KR20137023002 A KR 20137023002A KR 101420991 B1 KR101420991 B1 KR 101420991B1
- Authority
- KR
- South Korea
- Prior art keywords
- synthase
- terpene
- control
- test
- terpene synthase
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/25—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving enzymes not classifiable in groups C12Q1/26 - C12Q1/66
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/527—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving lyase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/03—Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
- C12Y402/03047—Beta-farnesene synthase (4.2.3.47)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 개시는 조작된 숙주 세포들을 통해 테르펜 합성효소 변이체들을 개발하는 방법들에 관한 것이다. 상세하게, 본 개시는 테르펜 산물들의 상업적인 생산에 유용한 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들을 개발하는 방법들을 제공한다. 또한 본 개시에는 우월한 테르펜 합성효소 변이체들 및 이러한 테르펜 합성효소 변이체들을 포함하는 숙주 세포들이 포함된다.
Description
본 발명은 조작된 숙주 세포들을 통하여 테르펜 합성효소 변이체들을 개발하는 방법들에 관한 것이다. 상세하게, 본 발명은 테르펜 산물들의 상업적인 생산에 유용한 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들을 개발하는 방법들을 제공한다. 또한 본 발명에는 우월한 테르펜 합성효소 변이체들 및 이러한 테르펜 합성효소 변이체들을 포함하는 숙주 세포들이 포함된다.
테르펜들 (terpenes)은 많은 생물들에서 생산되는 탄화수소들의 대분류의 하나이다. 그들은 이소프렌 (C5H8)의 연결 단위들에 의해 유래되고, 존재하는 이소프렌 단위들의 수에 의해 분류된다. 헤미테르펜들 (hemiterpenes)은 단일한 이소프렌 단위로 구성된다. 이소프렌 자체는 헤미테르펜으로만 고려된다. 모노테르펜들은 두 개의 이소프렌 단위들로 만들어지고, 분자식 C10H16을 가진다. 모노테르펜들의 예들로는 게라니올 (geraniol), 리모넨 (limonene), 및 테르피네올 (terpineol)이 있다. 세스퀴테르펜들 (sesquiterpenes)은 세 개의 이소프렌 단위들로 구성되고, 분자식 C15H24을 가진다. 세스퀴테르펜들의 예들로는 파네센 (farnesenes), 파네솔 (farnesol) 및 패추롤 (patchoulol)이 있다. 디테르펜들은 네 개의 이소프렌 단위들로 구성되고, 분자식 C20H32를 가진다. 디테르펜들의 예들로는 카페스톨 (cafestol), 카후올 (kahweol), 켐브렌 (cembrene), 및 택사디엔 (taxadiene)이 있다. 세스터테르펜들 (sesterterpenes)은 다섯 개의 이소프렌 단위들로 구성되고, 분자식 C25H40을 가진다. 세스터테르펜들의 예로는 게라닐파네솔 (geranylfarnesol)이 있다. 트리테르펜들은 여섯 개의 이소프렌 단위들로 구성되고, 분자식 C30H48을 가진다. 테트라테르펜들은 여덟 개의 이소프렌 단위들로 구성되고, 분자식 C40H64를 가진다. 생물학적으로 중요한 테트라테르펜들로는 비고리 라이코펜 (lycopene), 단일고리 감마-카로틴 (gamma-carotene), 및 이중고리 알파- 및 베타-카로틴들을 포함한다. 폴리테르펜들은 많은 이소프렌 단위들의 긴 사슬들로 구성된다. 천연 고무는 이중 결합이 시스 (cis)인 폴리이소프렌으로 구성된다.
테르펜들은 화학적으로 변형될 때 (예로, 산화 또는 탄소 골격의 재배열을 통해), 그 결과 얻은 화합물들은 이소프레노이드류 (isoprenoids)라고도 알려져 있는 테르페노이드류 (terpenoids)라고 일반적으로 말한다. 이소프레노이드들은, 예를 들면 전자 전달 회로들에서 퀴논들 (quinones)로서, 세포하 표적화 및 단백질 프레닐화를 통한 조절에서 막들의 구성성분들로서, 카로티노이드류, 클로로필을 포함하는 광합성 색소들로서, 호르몬들 및 조효소들로서, 또한 다양한 모노테르펜들, 세스퀴테르펜들, 및 디테르펜들을 가진 식물 방어 화합물들로서, 많은 중요한 생물학적 역할들을 한다. 그들은 항생제들, 호르몬들, 항암 약물들, 살충제들, 및 화학물질들로서 산업적으로 유용하다.
테르펜들은 이소펜테닐 피로포스페이트 (이소펜테닐 디포스페이트 또는 IPP) 및 그의 이성질체 디메틸알릴 피로포스페이트 (디메틸알릴 디포스페이트 또는 DMAPP)의 응축들을 통하여 생합성된다. 두 개의 경로들이 IPP 및 DMAPP를 생성하는 것으로 알려져 있고, 즉 진핵생물들의 메발로네이트-의존성 (MEV) 경로, 및 원핵생물들의 메발로네이트-비의존성 데옥시자일루오스-5-포스페이트 (DXP) 경로이다. 식물들은 MEV 경로 및 DXP 경로 둘 다를 사용한다. 다음 순서로 IPP 및 DMAPP가 프레닐 디스포스페이트 합성효소들 (예로, 각각 GPP 합성효소, FPP 합성효소, 및 GGPP 합성효소)의 작용을 통하여 폴리프레닐 디포스페이트들 (예로, 게라닐 디스포스페이트 또는 GPP, 파네실 디포스페이트 또는 FPP, 또한 게라닐게라닐 디포스페이트 또는 GGPP)로 응축된다.
폴리프레닐 디포스페이트 중간물들은 테르펜 합성효소들에 의해 더 복잡한 이소프레노이드 구조들로 전환된다. 테르펜 합성효소들은 복수의 산물들을 형성하는 큰 유전자 패밀리들로 조직화된다. 테르펜 합성효소들의 예들로는 FPP를 세스퀴테르펜들로 전환하는 세스퀴테르펜 합성효소들을 포함한다. 세스퀴테르펜 합성효소의 예로는 FPP를 파네센으로 전환하는 파네센 합성효소를 포함한다. 테르펜 합성효소들의 반응 기작은 광범위하게 연구되어 왔고 잘 이해되어 있다. 전반적으로, 세 개의 단계들이 FPP와 같은 디포스페이트 기질을 그의 이소프레노이드 산물로 전환하는 데 요구된다: a) 효소-기질 복합체 (ES)의 형성, b) 효소-결합 반응성 탄화수소 중간물의 형성, 이어지는 재배열들, 및 산물 (EP)의 형성, 또한 c) 효소-산물 복합체로부터 산물의 방출. 테르펜 합성효소 촉매화된 반응들에 관한 시험관내 역학적 및 전-안정기 역학적 연구들은 반응들을 위한 전반적인 속도-결정 단계가 산물의 방출인 점을 보여주었다 (Cane et al . (1997) Biochemistry , 36(27):8332-9, 및 Mathis et al . (1997) Biochemistry 36(27):8340-8). 테르펜 합성효소들의 회전율들은 낮고, 일반적으로 초당 0.5 이하로 측정된다 (Cane, D. C. (1990) Chem . Rev . 90:1089-1103).
테르펜 합성효소들은 이소프레노이드로의 유동 경로의 조절에서 그들이 대사적 분지 지점들을 작동시키고 종종 프레닐 디포스페이트 풀을 위한 다른 대사적 효소들과 경쟁하기 때문에 중요하다. 예를 들면, FPP는 스쿠알렌 (squalene), 돌리콜들 (dolichols), 및 보조인자 헴을 포함하는 많은 세포성 분자들로 가는 전구체이다. 파네센과 같은 세스퀴테르펜들의 생산이 기대되는 조작된 미생물들에서 테르펜 합성효소들은 이러한 테르펜들의 높은 생산 수율로의 핵심이 된다. 그러나, 그들이 느린 효소들이기 때문에, 테르펜 합성효소들은 종종 대사적 경로들에서 병목 현상을 일으킨다. 또한, 그들은 조작된 미생물 숙주들에서 테르펜들의 효율적인 생산을 위해 요구되는 역학적 능력을 제한하는 기질 저해와 같은 기타 단점들로 겪을 수 있다 (Crock et al . (1997) Proc . Natl . Acad . Sci . USA 94:12833-12838).
따라서, 테르펜 합성효소들의 촉매적 효율을 이들 효소들이 전반적인 이소프레노이드로의 대사적 흐름을 더 이상 제한하지 않도록 개선하는 것은 잠재적으로 엄청난 유익들이 존재한다. 변경된 산물 특이도를 위해 테르펜 합성효소들을 조작하는 시도들뿐만 아니라 구조적 유도 (guidance) 또는 적응적 진화를 기초로 하는 시도들과 같은 합리적인 접근법들의 사용이 이전에 기술되어 왔다 (Greenhagen et al . (2006) Proc . Natl . Acad . Sci . USA 103:9826-9831; O'Maille et al . (2008) Nat . Chem . Biol . 4:617-623; Yoshikuni et al . (2006) Nature 440:1078-1082; Yoshikuni et al . (2008) Chem . Biol . 15:607-618). 그러나, 이들 연구들은 테르펜 합성효소들의 산물 특이도도 유지하면서 그들의 역학적 용량을 개선하는 데는 부족하였다. 또한, 유도된 (directed) 진화와 같은 통상적인 단백질 조작 전략들의 적용이, 일차적으로 사용가능하고 효과적인 고처리량 검색 방법들 (high throughput screening method)의 결여 때문에 테르펜 합성효소들을 위해서는 전혀 없었다 (Yoshikuni et al . (2008) (supra)). 따라서 테르펜 합성효소들의 촉매적 효율을 개선하는 신뢰가능하고 고처리량 방법들을 위한, 또한 이러한 개선된 촉매적 효율을 가지는 테르펜 합성효소 변이체들을 위한 필요성이 여전히 존재한다.
본 발명은 조작된 숙주 세포들을 통하여 테르펜 합성효소 변이체들을 개발하는 방법들에 관한 것이다. 상세하게, 본 발명은 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들을 개발하는 방법들을 제공한다. 본 방법들은 이들 효소들의 생체내 성능의 계속된 개선도 역시 허용한다.
한 가지 관점에서, 본 발명은
(a) 대조군 세스퀴테르펜 합성효소를 발현하는 숙주세포를 올라간 수준의 FPP를 포함하도록 조작하고, 상기 올라간 수준의 FPP는 상기 숙주세포의 생존도를 올라간 수준의 FPP를 포함하지 않는 부모 세포와 대비하여 감소시키고;
(b) 상기 숙주세포에서는 상기 대조군 세스퀴테르펜 합성효소 대신에 상기 테스트 세스퀴테르펜 합성효소를 발현시키고, 상기 테스트 세스퀴테르펜 합성효소는 상기 대조군 세스퀴테르펜 합성효소의 변이체이고: 또한
(c) 상기 대조군 세스퀴테르펜 합성효소를 발현하는 상기 숙주세포와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 발현하는 숙주세포의 생존도에서 증가에 의해, 상기 대조군 세스퀴테르펜 합성효소와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 개선된 생체내 성능을 가지는 것으로서 확인하는:
단계들을 포함하는, 개선된 생체내 성능을 가진 세스퀴테르펜 합성효소 변이체의 검색 방법을 제공한다.
일정 구현예들에서, 숙주세포는 한천 배지 상에 도말되고, 개선된 생체내 성능을 가지는 테스트 테르펜 합성효소 변이체를 포함하는 숙주세포는 콜로니 성장에 의해 확인된다. 일정 구현예들에서, 본 방법은 또한 개선된 생체내 성능을 가지는 세스퀴테르펜 합성효소를 선택하고 및/또는 분리하는 것을 포함한다.
일정 구현예들에서, 세스퀴테르펜 합성효소 변이체들의 집합 (collection)은 숙주세포들의 집합에서 발현된다. 일정 구현예들에서, 세스퀴테르펜 합성효소 변이체들의 집합은 2개로부터 5개까지, 5개로부터 10개까지, 10개로부터 50개까지, 50개로부터 100개까지, 100개로부터 500개까지, 500개로부터 1,000개까지, 1,000개로부터 10,000개까지, 10,000개로부터 100,000개까지, 및 100,000개로부터 1,000,000개까지 이상의 세스퀴테르펜 합성효소 변이체들을 포함한다.
일정 구현예들에서, 본 검색 방법은 반복적인 방식으로 사용되고, 반복으로 확인되는 테스트 세스퀴테르펜 합성효소는 다음 번 반복의 대조군 세스퀴테르펜 합성효소로서 사용되고, 반복에서의 숙주세포는 올라간 수준의 FPP를 포함하여 올라간 수준의 FPP를 포함하지 않는 부모 세포들과 대비하여 이전의 반복에서 확인된 테스트 세스퀴테르펜 합성효소의 존재 시 감소된 생존도를 가진다.
또 다른 관점에서, 본 명세서에서는
(a) 첫 번째 소집단 (subpopulation)은 대조군 세스퀴테르펜 합성효소를 포함하고, 올라간 수준의 FPP는 상기 첫 번째 소집단의 세포들의 생존도를 올라간 수준의 FPP를 포함하지 않는 부모 세포의 생존도와 대비하여 감소시키고; 또한
(b) 두 번째 소집단은 테스트 세스퀴테르펜 합성효소를 포함하고, 상기 테스트 세스퀴테르펜 합성효소는 상기 대조군 세스퀴테르펜 합성효소의 변이체인:
올라간 수준의 FPP를 포함하는 숙주 세포들의 공통적인 집단으로부터 유래된 두 개 세포 소집단들을 포함하는 조성물이 제공된다.
일정 구현예들에서, 두 번째 소집단의 세포들의 생존도는 첫 번째 소집단의 세포들의 생존도보다 크다.
또 다른 관점에서, 본 발명은
(a) 대조군 테르펜 합성효소를 발현하고 성장률을 가지는 숙주 세포를 제공하고;
(b) 상기 숙주세포에서 대조군 테르펜 합성효소 대신에 테스트 테르펜 합성효소를 발현시키고, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소의 변이체이고; 또한
(d) 상기 대조군 세스퀴테르펜 합성효소를 발현하는 상기 숙주세포와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 발현하는 숙주세포의 감소된 성장률에 의해, 상기 대조군 세스퀴테르펜 합성효소와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 개선된 생체내 성능을 가지는 것으로서 확인하는:
단계들을 포함하는, 개선된 생체내 성능을 가지는 테르펜 합성효소 변이체들을 확인하는 두 번째 검색 방법을 제공한다.
보다 또 다른 관점에서, 본 발명은
(a) 숙주 세포들의 집단을 대조군 집단 및 테스트 집단으로 분할하고;
(b) 상기 대조군 집단에서 대조군 테르펜 합성효소 및 비교군 테르펜 합성효소를 발현시키고, 상기 대조군 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환할 수 있고, 상기 비교군 테르펜 합성효소는 상기 폴리프레닐 디포스페이트를 두 번째 테르펜으로 전환할 수 있고;
(c) 상기 테스트 집단에서 비교군 테르펜 합성효소 및 상기 테스트 테르펜 합성효소를 발현시키고, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소의 변이체이고, 상기 비교군 테르펜 합성효소는 상기 테스트 집단에서 및 상기 대조군 집단에서 유사한 수준들로 발현되고; 또한
(d) 상기 테스트 집단 및 상기 대조군 집단 둘 다에서 상기 두 번째 테르펜 대비 상기 첫 번째 테르펜의 비율을 측정하는:
단계들을 포함하는, 테르펜 합성효소 변이체들의 개선된 생체내 성능을 확인하고 및/또는 순위 매기는 경쟁 방법을 제공한다.
별도의 구현예들에서, 본 경쟁 방법은 모노테르펜 합성효소들, 디테르펜 합성효소들, 세스퀴테르펜 합성효소들, 세스터테르펜 합성효소들, 트리테르펜 합성효소들, 테트라테르펜 합성효소들, 및 폴리테르펜 합성효소들로 이루어진 그룹으로부터 선택되는 테르펜 합성효소를 확인하고 및/또는 순위 매기는 데 적용된다.
일정 구현예들에서, 본 경쟁 방법은 대조군 테르펜 합성효소와 대비하여, 개선된 생체내 성능을 가지는 테르펜 합성효소 변이체가 폴리프레닐 디포스페이트로부터 그의 테르펜 산물까지 더 많은 유동 (flux)을 전환시킬 수 있어, 관심있는 테르펜/비교군 테르펜 (예로, 첫 번째 테르펜/두 번째 테르펜)의 더 높은 비율을 주는 점을 기초로 하여 돌연변이 테르펜 합성효소들의 라이브러리를 검색하는 데 사용된다. 이러한 구현예들에서, 테스트 테르펜 합성효소가 대조군 테르펜 합성효소가 대조군 집단에서 발현되는 것과 유사한 수준으로 테스트 집단에서 발현되는 점은 중요하다.
다른 구현예들에서, 본 경쟁 방법은 원하는 강도의 프로모터를 확인하는 데 사용된다. 이러한 구현예들에서, 대조군 테르펜 합성효소 및 테스트 테르펜 합성효소는 일치하고, 대조군 집단 및 테스트 집단은 대조군 테르펜 합성효소의 발현 수준에서 서로 다르다.
또 다른 관점에서, 본 명세서에서는
(a) 첫 번째 소집단은 대조군 테르펜 합성효소 및 비교군 테르펜 합성효소를 포함하고, 상기 대조군 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환하고, 상기 비교군 세스퀴테르펜 합성효소는 상기 폴리프레닐 디포스페이트를 두 번째 테르펜으로 전환할 수 있고; 또한
(b) 두 번째 소집단은 테스트 테르펜 합성효소 및 비교군 테르펜 합성효소를 포함하고, 상기 대조군 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환하고, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소의 변이체인:
숙주 세포들의 공통적인 집단으로부터 유래한 두 개 세포 소집단들을 포함하는 조성물이 제공된다.
일정 구현예들에서, 두 번째 테르펜 대비 첫 번째 테르펜의 비율은 상기 첫 번째 소집단에서의 비율과 대비하여 상기 두 번째 집단에서 더 크다.
보다 또 다른 관점에서, 본 명세서에서는 서열번호 111에 주어진 바와 같은 아미노산 서열을 가지지만 서열번호 111의 2, 3, 4, 6, 9, 11, 18, 20, 24, 35, 38, 50, 61, 72, 80, 89, 105, 115, 144, 196, 211, 251, 280, 288, 319, 348, 357, 359, 369, 371, 385, 398, 423, 433, 434, 442, 444, 446, 460, 467, 488, 495, 505, 526, 531, 556, 572, 및 575번 위치들로 이루어진 그룹으로부터 선택되는 위치들에서 하나 이상의 아미노산 치환들을 포함하는, 분리된 β-파네센 합성효소 변이체들, 또한 이러한 β-파네센 합성효소 변이체들을 인코딩하는 뉴클레오타이드 서열을 포함하는 분리된 핵산들이 제공된다.
보다 또 다른 관점에서, 본 발명은
(a) 서열번호 111에 의해 인코드되는 β-파네센 합성효소의 변이체인 이종유래 β-파네센 합성효소; 및
(b) MEV 경로 또는 DXP 경로 효소:를 포함하고;
상기 숙주세포는 MEV 경로 또는 DXP 경로 효소 및 서열번호 111에 의해 인코드되는 β-파네센 합성효소를 포함하는 부모 세포와 대비하여 적어도 15% 이상의 β-파네센을 만드는, 유전적으로 변형된 숙주세포를 제공한다.
보다 또 다른 관점에서, 본 명세서에서는
(a) (i) 서열번호 111에 의해 인코드되는 β-파네센 합성효소의 변이체를 인코딩하는 첫 번째 이종유래 뉴클레오타이드 서열; 및 (ii) MEV 경로 또는 DXP 경로 효소를 인코딩하는 두 번째 이종유래 뉴클레오타이드 서열:을 포함하는 유전적으로 변형된 다수의 숙주 세포들을 획득하고;
(b) 상기 유전적으로 변형된 숙주 세포들을 β-파네센을 만드는 데 적합한 조건들 하에서 탄소원을 포함하는 배지로 배양하고; 또한
(c) 상기 배지로부터 β-파네센을 회수하는:
단계들을 포함하는 β-파네센을 생산하는 방법이 제공된다.
본 발명은 바람직한 구현예들을 도시하도록 제공된 첨부된 도면들과 연결하여 설명될 때 가장 잘 이해된다. 그러나 본 발명은 도면들에 기재된 특정한 구현예들에 제한되지 않는 것으로 이해된다.
도 1A 내지 Z는 본 발명의 숙주 세포들의 생성에 사용된 여러 염색체 통합 제작물들의 지도들을 나타낸 것이다.
도 2는 FPP 기아-기초 선별을 위해 활성 및 비활성 세스퀴테르펜 합성효소들을 포함하는 대장균 (Escherichia coli) 숙주 세포들이 도말된 여러 개의 한천 배지들의 영상을 나타낸 것이다.
도 3은 FPP 독성-기초 성장 선별을 위해 활성 및 비활성 세스퀴테르펜 합성효소들을 포함하는 대장균 숙주 세포들이 도말된 두 개의 한천 배지들의 영상을 나타낸 것이다.
도 4는 다양한 파네센 합성효소 코딩 서열들을 포함하는 대장균 숙주 세포들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 5는 FPP-독성-기초 성장 선별을 위해 활성 및 비활성 세스퀴테르펜 합성효소들을 포함하는 사카로마이세스 세레비시애 숙주 세포들이 도말된 두 개의 한천 배지들의 영상을 나타낸 것이다.
도 6은 염색체로 통합 또는 염색체외 유지되는 파네센 합성효소 코딩 서열들을 포함하는 사카로마이세스 세레비시애 숙주 세포들의 나일 레드 형광 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 7은 세스퀴테르펜 합성효소 경쟁에 의해 순위가 매겨진 사카로마이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 8은 파네센 합성효소 코딩 서열들의 증가하는 사본수들을 포함하는 사카로마이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 파네센/트리코디엔 역가 비율들을 나타낸 것이다.
도 9는 세스퀴테르펜 합성효소 라이브러리의 대장균 숙주 세포들의 GC 분석 대비 나일 레드 형광 분석에 의해 획득된 파네센 역가들의 비교를 나타낸 것이다.
도 10은 나일 레드 형광에 의해 검색된 FS 변이체들의 라이브러리로부터 확인된 대장균 숙주 세포주들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 11은 FPP 독성-기초 성장 선별에 의해 검색된 FS 변이체들의 라이브러리로부터 확인된 사카로마이세스 세레비시애 숙주 세포주들의 나일 레드 형광 (A) 및 GC 분석 (B)에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 12는 FPP 독성-기초 성장 선별에 의한 FS 변이체들의 라이브러리로부터 확인된 사카로마이세스 세레비시애 숙주 세포주들의 나일 레드 형광 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 13은 본 발명의 숙주 세포들의 생성에 사용되는 다양한 발현 플라스미드들의 지도들을 나타낸 것이다.
도 14는 FS 변이체 코딩 서열들의 단일한 염색체로 통합된 사본들을 포함하는 사카로마이세스 세레비시애 숙주 세포주들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 15는 IPP 및 DMAPP의 생산을 위한 MEV 경로의 모식적 재연을 나타낸 것이다.
도 16은 IPP 및 DMAPP의 생산을 위한 DXP 경로의 모식적 재연을 나타낸 것이다.
도 17은 아모파디엔 합성효소 변이체들의 코딩 서열들을 포함하는 사카로마 이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 아모파디엔/트리코디엔 역가 비율들을 나타낸 것이다.
도 18은 리모넨 합성효소 변이체들의 코딩 서열들을 포함하는 사카로마이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 리모넨/마이어센 역가 비율들을 나타낸 것이다.
도 1A 내지 Z는 본 발명의 숙주 세포들의 생성에 사용된 여러 염색체 통합 제작물들의 지도들을 나타낸 것이다.
도 2는 FPP 기아-기초 선별을 위해 활성 및 비활성 세스퀴테르펜 합성효소들을 포함하는 대장균 (Escherichia coli) 숙주 세포들이 도말된 여러 개의 한천 배지들의 영상을 나타낸 것이다.
도 3은 FPP 독성-기초 성장 선별을 위해 활성 및 비활성 세스퀴테르펜 합성효소들을 포함하는 대장균 숙주 세포들이 도말된 두 개의 한천 배지들의 영상을 나타낸 것이다.
도 4는 다양한 파네센 합성효소 코딩 서열들을 포함하는 대장균 숙주 세포들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 5는 FPP-독성-기초 성장 선별을 위해 활성 및 비활성 세스퀴테르펜 합성효소들을 포함하는 사카로마이세스 세레비시애 숙주 세포들이 도말된 두 개의 한천 배지들의 영상을 나타낸 것이다.
도 6은 염색체로 통합 또는 염색체외 유지되는 파네센 합성효소 코딩 서열들을 포함하는 사카로마이세스 세레비시애 숙주 세포들의 나일 레드 형광 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 7은 세스퀴테르펜 합성효소 경쟁에 의해 순위가 매겨진 사카로마이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 8은 파네센 합성효소 코딩 서열들의 증가하는 사본수들을 포함하는 사카로마이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 파네센/트리코디엔 역가 비율들을 나타낸 것이다.
도 9는 세스퀴테르펜 합성효소 라이브러리의 대장균 숙주 세포들의 GC 분석 대비 나일 레드 형광 분석에 의해 획득된 파네센 역가들의 비교를 나타낸 것이다.
도 10은 나일 레드 형광에 의해 검색된 FS 변이체들의 라이브러리로부터 확인된 대장균 숙주 세포주들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 11은 FPP 독성-기초 성장 선별에 의해 검색된 FS 변이체들의 라이브러리로부터 확인된 사카로마이세스 세레비시애 숙주 세포주들의 나일 레드 형광 (A) 및 GC 분석 (B)에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 12는 FPP 독성-기초 성장 선별에 의한 FS 변이체들의 라이브러리로부터 확인된 사카로마이세스 세레비시애 숙주 세포주들의 나일 레드 형광 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 13은 본 발명의 숙주 세포들의 생성에 사용되는 다양한 발현 플라스미드들의 지도들을 나타낸 것이다.
도 14는 FS 변이체 코딩 서열들의 단일한 염색체로 통합된 사본들을 포함하는 사카로마이세스 세레비시애 숙주 세포주들의 GC 분석에 의해 획득된 파네센 역가들을 나타낸 것이다.
도 15는 IPP 및 DMAPP의 생산을 위한 MEV 경로의 모식적 재연을 나타낸 것이다.
도 16은 IPP 및 DMAPP의 생산을 위한 DXP 경로의 모식적 재연을 나타낸 것이다.
도 17은 아모파디엔 합성효소 변이체들의 코딩 서열들을 포함하는 사카로마 이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 아모파디엔/트리코디엔 역가 비율들을 나타낸 것이다.
도 18은 리모넨 합성효소 변이체들의 코딩 서열들을 포함하는 사카로마이세스 세레비시애 숙주 세포들의 GC 분석에 의해 획득된 리모넨/마이어센 역가 비율들을 나타낸 것이다.
정의들
본 명세서에서 사용된 다음의 용어들은 하기에 지시된 바와 같은 의미들을 가진다.
본 명세서에서 사용되는 바, 용어 "테르펜 합성효소 변이체 (terpene synthase variant)"는 선택된 테르펜 합성효소와 대비하여 다른 뉴클레오타이드 또는 아미노산 서열을 가지는 테르펜 합성효소를 말한다. 예를 들면, 선택된 테르펜 합성효소의 야생형 서열과 대비하여, 테르펜 합성효소 변이체는 해당하는 아미노산 서열에 변화들을 유도하거나 유도하지 않을 수 있는 뉴클레오타이드 첨가들, 결실들, 및/또는 치환들을 포함할 수 있다. 뉴클레오타이드 변화들이 아미노산 서열에 변화들을 유도하지 않는 일정 구현예들에서, 본 변화들은 그럼에도 불구하고, 예를 들면 코돈 최적화를 통해 합성효소의 개선된 활성에 효과를 줄 수 있다. 다른 구현예들에서, 테르펜 합성효소 변이체는 아미노산 첨가들, 결실들, 및/또는 치환들을 포함한다. 따라서, 본 명세서에서 사용되는 바, 용어 "세스퀴테르펜 합성효소 변이체 (sesquiterpene synthase variant)"는 선택된 세스퀴테르펜 합성효소와 대비하여 다른 뉴클레오타이드 또는 아미노산 서열을 가지는 세스퀴테르펜 합성효소를 말한다. 예를 들면, 선택된 세스퀴테르펜 합성효소와 대비하여, 세스퀴테르펜 합성효소 변이체는 해당하는 아미노산 서열에 변화들을 유도하거나 유도하지 않을 수 있는 뉴클레오타이드 첨가들, 결실들, 및/또는 치환들을 포함할 수 있다. 다른 구현예들에서, 테르펜 합성효소 변이체는 아미노산 첨가들, 결실들 및/또는 치환들을 포함한다.
본 명세서에서 사용되는 바, 용어 "조작된 숙주세포 (engineered host cell)"는 유전공학적 기법들 (예로, 재조합 기술학)을 사용하여 부모 세포를 유전적으로 변형하여 생성되는 숙주세포를 말한다. 조작된 숙주세포는 부모 세포의 게놈에 뉴클레오타이드 서열들의 첨가들, 결실들 및/또는 치환들을 포함할 수 있다.
본 명세서에서 사용되는 바, 용어 "이종유래 (heterologous)"는 정상적으로 자연에서는 발견되지 못하는 것을 말한다. 용어 "이종유래 뉴클레오타이드 서열"은 정상적으로 자연에서의 주어진 세포에서는 발견되지 못하는 뉴클레오타이드 서열을 말한다. 이와 같이, 이종유래 뉴클레오타이드 서열은: (a) 그의 숙주세포에 대해 외래성 (예로, 세포에 대해 "외인성 (exogenous)")이거나; (b) 숙주세포에서 자연적으로 발견되지만 (예로, "내인성 (endogenous)") 세포에서 비천연의 양으로 존재하거나 (예로, 숙주세포에서 자연적으로 발견되는 것보다 적거나 많음); (c) 숙주세포에서 자연적으로 발견되지만 그의 원래 좌위의 외부에 위치될 수 있다.
본 명세서에서 사용되는 바, 용어 "자연적으로 생기는 (naturally occurring)"은 천연에서 발견되는 것을 말한다. 예를 들면, 자연에 있는 출처로부터 분리될 수 있고 연구실에서 인간에 의해 의도적으로 변형되지 않았던 테르펜 합성효소는 자연적으로 생기는 테르펜 합성효소이다. 반대로, 본 명세서에서 사용되는 바, 용어 "자연적으로 생기지 않는 (naturally not occurring)"은 자연에서 발견되지 않지만 인간 개입에 의해 제조될 수 있는 것을 말한다.
본 명세서에서 사용되는 바, 용어 "생합성적 효소 (biosynthetic enzyme)"는 자연적으로 생기는 분자의 생산을 유도하는 생합성 경로에서 기능하는 효소를 말한다.
본 명세서에서 사용되는 바, 용어 "생체내 성능 (in vivo performance)"은 숙주세포에서 발현될 때 폴리프레닐 디포스페이트 기질을 테르펜으로 전환하는 테르펜 합성효소의 능력을 말한다. 따라서, 용어 "개선된 생체내 성능 (improved in vivo performance)"은 숙주세포에서 발현될 때 폴리프레닐 디포스페이트 기질을 테르펜으로 전환하는 테르펜 합성효소의 증가된 능력을 말한다.
본 명세서에서 사용되는 바, 용어 "부모 세포 (parent cell)"는 올라간 세포내 수준의 FPP를 포함하지 않거나 특정한 이종유래 뉴클레오타이드 서열을 포함하지 않는 점을 제외하고, 본 명세서에서 기재된 숙주세포와 일치하는 유전적 배경을 가지고, 상기 올라간 세포내 수준의 FPP 또는 본 명세서에서 기재된 숙주세포의 생성을 유도하는 상기 이종유래 뉴클레오타이드 서열을 도입하는 시작점으로서 작용하는 세포를 말한다.
일반적인 개괄
본 발명은 조작된 숙주 세포들을 통하여 테르펜 합성효소 변이체들을 개발하는 방법들에 관한 것이다. 상세하게, 본 발명은 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들을 개발하는 방법들을 제공한다. 본 방법들은 이들 효소들의 생체내 성능의 계속된 개선도 역시 허용한다.
한 가지 관점에서, 본 발명은 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들의 검색 방법을 제공한다. 일정 구현예들에서, 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들은 조작된 숙주 세포들을 세포 사망으로부터 구출하는 그들의 능력에 의해 확인된다. 조작된 숙주 세포들은 올가간 세포내 수준들의 FPP를 초래하는 유전적 변형들을 포함한다. FPP는 세포들에 대해 독성이 높아서 세포 생존도 (viability)를 감소시키기 때문에 (Withers et al . (2007) Appl . Environ. Microbiol . 73:6277-6283), 올라간 수준의 세포내 FPP를 포함하지 않는 부모 세포의 생존도와 비교가능한 생존도를 달성하기 위하여 조작된 숙주세포들은 FPP의 세포내 수준들을 감소시키도록 충분하게 활성을 가진 세스퀴테르펜 합성효소를 요구한다.
따라서 다음의 단계들을 포함하는 검색 방법이 현재 제공된다:
(a) 대조군 세스퀴테르펜 합성효소를 발현하는 숙주세포를 올라간 수준의 FPP를 포함하도록 조작하고, 상기 올라간 수준의 FPP는 상기 숙주세포의 생존도를 올라간 수준의 FPP를 포함하지 않는 부모 세포와 대비하여 감소시키고;
(b) 상기 숙주세포에서 상기 대조군 세스퀴테르펜 합성효소 대신에 상기 테스트 세스퀴테르펜 합성효소를 발현시키고, 상기 테스트 세스퀴테르펜 합성효소는 상기 대조군 세스퀴테르펜 합성효소의 변이체이고: 또한
(c) 상기 대조군 세스퀴테르펜 합성효소를 발현하는 상기 숙주세포와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 발현하는 숙주세포의 생존도에서 증가에 의해, 상기 대조군 세스퀴테르펜 합성효소와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 개선된 생체내 성능을 가지는 것으로서 확인한다.
일정 구현예들에서, 본 방법은 또한 개선된 생체내 성능을 가지는 상기 테스트 세스퀴테르펜 합성효소를 선별하고 및/또는 분리하는 단계를 포함한다.
숙주세포에서 올라간 수준의 FPP가 유도가능한 경우라면 가장 편리하다. 유도는 유도제 또는, 예를 들면 온도와 같은 특이적 성장 조건들에 반응하여 일어날 수 있다. 숙주세포에서 올라간 수준의 FPP는 약 10%로부터 적어도 1,000배 이상, 부모 세포의 FPP 보다 높은 수준까지의 범위일 수 있다.
부모 세포와 대비하여 대조군 세스퀴테르펜 합성효소를 발현하는 숙주세포의 감소된 생존도는 감소된 세포 성장으로부터 치사까지의 범위일 수 있다. 따라서, 일정 구현예들에서, 대조군 세스퀴테르펜 합성효소를 발현하는 숙주세포는 부모 세포와 대비하여 액체 배양에서 또는 한천 배지 상에서 감소된 수의 자손 세포들을 생산한다. 다른 구현예들에서, 대조군 세스퀴테르펜 합성효소를 발현하는 숙주세포는 부모 세포와 대비하여 액체 배양에서 또는 한천 배지 상에서 자손 세포들을 전혀 생산하지 않는다. 따라서, 대조군 세스퀴테르펜 합성효소 대신에 테스트 세스퀴테르펜 합성효소를 발현하는 숙주세포의 생존도에서 증가는, 대조군 세스퀴테르펜 합성효소를 발현하는 숙주세포에 의해 생산된 자손 세포들의 수 또는 콜로니 크기와 대비하여 액체 배양에서 자손 세포들의 더 많은 수에 의해, 또는 한천 배지 상에서 더 큰 콜로니 크기에 의해 분명해질 수 있다.
숙주세포에서 올라간 수준의 FPP는 숙주세포에서 FPP 또는 그의 전구체들의 생산에 관여하는 효소의 발현 및/또는 활성을 변형하여 효과를 줄 수 있다. 일정 이러한 구현예들에서, MEV 또는 DXP 경로의 효소의 발현 및/또는 활성은 변형된다. 일정 이러한 구현예들에서, HMG-CoA 환원효소 및/또는 메발로네이트 키나제의 발현 및/또는 활성은 변형된다. 임의적으로, 숙주세포에서 올라간 수준의 FPP는 숙주세포에서 FPP 또는 그의 전구체들의 생산에 관여하는 효소의 발현 및/또는 활성을 변형하여 효과를 낼 수 있다. 일정 이러한 구현예들에서, 스쿠알렌 합성효소의 발현 및/또는 활성은 변형된다.
대조군 세스퀴테르펜 합성효소는 자연적으로 생기는 세스퀴테르펜 합성효소 또는 자연적으로 생기지 않는 세스퀴테르펜 합성효소일 수 있다. 테스트 세스퀴테르펜 합성효소는 하나 이상의 아미노산 치환들, 결실들 및/또는 첨가들을 포함하는 것에 의해 대조군 세스퀴테르펜 합성효소와 서로 달라질 수 있다. 추가적으로 또는 임의적으로, 테스트 세스퀴테르펜 합성효소는 대조군 세스퀴테르펜 합성효소와 일치하는 아미노산들을 포함할 수 있지만 이들 아미노산들을 인코딩하는 코돈들은 테스트 세스퀴테르펜 합성효소 및 대조군 세스퀴테르펜 합성효소 간에 서로 달라질 수 있다. 일정 이러한 구현예들에서, 코돈들은 숙주세포에서 사용도를 위해 최적화된다.
일정 구현예들에서, 대조군 세스퀴테르펜 합성효소는 β-파네센 합성효소, α-파네센 합성효소, 트리코디엔 합성효소 (trichodiene synthase), 패추롤 합성효소 (patchoulol synthase), 아모파디엔 합성효소 (amorphadiene synthase), 발렌센 합성효소 (valencene synthase), 파네솔 합성효소 (farnesol synthase), 네로리돌 합성효소 (nerolidol synthase), 및 누트카톤 합성효소 (nootkatone synthase)으로 이루어진 그룹으로부터 선택된다. 일정 이러한 구현예들에서, 대조군 세스퀴테르펜 합성효소는 아르테미시아 애누아 (Artemisia annua)의 β-파네센 합성효소이다. 일정 이러한 구현예들에서, 대조군 세스퀴테르펜 합성효소는 서열번호 111의 아미노산 서열을 가진다.
테스트 세스퀴테르펜 합성효소의 존재 시 숙주세포의 생존도를 대조군 세스퀴테르펜 합성효소의 존재 시 숙주세포의 생존도와 비교할 수 있기 위하여, 숙주세포에서 대조군 세스퀴테르펜 합성효소 및 테스트 세스퀴테르펜 합성효소의 유사한 발현 수준들을 입증하는 것이 필요하다. 이것은 두 개 숙주 세포들에 있는 세스퀴테르펜 합성효소들을 인코딩하는 뉴클레오타이드 서열들을 동일한 조절 요소들의 조절 하에 두어서 달성될 수 있다.
개선된 세스퀴테르펜 합성효소 변이체라기 보다는 성장 촉진 돌연변이를 포함하는 신속하게 성장하는 위양성 숙주 세포들이 숙주세포 배양을 점령하는 경쟁적 성장 환경을 방지하기 위하여, 검색 방법의 한 가지 구현예는 아가-플레이트 기초 선별 시스템이 관여한다. 본 구현예에서, 숙주세포는 한천 배지 상에 도말되고, 개선된 생체내 성능을 가지는 테스트 세스퀴테르펜 합성효소 변이체를 포함하는 숙주세포는 콜로니 성장에 의해 확인된다.
현재까지 기재된 검색 방법의 한 가지 주요한 장점은 반복적 방식으로 좀 더 나은 세스퀴테르펜 합성효소 변이체들을 선택하는 그의 계속된 능력 (capacity)이고, 반복으로 확인된 테스트 세스퀴테르펜 합성효소는 연속적 반복으로 대조군 세스퀴테르펜 합성효소로서 사용된다. 따라서, 본 방법은 특정한 세스퀴테르펜 합성효소가 생합성 경로에서 활성을 가질 수 있는지 여부를 확인하도록 목표로 하고, 대조군 예로 부모 합성효소 대비 개선된 활성을 가지는 합성효소들을 확인하도록 추구하지 않는 당해 기술분야에 알려져 있는 다른 검정법들과는 구별될 수 있다. 일정 구현예들에서, 숙주세포에서 FPP 수준은 검토되고, 각 반복에서 숙주세포가 새로운 세스퀴테르펜 합성효소 (예로, 이전의 반복의 테스트 세스퀴테르펜 합성효소)를 발현할 때 감소된 생존도를 초래하는 수준으로 (예로, 효소들의 발현 수준들을 증가시키거나 감소시키는 것, 효소들을 첨가하거나 차감하는 것, 유전자들의 사본수들을 증가시키거나 감소시키는 것, 효소들의 발현을 조절하는 프로모터들을 대체하는 것, 또는 유전적 돌연변이에 의해 효소들을 변경하는 것에 의해) 잠재적으로 감소된다. 임의적으로, 또는 추가적으로, 각 반복에서 대조군 세스퀴테르펜 합성효소의 발현은 감소된 대조군 세스퀴테르펜 합성효소 활성을 제공하도록 (예로, 대조군 세스퀴테르펜 합성효소 전사체 또는 폴리펩타이드의 발현을 감소시키는 것, 더 약한 프로모터들을 사용하는 것, 또는 이의 안정도를 감소시키는 것에 의해) 감소될 수 있다. 다음 번 반복에서, 이전의 반복의 테스트 세스퀴테르펜 합성효소와 대비하여 여전히 증가된 생체내 성능을 가지는 테스트 세스퀴테르펜 합성효소가 다음으로 확인될 수 있다.
현재까지 기재된 검색 방법의 또 다른 주요한 장점은 고처리량 시행을 위한 그의 단순성 및 용량이다. 조작된 숙주세포에서 세포내 FPP 수준들을 비독성 수준들로 감소시킬 수 있는 세스퀴테르펜 합성효소 변이체들은 세포 생존도를 기초로 하여 확인되고, 기타 비용과 시간을 소비하는 검색 방법들을 실질적으로 불필요하게 만든다. 따라서, 한 가지 구현예에서, 본 방법은 개선된 생체내 성능을 가지는 세스퀴테르펜 합성효소 변이체들을 위한 세스퀴테르펜 합성효소 변이체들의 집합 (예로, 돌연변이 세스퀴테르펜 합성효소들의 라이브러리)을 검색하는 데 사용된다. 이러한 구현예에서, 단일하지 않은 테스트 세스퀴테르펜 합성효소가 숙주세포에서 발현되지만 테스트 세스퀴테르펜 합성효소들의 집합은 숙주 세포들의 집합에서 발현된다. 다음으로 숙주 세포들은 한천 배지들 상에서 성장될 수 있고, 개선된 생체내 성능을 가지는 세스퀴테르펜 합성효소 변이체들을 발현하는 숙주 세포들은 콜로니 성장을 기초로 하여 확인될 수 있다. 일정 구현예들에서, 세스퀴테르펜 합성효소 변이체들은 2개로부터 5개까지, 5개로부터 10개까지, 10개로부터 50개까지, 50개로부터 100개까지, 100개로부터 500개까지, 500개로부터 1,000개까지, 1,000개로부터 10,000개까지, 10,000개로부터 100,000개까지, 및 100,000개로부터 1,000,000개까지 이상의 세스퀴테르펜 합성효소 변이체들을 포함한다.
현재까지 기재된 검색 방법의 또 다른 주요한 장점은 개선된 세스퀴테르펜 합성효소들을 위한 선택이 시험관내라기 보다는 생체내에서 일어나는 것이다. 그 결과로, 세스퀴테르펜 합성효소 변이체의 생체내 성능을 증진하는 복수의 효소 성질들의 개선들이 획득될 수 있다.
또 다른 관점에서, 본 발명은 개선된 생체내 성능을 가지는 테르펜 합성효소 변이체들을 확인하는 두 번째 검색 방법을 제공한다. 두 번째의 검색 방법에서, 개선된 생체내 성능을 가지는 테르펜 합성효소는 숙주 세포들을 폴리프레닐 디포스페이트 (예로, FPP)의 기아로 만드는 그들의 능력에 의해 확인된다. 높은 활성을 가진 테르펜 합성효소 변이체의 존재 시, 숙주세포에서 그의 폴리프레닐 디포스페이트 기질의 세포내 풀은 고갈될 수 있고, 세포가 세포 생존을 위해 요구되는 기본 세포성 과정들을 유지할 수 없도록 초래한다.
따라서 현재 다음의 단계들을 포함하는 두 번째의 검색 방법이 제공된다:
(a) 대조군 테르펜 합성효소를 발현하고 성장률을 가지는 숙주 세포를 제공하고;
(b) 상기 숙주세포에서 대조군 테르펜 합성효소 대신에 테스트 테르펜 합성효소를 발현시키고, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소의 변이체이고; 또한
(d) 상기 대조군 세스퀴테르펜 합성효소를 발현하는 상기 숙주세포와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 발현하는 숙주세포의 감소된 성장률에 의해, 상기 대조군 세스퀴테르펜 합성효소와 대비하여 상기 테스트 세스퀴테르펜 합성효소를 개선된 생체내 성능을 가지는 것으로서 확인한다.
대조군 테르펜 합성효소는 모노테르펜 합성효소, 세스퀴테르펜 합성효소, 디테르펜 합성효소, 세스터테르펜 합성효소, 트리테르펜 합성효소, 테트라테르펜 합성효소, 또는 폴리테르펜 합성효소일 수 있다. 일정 구현예들에서, 대조군 테르펜 합성효소는 세스퀴테르펜 합성효소이다. 일정 이러한 구현예들에서, 대조군 테르펜 합성효소는 β-파네센 합성효소이다. 일정 이러한 구현예들에서, 대조군 테르펜 합성효소는 아르테미시아 애누아 (Artemisia annua)의 β-파네센 합성효소이다. 일정 이러한 구현예들에서, 대조군 세스퀴테르펜 합성효소는 서열번호 111로 주어진 바와 같은 아미노산 서열을 가진다.
테스트 테르펜 합성효소의 존재 시 숙주세포에서 고갈되는 폴리프레닐 디포스페이트 기질은 FPP일 수 있다. 세스퀴테르펜들과는 별도로, 많은 다른 화합물들이 숙주세포의 생존도 및 성장에 필수적인 FPP로부터 합성된다. 이러한 화합물들로는 이에 제한되는 것은 아니지만 스쿠알렌 (squalene), 라노스테롤 (lanosterol), 에르고스테롤 (ergosterol), 고리아르테놀 (cycloartenol), 콜레스테롤 (cholesterol), 스테로이드 호르몬들 (steroid hormones), 및 비타민 D을 포함한다. 따라서 일정 구현예들에서, 테스트 테르펜 합성효소를 발현하는 숙주세포는 그의 세포막에 감소된 양들의 콜레스테롤 또는 에르고스테롤을 포함할 수 있다. 세포들에서 콜레스테롤 또는 에르고스테롤의 정량 방법은 당해 기술분야에 알려져 있다 (예로, Crockett and Hazel (2005) J. Experimental Zoology, 271(3): 190-195; Arthington-Skaggs et al. (1999) J Clin Microbiol. 37(10): 3332-3337; Seitz et al. (1979) Physiol. Biochem. 69: 1202-1203). 일정 구현예들에서, 테스트 테르펜 합성효소의 존재 시 숙주세포에서 유지될 수 없는 세포 생존을 위해 요구되는 기본 세포성 과정은 세포막의 생산 및/또는 유지이다. 다른 구현예들에서, 테스트 테르펜 합성효소의 존재 시 숙주세포에서 고갈되는 폴리프레닐 디포스페이트 기질은 GPP 또는 GGPP이다.
보다 또 다른 관점에서, 본 발명은 테르펜 합성효소 변이체들의 생체내 성능을 확인하고 및/또는 순위 매기는 경쟁 방법을 제공한다. 본 경쟁 방법은 테르펜 합성효소 변이체들이 비교되는 비교군 효소로서 기지의 테르펜 합성효소를 사용한다. 비교군 테르펜 합성효소 및 각 테르펜 합성효소 변이체들 둘 다는 다음으로 그들이 해당하는 테르펜들을 생산하도록 동일한 폴리프레닐 디포스페이트 기질 (예로, GPP, FPP, 또는 GGPP)과 경쟁하는 숙주세포에서 공동-발현된다. 비교군 효소의 성적은 숙주 세포들에서 일정하게 남아있기 때문에, 비교군 테르펜 합성효소 및 테르펜 합성효소 변이체들에 의해 생산되는 테르펜 산물들의 역가들의 비율들에서 변화들이라면 모두는 테르펜 합성효소 변이체들의 활성들의 직접적인 결과이다. 결론적으로, 이러한 비율들은 개선된 생체내 성능을 가지는 테르펜 합성효소 변이체들을 확인하고 및/또는 폴리프레닐 디포스페이트 기질들을 테르펜들의 생산으로 전환하는 단계에서 그들의 생체내 역학적 능력들에 대해 순위를 매기거나 정량적으로 비교하는 데 사용될 수 있다.
따라서 현재 다음의 단계를 포함하는 경쟁 방법이 제공된다:
(a) 숙주 세포들의 집단을 대조군 집단 및 테스트 집단으로 분할하고;
(b) 상기 대조군 집단에서 대조군 테르펜 합성효소 및 비교군 테르펜 합성효소를 발현시키고, 상기 대조군 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환할 수 있고, 상기 비교군 테르펜 합성효소는 상기 폴리프레닐 디포스페이트를 두 번째 테르펜으로 전환할 수 있고;
(c) 상기 테스트 집단에서 비교군 테르펜 합성효소 및 상기 테스트 테르펜 합성효소를 발현시키고, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소의 변이체이고, 상기 비교군 테르펜 합성효소는 상기 테스트 집단에서 및 상기 대조군 집단에서 유사한 수준들로 발현되고; 또한
(d) 상기 테스트 집단 및 상기 대조군 집단에서 상기 두 번째 테르펜 대비 상기 첫 번째 테르펜의 비율을 측정한다.
명확하게, 현재 기술된 경쟁 방법은 광범위한 테르펜 합성효소들에 적용될 수 있다. 따라서 별도의 구현예들에서, 본 경쟁 방법은 모노테르펜 합성효소들, 디테르펜 합성효소들, 세스퀴테르펜 합성효소들, 세스터테르펜 합성효소들, 트리테르펜 합성효소들, 테트라테르펜 합성효소들, 및 폴리테르펜 합성효소들로 이루어진 그룹으로부터 선택되는 테르펜 합성효소들을 확인하고 및/또는 순위 매기는 데 적용된다. 따라서 별도의 구현예들에서, 첫 번째 테르펜 및 두 번째 테르펜은 모노테르펜들, 세스퀴테르펜들, 디테르펜들, 세스터테르펜들, 트리테르펜들, 테트라테르펜들, 및 폴리테르펜들로 이루어진 그룹으로부터 선택된다. 일정 이러한 구현예들에서, 첫 번째 테르펜 및 두 번째 테르펜은 β-파네센, α-파네센, 트리코디엔, 패추롤, 아모파디엔, 발렌센, 파네솔, 네로리돌, 리모넨, 마이어센, 및 누트카톤으로 이루어진 그룹으로부터 선택된다.
대조군 테르펜 합성효소는 자연적으로 생기는 테르펜 합성효소 또는 자연적으로 생기지 않는 테르펜 합성효소일 수 있다. 테스트 테르펜 합성효소는 대조군 테르펜 합성효소와 대비하여 아미노산 치환들, 결실들 및/또는 첨가들을 포함하거나, 대조군 테르펜 합성효소 및 테스트 테르펜 합성효소를 인코딩하는 뉴클레오타이드 서열들에서 서로 다른 코돈들에 의해 인코드되는 일치하는 아미노산들을 포함할 수 있다. 일정 구현예들에서, 대조군 테르펜 합성효소는 세스퀴테르펜 합성효소이다. 일정 이러한 구현예들에서, 세스퀴테르펜 합성효소는 β-파네센 합성효소, a-파네센 합성효소, 트리코디엔 합성효소, 패추롤 합성효소, 아모파디엔 합성효소, 발렌센 합성효소, 파네솔 합성효소, 네로리돌 합성효소, 및 누트카톤 합성효소로 이루어진 그룹으로부터 선택된다. 일정 이러한 구현예들에서, 대조군 세스퀴테르펜 합성효소는 아르테미시아 애누아 (Artemisia annua)의 β-파네센 합성효소이다. 일정 이러한 구현예들에서, 대조군 세스퀴테르펜 합성효소는 서열번호 111로 주어진 바와 같은 아미노산 서열을 가진다.
대조군 집단 및 테스트 집단의 첫 번째 테르펜/두 번째 테르펜의 비율들을 비교할 수 있기 위하여, 비교군 테르펜 합성효소의 유사한 발현 수준들을 입증하는 것이 필요하다. 이것은 두 개 숙주 세포 집단들에 있는 비교군 테르펜 합성효소들을 인코딩하는 뉴클레오타이드 서열들을 동일한 조절 요소들의 조절 하에 두어서 달성될 수 있다. 경쟁 방법이 테르펜 합성효소 변이체를 확인하는 데 사용되는 구현예들에서, 두 개 세포 집단들에 있는 대조군 테르펜 합성효소 및 테스트 테르펜 합성효소의 발현 수준들도 역시 유사해야 한다. 경쟁 방법이 예를 들면 원하는 발현 수준을 제공하는 조절 요소들 (예로, 프로모터들)을 확인하는데 사용되는 다른 구현예들에서, 테스트 테르펜 합성효소는 대조군 테르펜 합성효소와 뉴클레오타이드 또는 아미노산 서열에서는 아니지만 발현 수준에서는 서로 다르다. 이러한 구현예들에서, 서로 다른 요소들이 대조군 테르펜 합성효소 및 테스트 테르펜 합성효소의 발현에 사용된다.
현재까지 기재된 경쟁 방법을 위한 수많은 유용성들이 존재한다. 일정 구현예들에서, 본 방법은 대조군 테르펜 합성효소와 대비하여, 개선된 생체내 성능을 가진 테르펜 합성효소 변이체가 폴리프레닐 디포스페이트 기질로부터 그의 테르펜 산물까지 더 많은 유동을 전환할 수 있어, 관심있는 테르펜/비교군 테르펜 (예로, 첫 번째 테르펜/두 번째 테르펜)의 더 높은 비율들을 주는 점을 기초로 하여 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들을 (예로, 돌연변이 테르펜 합성효소들의 라이브러리로부터) 검색하는 데 사용된다.
유사한 검정법이 일련의 프로모터들의 강도를 순위 매기는 데 사용될 수 있다 (예를 들면, 이러한 검정법이 본 명세서에서 기재된 첫 번째 검색 방법에서 대조군 세스퀴테르펜 합성효소를 발현하는 용도에 적합한 프로모터들을 확인하는 데 사용되었던 실시예 16을 참조하라.). 이러한 구현예에서, 대조군 테르펜 합성효소 및 테스트 테르펜 합성효소는 실제로 일치하지만, 그들은 서로 다른 프로모터들의 조절적 통제 하에 있어 대조군 집단 및 테스트 집단은 그들이 포함하는 테스트 테르펜 합성효소의 유형에서는 아니지만 테스트 테르펜 합성효소의 발현의 수준에서는 서로 다르다. 이러한 구현예에서, 대조군 집단 및 테스트 집단에서 두 번째 테르펜 대비 첫 번째 테르펜의 비율을 비교하는 것은 테스트 테르펜 합성효소의 활성에 대한 것은 아니지만 테스트 테르펜 합성효소의 발현을 추진하는 프로모터의 강도에 대한 정보를 제공한다.
또한, 본 시스템은 다양한 세포들에 의해 만들어진 둘 이상의 테르펜 산물들의 비율을 조정하는 데 사용될 수 있어, 정의된 비율을 가진 다양한 세포들의 조합된 혼합물은 상업적으로 유용한 산물의 원하는 성질들을 소유한다.
현재까지 기재된 경쟁 방법의 주요한 장점들은 이것이 효소 발현 및 활성에서 세포마다의 다양성들을 제거하고, 이것이 튼튼하고, 또한 이것은 폴리프레닐 디포스페이트 기질로의 전반적인 유동 경로가 숙주세포에서 제한될 때도 심지어 사용될 수 있는 것이다. 후자는 절대적인 테르펜 역가 측정들을 기초로 하는 검정법들이 테르펜 역가들이 폴리프레닐 디포스페이트 기질로의 전반적인 유동 경로에 의해 막혀 있을 때 효소 활성들에서 개선들을 차단할 수 있기 때문에 중요하다.
현재까지 기재된 검색 방법 및/또는 경쟁 방법을 사용하여 개발된 효소들은, 이에 제한되는 것은 아니지만 형광 검색 및/또는 기체 크로마토그래피에 의해 테르펜 산물의 직접적인 정량을 포함하는 선택적인 검색의 추가적인 수단이 될 수 있다. 보다 상세하게, 이것은 파네센과 같은 세스퀴테르펜의 생산을 측정하는 나일 레드-기초 고처리량 형광 검정법, 및 파네센과 같은 세스퀴테르펜의 역가를 측정하는 기체 크로마토그래피 (GC)-기초 직접적인 정량 방법을 포함한다. 개선된 효소들도 역시 유도된 돌연변이들 등과 같은 유전공학적 방법들에 의해 좀 더 개선될 수 있다. 그 결과로, 최종 효소 성능을 증진하는 복수의 효소 성질들의 개선들이 성공적으로 달성될 수 있고, 가장 효과적인 효소 변이체들이 확인된다.
본 발명은 월등한 파네센 합성효소 변이체들, 및 이러한 파네센 합성효소 변이체들을 포함하는 숙주 세포들에도 역시 속한다. 파네센 합성효소 변이체들은 본 명세서에서 기재된 방법들을 사용하여 개발되었고, 생체내 성능에서, 200% 이상의 개선을 보여준다. 파네센 합성효소 변이체들은 촉매적 효율을 개선하였고, 예로 그들은 더 빠른 속도로 그들의 반응을 촉매화할 수 있다. 이와 같이, 그들은 고수율 생산이 주로 중요한, 파네센과 같은 세스퀴테르펜 산물들의 상업적인 생산에 더욱 적합하다.
따라서 보다 또 다른 관점에서, 본 명세서에서는 서열번호 111에 주어진 바와 같은 아미노산 서열들을 가지지만 서열번호 111의 2, 3, 4, 6, 9, 11, 18, 20, 24, 35, 38, 50, 61, 72, 80, 89, 105, 115, 144, 196, 211, 251, 280, 288, 319, 348, 357, 359, 369, 371, 385, 398, 423, 433, 434, 442, 444, 446, 460, 467, 488, 495, 505, 526, 531, 556, 572, 및 575번 위치들로 이루어진 그룹으로부터 선택되는 하나 이상의 아미노산 치환들을 포함하는, 분리된 β-파네센 합성효소 변이체들 및 이러한 β-파네센 합성효소 변이체들을 인코딩하는 뉴클레오타이드 서열을 포함하는 분리된 핵산들이 제공된다.
보다 또 다른 관점에서, 본 발명은
(a) 서열번호 111에 의해 인코드되는 β-파네센 합성효소의 변이체인, 이종유래 β-파네센 합성효소; 및
(b) MEV 경로 또는 DXP 경로 효소:
를 포함하는 유전적으로 변형된 숙주세포를 제공하고, 상기 숙주세포는 MEV 경로 또는 DXP 경로 효소 및 서열번호 111에 의해 인코드되는 β-파네센 합성효소를 포함하는 부모 세포와 대비하여 적어도 15% 이상의 β-파네센을 생산한다.
일정 구현예들에서, 이종유래 β-파네센 합성효소는 서열번호 111의 2, 3, 4, 6, 9, 11, 18, 20, 24, 35, 38, 50, 61, 72, 80, 89, 105, 115, 144, 196, 211, 251, 280, 288, 319, 348, 357, 359, 369, 371, 385, 398, 423, 433, 434, 442, 444, 446, 460, 467, 488, 495, 505, 526, 531, 556, 572, 및 575번 위치들로 이루어진 그룹으로부터 선택되는 위치들에서 하나 이상의 아미노산 치환들을 포함한다.
일정 구현예들에서, MEV 경로 효소는 HMG-CoA 환원효소이다. 일정 구현예들에서, MEV 경로 효소는 메발로네이트 키나제이다. 추가적인 MEV 경로의 대표적인 효소들은 하기 섹션 5.4에 제공된다.
보다 또 다른 관점에서, 본 명세서에서는
(a) (i) 서열번호 111에 의해 인코드되는 β-파네센 합성효소의 변이체를 인코딩하는 첫 번째 이종유래 뉴클레오타이드 서열; 및 (ii) MEV 경로 또는 DXP 경로 효소를 인코딩하는 두 번째 이종유래 뉴클레오타이드 서열:을 포함하는 유전적으로 변형된 다수의 숙주 세포들을 획득하고;
(b) 상기 유전적으로 변형된 숙주 세포들을 β-파네센을 만드는 데 적합한 조건들 하에서 탄소원을 포함하는 배지로 배양하고; 또한
(c) 상기 배지로부터 β-파네센을 회수하는:
단계들을 포함하는 β-파네센을 생산하는 방법이 제공된다.
일정 구현예들에서, MEV 경로 효소는 HMG-CoA 환원효소이다. 일정 구현예들에서, MEV 경로 효소는 메발로네이트 키나제이다. 추가적인 MEV 경로의 대표적인 효소들은 하기 섹션 (유전적으로 조작된 숙주 세포들)에서 제공된다.
숙주세포들을 선택하는 단계
본 발명의 관행에서 유용한 숙주세포들은 원시세균 (archae), 원핵세포, 또는 진핵세포들을 포함한다.
적합한 원핵세포 숙주들은 이에 제한되는 것은 아니지만 다양한 그램-양성, 그램-음성, 또는 그램-다양성 박테리아를 포함한다. 예들로는 이에 제한되는 것은 아니지만: Agrobacterium , Alicyclobacillus, Anabaena , Anacystis , Arthrobacter , Azobacter , Bacillus , Brevibacterium , Chromatium, Clostridium , Corynebacterium , Enterobacter , Erwinia , Escherichia , Lactobacillus , Lactococcus , Mesorhizobium , Methylobacterium , Microbacterium , Phormidium , Pseudomonas, Rhodobacter , Rhodopseudomonas , Rhodospirillum , Rhodococcus , Salmonella, Scenedesmun , Serratia , Shigella , Staphlococcus , Strepromyces , Synnecoc cus , 및 Zymomonas 속들에 속하는 세포들을 포함한다. 진핵세포주들의 예들로는 이에 제한되는 것은 아니지만: Bacillus subtilis , Bacillus amyloliquefacines , Brevibacterium ammoniagenes , Brevibacterium immariophilum , Clostridium beigerinckii , Enterobacter sakazakii , Escherichia coli , Lactococcus lactis , Mesorhizobium loti , Pseudomonas aeruginosa , Pseudomonas mevalonii , Pseudomonas pudica , Rhodobacter capsulatus, Rhodobacter sphaeroides , Rhodospirillum rubrum , Salmonella enterica , Salmonella typhi, Salmonella typhimurium , Shigella dysenteriae , Shigella flexneri , Shigella sonnei , 및 Staphylococ cus aureus를 포함한다.
적합한 원시세균 숙주들은 이에 제한되는 것은 아니지만: Aeropyrum , Archaeglobus , Halobacterium , Methanococ cus, Methanobacterium , Pyrococcus , Sulfolobus 및 Thermoplasma 속들에 속하는 세포들을 포함한다. 원시세균 숙주들의 예들로는 이에 제한되는 것은 아니지만: Archaeoglobus fulgidus , Halobacterium sp ., Methanococcus jannaschii, Methanobacterium thermoautotrophicum , Thermoplasma acidophilum , Thermoplasma volcanium , Pyrococcus horikoshii , Pyrococcus abyssi, 및 Aeropyrum pernix를 포함한다.
적합한 진핵세포 숙주들은 이에 제한되는 것은 아니지만 곰팡이 세포들, 조류 세포들, 곤충 세포들, 및 식물 세포들을 포함한다. 예들로는 이에 제한되는 것은 아니지만: Aspergillus , Candida , Chrysosporium, Cryotococcus , Fusarium , Kluyveromyces , Neotyphodium , Neurospora, Penicillium , Pichia , Saccharomyces , Trichoderma , Ascomycota , Basidiomycota , Dothideomycetes, 및 Xanthophyllomyces (이전에는 Phaffia) 속들에 속하는 세포들을 포함한다. 진핵세포주들의 예들로는 이에 제한되는 것은 아니지만: Pichia pastoris , Pichia finlandica , Pichia trehalophila , Pichia koc lamae , Pichia membranaefaciens , Pichia opuntiae , Pichia thermotolerans , Pichia salictaria , Pichia quercuum , Pichia pijperi , Pichia stiptis, Pichia methanolica , Pichia sp ., Saccharomyces cerevisiae , Saccharomyces sp ., Schizosaccharomyces pombe , Hansenula polymorpha , Kluyveromyces sp . , Kluyveromyces lactis , Candida albicans , Aspergillus nidulans , Aspergillus niger , Aspergillus oryzae , Trichoderma reesei, Chrysosporium lucknowense , Fusarium sp ., Fusarium gramineum , Fusarium venenatum , Neurospora crassa, 및 Chlamydomonas reinhardtii을 포함한다.
특정한 구현예에서, 숙주세포는 대장균 (Escherichia coli) 세포이다. 또 다른 특정한 구현예에서, 숙주세포는 사카로마이세스 세레비시애 (Saccharomyces cerevisiae) 세포이다. 일정 구현예들에서, 숙주세포는 베이커의 효모, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1, 및 AL-1로 이루어진 그룹으로부터 선택되는 사카로마이세스 세레비시애 세포이다. 일정 구현예들에서, 숙주세포는 PE-2, CAT-1, VR-1, BG-1, CR-1, 및 SA-1로 이루어진 그룹으로부터 선택되는 사카로마이세스 세레비시애 세포이다. 특정한 구현예에서, 숙주세포는 균주 PE-2의 사카로마이세스 세레비시애이다. 또 다른 특정한 구현예에서, 숙주세포는 균주 CAT-1의 사카로마이세스 세레비시애이다. 또 다른 특정한 구현예에서, 숙주세포는 사카로마이세스 세레비시애 균주 BG-1이다.
일정 구현예들에서, 숙주세포는 산업적 발효, 예로 바이오에탄올 발효에 적합한 세포이다. 특정한 구현예에서, 숙주세포는 산업적 발효 환경의 인식된 스트레스 조건들이 되는 높은 용매 농도, 높은 온도, 확장된 기질 사용도, 영양분 제한, 삼투압 스트레스, 설파이드 및 박테리아 오염, 또는 그들의 조합들 하에서 살아가도록 조정된다.
올라간 세포내 FPP 수준들을 가진 숙주세포들
일정 구현예들에서, 부모 세포와 대비하여 숙주세포는 올라간 세포내 수준의 FPP를 포함하고, 올라간 세포내 수준의 FPP는 숙주세포의 생존도를 감소시킨다.
일정 구현예들에서, 숙주세포는 세포 배양액의 단위 부피 당을 기초로 하여 부모 세포의 FPP 세포내 수준보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상 높은, FPP의 세포내 수준을 포함한다.
일정 구현예들에서, 숙주세포는 단위 건조 세포 무게 당을 기초로 하여 부모 세포의 FPP 세포내 수준보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상 높은, FPP의 세포내 수준을 포함한다.
일정 구현예들에서, 숙주세포는 단위 시간 당 세포 배양액의 단위 부피 당을 기초로 하여 부모 세포의 FPP 세포내 수준보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상 높은, FPP의 세포내 수준을 포함한다.
일정 구현예들에서, 숙주세포는 단위 시간 당 단위 건조 세포 무게 당을 기초로 하여 부모 세포의 FPP 세포내 수준보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상 높은, FPP의 세포내 수준을 포함한다.
대부분의 구현예들에서, 숙주세포에서 올라간 세포내 수준의 FPP는 유도화 화합물 (inducing compound)에 의해 유도가능하다. 이러한 숙주세포는 유도화 화합물의 부재 시 쉽게 조작될 수 있다. 다음으로 유도화 화합물은 숙주세포에서 올라간 세포내 수준의 FPP를 유도하도록 첨가된다. 다른 구현예들에서, 숙주세포에서 올라간 세포내 수준의 FPP는, 예를 들면 성장 온도와 같은 배양 조건들을 변화시켜서 유도가능하다. 따라서 세포내 FPP 수준의 유도가능한 증가는 숙주세포의 감소된 생존도 표현형을 위한 분자적 온-오프 스위치를 제공한다.
세포내 FPP 수준의 증가는 숙주세포의 표적화된 유전적 조작을 통해 효과를 낼 수 있다. 많은 효소들이 FPP 및 그의 전구체들의 생산 및 사용에서 기능하는 것으로 알려져 있고, 이들 효소들의 하나라면 모두가 숙주세포에서 FPP 수준을 변화하도록 조작될 수 있다.
일정 구현예들에서, 숙주세포에서 FPP의 생산은 숙주세포에 있는 세포성 아세틸-CoA의 생산을 증가시켜서 증가된다.
일정 구현예들에서, 숙주세포에서 FPP의 생산은 숙주세포에 있는 IPP 및/또는 DMAPP 의 생산을 증가시켜서 증가된다. 일정 이러한 구현예들에서, 숙주세포에서 IPP 및/또는 DMAPP 의 생산은 MEV 경로의 하나 이상의 효소들을 증가시켜서 증가된다. MEV 경로의 모식적 재연은 도 15에 도시되어 있다. 일반적으로, 본 경로는 여섯 개의 단계들을 포함한다.
첫 번째 단계에서, 아세틸 조효소 A의 두 개 분자들은 아세토아세틸-CoA를 형성하도록 효소적으로 조합된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 아세틸-CoA 티올라제이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만 다음의 진뱅크 (GenBank) 기탁번호들 및 서열들이 유래한 생물을 포함한다: (NC_000913 REGION: 2324131. . 2325315; Escherichia coli), (D49362; Paracoccus denitrificans), 및 (L20428; Saccharomyces cerevisiae).
MEV 경로의 두 번째 단계에서, 아세토아세틸-CoA는 3-하이드록시-3-메틸글루타릴-CoA (HMG-CoA)을 형성하도록 아세틸-CoA의 또 다른 분자와 효소적으로 응축된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 HMG-CoA 합성효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (NC_001145. 보완 19061. . 20536; Saccharomyces cerevisiae), (X96617; Saccharomyces cerevisiae), (X83882; Arabidopsis thaliana), (AB037907; Kitasatospora griseola), (BT007302; Homo sapiens), 및 (NC_002758, 좌위 표시 SAV2546, GeneID 1122571; Staphylococcus aureus)을 포함한다.
세 번째 단계에서, HMG-CoA는 메발로네이트로 효소적으로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 HMG-CoA 환원효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (NM_206548; Drosophila melanogaster), (NC_002758, 좌위 표시 SAV2545, GeneID 1122570; Staphylococ cus aureus), (NM_204485; Gallus gallus), (AB015627; Streptomyces sp. KO 3988), (AF542543; Nicotiana attenuata), (AB037907; Kitasatospora griseola), (AX128213, 절단된 HMGR를 인코딩하는 서열을 제공함; Saccharomyces cerevisiae), 및 (NC_001145: 보완 (115734. . 118898; Saccharomyces cerevisiae)를 포함한다.
네 번째 단계에서, 메발로네이트는 메발로네이트 5-포스페이트를 형성하도록 효소적으로 인산화된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 메발로네이트 키나제이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (L77688; Arabidopsis thaliana), 및 (X55875; Saccharomyces cerevisiae)를 포함한다.
다섯 번째 단계에서, 두 번째 포스페이트기는 메발로네이트 5-피로포스페이트를 형성하도록 메발로네이트 5-포스페이트에 효소적으로 첨가된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 포스포메발로네이트 키나제이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AF429385; Hevea brasiliensis), (NM_006556; Homo sapiens), 및 (NC_001145. 보완 712315. . 713670; Saccharomyces cerevisiae)를 포함한다.
여섯 번째 단계에서, 메발로네이트 5-피로포스페이트는 IPP로 효소적으로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 메발로네이트 피로포스페이트 탈탄산화효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (X97557; Saccharomyces cerevisiae), (AF290095; Enterococcus faecium), 및 (U49260; Homo sapiens)을 포함한다.
다른 이러한 구현예들에서, 숙주세포에서 IPP 및 DMAPP의 생산은 DXP 경로의 하나 이상의 효소들의 활성을 증가시켜서 증가된다. DXP 경로의 모식적 재연은 도 16에 도시되어 있다. 일반적으로 DXP 경로는 일곱 개의 단계들을 포함한다:
첫 번째 단계에서, 피루베이트는 1-데옥시-D-자일루로스-5-포스페이트를 만들도록 D-글리세르알데하이드 3-포스페이트와 응축된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 1-데옥시-D-자일루오스-5-포스페이트 합성효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AF035440; Escherichia coli), (NC_002947, 좌위 표시 PP0527; Pseudomonas putida KT2440), (CP000026, 좌위 표시 SPA2301; Salmonella enterica Paratyphi , ATCC 9150 참조하라), (NC_007493, 좌위 표시 RSP_0254; Rhodobacter sphaeroides 2. 4. 1), (NC_005296, 좌위 표시 RPA0952; Rhodopseudomonas palustris CGA009), (NC_004556, 좌위 표시 PD1293; Xylella fastidiosa Temecula1), 및 (NC_003076, 좌위 표시 AT5G11380; Arabidopsis thaliana)를 포함한다.
두 번째 단계에서, 1-데옥시-D-자일루로스-5-포스페이트는 2C-메틸-D-에리트리톨-4-포스페이트로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 1-데옥시-D-자일루로스-5-포스페이트 환원이성질화효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AB013300; Escherichia coli), (AF148852; Arabidopsis thaliana), (NC_002947, 좌위 표시 PP1597; Pseudomonas putida KT2440), (AL939124, 좌위 표시 SCO5694; Streptomyces coelicolor A3(2)), (NC_007493, 좌위 표시 RSP_2709; Rhodobacter sphaeroides 2. 4. 1), 및 (NC_007492, 좌위 표시 Pfl_1107; Pseudomonas fluorescens PfO-1)를 포함한다.
세 번째 단계에서, 2C-메틸-D-에리트리톨-4-포스페이트는 4-디포스포사이티딜-2C-메틸-D-에리트리톨로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 4-디포스포사이티딜-2C-메틸-D-에리트리톨 합성효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AF230736; Escherichia coli), (NC_007493, 좌위_표시 RSP_2835; Rhodobacter sphaeroides 2. 4. 1), (NC_003071, 좌위_표시 AT2G02500; Arabidopsis thaliana ), 및 (NC_002947, 좌위_표시 PP1614; Pseudomonas putida KT2440)를 포함한다.
네 번째 단계에서, 4-디포스포사이티딜-2C-메틸-D-에리트리톨은 4-디포스포사이티딜-2C-메틸-D-에리트리톨-2-포스페이트로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 4-디포스포사이티딜-2C-메틸-D-에리트리톨 키나제이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AF216300; Escherichia coli) 및 (NC_007493, 좌위_표시 RSP_1779; Rhodobacter sphaeroides 2. 4. 1)를 포함한다.
다섯 번째 단계에서, 4-디포스포사이티딜-2C-메틸-D-에리트리톨-2포스페이트는 2C-메틸-D-에리트리톨-2,4-고리디포스페이트로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 2C-메틸-D-에리트리톨 2,4-고리디포스페이트 합성효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AF230738; Escherichia coli), (NC_007493, 좌위_표시 RSP_6071; Rhodobacter sphaeroides 2. 4. 1), 및 (NC_002947, 좌위_표시 PP1618; Pseudomonas putida KT2440)를 포함한다.
여섯 번째 단계에서, 2C-메틸-D-에리트리톨 2,4-고리디포스페이트는 1-하이드록시-2-메틸-2-(E)-부테닐-4-디포스페이트로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 1-하이드록시-2-메틸-2-(E)-부테닐-4-디포스페이트 합성효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AY033515; Escherichia coli), (NC_002947, 좌위_표시 PP0853; Pseudomonas putida KT2440), 및 (NC_007493, 좌위_표시 RSP_2982; Rhodobacter sphaeroides 2. 4. 1)을 포함한다.
일곱 번째 단계에서, 1-하이드록시-2-메틸-2-(E)-부테닐-4-디포스페이트는 IPP 또는 그의 이성질체, DMAPP 로 전환된다. 본 단계를 촉매화하는 것으로 알려진 효소는, 예를 들면 이소펜틸/디메틸알릴 디포스페이트 합성효소이다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (AY062212; Escherichia coli) 및 (NC_002947, 좌위_표시 PP0606; Pseudomonas putida KT2440)를 포함한다.
일정 구현예들에서, 숙주세포에서 FPP의 생산은 IPP의 DMAPP로 이성질화를 증가시켜서 증가된다. 일정 이러한 구현예들에서, IPP의 DMAPP로 이성질화는 IPP 이성질화효소의 활성을 증가시켜서 증가된다. 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (NC_000913, 3031087. . 3031635; Escherichia coli), 및 (AF082326; Haematococ cus pluvialis)를 포함한다.
일정 구현예들에서, 숙주세포에서 FPP의 생산은 FPP와 IPP 및 DMAPP의 응축을 증가시켜서 증가된다. 일정 이러한 구현예들에서, IPP 및 DMAPP의 또는 IPP및 게라닐 피로포스페이트 ("GPP")의 FPP와 응축은 FPP 합성효소의 활성을 증가시켜서 증가된다. FPP 합성효소들을 인코드하는 뉴클레오타이드 서열들의 도시적 예들로는 이에 제한되는 것은 아니지만: (ATU80605; Arabidopsis thaliana), (ATHFPS2R; Arabidopsis thaliana), (AAU36376; Artemisia annua), (AF461050; Bos taurus), (D00694; Escherichia coli K-12), (AE009951, 좌위 AAL95523; Fusobacterium nucleatum subsp. nucleatum ATCC 25586), (GFFPPSGEN; Gibberella fujikuroi), (CP000009, 좌위 AAW60034; Gluconobacter oxydans 621H), (AF019892; Helianthus annuus), (HUMFAPS; Homo sapiens), (KLPFPSQCR; Kluyveromyces lactis), (LAU15777; Lupinus albus), (LAU20771; Lupinus albus), (AF309508; Mus musculus), (NCFPPSGEN; Neurospora crassa), (PAFPS1; Parthenium argentatum), (PAFPS2; Parthenium argentatum), (RATFAPS; Rattus norvegicus), (YSCFPP; Saccharomyces cerevisiae), (D89104; Schizosaccharomyces pombe), (CP000003, 좌위 AAT87386; Streptococcus pyogenes), (CP000017, 좌위 AAZ51849; Streptococcus pyogenes), (NC_008022, 좌위 YP_598856; Streptococ cus pyogenes MGAS10270), (NC_008023, 좌위 YP_600845; Streptococ cus pyogenes MGAS2096), (NC_008024, 좌위 YP_602832; Streptococ cus pyogenes MGAS10750), (MZEFPS; Zea mays), (AE000657, 좌위 AAC06913; Aquifex aeolicus VF5), (NM_202836; Arabidopsis thaliana), (D84432, 좌위 BAA12575; Bacillus subtilis), (U12678, 좌위 AAC28894; Bradyrhizobium japonicum USDA 110), (BACFDPS; Geobacillus stearothermophilus), (NC_002940, 좌위 NP_873754; Haemophilus ducreyi 35000HP), (L42023, 좌위 AAC23087; Haemophilus influenzae Rd KW20), (J05262; Homo sapiens), (YP_395294; Lactobacillus sakei subsp . sakei 23K), (NC_005823, 좌위 YP_000273; Leptospira interrogans serovar Copenhageni str . Fioc ruz L1-130), (AB003187; Micrococcus luteus), (NC_002946, 좌위 YP_208768; Neisseria gonorrhoeae FA 1090), (U00090, 좌위 AAB91752; Rhizobium sp. NGR234), (J05091; Saccharomyces cerevisae), (CP000031, 좌위 AAV93568; Silicibacter pomeroyi DSS-3), (AE008481, 좌위 AAK99890; Streptococcus pneumoniae R6), 및 (NC_004556, 좌위 NP 779706; Xylella fastidiosa Temecula1)를 포함한다.
일정 구현예들에서, 숙주세포에서 FPP의 생산은 생산적 단계들로부터 FPP의 형성으로 중간물들을 전환시키는 반응들을 저해하여 증가된다. 이러한 반응들은 이에 제한되는 것은 아니지만 지방산 생합성을 유도하는 TCA 회로의 부수적 반응들, 알라닌 생합성, 아스파테이트 수퍼경로 (aspartate superpathway), 포도당신합성, 헴 생합성, 글루타메이트 생합성, 및 포스포아세틸전이효소의 작용을 통한 아세틸-CoA의 아세테이트로 전환을 포함한다.
일정 구현예들에서, 올라간 세포내 수준의 FPP를 포함하는 숙주세포는 숙주세포에서 FPP의 소모를 감소시켜서 획득된다. 일정 이러한 구현예들에서, 숙주세포에서 FPP의 소모는 FPP를 스쿠알렌으로 전환할 수 있는 파네실-디포스페이트 파네실 전이효소 또는 스쿠알렌 합성효소의 활성을 감소시켜서 감소된다. 다른 이러한 구현예들에서, 숙주세포에서 FPP의 소모는 세스퀴테르펜 합성효소의 활성을 감소시켜서 감소된다.
올라간 세포내 수준의 FPP를 포함하는 숙주세포는 유전공학적 기법들 (예로, 재조합 기술학), 고전적인 미생물학적 기법들, 또는 이러한 기법들의 조합을 사용하여 부모 세포를 유전적으로 변형시켜서 생성될 수 있다. 숙주세포는 또한 올라간 세포내 수준의 FPP로 인해 소정의 성장 조건들 하에서 비-생존가능한 자연적으로 생기는 유전적 변이체일 수도 있다.
감소된 세포 생존도를 가지는 이러한 올라간 세포내 수준의 FPP를 포함하는 숙주세포는 고체 배지 상에서 숙주세포의 성장을 올라간 세포내 수준의 FPP를 포함하지 않는 부모 세포의 성장과 비교하여 확인될 수 있다. 올라간 수준의 세포내 FPP를 포함하는 숙주세포는 그의 부모 세포와 대비하여 고체 아가 배지 상에서 더 적거나 작은 콜론들을 생산해야 한다. 소정의 성장 조건들 하에서만 올라간 세포내 수준의 FPP를 포함하는 숙주세포는, 제한된 성장 조건들 하에서만 감소된 생존도를 가지고 허용된 성장 조건들 하에서는 감소된 생존도를 가지지 않는 숙주 세포들을 확인하도록, 숙주세포가 올라간 세포내 수준의 FPP를 포함하지 않는 조건, 또한 그의 부모 세포와 동일한 생존도를 가지는 조건들 ("허용된 성장 조건들") 하에서 숙주세포를 먼저 성장시키고, 다음으로 숙주세포를 복제-도말하고 (replica-plating) 이를 숙주세포가 올라간 세포내 수준의 FPP를 포함하지 않는 조건들 ("제한된 성장 조건들") 하에서 성장시켜서 확인될 수 있다. 이러한 제한된 성장 조건들은 이에 제한되는 것은 아니지만 배양 배지에서 특이적 영양분의 존재, 배양 배지에서 특이적 수준으로 특이적 영양분의 존재, 배양 배지에서 유도화 화합물의 존재, 배양 배지에서 억제하는 화합물의 존재, 또한 특이적 성장 온도를 포함할 수 있다.
테르펜 합성효소들
본 명세서에서 제공된 본 발명들은 개선된 생체내 성능을 가진 테르펜 합성효소 변이체들을 개발하는 것에 관해 중점을 두고 있다.
일정 구현예들에서, 테르펜 합성효소 변이체는 자연적으로 생기는 테르펜 합성효소의 변이체이다. 다른 구현예들에서, 테르펜 합성효소 변이체는 자연적으로 생기지 않는 테르펜 합성효소의 변이체이다.
일정 이러한 구현예들에서, 테르펜 합성효소 변이체는 자연적으로 생기는 테르펜 합성효소와 또는 자연적으로 생기지 않는 테르펜 합성효소와 하나 이상의 아미노산 치환들, 결실들 및/또는 첨가들에 의해 서로 달라진다. 일정 구현예들에서, 테르펜 합성효소는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 추가적인 아미노산들을 포함하는 것에 의해 자연적으로 생기는 테르펜 합성효소와 또는 자연적으로 생기지 않는 테르펜 합성효소와 서로 달라진다. 일정 구현예들에서, 테르펜 합성효소는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 아미노산 치환들을 포함하는 것에 의해 자연적으로 생기는 테르펜 합성효소와 또는 자연적으로 생기지 않는 테르펜 합성효소와 서로 달라진다. 일정 구현예들에서, 테르펜 합성효소는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 아미노산 치환들이 결실되는 것에 의해 자연적으로 생기는 테르펜 합성효소와 또는 자연적으로 생기지 않는 테르펜 합성효소와 서로 달라진다.
일정 구현예들에서, 테르펜 합성효소 변이체는 자연적으로 생기는 테르펜 합성효소 또는 자연적으로 생기지 않는 테르펜 합성효소의 아미노산 서열과 약 50%로부터 약 55%까지, 약 55%로부터 약 60%까지, 약 60%로부터 약 65%까지, 약 65%로부터 약 70%까지, 약 70%로부터 약 75%까지, 약 75%로부터 약 80%까지, 약 80%로부터 약 85%까지, 약 85%로부터 약 90%까지, 약 90%로부터 약 95%까지, 또는 약 95%로부터 약 99%까지의 아미노산 서열 일치도를 가진다.
일정 구현예들에서, 테르펜 합성효소 변이체는 공통의 (consensus) 아미노산 서열을 포함한다. 공통의 아미노산 서열은 두 개 이상의 아미노산 서열들을 정렬하고, 적어도 두 개의 서열들에 의해 공유되는 아미노산들을 확인하여 유래된다. 일정 구현예들에서, 테르펜 합성효소 변이체는 둘 이상의 자연적으로 생기는 테르펜 합성효소들로부터 유래한 공통의 서열을 포함한다.
일정 구현예들에서, 테르펜 합성효소 변이체는 하이브리드 테르펜 합성효소이다. 하이브리드 테르펜 합성효소들은 둘 이상의 서로 다른 테르펜 합성효소들로부터 나온 인접한 (contiguous) 아미노산들의 연결들 (streches)을 포함한다. 하이브리드 테르펜 합성효소들은, 이에 제한되는 것은 아니지만 엑손 셔플링, 및 도메인 스워핑 등을 포함하는 기지의 방법이라면 모두를 사용하여 생성될 수 있다 (예로, Nixon et al . (1997) Proc . Natl . Acad . Sci . USA 94:1069-1073; Fisch et al . (1996) Proc Natl Acad Sci USA 93(15):7761-7766).
일정 구현예들에서, 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산은 자연적으로 생기는 테르펜 합성효소를 인코딩하는 핵산과 엄격한 혼성화 조건들 하에서 혼성화한다. 또 다른 구현예들에서, 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산은 자연적으로 생기는 테르펜 합성효소를 인코딩하는 핵산과 적당한 혼성화 조건들 하에서 혼성화한다. 보다 또 다른 구현예들에서, 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산은 자연적으로 생기는 테르펜 합성효소를 인코딩하는 핵산과 낮은 혼성화 조건들 하에서 혼성화한다.
일정 구현예들에서, 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열은 특정한 숙주세포를 위한 코돈 선호도들을 반영하도록 자연적으로 생기는 테르펜 합성효소를 인코딩하는 뉴클레오타이드 서열로부터 변경된다 (예로, 특정한 숙주세포에서 발현을 위해 코돈-최적화됨). 특정한 숙주세포를 위해 선호되는 코돈들의 사용은 일반적으로 뉴클레오타이드 서열의 해독, 이에 따른 발현의 유사성을 증가시킨다. 특이적 생물이 특이적 아미노산을 코딩하는 데 특이적 코돈을 사용하는 시간의 백분율을 정리한 코돈 사용도 표들은 많은 생물들의 경우에 입수가능하고, 적합한 뉴클레오타이드 서열들을 설계하는 데 기준으로서 사용될 수 있다. 일정 구현예들에서, 테르펜 합성효소를 인코딩하는 뉴클레오타이드 서열은 사카로마이세스 세레비시애의 코돈 선호도를 반영하도록 변경된다 (예로, Bennetzen and Hall (1982) J. Biol . Chem . 257(6): 3026-3031를 참조하라). 일정 구현예들에서, 테르펜 합성효소를 인코딩하는 뉴클레오타이드 서열은 사카로마이세스 세레비시애의 코돈 선호도를 반영하도록 변경된다 (예로, Gouy and Gautier (1982) Nucleic Acids Res . 10(22):7055-7074; Eyre-Walker (1996) Mol . Biol . Evol . 13(6):864-872; Nakamura et al . (2000) Nucleic Acids Res . 28(1):292를 참조하라).
테르펜 합성효소를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산은 다양한 기지의 재조합 기법들 및 합성적 절차들이라면 모두를 사용하여 획득될 수 있다. 핵산은 게놈 DNA, cDNA, 또는 RNA로부터 제조될 수 있고, 이들 모두는 세포로부터 직접 추출될 수 있거나, 이에 제한되는 것은 아니지만 PCR 및 rt-PCR을 포함하는 다양한 증폭 공정들에 의해 재조합으로 생산될 수 있다. 직접적인 화학적 합성 방법들도 역시 당해 기술분야에 잘 알려져 있다.
테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산은 다양한 기지의 재조합 방법들이라면 모두를 사용하여 획득될 수 있다. 예를 들면, 핵산들은 화학적 돌연변이원들 또는 방사선조사로 처리되었던 세포들로부터, 또는DNA 복구에 결함들을 가지는 세포들로부터 분리될 수 있다. 적합한 화학적 돌연변이원들은, 이에 제한되는 것은 아니지만 에틸 메탄술포네이트 (EMS), 메틸 메탄술포네이트 (MMS), N-니트로소 우레아 (ENU), N-메틸-N-니트로-N'-니트로소구아니딘, 4-니트로퀴놀린 N-옥사이드, 디에틸설페이트, 벤조피렌, 고리포스파아미이드, 블레오마이신, 트리에틸멜라민, 아크릴아마이드 단량체, 질소 머스타드, 빈크리스틴, 디에폭시알칸들 (예를 들면, 디에폭시부탄), ICR-170, 포름알데하이드, 프로카바진 염산, 에틸렌 옥사이드, 디메틸니트로사민, 7,12 디메틸벤즈(사)안트라센, 클로르암부실, 헥사메틸포스포아마이드, 비설판, 및 아크리딘 염색약들을 포함한다 (예를 들면 Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology , Second Edition (1989) Sinauer Associates, Inc. , Sunderland, Mass., or Deshpande Mukund V., Appl . Biochem . Biotechnol. 36, 227 (1992)를 참조하라). 적합한 방사선 노출들은 이에 제한되는 것은 아니지만 자외선 방사선 조사 (임의적으로, 예를 들면 트리메틸프소라렌과 같은 화학적 제제들에 대한 노출과 조합으로), γ-방사선 조사, X-선들, 및 빠른 중성자 충돌을 포함한다. 세포에서 DNA 복구의 결함들을 도입하는 적합한 방법은 이에 제한되는 것은 아니지만 세포의 게놈에서 높은 빈도의 돌연변이들을 생성하는 (약 1개 돌연변이/100개 유전자들 내지 약 1개 돌연변이/10,000개 유전자들의 빈도) 돌연변이 DNA 복구 효소의 발현을 포함한다. DNA 복구 효소들을 인코딩하는 유전자들의 예들로는 이에 제한되는 것은 아니지만 Mut H, Mut S, Mut L, 및 Mut U, 또한 다른 종들에서 그의 유사체들 (예를 들면, MSH 1-6, PMS 1-2, MLH 1, GTBP, 및 ERCC-1)을 포함한다. 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산을 획득하는 다른 방법들은 무세포 시험관내 시스템들의 조작 (예로, 핵산의 증폭을 위해 오류-빈발 PCR를 사용함), 이동성 DNA 요소의 세포 게놈 내 무작위 또는 표적화 삽입 (예로, 이동가능성 (transposable) 요소), 또는 시험관내 DNA 셔플링 (예로, 엑손 셔플링, 및 도메인 스와핑 등; 예를 들면 Ausubel et al., Current Protocols In Molecular Biology, John Wiley and Sons, New York (current edition); and Sambrook et al ., Molecular Cloning , A Laboratory Manual, 3d. ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (2001)를 참조하라)을 포함한다.
일정 구현예들에서, 테르펜 합성효소 변이체들은 β-파네센 합성효소, a-파네센 합성효소, 트리코디엔 합성효소, 패추롤 합성효소, 아모파디엔 합성효소, 발렌센 합성효소, 파네솔 합성효소, 네로리돌 합성효소, 및 누트카톤 합성효소로 이루어진 그룹으로부터 선택된 세스퀴테르펜 합성효소의 변이체들이다.
일정 구현예들에서, 테르펜 합성효소 변이체는 β-파네센 합성효소 변이체이다. 일정 이러한 구현예들에서, β-파네센 합성효소 변이체는 아르테미시아 애누아 (Artemisia annua)의 β-파네센 합성효소로부터 유래된다. 아르테미시아 애누아의 β-파네센 합성효소의 서열은 이전에 기술되었다 (Picaud, et al., (2005) Phytoc hemistry 66(9): 961-967). 아르테미시아 애누아의 β-파네센 합성효소의 뉴클레오타이드 서열은 진뱅크 기탁번호 제 AY835398호 하에 기탁되어 있고, 본 명세서에서 제공된 바와 같이 서열번호 112이다. 아르테미시아 애누아의 β-파네센 합성효소의 아미노산 서열은 진뱅크 기탁번호 제 AAX39387호 하에 기탁되어 있고, 본 명세서에서 제공된 바와 같이 서열번호 111이다.
일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 2번 위치에서 세린으로부터 아스파테이드로 아미노산 치환 (S2D 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 3번 위치에서 트레오닌으부터 아스파라진으로 아미노산 치환 (T3N 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 4번 위치에서 루이신으로부터 세린으로 아미노산 치환 (L4S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 6번 위치에서 이소루이신으로부터 트레오닌으로 아미노산 치환 (I6T 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 9번 위치에서 발린으로부터 아스파트산으로 아미노산 치환 (V9D 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 11번 위치에서 페닐알라닌으로부터 세린으로 아미노산 치환 (F11S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 20번 위치에서 발린으로부터 글루탐산으로 아미노산 치환 (V20E 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 24번 위치에서 발린으로부터 아스파트산으로 아미노산 치환 (V24D 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 35번 위치에서 메티오닌으로부터 트레오닌으로 아미노산 치환 (M35T 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 38번 위치에서 아스파라진으로부터 세린으로 아미노산 치환 (N38S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 50번 위치에서 아스파트산으로부터 아스파라진으로 아미노산 치환 (D50N 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 61번 위치에서 루이신으로부터 글루타민으로 아미노산 치환 (L61Q 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 72번 위치에서 글루탐산으로부터 라이신으로 아미노산 치환 (E72K 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 80번 위치에서 아스파라진으로부터 아스파트산으로 아미노산 치환 (N80D 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 89번 위치에서 이소루이신으로부터 발린으로 아미노산 치환 (I89V 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 105번 위치에서 글루탐산으로부터 아스파트산으로 아미노산 치환 (E105D 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 115번 위치에서 이소루이신으로부터 메티오닌으로 아미노산 치환 (I115M 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 144번 위치에서 페닐알라닌으로부터 타이로신으로 아미노산 치환 (F114Y 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 196번 위치에서 트레오닌으로부터 세린으로 아미노산 치환 (T196S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 211번 위치에서 세린으로부터 트레오닌으로 아미노산 치환 (S211T 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 251번 위치에서 루이신으로부터 메티오닌으로 아미노산 치환 (L251M 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 280번 위치에서 루이신으로부터 글루탐산으로 아미노산 치환 (L280Q 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 288번 위치에서 타이로신으로부터 페닐알라닌으로 아미노산 치환 (Y288F 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 319번 위치에서 트레오닌으로부터 세린으로 아미노산 치환 (T319S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 357번 위치에서 글루탐산으로부터 발린으로 아미노산 치환 (E357V 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 359번 위치에서 글루탐산으로부터 트레오닌으로 아미노산 치환 (E359T 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 369번 위치에서 발린으로부터 루이신으로 아미노산 치환 (V369L 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 371번 위치에서 루이신으로부터 메티오닌으로 아미노산 치환 (L371M 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 385번 위치에서 트레오닌으로부터 알라닌으로 아미노산 치환 (T385A 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 398번 위치에서 이소루이신으로부터 발린으로 아미노산 치환 (I398V 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 423번 위치에서 발린으로부터 이소루이신으로 아미노산 치환 (V423I 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 433번 위치에서 메티오닌으로부터 이소루이신으로 아미노산 치환 (M433I 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 434번 위치에서 이소루이신으로부터 트레오닌으로 아미노산 치환 (I434T 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 442번 위치에서 글리신으로부터 알라닌으로 아미노산 치환 (G442A 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 442번 위치에서 글리신으로부터 아스파트산으로 아미노산 치환 (G442D 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 444번 위치에서 이소루이신으로부터 루이신으로 아미노산 치환 (I444L 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 446번 위치에서 트레오닌으로부터 아스파라진으로 아미노산 치환 (T446N 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 460번 위치에서 이소루이신으로부터 발린으로 아미노산 치환 (I460V 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 467번 위치에서 발린으로부터 이소루이신으로 아미노산 치환 (V467I 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 488번 위치에서 세린으로부터 페닐알라닌으로 아미노산 치환 (S488F 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 495번 위치에서 글루탐산으로부터 글리신으로 아미노산 치환 (E495G 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 505번 위치에서 글루탐산으로부터 발린으로 아미노산 치환 (E505V 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 526번 위치에서 트레오닌으로부터 세린으로 아미노산 치환 (T526S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 531번 위치에서 프롤린으로부터 세린으로 아미노산 치환 (P531S 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 556번 위치에서 알라닌으로부터 발린으로 아미노산 치환 (A556V 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 572번 위치에서 메티오닌으로부터 라이신으로 아미노산 치환 (M572K 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 575번 위치에서 종결 코돈으로부터 라이신으로 아미노산 치환 (stop575K 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 348번 위치에서 아르기닌으로부터 라이신으로 아미노산 치환 (R348K 돌연변이)을 포함하는 아미노산 서열을 가진다. 일정 구현예들에서, β-파네센 합성효소 변이체는 서열번호 111에 주어진 바와 같지만 18번 위치에서 루이신으로부터 이소루이신으로 아미노산 치환 (L18I 돌연변이)을 포함하는 아미노산 서열을 가진다.
유전적으로 조작된 숙주 세포들
본 명세서에서 제공된 방법들은 올라간 세포내 FPP 수준을 포함하도록 또는 테르펜 합성효소 또는 테르펜 합성효소 변이체를 발현하도록 유전적으로 조작된 숙주세포를 획득하는 단계를 포함한다. 이러한 유전적으로 조작된 숙주세포는 FPP의 세포내 수준을 올리거나 테르펜 합성효소 또는 테르펜 합성효소 변이체를 발현하는 원하는 효과를 제공하도록 이러한 방식으로 뉴클레오타이드들의 삽입들, 결실들, 또는 변형들을 포함할 수 있다. 이러한 유전적 변형들은 특이적 효소의 사본수 또는 활성에서 감소 또는 증가 또는 변형들을 가져올 수 있다.
예를 들면, 숙주세포에서 효소의 사본수는 효소를 인코드하는 유전자의 전사를 변형하여 변경될 수 있다. 이것은 예를 들면 효소를 인코딩하는 뉴클레오타이드 서열의 사본수를 변형하는 것에 의해 (예로, 뉴클레오타이드 서열을 포함하는 더 높은 또는 더 낮은 사본수 발현 벡터를 사용하는 것에 의해 또는 숙주세포의 게놈 내로 뉴클레오타이드 서열의 추가적인 사본들을 도입하는 것에 의해 또는 숙주세포의 게놈에서 뉴클레오타이드 서열을 결실하거나 파괴하는 것에 의해), 오페론의 폴리시스트론 mRNA 상에서 코딩 서열들의 순서를 변화하거나 각각 그 자신의 조절 요소들을 가진 개별 유전자들 내 오페론을 파괴하는 것에 의해, 또는 뉴클레오타이드 서열이 작동적으로 연결된 프로모터 또는 오퍼레이터의 강도를 증가시키는 것에 의해 달성될 수 있다. 임의적으로 또는 추가적으로, 숙주세포에서 효소의 사본수는 효소를 인코드하는 mRNA 해독의 수준을 변형하여 변경될 수 있다. 이것은, 예를 들면 mRNA의 안정성을 변형하고, 리보좀 결합 부위의 서열을 변형하고, 리보좀 결합 부위 및 효소 코딩 서열 사이의 거리 또는 서열을 변형하고, 효소 코딩 부위의 개시 코돈의 "상류" 또는 5'측면에 인접하여 위치하는 시트트론간 부위 전부를 변형하고, 헤어핀들 및 특수화된 서열들을 사용하여 mRNA 전사체의 3'-말단을 안정화하고, 효소의 코돈 사용도를 변형하고, 효소의 생합성에 사용되는 희귀한 코돈 tRNAs의 발현을 변경하고 및/또는, 예를 들면 그의 코딩 서열의 돌연변이를 통해 효소의 안정도를 증가시키는 것에 의해 달성될 수 있다.
숙주세포에서 효소의 활성은, 이에 제한되는 것은 아니지만 숙주세포에서 증가되거나 감소된 용해도를 나타내는 효소의 변형된 형태를 발현하거나, 효소의 활성이 저해되는 도메인이 결여된 효소의 변형된 형태를 발현하거나, 기질에 대한 더 높거나 더 낮은 Kcat 또는 더 낮거나 더 높은 Km을 가지는 효소의 변형된 형태를 발현하거나, 경로에서 또 다른 분자에 의해 피드백 또는 피드-포워드 조절에 의해 다소간 영향을 받는 효소의 변경된 형태를 발현하는 단계를 포함하는 많은 방식들로 변경될 수 있다.
본 명세서에서 제공된 방법들은 또한 이러한 테르펜 합성효소 또는 테르펜 합성효소 변이체를 자연적으로 발현하지 않는 숙주세포에서 테르펜 합성효소 또는 테르펜 합성효소 변이체를 발현하는 단계들을 포함한다. 숙주세포에서 테르펜 합성효소 또는 테르펜 합성효소 변이체의 발현은 숙주세포 에서 발현을 허용하는 조절 요소들의 통제 하에 테르펜 합성효소 또는 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산을 숙주세포 내로 도입하여 달성될 수 있다. 일정 구현예들에서, 핵산은 염색체외 플라스미드이다. 다른 구현예들에서, 핵산은 숙주세포의 염색체 내로 뉴클레오타이드 서열을 통합할 수 있는 염색체 통합 벡터이다.
일정 구현예들에서, 둘 이상의 숙주 세포들에서 테르펜 합성효소들 또는 테르펜 합성효소 변이체들의 발현 수준들은 유사한 것이 필수적이다. 이것은 테르펜 합성효소 또는 테르펜 합성효소 변이체를 동일한 조절 요소들의 통제 하에 인코딩하는 뉴클레오타이드 서열들을 포함하는 핵산들을 사용하여 달성될 수 있다. 이러한 핵산들은 염색체외 발현 벡터들로서 또는 테르펜 합성효소 또는 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열들 및 조절 요소들을 숙주세포의 염색체 내로 통합하는 데 사용될 수 있다. 비교가능한 발현 수준들은 테르펜 합성효소 또는 테르펜 합성효소 변이체를 인코딩하는 뉴클레오타이드 서열들을 포함하는 핵산들을 둘 이상의 숙주 세포들에서 일치하는 위치들로 표적화하고, 따라서 동일한 내인성 조절 요소들의 통제 하에 뉴클레오타이드 서열들을 두는 것에 의해서도 역시 달성될 수 있다. 유사한 조절 요소들의 사용과 추가하여, 비교가능한 발현 수준들은 둘 이상의 숙주 세포들에서 뉴클레오타이드 서열들의 유사한 사본수에도 역시 의존할 수 있다. 사본수들은 염색체외 발현 벡터들에서 유사하거나 일치하는 복제 원점들의 사용에 의해, 또는 둘 이상의 숙주 세포들의 염색체 내로 뉴클레오타이드 서열들의 통합을 위한 염색체 통합 제작물들의 유사한 유형들의 사용 및 수들에 의해 조절될 수 있다. 핵산들의 추가적인 많은 특징들은 인코드된 테르펜 합성효소들 또는 테르펜 합성효소 변이체들의 발현 수준에 영향을 줄 수 있고 (예로, 단백질 또는 mRNA 안정도, 리보좀 결합 부위의 서열, 리보좀 결합 부위 및 개시 코돈 간의 거리, 및 코돈 사용도), 이들 모두는 제공된 방법들에서 요구될 때 유사한 발현 수준들을 입증하도록 변형될 수 있다.
핵산들은 제한되지 않고도 당업자가 숙지하고 있는 방법이라면 모두에 의해 미생물들 내로 도입될 수 있다 (예를 들면, Hinnen et al . (1978) Proc . Natl . Acad . Sci . USA 75:1292-3; Cregg et al . (1985) Mol . Cell . Biol . 5:3376-3385; Goeddel et al . , eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc. , CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al. , 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; 및 Ausubel et al . , eds. , Current Edition, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY를 참조하라). 대표적인 기법들로는 이에 제한되는 것은 아니지만 원형질화 (spheroplasting), 전기천공 (electroporation), PEG 1000 매개성 형질전환, 또한 리튬 아세테이트 또는 리튬 클로라이드 매개성 형질전환을 포함한다.
일정 구현예들에서, 숙주세포를 유전적으로 변형하는 데 사용되는 핵산은 형질전환된 숙주 세포들의 선별을 위해 또한 외래 DNA를 유지하도록 숙주 세포 상에 선택적 압력을 두는 데 유용한 하나 이상의 선택가능한 마커들을 포함한다.
일정 구현예들에서, 선택가능한 마커는 항생제 저항성 마커이다. 항생제 저항성 마커들의 설명적 예들로는 이에 제한되는 것은 아니지만 BLA , NAT1 , PAT , AUR1 -C, PDR4 , SMR1 , CAT, 마우스 dhfr, HPH , DSDA , KAN R , 및 SH BLE 유전자 산물들을 포함한다. 대장균으로부터 나온 BLA 유전자 산물은 베타-락탐 항생제들 (예로, 좁은-스펙트럼의 세팔로스포릴류, 세팔로마이신류, 및 카바페넴류 (에르타페넴), 세파만돌, 및 세포페라존)에 대한 또한 테모실린을 제외한 항-그램-음성-박테리아 모두에 대한 저항성을 부여하고; S. noursei로부터 나온 NAT1 유전자 산물은 나르세오트리신 (nourseothricin)에 대한 저항성을 부여하고; S. viridochromogenes Tu94로부터 나온 PAT 유전자 산물은 비알로포스 (bialophos)에 대한 저항성을 부여하고; 사카로마이세스 세레비시애로부터 나온 AUR1 -C 유전자 산물은 아우에로바시딘 A (Auerobasidin A, AbA)에 대한 저항성을 부여하고; PDR4 유전자 산물은 세룰레닌 (cerulenin)에 대한 저항성을 부여하고; SMR1 유전자 산물은 셀포메투론 메틸 (sulfometuron methyl)에 대한 저항성을 부여하고; Tn9 트랜스포존으로부터 나온 CAT 유전자 산물은 클로르암페니콜에 대한 저항성을 부여하고; 마우스 dhfr 유전자 산물은 메토트렉세이트 (methotrexate)에 대한 저항성을 부여하고; 크렙시엘라 뉴모니아 (Klebsiella pneumonia)의 HPH 유전자 산물은 하이그로마이신 B (Hygromycin B)에 대한 저항성을 부여하고; 대장균의 DSDA 유전자 산물은 단독 질소원으로서 D-세린을 가진 플레이트들 상에서 세포들이 성장하도록 허용하고; Tn903 트랜스포존의 KAN R 유전자는 G418에 대한 저항성을 부여하고; 또한 Streptoalloteichus hindustanus로부터 나온 SH BLE 유전자 산물은 제오신 (블레오마이신)에 대한 저항성을 부여한다. 일정 구현예들에서, 본 항생제 저항성 마커는 본 명세서에서 기재된 유전적으로 변형된 숙주세포가 분리된 이후에 결실된다.
일정 구현예들에서, 선택가능한 마커는 유전적으로 변형된 미생물에서 영양요구성 (예로, 영양적 요구성)을 회복시킨다. 이러한 구현예들에서, 부모 미생물은 아미노산 또는 뉴클레오타이드 생합성 경로에서 기능하고, 비기능성일 때, 부모 세포를 하나 이상의 영양분들로의 보충이 없이는 배지에서 성장할 수 없게 하는 하나 이상의 유전자 산물에서 기능적 파괴를 포함한다. 이러한 유전자 산물들은 효모에서 이에 제한되는 것은 아니지만 HIS3 , LEU2 , LYS1 , LYS2, MET15, TRP1 , ADE2 , 및 URA3 유전자 산물들을 포함한다. 다음으로 영양요구성 표현형은 파괴된 유전자 산물의 기능적 사본을 인코딩하는 발현 벡터 또는 염색체 통합 제작물로 부모 세포를 형질전환하여 회복될 수 있고, 생성된 유전적으로 변형된 숙주세포는 부모 세포의 영양요구성 표현형의 소실을 기초로 하여 선택될 수 있다. 선택가능한 마커로서 URA3 , TRP1, 및 LYS2 유전자들은 양성 및 음성 선별들 둘 다가 가능하기 때문에 현저한 장점을 가진다. 양성 선별은 URA3 , TRP1, 및 LYS2 돌연변이들의 영양요구성 보완에 의해 수행되는 한편, 음성 선별은 원영양성 균주들의 성장은 막지만 URA3 , TRP1, 및 LYS2 돌연변이들의 성장은 각각 허용하는 특이적 저해제들, 예로 5-플루오로-오로트산 (FOA), 5-플루오로안트라닐산, 및 α-아미노아디프산 (aAA)을 각각 기초로 한다.
다른 구현예들에서, 선택가능한 마커들은 기지의 선별 방법에 의해 확인될 수 있는 다른 비치사성 결함들 또는 표현형들을 구출한다.
숙주세포들을 성장시키는 단계
본 발명은 개선된 생체내 성능을 가지는 테르펜 합성효소 변이체들을 개발하는, 또한 테르펜들을 생산하는 방법들을 제공한다. 본 방법들은 일반적으로 탄소원을 포함하는 적합한 배지에서 적합한 조건들 하에 숙주세포를 성장시키는 단계가 관여한다.
미생물들을 성장시키는 적합한 조건들 및 적합한 배지는 당해 기술분야에 잘 알려져 있다. 일정 구현예들에서, 적합한 배지는 예를 들면 유도화 화합물 (예로, 유전자 산물을 인코딩하는 하나 이상의 뉴클레오타이드 서열들이 유도가능한 프로모터의 조절 하에 있음), 억제 화합물 (repressing compound) (예로, 유전자 산물을 인코딩하는 하나 이상의 뉴클레오타이드 서열들이 억제가능한 프로모터의 조절 하에 있음), 또는 선택 제제 (예로, 유전적 변형들을 포함하는 미생물들을 선별하는 항생제)와 같은 하나 이상의 추가적인 제제들로 보충된다.
일정 구현예들에서, 탄소원은 단당류 (단순한 당), 이당류, 다당류, 비-발효가능한 탄소원, 또는 하나 이상의 그들의 조합들이다. 적합한 단당류들의 비제한적인 예들로는 포도당, 갈락토스, 만노스, 과당, 리보스 및 그의 조합들을 포함한다. 적합한 이당류들의 비제한적인 예들로는 전분, 글리코겐, 셀루로스, 키틴, 및 그의 조합들을 포함한다. 적합한 비-발효가능한 탄소원들의 비제한적인 예들로는 아세테이트 및 글리세롤을 포함한다.
한 가지 관점에서, 본 발명은 테스트 테르펜 합성효소를 포함하는 숙주세포의 성장률을 기초로 하여 개선된 생체내 성능을 가진 테르펜 합성효소를 확인하는 방법을 제공한다. 숙주세포의 성장률은, 예를 들면 정의된 시간의 기간 동안 액체 배지에서 숙주세포를 성장시키고, 다음으로 한천 배지 상에서 배양액의 모두 또는 분량을 도말하고, 최종적으로 한천 배지 상에서 나오는 콜로니들의 수를 점수 매기어 결정될 수 있다. 임의적으로, 숙주세포의 성장율은 정의된 시간의 기간 이후에 배양액의 생물량을 측정하여 결정된다. 생물량은 액체 배양액의 밀도를 결정하여, 예로 UV 분광분석법에 의해 또는 헥소스아민 및 에르고스테롤과 같은 생물량 지표 분자들을 정량하여 측정될 수 있다 (Frey et al. (1992) Biol. Fertil. Soils 13: 229-234; Newell (1992) p. 521-561. In G. C. Carroll and D. T. Wicklow (ed.), The fungal community: its organization and role in the ecosystem, 2nd ed. Marcel Dekker Inc., New York).
테르펜들을 생산하는 단계
본 발명은 테르펜들을 생산하는 방법들을 제공한다.
일정 구현예들에서, 테르펜은 발효 배지 리터 당 약 10 그램 이상의 양으로 생산된다. 일정 이러한 구현예들에서, 테르펜은 세포 배양액 리터 당 약 10으로부터 약 50 그램까지, 약 15 그램 이상, 약 20 그램 이상, 약 25 그램 이상, 또는 약 30 그램 이상의 양으로 생산된다.
일정 구현예들에서, 테르펜은 건조 세포 무게의 그램 당 약 50 밀리그램 이상의 양으로 생산된다. 일정 이러한 구현예들에서, 테르펜은 건조 세포 무게의 그램 당 약 50으로부터 약 1500 밀리그램까지, 약 100 밀리그램 이상, 약 150 밀리그램 이상, 약 200 밀리그램 이상, 약 250 밀리그램 이상, 약 500 밀리그램 이상, 약 750 밀리그램 이상, 또는 약 1000 밀리그램 이상의 양으로 생산된다.
일정 구현예들에서, 테르펜은 세포 배양액의 단위 부피 당을 기초로 하여, 첫 번째 이종유래 뉴클레오타이드 서열을 포함하지 않는 숙주세포에 의해 생산되는 테르펜의 양보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상인 양으로 생산된다.
일정 구현예들에서, 테르펜은 단위 건조세포 무게 당을 기초로 하여, 첫 번째 이종유래 뉴클레오타이드 서열을 포함하지 않는 숙주세포에 의해 생산되는 테르펜의 양보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상인 양으로 생산된다.
일정 구현예들에서, 테르펜은 단위 시간 당 세포 배양액의 단위 부피 당을 기초로 하여, 첫 번째 이종유래 뉴클레오타이드 서열을 포함하지 않는 숙주세포에 의해 생산되는 테르펜의 양보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상인 양으로 생산된다.
일정 구현예들에서, 테르펜은 단위 시간 당 단위 건조세포 무게 당을 기초로 하여, 첫 번째 이종유래 뉴클레오타이드 서열을 포함하지 않는 숙주세포에 의해 생산되는 테르펜의 양보다 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 2배, 적어도 약 2.5배, 적어도 약 5배, 적어도 약 10배, 적어도 약 20배, 적어도 약 30배, 적어도 약 40배, 적어도 약 50배, 적어도 약 75배, 적어도 약 100배, 적어도 약 200배, 적어도 약 300배, 적어도 약 400배, 적어도 약 500배, 또는 적어도 약 1,000배 이상인 양으로 생산된다.
테르펜들을 추출하고 정량하는 단계
본 발명의 유전적으로 변형된 숙주세포에 의해 생산된 테르펜은 당해 기술분야에 알려져 있는 적합한 분리 및 정제 방법들이라면 모두를 사용하여 발효로부터 분리될 수 있다.
일정 구현예들에서, 테르펜을 포함하는 유기상은 원심분리에 의해 발효로부터 분리된다. 다른 구현예들에서, 테르펜을 포함하는 유기상은 발효로부터 자발적으로 분리된다. 보다 다른 구현예들에서, 테르펜을 포함하는 유기상은 탈에멀전화제 및/또는 핵형성화 제제 (nucleating agent)를 발효 반응 내로 첨가하여 발효로부터 분리된다. 핵형성화 제제의 도시적 예들로는 테르펜 자체의 소방울들 (droplets) 또한 도데칸, 이소프로필 미리스트레이트, 및 메틸 올레이트와 같은 유기 용매들을 포함한다.
일정 구현예들에서, 테르펜은 유기상에서 존재할 수 있는 다른 산물들로부터 분리된다. 일정 구현예들에서, 분리는 흡착, 증류, 기체-액체 추출 (압출), 액체-액체 추출 (용매 추출), 초여과, 및 표준 크로마토그래피 기법들을 사용하여 달성된다.
일정 구현예들에서, 테르펜은 순수하고, 예로 적어도 40% 순도, 적어도 50% 순도, 적어도 60% 순도, 적어도 70% 순도, 적어도 80% 순도, 적어도 90% 순도, 적어도 95% 순도, 적어도 98% 순도, 또는 98% 이상의 순도이고, 테르펜의 맥락에서 "순수한 (pure)"은 다른 테르펜들 또는 오염물들이 없는 테르펜을 말한다.
테르펜 생산은, 이에 제한되는 것은 아니지만 기체 크로마토그래피 (GC), 기체 크로마토그래피-질량 분광분석법 (GC/MS), 핵자기 공명 (NMR), RAMAN 분광분석법, 광학적 흡착법 (UV/VIS), 자외선 분광분석법 (IR), 고해상도 액체 크로마토그래피 (HPLC), 액체 크로마토그래피-질량 분광분석법 (LC/MS), 이온 크로마토그래피-질량 분광분석법, 박막 크로마토그래피, 간헐적 전류측정 검출법 (pulsed amperometric detection), 및 UV-가시광선 분광분석법을 포함하는 당해 기술분야에 숙지되어 있는 잘 알려진 방법들을 사용하여 바로 정량될 수 있다.
숙주 세포들에 의해 생산된 테르펜들은, 이에 제한되는 것은 아니지만 크로마토그래피, 추출법, 용매 추출법, 막 분리법, 전기투석법, 역삼투압법, 화학적 유도체화, 및 결정화를 포함하는 다양한 방법들이라면 모두를 사용하여 회수될 수 있다.
테르펜 정량 또는 분리를 개선하는 추가적인 가공 단계들은 이에 제한 되는 것은 아니지만 숙주 세포들을 파쇄하여 여는 것을 포함한다. 적합한 방법들은 이에 제한되는 것은 아니지만 볼텍싱, 초음파 파쇄, 유리 비드들의 사용을 포함한다. 다른 가공 단계들은 유해한 세포 잔재물을 상청액으로부터 제거하도록 원심분리를 포함할 수 있다.
실시예들
다음의 특정한 실시예들은 본 발명을 상술하도록 의도되고 청구항들의 범위를 제한하는 것으로서 참작되지 않아야 한다.
실시예
1
본 실시예는 테르펜 합성효소 변이체들의 생성 및 특성분석에 유용한 DNA 제작물들을 만드는 방법들을 기술하고 있다.
발현 플라스미드 pAM36-MevT66는 MevT66 오페론을 벡터 pAM36 내로 삽입하여 생성되었다. 벡터 pAM36는 pACYC184 벡터 (진뱅크 기탁번호 XO6403)로부터 tet 저항성 유전자를 제거하고 AscI-SfiI-AsiSI-XhoI-PacI-FsIl-PmeI 제한효소 부위들을 포함하는 올리고뉴클레오타이드 카세트를 벡터 내로 첨가하여 생성되었다. MevT66 오페론은 편재하는 전구체 아세틸-CoA를 (R)-메발로네이트로 다함께 변환시키는 한 벌의 MEV 경로 효소들, 즉 아세토아세틸-CoA 티올라제, HMG-CoA 합성효소, 및 HMG-CoA 환원효소를 인코드하였다. MevT66 오페론은 합성적으로 생성되었고 대장균에서 발현을 위해 코돈-최적화된 대장균의 atoB 유전자 (진뱅크 기탁번호 NC_000913 REGION: 2324131..2325315; 아세토아세틸-CoA 티올라제를 인코드함), 대장균에서 발현을 위해 코돈-최적화된 사카로마이세스 세레비시애의 ERG13 유전자의 코딩 서열 (진뱅크 기탁번호 X96617, REGION: 220..1695; HMG-CoA 합성효소를 인코드함), 및 대장균에서 발현을 위해 코돈-최적화된 사카로마이세스 세레비시애의 HGM1 유전자의 절단된 코딩 서열 (진뱅크 기탁번호 M22002, REGION: 1777..3285; 절단된 HMG-CoA 환원효소를 인코드함)을 포함하였다. 합성적으로 생성된 MevT66 오페론은 표준 pUC 또는 pACYC 기원 벡터와 같은 클로닝 벡터 내로 클론되었고, 이것은 다시 끼어있는 SfiI 및 AsiSI 제한효소 부위들을 가지고 PCR 증폭되었고, 증폭된 DNA 단편은 SfiI 및 AsiSI 제한효소들을 사용하여 소화되었고, MevT66 오페론을 포함하는 대략 4.2 kb DNA 단편은 젤 정제되었고, 정제된 DNA 단편은 pAM36 벡터의 SfiI 및 AsiSI 제한효소 부위들 내로 삽입되었고, 발현 플라스미드 pAM36-MevT66를 수득하였다.
발현 플라스미드 pMevB-Cm는 MevB 오페론을 pBBR1MCS-1 벡터 내로 삽입하여 생성되었다. MevB 오페론은 (R)-메발로네이트를 IPP로 다함께 전환하는 한 벌의 효소들, 즉 메발로네이트 키나제, 포스포메발로네이트 키나제, 및 메발로네이트 피로포스페이트 탈탄산화효소를 인코드한다. ERG12 유전자의 코딩 서열 (진뱅크 기탁번호 X55875, REGION: 580..1911; 메발로네이트 키나제를 인코드함), ERG8 유전자의 코딩 서열 (진뱅크 기탁번호 Z49939, REGION: 3363..4718; 포스포메발로네이트 키나제를 인코드함), 및 MVD1 유전자의 코딩 서열 (진뱅크 기탁번호 X97557, REGION: 544..1734; 메발로네이트 피로포스페이트 탈탄산화효소를 인코드함)은 사 카로마이세스 세레비시애 게놈 DNA로부터 PCR 증폭되었다. 적절한 프라이머 서열들을 선택하여, ERG12 및 ERG8 코딩 서열들의 종결 코돈들은 리보좀 결합 부위들을 도입하도록 PCR 증폭 동안 TAA로부터 TAG까지 변화되었다. PCR 산물들은 서열 중복 연장 (SOE; Ho , et al , 1989)에 의해 MevB 오페론 내로 다함께 스프라이싱되었다. 3' A 오버행들의 첨가 이후에, MevB 오페론은 TA 클로닝 벡터 pCR4 (Invitrogen, Carlsbad, CA) 내로 라이게이션되었다. MevB 오페론은 PstI 제한효소를 사용하여 클로닝 제작물을 소화하는 것에 의해 절단되고 (excised), MevB 오페론을 포함하는 대략 4.2 kb DNA 단편이 젤 정제되었고, 정제된 DNA 단편은 벡터 pBBR1MCS-1의 PstI 제한효소 부위 내로 라이게이션되었고 (Kovach et al ., Gene 166(1): 175-176 (1995)), 발현 플라스미드 pMevB-Cm를 수득하였다.
발현 플라스미드 pMBI는 MBI 오페론을 pBBR1MCS-3 벡터 내로 삽입하여 생성되었다. MBI 오페론은 MevB 오페론과 동일한 효소들, 뿐만 아니라 IPP의 DMAPP로 전환을 촉매화하는 이소펜테닐 피로포스파타제 이성질화효소를 인코드한다. MBI 오페론은 대장균 게놈 DNA로부터 idi 유전자 (진뱅크 기탁번호 AF119715) 의 코딩 서열을 XmaI 제한효소 부위를 그들의 5' 말단들에 포함하는 프라이머들을 사용하여 PCR 증폭하여 생성되었다. PCR 산물은 XmaI 제한효소를 사용하여 소화되었고, idi 코딩 서열을 포함하는 0.5 kb DNA 단편은 젤 정제되었고, 정제된 DNA 단편은 발현 플라스미드 pMevB-Cm의 XmaI 제한효소 부위 내로 삽입되었고 idi는 MevB 오페론의 3'말단에 두었다. 다음으로 MBI 오페론은 벡터 pBBR1MCS-3 (Kovach et al ., Gene 166(1): 175-176 (1995))의 SalI 및 SacI 제한효소 부위 내로 서브클론되었고 발현 플라스미드 pMBI를 수득하였다.
발현 플라스미드 pMBIS은 ispA 유전자를 발현 플라스미드 pMBI 내로 삽입하여 생성되었다. ispA 유전자는 IPP 및 DMAPP의 FPP로 응축을 촉매화하는 파네실 피로포스페이트 합성효소를 인코드한다. ispA 유전자 (진뱅크 기탁번호 D00694, REGION: 484..1383)의 코딩 서열은 SacⅡ 제한효소 부위를 가진 전방향 프라이머 및 SacI 제한효소 부위를 가진 역방향 프라이머를 사용하여 대장균 게놈 DNA로부터 PCR 증폭되었다. 증폭된 PCR 산물은 SacⅡ 및 SacI 제한효소들을 사용하여 소화되었고, ispA 코딩 서열을 포함하는 0.9 kb DNA 단편은 젤 정제되었고, 정제된 DNA 단편은 pMBI의 SacⅡ 및 SacI 제한효소 부위들 내로 라이게이션되었고, ispA 코딩 서열을 idi 및 MevB 오페론의 3'에 두었고 발현 플라스미드 pMBIS를 수득하였다.
발현 플라스미드 pAM25는 MevT66 오페론을 pAM29 벡터 내로 삽입하여 생성되었다. pAM29 벡터는 p15A 복제원점 및 pZS24-MCS1 벡터 (Lutz and Bujard (1997) Nucl Acids Res. 25:1203-1210)로부터 나온 카나마이신 저항성을 부여하는 유전자를 올리고뉴클레오타이드-생성된 lacUV5 프로모터와 조립하여 제작되었다. MevT66 오페론을 포함하는 DNA 합성 제작물 (상기 pAM36-MevT66에 대한 기재를 참조하라)은 EcoRI 및 Hind Ⅲ 제한효소들을 사용하여 소화되었고, MevT66 오페론을 포함하는 대략 4.2 kb DNA 단편은 젤 정제되었고, 정제된 DNA 단편은 pAM29의 EcoRI 및 HindⅢ 제한효소 부위들 내로 라이게이션되었고, 발현 플라스미드 pAM25를 수득하였다.
발현 플라스미드 pAM41는 발현 플라스미드 pAM25 내로 사카로마이세스 세레비시애 HMG-CoA 환원효소의 절단된 버전을 인코드하는 HMG1유전자의 절단된 코딩 서열을 스태필로코커스 아우레우스 (Staphylococcus aureus ) HMG-CoA 환원효소를 인코드하는 mvaA 유전자 (진뱅크 기탁번호 BA000017, REGION: 2688925..2687648)의 코딩 서열로 대체하여 생성되었다. mvaA 유전자의 코딩 서열은 스태필로코커스 아 우레우스 아종 아우레우스 (ATCC 70069) 게놈 DNA로부터 SpeI 제한효소 부위들을 포함하는 프라이머들을 사용하여 PCR 증폭되었고, PCR 산물은 SpeI 제한효소를 사용하여 소화되었고, mvaA 코딩 서열을 포함하는 대략 1.3 kb DNA 단편은 젤 정제되었다. 발현 플라스미드 pAM25는 HindⅢ 제한효소를 사용하여 소화되었고, 말단의 오버행들은 T4 DNA 중합효소를 사용하여 블런트화되었고, 선형의 벡터 골격은 SpeI 제한효소를 사용하여 부분적으로 소화되었고, 절단된 HMG1 코딩 서열이 결여된 대략 4.8 kb DNA 단편은 젤 정제되었다. 정제된 DNA 단편들은 라이게이션되었고, 발현 플라스미드 pAM41를 수득하였다.
발현 플라스미드 pAM43는 MBIS 오페론을 발현 플라스미드 pAM36-MevT66 내로 삽입하여 생성되었다. MBIS 오페론은 pMBIS로부터 5' XhoI 제한효소 부위 및 3' PacI 제한효소 부위를 포함하는 프라이머들을 사용하여 PCR 증폭되었고, 증폭된 PCR 산물은 XhoI 및 PacI 제한효소들을 사용하여 소화되었고, MBIS 오페론을 포함하는 대략 5.4 kb DNA 단편은 젤 정제되었고, 정제된 DNA 단편은 발현 플라스미드 pAM36-MevT66의 XhoI PacI 제한효소 부위 내로 라이게이션되었고, 발현 플라스미드 pAM43를 수득하였다.
발현 플라스미드 pAM45는 lacUV5 프로모터들을 발현 플라스미드 pAM43의 MBIS 및 MevT66 오페론들 앞에 삽입하여 생성되었다. lacUV5 프로모터를 인코딩하는 뉴클레오타이드 서열을 포함하는 DNA 단편은 올리고뉴클레오타이드들로부터 합성되었고, pAM43의 AscI SfiI 및 AsiSI XhoI 제한효소 부위들 내로 삽입되었고, 발현 플라스미드 pAM45를 수득하였다.
발현 플라스미드 pAM52는 발현 플라스미드 pAM41 내에 사카로마이세스 세레비시애 HMG-CoA 합성효소를 인코드하는 ERG13 유전자의 코딩 서열을 스태필로코커 스 아우레우스 HMG-CoA 합성효소를 인코드하는 mvaS 유전자 (진뱅크 기탁번호 BA000017, REGION: 2689180..2690346)의 코딩 서열로 대체하여 생성되었다. mvaS 유전자의 코딩 서열은 스태필로코커스 아우레우스 아종 아우레우스 (ATCC 70069) 게놈 DNA로부터 PCR 증폭되었고, 증폭된 DNA 단편은 가이저 등의 방법에 따라 pAM41에서 HMG1 유전자의 코딩 서열을 대체하도록 PCR 프라이머로서 사용되었고 (Geiser et al ., BioTechniques 31:88-92 (2001)), 발현 플라스미드 pAM52를 수득하였다.
발현 플라스미드 pAM97는 발현 플라스미드 pAM45에서 MevT66 오페론을 발현 플라스미드 pAM52의 (atoB(opt):mvaS:mvaA) 오페론으로 대체하여 생성되었다. 발현 플라스미드 pAM45는 AsiSI 및 SfiI 제한효소들을 사용하여 소화되었고, MevT66 오페론이 결여된 대략 8.3 kb DNA 단편이 젤 정제되었다. pAM52의 (atoB(opt):mvaS:mvaA) 오페론은 SfiI 및 AsiSI 제한효소 부위를 포함하는 프라이머들을 사용하여 PCR 증폭되었고, PCR 산물은 SfiI 및 AsiSI 제한효소들을 사용하여 소화되었고, (atoB(opt):mvaS:mvaA) 오페론을 포함하는 대략 3.8 kb DNA 단편은 젤 정제되었다. 정제된 DNA 단편들은 라이게이션되고, 발현 플라스미드 pAM97를 수득하였다.
발현 플라스미드 pAM765는 발현 플라스미드 pAM97에서 사카로마이세스 세레비시애 메발로네이트 키나제를 인코드하는 ERG12 유전자의 코딩 서열을 스태필로코 커스 아우레우스 메발로네이트 키나제를 인코드하는 mvaK1 유전자 (진뱅크 기탁번호 AAG02424)의 코딩 서열로 대체하여 생성되었다. 스태필로코커스 아우레우스 메발로네이트 키나제는 FPP에 의한 피드백 저해에 대해 덜 민감하고 (Voynova et al . (2004) J. Bacteriol . 186:61-67), 따라서 발현 플라스미드 pAM765는 발현 플라스미드 pAM97보다 숙주세포에서 FPP의 더 많은 생산을 유도할 수 있다. mvaK1 유전자의 코딩 서열은 발현 플라스미드로부터 PCR 증폭되었고, 대략 0.9 kb PCR 산물이 젤 전제되었다. PMK-PMD-idi-ispA 오페론은 pAM97로부터 PCR 증폭되었고, 대략 4.1 kb PCR 산물이 젤 정제되었다. 정제된 PCR 산물들이 다함께 연결되었고, 연결된 산물은 젤 정제되었다. 정제된 연결된 산물 및 pAM97는 XhoI 및 SacI 제한효소들을 사용하여 소화되었고, 소화된 DNA 단편들은 젤 정제되었고, 정제된 DNA 단편들은 라이게이션되었고, 발현 플라스미드 pAM765 (서열번호 1)를 수득하였다.
플라스미드 pAM489는 벡터 pAM471의 PGAL10-ERG20_PGAL1-tHMGR 삽입체를 벡터 pAM466 내로 삽입하여 생성되었다. 벡터 pAM471는 사카로마이세스 세레비시애의 ERG20 유전자의 코딩 서열 (ERG20 뉴클레오타이드 위치들 1번 내지 1208번; ATG 개시 코돈의 A가 뉴클레오타이드 1번) (ERG20)을 포함하는 DNA 단편 PGAL10-ERG20_PGAL1-tHMGR, 사카로마이세스 세레비시애의 분지된 (divergent) GAL1 및 GAL10 프로모터를 포함하는 게놈 좌위 (GAL1 뉴클레오타이드 위치 -1번 내지 -668번) (PGAL), 및 사카로마이세스 세레비시애의 HMG1 유전자의 절단된 코딩 서열 (HMG1 뉴클레오타이드 위치들 1586번 내지 3323번) (tHMGR)을 TOPO 제로 블런트 Ⅱ 클로닝 벡터 (Invitrogen, Carlsbad, CA) 내로 삽입하여 생성되었다. 벡터 pAM466는 뉴클레오타이드 위치 -856번으로부터 위치 548번까지 연장되고 염기들 -226번 및 -225번 사이에 인위적 내부 XmaI 제한효소 부위를 보유하는 사카로마이세스 세레비시애의 야생형 TRP1 좌위의 분절을 포함하는 DNA 단편 TRP1-856 내지 +548을 TOPO TA pCR2.1 클로닝 벡터 (Invitrogen,q Carlsbad, CA) 내에 삽입하여 생성되었다. DNA 단편 PGAL10-ERG20_PGAL1-tHMGR 및 TRP1-856 내지 + 548는 표 1에 개괄된 바와 같이 PCR 증폭에 의해 생성되었다. pAM489의 제작을 위해, 400 ng의 pAM471 및 100 ng의 pAM466가 XmaI 제한효소 (New England Biolabs, Ipswich, MA)을 사용하여 완전하게 소화되었고, PGAL10-ERG20_PGAL1-tHMGR 삽입체 및 선형화된 pAM466 벡터에 해당하는 DNA 단편들은 젤 정제되었고, 정제된 삽입체의 4 몰라 당량들이 정제된 선형화된 벡터의 1 몰라 당량과 라이게이션되었고, pAM489를 수득하였다. 도 1R은 pAM489의 TRP1_PGAL10-ERG20_PGAL1-tHMGR_TRP 삽입체의 지도 및 서열번호 2의 그의 뉴클레오타이드 서열을 나타낸다.
플라스미드 pAM491는 벡터 pAM472의 PGAL10-ERG13_PGAL1-tHMGR 삽입체를 벡터 pAM467 내로 삽입하여 생성되었다. 벡터 pAM472는 사카로마이세스 세레비시애의 ERG13 유전자의 코딩 서열 (ERG13 뉴클레오타이드 위치들 1번 내지 1626번) (ERG13)을 포함하는 DNA 단편 PGAL10-ERG13_PGAL1-tHMGR, 사카로마이세스 세레비시애의 분지된 GAL1 및 GAL10 프로모터를 포함하는 게놈 좌위 (GAL1 뉴클레오타이드 위치 -1번 내지 -668번) (PGAL), 및 사카로마이세스 세레비시애의 HMG1 유전자의 절단된 ORF (HMG1 뉴클레오타이드 위치 1586번 내지 3323번) (tHMGR)를 TOPO 제로 블런트 Ⅱ 클로닝 벡터 내로 삽입하여 생성되었다. 벡터 pAM467는 뉴클레오타이드 위치 -723번으로부터 위치 -224번까지 연장되고 염기들 -224번 및 -223번 사이에 인위적 내부 XmaI 제한효소 부위를 보유하는 사카로마이세스 세레비시애의 야생형 URA3 좌위의 분절을 포함하는 DNA 단편 URA3-723 내지 701를 TOPO TA pCR2.1 클로닝 벡터 내로 삽입하여 생성되었다. DNA 단편들 PGAL10-ERG13_PGAL1-tHMGR 및 URA3-723 내지 701는 표 2에 개괄된 바와 같이 PCR 증폭에 의해 생성되었다. pAM491의 제작을 위해, 400 ng의 pAM472 및 100 ng의 pAM467가 XmaI 제한효소를 사용하여 완전하게 소화되었고, ERG13-PGAL-tHMGR 삽입체 및 선형화된 pAM467 벡터에 해당하는 DNA 단편들이 젤 정제되었고, 정제된 삽입체의 4 몰라 당량들이 정제된 선형화된 벡터의 1 몰라 당량과 라이게이션되었고, pAM491을 수득하였다. 도 1S는 pAM491의 URA3_PGAL10-ERG13_PGAL1-tHMGR_URA3 삽입체의 지도 및 서열번호 13의 그의 뉴클레오타이드 서열을 나타낸다.
플라스미드 pAM493는 벡터 pAM473의 PGAL10-IDI1_PGAL1-tHMGR 삽입체를 벡터 pAM468 내로 삽입하여 생성되었다. 벡터 pAM473는 사카로마이세스 세레비시애의 IDI1 유전자의 코딩 서열 (IDI1 뉴클레오타이드 위치 1번 내지 1017번) (IDI1)을 포함하는 DNA 단편 PGAL10-IDI1_PGAL1-tHMGR, 사카로마이세스 세레비시애의 분지된 GAL1 및 GAL10 프로모터를 포함하는 게놈 좌위 (GAL1 뉴클레오타이드 위치 -1번 내지 -668번) (PGAL), 및 사카로마이세스 세레비시애의 HMG1 유전자의 절단된 ORF (HMG1 뉴클레오타이드 위치 1586번 내지 3323번) (tHMGR)를 TOPO 제로 블런트 Ⅱ 클로닝 벡터 내로 삽입하여 생성되었다. 벡터 pAM468은 뉴클레오타이드 위치 -225번으로부터 위치 653번까지 연장되고 염기들 -226번 및 -225번 사이에 인위적 내부 XmaI 제한효소 부위를 보유하는 사카로마이세스 세레비시애의 야생형 ADE1 좌위의 분절을 포함하는 DNA 단편 ADE1-825 내지 653을 TOPO TA pCR2.1 클로닝 벡터 내로 삽입하여 생성되었다. DNA 단편들 PGAL10-IDI1_PGAL1-tHMGR 및 ADE1-825 내지 653는 표 3에 개괄된 바와 같이 PCR 증폭에 의해 생성되었다. pAM493의 제작을 위해, 400 ng의 pAM473 및 100 ng의 pAM468이 XmaI 제한효소를 사용하여 완전하게 소화되었고, PGAL-IDI1-PGAL-tHMGR 삽입체 및 선형화된 pAM468벡터에 해당하는 DNA 단편들이 젤 정제되었고, 정제된 삽입체의 4 몰라 당량들이 정제된 선형화된 벡터의 1 몰라 당량과 라이게이션되었고, pAM493을 수득하였다. 도 1T는 pAM493의 ADE1_PGAL10-IDI1_PGAL1-tHMGR_ADE1 삽입체의 지도 및 서열번호 24의 그의 뉴클레오타이드 서열을 나타낸다.
플라스미드 pAM495는 pAM474의 PGAL10-ERG10_PGAL1-ERG12 삽입체를 벡터 pAM469 내로 삽입하여 생성되었다. 벡터 pAM474는 사카로마이세스 세레비시애의 ERG10 유전자의 코딩 서열 (ERG10 뉴클레오타이드 위치 1번 내지 1347번) (ERG10)을 포함하는 DNA 단편 PGAL10-ERG10_PGAL1-ERG12, 사카로마이세스 세레비시애의 분지된 GAL1 및 GAL10 프로모터를 포함하는 게놈 좌위 (GAL1 뉴클레오타이드 위치 -1번 내지 -668번) (PGAL), 및 사카로마이세스 세레비시애의 ERG12 유전자의 코딩 서열 (ERG12 뉴클레오타이드 위치 1번 내지 1482번) (ERG12)를 TOPO 제로 블런트 Ⅱ 클로닝 벡터 내로 삽입하여 생성되었다. 벡터 pAM469는 뉴클레오타이드 위치 -32번으로부터 위치 -1000번까지 및 504번으로부터 위치 1103번까지 연장되는 사카로마이세스 세레비시애의 HIS 좌위의 두 개 분절, HISMX 마커, 및 HIS3504 내지 -1103 서열 및 HISMX 마커 사이에 인위적 XmaI 제한효소 부위를 포함하는 DNA 단편 HIS3-32 내지 -1000_HISMX_HIS3504 내지 -1103를 TOPO TA pCR2.1 클로닝 벡터 내로 삽입하여 생성되었다. DNA 단편들 PGAL10-ERG10_PGAL1-ERG12 및 HIS3-32 내지 -1000_HISMX_HIS3504 내지 -1103 는 표 4에 개괄된 바와 같이 PCR 증폭에 의해 생성되었다. pAM495의 제작을 위해, 400 ng의 pAM474 및 100 ng의 pAM469가 XmaI 제한효소를 사용하여 완전하게 소화되었고, PGAL10-ERG10_PGAL1-ERG12삽입체 및 선형화된 pAM469 벡터에 해당하는 DNA 단편들이 젤 정제되었고, 정제된 삽입체의 4 몰라 당량들이 정제된 선형화된 벡터의 1 몰라 당량과 라이게이션되었고, pAM495를 수득하였다. 도 1D는 pAM495의 HIS3_PGAL10-ERG10_PGAL1-ERG12_HIS3 삽입체의 지도 및 서열번호 34의 그의 뉴클레오타이드 서열을 나타낸다.
플라스미드 pAM497는 pAM475의 PGAL10-ERG8_PGAL1-ERG19 삽입체를 벡터 pAM470 내로 삽입하여 생성되었다. 벡터 pAM475는 사카로마이세스 세레비시애의 ERG8 유전자의 코딩 서열 (ERG8 뉴클레오타이드 위치 1번 내지 1512번) (ERG8)을 포함하는 DNA 단편 PGAL10-ERG8_PGAL1-ERG19, 사카로마이세스 세레비시애의 분지된 GAL1 및 GAL10 프로모터를 포함하는 게놈 좌위 (GAL1 뉴클레오타이드 위치 -1번 내지 -668번) (PGAL), 및 사카로마이세스 세레비시애의 ERG19 유전자의 코딩 서열 (ERG19 뉴클레오타이드 위치 1번 내지 1341번) (ERG19)을 TOPO 제로 블런트 Ⅱ 클로닝 벡터 내로 삽입하여 생성되었다. 벡터 pAM470은 뉴클레오타이드 위치 -100번으로부터 위치 450번까지 및 1096번으로부터 위치 1770번까지 연장되는 사카로마이세스 세레비시애의 LEU2 좌위의 두 개 분절을 포함하는 DNA 단편 LEU2-100 내지 450_HISMX_LEU21096 내지 1770, HISMX 마커, 및 LEU21096 내지 1770 서열 및 HISMX 마커 사이에 인위적 XmaI 제한효소 부위를 포함하는 DNA 단편을 TOPO TA pCR2.1 클로닝 벡터 내로 삽입하여 생성되었다. DNA 단편들 PGAL10-ERG8_PGAL1-ERG19 및 LEU2-100 내지 450_HISMX_LEU21096 내지 1770는 표 5에 개괄된 바와 같이 PCR 증폭에 의해 생성되었다. pAM497의 제작을 위해, 400 ng의 pAM475 및 100 ng의 pAM470이 XmaI 제한효소를 사용하여 완전하게 소화되었고, ERG8_PGAL1-ERG19 삽입체 및 선형화된 pAM470 벡터에 해당하는 DNA 단편들이 젤 정제되었고, 정제된 삽입체의 4 몰라 당량들이 정제된 선형화된 벡터의 1 몰라 당량과 라이게이션되었고, pAM497을 수득하였다. 도 1V는 pAM497의 LEU2_PGAL10-ERG8_PGAL1-ERG19_LEU2 삽입체의 지도 및 서열번호 47의 그의 뉴클레오타이드 서열을 나타낸다.
벡터 pAM1419는 벡터 pTrc99A (Amman et al ., Gene 40:183-190 (1985))로부터 두 개의 NcoI 제한효소 부위들을 제거하여 생성되었다. 벡터 pTrc99A의 복수의 클로닝 부위에서 NcoI 제한효소 부위는 먼저 제조사의 추천된 프로토콜들에 따라 Quikchange 멀티 부위-유도성 돌연변이화 키트 (Stratagene Cloning Systems, La Jolla, CA)를 사용하여 NdeI 제한효소 부위로 변화되었다. 다음으로 복수 클로닝 부위의 외부에 있는 벡터 pTrc99A의 위치 2633번에서 두 번째 NdeI 제한효소 부위도 역시 Quikchange 멀티 부위-유도성 돌연변이화 키트를 사용하여 제거되었고, 벡터 pAM1419 (서열번호 60)를 수득하였다.
발현 플라스미드 pAM1421 (도 13A)는 벡터 pAM1419 내로 FS_S2D-Ec 코딩 서열을 삽입하여 생성되었다. 벡터 pAM1419는 BamHI 및 NdeI 제한효소들을 사용하여 소화되었고, 대략 4.15 kb의 선형화된 벡터 골격이 젤 정제되었고, 정제된 DNA 단편은 5' 포스페이트기들을 제거하도록 송아지 정소 알칼라인 포스파타제 (CIP)로 소화되었다. 세린으로부터 아스파테이트로 (S2D) 위치 2번에서 아미노산 치환을 포함하고 대장군에서 발현을 위해 코돈-최적화된 (FS_S2D_Ec 코딩 서열; 서열번호 61) BamHI 및 NdeI 제한효소 부위들을 가진 아르테미시아 애누아의 β-파네센 합성효소 유전자 (진뱅크 기탁번호 AY835398; Picaud, et al, 2005)는 다른 발현 플라스미드들로부터 PCR 증폭되었고, PCR 산물은 BamHI 및 NdeI 제한효소들을 사용하여 소화되었고, 다음으로 젤 정제되었다. 정제된 선형화된 벡터 및 소화된 PCR 산물은 T4 DNA 리가제를 사용하여 라이게이션되었고, 발현 플라스미드 pAM1421를 수득하였다.
발현 플라스미드 pAM353는 pRS425-Gal1 벡터 (Mumberg et. al. (1994) Nucl. Acids. Res. 22(25): 5767-5768) 내로 사카로마이세스 세레비시애에서 발현을 위해 코돈-최적화된 (FS_Aa_Sc coding 서열; 서열번호 68) 아르테미시아 애누아의 β-파네센 합성효소 유전자의 코딩 서열 (진뱅크 기탁번호 AY835398)을 삽입하여 생성되었다. FS_Aa_Sc 코딩 서열은 합성적으로 생성되었고, 5' BamHI 및 3' XhoI 제한효소 부위들에 의해 끼어있어 표준 pUC 또는 pACYC 기원 벡터와 같은 클로닝 벡터의 적합한 제한효소 부위들 내로 클론될 수 있다. FS_Aa_Sc 코딩 서열은 다시 본 제작물을 BamHI 및 XhoI 제한효소들 사용하여 소화하여 절단되었고, FS_Aa_Sc 코딩 서열을 포함하는 대략 1.7 kb DNA 단편이 젤 정제되었고, 정제된 DNA 단편은 pRS425-Gal1 벡터의 BamHI XhoI 제한효소 부위 내로 라이게이션되었고, 발현 플라스미드 pAM353를 수득하였다.
발현 플라스미드 pAM404 (도 13B)는 벡터 pAM178 (서열번호 69) 내로 FS_Aa_Sc 코딩 서열을 삽입하여 생성되었다. 벡터 pAM178는 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, 대략 7.3 kb의 벡터 골격이 젤 정제되었다. 끼여있는 BamHI 및 NheI 제한효소 부위들을 가진 FS_Aa_Sc 코딩 서열은 pAM353로부터 PCR 증폭되었고, PCR 산물은 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, FS_Aa_Sc 코딩 서열을 포함하는 대략 1.7 kb의 DNA 단편이 젤 정제되었다. 두 개의 젤 정제된 DNA 단편들이 라이게이션되었고, 발현 플라스미드 pAM404를 수득하였다.
표 6 및 도 13B에 나타낸 발현 플라스미드들은 표 6에 발현 플라스미드 pAM404에서 FS_Aa_Sc 코딩 서열을 표시된 코딩 서열들로 대체하여 생성되었다. 벡터 pAM404는 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, FS_Aa_Sc 코딩 서열이 결여된 대략 7.3 kb 선형화된 벡터 골격이 젤 정제되었다. FS_S2D_Ec 코딩 서열은 선형화된 pAM404 벡터 골격의 말단 서열과 중복되는 프라이머들을 사용하여 또 다른 발현 플라스미드로부터 PCR 증폭되었다. IS_Pn_Sc 및 TDS_Pn_Sc 코딩 서열은 다른 발현 벡터들로부터 제한효소 소화에 의해 추출되었다. DNA 단편은 젤 정제되었다. FS_S2D_Ec 코딩 서열은 균주 Y539를 형질전환하고 숙주세포 형질전환체들을 단독 탄소원으로서 2% 포도당을 가진 루이신이 결여된 완전 합성 배지 (CSM) (CSM-L) 상에서 선별하여 상동 재조합을 통해 정제된 선형화된 벡터 내로 삽입되었다. IS_Pn_Sc 및 TDS_Fs_Sc 코딩 서열들은 T4 DNA 리가제를 사용하여 정제된 선형화된 벡터 내로 라이게이션되었다.
발현 플라스미드 pAM1812 (서열번호 72; 도 13C)는 발현 플라스미드 pAM404 내로 TDS_Fs_Sc 코딩 서열을 삽입하여 생성되었다. 발현 플라스미드 pAM404는 NotI 제한효소를 사용하여 소화되었고, 대략 9.0 kb의 선형화된 플라스미드가 젤 정제되었다. TDS_Fs_Sc 코딩 서열은 선형화된 pAM404의 말단 서열과 중복되는 프라이머들을 사용하여 발현 플라스미드 pAM1795로부터 PCR 증폭되었고, TDS_Fs_Sc 코딩 서열을 포함하는 1.2 kb PCR 산물은 젤 정제되었다. 두 개의 젤 정제된 DNA 단편들은 균주 Y539를 정제된 단편들 둘 다로 형질전환하고 숙주세포 형질전환체들을 단독 탄소원으로서 2% 포도당을 가진 CSM-L 상에서 선별하여 상동 재조합을 통해 라이게이션되었다.
표 7 및 도 13C에 나타낸 발현 플라스미드들은 발현 플라스미드 pAM1812 내에서 FS_Aa_Sc 코딩 서열을 표시된 코딩 서열들과 대체하여 생성되었다. 발현 플라스미드 pAM1812는 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, FS_Aa_Sc 코딩 서열이 결여된 대략 7.2 kb의 선형 플라스미드가 젤 정제되었다. 코딩 서열들은 다른 발현 벡터들로부터 BamHI 및 NheI 제한효소 소화에 의해 추출되었고, 코딩 서열을 포함하는 DNA 단편이 젤 정제되었다. 정제된 DNA 단편들은 최종적으로 T4 DNA 리가제를 사용하여 라이게이션되었고, 발현 플라스미드들을 수득하였다.
발현 플라스미드 pAM1813 (도 13D)는 발현 플라스미드 pAM1795내로 FS_Aa_Sc 코딩 서열의 코딩 서열을 삽입하여 생성되었다. 발현 플라스미드 pAM1795는 NotI 제한효소를 사용하여 소화되었고, 대략 8.4 kb의 선형화된 플라스미드가 젤 정제되었다. FS_Aa_Sc 코딩 서열들은 선형화된 pAM404의 말단 서열들과 중복되는 프라이머들을 사용하여 PCR 증폭되었고, FS_Aa_Sc 코딩 서열들을 포함하는 PCR 산물은 젤 정제되었다. 정제된 PCR 산물은 이를 균주 Y539 내로 형질전환하고 숙주세포 형질전환체들을 단독 탄소원으로서 2% 포도당을 가진 CSM-L 상에서 선별하여 상동 재조합을 통해 라이게이션되었다. pAM1812 및 pAM1813이 TDS 및 FS를 위한 프로모터들이 스위치된 것 이외에는 일치하는 점을 주목하라. 서로 다른 강도들의 프로모터들을 사용하는 것은 파네센/트리코디엔 비율들의 다양성을 허용한다.
발현 플라스미드 pAM1653는 벡터 pRS415 내로 IS_Pn_Sc 코딩 서열을 삽입하여 생성되었다. 발현 플라스미드 pAM1549는SapI 제한효소를 사용하여 소화되었고, 생성된 블런트 말단들에는 클레노 단편으로 처리되었고, 다시 NotI 제한효소를 사용하여 소화되었고, IS_Pn_Sc 코딩 서열 및 PGAL 서열을 포함하는 2.8 kb DNA 단편이 젤 정제되었다. 벡터 pRS415는 NotI 및 AleI 제한효소들을 사용하여 소화되었고, 6.0 kb의 선형화된 벡터 골격은 젤 정제되었다. 두 개의 정제된 DNA 단편들은 라이게이션되었고, 발현 플라스미드 pAM1653를 수득하였다.
발현 플라스미드 pAM1734는 발현 플라스미드 pAM1653의 복수의 클로닝 부위로부터 소정의 제한효소 부위들을 제거하여 생성되었다. 발현 플라스미드 pAM1653는 XbaI 및 HindⅢ 제한효소들을 사용하여 소화되었고, 생성된 블런트 말단들에는 클레노 단편으로 처리되었고, 최종적으로 자가-라이게이션되었고, 발현 플라스미드 pAM1734를 수득하였다.
발현 플라스미드 pAM1764 (서열번호 74)는 발현 플라스미드 pAM1734 내로 FS_S2D_Ec 코딩 서열을 삽입하여 생성되었다. 발현 벡터 pAM1734는 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, 대략 6.9 kb의 선형화된 플라스미드가 젤 정제되었다. FS_S2D_Ec 코딩 서열은 선형화된 pAM1734의 말단 서열들과 중복되는 프라이머들을 사용하여 발현 플라스미드 pAM1421로부터 PCR 증폭되었고, FS_S2D-Sc 코딩 서열을 포함하는 1.7 kb PCR 산물이 젤 정제되었다. 두 개의 정제된 DNA 단편들은 균주 Y539를 정제된 DNA 단편들 둘 다로 형질전환하고 숙주세포 형질전환체들을 단독 탄소원으로서 2% 포도당을 가진 CSM-L 상에서 선별하여 상동 재조합을 통해 라이게이션되었다.
발현 플라스미드 pAM1668는 발현 플라스미드 pAM1419로부터 lacI 유전자를 결실시켜서 생성되었다. 발현 플라스미드 pAM1419는 EcoRV 및 SapI 제한효소들을 사용하여 소화되었고, 소화된 플라스미드는 End-It DNA 말단-복구 키트 (Epicentre, Madison, WI)를 제조사의 추천된 프로토콜들에 따라 사용하여 복구되었고, 말단-복구된 벡터는 자가-라이게이션되었고, 벡터 pAM1668를 수득하였다.
표 8 및 도 13E에 나타낸 발현 플라스미드들은 벡터 pAM1668 내로 표시된 코딩 서열들을 삽입하여 생성되었다. 벡터 pAM1668은 BamHI 및 NdeI 제한효소들을 사용하여 소화되었고, 대략 2.9 kb의 선형화된 벡터 골격이 젤 정제되었다. 코딩 서열들은 선형화된 pAM1668의 말단 서열들과 중복되는 프라이머들을 사용하여 PCR 증폭되었고, PCR 산물들은 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, 코딩 서열을 포함하는 소화된 PCR 산물들이 젤 정제되었다. 정제된 선형화된 벡터 및 소화된 PCR 산물들은 최종적으로 라이게이션되었고, 발현 플라스미드들을 수득하였다.
제작물 A는 표 9에 기술된 바와 같이 PCR 증폭에 의해 생성되었다. 본 제작물은 사카로마이세스 세레비시애의 NDT80 유전자의 상류 부위 (NDT80 뉴클레오타이드 positions -175 내지 -952), 사카로마이세스 세레비시애의 LEU2 마커 (LEU2 뉴클레오타이드 위치들 -661번 내지 +1541번), 사카로마이세스 세레비시애의 GAL 1 유전자의 프로모터 (GAL1 뉴클레오타이드 위치들 -1번 내지 -667번), FS_Aa_Sc 코딩 서열, 사카로마이세스 세레비시애의 CYC1 유전자의 종결인자 (CYC1 뉴클레오타이드 위치들 +331번 내지 +521번), 및 사카로마이세스 세레비시애의 NDT80 유전자의 하류 부위 (NDT80 뉴클레오타이드 위치들 +1685번 내지 +2471)를 포함한다. 도 1W는 제작물 A의 지도 및 서열번호 86의 그의 뉴클레오타이드 서열을 나타낸다.
제작물 B (도 1X)는 PCR 증폭에 의해 생성되었다. 본 제작물은 사카로마이세스 세레비시애의 NDT80 유전자의 상류 부위 (NDT80 뉴클레오타이드 positions -175 내지 -952), 사카로마이세스 세레비시애의 LEU2 마커 (LEU2 뉴클레오타이드 위치들 -661번 내지 +1541번), 사카로마이세스 세레비시애의 GAL 1 유전자의 프로모터 (GAL1 뉴클레오타이드 위치들 -1번 내지 -667번), HISG 마커, 사카로마이세스 세레비시애의 CYC1 유전자의 종결인자 (CYC1 뉴클레오타이드 위치들 +331번 내지 +521번), 및 사카로마이세스 세레비시애의 NDT80 유전자의 하류 부위 (NDT80 뉴클레오타이드 위치들 +1685번 내지 +2471)를 포함한다.
제작물 D는 표 10에 기술된 바와 같이 PCR 증폭에 의해 생성되었다. 본 제작물은 사카로마이세스 세레비시애의 GAL1 유전자의 프로모터 (PGAL1; GAL1 뉴클레오타이드 위치들 -1번 내지 -455번) 및 사카로마이세스 세레비시애의 PGK1 유전자의 종결인자 (TPGK1; PGK1 뉴클레오타이드 위치들 +1159번 내지 +1547번) 에 의해 끼여있는 FS_A_5.3 코딩 서열, 또한 사카로마이세스 세레비시애의 GAL10 유전자의 프로모터 (PGAL10; GAL10 뉴클레오타이드 위치들 -1번 내지 -202번) 및 사카로마이세스 세레비시애의 ADH1 유전자의 종결인자 (TADH1; ADH1 뉴클레오타이드 위치들 -1번 내지 -166번)에 의해 끼여있는 TDS_Fs_Sc 코딩 서열을 포함한다. 도 1Z는 제작물 D의 지도 및 서열번호 116의 그의 뉴클레오타이드 서열을 나타낸다.
발현 플라스미드 pAM2191는 지수적으로 성장하는 Y 3198 세포들을 FastDigest® BstZ17I 제한효소 (Fisher Scientific Worldwide, Hampton, NH)를 사용하여 소화된 100 ng의 벡터 pAM552 (서열번호 156) 및 300 ng의 제작물 D로 형질전환하여 제작되었다. 숙주세포 형질전환체들은 단독 탄소원으로서 2% 포도당을 포함하는 CSM-L 한천 배지들 상에 도말되었고, 플레이트들은 30℃에서 3일 동안 개별 콜로니들이 반경 ~1 mm가 될 때까지 배양되었다. DNA는 ZymoprepTM 효모 플라스미드 미니프렙 키트 Ⅱ (Zymo Research Corporation, Orange, CA)를 사용하여 이들 콜로니들로부터 수확되었고, 수확된 DNA는 화학적으로 적합한 (competent) XL1Blue 대장균 (Agilent Technologies Inc., Santa Clara, CA) 내로 형질전환되었다. 숙주세포 형질전환체들은 카베니실린이 보충된 라이소제니 (Lysogeny) 액체 아가 배지에 도말되었고, 개별 콜로니들이 가시적이 될 때까지 37℃에서 24시간 동안 배양되었다. 플라스미드 DNA가 QIAprep 스핀 미니프렙 키트 (QIAGEN Inc, Valencia, CA)를 사용하여 이들 콜로니들로부터 수확되었고, 플라스미드 DNA는 발현 플라스미드 pAM2191의 정확한 제작을 검증하도록 서열결정되었다.
실시예
2
본 실시예는 테르펜 합성효소들 변이체들의 생성 및 특성분석에서 유용한 효모 균주들을 만드는 방법들을 기술하고 있다.
균주들 Y93 (MAT A) 및 Y94 (MAT 알파)가 효모 균주들Y002 및 Y003 (CEN.PK2 배경 MAT A 또는 MAT 알파 각각, ura3-52; trp1-289; leu2-3,112; his3D1; MAL2-8C; SUC2; van Dijken et al . (2000) Enzyme Microb. Technol. 26:706-714)의 ERG9 유전자의 프로모터 각각을 사카로마이세스 세레비시애의 MET3 유전자의 프로모터로 대체하여 생성되었다. 본 목적으로, 지수적으로 성장하는 Y002 및 Y003 세포들이 통합 제작물 i8 (서열번호 87)로 형질전환되었고, 이는 Kluyveromyces lactis의 Tef1 유전자의 프로모터 및 종결인자에 의해 끼여있는 카나마이신 저항성 마커 (KanMX), ERG9 코딩 서열, ERG9 프로모터의 절단된 분절 (trune. PERG9), 및 ERG9 상류 및 하류 서열들에 의해 끼여있는 MET3 프로모터 (PMET3)를 포함하였다 (도 1A). 숙주세포 형질전환체들은 0.5 ug/mL 젠타마이신 (Invitrogen Corp., Carlsbad, CA)을 포함하는 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y93 및 Y94를 수득하였다.
균주들 Y176 (MAT A) 및 Y177 (MAT 알파)는 균주들 Y93 및 Y94에서 ADE1의 코딩 서열 각각을 Candida glabrata의 LEU2 유전자의 코딩 서열 (CgLEU2)과 대체하여 생성되었다. 본 목적으로, 3.5 kb의 CgLEU2 게놈 좌위가 Candida glabrata 게놈 DNA (ATCC, Manassas, VA)로부터 프라이머들 61-67-CPK066-G (서열번호 88) 및 61-67-CPK067-G (서열번호 89)를 사용하여 PCR 증폭되었고, PCR 산물은 지수적으로 성장하는 Y93 및 Y94 세포들 내로 형질전환되었다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주들 Y176 및 Y177을 수득하였다.
균주 Y188는 균주Y176 내로 각각 사카로마이세스 세레비시애의 GAL1 또는 GAL10 유전자의 갈락토스 유도가능한 프로모터의 조절적 통제 하에 있는 사카로마이세스 세레비시애의 ERG13, ERG10, 및 ERG12 유전자들의 코딩 서열들, 및 사카로마이세스 세레비시애의 HMG1의 절단된 코딩 서열의 추가적인 사본을 도입하여 생성되었다. 본 목적으로, 지수적으로 성장하는 Y176 세포들은 PmeI 제한효소 (New England Biolabs, Beverly, MA)로 소화된 2 ug의 발현 플라스미드들 pAM491 및 pAM495로 형질전환되었다. 숙주세포 형질전환체들은 우라실 및 히스티딘이 결여된 CSM (CSM-U-H) 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y188를 수득하였다.
균주 Y189는 균주 Y177 내로 각각 사카로마이세스 세레비시애의 GAL1 또는 GAL10 유전자의 갈락토스 유도가능한 프로모터의 조절적 통제 하에 있는 사카로마이세스 세레비시애의 ERG20, ERG8, 및 ERG19 유전자들의 코딩 서열들, 및 사카로마이세스 세레비시애의 HMG1의 절단된 코딩 서열의 추가적인 사본을 도입하여 생성되었다. 본 목적으로, 지수적으로 성장하는 Y188 세포들은 PmeI 제한효소로 소화된 2 ug의 발현 플라스미드들 pAM489 및 pAM497로 형질전환되었다. 숙주세포 형질전환체들은 트립토판 및 히스티딘이 결여된 CSM (CSM-T-H) 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y189를 수득하였다.
균주 Y238은 균주들 Y188 및 Y189를 메이팅하고, 각각 사카로마이세스 세레비시애의 GAL1 또는 GAL10 유전자의 갈락토스 유도가능한 프로모터의 조절적 통제 하에 있는 사카로마이세스 세레비시애의 IDI1 유전자의 코딩 서열, 및 사카로마이세스 세레비시애의 HMG1의 절단된 코딩 서열의 추가적인 사본을 도입하여 생성되었다. 본 목적으로, 균주들 Y188 및 Y189의 대략 1 x 107개 세포들이 YPD 배지 플레이트 상에서 상온으로 6시간 동안 혼합되었고, 이수성 세포들이 PmeI 제한효소로 소화된 2 ug의 발현 플라스미드 pAM493으로 형질전환되었다. 숙주세포 형질전환체들은 아데닌이 결여된 CSM (CSM-A) 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y238을 수득하였다.
균주들 Y210 (MAT A) 및 Y211 (MAT 알파)는 균주 Y238를 포자 형성하여 생성되었다. 이수성 세포들은 2% 포타슘 아세테이트 및 0.02% 라피노스 액체 배지에서 포자 형성되었고, 대략 200개의 유전적 사분체들 (tetrads)이 싱거 MSM300 시리즈 기기들인 미세조작기 (Singer Instrument Co, LTD. Somerset, UK)를 사용하여 분리되었다. 포자들은 CSM-A-H-U-T 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주들 Y210 (MAT A) 및 Y211 (MAT 알파)을 수득하였다.
균주 Y221는 지수적으로 성장하는 Y211 세포들을 벡터 pAM178로 형질전환하여 생성되었다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었다.
균주 Y290는 균주 Y221의 GAL80 유전자의 코딩 서열을 결실시켜서 생성되었다. 본 목적으로, 지수적으로 성장하는 Y221 세포들은 통합 제작물 i32 (서열번호 90)로 형질전환되었고, 이는 GAL80 상류 및 하류 서열들에 의해 끼여있는 Kluyveromyces lactis의 Tef1 유전자의 프로모터 및 종결인자에 의해 끼여있는 하이그로마이신 B 저항성 마커 (hph)를 포함하였다 (도 1B). 숙주세포 형질전환체들은 하이그로마이신 B를 포함하는 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y290를 수득하였다.
균주 Y318는 루이신-풍부 배지에서의 일련 증식에 의해 균주 Y290로부터 pAM178 벡터를 제거하고, 개별적 콜로니들을 CSM-L 상에서 자라는 그들의 무능력에 대해 테스트하여 생성되었고, 균주 Y318를 수득하였다.
균주 Y409는 β-파네센 합성효소를 인코딩하는 이종유래 뉴클레오타이드 서열을 균주 Y318 내로 도입하여 생성되었다. 본 목적으로, 지수적으로 성장하는 Y318 세포들은 발현 플라스미드 pAM404로 형질전환되었다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 균주 Y409를 수득하였다.
균주 Y419는 균주 Y409의 GAL 프로모터들을 전신적 활성을 가지도록 만들어 생성되었다. 본 목적으로, 지수적으로 성장하는Y409 세포들은 통합 제작물 i33 (서열번호 91)로 형질전환되었고, 이는 변형된 ERG9 프로모터 및 코딩 서열들의 상류 및 하류 서열들에 의해 끼여있는 그의 원 (native) 프로모터 (PGAL4oc; Griggs & Johnston (1991) PNAS 88(19):8597-8601) 및 GAL4 종결인자 (TGAL4) (도 1C)의 "작동 전신적" 버전의 조절적 통제 하에 Kluyveromyces lactis의 Tef1 유전자의 프로모터 및 종결인자에 의해 끼여있는 스트렙토마이세스 나르세이의 나르세오트리신 저항성 마커 (NatR), 및 사카로마이세스 세레비시애의 GAL4 유전자의 코딩 서열을 포함하 였다. 숙주세포 형질전환체들은 나르세오트리신을 포함하는 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y419를 수득하였다.
균주 Y677는 균주 Y419의 변형된 GAL80 좌위에 사카로마이세스 세레비시애의 GAL1 유전자의 프로모터의 조절적 통제 하에 사카로마이세스 세레비시애의 ERG12의 코딩 부위의 추가적인 사본을 도입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y677 세포들은 통합 제작물 i37 (서열번호 92)로 형질전환되었고, 이는 Kluyveromyces lactis의 Tef1 유전자의 프로모터 및 종결인자에 의해 끼여있는 스트렙토마이세스 나르세이의 카나마이신 저항성 마커 (KanR), 또한 GAL1 프로모터 (PGAL1) 및 ERG12 종결인자 (TERG12) (도 1D)에 의해 끼여있는 사카로마이세스 세레비시애의 GAL4 유전자의 코딩 및 종결 서열들을 포함하였다. 숙주세포 형질전환체들은 카나마이신을 포함하는 배지 상에서 선택되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y677를 수득하였다.
균주 Y1551는 화학적 돌연변이화에 의해 균주 Y677로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y1551를 수득하였다.
균주 Y1778는 화학적 돌연변이화에 의해 균주 Y1551로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y1778을 수득하였다.
균주 Y1816는 균주 Y1778의 HXT3 코딩 서열을 하나는 사카로마이세스 세레비시애로부터 유래되고 다른 하나는 C. butylicum로부터 유래된 두 개 사본들의 아세토아세틸-CoA 티올라제 코딩 서열, 또한 B. juncea의 HMGS 유전자의 코딩 서열의 하나의 사본과 대체하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y1778 세포들은 통합 제작물 i301 (서열번호 93)로 형질전환되었고, 이는 Kluyveromyces lactis의 Tef1 유전자의 프로모터 및 종결인자에 의해 끼여있는 사카로마이세스 세레비시애의 하이그로마이신 B 저항성 마커 (hyg), 절단된 TDH3 프로모터 (tPTDH3) 및 AHP1 종결인자 (TAHP1)에 의해 끼여있는 사카로마이세스 세레비시애의 ERG10 유전자의 코딩 서열, YPD1 프로모터 (PYPD1) 및 CCW12 종결인자 (TCCW12)에 의해 끼여있는 C. butylicum의 아세토아세틸-CoA 티올라제 (thiolase) 또한 TUB2 프로모터 (PTUB2)가 선행되고 사카로마이세스 세레비시애의 HXT3 유전자의 상류 및 하류 서열들에 의해 끼여있는 B. juncea의 HMGS 유전자의 코딩 서열 (HMGS)을 포함하였다 (도 1E). 숙주세포 형질전환체들은 하이그로마이신 B를 포함하는 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y1816를 수득하였다.
균주 Y2055는 화학적 돌연변이화에 의해 균주 Y1778로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y2055를 수득하였다.
균주 Y2295는 화학적 돌연변이화에 의해 균주 Y2055로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y2295를 수득하였다.
균주 Y3111는 MAT A로부터 MAT 알파까지 균주 Y2295의 메이팅 유형을 스위치하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y2295 세포들은 통합 제작물 i476 (서열번호 94)로 형질전환되었고, 이는 MAT 알파 메이팅 좌위 및 하이그로마이신 B 저항성 마커 (hygA) (도 1F)를 포함하였다. 숙주세포 형질전환체들은 하이그로마이신 B를 포함하는 배지 상에서 선별되었고, 선별된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y3111를 수득하였다.
균주 Y2168는 화학적 돌연변이화에 의해 균주 Y1816으로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y2168을 수득하였다.
균주 Y2446는 화학적 돌연변이화에 의해 균주 Y2168로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y2446을 수득하였다.
균주 Y3118는 균주 Y2446의 원래 URA3 좌위 내로 사카로마이세스 세레비시애의 GAL80 유전자의 코딩 서열, 프로모터, 및 종결인자를 삽입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y2446 세포들은 통합 제작물 i477 (서열번호 95)로 형질전환되었고, 이는 프로모터, 종결인자, 및 중복되는URA3 서열들 (상동 재조합에 의해 GAL80 유전자의 루프-아웃 절단 및 원래의 URA3 서열의 복구를 가능하게 함)에 의해 끼여있는 사카로마이세스 세레비시애의 GAL80 유전자의 코딩 서열 (GAL80) (도 1G)을 포함하였다. 숙주세포 형질전환체들은 5-FOA를 포함하는 배지 상에서 선별되었고, 균주 Y3118를 수득하였다.
균주 Y3125는 발현 플라스미드 pAM404를 제거하여 균주 Y3118로부터 생성되었다. 본 목적으로, 균주 Y3118는 먼저 40 mg/L 우라실 (YPD+L+U)을 가진 3 mL YPD+0.5% 루이신 배지에서 배양되었다. 세포들은 발현 플라스미드 pAM404를 없애도록 신선한 YPD+L+U로 5일까지 동안 24시간마다 100배 희석되었고, 다음으로 YPD 상에 도말되었고 5일까지 동안 30?에서 배양되었다. 작은 콜로니들은 둘 다의 YPD 및 CSM-L 상에서 복제-도말되었고, YPD 상에서는 자랄 수 있지만 CSM-L 상에서는 자라지 못하는 콜로니들이 확인되었고, 균주 Y3125를 수득하였다.
표 11에 나타낸 균주들은 지수적으로 성장하는 Y3125 세포들을 표시된 코딩 서열들을 포함하는 표시된 발현 플라스미드들로 형질전환하고, 숙주세포 형질전환체들을 CSM-L 상에서 선별하여 생성되었다.
균주 Y227는 발현 플라스미드 pAM426로 균주 Y211를 형질전환하여 생성되었다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었다.
균주 Y3198는 발현 플라스미드 pAM426를 균주 Y227로부터 제거하여 생성되었다. 본 목적으로, Y227 세포들은 YPD+L으로 4일 동안 배양되었다. 24시간마다, 배양액이 신선한 YPD+L에 0.05의 OD600으로 접종되었다. 4일 이후에, 세포들은 일련으로 희석되었고 YPD 고체 아가 상에 도말되었고, 플레이트들은 30?에서 4일 동안 배양되었다. 더 작은 콜로니들은 둘 다의 YPD 및 CSM-L 상에서 복제-도말되었고, YPD 상에서는 자랄 수 있지만 CSM-L 상에서는 자라지 못하는 콜로니들이 확인되었고, 균주 Y3198을 수득하였다.
균주 Y3215는 균주들 Y3111 및 Y3118을 메이팅하여 생성되었다. 균주들 Y3111 및 Y3118의 대략 1 x 107개 세포들은 메이팅을 허용하도록 YPD 배지 플레이트 상에 상온으로 6시간 동안 혼합되었고, 이어서 단일 콜로니들을 분리하도록 YPD 한천 배지 상에서 도말되었다. 이수체들은 hphA-마커된 MAT 알파 좌위 및 야생형 MAT A 좌위 둘 다의 존재에 대해 콜로니 PCR에 의해 검색되어 확인되었다.
균주 Y3000은 균주 Y3215를 포자 형성하고 GAL80 코딩 서열을 루프 아웃하여 생성되었다. 이수성 세포들은 2% 포타슘 아세테이드 및 0.02% 라피노스 액체 배지에서 포자 형성되었다. 무작위 포자들이 분리되었고, YPD 아가 상에서 도말되었고, 3일 동안 성장되었고, 다음으로 GAL80이 결여된 (예로, 기능적 URA3 유전자를 가지는) 세포들의 성장만을 허용하도록 CSM-U에 복제-도말되었다. 다음으로 포자들은 β-?파네센 생산에 대해 테스트되었고, 최고의 생산자가 확인되었고, 통합 제작물 i301의 존재가 진단적 PCR에 의해 검증되었고, 균주 Y3000를 수득하였다.
균주 Y3284는 균주 Y3000로부터 URA3 마커를 제거하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y3000 세포들은 통합 제작물 i94 (서열번호 96)로 형질전환되었고, 이는 사카로마이세스 세레비시애의 URA3 유전자의 상류 및 하류 서열들에 의해 끼여있는 사카로마이세스 세레비시애의 GAL1 또는 GAL10 유전자의 갈락토스 유도가능한 프로모터의 조절 하에 살모넬라의 hisG 코딩 서열 및 ERG13 유전자의 코딩 서열을 포함하였다 (도 1H). 숙주세포 형질전환체들은 5-FOA를 포함하는 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y3284를 수득하였다.
균주 Y3385는 균주 Y3284의 NDT80 코딩 서열을 사카로마이세스 세레비시애의 아세틸-CoA 합성효소 유전자의 코딩 서열 및 Z. mobilis의 PDC 유전자의 코딩 서열의 추가적인 사본과 대체하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y3385 세포들은 통합 제작물 i467 (서열번호 97)로 형질전환되었고, 이는 URA3 마커, HXT3 프로모터 (PHXT3) 및 PGK1 종결인자 (TPGK1)에 의해 끼여있는 사카로마이세스 세레비시애의 ACS2 유전자의 코딩 서열 (ACS2), 또한 GAL7 프로모터 (PGAL7) 및 NDT80 서열들의 상류 및 하류에 의해 끼여있는 TDH3 종결인자 (TTDH3)에 의해 끼여있는 Z. mobilis의 PDC 유전자의 코딩 서열 (zmPDC)을 포함하였다 (도 1I). 숙주세포 형질전환체들은 CSM-U 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y3385를 수득하였다.
균주 Y3547는 화학적 돌연변이화에 의해 균주 Y3385로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y3547을 수득하였다.
균주 Y3639 는 화학적 돌연변이화에 의해 균주 Y3547로부터 생성되었다. 변이화된 균주들은 β-파네센의 증가된 생산에 대해 검색되었고, 균주 Y3639를 수득하였다.
균주 Y3902는 균주 Y3639의 NDT80 좌위에서 URA3 마커를 사카로마이세스 세레비시애의 GAL80 유전자의 코딩 서열, 프로모터, 및 종결인자로 파괴하여 생성되었다. 본 경우에, GAL80s -2라고 불리는 GAL80의 변이 대립인자가 사용되었다 (Nucleic acids Research (1984) 12(24):9287-9298). 지수적으로 성장하는Y3639 세포들은 통합 제작물 i601 (서열번호 98)로 형질전환되었고, 이는 NDT80 서열들의 상류 및 하류에 의해 끼여있는, 사카로마이세스 세레비시애의 GAL80 유전자의 프로모터, 종결인자, 및 중복되는URA3 서열들 (상동 재조합에 의해 GAL80 유전자의 루프-아웃 절단 및 원래의 URA3 서열의 복구를 가능하게 함)에 의해 끼여있는 코딩 서열 (GAL80, TGAL80, 및 GAL80), HXT3 프로모터 (PHXT3) 및 PGK1 종결인자 (TPGK1)에 의해 끼여있는 사카로마이세스 세레비시애의 ACS2 유전자의 코딩 서열들 (ACS2), 또한 GAL7 프로모터 (PGAL7) 및 TDH3 종결인자 (TTDH3)에 의해 끼여있는 Z. mobilis의 PDC 유전자의 코딩 서열 (zmPDC) (도 1J)을 포함하였다. 숙주세포 형질전환체들은 5-FOA를 포함하는 배지 상에서 선별되었고, 균주 Y3902를 수득하였다.
균주 Y4027는 Y3902로부터 루이신-풍부 배지에서 일련의 증식에 의해 발현 플라스미드 pAM404를 제거하고 개별 콜로니들을 루이신이 결핍된 배지에서 성장하는 무능력을 테스트하여 균주 생성되었다.
균주 Y4909는 균주 Y4027의 ADH5 코딩 서열을 FS_D_3.5 코딩 서열 및 FS_C_7 코딩 서열과 대체하여 생성되었다 (표 17을 참조하라). 본 목적으로, 지수적으로 성장하는Y4909 세포들은 통합 제작물 i2125 (서열번호 99)로 형질전환되었고, 이는 ADH5 서열들의 상류 및 하류에 의해 끼여있는, LEU2 코딩 서열 (LEU2) 또한 GAL1 또는 GAL10 프로모터 (PGAL1 또는 PGAL10) 및 CYC1 또는 ADH1 종결인자 (TCYC1 또는 TADH1)에 의해 각각 끼여있는 파네센 합성효소 변이체 코딩 서열들을 포함하였다 (도 1K). 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y4909를 수득하였다.
균주 Y4959는 균주 Y4909로부터 사카로마이세스 세레비시애의 GAL80 유전자의 코딩 서열, 프로모터, 및 종결인자를 제거하여 생성되었다. 본 목적으로, Y4909 세포들은 자발적인 GAL80 "루프 아웃" 재조합 사건들에 대해 선별하도록 CSM-U 상에 도말되었고, 균주 Y4959를 수득하였다.
균주 Y5444는 균주 Y4959의 CAN1 좌위에 TDS_Fs_Sc 코딩 서열을 삽입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y4959 세포들은 통합 제작물 i2608 (서열번호 100)로 형질전환되었고, 이는 사카로마이세스 세레비시애의 GAL1 프로모터 (PGAL1) 및 사카로마이세스 세레비시애의 CYC1 종결인자 (TCYC1)에 의해 끼여있는 TDS_Fs_Sc 코딩 서열을 포함하였다 (도 1L). 숙주세포 형질전환체들은 카나바닌을 포함하고 아르기닌이 결여된 YNB 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에서 의해 검증되었고, 균주 Y5444를 수득하였다.
균주 Y4910는 Y4027의 ADH5 좌위에 FS_A_5.3 코딩 서열, FS_B_5.3 코딩 서열, FS_C_7 코딩 서열, 및 FS_D_3.5 코딩 서열을 삽입하여 생성되었다 (표 17을 참조하라). 본 목적으로, 지수적으로 성장하는Y4909는 통합 제작물 i2127 (서열번호 101)로 형질전환되었고, 이는 ADH5 서열의 상류 및 하류에 의해 끼여있는, LEU2 코딩 서열 (LEU2) 또한 GAL1 또는 GAL10 프로모터 (PGAL1 또는 PGAL10) 및 ADH1 또는 CYC1 종결인자 (TADH1 또는 TCYC1)에 의해 끼여있는 파네센 합성효소 변이체 코딩 서열을 포함하였고 (도 1M), 이는 i2127의 두 개 중복되는 분절들로 공동-형질전환, 이에 의한 두 개 중복되는 플라스미드 삽입체들 간의 상동 재조합의 촉진에 의해 생성되었다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y4910을 수득하였다.
균주 Y4960는 균주 Y4910로부터 사카로마이세스 세레비시애의 GAL80 유전자의 코딩 서열, 프로모터, 및 종결인자를 제거하여 생성되었다. 본 목적으로, Y4910 세포들은 자발적인 GAL80 "루프-아웃" 재조합 사건들에 대해 선별하도록 CSM-U 상에서 도말되었고, 균주 Y4960를 수득하였다.
균주 Y5445는 균주 Y4960의 CAN1 좌위에 TDS_Fs_Sc 코딩 서열을 삽입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y4959 세포들은 통합 제작물 i2608 (서열번호 100)로 형질전환되었고, 이는 사카로마이세스 세레비시애의 GAL1 프로모터 (PGAL1) 및 사카로마이세스 세레비시애의 CYC1 종결인자 (TCYC1)에 의해 끼여있는 TDS_Fs_Sc 코딩 서열을 포함하였다 (도 1L). 숙주세포 형질전환체들은 카나바닌을 포함하고 아르기닌이 결여된 YNB 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에서 의해 검증되었고, 균주 Y5445를 수득하였다.
균주 Y5064는 균주 Y4960로부터 URA3 마커를 제거하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y4960 세포들은 통합 제작물 i569 (서열번호 102)로 형질전환되었고, 이는 NDT80 서열들의 상류 및 하류에 의해 끼여있는, HXT3 프로모터 (PHXT3) 및 PGK1 종결인자 (TPGK1)에 의해 끼여있는 사카로마이세스 세레비시애의 ACS2 유전자의 코딩 서열들 (ACS2), 또한 GAL7 프로모터 (PGAL7) 및 TDH3 종결인자 (TTDH3)에 의해 끼여있는 Z. mobilis의 PDC 유전자의 코딩 서열 (zmPDC) (도 1N)을 포함하였다. 숙주세포 형질전환체들은 5-FOA를 포함하는 배지 상에서 성장하는 그들의 능력을 기초로 하여 선별되었고, 균주 Y5064를 수득하였다.
균주 Y5065는 균주 Y5064의 BIO4 좌위에 FS_A_5.3 코딩 서열 및 FS_B_5.3 코딩 서열을 삽입하여 생성되었다 (표 17을 참조하라). 본 목적으로, 지수적으로 성장하는Y5064 세포들은 통합 제작물 i2124 (서열번호 103)로 형질전환되었고, 이는 BIO4 서열들의 상류 및 하류에 의해 끼여있는, URA3 코딩 서열 (URA3), 또한 GAL1 또는 GAL10 프로모터 (PGAL1 또는 PGAL10) 및 ADH1 또는 CYC1 종결인자 (TADH1 또는 TCYC1)에 의해 끼여있는 파네센 합성효소 변이체 코딩 서열들을 포함하였다 (도 1O). 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y5065를 수득하였다.
균주 Y5066은 균주 Y5064의 BIO4 좌위에 FS_A_5.3 코딩 서열, FS_B_5.3 코딩 서열, FS_C_7 코딩 서열, 및 FS_D_3.5 코딩 서열을 삽입하여 생성되었다 (표 17을 참조하라). 본 목적으로, 지수적으로 성장하는Y5064 세포들은 통합 제작물 i2127 (서열번호 101)로 형질전환되었고, 이는 ADH5 서열들의 상류 및 하류에 의해 끼여있는, LEU2 코딩 서열 (LEU2), 또한 GAL1 또는 GAL10 프로모터 (PGAL1 또는 PGAL10) 및 ADH1 또는 CYC1 종결인자 (TADH1 또는 TCYC1)에 의해 끼여있는 파네센 합성효소 변이체 코딩 서열들을 포함하였고 (도 1M), 이는 i2127의 두 개 중복되는 분절들로 공동-형질전환, 이에 의한 두 개 중복되는 플라스미드 삽입체들 간의 상동 재조합의 촉진에 의해 생성되었다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y5066를 수득하였다.
균주 Y5446는 균주 Y5065의 CAN1 좌위에 TDS_Fs_Sc 코딩 서열을 삽입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y4959 세포들은 통합 제작물 i2608 (서열번호 100)로 형질전환되었고, 이는 사카로마이세스 세레비시애의 GAL1 유전자의 프로모터 (PGAL1) 및 사카로마이세스 세레비시애의 CYC1 유전자의 종결인자 (TCYC1)에 의해 끼여있는 TDS_Fs_Sc 코딩 서열을 포함하였다 (도 1L). 숙주세포 형질전환체들은 카나바닌을 포함하고 아르기닌이 결여된 YNB 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에서 의해 검증되었고, 균주 Y5446을 수득하였다.
균주 Y5447 는 균주 Y5066의 CAN1 좌위에 TDS_Fs_Sc 코딩 서열을 삽입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y4959 세포들은 통합 제작물 i2608 (서열번호 100)로 형질전환되었고, 이는 사카로마이세스 세레비시애의 GAL1 프로모터 (PGAL1) 및 사카로마이세스 세레비시애의 CYC1 종결인자 (TCYC1)에 의해 끼여있는 TDS_Fs_Sc 코딩 서열을 포함하였다 (도 1L). 숙주세포 형질전환체들은 카나바닌을 포함하고 아르기닌이 결여된 YNB 배지 상에서 선별되었고, 선택된 클론들은 진단적 PCR에서 의해 검증되었고, 균주 Y5447을 수득하였다.
균주 Y224는 균주 Y211 내로 아모파디엔 합성효소 (ADS), 사이토크롬 P450 모노옥시게나제 (AMO, CYP71AV1), 및 NADP-사이토크롬 P450 산화환원효소 (CPR)를 인코딩하는 발현 플라스미드를 도입하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y211 세포들은 발현 플라스미드 pAM322로 형질전환되었고, 이는 사카로마이세스 세레비시애에서 발현을 위해 코돈-최적화되고 사카로마이세스 세레비시애의 GAL1 또는 GAL10 유전자 프로모터의 조절적 통제 하에 아르테미시아 애누아의 ADS 유전자의 코딩 서열 (ADS), 아르테미시아 애누아의 AMOS 유전자의 코딩 서열, 및 아르테미시아 애누아의 CPR 유전자의 코딩 서열을 포함하였다. 숙주세포 형질전환체들은 CSM-L 상에서 선별되었고, 균주 Y224를 수득하였다.
균주 Y284는 균주 Y224의 GAL1 및 GAL10 유전자들의 분지된 프로모터 및 GAL1 코딩 서열을 하이그로마이신 B 저항성 마커 (hphA)과 대체하여 생성되었다. 본 목적으로, 지수적으로 성장하는Y224 세포들는 통합 제작물 i65 (서열번호 104; 도 1P)로 형질전환되었다. 숙주세포 형질전환체들은 하이그로마이신 B에 대한 그들의 저항성을 기초로 하여 선별되었고, 선택된 클론들은 진단적 PCR에 의해 검증되었고, 균주 Y284를 수득하였다.
균주 Y301는 균주 Y284 의 ERG9 유전자를 사카로마이세스 세레비시애의 CTR3 유전자의 프로모터의 조절적 통제 하에 놓아서 생성되었다. 본 목적으로, 지수적으로 성장하는Y284 세포들은 통합 제작물 i10 (서열번호 105)로 형질전환되었고, 이는 ERG9 유전자의 상류 및 코딩 서열들에 의해 끼여있는 D-세린 탈아미노효소 (dsdA)의 코딩 서열 및 CTR3 프로모터 (PCTR3)를 포함하였다 (도 1Q). 숙주세포 형질전환체들은 D-세린 탈아미노효소 상에서 성장하는 그들의 능력을 기초로 하여 선별되었고, 진단적 PCR에 의해 검증되었고, 균주 Y301를 수득하였다.
균주 Y539는 균주 Y301로부터 발현 플라스미드 pAM322를 제거하여 생성되었다. 본 목적으로, 균주 Y301는 0.5% 루이신 (w/v)을 포함하는 강화된 효모 펩톤 덱스트로스 (YPD) 배지에서 4일 동안 증식되었다. 24시간마다, 배양액은 0.5% 루이신 (w/v)을 포함하는 신선한 YPD에 OD600 0.05로 접종되었다. 4일 이후에, 세포들은 일련 희석되었고 YPD 고체 아가 상 에 도말되었고, 플레이트들은 30℃에서 4일 동안 배양되었다. 두 개의 구별되는 콜로니 크기들이 관찰되었다. 더 작은 콜로니들은 (pAM322의 소실을 가리킴) 루이신이 결여된 최소 배지 상에 복제 도말되었다. YPD 고체 아가 상에서는 자랄 수 있지만 루이신 결핍 배지에서는 자라지 못하는 클론들이 균주 Y539로서 선별되었다.
실시예
3
본 실시예는 개선된 생체내 성능을 가진 테르펜 합성효소들을 검색하도록 대장균에서 FPP 기아 기초 선별을 사용하는 유용성을 기술하고 있다.
DH5α 화학적- 또는 전기적-적합 대장균 세포들 (Invitrogen, Carlsbad, CA)이 발현 플라스미드들 pAM1668 (음성 대조군), pAM1670, pAM2096, pAM2097, pAM2098, pAM2101, 및 pAM2104로 이루어진 그룹으로부터 선택되는 발현 플라스미드 5 ng으로 형질전환되었다. 숙주세포 형질전환체들은 카베니실린을 포함하는 한천 배지들 상에 도말되었고, 플레이트들은 2 내지 3일 동안 30℃에서 배양되었다.
도 2에 나타난 바와 같이, 발현 플라스미드 pAM2097 또는 pAM2096로 형질전환된 세포들은 빈 벡터 (pAM1668)로 형질전환된 세포들과 동일한 크기의 콜로니들을 생산하였다. 그러나, 발현 플라스미드 pAM1670, pAM2098로 형질전환된 세포들, 뿐만 아니라 발현 플라스미드들 pAM2104 또는 pAM2101로 형질전환된 세포들 (결과 미도시)은 대조군에 의해 생산된 것들보다 작은 콜로니들을 생산하였다. 더 작은 콜로니 크기는 활성을 가진 세스퀴테르펜 합성효소의 발현에 의해 매개된 숙주세포들에서 FPP의 파네센으로 전환에 의해 촉발된 FPP 기아에 의한 것 같다. 이들 세스퀴테르펜 합성효소들의 생체내 활성들은 72시간에서 진탕 플라스크들에 있는 숙주 세포들의 GC 분석에 의해 입증되었고 (도 4), 대장균에서 FPP 기아 기초 선별이 생체내 효소 활성에 대해 세스퀴테르펜 합성효소들을 검색하는 데 사용될 수 있는 점을 보여주었다.
실시예
4
본 실시예는 개선된 생체내 성능을 가진 세스퀴테르펜 합성효소들을 검색하도록 대장균에서 FPP 기아 기초 선별을 사용하는 유용성을 기술하고 있다.
DH5α 화학적- 또는 전기적-적합 대장균 세포들 (Invitrogen, Carlsbad, CA)이 5 ng의 발현 플라스미드 pAM765 (숙주세포들에서 FPP의 생산을 종합적으로 증가시키는 MEV 경로의 효소들을 인코딩함) 또한 발현 플라스미드들 pAM1668 (음성 대조군) pAM1670, pAM2117, pAM2157, pAM2158, pAM2098, pAM2104, pAM2097, pAM2101, 및 pAM2096로 이루어진 그룹으로부터 선택되는 5 ng의 발현 플라스미드로 공동-형질전환되었다. 숙주세포 형질전환체들은 클로르암페니콜 및 카베니실린을 포함하는 한천 배지들 상에 도말되었고, 플레이트들은 2 내지 5일 동안 30℃에서 배양되었다.
도 3 및 표 12에 나타난 바와 같이, 빈 벡터 (pAM1668)로 형질전환된 세포들은 아마도 숙주 세포들에서 독성 FPP의 축적에 의해 촉발된 세포 사망으로 인해, 콜로니들을 전혀 생산하지 않았다 (Withers at al. (2007) Appl . Environ . Microbiol. 73:6277-6283). 유사하게, 발현 플라스미드 pAM2158 또는 pAM2117로 형질전환된 세포들은 아마도 이들 플라스미들의 파네센 합성효소 코딩 서열들이 대장균 숙주세포들에서 효율적인 발현을 위해 코돈-최적화되지 않은 점으로 인해, 콜로니들을 형성하지 못하였다. 발현 플라스미드들 pAM2096로 형질전환된 세포들도 역시 콜로니들을 형성하지 못하였고, Citrus junos 파네센 합성효소가 대장균 숙주세포들에서 충분한 활성을 보유하지 못한 점을 제시하였다. 다른 형질전환된 세포들 모두가 아마도 발현 플라스미드들 pAM1670, pAM2157, pAM2098, pAM2104, pAM2097, 및 pAM2101에 의해 인코드되는 활성을 가진 세스퀴테르펜 합성효소들에 의한 덜 독성인 세스퀴테르펜으로의 FPP의 전환으로 인해, 배양 1 내지 3일 이내에 콜로니들을 생산하였다. 여러 이들 세스퀴테르펜 합성효소들의 생체내 활성들은 72시간에서 진탕 플라스크들에 있는 숙주 세포들의 GC 분석에 의해 입증되었고 (도 4), 대장균에서 FPP 독성 기초 성장 선별이 생체내 효소 활성에 대해 세스퀴테르펜 합성효소들을 검색하는 데 사용될 수 있는 점을 보여주었다.
실시예
5
본 실시예는 개선된 생체내 성능을 가진 세스퀴테르펜 합성효소들을 검색하도록 효모에서 FPP 독성 기초 성장 선별을 사용하는 유용성을 기술하고 있다.
균주 Y3198는 500 ng의 제작물 A 또는 제작물 B로 각각 형질전환되었다. 숙주세포 형질전환체들은 5 mL YPD 배지에서 250 rpm으로 진탕하면서 6시간 동안 배양되었고, 5 mL diH2O으로 두 번 세척되었다. 각 세척된 배양액의 절반은 단독 탄소원으로서 2% 갈락토스를 포함하는 CSM-L 한천 배지들에 도말되었다 (갈락토스 상의 성장은 균주 Y3198 내로 조작된 MEV 경로 효소 코딩 서열들의 발현을 유도하여, 세포들에서 증가된 FPP 생산을 가져오는 점을 주목하라). 각 세척된 배양액의 남아있는 절반은 단독 탄소원으로서 2% 포도당을 포함하는 CSM-L 한천 배지들에 도말되었다. 플레이트들은 개별 콜로니들이 대략 1 mm의 반경이 될 때까지 30℃에서 3일 동안 배양되었다.
도 5에서 나타난 바와 같이, 제작물 A로 형질전환된 세포들만이 단독 탄소원으로서 갈락토스를 포함하는 CSM-L 배지 상에서 성장할 수 있었고, 효모에서 생체내 효소 활성에 대해 세스퀴테르펜 합성효소들을 검색하는 데 FPP 독성 기초 성장 선별의 유용성을 보여주었다.
실시예
6
본 실시예는 개선된 생체내 성능을 가진 테르펜 합성효소들을 검색하도록 나일 레드 형광을 사용하는 유용성을 기술하고 있다.
상대적인 파네센 역가들을 결정하기 위하여, 제작물 A로 형질전환된 균주 Y3198의 48개 콜로니들 및 발현 플라스미드 pAM404로 형질전환된 균주 Y3198의 48개 콜로니들이 웰 당 2% 갈락토스를 가진 360 uL의 버드 종자 배지 (BSM)를 포함하는 96-웰 플레이트의 분리된 웰들로 나뉘었다 (전배양). 999 rpm 교반으로 30℃에서 배양 2일 이후에, 각 웰의 16 uL이 2% 갈락토스를 가진 신선한 360 uL의 BSM을 포함하는 새로운 96-웰 플레이트의 웰 내로 접종되었다 (생산 배양). 또 다른 999 rpm 교반으로 30℃에서 배양 2일 이후에, 시료들이 나일 레드 형광에 의한 파네센 역가 결정을 위해 취해졌다.
나일 레드 형광 분석을 위해, 98 uL의 각 배양액이 96-웰 검은색 폴리스티렌 편평 바닥 플레이트 내로 옮겨졌고, DMSO에 넣어 100 ug/mL로 용해된 2 uL의 나일 레드 (Invitrogen, Carlsbad, CA)가 각 웰에 첨가되었다. 형광 수준들이 500 nm에서 여기 및 550 nm에서 방출로 바로 측정되었다.
도 6에서 나타난 바와 같이, 제작물 A로 형질전환된 균주 Y3198에서 FS_Aa_Sc 코딩 서열의 단일한 염색체로 통합된 사본은 고-사본수 발현 플라스미드 pAM404로 형질전환된 균주 Y3198로 획득된 것의 39%가 되는 나일 레드 형광 신호를 생산하였다. 두 개 균주들 간의 파네센 역가들에서 대략 3배의 차이가 GC 분석에 의해 입증되었고 (결과 미도시), 본 시스템의 경우 개선된 생체내 성능을 가진 테르펜 합성효소들을 위해 적합한 검색이 되도록 나일 레드 형광 수준들 (예로, 파네센 수준들)에서 충분한 차이 (델타)가 존재하는 점을 보여주었다.
실시예
7
본 실시예는 세스퀴테르펜 합성효소들을 그들의 생체내 효소 활성 수준들에 따라 순위 매기도록 효모에서 세스퀴테르펜 합성효소 경쟁을 사용하는 유용성을 기술하고 있다.
각각의 효모 균주들 Y3353 및 Y3354을 위해, 발현 플라스미드 pAM1812 또는 pAM1813 각각으로 균주 Y3125의 형질전환의 8개의 단일 콜로니들이 웰 당 2% 슈크로스를 가진 360 uL의 버드 종자 배지 (BSM)를 포함하는 96-웰 플레이트의 분리된 웰들에서 배양되었다 (전배양). 999 rpm 교반으로 30℃에서 배양 2일 이후에, 각 웰의 16 uL이 2% 슈크로스를 가진 신선한 360 uL의 BSM을 포함하는 새로운 96-웰 플레이트의 웰 내로 접종되었다 (생산 배양). 또 다른 999 rpm 교반으로 30℃에서 배양 2일 이후에, 시료들이 취해졌고 기체 크로마토그래피 (GC) 분석에 의해 테르펜 생산에 대해 분석되었다. 각 균주를 위해, 단일 콜로니가 역시 CSM-L-M-U 한천 배지들 상에서 재도말되었고, 각 재도말 (re-streak)로부터 얻은 8개의 단일 콜로니들이 기술된 바와 같이 성장되었고, GC 분석에 의해 테르펜 생산에 대해 분석되었다.
GC 분석을 위해, 시료들이 메탄올-헵탄 (1:1 v/v)으로 추출되었고, 혼합물은 세포성 물질을 제거하도록 원심분리되었다. 메탄올-헵탄 추출물의 분량이 헵탄으로 희석된 다음, 펄스 분리 주입을 사용하여 메틸 실리콘 정지상 상에 주입되었다. 파네센 및 트리코디엔이 점화 이온화 검출 (FID)로 GC를 사용하는 비등점에 의해 분리되었다. 트랜스-β-카리오필렌이 특정된 GC 오븐 프로파일 동안 성공적인 주입 및 용출을 감시하도록 보유 시간 마커로서 사용되었다. 파네센 및 트리코디엔의 역가들이 파네센/트리코디엔 비율들을 계산하는 데 사용되었다.
도 13에서 나타난 바와 같이, 독립적인 원래 형질전환체 중에서 테르펜 역가들은 웰마다 상당하게 다양화되었고, 29%까지의 계수들의 변화 (CVs) 를 가져왔다. CVs는 8개의 복제본들의 경우 감소되었다. 관찰된 CVs는 웰마다 또한 클론마다 변화들이 세스퀴테르펜들을 생산하는 세스퀴테르펜 합성효소들의 활성들에 관해 세스퀴테르펜 역가들로부터 직접 결론들을 내는 것을 불가능하게 하는 점을 보여주고 있다. 그러나, 표 13에서도 역시 나타난 바와 같이, 파네센/트리코디엔 비율들은 시료들 전체를 통해 오히려 일정하였고, 단지 5.7%의 CVs를 생산하였다. 따라서, 대조군 세스퀴테르펜 합성효소와 동일한 플라스미드로부터 테스트 세스퀴테르펜 합성효소를 공동-발현하여, 또한 테스트 및 대조군 세스퀴테르펜 합성효소들의 활성들을 비교하여, 웰마다 및 클론마다 변화들이 크게 감소되었고, 대조군 세스퀴테르펜 합성효소 (예로, TDS)의 효율에 대한 테스트 세스퀴테르펜 합성효소 (예로, 파네센 합성효소)의 생체내 촉매적 효율을 벤치마크하는 것을 가능하게 하였다.
효모에서 세스퀴테르펜 합성효소 활성들을 위한 순위매김 도구로서 세스퀴테르펜 합성효소 경쟁을 좀 더 입증하기 위하여, 효모 균주들 Y3353, Y3394, 및 Y3395가 기술된 바와 같이 평가되었다. 표 14에서 나타난 바와 같이, 절대적인 파네센 역가들은 다시 유의한 변화들을 보여주었던 한편, 파네센/트리코디엔 비율들을 위해 낮은 CVs가 관찰되었다. 관찰된 비율에 의해 판단된 바와 같이, 테스트된 파네센 합성효소들은 다음과 같이 (가장 큰 활성을 가진 것부터 가장 작은 활성을 가진 것까지) 순위가 매겨질 수 있었다: FS_Ad_Sc 코딩 서열 (Y3395) 로부터 발현되는 Actinidia deliciosa 파네센 합성효소 > FS_Aa_Sc 코딩 서열 (Y3353)로부터 발현되는 아르테미시아 애누아 파네센 합성효소 > FS_S2D_Ec 코딩 서열 (Y3394)로부터 발현되는 S2D 변이 아르테미시아 애누아파네센 합성효소. 본 순위매김은 FS_Aa_Sc, FS_S2D_Ec, 또는 FS_Ad_Sc 코딩 서열의 단일 사본을 보유하는 균주들을 사용하는 GC 분석에 의해 검증되었고 (도 7), 따라서 세스퀴테르펜 합성효소를 효모에서 그들의 생체내 효소 활성 수준들에 따라 순위 매기는 수단으로서 세스퀴테르펜 합성효소 경쟁의 유용성을 입증하였다.
효모에서 세스퀴테르펜 합성효소 활성들을 위한 순위매김 도구로서 세스퀴테르펜 합성효소 경쟁을 좀 더 입증하기 위하여, 효모 균주들 Y5444, Y5445, Y5446, 및 Y5447가 다음의 예외들을 가지고 기술된 바와 같이 평가되었다: 각 균주를 위해, 8개의 콜로니들 대신에 4개의 콜로니들이 분석되었고, 배양액들은 30℃에서가 아닌 34℃에서 배양되었으며, 전배양들은 2일이 아닌 3일 동안 지속되었고, 생산 배양액은 전배양액의 10배 희석이었다. 표 15 및 도 8에서 나타난 바와 같이, 선형의 관계성이 통합된 파네센 합성효소 코딩 서열들의 수 및 파네센 대비 트리코디엔 비율들 간에 관찰되었고, 세스퀴테르펜 합성효소를 효모에서 그들의 생체내 효소 활성 수준들에 따라 순위 매기는 수단으로서 세스퀴테르펜 합성효소 경쟁의 유용성을 입증하였다.
실시예
8
본 실시예는 세스퀴테르펜 합성효소들 변이체들의 라이브러리들을 생성하는 방법들을 기술하고 있다.
여러 파네센 합성효소 변이체 라이브러리들이 주형으로서 FS_S2D_Ec 코딩 서열을 사용하여 생성되었다. 각 라이브러리를 위해, 250 내지 500 ng의 pAM1670가 GeneM 또는 ph® Ⅱ 랜덤 돌연변이화 키트 (Agilent Technologies, Inc., Santa Clara, CA)를 제조사의 제시된 프로토콜들에 따라 사용하고 프라이머들 LX-268-®139-S2D-F (서열번호 106) 및 LX-268-139-S2D-R (서열번호 107)을 25회 증폭 순환들에 사용하여 오류-빈발 PCR이 되었다. PCR 산물들은 젤 정제되었고 FastDigest® NdeI 및 BamHI 제한효소들 (Fermentas Inc., Burlington, Ontario)로 연속하여 소화되었다. 벡터 pAM1668는 동일한 두 개의 제한효소들을 사용하여 완전하게 소화되었고, 선형화된 벡터 DNA 단편은 재원형화를 허용하는 5'포스페이트기들을 제거하도록 송아지 장 알칼라인 포스파타제 (CIP)로 처리되었다. 정제된 PCR 산물들 및 선형화된 pAM1688 벡터는 T4 DNA 리가제를 사용하여 3:1의 삽입체 대비 벡터 비율로 라이게이션되고, 2 uL의 라이게이션 반응 혼합물이 XL1-Blue 전기적-적합 대장균 세포들 (Agilent Technologies Inc., Santa Clara, CA) 내로 제조사의 제시된 프로토콜들에 따라 형질전환되었다. 숙주세포 형질전환체들은 카베니실린을 포함하는 여러 개의 LB 한천 배지들 (100 mm 반경) 상에서 선별되었다. 무작위 돌연변이화 라이브러리의 품질을 평가하기 위하여, 48개 또는 96개 단일 콜로니들이 뽑혔고 카베니실린을 포함하는 LB 배지에서 성장되었고, 플라스미드 DNA각 각 배양액으로부터 QIAprep 96 터보 미니프렙 키트 (Qiagen, Valencia, CA)를 사용하여 분리되었고, 플라스미드 DNA가 FastDigest® NdeI 및 BamHI 제한효소들 (Fermentas Inc., Burlington, Ontario)을 사용하여 소화되어 대략 95%의 플라스미드들이 삽입체를 포함하였던 점을 결정하였다. 플라스미드들은 돌연변이 빈도를 결정하도록 역시 서열결정되었고, 이는 추정된 평균이 FS 코딩 서열 당 2 내지 6개 뉴클레오타이드 변화들이 되는 것으로 확인되었다. 남아있는 콜로니들은 한천 배지들로부터 세척되었으며, 플라스미드 DNA는 QIAprep 스핀 미니프렙 키트 (Qiagen, Valencia, CA)를 사용하여 분리되었다.
여러 개의 파네센 합성효소 변이체 라이브러리들도 역시 주형으로서 FS_Aa_Sc 코딩 서열을 사용하여 생성되었다. 제작물 C는 최종적 조립 이전에 FS_Aa_Sc PCR 산물이 제조사의 제시된 프로토콜들에 따라 Mutazyme Ⅱ® 키트 (Agilent Technologies, Inc., Santa Clara, CA) 및 프라이머들 AM-288-90-CPK1618 (서열번호 83) 및 AM-288-90-CPK1619 (서열번호 84)를 사용하여 오류-빈발 PCR에 의해 돌연변화되는 점을 제외하고 제작물 A와 필수적으로 일치하였다. 균주 Y3198는 500 ng의 제작물 C로 형질전환되었고, 숙주세포 형질전환체들은 그들이 2% 갈락토스를 가진 CSM-L 상에서 도말되기 이전에 5 mL YPD 배지에서 250 rpm으로 진탕하면서 6시간 동안 회수되었다.
실시예
9
본 실시예는 대장균에서 FPP 독성 기초 성장 선별에 의해 세스퀴테르펜 합성효소 변이체들의 라이브러리들을 검색하는 방법들을 기술하고 있다.
ElectroMAX DH5-α-E 대장균 세포들 (Invitrogen, Carlsbad, CA)이 5 ng의 발현 플라스미드 pAM765 (MEV 경로의 효소들을 인코딩함) 및 5 ng의 실시예 8의 FS_S2D_Ec 기초 파네센 합성효소 변이체 라이브러리 플라스미드들로 형질전환되었다. 40회 이상의 공동-형질전환 실험들이 ~ 2 x 105개 숙주세포 형질전환체들을 생성하도록 수행되었다. 숙주세포 형질전환체들이 카베니실린 및 클로르암페니콜을 포함하는 LB 한천 배지들 (100 mm 반경) 상에 도말되었고, 30?에서 2시간 동안 배양되었고, 이후에 대략 400개의 큰 콜로니들 및 유사한 수의 작은 콜로니들이 한천 배지들 상에서 관찰되었다. ElectroMAX DH5α-E 대장균 세포들 (Invitrogen, Carlsbad, CA)이 5 ng의 발현 플라스미드 pAM765만으로 형질전환되었고, 카베니실린 및 클로르암페니콜을 포함하는 LB 한천 배지들 상에 도말되었을 때 콜로니들은 전혀 관찰되지 않았다. 이들 콜로니들 모두가 부모 파네센 합성효소와 동등하거나 더 큰 활성을 소유하는 파네센 합성효소 변이체들을 포함하는 것으로 가정하여, 적중율은 대략 1%로 추정되었다.
실시예
10
본 실시예는 나일 레드 형광을 사용하여 테르펜 합성효소 변이체들의 라이브러리들을 검색하는 방법들을 기술하고 있다.
실시예 9의 FPP 기초 성장 선별 검색에서 획득된 거대 콜로니들이 개별적으로 웰 당 5 uL diH2O을 포함하는 96-웰 플레이트들 내로 뽑혔고 98?에서 10분 동안 가열되었다. 생성된 용출물들은 XL1-Blue 화학적-적합 대장균 세포들 (Agilent Technologies Inc., Santa Clara, CA) 내로 형질전환되었고, 숙주세포 형질전환체들은 카베니실린을 포함하는 LB 한천 배지들 상에 도말되었다. 클로르암페니콜이 선택 배지로부터 생략되어 발현 플라스미드 pAM765가 세포들로부터 소실되었던 점을 주목하라. 개별 콜로니들이 뽑혔고 카베니실린을 포함하는 LB 배지에서 성장되었으며, 플라스미드 DNA가 QIAprep 96 터보 미니프렙 키트 (Qiagen, Valencia, CA)를 사용하여 분리되었다. 거대 콜로니들이 선택 플레이트들로부터 분리된 이후에, 작은 콜로니들이 플레이트들로부터 세척되었고, 그들의 플라스미드들은 유사한 방식으로 혼합물로서 분리되었다.
XL1-Blue 화학적-적합 대장균 세포들 (Agilent Technologies Inc., Santa Clara, CA)은 5 ng의 발현 플라스미드 pAM97 (MEV 경로의 효소들을 인코딩함) 및5 ng의 분리된 플라스미드들 (거대 콜로니들로부터 획득됨) 또는 플라스미드 혼합물 (작은 콜로니들로부터 획득됨)으로 공동-형질전환되었다. 숙주세포 형질전환체들은 카베니실린 및 클로르암페니콜을 포함하는 LB 한천 배지들 상에 도말되었고, 37℃에서 24시간 동안 배양되었다. 개별 콜로니들은 카베니실린 및 클로르암페니콜을 포함하는 M9-헤르페스 배지를 포함하는 96-웰 플레이트들 내로 접종되었고, 배양액들은 30℃에서 24시간 동안 배양되었다 (전배양). 다음으로, 50 uL의 각 배양액은 두 번째 배양을 0.05의 초기 OD로 접종하는 데 사용되었다. MEV 경로 및 파네센 합성효소의 발현을 유도하기 위하여, 이소프로필 β-D-1-티오갈락토피라노사이드 (IPTG)가 각 배양액에 1 mM 최종 농도로 첨가되었다. 배양액들은 나일 레드 형광에 의해 파네센 역가들이 결정되기 이전에 적어도 20시간 동안 배양되었다 (생산 배양). pAM97 및 pAM1419으로 공동-형질전환된 대장균 균주가 음성 대조군으로서 사용되었고, pAM97 및 pAM1421로 공동-형질전환된 대장균 균주가 양성 대조군으로서 사용되었다. 나일 레드 형광 분석을 입증하기 위하여, 파네센 역가들도 역시 GC 분석에 의해 결정되었다.
도 9에서 나타난 바와 같이, 측정된 나일 레드 형광 신호들은 GC 분석에 의해 결정된 파네센 역가들과 직접적으로 상관되어 있었고, 또한 나일 레드 형광을 파네센 역가들을 측정하는 수단으로서 입증하였다.
나일 레드 형광 및 GC 분석에 의해 결정된 바와 같이 가장 큰 파네센 역가들을 생산하였던 거대 콜로니들로부터 획득된 플라스미드들로 형질전환된 세포들로부터 유래한 탑 70 균주들이 새로운 96-웰 플레이드들 내로 복제-도말되었고, 그들의 생산 수준들은 기술된 바와 같이 재측정되었다. 도 10에 나타난 바와 같이, 이들 균주들의 대략 50개는 부모 FS_S2D_Ec 코딩 서열을 포함하는 대조군 균주보다 높은 파네센 역가들을, 부모 파네센 합성효소보다 65% 이상의 파네센을 생산하는 최고의 파네센 합성효소 변이체로 생산하였다.
대략 400개의 큰 콜로니들로부터 추출된 플라스미드들은 등분자 양들로 조합되었고, FS 코딩 서열들은 프라이머들 LX-268-130-3-S2D-F (서열번호 110) 및 LX-268-130-4-S2D-R (서열번호 109)을 사용하여 PCR 증폭되었고, PCR 산물들은 젤 정제되었다. 벡터 pAM1734는 FastDigest® Bst1101 제한효소 (Fermentas Inc., Burlington, Ontario)를 사용하여 선형화되었고, 선형화된 벡터는 Zymo DNA 세척 & 농축TM 키트 (Zymo Research Corp., Orange, CA)를 사용하여 세척되었다. 정제된 벡터 및 PCR 산물들은 1:3 (벡터:삽입체)의 비율로 혼합되었고, 균주 Y539 또는 균주 Y3198 내로 상동 재조합을 통한 라이게이션을 위해 형질전환되었다. 숙주세포 형질전환체들은 단독 탄소원으로서 2% 포도당 (Y539 숙주) 또는 2% 갈락토스 (Y3198 숙주)을 가진 CSM-L 한천 배지들 상에 도말되었다. 대략 2,500개의 개별 콜로니들이 뽑혔고, 파네센 역가들이 기술된 바와 같이 (Y539 숙주의 경우 2% 포도당을 가진 BSM, 또한 Y3198 숙주의 경우 2% 갈락토스를 가진 BSM을 사용함), 나일 레드 형광에 의해 결정되었다. 부모 대조군 (Y539에서 pAM1764 (CEN.ARS 플라스미드 상의 FS_S2D_Ec))의 경우 획득된 신호보다 3배 표준 편차로 더 큰 형광 신호를 생산하였던 클론들이 단일 콜로니들을 획득하도록 CSM-L 한천 배지들 상에 재도말되었고, 각 재도말의 4개 콜로니들이 나일 레드 형광 및 GC 분석에 의해 다시 테스트되었다. 도 11A 및 11B에 나타난 바와 같이, 파네센 합성효소 변이체로 형질전환된 많은 세포들은 부모 대조군 균주보다 더 높은 파네센 역가들을 생산하였고, 소수가 발현 플라스미드 pAM1765 (고-사본수 플라스미드 상의 FS_Aa_Ec)로 형질전환된 균주 Y539보다 훨씬 더 높은 역가들을 생산하였다.
실시예
11
본 실시예는 효모에서 FPP 독성 기포 성장 선별에 의해 세스퀴테르펜 합성효소 변이체들의 라이브러리들을 검색하는 방법들을 기술하고 있다.
실시예 8의 제작물 C로 형질전환된 균주 Y3198의 세척된 형질전환이 단독 탄소원으로서 2% 갈락토스를 포함하는 CSM-L 한천 배지들에 도말되었다. 플레이트들은 5일 동안 30℃에서 배양되었고, 콜로니들은 뽑혔고 증식되었고 기술된 바와 같이 나일 레드 형광 및 GC 분석에 의해 분석되었다. 도 12에 나타난 바와 같이, 단독 탄소원으로서 갈락토스 상에서 성장된 대략 15%의 클론들이 부모 대조군 (제작물 C로 형질전환된 균주 Y3198)으로 획득된 평균 역가보다 적어도 15% 더 높은 파네센 역가들을 가졌다. 부모 대조군보다 적어도 15% 더 높은 파네센 역가들을 가지는 클론들은 2% 포도당을 포함하는 CSM-L 한천 배지들에 개별 콜로니들을 위해 도말되었다. 각 클론을 위해, 6개의 개별 콜로니들이 뽑혔고 GC 분석에 의해 기술된 바와 같이 다시 테스트되었다. GC 검정법을 통하여 대조군보다 >15% 더 높은 평균 파네센 역가를 유지하였던 클론들은 세스퀴테르펜 경쟁 검정법을 위해 촉진되었다.
실시예
12
본 실시예는 효모에서 세스퀴테르펜 합성효소 경쟁에 의해 세스퀴테르펜 합성효소 변이체들을 검색하는 방법들을 기술하고 있다.
플라스미드들은 탑 파네센을 생산하는 실시예 10의 효모 균주들로부터 ZymoprepTM 효모 플라스미드 미니프렙 키트 (Zymo Research Corp., Orange, CA)를 사용하여 분리되었다. 플라스미드들은 BamHI 및 NheI 제한효소들을 사용하여 소화되었고, 파네센 합성효소 변이체 코딩 서열들이 젤 정제되었고, 동일한 두 개의 제한효소들로 소화된 발현 벡터 pAM1812와 라이게이션되었고, 따라서 pAM1812의 FS_Aa_Sc 코딩 서열을 변이체들 FS_S2D_Ec 또는 FS_Aa_Sc 코딩 서열들과 대체하였다.
임의적으로, 또한 추가적으로, 파네센 합성효소 변이체 코딩 서열들은 분리된 세포들로부터 또는 탑 파네센을 생산하는 실시예 11의 효모 균주들의 세포 용출물들로부터 프라이머들 AM-288-90-CPK1618 (서열번호 83) 및 AM-288-90-CPK1619 (서열번호 84)를 사용하여 PCR 증폭되었고, PCR 산물들은 제조사의 제시된 프로토콜들에 따라 E.Z.N.A.® 젤 추출 키트 (Omega Bio-Tek Inc., Norcross, GA)를 사용하여 젤 정제되었고, FastDigest BamHI 제한효소 (Fermentas Inc., Burlington, Ontario)로 소화된 발현 플라스미드 pAM1948와, 균주 Y3125를 둘 다의 정제된 DNA 단편들로 형질전환하고, 따라서 pAM1948의 IS_Pn_Sc 코딩 서열을 변이체 FS_S2D_Ec 코딩 서열들과 대체하는 것에 의한 상동 재조합을 통해 라이게이션되었다.
숙주세포 형질전환체들은 단독 탄소원으로서 2% 포도당을 가진 CSM-L 한천 배지들에 도말되었고, 다음으로 숙주세포 형질전환체에서 GAL80 코딩 서열을 루프 아웃하도록 CSM-L-U 한천 배지들에 30℃에서 적어도 72시간 동안 복제-도말되었다. 각 클론을 위해, 8개의 콜로니들이 뽑혔고, 증식되었고, 그들의 테르펜 역가들이 GC 분석에 의해 기술된 바와 같이 결정되었다. 부모 파네센 합성효소를 위해 획득된 비율보다 더 높은 파네센/트리코디엔 비율을 생산하였던 파네센 합성효소 변이체들 (pAM1812로 형질전환된 균주 Y3125)은 CSM-L 한천 플레이트들에 재도말되었다. 각 재도말을 위해, 8개의 개별 콜로니들이 기술된 바와 같이 96-웰 플레이트 생산 실험들에서 다시 테스트되었다. 파네센 합성효소 변이체를 포함하는 모두 11개 효모 균주들이 개선된 파네센/트리코디엔 비율들을 보여주었고, 이들 파네센 합성효소 변이체들이 효모에서 개선된 생체내 효소 활성을 소유하는 점을 제시하였다.
실시예
13
본 실시예는 개선된 효소 활성을 가지는 세스퀴테르펜 합성효소 변이체의 특성분석을 기술하고 있다.
가능한 원인적 돌연변이들을 확인하기 위하여, 실시예 12에서 또는 기술된 바와 같이 필수적으로 생성되고 검색된 파네센 합성효소 변이체들의 다른 라이브러리들에서 확인된 개선된 파네센 합성효소 변이체들은 엘림 바이오제약사 (Elim Biopharmeceuticals, Inc., Hayward, CA)에 의해 서열결정되었다. 확인된 돌연변이들은 표 16에 나열되어 있다. 전반적으로, 추정된 300,000개의 클론들 모두가 대장균 및/또는 효모에서 FPP 독성 기초 성장 선별, 나일 레드 형광 및/또는 GC 분석, 및 효모에서 세스퀴테르펜 합성효소 경쟁에 의해 검색되고 평가되었고, 개선된 효소 활성을 가진 51개의 파네센 합성효소 변이체들을 가져왔다. 많은 파네센 합성효소 변이체들이 한 번 이상 (횟수는 표 16에서 변이체의 명칭 다음에 괄호로 표시됨) 확인되었고, 소정의 뉴클레오타이드 및 아미노산 변화들이 복수의 파네센 합성효소 변이체들에서 발견되었고, 돌연변이들 및 증가된 효소 활성 간의 인과 관계들을 제시하였다. 일정의 파네센 합성효소 변이체들에서, 침묵의 돌연변이들이 밝혀졌고, 이들 돌연변이들이 아마도 인코드된 FS의 발현을 개선하는 점을 제시하였다.
실시예
14
본 실시예는 돌연변이들을 조합하고 효모에서 세스퀴테르펜 합성효소 경쟁을 사용하여 개선된 파네센 합성효소 변이체들을 검색하는 방법들을 기술하고 있다.
실시예 13에서 확인된 다양한 아미노산 변화들은 서열 중복 연장 (SOE; Ho, et al , 1989)에 의해 조합되었고, 조합들은 개선된 효소 활성을 가진 FS를 확인하도록 기술된 바와 같이 세스퀴테르펜 합성효소 경쟁에 의해 검색되었다. 표 17에서 나타난 바와 같이, 여러 개의 파네센 합성효소 변이체들은 야생형 A. annua FS 의 것과 대비 그들의 파네센/트리코디엔 비율들에서 실질적인 개선들을 보여주었다. 여러 가지의 이들 파네센 합성효소 변이체들의 증가된 활성은 또한 파네센 합성효소 변이체들 코딩 서열들의 단일한 염색체로 통합된 사본들을 포함하는 효소 균주들의 GC 분석에 의해 검증되었다 (도. 14).
실시예
15
본 실시예는 야생형 파네센 합성효소 및 파네센 합성효소 변이체 단백질들을 발현하고 정제하는 방법들을 기술하고 있다.
대장균 로제타 (DE3) 세포들은 FS_Aa_Ec, FS_B_5.3_Ec (대장균에서 발현을 위해 코돈-최적화된 FS_B_5.3)를 포함하는 발현 플라스미드들 또는 벡터 pAM1490 (서열번호 117)의 BamHI 및 NdeI 부위들 내로 클론된 FS_C_8 코딩 서열로 형질전환되었다. 숙주세포 형질전환체들의 1 L 배양액들에서 FS의 발현은 0.4 mM IPTG을 첨가하여 유도되었고, 각 배양액은 20℃에서 20시간 동안 배양되었다. 세포 용출물들은 Ni 세파로스TM 6 패스트 플로우 레진 (GE Healthcare, Piscataway, NJ)으로 미리 충전된 His GraviTrap 컬럼 상에 로딩되었다. 컬럼들은 10 mL (10 배 컬럼 부피) 결합 완충액 (50 mM 트리스-HCl, pH 8.0, 500 mM NaCl, 5 mM 이미다졸, 5% 글리세롤, 0.5 mM DTT)으로 세척되었고, 분획들은 단계적으로 50 (분획 1), 100 (분획 2), 또는 250 mM (분획 3) 이미다졸을 포함하는 4 ml 용출 완충액 (50 mM 트리스-HCl, pH 8.0, 500 mM NaCl, 5% 글리세롤, 0.5 mM DTT)을 사용하여 용출되었다. 모든 분획들은 결합 완충액에 대해 투석되었고, 분획 2는 또한 투석 카세트에서 단백분해효소 소화 완충액 (20 mM 트리스-HCl, pH 7.5, 200 mM NaCl, 5% 글리세롤, 1 mM DTT)에 대해 투석되었다. His6-태그들을 제거하기 위하여, 120 U의 PreScission 단백분해효소 (GE Healthcare, Piscataway, NJ)가 직접적으로 각 투석 카세트에 첨가되었고, 단백분해효소-소화된 시료들이 저장 완충액 (20 mM 트리스-HCl, pH 7.5, 200 mM NaCl, 20% 글리세롤, 1 mM DTT)에 대해 투석되고 투석 카세트로부터 제거되기 이전에 투석이 밤새 계속되도록 허용되었다. GST-태그된 단백분해효소를 제거하기 위하여, 저장 완충액으로 미리 세척된 글루타치온 세파로스 4B 비드들 (GE Healthcare, Piscataway, NJ)이 단백분해효소-소화된 시료들에 첨가되었고, 비드 혼합물들은 가만히 혼합하면서 한 시간 동안 배양되었다. FS 단백질들은 폴리-프렙 크로마토그래피 컬럼 (Bio-Rad, Hercules, CA)을 통해 혼합물들을 통과시켜서 최종적으로 회수되었고, 정제된 FS 단백질들은 -80℃에서 저장되었다.
분리된 파네센 합성효소 변이체들은 역학적 특성들을 위해 검정되었다. 표 18에서 나타난 바와 같이, 파네센 합성효소 변이체들의 증가된 생체내 활성은 분리된 파네센 합성효소 변이체들의 증가된 kcat에 반영되었다.
실시예
16
본 실시예는 파네센 합성효소 발현을 효모에서 FPP 독성-기초 성장 선별을 가능하게 하는 수준으로 조정하는 데 적합한 프로모터를 선택하도록 세스퀴테르펜 합성효소 경쟁의 사용을 기술하고 있다.
다양한 프로모터들이 표 19에 기술된 바와 같이 PCR 증폭되었다.
pAM2191에서 GAL1 프로모터를 대체하기 위하여, 발현 FastDigest® BamHI 제한효소를 사용하여 소화되었고, 100 ng의 본 선형화된 플라스미드가 300 ng의 각 프로모터들 PCR 산물들로 지수적으로 성장하는Y3198 세포들 내로 공동-형질전환되었다. 숙주세포 형질전환체들은 단독 탄소원으로서 2% 포도당을 가진 CSM-L에 도말되었고, 개별 콜로니들이 반경 ~1 mm가 될 때까지 3일 동안 30℃에서 배양되었다. 각 형질전환으로부터 8개의 콜로니들이 뽑혔고, 기술된 바와 같이 그들의 파네센 및 트리코디엔 역가들이 GC 분석에 의해 결정되기 이전에 기술된 바와 같이 성장되었다 (표 20). FS_Aa_Sc 코딩 서열에 연결된 GAL1 프로모터의 것과 유사한 파네센/트리코디엔 비율들을 주는 프로모터들이 선택되었고, 또한 기술된 바와 같이 Y227에서 FPP-독성 기초 성장 선별에 의해 검색되었다. 테스트된 프로모터들 중에서, PET9 유전자의 프로모터가 부모 주형으로서 FS_A_5.3 코딩 서열을 사용할 때 개선된 FS를 위한 FPP 독성-기초 선별에서 사용에 적합한 것으로 관찰되었다.
실시예
17
본 실시예는 세스퀴테르펜 합성효소 경쟁을 통해 확인된 파네센 합성효소의 유익한 돌연변이들을 관련된 세스퀴테르펜 합성효소 내로 자리잡는 방법들을 기술하고 있다.
실시예 13에서 확인된 FS의 다양한 아미노산 변화들이 포화 돌연변이화를 사용하여 FS 활성에서 개선을 위한 원인으로서 검증되었고, 여러 개의 이들 돌연변이들이 활성에서 유사한 개선이 달성될 수 있는지 여부를 결정하도록 관련 세스퀴테르펜 합성효소, 아르테미시아 애누아의 아모파디엔 합성효소 (ADS) 내에 자리잡았다. 자리잡힘을 위해 선택된 FS의 아미노산 위치들은 Met35, Tyr288, Thr319, Val369, Ile434, Thr446, I460 및 V467이었다. 복수의 서열 정렬들을 기초로 하여, ADS에서 정렬된 해당하는 아미노산들은 Ala13, Cys260, Ala291, Met341, Thr406, Thr418, Phe432 및 Gly439이다. 이들 위치들의 각각은 19개 다른 잔기들로의 치환에 의해 변이화되었고, 각 돌연변이체는 아모파디엔 : 트리코디엔 경쟁 검정법으로 테스트되었다.
ADS 돌연변이체들은 ADS 유전자에 있는 특정한 코돈에서 중복되는 두 개의 DNA 단편들을 증폭하도록 별도의 PCR 반응들을 사용하여 제작되었다. 각 올리고뉴클레오타이드 쌍은 둘 다의 측면 상에 표적 부위를 특이적으로 아닐링하는 뉴클레오타이들에 의해 끼여있는, 올리고뉴클레오타이드의 중간에 오류매칭된 중복 (degenerate) 뉴클레오타이드 서열과 함께 합성되었다 (예를 들면, NNK에서 K는 혼합된 G 및 T 염기들을 나타내고, N은 A, T, G 및 C 혼합된 염기들을 나타냄).
ADS-TDS 경쟁 벡터들을 제조하기 위하여, pAM1948 플라스미드는 IS_Pn_Sc 코딩 서열을 잘라내도록 BamHI 및 NheI로 소화되었고, ZymoClean 젤 정제 키트 (Zymo Research, Irvine CA)를 사용하여 젤 정제되었다. 각 포화 변이체를 포함하는 ADS 오픈 리딩 프레임 (orf)의 증폭은 Ala13 잔기의 돌연변이화를 위해 ADS-A13-F 및 ADS-SM-3'가 orf를 직접적으로 증폭하는 데 사용되는 점을 제외하고는, 표 22에 나열된 PCR 단편 또한 표 21에 나열된 적절한 ADS-SM-5' 및 ADS-SM-3' 올리고들의 동등한 몰량을 혼합하여 수행되었다. 증폭된 PCR 산물들은 선형화된 pAM1948에서 갭-복구되었고 Y3125에 형질전환되었다. 각 부위 포화 돌연변이체를 위해, 배수-개선이 ADS WT의 비율과 변이체의 ADS/TDS 비율을 대비하여 획득되었다.
도 17에 나타난 바와 같이, Ala291의 발린 (A291V; 서열번호 174), 시스테인 (A291C; 서열번호 175) 또는 이소루이신 (A291I; 서열번호 176)로의 치환은 ADS 부모 (WT)와 대비하여 30% 이상까지 ADS/TDS 비율의 개선을 유도하였다.
ADS A291V, A291C 및 A291I의 개선된 활성들을 검증하기 위하여, 아모파디엔 역가들이 각 돌연변이체를 위해 발현 플라스미드들로 형질전환된 세포들에서 결정되었다. A291V, A291C 및 A291I을 각각 포함하는 ADS-TDS 플라스미드는 BamHI 및 NheI로 사용하여 소화되었고, 젤 정제되었다. CEN.ARS 플라스미드 및 2μ Leu2 플라스미드가 동일한 제한효소를 사용하여 선형화되었고 젤 정제되었다. ADS 변이체들을 포함하는 소화된 단편들은 T4 DNA 리가제를 사용하여 선형화된 CEN.ARS 또는 2μ Leu2 플라스미드 내로 16℃에서 라이게이션되었다. 2 μL의 반응액은 Xl1-Blue 세포들 내로 형질전환되었고 LB 플레이트들 상에 도말되었다. 각 ADS 변이체를 CEN.ARS 플라스미드 또는 2μ Leu2 플라스미드 둘 중 하나에 포함하는 콜로니들은 서열이 확인되었다.
생산을 위해, 각 플라스미드는 치료된 Y227 내로 형질전환되었고 CSM-L 플레이트들 상에 도말되었다. 8개의 콜로니들이 각 변이체를 위해 뽑혔고, 4% 갈락토스를 가진 360 uL의 버드 종자 배지 (BSM)를 포함하는 96-웰 플레이트에서 성장되었다. 34℃에서 배양 2일 이후에, 각 웰의 16 uL이 4% 갈락토스를 가진 신선한 버드 종자 배지를 포함하는 새로운 96-웰 플레이트 내로 접종되었다. 30℃에서 배양 2일 이후에, 생산 시료들이 나일 레드 및 GC 분석을 위해 취해졌다.
도 18에서 나타난 바와 같이, ADS A291V, A291C 및 A291I 각각은 2μ 플라스미드 또는 CEN.ARS 플라스미드 둘 중 하나 상에서 발현될 때 부모 ADS와 대비하여 아모파디엔 생산에서 증가를 보여주었다. 최고의 돌연변이체, Ala291Val은 부모의 역가보다 58%까지 아모파디엔 역가에서 개선을 보여주었다.
이들 결과들은 테르펜 합성효소 경쟁 검정법을 사용하여 하나의 테르펜 합성효소에서 확인되는 유익한 돌연변이들이 개선된 합성효소 활성을 영향 주도록 관련 테르펜 합성효소 내에 성공적으로 자리잡을 수 있는 점을 보여주고 있다.
실시예
18
본 실시예는 효모에서 패추롤 합성효소 (PS)를 그들의 생체내 효소 활성 수준들에 따라 순위 매기도록 세스퀴테르펜 합성효소 경쟁을 사용하는 유용성을 기술하고 있다.
효모 균주들 Y9259, Y11136, Y9260가 발현 플라스미드들 pAM2596, pAM2702, 및 pAM2597를 효모 균주 Y9120 (MEV 경로를 포함함) 내로 각각 형질전환하여 만들어졌고, 정확한 플라스미드를 포함하도록 콜론 PCR에 의해 검증되었다. 각 플라스미드는 GAL1 프로모터 상에 서로 다른 PS 이소형 또한 분지된 GAL1 프로모터 상에 트리코디엔 합성효소 (TDS)의 일치하는 버전들을 포함하고 있다. 검증된 콜로니는 단일 콜로니들을 위해 재도말되었고, 8개의 콜로니들이 웰 당 2% 슈크로스를 가진 360 uL의 버드 종자 배지 (BSM)를 포함하는 96-웰 플레이트의 분리된 웰들에서 배양되었다 (전배양). 999 rpm 교반으로 30℃에서 배양 2일 이후에, 각 웰의 6.4 uL이 4% 갈락토스 및 3.33%의 미네랄 오일 을 가진 신선한 150 uL의 BSM및 Brij-56 에멀전을 포함하는 새로운 96-웰 플레이트의 웰 내로 접종되었다 (생산 배양). 또 다른 999 rpm 교반으로 30℃에서 배양 2일 이후에, 시료들이 취해졌고 기체 크로마토그래피 (GC) 분석에 의해 테르펜 생산에 대해 분석되었다.
GC 분석을 위해, 시료들이 메탄올-부톡시에탄올-헵탄 (100 μL: 50 μL: 400 μL v/v)으로 추출되었고, 세포 물질은 중력에 의해 가라앉도록 허용되었다. 헵탄 추출물의 분량이 헵탄 내로 좀 더 희석되었고, 다음으로 펄스 분리 주입을 사용하여 메틸 실리콘 정지상 위에 주입되었다. 패추리 알코올 및 트리코디엔은 점화 이온화 검출 (FID)로 GC를 사용하는 비등점에 의해 분리되었다. 헥사데칸은 특정된 GC 오븐 프로파일 동안 성공적인 주입 및 용출을 감시하도록 보유 시간 마커로서 사용되었다. 패추리 알코올 및 트리코디엔의 역가들이 패추리 오일/트리코디엔 비율들을 계산하는 데 사용되었다 (패추리 오일은 패추리 알코올의 역가의 대략 3배임).
도 24에서 나타난 바와 같이, 패추리 오일/트리코디엔 비율들은 시료들을 거쳐서 매우 일정하게 유지되었고, 단지 5.47%의 CVs를 생산하였다. 따라서, TDS와 동일한 플라스미드로부터 PS를 공동-발현하여, 테스트된 패추롤 합성효소들은 다음과 같이 (가장 큰 활성을 가진 것부터 가장 작은 활성을 가진 것까지) 순위가 매겨질 수 있었음): PS_이소형_3 코딩 서열 (Y9260) > PS_이소형_2 코딩 서열 (Y11136) > PS_이소형_1 코딩 서열 (Y9259).
실시예
19
본 실시예는 모노테르펜 합성효소들을 그들의 생체내 효소 활성에 따라 순위 매기도록 모노테르펜 합성효소 경쟁을 사용하는 유용성을 기술하고 있다.
모노테르펜 리모넨의 합성효소들의 생산성을 결정하기 위하여, 본 명세서에서 대조군 테르펜 합성효소로서 사용되고, pGal10 프로모터에 의해 추진되는 Ocimum basilicum의 마이어센 합성효소를 위한 코딩 서열, 또한 동일한 플라스미드 (pAM2645) 상에서 pGAL1에 의해 추진되는 의문 (query) 리모넨 합성효소 (LS)의 코딩 서열을 포함하는 경쟁 벡터가 제조되었다. 각각 서로 다른 LS 절단 변이체 또는 이소형을 인코딩하는 8개의 경쟁 플라스미드들은 각각 효모 균주 Y8270 (MEV 경로를 포함함) 내로 형질전환되었고, 형질전환된 균주들은 정확한 플라스미드를 포함하도록 콜론 PCR에 의해 검증되었다. 각 균주의 8개 단일 콜로니들이 탄소원으로서 2% 포도당을 포함하는 360 uL의 버드 종자 배지를 포함하는 96-웰 마이크로타이터 플레이트들에서 배양되었다 (전배양). 998 rpm으로 진탕하면서 30℃에서 성장 3일 이후에, 각 배양액의 6 uL의 각 배양액이 웰 당 4% 갈락토스를 포함하는 75 uL의 버드 종자 배지 및 75 uL의 이소프로필 미리스테이트를 포함하는 96-웰 플레이트의 웰 내로 접종되었다. 생산 플레이트들은 Velocity 11 열 밀봉기 (Agilent Technologies)로 밀봉되었고 -20℃에서 2시간 동안 냉동 이전에 998 rpm으로 진탕하면서 30°C에서 성장되었다. 다음으로 산물들은 0.001% 헥사데칸 내부 표준을 포함하는 300 uL의 에틸아세테이트를 신속하게 첨가하고, 열 밀봉하고, 상온에서 2시간 동안 진탕한 이후에 검정되었다. 기체 크로마토그램 점화 이온화 검출 (GC-FID)이 마이어센 및 리모넨의 절대 농도의 표준 곡선들을 사용하여 수행되었다. 자세하게는, 2 uL의 에틸아세테이트 추출물이 메틸 실리콘 정지상 컬럼 상에 분리 비율 1:50으로 주입되었다. 본 주입은 주입 정확도 및 보유 시간 조정을 위한 내부 표준으로서 헥사데칸을 사용하여 분석되었다. 오븐 온도들은 2.5분의 과정 동안 25℃ 내지 250℃ 범위이었고, 이 지점에서 오븐은 다음 시료를 위해 신속하게 식혀졌다. 마이어센 및 리모넨의 역가들은 경쟁 비율을 계산하는 데 사용되었다.
도 18에서 나타난 바와 같이, 테르펜 합성효소 경쟁 검정법은 서로 다른 리모넨 합성효소 절단 변이체들 및 이소형들의 상대적인 성적을 순위 매기는 데 사용될 수 있다.
본 발명의 다양한 변형들 및 변화들이 본 발명의 범위 및 정신을 벗어나지 않고도 당업자에게라면 자명할 것이다. 본 발명이 특정한 바람직한 구현예들과 연결하여 기술되었더라도, 청구항들은 이러한 특정한 구현예들에 부당하게 제한되지 않는 것으로 이해되어야 한다. 그리하여, 당업자에게라면 이해되는, 본 발명을 수행하는 기술된 방식들의 다양한 변형들이 청구항들의 범위 내에 속하는 것으로 의도된다.
SEQUENCE LISTING
<110> Zhao, Lishan
Xu, Lan
Westfall, Patrick
Main, Andrew
<120> Methods of Developing Terpene Synthase Variants
<130> 6291-21-PCT
<140> not yet assigned
<141> 2012-02-01
<150> 61/438,948
<151> 2011-02-02
<160> 176
<170> PatentIn version 3.5
<210> 1
<211> 11741
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM765
<400> 1
gaattccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 60
gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 120
ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 180
tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 240
aaatctcgat aactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagtt 300
ggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggccc agggcttccc 360
ggtatcaaca gggacaccag gatttattta ttctgcgaag tgatcttccg tcacaggtat 420
ttattcggcg caaagtgcgt cgggtgatgc tgccaactta ctgatttagt gtatgatggt 480
gtttttgagg tgctccagtg gcttctgttt ctatcagctg tccctcctgt tcagctactg 540
acggggtggt gcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatact 600
ggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa 660
aaggctgcac cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc 720
actgactcgc tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc 780
ggagatttcc tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa 840
agccgttttt ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc 900
agtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc 960
tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc 1020
gtttgtctca ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac 1080
tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt 1140
gagtccaacc cggaaagaca tgcaaaagca ccactggcag cagccactgg taattgattt 1200
agaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg 1260
tgactgcgct cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt 1320
cgaaaaaccg ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc 1380
aaaacgatct caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca 1440
atttatctct tcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctc 1500
atgtttgaca gcttatcatc gataagcttc cgatggcgcg ccgagaggct ttacacttta 1560
tgcttccggc tcgtataatg tgtggaattg tgagcggata acaattgaat tcaaaggagg 1620
ccatcctggc catgaagaac tgtgtgattg tttctgcggt ccgcacggcg atcggcagct 1680
ttaacggctc tttagcgagc acctctgcaa tcgatctggg tgcgacggtc attaaggccg 1740
ccattgaacg cgccaaaatc gacagccagc acgttgatga ggtgatcatg ggcaatgtgt 1800
tacaagccgg cctgggtcaa aacccagcgc gtcaagcact gttaaaatct ggtctggccg 1860
agaccgtgtg tggcttcacc gtcaataagg tttgcggctc tggcctgaag agcgtggccc 1920
tggcagcaca agcgattcaa gccggtcagg cacaaagcat cgttgcgggt ggcatggaga 1980
acatgtctct ggcgccgtac ttattagatg ccaaagcccg cagcggttat cgcctgggcg 2040
atggtcaggt gtacgacgtc atcttacgcg atggcttaat gtgcgcgacc cacggttacc 2100
acatgggtat tacggccgaa aacgtggcga aagaatacgg cattacgcgc gagatgcagg 2160
atgaattagc actgcactct cagcgcaaag cagcagccgc gatcgagtct ggtgcgttta 2220
cggcggaaat cgtgccagtt aacgtggtca cgcgcaagaa gacgttcgtt ttcagccagg 2280
acgagttccc gaaggcaaac agcaccgcgg aggccttagg tgccttacgc ccagcctttg 2340
acaaagcggg cacggtcacc gccggtaatg cgagcggcat caatgatggt gcagcggcac 2400
tggtcatcat ggaagagagc gccgcattag cagcgggtct gaccccatta gcgcgcatta 2460
aatcttatgc cagcggcggc gtcccaccag ccctgatggg catgggtccg gtcccagcca 2520
cgcaaaaagc cctgcaatta gcgggcctgc aactggccga cattgatctg atcgaggcga 2580
acgaggcgtt tgcagcgcag ttcctggcgg tgggtaagaa tctgggcttc gacagcgaga 2640
aagtcaatgt gaacggtggc gcgattgcgt taggccatcc gattggtgca agcggcgcac 2700
gcatcttagt gacgttactg cacgccatgc aggcacgcga caagacctta ggcctggcga 2760
ccttatgtat tggtggcggt caaggtatcg ccatggtgat cgaacgcctg aactgaagat 2820
ctaggaggaa agcaaaatga caataggtat cgacaaaata aacttttacg ttccaaagta 2880
ctatgtagac atggctaaat tagcagaagc acgccaagta gacccaaaca aatttttaat 2940
tggaattggt caaactgaaa tggctgttag tcctgtaaac caagacatcg tttcaatggg 3000
cgctaacgct gctaaggaca ttataacaga cgaagataaa aagaaaattg gtatggtaat 3060
tgtggcaact gaatcagcag ttgatgctgc taaagcagcc gctgttcaaa ttcacaactt 3120
attaggtatt caaccttttg cacgttgctt tgaaatgaaa gaagcttgtt atgctgcaac 3180
accagcaatt caattagcta aagattattt agcaactaga ccgaatgaaa aagtattagt 3240
tattgctaca gatacagcac gttatggatt gaattcaggc ggcgagccaa cacaaggtgc 3300
tggcgcagtt gcgatggtta ttgcacataa tccaagcatt ttggcattaa atgaagatgc 3360
tgttgcttac actgaagacg tttatgattt ctggcgtcca actggacata aatatccatt 3420
agttgatggt gcattatcta aagatgctta tatccgctca ttccaacaaa gctggaatga 3480
atacgcaaaa cgtcaaggta agtcgctagc tgacttcgca tctctatgct tccatgttcc 3540
atttacaaaa atgggtaaaa aggcattaga gtcaatcatt gataacgctg atgaaacaac 3600
tcaagagcgt ttacgttcag gatatgaaga tgctgtagat tataaccgtt atgtcggtaa 3660
tatttatact ggatcattat atttaagcct aatatcatta cttgaaaatc gtgatttaca 3720
agctggtgaa acaatcggtt tattcagtta tggctcaggt tcagttggtg aattttatag 3780
tgcgacatta gttgaaggct acaaagatca tttagatcaa gctgcacata aagcattatt 3840
aaataaccgt actgaagtat ctgttgatgc atatgaaaca ttcttcaaac gttttgatga 3900
cgttgaattt gacgaagaac aagatgctgt tcatgaagat cgtcatattt tctacttatc 3960
aaatattgaa aataacgttc gcgaatatca cagaccagag taactagtag gaggaaaaca 4020
tcatgcaaag tttagataag aatttccgac atttatctcg tcaacaaaag ttacaacaat 4080
tggtagataa gcaatggtta tcagaagatc aattcgacat tttattgaat catccattaa 4140
ttgatgagga agtagcaaat agtttaattg aaaatgtcat cgcgcaaggt gcattacccg 4200
ttggattatt accgaatatc attgtggacg ataaggcata tgttgtacct atgatggtgg 4260
aagagccttc agttgtcgct gcagctagtt atggtgcaaa gctagtgaat cagactggcg 4320
gatttaaaac ggtatcttct gaacgtatta tgataggtca aatcgtcttt gatggcgttg 4380
acgatactga aaaattatca gcagacatta aagctttaga aaagcaaatt cataaaattg 4440
cggatgaggc atatccttct attaaagcgc gtggtggtgg ttaccaacgt atagctattg 4500
atacatttcc tgagcaacag ttactatctt taaaagtatt tgttgatacg aaagatgcta 4560
tgggcgctaa tatgcttaat acgattttag aggccataac tgcattttta aaaaatgaat 4620
ctccacaaag cgacatttta atgagtattt tatccaatca tgcaacagcg tccgttgtta 4680
aagttcaagg cgaaattgac gttaaagatt tagcaagggg cgagagaact ggagaagagg 4740
ttgccaaacg aatggaacgt gcttctgtat tggcacaagt tgatattcat cgtgctgcaa 4800
cacataataa aggtgttatg aatggcatac atgccgttgt tttagcaaca ggaaatgata 4860
cgcgtggtgc agaagcaagt gcgcatgcat acgcgagtcg tgacggacag tatcgtggta 4920
ttgcaacatg gagatacgat caaaaacgtc aacgtttaat tggtacaata gaagtgccta 4980
tgacattggc aatcgttggc ggtggtacaa aagtattacc aattgctaaa gcttctttag 5040
aattgctaaa tgtagattca gcacaagaat taggtcatgt agttgctgcc gttggtttag 5100
cacagaactt tgcagcatgt cgcgcgctcg tttccgaagg tatccagcaa ggccatatga 5160
gcttgcaata taaatcttta gctattgttg taggtgcaaa aggtgatgaa attgcgcaag 5220
tagctgaagc attgaagcaa gaaccccgtg cgaatacaca agtagctgaa cgcattttac 5280
aagaaattag acaacaatag tctagaagca gcttcgatcc catggtacgc gtgctagagg 5340
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 5400
tcggtgaacg ctctcctgag taggacaaat ccgccggcga tcgccgagag gctttacact 5460
ttatgcttcc ggctcgtata atgtgtggaa ttgtgagcgg ataacaattg aattcaaagg 5520
aggctcgaga tgacgcgcaa aggctacggt gaatctactg gtaagattat cctgattggc 5580
gagcatgctg taacctttgg cgaacctgcc atcgcagtac cgttcaacgc gggcaaaatc 5640
aaggttctga tcgaagccct ggagtccggc aactattcta gcatcaaatc tgacgtatac 5700
gacggtatgc tgtacgacgc gccggaccac ctgaagagcc tggtgaaccg ttttgttgaa 5760
ctgaacaaca tcactgaacc gctggcggta accattcaga ccaacctgcc gccatctcgc 5820
ggcctgggta gctctgctgc ggttgctgta gcgttcgtac gcgcgtctta tgatttcctg 5880
ggtaagtctc tgaccaaaga agaactgatt gagaaagcga actgggcaga acagattgca 5940
cacggcaaac caagcggcat cgacacccaa actattgtgt ctggcaaacc agtttggttc 6000
caaaaaggcc aggcggagac cctgaaaacc ctgagcctgg acggttacat ggttgtaatt 6060
gacactggtg taaaaggcag cacccgccag gcagtagagg atgtgcacaa actgtgcgaa 6120
gaccctcagt atatgagcca cgtgaagcac atcggtaaac tggtactgcg cgcttctgac 6180
gtgattgaac accacaactt cgaagcactg gcggatatct tcaacgaatg ccatgcggat 6240
ctgaaagcac tgactgtgag ccatgacaaa attgagcagc tgatgaaaat cggcaaagaa 6300
aacggtgcga tcgctggcaa actgactggt gcaggtcgcg gtggctctat gctgctgctg 6360
gctaaagacc tgccgactgc taaaaacatt gttaaggcag tagaaaaggc aggtgctgca 6420
cacacttgga ttgaaaacct gggtggttag gaggcagatc aaatgtcaga gttgagagcc 6480
ttcagtgccc cagggaaagc gttactagct ggtggatatt tagttttaga tacaaaatat 6540
gaagcatttg tagtcggatt atcggcaaga atgcatgctg tagcccatcc ttacggttca 6600
ttgcaagggt ctgataagtt tgaagtgcgt gtgaaaagta aacaatttaa agatggggag 6660
tggctgtacc atataagtcc taaaagtggc ttcattcctg tttcgatagg cggatctaag 6720
aaccctttca ttgaaaaagt tatcgctaac gtatttagct actttaaacc taacatggac 6780
gactactgca atagaaactt gttcgttatt gatattttct ctgatgatgc ctaccattct 6840
caggaggata gcgttaccga acatcgtggc aacagaagat tgagttttca ttcgcacaga 6900
attgaagaag ttcccaaaac agggctgggc tcctcggcag gtttagtcac agttttaact 6960
acagctttgg cctccttttt tgtatcggac ctggaaaata atgtagacaa atatagagaa 7020
gttattcata atttagcaca agttgctcat tgtcaagctc agggtaaaat tggaagcggg 7080
tttgatgtag cggcggcagc atatggatct atcagatata gaagattccc acccgcatta 7140
atctctaatt tgccagatat tggaagtgct acttacggca gtaaactggc gcatttggtt 7200
gatgaagaag actggaatat tacgattaaa agtaaccatt taccttcggg attaacttta 7260
tggatgggcg atattaagaa tggttcagaa acagtaaaac tggtccagaa ggtaaaaaat 7320
tggtatgatt cgcatatgcc agaaagcttg aaaatatata cagaactcga tcatgcaaat 7380
tctagattta tggatggact atctaaacta gatcgcttac acgagactca tgacgattac 7440
agcgatcaga tatttgagtc tcttgagagg aatgactgta cctgtcaaaa gtatcctgaa 7500
atcacagaag ttagagatgc agttgccaca attagacgtt cctttagaaa aataactaaa 7560
gaatctggtg ccgatatcga acctcccgta caaactagct tattggatga ttgccagacc 7620
ttaaaaggag ttcttacttg cttaatacct ggtgctggtg gttatgacgc cattgcagtg 7680
attactaagc aagatgttga tcttagggct caaaccgcta atgacaaaag attttctaag 7740
gttcaatggc tggatgtaac tcaggctgac tggggtgtta ggaaagaaaa agatccggaa 7800
acttatcttg ataaatagga ggtaatactc atgaccgttt acacagcatc cgttaccgca 7860
cccgtcaaca tcgcaaccct taagtattgg gggaaaaggg acacgaagtt gaatctgccc 7920
accaattcgt ccatatcagt gactttatcg caagatgacc tcagaacgtt gacctctgcg 7980
gctactgcac ctgagtttga acgcgacact ttgtggttaa atggagaacc acacagcatc 8040
gacaatgaaa gaactcaaaa ttgtctgcgc gacctacgcc aattaagaaa ggaaatggaa 8100
tcgaaggacg cctcattgcc cacattatct caatggaaac tccacattgt ctccgaaaat 8160
aactttccta cagcagctgg tttagcttcc tccgctgctg gctttgctgc attggtctct 8220
gcaattgcta agttatacca attaccacag tcaacttcag aaatatctag aatagcaaga 8280
aaggggtctg gttcagcttg tagatcgttg tttggcggat acgtggcctg ggaaatggga 8340
aaagctgaag atggtcatga ttccatggca gtacaaatcg cagacagctc tgactggcct 8400
cagatgaaag cttgtgtcct agttgtcagc gatattaaaa aggatgtgag ttccactcag 8460
ggtatgcaat tgaccgtggc aacctccgaa ctatttaaag aaagaattga acatgtcgta 8520
ccaaagagat ttgaagtcat gcgtaaagcc attgttgaaa aagatttcgc cacctttgca 8580
aaggaaacaa tgatggattc caactctttc catgccacat gtttggactc tttccctcca 8640
atattctaca tgaatgacac ttccaagcgt atcatcagtt ggtgccacac cattaatcag 8700
ttttacggag aaacaatcgt tgcatacacg tttgatgcag gtccaaatgc tgtgttgtac 8760
tacttagctg aaaatgagtc gaaactcttt gcatttatct ataaattgtt tggctctgtt 8820
cctggatggg acaagaaatt tactactgag cagcttgagg ctttcaacca tcaatttgaa 8880
tcatctaact ttactgcacg tgaattggat cttgagttgc aaaaggatgt tgccagagtg 8940
attttaactc aagtcggttc aggcccacaa gaaacaaacg aatctttgat tgacgcaaag 9000
actggtctac caaaggaata actgcagccc gggaggagga ttactatatg caaacggaac 9060
acgtcatttt attgaatgca cagggagttc ccacgggtac gctggaaaag tatgccgcac 9120
acacggcaga cacccgctta catctcgcgt tctccagttg gctgtttaat gccaaaggac 9180
aattattagt tacccgccgc gcactgagca aaaaagcatg gcctggcgtg tggactaact 9240
cggtttgtgg gcacccacaa ctgggagaaa gcaacgaaga cgcagtgatc cgccgttgcc 9300
gttatgagct tggcgtggaa attacgcctc ctgaatctat ctatcctgac tttcgctacc 9360
gcgccaccga tccgagtggc attgtggaaa atgaagtgtg tccggtattt gccgcacgca 9420
ccactagtgc gttacagatc aatgatgatg aagtgatgga ttatcaatgg tgtgatttag 9480
cagatgtatt acacggtatt gatgccacgc cgtgggcgtt cagtccgtgg atggtgatgc 9540
aggcgacaaa tcgcgaagcc agaaaacgat tatctgcatt tacccagctt aaataacccg 9600
ggggatccac tagttctaga gcggccgcca ccgcggagga ggaatgagta atggactttc 9660
cgcagcaact cgaagcctgc gttaagcagg ccaaccaggc gctgagccgt tttatcgccc 9720
cactgccctt tcagaacact cccgtggtcg aaaccatgca gtatggcgca ttattaggtg 9780
gtaagcgcct gcgacctttc ctggtttatg ccaccggtca tatgttcggc gttagcacaa 9840
acacgctgga cgcacccgct gccgccgttg agtgtatcca cgcttactca ttaattcatg 9900
atgatttacc ggcaatggat gatgacgatc tgcgtcgcgg tttgccaacc tgccatgtga 9960
agtttggcga agcaaacgcg attctcgctg gcgacgcttt acaaacgctg gcgttctcga 10020
ttttaagcga tgccgatatg ccggaagtgt cggaccgcga cagaatttcg atgatttctg 10080
aactggcgag cgccagtggt attgccggaa tgtgcggtgg tcaggcatta gatttagacg 10140
cggaaggcaa acacgtacct ctggacgcgc ttgagcgtat tcatcgtcat aaaaccggcg 10200
cattgattcg cgccgccgtt cgccttggtg cattaagcgc cggagataaa ggacgtcgtg 10260
ctctgccggt actcgacaag tatgcagaga gcatcggcct tgccttccag gttcaggatg 10320
acatcctgga tgtggtggga gatactgcaa cgttgggaaa acgccagggt gccgaccagc 10380
aacttggtaa aagtacctac cctgcacttc tgggtcttga gcaagcccgg aagaaagccc 10440
gggatctgat cgacgatgcc cgtcagtcgc tgaaacaact ggctgaacag tcactcgata 10500
cctcggcact ggaagcgcta gcggactaca tcatccagcg taataaataa gagctccaat 10560
tcgccctata gtgagacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag 10620
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt taattaactc 10680
caggccggcc tacgcgttta aacttccggt taacgccatg agcggcctca tttcttattc 10740
tgagttacaa cagtccgcac cgctgccggt agctccttcc ggtgggcgcg gggcatgact 10800
atcgtcgccg cacttatgac tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca 10860
gcgcccaaca gtcccccggc cacggggcct gccaccatac ccacgccgaa acaagcgccc 10920
tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 10980
acatctgtat taacgaagcg ctaaccgttt ttatcaggct ctgggaggca gaataaatga 11040
tcatatcgtc aattattacc tccacgggga gagcctgagc aaactggcct caggcatttg 11100
agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag caatagacat 11160
aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg ctttcgaatt 11220
tctgccattc atccgcttat tatcacttat tcaggcgtag caccaggcgt ttaagggcac 11280
caataactgc cttaaaaaaa ttacgccccg ccctgccact catcgcagta ctgttgtaat 11340
tcattaagca ttctgccgac atggaagcca tcacagacgg catgatgaac ctgaatcgcc 11400
agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatggtgaa aacgggggcg 11460
aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac ccagggattg 11520
gctgagacga aaaacatatt ctcaataaac cctttaggga aataggccag gttttcaccg 11580
taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc gtggtattca 11640
ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca agggtgaaca 11700
ctatcccata tcaccagctc accgtctttc attgccatac g 11741
<210> 2
<211> 5050
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, TRP1_PGAL10-ERG20_PGAL1-tHMGR_TRP insert of expression
plasmid pAM489
<400> 2
gtttaaacta ctattagctg aattgccact gctatcgttg ttagtggcgt tagtgcttgc 60
attcaaagac atggagggcg ttattacgcc ggagctcctc gacagcagat ctgatgactg 120
gtcaatatat ttttgcattg aggctctgtt tggaattata ttttgagatg acccatctaa 180
tgtactggta tcaccagatt tcatgtcgtt ttttaaagcg gctgcttgag tcttagcaat 240
agcgtcacca tctggtgaat cctttgaagg aaccactgac gaaggtttgg acagtgacga 300
agaggatctt tcctgctttg aattagtcgc gctgggagca gatgacgagt tggtggagct 360
gggggcagga ttgctggccg tcgtgggtcc tgaatgggtc cttggctggt ccatctctat 420
tctgaaaacg gaagaggagt agggaatatt actggctgaa aataagtctt gaatgaacgt 480
atacgcgtat atttctacca atctctcaac actgagtaat ggtagttata agaaagagac 540
cgagttaggg acagttagag gcggtggaga tattccttat ggcatgtctg gcgatgataa 600
aacttttcaa acggcagccc cgatctaaaa gagctgacac ccgggagtta tgacaattac 660
aacaacagaa ttctttctat atatgcacga acttgtaata tggaagaaat tatgacgtac 720
aaactataaa gtaaatattt tacgtaacac atggtgctgt tgtgcttctt tttcaagaga 780
ataccaatga cgtatgacta agtttaggat ttaatgcagg tgacggaccc atctttcaaa 840
cgatttatat cagtggcgtc caaattgtta ggttttgttg gttcagcagg tttcctgttg 900
tgggtcatat gactttgaac caaatggccg gctgctaggg cagcacataa ggataattca 960
cctgccaaga cggcacaggc aactattctt gctaattgac gtgcgttggt accaggagcg 1020
gtagcatgtg ggcctcttac acctaataag tccaacatgg caccttgtgg ttctagaaca 1080
gtaccaccac cgatggtacc tacttcgatg gatggcatgg atacggaaat tctcaaatca 1140
ccgtccactt ctttcatcaa tgttatacag ttggaacttt cgacattttg tgcaggatct 1200
tgtcctaatg ccaagaaaac agctgtcact aaattagctg catgtgcgtt aaatccacca 1260
acagacccag ccattgcaga tccaaccaaa ttcttagcaa tgttcaactc aaccaatgcg 1320
gaaacatcac tttttaacac ttttctgaca acatcaccag gaatagtagc ttctgcgacg 1380
acactcttac cacgaccttc gatccagttg atggcagctg gttttttgtc ggtacagtag 1440
ttaccagaaa cggagacaac ctccatatct tcccagccat actcttctac catttgcttt 1500
aatgagtatt cgacaccctt agaaatcata ttcataccca ttgcgtcacc agtagttgtt 1560
ctaaatctca tgaagagtaa atctcctgct agacaagttt gaatatgttg cagacgtgca 1620
aatcttgatg tagagttaaa agctttttta attgcgtttt gtccctcttc tgagtctaac 1680
catatcttac aggcaccaga tcttttcaaa gttgggaaac ggactactgg gcctcttgtc 1740
ataccatcct tagttaaaac agttgttgca ccaccgccag cattgattgc cttacagcca 1800
cgcatggcag aagctaccaa acaaccctct gtagttgcca ttggtatatg ataagatgta 1860
ccatcgataa ccaaggggcc tataacacca acgggcaaag gcatgtaacc tataacattt 1920
tcacaacaag cgccaaatac gcggtcgtag tcataatttt tatatggtaa acgatcagat 1980
gctaatacag gagcttctgc caaaattgaa agagccttcc tacgtaccgc aaccgctctc 2040
gtagtatcac ctaatttttt ctccaaagcg tacaaaggta acttaccgtg aataaccaag 2100
gcagcgacct ctttgttctt caattgtttt gtatttccac tacttaataa tgcttctaat 2160
tcttctaaag gacgtatttt cttatccaag ctttcaatat cgcgggaatc atcttcctca 2220
ctagatgatg aaggtcctga tgagctcgat tgcgcagatg ataaactttt gactttcgat 2280
ccagaaatga ctgttttatt ggttaaaact ggtgtagaag ccttttgtac aggagcagta 2340
aaagacttct tggtgacttc agtcttcacc aattggtctg cagccattat agttttttct 2400
ccttgacgtt aaagtataga ggtatattaa caattttttg ttgatacttt tatgacattt 2460
gaataagaag taatacaaac cgaaaatgtt gaaagtatta gttaaagtgg ttatgcagct 2520
tttgcattta tatatctgtt aatagatcaa aaatcatcgc ttcgctgatt aattacccca 2580
gaaataaggc taaaaaacta atcgcattat tatcctatgg ttgttaattt gattcgttga 2640
tttgaaggtt tgtggggcca ggttactgcc aatttttcct cttcataacc ataaaagcta 2700
gtattgtaga atctttattg ttcggagcag tgcggcgcga ggcacatctg cgtttcagga 2760
acgcgaccgg tgaagaccag gacgcacgga ggagagtctt ccgtcggagg gctgtcgccc 2820
gctcggcggc ttctaatccg tacttcaata tagcaatgag cagttaagcg tattactgaa 2880
agttccaaag agaaggtttt tttaggctaa gataatgggg ctctttacat ttccacaaca 2940
tataagtaag attagatatg gatatgtata tggtggtatt gccatgtaat atgattatta 3000
aacttctttg cgtccatcca aaaaaaaagt aagaattttt gaaaattcaa tataaatggc 3060
ttcagaaaaa gaaattagga gagagagatt cttgaacgtt ttccctaaat tagtagagga 3120
attgaacgca tcgcttttgg cttacggtat gcctaaggaa gcatgtgact ggtatgccca 3180
ctcattgaac tacaacactc caggcggtaa gctaaataga ggtttgtccg ttgtggacac 3240
gtatgctatt ctctccaaca agaccgttga acaattgggg caagaagaat acgaaaaggt 3300
tgccattcta ggttggtgca ttgagttgtt gcaggcttac ttcttggtcg ccgatgatat 3360
gatggacaag tccattacca gaagaggcca accatgttgg tacaaggttc ctgaagttgg 3420
ggaaattgcc atcaatgacg cattcatgtt agaggctgct atctacaagc ttttgaaatc 3480
tcacttcaga aacgaaaaat actacataga tatcaccgaa ttgttccatg aggtcacctt 3540
ccaaaccgaa ttgggccaat tgatggactt aatcactgca cctgaagaca aagtcgactt 3600
gagtaagttc tccctaaaga agcactcctt catagttact ttcaagactg cttactattc 3660
tttctacttg cctgtcgcat tggccatgta cgttgccggt atcacggatg aaaaggattt 3720
gaaacaagcc agagatgtct tgattccatt gggtgaatac ttccaaattc aagatgacta 3780
cttagactgc ttcggtaccc cagaacagat cggtaagatc ggtacagata tccaagataa 3840
caaatgttct tgggtaatca acaaggcatt ggaacttgct tccgcagaac aaagaaagac 3900
tttagacgaa aattacggta agaaggactc agtcgcagaa gccaaatgca aaaagatttt 3960
caatgacttg aaaattgaac agctatacca cgaatatgaa gagtctattg ccaaggattt 4020
gaaggccaaa atttctcagg tcgatgagtc tcgtggcttc aaagctgatg tcttaactgc 4080
gttcttgaac aaagtttaca agagaagcaa atagaactaa cgctaatcga taaaacatta 4140
gatttcaaac tagataagga ccatgtataa gaactatata cttccaatat aatatagtat 4200
aagctttaag atagtatctc tcgatctacc gttccacgtg actagtccaa ggattttttt 4260
taacccggga tatatgtgta ctttgcagtt atgacgccag atggcagtag tggaagatat 4320
tctttattga aaaatagctt gtcaccttac gtacaatctt gatccggagc ttttcttttt 4380
ttgccgatta agaattcggt cgaaaaaaga aaaggagagg gccaagaggg agggcattgg 4440
tgactattga gcacgtgagt atacgtgatt aagcacacaa aggcagcttg gagtatgtct 4500
gttattaatt tcacaggtag ttctggtcca ttggtgaaag tttgcggctt gcagagcaca 4560
gaggccgcag aatgtgctct agattccgat gctgacttgc tgggtattat atgtgtgccc 4620
aatagaaaga gaacaattga cccggttatt gcaaggaaaa tttcaagtct tgtaaaagca 4680
tataaaaata gttcaggcac tccgaaatac ttggttggcg tgtttcgtaa tcaacctaag 4740
gaggatgttt tggctctggt caatgattac ggcattgata tcgtccaact gcatggagat 4800
gagtcgtggc aagaatacca agagttcctc ggtttgccag ttattaaaag actcgtattt 4860
ccaaaagact gcaacatact actcagtgca gcttcacaga aacctcattc gtttattccc 4920
ttgtttgatt cagaagcagg tgggacaggt gaacttttgg attggaactc gatttctgac 4980
tgggttggaa ggcaagagag ccccgaaagc ttacatttta tgttagctgg tggactgacg 5040
ccgtttaaac 5050
<210> 3
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK001-G
<400> 3
gtttaaacta ctattagctg aattgccact 30
<210> 4
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK002-G
<400> 4
actgcaaagt acacatatat cccgggtgtc agctctttta gatcgg 46
<210> 5
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK003-G
<400> 5
ccgatctaaa agagctgaca cccgggatat atgtgtactt tgcagt 46
<210> 6
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK004-G
<400> 6
gtttaaacgg cgtcagtcca ccagctaaca 30
<210> 7
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK025-G
<400> 7
tccccccggg ttaaaaaaaa tccttggact agtca 35
<210> 8
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK050-G
<400> 8
aatttttgaa aattcaatat aaatggcttc agaaaaagaa attagga 47
<210> 9
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK051-G
<400> 9
tcctaatttc tttttctgaa gccatttata ttgaattttc aaaaatt 47
<210> 10
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK052-G
<400> 10
agttttcacc aattggtctg cagccattat agttttttct ccttgacgtt a 51
<210> 11
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK053-G
<400> 11
taacgtcaag gagaaaaaac tataatggct gcagaccaat tggtgaaaac t 51
<210> 12
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK031-G
<400> 12
tccccccggg agttatgaca attacaacaa cagaa 35
<210> 13
<211> 5488
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, URA3_PGAL10-ERG13_PGAL1-tHMGR_URA3 insert of
expression plasmid pAM491
<400> 13
gtttaaactt gctaaattcg agtgaaacac aggaagacca gaaaatcctc atttcatcca 60
tattaacaat aatttcaaat gtttatttgc attatttgaa actagggaag acaagcaacg 120
aaacgttttt gaaaattttg agtattttca ataaatttgt agaggactca gatattgaaa 180
aaaagctaca gcaattaata cttgataaga agagtattga gaagggcaac ggttcatcat 240
ctcatggatc tgcacatgaa caaacaccag agtcaaacga cgttgaaatt gaggctactg 300
cgccaattga tgacaataca gacgatgata acaaaccgaa gttatctgat gtagaaaagg 360
attaaagatg ctaagagata gtgatgatat ttcataaata atgtaattct atatatgtta 420
attacctttt ttgcgaggca tatttatggt gaaggataag ttttgaccat caaagaaggt 480
taatgtggct gtggtttcag ggtccatacc cgggagttat gacaattaca acaacagaat 540
tctttctata tatgcacgaa cttgtaatat ggaagaaatt atgacgtaca aactataaag 600
taaatatttt acgtaacaca tggtgctgtt gtgcttcttt ttcaagagaa taccaatgac 660
gtatgactaa gtttaggatt taatgcaggt gacggaccca tctttcaaac gatttatatc 720
agtggcgtcc aaattgttag gttttgttgg ttcagcaggt ttcctgttgt gggtcatatg 780
actttgaacc aaatggccgg ctgctagggc agcacataag gataattcac ctgccaagac 840
ggcacaggca actattcttg ctaattgacg tgcgttggta ccaggagcgg tagcatgtgg 900
gcctcttaca cctaataagt ccaacatggc accttgtggt tctagaacag taccaccacc 960
gatggtacct acttcgatgg atggcatgga tacggaaatt ctcaaatcac cgtccacttc 1020
tttcatcaat gttatacagt tggaactttc gacattttgt gcaggatctt gtcctaatgc 1080
caagaaaaca gctgtcacta aattagctgc atgtgcgtta aatccaccaa cagacccagc 1140
cattgcagat ccaaccaaat tcttagcaat gttcaactca accaatgcgg aaacatcact 1200
ttttaacact tttctgacaa catcaccagg aatagtagct tctgcgacga cactcttacc 1260
acgaccttcg atccagttga tggcagctgg ttttttgtcg gtacagtagt taccagaaac 1320
ggagacaacc tccatatctt cccagccata ctcttctacc atttgcttta atgagtattc 1380
gacaccctta gaaatcatat tcatacccat tgcgtcacca gtagttgttc taaatctcat 1440
gaagagtaaa tctcctgcta gacaagtttg aatatgttgc agacgtgcaa atcttgatgt 1500
agagttaaaa gcttttttaa ttgcgttttg tccctcttct gagtctaacc atatcttaca 1560
ggcaccagat cttttcaaag ttgggaaacg gactactggg cctcttgtca taccatcctt 1620
agttaaaaca gttgttgcac caccgccagc attgattgcc ttacagccac gcatggcaga 1680
agctaccaaa caaccctctg tagttgccat tggtatatga taagatgtac catcgataac 1740
caaggggcct ataacaccaa cgggcaaagg catgtaacct ataacatttt cacaacaagc 1800
gccaaatacg cggtcgtagt cataattttt atatggtaaa cgatcagatg ctaatacagg 1860
agcttctgcc aaaattgaaa gagccttcct acgtaccgca accgctctcg tagtatcacc 1920
taattttttc tccaaagcgt acaaaggtaa cttaccgtga ataaccaagg cagcgacctc 1980
tttgttcttc aattgttttg tatttccact acttaataat gcttctaatt cttctaaagg 2040
acgtattttc ttatccaagc tttcaatatc gcgggaatca tcttcctcac tagatgatga 2100
aggtcctgat gagctcgatt gcgcagatga taaacttttg actttcgatc cagaaatgac 2160
tgttttattg gttaaaactg gtgtagaagc cttttgtaca ggagcagtaa aagacttctt 2220
ggtgacttca gtcttcacca attggtctgc agccattata gttttttctc cttgacgtta 2280
aagtatagag gtatattaac aattttttgt tgatactttt atgacatttg aataagaagt 2340
aatacaaacc gaaaatgttg aaagtattag ttaaagtggt tatgcagctt ttgcatttat 2400
atatctgtta atagatcaaa aatcatcgct tcgctgatta attaccccag aaataaggct 2460
aaaaaactaa tcgcattatt atcctatggt tgttaatttg attcgttgat ttgaaggttt 2520
gtggggccag gttactgcca atttttcctc ttcataacca taaaagctag tattgtagaa 2580
tctttattgt tcggagcagt gcggcgcgag gcacatctgc gtttcaggaa cgcgaccggt 2640
gaagaccagg acgcacggag gagagtcttc cgtcggaggg ctgtcgcccg ctcggcggct 2700
tctaatccgt acttcaatat agcaatgagc agttaagcgt attactgaaa gttccaaaga 2760
gaaggttttt ttaggctaag ataatggggc tctttacatt tccacaacat ataagtaaga 2820
ttagatatgg atatgtatat ggtggtattg ccatgtaata tgattattaa acttctttgc 2880
gtccatccaa aaaaaaagta agaatttttg aaaattcaat ataaatgaaa ctctcaacta 2940
aactttgttg gtgtggtatt aaaggaagac ttaggccgca aaagcaacaa caattacaca 3000
atacaaactt gcaaatgact gaactaaaaa aacaaaagac cgctgaacaa aaaaccagac 3060
ctcaaaatgt cggtattaaa ggtatccaaa tttacatccc aactcaatgt gtcaaccaat 3120
ctgagctaga gaaatttgat ggcgtttctc aaggtaaata cacaattggt ctgggccaaa 3180
ccaacatgtc ttttgtcaat gacagagaag atatctactc gatgtcccta actgttttgt 3240
ctaagttgat caagagttac aacatcgaca ccaacaaaat tggtagatta gaagtcggta 3300
ctgaaactct gattgacaag tccaagtctg tcaagtctgt cttgatgcaa ttgtttggtg 3360
aaaacactga cgtcgaaggt attgacacgc ttaatgcctg ttacggtggt accaacgcgt 3420
tgttcaactc tttgaactgg attgaatcta acgcatggga tggtagagac gccattgtag 3480
tttgcggtga tattgccatc tacgataagg gtgccgcaag accaaccggt ggtgccggta 3540
ctgttgctat gtggatcggt cctgatgctc caattgtatt tgactctgta agagcttctt 3600
acatggaaca cgcctacgat ttttacaagc cagatttcac cagcgaatat ccttacgtcg 3660
atggtcattt ttcattaact tgttacgtca aggctcttga tcaagtttac aagagttatt 3720
ccaagaaggc tatttctaaa gggttggtta gcgatcccgc tggttcggat gctttgaacg 3780
ttttgaaata tttcgactac aacgttttcc atgttccaac ctgtaaattg gtcacaaaat 3840
catacggtag attactatat aacgatttca gagccaatcc tcaattgttc ccagaagttg 3900
acgccgaatt agctactcgc gattatgacg aatctttaac cgataagaac attgaaaaaa 3960
cttttgttaa tgttgctaag ccattccaca aagagagagt tgcccaatct ttgattgttc 4020
caacaaacac aggtaacatg tacaccgcat ctgtttatgc cgcctttgca tctctattaa 4080
actatgttgg atctgacgac ttacaaggca agcgtgttgg tttattttct tacggttccg 4140
gtttagctgc atctctatat tcttgcaaaa ttgttggtga cgtccaacat attatcaagg 4200
aattagatat tactaacaaa ttagccaaga gaatcaccga aactccaaag gattacgaag 4260
ctgccatcga attgagagaa aatgcccatt tgaagaagaa cttcaaacct caaggttcca 4320
ttgagcattt gcaaagtggt gtttactact tgaccaacat cgatgacaaa tttagaagat 4380
cttacgatgt taaaaaataa tcttccccca tcgattgcat cttgctgaac ccccttcata 4440
aatgctttat ttttttggca gcctgctttt tttagctctc atttaataga gtagtttttt 4500
aatctatata ctaggaaaac tctttattta ataacaatga tatatatata cccgggaagc 4560
ttttcaattc atcttttttt tttttgttct tttttttgat tccggtttct ttgaaatttt 4620
tttgattcgg taatctccga gcagaaggaa gaacgaagga aggagcacag acttagattg 4680
gtatatatac gcatatgtgg tgttgaagaa acatgaaatt gcccagtatt cttaacccaa 4740
ctgcacagaa caaaaacctg caggaaacga agataaatca tgtcgaaagc tacatataag 4800
gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc tatttaatat catgcacgaa 4860
aagcaaacaa acttgtgtgc ttcattggat gttcgtacca ccaaggaatt actggagtta 4920
gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat cttgactgat 4980
ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta caatttttta 5040
ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca gtactctgcg 5100
ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt ggtgggccca 5160
ggtattgtta gcggtttgaa gcaggcggcg gaagaagtaa caaaggaacc tagaggcctt 5220
ttgatgttag cagaattgtc atgcaagggc tccctagcta ctggagaata tactaagggt 5280
actgttgaca ttgcgaagag cgacaaagat tttgttatcg gctttattgc tcaaagagac 5340
atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt gggtttagat 5400
gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt ctctacagga 5460
tctgacatta ttattgttgg gtttaaac 5488
<210> 14
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK005-G
<400> 14
gtttaaactt gctaaattcg agtgaaacac 30
<210> 15
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK006-G
<400> 15
aaagatgaat tgaaaagctt cccgggtatg gaccctgaaa ccacag 46
<210> 16
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK007-G
<400> 16
ctgtggtttc agggtccata cccgggaagc ttttcaattc atcttt 46
<210> 17
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK008-G
<400> 17
gtttaaaccc aacaataata atgtcagatc 30
<210> 18
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK032-G
<400> 18
tccccccggg tatatatata tcattgttat 30
<210> 19
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK054-G
<400> 19
aatttttgaa aattcaatat aaatgaaact ctcaactaaa ctttgtt 47
<210> 20
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK052-G
<400> 20
agttttcacc aattggtctg cagccattat agttttttct ccttgacgtt a 51
<210> 21
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK055-G
<400> 21
aacaaagttt agttgagagt ttcatttata ttgaattttc aaaaatt 47
<210> 22
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK031-G
<400> 22
tccccccggg agttatgaca attacaacaa cagaa 35
<210> 23
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK053-G
<400> 23
taacgtcaag gagaaaaaac tataatggct gcagaccaat tggtgaaaac t 51
<210> 24
<211> 4933
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, ADE1_PGAL10-IDI1_PGAL1-tHMGR_ADE1 insert of expression
plasmid pAM493
<400> 24
gtttaaacta ctcagtatat taagtttcga attgaagggc gaactcttat tcgaagtcgg 60
agtcaccaca acacttccgc ccatactctc cgaatcctcg tttcctaaag taagtttact 120
tccacttgta ggcctattat taatgatatc tgaataatcc tctattaggg ttggatcatt 180
cagtagcgcg tgcgattgaa aggagtccat gcccgacgtc gacgtgatta gcgaaggcgc 240
gtaaccattg tcatgtctag cagctataga actaacctcc ttgacaccac ttgcggaagt 300
ctcatcaaca tgctcttcct tattactcat tctcttacca agcagagaat gttatctaaa 360
aactacgtgt atttcacctc tttctcgact tgaacacgtc caactcctta agtactacca 420
cagccaggaa agaatggatc cagttctaca cgatagcaaa gcagaaaaca caaccagcgt 480
acccctgtag aagcttcttt gtttacagca cttgatccat gtagccatac tcgaaatttc 540
aactcatctg aaacttttcc tgaaggttga aaaagaatgc cataagggtc acccgaagct 600
tattcacgcc cgggagttat gacaattaca acaacagaat tctttctata tatgcacgaa 660
cttgtaatat ggaagaaatt atgacgtaca aactataaag taaatatttt acgtaacaca 720
tggtgctgtt gtgcttcttt ttcaagagaa taccaatgac gtatgactaa gtttaggatt 780
taatgcaggt gacggaccca tctttcaaac gatttatatc agtggcgtcc aaattgttag 840
gttttgttgg ttcagcaggt ttcctgttgt gggtcatatg actttgaacc aaatggccgg 900
ctgctagggc agcacataag gataattcac ctgccaagac ggcacaggca actattcttg 960
ctaattgacg tgcgttggta ccaggagcgg tagcatgtgg gcctcttaca cctaataagt 1020
ccaacatggc accttgtggt tctagaacag taccaccacc gatggtacct acttcgatgg 1080
atggcatgga tacggaaatt ctcaaatcac cgtccacttc tttcatcaat gttatacagt 1140
tggaactttc gacattttgt gcaggatctt gtcctaatgc caagaaaaca gctgtcacta 1200
aattagctgc atgtgcgtta aatccaccaa cagacccagc cattgcagat ccaaccaaat 1260
tcttagcaat gttcaactca accaatgcgg aaacatcact ttttaacact tttctgacaa 1320
catcaccagg aatagtagct tctgcgacga cactcttacc acgaccttcg atccagttga 1380
tggcagctgg ttttttgtcg gtacagtagt taccagaaac ggagacaacc tccatatctt 1440
cccagccata ctcttctacc atttgcttta atgagtattc gacaccctta gaaatcatat 1500
tcatacccat tgcgtcacca gtagttgttc taaatctcat gaagagtaaa tctcctgcta 1560
gacaagtttg aatatgttgc agacgtgcaa atcttgatgt agagttaaaa gcttttttaa 1620
ttgcgttttg tccctcttct gagtctaacc atatcttaca ggcaccagat cttttcaaag 1680
ttgggaaacg gactactggg cctcttgtca taccatcctt agttaaaaca gttgttgcac 1740
caccgccagc attgattgcc ttacagccac gcatggcaga agctaccaaa caaccctctg 1800
tagttgccat tggtatatga taagatgtac catcgataac caaggggcct ataacaccaa 1860
cgggcaaagg catgtaacct ataacatttt cacaacaagc gccaaatacg cggtcgtagt 1920
cataattttt atatggtaaa cgatcagatg ctaatacagg agcttctgcc aaaattgaaa 1980
gagccttcct acgtaccgca accgctctcg tagtatcacc taattttttc tccaaagcgt 2040
acaaaggtaa cttaccgtga ataaccaagg cagcgacctc tttgttcttc aattgttttg 2100
tatttccact acttaataat gcttctaatt cttctaaagg acgtattttc ttatccaagc 2160
tttcaatatc gcgggaatca tcttcctcac tagatgatga aggtcctgat gagctcgatt 2220
gcgcagatga taaacttttg actttcgatc cagaaatgac tgttttattg gttaaaactg 2280
gtgtagaagc cttttgtaca ggagcagtaa aagacttctt ggtgacttca gttttcacca 2340
attggtctgc agccattata gttttttctc cttgacgtta aagtatagag gtatattaac 2400
aattttttgt tgatactttt atgacatttg aataagaagt aatacaaacc gaaaatgttg 2460
aaagtattag ttaaagtggt tatgcagctt ttgcatttat atatctgtta atagatcaaa 2520
aatcatcgct tcgctgatta attaccccag aaataaggct aaaaaactaa tcgcattatt 2580
atcctatggt tgttaatttg attcgttgat ttgaaggttt gtggggccag gttactgcca 2640
atttttcctc ttcataacca taaaagctag tattgtagaa tctttattgt tcggagcagt 2700
gcggcgcgag gcacatctgc gtttcaggaa cgcgaccggt gaagaccagg acgcacggag 2760
gagagtcttc cgtcggaggg ctgtcgcccg ctcggcggct tctaatccgt acttcaatat 2820
agcaatgagc agttaagcgt attactgaaa gttccaaaga gaaggttttt ttaggctaag 2880
ataatggggc tctttacatt tccacaacat ataagtaaga ttagatatgg atatgtatat 2940
ggtggtattg ccatgtaata tgattattaa acttctttgc gtccatccaa aaaaaaagta 3000
agaatttttg aaaattcaat ataaatgact gccgacaaca atagtatgcc ccatggtgca 3060
gtatctagtt acgccaaatt agtgcaaaac caaacacctg aagacatttt ggaagagttt 3120
cctgaaatta ttccattaca acaaagacct aatacccgat ctagtgagac gtcaaatgac 3180
gaaagcggag aaacatgttt ttctggtcat gatgaggagc aaattaagtt aatgaatgaa 3240
aattgtattg ttttggattg ggacgataat gctattggtg ccggtaccaa gaaagtttgt 3300
catttaatgg aaaatattga aaagggttta ctacatcgtg cattctccgt ctttattttc 3360
aatgaacaag gtgaattact tttacaacaa agagccactg aaaaaataac tttccctgat 3420
ctttggacta acacatgctg ctctcatcca ctatgtattg atgacgaatt aggtttgaag 3480
ggtaagctag acgataagat taagggcgct attactgcgg cggtgagaaa actagatcat 3540
gaattaggta ttccagaaga tgaaactaag acaaggggta agtttcactt tttaaacaga 3600
atccattaca tggcaccaag caatgaacca tggggtgaac atgaaattga ttacatccta 3660
ttttataaga tcaacgctaa agaaaacttg actgtcaacc caaacgtcaa tgaagttaga 3720
gacttcaaat gggtttcacc aaatgatttg aaaactatgt ttgctgaccc aagttacaag 3780
tttacgcctt ggtttaagat tatttgcgag aattacttat tcaactggtg ggagcaatta 3840
gatgaccttt ctgaagtgga aaatgacagg caaattcata gaatgctata acaacgcgtc 3900
aataatatag gctacataaa aatcataata actttgttat catagcaaaa tgtgatataa 3960
aacgtttcat ttcacctgaa aaatagtaaa aataggcgac aaaaatcctt agtaatatgt 4020
aaactttatt ttctttattt acccgggagt cagtctgact cttgcgagag atgaggatgt 4080
aataatacta atctcgaaga tgccatctaa tacatataga catacatata tatatatata 4140
cattctatat attcttaccc agattctttg aggtaagacg gttgggtttt atcttttgca 4200
gttggtacta ttaagaacaa tcgaatcata agcattgctt acaaagaata cacatacgaa 4260
atattaacga taatgtcaat tacgaagact gaactggacg gtatattgcc attggtggcc 4320
agaggtaaag ttagagacat atatgaggta gacgctggta cgttgctgtt tgttgctacg 4380
gatcgtatct ctgcatatga cgttattatg gaaaacagca ttcctgaaaa ggggatccta 4440
ttgaccaaac tgtcagagtt ctggttcaag ttcctgtcca acgatgttcg taatcatttg 4500
gtcgacatcg ccccaggtaa gactattttc gattatctac ctgcaaaatt gagcgaacca 4560
aagtacaaaa cgcaactaga agaccgctct ctattggttc acaaacataa actaattcca 4620
ttggaagtaa ttgtcagagg ctacatcacc ggatctgctt ggaaagagta cgtaaaaaca 4680
ggtactgtgc atggtttgaa acaacctcaa ggacttaaag aatctcaaga gttcccagaa 4740
ccaatcttca ccccatcgac caaggctgaa caaggtgaac atgacgaaaa catctctcct 4800
gcccaggccg ctgagctggt gggtgaagat ttgtcacgta gagtggcaga actggctgta 4860
aaactgtact ccaagtgcaa agattatgct aaggagaagg gcatcatcat cgcagacact 4920
aaattgttta aac 4933
<210> 25
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK009-G
<400> 25
gtttaaacta ctcagtatat taagtttcga 30
<210> 26
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK010-G
<400> 26
atctctcgca agagtcagac tgactcccgg gcgtgaataa gcttcgggtg acccttatgg 60
cattcttttt 70
<210> 27
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK011-G
<400> 27
aaaaagaatg ccataagggt cacccgaagc ttattcacgc ccgggagtca gtctgactct 60
tgcgagagat 70
<210> 28
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK012-G
<400> 28
gtttaaacaa tttagtgtct gcgatgatga 30
<210> 29
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK047-G
<400> 29
tccccccggg taaataaaga aaataaagtt 30
<210> 30
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK064-G
<400> 30
aatttttgaa aattcaatat aaatgactgc cgacaacaat agtatgc 47
<210> 31
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK052-G
<400> 31
agttttcacc aattggtctg cagccattat agttttttct ccttgacgtt a 51
<210> 32
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK065-G
<400> 32
gcatactatt gttgtcggca gtcatttata ttgaattttc aaaaatt 47
<210> 33
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK053-G
<400> 33
taacgtcaag gagaaaaaac tataatggct gcagaccaat tggtgaaaac t 51
<210> 34
<211> 6408
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, HIS3_PGAL10-ERG10_PGAL1-ERG12_HIS3 insert of
expression plasmid pAM495
<400> 34
gtttaaacta ttgtgagggt cagttatttc atccagatat aacccgagag gaaacttctt 60
agcgtctgtt ttcgtaccat aaggcagttc atgaggtata ttttcgttat tgaagcccag 120
ctcgtgaatg cttaatgctg ctgaactggt gtccatgtcg cctaggtacg caatctccac 180
aggctgcaaa ggttttgtct caagagcaat gttattgtgc accccgtaat tggtcaacaa 240
gtttaatctg tgcttgtcca ccagctctgt cgtaaccttc agttcatcga ctatctgaag 300
aaatttacta ggaatagtgc catggtacag caaccgagaa tggcaatttc tactcgggtt 360
cagcaacgct gcataaacgc tgttggtgcc gtagacatat tcgaagatag gattatcatt 420
cataagtttc agagcaatgt ccttattctg gaacttggat ttatggctct tttggtttaa 480
tttcgcctga ttcttgatct cctttagctt ctcgacgtgg gcctttttct tgccatatgg 540
atccgctgca cggtcctgtt ccctagcatg tacgtgagcg tatttccttt taaaccacga 600
cgctttgtct tcattcaacg tttcccattg tttttttcta ctattgcttt gctgtgggaa 660
aaacttatcg aaagatgacg actttttctt aattctcgtt ttaagagctt ggtgagcgct 720
aggagtcact gccaggtatc gtttgaacac ggcattagtc agggaagtca taacacagtc 780
ctttcccgca attttctttt tctattactc ttggcctcct ctagtacact ctatattttt 840
ttatgcctcg gtaatgattt tcattttttt tttttccacc tagcggatga ctcttttttt 900
ttcttagcga ttggcattat cacataatga attatacatt atataaagta atgtgatttc 960
ttcgaagaat atactaaagt ttagcttgcc tcgtccccgc cgggtcaccc ggccagcgac 1020
atggaggccc agaataccct ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt 1080
gactgtcgcc cgtacattta gcccatacat ccccatgtat aatcatttgc atccatacat 1140
tttgatggcc gcacggcgcg aagcaaaaat tacggctcct cgctgcagac ctgcgagcag 1200
ggaaacgctc ccctcacaga cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat 1260
ataaaaggtt aggatttgcc actgaggttc ttctttcata tacttccttt taaaatcttg 1320
ctaggataca gttctcacat cacatccgaa cataaacaac catggcagaa ccagcccaaa 1380
aaaagcaaaa acaaactgtt caggagcgca aggcgtttat ctcccgtatc actaatgaaa 1440
ctaaaattca aatcgctatt tcgctgaatg gtggttatat tcaaataaaa gattcgattc 1500
ttcctgcaaa gaaggatgac gatgtagctt cccaagctac tcagtcacag gtcatcgata 1560
ttcacacagg tgttggcttt ttggatcata tgatccatgc gttggcaaaa cactctggtt 1620
ggtctcttat tgttgaatgt attggtgacc tgcacattga cgatcaccat actaccgaag 1680
attgcggtat cgcattaggg caagcgttca aagaagcaat gggtgctgtc cgtggtgtaa 1740
aaagattcgg tactgggttc gcaccattgg atgaggcgct atcacgtgcc gtagtcgatt 1800
tatctagtag accatttgct gtaatcgacc ttggattgaa gagagagatg attggtgatt 1860
tatccactga aatgattcca cactttttgg aaagtttcgc ggaggcggcc agaattactt 1920
tgcatgttga ttgtctgaga ggtttcaacg atcaccacag aagtgagagt gcgttcaagg 1980
ctttggctgt tgccataaga gaagctattt ctagcaatgg caccaatgac gttccctcaa 2040
ccaaaggtgt tttgatgtga agtactgaca ataaaaagat tcttgttttc aagaacttgt 2100
catttgtata gtttttttat attgtagttg ttctatttta atcaaatgtt agcgtgattt 2160
atattttttt tcgcctcgac atcatctgcc cagatgcgaa gttaagtgcg cagaaagtaa 2220
tatcatgcgt caatcgtatg tgaatgctgg tcgctatact gctgtcgatt cgatactaac 2280
gccgccatcc acccgggatg gtctgcttaa atttcattct gtcttcgaaa gctgaattga 2340
tactacgaaa aatttttttt tgtttctctt tctatcttta ttacataaaa cttcatacac 2400
agttaagatt aaaaacaact aataaataat gcctatcgca aattagctta tgaagtccat 2460
ggtaaattcg tgtttcctgg caataataga tcgtcaattt gttgctttgt ggtagtttta 2520
ttttcaaata attggaatac tagggatttg attttaagat ctttattcaa attttttgcg 2580
cttaacaaac agcagccagt cccacccaag tctgtttcaa atgtctcgta actaaaatca 2640
tcttgcaatt tctttttgaa actgtcaatt tgctcttgag taatgtctct tcgtaacaaa 2700
gtcaaagagc aaccgccgcc accagcaccg gtaagttttg tggagccaat tctcaaatca 2760
tcgctcagat ttttaataag ttctaatcca ggatgagaaa caccgattga gacaagcagt 2820
ccatgattta ttcttatcaa ttccaatagt tgttcataca gttcattatt agtttctaca 2880
gcctcgtcat cggtgccttt acatttactt aacttagtca tgatctctaa gccttgtagg 2940
gcacattcac ccatggcatc tagaattggc ttcataactt caggaaattt ctcggtgacc 3000
aacacacgaa cgcgagcaac aagatctttt gtagaccttg gaattctagt ataggttagg 3060
atcattggaa tggctgggaa atcatctaag aacttaaaat tgtttgtgtt tattgttcca 3120
ttatgtgagt ctttttcaaa tagcagggca ttaccataag tggccacagc gttatctatt 3180
cctgaagggg taccgtgaat acacttttca cctatgaagg cccattgatt cactatatgc 3240
ttatcgtttt ctgacagctt ttccaagtca ttagatccta ttaacccccc caagtaggcc 3300
atagctaagg ccagtgatac agaaatagag gcgcttgagc ccaacccagc accgatgggt 3360
aaagtagact ttaaagaaaa cttaatattc ttggcatggg ggcataggca aacaaacata 3420
tacaggaaac aaaacgctgc atggtagtgg aaggattcgg atagttgagc taacaacgga 3480
tccaaaagac taacgagttc ctgagacaag ccatcggtgg cttgttgagc cttggccaat 3540
ttttgggagt ttacttgatc ctcggtgatg gcattgaaat cattgatgga ccacttatga 3600
ttaaagctaa tgtccgggaa gtccaattca atagtatctg gtgcagatga ctcgcttatt 3660
agcaggtagg ttctcaacgc agacacacta gcagcgacgg caggcttgtt gtacacagca 3720
gagtgttcac caaaaataat aacctttccc ggtgcagaag ttaagaacgg taatgacatt 3780
atagtttttt ctccttgacg ttaaagtata gaggtatatt aacaattttt tgttgatact 3840
tttatgacat ttgaataaga agtaatacaa accgaaaatg ttgaaagtat tagttaaagt 3900
ggttatgcag cttttgcatt tatatatctg ttaatagatc aaaaatcatc gcttcgctga 3960
ttaattaccc cagaaataag gctaaaaaac taatcgcatt attatcctat ggttgttaat 4020
ttgattcgtt gatttgaagg tttgtggggc caggttactg ccaatttttc ctcttcataa 4080
ccataaaagc tagtattgta gaatctttat tgttcggagc agtgcggcgc gaggcacatc 4140
tgcgtttcag gaacgcgacc ggtgaagacc aggacgcacg gaggagagtc ttccgtcgga 4200
gggctgtcgc ccgctcggcg gcttctaatc cgtacttcaa tatagcaatg agcagttaag 4260
cgtattactg aaagttccaa agagaaggtt tttttaggct aagataatgg ggctctttac 4320
atttccacaa catataagta agattagata tggatatgta tatggtggta ttgccatgta 4380
atatgattat taaacttctt tgcgtccatc caaaaaaaaa gtaagaattt ttgaaaattc 4440
aatataaatg tctcagaacg tttacattgt atcgactgcc agaaccccaa ttggttcatt 4500
ccagggttct ctatcctcca agacagcagt ggaattgggt gctgttgctt taaaaggcgc 4560
cttggctaag gttccagaat tggatgcatc caaggatttt gacgaaatta tttttggtaa 4620
cgttctttct gccaatttgg gccaagctcc ggccagacaa gttgctttgg ctgccggttt 4680
gagtaatcat atcgttgcaa gcacagttaa caaggtctgt gcatccgcta tgaaggcaat 4740
cattttgggt gctcaatcca tcaaatgtgg taatgctgat gttgtcgtag ctggtggttg 4800
tgaatctatg actaacgcac catactacat gccagcagcc cgtgcgggtg ccaaatttgg 4860
ccaaactgtt cttgttgatg gtgtcgaaag agatgggttg aacgatgcgt acgatggtct 4920
agccatgggt gtacacgcag aaaagtgtgc ccgtgattgg gatattacta gagaacaaca 4980
agacaatttt gccatcgaat cctaccaaaa atctcaaaaa tctcaaaagg aaggtaaatt 5040
cgacaatgaa attgtacctg ttaccattaa gggatttaga ggtaagcctg atactcaagt 5100
cacgaaggac gaggaacctg ctagattaca cgttgaaaaa ttgagatctg caaggactgt 5160
tttccaaaaa gaaaacggta ctgttactgc cgctaacgct tctccaatca acgatggtgc 5220
tgcagccgtc atcttggttt ccgaaaaagt tttgaaggaa aagaatttga agcctttggc 5280
tattatcaaa ggttggggtg aggccgctca tcaaccagct gattttacat gggctccatc 5340
tcttgcagtt ccaaaggctt tgaaacatgc tggcatcgaa gacatcaatt ctgttgatta 5400
ctttgaattc aatgaagcct tttcggttgt cggtttggtg aacactaaga ttttgaagct 5460
agacccatct aaggttaatg tatatggtgg tgctgttgct ctaggtcacc cattgggttg 5520
ttctggtgct agagtggttg ttacactgct atccatctta cagcaagaag gaggtaagat 5580
cggtgttgcc gccatttgta atggtggtgg tggtgcttcc tctattgtca ttgaaaagat 5640
atgattacgt tctgcgattt tctcatgatc tttttcataa aatacataaa tatataaatg 5700
gctttatgta taacaggcat aatttaaagt tttatttgcg attcatcgtt tttcaggtac 5760
tcaaacgctg aggtgtgcct tttgacttac ttttcccggg agaggctagc agaattaccc 5820
tccacgttga ttgtctgcga ggcaagaatg atcatcaccg tagtgagagt gcgttcaagg 5880
ctcttgcggt tgccataaga gaagccacct cgcccaatgg taccaacgat gttccctcca 5940
ccaaaggtgt tcttatgtag tgacaccgat tatttaaagc tgcagcatac gatatatata 6000
catgtgtata tatgtatacc tatgaatgtc agtaagtatg tatacgaaca gtatgatact 6060
gaagatgaca aggtaatgca tcattctata cgtgtcattc tgaacgaggc gcgctttcct 6120
tttttctttt tgctttttct ttttttttct cttgaactcg agaaaaaaaa tataaaagag 6180
atggaggaac gggaaaaagt tagttgtggt gataggtggc aagtggtatt ccgtaagaac 6240
aacaagaaaa gcatttcata ttatggctga actgagcgaa caagtgcaaa atttaagcat 6300
caacgacaac aacgagaatg gttatgttcc tcctcactta agaggaaaac caagaagtgc 6360
cagaaataac agtagcaact acaataacaa caacggcggc gtttaaac 6408
<210> 35
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK013-G
<400> 35
gtttaaacta ttgtgagggt cagttatttc 30
<210> 36
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK014alt-G
<400> 36
gcggggacga ggcaagctaa actttagtat attcttcgaa gaaa 44
<210> 37
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK017-G
<400> 37
cgatactaac gccgccatcc acccgggaga ggctagcaga attaccctcc acgttgattg 60
<210> 38
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK018-G
<400> 38
gtttaaacgc cgccgttgtt gttattgtag 30
<210> 39
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK035-G
<400> 39
tccccccggg aaaagtaagt caaaaggcac 30
<210> 40
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK056-G
<400> 40
aatttttgaa aattcaatat aaatgtctca gaacgtttac attgtat 47
<210> 41
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK057-G
<400> 41
atacaatgta aacgttctga gacatttata ttgaattttc aaaaatt 47
<210> 42
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK058-G
<400> 42
tgcagaagtt aagaacggta atgacattat agttttttct ccttgacgtt a 51
<210> 43
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK040-G
<400> 43
tccccccggg atggtctgct taaatttcat 30
<210> 44
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK059-G
<400> 44
taacgtcaag gagaaaaaac tataatgtca ttaccgttct taacttctgc a 51
<210> 45
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK015alt-G
<400> 45
tttcttcgaa gaatatacta aagtttagct tgcctcgtcc ccgc 44
<210> 46
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK016-G
<400> 46
caatcaacgt ggagggtaat tctgctagcc tctcccgggt ggatggcggc gttagtatcg 60
<210> 47
<211> 6087
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, LEU2_PGAL10-ERG8_PGAL1-ERG19_LEU2 insert of expression
plasmid pAM497
<400> 47
gtttaaactt ttccaatagg tggttagcaa tcgtcttact ttctaacttt tcttaccttt 60
tacatttcag caatatatat atatatattt caaggatata ccattctaat gtctgcccct 120
aagaagatcg tcgttttgcc aggtgaccac gttggtcaag aaatcacagc cgaagccatt 180
aaggttctta aagctatttc tgatgttcgt tccaatgtca agttcgattt cgaaaatcat 240
ttaattggtg gtgctgctat cgatgctaca ggtgttccac ttccagatga ggcgctggaa 300
gcctccaaga aggctgatgc cgttttgtta ggtgctgtgg gtggtcctaa atggggtacc 360
ggtagtgtta gacctgaaca aggtttacta aaaatccgta aagaacttca attgtacgcc 420
aacttaagac catgtaactt tgcatccgac tctcttttag acttatctcc aatcaagcca 480
caatttgcta aaggtactga cttcgttgtt gtcagagaat tagtgggagg tatttacttt 540
ggtaagagaa aggaagacgt ttagcttgcc tcgtccccgc cgggtcaccc ggccagcgac 600
atggaggccc agaataccct ccttgacagt cttgacgtgc gcagctcagg ggcatgatgt 660
gactgtcgcc cgtacattta gcccatacat ccccatgtat aatcatttgc atccatacat 720
tttgatggcc gcacggcgcg aagcaaaaat tacggctcct cgctgcagac ctgcgagcag 780
ggaaacgctc ccctcacaga cgcgttgaat tgtccccacg ccgcgcccct gtagagaaat 840
ataaaaggtt aggatttgcc actgaggttc ttctttcata tacttccttt taaaatcttg 900
ctaggataca gttctcacat cacatccgaa cataaacaac catggcagaa ccagcccaaa 960
aaaagcaaaa acaaactgtt caggagcgca aggcgtttat ctcccgtatc actaatgaaa 1020
ctaaaattca aatcgctatt tcgctgaatg gtggttatat tcaaataaaa gattcgattc 1080
ttcctgcaaa gaaggatgac gatgtagctt cccaagctac tcagtcacag gtcatcgata 1140
ttcacacagg tgttggcttt ttggatcata tgatccatgc gttggcaaaa cactctggtt 1200
ggtctcttat tgttgaatgt attggtgacc tgcacattga cgatcaccat actaccgaag 1260
attgcggtat cgcattaggg caagcgttca aagaagcaat gggtgctgtc cgtggtgtaa 1320
aaagattcgg tactgggttc gcaccattgg atgaggcgct atcacgtgcc gtagtcgatt 1380
tatctagtag accatttgct gtaatcgacc ttggattgaa gagagagatg attggtgatt 1440
tatccactga aatgattcca cactttttgg aaagtttcgc ggaggcggcc agaattactt 1500
tgcatgttga ttgtctgaga ggtttcaacg atcaccacag aagtgagagt gcgttcaagg 1560
ctttggctgt tgccataaga gaagctattt ctagcaatgg caccaatgac gttccctcaa 1620
ccaaaggtgt tttgatgtga agtactgaca ataaaaagat tcttgttttc aagaacttgt 1680
catttgtata gtttttttat attgtagttg ttctatttta atcaaatgtt agcgtgattt 1740
atattttttt tcgcctcgac atcatctgcc cagatgcgaa gttaagtgcg cagaaagtaa 1800
tatcatgcgt caatcgtatg tgaatgctgg tcgctatact gctgtcgatt cgatactaac 1860
gccgccatcc acccgggttt ctcattcaag tggtaactgc tgttaaaatt aagatattta 1920
taaattgaag cttggtcgtt ccgaccaata ccgtagggaa acgtaaatta gctattgtaa 1980
aaaaaggaaa agaaaagaaa agaaaaatgt tacatatcga attgatctta ttcctttggt 2040
agaccagtct ttgcgtcaat caaagattcg tttgtttctt gtgggcctga accgacttga 2100
gttaaaatca ctctggcaac atccttttgc aactcaagat ccaattcacg tgcagtaaag 2160
ttagatgatt caaattgatg gttgaaagcc tcaagctgct cagtagtaaa tttcttgtcc 2220
catccaggaa cagagccaaa caatttatag ataaatgcaa agagtttcga ctcattttca 2280
gctaagtagt acaacacagc atttggacct gcatcaaacg tgtatgcaac gattgtttct 2340
ccgtaaaact gattaatggt gtggcaccaa ctgatgatac gcttggaagt gtcattcatg 2400
tagaatattg gagggaaaga gtccaaacat gtggcatgga aagagttgga atccatcatt 2460
gtttcctttg caaaggtggc gaaatctttt tcaacaatgg ctttacgcat gacttcaaat 2520
ctctttggta cgacatgttc aattctttct ttaaatagtt cggaggttgc cacggtcaat 2580
tgcataccct gagtggaact cacatccttt ttaatatcgc tgacaactag gacacaagct 2640
ttcatctgag gccagtcaga gctgtctgcg atttgtactg ccatggaatc atgaccatct 2700
tcagcttttc ccatttccca ggccacgtat ccgccaaaca acgatctaca agctgaacca 2760
gacccctttc ttgctattct agatatttct gaagttgact gtggtaattg gtataactta 2820
gcaattgcag agaccaatgc agcaaagcca gcagcggagg aagctaaacc agctgctgta 2880
ggaaagttat tttcggagac aatgtggagt ttccattgag ataatgtggg caatgaggcg 2940
tccttcgatt ccatttcctt tcttaattgg cgtaggtcgc gcagacaatt ttgagttctt 3000
tcattgtcga tgctgtgtgg ttctccattt aaccacaaag tgtcgcgttc aaactcaggt 3060
gcagtagccg cagaggtcaa cgttctgagg tcatcttgcg ataaagtcac tgatatggac 3120
gaattggtgg gcagattcaa cttcgtgtcc cttttccccc aatacttaag ggttgcgatg 3180
ttgacgggtg cggtaacgga tgctgtgtaa acggtcatta tagttttttc tccttgacgt 3240
taaagtatag aggtatatta acaatttttt gttgatactt ttatgacatt tgaataagaa 3300
gtaatacaaa ccgaaaatgt tgaaagtatt agttaaagtg gttatgcagc ttttgcattt 3360
atatatctgt taatagatca aaaatcatcg cttcgctgat taattacccc agaaataagg 3420
ctaaaaaact aatcgcatta ttatcctatg gttgttaatt tgattcgttg atttgaaggt 3480
ttgtggggcc aggttactgc caatttttcc tcttcataac cataaaagct agtattgtag 3540
aatctttatt gttcggagca gtgcggcgcg aggcacatct gcgtttcagg aacgcgaccg 3600
gtgaagacca ggacgcacgg aggagagtct tccgtcggag ggctgtcgcc cgctcggcgg 3660
cttctaatcc gtacttcaat atagcaatga gcagttaagc gtattactga aagttccaaa 3720
gagaaggttt ttttaggcta agataatggg gctctttaca tttccacaac atataagtaa 3780
gattagatat ggatatgtat atggtggtat tgccatgtaa tatgattatt aaacttcttt 3840
gcgtccatcc aaaaaaaaag taagaatttt tgaaaattca atataaatgt cagagttgag 3900
agccttcagt gccccaggga aagcgttact agctggtgga tatttagttt tagatccgaa 3960
atatgaagca tttgtagtcg gattatcggc aagaatgcat gctgtagccc atccttacgg 4020
ttcattgcaa gagtctgata agtttgaagt gcgtgtgaaa agtaaacaat ttaaagatgg 4080
ggagtggctg taccatataa gtcctaaaac tggcttcatt cctgtttcga taggcggatc 4140
taagaaccct ttcattgaaa aagttatcgc taacgtattt agctacttta agcctaacat 4200
ggacgactac tgcaatagaa acttgttcgt tattgatatt ttctctgatg atgcctacca 4260
ttctcaggag gacagcgtta ccgaacatcg tggcaacaga agattgagtt ttcattcgca 4320
cagaattgaa gaagttccca aaacagggct gggctcctcg gcaggtttag tcacagtttt 4380
aactacagct ttggcctcct tttttgtatc ggacctggaa aataatgtag acaaatatag 4440
agaagttatt cataatttat cacaagttgc tcattgtcaa gctcagggta aaattggaag 4500
cgggtttgat gtagcggcgg cagcatatgg atctatcaga tatagaagat tcccacccgc 4560
attaatctct aatttgccag atattggaag tgctacttac ggcagtaaac tggcgcattt 4620
ggttaatgaa gaagactgga atataacgat taaaagtaac catttacctt cgggattaac 4680
tttatggatg ggcgatatta agaatggttc agaaacagta aaactggtcc agaaggtaaa 4740
aaattggtat gattcgcata tgccggaaag cttgaaaata tatacagaac tcgatcatgc 4800
aaattctaga tttatggatg gactatctaa actagatcgc ttacacgaga ctcatgacga 4860
ttacagcgat cagatatttg agtctcttga gaggaatgac tgtacctgtc aaaagtatcc 4920
tgagatcaca gaagttagag atgcagttgc cacaattaga cgttccttta gaaaaataac 4980
taaagaatct ggtgccgata tcgaacctcc cgtacaaact agcttattgg atgattgcca 5040
gaccttaaaa ggagttctta cttgcttaat acctggtgct ggtggttatg acgccattgc 5100
agtgattgct aagcaagatg ttgatcttag ggctcaaacc gctgatgaca aaagattttc 5160
taaggttcaa tggctggatg taactcaggc tgactggggt gttaggaaag aaaaagatcc 5220
ggaaacttat cttgataaat aacttaaggt agataatagt ggtccatgtg acatctttat 5280
aaatgtgaag tttgaagtga ccgcgcttaa catctaacca ttcatcttcc gatagtactt 5340
gaaattgttc ctttcggcgg catgataaaa ttcttttaat gggtacaagc tacccgggcc 5400
cgggaaagat tctctttttt tatgatattt gtacataaac tttataaatg aaattcataa 5460
tagaaacgac acgaaattac aaaatggaat atgttcatag ggtagacgaa actatatacg 5520
caatctacat acatttatca agaaggagaa aaaggaggat gtaaaggaat acaggtaagc 5580
aaattgatac taatggctca acgtgataag gaaaaagaat tgcactttaa cattaatatt 5640
gacaaggagg agggcaccac acaaaaagtt aggtgtaaca gaaaatcatg aaactatgat 5700
tcctaattta tatattggag gattttctct aaaaaaaaaa aaatacaaca aataaaaaac 5760
actcaatgac ctgaccattt gatggagttt aagtcaatac cttcttgaac catttcccat 5820
aatggtgaaa gttccctcaa gaattttact ctgtcagaaa cggccttaac gacgtagtcg 5880
acctcctctt cagtactaaa tctaccaata ccaaatctga tggaagaatg ggctaatgca 5940
tcatccttac ccagcgcatg taaaacataa gaaggttcta gggaagcaga tgtacaggct 6000
gaacccgagg ataatgcgat atcccttagt gccatcaata aagattctcc ttccacgtag 6060
gcgaaagaaa cgttaacacg tttaaac 6087
<210> 48
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK019-G
<400> 48
gtttaaactt ttccaatagg tggttagcaa 30
<210> 49
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK020-G
<400> 49
gggtgacccg gcggggacga ggcaagctaa acgtcttcct ttctcttacc aaagt 55
<210> 50
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK023-G
<400> 50
gctgtcgatt cgatactaac gccgccatcc acccgggaaa gattctcttt ttttatgata 60
tt 62
<210> 51
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK024-G
<400> 51
gtttaaacgt gttaacgttt ctttcgccta cgtggaagga gaatc 45
<210> 52
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK021-G
<400> 52
actttggtaa gagaaaggaa gacgtttagc ttgcctcgtc cccgccgggt caccc 55
<210> 53
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK022-G
<400> 53
aatatcataa aaaaagagaa tctttcccgg gtggatggcg gcgttagtat cgaatcgaca 60
gc 62
<210> 54
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK041-G
<400> 54
tccccccggg tagcttgtac ccattaaaag aattttatca tgccg 45
<210> 55
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK060-G
<400> 55
aatttttgaa aattcaatat aaatgtcaga gttgagagcc ttcagtg 47
<210> 56
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK061-G
<400> 56
cactgaaggc tctcaactct gacatttata ttgaattttc aaaaatt 47
<210> 57
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK062-G
<400> 57
ggtaacggat gctgtgtaaa cggtcattat agttttttct ccttgacgtt a 51
<210> 58
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK046-G
<400> 58
tccccccggg tttctcattc aagtggtaac 30
<210> 59
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK063-G
<400> 59
taacgtcaag gagaaaaaac tataatgacc gtttacacag catccgttac c 51
<210> 60
<211> 4178
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM1419
<400> 60
gtttgacagc ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc 60
ggaagctgtg gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc 120
gcactcccgt tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc 180
tgaaatgagc tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga 240
taacaatttc acacaggaaa cagacatatg ggaattcgag ctcggtaccc ggggatcctc 300
tagagtcgac ctgcaggcat gcaagcttgg ctgttttggc ggatgagaga agattttcag 360
cctgatacag attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg 420
cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc 480
cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac 540
gaaaggctca gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc 600
tcctgagtag gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag 660
ggtggcgggc aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc 720
tgacggatgg cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc 780
aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag 840
gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg 900
ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt 960
gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt 1020
tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt 1080
attatcccgt gttgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa 1140
tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag 1200
agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac 1260
aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac 1320
tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac 1380
cacgatgcct acagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 1440
tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 1500
tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 1560
tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 1620
tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 1680
aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 1740
gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 1800
tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 1860
aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 1920
aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 1980
tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc 2040
gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 2100
cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 2160
acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 2220
cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 2280
cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 2340
aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 2400
gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 2460
atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 2520
tcacatgttc tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga 2580
gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga 2640
agcggaagag cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg 2700
cacatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc agtatacact 2760
ccgctatcgc tacgtgactg ggtcatggct gcgccccgac acccgccaac acccgctgac 2820
gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt gaccgtctcc 2880
gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag gcagcagatc 2940
aattcgcgcg cgaaggcgaa gcggcatgca tttacgttga caccatcgaa tggtgcaaaa 3000
cctttcgcgg tatggcatga tagcgcccgg aagagagtca attcagggtg gtgaatgtga 3060
aaccagtaac gttatacgat gtcgcagagt atgccggtgt ctcttatcag accgtttccc 3120
gcgtggtgaa ccaggccagc cacgtttctg cgaaaacgcg ggaaaaagtg gaagcggcga 3180
tggcggagct gaattacatt cccaaccgcg tggcacaaca actggcgggc aaacagtcgt 3240
tgctgattgg cgttgccacc tccagtctgg ccctgcacgc gccgtcgcaa attgtcgcgg 3300
cgattaaatc tcgcgccgat caactgggtg ccagcgtggt ggtgtcgatg gtagaacgaa 3360
gcggcgtcga agcctgtaaa gcggcggtgc acaatcttct cgcgcaacgc gtcagtgggc 3420
tgatcattaa ctatccgctg gatgaccagg atgccattgc tgtggaagct gcctgcacta 3480
atgttccggc gttatttctt gatgtctctg accagacacc catcaacagt attattttct 3540
cccatgaaga cggtacgcga ctgggcgtgg agcatctggt cgcattgggt caccagcaaa 3600
tcgcgctgtt agcgggccca ttaagttctg tctcggcgcg tctgcgtctg gctggctggc 3660
ataaatatct cactcgcaat caaattcagc cgatagcgga acgggaaggc gactggagtg 3720
ccatgtccgg ttttcaacaa accatgcaaa tgctgaatga gggcatcgtt cccactgcga 3780
tgctggttgc caacgatcag atggcgctgg gcgcaatgcg cgccattacc gagtccgggc 3840
tgcgcgttgg tgcggatatc tcggtagtgg gatacgacga taccgaagac agctcatgtt 3900
atatcccgcc gtcaaccacc atcaaacagg attttcgcct gctggggcaa accagcgtgg 3960
accgcttgct gcaactctct cagggccagg cggtgaaggg caatcagctg ttgcccgtct 4020
cactggtgaa aagaaaaacc accctggcgc ccaatacgca aaccgcctct ccccgcgcgt 4080
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 4140
cgcaacgcaa ttaatgtgag ttagcgcgaa ttgatctg 4178
<210> 61
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_S2D_Ec coding sequence
<400> 61
atggacactc tgccgatctc ttccgtaagc ttttcttcct ctacttcccc gctggtagtc 60
gatgacaagg tttctaccaa acctgatgta attcgtcaca ctatgaactt caacgcatct 120
atctggggcg atcagttcct gacttatgat gaaccggaag atctggtaat gaaaaagcaa 180
ctggtagaag aactgaaaga agaagttaaa aaggaactga tcaccattaa gggtagcaac 240
gaaccgatgc agcacgtgaa actgattgaa ctgatcgatg cggttcagcg tctgggtatt 300
gcttatcatt ttgaagagga aatcgaggaa gctctgcaac acatccacgt aacctacggc 360
gaacaatggg tggataaaga gaatctgcag tctatcagcc tgtggttccg cctgctgcgt 420
cagcaaggtt tcaatgtctc ttctggcgtt ttcaaagact tcatggatga aaagggcaaa 480
ttcaaggaat ccctgtgtaa cgatgcgcaa ggtatcctgg cactgtacga agcggccttc 540
atgcgtgtgg aagacgaaac cattctggac aacgcgctgg aattcactaa agtgcatctg 600
gacatcatcg cgaaagatcc gtcctgcgac tcctctctgc gtactcagat ccatcaagcg 660
ctgaaacagc cgctgcgtcg tcgcctggca cgtattgagg ctctgcacta tatgccgatt 720
taccagcagg aaacctctca cgacgaagtc ctgctgaaac tggctaaact ggacttcagc 780
gttctgcaat ctatgcacaa gaaagaactg tcccacatct gcaaatggtg gaaagatctg 840
gatctgcaaa acaaactgcc gtacgttcgt gaccgtgttg ttgagggcta tttttggatt 900
ctgtccatct actatgaacc acagcacgcg cgtactcgca tgtttctgat gaaaacctgc 960
atgtggctgg ttgtcctgga cgacaccttt gacaactatg gtacgtacga agaactggaa 1020
atcttcaccc aggccgtgga acgttggtct atttcctgcc tggatatgct gccggaatac 1080
atgaaactga tctatcaaga actggttaac ctgcacgtgg aaatggaaga gtctctggag 1140
aaagaaggta aaacttacca gatccactac gtcaaggaga tggcgaaaga actggtccgt 1200
aactatctgg tcgaggcgcg ttggctgaaa gagggctata tgccgactct ggaagaatac 1260
atgagcgtat ccatggttac cggcacctac ggcctgatga ttgcgcgttc ctacgtcggc 1320
cgtggtgata ttgttaccga agataccttt aagtgggttt cttcctaccc gccgatcatc 1380
aaagcgtctt gtgtcatcgt tcgcctgatg gacgacatcg tttctcacaa agaggagcaa 1440
gaacgtggtc acgtagcatc tagcatcgaa tgctactcca aagaatccgg cgcgtccgaa 1500
gaagaagctt gcgaatacat cagccgtaaa gttgaagatg cctggaaagt tatcaaccgc 1560
gaaagcctgc gtccgacggc ggtcccgttt ccgctgctga tgccggcaat caacctggca 1620
cgcatgtgtg aggttctgta cagcgtgaac gatggtttta ctcacgcgga aggtgacatg 1680
aagagctata tgaagagctt cttcgtacac cctatggtcg tatga 1725
<210> 62
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_Aa_Ec coding sequence
<400> 62
atgtctactc tgccgatctc ttccgtaagc ttttcttcct ctacttcccc gctggtagtc 60
gatgacaagg tttctaccaa acctgatgta attcgtcaca ctatgaactt caacgcatct 120
atctggggcg atcagttcct gacttatgat gaaccggaag atctggtaat gaaaaagcaa 180
ctggtagaag aactgaaaga agaagttaaa aaggaactga tcaccattaa gggtagcaac 240
gaaccgatgc agcacgtgaa actgattgaa ctgatcgatg cggttcagcg tctgggtatt 300
gcttatcatt ttgaagagga aatcgaggaa gctctgcaac acatccacgt aacctacggc 360
gaacaatggg tggataaaga gaatctgcag tctatcagcc tgtggttccg cctgctgcgt 420
cagcaaggtt tcaatgtctc ttctggcgtt ttcaaagact tcatggatga aaagggcaaa 480
ttcaaggaat ccctgtgtaa cgatgcgcaa ggtatcctgg cactgtacga agcggccttc 540
atgcgtgtgg aagacgaaac cattctggac aacgcgctgg aattcactaa agtgcatctg 600
gacatcatcg cgaaagatcc gtcctgcgac tcctctctgc gtactcagat ccatcaagcg 660
ctgaaacagc cgctgcgtcg tcgcctggca cgtattgagg ctctgcacta tatgccgatt 720
taccagcagg aaacctctca cgacgaagtc ctgctgaaac tggctaaact ggacttcagc 780
gttctgcaat ctatgcacaa gaaagaactg tcccacatct gcaaatggtg gaaagatctg 840
gatctgcaaa acaaactgcc gtacgttcgt gaccgtgttg ttgagggcta tttttggatt 900
ctgtccatct actatgaacc acagcacgcg cgtactcgca tgtttctgat gaaaacctgc 960
atgtggctgg ttgtcctgga cgacaccttt gacaactatg gtacgtacga agaactggaa 1020
atcttcaccc aggccgtgga acgttggtct atttcctgcc tggatatgct gccggaatac 1080
atgaaactga tctatcaaga actggttaac ctgcacgtgg aaatggaaga gtctctggag 1140
aaagaaggta aaacttacca gatccactac gtcaaggaga tggcgaaaga actggtccgt 1200
aactatctgg tcgaggcgcg ttggctgaaa gagggctata tgccgactct ggaagaatac 1260
atgagcgtat ccatggttac cggcacctac ggcctgatga ttgcgcgttc ctacgtcggc 1320
cgtggtgata ttgttaccga agataccttt aagtgggttt cttcctaccc gccgatcatc 1380
aaagcgtctt gtgtcatcgt tcgcctgatg gacgacatcg tttctcacaa agaggagcaa 1440
gaacgtggtc acgtagcatc tagcatcgaa tgctactcca aagaatccgg cgcgtccgaa 1500
gaagaagctt gcgaatacat cagccgtaaa gttgaagatg cctggaaagt tatcaaccgc 1560
gaaagcctgc gtccgacggc ggtcccgttt ccgctgctga tgccggcaat caacctggca 1620
cgcatgtgtg aggttctgta cagcgtgaac gatggtttta ctcacgcgga aggtgacatg 1680
aagagctata tgaagagctt cttcgtacac cctatggtcg tatga 1725
<210> 63
<211> 1683
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_Cj_Ec coding sequence
<400> 63
atgaaagata tgagcatccc gctgttagcc gcggtttcta gctctaccga ggagacggtc 60
cgtccgatcg cggatttcca tccgacgctg tggggcaacc atttcctgaa gtctgcggca 120
gatgttgaga cgattgatgc ggcaacgcaa gagcagcacg cggcactgaa acaagaggtt 180
cgccgcatga ttaccaccac ggcgaataag ctggcgcaga aactgcacat gattgacgcc 240
gtccagcgct taggtgtggc gtaccacttc gagaaggaga ttgaagacga actgggcaaa 300
gttagccatg acctggactc tgacgatctg tatgtggtca gcctgcgttt tcgtctgttt 360
cgtcaacagg gcgtcaagat tagctgcgat gtgttcgaca agttcaagga cgacgagggc 420
aaattcaaag agagcctgat taacgacatc cgtggcatgt tatctttata cgaggcggcc 480
tatctggcaa ttcgcggtga ggatatctta gacgaggcaa ttgtcttcac cacgacccat 540
ctaaagagcg tcatcagcat tagcgaccat tctcatgcga atagcaatct ggcggagcag 600
atccgtcata gcctgcaaat tccactgcgc aaagccgccg cccgtctgga ggcccgctac 660
ttcctggaca tctattctcg tgacgacctg catgacgaga ccttactgaa attcgccaaa 720
ctggacttca acatcttaca agccgcgcac caaaaggagg caagcatcat gacccgctgg 780
tggaatgacc tgggcttccc aaaaaaggtg ccgtacgcgc gcgaccgcat tattgagacc 840
tacatttgga tgctgctggg cgtgagctac gagccaaacc tggcctttgg ccgtatcttc 900
gcgagcaaag tggtctgcat gatcacgacg atcgacgata ccttcgacgc gtacggtacg 960
ttcgaggaac tgaccctgtt tacggaggcg gtgacgcgct gggacatcgg cctgatcgac 1020
acgctgccgg agtacatgaa gttcatcgtc aaggccctgc tggacattta ccgtgaagcg 1080
gaggaggaat tagcgaagga aggccgcagc tatggtatcc cgtacgcgaa gcagatgatg 1140
caggagctga tcatcctgta ctttaccgaa gcgaaatggc tgtacaaggg ctacgtgccg 1200
acgttcgacg agtacaaaag cgttgccctg cgcagcattg gtctgcgcac gctggccgtt 1260
gcaagcattg tggacctggg cgacttcatt gcgaccaagg acaacttcga gtgcatcctg 1320
aagaacgcca agagcctgaa agccacggag accatcggcc gtctgatgga tgatatcgcg 1380
ggctacaagt tcgagcagaa acgcggccat aacccatctg cggtggagtg ttacaagaat 1440
cagcacggcg tcagcgaaga ggaggcggtt aaagagctgc tgctggaggt ggcgaacagc 1500
tggaaggaca tcaatgagga gctgttaaac ccgaccaccg tcccactgcc gatgctgcag 1560
cgtctgctgt acttcgcacg cagcggtcat ttcatttacg acgacggcca tgatcgctac 1620
acccacagcc tgatgatgaa gcgccaggtc gcgttactgt taacggaacc actggcgatc 1680
taa 1683
<210> 64
<211> 1014
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, PS_S_Ec coding sequence
<400> 64
atgccgcagg acgtcgactt ccatattccg ctgccaggcc gtcagtcacc ggaccatgcc 60
cgcgctgaag cggagcaatt agcgtggccg cgcagcttgg gcctgattcg ttccgatgct 120
gcggcagagc gtcatctccg tggtggttac gcagatctgg caagccgctt ttatccgcat 180
gcgaccggcg cagaccttga tttaggggtg gacctgatga gctggttttt cctctttgat 240
gacctgttcg atggcccgcg cggtgaaaac ccggaggata ccaaacagct gaccgaccaa 300
gtggctgcag cactggatgg cccgctcccc gataccgccc cccccatcgc tcacggtttt 360
gcagatattt ggcgccgtac gtgtgaaggt atgacgccgg cgtggtgcgc ccgtagcgcg 420
cgccattggc gtaattattt tgatggctac gtagatgaag ccgagagccg cttttggaac 480
gctccatgcg attcggccgc ccaatacctg gcgatgcgcc gtcacacgat cggtgtacaa 540
cctaccgtcg atttggcgga gcgtgcgggc cgtttcgaag tgccacaccg tgtgttcgat 600
tctgcagtga tgtctgcaat gctgcagatt gcggtagacg tgaacctgct gctgaacgac 660
atcgccagcc tggaaaaaga ggaagcccgt ggtgagcaaa acaatatggt catgatcctg 720
cgtcgcgaac acggctggtc aaagagccgc agcgtcagcc acatgcaaaa tgaagttcgc 780
gcccgccttg aacagtattt gttactggaa agctgtctcc cgaaagtcgg cgaaatttat 840
cagctggata ccgcagaacg cgaggcactg gaacgttatc gtacggatgc tgtccgtacc 900
gttatccgtg gttcctatga ctggcatcgc agcagtgggc gctatgacgc cgagttcgct 960
ctggcggcag gtgcacaggg atacctggaa gaactgggct ccagcgccca ttaa 1014
<210> 65
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, TDS_Fs_Ec coding sequence
<400> 65
atggaaaatt ttcctacgga atacttcctg aataccacgg tccgcttgct ggaatacatt 60
cgctaccgtg attctaatta tacgcgcgag gagcgtatcg aaaacctcca ttatgcgtac 120
aacaaagcgg ctcatcattt tgcacagccg cgtcagcaac aactcctgaa agtggaccct 180
aaacgtctcc aggcaagcct gcaaactatt gttggcatgg tggtttatag ctgggccaaa 240
gtttcaaaag agtgcatggc ggatctgagt atccattata cgtatacgct ggtgttagat 300
gactcaaaag atgacccgta cccaactatg gtgaattact ttgacgactt gcaagcgggc 360
cgtgaacagg cacatccgtg gtgggctctg gtgaacgaac attttccgaa tgttcttcgc 420
catttcggcc cgttttgctc gttaaattta atccgtagca ccctggattt ctttgaagga 480
tgctggatcg aacagtataa ttttggcggt tttccaggga gccacgacta cccgcagttt 540
ctgcgccgca tgaatggtct tggacattgt gttggtgcct cgttatggcc gaaggaacag 600
tttaatgaac gcagcctgtt cctggaaatc acctctgcca ttgcacagat ggaaaattgg 660
atggtatggg tcaacgatct gatgtccttc tataaagagt tcgatgatga acgcgaccag 720
atttcgttag tcaaaaatta tgtcgtgtca gatgaaatct ccttgcacga agccctggag 780
aagttgacgc aggacaccct gcactccagt aaacaaatgg tagccgtttt ttctgacaaa 840
gatccgcaag taatggacac catcgagtgt ttcatgcatg ggtatgtgac ctggcatttg 900
tgcgaccgtc gttatcgtct gtccgaaatt tacgaaaaag ttaaggagga gaaaaccgaa 960
gacgcacaaa aattctgcaa attttacgaa caggccgcga atgtaggcgc tgtcagccct 1020
tccgaatggg catatccgcc tgtggcccag ctggcgaacg ttcgttcaaa agatgtgaaa 1080
gaagtccaga aaccgtttct gagctctatt gaattagtcg agtaa 1125
<210> 66
<211> 1686
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_Cs_Ec coding sequence
<400> 66
atgagctcta acgtgagcgc catcccaaac tcttttgaac tgattcgccg ctctgcgcaa 60
ttccaggcaa gcgtctgggg cgattatttc ctgagctacc acagcctgcc accggagaag 120
ggcaacaagg tgatggaaaa acaaacggag gagctgaagg aggagatcaa aatggagctg 180
gtgtctacca ccaaggacga gccggagaaa ttacgcctga ttgatctgat ccaacgttta 240
ggcgtgtgct accacttcga gaacgaaatc aacaatatcc tgcagcagct gcatcacatc 300
acgattacca gcgagaaaaa tggcgacgac aatccataca acatgacgct gtgctttcgt 360
ttactgcgtc agcagggcta caacgtgtct tctgagccgt ttgaccgctt ccgcggcaag 420
tgggagagca gctacgacaa caatgtggaa gaactgctga gcctgtatga agcaagccaa 480
ctgcgcatgc aaggcgagga ggccctggat gaggcgtttt gcttcgccac cgcgcaactg 540
gaagcgatcg tgcaagaccc gaccaccgat ccgatggtcg ccgcggagat tcgtcaggcc 600
ttaaaatggc caatgtacaa gaatttaccg cgtctgaaag cccgtcacca cattggtctg 660
tattctgaga aaccgtggcg taacgagagc ttactgaact ttgcgaagat ggacttcaac 720
aagctgcaaa acctgcatca gaccgagatc gcatacatct ctaagtggtg ggacgattat 780
ggctttgcgg agaaactgtc ttttgcccgt aatcgcattg tggaaggtta tttctttgcc 840
ctgggtatct tcttcgaacc gcaattatta accgcacgcc tgatcatgac gaaagttatt 900
gcgattggta gcatgctgga tgacatctac gacgtctacg gtacgtttga ggaactgaag 960
ctgttaacgt tagcgttaga acgctgggac aagagcgaaa cgaagcaatt accgaactac 1020
atgaaaatgt actacgaggc cctgctggac gtgtttgaag agattgagca ggaaatgtct 1080
caaaaagaga cggaaacgac cccgtattgc attcatcaca tgaaagaagc cacgaaggaa 1140
ttaggtcgtg ttttcttagt cgaggcgacc tggtgtaagg agggttatac cccgaaggtc 1200
gaagaatatc tggacattgc gctgatcagc ttcggccaca agctgctgat ggttacggca 1260
ctgctgggta tgggttctca catggccacg cagcagattg tccagtggat cacgagcatg 1320
ccgaatatcc tgaaggcaag cgccgttatt tgtcgcctga tgaacgatat cgtctctcac 1380
aagtttgagc aggaacgcgg ccacgttgcg agcgcgatcg agtgctacat ggagcaaaat 1440
cacttatctg agtacgaggc actgatcgcc ttacgtaagc agatcgatga tctgtggaaa 1500
gacatggtcg aaaactactg tgcggtgatc acggaggacg aggttccgcg cggcgtcctg 1560
atgcgcgtgt taaatttaac ccgtttattt aacgtgattt acaaagatgg cgatggctat 1620
acgcagtctc atggtagcac gaaggcacat attaagagcc tgttagttga ctctgttcca 1680
ttataa 1686
<210> 67
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_Pt_Ec coding sequence
<400> 67
atgagctctt tagcggttga tgacgccgaa cgccgtgtgg gcgactacca cccgaactta 60
tgggacgacg cactgatcca gagcttaagc acgccatacg gcgcaagccc gtatcgcgat 120
gttgccgaga agctgatcgg cgagatcaag gagatgtttg cgagcatctc tatcgaggat 180
ggcgatgacg agatctgcta cttcctgcag cgcctgtgga tgattgacaa cgtcgagcgc 240
ctgggcatta gccgtcattt cgaaaatgag attaaggcgg cgatggagga cgtgtattct 300
cgtcattgga gcgacaaagg catcgcgtgt ggccgccaca gcgtggttgc agacctgaac 360
tctaccgcac tggcgttccg caccctgcgc ctgcacggct acagcgtttg cagcgacgtg 420
ttcaagattt tccaagatca gaaaggtgag ttcgcatgtt ctgcggatca gaccgagggt 480
gagattaaag gcattctgaa cctgttacgc gccagcctga tcgcctttcc gggcgagcgt 540
atcctgcagg aggccgagat ctttgcgacg acctatctga aagaggcctt accgaagatc 600
cagggcagcc gcttatctca ggaaattgaa tacgtgctgg agtacggctg gctgaccgat 660
ctgccgcgcc tggagacgcg taactacatc gaggtcctgg ccgaggagat cacgccgtac 720
ttcaagaagc cgtgcatggc cgtcgagaaa ctgctgaaac tggcgaaaat cgagttcaac 780
ctgtttcaca gcctgcagca aaccgagctg aagcacctgt ctcgctggtg gaaggacagc 840
ggttttgcgc agctgacgtt cacgcgtcac cgccatgttg aattttatac cctggccagc 900
tgcatcgcca tggagccgaa gcactctgcg ttccgcctgg gcttcgccaa actgtgctat 960
ctgggcatcg tgctggacga tatctatgac acctacggca agatggagga gctggagctg 1020
ttcaccgcgg caatcaaacg ttgggatacg agcacgacgg agtgcctgcc ggagtacatg 1080
aagggcgttt acatggcgtt ttatgactgt gtcaacgaga tggcccgcca agcagagaag 1140
acccaaggct gggacaccct ggactacgcg cgcaagacct gggaggccct gatcgacgca 1200
ttcatggagg aggcgaagtg gatcagctct ggctacgtcc caaccttcca gaagtacctg 1260
gacaacggca aggtcagctt cggttaccgt gcagcgacgc tgcagccaat cttaacgctg 1320
gacatcccgc tgccgctgca catcctgcaa gagattgact tcccgagcag cttcaacgac 1380
ctggcgagct ctattctgcg cttacgtggc gacatttgcg gttatcaggc cgaacgttct 1440
cgtggtgagc aggcgtctag catcagctgc tacatgaagg ataacccggg tagcacggaa 1500
gaggatgccc tgagccacgt caacgccatg atcggcgaca agatcccgga gttcaattgg 1560
gagttcatga aaccaagcaa ggccccgatt agcagcaaaa agtacgcctt cgacatcctg 1620
cgcgcattct accacctgta caagtaccgc gatggcttca gcatcgccaa gatcgagacc 1680
aaaaaactgg tgatgcgcac ggtcctggac ccggtcccaa tgtaa 1725
<210> 68
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_Aa_Sc coding sequence
<400> 68
atgtcaactt tgcctatttc ttctgtgtca ttttcctctt ctacatcacc attagtcgtg 60
gacgacaaag tctcaaccaa gcccgacgtt atcagacata caatgaattt caatgcttct 120
atttggggag atcaattctt gacctatgat gagcctgaag atttagttat gaagaaacaa 180
ttagtggagg aattaaaaga ggaagttaag aaggaattga taactatcaa aggttcaaat 240
gagcccatgc agcatgtgaa attgattgaa ttaattgatg ctgttcaacg tttaggtata 300
gcttaccatt ttgaagaaga gatcgaggaa gctttgcaac atatacatgt tacctatggt 360
gaacagtggg tggataagga aaatttacag agtatttcat tgtggttcag gttgttgcgt 420
caacagggct ttaacgtctc ctctggcgtt ttcaaagact ttatggacga aaaaggtaaa 480
ttcaaagagt ctttatgcaa tgatgcacaa ggaatattag ccttatatga agctgcattt 540
atgagggttg aagatgaaac catcttagac aatgctttgg aattcacaaa agttcattta 600
gatatcatag caaaagaccc atcttgcgat tcttcattgc gtacacaaat ccatcaagcc 660
ttaaaacaac ctttaagaag gagattagca aggattgaag cattacatta catgccaatc 720
taccaacagg aaacatctca tgatgaagta ttgttgaaat tagccaagtt ggatttcagt 780
gttttgcagt ctatgcataa aaaggaattg tcacatatct gtaagtggtg gaaagattta 840
gatttacaaa ataagttacc ttatgtacgt gatcgtgttg tcgaaggcta cttctggata 900
ttgtccatat actatgagcc acaacacgct agaacaagaa tgtttttgat gaaaacatgc 960
atgtggttag tagttttgga cgatactttt gataattatg gaacatacga agaattggag 1020
atttttactc aagccgtcga gagatggtct atctcatgct tagatatgtt gcccgaatat 1080
atgaaattaa tctaccaaga attagtcaat ttgcatgtgg aaatggaaga atctttggaa 1140
aaggagggaa agacctatca gattcattac gttaaggaga tggctaaaga attagttcgt 1200
aattacttag tagaagcaag atggttgaag gaaggttata tgcctacttt agaagaatac 1260
atgtctgttt ctatggttac tggtacttat ggtttgatga ttgcaaggtc ctatgttggc 1320
agaggagaca ttgttactga agacacattc aaatgggttt ctagttaccc acctattatt 1380
aaagcttcct gtgtaatagt aagattaatg gacgatattg tatctcacaa ggaagaacaa 1440
gaaagaggac atgtggcttc atctatagaa tgttactcta aagaatcagg tgcttctgaa 1500
gaggaagcat gtgaatatat tagtaggaaa gttgaggatg cctggaaagt aatcaataga 1560
gaatctttgc gtccaacagc cgttcccttc cctttgttaa tgccagcaat aaacttagct 1620
agaatgtgtg aggtcttgta ctctgttaat gatggtttta ctcatgctga gggtgacatg 1680
aaatcttata tgaagtcctt cttcgttcat cctatggtcg tttga 1725
<210> 69
<211> 7348
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM178
<400> 69
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatgcttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa aagagaatct 660
ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc ggtggtactg 720
ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt aactgcatct 780
tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat tgcagcagac 840
aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga accgtggcat 900
ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga cgcagatggc 960
aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc accaaacatg 1020
ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat catggcggca 1080
gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat ggtttcctcc 1140
acagtttttc tccataatct tgaagaggcc aaaagattag ctttatccaa ggaccaaata 1200
ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat tctttgcact 1260
tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc ttcctttctc 1320
ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt acctttagca 1380
aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt acatggtctt 1440
aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc aggtctaaca 1500
ctaccggtac cccatttagg accagccaca gcacctaaca aaacggcatc aaccttcttg 1560
gaggcttcca gcgcctcatc tggaagtgga acacctgtag catcgatagc agcaccacca 1620
attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat agctttaaga 1680
accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa aacgacgatc 1740
ttcttagggg cagacattac aatggtatat ccttgaaata tatataaaaa aaggcgcctt 1800
agaccgctcg gccaaacaac caattacttg ttgagaaata gagtataatt atcctataaa 1860
tataacgttt ttgaacacac atgaacaagg aagtacagga caattgattt tgaagagaat 1920
gtggattttg atgtaattgt tgggattcca tttttaataa ggcaataata ttaggtatgt 1980
ggatatacta gaagttctcc tcgaccgtcg atatgcggtg tgaaataccg cacagatgcg 2040
taaggagaaa ataccgcatc aggaaattgt aaacgttaat attttgttaa aattcgcgtt 2100
aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 2160
taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 2220
actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 2280
cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact 2340
aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt 2400
ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc 2460
ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc 2520
gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 2580
gctattacgc cagctgaatt ggagcgacct catgctatac ctgagaaagc aacctgacct 2640
acaggaaaga gttactcaag aataagaatt ttcgttttaa aacctaagag tcactttaaa 2700
atttgtatac acttattttt tttataactt atttaataat aaaaatcata aatcataaga 2760
aattcgctta tttagaagtg tcaacaacgt atctaccaac gatttgaccc ttttccatct 2820
tttcgtaaat ttctggcaag gtagacaagc cgacaacctt gattggagac ttgaccaaac 2880
ctctggcgaa gaattgttaa ttaagagctc agatcttatc gtcgtcatcc ttgtaatcca 2940
tcgatactag tgcggccgcc ctttagtgag ggttgaattc gaattttcaa aaattcttac 3000
tttttttttg gatggacgca aagaagttta ataatcatat tacatggcat taccaccata 3060
tacatatcca tatacatatc catatctaat cttacttata tgttgtggaa atgtaaagag 3120
ccccattatc ttagcctaaa aaaaccttct ctttggaact ttcagtaata cgcttaactg 3180
ctcattgcta tattgaagta cggattagaa gccgccgagc gggtgacagc cctccgaagg 3240
aagactctcc tccgtgcgtc ctcgtcttca ccggtcgcgt tcctgaaacg cagatgtgcc 3300
tcgcgccgca ctgctccgaa caataaagat tctacaatac tagcttttat ggttatgaag 3360
aggaaaaatt ggcagtaacc tggccccaca aaccttcaaa tgaacgaatc aaattaacaa 3420
ccataggatg ataatgcgat tagtttttta gccttatttc tggggtaatt aatcagcgaa 3480
gcgatgattt ttgatctatt aacagatata taaatgcaaa aactgcataa ccactttaac 3540
taatactttc aacattttcg gtttgtatta cttcttattc aaatgtaata aaagtatcaa 3600
caaaaaattg ttaatatacc tctatacttt aacgtcaagg agaaaaaacc ccggatccgt 3660
aatacgactc actatagggc ccgggcgtcg acatggaaca gaagttgatt tccgaagaag 3720
acctcgagta agcttggtac cgcggctagc taagatccgc tctaaccgaa aaggaaggag 3780
ttagacaacc tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa 3840
cgttatttat atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca 3900
ttatactgaa aaccttgctt gagaaggttt tgggacgctc gaagatccag ctgcattaat 3960
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 4020
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 4080
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 4140
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 4200
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 4260
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 4320
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 4380
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 4440
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4500
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4560
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4620
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4680
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4740
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4800
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 4860
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 4920
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 4980
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 5040
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 5100
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 5160
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 5220
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 5280
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 5340
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 5400
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 5460
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 5520
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 5580
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 5640
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 5700
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 5760
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 5820
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 5880
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgaac 5940
gaagcatctg tgcttcattt tgtagaacaa aaatgcaacg cgagagcgct aatttttcaa 6000
acaaagaatc tgagctgcat ttttacagaa cagaaatgca acgcgaaagc gctattttac 6060
caacgaagaa tctgtgcttc atttttgtaa aacaaaaatg caacgcgaga gcgctaattt 6120
ttcaaacaaa gaatctgagc tgcattttta cagaacagaa atgcaacgcg agagcgctat 6180
tttaccaaca aagaatctat acttcttttt tgttctacaa aaatgcatcc cgagagcgct 6240
atttttctaa caaagcatct tagattactt tttttctcct ttgtgcgctc tataatgcag 6300
tctcttgata actttttgca ctgtaggtcc gttaaggtta gaagaaggct actttggtgt 6360
ctattttctc ttccataaaa aaagcctgac tccacttccc gcgtttactg attactagcg 6420
aagctgcggg tgcatttttt caagataaag gcatccccga ttatattcta taccgatgtg 6480
gattgcgcat actttgtgaa cagaaagtga tagcgttgat gattcttcat tggtcagaaa 6540
attatgaacg gtttcttcta ttttgtctct atatactacg tataggaaat gtttacattt 6600
tcgtattgtt ttcgattcac tctatgaata gttcttacta caattttttt gtctaaagag 6660
taatactaga gataaacata aaaaatgtag aggtcgagtt tagatgcaag ttcaaggagc 6720
gaaaggtgga tgggtaggtt atatagggat atagcacaga gatatatagc aaagagatac 6780
ttttgagcaa tgtttgtgga agcggtattc gcaatatttt agtagctcgt tacagtccgg 6840
tgcgtttttg gttttttgaa agtgcgtctt cagagcgctt ttggttttca aaagcgctct 6900
gaagttccta tactttctag agaataggaa cttcggaata ggaacttcaa agcgtttccg 6960
aaaacgagcg cttccgaaaa tgcaacgcga gctgcgcaca tacagctcac tgttcacgtc 7020
gcacctatat ctgcgtgttg cctgtatata tatatacatg agaagaacgg catagtgcgt 7080
gtttatgctt aaatgcgtac ttatatgcgt ctatttatgt aggatgaaag gtagtctagt 7140
acctcctgtg atattatccc attccatgcg gggtatcgta tgcttccttc agcactaccc 7200
tttagctgtt ctatatgctg ccactcctca attggattag tctcatcctt caatgctatc 7260
atttcctttg atattggatc atactaagaa accattatta tcatgacatt aacctataaa 7320
aataggcgta tcacgaggcc ctttcgtc 7348
<210> 70
<211> 1125
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, TDS_Fs_Sc coding sequence
<400> 70
atggaaaact ttccaaccga gtacttcttg aacaccaccg tcaggttgtt ggagtacatt 60
aggtacaggg actcaaacta taccagggag gagaggattg agaacttaca ctacgcctac 120
aacaaagccg cccaccactt cgcccagcca agacagcagc agttgttgaa ggtcgaccct 180
aagagattgc aagcttcatt gcagaccatt gtcggtatgg ttgtatattc atgggccaag 240
gtatctaaag agtgtatggc agacttgtca atccactata cctacacctt ggtattggac 300
gattcaaaag acgacccata ccctactatg gtaaactact tcgatgactt acaagcaggt 360
agagaacagg ctcatccttg gtgggcttta gtaaacgagc actttccaaa cgtattgagg 420
cattttggtc ctttttgctc attgaacttg atcaggtcta ccttagactt cttcgagggt 480
tgctggatag aacaatacaa ttttggagga ttcccaggtt ctcacgacta cccacagttc 540
ttgagaagaa tgaacggttt aggacactgc gtcggtgcct ctttgtggcc aaaggagcag 600
ttcaatgaaa gatcattgtt tttggagatc acttcagcca tagctcaaat ggaaaattgg 660
atggtctggg ttaatgattt gatgtcattt tacaaggagt tcgacgacga gagggatcag 720
atctctttgg taaagaacta cgttgtttct gacgagatat cattacacga ggccttagaa 780
aaattgaccc aggatacctt gcactcttca aagcaaatgg ttgcagtttt ctcagacaag 840
gaccctcaag taatggacac catagagtgc ttcatgcatg gttatgtcac atggcattta 900
tgcgacagga ggtacaggtt gtctgaaatc tacgagaaag tcaaggagga aaagactgag 960
gatgcccaaa aattttgcaa gttctacgag caagctgcca atgtaggagc cgtttcacct 1020
tctgagtggg cctatccacc agtcgcccag ttagctaacg taagatcaaa ggacgtcaaa 1080
gaggtccaga aaccattttt atcatctata gaattagttg aataa 1125
<210> 71
<211> 1788
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, IS_Pn_Sc coding sequence
<400> 71
atggctaccg agttgttgtg cttgcacagg ccaatatctt tgacccacaa attgttcagg 60
aatccattgc caaaagtcat acaagcaaca ccattgacct tgaagttaag gtgctctgta 120
tcaaccgaga acgtttcatt cacagagaca gaaacagaaa caaggaggtc agctaattac 180
gagccaaact catgggatta tgactacttg ttgtcttctg acaccgacga gtctattgag 240
gtatataaag acaaggcaaa gaagttggag gctgaagtca ggagggagat caacaacgaa 300
aaggcagagt tcttgacttt gccagagttg attgacaacg tacagaggtt gggattgggt 360
tataggtttg agtcagacat aagaagggct ttggacaggt ttgtatcttc aggtggattc 420
gacgcagtta ctaagacctc attgcatgct accgctttat cttttaggtt attgagacag 480
catggtttcg aagtatcaca ggaggcattc tcaggattca aagaccagaa cggaaacttt 540
ttgaagaact tgaaggagga cataaaagcc atcttgtctt tatacgaagc ctcatttttg 600
gccttagagg gtgagaatat tttagacgag gctaaggtct tcgccatatc tcacttgaag 660
gagttgtctg aggagaaaat aggaaaggac ttagccgaac aagtaaacca cgcattggaa 720
ttaccattgc ataggagaac tcaaaggtta gaagcagtct ggtctatcga ggcctacagg 780
aagaaagagg atgctgatca ggttttattg gagttggcca tcttagacta caacatgatc 840
cagtcagtct atcagagaga cttgagagaa acttctaggt ggtggagaag agtcggatta 900
gccactaaat tgcacttcgc tagggatagg ttaatagagt cattctattg ggctgttgga 960
gtagcttttg aaccacaata ctcagattgt aggaactcag tagccaagat gttctcattc 1020
gtcaccataa tcgatgacat ctacgacgta tacggaactt tggatgaatt ggaattattc 1080
actgatgcag tcgagagatg ggacgtaaat gccattgatg acttgcctga ttacatgaag 1140
ttgtgcttct tagctttgta caacaccata aacgagatcg catacgacaa cttgaaggac 1200
aagggtgaaa atatattgcc ttacttaacc aaggcctggg ctgatttgtg taacgcattc 1260
ttacaggaag caaaatggtt gtataacaaa tcaacaccta ctttcgacga gtattttggt 1320
aacgcttgga agtcttcatc tggaccttta caattggtat ttgcttactt cgccgtcgta 1380
caaaacatta agaaagagga gattgataac ttgcaaaagt accacgatat catctcaaga 1440
ccatcacaca ttttcaggtt atgtaacgac ttggcctctg cttcagctga aatagctaga 1500
ggagagactg caaattcagt ttcatgttac atgaggacca agggtatatc agaagaatta 1560
gcaaccgaat ctgtcatgaa tttaatcgac gagacctgga agaagatgaa caaggaaaag 1620
ttgggaggtt ctttattcgc aaaacctttt gtcgaaacag ccatcaattt agccaggcag 1680
tcacactgta catatcacaa tggtgatgcc cacacctcac ctgacgagtt gaccaggaaa 1740
agagttttgt cagttattac tgaacctata ttaccttttg agaggtga 1788
<210> 72
<211> 9905
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM1812
<400> 72
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagtatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 120
aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 180
catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 240
gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 300
tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 360
gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 420
cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 480
gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 540
ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 600
ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 660
acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta gtaagaacta 720
ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 780
agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 840
actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 900
ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 960
caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 1020
acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 1080
gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 1140
aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt ctgttctgta 1200
aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgtttt 1260
acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg catttctgtt 1320
ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 1380
gttctacaaa atgaagcaca gatgcttcgt tcaggtggca cttttcgggg aaatgtgcgc 1440
ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 1500
taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 1560
cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 1620
acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 1680
ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 1740
atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 1800
gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 1860
acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 1920
atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 1980
accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 2040
ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2100
acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2160
gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 2220
tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 2280
ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 2340
actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 2400
taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 2460
tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 2520
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 2580
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 2640
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 2700
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 2760
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 2820
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 2880
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 2940
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 3000
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 3060
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 3120
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 3180
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 3240
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 3300
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 3360
ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggatcttcga gcgtcccaaa 3420
accttctcaa gcaaggtttt cagtataatg ttacatgcgt acacgcgtct gtacagaaaa 3480
aaaagaaaaa tttgaaatat aaataacgtt cttaatacta acataactat aaaaaaataa 3540
atagggacct agacttcagg ttgtctaact ccttcctttt cggttagagc ggatcttagc 3600
tagctcaaac gaccatagga tgaacgaaga aggacttcat ataagatttc atgtcaccct 3660
cagcatgagt aaaaccatca ttaacagagt acaagacctc acacattcta gctaagttta 3720
ttgctggcat taacaaaggg aagggaacgg ctgttggacg caaagattct ctattgatta 3780
ctttccaggc atcctcaact ttcctactaa tatattcaca tgcttcctct tcagaagcac 3840
ctgattcttt agagtaacat tctatagatg aagccacatg tcctctttct tgttcttcct 3900
tgtgagatac aatatcgtcc attaatctta ctattacaca ggaagcttta ataataggtg 3960
ggtaactaga aacccatttg aatgtgtctt cagtaacaat gtctcctctg ccaacatagg 4020
accttgcaat catcaaacca taagtaccag taaccataga aacagacatg tattcttcta 4080
aagtaggcat ataaccttcc ttcaaccatc ttgcttctac taagtaatta cgaactaatt 4140
ctttagccat ctccttaacg taatgaatct gataggtctt tccctccttt tccaaagatt 4200
cttccatttc cacatgcaaa ttgactaatt cttggtagat taatttcata tattcgggca 4260
acatatctaa gcatgagata gaccatctct cgacggcttg agtaaaaatc tccaattctt 4320
cgtatgttcc ataattatca aaagtatcgt ccaaaactac taaccacatg catgttttca 4380
tcaaaaacat tcttgttcta gcgtgttgtg gctcatagta tatggacaat atccagaagt 4440
agccttcgac aacacgatca cgtacataag gtaacttatt ttgtaaatct aaatctttcc 4500
accacttaca gatatgtgac aattcctttt tatgcataga ctgcaaaaca ctgaaatcca 4560
acttggctaa tttcaacaat acttcatcat gagatgtttc ctgttggtag attggcatgt 4620
aatgtaatgc ttcaatcctt gctaatctcc ttcttaaagg ttgttttaag gcttgatgga 4680
tttgtgtacg caatgaagaa tcgcaagatg ggtcttttgc tatgatatct aaatgaactt 4740
ttgtgaattc caaagcattg tctaagatgg tttcatcttc aaccctcata aatgcagctt 4800
catataaggc taatattcct tgtgcatcat tgcataaaga ctctttgaat ttaccttttt 4860
cgtccataaa gtctttgaaa acgccagagg agacgttaaa gccctgttga cgcaacaacc 4920
tgaaccacaa tgaaatactc tgtaaatttt ccttatccac ccactgttca ccataggtaa 4980
catgtatatg ttgcaaagct tcctcgatct cttcttcaaa atggtaagct atacctaaac 5040
gttgaacagc atcaattaat tcaatcaatt tcacatgctg catgggctca tttgaacctt 5100
tgatagttat caattccttc ttaacttcct cttttaattc ctccactaat tgtttcttca 5160
taactaaatc ttcaggctca tcataggtca agaattgatc tccccaaata gaagcattga 5220
aattcattgt atgtctgata acgtcgggct tggttgagac tttgtcgtcc acgactaatg 5280
gtgatgtaga agaggaaaat gacacagaag aaataggcaa agttgacatg gatccggggt 5340
tttttctcct tgacgttaaa gtatagaggt atattaacaa ttttttgttg atacttttat 5400
tacatttgaa taagaagtaa tacaaaccga aaatgttgaa agtattagtt aaagtggtta 5460
tgcagttttt gcatttatat atctgttaat agatcaaaaa tcatcgcttc gctgattaat 5520
taccccagaa ataaggctaa aaaactaatc gcattatcat cctatggttg ttaatttgat 5580
tcgttcattt gaaggtttgt ggggccaggt tactgccaat ttttcctctt cataaccata 5640
aaagctagta ttgtagaatc tttattgttc ggagcagtgc ggcgcgaggc acatctgcgt 5700
ttcaggaacg cgaccggtga agacgaggac gcacggagga gagtcttcct tcggagggct 5760
gtcacccgct cggcggcttc taatccgtac ttcaatatag caatgagcag ttaagcgtat 5820
tactgaaagt tccaaagaga aggttttttt aggctaagat aatggggctc tttacatttc 5880
cacaacatat aagtaagatt agatatggat atgtatatgg atatgtatat ggtggtaatg 5940
ccatgtaata tgattattaa acttctttgc gtccatccaa aaaaaaagta agaatttttg 6000
aaaattcgaa ttcatggaaa actttccaac cgagtacttc ttgaacacca ccgtcaggtt 6060
gttggagtac attaggtaca gggactcaaa ctataccagg gaggagagga ttgagaactt 6120
acactacgcc tacaacaaag ccgcccacca cttcgcccag ccaagacagc agcagttgtt 6180
gaaggtcgac cctaagagat tgcaagcttc attgcagacc attgtcggta tggttgtata 6240
ttcatgggcc aaggtatcta aagagtgtat ggcagacttg tcaatccact atacctacac 6300
cttggtattg gacgattcaa aagacgaccc ataccctact atggtaaact acttcgatga 6360
cttacaagca ggtagagaac aggctcatcc ttggtgggct ttagtaaacg agcactttcc 6420
aaacgtattg aggcattttg gtcctttttg ctcattgaac ttgatcaggt ctaccttaga 6480
cttcttcgag ggttgctgga tagaacaata caattttgga ggattcccag gttctcacga 6540
ctacccacag ttcttgagaa gaatgaacgg tttaggacac tgcgtcggtg cctctttgtg 6600
gccaaaggag cagttcaatg aaagatcatt gtttttggag atcacttcag ccatagctca 6660
aatggaaaat tggatggtct gggttaatga tttgatgtca ttttacaagg agttcgacga 6720
cgagagggat cagatctctt tggtaaagaa ctacgttgtt tctgacgaga tatcattaca 6780
cgaggcctta gaaaaattga cccaggatac cttgcactct tcaaagcaaa tggttgcagt 6840
tttctcagac aaggaccctc aagtaatgga caccatagag tgcttcatgc atggttatgt 6900
cacatggcat ttatgcgaca ggaggtacag gttgtctgaa atctacgaga aagtcaagga 6960
ggaaaagact gaggatgccc aaaaattttg caagttctac gagcaagctg ccaatgtagg 7020
agccgtttca ccttctgagt gggcctatcc accagtcgcc cagttagcta acgtaagatc 7080
aaaggacgtc aaagaggtcc agaaaccatt tttatcatct atagaattag ttgaataagc 7140
gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa taagtgtata 7200
caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga gtaactcttt 7260
cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctccaattc agctggcgta 7320
atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat 7380
ggcgcgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 7440
tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 7500
tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 7560
gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta 7620
gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 7680
atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg 7740
atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 7800
aatttaacgc gaattttaac aaaatattaa cgtttacaat ttcctgatgc ggtattttct 7860
ccttacgcat ctgtgcggta tttcacaccg catatcgacg gtcgaggaga acttctagta 7920
tatccacata cctaatatta ttgccttatt aaaaatggaa tcccaacaat tacatcaaaa 7980
tccacattct cttcaaaatc aattgtcctg tacttccttg ttcatgtgtg ttcaaaaacg 8040
ttatatttat aggataatta tactctattt ctcaacaagt aattggttgt ttggccgagc 8100
ggtctaaggc gccttttttt atatatattt caaggatata ccattgtaat gtctgcccct 8160
aagaagatcg tcgttttgcc aggtgaccac gttggtcaag aaatcacagc cgaagccatt 8220
aaggttctta aagctatttc tgatgttcgt tccaatgtca agttcgattt cgaaaatcat 8280
ttaattggtg gtgctgctat cgatgctaca ggtgttccac ttccagatga ggcgctggaa 8340
gcctccaaga aggttgatgc cgttttgtta ggtgctgtgg ctggtcctaa atggggtacc 8400
ggtagtgtta gacctgaaca aggtttacta aaaatccgta aagaacttca attgtacgcc 8460
aacttaagac catgtaactt tgcatccgac tctcttttag acttatctcc aatcaagcca 8520
caatttgcta aaggtactga cttcgttgtt gtcagagaat tagtgggagg tatttacttt 8580
ggtaagagaa aggaagacga tggtgatggt gtcgcttggg atagtgaaca atacaccgtt 8640
ccagaagtgc aaagaatcac aagaatggcc gctttcatgg ccctacaaca tgagccacca 8700
ttgcctattt ggtccttgga taaagctaat cttttggcct cttcaagatt atggagaaaa 8760
actgtggagg aaaccatcaa gaacgaattc cctacattga aggttcaaca tcaattgatt 8820
gattctgccg ccatgatcct agttaagaac ccaacccacc taaatggtat tataatcacc 8880
agcaacatgt ttggtgatat catctccgat gaagcctccg ttatcccagg ttccttgggt 8940
ttgttgccat ctgcgtcctt ggcctctttg ccagacaaga acaccgcatt tggtttgtac 9000
gaaccatgcc acggttctgc tccagatttg ccaaagaata aggttgaccc tatcgccact 9060
atcttgtctg ctgcaatgat gttgaaattg tcattgaact tgcctgaaga aggtaaggcc 9120
attgaagatg cagttaaaaa ggttttggat gcaggtatca gaactggtga tttaggtggt 9180
tccaacagta ccaccgaagt cggtgatgct gtcgccgaag aagttaagaa aatccttgct 9240
taaaaagatt ctcttttttt atgatatttg tacataaact ttataaatga aattcataat 9300
agaaacgaca cgaaattaca aaatggaata tgttcatagg gtagacgaaa ctatatacgc 9360
aatctacata catttatcaa gaaggagaaa aaggaggata gtaaaggaat acaggtaagc 9420
aaattgatac taatggctca acgtgataag gaaaaagaat tgcactttaa cattaatatt 9480
gacaaggagg agggcaccac acaaaaagtt aggtgtaaca gaaaatcatg aaactacgat 9540
tcctaatttg atattggagg attttctcta aaaaaaaaaa aatacaacaa ataaaaaaca 9600
ctcaatgacc tgaccatttg atggagttta agtcaatacc ttcttgaagc atttcccata 9660
atggtgaaag ttccctcaag aattttactc tgtcagaaac ggccttacga cgtagtcgat 9720
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc 9780
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca 9840
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg 9900
cgcga 9905
<210> 73
<211> 2307
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_Ad_Sc coding sequence
<400> 73
atggaacctc tgctattctc aatccaaaca ctagtgcatc aagtgaaaca ggaaattttc 60
tcatctactt ttgatttgta tagctttgta agcccatctg cctatgatac agcatggtta 120
gccatgattc cccatccaaa acaaaactct tgccctaaat ttaaaggctg tttggattgg 180
atcttagata accaaaagga agcaggatac tggggtgaat gtgatcacga tggattacca 240
actatagata gcctgcccgc aactctagcc tgtatggtag ctttgaagac gtggggtgtg 300
tcagagaagc atataaataa aggacttgct tttattcacg caaactcaac cacattgttg 360
aaagaaaaat acgaccattt gccaaggtgg tttgtcatag tttttcccgc gatggtcgaa 420
gtcgctcaag ccgccggcct aaaagttttg tttagtaacg gattagaaga ggtggttctt 480
aatatttctc tggaaagaga aaaaatacta gaaagagaag agttcgtcga taaatatcat 540
tacccacctc ttgcatctta tttagaagcc ctgcctccaa gttataccat agacagaaag 600
gatataacta tgaacctatc aggcgatggc tcctgctttc agtccccgtc agctactgct 660
tgcgcctttt tggcaaccgg aaatcaaaaa tgcatggctt acctggaatc tttggtacag 720
aagagacccg gtggtgtgcc gaccatgtat ccgatggatg gagaattggt gagcctttgc 780
ttagtaaatc aaattcaaag attgggttta gcggagcatt tcacagaaga aattgaggag 840
aatttaaaat tgatatatga aaattataag aaccaagaat cacgtgaaat gaaagattca 900
tatttggtgc caactaagat ttataaggat agtttagcct tcagattgct acgtatgcac 960
ggttataatg ttacgcccag acgtttctgt tggtttttat accaagaaga tatacgtgtc 1020
cacatagaga aaaattacga gtgttttaca tcagcgctgt acaatgtcta ccgtgccaca 1080
gacttaatgt tttctggtga atatgaattg gaagaagcca gggtcttctc taggaaattg 1140
ctggagaaat caatgaaatt gaagtcttta aacgataatt tggttaattt tccatctttc 1200
aggtcagtta ttgatcatga gttgtctgtg ccttggatcg cccgtttgga gcatcttgat 1260
catagaatgt ggattgaaga aaataaggtg gatacacttt ggatcggtaa agcctctttt 1320
tatcgtctgc gtgcgcttaa cgataagtta atgacattag ctgtggagtc atataagttt 1380
agacaatctt tttatagaaa cgaacttgaa gaattgaaaa gatggagtaa ggactggggt 1440
ttgacagatt taggattcgg tagaaaaaaa acgacatatt gttattatgc aattgctgct 1500
tcctctagtt taccacacaa ttctatggtc agattgattg tggcaaaatc cgcattactt 1560
gtgaccattg cagatgattt ctttgatatg gaagggtccc tagaggattt acaaagtttg 1620
acacaggctg tacaaagatg ggatggcaac agtttgtccg gtcacggtaa aataatattc 1680
tgcgcattag acaacttggt tagtgatatc gccaaacccc atttacacct agaagggtca 1740
catgtagccg agaatgtcaa aaacatgtgg tctgaaacta tcgccagctg gttgactgag 1800
actacctgga gtcacacagg ttacgtccct agtctggatg aatacctaca gacaggtaag 1860
atttctgttg cttctcagtt gatgaccgtc ccagctttat gttttttatc tccaaacgtt 1920
caccctatct gtaagcttga agctaatcac tatcaaatta taactaagtt gttgatggtc 1980
tctacaagat tgcttaacga tactcaaaca tacgaaaagg agttaaaaga cggtaaaaga 2040
aattttgtta tccttcattc taaggggtca ccacagacag gaatcgagaa atcagttgct 2100
tttgttaagg aaattttgga tcaaatagaa aaagagttct tagaacatac tttgatggac 2160
ggtcataacg atctacctaa gccttgtaag catttacatt tgtctatatt aagagcattt 2220
cacatgttct ataactcagg agacttattc gatagcgata caggattgct tcatgatatc 2280
aataaggcgt tttatgtccc cttgtaa 2307
<210> 74
<211> 8671
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM1764
<400> 74
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatggttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa aagagaatct 660
ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc ggtggtactg 720
ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt aactgcatct 780
tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat tgcagcagac 840
aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga accgtggcat 900
ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga cgcagatggc 960
aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc accaaacatg 1020
ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat catggcggca 1080
gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat ggtttcctcc 1140
acagtttttc tccataatct tgaagaggcc aaaacattag ctttatccaa ggaccaaata 1200
ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat tctttgcact 1260
tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc ttcctttctc 1320
ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt acctttagca 1380
aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt acatggtctt 1440
aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc aggtctaaca 1500
ctaccggtac cccatttagg accacccaca gcacctaaca aaacggcatc aaccttcttg 1560
gaggcttcca gcgcctcatc tggaagtggg acacctgtag catcgatagc agcaccacca 1620
attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat agctttaaga 1680
accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa aacgacgatc 1740
ttcttagggg cagacatagg ggcagacatt agaatggtat atccttgaaa tatatatata 1800
tattgctgaa atgtaaaagg taagaaaagt tagaaagtaa gacgattgct aaccacctat 1860
tggaaaaaac aataggtcct taaataatat tgtcaacttc aagtattgtg atgcaagcat 1920
ttagtcatga acgcttctct attctatatg aaaagccggt tccggcctct cacctttcct 1980
ttttctccca atttttcagt tgaaaaaggt atatgcgtca ggcgacctct gaaattaaca 2040
aaaaatttcc agtcatcgaa tttgattctg tgcgatagcg cccctgtgtg ttctcgttat 2100
gttgaggaaa aaaataatgg ttgctaagag attcgaactc ttgcatctta cgatacctga 2160
gtattcccac agttaactgc ggtcaagata tttcttgaat caggcgcctt agaccgctcg 2220
gccaaacaac caattacttg ttgagaaata gagtataatt atcctataaa tataacgttt 2280
ttgaacacac atgaacaagg aagtacagga caattgattt tgaagagaat gtggattttg 2340
atgtaattgt tgggattcca tttttaataa ggcaataata ttaggtatgt ggatatacta 2400
gaagttctcc tcgaccgtcg atatgcggtg tgaaataccg cacagatgcg taaggagaaa 2460
ataccgcatc aggaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt 2520
taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa 2580
gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag 2640
aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt 2700
gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac 2760
cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag 2820
gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg 2880
cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc gcgccattcg 2940
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 3000
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3060
cagtcacgac gttgtaaaac gacggccagt gagcgcgcgt aatacgactc actatagggc 3120
gaattgggta ccgggccccc cctcgaggtc gacggtatcg ataagctcta gagcggccgc 3180
cctttagtga gggttgaatt cgaattttca aaaattctta cttttttttt ggatggacgc 3240
aaagaagttt aataatcata ttacatggca ttaccaccat atacatatcc atatacatat 3300
ccatatctaa tcttacttat atgttgtgga aatgtaaaga gccccattat cttagcctaa 3360
aaaaaccttc tctttggaac tttcagtaat acgcttaact gctcattgct atattgaagt 3420
acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc ctccgtgcgt 3480
cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc actgctccga 3540
acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat tggcagtaac 3600
ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat gataatgcga 3660
ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt tttgatctat 3720
taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt caacattttc 3780
ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt gttaatatac 3840
ctctatactt taacgtcaag gagaaaaaac cccggatcca tggatacttt gcctatttct 3900
tctgtgtcat tttcctcttc tacatcacca ttagtcgtgg acgacaaagt ctcaaccaag 3960
cccgacgtta tcagacatac aatgaatttc aatgcttcta tttggggaga tcaattcttg 4020
acctatgatg agcctgaaga tttagttatg aagaaacaat tagtggagga attaaaagag 4080
gaagttaaga aggaattgat aactatcaaa ggttcaaatg agcccatgca gcatgtgaaa 4140
ttgattgaat taattgatgc tgttcaacgt ttaggtatag cttaccattt tgaagaagag 4200
atcgaggaag ctttgcaaca tatacatgtt acctatggtg aacagtgggt ggataaggaa 4260
aatttacaga gtatttcatt gtggttcagg ttgttgcgtc aacagggctt taacgtctcc 4320
tctggcgttt tcaaagactt tatggacgaa aaaggtaaat tcaaagagtc tttatgcaat 4380
gatgcacaag gaatattagc cttatatgaa gctgcattta tgagggttga agatgaaacc 4440
atcttagaca atgctttgga attcacaaaa gttcatttag atatcatagc aaaagaccca 4500
tcttgcgatt cttcattgcg tacacaaatc catcaagcct taaaacaacc tttaagaagg 4560
agattagcaa ggattgaagc attacattac atgccaatct accaacagga aacatctcat 4620
gatgaagtat tgttgaaatt agccaagttg gatttcagtg ttttgcagtc tatgcataaa 4680
aaggaattgt cacatatctg taagtggtgg aaagatttag atttacaaaa taagttacct 4740
tatgtacgtg atcgtgttgt cgaaggctac ttctggatat tgtccatata ctatgagcca 4800
caacacgcta gaacaagaat gtttttgatg aaaacatgca tgtggttagt agttttggac 4860
gatacttttg ataattatgg aacatacgaa gaattggaga tttttactca agccgtcgag 4920
agatggtcta tctcatgctt agatatgttg cccgaatata tgaaattaat ctaccaagaa 4980
ttagtcaatt tgcatgtgga aatggaagaa tctttggaaa aggagggaaa gacctatcag 5040
attcattacg ttaaggagat ggctaaagaa ttagttcgta attacttagt agaagcaaga 5100
tggttgaagg aaggttatat gcctacttta gaagaataca tgtctgtttc tatggttact 5160
ggtacttatg gtttgatgat tgcaaggtcc tatgttggca gaggagacat tgttactgaa 5220
gacacattca aatgggtttc tagttaccca cctattatta aagcttcctg tgtaatagta 5280
agattaatgg acgatattgt atctcacaag gaagaacaag aaagaggaca tgtggcttca 5340
tctatagaat gttactctaa agaatcaggt gcttctgaag aggaagcatg tgaatatatt 5400
agtaggaaag ttgaggatgc ctggaaagta atcaatagag aatctttgcg tccaacagcc 5460
gttcccttcc ctttgttaat gccagcaata aacttagcta gaatgtgtga ggtcttgtac 5520
tctgttaatg atggttttac tcatgctgag ggtgacatga aatcttatat gaagtccttc 5580
ttcgttcatc ctatggtcgt ttgagctagc taagatccgc tctaaccgaa aaggaaggag 5640
ttagacaacc tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa 5700
cgttatttat atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca 5760
ttatactgaa aaccttgctt gagaaggttt tgggacgctc gaagatccag ctgcattaat 5820
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gctcggtgga 5880
gctccagctt ttgttccctt tagtgagggt taattgcgcg cttggcgtaa tcatggtcat 5940
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa 6000
gcataaagtg taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc 6060
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 6120
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 6180
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 6240
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 6300
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 6360
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 6420
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 6480
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 6540
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 6600
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 6660
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 6720
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 6780
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 6840
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 6900
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 6960
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 7020
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 7080
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 7140
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 7200
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 7260
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 7320
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 7380
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 7440
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 7500
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 7560
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 7620
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 7680
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 7740
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 7800
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 7860
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 7920
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 7980
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 8040
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctggg tccttttcat 8100
cacgtgctat aaaaataatt ataatttaaa ttttttaata taaatatata aattaaaaat 8160
agaaagtaaa aaaagaaatt aaagaaaaaa tagtttttgt tttccgaaga tgtaaaagac 8220
tctaggggga tcgccaacaa atactacctt ttatcttgct cttcctgctc tcaggtatta 8280
atgccgaatt gtttcatctt gtctgtgtag aagaccacac acgaaaatcc tgtgatttta 8340
cattttactt atcgttaatc gaatgtatat ctatttaatc tgcttttctt gtctaataaa 8400
tatatatgta aagtacgctt tttgttgaaa ttttttaaac ctttgtttat ttttttttct 8460
tcattccgta actcttctac cttctttatt tactttctaa aatccaaata caaaacataa 8520
aaataaataa acacagagta aattcccaaa ttattccatc attaaaagat acgaggcgcg 8580
tgtaagttac aggcaagcga tccgtcctaa gaaaccatta ttatcatgac attaacctat 8640
aaaaataggc gtatcacgag gccctttcgt c 8671
<210> 75
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1621
<400> 75
cttggcacat cctcttccgt agcttcgagc gtcccaaaac cttc 44
<210> 76
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_S2D_Sc coding sequence
<400> 76
atggatactt tgcctatttc ttctgtgtca ttttcctctt ctacatcacc attagtcgtg 60
gacgacaaag tctcaaccaa gcccgacgtt atcagacata caatgaattt caatgcttct 120
atttggggag atcaattctt gacctatgat gagcctgaag atttagttat gaagaaacaa 180
ttagtggagg aattaaaaga ggaagttaag aaggaattga taactatcaa aggttcaaat 240
gagcccatgc agcatgtgaa attgattgaa ttaattgatg ctgttcaacg tttaggtata 300
gcttaccatt ttgaagaaga gatcgaggaa gctttgcaac atatacatgt tacctatggt 360
gaacagtggg tggataagga aaatttacag agtatttcat tgtggttcag gttgttgcgt 420
caacagggct ttaacgtctc ctctggcgtt ttcaaagact ttatggacga aaaaggtaaa 480
ttcaaagagt ctttatgcaa tgatgcacaa ggaatattag ccttatatga agctgcattt 540
atgagggttg aagatgaaac catcttagac aatgctttgg aattcacaaa agttcattta 600
gatatcatag caaaagaccc atcttgcgat tcttcattgc gtacacaaat ccatcaagcc 660
ttaaaacaac ctttaagaag gagattagca aggattgaag cattacatta catgccaatc 720
taccaacagg aaacatctca tgatgaagta ttgttgaaat tagccaagtt ggatttcagt 780
gttttgcagt ctatgcataa aaaggaattg tcacatatct gtaagtggtg gaaagattta 840
gatttacaaa ataagttacc ttatgtacgt gatcgtgttg tcgaaggcta cttctggata 900
ttgtccatat actatgagcc acaacacgct agaacaagaa tgtttttgat gaaaacatgc 960
atgtggttag tagttttgga cgatactttt gataattatg gaacatacga agaattggag 1020
atttttactc aagccgtcga gagatggtct atctcatgct tagatatgtt gcccgaatat 1080
atgaaattaa tctaccaaga attagtcaat ttgcatgtgg aaatggaaga atctttggaa 1140
aaggagggaa agacctatca gattcattac gttaaggaga tggctaaaga attagttcgt 1200
aattacttag tagaagcaag atggttgaag gaaggttata tgcctacttt agaagaatac 1260
atgtctgttt ctatggttac tggtacttat ggtttgatga ttgcaaggtc ctatgttggc 1320
agaggagaca ttgttactga agacacattc aaatgggttt ctagttaccc acctattatt 1380
aaagcttcct gtgtaatagt aagattaatg gacgatattg tatctcacaa ggaagaacaa 1440
gaaagaggac atgtggcttc atctatagaa tgttactcta aagaatcagg tgcttctgaa 1500
gaggaagcat gtgaatatat tagtaggaaa gttgaggatg cctggaaagt aatcaataga 1560
gaatctttgc gtccaacagc cgttcccttc cctttgttaa tgccagcaat aaacttagct 1620
agaatgtgtg aggtcttgta ctctgttaat gatggtttta ctcatgctga gggtgacatg 1680
aaatcttata tgaagtcctt cttcgttcat cctatggtcg tttga 1725
<210> 77
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer PW-091-144-CPK640
<400> 77
gtttaaactg cgaaaagaaa cgtggataa 29
<210> 78
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1615
<400> 78
aagttccctc aagaatttta ctgacaggcc tcgagatatt tgag 44
<210> 79
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1620
<400> 79
gaaggttttg ggacgctcga agctacggaa gaggatgtgc caag 44
<210> 80
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer PW-091-144-CPK649
<400> 80
gtttaaaccg tttaagtgtc actgtgct 28
<210> 81
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1616
<400> 81
actagaagtt ctcctcgacc gttttcaaaa attcttactt t 41
<210> 82
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1638
<400> 82
gtatagaggt atattaacaa 20
<210> 83
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1618
<400> 83
ttgttaatat acctctatac tttaacgtca aggagaaaaa accccggatc c 51
<210> 84
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1619
<400> 84
aggttgtctg actccttcct tttcggttag agcggatctt agctagc 47
<210> 85
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-90-CPK1639
<400> 85
gaaaaggaag gagtcagaca 20
<210> 86
<211> 6365
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Construct A
<400> 86
ctgcgaaaag aaacgtggat aagtattata gaaacagcac ttcttcggcc aacaatatca 60
cgcaaattga gcaagatagt gctataaaag gtcttttgcc cttttttgcc tattatgcaa 120
gcattgcttt actagtgtgg atgcaaccaa gctttattac actctctttc atcctttccg 180
ttggtttcac gggagcattt accgtcggaa gaataatcgt ttgccattta actaagcaga 240
gctttcccat gttcaatgca cccatgttaa ttcctttgtg ccagatagta ttgtacaaaa 300
tatgtctatc cctttgggga attgagtcta ataaaatcgt ctttgcccta tcttggcttg 360
ggttcggtct ctcactaggt gttcacatta tgtttatgaa tgacattatc catgaattta 420
ctgagtacct ggacgtttat gctttatcca tcaagcgctc caagctgaca taaatcgcac 480
tttgtatcta ctttttttta ttcgaaaaca aggcacaaca atgaatctat cgccctgtga 540
gattttcaat ctcaagtttg tgtaatagat agcgttatat tatagaacta taaaggtcct 600
tgaatataca tagtgtttca ttcctattac tgtatatgtg actttacatt gttacttccg 660
cggctatttg acgttttctg cttcaggtgc ggcttggagg gcaaagtgtc agaaaatcgg 720
ccaggccgta tgacacaaaa gagtagaaaa cgagatctca aatatctcga ggcctgtcag 780
taaaattctt gagggaactt tcaccattat gggaaatggt tcaagaaggt attgacttaa 840
actccatcaa atggtcaggt cattgagtgt tttttatttg ttgtattttt ttttttttag 900
agaaaatcct ccaatatcaa attaggaatc gtagtttcat gattttctgt tacacctaac 960
tttttgtgtg gtgccctcct ccttgtcaat attaatgtta aagtgcaatt ctttttcctt 1020
atcacgttga gccattagta tcaatttgct tacctgtatt cctttactat cctccttttt 1080
ctccttcttg ataaatgtat gtagattgcg tatatagttt cgtctaccct atgaacatat 1140
tccattttgt aatttcgtgt cgtttctatt atgaatttca tttataaagt ttatgtacaa 1200
atatcataaa aaaagagaat ctttttaagc aaggattttc ttaacttctt cggcgacagc 1260
atcaccgact tcggtggtac tgttggaacc acctaaatca ccagttctga tacctgcatc 1320
caaaaccttt ttaactgcat cttcaatggc cttaccttct tcaggcaagt tcaatgacaa 1380
tttcaacatc attgcagcag acaagatagt ggcgataggg tcaaccttat tctttggcaa 1440
atctggagca gaaccgtggc atggttcgta caaaccaaat gcggtgttct tgtctggcaa 1500
agaggccaag gacgcagatg gcaacaaacc caaggaacct gggataacgg aggcttcatc 1560
ggagatgata tcaccaaaca tgttgctggt gattataata ccatttaggt gggttgggtt 1620
cttaactagg atcatggcgg cagaatcaat caattgatgt tgaaccttca atgtagggaa 1680
ttcgttcttg atggtttcct ccacagtttt tctccataat cttgaagagg ccaaaacatt 1740
agctttatcc aaggaccaaa taggcaatgg tggctcatgt tgtagggcca tgaaagcggc 1800
cattcttgtg attctttgca cttctggaac ggtgtattgt tcactatccc aagcgacacc 1860
atcaccatcg tcttcctttc tcttaccaaa gtaaatacct cccactaatt ctctgacaac 1920
aacgaagtca gtacctttag caaattgtgg cttgattgga gataagtcta aaagagagtc 1980
ggatgcaaag ttacatggtc ttaagttggc gtacaattga agttctttac ggatttttag 2040
taaaccttgt tcaggtctaa cactaccggt accccattta ggaccaccca cagcacctaa 2100
caaaacggca tcaaccttct tggaggcttc cagcgcctca tctggaagtg ggacacctgt 2160
agcatcgata gcagcaccac caattaaatg attttcgaaa tcgaacttga cattggaacg 2220
aacatcagaa atagctttaa gaaccttaat ggcttcggct gtgatttctt gaccaacgtg 2280
gtcacctggc aaaacgacga tcttcttagg ggcagacata ggggcagaca ttagaatggt 2340
atatccttga aatatatata tatattgctg aaatgtaaaa ggtaagaaaa gttagaaagt 2400
aagacgattg ctaaccacct attggaaaaa acaataggtc cttaaataat attgtcaact 2460
tcaagtattg tgatgcaagc atttagtcat gaacgcttct ctattctata tgaaaagccg 2520
gttccggcct ctcacctttc ctttttctcc caatttttca gttgaaaaag gtatatgcgt 2580
caggcgacct ctgaaattaa caaaaaattt ccagtcatcg aatttgattc tgtgcgatag 2640
cgcccctgtg tgttctcgtt atgttgagga aaaaaataat ggttgctaag agattcgaac 2700
tcttgcatct tacgatacct gagtattccc acagttaact gcggtcaaga tatttcttga 2760
atcaggcgcc ttagaccgct cggccaaaca accaattact tgttgagaaa tagagtataa 2820
ttatcctata aatataacgt ttttgaacac acatgaacaa ggaagtacag gacaattgat 2880
tttgaagaga atgtggattt tgatgtaatt gttgggattc catttttaat aaggcaataa 2940
tattaggtat gtggatatac tagaagttct cctcgaccgt tttcaaaaat tcttactttt 3000
tttttggatg gacgcaaaga agtttaataa tcatattaca tggcattacc accatataca 3060
tatccatata catatccata tctaatctta cttatatgtt gtggaaatgt aaagagcccc 3120
attatcttag cctaaaaaaa ccttctcttt ggaactttca gtaatacgct taactgctca 3180
ttgctatatt gaagtacgga ttagaagccg ccgagcgggt gacagccctc cgaaggaaga 3240
ctctcctccg tgcgtcctcg tcttcaccgg tcgcgttcct gaaacgcaga tgtgcctcgc 3300
gccgcactgc tccgaacaat aaagattcta caatactagc ttttatggtt atgaagagga 3360
aaaattggca gtaacctggc cccacaaacc ttcaaatgaa cgaatcaaat taacaaccat 3420
aggatgataa tgcgattagt tttttagcct tatttctggg gtaattaatc agcgaagcga 3480
tgatttttga tctattaaca gatatataaa tgcaaaaact gcataaccac tttaactaat 3540
actttcaaca ttttcggttt gtattacttc ttattcaaat gtaataaaag tatcaacaaa 3600
aaattgttaa tatacctcta tactttaacg tcaaggagaa aaaaccccgg atccatgtca 3660
actttgccta tttcttctgt gtcattttcc tcttctacat caccattagt cgtggacgac 3720
aaagtctcaa ccaagcccga cgttatcaga catacaatga atttcaatgc ttctatttgg 3780
ggagatcaat tcttgaccta tgatgagcct gaagatttag ttatgaagaa acaattagtg 3840
gaggaattaa aagaggaagt taagaaggaa ttgataacta tcaaaggttc aaatgagccc 3900
atgcagcatg tgaaattgat tgaattaatt gatgctgttc aacgtttagg tatagcttac 3960
cattttgaag aagagatcga ggaagctttg caacatatac atgttaccta tggtgaacag 4020
tgggtggata aggaaaattt acagagtatt tcattgtggt tcaggttgtt gcgtcaacag 4080
ggctttaacg tctcctctgg cgttttcaaa gactttatgg acgaaaaagg taaattcaaa 4140
gagtctttat gcaatgatgc acaaggaata ttagccttat atgaagctgc atttatgagg 4200
gttgaagatg aaaccatctt agacaatgct ttggaattca caaaagttca tttagatatc 4260
atagcaaaag acccatcttg cgattcttca ttgcgtacac aaatccatca agccttaaaa 4320
caacctttaa gaaggagatt agcaaggatt gaagcattac attacatgcc aatctaccaa 4380
caggaaacat ctcatgatga agtattgttg aaattagcca agttggattt cagtgttttg 4440
cagtctatgc ataaaaagga attgtcacat atctgtaagt ggtggaaaga tttagattta 4500
caaaataagt taccttatgt acgtgatcgt gttgtcgaag gctacttctg gatattgtcc 4560
atatactatg agccacaaca cgctagaaca agaatgtttt tgatgaaaac atgcatgtgg 4620
ttagtagttt tggacgatac ttttgataat tatggaacat acgaagaatt ggagattttt 4680
actcaagccg tcgagagatg gtctatctca tgcttagata tgttgcccga atatatgaaa 4740
ttaatctacc aagaattagt caatttgcat gtggaaatgg aagaatcttt ggaaaaggag 4800
ggaaagacct atcagattca ttacgttaag gagatggcta aagaattagt tcgtaattac 4860
ttagtagaag caagatggtt gaaggaaggt tatatgccta ctttagaaga atacatgtct 4920
gtttctatgg ttactggtac ttatggtttg atgattgcaa ggtcctatgt tggcagagga 4980
gacattgtta ctgaagacac attcaaatgg gtttctagtt acccacctat tattaaagct 5040
tcctgtgtaa tagtaagatt aatggacgat attgtatctc acaaggaaga acaagaaaga 5100
ggacatgtgg cttcatctat agaatgttac tctaaagaat caggtgcttc tgaagaggaa 5160
gcatgtgaat atattagtag gaaagttgag gatgcctgga aagtaatcaa tagagaatct 5220
ttgcgtccaa cagccgttcc cttccctttg ttaatgccag caataaactt agctagaatg 5280
tgtgaggtct tgtactctgt taatgatggt tttactcatg ctgagggtga catgaaatct 5340
tatatgaagt ccttcttcgt tcatcctatg gtcgtttgag ctagctaaga tccgctctaa 5400
ccgaaaagga aggagtcaga caacctgaag tctaggtccc tatttatttt tttatagtta 5460
tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg 5520
tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagc 5580
tacggaagag gatgtgccaa ggacattttc aagaatatta gaaacaggtt cgtttcaaaa 5640
ttattatcaa aaaatggatg cagaaaatgc agatagggta tattcgaaag gggtcaagtt 5700
gattgcaagc ggtactctac catctggtat atttaatagg gaagaattgt ttgaggaaga 5760
tagtttctat aagtattaaa taaactaatg attttaaatc gttaaaaaaa tatgcgaatt 5820
ctgtggatcg aacacaggac ctccagataa cttgaccgaa gttttttctt cagtctggcg 5880
ctctcccaac tgagctaaat ccgcttacta tttgttatca gttcccttca tatctacata 5940
gaataggtta agtattttat tagttgccag aagaactact gatagttggg aatatttggt 6000
gaataatgaa gattgggtga ataatttgat aattttgaga ttcaattgtt aatcaatgtt 6060
acaatattat gtatacagag tatactagaa gttctcttcg gagatcttga agttcacaaa 6120
agggaatcga tatttctaca taatattatc attacttctt ccccatctta tatttgtcat 6180
tcattattga ttatgatcaa tgcaataatg attggtagtt gccaaacatt taatacgatc 6240
ctctgtaata tttctatgaa taattatcac agcaacgttc aattatcttc aattcggctt 6300
cagtactgta tgaaatactc gctaacattt tctttattct ataatagcac agtgacactt 6360
aaacg 6365
<210> 87
<211> 5251
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i8
<400> 87
ttgcctatgc tttgtttgct ttgaacactt gtttccgctc tccttttact tattggctac 60
taaaactacg tgtaaaagat cgcccagcgc aaaaaggtcc ggcggtttca aataatctcg 120
aactattcct ataatatgca aaatagtagg taggaacaag tcgactctag gcagataagg 180
aagatgtccg gtaaatggag actagtgctg accgggatag gcaatccaga gcctcagtac 240
gctggtaccc gtcacaatgt agggctatat atgctggagc tgctacgaaa gcggcttggt 300
ctgcagggga gaacttattc ccctgtgcct aatacgggcg gcaaagtgca ttatatagaa 360
gacgaacatt gtacgatact aagatcggat ggccagtaca tgaatctaag tggagaacag 420
gtgtgcaagg tctgggcccg gtacgccaag taccaagccc gacacgtagt tattcatgac 480
gagttaagtg tggcgtgtgg aaaagtgcag ctcagagccc ccagcaccag tattagaggt 540
cataatgggc tgcgaagcct gctaaaatgc agtggaggcc gtgtaccctt tgccaaattg 600
gctattggaa tcggcagaga acctgggtcc cgttctagag accctgcgag cgtgtcccgg 660
tgggttctgg gagctctaac tccgcaggaa ctacaaacct tgcttacaca gagtgaacct 720
gctgcctggc gtgctctgac tcagtacatt tcatagtgga tggcggcgtt agtatcgaat 780
cgacagcagt atagcgacca gcattcacat acgattgacg catgatatta ctttctgcgc 840
acttaacttc gcatctgggc agatgatgtc gaggcgaaaa aaaatataaa tcacgctaac 900
atttgattaa aatagaacaa ctacaatata aaaaaactat acaaatgaca agttcttgaa 960
aacaagaatc tttttattgt cagtactgat tagaaaaact catcgagcat caaatgaaac 1020
tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg tttctgtaat 1080
gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta tcggtctgcg 1140
attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa aataaggtta 1200
tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa aagcttatgc 1260
atttctttcc agacttgttc aacaggccag ccattacgct cgtcatcaaa atcactcgca 1320
tcaaccaaac cgttattcat tcgtgattgc gcctgagcga gacgaaatac gcgatcgctg 1380
ttaaaaggac aattacaaac aggaatcgaa tgcaaccggc gcaggaacac tgccagcgca 1440
tcaacaatat tttcacctga atcaggatat tcttctaata cctggaatgc tgttttgccg 1500
gggatcgcag tggtgagtaa ccatgcatca tcaggagtac ggataaaatg cttgatggtc 1560
ggaagaggca taaattccgt cagccagttt agtctgacca tctcatctgt aacatcattg 1620
gcaacgctac ctttgccatg tttcagaaac aactctggcg catcgggctt cccatacaat 1680
cgatagattg tcgcacctga ttgcccgaca ttatcgcgag cccatttata cccatataaa 1740
tcagcatcca tgttggaatt taatcgcggc ctcgaaacgt gagtcttttc cttacccatg 1800
gttgtttatg ttcggatgtg atgtgagaac tgtatcctag caagatttta aaaggaagta 1860
tatgaaagaa gaacctcagt ggcaaatcct aaccttttat atttctctac aggggcgcgg 1920
cgtggggaca attcaacgcg tctgtgaggg gagcgtttcc ctgctcgcag gtctgcagcg 1980
aggagccgta atttttgctt cgcgccgtgc ggccatcaaa atgtatggat gcaaatgatt 2040
atacatgggg atgtatgggc taaatgtacg ggcgacagtc acatcatgcc cctgagctgc 2100
gcacgtcaag actgtcaagg agggtattct gggcctccat gtcgctggcc gggtgacccg 2160
gcggggacga ggcaagctaa acagatctga tcttgaaact gagtaagatg ctcagaatac 2220
ccgtcaagat aagagtataa tgtagagtaa tataccaagt attcagcata ttctcctctt 2280
cttttgtata aatcacggaa gggatgattt ataagaaaaa tgaatactat tacacttcat 2340
ttaccaccct ctgatctaga ttttccaacg atatgtacgt agtggtataa ggtgaggggg 2400
tccacagata taacatcgtt taatttagta ctaacagaga cttttgtcac aactacatat 2460
aagtgtacaa atatagtaca gatatgacac acttgtagcg ccaacgcgca tcctacggat 2520
tgctgacaga aaaaaaggtc acgtgaccag aaaagtcacg tgtaattttg taactcaccg 2580
cattctagcg gtccctgtcg tgcacactgc actcaacacc ataaacctta gcaacctcca 2640
aaggaaatca ccgtataaca aagccacagt tttacaactt agtctcttat gaagttactt 2700
accaatgaga aatagaggct ctttctcgag aaatatgaat atggatatat atatatatat 2760
atatatatat atatatatat gtaaacttgg ttctttttta gcttgtgatc tctagcttgg 2820
gtctctctct gtcgtaacag ttgtgatatc ggaagaagag aaaagacgaa gagcagaagc 2880
ggaaaacgta tacacgtcac atatcacaca cacacaatgg gaaagctatt acaattggca 2940
ttgcatccgg tcgagatgaa ggcagctttg aagctgaagt tttgcagaac accgctattc 3000
tccatctatg atcagtccac gtctccatat ctcttgcact gtttcgaact gttgaacttg 3060
acctccagat cgtttgctgc tgtgatcaga gagctgcatc cagaattgag aaactgtgtt 3120
actctctttt atttgatttt aagggctttg gataccatcg aagacgatat gtccatcgaa 3180
cacgatttga aaattgactt gttgcgtcac ttccacgaga aattgttgtt aactaaatgg 3240
agtttcgacg gaaatgcccc cgatgtgaag gacagagccg ttttgacaga tttcgaatcg 3300
attcttattg aattccacaa attgaaacca gaatatcaag aagtcatcaa ggagatcacc 3360
gagaaaatgg gtaatggtat ggccgactac atcttagatg aaaattacaa cttgaatggg 3420
ttgcaaaccg tccacgacta cgacgtgtac tgtcactacg tagctggttt ggtcggtgat 3480
ggtttgaccc gtttgattgt cattgccaag tttgccaacg aatctttgta ttctaatgag 3540
caattgtatg aaagcatggg tcttttccta caaaaaacca acatcatcag agattacaat 3600
gaagatttgg tcgatggtag atccttctgg cccaaggaaa tctggtcaca atacgctcct 3660
cagttgaagg acttcatgaa acctgaaaac gaacaactgg ggttggactg tataaaccac 3720
ctcgtcttaa acgcattgag tcatgttatc gatgtgttga cttatttggc cggtatccac 3780
gagcaatcca ctttccaatt ttgtgccatt ccccaagtta tggccattgc aaccttggct 3840
ttggtattca acaaccgtga agtgctacat ggcaatgtaa agattcgtaa gggtactacc 3900
tgctatttaa ttttgaaatc aaggactttg cgtggctgtg tcgagatttt tgactattac 3960
ttacgtgata tcaaatctaa attggctgtg caagatccaa atttcttaaa attgaacatt 4020
caaatctcca agatcgaaca gtttatggaa gaaatgtacc aggataaatt acctcctaac 4080
gtgaagccaa atgaaactcc aattttcttg aaagttaaag aaagatccag atacgatgat 4140
gaattggttc caacccaaca agaagaagag tacaagttca atatggtttt atctatcatc 4200
ttgtccgttc ttcttgggtt ttattatata tacactttac acagagcgtg aagtctgcgc 4260
caaataacat aaacaaacaa ctccgaacaa taactaagta cttacataat aggtagaggc 4320
ctatccttaa agataacctt atatttcatt acatcaacta attcgacctt attatctttc 4380
gaattgaaat gcattatacc catcggtacg tctagctttg tcaccttccc cagtaaacgc 4440
tgtttcttgc cgacaaacaa tgtggccctc tctccgtcaa tctgtaacga cccaaatcgt 4500
attaaagttt cgccgtcctg ttcactgaac cttccctcat ttggagaatc tctcctcgcc 4560
agcgacgcaa agtccttagg caactctagt tcaccttgaa tctccagcat catcatccca 4620
agcggtgtta tcaccgtggt ctgcttttct cttgactgtg tcaacttctg ccattgacta 4680
gcatctatat ctacactagg cattcttttc agctgtttat tgggctgaat gatagtgata 4740
attctttttt ctatcactcc tttggctata ttagtggtta gcttactaaa aaagattaaa 4800
ggaaaaatga aattcaagat gctaacgttg acatgtatat tttaagaaaa caaaaatcat 4860
acaaagagga gatcggatat aaaagaataa cataaatatg tttagtgcat taggtaaatg 4920
ggtccgaggc tctcgcaatg ataaggactt tgtgacgaag tataccgcag atttatcaca 4980
aataacttca cagatccatc aattagatgt cgcgttaaag aaaagccaat ccatcttgag 5040
tcaatggcaa tcaaatctga ccttttatgg tattgcgtta acggtattgg ccctgagcta 5100
cacatattgg gagtaccatg gttatcgacc ataccttgtg gtgactgcgc tactatgcat 5160
aggctcgcta atcttgttca aatgggcatt aaccaaactc tatgcatttt ataacaacaa 5220
taggttacgc aagttggcaa aactccgtgc a 5251
<210> 88
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK066-G
<400> 88
ggtaagacgg ttgggtttta tcttttgcag ttggtactat taagaacaat cacaggaaac 60
agctatgacc 70
<210> 89
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer 61-67-CPK067-G
<400> 89
ttgcgttttg tactttggtt cgctcaattt tgcaggtaga taatcgaaaa gttgtaaaac 60
gacggccagt 70
<210> 90
<211> 4162
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i32
<400> 90
gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60
cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120
aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180
gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240
gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300
caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360
ttgggtgcct ctatgatggg tatggcttgg gcaagtgtct ttttatgtat cgtggaattt 420
atcctgctgg tcttctggtc tgttagggca aggttggcct ctacttactc catcgacaat 480
tcaagataca gaacctcctc cagatggaat cccttccata gagagaagga gcaagcaact 540
gacccaatat tgactgccac tggacctgaa gacatgcaac aaagtgcaag catagtgggg 600
ccttcttcca atgctaatcc ggtcactgcc actgctgcta cggaaaacca acctaaaggt 660
attaacttct tcactataag aaaatcacac gagcgcccgg acgatgtctc tgtttaaatg 720
gcgcaagttt tccgctttgt aatatatatt tatacccctt tcttctctcc cctgcaatat 780
aatagtttaa ttctaatatt aataatatcc tatattttct tcatttaccg gcgcactctc 840
gcccgaacga cctcaaaatg tctgctacat tcataataac caaaagctca taactttttt 900
ttttgaacct gaatatatat acatcacata tcactgctgg tccttgccga ccagcgtata 960
caatctcgat agttggtttc ccgttctttc cactcccgtc cacaggaaac agctatgacc 1020
atgattacgc caagctattt aggtgacact atagaatact caagctatgc atcaagcttg 1080
gtaccgagct cggatccact agtaacggcc gccagtgtgc tggaattcgc cctgtcgaca 1140
ctagtaatac acatcatcgt cctacaagtt catcaaagtg ttggacagac aactatacca 1200
gcatggatct cttgtatcgg ttcttttctc ccgctctctc gcaataacaa tgaacactgg 1260
gtcaatcata gcctacacag gtgaacagag tagcgtttat acagggttta tacggtgatt 1320
cctacggcaa aaatttttca tttctaaaaa aaaaaagaaa aatttttctt tccaacgcta 1380
gaaggaaaag aaaaatctaa ttaaattgat ttggtgattt tctgagagtt ccctttttca 1440
tatatcgaat tttgaatata aaaggagatc gaaaaaattt ttctattcaa tctgttttct 1500
ggttttattt gatagttttt ttgtgtatta ttattatgga ttagtactgg tttatatggg 1560
tttttctgta taacttcttt ttattttagt ttgtttaatc ttattttgag ttacattata 1620
gttccctaac tgcaagagaa gtaacattaa aaatgaaaaa gcctgaactc accgcgacgt 1680
ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg cagctctcgg 1740
agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat gtcctgcggg 1800
taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac tttgcatcgg 1860
ccgcgctccc gattccggaa gtgcttgaca ttggggaatt cagcgagagc ctgacctatt 1920
gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc gaactgcccg 1980
ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc tgcggccgat cttagccaga 2040
cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca tggcgtgatt 2100
tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg gacgacaccg 2160
tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag gactgccccg 2220
aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg gacaatggcc 2280
gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa tacgaggtcg 2340
ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg cgctacttcg 2400
agcggaggca tccggagctt gcaggatcgc cgcggctccg ggcgtatatg ctccgcattg 2460
gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca gcttgggcgc 2520
agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt acacaaatcg 2580
cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc gatagtggaa 2640
accgacgccc cagcactcgt ccgagggcaa aggaataggt ttaacttgat actactagat 2700
tttttctctt catttataaa atttttggtt ataattgaag ctttagaagt atgaaaaaat 2760
cctttttttt cattctttgc aaccaaaata agaagcttct tttattcatt gaaatgatga 2820
atataaacct aacaaaagaa aaagactcga atatcaaaca ttaaaaaaaa ataaaagagg 2880
ttatctgttt tcccatttag ttggagtttg cattttctaa tagatagaac tctcaattaa 2940
tgtggattta gtttctctgt tcgttttttt ttgttttgtt ctcactgtat ttacatttct 3000
atttagtatt tagttattca tataatctta acttctcgag gagctctaag ggcgaattct 3060
gcagatatcc atcacactgg cggccgctcg agcatgcatc tagagggccc aattcgccct 3120
atagtgagtc gtattacaat tcactggccg tcgttttaca acaagcatct tgccctgtgc 3180
ttggccccca gtgcagcgaa cgttataaaa acgaatactg agtatatatc tatgtaaaac 3240
aaccatatca tttcttgttc tgaactttgt ttacctaact agttttaaat ttcccttttt 3300
cgtgcatgcg ggtgttctta tttattagca tactacattt gaaatatcaa atttccttag 3360
tagaaaagtg agagaaggtg cactgacaca aaaaataaaa tgctacgtat aactgtcaaa 3420
actttgcagc agcgggcatc cttccatcat agcttcaaac atattagcgt tcctgatctt 3480
catacccgtg ctcaaaatga tcaaacaaac tgttattgcc aagaaataaa cgcaaggctg 3540
ccttcaaaaa ctgatccatt agatcctcat atcaagcttc ctcatagaac gcccaattac 3600
aataagcatg ttttgctgtt atcaccgggt gataggtttg ctcaaccatg gaaggtagca 3660
tggaatcata atttggatac taatacaaat cggccatata atgccattag taaattgcgc 3720
tcccatttag gtggttctcc aggaatacta ataaatgcgg tgcatttgca aaatgaattt 3780
attccaaggc caaaacaaca cgatgaatgg ctttattttt ttgttattcc tgacatgaag 3840
ctttatgtaa ttaaggaaac ggacatcgag gaatttgcat cttttttaga tgaaggagct 3900
attcaagcac caaagctatc cttccaggat tatttaagcg gtaaggccaa ggcttcccaa 3960
caggttcatg aagtgcatca tagaaagctt acaaggtttc agggtgaaac ttttctaaga 4020
gattggaact tagtctgtgg gcattataag agagatgcta agtgtggaga aatgggaccc 4080
gacataattg cagcatttca agatgaaaag ctttttcctg agaataatct agccttaatt 4140
tctcatattg ggggtcatat tt 4162
<210> 91
<211> 7879
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i33
<220>
<221> misc_feature
<222> (270)..(270)
<223> n is a, c, g, or t
<400> 91
atgaattggc cagttttttc caattatgga acgcctgttc ctgatccacg gcctgcactt 60
gcgaccacaa ttccacacct gaggcgcctg cctcttttcc agcatgtggc aactgtcccc 120
acgacagggc atcccagaat cctctggtaa atcttaaatg aaactgacgc gtggcagtag 180
attccaacaa tggtgggatg gcccgtggga aagtcgtgta gtgctcatac gcatcatatg 240
acatggatga tacggccggg tcaaacggtn cgattgcagt tggaatgcaa atgagagtag 300
cagatcattg ttgggcagcg gcttcaacac cagtgcttcg tcgtacggat accataaact 360
gtcatttata ccaatctgcg acaccgtgtc ttctgcgaac acacccagca gtagagtgcc 420
cagcatgaaa taggccagtg tgaggatcat cgtcgtcttg cctatgcttt gtttgctttg 480
aacacttgtt tccgctctcc ttttacttat tggctactaa aactacgtgt aaaagatcgc 540
ccagcgcaaa aaggtccggc ggtttcaaat aatctcgaac tattcctata atatgcaaaa 600
tagtaggtag gaacaagtca actctaggca gataacgaag atgtccggta aatggagact 660
agtgctgact gggataggca atccagagcc tcagtacgct ggcacccgtc acaatgtagg 720
gctatatatg ctggagctgc tacgaaagcg gcttggtctg caggggagaa cttattcccc 780
tgtgcctaat acgggcggca aagtgcatta tatagaagac gaacattgta cgatactaag 840
atcggatggc cagtacatga atctaagtgg agaacaggtg tgcaaggtct gggcccggta 900
cgccaagtac caagcccgac acgttgttat tcatgacgag ttaagtgtgg cgtgtggaaa 960
agtgcagctc agagccccca gcaccagtat tagaggtcat aatgggctgc gaagcctgct 1020
aaaatgcagt ggaggccgtg taccctttgc caaattggct attggaatcg gcagagaacc 1080
tgggtcccgt tctagagacc ctgcgagcgt gtcccggtgg gttctgggag ctctaactcc 1140
gcaggaacta caaaccttgc ttacacagag tgaacctgct gcctggcgtg ctctgactca 1200
gtacatttca taggacagca ttcgcccagt atttttttta ttctacaaac cttctataat 1260
ttcaaagtat ttacataatt ctgtatcagt ttaatcacca taatatcgtt ttctttgttt 1320
agtgcaatta atttttccta ttgttacttc gggccttttt ctgttttatg agctattttt 1380
tccgtcatcc ttccggatcc agattttcag cttcatctcc agattgtgtc tacgtaatgc 1440
acgccatcat tttaagagag gacagagaag caagcctcct gaaagatgaa gctactgtct 1500
tctatcgaac aagcatgcga tatttgccga cttaaaaagc tcaagtgctc caaagaaaaa 1560
ccgaagtgcg ccaagtgtct gaagaacaac tgggagtgtc gctactctcc caaaaccaaa 1620
aggtctccgc tgactagggc acatctgaca gaagtggaat caaggctaga aagactggaa 1680
cagctatttc tactgatttt tcctcgagaa gaccttgaca tgattttgaa aatggattct 1740
ttacaggata taaaagcatt gttaacagga ttatttgtac aagataatgt gaataaagat 1800
gccgtcacag atagattggc ttcagtggag actgatatgc ctctaacatt gagacagcat 1860
agaataagtg cgacatcatc atcggaagag agtagtaaca aaggtcaaag acagttgact 1920
gtatcgattg actcggcagc tcatcatgat aactccacaa ttccgttgga ttttatgccc 1980
agggatgctc ttcatggatt tgattggtct gaagaggatg acatgtcgga tggcttgccc 2040
ttcctgaaaa cggaccccaa caataatggg ttctttggcg acggttctct cttatgtatt 2100
cttcgatcta ttggctttaa accggaaaat tacacgaact ctaacgttaa caggctcccg 2160
accatgatta cggatagata cacgttggct tctagatcca caacatcccg tttacttcaa 2220
agttatctca ataattttca cccctactgc cctatcgtgc actcaccgac gctaatgatg 2280
ttgtataata accagattga aatcgcgtcg aaggatcaat ggcaaatcct ttttaactgc 2340
atattagcca ttggagcctg gtgtatagag ggggaatcta ctgatataga tgttttttac 2400
tatcaaaatg ctaaatctca tttgacgagc aaggtcttcg agtcaggttc cataattttg 2460
gtgacagccc tacatcttct gtcgcgatat acacagtgga ggcagaaaac aaatactagc 2520
tataattttc acagcttttc cataagaatg gccatatcat tgggcttgaa tagggacctc 2580
ccctcgtcct tcagtgatag cagcattctg gaacaaagac gccgaatttg gtggtctgtc 2640
tactcttggg agatccaatt gtccctgctt tatggtcgat ccatccagct ttctcagaat 2700
acaatctcct tcccttcttc tgtcgacgat gtgcagcgta ccacaacagg tcccaccata 2760
tatcatggca tcattgaaac agcaaggctc ttacaagttt tcacaaaaat ctatgaacta 2820
gacaaaacag taactgcaga aaaaagtcct atatgtgcaa aaaaatgctt gatgatttgt 2880
aatgagattg aggaggtttc gagacaggca ccaaagtttt tacaaatgga tatttccacc 2940
accgctctaa ccaatttgtt gaaggaacac ccttggctat cctttacaag attcgaactg 3000
aagtggaaac agttgtctct tatcatttat gtattaagag attttttcac taattttacc 3060
cagaaaaagt cacaactaga acaggatcaa aatgatcatc aaagttatga agttaaacga 3120
tgctccatca tgttaagcga tgcagcacaa agaactgtta tgtctgtaag tagctatatg 3180
gacaatcata atgtcacccc atattttgcc tggaattgtt cttattactt gttcaatgca 3240
gtcctagtac ccataaagac tctactctca aactcaaaat cgaatgctga gaataacgag 3300
accgcacaat tattacaaca aattaacact gttctgatgc tattaaaaaa actggccact 3360
tttaaaatcc agacttgtga aaaatacatt caagtactgg aagaggtatg tgcgccgttt 3420
ctgttatcac agtgtgcaat cccattaccg catatcagtt ataacaatag taatggtagc 3480
gccattaaaa atattgtcgg ttctgcaact atcgcccaat accctactct tccggaggaa 3540
aatgtcaaca atatcagtgt taaatatgtt tctcctggct cagtagggcc ttcacctgtg 3600
ccattgaaat caggagcaag tttcagtgat ctagtcaagc tgttatctaa ccgtccaccc 3660
tctcgtaact ctccagtgac aataccaaga agcacacctt cgcatcgctc agtcacgcct 3720
tttctagggc aacagcaaca gctgcaatca ttagtgccac tgaccccgtc tgctttgttt 3780
ggtggcgcca attttaatca aagtgggaat attgctgata gctcattgtc cttcactttc 3840
actaacagta gcaacggtcc gaacctcata acaactcaaa caaattctca agcgctttca 3900
caaccaattg cctcctctaa cgttcatgat aacttcatga ataatgaaat cacggctagt 3960
aaaattgatg atggtaataa ttcaaaacca ctgtcacctg gttggacgga ccaaactgcg 4020
tataacgcgt ttggaatcac tacagggatg tttaatacca ctacaatgga tgatgtatat 4080
aactatctat tcgatgatga agatacccca ccaaacccaa aaaaagagta aaatgaatcg 4140
tagatactga aaaaccccgc aagttcactt caactgtgca tcgtgcacca tctcaatttc 4200
tttcatttat acatcgtttt gccttctttt atgtaactat actcctctaa gtttcaatct 4260
tggccatgta acctctgatc tatagaattt tttaaatgac tagaattaat gcccatcttt 4320
tttttggacc taaattcttc atgaaaatat attacgaggg cttattcaga agcttcgctc 4380
agtcgacact agtaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 4440
ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 4500
aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 4560
cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 4620
caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 4680
ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 4740
tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 4800
tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 4860
acattatagt tccctaactg caagagaagt aacattaaaa atgaccactc ttgacgacac 4920
ggcttaccgg taccgcacca gtgtcccggg ggacgccgag gccatcgagg cactggatgg 4980
gtccttcacc accgacaccg tcttccgcgt caccgccacc ggggacggct tcaccctgcg 5040
ggaggtgccg gtggacccgc ccctgaccaa ggtgttcccc gacgacgaat cggacgacga 5100
atcggacgcc ggggaggacg gcgacccgga ctcccggacg ttcgtcgcgt acggggacga 5160
cggcgacctg gcgggcttcg tggtcgtctc gtactccggc tggaaccgcc ggctgaccgt 5220
cgaggacatc gaggtcgccc cggagcaccg ggggcacggg gtcgggcgcg cgttgatggg 5280
gctcgcgacg gagttcgccc gcgagcgggg cgccgggcac ctctggctgg aggtcaccaa 5340
cgtcaacgca ccggcgatcc acgcgtaccg gcggatgggg ttcaccctct gcggcctgga 5400
caccgccctg tacgacggca ccgcctcgga cggcgagcag gcgctctaca tgagcatgcc 5460
ctgcccctga gtttaacttg atactactag attttttctc ttcatttata aaatttttgg 5520
ttataattga agctttagaa gtatgaaaaa atcctttttt ttcattcttt gcaaccaaaa 5580
taagaagctt cttttattca ttgaaatgat gaatataaac ctaacaaaag aaaaagactc 5640
gaatatcaaa cattaaaaaa aaataaaaga ggttatctgt tttcccattt agttggagtt 5700
tgcattttct aatagataga actctcaatt aatgtggatt tagtttctct gttcgttttt 5760
ttttgttttg ttctcactgt atttacattt ctatttagta tttagttatt catataatct 5820
taacttctcg aggagctcga tcttgaaact gagtaagatg ctcagaatac ccgtcaagat 5880
aagagtataa tgtagagtaa tataccaagt attcagcata ttctcctctt cttttgtata 5940
aatcacggaa gggatgattt ataagaaaaa tgaatactat tacacttcat ttaccaccct 6000
ctgatctaga ttttccaacg atatgtacgt agtggtataa ggtgaggggg tccacagata 6060
taacatcgtt taatttagta ctaacagaga cttttgtcac aactacatat aagtgtacaa 6120
atatagtaca gatatgacac acttgtagcg ccaacgcgca tcctacggat tgctgacaga 6180
aaaaaaggtc acgtgaccag aaaagtcacg tgtaattttg taactcaccg cattctagcg 6240
gtccctgtcg tgcacactgc actcaacacc ataaacctta gcaacctcca aaggaaatca 6300
ccgtataaca aagccacagt tttacaactt agtctcttat gaagtgtctc tctctgtcgt 6360
aacagttgtg atatcggaag aagagaaaag acgaagagca gaagcggaaa acgtatacac 6420
gtcacatatc acacacacac aatgggaaag ctattacaat tggcattgca tccggtcgag 6480
atgaaggcag ctttgaagct gaagttttgc agaacaccgc tattctccat ctatgatcag 6540
tccacgtctc catatctctt gcactgtttc gaactgttga acttgacctc cagatcgttt 6600
gctgctgtga tcagagagct gcatccagaa ttgagaaact gtgttactct cttttatttg 6660
attttaaggg ctttggatac catcgaagac gatatgtcca tcgaacacga tttgaaaatt 6720
gacttgttgc gtcacttcca cgagaaattg ttgttaacta aatggagttt cgacggaaat 6780
gcccccgatg tgaaggacag agccgttttg acagatttcg aatcgattct tattgaattc 6840
cacaaattga aaccagaata tcaagaagtc atcaaggaga tcaccgagaa aatgggtaat 6900
ggtatggccg actacatctt ggatgaaaat tacaacttga atgggttgca aaccgtccac 6960
gactacgacg tgtactgtca ctacgtagct ggtttggtcg gtgatggttt gacccgtttg 7020
attgtcattg ccaagtttgc caacgaatct ttgtattcta atgagcaatt gtatgaaagc 7080
atgggtcttt tcctacaaaa aaccaacatc atcagagact acaatgaaga tttggtcgat 7140
ggtagatcct tctggcccaa ggaaatctgg tcacaatacg ctcctcagtt gaaggacttc 7200
atgaaacctg aaaacgaaca actggggttg gactgtataa accacctcgt cttaaacgca 7260
ttgagtcatg ttatcgatgt gttgacttat ttggccagta tccacgagca atccactttc 7320
caattttgtg ccattcccca agttatggcc attgcaacct tggctttggt attcaacaac 7380
cgtgaagtgc tacatggcaa tgtaaagatt cgtaagggta ctacctgcta tttaattttg 7440
aaatcaagga ctttgcgtgg ctgtgtcgag atttttgact attacttacg tgatatcaaa 7500
tctaaattgg ctgtgcaaga tccaaatttc ttaaaattga acattcaaat ctccaagatc 7560
gaacaattca tggaagaaat gtaccaggat aaattacctc ctaacgtgaa gccaaatgaa 7620
actccaattt tcttgaaagt taaagaaaga tccagatacg atgatgaatt ggtcccaacc 7680
caacaagaag aagagtacaa gttcaatatg gttttatcta tcatcttgtc cgttcttctt 7740
gggttttatt atatatacac tttacacaga gcgtgaagtc tgcgccaaat aacataaaca 7800
aacaactccg aacaataact aagtacttac ataataggta gaggcctatc cttaaagata 7860
accttatatt tcattacat 7879
<210> 92
<211> 5714
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i37
<400> 92
gcctgtctac aggataaaga cgggtcggat acctgcacaa gcaatttggc acctgcatac 60
cccatttccc cagtagataa cttcaacaca cacatcaatg tccctcacca gtttatttcc 120
aaaagagacg ctttttacta cctgactaga ttttcatttt gtttcttttg gattgcgctt 180
gcctttgtag gtgtgtcgtt tatcctttac gttttgactt ggtgctcgaa gatgctttca 240
gagatggtgc ttatcctcat gtcttttggg tttgtcttca atacggcagc cgttgtcttg 300
caaacggccg cctctgccat ggcaaagaat gctttccatg acgatcatcg tagtgcccaa 360
ttgggtgcct ctatgatggg tttaaacgta tggcttgggc aagtgtcttt ttatgtatcg 420
tggaatttat cctgctggtc ttctggtctg ttagggcaag gttggcctct acttactcca 480
tcgacaattc aagatacaga acctcctcca gatggaatcc cttccataga gagaaggagc 540
aagcaactga cccaatattg actgccactg gacctgaaga catgcaacaa agtgcaagca 600
tagtggggcc ttcttccaat gctaatccgg tcactgccac tgctgctacg gaaaaccaac 660
ctaaaggtat taacttcttc actataagaa aatcacacga gcgcccggac gatgtctctg 720
tttaaatggc gcaagttttc cgctttgtaa tatatattta tacccctttc ttctctcccc 780
tgcaatataa tagtttaatt ctaatattaa taatatccta tattttcttc atttaccggc 840
gcactctcgc ccgaacgacc tcaaaatgtc tgctacattc ataataacca aaagctcata 900
actttttttt ttgaacctga atatatatac atcacatatc actgctggtc ctgagaagtt 960
aagattatat gaataactaa atactaaata gaaatgtaaa tacagtgaga acaaaacaaa 1020
aaaaaacgaa cagagaaact aaatccacat taattgagag ttctatctat tagaaaatgc 1080
aaactccaac taaatgggaa aacagataac ctcttttatt tttttttaat gtttgatatt 1140
cgagtctttt tcttttgtta ggtttatatt catcatttca atgaataaaa gaagcttctt 1200
attttggttg caaagaatga aaaaaaagga ttttttcata cttctaaagc ttcaattata 1260
accaaaaatt ttataaatga agagaaaaaa tctagtagta tcaagttaaa cttagaaaaa 1320
ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt 1380
ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc 1440
aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt 1500
cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg 1560
tgagaatggc aaaagcttat gcatttcttt ccagacttgt tcaacaggcc agccattacg 1620
ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt gcgcctgagc 1680
gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg aatgcaaccg 1740
gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat attcttctaa 1800
tacctggaat gctgttttgc cggggatcgc agtggtgagt aaccatgcat catcaggagt 1860
acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt ttagtctgac 1920
catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa acaactctgg 1980
cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga cattatcgcg 2040
agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg gcctcgaaac 2100
gtgagtcttt tccttaccca tttttaatgt tacttctctt gcagttaggg aactataatg 2160
taactcaaaa taagattaaa caaactaaaa taaaaagaag ttatacagaa aaacccatat 2220
aaaccagtac taatccataa taataataca caaaaaaact atcaaataaa accagaaaac 2280
agattgaata gaaaaatttt ttcgatctcc ttttatattc aaaattcgat atatgaaaaa 2340
gggaactctc agaaaatcac caaatcaatt taattagatt tttcttttcc ttctagcgtt 2400
ggaaagaaaa atttttcttt ttttttttag aaatgaaaaa tttttgccgt aggaatcacc 2460
gtataaaccc tgtataaacg ctactctgtt cacctgtgta ggctatgatt gacccagtgt 2520
tcattgttat tgcgagagag cgggagaaaa gaaccgatac aagagatcca tgctggtata 2580
gttgtctgtc caacactttg atgaacttgt aggacgatga tgtgtattac tagtgtcgac 2640
accatataca tatccatatc taatcttact tatatgttgt ggaaatgtaa agagccccat 2700
tatcttagcc taaaaaaacc ttctctttgg aactttcagt aatacgctta actgctcatt 2760
gctatattga agtacggatt agaagccgcc gagcgggcga cagccctccg acggaagact 2820
ctcctccgtg cgtcctggtc ttcaccggtc gcgttcctga aacgcagatg tgcctcgcgc 2880
cgcactgctc cgaacaataa agattctaca atactagctt ttatggttat gaagaggaaa 2940
aattggcagt aacctggccc cacaaacctt caaatcaacg aatcaaatta acaaccatag 3000
gataataatg cgattagttt tttagcctta tttctggggt aattaatcag cgaagcgatg 3060
atttttgatc tattaacaga tatataaatg caaaagctgc ataaccactt taactaatac 3120
tttcaacatt ttcggtttgt attacttctt attcaaatgt cataaaagta tcaacaaaaa 3180
attgttaata tacctctata ctttaacgtc aaggagaaaa aactataatg tcattaccgt 3240
tcttaacttc tgcaccggga aaggttatta tttttggtga acactctgct gtgtacaaca 3300
agcctgccgt cgctgctagt gtgtctgcgt tgagaaccta cctgctaata agcgagtcat 3360
ctgcaccaga tactattgaa ttggacttcc cggacattag ctttaatcat aagtggtcca 3420
tcaatgattt caatgccatc accgaggatc aagtaaactc ccaaaaattg gccaaggctc 3480
aacaagccac cgatggcttg tctcaggaac tcgttagtct tttggatccg ttgttagctc 3540
aactatccga atccttccac taccatgcag cgttttgttt cctgtatatg tttgtttgcc 3600
tatgccccca tgccaagaat attaagtttt ctttaaagtc tactttaccc atcggtgctg 3660
ggttgggctc aagcgcctct atttctgtat cactggcctt agctatggcc tacttggggg 3720
ggttaatagg atctaatgac ttggaaaagc tgtcagaaaa cgataagcat atagtgaatc 3780
aatgggcctt cataggtgaa aagtgtattc acggtacccc ttcaggaata gataacgctg 3840
tggccactta tggtaatgcc ctgctatttg aaaaagactc acataatgga acaataaaca 3900
caaacaattt taagttctta gatgatttcc cagccattcc aatgatccta acctatacta 3960
gaattccaag gtctacaaaa gatcttgttg ctcgcgttcg tgtgttggtc accgagaaat 4020
ttcctgaagt tatgaagcca attctagatg ccatgggtga atgtgcccta caaggcttag 4080
agatcatgac taagttaagt aaatgtaaag gcaccgatga cgaggctgta gaaactaata 4140
atgaactgta tgaacaacta ttggaattga taagaataaa tcatggactg cttgtctcaa 4200
tcggtgtttc tcatcctgga ttagaactta ttaaaaatct gagcgatgat ttgagaattg 4260
gctccacaaa acttaccggt gctggtggcg gcggttgctc tttgactttg ttacgaagag 4320
acattactca agagcaaatt gacagtttca aaaagaaatt gcaagatgat tttagttacg 4380
agacatttga aacagacttg ggtgggactg gctgctgttt gttaagcgca aaaaatttga 4440
ataaagatct taaaatcaaa tccctagtat tccaattatt tgaaaataaa actaccacaa 4500
agcaacaaat tgacgatcta ttattgccag gaaacacgaa tttaccatgg acttcataag 4560
ctaatttgcg ataggcatta tttattagtt gtttttaatc ttaactgtgt atgaagtttt 4620
atgtaataaa gatagaaaga gaaacaaaaa aaaatttttc gtagtatcaa ttcagctttc 4680
gaagacagaa tgaaatttaa gcagaccatc atcttgccct gtgcttggcc cccagtgcag 4740
cgaacgttat aaaaacgaat actgagtata tatctatgta aaacaaccat atcatttctt 4800
gttctgaact ttgtttacct aactagtttt aaatttccct ttttcgtgca tgcgggtgtt 4860
cttatttatt agcatactac atttgaaata tcaaatttcc ttagtagaaa agtgagagaa 4920
ggtgcactga cacaaaaaat aaaatgctac gtataactgt caaaactttg cagcagcggg 4980
catccttcca tcatagcttc aaacatatta gcgttcctga tcttcatacc cgtgctcaaa 5040
atgatcaaac aaactgttat tgccaagaaa taaacgcaag gctgccttca aaaactgatc 5100
cattagatcc tcatatcaag cttcctcata gaacgcccaa ttacaataag catgttttgc 5160
tgttatcacc gggtgatagg tttgctcaac catggaaggt agcatggaat cataatttgg 5220
atactaatac aaatcggcca tataatgcca ttagtaaatt gcgctcccat ttaggtggtt 5280
ctccaggcaa atttgaatac taataaatgc ggtgcatttg caaaatgaat ttattccaag 5340
gccaaaacaa cacgatgaat ggctttattt ttttgttatt cctgacatga agctttatgt 5400
aattaaggaa acggacatcg aggaatttgc atctttttta gatgaaggag ctattcaagc 5460
accaaagcta tccttccagg attatttaag cggtaaggcc aaggcttccc aacaggttca 5520
tgaagtgcat catagaaagc ttacaaggtt tcagggtgaa acttttctaa gagattggaa 5580
cttagtctgt gggcattata agagagatgc taagtgtgga gaaatgggac ccgacataat 5640
tgcagcattt caagatgaaa agctttttcc tgagaataat ctagccttaa tttctcatat 5700
tgggggtcat attt 5714
<210> 93
<211> 7688
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i301
<400> 93
gacggcacgg ccacgcgttt aaaccgccga gctattcgcg gaacattcta gctcgtttgc 60
atcttcttgc atttggtagg ttttcaatag ttcggtaata ttaacggata cctactatta 120
tcccctagta ggctcttttc acggagaaat tcgggagtgt tttttttccg tgcgcatttt 180
cttagctata ttcttccagc ttcgcctgct gcccggtcat cgttcctgtc acgtagtttt 240
tccggattcg tccggctcat ataataccgc aataaacacg gaatatctcg ttccgcggat 300
tcggttaaac tctcggtcgc ggattatcac agagaaagct tcgtggagaa tttttccaga 360
ttttccgctt tccccgatgt tggtatttcc ggaggtcatt atactgaccg ccattataat 420
gactgtacaa cgaccttctg gagaaagaaa caactcaata acgatgtggg acattggggg 480
cccactcaaa aaatctgggg actatatccc cagagaattt ctccagaaga gaagaaaagt 540
caaagttttt tttcgcttgg gggttgcata taaagctcac acgcggccag ggggagccat 600
gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa agttcgacag 660
cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca gcttcgatgt 720
aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct acaaagatcg 780
ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc ttgacattgg 840
ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg tcacgttgca 900
agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg ccatggatgc 960
gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac cgcaaggaat 1020
cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc atgtgtatca 1080
ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc tcgatgagct 1140
gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg atttcggctc 1200
caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga gcgaggcgat 1260
gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt ggttggcttg 1320
tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag gatcgccgcg 1380
gctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct tggttgacgg 1440
caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc gatccggagc 1500
cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga ccgatggctg 1560
tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga gggcaaagga 1620
atagcgctcg tccaacgccg gcggacctcg ctcgtccaac gccggcggac ctcttttaat 1680
tctgctgtaa cccgtacatg cccaaaatag ggggcgggtt acacagaata tataacatcg 1740
taggtgtctg ggtgaacagt ttattcctgg catccactaa atataatgga gcccgctttt 1800
taagctggca tccagaaaaa aaaagaatcc cagcaccaaa atattgtttt cttcaccaac 1860
catcagttca taggtccatt ctcttagcgc aactacagag aacaggggca caaacaggca 1920
aaaaacgggc acaacctcaa tggagtgatg caacctgcct ggagtaaatg atgacacaag 1980
gcaattgacc cacgcatgta tctatctcat tttcttacac cttctattac cttctgctct 2040
ctctgatttg gaaaaagctg aaaaaaaagg ttgaaaccag ttccctgaaa ttattcccct 2100
acttgactaa taagtatata aagacggtag gtattgattg taattctgta aatctatttc 2160
ttaaacttct taaattctac ttttatagtt agtctttttt ttagttttaa aacaccaaga 2220
acttagtttc gatccccgcg tgcttggccg gccgtatccc cgcgtgcttg gccggccgta 2280
tgtctcagaa cgtttacatt gtatcgactg ccagaacccc aattggttca ttccagggtt 2340
ctctatcctc caagacagca gtggaattgg gtgctgttgc tttaaaaggc gccttggcta 2400
aggttccaga attggatgca tccaaggatt ttgacgaaat tatttttggt aacgttcttt 2460
ctgccaattt gggccaagct ccggccagac aagttgcttt ggctgccggt ttgagtaatc 2520
atatcgttgc aagcacagtt aacaaggtct gtgcatccgc tatgaaggca atcattttgg 2580
gtgctcaatc catcaaatgt ggtaatgctg atgttgtcgt agctggtggt tgtgaatcta 2640
tgactaacgc accatactac atgccagcag cccgtgcggg tgccaaattt ggccaaactg 2700
ttcttgttga tggtgtcgaa agagatgggt tgaacgatgc gtacgatggt ctagccatgg 2760
gtgtacacgc agaaaagtgt gcccgtgatt gggatattac tagagaacaa caagacaatt 2820
ttgccatcga atcctaccaa aaatctcaaa aatctcaaaa ggaaggtaaa ttcgacaatg 2880
aaattgtacc tgttaccatt aagggattta gaggtaagcc tgatactcaa gtcacgaagg 2940
acgaggaacc tgctagatta cacgttgaaa aattgagatc tgcaaggact gttttccaaa 3000
aagaaaacgg tactgttact gccgctaacg cttctccaat caacgatggt gctgcagccg 3060
tcatcttggt ttccgaaaaa gttttgaagg aaaagaattt gaagcctttg gctattatca 3120
aaggttgggg tgaggccgct catcaaccag ctgattttac atgggctcca tctcttgcag 3180
ttccaaaggc tttgaaacat gctggcatcg aagacatcaa ttctgttgat tactttgaat 3240
tcaatgaagc cttttcggtt gtcggtttgg tgaacactaa gattttgaag ctagacccat 3300
ctaaggttaa tgtatatggt ggtgctgttg ctctaggtca cccattgggt tgttctggtg 3360
ctagagtggt tgttacactg ctatccatct tacagcaaga aggaggtaag atcggtgttg 3420
ccgccatttg taatggtggt ggtggtgctt cctctattgt cattgaaaag atatgattac 3480
gttctgcgat tttctcatga tctttttcat aaaatacata aatatataaa tggctttatg 3540
tataacaggc ataatttaaa gttttatttg cgattcatcg tttttcaggt actcaaacgc 3600
tgaggtgtgc cttttgactt acttttccgc cttggcaagc tggccgggtg atacttgcac 3660
aagttccact aattactgac atttgtggta ttaactcgtt tgactgctct acaattgtag 3720
gatgttaatc aatgtcttgg ctgcctaacc tgcaggccgc gagcgccgat atgctatgta 3780
atagacaata aaaccatgtt tatataaaaa aaattcaaaa tagaaaacga ttctgtacaa 3840
ggagtatttt ttttttgttc tagtgtgttt atattatcct tggctaagag gcactgcgta 3900
tacttcaagg tacccctgtg ttttgaaaaa aaacaacagt aaaataggaa ctccgcgagg 3960
ttcaggaacc tgaaacaaaa tcaataaaaa cattatatgc gtttcgaaca aaattaaaga 4020
aaaagaataa atatagatta aaaaaaaaaa gaagaaatta aaagaatttc tactaaatcc 4080
caattgttat atatttgtta aatgccaaaa aagtttataa aaaatttaga atgtataaat 4140
aataataaac taagtaacgc gatcgccgac gccgccgata tctccctcgc cagcggccgc 4200
cttatggcta agaatgttgg aattttggcc atggacatct acttcccacc aacttgtgtt 4260
cagcaggagg ctttagaagc acatgacgga gcctcaaagg gtaagtacac aatcggatta 4320
ggacaggatt gcttagcatt ctgcactgaa ttggaggacg tcatctcaat gtctttcaac 4380
gccgtcacct cattgttaga gaagtacaaa atcgacccaa accagatcgg aaggttggaa 4440
gtcggttctg aaaccgtcat cgacaagtct aaatcaatca agactttcgt tatgcagttg 4500
ttcgaaaagt gcggtaatac tgacgtcgag ggtgtagact ctactaacgc ttgttatggt 4560
ggtaccgcag ctttattgaa ctgcgtaaac tgggttgagt caaactcatg ggatggtagg 4620
tacggattag tcatttgcac cgattctgcc gtctacgccg agggtccagc aaggccaacc 4680
ggtggagctg cagctattgc tatgttaatc ggaccagatg cccctatagt cttcgagtct 4740
aagttgaggg gttcacacat ccctaacgtc tacgacttct acaagccaaa cttggcctca 4800
gagtatccag ttgtcgacgg aaagttatct cagacatgct acttgatggc cttagattca 4860
tgttacaagc acttatgcaa caagttcgaa aagttggagg gaaaggagtt ctcaattaac 4920
gacgccgact acttcgtttt tcactctcca tacaacaaat tggtccagaa gtcattcgcc 4980
aggttattgt acaacgattt tttgagaaac gcatcatcta tcgatgaggc cgccaaggag 5040
aaattcaccc catattcttc tttgtcattg gacgagtctt accagtctag ggacttggag 5100
aaggtatcac agcaattggc taaaaccttc tatgacgcca aagttcagcc aaccaccttg 5160
gtccctaaac aggtcggaaa tatgtatact gcatctttgt atgccgcctt tgcctctttg 5220
atccacaaca agcacaacga tttagtcgga aaaagggttg tcatgttttc ttacggtgcc 5280
ggatctactg ccactatgtt ctcattgagg ttatgcgaaa accagtcacc attttcattg 5340
tctaacatcg cctcagtcat ggacgtaggt gtctcacctg agaagttcgt agaaaccatg 5400
aagttgatgg agcacagata cggtgccaaa gaattcgtca cttcaaaaga gggaatcttg 5460
gatttgttgg ccccaggaac ctactatttg aaggaggtcg actctttgta cagaaggttc 5520
tatggaaaga agggagacga cggatctgtc gcaaacggtc agtaaatcgg cggcgtcggc 5580
gatcgcgtta aggcggccgc tggcgaggga gatatttcaa cctgggccta acagtaaaga 5640
tatcctcctc aaaactggtg cacttaatcg ctgaatttgt tctggcttct cttctttttc 5700
tttattcccc ccatgggcca aaaaaaatag tactatcagg aatttggcgc cgggtcacga 5760
tatacgtgta cagtgaccta ggcgacgcca caaggaaaaa ggaaaaaaac agaaaaaaca 5820
acaaaaacta aaacaaacac gaaaacttta atagatctaa gtgaagtagt ggtgaggcaa 5880
ttggagtgac atagcagcta ctacaactac aaaaaaggcg cgccacggtc gtgcggatat 5940
gaaagaggtc gttatagctt ctgccgtcag gaccgccatc ggatcttacg gtaagtcatt 6000
aaaggacgtc cctgccgttg atttaggagc caccgcaatt aaagaggccg ttaaaaaggc 6060
aggtataaag ccagaggacg tcaacgaggt catcttggga aatgtcttac aagccggatt 6120
aggtcaaaac ccagcaagac aagcatcatt caaagccggt ttacctgtcg agatacctgc 6180
aatgaccatc aacaaggttt gcggttcagg attaaggacc gtttctttag cagcacagat 6240
cattaaggct ggagatgcag acgttatcat tgctggtggt atggaaaaca tgtcaagagc 6300
cccatacttg gctaataacg ccaggtgggg atataggatg ggaaacgcca agtttgtcga 6360
cgaaatgatt actgacggat tgtgggacgc cttcaatgac tatcacatgg gtataaccgc 6420
agaaaacatt gccgagaggt ggaatatctc aagagaagaa caggatgagt ttgcattggc 6480
ctcacagaaa aaagcagagg aggcaataaa gtcaggtcag tttaaggatg aaatcgtccc 6540
agtcgtcatc aagggaagaa agggtgagac agttgtcgac accgacgaac accctagatt 6600
tggttcaacc atcgagggat tagcaaagtt gaagccagcc ttcaagaaag acggaaccgt 6660
aaccgccggt aatgcatctg gattgaacga ttgcgcagca gttttggtca taatgtcagc 6720
cgagaaagct aaggagttgg gtgtcaagcc attggcaaaa attgtttcat acggatcagc 6780
cggtgtcgac cctgccatca tgggttacgg acctttttac gccaccaagg ctgcaatcga 6840
aaaggccggt tggaccgtag atgaattgga tttgatcgag tcaaacgagg cctttgccgc 6900
ccaatcattg gctgtcgcca aggacttgaa gttcgacatg aacaaggtca acgtcaacgg 6960
tggtgccatc gcattgggtc accctatcgg agcctctggt gccaggatct tggttacctt 7020
ggtccacgcc atgcagaaga gggacgcaaa gaagggtttg gccaccttgt gcatcggtgg 7080
aggtcaggga acagctatct tgttagagaa atgcagcccc tcagcccccc tagcgtcgaa 7140
taaaagacat tggtacatga tatcaaacag aattttaaca tttcttgatc cagtttgtaa 7200
acaaaacaaa caatttttct accatttaac ttcataccat cggcgagagc cgaacaggaa 7260
aaaaaagaag tctccggtta tcgtaagcag tatcaaataa taagaatgta tgtgtgtgca 7320
atttgttata cccacgaaga agtgcgcagt agagttagaa aaccaactga gtaatcttta 7380
ctcccgacaa tcgtccaata atcctcttgt tgctaggaac gtgatgatgg atttcgtttg 7440
aaatccggac ggaaaactca aaagaagtcc aaccaccaac cattttcgag cctcaagaat 7500
ctctaagcag gtttctttac taaggggatg gcctttctgt cctggacatt ttttccttcc 7560
ttttttcatt tccttgaaag gaacagattt tttttgactt ttgccacaca gctgcactat 7620
ctcaacccct tttacatttt aagttttcgg gttgaatggc cggtgtttaa accccagcgc 7680
ctggcggg 7688
<210> 94
<211> 5025
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i476
<400> 94
caggatccga cggcacggcc acgcgtttaa accgcctggg ataggatagt agcaactctt 60
ggaggagagc attgtcagtt gtccagtctc tgaagttaag tagtaagttt gcggagtcaa 120
agggggatgg cttttgccat ttgtgagagt tgtgcggcag catcttattc aaatagagct 180
gtattctgaa gacctcttgt agaacatcat ccatactaaa aagtaaatcg tcctgtccca 240
ttacgagctg tattagtgct gtgaccctct gtatatttac gttgccatga agaaggtaat 300
gggcgatatt ttgatacaat tcctgagttg catgttggat tgagtttacg aagggtcgcc 360
agacggccag aaacctccag gcggagttaa caactagtaa tacggcatcc atgtttgcat 420
cagcgccgag cctataccag tcactgagta gacgttttct tgctcttttt atgtcctgac 480
ttcttttgac gagggggcat tctctagaga cacaggcagt tgcttccagc aactgccgta 540
cggccgttct catgctgtcg aggatttttt ttgggacgat attgtcatta tagggcagtg 600
tgtgacttat gaattgttgt agaaggacgt ctgtgatgtt ggagatatgt attttgttaa 660
ctcttcttga gacgatttgg ccctggatag cgaagcgtgc ggttacaaat aggtcgtctt 720
gttcaagaag gtaggcgagg acattatcta tcagtacaaa catcttagta gtgtctgagg 780
agagggttga ttgtttatgt atttttgcga aatatatata tatatattct acacagatat 840
atacatattt gtttttcggg ctcattcttt cttctttgcc agaggctcac cgctcaagag 900
gtccgctaat tctggagcga ttgttattgt tttttctttt cttcttctat tcgaaaccca 960
gtttttgatt tgaatgcgag ataaactggt attcttcatt agattctcta ggcccttggt 1020
atctagatat gggttctcga tgttctttgc aaaccaactt tctagtattc ggacattttc 1080
ttttgtaaac cggtgtcctc tgtaaggttt agtacttttg tttatcatat cttgagttac 1140
cacattaaat accaacccat ccgccgattt atttttctgt gtaagttgat aattacttct 1200
atcgttttct atgctgcgca tttctttgag taatacagta atggtagtag tgagttgaga 1260
tgttgtttgc aacaacttct tctcctcatc actaatctta cggtttttgt tggccctaga 1320
taagaatcct aatatatccc ttaattcaac ttcttcttct gttgttacac tctctggtaa 1380
cttaggtaaa ttacagcaaa tagaaaagag ctttttattt atgtctagta tgctggattt 1440
aaactcatct gtgatttgtg gatttaaaag gtctttaatg ggtattttat tcattttttc 1500
ttgcttatct tccttttttt cttgcccact tctaagctga tttcaatctc tcctttatat 1560
atatttttaa gttccaacat tttatgtttc aaaacattaa tgatgtctgg gttttgtttg 1620
ggatgcaatt tattgcttcc caatgtagaa aagtacatca tatgaaacaa cttaaactct 1680
taactacttc ttttaacctt cactttttat gaaatgtatc aaccatatat aataacttaa 1740
tagacgacat tcacaatatg tttacttcga agcctgcttt caaaattaag aacaaagcat 1800
ccaaatcata cagaaacaca gcggtttcaa aaaagctgaa agaaaaacgt ctagctgagc 1860
atgtgaggcc aagctgcttc aatattattc gaccactcaa gaaagatatc cagattcctg 1920
ttccttcctc tcgattttta aataaaatcc aaattcacag gatagcgtct ggaagtcaaa 1980
atactcagtt tcgacagttc aataagacat ctataaaatc ttcaaagaaa tatttaaact 2040
catttatggc ttttagagca tattactcac agtttggctc cggtgtaaaa caaaatgtct 2100
tgtcttctct gctcgctgaa gaatggcacg cggacaaaat gcagcacgga atatgggact 2160
acttcgcgca acagtataat tttataaacc ctggttttgg ttttgtagag tggttgacga 2220
ataattatgc tgaagtacgt ggtgacggat attgggaaga tgtgtttgta catttggcct 2280
tatagagtgt ggtcgtggcg gaggttgttt atctttcgag tactgaatgt tgtcagtata 2340
gctatcctat ttgaaactcc ccatcgtctt gctcttgttc ccaatgtttg tttatacact 2400
catatggcta tacccttatc tacttgcctc ttttgtttat gtctatgtat ttgtataaaa 2460
tatgatatta ctcagactca agcaaacaat caatgctcac acgcggccag ggggagcctc 2520
gacactagta atacacatca tcgtcctaca agttcatcaa agtgttggac agacaactat 2580
accagcatgg atctcttgta tcggttcttt tctcccgctc tctcgcaata acaatgaaca 2640
ctgggtcaat catagcctac acaggtgaac agagtagcgt ttatacaggg tttatacggt 2700
gattcctacg gcaaaaattt ttcatttcta aaaaaaaaaa gaaaaatttt tctttccaac 2760
gctagaagga aaagaaaaat ctaattaaat tgatttggtg attttctgag agttcccttt 2820
ttcatatatc gaattttgaa tataaaagga gatcgaaaaa atttttctat tcaatctgtt 2880
ttctggtttt atttgatagt ttttttgtgt attattatta tggattagta ctggtttata 2940
tgggtttttc tgtataactt ctttttattt tagtttgttt aatcttattt tgagttacat 3000
tatagttccc taactgcaag agaagtaaca ttaaaaatga aaaagcctga actcaccgcg 3060
acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 3120
tcggagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 3180
cgggtaaata gctgcgccga tggtttctac aaagatcgtt atgtttatcg gcactttgca 3240
tcggccgcgc tcccgattcc ggaagtgctt gacattgggg aattcagcga gagcctgacc 3300
tattgcatct cccgccgtgc acagggtgtc acgttgcaag acctgcctga aaccgaactg 3360
cccgctgttc tgcagccggt cgcggaggcc atggatgcga tcgctgcggc cgatcttagc 3420
cagacgagcg ggttcggccc attcggaccg caaggaatcg gtcaatacac tacatggcgt 3480
gatttcatat gcgcgattgc tgatccccat gtgtatcact ggcaaactgt gatggacgac 3540
accgtcagtg cgtccgtcgc gcaggctctc gatgagctga tgctttgggc cgaggactgc 3600
cccgaagtcc ggcacctcgt gcacgcggat ttcggctcca acaatgtcct gacggacaat 3660
ggccgcataa cagcggtcat tgactggagc gaggcgatgt tcggggattc ccaatacgag 3720
gtcgccaaca tcttcttctg gaggccgtgg ttggcttgta tggagcagca gacgcgctac 3780
ttcgagcgga ggcatccgga gcttgcagga tcgccgcggc tccgggcgta tatgctccgc 3840
attggtcttg accaactcta tcagagcttg gttgacggca atttcgatga tgcagcttgg 3900
gcgcagggtc gatgcgacgc aatcgtccga tccggagccg ggactgtcgg gcgtacacaa 3960
atcgcccgca gaagcgcggc cgtctggacc gatggctgtg tagaagtact cgccgatagt 4020
ggaaaccgac gccccagcac tcgtccgagg gcaaaggaat aggtttaact tgatactact 4080
agattttttc tcttcattta taaaattttt ggttataatt gaagctttag aagtatgaaa 4140
aaatcctttt ttttcattct ttgcaaccaa aataagaagc ttcttttatt cattgaaatg 4200
atgaatataa acctaacaaa agaaaaagac tcgaatatca aacattaaaa aaaaataaaa 4260
gaggttatct gttttcccat ttagttggag tttgcatttt ctaatagata gaactctcaa 4320
ttaatgtgga tttagtttct ctgttcgttt ttttttgttt tgttctcact gtatttacat 4380
ttctatttag tatttagtta ttcatataat cttaacttct cgaggagctc cgctcgtcca 4440
acgccggcgg acctcggagg ttgtttatct ttcgagtact gaatgttgtc agtatagcta 4500
tcctatttga aactccccat cgtcttgctc ttgttcccaa tgtttgttta tacactcata 4560
tggctatacc cttatctact tgcctctttt gtttatgtct atgtatttgt ataaaatatg 4620
atattactca gactcaagca aacaatcaat tcttagcatc attctttgtt cttatcttaa 4680
ccataaacga tcttgatgtg acttttgtaa tttgaacgaa ttggctatac gggacggatg 4740
acaaatgcac cattactcta ggttgttgtt ggatcttaac aaaccgtaaa ggtaaactgc 4800
ccatgcggtt cacatgactt ttgactttcc tttgtttgct agttaccttc ggcttcacaa 4860
tttgtttttc cacttttcta acaggtttat cacctttcaa acttatcttt atcttattcg 4920
ccttcttggg tgcctccaca gtagaggtta cttccttttt aatatgtact tttaggatac 4980
tttcacgctt tataacacgg tgtttaaacc ccagcgcctg gcggg 5025
<210> 95
<211> 3665
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i477
<400> 95
agctcgagga cggcacggcc acgcgtttaa accgccaagc ttttcaattc atcttttttt 60
tttttgttct tttttttgat tccggtttct ttgaaatttt tttgattcgg taatctccga 120
gcagaaggaa gaacgaagga aggagcacag acttagattg gtatatatac gcatatgtgg 180
tgttgaagaa acatgaaatt gcccagtatt cttaacccaa ctgcacagaa caaaaacctg 240
caggaaacga agataaatca tgtcgaaagc tacatataag gaacgtgctg ctactcatcc 300
tagtcctgtt gctgccaagc tatttaatat catgcacgaa aagcaaacaa acttgtgtgc 360
ttcattggat gttcgtacca ccaaggaatt actggagtta gttgaagcat taggtcccaa 420
aatttgttta ctaaaaacac atgtggatat cttgactgat ttttccatgg agggcacagt 480
taagccgcta aaggcattat ccgccaagta caatttttta ctcttcgaag acagaaaatt 540
tgctgacatt ggtaatacag tcaaattgca gtactctgcg ggtgtataca gaatagcaga 600
atgggcagac attacgaatg cacacggtgt ggtgggccca ggtattgtta gcggtttgaa 660
gcaggcggca gaagaagtaa caaaggaacc tagaggcctt ttgatgttag cagaattgtc 720
atgcaagggc tccctatcta ctggagaata tactaagggt actgttgaca ttgcgaagag 780
tgacaaagat tttgttatcg gctttattgc tcaaagagac atgggtggaa gagatgaagg 840
ttacgattgg ttgattatga cacccggtgt gggtttagat gacaagggag acgcattggg 900
tcaacagtat agaaccgtgg atgatgtggt ctctacagga tctgacatta ttattgttgg 960
aagcgctcgt ccaacgccgg cggacctatg gcgcaagttt tccgctttgt aatatatatt 1020
tatacccctt tcttctctcc cctgcaatat aatagtttaa ttctaatatt aataatatcc 1080
tatattttct tcatttaccg gcgcactctc gcccgaacga cctcaaaatg tctgctacat 1140
tcataataac caaaagctca taactttttt ttttgaacct gaatatatat acatcacata 1200
tcactgctgg tccttgccga ccagcgtata caatctcgat agttggtttc ccgttctttc 1260
cactcccgtc atggactaca acaagagatc ttcggtctca accgtgccta atgcagctcc 1320
cataagagtc ggattcgtcg gtctcaacgc agccaaagga tgggcaatca agacacatta 1380
ccccgccata ctgcaactat cgtcacaatt tcaaatcact gccttataca gtccaaaaat 1440
tgagacttct attgccacca tccagcgtct aaaattgagt aatgccactg cttttcccac 1500
tttagagtca tttgcatcat cttccactat agatatgata gtgatagcta tccaagtggc 1560
cagtcattat gacgttgtta tgcctctctt ggaattctcc aaaaataatc cgaacctcaa 1620
gtatcttttc gtagaatggg cccttgcatg ttcactagat caagccgaat ccatttataa 1680
ggctgctgct gaacgtgggg ttcaaaccat catctcttta caaggtcgta aatcaccata 1740
tattttgaga gcaaaagaat taatatctca aggctatatc ggcgacatta attctatcga 1800
gattgctgga aatggcggtt ggtacggcta cgaaaggcct gttaaatcac caaaatacat 1860
ctatgaaatc gggaacggtg tagatctggt aaccacaaca tttggtcaca caatcgatat 1920
tttacaatac atgacaagtt cgtacttttc caggataaat gcaatggttt tcaataatat 1980
tccagagcaa gagctgatag atgagcgtgg taaccgattg ggccagcgag tcccaaagac 2040
agtaccggat catcttttat tccaaggcac attgttaaat ggcaatgttc cagtgtcatg 2100
cagtttcaaa ggtggcaaac ctaccaaaaa atttaccaaa aatttggtca ttgatattca 2160
cggtaccaag ggagatttga aacttgaagg cgatgccgga ttcgcagaaa tttcaaatct 2220
ggtcctttac tacagtggaa ctagagcaaa cgacttcccg ctagctaatg gacaacaagc 2280
tcctttagac ccggggtatg atgcaggtaa agaaatcatg gaagtatatc atttacgaaa 2340
ttataatgcc attgtcggta atattcatcg actgtatcaa tctatctctg acttccactt 2400
caatacaaag aaaattcctg aattaccctc acaatttgta atgcaaggtt tcgatttcga 2460
aggctttccc accttgatgg atgctctgat attacacagg ttaatcgaga gcgtttataa 2520
aagtaacatg atgggctcca cattaaacgt tagcaatatc tcgcattata gtttataaaa 2580
gcatcttgcc ctgtgcttgg cccccagtgc agcgaacgtt ataaaaacga atactgagta 2640
tatatctatg taaaacaacc atatcatttc ttgttctgaa ctttgtttac ctaactagtt 2700
ttaaatttcc ctttttcgtg catgcgggtg ttcttattta ttagcatact acatttgaaa 2760
tatcaaattt ccttagtaga aaagtgagag aaggtgcact gacacaaaaa ataaaatccc 2820
cgcgtgcttg gccggccgtc ttcattggat gttcgtacca ccaaggaatt actggagtta 2880
gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat cttgactgat 2940
ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta caatttttta 3000
ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca gtactctgcg 3060
ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt ggtgggccca 3120
ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc tagaggcctt 3180
ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata tactaagggt 3240
actgttgaca ttgcgaagag tgacaaagat tttgttatcg gctttattgc tcaaagagac 3300
atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt gggtttagat 3360
gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt ctctacagga 3420
tctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc taaggtagag 3480
ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg ccagcaaaac 3540
taaaaaactg tattataagt aaatgcatgt atactaaact cacaaattag agcttcaatt 3600
taattatatc agttattacc cgggaatctc ggtgtttaaa ccccagcgcc tggcgggtct 3660
agatc 3665
<210> 96
<211> 10623
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i94
<400> 96
atgagtgata gggaattcgt cacggtagat cccgtcacta tcataatcaa agaatgcatt 60
aatttatcga cagcgatgcg gaaatactct aaatttacct ctcaatctgg agtggccgct 120
ttgctggggg gaggaagtga aatatttagc aatcaagatg actacttggc tcacacattc 180
aacaatttga ataccaacaa gcacaatgat ccatttttat ctggattcat tcagttaaga 240
cttatgttga ataaactgaa aaatctagat aatatagatt cactaaccat attgcagcca 300
tttttattaa ttgtgagtac aagttccatt tctggttaca tcacttccct ggccctggac 360
tctttgcaga aattctttac cttgaatatc atcaatgaat catcgcaaaa ctatattggt 420
gcacacaggg cgacggtaaa tgctctaaca cattgtaggt ttgaaggatc tcaacaactt 480
tctgatgatt cagttctttt gaaagtcgtg tttttactgc gttcaatcgt cgactcacct 540
tacggagatt tattatcaaa ctctatcata tatgacgtat tgcaaacgat tctttcattg 600
gcttgtaata acagaaggag cgaagtcctt aggaatgctg cacaatcaac aatgatagcc 660
gttaccgtaa agattttctc aaaactaaag actattgagc ctgttaatgt gaatcaaata 720
tacatcaatg atgaaagtta cacaaatgat gtattgaagg ccgatacaat tggcacaaat 780
gtagaatcca aagaagaagg aagtcaagaa gatcccatcg gcatgaaagt gaataatgag 840
gaagctatta gcgaggacga tggcattgaa gaagagcata ttcattcaga gaagagcaca 900
aatggcgccg aacaactaga tattgtgcaa aaaacaacaa gatcaaattc caggatccaa 960
gcgtatgctg atgataacta tggattgccc gtggttaggc aatatttaaa cttattacta 1020
tcattgattg cgccagaaaa tgaattaaaa cattcatact ccactagaat atttggccta 1080
gagttaattc aaacggcatt agaaatttca ggtgatcgat tgcagctata cccacggctt 1140
tttacactga tatcagatcc tattttcaaa agcattttgt ttatcataca gaacactaca 1200
aaattatcac tacttcaagc tacattgcag ctatttacta ctctagttgt tatattgggc 1260
aacaacttac aattacagat cgagctcact ctaacaagaa tattttctat tcttttagat 1320
gatggtaccg caaataactc gagttctgaa aataagaaca agccatcaat aataaaggaa 1380
cttctaattg agcaaatatc catcttatgg actaggtcgc catctttttt tacttctact 1440
tttatcaatt tcgattgtaa tctcgatagg gcagacgttt ccataaactt tttgaaggct 1500
ttgactaaat tggccttacc agaatccgcc ttaactacca cagaaagtgt accacccatt 1560
tgccttgagg gattggtctc cctagtcgat gatatgttcg atcacatgaa ggacattgac 1620
agagaagaat ttggcaggca aaagaatgaa atggaaatct taaaaaagag ggaccgtaaa 1680
acagagttta ttgaatgtac caatgcattc aatgaaaagc ccaaaaaggg tattccgatg 1740
ttaatagaaa aaggtttcat tgcttccgac tccgataaag atattgcgga gtttcttttc 1800
aataataaca accgtatgaa taaaaaaaca atcggtttgc tactttgcca tccggacaaa 1860
gtaagcttgt tgaatgaata tattcgtttg tttgattttt cagggttaag ggtcgatgaa 1920
gctattagaa ttttgttgac gaaatttagg ttgcctggtg aatcgcaaca aattgaaaga 1980
atcatcgaag ccttctcgtc tgcgtattgt gaaaatcaag attacgatcc atccaaaatc 2040
agtgacaacg cggaggatga catttctact gttcaaccag acgctgattc tgttttcatt 2100
ttaagttatt caattattat gttgaacact gacctacata accctcaagt gaaggaacac 2160
atgtcatttg aagattactc tggtaactta aagggatgct gtaatcacaa agacttccca 2220
ttctggtatt tggatagaat ttactgttca atcagagata aagaaattgt tatgcctgaa 2280
gagcaccacg gcaacgaaaa gtggtttgaa gatgcttgga ataacttgat atcttcaact 2340
actgttataa ctgaaataaa aaaagacaca caatctgtca tggataaatt aacacccttg 2400
gagcttttga actttgatag agcaattttt aaacaagttg gcccaagtat tgtcagtact 2460
ttattcaaca tttacgtagt tgcatctgat gaccatatat ctaccagaat gataacaagt 2520
ttggacaaat gttcctatat ttccgcattt tttgacttca aagatctctt taatgatata 2580
ctaaactcca ttgctaaggg cactactttg attaattcaa gccatgacga tgaactttca 2640
actttagctt ttgaatatgg cccaatgcca ctggtgcaaa ttaaattcga agacactaac 2700
actgagatcc cggttagtac agatgctgtt agatttggta gatcatttaa gggtcaacta 2760
aatacagttg tttttttccg gattattcgc aggaacaaag atcctaaaat tttctccaag 2820
gaattatggt taaacattgt taatattata ctaacattgt acgaagactt gattttgtct 2880
cctgatattt tccctgattt acaaaaaaga ctgaaattaa gcaacttgcc taagccatct 2940
cctgaaattt ctattaacaa gagcaaagaa agcaaaggtc tcttatcaac atttgcttct 3000
tatttaaaag gtgatgaaga acccacagaa gaggaaatca aatcctcaaa aaaagcgatg 3060
gagtgcataa agtcgagtaa tattgccgcc tctgtctttg gaaatgaatc aaatataaca 3120
gcggatttaa taaaaacttt actagactcc gccaaaactg agaaaaacgc agataattcc 3180
aggtattttg aagcagaact tttatttatc atcgaattga ctattgcatt atttctattt 3240
tgcaaagagg agaaagaatt aggaaagttc atacttcaaa aagttttcca actttctcac 3300
acgaaaggcc tcacgaaaag gactgttcgt agaatgctaa catacaaaat tttgttaatt 3360
tcgttatgtg cggatcagac ggagtacttg tccaaattaa taaacgatga gctgttaaaa 3420
aagggggata tttttaccca aaaatttttt gcaactaatc aaggtaagga atttttgaag 3480
agactatttt cattgaccga atcagagttt tatagaggat ttttactagg aaatgagaat 3540
ttttggaaat ttttaagaaa agttacagca atgaaagagc agagcgagag catttttgaa 3600
tatttaaatg aatcgatcaa gacagacagc aatattttga caaatgagaa cttcatgtgg 3660
gtcctaggac tattagatga aatttcatca atgggtgccg ttggaaatca ctgggaaata 3720
gaatacaaga aattgacaga aagtggtcat aaaattgata aggagaatcc atacaagaaa 3780
tcgatcgaat tatcattgaa atccattcaa ctaacatcac acttgctgga agataataac 3840
gatctgcgta aaaacgagat attcgctatt attcaagctt tggcacatca atgcatcaat 3900
ccgtgtaagc agataagtga atttgcagtg gtaacgctag agcagacgct catcaataaa 3960
atcgaaattc caactaatga gatggaatcg gtagaagaat taattgaggg cggattacta 4020
ccgttgctaa attcgagtga aacacaggaa gaccagaaaa tcctcatttc atccatatta 4080
acaataattt caaatgttta tttgcattat ttgaaactag ggaagacaag caacgaaacg 4140
tttttgaaaa ttttgagtat tttcaataaa tttgtagagg actcagatat tgaaaaaaag 4200
ctacagcaat taatacttga taagaagagt attgagaagg gcaacggttc atcatctcat 4260
ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 4320
attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattaa 4380
agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 4440
cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 4500
tggctgtggt ttcagggtcc atacccggga gttatgacaa ttacaacaac agaattcttt 4560
ctatatatgc acgaacttgt aatatggaag aaattatgac gtacaaacta taaagtaaat 4620
attttacgta acacatggtg ctgttgtgct tctttttcaa gagaatacca atgacgtatg 4680
actaagttta ggatttaatg caggtgacgg acccatcttt caaacgattt atatcagtgg 4740
cgtccaaatt gttaggtttt gttggttcag caggtttcct gttgtgggtc atatgacttt 4800
gaaccaaatg gccggctgct agggcagcac ataaggataa ttcacctgcc aagacggcac 4860
aggcaactat tcttgctaat tgacgtgcgt tggtaccagg agcggtagca tgtgggcctc 4920
ttacacctaa taagtccaac atggcacctt gtggttctag aacagtacca ccaccgatgg 4980
tacctacttc gatggatggc atggatacgg aaattctcaa atcaccgtcc acttctttca 5040
tcaatgttat acagttggaa ctttcgacat tttgtgcagg atcttgtcct aatgccaaga 5100
aaacagctgt cactaaatta gctgcatgtg cgttaaatcc accaacagac ccagccattg 5160
cagatccaac caaattctta gcaatgttca actcaaccaa tgcggaaaca tcacttttta 5220
acacttttct gacaacatca ccaggaatag tagcttctgc gacgacactc ttaccacgac 5280
cttcgatcca gttgatggca gctggttttt tgtcggtaca gtagttacca gaaacggaga 5340
caacctccat atcttcccag ccatactctt ctaccatttg ctttaatgag tattcgacac 5400
ccttagaaat catattcata cccattgcgt caccagtagt tgttctaaat ctcatgaaga 5460
gtaaatctcc tgctagacaa gtttgaatat gttgcagacg tgcaaatctt gatgtagagt 5520
taaaagcttt tttaattgcg ttttgtccct cttctgagtc taaccatatc ttacaggcac 5580
cagatctttt caaagttggg aaacggacta ctgggcctct tgtcatacca tccttagtta 5640
aaacagttgt tgcaccaccg ccagcattga ttgccttaca gccacgcatg gcagaagcta 5700
ccaaacaacc ctctgtagtt gccattggta tatgataaga tgtaccatcg ataaccaagg 5760
ggcctataac accaacgggc aaaggcatgt aacctataac attttcacaa caagcgccaa 5820
atacgcggtc gtagtcataa tttttatatg gtaaacgatc agatgctaat acaggagctt 5880
ctgccaaaat tgaaagagcc ttcctacgta ccgcaaccgc tctcgtagta tcacctaatt 5940
ttttctccaa agcgtacaaa ggtaacttac cgtgaataac caaggcagcg acctctttgt 6000
tcttcaattg ttttgtattt ccactactta ataatgcttc taattcttct aaaggacgta 6060
ttttcttatc caagctttca atatcgcggg aatcatcttc ctcactagat gatgaaggtc 6120
ctgatgagct cgattgcgca gatgataaac ttttgacttt cgatccagaa atgactgttt 6180
tattggttaa aactggtgta gaagcctttt gtacaggagc agtaaaagac ttcttggtga 6240
cttcagtctt caccaattgg tctgcagcca ttatagtttt ttctccttga cgttaaagta 6300
tagaggtata ttaacaattt tttgttgata cttttatgac atttgaataa gaagtaatac 6360
aaaccgaaaa tgttgaaagt attagttaaa gtggttatgc agcttttgca tttatatatc 6420
tgttaataga tcaaaaatca tcgcttcgct gattaattac cccagaaata aggctaaaaa 6480
actaatcgca ttattatcct atggttgtta atttgattcg ttgatttgaa ggtttgtggg 6540
gccaggttac tgccaatttt tcctcttcat aaccataaaa gctagtattg tagaatcttt 6600
attgttcgga gcagtgcggc gcgaggcaca tctgcgtttc aggaacgcga ccggtgaaga 6660
ccaggacgca cggaggagag tcttccgtcg gagggctgtc gcccgctcgg cggcttctaa 6720
tccgtacttc aatatagcaa tgagcagtta agcgtattac tgaaagttcc aaagagaagg 6780
tttttttagg ctaagataat ggggctcttt acatttccac aacatataag taagattaga 6840
tatggatatg tatatggtgg tattgccatg taatatgatt attaaacttc tttgcgtcca 6900
tccaaaaaaa aagtaagaat ttttgaaaat tcaatataaa tgaaactctc aactaaactt 6960
tgttggtgtg gtattaaagg aagacttagg ccgcaaaagc aacaacaatt acacaataca 7020
aacttgcaaa tgactgaact aaaaaaacaa aagaccgctg aacaaaaaac cagacctcaa 7080
aatgtcggta ttaaaggtat ccaaatttac atcccaactc aatgtgtcaa ccaatctgag 7140
ctagagaaat ttgatggcgt ttctcaaggt aaatacacaa ttggtctggg ccaaaccaac 7200
atgtcttttg tcaatgacag agaagatatc tactcgatgt ccctaactgt tttgtctaag 7260
ttgatcaaga gttacaacat cgacaccaac aaaattggta gattagaagt cggtactgaa 7320
actctgattg acaagtccaa gtctgtcaag tctgtcttga tgcaattgtt tggtgaaaac 7380
actgacgtcg aaggtattga cacgcttaat gcctgttacg gtggtaccaa cgcgttgttc 7440
aactctttga actggattga atctaacgca tgggatggta gagacgccat tgtagtttgc 7500
ggtgatattg ccatctacga taagggtgcc gcaagaccaa ccggtggtgc cggtactgtt 7560
gctatgtgga tcggtcctga tgctccaatt gtatttgact ctgtaagagc ttcttacatg 7620
gaacacgcct acgattttta caagccagat ttcaccagcg aatatcctta cgtcgatggt 7680
catttttcat taacttgtta cgtcaaggct cttgatcaag tttacaagag ttattccaag 7740
aaggctattt ctaaagggtt ggttagcgat cccgctggtt cggatgcttt gaacgttttg 7800
aaatatttcg actacaacgt tttccatgtt ccaacctgta aattggtcac aaaatcatac 7860
ggtagattac tatataacga tttcagagcc aatcctcaat tgttcccaga agttgacgcc 7920
gaattagcta ctcgcgatta tgacgaatct ttaaccgata agaacattga aaaaactttt 7980
gttaatgttg ctaagccatt ccacaaagag agagttgccc aatctttgat tgttccaaca 8040
aacacaggta acatgtacac cgcatctgtt tatgccgcct ttgcatctct attaaactat 8100
gttggatctg acgacttaca aggcaagcgt gttggtttat tttcttacgg ttccggttta 8160
gctgcatctc tatattcttg caaaattgtt ggtgacgtcc aacatattat caaggaatta 8220
gatattacta acaaattagc caagagaatc accgaaactc caaaggatta cgaagctgcc 8280
atcgaattga gagaaaatgc ccatttgaag aagaacttca aacctcaagg ttccattgag 8340
catttgcaaa gtggtgttta ctacttgacc aacatcgatg acaaatttag aagatcttac 8400
gatgttaaaa aataatcttc ccccatcgat tgcatcttgc tgaaccccct tcataaatgc 8460
tttatttttt tggcagcctg ctttttttag ctctcattta atagagtagt tttttaatct 8520
atatactagg aaaactcttt atttaataac aatgatatat atatattcca gtggtgcatg 8580
aacgcatgag aaagcccccg gaagatcatc ttccgggggc tttttttttg gcgcgcgata 8640
cagaccggtt cagacaggat aaagaggaac gcagaatgtt agacaacacc cgcttacgca 8700
tagctattca gaaatcaggc cgtttaagcg atgattcacg agaattgctg gcccgctgcg 8760
gcataaaaat taatttacac actcagcgcc tgattgcgat ggcggaaaac atgccgattg 8820
atatcctgcg cgtgcgtgat gatgacattc cgggtctggt aatggatggc gtggtcgatc 8880
tcggtattat cggcgaaaac gtgctggaag aagagctact caaccgccgc gcacagggcg 8940
aagatccacg ctatttaacc ctgcgccgtc ttgacttcgg cggctgccgt ttatcgctgg 9000
caacaccggt tgacgaagcc tgggacggcc cggccgcgct ggacggtaaa cgtatcgcta 9060
cctcatatcc gcacctcctc aaacgctacc tcgaccagaa aggcgtctct tttaaatcgt 9120
gtctgttaaa tggttctgtc gaagtcgcgc cgcgcgcggg gctggccgac gctatctgcg 9180
atttggtctc taccggcgcg acgcttgaag ctaacggcct gcgtgaagtc gaagttatct 9240
accgctctaa agcctgtctg attcagcgcg acggtgagat ggcacagagc aagcaagagc 9300
tgatcgataa attgctgacc cgtattcagg gcgtgattca ggcgcgcgaa tcgaaataca 9360
tcatgatgca cgcgccaagt gaacgcctgg aagaggttat cgccctgctg ccaggcgccg 9420
aaaggccgac aattctgccg ctggcaggcg agcaacagcg cgtggcgatg cacatggtca 9480
gcagcgaaac gttgttctgg gaaaccatgg agaaactgaa agcgcttggc gccagctcga 9540
ttctggtact gccgatcgag aagatgatgg agtgatctga cgcctgatgg cgctgcgctt 9600
atcaggccta cgtaatgcgt tgaaaaactg tattataagt aaatgcatgt atactaaact 9660
cacaaattag agcttcaatt taattatatc agttattacc cgggaatctc ggtcgtaatg 9720
atttctataa tgacgaaaaa aaaaaaattg gaaagaaaaa gcttcatggc ctttataaaa 9780
aggaactatc caatacctcg ccagaaccaa gtaacagtat tttacggggc acaaatcaag 9840
aacaataaga caggactgta aagatggacg cattgaactc caaagaacaa caagagttcc 9900
aaaaagtagt ggaacaaaag caaatgaagg atttcatgcg tttgtactct aatctggtag 9960
aaagatgttt cacagactgt gtcaatgact tcacaacatc aaagctaacc aataaggaac 10020
aaacatgcat catgaagtgc tcagaaaagt tcttgaagca tagcgaacgt gtagggcagc 10080
gtttccaaga acaaaacgct gccttgggac aaggcttggg ccgataaggt gtactggcgt 10140
atatatatct aattatgtat ctctggtgta gcccattttt agcatgtaaa tataaagaga 10200
aaccatatct aatctaacca aatccaaaca aaattcaata gttactatcg cttttttctt 10260
tctgtatcgc aaataagtga aaattaaaaa agaaagatta aattggaagt tggatatggg 10320
ctggaacagc agcagtaatc ggtatcgggt tcgccactaa tgacgtccta cgattgcact 10380
caacagacct tgacgctcac gccgtagcgg gcgacaagtc aaacggaaca accgttgccg 10440
ttcccatcgg agtccgacct aggccgaact ccgtgaattt ctgataacaa cggtcggtaa 10500
agactggttc cccagtatat ttcttctctc aggagcaggg gccaatgcca aaagcgacat 10560
taacccggag gacaaggctc cactgtgttc caccgaattt cccacctgat aatatctgat 10620
aac 10623
<210> 97
<211> 8479
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i467
<400> 97
gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60
actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120
tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180
atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240
gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300
atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360
cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420
cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480
ctttcattaa agagaaataa caatattata aaaagcgctt aaagctcaca cgcggccagg 540
gggagccgtt catcatctca tggatctgca catgaacaaa caccagagtc aaacgacgtt 600
gaaattgagg ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 660
tctgatgtag aaaaggatta aagatgctaa gagatagtga tgatatttca taaataatgt 720
aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 780
gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 840
cttttttttt tttgttcttt tttttgattc cggtttcttt gaaatttttt tgattcggta 900
atctccgagc agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc 960
atatgtggtg ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca 1020
aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga acgtgctgct 1080
actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac 1140
ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt tgaagcatta 1200
ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt ttccatggag 1260
ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact cttcgaagac 1320
agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg tgtatacaga 1380
atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg tattgttagc 1440
ggtttgaagc aggcggcaga agaagtaaca aaggaaccta gaggcctttt gatgttagca 1500
gaattgtcat gcaagggctc cctatctact ggagaatata ctaagggtac tgttgacatt 1560
gcgaagagtg acaaagattt tgttatcggc tttattgctc aaagagacat gggtggaaga 1620
gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga caagggagac 1680
gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc tgacattatt 1740
attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg tgaacgttac 1800
agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta aaaaactgta 1860
ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta attatatcag 1920
ttattacccg ggaatctcgg tcgtaatgat ttctataatg acgaaaaaaa aaaaattgga 1980
aagaaaaagc ttcatggcct ttataaaaag gaactatcca atacctcgcc agaaccaagt 2040
aacagtattt tacggggcac aaatcaagaa caataagaca ggactgtaaa gatggacgca 2100
tcgctcgtcc aacgccggcg gacctgtttt caatagttcg gtaatattaa cggataccta 2160
ctattatccc ctagtaggct cttttcacgg agaaattcgg gagtgttttt tttccgtgcg 2220
cattttctta gctatattct tccagcttcg cctgctgccc ggtcatcgtt cctgtcacgt 2280
agtttttccg gattcgtccg gctcatataa taccgcaata aacacggaat atctcgttcc 2340
gcggattcgg ttaaactctc ggtcgcggat tatcacagag aaagcttcgt ggagaatttt 2400
tccagatttt ccgctttccc cgatgttggt atttccggag gtcattatac tgaccgccat 2460
tataatgact gtacaacgac cttctggaga aagaaacaac tcaataacga tgtgggacat 2520
tgggggccca ctcaaaaaat ctggggacta tatccccaga gaatttctcc agaagagaag 2580
aaaagtcaaa gttttttttc gcttgggggt tgcatataaa tacaggcgct gttttatctt 2640
cagcatgaat attccataat tttacttaat agcttttcat aaataataga atcacaaaca 2700
aaatttacat ctgagttaaa caatcatgac aatcaaggaa cataaagtag tttatgaagc 2760
tcacaacgta aaggctctta aggctcctca acatttttac aacagccaac ccggcaaggg 2820
ttacgttact gatatgcaac attatcaaga aatgtatcaa caatctatca atgagccaga 2880
aaaattcttt gataagatgg ctaaggaata cttgcattgg gatgctccat acaccaaagt 2940
tcaatctggt tcattgaaca atggtgatgt tgcatggttt ttgaacggta aattgaatgc 3000
atcatacaat tgtgttgaca gacatgcctt tgctaatccc gacaagccag ctttgatcta 3060
tgaagctgat gacgaatccg acaacaaaat catcacattt ggtgaattac tcagaaaagt 3120
ttcccaaatc gctggtgtct taaaaagctg gggcgttaag aaaggtgaca cagtggctat 3180
ctatttgcca atgattccag aagcggtcat tgctatgttg gctgtggctc gtattggtgc 3240
tattcactct gttgtctttg ctgggttctc cgctggttcg ttgaaagatc gtgtcgttga 3300
cgctaattct aaagtggtca tcacttgtga tgaaggtaaa agaggtggta agaccatcaa 3360
cactaaaaaa attgttgacg aaggtttgaa cggagtcgat ttggtttccc gtatcttggt 3420
tttccaaaga actggtactg aaggtattcc aatgaaggcc ggtagagatt actggtggca 3480
tgaggaggcc gctaagcaga gaacttacct acctcctgtt tcatgtgacg ctgaagatcc 3540
tctattttta ttatacactt ccggttccac tggttctcca aagggtgtcg ttcacactac 3600
aggtggttat ttattaggtg ccgctttaac aactagatac gtttttgata ttcacccaga 3660
agatgttctc ttcactgccg gtgacgtcgg ctggatcacg ggtcacacct atgctctata 3720
tggtccatta accttgggta ccgcctcaat aattttcgaa tccactcctg cctacccaga 3780
ttatggtaga tattggagaa ttatccaacg tcacaaggct acccatttct atgtggctcc 3840
aactgcttta agattaatca aacgtgtagg tgaagccgaa attgccaaat atgacacttc 3900
ctcattacgt gtcttgggtt ccgtcggtga accaatctct ccagacttat gggaatggta 3960
tcatgaaaaa gtgggtaaca aaaactgtgt catttgtgac actatgtggc aaacagagtc 4020
tggttctcat ttaattgctc ctttggcagg tgctgtccca acaaaacctg gttctgctac 4080
cgtgccattc tttggtatta acgcttgtat cattgaccct gttacaggtg tggaattaga 4140
aggtaatgat gtcgaaggtg tccttgccgt taaatcacca tggccatcaa tggctagatc 4200
tgtttggaac caccacgacc gttacatgga tacttacttg aaaccttatc ctggtcacta 4260
tttcacaggt gatggtgctg gtagagatca tgatggttac tactggatca ggggtagagt 4320
tgacgacgtt gtaaatgttt ccggtcatag attatccaca tcagaaattg aagcatctat 4380
ctcaaatcac gaaaacgtct cggaagctgc tgttgtcggt attccagatg aattgaccgg 4440
tcaaaccgtc gttgcatatg tttccctaaa agatggttat ctacaaaaca acgctactga 4500
aggtgatgca gaacacatca caccagataa tttacgtaga gaattgatct tacaagttag 4560
gggtgagatt ggtcctttcg cctcaccaaa aaccattatt ctagttagag atctaccaag 4620
aacaaggtca ggaaagatta tgagaagagt tctaagaaag gttgcttcta acgaagccga 4680
acagctaggt gacctaacta ctttggccaa cccagaagtt gtacctgcca tcatttctgc 4740
tgtagagaac caatttttct ctcaaaaaaa gaaataaatt gaattgaatt gaaatcgata 4800
gatcaatttt tttcttttct ctttccccat cctttacgct aaaataatag tttattttat 4860
tttttgaata ttttttattt atatacgtat atatagacta ttatttatct tttaatgatt 4920
attaagattt ttattaaaaa aaaattcgct cctcttttaa tgcctttatg cagttttttt 4980
ttcccattcg atatttctat gttcgggttc agcgtatttt aagtttaata actcgaaaat 5040
tctgcgttcg ttaaagcttt cgagaaggat attatttcga aataaaccgt gttgtgtaag 5100
cttgaagcct ttttgcgctg ccaatattct tatccatcta ttgtactctt tagatccagt 5160
atagtgtatt cttcctgctc caagctcatc ccatccccgc gtgcttggcc ggccgttttg 5220
ccagcttact atccttcttg aaaatatgca ctctatatct tttagttctt aattgcaaca 5280
catagatttg ctgtataacg aattttatgc tattttttaa atttggagtt cagtgataaa 5340
agtgtcacag cgaatttcct cacatgtagg gaccgaattg tttacaagtt ctctgtacca 5400
ccatggagac atcaaaaatt gaaaatctat ggaaagatat ggacggtagc aacaagaata 5460
tagcacgagc cgcggagttc atttcgttac ttttgatatc actcacaact attgcgaagc 5520
gcttcagtga aaaaatcata aggaaaagtt gtaaatatta ttggtagtat tcgtttggta 5580
aagtagaggg ggtaattttt cccctttatt ttgttcatac attcttaaat tgctttgcct 5640
ctccttttgg aaagctatac ttcggagcac tgttgagcga aggctcatta gatatatttt 5700
ctgtcatttt ccttaaccca aaaataaggg aaagggtcca aaaagcgctc ggacaactgt 5760
tgaccgtgat ccgaaggact ggctatacag tgttcacaaa atagccaagc tgaaaataat 5820
gtgtagctat gttcagttag tttggctagc aaagatataa aagcaggtcg gaaatattta 5880
tgggcattat tatgcagagc atcaacatga taaaaaaaaa cagttgaata ttccctcaaa 5940
aatgtcttac accgtcggaa cctacttggc cgagaggttg gtccagatcg gattgaagca 6000
ccacttcgcc gtcgccggtg actacaactt ggtcttgttg gacaacttgt tgttgaacaa 6060
gaacatggag caggtctatt gctgcaacga gttgaactgc ggtttctcag cagaaggtta 6120
tgcaagagcc aagggagcag ccgctgccgt cgtcacctac tcagtcggtg cattatcagc 6180
attcgatgca attggaggtg cttacgctga gaacttgcca gtcatcttga tctctggagc 6240
acctaacaac aacgaccatg ctgctggtca cgtattgcac cacgccttgg gtaaaacaga 6300
ctaccactac cagttggaaa tggcaaaaaa tattaccgca gccgcagagg ccatctacac 6360
cccagaggaa gcacctgcca aaattgacca cgtcataaag accgctttga gagagaagaa 6420
gcctgtttac ttggagatcg cctgcaacat cgcttctatg ccatgcgccg cacctggtcc 6480
agcctctgct ttgttcaacg acgaggcctc tgacgaagct tcattgaacg ccgcagtcga 6540
agagacatta aagttcatcg ccaacaggga caaagttgcc gtcttagtcg gttcaaagtt 6600
gagggccgct ggtgccgaag aggcagctgt caagttcgct gacgccttgg gaggagccgt 6660
cgccaccatg gccgcagcaa aatctttctt tcctgaggag aacccacatt acatcggaac 6720
ctcatggggt gaagtatcat atcctggagt agaaaaaacc atgaaagagg ccgatgccgt 6780
aatagcattg gctcctgtct tcaacgacta ctcaaccaca ggatggactg atataccaga 6840
tccaaagaaa ttagtcttgg ctgagcctag gtctgtcgtc gtaaacggta tcaggttccc 6900
ttctgttcat ttgaaggact acttaacaag attggcccaa aaggtatcta aaaagactgg 6960
tgccttggac ttcttcaagt cattaaacgc aggagaattg aaaaaagcag caccagccga 7020
tccatcagcc ccattagtta acgctgaaat cgctagacaa gtagaggctt tgttgactcc 7080
aaacactacc gtcatagctg agacaggtga ctcttggttc aacgcacaga gaatgaaatt 7140
gccaaatggt gccagggtcg agtatgaaat gcagtgggga catataggtt ggtcagtccc 7200
agccgccttt ggatacgcag taggtgcccc tgagaggagg aacatattga tggttggtga 7260
tggttcattc caattaacag cccaggaggt agcccaaatg gtcaggttga agttgcctgt 7320
catcatcttc ttgatcaaca attacggata caccatcgag gtcatgatcc acgacggacc 7380
ttacaacaac atcaaaaact gggactacgc cggtttgatg gaggttttca acggtaacgg 7440
tggttatgac tcaggagccg gtaagggatt aaaggctaag accggtggtg aattggctga 7500
agcaattaag gtcgcattgg ccaacaccga tggacctaca ttgattgaat gcttcatcgg 7560
aagggaggac tgcaccgagg aattggttaa atggggtaaa agggtagccg ctgctaattc 7620
aagaaaacca gttaataaat tattataata agtgaattta ctttaaatct tgcatttaaa 7680
taaattttct ttttatagct ttatgactta gtttcaattt atatactatt ttaatgacat 7740
tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc attgttcttg 7800
tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga tgctgagtga 7860
aattttagtt aataatggag gcgctcttaa taattttggg gatattggct taacctgcag 7920
gccgcgagcg ccgatataaa ctaatgattt taaatcgtta aaaaaatatg cgaattctgt 7980
ggatcgaaca caggacctcc agataacttg accgaagttt tttcttcagt ctggcgctct 8040
cccaactgag ctaaatccgc ttactatttg ttatcagttc ccttcatatc tacatagaat 8100
aggttaagta ttttattagt tgccagaaga actactgata gttgggaata tttggtgaat 8160
aatgaagatt gggtgaataa tttgataatt ttgagattca attgttaatc aatgttacaa 8220
tattatgtat acagagtata ctagaagttc tcttcggaga tcttgaagtt cacaaaaggg 8280
aatcgatatt tctacataat attatcatta cttcttcccc atcttatatt tgtcattcat 8340
tattgattat gatcaatgca ataatgattg gtagttgcca aacatttaat acgatcctct 8400
gtaatatttc tatgaataat tatcacagca acgttcaatt atcttcaatt ccggtgttta 8460
aaccccagcg cctggcggg 8479
<210> 98
<211> 10959
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i601
<400> 98
gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60
actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120
tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180
atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240
gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300
atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360
cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420
cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480
ctttcattaa agagaaataa caatattata aaaagcgctt aaagctcaca cgcggccagg 540
gggagccgtt catcatctca tggatctgca catgaacaaa caccagagtc aaacgacgtt 600
gaaattgagg ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 660
tctgatgtag aaaaggatta aagatgctaa gagatagtga tgatatttca taaataatgt 720
aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 780
gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 840
cttttttttt tttgttcttt tttttgattc cggtttcttt gaaatttttt tgattcggta 900
atctccgagc agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc 960
atatgtggtg ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca 1020
aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga acgtgctgct 1080
actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac 1140
ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt tgaagcatta 1200
ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt ttccatggag 1260
ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact cttcgaagac 1320
agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg tgtatacaga 1380
atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg tattgttagc 1440
ggtttgaagc aggcggcaga agaagtaaca aaggaaccta gaggcctttt gatgttagca 1500
gaattgtcat gcaagggctc cctatctact ggagaatata ctaagggtac tgttgacatt 1560
gcgaagagtg acaaagattt tgttatcggc tttattgctc aaagagacat gggtggaaga 1620
gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga caagggagac 1680
gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc tgacattatt 1740
attgttggaa gcgctcgtcc aacgccggcg gacctatggc gcaagttttc cgctttgtaa 1800
tatatattta tacccctttc ttctctcccc tgcaatataa tagtttaatt ctaatattaa 1860
taatatccta tattttcttc atttaccggc gcactctcgc ccgaacgacc tcaaaatgtc 1920
tgctacattc ataataacca aaagctcata actttttttt ttgaacctga atatatatac 1980
atcacatgtc actgctggtc cttgccgacc agcgtataca atctcgatag ttggtttccc 2040
gttctttcca ctcccgtcat ggactacaac aagagatctt cggtctcaac cgtgcctaat 2100
gcagctccca taagagtcgg attcgtcggt ctcaacgcag ccaaaggatg ggcaatcaag 2160
acacattacc ccgccatact gcaactatcg tcacaatttc aaatcactgc cttatacagt 2220
ccaaaaattg agacttctat tgccaccatc cagcgtctaa aattgagtaa tgccactgct 2280
tttcccactt tagagtcatt tgcatcatct tccactatag atatgatagt gatagctatc 2340
caagtggcca gtcattatga cgttgttatg cctctcttgg aattctccaa aaataatccg 2400
aacctcaagt atcttttcgt agaatgggcc cttgcatgtt cactagatca agccgaatcc 2460
atttataagg ctgctgctga acgtggggtt caaaccatca tctctttaca aggtcgtaaa 2520
tcaccatata ttttgagagc aaaagaatta atatctcaag gctatatcgg cgacattaat 2580
tctatcgaga ttgctggaaa tggcggttgg tacggctacg aaaggcctgt taaatcacca 2640
aaatacatct atgaaatcgg gaacggtgta gatctggtaa ccacaacatt tggtcacaca 2700
atcgatattt tacaatacat gacaagttcg tacttttcca ggataaatgc aatggttttc 2760
aataatattc cagagcaaga gctgatagat gagcgtggta accgattggg ccagcgagtc 2820
ccaaagacag taccggatca tcttttattc caaggcacat tgttaaatgg caatgttcca 2880
gtgtcatgca gtttcaaagg tggcaaacct accaaaaaat ttaccaaaaa tttggtcatt 2940
gatattcacg gtaccaaggg agatttgaaa cttgaaggcg atgccggatt cgcagaaatt 3000
tcaaatctgg tcctttacta cagtggaact agagcaaacg acttcccgct agctaatgga 3060
caacaagctc ctttagaccc ggggtatgat gcaggtaaag aaatcatgaa agtatatcat 3120
ttacgaaatt ataatgccat tgtcggtaat attcatcgac tgtatcaatc tatctctgac 3180
ttccacttca atacaaagaa aattcctgaa ttaccctcac aatttgtaat gcaaggtttc 3240
gatttcgaag gctttcccac cttgatggat gctctgatat tacacaggtt aatcgagagc 3300
gtttataaaa gtaacatgat gggctccaca ttaaacgtta gcaatatctc gcattatagt 3360
ttataaaagc atcttgccct gtgcttggcc cccagtgcag cgaacgttat aaaaacgaat 3420
actgagtata tatctatgta aaacaaccat atcatttctt gttctgaact ttgtttacct 3480
aactagtttt aaatttccct ttttcgtgca tgcgggtgtt cttatttatt agcatactac 3540
atttgaaata tcaaatttcc ttagtagaaa agtgagagaa ggtgcactga cacaaaaaat 3600
aaaatccccg cgtgcttggc cggccgtctt cattggatgt tcgtaccacc aaggaattac 3660
tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat gtggatatct 3720
tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc gccaagtaca 3780
attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc aaattgcagt 3840
actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca cacggtgtgg 3900
tgggcccagg tattgttagc ggtttgaagc aggcggcaga agaagtaaca aaggaaccta 3960
gaggcctttt gatgttagca gaattgtcat gcaagggctc cctatctact ggagaatata 4020
ctaagggtac tgttgacatt gcgaagagtg acaaagattt tgttatcggc tttattgctc 4080
aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca cccggtgtgg 4140
gtttagatga caagggagac gcattgggtc aacagtatag aaccgtggat gatgtggtct 4200
ctacaggatc tgacattatt attgttggaa gaggactatt tgcaaaggga agggatgcta 4260
aggtagaggg tgaacgttac agaaaagcag gctgggaagc atatttgaga agatgcggcc 4320
agcaaaacta aaaaactgta ttataagtaa atgcatgtat actaaactca caaattagag 4380
cttcaattta attatatcag ttattacccg ggaatctcgg tcgtaatgat ttctataatg 4440
acgaaaaaaa aaaaattgga aagaaaaagc ttcatggcct ttataaaaag gaactatcca 4500
atacctcgcc agaaccaagt aacagtattt tacggggcac aaatcaagaa caataagaca 4560
ggactgtaaa gatggacgca tcgctcgtcc aacgccggcg gacctgtttt caatagttcg 4620
gtaatattaa cggataccta ctattatccc ctagtaggct cttttcacgg agaaattcgg 4680
gagtgttttt tttccgtgcg cattttctta gctatattct tccagcttcg cctgctgccc 4740
ggtcatcgtt cctgtcacgt agtttttccg gattcgtccg gctcatataa taccgcaata 4800
aacacggaat atctcgttcc gcggattcgg ttaaactctc ggtcgcggat tatcacagag 4860
aaagcttcgt ggagaatttt tccagatttt ccgctttccc cgatgttggt atttccggag 4920
gtcattatac tgaccgccat tataatgact gtacaacgac cttctggaga aagaaacaac 4980
tcaataacga tgtgggacat tgggggccca ctcaaaaaat ctggggacta tatccccaga 5040
gaatttctcc agaagagaag aaaagtcaaa gttttttttc gcttgggggt tgcatataaa 5100
tacaggcgct gttttatctt cagcatgaat attccataat tttacttaat agcttttcat 5160
aaataataga atcacaaaca aaatttacat ctgagttaaa caatcatgac aatcaaggaa 5220
cataaagtag tttatgaagc tcacaacgta aaggctctta aggctcctca acatttttac 5280
aacagccaac ccggcaaggg ttacgttact gatatgcaac attatcaaga aatgtatcaa 5340
caatctatca atgagccaga aaaattcttt gataagatgg ctaaggaata cttgcattgg 5400
gatgctccat acaccaaagt tcaatctggt tcattgaaca atggtgatgt tgcatggttt 5460
ttgaacggta aattgaatgc atcatacaat tgtgttgaca gacatgcctt tgctaatccc 5520
gacaagccag ctttgatcta tgaagctgat gacgaatccg acaacaaaat catcacattt 5580
ggtgaattac tcagaaaagt ttcccaaatc gctggtgtct taaaaagctg gggcgttaag 5640
aaaggtgaca cagtggctat ctatttgcca atgattccag aagcggtcat tgctatgttg 5700
gctgtggctc gtattggtgc tattcactct gttgtctttg ctgggttctc cgctggttcg 5760
ttgaaagatc gtgtcgttga cgctaattct aaagtggtca tcacttgtga tgaaggtaaa 5820
agaggtggta agaccatcaa cactaaaaaa attgttgacg aaggtttgaa cggagtcgat 5880
ttggtttccc gtatcttggt tttccaaaga actggtactg aaggtattcc aatgaaggcc 5940
ggtagagatt actggtggca tgaggaggcc gctaagcaga gaacttacct acctcctgtt 6000
tcatgtgacg ctgaagatcc tctattttta ttatacactt ccggttccac tggttctcca 6060
aagggtgtcg ttcacactac aggtggttat ttattaggtg ccgctttaac aactagatac 6120
gtttttgata ttcacccaga agatgttctc ttcactgccg gtgacgtcgg ctggatcacg 6180
ggtcacacct atgctctata tggtccatta accttgggta ccgcctcaat aattttcgaa 6240
tccactcctg cctacccaga ttatggtaga tattggagaa ttatccaacg tcacaaggct 6300
acccatttct atgtggctcc aactgcttta agattaatca aacgtgtagg tgaagccgaa 6360
attgccaaat atgacacttc ctcattacgt gtcttgggtt ccgtcggtga accaatctct 6420
ccagacttat gggaatggta tcatgaaaaa gtgggtaaca aaaactgtgt catttgtgac 6480
actatgtggc aaacagagtc tggttctcat ttaattgctc ctttggcagg tgctgtccca 6540
acaaaacctg gttctgctac cgtgccattc tttggtatta acgcttgtat cattgaccct 6600
gttacaggtg tggaattaga aggtaatgat gtcgaaggtg tccttgccgt taaatcacca 6660
tggccatcaa tggctagatc tgtttggaac caccacgacc gttacatgga tacttacttg 6720
aaaccttatc ctggtcacta tttcacaggt gatggtgctg gtagagatca tgatggttac 6780
tactggatca ggggtagagt tgacgacgtt gtaaatgttt ccggtcatag attatccaca 6840
tcagaaattg aagcatctat ctcaaatcac gaaaacgtct cggaagctgc tgttgtcggt 6900
attccagatg aattgaccgg tcaaaccgtc gttgcatatg tttccctaaa agatggttat 6960
ctacaaaaca acgctactga aggtgatgca gaacacatca caccagataa tttacgtaga 7020
gaattgatct tacaagttag gggtgagatt ggtcctttcg cctcaccaaa aaccattatt 7080
ctagttagag atctaccaag aacaaggtca ggaaagatta tgagaagagt tctaagaaag 7140
gttgcttcta acgaagccga acagctaggt gacctaacta ctttggccaa cccagaagtt 7200
gtacctgcca tcatttctgc tgtagagaac caatttttct ctcaaaaaaa gaaataaatt 7260
gaattgaatt gaaatcgata gatcaatttt tttcttttct ctttccccat cctttacgct 7320
aaaataatag tttattttat tttttgaata ttttttattt atatacgtat atatagacta 7380
ttatttatct tttaatgatt attaagattt ttattaaaaa aaaattcgct cctcttttaa 7440
tgcctttatg cagttttttt ttcccattcg atatttctat gttcgggttc agcgtatttt 7500
aagtttaata actcgaaaat tctgcgttcg ttaaagcttt cgagaaggat attatttcga 7560
aataaaccgt gttgtgtaag cttgaagcct ttttgcgctg ccaatattct tatccatcta 7620
ttgtactctt tagatccagt atagtgtatt cttcctgctc caagctcatc ccatccccgc 7680
gtgcttggcc ggccgttttg ccagcttact atccttcttg aaaatatgca ctctatatct 7740
tttagttctt aattgcaaca catagatttg ctgtataacg aattttatgc tattttttaa 7800
atttggagtt cagtgataaa agtgtcacag cgaatttcct cacatgtagg gaccgaattg 7860
tttacaagtt ctctgtacca ccatggagac atcaaaaatt gaaaatctat ggaaagatat 7920
ggacggtagc aacaagaata tagcacgagc cgcggagttc atttcgttac ttttgatatc 7980
actcacaact attgcgaagc gcttcagtga aaaaatcata aggaaaagtt gtaaatatta 8040
ttggtagtat tcgtttggta aagtagaggg ggtaattttt cccctttatt ttgttcatac 8100
attcttaaat tgctttgcct ctccttttgg aaagctatac ttcggagcac tgttgagcga 8160
aggctcatta gatatatttt ctgtcatttt ccttaaccca aaaataaggg aaagggtcca 8220
aaaagcgctc ggacaactgt tgaccgtgat ccgaaggact ggctatacag tgttcacaaa 8280
atagccaagc tgaaaataat gtgtagctat gttcagttag tttggctagc aaagatataa 8340
aagcaggtcg gaaatattta tgggcattat tatgcagagc atcaacatga taaaaaaaaa 8400
cagttgaata ttccctcaaa aatgtcttac accgtcggaa cctacttggc cgagaggttg 8460
gtccagatcg gattgaagca ccacttcgcc gtcgccggtg actacaactt ggtcttgttg 8520
gacaacttgt tgttgaacaa gaacatggag caggtctatt gctgcaacga gttgaactgc 8580
ggtttctcag cagaaggtta tgcaagagcc aagggagcag ccgctgccgt cgtcacctac 8640
tcagtcggtg cattatcagc attcgatgca attggaggtg cttacgctga gaacttgcca 8700
gtcatcttga tctctggagc acctaacaac aacgaccatg ctgctggtca cgtattgcac 8760
cacgccttgg gtaaaacaga ctaccactac cagttggaaa tggcaaaaaa tattaccgca 8820
gccgcagagg ccatctacac cccagaggaa gcacctgcca aaattgacca cgtcataaag 8880
accgctttga gagagaagaa gcctgtttac ttggagatcg cctgcaacat cgcttctatg 8940
ccatgcgccg cacctggtcc agcctctgct ttgttcaacg acgaggcctc tgacgaagct 9000
tcattgaacg ccgcagtcga agagacatta aagttcatcg ccaacaggga caaagttgcc 9060
gtcttagtcg gttcaaagtt gagggccgct ggtgccgaag aggcagctgt caagttcgct 9120
gacgccttgg gaggagccgt cgccaccatg gccgcagcaa aatctttctt tcctgaggag 9180
aacccacatt acatcggaac ctcatggggt gaagtatcat atcctggagt agaaaaaacc 9240
atgaaagagg ccgatgccgt aatagcattg gctcctgtct tcaacgacta ctcaaccaca 9300
ggatggactg atataccaga tccaaagaaa ttagtcttgg ctgagcctag gtctgtcgtc 9360
gtaaacggta tcaggttccc ttctgttcat ttgaaggact acttaacaag attggcccaa 9420
aaggtatcta aaaagactgg tgccttggac ttcttcaagt cattaaacgc aggagaattg 9480
aaaaaagcag caccagccga tccatcagcc ccattagtta acgctgaaat cgctagacaa 9540
gtagaggctt tgttgactcc aaacactacc gtcatagctg agacaggtga ctcttggttc 9600
aacgcacaga gaatgaaatt gccaaatggt gccagggtcg agtatgaaat gcagtgggga 9660
catataggtt ggtcagtccc agccgccttt ggatacgcag taggtgcccc tgagaggagg 9720
aacatattga tggttggtga tggttcattc caattaacag cccaggaggt agcccaaatg 9780
gtcaggttga agttgcctgt catcatcttc ttgatcaaca attacggata caccatcgag 9840
gtcatgatcc acgacggacc ttacaacaac atcaaaaact gggactacgc cggtttgatg 9900
gaggttttca acggtaacgg tggttatgac tcaggagccg gtaagggatt aaaggctaag 9960
accggtggtg aattggctga agcaattaag gtcgcattgg ccaacaccga tggacctaca 10020
ttgattgaat gcttcatcgg aagggaggac tgcaccgagg aattggttaa atggggtaaa 10080
agggtagccg ctgctaattc aagaaaacca gttaataaat tattataata agtgaattta 10140
ctttaaatct tgcatttaaa taaattttct ttttatagct ttatgactta gtttcaattt 10200
atatactatt ttaatgacat tttcgattca ttgattgaaa gctttgtgtt ttttcttgat 10260
gcgctattgc attgttcttg tctttttcgc cacatgtaat atctgtagta gatacctgat 10320
acattgtgga tgctgagtga aattttagtt aataatggag gcgctcttaa taattttggg 10380
gatattggct taacctgcag gccgcgagcg ccgatataaa ctaatgattt taaatcgtta 10440
aaaaaatatg cgaattctgt ggatcgaaca caggacctcc agataacttg accgaagttt 10500
tttcttcagt ctggcgctct cccaactgag ctaaatccgc ttactatttg ttatcagttc 10560
ccttcatatc tacatagaat aggttaagta ttttattagt tgccagaaga actactgata 10620
gttgggaata tttggtgaat aatgaagatt gggtgaataa tttgataatt ttgagattca 10680
attgttaatc aatgttacaa tattatgtat acagagtata ctagaagttc tcttcggaga 10740
tcttgaagtt cacaaaaggg aatcgatatt tctacataat attatcatta cttcttcccc 10800
atcttatatt tgtcattcat tattgattat gatcaatgca ataatgattg gtagttgcca 10860
aacatttaat acgatcctct gtaatatttc tatgaataat tatcacagca acgttcaatt 10920
atcttcaatt ccggtgttta aaccccagcg cctggcggg 10959
<210> 99
<211> 7329
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i2125
<400> 99
taattttaca agtagtgtct tcatgacgga ttcatagtct atccaagcgt ttgcccaaaa 60
ttttgcagta aatttaatgt tttctgtata ggataatggt gcgccattca agtcccgcga 120
aaaatgactg atgtctacag gacaggggcg caatatatgt tctctgacat tgcacctttt 180
gaatatatca tgtgtttgtt ctgctatctg cttgtagaag ggtacgctaa cagagccggc 240
ggcattgtaa aaagttctcc tttcgcggaa ggatgagtca aaaagcatgt gacaatgaaa 300
taatcaaatt gtgacatctg ctgacgcggg atcgttcctt cgtattgtct agattgtaat 360
ctatataaca tactacgaat ataaaagagg gactacaaga tatttctagc gcaaactact 420
gctttactgt ctcacaatgt ctctgattgg aagataccta agaaaattat ttaactacat 480
atctacaaaa tcaaagcatc taggataatt atactctatt tctcaacaag taattggttg 540
tttggccgag cggtctaagg cgcctgattc aagaaatatc ttgaccgcag ttaactgtgg 600
gaatactcag gtatcgtaag atgcaagagt tcgaatctct tagcaaccat tatttttttc 660
ctcaacataa cgagaacaca caggggcgct atcgcacaga atcaaattcg atgactggaa 720
attttttgtt aatttcagag gtcgcctgac gcatatacct ttttcaactg aaaaattggg 780
agaaaaagga aaggtgagag cgccggaacc ggcttttcat atagaataga gaagcgttca 840
tgactaaatg cttgcatcac aatacttgaa gttgacaata ttatttaagg acctattgtt 900
ttttccaata ggtggttagc aatcgtctta ctttctaact tttcttacct tttacatttc 960
agcaatatat atatatatat ttcaaggata taccattcta atgtctgccc ctaagaagat 1020
cgtcgttttg ccaggtgacc acgttggtca agaaatcaca gccgaagcca ttaaggttct 1080
taaagctatt tctgatgttc gttccaatgt caagttcgat ttcgaaaatc atttaattgg 1140
tggtgctgct atcgatgcta caggtgttcc acttccagat gaggcgctgg aagcctccaa 1200
gaaggctgat gccgttttgt taggtgctgt gggtggtcct aaatggggta ccggtagtgt 1260
tagacctgaa caaggtttac taaaaatccg taaagaactt caattgtacg ccaacttaag 1320
accatgtaac tttgcatccg actctctttt agacttatct ccaatcaagc cacaatttgc 1380
taaaggtact gacttcgttg ttgtcagaga attagtggga ggtatttact ttggtaagag 1440
aaaggaagac gatggtgatg gtgtcgcttg ggatagtgaa caatacaccg ttccagaagt 1500
gcaaagaatc acaagaatgg ccgctttcat ggccctacaa catgagccac cattgcctat 1560
ttggtccttg gataaagcta atgttttggc ctcttcaaga ttatggagaa aaactgtgga 1620
ggaaaccatc aagaacgaat tccctacatt gaaggttcaa catcaattga ttgattctgc 1680
cgccatgatc ctagttaaga acccaaccca cctaaatggt attataatca ccagcaacat 1740
gtttggtgat atcatctccg atgaagcctc cgttatccca ggttccttgg gtttgttgcc 1800
atctgcgtcc ttggcctctt tgccagacaa gaacaccgca tttggtttgt acgaaccatg 1860
ccacggttct gctccagatt tgccaaagaa taaggtcaac cctatcgcca ctatcttgtc 1920
tgctgcaatg atgttgaaat tgtcattgaa cttgcctgaa gaaggtaagg ccattgaaga 1980
tgcagttaaa aaggttttgg atgcaggtat cagaactggt gatttaggtg gttccaacag 2040
taccaccgaa gtcggtgatg ctgtcgccga agaagttaag aaaatccttg cttaaaaaga 2100
ttctcttttt ttatgatatt tgtacataaa ctttataaat gaaattcata atagaaacga 2160
cacgaaatta caaaatggaa tatgttcata gggtagacga aactatatac gcaatctaca 2220
tacatttatc aagaaggaga aaaaggagga tgtaaaggaa tacaggtaag caaattgata 2280
ctaatggctc aacgtgataa ggaaaaagaa ttgcacttta acattaatat tgacaaggag 2340
gagggcttcg agcgtcccaa aaccttctca agcaaggttt tcagtataat gttacatgcg 2400
tacacgcgtc tgtacagaaa aaaaagaaaa atttgaaata taaataacgt tcttaatact 2460
aacataacta taaaaaaata aatagggacc tagacttcag gttgtctaac tccttccttt 2520
tcggttagag cggatcttag ctagctcaaa cgaccatcgg gtggacgaag aatgacttca 2580
tgtaagactt catatctcct tctgcatgtg taaatccgtc gtttacacta tagagaacct 2640
cacacattct agccaaattg atggcaggca taagcaaagg aaacggaacg gcagttggac 2700
gcaacgactc tcggttgata actttccatg catcctcaac cttacggcta atgtactcgc 2760
aggcctcttc ttcactggcc ccagattctt tcgaatagca ttcgatagaa cttgcaacat 2820
gccctcgttc ttgttcttct ttatgagaca cgatatcatc catcagacgg ataataacac 2880
acgacgcttt tacgataggc gggtacgaag acacccactt aaacgtatct tcattgacga 2940
tgtccccacg accaacgtaa ctccgagcgg tcataagccc gtaagtcccc gtaaccatgc 3000
taacgctcat gtactcctct aaagtaggca tgtagccttc ctttaaccat ctagcttcaa 3060
ctagataatt tcttaccagt tctttggcca tttccttaac gtagtggatt tgataagttt 3120
taccttcttt ctcaagactc tcctccattt caacgtgaag gttgacaagc tcttgataga 3180
tcaatttcat gtattctggt agcatgtcga gacatgatat tgaccacctc tcgacagctt 3240
gcgtgaaaat ctccaactcc tcgtatgttc cgtagttatc aaatgtatca tccaggacta 3300
ccagccacat acacgacttc ataagaaaca tacgagtacg tgcatgctga ggttcataat 3360
aaatactcaa aatccaaaaa tatccctcga cgactctgtc acgaacaaac ggtagtttgt 3420
tctgcaaatc gaggtccttc caccacttac aaatatgcga caattccttt ttgtgcatag 3480
attggagcac agaaaaatcc agcttcgcta gcttcaataa aacttcatca tgactagtct 3540
cctgttgata gattggcata tagtgaagag cttctattcg agccagtctg cgtctgagtg 3600
gctgctttaa tgcctgatga atctgtgtac gtagagatga atcacagctt ggatctttag 3660
caattatatc gagatgaacc ttactgaact ccaaggcgtt atctaagata gtttcatcct 3720
caaccctcat aaacgccgcc tcatagagag ctaaaatacc ttgagcatca ttacagaggc 3780
tttctttaaa ctttcccttt tcgtccataa aatctttaaa cactccactc gaaacgttga 3840
atccctgttg tctaagtaat cgaaaccata gcgagattga ctgaagattt tctttatcga 3900
cccactgctc tccgtaagta acgtgaatat gttgcaaagc ttcctcaatt tcctcctcaa 3960
aatggtaagc aattccaaga cgctgcacgg catcgatcag ctcgatgagt ttaacatgtt 4020
gcataggctc atttgatcct ttgattgtaa taagttcttt cttaacctct tccttcagtt 4080
cctctacgag ttgcttcttc ataaccaaat cctcgggttc atcgtatgtt aaaaactggt 4140
caccccaaat agacgcgttg aaatttgtgg tatgtctgat tacgtccggt ttagtagaat 4200
ccttgtcatc gactaccaat ggggaggtac tagaagatga ggaaacagaa gaaataggta 4260
aagtagacat ttatattgaa ttttcaaaaa ttcttacttt ttttttggat ggacgcaaag 4320
aagtttaata atcatattac atggcaatac caccatatac atatccatat ctaatcttac 4380
ttatatgttg tggaaatgta aagagcccca ttatcttagc ctaaaaaaac cttctctttg 4440
gaactttcag taatacgctt aactgctcat tgctatattg aagtacggat tagaagccgc 4500
cgagcgggcg acagccctcc gacggaagac tctcctccgt gcgtcctggt cttcaccggt 4560
cgcgttcctg aaacgcagat gtgcctcgcg ccgcactgct ccgaacaata aagattctac 4620
aatactagct tttatggtta tgaagaggaa aaattggcag taacctggcc ccacaaacct 4680
tcaaatcaac gaatcaaatt aacaaccata ggataataat gcgattagtt ttttagcctt 4740
atttctgggg taattaatca gcgaagcgat gatttttgat ctattaacag atatataaat 4800
gcaaaagctg cataaccact ttaactaata ctttcaacat tttcggtttg tattacttct 4860
tattcaaatg tcataaaagt atcaacaaaa aattgttaat atacctctat actttaacgt 4920
caaggagaaa aaactataat gtcaaccttg cctatttctt ctgtctcatc ttcttcatct 4980
acctctccat tggtcgtaga cgataaggac tctactaaac cagacgtcat caggcacacc 5040
acgaatttca acgcttctat atggggagac cagtttttaa cttacgacga acctgaggat 5100
ttggtcatga aaaaacagtt ggtcgaagaa ttgaaggagg aggtcaagaa ggagttgatt 5160
acaatcaagg gatcaaacga acctatgcag cacgttaagt tgatcgaatt aatagatgct 5220
gtccaaagat tgggtatagc ctaccacttc gaggaggaaa tcgaggaggc tttacaacat 5280
atacacgtca catacggtga acagtgggtc gataaagaga atttgcagtc tatctcattg 5340
tggttcaggt tgttaaggca acaaggtttt aatgtttcat ctggagtttt caaggacttt 5400
atggacgaga aaggtaaatt caaggagtct ttgtgcaacg atgctcaggg tattttagca 5460
ttgtatgagg ccgcatttat gagggttgaa gacgagacta tcttagataa cgcattggag 5520
ttctccaagg tccacttaga cattattgct aaagacccat catgtgactc ttctttgaga 5580
actcaaatac accaggcatt aaagcaacct ttgaggagaa ggttggctag aatcgaagca 5640
ttacactata tgccaatata tcagcaggaa acctcacacg acgaagtttt gttaaagtta 5700
gcaaaattgg acttctctgt cttgcagtca atgcataaga aggagttgtc tcatatctgc 5760
aagtggtgga aggatttaga tttacaaaat aagttgccat tcgtcagaga tagggttgta 5820
gagggatact tctggatctt gtctatatac tatgagcctc agcacgccag aaccagaatg 5880
ttcttaatga agtcctgcat gtggttagta gtattagacg acaccttcga caattatgga 5940
acatacgagg aattggagat ctttactcaa gccgttgaga gatggtctat ttcttgcttg 6000
gacatgttgc cagagtatat gaagttgatc taccaggagt tagttaactt gcacgtcgaa 6060
atggaggaat ctttggagaa agagggaaag acataccaga ttcactatgt caaggaaatg 6120
gccaaagagt tggtaaggaa ctatttggtt gaggccagat ggttgaaaga gggttatatg 6180
cctaccttgg aggagtacat gtcagtctca atggttactg gtacctatgg tttgatgact 6240
gccagatcat acgtcggaag aggtgatatc gtaaatgagg ataccttcaa gtgggtttct 6300
tcataccctc ctatcgttaa ggcctcttgc gtcataatta ggttgatgga tgacattgtt 6360
tctcataagg aggaacagga gaggggtcac gtagcctcat caatagagtg ctattcaaaa 6420
gagtctggtg catcagagga agaggcatgt gaatacatct ctagaaaagt agaggatgcc 6480
tggaaggtca ttaacaggga gtcattgaga cctactgctg taccttttcc tttgttgatg 6540
cctgctatca acttggcaag gatgtgcgaa gttttgtatt cagtaaacga tggtttcact 6600
cacgccgaag gtgatatgaa atcatatatg aaatcttttt tcgtacatcc tatggtagta 6660
taagcgaatt tcttatgatt tatgattttt attattaaat aagttataaa aaaaataagt 6720
gtatacaaat tttaaagtga ctcttaggtt ttaaaacgaa aattcttatt cttgagtaac 6780
tctttcctgt aggtcaggtt gctttctcag gtatagcatg aggtcgctct cttttgtaac 6840
gaatttgatg aatatatttt tactttttat ataagctatt ttgtagatat tgacttttta 6900
cgatttattt gtaacaatga gaattactcc atttctgaac ttcagtaaat agcgagtgat 6960
tctgtacttt gcgagaaccg gtggacattt ggtattttgc cttacaagaa caacctatac 7020
aaacgtttca atatctaatt ctttgtaatc cattgtttta cgagacatat aatgtgatat 7080
atagatgaac tttacgtata aaatgatata tttaaaacta gcaactgcgt gcgtaagaca 7140
aactgaaata ggccatttac ggaaaagaaa tttaataatg tcgactggaa actgaaacca 7200
ggaggagtag aaattggtta aattgattag ctaaaattta ctcgttgtgg acagagtttg 7260
agccaagcgg aatgttttca aggctttctt tgtttcgaag ggcagctctg gctcctgccc 7320
ctatgagaa 7329
<210> 100
<211> 4016
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i2608
<400> 100
tggaacacgg agtaaaatat tgtgtgtatg ggcacaaacc cttggaaata gcttagcatt 60
tgccgttggc ctgatgatct gaccattccc tttagtagag aaagaaagtc gcttcaagct 120
aacccagttt tctttttttt ttatcactta tcagtcctat tcggagatac aggcaacaag 180
tgatagaggg cccattatga atacgcacct ctatgtattt ccgagatacg attactccag 240
ttcctcttac aagaaatgca taaaaatagt tacaattaat tagaacaaga acttatttag 300
aacacgttca cactgagtaa gaactcttgt cccttattag ccttgatagt gctgaaaaaa 360
agaaaaaaaa caaaaaaaag aaataaaata acggcaaaca gcaaaggcca cagatctgta 420
ttcatgctac ttctgcaata tcaatcactt actggcaagt gcgtataaat taaacctatg 480
acggcacggc cacgcgttta aaccgccttc tttatcatca tatttactta tatctttaac 540
agattccaaa ccctaaagtg tccgaatttt caatagggcg aacttgaaga ataaccaagg 600
tcaataatat atcttttagt ataaccctga aatttgccct ataaaaatct agggtttctg 660
tgtggtttcc gggtgagtca tacggctttt ttgaatttct ttttttgcag ttgtctctat 720
caatgaaaat ttcgaggaag acgataaggt taagataagt agataagaga atgatacgag 780
ataaagcaca aattagcaga aagaagagtg gttgcgaaca gagtaaaccg aatcagggaa 840
tccctttttg caaaaacatc aattatcctt ttcttttttt tacgtatata tctggaacag 900
aaatatataa gttactatta tacttatagt tggatccagt ttttaatctg tcgtcaatcg 960
aaagtttatt tcagagttct tcagacttct taactcctgt aaaaacaaaa aaaaaaaaag 1020
gcatagcagc tcacacgcgg ccagggggag ccaccatata catatccata tctaatctta 1080
cttatatgtt gtggaaatgt aaagagcccc attatcttag cctaaaaaaa ccttctcttt 1140
ggaactttca gtaatacgct taactgctca ttgctatatt gaagtacgga ttagaagccg 1200
ccgagcgggc gacagccctc cgacggaaga ctctcctccg tgcgtcctgg tcttcaccgg 1260
tcgcgttcct gaaacgcaga tgtgcctcgc gccgcactgc tccgaacaat aaagattcta 1320
caatactagc ttttatggtt atgaagagga aaaattggca gtaacctggc cccacaaacc 1380
ttcaaatcaa cgaatcaaat taacaaccat aggataataa tgcgattagt tttttagcct 1440
tatttctggg gtaattaatc agcgaagcga tgatttttga tctattaaca gatatataaa 1500
tgcaaaagct gcataaccac tttaactaat actttcaaca ttttcggttt gtattacttc 1560
ttattcaaat gtcataaaag tatcaacaaa aaattgttaa tatacctcta tactttaacg 1620
tcaaggagaa aaaactataa tggaaaactt tccaaccgag tacttcttga acaccaccgt 1680
caggttgttg gagtacatta ggtacaggga ctcaaactat accagggagg agaggattga 1740
gaacttacac tacgcctaca acaaagccgc ccaccacttc gcccagccaa gacagcagca 1800
gttgttgaag gtcgacccta agagattgca agcttcattg cagaccattg tcggtatggt 1860
tgtatattca tgggccaagg tatctaaaga gtgtatggca gacttgtcaa tccactatac 1920
ctacaccttg gtattggacg attcaaaaga cgacccatac cctactatgg taaactactt 1980
cgatgactta caagcaggta gagaacaggc tcatccttgg tgggctttag taaacgagca 2040
ctttccaaac gtattgaggc attttggtcc tttttgctca ttgaacttga tcaggtctac 2100
cttagacttc ttcgagggtt gctggataga acaatacaat tttggaggat tcccaggttc 2160
tcacgactac ccacagttct tgagaagaat gaacggttta ggacactgcg tcggtgcctc 2220
tttgtggcca aaggagcagt tcaatgaaag atcattgttt ttggagatca cttcagccat 2280
agctcaaatg gaaaattgga tggtctgggt taatgatttg atgtcatttt acaaggagtt 2340
cgacgacgag agggatcaga tctctttggt aaagaactac gttgtttctg acgagatatc 2400
attacacgag gccttagaaa aattgaccca ggataccttg cactcttcaa agcaaatggt 2460
tgcagttttc tcagacaagg accctcaagt aatggacacc atagagtgct tcatgcatgg 2520
ttatgtcaca tggcatttat gcgacaggag gtacaggttg tctgaaatct acgagaaagt 2580
caaggaggaa aagactgagg atgcccaaaa attttgcaag ttctacgagc aagctgccaa 2640
tgtaggagcc gtttcacctt ctgagtgggc ctatccacca gtcgcccagt tagctaacgt 2700
aagatcaaag gacgtcaaag aggtccagaa accattttta tcatctatag aattagttga 2760
ataagctagc taagatccgc tctaaccgaa aaggaaggag ttagacaacc tgaagtctag 2820
gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat atttcaaatt 2880
tttctttttt ttctgtacag acgcgtgtac gcatgtaaca ttatactgaa aaccttgctt 2940
gagaaggttt tgggacgctc gaagaacctg caggccgcga gcgccgatat atgacgtttt 3000
attacctttg atcacatttc cacgccattt cgcattctca ccctcataag tcatacaccg 3060
aaaagaaagt ttaagggatc aatgagctta ctataatctc agtatattta tttttatcga 3120
tgattcacca caacaatctt gctcccgaaa agaaagcaga cggagtagaa gcatttgaaa 3180
ctccttcaga ccttcaagta tatatatata tatatatata tgtatatgtg tacattttca 3240
cgctaatact aatgtataat tagaagataa tttttactca tttttcgtta tcttcacgtc 3300
acccgaacct agaaccaaat gtcattttca cgatatgtaa atagtgaaat aggcaaaaac 3360
gccaaaaagt agtaagcgca acatacaccg gtgtttaaac cccagcgcct ggcgggtaaa 3420
ccattaaaga atatctcgac cagaatctaa cagatataca tgttccgata atgtctgagt 3480
taggtgagta ttctaaatta gaaaacaaag agcttagaac ggagtttgaa ttgacaaatt 3540
ttccttttcc aggcacaact gataacgact ccgatgacgg aagccaaggg cagaactctt 3600
tgaatatcat tactcctgac atggatgata ctctggttaa tgatgtactt cgagaaaacg 3660
ataaaaagtc tagtatgaga atggctttta tgaatctagc aaactctatt cttggtgccg 3720
gaataattac tcagccgttc gcgatcaaaa atgctggtat attaggcggg ctattatcat 3780
acgtagccct cggatttata gttgattgga cgttaagact tattgtcatt aacttgactc 3840
ttgctggcaa gagaacatac cagggtacgg tcgaacatgt aatgggtaaa aaagggaaat 3900
tgctgattct atttacaaac gggttatttg catttggtgg atgtattggt tattgcataa 3960
ttattgggga tacgataccc cacgtactca gagctatatt cagccagaac gatggt 4016
<210> 101
<211> 11880
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i2127
<400> 101
gacggcacgg ccacgcgttt aaaccgcctc atagtctatc caagcgtttg cccaaaattt 60
tgcagtaaat ttaatgtttt ctgtatagga taatggtgcg ccattcaagt cccgcgaaaa 120
atgactgatg tctacaggac aggggcgcaa tatatgttct ctgacattgc accttttgaa 180
tatatcatgt gtttgttctg ctatctgctt gtagaagggt acgctaacag agccggcggc 240
attgtaaaaa gttctccttt cgcggaagga tgagtcaaaa agcatgtgac aatgaaataa 300
tcaaattgtg acatctgctg acgcgggatc gttccttcgt attgtctaga ttgtaatcta 360
tataacatac tacgaatata aaagagggac tacaagatat ttctagcgca aactactgct 420
ttactgtctc acaatgtctc tgattggaag atacctaaga aaattattta actacatatc 480
tacaaaatca aagcatccgc tcgtccaacg ccggcggacc tgagcgacct catgctatac 540
ctgagaaagc aacctgacct acaggaaaga gttactcaag aataagaatt ttcgttttaa 600
aacctaagag tcactttaaa atttgtatac acttattttt tttataactt atttaataat 660
aaaaatcata aatcataaga aattcgctta gactaccata gggtgaacaa agaatgactt 720
catgtatgat ttcatgtcac cctcggcgtg ggtgaaaccg tcattaactg aatataagac 780
ttcgcacatt cttgctaagt ttatggcagg cattaataat gggaaaggga ctgcggttgg 840
cctcaatgac tctctgttga taactttcca tgcatcttcg acttttctag agatgtactc 900
acaggcttct tcttcagatg ctcctgattc ttttgaataa cactcgatag atgatgctac 960
atgtcccctc tcttgttcct ctttgtgaga tacaatatca tccatcaacc ttataataac 1020
gcatgaggcc tttacgatag gtggataaga tgatacccac ttgaatgtgt cttcgtttac 1080
aatgtctcct ctaccgacat aagatctagc agtcattaat ccgtaggttc cagtgaccat 1140
agaaacagac atatattcct ccaaggtagg catgtaaccc tccttcaacc atctagcttc 1200
taccaagtag tttcttacca actcttttgc catctccttg acatagtgga tctgataagt 1260
tttaccctct ttctccaaag attcttccat ctcgacgtgt aagttgacta actcctggta 1320
gatcaacttc atatactctg gtaacatgtc caagcatgaa attgaccatc tctctacagc 1380
ttgagtgaag atctctaatt cctcgtaggt accgtaattg tcaaaagtgt cgtctaaaac 1440
gaccaaccac atgcaagact tcattaagaa cattcttgtt ctagcgtgct gaggctcgta 1500
gtagatagac aatatccaga aatatccctc aacgactctg tctctaacaa aaggcaactt 1560
attctgcaaa tccaaatcct tccaccattt gcagatatga gacaattcct ttttatgcat 1620
tgactgcaat acagagaagt ccaatttggc caacttcaac aaaacttcat catgtgatgt 1680
ttcctgctga tagataggca tatagtgcaa ggcttctatc cttgctaacc ttctcctcaa 1740
aggttgcttc aatgcttgat gtatttgtgt tcttaaagaa gagtcgcatg aaggatcctt 1800
tgcgatgatg tctaagtgga ctttagagaa ttccaatgcg ttgtctaata tagtctcgtc 1860
ctctaccctc ataaaggcag cttcatataa tgccaaaatt ccttgagcat cgttgcataa 1920
tgactcctta aactttccct tttcgtccat gaaatcttta aagacacctg aagagacgtt 1980
gaatccctgt tgccttaaca acctaaacca taaagagatt gattgcaagt tctccttgtc 2040
aacccattgt tctccataag taacatgaat atgctgcaat gcctcttcaa tctcctcttc 2100
gaaatgatat gcaattccta acctttgaac agcgtcaatt aactctatca acttgacgtg 2160
ttgcataggc tcgtttgaac cttttatggt gatcaactcc ttcttaacct cctcctttaa 2220
ctcctcgacc aactgttttt tcatgactaa atcctctggt tcgtcatagg tcaagaactg 2280
gtctccccat atagaggcgt tgaagttcgt tgtatgcctt atgacgtctg gctttgtaga 2340
atctttgtcg tctacaacca atggtgaggt agaagatgag gatgagactg aagatatagg 2400
caatgttgac attgtaaagt tagttggttg cgcgacttcg ggtggggtaa gtatagaggt 2460
atattaacaa ttttttgttg atacttttat gacatttgaa taagaagtaa tacaaaccga 2520
aaatgttgaa agtattagtt aaagtggtta tgcagctttt gcatttatat atctgttaat 2580
agatcaaaaa tcatcgcttc gctgattaat taccccagaa ataaggctaa aaaactaatc 2640
gcattattat cctatggttg ttaatttgat tcgttgattt gaaggtttgt ggggccaggt 2700
tactgccaat ttttcctctt cataaccata aaagctagta ttgtagaatc tttattgttc 2760
ggagcagtgc ggcgcgaggc acatctgcgt ttcaggaacg cgaccggtga agaccaggac 2820
gcacggagga gagtcttccg tcggagggct gtcgcccgct cggcggcttc taatccgtac 2880
ttcaatatag caatgagcag ttaagcgtat tactgaaagt tccaaagaga aggttttttt 2940
aggctaagat aatggggctc tttacatttc cacaacatat aagtaagatt agatatggat 3000
atgtatatgg tggtattgcc atgtaatatg attattaaac ttctttgcgt ccatccaaaa 3060
aaaaagtaac gcacgcacac tcccgacaga caactagctt gataatgtca actttgccta 3120
tttcttctgt gtcatcttcc tcttctacat caccattagt cgtggacgac aaagattcaa 3180
ccaagcccga cgttatcaga catacaacga atttcaatgc ttctatttgg ggagatcaat 3240
tcttgaccta tgatgagcct gaagatttag ttatgaagaa acaattagtg gaggaattaa 3300
aagaggaagt taagaaggaa ttgataacta tcaaaggttc aaatgagccc atgcagcatg 3360
tgaaattgat tgaattaatt gatgctgttc aacgtttagg tatagcttac cattttgaag 3420
aagagatcga ggaagctttg caacatatgc atgttaccta tggtgaacag tgggtggata 3480
aggaaaattt acagagtatt tcattgtggt tcaggttgtt gcgtcaacag ggctttaacg 3540
tctcctctgg cgttttcaaa gactttatgg acgaaaaagg taaattcaaa gagtctttat 3600
gcaatgatgc acaaggaata ttagccttat atgaagctgc atttatgagg gttgaagatg 3660
aaaccatctt agacaatgct ttggaattct caaaagttca tttagatatc atagcaaaag 3720
acccatcttg cgattcttca ttgcgtacac aaatccatca agccttaaaa caacctttaa 3780
gaaggagatt agcaaggatt gaagcattac attacatgcc aatctaccaa caggaaacat 3840
ctcatgatga agtattgttg aaattagcca agttggattt cagtgttttg cagtctatgc 3900
ataaaaagga attgtcacat atctgtaagt ggtggaaaga tttagattta caaaataagt 3960
taccttttgt acgtgatcgt gttgtcgaag gctacttctg gatattgtcc atatactatg 4020
agccacaaca cgctagaaca agaatgtttt tgatgaaatc atgcatgtgg ttagtagttt 4080
tggacgatac ttttgataat tatggaacat acgaagaatt ggagattttt actcaagccg 4140
tcgagagatg gtctatctca tgcttagata tgttgcccga atatatgaaa ttaatctacc 4200
aagaattagt caatttgcat gtggaaatgg aagaatcttt ggaaaaggag ggaaagacct 4260
atcagattca ttacgttaag gagatggcta aagaattagt tcgtaattac ttagtagaag 4320
caagatggtt gaaggaaggt tatatgccta ctttagaaga atacatgtct gtttctatgg 4380
ttactggtac ttatggtttg atgactgcaa ggtcctatgt tggcagagga gacattgtta 4440
atgaagacac attcaaatgg gtttctagtt acccacctat tgttaaagct tcctgtgtaa 4500
taattagatt aatggacgat attgtatctc acaaggaaga acaagaaaga ggacatgtgg 4560
cttcatctat agaatgttac tctaaagaat caggtgcttc tgaagaggaa gcatgtgaat 4620
atattagtag gaaagttgag gatgcctgga aagtaatcaa tagagaatct ttgcgtccaa 4680
cagccgttcc cttccctttg ttaatgccag caataaactt agctagaatg tgtgaggtct 4740
tgtactctgt taatgatggt tttactcatg ctgagggtga catgaaatct tatatgaagt 4800
ccttcttcgt tcatcctatg gtcgtttgag ctagctaaga tccgctctaa ccgaaaagga 4860
aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt 4920
aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg 4980
taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaaga acctgcaggc 5040
cgcgagcgcc gatggtctaa ggcgcctgat tcaagaaata tcttgaccgc agttaactgt 5100
gggaatactc aggtatcgta agatgcaaga gttcgaatct cttagcaacc attatttttt 5160
tcctcaacat aacgagaaca cacaggggcg ctatcgcaca gaatcaaatt cgatgactgg 5220
aaattttttg ttaatttcag aggtcgcctg acgcatatac ctttttcaac tgaaaaattg 5280
ggagaaaaag gaaaggtgag agcgccggaa ccggcttttc atatagaata gagaagcgtt 5340
catgactaaa tgcttgcatc acaatacttg aagttgacaa tattatttaa ggacctattg 5400
ttttttccaa taggtggtta gcaatcgtct tactttctaa cttttcttac cttttacatt 5460
tcagcaatat atatatatat atttcaagga tataccattc taatgtctgc ccctaagaag 5520
atcgtcgttt tgccaggtga ccacgttggt caagaaatca cagccgaagc cattaaggtt 5580
cttaaagcta tttctgatgt tcgttccaat gtcaagttcg atttcgaaaa tcatttaatt 5640
ggtggtgctg ctatcgatgc tacaggtgtt ccacttccag atgaggcgct ggaagcctcc 5700
aagaaggctg atgccgtttt gttaggtgct gtgggtggtc ctaaatgggg tactggtagt 5760
gttagacctg aacaaggttt actaaaaatc cgtaaagaac ttcaattgta cgccaactta 5820
agaccatgta actttgcatc cgactctctt ttagacttat ctccaatcaa gccacaattt 5880
gctaaaggta ctgacttcgt tgttgtcaga gaattagtgg gaggtattta ctttggtaag 5940
agaaaggaag acgatggtga tggtgtcgct tgggatagtg aacaatacac cgttccagaa 6000
gtgcaaagaa tcacaagaat ggccgctttc atggccctac aacatgagcc accattgcct 6060
atttggtcct tggataaagc taatgttttg gcctcttcaa gattatggag aaaaactgtg 6120
gaggaaacca tcaagaacga attccctaca ttgaaggttc aacatcaatt gattgattct 6180
gccgccatga tcctagttaa gaacccaacc cacctaaatg gtattataat caccagcaac 6240
atgtttggtg atatcatctc cgatgaagcc tccgttatcc caggttcctt gggtttgttg 6300
ccatctgcgt ccttggcctc tttgccagac aagaacaccg catttggttt gtacgaacca 6360
tgccacggtt ctgctccaga tttgccaaag aataaggtca accctatcgc cactatcttg 6420
tctgctgcaa tgatgttgaa attgtcattg aacttgcctg aagaaggtaa ggccattgaa 6480
gatgcagtta aaaaggtttt ggatgcaggt atcagaactg gtgatttagg tggttccaac 6540
agtaccaccg aagtcggtga tgctgtcgcc gaagaagtta agaaaatcct tgcttaaaaa 6600
gattctcttt ttttatgata tttgtacata aactttataa atgaaattca taatagaaac 6660
gacacgaaat tacaaaatgg aatatgttca tagggtagac gaaactatat acgcaatcta 6720
catacattta tcaagaagga gaaaaaggag gatgtaaagg aatacaggta agcaaattga 6780
tactaatggc tcaacgtgat cggcgctcgc ggcctgcagg ttcttcgagc gtcccaaaac 6840
cttctcaagc aaggttttca gtataatgtt acatgcgtac acgcgtctgt acagaaaaaa 6900
aagaaaaatt tgaaatataa ataacgttct taatactaac ataactataa aaaaataaat 6960
agggacctag acttcaggtt gtctaactcc ttccttttcg gttagagcgg atcttagcta 7020
gctcaaacga ccatcgggtg gacgaagaat gacttcatgt aagacttcat atctccttct 7080
gcatgtgtaa atccgtcgtt tacactatag agaacctcac acattctagc caaattgatg 7140
gcaggcataa gcaaaggaaa cggaacggca gttggacgca acgactctcg gttgataact 7200
ttccatgcat cctcaacctt acggctaatg tactcgcagg cctcttcttc actggcccca 7260
gattctttcg aatagcattc gatagaactt gcaacatgcc ctcgttcttg ttcttcttta 7320
tgagacacga tatcatccat cagacggata ataacacacg acgcttttac gataggcggg 7380
tacgaagaca cccacttaaa cgtatcttca ttgacgatgt ccccacgacc aacgtaactc 7440
cgagcggtca taagcccgta agtccccgta accatgctaa cgctcatgta ctcctctaaa 7500
gtaggcatgt agccttcctt taaccatcta gcttcaacta gataatttct taccagttct 7560
ttggccattt ccttaacgta gtggatttga taagttttac cttctttctc aagactctcc 7620
tccatttcaa cgtgaaggtt gacaagctct tgatagatca atttcatgta ttctggtagc 7680
atgtcgagac atgatattga ccacctctcg acagcttgcg tgaaaatctc caactcctcg 7740
tatgttccgt agttatcaaa tgtatcatcc aggactacca gccacataca cgacttcata 7800
agaaacatac gagtacgtgc atgctgaggt tcataataaa tactcaaaat ccaaaaatat 7860
ccctcgacga ctctgtcacg aacaaacggt agtttgttct gcaaatcgag gtccttccac 7920
cacttacaaa tatgcgacaa ttcctttttg tgcatagatt ggagcacaga aaaatccagc 7980
ttcgctagct tcaataaaac ttcatcatga ctagtctcct gttgatagat tggcatatag 8040
tgaagagctt ctattcgagc cagtctgcgt ctgagtggct gctttaatgc ctgatgaatc 8100
tgtgtacgta gagatgaatc acagcttgga tctttagcaa ttatatcgag atgaacctta 8160
ctgaactcca aggcgttatc taagatagtt tcatcctcaa ccctcataaa cgccgcctca 8220
tagagagcta aaataccttg agcatcatta cagaggcttt ctttaaactt tcccttttcg 8280
tccataaaat ctttaaacac tccactcgaa acgttgaatc cctgttgtct aagtaatcga 8340
aaccatagcg agattgactg aagattttct ttatcgaccc actgctctcc gtaagtaacg 8400
tgaatatgtt gcaaagcttc ctcaatttcc tcctcaaaat ggtaagcaat tccaagacgc 8460
tgcacggcat cgatcagctc gatgagttta acatgttgca taggctcatt tgatcctttg 8520
attgtaataa gttctttctt aacctcttcc ttcagttcct ctacgagttg cttcttcata 8580
accaaatcct cgggttcatc gtatgttaaa aactggtcac cccaaataga cgcgttgaaa 8640
tttgtggtat gtctgattac gtccggttta gtagaatcct tgtcatcgac taccaatggg 8700
gaggtactag aagatgagga aacagaagaa ataggtaaag tagacattat caagctagtt 8760
gtctgtcggg agtgtgcgtg cgttactttt tttttggatg gacgcaaaga agtttaataa 8820
tcatattaca tggcaatacc accatataca tatccatatc taatcttact tatatgttgt 8880
ggaaatgtaa agagccccat tatcttagcc taaaaaaacc ttctctttgg aactttcagt 8940
aatacgctta actgctcatt gctatattga agtacggatt agaagccgcc gagcgggcga 9000
cagccctccg acggaagact ctcctccgtg cgtcctggtc ttcaccggtc gcgttcctga 9060
aacgcagatg tgcctcgcgc cgcactgctc cgaacaataa agattctaca atactagctt 9120
ttatggttat gaagaggaaa aattggcagt aacctggccc cacaaacctt caaatcaacg 9180
aatcaaatta acaaccatag gataataatg cgattagttt tttagcctta tttctggggt 9240
aattaatcag cgaagcgatg atttttgatc tattaacaga tatataaatg caaaagctgc 9300
ataaccactt taactaatac tttcaacatt ttcggtttgt attacttctt attcaaatgt 9360
cataaaagta tcaacaaaaa attgttaata tacctctata cttaccccac ccgaagtcgc 9420
gcaaccaact aactttacaa tgtcaacctt gcctatttct tctgtctcat cttcttcatc 9480
tacctctcca ttggtcgtag acgataagga ctctactaaa ccagacgtca tcaggcacac 9540
cacgaatttc aacgcttcta tatggggaga ccagttttta acttacgacg aacctgagga 9600
tttggtcatg aaaaaacagt tggtcgaaga attgaaggag gaggtcaaga aggagttgat 9660
tacaatcaag ggatcaaacg aacctatgca gcacgttaag ttgatcgaat taatagatgc 9720
tgtccaaaga ttgggtatag cctaccactt cgaggaggaa atcgaggagg ctttacaaca 9780
tatacacgtc acatacggtg aacagtgggt cgataaagag aatttgcagt ctatctcatt 9840
gtggttcagg ttgttaaggc aacaaggttt taatgtttca tctggagttt tcaaggactt 9900
tatggacgag aaaggtaaat tcaaggagtc tttgtgcaac gatgctcagg gtattttagc 9960
attgtatgag gccgcattta tgagggttga agacgagact atcttagata acgcattgga 10020
gttctccaag gtccacttag acattattgc taaagaccca tcatgtgact cttctttgag 10080
aactcaaata caccaggcat taaagcaacc tttgaggaga aggttggcta gaatcgaagc 10140
attacactat atgccaatat atcagcagga aacctcacac gacgaagttt tgttaaagtt 10200
agcaaaattg gacttctctg tcttgcagtc aatgcataag aaggagttgt ctcatatctg 10260
caagtggtgg aaggatttag atttacaaaa taagttgcca ttcgtcagag atagggttgt 10320
agagggatac ttctggatct tgtctatata ctatgagcct cagcacgcca gaaccagaat 10380
gttcttaatg aagtcctgca tgtggttagt agtattagac gacaccttcg acaattatgg 10440
aacatacgag gaattggaga tctttactca agccgttgag agatggtcta tttcttgctt 10500
ggacatgttg ccagagtata tgaagttgat ctaccaggag ttagttaact tgcacgtcga 10560
aatggaggaa tctttggaga aagagggaaa gacataccag attcactatg tcaaggaaat 10620
ggccaaagag ttggtaagga actatttggt tgaggccaga tggttgaaag agggttatat 10680
gcctaccttg gaggagtaca tgtcagtctc aatggttact ggtacctatg gtttgatgac 10740
tgccagatca tacgtcggaa gaggtgatat cgtaaatgag gataccttca agtgggtttc 10800
ttcataccct cctatcgtta aggcctcttg cgtcataatt aggttgatgg atgacattgt 10860
ttctcataag gaggaacagg agaggggtca cgtagcctca tcaatagagt gctattcaaa 10920
agagtctggt gcatcagagg aagaggcatg tgaatacatc tctagaaaag tagaggatgc 10980
ctggaaggtc attaacaggg agtcattgag acctactgct gtaccttttc ctttgttgat 11040
gcctgctatc aacttggcaa ggatgtgcga agttttgtat tcagtaaacg atggtttcac 11100
tcacgccgaa ggtgatatga aatcatatat gaaatctttt ttcgtacatc ctatggtagt 11160
ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa aaaaaataag 11220
tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat tcttgagtaa 11280
ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc aggtccgccg 11340
gcgttggacg agcgtctttt gtaacgaatt tgatgaatat atttttactt tttatataag 11400
ctattttgta gatattgact ttttacgatt tatttgtaac aatgagaatt actccatttc 11460
tgaacttcag taaatagcga gtgattctgt actttgcgag aaccggtgga catttggtat 11520
tttgccttac aagaacaacc tatacaaacg tttcaatatc taattctttg taatccattg 11580
ttttacgaga catataatgt gatatataga tgaactttac gtataaaatg atatatttaa 11640
aactagcaac tgcgtgcgta agacaaactg aaataggcca tttacggaaa agaaatttaa 11700
taatgtcgac tggaaactga aaccaggagg agtagaaatt ggttaaattg attagctaaa 11760
atttactcgt tgtggacaga gtttgagcca agcggaatgt tttcaaggct ttctttgttt 11820
cgaagggcag ctctggctcc tgcccctatg agggcggttt aaacgcgtgg ccgtgccgtc 11880
<210> 102
<211> 6896
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i569
<400> 102
gacggcacgg ccacgcgttt aaaccgccct ccaagctgac ataaatcgca ctttgtatct 60
actttttttt attcgaaaac aaggcacaac aatgaatcta tcgccctgtg agattttcaa 120
tctcaagttt gtgtaataga tagcgttata ttatagaact ataaaggtcc ttgaatatac 180
atagtgtttc attcctatta ctgtatatgt gactttacat tgttacttcc gcggctattt 240
gacgttttct gcttcaggtg cggcttggag ggcaaagtgt cagaaaatcg gccaggccgt 300
atgacacaaa agagtagaaa acgagatctc aaatatctcg aggcctgtcc tctatacaac 360
cgcccagctc tctgacaaag ctccagaacg gttgtctttt gtttcgaaaa gccaaggtcc 420
cttataattg ccctccattt tgtgtcacct atttaagcaa aaaattgaaa gtttactaac 480
ctttcattaa agagaaataa caatattata aaaagcgccg ctcgtccaac gccggcggac 540
ctgttttcaa tagttcggta atattaacgg atacctacta ttatccccta gtaggctctt 600
ttcacggaga aattcgggag tgtttttttt ccgtgcgcat tttcttagct atattcttcc 660
agcttcgcct gctgcccggt catcgttcct gtcacgtagt ttttccggat tcgtccggct 720
catataatac cgcaataaac acggaatatc tcgttccgcg gattcggtta aactctcggt 780
cgcggattat cacagagaaa gcttcgtgga gaatttttcc agattttccg ctttccccga 840
tgttggtatt tccggaggtc attatactga ccgccattat aatgactgta caacgacctt 900
ctggagaaag aaacaactca ataacgatgt gggacattgg gggcccactc aaaaaatctg 960
gggactatat ccccagagaa tttctccaga agagaagaaa agtcaaagtt ttttttcgct 1020
tgggggttgc atataaatac aggcgctgtt ttatcttcag catgaatatt ccataatttt 1080
acttaatagc ttttcataaa taatagaatc acaaacaaaa tttacatctg agttaaacaa 1140
tcatgacaat caaggaacat aaagtagttt atgaagctca caacgtaaag gctcttaagg 1200
ctcctcaaca tttttacaac agccaacccg gcaagggtta cgttactgat atgcaacatt 1260
atcaagaaat gtatcaacaa tctatcaatg agccagaaaa attctttgat aagatggcta 1320
aggaatactt gcattgggat gctccataca ccaaagttca atctggttca ttgaacaatg 1380
gtgatgttgc atggtttttg aacggtaaat tgaatgcatc atacaattgt gttgacagac 1440
atgcctttgc taatcccgac aagccagctt tgatctatga agctgatgac gaatccgaca 1500
acaaaatcat cacatttggt gaattactca gaaaagtttc ccaaatcgct ggtgtcttaa 1560
aaagctgggg cgttaagaaa ggtgacacag tggctatcta tttgccaatg attccagaag 1620
cggtcattgc tatgttggct gtggctcgta ttggtgctat tcactctgtt gtctttgctg 1680
ggttctccgc tggttcgttg aaagatcgtg tcgttgacgc taattctaaa gtggtcatca 1740
cttgtgatga aggtaaaaga ggtggtaaga ccatcaacac taaaaaaatt gttgacgaag 1800
gtttgaacgg agtcgatttg gtttcccgta tcttggtttt ccaaagaact ggtactgaag 1860
gtattccaat gaaggccggt agagattact ggtggcatga ggaggccgct aagcagagaa 1920
cttacctacc tcctgtttca tgtgacgctg aagatcctct atttttatta tacacttccg 1980
gttccactgg ttctccaaag ggtgtcgttc acactacagg tggttattta ttaggtgccg 2040
ctttaacaac tagatacgtt tttgatattc acccagaaga tgttctcttc actgccggtg 2100
acgtcggctg gatcacgggt cacacctatg ctctatatgg tccattaacc ttgggtaccg 2160
cctcaataat tttcgaatcc actcctgcct acccagatta tggtagatat tggagaatta 2220
tccaacgtca caaggctacc catttctatg tggctccaac tgctttaaga ttaatcaaac 2280
gtgtaggtga agccgaaatt gccaaatatg acacttcctc attacgtgtc ttgggttccg 2340
tcggtgaacc aatctctcca gacttatggg aatggtatca tgaaaaagtg ggtaacaaaa 2400
actgtgtcat ttgtgacact atgtggcaaa cagagtctgg ttctcattta attgctcctt 2460
tggcaggtgc tgtcccaaca aaacctggtt ctgctaccgt gccattcttt ggtattaacg 2520
cttgtatcat tgaccctgtt acaggtgtgg aattagaagg taatgatgtc gaaggtgtcc 2580
ttgccgttaa atcaccatgg ccatcaatgg ctagatctgt ttggaaccac cacgaccgtt 2640
acatggatac ttacttgaaa ccttatcctg gtcactattt cacaggtgat ggtgctggta 2700
gagatcatga tggttactac tggatcaggg gtagagttga cgacgttgta aatgtttccg 2760
gtcatagatt atccacatca gaaattgaag catctatctc aaatcacgaa aacgtctcgg 2820
aagctgctgt tgtcggtatt ccagatgaat tgaccggtca aaccgtcgtt gcatatgttt 2880
ccctaaaaga tggttatcta caaaacaacg ctactgaagg tgatgcagaa cacatcacac 2940
cagataattt acgtagagaa ttgatcttac aagttagggg tgagattggt cctttcgcct 3000
caccaaaaac cattattcta gttagagatc taccaagaac aaggtcagga aagattatga 3060
gaagagttct aagaaaggtt gcttctaacg aagccgaaca gctaggtgac ctaactactt 3120
tggccaaccc agaagttgta cctgccatca tttctgctgt agagaaccaa tttttctctc 3180
aaaaaaagaa ataaattgaa ttgaattgaa atcgatagat caattttttt cttttctctt 3240
tccccatcct ttacgctaaa ataatagttt attttatttt ttgaatattt tttatttata 3300
tacgtatata tagactatta tttatctttt aatgattatt aagattttta ttaaaaaaaa 3360
attcgctcct cttttaatgc ctttatgcag tttttttttc ccattcgata tttctatgtt 3420
cgggttcagc gtattttaag tttaataact cgaaaattct gcgttcgtta aagctttcga 3480
gaaggatatt atttcgaaat aaaccgtgtt gtgtaagctt gaagcctttt tgcgctgcca 3540
atattcttat ccatctattg tactctttag atccagtata gtgtattctt cctgctccaa 3600
gctcatccca tccccgcgtg cttggccggc cgttttgcca gcttactatc cttcttgaaa 3660
atatgcactc tatatctttt agttcttaat tgcaacacat agatttgctg tataacgaat 3720
tttatgctat tttttaaatt tggagttcag tgataaaagt gtcacagcga atttcctcac 3780
atgtagggac cgaattgttt acaagttctc tgtaccacca tggagacatc aaaaattgaa 3840
aatctatgga aagatatgga cggtagcaac aagaatatag cacgagccgc ggagttcatt 3900
tcgttacttt tgatatcact cacaactatt gcgaagcgct tcagtgaaaa aatcataagg 3960
aaaagttgta aatattattg gtagtattcg tttggtaaag tagagggggt aatttttccc 4020
ctttattttg ttcatacatt cttaaattgc tttgcctctc cttttggaaa gctatacttc 4080
ggagcactgt tgagcgaagg ctcattagat atattttctg tcattttcct taacccaaaa 4140
ataagggaaa gggtccaaaa agcgctcgga caactgttga ccgtgatccg aaggactggc 4200
tatacagtgt tcacaaaata gccaagctga aaataatgtg tagctatgtt cagttagttt 4260
ggctagcaaa gatataaaag caggtcggaa atatttatgg gcattattat gcagagcatc 4320
aacatgataa aaaaaaacag ttgaatattc cctcaaaaat gtcttacacc gtcggaacct 4380
acttggccga gaggttggtc cagatcggat tgaagcacca cttcgccgtc gccggtgact 4440
acaacttggt cttgttggac aacttgttgt tgaacaagaa catggagcag gtctattgct 4500
gcaacgagtt gaactgcggt ttctcagcag aaggttatgc aagagccaag ggagcagccg 4560
ctgccgtcgt cacctactca gtcggtgcat tatcagcatt cgatgcaatt ggaggtgctt 4620
acgctgagaa cttgccagtc atcttgatct ctggagcacc taacaacaac gaccatgctg 4680
ctggtcacgt attgcaccac gccttgggta aaacagacta ccactaccag ttggaaatgg 4740
caaaaaatat taccgcagcc gcagaggcca tctacacccc agaggaagca cctgccaaaa 4800
ttgaccacgt cataaagacc gctttgagag agaagaagcc tgtttacttg gagatcgcct 4860
gcaacatcgc ttctatgcca tgcgccgcac ctggtccagc ctctgctttg ttcaacgacg 4920
aggcctctga cgaagcttca ttgaacgccg cagtcgaaga gacattaaag ttcatcgcca 4980
acagggacaa agttgccgtc ttagtcggtt caaagttgag ggccgctggt gccgaagagg 5040
cagctgtcaa gttcgctgac gccttgggag gagccgtcgc caccatggcc gcagcaaaat 5100
ctttctttcc tgaggagaac ccacattaca tcggaacctc atggggtgaa gtatcatatc 5160
ctggagtaga aaaaaccatg aaagaggccg atgccgtaat agcattggct cctgtcttca 5220
acgactactc aaccacagga tggactgata taccagatcc aaagaaatta gtcttggctg 5280
agcctaggtc tgtcgtcgta aacggtatca ggttcccttc tgttcatttg aaggactact 5340
taacaagatt ggcccaaaag gtatctaaaa agactggtgc cttggacttc ttcaagtcat 5400
taaacgcagg agaattgaaa aaagcagcac cagccgatcc atcagcccca ttagttaacg 5460
ctgaaatcgc tagacaagta gaggctttgt tgactccaaa cactaccgtc atagctgaga 5520
caggtgactc ttggttcaac gcacagagaa tgaaattgcc aaatggtgcc agggtcgagt 5580
atgaaatgca gtggggacat ataggttggt cagtcccagc cgcctttgga tacgcagtag 5640
gtgcccctga gaggaggaac atattgatgg ttggtgatgg ttcattccaa ttaacagccc 5700
aggaggtagc ccaaatggtc aggttgaagt tgcctgtcat catcttcttg atcaacaatt 5760
acggatacac catcgaggtc atgatccacg acggacctta caacaacatc aaaaactggg 5820
actacgccgg tttgatggag gttttcaacg gtaacggtgg ttatgactca ggagccggta 5880
agggattaaa ggctaagacc ggtggtgaat tggctgaagc aattaaggtc gcattggcca 5940
acaccgatgg acctacattg attgaatgct tcatcggaag ggaggactgc accgaggaat 6000
tggttaaatg gggtaaaagg gtagccgctg ctaattcaag aaaaccagtt aataaattat 6060
tataataagt gaatttactt taaatcttgc atttaaataa attttctttt tatagcttta 6120
tgacttagtt tcaatttata tactatttta atgacatttt cgattcattg attgaaagct 6180
ttgtgttttt tcttgatgcg ctattgcatt gttcttgtct ttttcgccac atgtaatatc 6240
tgtagtagat acctgataca ttgtggatgc tgagtgaaat tttagttaat aatggaggcg 6300
ctcttaataa ttttggggat attggcttaa cctgcaggcc gcgagcgccg atataaacta 6360
atgattttaa atcgttaaaa aaatatgcga attctgtgga tcgaacacag gacctccaga 6420
taacttgacc gaagtttttt cttcagtctg gcgctctccc aactgagcta aatccgctta 6480
ctatttgtta tcagttccct tcatatctac atagaatagg ttaagtattt tattagttgc 6540
cagaagaact actgatagtt gggaatattt ggtgaataat gaagattggg tgaataattt 6600
gataattttg agattcaatt gttaatcaat gttacaatat tatgtataca gagtatacta 6660
gaagttctct tcggagatct tgaagttcac aaaagggaat cgatatttct acataatatt 6720
atcattactt cttccccatc ttatatttgt cattcattat tgattatgat caatgcaata 6780
atgattggta gttgccaaac atttaatacg atcctctgta atatttctat gaataattat 6840
cacagcaacg ttcaattatc ttcaattccg gtgtttaaac cccagcgcct ggcggg 6896
<210> 103
<211> 7038
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i2124
<400> 103
aagaaggacg tgagaaaact ttaacatctg cttggtaagg gcctcattta attctggatt 60
attgtacccg tgaataacac accaccacga cgacatggcg tcgatcacct cgacgtccac 120
tggtgagtcg gtatccaaca ccagcttgca tccgtgagca ctctttaccg gataaacgtt 180
caatggtgaa ctcaatgacg tataaggatg ccaaatatgt tttttatcaa agtctagcag 240
ttccgcgaca tctggtgtat atgaaatttc ttgagacatt agttgttatc ctagcaatag 300
aaaacgaatt gcgctgttga catcctcccg accaaaagaa aatgaaatat acaaacaatg 360
gctatttata attcaaaatt attgggcaaa acaaaataaa atcccgctgg tagttcgttt 420
actgaagtat ataaagagat atactttttt ccacaagtag gccagtgaaa agaactcaaa 480
aaatcactag cgcacaggtc gttcatcatc tcatggatct gcacatgaac aaacaccaga 540
gtcaaacgac gttgaaattg aggctactgc gccaattgat gacaatacag acgatgataa 600
caaaccgaag ttatctgatg tagaaaagga ttaaagatgc taagagatag tgatgatatt 660
tcataaataa tgtaattcta tatatgttaa ttaccttttt tgcgaggcat atttatggtg 720
aaggataagt tttgaccatc aaagaaggtt aatgtggctg tggtttcagg gtccataaag 780
cttttcaatt catctttttt ttttttgttc ttttttttga ttccggtttc tttgaaattt 840
ttttgattcg gtaatctccg agcagaagga agaacgaagg aaggagcaca gacttagatt 900
ggtatatata cgcatatgtg gtgttgaaga aacatgaaat tgcccagtat tcttaaccca 960
actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag ctacatataa 1020
ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata tcatgcacga 1080
aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat tactggagtt 1140
agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata tcttgactga 1200
tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt acaatttttt 1260
actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc agtactctgc 1320
gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg tggtgggccc 1380
aggtattgtt agcggtttga agcaggcggc agaagaagta acaaaggaac ctagaggcct 1440
tttgatgtta gcagaattgt catgcaaggg ctccctatct actggagaat atactaaggg 1500
tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg ctcaaagaga 1560
catgggtgga agagatgaag gttacgattg gttgattatg acacccggtg tgggtttaga 1620
tgacaaggga gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg tctctacagg 1680
atctgacatt attattgttg gaagaggact atttgcaaag ggaagggatg ctaaggtaga 1740
gggtgaacgt tacagaaaag caggctggga agcatatttg agaagatgcg gccagcaaaa 1800
ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta gagcttcaat 1860
ttaattatat cagttattac ccgggaatct cggtcgtaat gatttctata atgacgaaaa 1920
aaaaaaaatt ggaaagaaaa agcttcatgg cctttataaa aaggaactat ccaatacctc 1980
gccagaacca agtaacagta ttttacgggg cacaaatcaa gaacaataag acaggactgt 2040
aaagatggac gcatgagcga cctcatgcta tacctgagaa agcaacctga cctacaggaa 2100
agagttactc aagaataaga attttcgttt taaaacctaa gagtcacttt aaaatttgta 2160
tacacttatt ttttttataa cttatttaat aataaaaatc ataaatcata agaaattcgc 2220
ttagactacc atagggtgaa caaagaatga cttcatgtat gatttcatgt caccctcggc 2280
gtgggtgaaa ccgtcattaa ctgaatataa gacttcgcac attcttgcta agtttatggc 2340
aggcattaat aatgggaaag ggactgcggt tggcctcaat gactctctgt tgataacttt 2400
ccatgcatct tcgacttttc tagagatgta ctcacaggct tcttcttcag atgctcctga 2460
ttcttttgaa taacactcga tagatgatgc tacatgtccc ctctcttgtt cctctttgtg 2520
agatacaata tcatccatca accttataat aacgcatgag gcctttacga taggtggata 2580
agatgatacc cacttgaatg tgtcttcgtt tacaatgtct cctctaccga cataagatct 2640
agcagtcatt aatccgtagg ttccagtgac catagaaaca gacatatatt cctccaaggt 2700
aggcatgtaa ccctccttca accatctagc ttctaccaag tagtttctta ccaactcttt 2760
tgccatctcc ttgacatagt ggatctgata agttttaccc tctttctcca aagattcttc 2820
catctcgacg tgtaagttga ctaactcctg gtagatcaac ttcatatact ctggtaacat 2880
gtccaagcat gaaattgacc atctctctac agcttgagtg aagatctcta attcctcgta 2940
ggtaccgtaa ttgtcaaaag tgtcgtctaa aacgaccaac cacatgcaag acttcattaa 3000
gaacattctt gttctagcgt gctgaggctc gtagtagata gacaatatcc agaaatatcc 3060
ctcaacgact ctgtctctaa caaaaggcaa cttattctgc aaatccaaat ccttccacca 3120
tttgcagata tgagacaatt cctttttatg cattgactgc aatacagaga agtccaattt 3180
ggccaacttc aacaaaactt catcatgtga tgtttcctgc tgatagatag gcatatagtg 3240
caaggcttct atccttgcta accttctcct caaaggttgc ttcaatgctt gatgtatttg 3300
tgttcttaaa gaagagtcgc atgaaggatc ctttgcgatg atgtctaagt ggactttaga 3360
gaattccaat gcgttgtcta atatagtctc gtcctctacc ctcataaagg cagcttcata 3420
taatgccaaa attccttgag catcgttgca taatgactcc ttaaactttc ccttttcgtc 3480
catgaaatct ttaaagacac ctgaagagac gttgaatccc tgttgcctta acaacctaaa 3540
ccataaagag attgattgca agttctcctt gtcaacccat tgttctccat aagtaacatg 3600
aatatgctgc aatgcctctt caatctcctc ttcgaaatga tatgcaattc ctaacctttg 3660
aacagcgtca attaactcta tcaacttgac gtgttgcata ggctcgtttg aaccttttat 3720
ggtgatcaac tccttcttaa cctcctcctt taactcctcg accaactgtt ttttcatgac 3780
taaatcctct ggttcgtcat aggtcaagaa ctggtctccc catatagagg cgttgaagtt 3840
cgttgtatgc cttatgacgt ctggctttgt agaatctttg tcgtctacaa ccaatggtga 3900
ggtagaagat gaggatgaga ctgaagatat aggcaatgtt gacatttata ttgaattttc 3960
aaaaattctt actttttttt tggatggacg caaagaagtt taataatcat attacatggc 4020
aataccacca tatacatatc catatctaat cttacttata tgttgtggaa atgtaaagag 4080
ccccattatc ttagcctaaa aaaaccttct ctttggaact ttcagtaata cgcttaactg 4140
ctcattgcta tattgaagta cggattagaa gccgccgagc gggcgacagc cctccgacgg 4200
aagactctcc tccgtgcgtc ctggtcttca ccggtcgcgt tcctgaaacg cagatgtgcc 4260
tcgcgccgca ctgctccgaa caataaagat tctacaatac tagcttttat ggttatgaag 4320
aggaaaaatt ggcagtaacc tggccccaca aaccttcaaa tcaacgaatc aaattaacaa 4380
ccataggata ataatgcgat tagtttttta gccttatttc tggggtaatt aatcagcgaa 4440
gcgatgattt ttgatctatt aacagatata taaatgcaaa agctgcataa ccactttaac 4500
taatactttc aacattttcg gtttgtatta cttcttattc aaatgtcata aaagtatcaa 4560
caaaaaattg ttaatatacc tctatacttt aacgtcaagg agaaaaaact ataatgtcaa 4620
ctttgcctat ttcttctgtg tcatcttcct cttctacatc accattagtc gtggacgaca 4680
aagattcaac caagcccgac gttatcagac atacaacgaa tttcaatgct tctatttggg 4740
gagatcaatt cttgacctat gatgagcctg aagatttagt tatgaagaaa caattagtgg 4800
aggaattaaa agaggaagtt aagaaggaat tgataactat caaaggttca aatgagccca 4860
tgcagcatgt gaaattgatt gaattaattg atgctgttca acgtttaggt atagcttacc 4920
attttgaaga agagatcgag gaagctttgc aacatatgca tgttacctat ggtgaacagt 4980
gggtggataa ggaaaattta cagagtattt cattgtggtt caggttgttg cgtcaacagg 5040
gctttaacgt ctcctctggc gttttcaaag actttatgga cgaaaaaggt aaattcaaag 5100
agtctttatg caatgatgca caaggaatat tagccttata tgaagctgca tttatgaggg 5160
ttgaagatga aaccatctta gacaatgctt tggaattctc aaaagttcat ttagatatca 5220
tagcaaaaga cccatcttgc gattcttcat tgcgtacaca aatccatcaa gccttaaaac 5280
aacctttaag aaggagatta gcaaggattg aagcattaca ttacatgcca atctaccaac 5340
aggaaacatc tcatgatgaa gtattgttga aattagccaa gttggatttc agtgttttgc 5400
agtctatgca taaaaaggaa ttgtcacata tctgtaagtg gtggaaagat ttagatttac 5460
aaaataagtt accttttgta cgtgatcgtg ttgtcgaagg ctacttctgg atattgtcca 5520
tatactatga gccacaacac gctagaacaa gaatgttttt gatgaaatca tgcatgtggt 5580
tagtagtttt ggacgatact tttgataatt atggaacata cgaagaattg gagattttta 5640
ctcaagccgt cgagagatgg tctatctcat gcttagatat gttgcccgaa tatatgaaat 5700
taatctacca agaattagtc aatttgcatg tggaaatgga agaatctttg gaaaaggagg 5760
gaaagaccta tcagattcat tacgttaagg agatggctaa agaattagtt cgtaattact 5820
tagtagaagc aagatggttg aaggaaggtt atatgcctac tttagaagaa tacatgtctg 5880
tttctatggt tactggtact tatggtttga tgactgcaag gtcctatgtt ggcagaggag 5940
acattgttaa tgaagacaca ttcaaatggg tttctagtta cccacctatt gttaaagctt 6000
cctgtgtaat aattagatta atggacgata ttgtatctca caaggaagaa caagaaagag 6060
gacatgtggc ttcatctata gaatgttact ctaaagaatc aggtgcttct gaagaggaag 6120
catgtgaata tattagtagg aaagttgagg atgcctggaa agtaatcaat agagaatctt 6180
tgcgtccaac agccgttccc ttccctttgt taatgccagc aataaactta gctagaatgt 6240
gtgaggtctt gtactctgtt aatgatggtt ttactcatgc tgagggtgac atgaaatctt 6300
atatgaagtc cttcttcgtt catcctatgg tcgtttgagc tagctaagat ccgctctaac 6360
cgaaaaggaa ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat 6420
gttagtatta agaacgttat ttatatttca aatttttctt ttttttctgt acagacgcgt 6480
gtacgcatgt aacattatac tgaaaacctt gcttgagaag gttttgggac gctcgaagtt 6540
taaataaaaa agttgcaagg ctttcatcag ctatatataa gtagcatggt atgaacagag 6600
taggggcagt gttcctattt gtatatgaaa gaaatttttt tttgtctatt gttccagatc 6660
gtcacaggac ggaaataaga atgtctagtt cagaaaggtc agaagtcaag tttgacaagc 6720
actttaattg gtggtcccta ttaggtatcg cgttctcatt aagttgctca tgggtcggta 6780
tctcagcgtc gatggccgtt ggtattgcca gtggagggcc actgcttatc atctatgggt 6840
tgataattgc tgcttttttc agtctcatgt gtggtatatc tctgggagat tttgctgcta 6900
tcctgccaaa cagcagcggt ggttcatttt gggttcttaa aatgttggaa caagaatcag 6960
tcactttgaa aacccctgag tacgaggacc cttctgacga tgatgaagaa gtgttcctcg 7020
agaattattg tcaaactt 7038
<210> 104
<211> 4376
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i65
<400> 104
gtttaaaccc tggaaattcg gtgtccttct cattatctat cagcatgtac tcggcggtaa 60
aaacatcctt tgaaggattt tgaatgatgg gtcccaaaaa tctttttctg tggaaagaac 120
cgatactact atgattcgca ttaacgccgt tattaacggt taactgatag tctttgttgc 180
ataaactaaa cttacccttc gaaatacgat tagcatacct gccgatcgtg gcgcctatat 240
aagcactatc aggattcaaa tacccttcct cattttcata gccaagaaca actgattgtc 300
cgttcacttt caggtcaaca atgctggcgc ccaaattggc aaacgtggct tgaaatctgg 360
tgccggcacc aatagtcaca aatcttgcgt cataacgcat atcttcagcg gaaaatctgg 420
cctcgacacc ccttaactgg taaccaaaag gattctcagt agtccatttc cataaatcct 480
tgcaggagtc ttcaacctgc aactcggtct gccatttcag ttcgcgtttg gccctatctg 540
gtttagccgt caagttcaaa acatcacctg ctcttctgcc cgtaactttg tatggaagat 600
caataccaga agctttgcag aatgcatgat aaacttcaaa aactgtagaa cctttaccgg 660
aacccaagtt ccactcacga cacaaacctt cattttcatt gtaggcctct aggtattgca 720
gggctgcaat atgacctttt gctagatcaa ctacgtggat ataatccctg atcggggtac 780
catctctgga atcataatcg tctccgaaga tgtaaagctt ctcgcgccta ccaacagcta 840
cttgagccat atatggcaac aaattgtttg gtatacctag cggatcttct ccgattaatc 900
cagagggatg tgcgccaatt gggttaaaat aacgcaagat agcaaacttc caactttttt 960
tgtcgctatt gtaaagatca ttcaagatat tctcaatggc gtatttcgta tgaccatacg 1020
gattagtagg ccctaaggga cattcttctg ggataggaat catatttggg aatctcgtag 1080
catcaccata gacagtagca gaagatgaaa aaacaaattt ggaaacgttg tattgttgca 1140
ttaactctaa taaaacgaca gttcccaaaa tgttattgtg atagtatctc agcgggattt 1200
gtgtagattc acctacagcc tttaaaccag caaagtgaat taccgaatca attttatatt 1260
ctttgaaaac cttttccaga ccttttcggt cacacaaatc aacctcatag aagggaatgt 1320
gatgcttggt caagacctct aacctggcta cagaatcata agttgaattc gacaggttat 1380
cagcaacaac acagtcatat ccattctcaa ttagctctac cacagtgtgt gaaccaatgt 1440
atccagcacc acctgtaacc aaaacaattt tagaagtact ttcactttgt aactgagctg 1500
tgtcgacact agtaatacac atcatcgtcc tacaagttca tcaaagtgtt ggacagacaa 1560
ctataccagc atggatctct tgtatcggtt cttttctccc gctctctcgc aataacaatg 1620
aacactgggt caatcatagc ctacacaggt gaacagagta gcgtttatac agggtttata 1680
cggtgattcc tacggcaaaa atttttcatt tctaaaaaaa aaaagaaaaa tttttctttc 1740
caacgctaga aggaaaagaa aaatctaatt aaattgattt ggtgattttc tgagagttcc 1800
ctttttcata tatcgaattt tgaatataaa aggagatcga aaaaattttt ctattcaatc 1860
tgttttctgg ttttatttga tagttttttt gtgtattatt attatggatt agtactggtt 1920
tatatgggtt tttctgtata acttcttttt attttagttt gtttaatctt attttgagtt 1980
acattatagt tccctaactg caagagaagt aacattaaaa atgaaaaagc ctgaactcac 2040
cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac agcgtctccg acctgatgca 2100
gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat gtaggagggc gtggatatgt 2160
cctgcgggta aatagctgcg ccgatggttt ctacaaagat cgttatgttt atcggcactt 2220
tgcatcggcc gcgctcccga ttccggaagt gcttgacatt ggggaattca gcgagagcct 2280
gacctattgc atctcccgcc gtgcacaggg tgtcacgttg caagacctgc ctgaaaccga 2340
actgcccgct gttctgcagc cggtcgcgga ggccatggat gcgatcgctg cggccgatct 2400
tagccagacg agcgggttcg gcccattcgg accgcaagga atcggtcaat acactacatg 2460
gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat cactggcaaa ctgtgatgga 2520
cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag ctgatgcttt gggccgagga 2580
ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc tccaacaatg tcctgacgga 2640
caatggccgc ataacagcgg tcattgactg gagcgaggcg atgttcgggg attcccaata 2700
cgaggtcgcc aacatcttct tctggaggcc gtggttggct tgtatggagc agcagacgcg 2760
ctacttcgag cggaggcatc cggagcttgc aggatcgccg cggctccggg cgtatatgct 2820
ccgcattggt cttgaccaac tctatcagag cttggttgac ggcaatttcg atgatgcagc 2880
ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga gccgggactg tcgggcgtac 2940
acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc tgtgtagaag tactcgccga 3000
tagtggaaac cgacgcccca gcactcgtcc gagggcaaag gaataggttt aacttgatac 3060
tactagattt tttctcttca tttataaaat ttttggttat aattgaagct ttagaagtat 3120
gaaaaaatcc ttttttttca ttctttgcaa ccaaaataag aagcttcttt tattcattga 3180
aatgatgaat ataaacctaa caaaagaaaa agactcgaat atcaaacatt aaaaaaaaat 3240
aaaagaggtt atctgttttc ccatttagtt ggagtttgca ttttctaata gatagaactc 3300
tcaattaatg tggatttagt ttctctgttc gttttttttt gttttgttct cactgtattt 3360
acatttctat ttagtattta gttattcata taatcttaac ttctcgagac tcataacttt 3420
agcatcacaa aatacgcaat aataacgagt agtaacactt ttatagttca tacatgcttc 3480
aactacttaa taaatgattg tatgataatg ttttcaatgt aagagatttc gattatccac 3540
aaactttaaa acacagggac aaaattcttg atatgctttc aaccgctgcg ttttggatac 3600
ctattcttga catgatatga ctaccatttt gttattgtac gtggggcagt tgacgtctta 3660
tcatatgtca aagtcatttg cgaagttctt ggcaagttgc caactgacga gatgcagtaa 3720
aaagagattg ccgtcttgaa actttttgtc cttttttttt tccggggact ctacgagaac 3780
cctttgtcct actgattaat tttgtactga atttggacaa ttcagatttt agtagacaag 3840
cgcgaggagg aaaagaaatg acagaaaaat tccgatggac aagaagatag gaaaaaaaaa 3900
aagctttcac cgatttccta gaccggaaaa aagtcgtatg acatcagaat gaaaaatttt 3960
caagttagac aaggacaaaa tcaggacaaa ttgtaaagat ataataaact atttgattca 4020
gcgccaattt gcccttttcc attttccatt aaatctctgt tctctcttac ttatatgatg 4080
attaggtatc atctgtataa aactcctttc ttaatttcac tctaaagcat accccataga 4140
gaagatcttt cggttcgaag acattcctac gcataataag aataggaggg aataatgcca 4200
gacaatctat cattacattt aagcggctct tcaaaaagat tgaactctcg ccaacttatg 4260
gaatcttcca atgagacctt tgcgccaaat aatgtggatt tggaaaaaga gtataagtca 4320
tctcagagta atataactac cgaagtttat gaggcatcga gctttgaagt ttaaac 4376
<210> 105
<211> 7686
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Integration construct i10
<400> 105
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagcttg 240
gtaccgagct cggatccact agtaacggcc gccagtgtgc tggaattcgc ccttctcgag 300
aagttaagat tatatgaata actaaatact aaatagaaat gtaaatacag tgagaacaaa 360
acaaaaaaaa acgaacagag aaactaaatc cacattaatt gagagttcta tctattagaa 420
aatgcaaact ccaactaaat gggaaaacag ataacctctt ttattttttt ttaatgtttg 480
atattcgagt ctttttcttt tgttaggttt atattcatca tttcaatgaa taaaagaagc 540
ttcttatttt ggttgcaaag aatgaaaaaa aaggattttt tcatacttct aaagcttcaa 600
ttataaccaa aaattttata aatgaagaga aaaaatctag tagtatcaag ttaaacttaa 660
cggccttttg ccagatattg attcatctct tcttccggca ccattccacc tcccgtcgcc 720
cacaccagat gagtggtatt acgcagttgt tctgcgctga aaccgtgcat ctgttggtaa 780
cttactgatg cacacacgcg ctgaggtccg gccatacccg ccagtgccga aggttcaaga 840
cgaatacctt cttcctgcgc cagccagcca agcatgtcat acatggtttg atcgctaagg 900
gtatagaagc catccagcag acgctccatt gcccgcccga caaagcctga tgcgcgacca 960
actgcaaggc catccgctgc ggtaaggttg tcgataccaa tatcctgaac agaaatctga 1020
tcgtgtaatc ctgtatggac gcctaacaac atacaagggg agtgcgttgg ttcggcaaaa 1080
aagcagtgaa catgatcgcc aaacgccagt ttaagcccga atgcgacgcc accaggacca 1140
ccgccaacac cacacggcag atagacaaac agagggttat cagcatcgac gatacggcct 1200
tgctgggcaa attgcgcttt aagacgctgg ccagcgacgg aatacccaag gaacaacgtg 1260
cgggaatttt cgtcatcaat aaagaaacag ttcgggtcag actgcgctgc tttacgtcct 1320
tcctcgacgg caacaccata atcttgctca tattccacga ccgtaacgcc atgcgtgcgc 1380
agtttcgctt ttttccatgc ccgggcatca gcagacatat gaactgtcac cttaaagcca 1440
atgcgggcgc tcataatgcc gattgataac cccagatttc cggttgagcc cacagcaatg 1500
ctgtattggc taaagaactg tttaaactcc ggagaaagca gtttgctgta gtcatcatca 1560
agcgtcagca accccgcttc cagagccagt ttttctgcgt gtgccaggac ttcataaatc 1620
ccgccgcgtg cttttatgga gccggaaatg ggcaaatggc tatctttttt cagtaacagt 1680
tgcccgctga tcggttgctg atattctttt tccagccgtt tttgcatagc tcgaatggca 1740
accagttctg attcaataat ccccccagtg gcagcagttt caggaaatgc ttttgccaga 1800
tagggtgcaa aacgggataa gcgcgcatgg gcgtcctgaa catcctgttc ggtcaggcca 1860
acataaggta aaccttcagc caatgaggtc gtgccaggat taaaccaggt ggtttcttta 1920
agagcaacca gatcctttac caacggatac tgggcgatga gcgagttcat tttagcgttt 1980
tccattttta atgttacttc tcttgcagtt agggaactat aatgtaactc aaaataagat 2040
taaacaaact aaaataaaaa gaagttatac agaaaaaccc atataaacca gtactaatcc 2100
ataataataa tacacaaaaa aactatcaaa taaaaccaga aaacagattg aatagaaaaa 2160
ttttttcgat ctccttttat attcaaaatt cgatatatga aaaagggaac tctcagaaaa 2220
tcaccaaatc aatttaatta gatttttctt ttccttctag cgttggaaag aaaaattttt 2280
cttttttttt ttagaaatga aaaatttttg ccgtaggaat caccgtataa accctgtata 2340
aacgctactc tgttcacctg tgtaggctat gattgaccca gtgttcattg ttattgcgag 2400
agagcgggag aaaagaaccg atacaagaga tccatgctgg tatagttgtc tgtccaacac 2460
tttgatgaac ttgtaggacg atgatgtgta ttactagtgt cgacgtattc caatgagaat 2520
cgctagaaat gctttaccag aactagacta cttgtcgcag atcacttttg aactgtatga 2580
gagtacggat gcttctggtc aaaaatcgca ttccattaga ctgaaaatgt ctcctgggtg 2640
tcatactcaa gatccgttag atgttcaatt agatgacagg cattatatta gttgtattcc 2700
aaagatttcc ctgacgaagc atttggatat ggactacgtt caacagaaat tgagaaacaa 2760
atttaccagg gtcattatgc ctccgaaatt tacaccagta aacattacga gccccaactt 2820
gagtttccag aaacgcaaaa ccagaagaaa gtcggtatct gttgagaagt tgaagcttcc 2880
tgcctcgtcc ggatcttcat catctacctc cgttaacaag acattagatt agtgatcaca 2940
cccaattttt aatttagcaa cccaaaataa ataagtattt actcaacttt tttttaataa 3000
aaaaaaactt aattgaattt tgctcgcgat ctttaggtcc ggggttttcg ttgaaccctt 3060
agacgagcaa attagcgcca taaggatata cgtcagagca cattaattag tgacatatac 3120
ctatataaag agcaaccttc tccgatagac ttgtaattta tcttatttca tttcctaaca 3180
ctttggtcga agaagaggga taaaaacaga cgaaaacaca tttaagggct atacaaagat 3240
gggaaagcta ttacaattgg cattgcatcc ggtcgagatg aaggcagctt tgaagctgaa 3300
gttttgcaga acaccgctat tctccatcta tgatcagtcc acgtctccat atctcttgca 3360
ctgtttcgaa ctgttgaact tgacctccag atcgtttgct gctgtgatca gagagctgca 3420
tccagaattg agaaactgtg ttactctctt ttatttgatt ttaagggctt tggataccat 3480
cgaagacgat atgtccatcg aacacgattt gaaaattgac ttgttgcgtc acttccacga 3540
gaaattgttg ttaactaaat ggagtttcga cggaaatgcc cccgatgtga aggacagagc 3600
cgttttgaca gatttcgaat cgattcttat tgaattccac aaattgaaac cagaatatca 3660
agaagtcatc aaggagatca ccgagaaaat gggtaatggt atggccgact acatcttaga 3720
tgaaaattac aacttgaatg ggttgcaaac cgtccacgac tacgacgtgt actgtcacta 3780
cgtagctggt ttggtcggtg atggtttgac ccgtttgatt gtcattgcca agtttgccaa 3840
cgaatctttg tattctaatg agcaattgta tgaaagcatg ggtcttttcc tacaaaaaac 3900
caacatcatc agagattaca atgaagattt ggtcgatggt agatccttct ggcccaagga 3960
aatctggtca caatacgctc ctcagttgaa ggacttcatg aaacctgaaa acgaacaact 4020
ggggttggac tgtataaacc acctcgtcta agggcgaatt ctgcagatat ccatcacact 4080
ggcggccgct cgagcatgca tctagagggc ccaattcgcc ctatagtgag tcgtattaca 4140
attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 4200
atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 4260
atcgcccttc ccaacagttg cgcagcctga atggcgaatg gacgcgccct gtagcggcgc 4320
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 4380
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 4440
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 4500
ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt 4560
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 4620
aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc 4680
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 4740
tcagggcgca agggctgcta aaggaagcgg aacacgtaga aagccagtcc gcagaaacgg 4800
tgctgacccc ggatgaatgt cagctactgg gctatctgga caagggaaaa cgcaagcgca 4860
aagagaaagc aggtagcttg cagtgggctt acatggcgat agctagactg ggcggtttta 4920
tggacagcaa gcgaaccgga attgccagct ggggcgccct ctggtaaggt tgggaagccc 4980
tgcaaagtaa actggatggc tttcttgccg ccaaggatct gatggcgcag gggatcaaga 5040
tctgatcaag agacaggatg aggatcgttt cgcatgattg aacaagatgg attgcacgca 5100
ggttctccgg ccgcttgggt ggagaggcta ttcggctatg actgggcaca acagacaatc 5160
ggctgctctg atgccgccgt gttccggctg tcagcgcagg ggcgcccggt tctttttgtc 5220
aagaccgacc tgtccggtgc cctgaatgaa ctgcaggacg aggcagcgcg gctatcgtgg 5280
ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg ttgtcactga agcgggaagg 5340
gactggctgc tattgggcga agtgccgggg caggatctcc tgtcatccca ccttgctcct 5400
gccgagaaag tatccatcat ggctgatgca atgcggcggc tgcatacgct tgatccggct 5460
acctgcccat tcgaccacca agcgaaacat cgcatcgagc gagcacgtac tcggatggaa 5520
gccggtcttg tcgatcagga tgatctggac gaagagcatc aggggctcgc gccagccgaa 5580
ctgttcgcca ggctcaaggc gcgcatgccc gacggcgagg atctcgtcgt gacccatggc 5640
gatgcctgct tgccgaatat catggtggaa aatggccgct tttctggatt catcgactgt 5700
ggccggctgg gtgtggcgga ccgctatcag gacatagcgt tggctacccg tgatattgct 5760
gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc tttacggtat cgccgctccc 5820
gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt tcttctgaat tgaaaaagga 5880
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 5940
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 6000
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 6060
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 6120
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 6180
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 6240
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 6300
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 6360
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 6420
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 6480
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 6540
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 6600
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 6660
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 6720
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 6780
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 6840
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 6900
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 6960
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 7020
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt 7080
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 7140
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 7200
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 7260
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 7320
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 7380
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 7440
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 7500
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 7560
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 7620
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 7680
cggaag 7686
<210> 106
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer LX-268-139-S2D-F
<400> 106
ggtcaccata tggacactct gccgatctct tcc 33
<210> 107
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer LX-268-139-S2D-R
<400> 107
gtataaggat cctcatacga ccatagggtg tacg 34
<210> 108
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_D_3.5 coding sequence
<400> 108
atgtctactt tacctatttc ttctgtttcc tcatcttcta gtacctcccc attggtagtc 60
gatgacaagg attctactaa accggacgta atcagacata ccacaaattt caacgcgtct 120
atttggggtg accagttttt aacatacgat gaacccgagg atttggttat gaagaagcaa 180
ctcgtagagg aactgaagga agaggttaag aaagaactta ttacaatcaa aggatcaaat 240
gagcctatgc aacatgttaa actcatcgag ctgatcgatg ccgtgcagcg tcttggaatt 300
gcttaccatt ttgaggagga aattgaggaa gctttgcaac atattcacgt tacttacgga 360
gagcagtggg tcgataaaga aaatcttcag tcaatctcgc tatggtttcg attacttaga 420
caacagggat tcaacgtttc gagtggagtg tttaaagatt ttatggacga aaagggaaag 480
tttaaagaaa gcctctgtaa tgatgctcaa ggtattttag ctctctatga ggcggcgttt 540
atgagggttg aggatgaaac tatcttagat aacgccttgg agttcagtaa ggttcatctc 600
gatataattg ctaaagatcc aagctgtgat tcatctctac gtacacagat tcatcaggca 660
ttaaagcagc cactcagacg cagactggct cgaatagaag ctcttcacta tatgccaatc 720
tatcaacagg agactagtca tgatgaagtt ttattgaagc tagcgaagct ggatttttct 780
gtgctccaat ctatgcacaa aaaggaattg tcgcatattt gtaagtggtg gaaggacctc 840
gatttgcaga acaaactacc gtttgttcgt gacagagtcg tcgagggata tttttggatt 900
ttgagtattt attatgaacc tcagcatgca cgtactcgta tgtttcttat gaagtcgtgt 960
atgtggctgg tagtcctgga tgatacattt gataactacg gaacatacga ggagttggag 1020
attttcacgc aagctgtcga gaggtggtca atatcatgtc tcgacatgct accagaatac 1080
atgaaattga tctatcaaga gcttgtcaac cttcacgttg aaatggagga gagtcttgag 1140
aaagaaggta aaacttatca aatccactac gttaaggaaa tggccaaaga actggtaaga 1200
aattatctag ttgaagctag atggttaaag gaaggctaca tgcctacttt agaggagtac 1260
atgagcgtta gcatggttac ggggacttac gggcttatga ccgctcggag ttacgttggt 1320
cgtggggaca tcgtcaatga agatacgttt aagtgggtgt cttcgtaccc gcctatcgta 1380
aaagcgtcgt gtgttattat ccgtctgatg gatgatatcg tgtctcataa agaagaacaa 1440
gaacgagggc atgttgcaag ttctatcgaa tgctattcga aagaatctgg ggccagtgaa 1500
gaagaggcct gcgagtacat tagccgtaag gttgaggatg catggaaagt tatcaaccga 1560
gagtcgttgc gtccaactgc cgttccgttt cctttgctta tgcctgccat caatttggct 1620
agaatgtgtg aggttctcta tagtgtaaac gacggattta cacatgcaga aggagatatg 1680
aagtcttaca tgaagtcatt cttcgtccac ccgatggtcg tttga 1725
<210> 109
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer LX-268-130-4-S2D-R
<400> 109
ctttaacgtc aaggagaaaa aaccccggat ccatggacac tctgccgatc tcttcc 56
<210> 110
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer LX-268-130-3-S2D-F
<400> 110
ccttcctttt cggttagagc ggatcttagc tagctcatac gaccataggg tgtacgaag 59
<210> 111
<211> 574
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic, A. annua b-farnesene synthase amino acid sequence
<400> 111
Met Ser Thr Leu Pro Ile Ser Ser Val Ser Phe Ser Ser Ser Thr Ser
1 5 10 15
Pro Leu Val Val Asp Asp Lys Val Ser Thr Lys Pro Asp Val Ile Arg
20 25 30
His Thr Met Asn Phe Asn Ala Ser Ile Trp Gly Asp Gln Phe Leu Thr
35 40 45
Tyr Asp Glu Pro Glu Asp Leu Val Met Lys Lys Gln Leu Val Glu Glu
50 55 60
Leu Lys Glu Glu Val Lys Lys Glu Leu Ile Thr Ile Lys Gly Ser Asn
65 70 75 80
Glu Pro Met Gln His Val Lys Leu Ile Glu Leu Ile Asp Ala Val Gln
85 90 95
Arg Leu Gly Ile Ala Tyr His Phe Glu Glu Glu Ile Glu Glu Ala Leu
100 105 110
Gln His Ile His Val Thr Tyr Gly Glu Gln Trp Val Asp Lys Glu Asn
115 120 125
Leu Gln Ser Ile Ser Leu Trp Phe Arg Leu Leu Arg Gln Gln Gly Phe
130 135 140
Asn Val Ser Ser Gly Val Phe Lys Asp Phe Met Asp Glu Lys Gly Lys
145 150 155 160
Phe Lys Glu Ser Leu Cys Asn Asp Ala Gln Gly Ile Leu Ala Leu Tyr
165 170 175
Glu Ala Ala Phe Met Arg Val Glu Asp Glu Thr Ile Leu Asp Asn Ala
180 185 190
Leu Glu Phe Thr Lys Val His Leu Asp Ile Ile Ala Lys Asp Pro Ser
195 200 205
Cys Asp Ser Ser Leu Arg Thr Gln Ile His Gln Ala Leu Lys Gln Pro
210 215 220
Leu Arg Arg Arg Leu Ala Arg Ile Glu Ala Leu His Tyr Met Pro Ile
225 230 235 240
Tyr Gln Gln Glu Thr Ser His Asp Glu Val Leu Leu Lys Leu Ala Lys
245 250 255
Leu Asp Phe Ser Val Leu Gln Ser Met His Lys Lys Glu Leu Ser His
260 265 270
Ile Cys Lys Trp Trp Lys Asp Leu Asp Leu Gln Asn Lys Leu Pro Tyr
275 280 285
Val Arg Asp Arg Val Val Glu Gly Tyr Phe Trp Ile Leu Ser Ile Tyr
290 295 300
Tyr Glu Pro Gln His Ala Arg Thr Arg Met Phe Leu Met Lys Thr Cys
305 310 315 320
Met Trp Leu Val Val Leu Asp Asp Thr Phe Asp Asn Tyr Gly Thr Tyr
325 330 335
Glu Glu Leu Glu Ile Phe Thr Gln Ala Val Glu Arg Trp Ser Ile Ser
340 345 350
Cys Leu Asp Met Leu Pro Glu Tyr Met Lys Leu Ile Tyr Gln Glu Leu
355 360 365
Val Asn Leu His Val Glu Met Glu Glu Ser Leu Glu Lys Glu Gly Lys
370 375 380
Thr Tyr Gln Ile His Tyr Val Lys Glu Met Ala Lys Glu Leu Val Arg
385 390 395 400
Asn Tyr Leu Val Glu Ala Arg Trp Leu Lys Glu Gly Tyr Met Pro Thr
405 410 415
Leu Glu Glu Tyr Met Ser Val Ser Met Val Thr Gly Thr Tyr Gly Leu
420 425 430
Met Ile Ala Arg Ser Tyr Val Gly Arg Gly Asp Ile Val Thr Glu Asp
435 440 445
Thr Phe Lys Trp Val Ser Ser Tyr Pro Pro Ile Ile Lys Ala Ser Cys
450 455 460
Val Ile Val Arg Leu Met Asp Asp Ile Val Ser His Lys Glu Glu Gln
465 470 475 480
Glu Arg Gly His Val Ala Ser Ser Ile Glu Cys Tyr Ser Lys Glu Ser
485 490 495
Gly Ala Ser Glu Glu Glu Ala Cys Glu Tyr Ile Ser Arg Lys Val Glu
500 505 510
Asp Ala Trp Lys Val Ile Asn Arg Glu Ser Leu Arg Pro Thr Ala Val
515 520 525
Pro Phe Pro Leu Leu Met Pro Ala Ile Asn Leu Ala Arg Met Cys Glu
530 535 540
Val Leu Tyr Ser Val Asn Asp Gly Phe Thr His Ala Glu Gly Asp Met
545 550 555 560
Lys Ser Tyr Met Lys Ser Phe Phe Val His Pro Met Val Val
565 570
<210> 112
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, A. annua b-farnesene synthase nucleotide sequence
<400> 112
atgtcgactc ttcctatttc tagtgtttca ttctcttcat ctacgtcacc tttggttgtt 60
gacgataaag ttagcacgaa accagatgtt atccgccata ccatgaattt caatgctagc 120
atatggggag atcaatttct tacatatgat gagccagaag atttggttat gaagaaacaa 180
cttgttgaag agctcaaaga ggaagtcaag aaagagctaa taacgatcaa aggttcaaat 240
gaaccgatgc agcatgtcaa gttgatagaa cttattgatg cagtccaacg gcttggcata 300
gcctatcatt ttgaagagga gattgaagaa gccttgcaac atatccatgt tacatatggc 360
gagcagtggg tcgataaaga aaacctacaa agcatttctc tttggttccg actcctacga 420
caacaaggct tcaacgtctc atcaggagta ttcaaggact ttatggacga gaagggaaaa 480
tttaaggaat ccttatgtaa tgatgctcag ggaattcttg ctctgtatga agcggcattt 540
atgagggtgg aagatgaaac aatactagat aatgcgctcg agttcactaa agttcacctt 600
gacatcatag ccaaggatcc ttcttgtgac tcttccctaa gaacccaaat acaccaagcg 660
ttaaagcagc cacttaggag aaggctggca aggattgagg cgttgcatta catgcctatc 720
taccaacaag aaacatccca cgatgaggtc ttactgaagc ttgcaaaatt agattttagc 780
gtgcttcagt cgatgcacaa aaaggaactt agccacattt gcaaatggtg gaaggatttg 840
gacctccaaa ataagcttcc ttatgttcga gacagggtgg tggaaggcta tttttggata 900
ctatccatct attacgagcc tcaacatgct cgaacaagaa tgttcctaat gaaaacatgc 960
atgtggttag tcgttttaga tgatacattt gataattatg gtacttatga agaactcgaa 1020
atctttacac aagctgttga aagatggtca ataagctgcc tggatatgct tccagaatac 1080
atgaaactaa tatatcaaga gcttgtgaat cttcacgtgg aaatggagga atcacttgaa 1140
aaggagggaa aaacatatca aattcactat gtcaaggaga tggcaaaaga gttggttcgc 1200
aattacttgg tagaagccag atggctaaaa gaggggtaca tgccaactct tgaggagtac 1260
atgtctgtgt caatggtgac tggtacctat ggcttgatga tagcgagatc ttatgtcggc 1320
aggggtgata tcgtcaccga ggataccttt aaatgggtgt cctcgtatcc tcctattata 1380
aaagcttcat gtgtgattgt aagacttatg gatgatattg tcagccacaa ggaggaacaa 1440
gagagaggcc atgttgcttc aagcatcgaa tgctattcta aggaaagtgg tgcatcagag 1500
gaggaagcgt gtgaatatat ctcaagaaaa gttgaagatg catggaaagt tataaaccga 1560
gagtcgctca ggcctacagc tgtcccattt cctctactta tgcctgcaat caaccttgca 1620
cgtatgtgtg aagtcctata tagcgtcaac gatggcttca ctcatgctga gggagacatg 1680
aaaagttaca tgaaatcgtt cttcgttcac cctatggttg tctaa 1725
<210> 113
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2090
<400> 113
cacgttcgcc ggccaaatta aagcagatct agatcggtga aaacatc 47
<210> 114
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2091
<400> 114
gaagaaatag gcaaagttga catggatccg tttagtccgt attgctattg 50
<210> 115
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2092
<400> 115
cacgttcgcc ggccaaatta aagcagatct ctctacaacc gcagggaaat 50
<210> 116
<211> 4309
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Construct D
<400> 116
gaagatccga ggcctagctt taacgaacgc agaattttcg agttattaaa cttaaaatac 60
gctgaacccg aacatagaaa tatcgaatgg gaaaaaaaaa ctgcataaag gcattaaaag 120
aggagcgaat ttttttttaa taaaaatctt aataatcatt aaaagataaa taatagtcta 180
tatatacgta tataaataaa aaatattcaa aaaataaaat aaactattat tttagcgtaa 240
aggatgggga aagagaaaag aaaaaaattg atctatcgat ttcaattcaa ttcaatttat 300
ttcttttcgg ataagaaagc aacacctggc aattccttac cttccaataa ttccaaagaa 360
gcaccaccac cagtagagac atgggagagt caaacgacca taggatgaac gaagaaggac 420
ttcatataag atttcatgtc accctcagca tgagtaaaac catcattaac agagtacaag 480
acctcacaca ttctagctaa gtttattgct ggcattaaca aagggaaggg aacggctgtt 540
ggacgcaaag attctctatt gattactttc caggcatcct caactttcct actaatatat 600
tcacatgctt cctcttcaga agcacctgat tctttagagt aacattctat agatgaagcc 660
acatgtcctc tttcttgttc ttccttgtga gatacaatat cgtccattaa tcttactatt 720
acacaggaag ctttaataat aggtgggtaa ctagaaaccc atttgaatgt gtcttcagta 780
acaatgtctc ctctgccaac ataggacctt gcaatcatca aaccataagt accagtaacc 840
atagaaacag acatgtattc ttctaaagta ggcatataac cttccttcaa ccatcttgct 900
tctactaagt aattacgaac taattcttta gccatctcct taacgtaatg aatctgatag 960
gtctttccct ccttttccaa agattcttcc atttccacat gcaaattgac taattcttgg 1020
tagattaatt tcatatattc gggcaacata tctaagcatg agatagacca tctctcgacg 1080
gcttgagtaa aaatctccaa ttcttcgtat gttccataat tatcaaaagt atcgtccaaa 1140
actactaacc acatgcatgt tttcatcaaa aacattcttg ttctagcgtg ttgtggctca 1200
tagtatatgg acaatatcca gaagtagcct tcgacaacac gatcacgtac ataaggtaac 1260
ttattttgta aatctaaatc tttccaccac ttacagatat gtgacaattc ctttttatgc 1320
atagactgca aaacactgaa atccaacttg gctaatttca acaatacttc atcatgagat 1380
gtttcctgtt ggtagattgg catgtaatgt aatgcttcaa tccttgctaa tctccttctt 1440
aaaggttgtt ttaaggcttg atggatttgt gtacgcaatg aagaatcgca agatgggtct 1500
tttgctatga tatctaaatg aacttttgtg aattccaaag cattgtctaa gatggtttca 1560
tcttcaaccc tcataaatgc agcttcatat aaggctaata ttccttgtgc atcattgcat 1620
aaagactctt tgaatttacc tttttcgtcc ataaagtctt tgaaaacgcc agaggagacg 1680
ttaaagccct gttgacgcaa caacctgaac cacaatgaaa tactctgtaa attttcctta 1740
tccacccact gttcaccata ggtaacatgt atatgttgca aagcttcctc gatctcttct 1800
tcaaaatggt aagctatacc taaacgttga acagcatcaa ttaattcaat caatttcaca 1860
tgctgcatgg gctcatttga acctttgata gttatcaatt ccttcttaac ttcctctttt 1920
aattcctcca ctaattgttt cttcataact aaatcttcag gctcatcata ggtcaagaat 1980
tgatctcccc aaatagaagc attgaaattc attgtatgtc tgataacgtc gggcttggtt 2040
gagactttgt cgtccacgac taatggtgat gtagaagagg aaaatgacac agaagaaata 2100
ggcaaagttg acatggatcc ggggtttttt ctccttgacg ttaaagtata gaggtatatt 2160
aacaattttt tgttgatact tttattacat ttgaataaga agtaatacaa accgaaaatg 2220
ttgaaagtat tagttaaagt ggttatgcag tttttgcatt tatatatctg ttaatagatc 2280
aaaaatcatc gcttcgctga ttaattaccc cagaaataag gctaaaaaac taatcgcatt 2340
atcatcctat ggttgttaat ttgattcgtt catttgaagg tttgtggggc caggttactg 2400
ccaatttttc ctcttcataa ccataaaagc tagtattgta gaatctttat tgttcggagc 2460
agtgcggcgc gaggcacatc tgcgtttcag gaacgcgacc ggtgaagacg aggacgcacg 2520
gaggagagtc ttccttcgga gggctgtcac ccgctcggcg gcttctaatc cgtactagat 2580
ctgctttaat ttggccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 2640
gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 2700
ttaatgcgcc gctacagggc gcgtcgcgcc attcgccatt caggctgcgc aactgttggg 2760
aagggcgatc ggtgcgggcc tcttcgctat tacgccagct gaattggagc gacctcatgc 2820
tatacctgag aaagcaacct gacctacagg aaagagttac tcaagaataa gaattttcgt 2880
tttaaaacct aagagtcact ttaaaatttg tatacactta ttttttttat aacttattta 2940
ataataaaaa tcataaatca taagaaattc gcttattcaa ctaattctat agatgataaa 3000
aatggtttct ggacctcttt gacgtccttt gatcttacgt tagctaactg ggcgactggt 3060
ggataggccc actcagaagg tgaaacggct cctacattgg cagcttgctc gtagaacttg 3120
caaaattttt gggcatcctc agtcttttcc tccttgactt tctcgtagat ttcagacaac 3180
ctgtacctcc tgtcgcataa atgccatgtg acataaccat gcatgaagca ctctatggtg 3240
tccattactt gagggtcctt gtctgagaaa actgcaacca tttgctttga agagtgcaag 3300
gtatcctggg tcaatttttc taaggcctcg tgtaatgata tctcgtcaga aacaacgtag 3360
ttctttacca aagagatctg atccctctcg tcgtcgaact ccttgtaaaa tgacatcaaa 3420
tcattaaccc agaccatcca attttccatt tgagctatgg ctgaagtgat ctccaaaaac 3480
aatgatcttt cattgaactg ctcctttggc cacaaagagg caccgacgca gtgtcctaaa 3540
ccgttcattc ttctcaagaa ctgtgggtag tcgtgagaac ctgggaatcc tccaaaattg 3600
tattgttcta tccagcaacc ctcgaagaag tctaaggtag acctgatcaa gttcaatgag 3660
caaaaaggac caaaatgcct caatacgttt ggaaagtgct cgtttactaa agcccaccaa 3720
ggatgagcct gttctctacc tgcttgtaag tcatcgaagt agtttaccat agtagggtat 3780
gggtcgtctt ttgaatcgtc caataccaag gtgtaggtat agtggattga caagtctgcc 3840
atacactctt tagatacctt ggcccatgaa tatacaacca taccgacaat ggtctgcaat 3900
gaagcttgca atctcttagg gtcgaccttc aacaactgct gctgtcttgg ctgggcgaag 3960
tggtgggcgg ctttgttgta ggcgtagtgt aagttctcaa tcctctcctc cctggtatag 4020
tttgagtccc tgtacctaat gtactccaac aacctgacgg tggtgttcaa gaagtactcg 4080
gttggaaagt tttccatgaa ttcgaatttt caaaaattct tacttttttt ttggatggac 4140
gcaaagaagt ttaataatca tattacatgg cattaccacc atatacatat ccatatacat 4200
atccatatct aatcttactt atatgttgtg gaaatgtaaa gagccccatt atcttagcct 4260
aaaaaaacct tctctttgga actttcagta atacgcttaa ctgctcatt 4309
<210> 117
<211> 5714
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM1490
<400> 117
ttcttgaaga cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat 60
aatggtttct tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 120
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 180
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 240
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 300
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 360
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 420
agttctgcta tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg 480
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 540
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 600
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 660
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 720
accaaacgac gagcgtgaca ccacgatgcc tgcagcaatg gcaacaacgt tgcgcaaact 780
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 840
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 900
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 960
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 1020
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 1080
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 1140
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 1200
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 1260
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 1320
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 1380
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 1440
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 1500
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 1560
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 1620
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 1680
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 1740
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 1800
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 1860
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 1920
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 1980
cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca 2040
tctgtgcggt atttcacacc gcatatatgg tgcactctca gtacaatctg ctctgatgcc 2100
gcatagttaa gccagtatac actccgctat cgctacgtga ctgggtcatg gctgcgcccc 2160
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 2220
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 2280
cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga 2340
tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc 2400
ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcact gatgcctccg 2460
tgtaaggggg atttctgttc atgggggtaa tgataccgat gaaacgagag aggatgctca 2520
cgatacgggt tactgatgat gaacatgccc ggttactgga acgttgtgag ggtaaacaac 2580
tggcggtatg gatgcggcgg gaccagagaa aaatcactca gggtcaatgc cagcgcttcg 2640
ttaatacaga tgtaggtgtt ccacagggta gccagcagca tcctgcgatg cagatccgga 2700
acataatggt gcagggcgct gacttccgcg tttccagact ttacgaaaca cggaaaccga 2760
agaccattca tgttgttgct caggtcgcag acgttttgca gcagcagtcg cttcacgttc 2820
gctcgcgtat cggtgattca ttctgctaac cagtaaggca accccgccag cctagccggg 2880
tcctcaacga caggagcacg atcatgcgca cccgtggcca ggacccaacg ctgcccgaga 2940
tgcgccgcgt gcggctgctg gagatggcgg acgcgatgga tatgttctgc caagggttgg 3000
tttgcgcatt cacagttctc cgcaagaatt gattggctcc aattcttgga gtggtgaatc 3060
cgttagcgag gtgccgccgg cttccattca ggtcgaggtg gcccggctcc atgcaccgcg 3120
acgcaacgcg gggaggcaga caaggtatag ggcggcgcct acaatccatg ccaacccgtt 3180
ccatgtgctc gccgaggcgg cataaatcgc cgtgacgatc agcggtccag tgatcgaagt 3240
taggctggta agagccgcga gcgatccttg aagctgtccc tgatggtcgt catctacctg 3300
cctggacagc atggcctgca acgcgggcat cccgatgccg ccggaagcga gaagaatcat 3360
aatggggaag gccatccagc ctcgcgtcgc gaacgccagc aagacgtagc ccagcgcgtc 3420
ggccgccatg ccggcgataa tggcctgctt ctcgccgaaa cgtttggtgg cgggaccagt 3480
gacgaaggct tgagcgaggg cgtgcaagat tccgaatacc gcaagcgaca ggccgatcat 3540
cgtcgcgctc cagcgaaagc ggtcctcgcc gaaaatgacc cagagcgctg ccggcacctg 3600
tcctacgagt tgcatgataa agaagacagt cataagtgcg gcgacgatag tcatgccccg 3660
cgcccaccgg aaggagctga ctgggttgaa ggctctcaag ggcatcggtc gagatcccgg 3720
tgcctaatga gtgagctaac ttacattaat tgcgttgcgc tcactgcccg ctttccagtc 3780
gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 3840
gcgtattggg cgccagggtg gtttttcttt tcaccagtga gacgggcaac agctgattgc 3900
ccttcaccgc ctggccctga gagagttgca gcaagcggtc cacgctggtt tgccccagca 3960
ggcgaaaatc ctgtttgatg gtggttaacg gcgggatata acatgagctg tcttcggtat 4020
cgtcgtatcc cactaccgag atatccgcac caacgcgcag cccggactcg gtaatggcgc 4080
gcattgcgcc cagcgccatc tgatcgttgg caaccagcat cgcagtggga acgatgccct 4140
cattcagcat ttgcatggtt tgttgaaaac cggacatggc actccagtcg ccttcccgtt 4200
ccgctatcgg ctgaatttga ttgcgagtga gatatttatg ccagccagcc agacgcagac 4260
gcgccgagac agaacttaat gggcccgcta acagcgcgat ttgctggtga cccaatgcga 4320
ccagatgctc cacgcccagt cgcgtaccgt cttcatggga gaaaataata ctgttgatgg 4380
gtgtctggtc agagacatca agaaataacg ccggaacatt agtgcaggca gcttccacag 4440
caatggcatc ctggtcatcc agcggatagt taatgatcag cccactgacg cgttgcgcga 4500
gaagattgtg caccgccgct ttacaggctt cgacgccgct tcgttctacc atcgacacca 4560
ccacgctggc acccagttga tcggcgcgag atttaatcgc cgcgacaatt tgcgacggcg 4620
cgtgcagggc cagactggag gtggcaacgc caatcagcaa cgactgtttg cccgccagtt 4680
gttgtgccac gcggttggga atgtaattca gctccgccat cgccgcttcc actttttccc 4740
gcgttttcgc agaaacgtgg ctggcctggt tcaccacgcg ggaaacggtc tgataagaga 4800
caccggcata ctctgcgaca tcgtataacg ttactggttt cacattcacc accctgaatt 4860
gactctcttc cgggcgctat catgccatac cgcgaaaggt tttgcgccat tcgatggtgt 4920
ccgggatctc gacgctctcc cttatgcgac tcctgcatta ggaagcagcc cagtagtagg 4980
ttgaggccgt tgagcaccgc cgccgcaagg aatggtgcat gcaaggagat ggcgcccaac 5040
agtcccccgg ccacggggcc tgccaccata cccacgccga aacaagcgct catgagcccg 5100
aagtggcgag cccgatcttc cccatcggtg atgtcggcga tataggcgcc agcaaccgca 5160
cctgtggcgc cggtgatgcc ggccacgatg cgtccggcgt agaggatcga gatctcgatc 5220
ccgcgaaatt aatacgactc actatagggg aattgtgagc ggataacaat tcccctctag 5280
aaataatttt gtttaacttt aagaaggaga tataccatgg gcagcagcca tcatcatcat 5340
catcacagca gcggcctgga agttctgttc caggggcccc atatgctcga ggatccggct 5400
gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca 5460
taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata 5520
tccggatatc ccgcaagagg cccggcagta ccggcataac caagcctatg cctacagcat 5580
ccagggtgac ggtgccgagg atgacgatga gcgcattgtt agatttcata cacggtgcct 5640
gactgcgtta gcaatttaac tgtgataaac taccgcatta aagcttatcg atgataagct 5700
gtcaaacatg agaa 5714
<210> 118
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_A coding sequence
<400> 118
atgtcaactt tgcctatttc ttctgtgtca ttttcctctt ctacatcacc attagtcgtg 60
gacgacaaag tctcaaccaa gcccgacgtt atcagacata caatgaattt caatgcttct 120
atttggggag atcaattctt gacctatgat gagcctgaag atttagttat gaagaaacaa 180
ttagtggagg aattaaaaga ggaagttaag aaggaattga taactatcaa aggttcaaat 240
gagcccatgc agcatgtgaa attgattgaa ttaattgatg ctgttcaacg tttaggtata 300
gcttaccatt ttgaagaaga gatcgaggaa gctttgcaac atatacatgt tacctatggt 360
gaacagtggg tggataagga aaatttacag agtatttcat tgtggttcag gttgttgcgt 420
caacagggct ttaacgtctc ctctggcgtt ttcaaagact ttatggacga aaaaggtaaa 480
ttcaaagagt ctttatgcaa tgatgcacaa ggaatattag ccttatatga agctgcattt 540
atgagggttg aagatgaaac catcttagac aatgctttgg aattcacaaa agttcattta 600
gatatcatag caaaagaccc atcttgcgat tcttcattgc gtacacaaat ccatcaagcc 660
ttaaaacaac ctttaagaag gagattagca aggattgaag cattacatta catgccaatc 720
taccaacagg aaacatctca tgatgaagta ttgttgaaat tagccaagtt ggatttcagt 780
gttttgcagt ctatgcataa aaaggaattg tcacatatct gtaagtggtg gaaagattta 840
gatttacaaa ataagttacc ttatgtacgt gatcgtgttg tcgaaggcta cttctggata 900
ttgtccatat actatgagcc acaacacgct agaacaagaa tgtttttgat gaaaacatgc 960
atgtggttag tagttttgga cgatactttt gataattatg gaacatacga agaattggag 1020
atttttactc aagccgtcga gagatggtct atctcatgct tagatatgtt gcccgaatat 1080
atgaaattaa tctaccaaga attagtcaat ttgcatgtgg aaatggaaga atctttggaa 1140
aaggagggaa agacctatca gattcattac gttaaggaga tggctaaaga attagttcgt 1200
aattacttag tagaagcaag atggttgaag gaaggttata tgcctacttt agaagaatac 1260
atgtctgttt ctatggttac tggtacttat ggtttgatga ttgcaaggtc ctatgttggc 1320
agaggagaca ttgttactga agacacattc aaatgggttt ctagttaccc acctattatt 1380
aaagcttcct gtgtaatagt aagattaatg gacgatattg tatctcacaa ggaagaacaa 1440
gaaagaggac atgtggcttc atctatagaa tgttactcta aagaatcagg tgcttctgaa 1500
gaggaagcat gtgaatatat tagtaggaaa gttgaggatg cctggaaagt aatcaataga 1560
gaatctttgc gtccaacagc cgttcccttc cctttgttaa tgccagcaat aaacttagct 1620
agaatgtgtg aggtcttgta ctctgttaat gatggtttta ctcatgctga gggtgacatg 1680
aaatcttata tgaagtcctt cttcgttcat cctatggtcg tttga 1725
<210> 119
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_B coding sequence
<400> 119
atgtcaacat tgcctatatc ttcagtctca ttctcatctt ctacctcacc attggttgta 60
gacgacaaag tttctacaaa gccagacgtc ataaggcata caatgaactt caacgcctct 120
atatggggag accagttctt gacctatgac gaaccagagg atttagtcat gaaaaaacag 180
ttggtcgagg agttaaagga ggaggttaag aaggagttga tcaccataaa aggttcaaac 240
gagcctatgc aacacgtcaa gttgatagag ttaattgacg ctgttcaaag gttaggaatt 300
gcatatcatt tcgaagagga gattgaagag gcattgcagc atattcatgt tacttatgga 360
gaacaatggg ttgacaagga gaacttgcaa tcaatctctt tatggtttag gttgttaagg 420
caacagggat tcaacgtctc ttcaggtgtc tttaaagatt tcatggacga aaagggaaag 480
tttaaggagt cattatgcaa cgatgctcaa ggaattttgg cattatatga agctgccttt 540
atgagggtag aggacgagac tatattagac aacgcattgg aattcactaa agtccactta 600
gacatcatcg caaaggatcc ttcatgcgac tcttctttaa gaacacaaat acatcaagca 660
ttgaagcaac ctttgaggag aaggttagca aggatagaag ccttgcacta tatgcctatc 720
tatcagcagg aaacatcaca tgatgaagtt ttgttgaagt tggccaaatt ggacttctct 780
gtattgcagt caatgcataa aaaggaattg tctcatatct gcaaatggtg gaaggatttg 840
gatttgcaga ataagttgcc ttatgttaga gacagagtcg ttgagggata tttctggata 900
ttgtctatct actacgagcc tcagcacgct agaacaagaa tgttcttaat gaagacttgc 960
atgtggttgg tcgttttaga cgacactttt gacaattacg gtacctacga ggaattagag 1020
atcttcactc aagctgtaga gagatggtca atttcatgct tggacatgtt accagagtat 1080
atgaagttga tctaccagga gttagtcaac ttacacgtcg agatggaaga atctttggag 1140
aaagagggta aaacttatca gatccactat gtcaaggaga tggcaaaaga gttggtaaga 1200
aactacttgg tagaagctag atggttgaag gagggttaca tgcctacctt ggaggaatat 1260
atgtctgttt ctatggtcac tggaacctac ggattaatga ttgctagatc ttatgtcggt 1320
agaggagaca ttgtaaccga agacacattc aagtgggtat catcttatcc acctatcata 1380
aaggcctcat gcgttattgt aaggttgatg gatgatattg tatctcacaa agaggaacaa 1440
gagaggggac atgtagcatc atctatcgag tgttattcaa aagaatcagg agcatctgaa 1500
gaagaagcct gtgagtacat ctctagaaaa gtcgaagatg catggaaagt tatcaacaga 1560
gagtcattga ggccaaccgc agtccctttc ccattattaa tgcctgccat aaacttagca 1620
agaatgtgcg aagtcttata ttcagttaat gacggtttca cccacgccga gggtgacatg 1680
aaatcataca tgaagtcatt ctttgttcac cctatggtag tctaa 1725
<210> 120
<211> 1725
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, FS_C coding sequence
<400> 120
atgtcaacct tgcctatttc ttctgtctca ttctcttcat ctacctctcc attggtcgta 60
gacgataagg tctctactaa accagacgtc atcaggcaca ccatgaattt caacgcttct 120
atatggggag accagttttt aacttacgac gaacctgagg atttggtcat gaaaaaacag 180
ttggtcgaag aattgaagga ggaggtcaag aaggagttga ttacaatcaa gggatcaaac 240
gaacctatgc agcacgttaa gttgatcgaa ttaatagatg ctgtccaaag attgggtata 300
gcctaccact tcgaggagga aatcgaggag gctttacaac atatacacgt cacatacggt 360
gaacagtggg tcgataaaga gaatttgcag tctatctcat tgtggttcag gttgttaagg 420
caacaaggtt ttaatgtttc atctggagtt ttcaaggact ttatggacga gaaaggtaaa 480
ttcaaggagt ctttgtgcaa cgatgctcag ggtattttag cattgtatga ggccgcattt 540
atgagggttg aagacgagac tatcttagat aacgcattgg agttcaccaa ggtccactta 600
gacattattg ctaaagaccc atcatgtgac tcttctttga gaactcaaat acaccaggca 660
ttaaagcaac ctttgaggag aaggttggct agaatcgaag cattacacta tatgccaata 720
tatcagcagg aaacctcaca cgacgaagtt ttgttaaagt tagcaaaatt ggacttctct 780
gtcttgcagt caatgcataa gaaggagttg tctcatatct gcaagtggtg gaaggattta 840
gatttacaaa ataagttgcc atacgtcaga gatagggttg tagagggata cttctggatc 900
ttgtctatat actatgagcc tcagcacgcc agaaccagaa tgttcttaat gaagacctgc 960
atgtggttag tagtattaga cgacaccttc gacaattatg gaacatacga ggaattggag 1020
atctttactc aagccgttga gagatggtct atttcttgct tggacatgtt gccagagtat 1080
atgaagttga tctaccagga gttagttaac ttgcacgtcg aaatggagga atctttggag 1140
aaagagggaa agacatacca gattcactat gtcaaggaaa tggccaaaga gttggtaagg 1200
aactatttgg ttgaggccag atggttgaaa gagggttata tgcctacctt ggaggagtac 1260
atgtcagtct caatggttac tggtacctat ggtttgatga ttgccagatc atacgtcgga 1320
agaggtgata tcgtaacaga ggataccttc aagtgggttt cttcataccc tcctatcatt 1380
aaggcctctt gcgtcatagt caggttgatg gatgacattg tttctcataa ggaggaacag 1440
gagaggggtc acgtagcctc atcaatagag tgctattcaa aagagtctgg tgcatcagag 1500
gaagaggcat gtgaatacat ctctagaaaa gtagaggatg cctggaaggt cattaacagg 1560
gagtcattga gacctactgc tgtacctttt cctttgttga tgcctgctat caacttggca 1620
aggatgtgcg aagttttgta ttcagtaaac gatggtttca ctcacgccga aggtgatatg 1680
aaatcatata tgaaatcttt tttcgtacat cctatggtag tataa 1725
<210> 121
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-110-CPK1849
<400> 121
gacacagaag aaataggcaa agttgacat 29
<210> 122
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-110-CPK1903
<400> 122
cggatccatg tcaactttgc ctatttctt 29
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2039
<400> 123
gaagatccga ggcctagctt 20
<210> 124
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2040
<400> 124
ccaccagtag agacatggga gagtcaaacg accataggat gaac 44
<210> 125
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2041
<400> 125
gttcatccta tggtcgtttg actctcccat gtctctactg gtgg 44
<210> 126
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2042
<400> 126
ggcttctaat ccgtactaga tctgctttaa tttggccgg 39
<210> 127
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2043
<400> 127
ccggccaaat taaagcagat ctagtacgga ttagaagcc 39
<210> 128
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2044
<400> 128
caggtatagc atgaggtcgc tccaattcag ctg 33
<210> 129
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2045
<400> 129
cagctgaatt ggagcgacct catgctatac ctg 33
<210> 130
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2046
<400> 130
aatgagcagt taagcgtatt 20
<210> 131
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2051
<400> 131
gaagaaatag gcaaagttga catggatccg ttctcgaggc agccg 45
<210> 132
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2052
<400> 132
cacgttcgcc ggccaaatta aagcagatct ccacgatgtt gataatgagc 50
<210> 133
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2053
<400> 133
gaagaaatag gcaaagttga catggatccg ttcttaattg ttattcgtac 50
<210> 134
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2054
<400> 134
cacgttcgcc ggccaaatta aagcagatct tccaggtatg ggtttgagga 50
<210> 135
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2055
<400> 135
gaagaaatag gcaaagttga catggatccg tgtgatgatg ttttatttgt 50
<210> 136
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2056
<400> 136
ccggccaaat taaagcagat ctaacggcgg gattcctcta tg 42
<210> 137
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2059
<400> 137
gaagaaatag gcaaagttga catggatccg tttgattgat ttgactgtgt 50
<210> 138
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2060
<400> 138
cacgttcgcc ggccaaatta aagcagatct gtaataaaca caccccgcgt 50
<210> 139
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2061
<400> 139
gaagaaatag gcaaagttga catggatccg ttttagttta tgtatgtgtt 50
<210> 140
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2062
<400> 140
cacgttcgcc ggccaaatta aagcagatct acgaagagtt tgaatc 46
<210> 141
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2063
<400> 141
gaagaaatag gcaaagttga catggatccg tttgaatatg tattacttgg 50
<210> 142
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2064
<400> 142
cacgttcgcc ggccaaatta aagcagatct cctcctttcc ccatgtttcc 50
<210> 143
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2065
<400> 143
gaagaaatag gcaaagttga catggatccg tgttgtattt agtttttttt 50
<210> 144
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2066
<400> 144
cacgttcgcc ggccaaatta aagcagatct tccttctttt cctcttgata 50
<210> 145
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2067
<400> 145
gaagaaatag gcaaagttga catggatccg cttgactata cttttttata 50
<210> 146
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2068
<400> 146
cacgttcgcc ggccaaatta aagcagatct ttgcatcgcc ctgc 44
<210> 147
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2073
<400> 147
gaagaaatag gcaaagttga catggatccg gtttagttaa ttatagttcg 50
<210> 148
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2074
<400> 148
cacgttcgcc ggccaaatta aagcagatct acccaaaatg tgaaagaaat 50
<210> 149
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2079
<400> 149
gaagaaatag gcaaagttga catggatccg tgttttatat ttgttgtaa 49
<210> 150
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2080
<400> 150
ccaaattaaa gcagatctgg catttgcaag aattactc 38
<210> 151
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2085
<400> 151
gaagaaatag gcaaagttga catggatccg ggctatttgc ttatatgtat 50
<210> 152
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2086
<400> 152
cacgttcgcc ggccaaatta aagcagatct atttcctttt cttcctctta 50
<210> 153
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2087
<400> 153
gaagaaatag gcaaagttga catggatccg tttgttcttt ctggaa 46
<210> 154
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2088
<400> 154
cacgttcgcc ggccaaatta aagcagatct tgtgttacgt atctttgatg 50
<210> 155
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer AM-288-160-CPK2089
<400> 155
gaagaaatag gcaaagttga catggatccg gttttagtgt gtgaatgaa 49
<210> 156
<211> 11151
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Expression plasmid pAM552
<400> 156
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatgcttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa aagagaatct 660
ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc ggtggtactg 720
ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt aactgcatct 780
tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat tgcagcagac 840
aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga accgtggcat 900
ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga cgcagatggc 960
aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc accaaacatg 1020
ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat catggcggca 1080
gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat ggtttcctcc 1140
acagtttttc tccataatct tgaagaggcc aaaagattag ctttatccaa ggaccaaata 1200
ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat tctttgcact 1260
tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc ttcctttctc 1320
ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt acctttagca 1380
aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt acatggtctt 1440
aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc aggtctaaca 1500
ctaccggtac cccatttagg accagccaca gcacctaaca aaacggcatc aaccttcttg 1560
gaggcttcca gcgcctcatc tggaagtggg acacctgtag catcgatagc agcaccacca 1620
attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat agctttaaga 1680
accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa aacgacgatc 1740
ttcttagggg cagacattac aatggtatat ccttgaaata tatataaaaa aaggcgcctt 1800
agaccgctcg gccaaacaac caattacttg ttgagaaata gagtataatt atcctataaa 1860
tataacgttt ttgaacacac atgaacaagg aagtacagga caattgattt tgaagagaat 1920
gtggattttg atgtaattgt tgggattcca tttttaataa ggcaataata ttaggtatgt 1980
ggatatacta gaagttctcc tcgaccgtcg atatgcggtg tgaaataccg cacagatgcg 2040
taaggagaaa ataccgcatc aggaaattgt aaacgttaat attttgttaa aattcgcgtt 2100
aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 2160
taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 2220
actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 2280
cccactacgt ggaagatccg aggcctagct ttaacgaacg cagaattttc gagttattaa 2340
acttaaaata cgctgaaccc gaacatagaa atatcgaatg ggaaaaaaaa actgcataaa 2400
ggcattaaaa gaggagcgaa ttttttttta ataaaaatct taataatcat taaaagataa 2460
ataatagtct atatatacgt atataaataa aaaatattca aaaaataaaa taaactatta 2520
ttttagcgta aaggatgggg aaagagaaaa gaaaaaaatt gatctatcga tttcaattca 2580
attcaattta tttcttttcg gataagaaag caacacctgg caattcctta ccttccaata 2640
attccaaaga agcaccacca ccagtagaga catgggagac ccgggccatg gttagataga 2700
catagggtaa actagcaatg atttgatcaa atgcttgtat tcatctccca ttctcgtaaa 2760
attgtcttta cctgcatatt ggacctctaa aaattggcaa agatatataa cagccataag 2820
taaaggtctt gggatattct ttgttgttaa atactctctg tttatgtctt tccaaacgtc 2880
ctccacttcc ttataaatca gtgtctgagc atattcttcg ttgacattgt attccttcat 2940
gtaagattct aaagagcttg aactatgttt tctctcctgt tccgctttat gagtcatcag 3000
gtcatttaat ctcctaccca gaataccact gtaacggaat aaaggcggag cagatacagc 3060
ccactcaact gattccttag tgaaaatatc gctcattcct agataacagg tagttgttag 3120
caagtttgca ccaccagtga taataactac gggatcgtgc tcttcagttg tcggtatgtg 3180
tccttcatta gcccatttcg cttctaccat tagattcctt acgaattctt taacgaactc 3240
cttcccacag ttgaataaat cagttctacc ttctttggcc agaaactcct ccatttctgt 3300
gtaggtatcc atgaataatt tgtaaatagg cttcatgtat tccggcaacg tgtctaagca 3360
ggtgatcgac catctttcca cggcttcagt gaaaatcttt aactcctcgt aagttccata 3420
tgcgtcatac gtgtcatcaa taagtgttat cacagcaact gccttagtga aaaaaactct 3480
agctcttgaa tactggggtt cgtaaccaga acctaaaccc caaaaatagc attcaacgat 3540
acgatctctc agacatgggg catttttctt aatatcaaat gccttccacc acttgcatac 3600
gtgactcaac tcttccttat gtaggctctg caatagattg aactccagtt tagctaactt 3660
tagcagagtt ttattatggg agtcttgttg ctgatagaag ggtatgtact gggcggcctc 3720
gatccttggc aatctcttcc acaatggttg ctttaaagct ctctggattt cagtgaataa 3780
agcggggttt gtactaaacg cgtcctttgt cataatcgat agccttgatc ttgtgaatcc 3840
cagggcatct tcaagaatta tttcgcccgg aactctcatg gacgtagcct catataattc 3900
caacaatcct tcaacatcat tcgctaacga ttgtttaaaa gcaccattct tgtctttata 3960
gttattaaac acatcacacg tgacatagta tccttgttta cgcatcagcc taaaccataa 4020
gctagacctg tcgccattcc aattatcacc ataggtctcg taaatacatt gcaatgcatg 4080
atcaatttca cgttcaaaat gatacggaat acctaaacgt tgaatctcgt caatcagctt 4140
caacaaattt gcatgtttca taggaatatc caatgcttcc tttaacaact gtcttacttc 4200
cttctttaga tcgtttacta tttgctccac accctgttca acttgtttct cataaatcaa 4260
aaattgatcg ccccaaatag aaggtgggaa atttgcaatt ggccttatag gtttctcttc 4320
agtcaaggcc attgttttct gcagatccgg ggttttttct ccttgacgtt aaagtataga 4380
ggtatattaa caattttttg ttgatacttt tattacattt gaataagaag taatacaaac 4440
cgaaaatgtt gaaagtatta gttaaagtgg ttatgcagtt tttgcattta tatatctgtt 4500
aatagatcaa aaatcatcgc ttcgctgatt aattacccca gaaataaggc taaaaaacta 4560
atcgcattat catcctatgg ttgttaattt gattcgttca tttgaaggtt tgtggggcca 4620
ggttactgcc aatttttcct cttcataacc ataaaagcta gtattgtaga atctttattg 4680
ttcggagcag tgcggcgcga ggcacatctg cgtttcagga acgcgaccgg tgaagacgag 4740
gacgcacgga ggagagtctt ccttcggagg gctgtcaccc gctcggcggc ttctaatccg 4800
tactaagatc tgctttaatt tggccggcga acgtggcgag aaaggaaggg aagaaagcga 4860
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 4920
ccgccgcgct taatgcgccg ctacagggcg cgtcgcgcca ttcgccattc aggctgcgca 4980
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg aattggagcg 5040
acctcatgct atacctgaga aagcaacctg acctacagga aagagttact caagaataag 5100
aattttcgtt ttaaaaccta agagtcactt taaaatttgt atacacttat tttttttata 5160
acttatttaa taataaaaat cataaatcat aagaaattcg cttatttaga agtgtcaaca 5220
acgtatctac caacgatttg acccttttcc atcttttcgt aaatttctgg caaggtagac 5280
aagccgacaa ccttgattgg agacttgacc aaacctctgg cgaagaattg ttaattaaga 5340
gtcagtcgac ttaaaaacta gggaccaata gcaattctgt tttacgttgc attgttgcac 5400
ctgaactttc cgtcatgtca atttgatcat atgaaactcc attgggcaac ttccagttga 5460
aatgataaag aatgttggct agtggcagtt gaacattggc caaacctaac gcagcgccag 5520
gacacatacg acgtccagcc ccaaatggta aatattcata ttcggcgccc atcactgttg 5580
ccgaagagtt ttcaaatctt tcaggtataa acgcttctgc atccttccag tattcaggat 5640
ctctattgat cgcaaacaca ttaacgatta atttcgtttt gttagggata ttataaccag 5700
ccaagtttac tggctgacga cattctctag gtagcactaa cggcaagggt gggtgtagtc 5760
taagagtctc tttgatgacc atattcaagt aggacaattc ttgtatatct tcttcatgta 5820
ttttttcttt cccattcaag gccttacgta attcagcctg aaccttttcc attgctttcg 5880
gacattttat tagctcgctt atagcccatt ctatggtaga acttgaagtg tcggtccctg 5940
caccgaacat gtccaaaatt attgctttga tattatccga agtcagagga aactcagcag 6000
aatcctttaa tctaagtaat acatctaata gggtttcgtt ggttttggat gacgtattta 6060
cggtatgttc agctaccaaa ttgtcaatta agttatcaat ctttttacgt aggctagtta 6120
atcttgctct cttaccgctc aagtgatgca agaacttttt agatgggaaa atatcggcaa 6180
catcgaaacc gcctgtttgt ctcagtattt ctttaacaat ttcagtaagt tccttttgat 6240
ctttaattcc cttaccaaac gcagcacggg atagtatagt ggcaattagt ttaaaaacgt 6300
tttcacttaa atttactggt ctaccactac ctgaagcctt tatttcctgg actaaattcc 6360
aacattcttc ttccctcaac gattgaaatg acttaacctt ttttacagac aacaattcaa 6420
gagtacaaat cttccttaat tgtctccagt attccccata tggagcaagg acaacatcag 6480
tgttatgata taaaactatt tccccagtta aagtttcggg tctattagcg aaagtaatat 6540
cgtaggttgt aagaatttcc ttagcccact taggactcga cacgactatt gtgggtacct 6600
ctcccaattg aaggtgcatt agcgaaccat attttctcgc taaatccctt acacccctgt 6660
gtggtgtggt tccgatcaaa tggtgcatgt gaccaatgat gggtagcctc caaggttccg 6720
gcaaggactt tttagttgac ttacttctag tggcaaattt gtacacgaac aacaaaatag 6780
ttgctaaagc aattgatgta gttaaagata gtgccatagc ctttaaaatt gacttcattg 6840
ttttcctagg cctttagtga gggttgaatt cgaattttca aaaattctta cttttttttt 6900
ggatggacgc aaagaagttt aataatcata ttacatggca ttaccaccat atacatatcc 6960
atatacatat ccatatctaa tcttacttat atgttgtgga aatgtaaaga gccccattat 7020
cttagcctaa aaaaaccttc tctttggaac tttcagtaat acgcttaact gctcattgct 7080
atattgaagt acggattaga agccgccgag cgggtgacag ccctccgaag gaagactctc 7140
ctccgtgcgt cctcgtcttc accggtcgcg ttcctgaaac gcagatgtgc ctcgcgccgc 7200
actgctccga acaataaaga ttctacaata ctagctttta tggttatgaa gaggaaaaat 7260
tggcagtaac ctggccccac aaaccttcaa atgaacgaat caaattaaca accataggat 7320
gataatgcga ttagtttttt agccttattt ctggggtaat taatcagcga agcgatgatt 7380
tttgatctat taacagatat ataaatgcaa aaactgcata accactttaa ctaatacttt 7440
caacattttc ggtttgtatt acttcttatt caaatgtaat aaaagtatca acaaaaaatt 7500
gttaatatac ctctatactt taacgtcaag gagaaaaaac cccaagctct agctaagatc 7560
cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta tttatttttt 7620
tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt tttttctgta 7680
cagacgcgtg tacgcatgta acattatact gaaaaccttg cttgagaagg ttttgggacg 7740
ctcgaagatc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 7800
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 7860
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 7920
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 7980
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 8040
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 8100
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 8160
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 8220
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 8280
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 8340
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 8400
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 8460
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 8520
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 8580
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 8640
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 8700
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 8760
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 8820
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 8880
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 8940
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 9000
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 9060
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 9120
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 9180
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 9240
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 9300
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 9360
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 9420
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 9480
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 9540
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 9600
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 9660
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 9720
tccccgaaaa gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca 9780
acgcgagagc gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat 9840
gcaacgcgaa agcgctattt taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa 9900
atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca 9960
gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta 10020
caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct 10080
cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg 10140
ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt 10200
cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc 10260
cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt 10320
gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact 10380
acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta 10440
ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga 10500
gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac 10560
agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatat 10620
tttagtagct cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg 10680
cttttggttt tcaaaagcgc tctgaagttc ctatactttc tagagaatag gaacttcgga 10740
ataggaactt caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc 10800
acatacagct cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat atatatatac 10860
atgagaagaa cggcatagtg cgtgtttatg cttaaatgcg tacttatatg cgtctattta 10920
tgtaggatga aaggtagtct agtacctcct gtgatattat cccattccat gcggggtatc 10980
gtatgcttcc ttcagcacta ccctttagct gttctatatg ctgccactcc tcaattggat 11040
tagtctcatc cttcaatgct atcatttcct ttgatattgg atcatactaa gaaaccatta 11100
ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt c 11151
<210> 157
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-A13-F
<220>
<221> misc_feature
<222> (57)..(58)
<223> n is a, c, g, or t
<400> 157
ggagaaaaaa ccccggatcc atggccttga ctgaagagaa acctataagg ccaattnnka 60
atttcccacc ttctatttg 79
<210> 158
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-C260-F
<220>
<221> misc_feature
<222> (27)..(28)
<223> n is a, c, g, or t
<400> 158
catttgatat taagaaaaat gccccannkc tgagagatcg tatcgttgaa tgc 53
<210> 159
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-C260-R
<400> 159
catttttctt aatatcaaat gccttccacc 30
<210> 160
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-A291-F
<220>
<221> misc_feature
<222> (27)..(28)
<223> n is a, c, g, or t
<400> 160
caagagctag agtttttttc actaagnnkg ttgctgtgat aacacttatt g 51
<210> 161
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-A291-R
<400> 161
gaaaaaaact ctagctcttg aatac 25
<210> 162
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-M341-F
<220>
<221> misc_feature
<222> (26)..(27)
<223> n is a, c, g, or t
<400> 162
catgaagcct atttacaaat tattcnnkga tacctacaca gaaatg 46
<210> 163
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-M341-R
<400> 163
aatttgtaaa taggcttcat gtattc 26
<210> 164
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-M406-F
<220>
<221> misc_feature
<222> (31)..(32)
<223> n is a, c, g, or t
<400> 164
gttattatca ctggtggtgc aaacttgcta nnkactacct gttatctag 49
<210> 165
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-M406-R
<400> 165
gtttgcacca ccagtgataa taactacggg 30
<210> 166
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-M418-F
<220>
<221> misc_feature
<222> (27)..(28)
<223> n is a, c, g, or t
<400> 166
gttatctagg aatgagcgat attttcnnka aggaatcagt tgagtgggc 49
<210> 167
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-M418-R
<400> 167
cgctcattcc tagataacag gtag 24
<210> 168
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-F432-F
<220>
<221> misc_feature
<222> (24)..(25)
<223> n is a, c, g, or t
<400> 168
gggctgtatc tgctccgcct ttannkcgtt acagtggtat tctg 44
<210> 169
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-F432-R
<400> 169
ggcggagcag atacagccca ctcaac 26
<210> 170
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-G439-F
<220>
<221> misc_feature
<222> (27)..(28)
<223> n is a, c, g, or t
<400> 170
ctttattccg ttacagtggt attctgnnka ggagattaaa tgacctgatg 50
<210> 171
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-G439-R
<400> 171
gaataccact gtaacggaat aaag 24
<210> 172
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-SM-5'
<400> 172
gaaaaaaccc cggatccatg gccttgactg aagagaaac 39
<210> 173
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic, Primer ADS-SM-3'
<400> 173
ggttagagcg gatcttagct agcttagata gacatagggt aaac 44
<210> 174
<211> 546
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic, Artemisia annua Amorpha-4,11-diene Synthase A291V
mutant
<400> 174
Met Ala Leu Thr Glu Glu Lys Pro Ile Arg Pro Ile Ala Asn Phe Pro
1 5 10 15
Pro Ser Ile Trp Gly Asp Gln Phe Leu Ile Tyr Glu Lys Gln Val Glu
20 25 30
Gln Gly Val Glu Gln Ile Val Asn Asp Leu Lys Lys Glu Val Arg Gln
35 40 45
Leu Leu Lys Glu Ala Leu Asp Ile Pro Met Lys His Ala Asn Leu Leu
50 55 60
Lys Leu Ile Asp Glu Ile Gln Arg Leu Gly Ile Pro Tyr His Phe Glu
65 70 75 80
Arg Glu Ile Asp His Ala Leu Gln Cys Ile Tyr Glu Thr Tyr Gly Asp
85 90 95
Asn Trp Asn Gly Asp Arg Ser Ser Leu Trp Phe Arg Leu Met Arg Lys
100 105 110
Gln Gly Tyr Tyr Val Thr Cys Asp Val Phe Asn Asn Tyr Lys Asp Lys
115 120 125
Asn Gly Ala Phe Lys Gln Ser Leu Ala Asn Asp Val Glu Gly Leu Leu
130 135 140
Glu Leu Tyr Glu Ala Thr Ser Met Arg Val Pro Gly Glu Ile Ile Leu
145 150 155 160
Glu Asp Ala Leu Gly Phe Thr Arg Ser Arg Leu Ser Ile Met Thr Lys
165 170 175
Asp Ala Phe Ser Thr Asn Pro Ala Leu Phe Thr Glu Ile Gln Arg Ala
180 185 190
Leu Lys Gln Pro Leu Trp Lys Arg Leu Pro Arg Ile Glu Ala Ala Gln
195 200 205
Tyr Ile Pro Phe Tyr Gln Gln Gln Asp Ser His Asn Lys Thr Leu Leu
210 215 220
Lys Leu Ala Lys Leu Glu Phe Asn Leu Leu Gln Ser Leu His Lys Glu
225 230 235 240
Glu Leu Ser His Val Cys Lys Trp Trp Lys Ala Phe Asp Ile Lys Lys
245 250 255
Asn Ala Pro Cys Leu Arg Asp Arg Ile Val Glu Cys Tyr Phe Trp Gly
260 265 270
Leu Gly Ser Gly Tyr Glu Pro Gln Tyr Ser Arg Ala Arg Val Phe Phe
275 280 285
Thr Lys Val Val Ala Val Ile Thr Leu Ile Asp Asp Thr Tyr Asp Ala
290 295 300
Tyr Gly Thr Tyr Glu Glu Leu Lys Ile Phe Thr Glu Ala Val Glu Arg
305 310 315 320
Trp Ser Ile Thr Cys Leu Asp Thr Leu Pro Glu Tyr Met Lys Pro Ile
325 330 335
Tyr Lys Leu Phe Met Asp Thr Tyr Thr Glu Met Glu Glu Phe Leu Ala
340 345 350
Lys Glu Gly Arg Thr Asp Leu Phe Asn Cys Gly Lys Glu Phe Val Lys
355 360 365
Glu Phe Val Arg Asn Leu Met Val Glu Ala Lys Trp Ala Asn Glu Gly
370 375 380
His Ile Pro Thr Thr Glu Glu His Asp Pro Val Val Ile Ile Thr Gly
385 390 395 400
Gly Ala Asn Leu Leu Thr Thr Thr Cys Tyr Leu Gly Met Ser Asp Ile
405 410 415
Phe Thr Lys Glu Ser Val Glu Trp Ala Val Ser Ala Pro Pro Leu Phe
420 425 430
Arg Tyr Ser Gly Ile Leu Gly Arg Arg Leu Asn Asp Leu Met Thr His
435 440 445
Lys Ala Glu Gln Glu Arg Lys His Ser Ser Ser Ser Leu Glu Ser Tyr
450 455 460
Met Lys Glu Tyr Asn Val Asn Glu Glu Tyr Ala Gln Thr Leu Ile Tyr
465 470 475 480
Lys Glu Val Glu Asp Val Trp Lys Asp Ile Asn Arg Glu Tyr Leu Thr
485 490 495
Thr Lys Asn Ile Pro Arg Pro Leu Leu Met Ala Val Ile Tyr Leu Cys
500 505 510
Gln Phe Leu Glu Val Gln Tyr Ala Gly Lys Asp Asn Phe Thr Arg Met
515 520 525
Gly Asp Glu Tyr Lys His Leu Ile Lys Ser Leu Leu Val Tyr Pro Met
530 535 540
Ser Ile
545
<210> 175
<211> 585
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic, Artemisia annua Amorpha-4,11-diene Synthase A291C
mutant
<400> 175
Ala Arg Thr Glu Met Ile Ser Ile Ala Ala Asn Asn Ala Ala Met Arg
1 5 10 15
Pro His Ala Asp Ile Glu Asn Glu Ser Tyr Asn Thr His Ala Ser Glu
20 25 30
Ala Cys Met Thr Ala Asn Thr Met Ala Leu Thr Glu Glu Lys Pro Ile
35 40 45
Arg Pro Ile Ala Asn Phe Pro Pro Ser Ile Trp Gly Asp Gln Phe Leu
50 55 60
Ile Tyr Glu Lys Gln Val Glu Gln Gly Val Glu Gln Ile Val Asn Asp
65 70 75 80
Leu Lys Lys Glu Val Arg Gln Leu Leu Lys Glu Ala Leu Asp Ile Pro
85 90 95
Met Lys His Ala Asn Leu Leu Lys Leu Ile Asp Glu Ile Gln Arg Leu
100 105 110
Gly Ile Pro Tyr His Phe Glu Arg Glu Ile Asp His Ala Leu Gln Cys
115 120 125
Ile Tyr Glu Thr Tyr Gly Asp Asn Trp Asn Gly Asp Arg Ser Ser Leu
130 135 140
Trp Phe Arg Leu Met Arg Lys Gln Gly Tyr Tyr Val Thr Cys Asp Val
145 150 155 160
Phe Asn Asn Tyr Lys Asp Lys Asn Gly Ala Phe Lys Gln Ser Leu Ala
165 170 175
Asn Asp Val Glu Gly Leu Leu Glu Leu Tyr Glu Ala Thr Ser Met Arg
180 185 190
Val Pro Gly Glu Ile Ile Leu Glu Asp Ala Leu Gly Phe Thr Arg Ser
195 200 205
Arg Leu Ser Ile Met Thr Lys Asp Ala Phe Ser Thr Asn Pro Ala Leu
210 215 220
Phe Thr Glu Ile Gln Arg Ala Leu Lys Gln Pro Leu Trp Lys Arg Leu
225 230 235 240
Pro Arg Ile Glu Ala Ala Gln Tyr Ile Pro Phe Tyr Gln Gln Gln Asp
245 250 255
Ser His Asn Lys Thr Leu Leu Lys Leu Ala Lys Leu Glu Phe Asn Leu
260 265 270
Leu Gln Ser Leu His Lys Glu Glu Leu Ser His Val Cys Lys Trp Trp
275 280 285
Lys Ala Phe Asp Ile Lys Lys Asn Ala Pro Cys Leu Arg Asp Arg Ile
290 295 300
Val Glu Cys Tyr Phe Trp Gly Leu Gly Ser Gly Tyr Glu Pro Gln Tyr
305 310 315 320
Ser Arg Ala Arg Val Phe Phe Thr Lys Cys Val Ala Val Ile Thr Leu
325 330 335
Ile Asp Asp Thr Tyr Asp Ala Tyr Gly Thr Tyr Glu Glu Leu Lys Ile
340 345 350
Phe Thr Glu Ala Val Glu Arg Trp Ser Ile Thr Cys Leu Asp Thr Leu
355 360 365
Pro Glu Tyr Met Lys Pro Ile Tyr Lys Leu Phe Met Asp Thr Tyr Thr
370 375 380
Glu Met Glu Glu Phe Leu Ala Lys Glu Gly Arg Thr Asp Leu Phe Asn
385 390 395 400
Cys Gly Lys Glu Phe Val Lys Glu Phe Val Arg Asn Leu Met Val Glu
405 410 415
Ala Lys Trp Ala Asn Glu Gly His Ile Pro Thr Thr Glu Glu His Asp
420 425 430
Pro Val Val Ile Ile Thr Gly Gly Ala Asn Leu Leu Thr Thr Thr Cys
435 440 445
Tyr Leu Gly Met Ser Asp Ile Phe Thr Lys Glu Ser Val Glu Trp Ala
450 455 460
Val Ser Ala Pro Pro Leu Phe Arg Tyr Ser Gly Ile Leu Gly Arg Arg
465 470 475 480
Leu Asn Asp Leu Met Thr His Lys Ala Glu Gln Glu Arg Lys His Ser
485 490 495
Ser Ser Ser Leu Glu Ser Tyr Met Lys Glu Tyr Asn Val Asn Glu Glu
500 505 510
Tyr Ala Gln Thr Leu Ile Tyr Lys Glu Val Glu Asp Val Trp Lys Asp
515 520 525
Ile Asn Arg Glu Tyr Leu Thr Thr Lys Asn Ile Pro Arg Pro Leu Leu
530 535 540
Met Ala Val Ile Tyr Leu Cys Gln Phe Leu Glu Val Gln Tyr Ala Gly
545 550 555 560
Lys Asp Asn Phe Thr Arg Met Gly Asp Glu Tyr Lys His Leu Ile Lys
565 570 575
Ser Leu Leu Val Tyr Pro Met Ser Ile
580 585
<210> 176
<211> 585
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic, Artemisia annua Amorpha-4,11-diene Synthase A291I
mutant
<400> 176
Ala Arg Thr Glu Met Ile Ser Ile Ala Ala Asn Asn Ala Ala Met Arg
1 5 10 15
Pro His Ala Asp Ile Glu Asn Glu Ser Tyr Asn Thr His Ala Ser Glu
20 25 30
Ala Ile Met Thr Ala Asn Thr Met Ala Leu Thr Glu Glu Lys Pro Ile
35 40 45
Arg Pro Ile Ala Asn Phe Pro Pro Ser Ile Trp Gly Asp Gln Phe Leu
50 55 60
Ile Tyr Glu Lys Gln Val Glu Gln Gly Val Glu Gln Ile Val Asn Asp
65 70 75 80
Leu Lys Lys Glu Val Arg Gln Leu Leu Lys Glu Ala Leu Asp Ile Pro
85 90 95
Met Lys His Ala Asn Leu Leu Lys Leu Ile Asp Glu Ile Gln Arg Leu
100 105 110
Gly Ile Pro Tyr His Phe Glu Arg Glu Ile Asp His Ala Leu Gln Cys
115 120 125
Ile Tyr Glu Thr Tyr Gly Asp Asn Trp Asn Gly Asp Arg Ser Ser Leu
130 135 140
Trp Phe Arg Leu Met Arg Lys Gln Gly Tyr Tyr Val Thr Cys Asp Val
145 150 155 160
Phe Asn Asn Tyr Lys Asp Lys Asn Gly Ala Phe Lys Gln Ser Leu Ala
165 170 175
Asn Asp Val Glu Gly Leu Leu Glu Leu Tyr Glu Ala Thr Ser Met Arg
180 185 190
Val Pro Gly Glu Ile Ile Leu Glu Asp Ala Leu Gly Phe Thr Arg Ser
195 200 205
Arg Leu Ser Ile Met Thr Lys Asp Ala Phe Ser Thr Asn Pro Ala Leu
210 215 220
Phe Thr Glu Ile Gln Arg Ala Leu Lys Gln Pro Leu Trp Lys Arg Leu
225 230 235 240
Pro Arg Ile Glu Ala Ala Gln Tyr Ile Pro Phe Tyr Gln Gln Gln Asp
245 250 255
Ser His Asn Lys Thr Leu Leu Lys Leu Ala Lys Leu Glu Phe Asn Leu
260 265 270
Leu Gln Ser Leu His Lys Glu Glu Leu Ser His Val Cys Lys Trp Trp
275 280 285
Lys Ala Phe Asp Ile Lys Lys Asn Ala Pro Cys Leu Arg Asp Arg Ile
290 295 300
Val Glu Cys Tyr Phe Trp Gly Leu Gly Ser Gly Tyr Glu Pro Gln Tyr
305 310 315 320
Ser Arg Ala Arg Val Phe Phe Thr Lys Ile Val Ala Val Ile Thr Leu
325 330 335
Ile Asp Asp Thr Tyr Asp Ala Tyr Gly Thr Tyr Glu Glu Leu Lys Ile
340 345 350
Phe Thr Glu Ala Val Glu Arg Trp Ser Ile Thr Cys Leu Asp Thr Leu
355 360 365
Pro Glu Tyr Met Lys Pro Ile Tyr Lys Leu Phe Met Asp Thr Tyr Thr
370 375 380
Glu Met Glu Glu Phe Leu Ala Lys Glu Gly Arg Thr Asp Leu Phe Asn
385 390 395 400
Cys Gly Lys Glu Phe Val Lys Glu Phe Val Arg Asn Leu Met Val Glu
405 410 415
Ala Lys Trp Ala Asn Glu Gly His Ile Pro Thr Thr Glu Glu His Asp
420 425 430
Pro Val Val Ile Ile Thr Gly Gly Ala Asn Leu Leu Thr Thr Thr Cys
435 440 445
Tyr Leu Gly Met Ser Asp Ile Phe Thr Lys Glu Ser Val Glu Trp Ala
450 455 460
Val Ser Ala Pro Pro Leu Phe Arg Tyr Ser Gly Ile Leu Gly Arg Arg
465 470 475 480
Leu Asn Asp Leu Met Thr His Lys Ala Glu Gln Glu Arg Lys His Ser
485 490 495
Ser Ser Ser Leu Glu Ser Tyr Met Lys Glu Tyr Asn Val Asn Glu Glu
500 505 510
Tyr Ala Gln Thr Leu Ile Tyr Lys Glu Val Glu Asp Val Trp Lys Asp
515 520 525
Ile Asn Arg Glu Tyr Leu Thr Thr Lys Asn Ile Pro Arg Pro Leu Leu
530 535 540
Met Ala Val Ile Tyr Leu Cys Gln Phe Leu Glu Val Gln Tyr Ala Gly
545 550 555 560
Lys Asp Asn Phe Thr Arg Met Gly Asp Glu Tyr Lys His Leu Ile Lys
565 570 575
Ser Leu Leu Val Tyr Pro Met Ser Ile
580 585
Claims (33)
- (a) 숙주세포들의 대조군 집단에서 대조군 테르펜 합성효소 및 비교군 테르펜 합성효소를 발현시키는 단계로서, 상기 대조군 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환할 수 있고, 상기 비교군 테르펜 합성효소는 상기 폴리프레닐 디포스페이트를 두 번째 테르펜으로 전환할 수 있는 것인 단계;
(b) 숙주세포들의 테스트 집단에서 테스트 테르펜 합성효소 및 상기 비교군 테르펜 합성효소를 발현시키는 단계로서, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소의 변이체이고, 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환할 수 있고,
상기 비교군 테르펜 합성효소는 상기 테스트 집단 및 상기 대조군 집단에서 유사한 수준들로 발현되는 것인 단계; 및
(c) 상기 테스트 집단 및 상기 대조군 집단 모두에서 상기 첫 번째 테르펜 및 상기 두 번째 테르펜의 양을 측정하는 단계
를 포함하는, 테르펜 합성효소 변이체를 개선된 생체내 성능에 대해 테스트하는 방법. - 제1항에 있어서, 상기 테스트 집단은, (i) 상기 대조군 집단에서의 비율과 대비한 상기 테스트 집단에서 상기 두 번째 테르펜의 양 대비 상기 첫 번째 테르펜의 양의 비율의 증가; 또는 (ii) 상기 대조군 집단에서의 비율과 대비한 상기 테스트 집단에서 상기 첫 번째 테르펜의 양 대비 상기 두 번째 테르펜의 양의 비율의 감소에 의해, 상기 대조군 테르펜 합성효소와 대비하여 개선된 생체내 성능을 가지는 테르펜 합성효소 변이체를 포함하는 것으로서 확인되는 것인 방법.
- 제1항에 있어서, 상기 대조군 테르펜 합성효소, 비교군 테르펜 합성효소 및 테스트 테르펜 합성효소는 세스퀴테르펜 합성효소들이고, 상기 폴리프레닐 디포스페이트는 파네실 디포스페이트 (FPP)인 방법.
- 제3항에 있어서, 상기 비교군 테르펜 합성효소는 트리코디엔 합성효소인 방법.
- 제3항에 있어서, 상기 대조군 및 테스트 테르펜 합성효소는 파네센 합성효소 활성을 가지는 합성효소들인 방법.
- 제1항에 있어서, 상기 대조군 테르펜 합성효소, 비교군 테르펜 합성효소 및 테스트 테르펜 합성효소는 모노테르펜 합성효소들이고, 상기 폴리프레닐 디포스페이트는 게라닐 디포스페이트 (GPP)인 방법.
- 제1항에 있어서, 상기 숙주세포는 메발로네이트 (MEV) 경로의 하나 이상의 이종유래 효소들을 포함하는 것인 방법.
- 제7항에 있어서, 상기 MEV 경로의 하나 이상의 이종유래 효소들은 포스포메발로네이트 키나제(ERG8), 아세틸-조효소 A(CoA) 티올라제(ERG10), 메발로네이트 키나제(ERG12), 3-히드록시-3-메틸글루타릴 조효소 A(HMG-CoA) 합성효소(ERG13), 메발로네이트 피로포스페이트 탈탄산화효소(ERG19) 및 HMG-CoA 환원효소(HMG1)로 이루어진 그룹으로부터 선택되는 것인 방법.
- 제1항에 있어서, 상기 테스트 테르펜 합성효소는 상기 대조군 테르펜 합성효소와 1개 내지 10개의 아미노산들에 의해 서로 다른 것인 방법.
- 제2항에 있어서, 상기 두 번째 테르펜 대비 상기 첫 번째 테르펜의 비율은 적어도 1.3인 방법.
- 제1항에 있어서, 상기 테스트 테르펜 합성효소는 상기 테스트 집단에서, 상기 대조군 테르펜 합성효소가 상기 대조군 집단에서 발현되는 것과 유사한 수준으로 발현되는 것인 방법.
- 제1항에 있어서, 상기 대조군 집단 및 상기 테스트 집단에서, 상기 대조군 테르펜 합성효소의 코딩서열과 상기 테스트 테르펜 합성효소의 코딩서열은 동일하지만, 상기 대조군 테르펜 합성효소와 상기 테스트 테르펜 합성효소는 서로 다른 프로모터의 조절적 통제하에 있고 서로 다른 수준들로 발현되는 것인 방법.
- 제1항에 있어서, 상기 숙주 세포들의 집단은 효모 세포들의 집단인 방법.
- 숙주세포들의 단일 집단으로부터 유래한 두 개의 세포 소집단들을 포함하는 조성물로서,
(a) 첫 번째 소집단은 대조군 테르펜 합성효소 및 비교군 테르펜 합성효소를 포함하고, 상기 대조군 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환하고, 상기 비교군 테르펜 합성효소는 상기 폴리프레닐 디포스페이트를 두 번째 테르펜으로 전환하고;
(b) 두 번째 소집단은 테스트 테르펜 합성효소 및 상기 비교군 테르펜 합성효소를 포함하고, 상기 테스트 테르펜 합성효소는 폴리프레닐 디포스페이트를 첫 번째 테르펜으로 전환하며, 상기 대조군 테르펜 합성효소의 변이체이고, 상기 비교군 테르펜 합성효소는 상기 첫 번째 소집단 및 상기 두 번째 소집단에서 유사한 수준들로 발현되는 것인,
조성물. - 제14항에 있어서, 상기 두 번째 테르펜 대비 상기 첫 번째 테르펜의 비율이 상기 첫 번째 소집단에서의 비율과 대비하여 상기 두 번째 소집단에서 더 큰 것인 조성물.
- 제1항에 있어서, 상기 숙주세포들의 집단은 대장균 세포들의 집단인 방법.
- 제8항에 있어서, 상기 숙주세포는 이종유래 이소펜테닐 피로포스페이트 (IPP) 이성질화효소를 포함하는 것인 방법.
- 제8항에 있어서, 상기 숙주세포는 이종유래 FPP 합성효소를 포함하는 것인 방법.
- 제8항에 있어서, 상기 숙주세포는 이종유래 게라닐게라닐 피로포스페이트 (GGPP) 합성효소를 포함하는 것인 방법.
- 제19항에 있어서, 상기 대조군 테르펜 합성효소, 비교군 테르펜 합성효소 및 테스트 테르펜 합성효소는 디테르펜 합성효소들이고, 상기 폴리프레닐 디포스페이트는 게라닐게라닐 피로포스페이트 (GGPP)인 방법.
- 제3항에 있어서, 상기 대조군 테르펜 합성효소, 비교군 테르펜 합성효소 및 테스트 테르펜 합성효소는 각각 β-파네센 합성효소, α-파네센 합성효소, 트리코디엔 합성효소, 패추롤 합성효소, 아모파디엔 합성효소, 발렌센 합성효소, 파네솔 합성효소, 네로리돌 합성효소 및 누트카톤 합성효소로 이루어진 그룹으로부터 선택되는 것인 방법.
- 제1항에 있어서, 상기 대조군 테르펜 합성효소, 비교군 테르펜 합성효소 및 테스트 테르펜 합성효소는 각각 세스터테르펜 합성효소, 트리테르펜 합성효소, 테트라테르펜 합성효소 또는 폴리테르펜 합성효소인 방법.
- 제1항에 있어서, 상기 첫 번째 테르펜 또는 상기 두 번째 테르펜은 β-파네센, α-파네센, 트리코디엔, 패추롤, 아모파디엔, 발렌센, 파네솔, 네로리돌 및 누트카톤으로 이루어진 그룹으로부터 선택되는 것인 방법.
- 제1항에 있어서, 상기 첫 번째 테르펜 또는 상기 두 번째 테르펜은 리모넨 또는 마이어센인 방법.
- 제1항에 있어서, (e) (i) 상기 테스트 집단에서의 상기 첫 번째 테르펜의 양 및 상기 테스트 집단에서의 상기 두 번째 테르펜의 양을 (ii) 상기 대조군 집단에서의 상기 첫 번째 테르펜의 양 및 상기 대조군 집단에서의 상기 두 번째 테르펜의 양과 비교하는 단계를 추가로 포함하는 방법.
- 제25항에 있어서, 상기 비교 단계 (e)는 (i) 상기 테스트 집단에서의 상기 첫 번째 테르펜의 양과 (ii) 상기 테스트 집단에서의 상기 두 번째 테르펜의 양의 비율인 첫 번째 비율을, (i) 상기 대조군 집단에서의 상기 첫 번째 테르펜의 양과 (ii) 상기 대조군 집단에서의 상기 두 번째 테르펜의 양의 비율인 두 번째 비율과 비교하는 것인 방법.
- 제26항에 있어서, 상기 첫 번째 비율은 (ii) 상기 테스트 집단에서의 상기 두 번째 테르펜의 양 대비 (i) 상기 테스트 집단에서의 상기 첫 번째 테르펜의 양의 비율이고, 상기 두 번째 비율은 (ii) 상기 대조군 집단에서의 상기 두 번째 테르펜의 양 대비 (i) 상기 대조군 집단에서의 상기 첫 번째 테르펜의 양의 비율인 방법.
- 제14항에 있어서, 상기 대조군 테르펜 합성효소, 비교군 테르펜 합성효소 및 테스트 테르펜 합성효소는 세스퀴테르펜 합성효소들이고, 상기 폴리프레닐 디포스페이트는 파네실 디포스페이트 (FPP)인 조성물.
- 제14항에 있어서, 상기 대조군 및 테스트 테르펜 합성효소는 파네센 합성효소 활성을 가지는 합성효소들인 조성물.
- 제14항에 있어서, 상기 비교군 테르펜 합성효소는 트리코디엔 합성효소인 조성물.
- 제14항에 있어서, 상기 숙주세포는 메발로네이트 (MEV) 경로의 하나 이상의 이종유래 효소들을 포함하는 것인 조성물.
- 제31항에 있어서, 상기 MEV 경로의 하나 이상의 이종유래 효소들은 포스포메발로네이트 키나제(ERG8), 아세틸-조효소 A(CoA) 티올라제(ERG10), 메발로네이트 키나제(ERG12), 3-히드록시-3-메틸글루타릴 조효소 A(HMG-CoA) 합성효소(ERG13), 메발로네이트 피로포스페이트 탈탄산화효소(ERG19) 및 HMG-CoA 환원효소(HMG1)로 이루어진 그룹으로부터 선택되는 것인 조성물.
- 제14항에 있어서, 상기 숙주세포는 이종유래 FPP 합성효소를 포함하는 것인 조성물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161438948P | 2011-02-02 | 2011-02-02 | |
US61/438,948 | 2011-02-02 | ||
PCT/US2012/023446 WO2012106405A1 (en) | 2011-02-02 | 2012-02-01 | Methods of developing terpene synthase variants |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130110226A KR20130110226A (ko) | 2013-10-08 |
KR101420991B1 true KR101420991B1 (ko) | 2014-08-12 |
Family
ID=46577676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137023002A KR101420991B1 (ko) | 2011-02-02 | 2012-02-01 | 테르펜 합성효소 변이체들을 개발하는 방법들 |
Country Status (12)
Country | Link |
---|---|
US (2) | US8236512B1 (ko) |
EP (1) | EP2670846B1 (ko) |
JP (1) | JP5580488B2 (ko) |
KR (1) | KR101420991B1 (ko) |
CN (1) | CN103608454B (ko) |
AU (1) | AU2012212292B2 (ko) |
CA (1) | CA2826554C (ko) |
DK (1) | DK2670846T3 (ko) |
MX (1) | MX346518B (ko) |
SG (1) | SG192195A1 (ko) |
WO (1) | WO2012106405A1 (ko) |
ZA (1) | ZA201305797B (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7442785B2 (en) | 2003-07-24 | 2008-10-28 | The University Of Kentucky Research Foundation | Sesquiterpene synthase gene and protein |
US20140148622A1 (en) * | 2012-11-21 | 2014-05-29 | The Ohio State University | Engineering Plants to Produce Farnesene and Other Terpenoids |
ES2647828T3 (es) | 2013-03-14 | 2017-12-26 | Evolva, Inc. | Polipéptidos de valenceno sintasa, moléculas de ácido nucleico que los codifican y usos de los mismos |
EP3368542B1 (en) | 2015-10-29 | 2022-06-22 | Firmenich Incorporated | High intensity sweeteners |
CN106011178B (zh) * | 2016-07-14 | 2019-02-26 | 珀莱雅化妆品股份有限公司 | 一种利用糖高粱秆和甘蔗废渣发酵制备β-法呢烯的方法 |
CN106635853B (zh) * | 2016-12-28 | 2019-12-27 | 中国中医科学院中药研究所 | 产甘草次酸的重组酿酒酵母、其构建方法以及用途 |
CN108624610B (zh) * | 2017-03-23 | 2022-01-07 | 中国科学院分子植物科学卓越创新中心 | 拟南芥三烯甲素及其制备方法 |
SG11201910136RA (en) | 2017-05-03 | 2019-11-28 | Firmenich Incorporated | Methods for making high intensity sweeteners |
KR101971678B1 (ko) * | 2017-10-18 | 2019-04-23 | 한국생명공학연구원 | 신규한 세스퀴테르펜 신타아제 및 이를 이용한 세스퀴테르펜 생산방법 |
CN109722403B (zh) * | 2017-10-30 | 2020-12-04 | 中国石油化工股份有限公司 | 一种利用纤维素制备金合欢烯的工程菌株及方法 |
KR102022242B1 (ko) * | 2018-02-12 | 2019-09-18 | 대한민국 | 겨울 우산 버섯 유래 테르펜 합성효소 유전자 및 상기 유전자가 삽입된 돌연변이 효모의 형질전환체 |
KR101971976B1 (ko) * | 2018-02-12 | 2019-04-25 | 대한민국 | 겨울 우산 버섯 유래 테르펜 합성효소 유전자 및 상기 유전자가 삽입된 효모의 형질전환체 |
JP2021513846A (ja) * | 2018-02-14 | 2021-06-03 | ギンゴー バイオワークス, インコーポレイテッド | キメラテルペンシンターゼ |
WO2020081468A1 (en) | 2018-10-15 | 2020-04-23 | Amyris, Inc. | Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides |
WO2020092704A1 (en) * | 2018-10-31 | 2020-05-07 | Zymergen Inc. | Multiplexed deterministic assembly of dna libraries |
CN113631698A (zh) | 2019-01-24 | 2021-11-09 | 阿迈瑞斯公司 | 用于高效生成瑞鲍迪苷的abc转运蛋白 |
CN109666668B (zh) * | 2019-01-24 | 2022-04-15 | 天津大学 | 一种小萼苔倍半萜合成酶MTa及其基因序列 |
CN109837266B (zh) * | 2019-01-24 | 2021-12-31 | 天津大学 | 一种小萼苔倍半萜合成酶MTc及其基因序列 |
KR102176556B1 (ko) * | 2019-07-31 | 2020-11-09 | 한국화학연구원 | 스쿠알렌 생산이 증대된 균주 및 이를 이용한 스쿠알렌 생산방법 |
NL2030206B1 (en) * | 2021-10-25 | 2023-05-16 | Sestina Bio Llc | Heterologous expression of enzymes for increased b-farnesene production |
CN114181964B (zh) * | 2021-11-02 | 2023-06-09 | 云南大学 | 一种表达盒组合、重组载体和重组酿酒酵母及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080171378A1 (en) * | 2004-07-27 | 2008-07-17 | Keasling Jay D | Genetically Modified Host Cells And Use Of Same For Producing Isoprenoid Compounds |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020035058A1 (en) * | 1996-05-15 | 2002-03-21 | The University Of Sheffield | Isopentenyl pyrophosphate isomerase (IPI) and/or prenyl transferase inhibitors |
US7927794B2 (en) | 2003-09-29 | 2011-04-19 | The Regents Of The University Of California | Methods for identifying a biosynthetic pathway gene product |
US20090053797A1 (en) * | 2005-08-19 | 2009-02-26 | Yoichiro Shiba | Genetically modified host cells and use of same for producing isoprenoid compounds |
WO2008133658A2 (en) * | 2006-11-21 | 2008-11-06 | Amyris Biotechnologies, Inc. | Jet fuel compositions and methods of making and using same |
AU2009240505B2 (en) | 2008-04-23 | 2013-09-05 | Danisco Us Inc. | Isoprene synthase variants for improved microbial production of isoprene |
-
2012
- 2012-02-01 JP JP2013552590A patent/JP5580488B2/ja active Active
- 2012-02-01 SG SG2013057518A patent/SG192195A1/en unknown
- 2012-02-01 US US13/363,588 patent/US8236512B1/en active Active
- 2012-02-01 WO PCT/US2012/023446 patent/WO2012106405A1/en active Application Filing
- 2012-02-01 CA CA2826554A patent/CA2826554C/en active Active
- 2012-02-01 MX MX2013008903A patent/MX346518B/es active IP Right Grant
- 2012-02-01 EP EP12742056.0A patent/EP2670846B1/en active Active
- 2012-02-01 KR KR1020137023002A patent/KR101420991B1/ko active IP Right Grant
- 2012-02-01 AU AU2012212292A patent/AU2012212292B2/en active Active
- 2012-02-01 DK DK12742056.0T patent/DK2670846T3/en active
- 2012-02-01 CN CN201280011458.6A patent/CN103608454B/zh active Active
- 2012-07-05 US US13/542,491 patent/US20120270260A1/en not_active Abandoned
-
2013
- 2013-07-31 ZA ZA2013/05797A patent/ZA201305797B/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080171378A1 (en) * | 2004-07-27 | 2008-07-17 | Keasling Jay D | Genetically Modified Host Cells And Use Of Same For Producing Isoprenoid Compounds |
Non-Patent Citations (2)
Title |
---|
Chemistry & Biology, 13권, 91-98면(2006.01.) * |
Chemistry & Biology, 13권, 91-98면(2006.01.)* |
Also Published As
Publication number | Publication date |
---|---|
JP5580488B2 (ja) | 2014-08-27 |
AU2012212292B2 (en) | 2014-02-06 |
US20120196315A1 (en) | 2012-08-02 |
CA2826554C (en) | 2015-03-31 |
US8236512B1 (en) | 2012-08-07 |
ZA201305797B (en) | 2014-04-30 |
SG192195A1 (en) | 2013-09-30 |
EP2670846B1 (en) | 2015-08-19 |
KR20130110226A (ko) | 2013-10-08 |
DK2670846T3 (en) | 2015-12-07 |
MX346518B (es) | 2017-03-23 |
CN103608454B (zh) | 2015-05-20 |
AU2012212292A1 (en) | 2013-08-15 |
US20120270260A1 (en) | 2012-10-25 |
CN103608454A (zh) | 2014-02-26 |
WO2012106405A1 (en) | 2012-08-09 |
EP2670846A4 (en) | 2014-01-01 |
EP2670846A1 (en) | 2013-12-11 |
JP2014505481A (ja) | 2014-03-06 |
MX2013008903A (es) | 2013-12-06 |
CA2826554A1 (en) | 2012-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101420991B1 (ko) | 테르펜 합성효소 변이체들을 개발하는 방법들 | |
DK2855662T3 (en) | RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
AU2019202844B2 (en) | Inducible coexpression system | |
KR20140015136A (ko) | 3-히드록시프로피온산 및 다른 생성물의 제조 방법 | |
CA2834053C (en) | Yeast strains engineered to produce ethanol from glycerol | |
KR20120136349A (ko) | 고가의 화학적 생성물의 미생물 생산, 및 관련 조성물, 방법 및 시스템 | |
CA2763792C (en) | Expression cassettes derived from maize | |
KR20130027063A (ko) | Fe-s 클러스터 요구성 단백질의 활성 향상 | |
ES2379368T3 (es) | Método para aumentar la producción de compuestos isoprenoides | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
TW201111512A (en) | Improved isoprene production using the DXP and MVA pathway | |
CN111465689B (zh) | Cas9变体和使用方法 | |
KR20150014953A (ko) | 케톨-산 리덕토아이소머라아제 효소 및 사용 방법 | |
KR20110020234A (ko) | 이소프렌의 미생물에 의한 개선된 생성을 위한 이소프렌 신타아제 변이체 | |
KR20100037031A (ko) | 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
DK2768848T3 (en) | METHODS AND PROCEDURES FOR EXPRESSION AND SECRETARY OF PEPTIDES AND PROTEINS | |
KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
JP2024037919A (ja) | モルフィナンアルカロイドおよび誘導体を生成する方法 | |
KR20230111189A (ko) | 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170629 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20190627 Year of fee payment: 6 |