KR20230154261A

KR20230154261A - N-연결된 글리코실화가 없거나 감소된 외인성 단백질의 생산을 위한 유전적으로 변형된 사상 진균

Info

Publication number: KR20230154261A
Application number: KR1020237034361A
Authority: KR
Inventors: 로넨 첼렛; 마크 아론 에말팝; 마리 마키넨; 마르쿠 살로헤이모
Original assignee: 다이아딕 인터내셔널 (유에스에이), 인크.
Priority date: 2021-03-11
Filing date: 2022-03-10
Publication date: 2023-11-07
Also published as: WO2022190022A1; JP2024509895A; BR112023018120A2; EP4291632A1; CN117377752A

Abstract

stt3 및/또는 cw13 db 유전자의 결실 또는 파괴를 포함하는, 포유동물 단백질의 N-글리칸이 감소되어 있거나 없는 단백질을 생산하도록 유전적으로 변형된 자낭균류 사상 진균이 제공된다.

Description

N-연결된 글리코실화가 없거나 감소된 외인성 단백질의 생산을 위한 유전적으로 변형된 사상 진균

본 발명은 STT3 및/또는 CWH8 단백질의 발현 및/또는 활성이 감소된, 유전적으로 변형된 자낭균류 사상 진균(genetically-modified ascomycetous filamentous fungi)에 관한 것이다. 유전적으로 변형된 사상 진균은 N-연결된 글리코실화가 부분적이거나 없는 재조합 단백질(recombinant protein)의 견고한 생산을 위해 사용된다.

해독후 단백질 변형(post-translational protein modification), 예를 들면, 글리코실화(glycosylation) 또는 인산화(phosphorylation)를 갖는 재조합 단백질의 발현 및 정제는 단지 진핵 발현 시스템을 사용하여 달성될 수 있다. 진핵세포 단백질 발현 시스템, 예를 들면, 포유동물 및 곤충 세포주, 식물 및 진균은 기능성 진핵세포 단백질의 생산을 위해 필수적으로 되어 왔다.

진핵세포 유기체로서, 효모 및 진균은 해독후 변형, 예를 들면, N- 및 O-글리코실화를 수행할 수 있지만, 효모 및 진균에서 단백질 글리코실화는 포유동물 세포에서의 것과는 상이하다. 이러한 문제점을 극복하기 위하여, N-글리코실화 경로를 재가공할 가능성이 특히 이종 단백질의 생산에 가장 흔히 사용된 종(예컨대, 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris), 야로위아 리폴리티카(Yarrowia lipolytica), 한세눌라 폴리모르파(Hansenula polymorpha), 및 아스퍼길러스(Aspergillus) 및 트리초데르마(Trichoderma) 종)에서 탐구되어 왔다.

문헌: Parsaie Nasab et al., (2013, Appl Environ Microbiol., 79(3): 997-1007)은 에스. 세레비지아에(S. cerevisiae)에서 사람 N-글리칸을 수반하는 재조합 단백질을 생산하기 위한 합성 N-글리코실화 경로를 기술하고 있다. 파르사이에 나삽(Parsaie Nasab) 등에 의한 연구는 또한 US 2011/0207214에 기술되어 있으며, 이는 ER 막에서 지질-연결된 올리고사카라이드(lipid-linked oligosaccharide; LLO) 플립파제(flippase) 활성을 발현시키기 위해 변형시킨 세포를 개시하고 있다. 플립파제는 ER의 사이토졸 측면(cytosolic side)에서 내강 측면(luminal side)으로 1, 2, 또는 3개의 만노스를 함유하는 LLO의 플립핑(flipping)을 가능하도록 한다. 이러한 연구는 문헌: De Wachter et al., (2018, Engineering of Yeast Glycoprotein Expression. In: Advances in Biochemical Engineering/Biotechnology. Springer, Berlin, Heidelberg)에서의 다른 관련된 연구와 함께 추가로 고찰되고 있다.

미국 특허 제7,029,872호, 미국 특허 제7,326,681호, 미국 특허 제7,629,163호, 및 미국 특허 제7,981,660호는 사람에서 당단백질의 공정을 모사(mimic)하는, 효소 반응의 순서를 세포가 수행하도록 하는 유전적으로 변형된 글리코실화 경로를 갖는 세포주를 개시하고 있다. 진핵세포, 예를 들면, 높은 만노스-함유 N-글리칸을 흔히 생산하는, 단세포 및 다세포 진균은 변형되어 사람 글리코실화 경로를 따라 N-글리칸, 예를 들면, Man₅GlcNAc₂ 또는 다른 구조를 생산한다.

미국 특허 제9,359,628호는 보다 작은 글리칸을 지닌 단백질을 생산할 수 있는 피치아의 유전적으로 가공된 균주를 개시하고 있다. 특히, 유전적으로 가공된 균주는 α-1,2-만노시다제 및 글루코시다제 중 어느 하나 또는 둘 다를 발현할 수 있다. 유전적으로 가공된 균주는 추가로 변형시켜 OCH1 유전자가 파괴되도록 할 수 있다. 이러한 유전적으로 가공된 피치아 균주를 사용하여 보다 작은 글리칸을 지닌 당단백질을 생산하는 방법이 또한 제공된다.

본 발명의 출원인에 대한 미국 특허 제8,268,585호 및 미국 특허 제8,871,493호는 이종 단백질 또는 폴리펩타이드를 발현 및 분비하기 위한 사상 진균 숙주 분야에서의 형질전환 시스템을 개시하고 있다. 또한 폴리펩타이드 또는 단백질을 경제적인 방식으로 다량 생산하는 공정이 개시되어 있다. 시스템은 크리소스포리움(Chrysosporium), 보다 특히 크리소스포리움 루크노웬세(Chrysosporium lucknowense) 속의 형질전환되거나 형질감염된 진균 균주 및 이의 돌연변이체 또는 유도체를 포함한다. 또한 크리소스포리움(Chrysosporium) 암호화 서열을 함유하는 형질전환체 뿐만 아니라, 크리소스포리움 유전자의 발현-조절 서열을 함유하는 형질전환체가 또한 개시되어 있다.

써모텔로마이세스 헤테로탈리카(Thermothelomyces heterothallica)(Th. 헤테로탈리카(Th. heterothallica)) 균주 C1(최근에 마이셀리오프토라 써모필라(Myceliophthora thermophila)로부터 재명명되었고, 이는 크리소스포리움 루크노웬세로부터 재명명되었다)은 고 수준의 셀룰라제를 생산하는 열-내성 자낭균류 사상 진균이며, 이러한 셀룰라제는 상기 균주가 이러한 및 다른 효소를 상업적 규모로 생산하는데 매력적이도록 한다.

야생형 C1은 부다페스트 조약(Budapest Treaty)에 따라 1996년 8월 29일의 기탁일에, 제VKM F-3500 D호로 기탁되었다. 고 셀룰라제(High Cellulase; HC) 및 저 셀룰라제(Low Cellulase; LC) 균주는 또한 예를 들면, 미국 특허 제8,268,585호에 기술된 바와 같이, 기탁되었다.

미국 특허 제9,695,454호는 감소된 프로테아제 활성을 가지고 푸코실화 경로를 발현하는, 사상 진균 세포, 예를 들면, 트리초데르마 진균 세포를 포함하는 조성물을 개시하고 있다. 또한 발현 시스템으로서, 유전적으로 변형된 사상 진균 세포, 예를 들면, 트리초데르마 진균 세포를 사용하여, 푸코실화된 N-글리칸을 갖는 당단백질을 생산하는 방법을 기술하고 있다.

미국 특허 제7,449,308호 및 미국 특허 제7,935,513호는 글리코실트랜스퍼라제, 당 트랜스포터(sugar transporter) 및 만노시다제의 세트의 이종 발현에 의해 변형되어 포유동물, 예컨대, 사람 치료학적 당단백질을 생산하기 위한 숙주-균주가 될 수 있도록 하는 변형된 올리고사카라이드를 갖는 진핵 숙주 세포를 개시하고 있다. 가공된 숙주 세포에서 제조된 N-글리칸은 Man₅GlcNAc₂ 코어 구조를 가지고 이는 이후에 하나 이상의 효소, 예컨대, 글리코실트랜스퍼라제, 당 트랜스포터 및 만노시다제의 이종 발현에 의해 추가로 변형되어 사람-유사 당단백질을 생성할 수 있다.

미국 특허 제8,268,585호 및 미국 특허 제8,871,493호는 이종 단백질 또는 폴리펩타이드를 발현 및 분비하기 위한 사상 진균 숙주 분야에서의 형질전환을 개시하고 있다. 또한 다량의 폴리펩타이드 또는 단백질을 경제적인 방식으로 생산하는 공정을 개시하고 있다. 시스템은 크리소스포리움, 보다 특히 크리소스포리움 루크노웬세 속의 형질전환되거나 형질감염된 진균 균주 및 이의 돌연변이체 또는 유도체를 포함한다. 또한 크리소스포리움 암호화 서열, 뿐만 아니라 크리소스포리움 유전자의 발현-조절 서열을 함유하는 형질전환체가 개시되어 있다.

미국 특허 제9,175,296호는 크리소스포리움 루크노웬세의 진균 숙주 균주를 개시하고 있다. 또한 순도가 75% 초과인 순수한 단백질의 동종 및/또는 이종 생산 방법, 인공 단백질 혼합물을 생산하는 방법 및 목적한 효소를 기능적으로 발현하는 균주의 단순화된 스크리닝(screening)을 위한 방법이 개시되어 있다. 미국 특허 제9,175,296호는 또한 크리소스포리움 루크노웬세(최근에 써모텔로마이세스 헤테로탈리카(써모텔로마이세스 헤테로탈리카)로 재명명됨)에서 유전자 발현의 전사 제어에 적합한 단리된 프로모터 서열 및 크리소스포리움루크노웬세의 진균 숙주 균주를 단리하는 방법을 개시하고 있으며, 여기서 프로테아제 분비는 크리소스포리움루크노웬세 균주 UV 18-25의 프로테아제 분비의 20% 미만이다.

N-연결된 글리코실화가 부분적이거나 없는 단백질을 고 수율로 생산함으로써, 단백질이 다양한 산업적 및 약제학적 용도에 적합하도록 할 수 있는 재조합 단백질의 생산을 위한 발현 시스템에 대한 요구가 존재한다.

발명의 요약

본 발명은 포유동물 단백질의 n-글리칸 변형이 감소되어 있거나 없는 단백질을 생산하도록 유전적으로 변형시킨, 유전적으로 변형된 자낭균류 사상 진균을 제공한다. 특히, 본 발명은 N-글리칸 변형이 감소되어 있거나 없는 재조합 단백질을 생산하도록 유전적으로 변형시킨 예시적인 자낭균류 사상 진균으로서 써모텔로마이세스 헤테로탈리카(Thermothelomyces heterothallica) 균주 C1을 제공한다. 일부 구현예에서, 본원에 개시된 진균은 stt3 및/또는 cwh8 유전자가 결여되도록 변형되었다.

본 발명은 부분적으로 본원에 개시된 바와 같은 써모텔로마이세스 헤테로탈리카가 변형되지 않은 균주와 비교하여 글리칸이 감소되어 있거나 없는 단백질을 생산한다는 발견을 기반으로 한다. 이는 수득된 N-글리칸내에 큰 변이(variation)를 지닌 단백질을 생산하는, 지금까지 기술된 발현 시스템과는 대조적이다.

유리하게는, 본 발명의 변형된 자낭균류 사상 진균 세포는 부분적인 해독 후 변형(post-translational modification)을 갖는 이종 단백질의 생산을 가능하도록 한다. 이러한 단백질은 다양한 적용에 사용될 수 있으며, 여기서 완전히 글리코실화된 단백질은 이에 적합하지 않다. 예를 들면, 단백질은 목적한 용해도 및/또는 생물학적 활성을 위해 설계될 수 있다. N-글리칸의 양이 감소된 단백질은 완전히 글리코실화된 단백질과 비교하여 감소된 면역원성을 나타낼 수 있다. 본 발명의 부분적으로 N-글리코실화된 단백질은 추가의 또는 다른 단백질 변형을 위한 1차 물질로서 사용될 수 있다. 또한, 비-N-글리코실화된 단백질은 약동학/약력한 연구에서 다양한 글리코실화된 형태 및 혼합물을 위한 잠재적인 제어 단백질로서 사용될 수 있다. 더욱이, 본원에 기술된 부분적인 글리코실화된 단백질은, 치료학적 효과가 흔히 N-글리코실화에 의존하므로, 천연적으로 글리코실화된 단백질과 비교하여 상이한 치료학적 효과를 가질 수 있다.

유리하게는, 본 발명의 변형된 자낭균류 사상 진균 세포는 고 수율 및 안정성을 지닌 단백질을 생산한다. 본 발명의 써모텔로마이세스 헤테로탈리카 세포를 사용하여 수득된 단백질 수준는 포유동물 세포, 예를 들면, CHO 세포, 또는 효모를 사용하여 수득된 것보다 훨씬 더 높다.

따라서, 본 발명은 약제 및 비-약제 산업에서 다양한 용도에 적합한, N-글리칸이 감소되거나 없는 진핵세포 재조합 단백질을 생산하기 위한 효율적인 시스템을 제공한다.

일 양태에 따라서, 본 발명은 N-연결된 글리코실화가 감소되어 있거나 없는 목적한 단백질을 생산할 수 있는 유전적으로 변형된 자낭균류 사상 진균을 제공하며, 이러한 유전적으로 변형된 사상 진균은 STT3 및/또는 CWH8의 발현 및/또는 활성이 감소된 적어도 하나의 세포를 포함한다.

일부 구현예에 따라서, 적어도 하나의 세포는 목적한 단백질을 암호화(encoding)하는 적어도 하나의 외인성 폴리뉴클레오타이드를 포함한다.

일부 구현예에 따라서, 적어도 하나의 세포는 STT3의 감소된 발현 및/또는 활성을 갖는다.

일부 구현예에 따라서, STT3은 써모텔로마이세스 헤테로탈리카 STT3의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성(identity)을 갖는 아미노산 서열을 포함한다. 특정의 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 STT3은 서열 번호: 27의 아미노산을 포함한다.

일부 구현예에 따라서, 적어도 하나의 세포는 CWH8의 감소된 발현 및/또는 활성을 갖는다.

일부 구현예에 따라서, CWH8은 써모텔로마이세스 헤테로탈리카 CWH8의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성을 갖는 아미노산 서열을 포함한다. 특정의 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 CWH8은 서열 번호: 28의 아미노산을 포함한다.

일부 구현예에 따라서, 변형된 사상 진균은 STT3 및 CWH8 단백질의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함한다.

일부 구현예에 따라서, 유전적 변형은 stt3 유전자의 결실 또는 파괴를 포함한다. 일부 구현예에 따라서, 유전적 변형은 stt3 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 올리고사카릴트랜스퍼라제(올리고사카릴트랜스퍼라제; OST) 복합체의 촉매분해적 소단위(subunit)를 감소된 양으로 생산하도록 한다. 일부 구현예에 따라서, 유전적 변형은 stt3 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 올리고사카릴트랜스퍼라제(OST) 복합체의 촉매분해적 양을 생산하지 못하도록 한다.

일부 구현예에 따라서, 유전적 변형은 cwh8 유전자의 결실 또는 파괴를 포함한다. 일부 구현예에 따라서 유전적 변형은 cwh8 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 기능적 돌리칠(functional dolichyl) 피로포스페이트 포스파타제를 감소된 양으로 생산하도록 한다. 일부 구현예에 따라서, 유전적 변형은 cwh8 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 기능적 돌리칠 피로포스페이트 포스파타제를 생산하지 못하도록 한다.

일부 구현예에 따라서, 변형된 사상 진균은 감소된 양의 N-연결된 글리코실화를 지닌 단백질을 발현한다. 특정의 구현예에 따라서, 변형된 사상 진균은 변형되지 않은 진균과 비교하여 20% 미만의 N-연결된 글리코실화를 지닌 단배질을 발현한다. 추가의 구현예에 따라, 변형된 사상 진균은 N-연결된 글리코실화가 없는 단백질을 발현한다.

일부 구현예에 따라서, 자낭균류 사상 진균은 페지조마이코티나(Pezizomycotina) 그룹 내의 속(genus)의 것이다.

일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스(Thermothelomyces), 마이셀리오프토라(Myceliophthora), 트리초데르마(Trichoderma), 아스퍼길러스(Aspergillus), 페니실리움(Penicillium), 라삼소니아(Rasamsonia), 크리소스포리움(Chrysosporium), 코리나스쿠스(Corynascus), 푸사리움(Fusarium), 뉴로스포라(Neurospora), 및 탈라로마이세스(Talaromyces)로 이루어진 그룹으로부터 선택된 속의 것이다.

일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스 헤테로탈리카(또한 마이셀리오프토라 써모필라(Myceliophthora thermophila)로서 나타냄), 마이셀리오프토라 루테아(Myceliophthora lutea), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 푸니쿨로수스(Aspergillus funiculosus), 아스퍼길러스 니거(Aspergillus niger), 아스퍼길러스 오리자에(Aspergillus oryzae), 트리초데르마 레에세이(Trichoderma reesei), 트리초데르마 하르지아눔(Trichoderma harzianum), 트리초데르마 론기브라티아툼(Trichoderma longibrachiatum), 트리초데르마 비리데(Trichoderma viride), 라삼소니아 에메르소니이(Rasamsonia emersonii), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 베루코숨(Penicillium verrucosum), 스포로트리쿰 써모필레(Sporotrichum thermophile), 코리나스쿠스 푸미몬타누스(Corynascus fumimontanus), 코리나스쿠스 써모필루스(Corynascus thermophilus), 크리소스포리움 루크노웬세, 푸사리움 그라미네룸(Fusarium graminearum), 푸사리움 베네나툼(Fusarium venenatum), 뉴로스포라 크라싸(Neurospora crassa), 및 탈라로마이세스 피니틸루스(Talaromyces piniphilus)로 이루어진 그룹으로부터 선택된 종(species)의 것이다.

일부 구현예에 따라서, 자낭균류 사상 진균은 서열 번호: 29에 제시된 핵산 서열에 대해 적어도 95%, 또는 적어도 96%, 또는 적어도 97%, 또는 적어도 98%, 또는 적어도 99% 또는 100% 동일성을 갖는 rDNA 서열을 포함하는 써모텔로마이세스 헤테로탈리카 균주이다.

일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스 헤테로탈리카이다. 일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스 헤테로탈리카 C1이다.

일부 구현예에서, C1은 다음으로 이루어진 그룹으로부터 선택된다: W1L#100I(prt-△alp1△chi1△alp2△pyr5) 기탁 번호 제CBS141153호, UV18-100f (prt-△alp1,△pyr5) 기탁 번호 제CBS141147호, W1L#100I(prt-△alp1△chi1△pyr5) 기탁 번호 제CBS141149호, 및 UV18-100f(prt-△alp1△pep4△alp2△prt1△pyr5) 기탁 번호 제CBS141143호 및 이의 유도체. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.

일부 구현예에 따라서, 목적한 단백질은 효소, 구조 단백질, 백신 항원 및 이의 구성성분으로 이루어진 그룹으로부터 선택된다.

일부 구현예에 따라서, 목적한 단백질은 분비된 단백질이다. 특정의 구현예에 따라서, 목적한 단백질은 리더 펩타이드이다. 다른 구현예에 따라서, 목적한 단백질은 세포내 단백질이다. 특정의 구현예에서, 세포내 단백질은 막 또는 소낭 결합된 단백질이다.

일부 구현예에 따라서, 목적한 단백질은 항체 또는 이의 단편이다. 특정의 구현예에 따라서, 항체는 IgG4 또는 IgG1이다. 추가의 구현예에 따라서, 항체는 이중-특이적(bi-specific) 또는 다중 특이적(multi specific) 항체이다.

일부 구현예에 따라서, 목적한 단백질은 치료학적 단백질이다.

일부 구현예에 따라서, 목적한 단백질은 백신 단백질 항원이다.

목적한 단백질을 암호화하는 폴리뉴클레오타이드는 DNA 작제물 또는 발현 벡터의 부분을 형성할 수 있다.

일부 구현예에 따라서, 적어도 하나의 외인성 폴리뉴클레오타이드는 상기 자낭균류 사상 진균에서 작동가능한 적어도 하나의 조절 성분을 추가로 포함하는 DNA 작제물 또는 발현 벡터이다. 특정의 구현예에 따라서, 조절 성분은 상기 진균에 대해 내인성인 조절 성분 및 상기 진균에 대해 이종인 조절 성분으로 이루어진 그룹으로부터 선택된다.

일부 구현예에 따라서, 유전적으로 변형된 자낭균류 사상 진균은 분비된 단백질을 생산하도록 설계된다.

일부 구현예에서, 본 발명에 따른 자낭균류 사상 진균은 유전적으로 변형되어 항체를 발현한다.

일부 구현예에서, 자낭균류 사상 진균은 내인성 프로테아제를 암호화하는 하나 이상의 유전자를 결실하도록 추가로 변형된 균주이다.

일부 구현예에 따라서, 유전적으로 변형된 자낭균류 사상 진균은 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 또는 14개의 프로테아제의 감소된 발현 및/또는 활성을 가진 적어도 하나의 세포를 포함한다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다. 특정의 구현예에 따라서, 변형된 사상 진균은 적어도 9, 10, 11, 12, 13, 또는 14개의 프로테아제의 감소된 발현 및/또는 활성을 가진 적어도 하나의 세포를 포함한다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.

다른 양태에 따라서, 본 발명은:

(a) 자낭균류 사상 진균의 STT3 단백질의 발현 및/또는 활성을 감소시키는 단계; 및/또는

(b) 자낭균류 사상 진균의 CHW8 단백질의 발현 및/또는 활성을 감소시키는 단계를 포함하여, N-연결된 글리코실화가 감소되어 있거나 없는 단백질을 생산할 수 있는 자낭균류 사상 진균을 생성하기 위한 방법을 제공한다.

일부 구현예에 따라서, 방법은:

(a) 자낭균류 사상 진균의 stt3 유전자를 결실시키거나 파괴함으로써 올리고사카릴트랜스퍼라제(OST) 복합체(complex)의 기능적 촉매분해 소단위(functional catalytic subunit)의 생산을 감소시키는 단계; 및/또는

(b) 자낭균류 사상 진균의 chw8 유전자를 결실시키거나 파괴함으로써 기능적 돌리칠 피로포스페이트 포스파타제의 생산을 감소시키는 단계를 포함한다.

일부 구현예에 따라서, 진균은 올리고사카릴트랜스퍼라제(OST) 복합체의 기능적 촉매분해 소단위를 생산하지 못한다.

일부 구현예에 따라서, 진균은 기능적 돌리칠 피로포스페이트 포스파타제를 생산하지 못한다.

일부 구현예에 따라서, 진균은 올리고사카릴트랜스퍼라제(OST) 복합체 및 기능적 돌리칠 피로포스페이트 포스파타제의 기능적 촉매분해 소단위를 생산하지 못한다.

일부 구현예에 따라서, 방법은 목적한 이종 단백질을 암호화하는 외인성 폴리뉴클레오타이드를 자낭균류 사상 진균 내로 도입시킴으로써 진균 내에서 N-글리칸이 감소되어 있거나 없는 이종 단백질을 발현시키는 단계를 추가로 포함한다.

다른 양태에 따라서, 본 발명은 N-글리칸 변형이 감소되어 있거나 없는 이종 단백질을 생산하기 위한 방법을 제공하고, 이러한 방법은:

(i) 본원에 기술된 바와 같은 STT3 및/또는 CWH8의 발현 및/또는 활성이 감소되어 있고 본 발명에 따른 목적한 단백질을 암호화하는 적어도 하나의 외인성 폴리뉴클레오타이드를 갖는 적어도 하나의 세포를 포함하는 유전적으로 변형된 자낭균류 사상 진균을 제공하는 단계;

(ii) 자낭균류 사상 진균을 단백질을 발현하기에 적합한 조건 하에서 배양하는 단계; 및

(iii) 단백질을 회수하는 단계를 포함한다.

일부 구현예에서, 단백질은 자낭균류 사상 진균 내에서 재조합적으로 발현된 이종의 포유동물 단백질이다. 일부 특수한 구현예에서, 단백질은 자낭균류 사상 진균에서 재조합적으로 발현된 사람 단백질이다. 다른 구현예에서, 단백질은 자낭균류 사상 진균 내에서 재조합적으로 발현된 반려 및/또는 농장 동물의 단백질이다.

추가의 양태에 따라서, 본 발명은 본 발명에 따라 유전적으로 변형된 자낭균류 사상 진균에 의해 생산된 재조합 단백질을 제공한다.

일부 구현예에서, 본 발명에 따라 유전적으로 변형된 자낭균류 사상 진균에 의해 생산된 재조합 단백질은 약제학적 등급의 단백질이다.

추가의 구현예에 따라서, 본 발명은 적어도 하나의 목적한 단백질을 생산하는 방법을 제공하고, 이러한 방법은 본원에 기술된 바와 같은 유전적으로 변형된 진균을 적합한 배지 속에서 배양하는 단계; 및 적어도 하나의 단백질 생성물을 회수하는 단계를 포함한다.

일부 구현예에 따라서, 회수하는 단계는 성장 배지로부터, 진균 덩어리로부터, 또는 둘 다로부터 회수하는 단백질을 포함한다.

일부 구현예에 따라서 단백질은 성장 배지로부터 회수된다. 특정의 구현예에 따라서, 단백질의 적어도 50%, 60%, 70%, 80%, 90% 또는 95%가 분비된다.

본원에 개시된 양태 및 구현예 각각의 어떠한 조합도 본 발명의 개시내용 내에 명확하게 포함됨이 이해되어야 한다.

본 발명의 이러한 및 추가의 양태 및 특징은 하기한 상세한 설명, 실시예 및 청구범위로부터 명백해질 것이다.

도 1. 지질-연결된 올리고사카라이드 생합성 경로 및 진핵 세포 내 소포체(endoplasmic reticulum; ER)의 막에서 올리고사카라이드의 발생기(nascent) 폴리펩타이드로의 이전.
도 2a 및 2b. 당변형되지 않은(non-glycomodified) C1 균주(2A) 및 stt3 결실 균주 M3210(2B)에서 생반응기 내에 생산된 진균의 천연 단백질에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성(abundance).
도 3a 및 3b. 당변형되지 않은 C1 균주(3A) 및 cwh8 결실 균주 M3211(3B)에서 생물반응기(bioreactor) 내에 생산된 진균의 천연 단백질에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 4a 및 4b. 당변형되지 않은 C1 균주(4A) 및 stt3 결실 균주 M3480(4B)에서 생산된 모노클로날 항체에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 5a 및 5b. 당변형되지 않은 C1 균주(5A) 및 cwh8 결실 균주 M3481(5B)에서 생산된 모노클로날 항체에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.

발명의 상세한 설명

본 발명은 N-연결된 글리코실화가 감소되어 있거나 없는 단백질을 생산하기 위한 대안적인, 고 효율적인 시스템을 제공한다. 본 발명의 시스템은 부분적으로 사상 진균 써모텔로마이세스 헤테로탈리카 C1 및 이의 특수한 균주를 기반으로 하며, 이는 단백질 뿐만 아니라 이차적인 대사산물 생산을 위한 천연 생물학적 공장으로서 이미 개발되었다. 본 발명은 일부 구현예에서 STT3 및/또는 CWH8 단백질의 발현 및/또는 활성이 감소된 유전적으로 변형된 진균을 제공한다. 일부 구현예에서, 유전적으로 변형된 진균은 다수의 프로테아제의 감소되거나 폐지된(abolished) 발현 및/또는 활성을 갖는다.

본원에 기술된 바와 같은 유전적으로 변형된 진균에 의해 생산된 단백질은 다양한 약제학적 및 비-약제학적 적용에 적합하다.

일 양태에 따라서, 본 발명은 목적한 단백질을 생산하기 위한 유전적으로 변형된 사상 진균을 제공하고, 유전적으로 변형된 사상 진균은 STT3 및/또는 CWH8 단백질의 발현 및/또는 활성이 감소된 적어도 하나의 세포를 포함한다.

추가의 양태에 따라서, 본 발명은 N-연결된 글리코실화가 감소되어 있거나 없는 재조합 단백질을 생산할 수 있는 유전적으로 변형된 사상 진균을 제공하고, 여기서 유전적 변형은:

(i) 유전적으로 변형된 사상 진균이 올리고사카릴트랜스퍼라제(OST) 복합체의 촉매분해적 소단위를 생산하지 못하도록 하는 stt3 유전자의 결실 또는 파괴;

(ii) 유전적으로 변형된 사상 진균이 기능적 돌리칠 피로포스페이트 포스파타제의 촉매분해적 소단위를 생산하지 못하도록 하는 cwh8 유전자의 결실 또는 파괴; 또는

(iii) stt3 및 cwh8 유전자 둘 다의 결실 또는 파괴를 포함한다.

용어 "파괴"는 유전자가 구조적으로 파괴되어 적어도 하나의 돌연변이 또는 구조적 변경을 포함함으로써 파괴된 유전자가 전체 길이의 기능성 유전자 생성물의 효율적인 발현을 지시할 수 없도록 함을 의미한다. 용어 "파괴"는 또한 파괴된 유전자 또는 이의 생성물 중 하나가 기능적으로 억제되거나 불활성화되어 유전자가 전체 길이 및/또는 완전한 기능의 유전자 생성물을 발현하지 않거나 효율적으로 발현할 수 없음을 의미한다. 기능적 억제 또는 불활성화는 전사 또는 해독의 어느 하나의 수준에서 발현의 구조적 파괴 및/또는 차단으로부터 야기될 수 있다. 용어 "파괴"는 또한 유전자 발현의 약화 또는 녹 다운(knocking down)을 포함한다.

단백질 글리코실화, 즉, 세포 내에서 새로이 합성된 폴리펩타이드 쇄의 측쇄에 대한 올리고사카라이드의 공유결합성 부착은 사카라이드 모이어티(moiety)를 순차적으로 가하고 제거하는 일련의 효소를 포함하는 진핵 세포내 정돈된 공정이다. N-글리코실화는 아스파라긴 잔기, 특히 서열 Asn-Xaa-Ser/Thr(여기서 Xaa는 Pro를 제외한 임의의 아미노산을 나타낸다)에서 발생하는 아스파라긴의 측쇄에 부착된다.

N-글리코실화는 소포체(ER) 내에서 개시되며, 여기서 올리고사카라이드 Glc₃Man₉GlcNAc₂는 지질 담체(lipid carrier)인, 돌리콜-피로포스페이트 상에서 조립되고, 후속적으로 ER의 내강으로 도입되는 폴리펩타이드의 선택된 아스파라긴 잔기로 이전된다. 도 1은 지질-연결된 올리고사카라이드의 생합성 경로 및 진핵 세포 내 ER의 막에서 발생기 폴리펩타이드로의 이전을 나타낸다. 지질-연결된 올리고사카라이드의 생합성은 수개의 특이적인 글리코실트랜스퍼라제의 활성을 요구한다. 이는 ER 막의 세포질 측면에서 시작하여 내강에서 끝나며 여기서 올리고사카릴트랜스퍼라제(OST)는 발생기의 폴리펩타이드의 N-X-S/T 시쿠온스(sequons)를 선택하여 아스파라긴의 측쇄 아미드와 올리고사카라이드 사이에 N-글리코시드성 연결을 생성한다. ER의 외부로부터 내부로 지질-연결된 올리고사카라이드의 플립핑(flipping)은 ER 막에 위치한 플립파제에 의해 수행된다. 발생기의 폴리펩타이드로의 이전 후, 올리고사카라이드는 글리코시다제 및 만노시다제에 의해 전형적으로 트리밍(trimming)된 다음 발생기의 당단백질이 추가의 공정을 위해 골지체로 이전된다.

돌리콜-피로포스페이트-결합된 올리고사카라이드의 합성은 필수적으로 모든 공지된 진핵세포에서 보존된다. 그러나, 당단백질로서 올리고사카라이드의 추가의 공정은 하등 진균세포, 예를 들면, 진균 또는 효모와 고등 진핵세포, 예를 들면, 동물 및 식물 상에서 크게 변하는 분비 경로를 따라 이동한다. 따라서, 당 측쇄의 최종 조성은 다양한 유기체 사이에서 상이하고, 숙주에 의존한다.

미생물, 예를 들면, 효모에서는, 추가의 만노스 및/또는 만노실포스페이트 당이 가해져서, 30 내지 50개까지의 만노스 잔기를 함유할 수 있는 "초만노실화된(hypermannosylated)" 유형의 N-글리칸을 생성한다.

동물 세포, 예를 들면, 사람, 반려 동물 및 다른 포유동물 세포에서는, 발생기의 당단백질(nascent glycoprotein)이 골지체로 이전되며 여기서 만노스 잔기는 골지-특이적인 1,2-만노시다제에 의해 제거된다. 단백질로서 지속되는 공정은 첨가되어 특이적인 당 잔기를 제거하는 다수의 변형 효소, 예를 들면, N-아세틸글루코스아민 트랜스퍼라제(GnT I, GnT II, GnT III, GnT IV, GnT V, GnT VI), 만노시다제 II 및 푸코실트랜스퍼라제에 의해 골지체를 통해 진행된다. 최종적으로, N-글리칸은 갈락토실 트랜스퍼라제(GalT) 및 시알릴트랜스퍼라제(ST)에 의해 작동하며 최종의 당단백질이 골치체로부터 방출된다. 동물 당단백질의 N-글리칸은 비(bi)-, 트리(tri)-, 또는 테트라(tetra)-안테너리(antennary) 구조를 가지며, 전형적으로 갈락토스, 만토스, 프럭토스 및 N-아세틸글루코스아민을 포함할 수 있다. 일반적으로 N-글리칸의 말단 잔기는 시알산으로 이루어진다.

효모와는 달리, 써모텔로마이세스 헤테로탈리카는 초만노실화된 N-글리칸을 가지지 않지만, 오히려 "올리고 만노스" 글리칸- - Man₃ 내지 Man_8-9 - 및 Man 및 HexNAc 잔기 둘 다를 함유하는 하이브리드 유형 글리칸(Man₃HexNac-Man₈HexNac)을 갖는다. 이러한 하이브리드 글리칸의 정확한 구조는 완전하게 알려져 있지 않다. 하이브리드 글리칸은 대표적인 만노스 잔기를 가지지만 또한 여전히 특성화되지 않은 결합을 통해 부착된 알려지지 않은 HexNAc를 갖는다.

본 발명은 N-글리코실화 경로의 유전적 변형으로 이것이 감소된 양의 N-글리칸을 생산하도록 하는 것에 관한 것이다.

본원에 사용된 바와 같은 "글리칸"은 담체, 예를 들면, 아미노산, 펩타이드, 폴리펩타이드, 지질 또는 환원 말단 접합체에 연결될 수 있는 올리고사카라이드 쇄를 지칭한다. 본 발명은 특히 아스파라긴 잔기(Asn)의 측쇄 아미드 질소에 N-결합에 의해 폴리펩타이드 N-글리코실화 부위, 예를 들면, -Asn-Xaa-Ser/Thr-에 접합된 N-연결된 글리칸("N-글리칸")에 관한 것이고, 여기서 Xaa는 Pro를 제외한 임의의 아미노산 잔기이다. 본 발명은 또한 돌리콜-포스포-올리고사카라이드(Dol-P-P-OS) 전구체 지질 구조의 부분으로서 글리칸에 관한 것이고, 이는 진핵 세포의 소포체 내에서 N-연결된 글리칸의 전구체이다. 전구체 올리고사카라이드는 이의 환원 말단에 의해 돌리콜 지질 상의 2개의 포스페이트 잔기에 결합된다.

용어 "stt3 유전자"는 돌리칠-디포스포올리고사카라이드-단백질 글리코실트랜스퍼라제 소단위를 암호화하는 유전자를 지칭한다. 이는 단백질 N-글리코실화의 제1 단계인, 발생기의 폴리펩타이드 쇄 내 Asn-X-Ser/Thr 컨센서스 모티프(consensus motif) 내의 아스파라긴 잔기로 지질 담체로부터의 정의된 글리칸(진핵세포에서 Glc3Man9GlcNAc2)의 초기 이전을 촉매하는 올리고사카릴트랜스퍼라제(OST) 복합체의 촉매분해 소단위이다. STT3 단백질은 다음의 반응을 촉매한다:

돌리칠 디포스포올리고사카라이드-(1→4)-N-아세틸-β-D-글리코스아미닐-(1→4)-N-아세틸--D-글리코스아미닐) + L-아스파라기닐-[단백질] →

돌리칠 디포스페이트 + H+ + N4-(올리고사카라이드-(1→4)-N-아세틸-β-D-글리코스아미닐-(1→4)-N-아세틸--D-글리코스아미닐)-L-아스파라기닐-[단백질].

본 발명의 유전적으로 변형된 자낭균류 사상 진균은 stt3 유전자의 결실 또는 파괴에 의해 유전적으로 변형됨으로써 올리고사카릴트랜스퍼라제(OST) 복합체의 기능적인 촉매분해 소단위를 생산한다. 본 발명의 유전적으로 변형된 자낭균류 사상 진균은 검출가능한 올리고사카릴트랜스퍼라제(OST) 활성을 나타내지 않는다.

용어 "cwh8 유전자"는 돌리칠디포스파타제를 암호화하는 유전자를 지칭한다. CWH8은 다음의 반응을 촉매한다:

돌리칠 디포스페이트 + H₂O = 돌리칠 포스페이트 + H+ + 포스페이트

본 발명의 유전적으로 변형된 자낭균류 사상 진균은 cwh8 유전자의 결실 또는 파괴에 의해 유전적으로 변형됨으로써 진균이 기능적 돌리칠디포스파타제를 생산하지 못하도록 한다. 본 발명의 유전적으로 변형된 자낭균류 사상 진균은 검출가능한 돌리칠디포스파타제 활성을 나타내지 않는다.

본원에 정의된 바와 같은 자낭균류 사상 진균은 그룹 페지조마이코티나(Pezizomycotina)에 속하는 임의의 진균 균주를 지칭한다. 페지조마이코티나는 하기 그룹을 포함하나, 이에 한정되지 않는다:

다음의 속(genus)을 포함하는, 소르다리알레스(Sordariales):

써모텔로마이세스(예를 들면, 헤테로탈리카(heterothallica) 및 서모필라(thermophila) 종),

마이셀리오프토라(Myceliophthora)(예를 들면, 루테아(lutea) 종 및 명명되지 않은 종),

코리나스쿠스(Corynascus)(예를 들면, 푸미몬타누스(fumimontanus) 종),

뉴로스포라(Neurospora)(예를 들면, 크라싸(crassa) 종);

다음의 속을 포함하는 하이포크레알레스(Hypocreales):

푸사리움(Fusarium)(예를 들면, 그라미네아룸(graminearum) 및 베네나툼(venenatum) 종),

트리초데르마(Trichoderma)(예를 들면, 레에세이(reesei), 하르지아눔(harzianum), 론기브라치아툼(longibrachiatum) 및 비리데(viride) 종);

다음의 속을 포함하는 오니게날레스(Onygenales):

크리소스포리움(예를 들면, 루크노웬세 종);

다음의 속을 포함하는 유로티알레스(Eurotiales):

라삼소니아(Rasamsonia)(예를 들면, 에메르소니이(emersonii) 종),

페니실리움(Penicillium)(예를 들면, 베르루코숨(verrucosum) 종),

아스퍼길러스(Aspergillus)(예를 들면, 푸니쿨로수스(funiculosus), 니둘란스(nidulans), 니거(niger) 및 오리자에(oryzae) 종),

탈라로마이세스(Talaromyces)(예를 들면, 피니필루스(piniphilus)(이전에 페니실리움 푸니쿨로숨(Penicillium funiculosum) 종).

상기 목록은 결정적인 것이 아닌 것으로 이해되어야 하고, 산업적으로 관련된 사상 자낭균류 진균 종의 불완전 목록을 제공함을 의미한다.

페지조마이코티나(Pezizomycotina) 외의 사상성 자낭?着? 종이 존재할 수 있지만, 이는 가장 일반적으로 공지된 비-사상의 산업적으로 관련된 속, 예를 들면, 사카로마이세스(Saccharomyces), 코마가타엘라(Komagataella)(예를 들면, 이전에 피치아 파스토리스(Pichia pastoris), 클루이베로마이세스(Kluyveromyces) 또는 타프리노마이소티나(Taphrinomycotina)를 함유하고, 이는 다른 일반적으로 공지된 비-사상성의 산업적으로 관련된 속, 예를 들면, 스키조사카로마이세스(Schizosaccharomyces)를 함유한다.

상기 모든 분류학적 범주는 특허 출원일의 NCBI 분류학 브로셔(Taxonomy browser)(ncbi.nlm.nih.gov/taxonomy)에 따라 정의된다.

진균 분류학은 지속적으로 변하고 있으며, 분류군(taxa)의 명명 및 계층적 위치는 앞으로도 변할 수 있음을 인식하여야 한다. 그러나, 당해 분야의 숙련가는 특수한 진균 균주가 상기 정의된 바와 같은 그룹에 속하는 경우를 명확하게 결정할 수 있을 것이다.

특정의 구현예에 따라서, 사상 진균 속은 마이셀로프토라(Myceliophthora), 써모텔로마이세스, 아스퍼길러스, 페니실리움, 트리초데르마(Trichoderma), 라삼소니아(Rasamsonia), 크리소스포리움(Chrysosporium), 코리나스쿠스(Corynascus), 푸사리움(Fusarium), 뉴로스포라(Neurospora), 탈라로마이세스(Talaromyces) 등으로 이루어진 그룹으로부터 선택된다. 일부 구현예에 따라서, 진균은 마이셀리오프토라 써모필라(Myceliophthora thermophila), 써모텔로마이세스 써모틸라( Thermothelomyces thermophila)(이전에, 엠. 써모필라(M. thermophila), 써모텔로마이세스 헤테로탈리카(이전에, 엠. 써모필라(M. thermophila) 및 헤테로탈리카(heterothallica)), 마이셀리오프토라 루테아(Myceliophthora lutea), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 푸니쿨로수스(Aspergillus funiculosus), 아스퍼길러스 니거(Aspergillus niger), 아스퍼길러스 오리자에(Aspergillus oryzae), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 베루코숨(Penicillium verrucosum), 트리초데르마 레에세이(Trichoderma reesei), 트리초데르마 하르지아눔(Trichoderma harzianum), 트리초데르마 론기브라치아툼(Trichoderma longibrachiatum), 트리초데르마 비리데(Trichoderma viride), 크리소스포리움루크노웬세, 라삼소니아 에메르소니이(Rasamsonia emersonii), 스포로트리쿰 써모필레(Sporotrichum thermophile), 코리나스쿠스 푸미몬타누스(Corynascus fumimontanus), 코리나스쿠스 써모필루스(Corynascus thermophilus), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 베네아툼(Fusarium venenatum), 뉴로스포라 크라싸(Neurospora crassa), 및 탈라로마이세스 피니필루스(Talaromyces piniphilus)로 이루어진 그룹으로부터 선택된다.

특히, 본 발명은 다량의 안정한 단백질을 생산할 수 있는, 자낭균류 사상 진균에 대한 모델로서 써모텔로마이세스 헤테로탈리카 균주 C1을 제공한다.

용어 "써모텔로마이세스(Thermothelomyces)" 및 이의 종 "써모텔로마이세스 헤테로탈리카" 및 써모필라(thermophila)는 본원에 공지된 바와 같은 가장 광의적인 영역에서 본원에 사용된다. 속 및 이의 종의 설명은 예를 들면, 마린-펠릭스 와이(Marin-Felix Y)(2015. Mycologica 107(3): 619-632 doi.org/10.3852/14-228) 및 반 덴 브링크 제이(van den Brink J) 등(2012, Fungal Diversity 52(1):197-207)에 기술되어 있다. 본원에 사용된 바와 같은 "C1" 또는 "써모텔로마이세스 헤테로탈리카 C1" 또는 Th. 헤테로탈리카 C1, 또는 C1 모두는 써모텔로마이세스 헤테로탈리카 균주 C1을 지칭한다.

상기 저자(Marin-Felix et al., 2015)는 최적의 성장 온도, 분생자(condiospore)의 형태학, 및 유성 생식 주기(sexual reproduction cycle)에서의 차이를 기반으로 하는 마이셀리오프토라(Myceliophthora) 속의 분할, 및 유성 생식 주기의 세부사항을 제안하였음을 유의한다. 제안된 범주에 따라서, C1은 새로이 확립된 써모텔로마이세스 속에 속하며, 이는 비-열내성 종에 포함되는 것으로 남은, 마이셀로프토라 속 이외의 전자의 열내성 마이셀리오프토라 종을 함유한다. C1은 써모텔로마이세스 써모필라 C1보다는 오히려 써모텔로마이세스 헤테로탈리카 균주 C1으로서 대치되는 접합형(opposite mating type)을 지닌 일부 다른 써모텔로마이세스(이전에는 마이셀리오프토라) 균주와 함께 자낭포자를 형성할 수 있기 때문에, C1은 써모텔로마이세스 써모필라 C1보다는 오히려, 써모텔로마이세스 헤테로탈리카 균주 C1으로 가장 잘 분류된다.

진균 분류학은 또한 과거에 지속적인 변화가 있었으므로, 상기 나열된 현재의 명칭은 현재 동의어로 고려되는, 마이셀리오프토라 써모필라(van Oorschot, 1977. Persoonia 9(3):403) 이상의 다양한 보다 오래된 명칭이 선행될 수 있다는 것을 인식하여야만 한다. 예를 들면, 써모텔로마이세스 헤테로탈리카(Marin-Felix et al., 2015. Mycologica, 3:619-63)는 코리나스쿠스 헤테로트찰리쿠스(Corynascus heterotchallicus), 티엘라비아 헤테로탈리카(Thielavia heterothallica), 크리소스포리움루크노웬세 및 써모필(thermophile) 뿐만 아니라 스포로트리치움 써모필레(Sporotrichium thermophile)와 동의어이다(Alpinis 1963. Nova Hedwigia 5:74).

본 발명은 서열 번호: 29에 대해 99% 이상의 상동성(homology)을 나타내는 리보소옴 DNA(rDNA) 서열을 함유하는 어떠한 균주도 포함함이 또한 명확하게 이해되어야 하며, 모든 이러한 균주는 에 대해 동종(conspecific)인 것으로 고려된다.

특히, 용어 써모텔로마이세스 헤테로탈리카 균주 C1은 야생형 균주로부터 유래된 유전적으로 변형된 서브-균주(sub-strain)을 포함하고, 이는 무작위 또는 직접적인 접근법, 예를 들면, UV 돌연변이유발을 사용하거나, 또는 하나 이상의 내인성 유전자를 결실시킴으로써 돌연변이되어 왔다. 예를 들면, C1 균주는 내인성 프로테아제를 암호화하는 하나 이상의 유전자를 결실하도록 변형된 야생형 균주를 지칭한다. 예를 들면, 본 발명에 포함된 C1 균주는 기탁 번호 제VKM F-3631 D호의 균주 UV18-25; 기탁 번호 제VKM F-3633 D호의 균주 NG7C-19; 및 기탁 번호 제VKM F-3632 D호의 균주 UV13-6를 포함한다. 본 발명의 교시에 따라 사용될 수 있는 추가의 C1 균주는 UV18-100f 기탁 번호 제CBS141147호의 HC 균주; 기탁 번호 제CBS141143호의 HC 균주 UV18-100f; 기탁 번호 제CBS141153호의 LC 균주 W1L#100I; 및 기탁 번호 제CBS141149호의 LC 균주 W1L#100I 및 이의 유도체를 포함한다.

본 발명의 교시는, 써모텔로마이세스 헤테로탈리카 C1 균주의 유도체, 후대세포, 및 클론이 본 발명의 교시에 따라 유전적으로 변형될 때, 본 발명의 교시에 따른 적어도 하나의 단백질 생성물을 생산할 수 있는 한, 써모텔로마이세스 헤테로탈리카 C1 균주의 돌연변이체, 유도체, 후대세포, 및 클론을 포함하는 것으로 명확하게 이해되어야 한다. 본원에 사용된 바와 같은 용어 "후대세포"는 모 진균주(parent fungal line)로부터 변형되지 않거나 부분적으로 변형된 후대세포, 예를 들면, 세포로부터의 세포를 지칭한다. 용어 "모 균주"는 본 발명에 따른 특정 프로테아제의 감소된 발현 또는 활성을 가지지 않는 상응하는 진균 균주를 지칭한다.

본 발명의 출원인에 의해 개발된 수개의 써모텔로마이세스 헤테로탈리카 C1 균주는 통상의 효모 균주 및 또한 대부분의 다른 자낭균류 사상 진균보다 탄소원으로서 성장 배지 속에 존재하는 글루코스 및 다른 발효가능한 당에 의한 피드백 억제(feedback repression)에 대해 덜 민감하며, 결과적으로 보다 높은 탄소원의 공급 율을 견딜 수 있어, 이러한 진균에 의한 높은 수율의 생산을 유도한다.

일부 구현예에 따라서, 진균 성장 배지는 글루코스, 슈크로스, 크실로스, 아라비노스, 갈락토스, 프럭토스, 락토스, 셀로비오스, 글리세롤 및 이의 임의의 조합으로 이루어진 그룹으로부터 선택된 탄소원(carbon source)을 포함한다.

본 발명은 또한 N-글리코실화 변형이 감소되거나 없도록 가공하는 것에 관한 것이다. O-글리칸은 존재할 수 있거나 또는 진균의 추가의 유전적 변형에 의해 제거 또는 변경될 수 있음을 유의한다.

본원에 기술된 바와 같은 용어 "감소된 발현" 또는 "억제된 발현"은 상호교환적으로 사용되며 단백질을 암호화하는 유전자를 결실시키거나 파괴함을 포함하나, 이에 한정되지 않는다.

본원에 기술된 바와 같은 용어 단백질의 "감소된 활성" 또는 "억제된 활성"은 해독 후 변형으로 단백질의 감소되거나 또는 폐지된 활성을 야기하는 것을 포함하나, 이에 한정되지 않는다.

본 발명에 따른 유전적 변형은 유전적으로-변형된 진균이 이의 의도된 용도에 적합한 충분한 속도에서 성장할 수 있도록 하는 것으로 이해되어야 한다.

상기 용어는 또한 야생형 균주로부터 유래된 유전적으로 변형된 서브-균주(sub-strain)를 포함하며, 이는 무작위 또는 직접적인 접근법, 예를 들면, UV 돌연변이유발을 사용하거나, 또는 하나 이상의 내인성 유전자를 결실시킴에 의해 돌연변이되었다.

일반적으로 Th. 헤테로탈리카 진균 및 특히 균주 C1은 적합한 조건에서 성장시키는 경우 효모 균주와 비교하여 보다 높은 생물량(biomass) 생산을 나타낸다. Th. 헤테로탈리카 진균은 다량의 3 차원(3 dimension; 3D) 액체 배양물 뿐만 아니라 고체 배지 속에서 성장할 수 있다. 본 발명의 출원인에 의해 개발된 수개의 균주는 통상의 효모 및 다른 진균과 비교하여 탄소원으로서 진균 성장 배지 속에 존재하는 글루코스 및 다른 발효가능한 당에 의한 피드백 억제에 대해 거의 민감하지 않고, 탄소원의 높은 공급 속도를 견뎌셔 고 수율을 이끌 수 있다. 더욱이, 이러한 균주 중 일부는 비-글루코스 억제된 야생형 Th. 헤테로탈리카 진균 또는 단백질 생산에 사용된 것으로 알려진 다른 사상 진균으로 수득된 고 점도와 비교하여 통상의 발효기 속에서 성장시키는 경우 유의적으로 감소된 배지 점도를 제공한다. 저 밀도는 모 균주(들)에서 길고 높은 긴 및 높은 교차된 균사(interlaced hyphae)를 갖는것으로부터 개발된 균주(들)에서 짧고 거의 교차되지 않은 균사로의 형태학적 변화에 기여할 수 있다. 낮은 배지 점도는 발효기 속에서 대규모 산업적 생산에 매우 유리하다. 예를 들면, 글루코스 억제에 대해 감소된 민감성을 나타내는, 기탁 번호 제VKM F-3631 D의 Th. 헤테로탈리카 C1 균주 UV18-25는 100,000 리터 이상의 용적에서 재조합 효소를 생산하기 위해 산업적으로 성장되었다.

용어 "이종"은, 유전자, 효소, 단백질 또는 펩타이드 서열을 지칭하는 경우, 본원에서 자낭균류 사상 진균에서 천연적으로 발견되거나 발현된 유전자, 효소, 단백질 또는 펩타이드 서열을 설명하기 위해 사용된다.

용어 "내인성"은, 유전자, 효소, 단백질 또는 펩타이드 서열, 예를 들면, 소세포 국재화 신호(subcellular localization signal)를 지칭하는 경우, 자낭균류 사상 진균에 천연적으로 존재하는 유전자, 효소, 단백질 또는 펩타이드 서열을 지칭한다.

용어 "외인성"은 폴리뉴클레오타이드를 지칭하는 경우, 본원에서 형질전환을 통해 자낭균류 사상 진균으로 외인성으로 도입된 합성 폴리뉴클레오타이드를 기술하기 위해 사용된다. 외인성 폴리뉴클레오타이드는 안정하거나 일시적인 방식으로 자낭균류 사상 진균 내에 도입되어 리보핵산(RNA) 분자 및 후속적으로 폴리펩타이드 분자를 생산할 수 있다.

발현 벡터(expression vector)

일부 구현예에 따라서, 본원에 기술된 유전적으로 변형된 자낭균류 사상 진균은 목적한 단백질을 암호화하는 적어도 하나의 외인성 폴리뉴클레오타이드를 포함한다.

목적한 단백질을 암호화하는 폴리뉴클레오타이드는 DNA 작제물(construct) 또는 발현 벡터의 부분을 형성할 수 있다.

용어 "발현 작제물" 및 "DNA 작제물" 또는 "발현 카세트(expression cassette)"는 본원에서 상호교환적으로 사용되며 목적한 단백질을 암호화하는 핵산 서열을 포함하고 조립되어 목적한 단백질이 표적 숙주 세포 내에서 발현되도록 하는 인공적으로 조립되거나 단리된 핵산 분자를 지칭한다. 발현 작제물은 전형적으로 목적한 단백질을 암호화하는 핵산 서열에 작동적으로 연결된 적절한 조절 서열을 포함한다. 발현 작제물은 선택 마커를 암호화하는 핵산 분자를 추가로 포함할 수 있다.

용어 "핵산 서열", "뉴클레오타이드 서열" 및 "폴리뉴클레오타이드"는 본원에서 별개의 단편의 형태 또는 보다 큰 작제물의 구성성분으로서 데옥시리보뉴클레오타이드(DNA), 리보뉴클레오타이드(RNA), 및 이의 변형된 형태의 중합체를 지칭하기 위해 사용된다. 핵산 서열은 암호화 서열, 즉, 세포 내에서 최종 생성물, 예를 들면, 단백질을 암호화하는 서열일 수 있다. 핵산 서열은 또한 예를 들면, 프로모터와 같은, 조절 서열일 수 있다.

용어 "펩타이드", "폴리펩타이드" 및 "단백질"은 본원에서 아미노산 잔기의 중합체를 지칭하기 위해 사용된다. 용어 "펩타이드"는 전형적으로 2 내지 50개의 아미노산으로 이루어진 아미노산 서열을 나타내지만, "단백질"은 50개 이상의 아미노산 잔기로 이루어진 아미노산 서열을 나타낸다.

참고 서열에 대해 "상동성"인 서열(예를 들면, 핵산 서열 및 아미노산 서열)은 본원에서 서열 간의 동일성 퍼센트(identity percent)를 지칭하고, 여기서 동일성 퍼센트는 적어도 75%, 바람직하게는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%또는 적어도 99%이다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다. 본원에 기술된 서열의 동족체는 본 발명 내에 포함된다. 단백질 동족체는 원래의 단백질의 활성을 유지하는 한 포함된다. 상동성 핵산 서열은 코돈 사용 및 유전 코드(genetic code)의 변성과 관련된 변화(variation)를 포함한다. 서열 동일성은 당해 분야에 공지된 바와 같은 뉴클레오타이드/아미노산 서열 비교를 사용하여 측정할 수 있다.

목적한 단백질을 암호화하는 핵산 서열은 발현에 대해 최적화될 수 있다. 이러한 서열 변형의 예는 낭균류 사상 진균에서 전형적으로 발견된 가장 근접한 접근법에 대한 변경된 G/C 함량 및 코돈 최적화로 일반적으로 지칭된, 진균에서 비정형적으로 발견된 코돈의 제거를 포함하나, 이에 한정되지 않는다.

어구 "코돈 최적화(codon optimization)"는 목적한 유기체 내에서 코돈 사용에 접근하는 구조 유전자 또는 이의 단편 내에서 사용하기 위한 적절한 DNA 뉴클레오타이드의 선택, 및/또는 천연 서열의 적어도 하나의 코돈(예컨대, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 천연의 아미노산 서열을 유지하면서 이러한 숙주 세포의 유전자에 보다 흔히 또는 가장 흔히 사용된 코돈으로 대체함으로써 목적한 숙주 세포 내에서 향상된 발현시키기 위해 핵산 서열을 변형시키는 공정을 지칭한다. 다양한 종이 특수한 아미노산의 특정 코돈에 대해 특수한 편향(bias)을 나타낸다. 코돈 편향(유기체 사이의 코돈 사용에서의 차이)는 흔히 전령(messenger) RNA(mRNA)의 해독의 효능과 관련되며, 이는 궁극적으로 다른 것들 중에서, 해독되는 코돈의 특성 및 특수한 전달 RNA(tRNA) 분자의 이용가능성에 의존하는 것으로 여겨진다. 세포 내에서 선택된 tRNA의 우위는 일반적으로 단백질 합성에 가장 흔히 사용된 코돈을 반형한다. 따라서, 유전자는 코돈 최적화를 기반으로 주어진 유기체에서 최적의 유전자 발현을 위해 조절(tailor)될 수 있다. 따라서, 최적화된 유전자 또는 핵산 서열은 천연의 또는 천연적으로 발생하는 유전자의 뉴클레오타이드 서열이 변형되어 유기체 내에서 통계적으로 바람직하거나 통계적으로 선호된 코돈을 활용하도록 하는 유전자를 지칭한다.

용어 "조절 서열(regulatory sequence)"은 암호화 서열, 예를 들면, 프로모터 및 터미네이터(terminator)의 발현(전사)를 제어하는 DNA 서열을 지칭한다.

용어 "프로모터"는 생체 내(in vivo) 또는 시험관 내(in vitro)에서 다른 DNA 서열의 전사를 제어하거나 지시하는 조절성 DNA 서열에 관한 것이다. 일반적으로, 프로모터는 전사된 서열의 5' 영역 내에 위치(즉, 앞에, 상부(upstream)에 위치)한다. 프로모터는 천연 공급원으로부터의 이의 실체로부터 유래될 수 있거나, 천연에서 발견된 상이한 프로모터로부터 유래된 상이한 성분으로 구성될 수 있거나, 또는 심지어 합성 뉴클레오타이드 분절을 포함할 수 있다. 프로모터는 구성적이거나(즉, 프로모터 활성화는 유도제에 의해 조절되지 않으므로 전사 속도는 일정하다), 또는 유도성이다(즉, 프로모터 활성화는 유도제에 의해 조절된다). 대부분의 경우에서 조절 서열의 정확한 경계부는 완전히 정의되지 않았으며, 일부 경우는 완전히 정의될 수 없으므로, 일부 변이의 DNA 서열은 동일한 프로모터 활성을 가질 수 있다.

용어 "터미네이터"는 전사 종결을 조절하는 다른 조절 DNA 서열에 관한 것이다. 터미네이터 서열은 전사될 핵산 서열의 3' 말단에 작동적으로 연결된다.

일부 구현예에 따라서, 사상 진균은 써모텔로마이세스 헤테로탈리카이고 목적한 단백질은 써모텔로마이세스 헤테로탈리카의 조절 성분을 갖는 작제물에서 발현된다. 특정 구현예에 따라서, 목적한 단백질을 발현하는 작제물은 써모텔로마이세스 헤테로탈리카 프로모터 및/또는 써모텔로마이세스 헤테로탈리카 터미네이터를 포함한다.

용어 "써모텔로마이세스 헤테로탈리카 프로모터" 및 "써모텔로마이세스 헤테로탈리카 터미네이터"는 써모텔로마이세스 헤테로탈리카에서 유전자 발현을 지시할 수 있는 써모텔로마이세스 헤테로탈리카에서 사용하기에 적합한 프로모터 및 터미네이터 서열을 나타낸다. 일부 특수한 구현예에서, C1 프로모터 및 C1 터미네이터가 사용되며, 이는 C1에서 유전자 발현을 지시할 수 있는 프로모터 및 터미네이터 서열을 나타낸다.

일부 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 프로모터/터미네이터는 써모텔로마이세스 헤테로탈리카의 내인성 유전자로부터 유래된다. 다른 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 프로모터/터미네이터는 써모텔로마이세스 헤테로탈리카에 대해 외인성인 유전자로부터 유래된다.

적합한 구성적 프로모터 및 터미네이터는 예를 들면, C1 당분해 유전자, 예를 들면, 포스포글리세레이트 키나제 유전자(phosphoglycerate kinase gene; PGK)(Uniprot: G2QLD8, NCBI 참고 서열: XM_003665967), 글리세르알데하이드 3-포스페이트 데하이드로게나제(GPD)(Uniprot: G2QPQ8, NCBI 참고 서열: XM_003666768), 포스포프럭토키나제(PFK)(Uniprot: G2Q605, NCBI 참고 서열: XM_003659879); 또는 β-글루코시다제 1 유전자 bgl1(수탁 번호: XM_003662656); 또는 트리오스 포스페이트 이소머라제(TPI)(Uniprot: G2QBR0, NCBI 참고 서열: XM_003663200); 또는 액틴(ACT)(Uniprot: G2Q7Q5, NCBI 참고 서열: XM_003662111);또는 C1 cbh1 프로모터(GenBank AX284115)또는 C1 chi1 프로모터(GenBank HI550986)의 것을 포함한다. 사용될 수 있는 추가의 프로모터는 아스퍼길러스 나둘란스(Aspergillus nidulans) gpdA 프로모터; 및 Rantasalo et al. (2018 NAR 46(18):e111)에 기술된 합성 프로모터이다. 예시적인 터미네이터로서, C1 키티나제 1 유전자 chi1(GenBank HI550986), 셀로비오하이드롤라제 1 cbh1(GenBank AX284115)의 터미네이터, 또는 효모 adh1 터미네이터가 사용될 수 있다.

용어 "작동적으로 연결된"은 선택된 핵산 서열이 조절 성분(프로모터 또는 터미네이터)에 근접하여 존재함으로써 선택된 핵산 서열의 발현을 조절하도록 함을 의미한다.

본 발명의 일부 구현예에 따른 발현 작제물은 단백질을 암호화하는 핵산 서열에 작동적으로 연결된 써모텔로마이세스 헤테로탈리카 프로모터 서열 및 써모텔로마이세스 헤테로탈리카 터미네이터 서열을 포함한다. 일부 특수한 구현예에서, 본 발명의 발현 작제물은 효소를 암호화하는 핵산 서열에 작동적으로 연결된 C1 프로모터 서열 및 C1 터미네이터 서열을 포함한다.

특수한 발현 작제물은 다양한 상이한 방법, 예를 들면, 통상의 분자 생물학 방법, 예를 들면, 폴리머라제 쇄 반응(polymerase chain reaction; PCR), 제한 엔도뉴클레아제 분해, 시험관 내 및 생체 내 조립 방법 뿐만 아니라, 유전자 합성 방법에 의해 조립될 수 있다. 예시적인 발현 작제물 및 이의 작제 방법은 하기 실시예 단락에서 제공된다.

stt3 및/또는 cwh8 유전자의 결실

유전자 결실 기술은 유전자의 부분적인 또는 완전한 제거에 의해 이의 발현을 제거하는 것을 가능하도록 한다. 이러한 방법에서, 유전자의 결실은 유전자를 플랭킹(flanking)하는 5' 및 3' 영역을 연속적으로 함유하도록 작제된 플라스미드를 사용한 동종 재조합에 의해 달성될 수 있다.

유전자 결실은 또한 유전자를 본원에서 또한 결실 작제물로 명명된 파괴 핵산 작제물(disruptive nucleic acid construct) 내로 삽입함으써 수행될 수 있다. 파괴 작제물은 단순히 유전자에 대해 상동성인 5' 및 3' 영역이 동반하는 선택가능한 마커 유전자일 수 있다. 선택가능한 마커는 파괴된 유전자를 함유하는 형질전환체의 확인을 가능하도록 한다. 대안적으로 또는 추가로, 파괴 핵산 작제물은 숙주 세포 내에 존재할 이종 단백질을 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함할 수 있다.

stt3 및 cwh8에 대한 예시적인 결실 작제물 및 결실을 수반하는 과정은 하기 실시예 단락에서 제공된다. 본원에 기술된 바와 같이, stt3 및 cwh8 유전자는 하기 실시예 1에 나타낸 바와 같이, 선택가능한 마커를 포함하는 파괴 작제물을 사용하여 결실된다.

결실(들)은 파괴 작제물(들)을 플랭킹(flanking)하는 적절한 프로모터를 지닌 PCR을 사용하여 확인될 수 있다.

유전적으로 가공된 써모텔로마이세스 헤테로탈리카

본 발명에 따르 N-연결된 글리칸이 감소되어 있거나 없는 단백질을 생산하도록 유전적으로 가공된 써모텔로마이세스 헤테로탈리카 세포는 써모텔로마이세스 헤테로탈리카의 2개의 내인성 유전자, stt3 및 cwh8 중 적어도 하나를 변형, 예를 들면 결실시킴으로써 유전자가 기능성 단백질을 생산하지 못하도록 함에 의해 생성된다.

내인성 유전자의 결실은 상기 기술되어 있고 또한 하기 실시예 단락에 입증되어 있다.

여전히 다른 양태에 따라서, 본 발명은 외인성 단백질을 생산하는 방법을 제공하며, 이러한 방법은 유전적으로 변형된 진균, 특히 본 발명의 써모텔로마이세스 헤테로탈리카 C1 진균을 적합한 배지 속에서 배양하는 단계; 및 단백질 생성물을 회수하는 단계를 포함한다.

특정의 구현예에 따라서, 배지는 글루코스, 슈크로스, 크실로스, 아라비노스, 갈락토스, 프럭토스, 락토스, 셀로비오스, 및 글리세롤로 이루어진 그룹으로부터 선택된 탄소원을 포함한다. 특정의 구현예에 따라서, 탄소원은 에탄올 생산 또는 전분, 사탕무 및 사탕 수수, 예를 들면, 발효가능한 당을 포함하는 당밀, 전분, 중합성 탄수화물, 예를 들면, 셀룰로스 및 헤미셀룰로스를 포함하는 리그노셀룰로스성 생물량으로부터의 다른 생물생성(bioproduction)으로부터 수득된 폐기물이다.

일부 구현예에 따라서, 외인성 단백질은 진균 성장 배지로부터 정제된다.

다른 구현예에 따라서, 외인성 단백질은 진균 덩어리(fungal mass)로부터 추출된다. 영양 조직(vegetative tissue)으로부터 단백질을 추출 및 정제하기 위해 당해 분야에 공지된 바와 같은 어떠한 방법도 사용될 수 있다.

추가의 양태에 따라서, 본 발명은 유전적으로 변형된 진균, 특히 본 발명의 유전적으로 변형된 써모텔로마이세스 헤테로탈리카 C1에 의해 생산된 외인성 단백질을 제공한다.

외인성 폴리뉴클레오타이드의 발현은 진균 세포, 특히 핵 내로 진균 내에서 발현될 단백질을 암호화하는 핵산을 포함하는 발현 작제물을 도입시킴으로써 수행된다. 특히, 본 발명에 따른 유전적 변형은 숙주 게놈으로 발현 작제물의 혼입을 의미한다.

진균 세포 내로 발현 작제물의 도입, 즉, 진균의 형질감염은 예를 들면, 하기 실시예 단락에 기술된 원형질 형질전환 방법을 사용하여, 당해 분야에 공지된 방법으로 수행할 수 있다.

형질전환된 세포의 용이한 선택을 촉진하기 위해, 선택 마커(selection marker)를 진균 세포 내로 형질전환시킬 수 있다. "선택 마커"는 형질전환되지 않은 세포 속에 존재하지 않는 특정 유형의 표현형, 예를 들면, 항생제 내성(내성 마커), 특정의 자원(resource)(활용/영양요구성 마커)를 활용하는 능력 또는 예컨대, 스펙트럼 측정에 의해 검출될 수 있는 리포터 단백질의 발현을 부여하는 유전자 생성물을 암호화하는 폴리뉴클레오타이드를 나타낸다. 영양요구성 마커는 전형적으로 식품 또는 약제 산업에서 선택 수단으로서 바람직하다. 선택 마커는 발현 작제물로 공-형질전환된 별개의 폴리뉴클레오타이드 상에, 또는 발현 작제물의 동일한 폴리뉴클레오탕드 상에 존재할 수 있다. 형질전환 후, 양성 형질전환체는 세포를 예컨대, 선택된 선택 마커에 따른 선택 배지에서 배양함으로써 선택된다. 일부 경우에, 분할 마커 시스템(split marker system)이 사용되며, 여기서 선택 마커는 2개의 플라스미드로 분할되고 기능성 선택 마커는 2개의 플라스미드가 공-형질전환되어 동종 재조합을 통해 함께 연결되는 경우에만 형성된다.

서열의 목록

다음의 실시예는 본 발명의 특정의 구현예를 보다 충분히 나열하기 위해 제시된다. 그러나, 이는 어떠한 방식으로도 본 발명의 광범위한 영역을 제한하는 것으로 고려되지 않아야 한다. 당해 분야의 숙련가는 본 발명의 영역으로부터 벗어니지 않고 본원에 개시된 원리의 많은 변화 및 변형을 용이하게 고안할 수 있다.

실시예

실시예 1 - C1 stt3 및 cwh8 유전자의 결실

C1에서 분비된 단백질의 N-글리코실화를 감소시키거나 제거하기 위하여, 돌리칠-디포스포-올리고사카라이드 단백질 글리코실트랜스퍼라제 촉매 소단위 STT3 및 돌리칠디포스파타제 CWH8를 암호화하는 유전자를 결실시켰다. STT3은 다량체성 올리고사카릴트랜스퍼라제(OST) 복합체의 소단위이고 복합체의 촉매 활성에 필수적이다(Zufferey et al. 1995, EMBO Journal 14, 4949-4960). OST 복합체는 지질 담체 돌리칠피로포스페이트로부터 폴리펩타이드 쇄의 선택된 아스파라긴 잔기의 이전을 촉매한다. 돌리칠피로포스페이트 포스파타제 CWH8는 액체 담체 돌리칠피로포스페이트의 재순환에 포함되는 것으로 간주된다. CWH8은 세포의 생존에 필수적이지 않지만 상응하는 유전자의 결실은 N-글리코실화 결함을 야기한다(van Berkel et al. 1999, Glycobiology 9, 243-253).

결실은 stt3 및 cwh8 결실 작제물을 개별적으로(1개의 결실/균주) C1 내로 형질전환시킴으로써 수행하였다. stt3 또는 cwh8를 결실시키기 위한 DNA 작제물은 2개의 별개의 플라스미드로 작제되었다. 5' 아암(arm) 플라스미드는 통합을 위해 stt3/cwh8 5' 플랭킹 영역 단편 및 pyr4 마커 유전자의 처음 1/2을 함유하였다. 3' 아암 플라스미드는 pyr4 마커의 두번째 1/2 및 통합을 위한 stt3/cwh8 3' 플랭킹 영역 단편을 함유하였다. 이러한 2개의 플라스미드내 pyr4 마커 단편은 서로 오버랩되어 있다. 2개의 플라스미드의 C1으로의 형질전환 동안, 5' 및 3' 플랭킹 영역 단편은 결실된 유전자의 양쪽 측면에서 게놈 DNA와 재조합되므로 동시에 플라스미드 사이에서 동종 재조합(homologous recombination)을 겪는다. 선택 마커 단편 사이의 재조합은 마커 유전자가 기능성이 되도록 하는데 필수적이므로 형질전환체가 선택 하에 성장할 수 있도록 한다. 5' 플랭킹 영역의 말단으로부터 대략 500 bp는 마커의 두번째 1/2 이후에 가해져서 필요한 경우, 마커 유전자를 루핑 아웃(looping out)시킬 수 있다. stt3 및 cwh8 5' 및 3' 아암 벡터의 상이한 단편은 C1 게놈 DNA로부터 증폭되고 효모 재조합 클로닝에 의해 마커 유전자와 함께 골격 벡터(pRS426) 내로 클로닝시켰다(Colot et al. 2006, PNAS 103, 10352-10357).

stt3 결실 작제물의 5' 아암은 서열 번호: 1에 제시되어 있다. 5' 플랭크 서열(flank sequence)은 서열 번호: 1의 1 내지 930번 위치에 상응하고 pyr4 마커 유전자의 처음 1/2은 서열 번호: 1의 938 내지 2,717번 위치에 상응한다. stt3 결실 작제물의 3' 아암은 서열 번호: 2에 제시되어 있다. pyr4 마커 유전자의 두번째 1/2은 서열 번호 1 내지 1,257번 위치에 상응한다. 직접적인 반복 서열은 서열 번호: 2의 1,266 내지 1,777번 위치에 상응한다. 3' 플랭킹 서열을 서열 번호: 1,785 내지 2,715번 위치에 상응한다.

cwh8 결실 작제물의 5' 아암은 서열 번호: 3에 제시되어 있다. 5' 플랭크 서열은 서열 번호: 3의 1 내지 1,000번 위치에 상응하고 pyr4 m마커 유전자의 처음 1/2은 서열 번호: 3의 1,008 내지 2,787번 위치에 상응한다. cwh8 결실 작제물의 3' 아암은 서열 번호: 4에 제시되어 있다. pyr4 마커 유전자의 두번째 1/2은 서열 번호: 4의 1 내지 1,257번 위치에 상응한다. 직접적인 반복 서열은 서열 번호: 4의 1,266 내지 1,765번 위치에 상응한다. 3' 플랭킹 서열은 서열 번호: 4의 1,774 내지 2,973번 위치에 상응한다.

stt3/cwh8 결실 작제물의 아암 둘 다는 플라스미드 골격으로부터 절개되어 프로테아제 유전자의 9개의 결실을 갖는 C1 균주 DNL132 내로 동시에 형질전환된다. 하나의 5' 아암 벡터 및 3' 아암 벡터의 쌍은 각각의 형질전환에서 사용되었다.

선택 배지 플레이트에서 성장하는 형질전환 콜로니는 선택 배지에서 스트리킹(streaking)으로서 배양하였다. 결실 작제물이 정확하게 통합된 형질전환체의 확인은 PCR로 수행하였다. 형질전환체 스트리킹으로부터의 균사체를 20 mM의 NaOH 속에 용해하고 100℃에서 항온처리하여 세포를 분해하였다. 1 내지 2 ㎕의 이러한 분해물을 Phire Plant PCR kit^TM(Thermo Fisher)를 사용한 PCR용 주형으로서 사용하였다. 사용된 올리고뉴클레오타이드 프라이머는 표 1에 나타낸다.

결실 작제물의 stt3 유전자자리(locus)로의 통합은 2개의 PCR 반응에 의해 입증되었다. 유전자의 5' 말단에서 통합은 서열 번호: 5 및 서열 번호: 6에 제시된 프라이머 세트와의 반응에 의해 입증되었다. 1152 bp의 단편의 증폭은 유전자의 5' 말단에서 stt3 유전자자리로의 성공적인 통합을 나타내었다. stt3의 3' 말단에서 통합은 서열 번호: 7 및 서열 번호: 8에 제시된 프라이모로 입증되었다. 1752 bp 단편의 증폭은 유전자의 3' 말단에서 stt3 유전자자리로의 성공적인 통합을 나타내었다. stt3 유전자자리로의 통합에 대해 양성인 형질전환체는 서열 번호: 9 및 서열 번호: 10에 제시된 프라이머 및 서열 번호: 11 및 서열 번호: 12에 제시된 프라이머를 사용한 정량적 PCR에 의해 추가로 분석하여 stt3 유전자가 이로부터 완전히 결실되었음을 입증하였다. stt3 유전자자리로의 작제물의 통합에 대해 양성이고 stt3 유전자의 존재에 대해 음성인, 형질전환체 C1 균주를 -80℃에서 저장하고 균주 번호 M3210으로 제공하였다.

결실 작제물의 cwh8 유전자자리로의 통합은 2개의 PCR 반응에 의해 입증되었다. 유전자의 5' 말단에서의 통합은 서열 번호: 13 및 서열 번호: 6에 제시된 프라이머를 사용한 반응에 의해 입증되었다. 1243 bp 단편의 증폭은 유전자의 5' 말단에서 cwh8 유전자자리의 성공적인 통합을 나타내었다. 유전자의 3' 말단에서 통합은 서열 번호: 14 및 서열 번호: 8에 제시된 프라이머를 사용하여 입증하였다. 2009 bp 단편의 증폭은 유전자의 3' 말단에서 cwh8 유전자자리로의 성공적인 통합을 나타내었다. cwh8 유전자자리로의 통합에 대해 양성인 형질전환체를 서열 번호: 15 및 서열 번호: 18에 제시된 프라이머 및 서열 번호: 17 및 서열 번호: 18에 제시된 프라이머를 사용하는 정량적 PCR에 의해 추가로 분석함으로써 cwh8 유전자가 이들로부터 완전히 결실되었음을 입증하였다. 유전자자리 내로의 작제물의 통합에 대해 양성이고 cwh8 유전자자리 내로의 작제물의 통합에 대해 양성이고 cwh8 유전자의 존재에 대해 음성인, 형질전환체 C1 균주를 -80℃에서 저장하고 균주 번호 M3211로 제공하였다.

[표 1]

M3210 및 M3211 균주를 1 L의 생물반응기 속에서 공급-배치 공정(fed-batch process)으로 효모 추출물 및 탕소원으로서 글루코스를 함유하는 배지 속에서 7일 동안 배양하였다. 7일째로부터의 상층액 샘플을 13 500 rpm, 15분으로 3회 원심분리하고, 상층액 속에 존재하는 총 단백질로부터의 글리칸 분석을 GlycoWorks^TM RapiFluor-MSTM N-글리칸 키트(Waters)를 사용하여 제조업자의 프로토콜에 따라 수행하였다. 9개의 프로테아제 결실을 지닌 균주 M2864를 N-글리칸 분석에서 대조군으로서 사용하였다. N-글리칸은 stt3 결실 균주의 배양 상층액으로부터 검출될 수 있었지만 대조군 균주는 정상적인 C1 글리칸 패턴을 나타내었다(도 2a 및 2b). cwh8 결실 균주의 배양물 상층액으로부터 검출된 N-글리칸은 양은 대조군 균주의 N-글리칸 양의 대략 10%이었다(도 3a 및 3b).

실시예 2 - 균주 M3210 및 M3211에서 모노클로날 항체의 생산

N-글리코실화되지 않고 N-글리코실화가 감소된 모노클로날 항체의 생산을 입증하기 위하여, 치료학적 항체 니볼루맙의 중쇄 및 경쇄를 stt3 또는 cwh8 결실 각각을 갖는 M3210 및 M3211 균주 내에서 발현시켰다.

발현 카세트를 실시예 1에 설명된 바와 같이 2개의 별개의 플라스미드 내로 2개 부분으로 작제하였다. 작제물의 5' 아암은 통합을 위한 cbh1 5' 플랭킹 영역, C1 CBH1 신호 서열에 융합된 니볼루맙 경쇄 유전자가 bgl8 프로모터 및 bgl8 터미네이터 사이에 융합된 발현 카세트, nia1 마커 유전자 및 하이그로마이신 마커 유전자의 처음 1/2을 함유하였다. 작제물의 3' 아암은 하이그로마이신 마커의 마지막 1/2, bgl8 터미네이터로부터의 직접적인 반복 서열, C1으로부터의 CBH1 신호 서열에 융합된 니볼루맙 중쇄 유전자가 bgl8 프로모터와 chi1 터미네이터 사이에 존재하는 발현 카세트, 및 통합을 위한 cbh1 3' 플랭킹 영역을 함유하였다.

니볼루맙 발현 카세트의 5' 아암은 서열 번호: 19에 제시된다. cbh1 5' 플랭크 서열은 서열 번호: 19의 1 내지 1,957번 위치에 상응한다. bgl8 프로모터 서열은 서열 번호: 19의 1,966 내지 3,357번 위치에 상응한다. C1 CBH1 신호 서열에 융합된 경쇄를 암호화하는 서열은 서열 번호: 19의 3,358 내지 4,053번 위치에 상응하고, 여기서 3,358 내지 3,408번 위치는 CBH1 신호 서열을 암호화하고 3,409 내지 4,053번 위치는 경쇄를 암호화한다. 이러한 서열은 C1에 대한 사람 경쇄 유전자를 코돈-최적화하고, Geenscript로 합성함으로써 수득하였다. 합성된 서열은 bgl8 프로모터 및 터미네이터를 위한 40 bp의 프랭크를 함유하였다. bgl8 터미네이터 서열은 서열 번호: 19의 4,054 내지 4,520번 위치에 상응한다. nia1 마커 유전자는 서열 번호: 19의 4,537 내지 8,651번 위치에 상응한다. 하이그로마이신 마커 유전자의 처음 1/2은 서열 번호: 19의 8,660 내지 10,360번 위치에 상응한다. 상기 기술된 단편 및 골격 벡터 pRS426를 깁슨 조립(Gibson assembly)을 함께 조립하여 5' 아암 벡터를 수득하였다.

니볼루맙 발현 작제물의 3' 아암은 서열 번호: 20으로 제시된다. 하이그로마이신 마커 유전자의 1/2은 서열 번호: 20의 1 내지 1,732번 위치에 상응한다. chi1 터미네이터 서열은 서열 번호: 20의 2,082 내지 2,727번 위치에 상응한다. C1 CBH1 신호 서열에 융합된 경쇄를 암호화하는 서열은 서열 번호: 20의 2,736 내지 4,109번 위치에 상응하고 여기서 4,059 내지 4,109번 위치는 CBH1 신호 서열을 암호화하고 2,736 내지 4,058번 위치는 중쇄를 암호화한다. 이러한 서열은 C1에 대한 사람 중쇄를 코돈-최적화하고, Genscript로 합성함으로써 수득하였다. 이는 bgl8 프로모터 및 chi1 터미네이터를 위한 40 bp 플랭크를 포함한다. bgl8 프로모터 서열은 서열 번호: 20의 4,110 내지 5,501번 위치에 상응한다. 3' 플랭크 서열은 서열 번호: 20의 5,510 내지 6,266번 위치에 상응한다. 상술된 단편 및 골격 벡터 pRS426는 깁슨 조립에 의해 함께 조립하여 3' 아암 벡터를 수득하였다.

니볼루맙 발현 플라스미드의 stt3 또는 cwh8 결실 각각을 수반하는 M3210 및 M3211 균주 내로의 형질전환, 및 형질전환체의 선택은 50 mg/l의 하이그로마이신을 함유하는 선택 배지에서 수행하였다. 형질전환체를 PCR로 스크리닝(screening)하여 클론을 발견하였고, 여기서 cbh1 유전자는 작제물에 의해 대체되었다. 스크리닝을 위해 사용된 프라이머는 표 2에 나타낸다. 서열 번호: 21 및 서열 번호: 22로 제시된 프라이머를 사용하여 정확한 통합이 cbh1 유전자의 5' 말단에서 일어났음을 입증하였다. 3592 bp 단편의 증폭은 유전자의 5' 말단에서 cbh1 유전자자리로의 성공적인 통합을 나타내었다. 서열 번호: 23 및 서열 번호: 24로서 제시된 프라이머를 사용하여 cbh1 유전자의 3' 말단에서 정확한 통합을 입증하였다. 1477 bp 단편의 증폭은 유전자의 3' 말단에서 cbh1 유전자자리로의 성공적인 통합을 나타내었다. 프라이머 서열 번호: 25 및 서열 번호: 26을 사용하여 cbh1 개방 판독 프레임(open reading frame)으로부터 500 bp 단편의 증폭이 없음을 입증함으로써 cbh1 유전자의 완전한 결실을 입증하였다.

[표 2]

작제된 C1 균주를 24-웰 플레이트 속에서 실시예 1에서와 같은 액체 배지 속에서 성장시켰다. 균사체를 250 ㎕의 샘플을 0.65 ㎛ MultiScreen 여과기 플레이트(Merck Millipore)를 통해 3500 RPM에서 10분 동안 원심분리하여 제거하여다. 형질전환체에 의한 니볼루맙의 생산을 웨스턴 블롯 분석(Western blot analysis)으로 확인하였다. 니볼루맙을 생산하는 것으로 밝혀진 형질전환체를 다음과 같이 선택 배지 플레이트 상에서 단일 콜로니 플레이팅(plating)을 통해 정제하였다. 스트리크(streak)으로부터의 균사체를 800 ㎕의 0.9 % NaCl - 0.025% 트윈(Tween) 20 용액 속에 현탁시켰다. 단일 콜로니를 0.9% NaCl - 0.025% 트윈 20 용액에 현탁액의 상이한 희석물을 제조하고 선택 배지 상에 100 ㎕의 희석물을 플레이팅함으로써 제조하였다. 정제된 형질전환체에 의한 니볼루맙의 생산을 실시예 1에서와 같이 수행된 24-웰 플레이트 배양에 이은 웨스턴 블롯 분석으로 입증하였다.

cbh1 유전자자리내로의 발현 작제물의 통합에 대해 양성이고 니볼루맙 중쇄 및 경쇄를 생산하는 stt3 결실 균주 M3210의 정제된 형질전환체를 -80℃에서 저장하고 균주 번호 M3480을 지정하였다. 발현 작제물의 cbh1 유전자자리내로의 통합에 대해 양성이고 니볼루맙의 중쇄 및 경쇄 둘 다를 생산하는, cwh8 결실 균주 M3211의 형질전환체를 -80℃에서 저장하고 균주 번호 M3481을 제공하였다.

균주 M3480 및 M3481을 1 L의 생물반응기 속에서 공급-배치 공정으로 효모 추출물 및 탄소원으로서 글루코스를 함유하는 배지 속에서 7일 동안 성장시켰다. 균주에 의해 생산된 니볼루맙을 1 ml의 MabSelect SuRe 단백질 A 컬럼(GE Healthcare)을 통해 단백질 정제 시스템(GE Healthcare)을 사용하여 정제하였다. 정제된 항체로부터의 글리칸 분석을 GlycoWorks^TM RapiFluor-MS^TM N-글리칸 키트(Waters)를 사용하여 제조업자의 프로토콜에 따라 수행하였다. 비-글리코 변형된 균주 M3242의 발효 상층액으로부터 정제된 니볼루맙을 글리칸 분석에서 대조군으로서 사용하였다. N-글리칸은 m3480 배양 상층액으로부터 정제된 니볼루맙으로부터 검출될 수 없었지만 대조군 균주로부터 정제된 니볼루맙은 정상적인 c1 글리칸 패턴을 나타내었다(도 4a 및 4b). cwh8 결실 균주 M3481 배양 상층액으로부터 정제된 니볼루맙으로부터의 N-글리칸의 양은 대조군 균주로부터 정제된 니볼루맙의 N-글리칸 양의 대략 11%이었다(도 5a 및 5b).

정제된 니볼루맙에 대한 펩타이드 맵핑(mapping)을 다음의 방법에 따라 수행하였다. 100 ㎍의 샘플은 50 mM 중탄산암모늄으로 Vivaspin 500(10,000 MWCO, PES, Sartorius)에 의해 3회 교환한 제1의 완충제이었다. 라피게스트(Rapigest) SF(Waters)를 0.1%의 최종 농도로 및 디티오트레이톨(DTT)을 5 mM의 최종 농도로 가하였다. 샘플을 60℃에서 40분 동안 항온처리하였다. 다음에, 요오도아세트아미드(IAM)를 15 mM의 최종 농도로 가하고 샘플을 실온에서 40분 동안 암실에서 항온처리하였다. 트립신(Promega) 용액을 각각의 샘플에 1:50(w/w)의 최종 프로테아제:단백질 비 또는 또는 50 ㎍의 단백질에 대해 1 ㎕ 트립신(1 ㎍/ml)의 비로 가하였다. 샘플을 37℃에서 밤새 항온처리하였다. 4 ㎕의 20% TFA를 가하여 반응을 중지시킨 후 샘플을 30분 동안 37℃에서 항온처리하고 5분 동안 10000 rpm에서 원심분리하였다. 최종적으로, 샘플을 SpeedVac으로 증발시키고 50 ㎕ Water/AcCN/TFA 20/80/0.1(v/v/v) 속에 재구성시켰다. 다음의 LC-MS 조건을 사용하였다: Acquity UHPLC system, Waters(Milford, 미국 매사추세츠주) 및 Waters Synapt G2-S MS 시스템(Milford, 미국 매사추세츠 주). 컬럼: 60℃에서 ACQUITY UPLC 당단백질 아미드 300A, 1.7um, 2.1x150mm(Waters). 용매: A 수 중 0.1% TFA 및 B 아세토니트릴 중 0.1% TFA. 구배 프로그램: 10% A로 0분, 50% A로 70분, 유동 속도 0.2 ml/min. 상용된 질량 분광법 매개변수는 25 V의 원뿔 전압(cone voltage) 및 3 kV의 모세관 전압(capillary voltage)을 사용하는 양성의 극성, 350℃의 탈용매화 온도, 및 120℃의 공급원 온도이었다. 데이타를 m/z 범위 50 내지 2000에서 MS^E 방식으로 에너지 램프(energy ramp) 25 내지 40 V를 사용하여 수집하였다. 데이타는 UNIFI 소프트웨어(Waters)를 사용하여 가공하였다.

당변형되지 않은 균주 M3242의 발효 상층액으로부터 정제된 니볼루맙을 펩타이드 맵핑 분석에서 대조군으로서 사용하였다. 펩타이드 맵핑 결과에 따르면, stt3 결실 균주 M3480에서 생산된 니볼루맙의 중쇄에 부착된 N-글리칸은 존재하지 않는다(표 3). N-글리코실화의 26.6% 만이 cwh8 결실 균주 M3481에서 생산된 니볼루맙의 중쇄로부터 검출된 반면(표 4) N-글리코실화의 95.8%는 당변형되지 않은 C1 균주 M3242내에서 생산된 니볼루맙의 중쇄로부터 검출되었다(표 5).

[표 3]

stt3 결실 균주 M3480에서 생산된 니볼루맙의 N-글리코실화를 지닌 펩타이드의 펩타이드 맵핑 결과

[표 4]

[표 5]

구체적인 구현예의 앞서의 설명은 본 발명의 일반적인 특성을 충분히 나타낼 것이므로, 다른 것을 현재의 지식을 적용하여 과도한 실험없이 및 일반적인 개념으로부터 벗어나지 않고 이러한 구체적인 구현예를 용이하게 변형시키고/시키거나 다양한 적용을 위해 개조할 수 있으므로, 이러한 개조 및 변형은 개시된 구현예의 등가물의 의미 및 범위 내에서 이해되는 것으로 의도된다. 본원에 사용된 어법 또는 전문용어는 설명의 목적이며 제한하는 것이 아님이 이해되어야 한다. 다양한 개시된 화학 구조 및 기능을 수행하기 위한 수단, 물질, 및 단계는 본 발명으로부터 벗어나지 않고 다양한 대안적인 형태를 취할 수 있다.

SEQUENCE LISTING <110> DYADIC INTERNATIONAL (USA), INC. <120> GENETICALLY-MODIFIED FILAMENTOUS FUNGI FOR PRODUCTION OF EXOGENOUS PROTEINS HAVING REDUCED OR NO N-LINKED GLYCOSYLATION <130> DYD/006 PCT <150> US 63/159492 <151> 2021-03-11 <160> 29 <170> PatentIn version 3.5 <210> 1 <211> 8247 <212> DNA <213> Artificial sequence <220> <223> Nucleic acids <400> 1 aggcgttttc gtgggtaatg ggatggttgt atctaggggc actcctggcg cggtttataa 60 aaacatttgg cactcaacac attgcatcat cccgggaatt ctgcttcagg gtttggggtg 120 ttatacgagg tcaatgattt ctcggtcccg gcttggtatc tataccactg ccgaatgaaa 180 gcgctgcgct gaacacccag cctcagacca ggccctcgtt ggtgatctac atccggtgat 240 gattgctggg attgtgtgcc ggcaattggg cctcgaccgc gtccagtgat ggatcagtga 300 acccagtcgc gagcgggttc gtagttcacc ttataccccg cctgagatat gatacagtta 360 cccaaagcca gggcgttcta ggtttgctcc atccgcgatc tgatgtgata gatccgtgcc 420 ccacacaatc gccaagagtc ccatcagatc aatggatctc tgttttccca aggttatgca 480 catatatatg gtcatggacc tggtgataga tccatcaaca tgagttgttt cgcagttctc 540 cgggagttac gcctcgcgga tcttcttaat cccagatctc tccctctgta tctttcggcc 600 tctgcattgc cacccctata cgaagtattg gaccctttgt actgcgtacg gatttggttt 660 tctgctcttt ctttggcccc tccaactttc tacatattaa tcggacttct gccgggcggt 720 gaagcgttga gcaacgaggc tgagtgggtc ttgggcgcga atcaagcatg ccaaggcgga 780 cccctggagc attccactcc agttgcatgc agaagctcca aactgtcctc tccaaaggcc 840 agagctcgct cgtctgcgct tgtccttggt gttagcctcc gacttcaact gggcgagagg 900 cagcaccaca ccccgcaaac gcaggccacc ggcgcgccgt tggcggtaac agcaggtgcc 960 gttcgctgct gctcggtcct tttcccgaaa gtaccctgcc ttcctggcct cgacctccgc 1020 ctgcggggct ctgggcactg tcaaactttc gcagttttgc acccgcagcg attcgagcgg 1080 gacccgcttc gccaacgcgg atcaggagag gtaaaagtct cccctgtcct ttctgccgga 1140 gcatcctccg tccgtcgttc gctggttgtt gtgtgtgtgt gtgtgtacag tactgtaggt 1200 acatagtgct caccccaggg catttcccca atccgcgatt gcgcatacca taggcgtcat 1260 ctgaatctgc gttacgtccg gataacacta cgcagtacga aggagtcggt gctactacgc 1320 ccgcaagttc aagtctacgg tgtggctaag gtgctcaagg gcatagttac acgcaccccg 1380 ggcgagcttc tcgcacctcg accctttgcc ggggcgtcac tggtccgaca actcataatc 1440 caccatcgct tgggcaggcc tgcatccccc gtgggtcgca tccaagccgc cggtaaatac 1500 cggccgacac acacacacac acacgcaccc tgtctagcgc gacgctacaa aagagaccgg 1560 caggcactcc ccgcgaccgc ttgttctggc catcccgtct ctcgcctctg cagttatcgc 1620 ctgcctcatc tctgcgtcct gataactttt gtcacctctg atcccccccc gacgagacgg 1680 tctcgccgac caggacccga gatggcggac cgccatccta ctctgtccca gtccttcgcc 1740 gagcgggcga agacggctag ccacccgctc acccgctacc tctttcggct catggacctc 1800 aaggcctcga acctgtgcct gagcgccgac gtgtccaccg cgcgcgagct tctgacgctg 1860 gccgaccggg tcggcccctc gatcgtcgtg ctcaagacgc actacgacct gatctcgggc 1920 tgggactaca acccgcaaac cggcaccggc gcgaagctgg ccgccctggc gaggaagcat 1980 ggcttcctca tctttgagga ccgcaagttt gtcgacattg gtaagacggt gcagatgcag 2040 tacacggctg gcactgcgcg cataatagag tgggcgcaca tcaccaacgc caacatcgac 2100 gccggcaagg acatggtgcg cgccatggcc gaggcggccg ccaagtggaa ggaacgcatc 2160 aactacgagg tcaagacctc cgtcacggtg ggcacgcccg tctcggacca gttcgacgat 2220 gcggaagagc aagcgcagtg gccgcagcac cagcagcacc agcaccagca ccagcaccag 2280 caacagcgag atgaaaaagg tgggccccgc aggctcggca ctcgggagga gcagcaccaa 2340 caggacaacg gagacggtga cggccggaaa gggagcattg tctcgatcac tacggtgacg 2400 cagtcatttg agcccgctca ctccccacgc ctgtccaaga gcaacgagct gggcgacgac 2460 gccgtcttcc ccggcatcga ggaggccccc gtcgaccgcg gcctgcttct gctcgcccag 2520 atgtcgtcca agggctgcct catgaccaag gagtacaccc aggcctgcgt cgaggccgcg 2580 cgcgagcata aggattttgt catgggcttc gtctcacagg agtcgctcaa ctcggccccg 2640 gacgacactt tcatccacat gacccccgga tgcaagcttc cgccgccagg cgaggacgaa 2700 gagagcggcc agatcgagtt taaacggcgc gccgctgttt cctgtgtgaa attgttatcc 2760 gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct ggggtgccta 2820 atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 2880 cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 2940 tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 3000 agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 3060 aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 3120 gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 3180 tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 3240 cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 3300 ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 3360 cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 3420 atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 3480 agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 3540 gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 3600 gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 3660 tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 3720 agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3780 gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 3840 aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 3900 aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 3960 ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 4020 gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 4080 aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 4140 ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 4200 tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 4260 ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 4320 cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 4380 agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 4440 gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 4500 gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 4560 acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 4620 acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 4680 agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 4740 aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 4800 gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 4860 tccccgaaaa gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca 4920 acgcgagagc gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat 4980 gcaacgcgaa agcgctattt taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa 5040 atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca 5100 gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta 5160 caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct 5220 cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg 5280 ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt 5340 cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc 5400 cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt 5460 gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact 5520 acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta 5580 ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga 5640 gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac 5700 agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatat 5760 tttagtagct cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg 5820 cttttggttt tcaaaagcgc tctgaagttc ctatactttc tagagaatag gaacttcgga 5880 ataggaactt caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc 5940 acatacagct cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat atatatatac 6000 atgagaagaa cggcatagtg cgtgtttatg cttaaatgcg tacttatatg cgtctattta 6060 tgtaggatga aaggtagtct agtacctcct gtgatattat cccattccat gcggggtatc 6120 gtatgcttcc ttcagcacta ccctttagct gttctatatg ctgccactcc tcaattggat 6180 tagtctcatc cttcaatgct atcatttcct ttgatattgg atcatactaa gaaaccatta 6240 ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt 6300 tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc 6360 tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt 6420 gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg caccatacca 6480 cagcttttca attcaattca tcattttttt tttattcttt tttttgattt cggtttcttt 6540 gaaatttttt tgattcggta atctccgaac agaaggaaga acgaaggaag gagcacagac 6600 ttagattggt atatatacgc atatgtagtg ttgaagaaac atgaaattgc ccagtattct 6660 taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta 6720 catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta tttaatatca 6780 tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc aaggaattac 6840 tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat gtggatatct 6900 tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc gccaagtaca 6960 attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc aaattgcagt 7020 actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca cacggtgtgg 7080 tgggcccagg tattgttagc ggtttgaagc aggcggcaga agaagtaaca aaggaaccta 7140 gaggcctttt gatgttagca gaattgtcat gcaagggctc cctatctact ggagaatata 7200 ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc tttattgctc 7260 aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca cccggtgtgg 7320 gtttagatga caagggagac gcattgggtc aacagtatag aaccgtggat gatgtggtct 7380 ctacaggatc tgacattatt attgttggaa gaggactatt tgcaaaggga agggatgcta 7440 aggtagaggg tgaacgttac agaaaagcag gctgggaagc atatttgaga agatgcggcc 7500 agcaaaacta aaaaactgta ttataagtaa atgcatgtat actaaactca caaattagag 7560 cttcaattta attatatcag ttattaccct atgcggtgtg aaataccgca cagatgcgta 7620 aggagaaaat accgcatcag gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa 7680 atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata 7740 aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac 7800 tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc 7860 cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa 7920 atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg 7980 cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg 8040 tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcgc 8100 gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 8160 tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 8220 ggttttccca gtcacgacgg tttaaac 8247 <210> 2 <211> 8245 <212> DNA <213> Artificial sequence <220> <223> Nucleic acids <400> 2 gaacctgtgc ctgagcgccg acgtgtccac cgcgcgcgag cttctgacgc tggccgaccg 60 ggtcggcccc tcgatcgtcg tgctcaagac gcactacgac ctgatctcgg gctgggacta 120 caacccgcaa accggcaccg gcgcgaagct ggccgccctg gcgaggaagc atggcttcct 180 catctttgag gaccgcaagt ttgtcgacat tggtaagacg gtgcagatgc agtacacggc 240 tggcactgcg cgcataatag agtgggcgca catcaccaac gccaacatcg acgccggcaa 300 ggacatggtg cgcgccatgg ccgaggcggc cgccaagtgg aaggaacgca tcaactacga 360 ggtcaagacc tccgtcacgg tgggcacgcc cgtctcggac cagttcgacg atgcggaaga 420 gcaagcgcag tggccgcagc accagcagca ccagcaccag caccagcacc agcaacagcg 480 agatgaaaaa ggtgggcccc gcaggctcgg cactcgggag gagcagcacc aacaggacaa 540 cggagacggt gacggccgga aagggagcat tgtctcgatc actacggtga cgcagtcatt 600 tgagcccgct cactccccac gcctgtccaa gagcaacgag ctgggcgacg acgccgtctt 660 ccccggcatc gaggaggccc ccgtcgaccg cggcctgctt ctgctcgccc agatgtcgtc 720 caagggctgc ctcatgacca aggagtacac ccaggcctgc gtcgaggccg cgcgcgagca 780 taaggatttt gtcatgggct tcgtctcaca ggagtcgctc aactcggccc cggacgacac 840 tttcatccac atgacccccg gatgcaagct tccgccgcca ggcgaggacg aagagagcgg 900 ccagatcgag ggcgacggcc tcggccagca gtacaactcg cccagcaagt tgatcaacat 960 ttgcggcacc gacattgtca tcgtagggcg tggcatcacc gccgccggcg acccgccctc 1020 cgaggctgag aggtacagga gaaaagcctg gaaggcctat ctggcgcgtc tggcgtgatt 1080 tggggggagg gggagaggag atgggggacg ggaggggtcg ccttggtcag tcttgtgcgt 1140 gtcctgcagc ggattcgtca ccggggcagc acccaaaaga gggagaaaaa ggggaaaaaa 1200 aataaataaa taaaaagggt taagttgttg aaaaaagtgt tgtgagctct ctggcaaggc 1260 gcgcccccca cacaatcgcc aagagtccca tcagatcaat ggatctctgt tttcccaagg 1320 ttatgcacat atatatggtc atggacctgg tgatagatcc atcaacatga gttgtttcgc 1380 agttctccgg gagttacgcc tcgcggatct tcttaatccc agatctctcc ctctgtatct 1440 ttcggcctct gcattgccac ccctatacga agtattggac cctttgtact gcgtacggat 1500 ttggttttct gctctttctt tggcccctcc aactttctac atattaatcg gacttctgcc 1560 gggcggtgaa gcgttgagca acgaggctga gtgggtcttg ggcgcgaatc aagcatgcca 1620 aggcggaccc ctggagcatt ccactccagt tgcatgcaga agctccaaac tgtcctctcc 1680 aaaggccaga gctcgctcgt ctgcgcttgt ccttggtgtt agcctccgac ttcaactggg 1740 cgagaggcag caccacaccc cgcaaacgca ggccaccatt taaataaagg tcagcagcgg 1800 gtggatttgt gtacaaagaa gtatgttaga gttgattctt ttattttgcg acatgcggat 1860 tgggaaaagg gcatcgggtc ggtcgtattg tgtacaacac aagcacgttg attgcgctac 1920 atggtgccac agaacacatg gttgaaagtg acctcgtcca acggcggctc caactgtgag 1980 caaccagcca aatgtgcatt catcgtcgcg cccgaacaga gatcgaagtg tcgaagaaga 2040 agcggcagcg atttgcgcga tttccagcca tggtaagtaa acaaggaaaa aaaaaaaaag 2100 ggggggggga cagcaggcgt tgctgttaaa gtgtcaagaa gcgctcaatg atttctgcct 2160 ctctcatgag tcttcctcgc cctatgattt ctgcctctct catgagtctt cctcgccctt 2220 tgacagctcc caccactgcg ggttctttac cagcctttca actgatctct ttcatcccat 2280 tagcatgcaa caggtcccgt gggcctaggc gcccgggcga aatttcagtg cagcatttga 2340 gatgagccca gttcgcacaa ctttgcccat acgggaacat tccctgcttg ttgcgtttgt 2400 tcttatagcc tacctatcag ccattccatc ctctcacagc tgttcccgct gctcaacttc 2460 gtttccttcc tcctctccct acataacctg ccgattctgt tcggacctac ggattcctac 2520 aatagtgtag tcaacgaact ctggctaccg gaccgcaaga tgcatttcag tgtgtaagtc 2580 agtctcatgg gtttgctggt ttcctttccc ttcgagacag gtcgctagtt tcttccgttc 2640 gctagctttc tgccaggagg ccaggagggc tcccaagacg ttccgccatg gctacattgc 2700 tcctcgctga ctgttgttta aacgctgttt cctgtgtgaa attgttatcc gctcacaatt 2760 ccacacaaca taggagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagg 2820 taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 2880 cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 2940 tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 3000 gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 3060 atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 3120 ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 3180 cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 3240 tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 3300 gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 3360 aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 3420 tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 3480 aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 3540 aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 3600 ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 3660 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 3720 atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 3780 atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 3840 tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 3900 gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 3960 tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 4020 gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 4080 cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 4140 gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 4200 atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 4260 aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 4320 atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 4380 aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 4440 aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 4500 gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 4560 gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 4620 gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 4680 ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 4740 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 4800 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 4860 gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc 4920 gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa 4980 agcgctattt taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg 5040 agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac 5100 gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta caaaaatgca 5160 tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct cctttgtgcg 5220 ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg ttagaagaag 5280 gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt cccgcgttta 5340 ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc cgattatatt 5400 ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt gatgattctt 5460 cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact acgtatagga 5520 aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta ctacaatttt 5580 tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga gtttagatgc 5640 aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac agagatatat 5700 agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatat tttagtagct 5760 cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg cttttggttt 5820 tcaaaagcgc tctgaagttc ctatactttc tagagaatag gaacttcgga ataggaactt 5880 caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc acatacagct 5940 cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat atatatatac atgagaagaa 6000 cggcatagtg cgtgtttatg cttaaatgcg tacttatatg cgtctattta tgtaggatga 6060 aaggtagtct agtacctcct gtgatattat cccattccat gcggggtatc gtatgcttcc 6120 ttcagcacta ccctttagct gttctatatg ctgccactcc tcaattggat tagtctcatc 6180 cttcaatgct atcatttcct ttgatattgg atcatactaa gaaaccatta ttatcatgac 6240 attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga 6300 cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 6360 tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg 6420 gcttaactat gcggcatcag agcagattgt actgagagtg caccatacca cagcttttca 6480 attcaattca tcattttttt tttattcttt tttttgattt cggtttcttt gaaatttttt 6540 tgattcggta atctccgaac agaaggaaga acgaaggaag gagcacagac ttagattggt 6600 atatatacgc atatgtagtg ttgaagaaac atgaaattgc ccagtattct taacccaact 6660 gcacagaaca aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga 6720 acgtgctgct actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa 6780 gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt 6840 tgaagcatta ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt 6900 ttccatggag ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact 6960 cttcgaagac agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg 7020 tgtatacaga atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg 7080 tattgttagc ggtttgaagc aggcggcaga agaagtaaca aaggaaccta gaggcctttt 7140 gatgttagca gaattgtcat gcaagggctc cctatctact ggagaatata ctaagggtac 7200 tgttgacatt gcgaagagcg acaaagattt tgttatcggc tttattgctc aaagagacat 7260 gggtggaaga gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga 7320 caagggagac gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc 7380 tgacattatt attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg 7440 tgaacgttac agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta 7500 aaaaactgta ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta 7560 attatatcag ttattaccct atgcggtgtg aaataccgca cagatgcgta aggagaaaat 7620 accgcatcag gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa atttttgtta 7680 aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga 7740 atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac tattaaagaa 7800 cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga 7860 accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa atcggaaccc 7920 taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga 7980 agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg 8040 cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcgc gccattcgcc 8100 attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 8160 gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 8220 gtcacgacgg gcgcgccgtt taaac 8245 <210> 3 <211> 8317 <212> DNA <213> Artificial sequence <220> <223> Nucleic acids <400> 3 atagcgcgat ctgtgcctcc ttgtatgtat gtatgtagtc cgtacaacat acagtactat 60 acgggacacg cattccatag agcggattac actagaactg cccattctgc gaacctgaga 120 accaaggtca cataccacgt tcttgatttg agatttccac aaatacatcg ttcgcacgtt 180 ggccttctgt ctgacttaga acgccaagta accgtctcta aaagcgctta gggcctagaa 240 gctgcgcaag taccctacaa gtatgctttg tatgtacata catacataca tacctacgtc 300 catcaggtat gtacctaagt caggtcgctt gagggccttc catacttggg agaagcggat 360 gcaattaccc acatgataat agaggcacct acagaccgcc cacaattgtg tagttttggc 420 aagcttcgtc actcagcact cctttattct cttctttaat gaattatatg aagaactatc 480 agtcaagtaa cccagtgcat tgtgtgagat caatacgata tgcagtgaaa ggtgcattta 540 ccgacttagc gcatcacgcg ggaatgggtg gagtactacg gataccgcta cgagttggag 600 gtacagtagt taccccgggg ggaaggggtt ggcggtttgg gggtttggcc tctgccgatt 660 ggccaacttc tgccaaggcc ggcctttctg ccgttcacat ttcaacggcg aagggcagct 720 gcttgaaaca aacttcggcc cctaacgacg gcgcacgcaa actcgcggta accacttacc 780 cggccaggcc aactgatatg agggcttgaa agagccaaac caacgatgca gcgaactaac 840 aagcagcgct gctgataaaa cgatcagaaa gagcctcgac ctctctcctt tttttctaga 900 gccgtgcgca tacttcttgc tgctcgcaac caacaacaac agtacagaac acaacaaaat 960 agcagagttc cgagaaacag tgcagaagag agttgccacc ggcgcgccgt tggcggtaac 1020 agcaggtgcc gttcgctgct gctcggtcct tttcccgaaa gtaccctgcc ttcctggcct 1080 cgacctccgc ctgcggggct ctgggcactg tcaaactttc gcagttttgc acccgcagcg 1140 attcgagcgg gacccgcttc gccaacgcgg atcaggagag gtaaaagtct cccctgtcct 1200 ttctgccgga gcatcctccg tccgtcgttc gctggttgtt gtgtgtgtgt gtgtgtacag 1260 tactgtaggt acatagtgct caccccaggg catttcccca atccgcgatt gcgcatacca 1320 taggcgtcat ctgaatctgc gttacgtccg gataacacta cgcagtacga aggagtcggt 1380 gctactacgc ccgcaagttc aagtctacgg tgtggctaag gtgctcaagg gcatagttac 1440 acgcaccccg ggcgagcttc tcgcacctcg accctttgcc ggggcgtcac tggtccgaca 1500 actcataatc caccatcgct tgggcaggcc tgcatccccc gtgggtcgca tccaagccgc 1560 cggtaaatac cggccgacac acacacacac acacgcaccc tgtctagcgc gacgctacaa 1620 aagagaccgg caggcactcc ccgcgaccgc ttgttctggc catcccgtct ctcgcctctg 1680 cagttatcgc ctgcctcatc tctgcgtcct gataactttt gtcacctctg atcccccccc 1740 gacgagacgg tctcgccgac caggacccga gatggcggac cgccatccta ctctgtccca 1800 gtccttcgcc gagcgggcga agacggctag ccacccgctc acccgctacc tctttcggct 1860 catggacctc aaggcctcga acctgtgcct gagcgccgac gtgtccaccg cgcgcgagct 1920 tctgacgctg gccgaccggg tcggcccctc gatcgtcgtg ctcaagacgc actacgacct 1980 gatctcgggc tgggactaca acccgcaaac cggcaccggc gcgaagctgg ccgccctggc 2040 gaggaagcat ggcttcctca tctttgagga ccgcaagttt gtcgacattg gtaagacggt 2100 gcagatgcag tacacggctg gcactgcgcg cataatagag tgggcgcaca tcaccaacgc 2160 caacatcgac gccggcaagg acatggtgcg cgccatggcc gaggcggccg ccaagtggaa 2220 ggaacgcatc aactacgagg tcaagacctc cgtcacggtg ggcacgcccg tctcggacca 2280 gttcgacgat gcggaagagc aagcgcagtg gccgcagcac cagcagcacc agcaccagca 2340 ccagcaccag caacagcgag atgaaaaagg tgggccccgc aggctcggca ctcgggagga 2400 gcagcaccaa caggacaacg gagacggtga cggccggaaa gggagcattg tctcgatcac 2460 tacggtgacg cagtcatttg agcccgctca ctccccacgc ctgtccaaga gcaacgagct 2520 gggcgacgac gccgtcttcc ccggcatcga ggaggccccc gtcgaccgcg gcctgcttct 2580 gctcgcccag atgtcgtcca agggctgcct catgaccaag gagtacaccc aggcctgcgt 2640 cgaggccgcg cgcgagcata aggattttgt catgggcttc gtctcacagg agtcgctcaa 2700 ctcggccccg gacgacactt tcatccacat gacccccgga tgcaagcttc cgccgccagg 2760 cgaggacgaa gagagcggcc agatcgagtt taaacggcgc gccgctgttt cctgtgtgaa 2820 attgttatcc gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct 2880 ggggtgccta atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc 2940 agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 3000 gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 3060 ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 3120 gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 3180 aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 3240 gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 3300 ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 3360 cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 3420 cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 3480 gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 3540 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 3600 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 3660 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 3720 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 3780 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 3840 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 3900 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 3960 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 4020 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 4080 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 4140 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 4200 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 4260 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 4320 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 4380 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 4440 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 4500 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 4560 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 4620 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 4680 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 4740 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 4800 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 4860 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 4920 cgcgcacatt tccccgaaaa gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa 4980 caaaaatgca acgcgagagc gctaattttt caaacaaaga atctgagctg catttttaca 5040 gaacagaaat gcaacgcgaa agcgctattt taccaacgaa gaatctgtgc ttcatttttg 5100 taaaacaaaa atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt 5160 ttacagaaca gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt 5220 ttttgttcta caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta 5280 ctttttttct cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg 5340 tccgttaagg ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct 5400 gactccactt cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata 5460 aaggcatccc cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag 5520 tgatagcgtt gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc 5580 tctatatact acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga 5640 atagttctta ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg 5700 tagaggtcga gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg 5760 gatatagcac agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta 5820 ttcgcaatat tttagtagct cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt 5880 cttcagagcg cttttggttt tcaaaagcgc tctgaagttc ctatactttc tagagaatag 5940 gaacttcgga ataggaactt caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg 6000 cgagctgcgc acatacagct cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat 6060 atatatatac atgagaagaa cggcatagtg cgtgtttatg cttaaatgcg tacttatatg 6120 cgtctattta tgtaggatga aaggtagtct agtacctcct gtgatattat cccattccat 6180 gcggggtatc gtatgcttcc ttcagcacta ccctttagct gttctatatg ctgccactcc 6240 tcaattggat tagtctcatc cttcaatgct atcatttcct ttgatattgg atcatactaa 6300 gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 6360 ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 6420 acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 6480 gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 6540 caccatacca cagcttttca attcaattca tcattttttt tttattcttt tttttgattt 6600 cggtttcttt gaaatttttt tgattcggta atctccgaac agaaggaaga acgaaggaag 6660 gagcacagac ttagattggt atatatacgc atatgtagtg ttgaagaaac atgaaattgc 6720 ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg 6780 tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta 6840 tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc 6900 aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat 6960 gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc 7020 gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc 7080 aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca 7140 cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcaga agaagtaaca 7200 aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc cctatctact 7260 ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc 7320 tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca 7380 cccggtgtgg gtttagatga caagggagac gcattgggtc aacagtatag aaccgtggat 7440 gatgtggtct ctacaggatc tgacattatt attgttggaa gaggactatt tgcaaaggga 7500 agggatgcta aggtagaggg tgaacgttac agaaaagcag gctgggaagc atatttgaga 7560 agatgcggcc agcaaaacta aaaaactgta ttataagtaa atgcatgtat actaaactca 7620 caaattagag cttcaattta attatatcag ttattaccct atgcggtgtg aaataccgca 7680 cagatgcgta aggagaaaat accgcatcag gaaattgtaa acgttaatat tttgttaaaa 7740 ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 7800 atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 7860 aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 7920 ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt 7980 aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg 8040 gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca 8100 agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag 8160 ggcgcgtcgc gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 8220 gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 8280 gtaacgccag ggttttccca gtcacgacgg tttaaac 8317 <210> 4 <211> 8503 <212> DNA <213> Artificial sequence <220> <223> Nucleic acids <400> 4 gaacctgtgc ctgagcgccg acgtgtccac cgcgcgcgag cttctgacgc tggccgaccg 60 ggtcggcccc tcgatcgtcg tgctcaagac gcactacgac ctgatctcgg gctgggacta 120 caacccgcaa accggcaccg gcgcgaagct ggccgccctg gcgaggaagc atggcttcct 180 catctttgag gaccgcaagt ttgtcgacat tggtaagacg gtgcagatgc agtacacggc 240 tggcactgcg cgcataatag agtgggcgca catcaccaac gccaacatcg acgccggcaa 300 ggacatggtg cgcgccatgg ccgaggcggc cgccaagtgg aaggaacgca tcaactacga 360 ggtcaagacc tccgtcacgg tgggcacgcc cgtctcggac cagttcgacg atgcggaaga 420 gcaagcgcag tggccgcagc accagcagca ccagcaccag caccagcacc agcaacagcg 480 agatgaaaaa ggtgggcccc gcaggctcgg cactcgggag gagcagcacc aacaggacaa 540 cggagacggt gacggccgga aagggagcat tgtctcgatc actacggtga cgcagtcatt 600 tgagcccgct cactccccac gcctgtccaa gagcaacgag ctgggcgacg acgccgtctt 660 ccccggcatc gaggaggccc ccgtcgaccg cggcctgctt ctgctcgccc agatgtcgtc 720 caagggctgc ctcatgacca aggagtacac ccaggcctgc gtcgaggccg cgcgcgagca 780 taaggatttt gtcatgggct tcgtctcaca ggagtcgctc aactcggccc cggacgacac 840 tttcatccac atgacccccg gatgcaagct tccgccgcca ggcgaggacg aagagagcgg 900 ccagatcgag ggcgacggcc tcggccagca gtacaactcg cccagcaagt tgatcaacat 960 ttgcggcacc gacattgtca tcgtagggcg tggcatcacc gccgccggcg acccgccctc 1020 cgaggctgag aggtacagga gaaaagcctg gaaggcctat ctggcgcgtc tggcgtgatt 1080 tggggggagg gggagaggag atgggggacg ggaggggtcg ccttggtcag tcttgtgcgt 1140 gtcctgcagc ggattcgtca ccggggcagc acccaaaaga gggagaaaaa ggggaaaaaa 1200 aataaataaa taaaaagggt taagttgttg aaaaaagtgt tgtgagctct ctggcaaggc 1260 gcgcctgtgt gagatcaata cgatatgcag tgaaaggtgc atttaccgac ttagcgcatc 1320 acgcgggaat gggtggagta ctacggatac cgctacgagt tggaggtaca gtagttaccc 1380 cggggggaag gggttggcgg tttgggggtt tggcctctgc cgattggcca acttctgcca 1440 aggccggcct ttctgccgtt cacatttcaa cggcgaaggg cagctgcttg aaacaaactt 1500 cggcccctaa cgacggcgca cgcaaactcg cggtaaccac ttacccggcc aggccaactg 1560 atatgagggc ttgaaagagc caaaccaacg atgcagcgaa ctaacaagca gcgctgctga 1620 taaaacgatc agaaagagcc tcgacctctc tccttttttt ctagagccgt gcgcatactt 1680 cttgctgctc gcaaccaaca acaacagtac agaacacaac aaaatagcag agttccgaga 1740 aacagtgcag aagagagttg ccaccattta aatggatccc ggttagagca ggtgggaaac 1800 catttgtgaa tgggttggca tgagggctca aatgcaagta atctatttac tctctctaat 1860 cgatgcaaat agtttcgacc gttcctgata aagcacatta caactcagct ctacttttta 1920 tcaacatttg aagcactgac tcgtccaaat aaaccgctgc tgtctcatcg gcttgccccg 1980 gaaccacaag tagcacggtt tcgacatctt accggtgata cacaccggga ttgtcatacc 2040 gatacccggc actaccattc gggtaactcc cgagcggaat gtcattgccg gcgccatacg 2100 gtgacttggt cgagccgttg cccaacccgc catacccgcc gccgctgccc acccgggtct 2160 gctcggtcgc atagctattg cgcagatcct ccggggtaga gtgctggggc agcgcgttgg 2220 gatccggaat gccgtccacc ggtgcagtgc gcttccggcc gaggccgaac cagttaaagc 2280 gcttgcggcg gccgtagccc tcggtgtagt tgttggccgg ggacgggccg aagcgcgcct 2340 ccttacggcg gtggcgaacg agggccaggc taacgaacgg agtgatggcg aacaagatgc 2400 tatcgtcaac tcacatgtca gcctacgaga ggtattctcg tcgagggaag ggaaagaggg 2460 ccggggggag ggggaaggga ggaaatgagg acgtacactg caacgatcga tactgccaaa 2520 catgccgact ccatcttgca agccgtcctc aaactaggca gcgccgtaaa cccgccgctg 2580 ccgttatcca ccacattggt attcgcatct cctttgccat acaccgtgtc gacctccccg 2640 ttacaagacg acgccccgcc gcggttcgca gtagcaatgt aaatgaagcc gccgatgaag 2700 gccacatcga ggaccatcgt gatgaatgac gggaatgagc ggccgggtac gcagcagagc 2760 atgagcaggg caaggatagt gtagaggaca ccaacgccag agatgcctgc gaccgcccgt 2820 gcccaagtag ggatgtgcat attatggttg gtaagagtcg cgagaaagta ggagaagagc 2880 gcgagcacga tcgcggcgca gcagaactga atggctcgca agaggaacat caagccccga 2940 agggcaatgc ctttggccgc gcccatggcg ttggtttaaa cgctgtttcc tgtgtgaaat 3000 tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg taaagcctgg 3060 ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc cgctttccag 3120 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 3180 ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 3240 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 3300 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 3360 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 3420 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 3480 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 3540 tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 3600 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 3660 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 3720 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 3780 ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 3840 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 3900 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 3960 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 4020 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 4080 taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 4140 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 4200 gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 4260 gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 4320 ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 4380 attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 4440 gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 4500 tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 4560 agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 4620 gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 4680 actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 4740 tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 4800 attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 4860 tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 4920 tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 4980 aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 5040 tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 5100 cgcacatttc cccgaaaagt gccacctgaa cgaagcatct gtgcttcatt ttgtagaaca 5160 aaaatgcaac gcgagagcgc taatttttca aacaaagaat ctgagctgca tttttacaga 5220 acagaaatgc aacgcgaaag cgctatttta ccaacgaaga atctgtgctt catttttgta 5280 aaacaaaaat gcaacgcgag agcgctaatt tttcaaacaa agaatctgag ctgcattttt 5340 acagaacaga aatgcaacgc gagagcgcta ttttaccaac aaagaatcta tacttctttt 5400 ttgttctaca aaaatgcatc ccgagagcgc tatttttcta acaaagcatc ttagattact 5460 ttttttctcc tttgtgcgct ctataatgca gtctcttgat aactttttgc actgtaggtc 5520 cgttaaggtt agaagaaggc tactttggtg tctattttct cttccataaa aaaagcctga 5580 ctccacttcc cgcgtttact gattactagc gaagctgcgg gtgcattttt tcaagataaa 5640 ggcatccccg attatattct ataccgatgt ggattgcgca tactttgtga acagaaagtg 5700 atagcgttga tgattcttca ttggtcagaa aattatgaac ggtttcttct attttgtctc 5760 tatatactac gtataggaaa tgtttacatt ttcgtattgt tttcgattca ctctatgaat 5820 agttcttact acaatttttt tgtctaaaga gtaatactag agataaacat aaaaaatgta 5880 gaggtcgagt ttagatgcaa gttcaaggag cgaaaggtgg atgggtaggt tatataggga 5940 tatagcacag agatatatag caaagagata cttttgagca atgtttgtgg aagcggtatt 6000 cgcaatattt tagtagctcg ttacagtccg gtgcgttttt ggttttttga aagtgcgtct 6060 tcagagcgct tttggttttc aaaagcgctc tgaagttcct atactttcta gagaatagga 6120 acttcggaat aggaacttca aagcgtttcc gaaaacgagc gcttccgaaa atgcaacgcg 6180 agctgcgcac atacagctca ctgttcacgt cgcacctata tctgcgtgtt gcctgtatat 6240 atatatacat gagaagaacg gcatagtgcg tgtttatgct taaatgcgta cttatatgcg 6300 tctatttatg taggatgaaa ggtagtctag tacctcctgt gatattatcc cattccatgc 6360 ggggtatcgt atgcttcctt cagcactacc ctttagctgt tctatatgct gccactcctc 6420 aattggatta gtctcatcct tcaatgctat catttccttt gatattggat catactaaga 6480 aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 6540 cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 6600 agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 6660 tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 6720 ccataccaca gcttttcaat tcaattcatc attttttttt tattcttttt tttgatttcg 6780 gtttctttga aatttttttg attcggtaat ctccgaacag aaggaagaac gaaggaagga 6840 gcacagactt agattggtat atatacgcat atgtagtgtt gaagaaacat gaaattgccc 6900 agtattctta acccaactgc acagaacaaa aacctgcagg aaacgaagat aaatcatgtc 6960 gaaagctaca tataaggaac gtgctgctac tcatcctagt cctgttgctg ccaagctatt 7020 taatatcatg cacgaaaagc aaacaaactt gtgtgcttca ttggatgttc gtaccaccaa 7080 ggaattactg gagttagttg aagcattagg tcccaaaatt tgtttactaa aaacacatgt 7140 ggatatcttg actgattttt ccatggaggg cacagttaag ccgctaaagg cattatccgc 7200 caagtacaat tttttactct tcgaagacag aaaatttgct gacattggta atacagtcaa 7260 attgcagtac tctgcgggtg tatacagaat agcagaatgg gcagacatta cgaatgcaca 7320 cggtgtggtg ggcccaggta ttgttagcgg tttgaagcag gcggcagaag aagtaacaaa 7380 ggaacctaga ggccttttga tgttagcaga attgtcatgc aagggctccc tatctactgg 7440 agaatatact aagggtactg ttgacattgc gaagagcgac aaagattttg ttatcggctt 7500 tattgctcaa agagacatgg gtggaagaga tgaaggttac gattggttga ttatgacacc 7560 cggtgtgggt ttagatgaca agggagacgc attgggtcaa cagtatagaa ccgtggatga 7620 tgtggtctct acaggatctg acattattat tgttggaaga ggactatttg caaagggaag 7680 ggatgctaag gtagagggtg aacgttacag aaaagcaggc tgggaagcat atttgagaag 7740 atgcggccag caaaactaaa aaactgtatt ataagtaaat gcatgtatac taaactcaca 7800 aattagagct tcaatttaat tatatcagtt attaccctat gcggtgtgaa ataccgcaca 7860 gatgcgtaag gagaaaatac cgcatcagga aattgtaaac gttaatattt tgttaaaatt 7920 cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa taggccgaaa tcggcaaaat 7980 cccttataaa tcaaaagaat agaccgagat agggttgagt gttgttccag tttggaacaa 8040 gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg 8100 cgatggccca ctacgtgaac catcacccta atcaagtttt ttggggtcga ggtgccgtaa 8160 agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc 8220 gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaggg cgctggcaag 8280 tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg 8340 cgcgtcgcgc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 8400 ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 8460 aacgccaggg ttttcccagt cacgacgggc gcgccgttta aac 8503 <210> 5 <211> 20 <212> DNA <213> Primer <400> 5 ccgtcaaggt acgagaaacc 20 <210> 6 <211> 20 <212> DNA <213> Primer <400> 6 agtttgacag tgcccagagc 20 <210> 7 <211> 20 <212> DNA <213> primer <400> 7 ttcttaacac cgagggttgg 20 <210> 8 <211> 20 <212> DNA <213> Primer <400> 8 agcctggaag gcctatctgg 20 <210> 9 <211> 20 <212> DNA <213> Primer <400> 9 acaacaacct cttccctcct 20 <210> 10 <211> 18 <212> DNA <213> Primer <400> 10 tcgtgaaagc ctcctcca 18 <210> 11 <211> 18 <212> DNA <213> Primer <400> 11 acaacgaagc cattgcca 18 <210> 12 <211> 20 <212> DNA <213> Primer <400> 12 caaccatgta gccgtaggag 20 <210> 13 <211> 20 <212> DNA <213> Primer <400> 13 gtttcggttt ttgagaacgg 20 <210> 14 <211> 20 <212> DNA <213> Primer <400> 14 cgtcctaaag cgtccaatcg 20 <210> 15 <211> 20 <212> DNA <213> Primer <400> 15 ggtgacgtat ctgatgaggg 20 <210> 16 <211> 20 <212> DNA <213> Primer <400> 16 cacaaatctt cctcgaccac 20 <210> 17 <211> 20 <212> DNA <213> Primer <400> 17 gtggtcgagg aagatttgtg 20 <210> 18 <211> 20 <212> DNA <213> Primer <400> 18 tcacaaatgg tttcccacct 20 <210> 19 <211> 15882 <212> DNA <213> Artificial sequence <220> <223> Nucleic acids <400> 19 tgcgcaagcg cccttcatct cttcagccga gaatctgttg cctaattaca tagtagatgc 60 tgggaacagt ctgagaagcc tgcgcaggtt cttcattaat taccaagaac gcgggagagg 120 tgggaagacg ccgaaaactc gacgcggacc attcgctgtt ttccgatctt acaaaaaaaa 180 ggtatccgat ttggggaacg tcgatgaaag tattgcaaaa gtgacgagag ttgcgcaact 240 aactcgctgc cgaagaagct gcggaagaaa gagaacaccg aaagtggaat aacgttacgg 300 atgtcctgac ctcaaagttg aaaccagccc ttcctgctct atttgggaaa gcggcttgcc 360 cttgaatgcg ctgcactgtg gcacgactac cagtgatcgg gaggagcaaa ctaccctggt 420 ccgttccttg gtggggcggc actaggccca acttagggtg atcggaggtc gatgccgcgg 480 tcctcgttgg tctgggctct tctcatttcc cggtttgcac cccccgttgc acctgctgat 540 cgcccgccaa cgccgatgag gttgcgccca gaccgacaat caccgcggct gcattcccaa 600 gtatattgaa gatggcacca ggtacccggt tttgcgtccc agtcgtttgg tgccaaattt 660 gggagttttt gagcctcaag atctggggaa atcgacctca acttccatac aagttaaagt 720 cgcacacacg gcgagttcca cgaagagaca catttttttc tgaaggcctc tctccccgca 780 catcagaaac caccaaatac caagactgca gaagccgggg taagtgggcc accgggacta 840 cactaaaatg cggggagaag cgagatccgt tgcgaaggga agggatgggg tgtgctgcgg 900 ctttctccgc tctcgtgcgc cttttgcttg aatctagtgt acaccagggt aggctccgaa 960 ggagtatcta cggcagcgct gttcgtgctg cgttgagagt cagggcggag acgagcaggc 1020 gacaggagcc tcgcaccggc acttcggatc gcatttgcgc ggagcgtcaa atacgctctt 1080 ctgcggtcat cagagagcat cgtgaaccaa ggttcttccg cagggcggcc tgggcttcgc 1140 agagtcgcac tcggcggacg ccttccgtgt cacccctgat aacctggctg ccgcgcccag 1200 actcctccaa tgaggtgtgt ggttgccctc gccgaccctt cagcaacctt aatcgcttcc 1260 atcgcacggc tccacgtcct cgaacgatgc cctcagtccg tgcccggccg tggcaaccat 1320 aacgtgacat cgccgcccag cctactagcc gctatcgacc ggttaggctt gtcaccgcag 1380 cgcccattct ccatcgggcc tctactctga tccacctcac ccaccgcaag cactagcgag 1440 cctcaccaga gtgcaagcga cacgacccgc ttggcccttc gtccttgact atctcccaga 1500 cctcttgcca tcttgccgac gccgccccct tttttttctc ctccccctgc cggcaggtcg 1560 gtggccccag tcccgagatg gcattgctcc gttgtccatg acgacccatc attcgatggc 1620 tgactggcac actcgtcttg tttgagcatc gacggcccgc ggcccgtctc ccacggtacg 1680 gaacctcgtt gtacagtacc tctcgtaatg atacccaaca ccggggccga gcgctgggag 1740 ggcggcgttc ccgagaagcc gggaaggcgg ctggccggct gacctttgtg acttggcgat 1800 ggatgcggcc atggagaatg tccgtccgaa gcgacgcgac aattagcctg gctaccatcg 1860 atataaattg ggtgattccc agctcttgat gggcgtgtct tctgcctggc agccctcgtc 1920 ttcagatcaa gcaactgtgt gctgatcctc ttccgcccgc cggcgggttg ccacggtcac 1980 ggaatgatgg agcgggtctg acacaccaaa cactcgataa gcagagcggc gatgtccatg 2040 ctccggaaca gccagcccga gttgccgtcg cccatagtgt tccaagtaag cgtatgggac 2100 gagaagaaag aagagaaaag aagaagagag ccgcccggct cgttcagagt cggccgcacg 2160 gttcggtttc ctgggagcga agggacgtga atcgccagag cgaccgaggt ttagccacgg 2220 caagaaagca aaatccggag ttttgccaga gagggcgcgc atcgctaaag tgctccttgg 2280 cccggatgcg tctcgtctcg cctcagagag atggataccc cgtgccttgg ctagaaagcc 2340 tggcttgcga gatgctcctc tcggcgcggg cggcgtggtg ccgtggttcg tttgctgagc 2400 tagaacgacg cccctgcgcg tgaccagcgt gtttttggtt tgttcacccc cagaatcagc 2460 cgaggtttac ccagccggag cgctcgtcag gtccttcacg ggccgtggat ccggaaacta 2520 tgcgaaggtg gagagagcga ctcggagcga ctttcgcgat tattctggcg agttttcgag 2580 ggcgcggtaa ctgcgaaagc tgaccttctt caattcaatc aacaatggaa ggagaggtcg 2640 aattcggagg tttacccccc ccccgcgcca aaatagtctc tcccaggtgc ccatgtaagg 2700 cacgggaata cctgcctaac ttggggttgg gaaagaaaag aaaggcagga aaaaaataca 2760 ctatcatacc atgctcaagc tttctctttc cagaaacatg tgtttcgggt tctccttccg 2820 tgctcccaga gctggccctt tggcccgttg ggggttggcg gggcccaagg gtgcgctagt 2880 ggggctcctc agtctccgca atatcgtgca tcgcaacgcg caaggccctt gcccactatc 2940 aacagccccc cggattgctg accgttggcc attcacggcc cttcgtttgc cagtccttcg 3000 ccagggtcaa cctaccccgc ggtggggggt tgttcttgga tccttgtcga ggccccggct 3060 gcccacatcg cccacgctgt gcactcagcg taacacaggg cccggatctc tcaagcgatg 3120 cccagctttt tttcatcggt gttgacggtc cgaaactcgc gggagagatg ggggcagatc 3180 atggcgggaa acggccgtga tggttcctgg atataaagga gatcaggcct tccctcctcg 3240 gctcattggg gcctactagc acatcatcat ccgtcttcca tccctcctca gaacttcctt 3300 ccccttcctc ctatccacct ttcccttact cacacagaca atcgtccatc gtccaccatg 3360 tacgccaagt tcgccaccct ggccgccctg gtcgccggcg ccgccgccga gatcgtcctc 3420 acccagtcgc ccgccaccct ctccctgagc cccggcgagc gcgccaccct gtcctgccgc 3480 gcctcccagt cggtctcctc ctacctggcc tggtaccagc agaagcccgg ccaggccccc 3540 aggctcctga tctacgacgc ctcgaaccgc gccaccggca tccccgcccg cttcagcggc 3600 tcgggctccg gcaccgactt caccctcacc atcagctccc tggagcccga ggacttcgcc 3660 gtctactact gccagcagtc gagcaactgg ccccgcacct tcggccaggg caccaaggtc 3720 gagatcaagc gcaccgtcgc cgccccctcg gtcttcatct tcccgccctc ggacgagcag 3780 ctcaagtcgg gcaccgcctc cgtcgtctgc ctcctgaaca acttctaccc gcgcgaggcc 3840 aaggtccagt ggaaggtcga caacgccctc cagagcggca actcccagga gtcggtcacc 3900 gagcaggaca gcaaggactc cacctactcg ctgtcctcga ccctcaccct gagcaaggcc 3960 gactacgaga agcacaaggt ctacgcctgc gaggtcaccc accagggcct gagctccccc 4020 gtcaccaagt ccttcaaccg cggcgagtgc taaggcaggc aggagttgga gtatgagggt 4080 agccgctgat ggctattctt cccacgtttt tgtgtgtttc ctcttcattt ttttttctct 4140 tgccgcaaca tgacggctcc tgtctctgaa gggaacccct gaaattcagg gttatcatga 4200 cttggttacg aatgagctac gacatgttca attgagtgac tctttactac caaagtactg 4260 ctaccatgac actcgaatcg tctcgtgact gaaaggagaa tcatgttggc attggttcgc 4320 gtagtacgga gtaacgacaa cggcattggt caacatctgg caggtatttg aggtagaata 4380 taccaacctg cctgaggctc tcggtatcaa gatttggaag gccaaagggt tggatgagca 4440 cttgagagca aagtcggact actggctgaa gaaggtaaac aaactaacgt acagtaccta 4500 cttaacttat gatacacgtc cgcgcgcggg cgcgccttat cggacggcct gatttgcggc 4560 atgcctcatc gcggcgaaac tgctgataag acctgctgcc gcagtccgcc cattcctgtg 4620 tctgacgcac accgattggg gcatgtccgc ggaaaaagag acgatcctct ccactaggtg 4680 gtttccgcct ttaacggatc gaggaaacat tagttgttag tagtaacacg ccttgaacgc 4740 cttgatctcc ggggctcctc ctcggacgac cgcggaccgc cggtcagagt gggtgggtac 4800 accacactac acgatactat cgcgcatcgt cgttgtccct gctctctccc catatggcgt 4860 cacggggtag tatatattct acacggagct ggagccaagg caggcccacc gtacggatta 4920 caccgccatg gttccaagtt tcttcgccat tgaatctgtt attcgtgtac tagtagatca 4980 agccattgcc ggttgccgat atcatgcaac tccggtcagg ccacggagaa gccatgcccg 5040 ctacgggttg atgttccctg ttccctttca taaacgggaa taagacgaag tgcgcggcgg 5100 gagttgggag cccatacccg acctcgatgc tttccccggt tcttccattc cctagtacta 5160 gtgtagctat ttcagagtct tcatgccagc ccttccccgg aggcccctgg cgccccccca 5220 ccccttcctc tcctggcgag agtgcacaca gtctttttgt acagtcttgg tcccatctag 5280 tgggcgtttt ccccttcttt cgtccccatt gtccgtagag agagtgttgg gtccgaccgc 5340 ctaccgacga caatggagat ggcgccctcg acgacctcct cctcttcttc ccttgaaggg 5400 tccccgatga ccttcccatc acacctgccg ccaacccctc cgctgcagga ttttgacgaa 5460 tatcagaaac taggtctcag cctgccgaca gatggcctcg gacgatccgt ccctccgtac 5520 cctctccctc cgccgtcgag gcagaacaag gtgctgcccg aggacctcaa aacgccggat 5580 gaccacgtgg agcgggaccc ccgcctgatc cggctcaccg gagtccaccc cttcaacgtc 5640 gagccccccc tgaccgacct ctttgacgaa ggcttcctga ccaccaagga cctgcactac 5700 gtccgcaacc atggcgccgt cccccgggtc gaggactcat ccgtgctcga ctgggacttc 5760 accgtcgagg gcatggtcgc ccacccgatc acgctcacgc tgcgcgacct gatccggacg 5820 tacgaccagg tgacgtaccc ggtcaccctg gtgtgcgcgg gcaaccggcg caaggagcag 5880 aacgtggtgc gcaagaccaa gggtttctcg tggggtgccg ccggcctgtc gacggcgctg 5940 tggacgggcg tcgccctgcc cgacctcctc gcccgcgccg ccccgctgcg cggtgcgcgg 6000 tacgtctgct tcgagggcgc cgaccgcctg cccaacggct gctacggcac ctcggtccgc 6060 ctcggctggg ccacggaccc ggcgcgtggc atcatgctcg cccaccgcat gaacggcgag 6120 ccgctgcccc cggaccacgg caagcccctc cgcgtcatca tcccgggcca gatcggcggc 6180 aggagcgtca agtggctcaa gcgcatcatc gtcacggcga agcccagcga cagctggtac 6240 cacatctacg acaaccgcgt gctgcccacc gtgatcagcc ccgaggagag cgccgaccgg 6300 cccgacgtct ggaaggacga gcggtacgcc atctacgacc tcaacaccaa cagcgccatc 6360 tgctatccgg cgcacgacga gagggtgccg ctcgggatcg cgcgcgggga cgcggcgacg 6420 tacaagctgc gggggtacgc ctacgccggc ggcggcaaga gggtgacccg tctggaggtg 6480 acgctcgacc agggccggac gtggatgctg gcgaccatgt cgtacccgga agacctgtac 6540 cggctcgcgc ccgaggggga gacgctgttt ggcgggaggc tggacgtgtc ctggcgcgag 6600 acgtgcttct gctggtgctt ctggtcgctg gacgtgccgc tgtcgcggct gcgagacgcc 6660 cgcgacgtca tgatccgggc gatggacgag tccatgatgg tgcagccgcg ggacatgtac 6720 tggagcgtgc tgggcatgat gaacaaccca tggtaccggg tcgtcatcca caaggagagc 6780 gacacgttgc gattcgagca ccccacccag ccggcgctga tgcccggcgg ttggatggag 6840 cgggtcaaga aagaaggggg caaccttacc aatgggtttt ggggcgagaa ggtgggcggc 6900 caggacgcgg cgccggccga cgaggctccc gccgccaaag agatcagcat ggtaaacgag 6960 aaggtcaccc gccgcatcac ccccgaagaa ctccgccagc actcgggcga ggatgagccg 7020 tggttcgtcg tcaacggcca ggtctatgac ggcaccaagt tcctcgaagg ccatcccggc 7080 ggcgccgcct ccatcatcaa cgccgcggga caagacgtga gcgaggagtt cctcgcgatt 7140 cgtaagttgc cctccctcct tcctttcttc cccccctccc accccctctc ccttcttccc 7200 ttccaaattt atctcggcaa ccaaccctga cacggccaaa aaaaaaaaaa aaaaaacgaa 7260 acacagacag cgagaacgcc aaggccatga tgccgagtta ccacattggc acgctgccgg 7320 cctcggccga cctctccgag gagccctcgg acgaggcggt ctcctcctcc tccgccgtct 7380 tcctccaacc caaaacctgg cgccgcgccc tcctcgcctc caagacggcc gtatcaccgg 7440 acaccaaggt cttccacttc accctgccct cgccggcgca ggccgtcggc ctcccggtgg 7500 gccagcacct cctcgtccgc ctgcgcgacc cggtcacgcg cgaggccatc atccgcgcct 7560 acacgccgct gtccgagggc ggcgaggtgg gcaccctgcg cgtgctcgtc aagatctacc 7620 gcgactcgcc cgacgggtcg cgcaagggcg gccgcatgac gcaggcgctc gactccctgc 7680 ccgtcggcca ccccgtcgag ttcaagggcc ccgtgggcaa gttcgagtac ctgggcgcgg 7740 ggaggtgcgt cgtcggcggc cgggagcgga cggtcgcccg gttcgtcatg gtctgcggcg 7800 ggtccggcgt gacccccatc tttgccgtcc tccgggccgt ggcgaggggc gagcgggacg 7860 agacggcgtg tctggtgctc gacggcaacc gcggggaagg ggacatcttg ctgcgcgagg 7920 aactggatgg gctggtgcgg gagagccggg ggaggtgtag gattgtgcac gctctgagca 7980 ggccgagaga cgggtggaag gggttgaagg ggcggatgga tagggccttc ttcgagaggg 8040 aggttggcgc tccgccggct gaaaggaacg cgatggtatt aatttgcggg cccgaaggca 8100 tggagaaggc agcgagggaa gcattcttgg ggatgggctg ggatgaggac gatctccttt 8160 tcttttagtt tagcatcatg acatgaactt tggaagggcg acgtggcgtt ggcaggcgtc 8220 gggaaaatgc atggtcccgg tattcttgtt tttgattcta agagggaggg ggggaagggg 8280 gagagaaatg taaagaaaag ggcacagcca tgattcatga ttctcaaatg accgaccact 8340 ctggcgaact cgaggggcca tgaaagagag tcctcaaggt tgaaccgcac atcaaccgag 8400 gtggggtgcc gtgaaggaag ggtgaagtgg cgctgcagaa ctgatttccc cggaggtact 8460 caatctttag gcggagactt ccagtttagc ttgtttatta gcccagctgc ttgcatctcc 8520 ggcgctgtca gccgagaatg gaaggcaccg tgtaacgcag agcacgattt ggtgtatttc 8580 atccgtataa ttaactaggg aaaagtgagc tggaaatacg caggtactgt acggattacc 8640 ttcgttgcac aatttaaatt ctccttagct ctgtacagtg accggtgact ctttctggca 8700 tgcggagaga cggacggacg cagagagaag ggctgagtaa taagcgccac tgcgccagac 8760 agctctggcg gctctgaggt gcagtggatg attattaatc agggaccggc cgcccctccg 8820 ccccgaagtg gaaaggctgg tgtgcccctc gttgaccaag aatctattgc atcatcggag 8880 aatatggagc ttcatcgaat caccggcagt aagcgaagga gaatgtgaag ccaggggtgt 8940 atagccgtcg gcgaaatagc atgccattaa cctaggtaca gaagtccaat tgcttccgat 9000 ctggtaaaag attcacgaga tagtaccttc tccgaagtag gtagagcgag tacccggcgc 9060 gtaagctccc taattggccc atccggcatc tgtagggcgt ccaaatatcg tgcctctcct 9120 gctttgcccg gtgtatgaaa ccggaaaggc cgctcaggag ctggccagcg gcgcagaccg 9180 ggaacacaag ctggcagtcg acccatccgg tgctctgcac tcgacctgct gaggtccctc 9240 agtccctggt aggcagcttt gccccgtctg tccgcccggt gtgtcggcgg ggttgacaag 9300 gtcgttgcgt cagtccaaca tttgttgcca tattttcctg ctctccccac cagctgctct 9360 tttcttttct ctttcttttc ccatcttcag tatattcatc ttcccatcca agaaccttta 9420 tttcccctaa gtaagtactt tgctacatcc atactccatc cttcccatcc cttattcctt 9480 tgaacctttc agttcgagct ttcccacttc atcgcagctt gactaacagc taccccgctt 9540 gagcagacat caccatgcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 9600 agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 9660 gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 9720 acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 9780 ttgacattgg ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg 9840 tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg 9900 ccatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 9960 cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 10020 atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 10080 tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 10140 atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 10200 gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 10260 ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 10320 gatcgccgcg gctccgggcg tatatgctcc gcattggtct gtttaaacgc tgtttcctgt 10380 gtgaaattgt tatccgctca caattccaca caacatagga gccggaagca taaagtgtaa 10440 agcctggggt gcctaatgag tgaggtaact cacattaatt gcgttgcgct cactgcccgc 10500 tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 10560 aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 10620 cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 10680 atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 10740 taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 10800 aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 10860 tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 10920 gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 10980 cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 11040 cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 11100 atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 11160 tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 11220 ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 11280 acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 11340 aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 11400 aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 11460 tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 11520 cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 11580 catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 11640 ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 11700 aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 11760 ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 11820 caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 11880 attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 11940 agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 12000 actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 12060 ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 12120 ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 12180 gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 12240 atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 12300 cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 12360 gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 12420 gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 12480 ggttccgcgc acatttcccc gaaaagtgcc acctgaacga agcatctgtg cttcattttg 12540 tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt 12600 ttacagaaca gaaatgcaac gcgaaagcgc tattttacca acgaagaatc tgtgcttcat 12660 ttttgtaaaa caaaaatgca acgcgagagc gctaattttt caaacaaaga atctgagctg 12720 catttttaca gaacagaaat gcaacgcgag agcgctattt taccaacaaa gaatctatac 12780 ttcttttttg ttctacaaaa atgcatcccg agagcgctat ttttctaaca aagcatctta 12840 gattactttt tttctccttt gtgcgctcta taatgcagtc tcttgataac tttttgcact 12900 gtaggtccgt taaggttaga agaaggctac tttggtgtct attttctctt ccataaaaaa 12960 agcctgactc cacttcccgc gtttactgat tactagcgaa gctgcgggtg cattttttca 13020 agataaaggc atccccgatt atattctata ccgatgtgga ttgcgcatac tttgtgaaca 13080 gaaagtgata gcgttgatga ttcttcattg gtcagaaaat tatgaacggt ttcttctatt 13140 ttgtctctat atactacgta taggaaatgt ttacattttc gtattgtttt cgattcactc 13200 tatgaatagt tcttactaca atttttttgt ctaaagagta atactagaga taaacataaa 13260 aaatgtagag gtcgagttta gatgcaagtt caaggagcga aaggtggatg ggtaggttat 13320 atagggatat agcacagaga tatatagcaa agagatactt ttgagcaatg tttgtggaag 13380 cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt tttttgaaag 13440 tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata ctttctagag 13500 aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct tccgaaaatg 13560 caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct gcgtgttgcc 13620 tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa atgcgtactt 13680 atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat attatcccat 13740 tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct atatgctgcc 13800 actcctcaat tggattagtc tcatccttca atgctatcat ttcctttgat attggatcat 13860 actaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct 13920 ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 13980 cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 14040 cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag attgtactga 14100 gagtgcacca taccacagct tttcaattca attcatcatt ttttttttat tctttttttt 14160 gatttcggtt tctttgaaat ttttttgatt cggtaatctc cgaacagaag gaagaacgaa 14220 ggaaggagca cagacttaga ttggtatata tacgcatatg tagtgttgaa gaaacatgaa 14280 attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa cgaagataaa 14340 tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct gttgctgcca 14400 agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg gatgttcgta 14460 ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt ttactaaaaa 14520 cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg ctaaaggcat 14580 tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 14640 cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 14700 atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg gcagaagaag 14760 taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag ggctccctat 14820 ctactggaga atatactaag ggtactgttg acattgcgaa gagcgacaaa gattttgtta 14880 tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat tggttgatta 14940 tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag tatagaaccg 15000 tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga ctatttgcaa 15060 agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg gaagcatatt 15120 tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca tgtatactaa 15180 actcacaaat tagagcttca atttaattat atcagttatt accctatgcg gtgtgaaata 15240 ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaaacgtt aatattttgt 15300 taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag gccgaaatcg 15360 gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt gttccagttt 15420 ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga aaaaccgtct 15480 atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg gggtcgaggt 15540 gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct tgacggggaa 15600 agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc gctagggcgc 15660 tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt aatgcgccgc 15720 tacagggcgc gtcgcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg 15780 tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa 15840 gttgggtaac gccagggttt tcccagtcac gacggtttaa ac 15882 <210> 20 <211> 11788 <212> DNA <213> Artificial sequence <220> <223> Nucleic acids <400> 20 tcgaaaagtt cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg 60 ctttcagctt cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg 120 gtttctacaa agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg 180 aagtgcttga cattggggaa ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac 240 agggtgtcac gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg 300 cggaggccat ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat 360 tcggaccgca aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg 420 atccccatgt gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc 480 aggctctcga tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc 540 acgcggattt cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg 600 actggagcga ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga 660 ggccgtggtt ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc 720 ttgcaggatc gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc 780 agagcttggt tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa 840 tcgtccgatc cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg 900 tctggaccga tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc 960 gtccgagggc aaaggaatag agtagatgcc gaccgggatc cacttaacgt tactgaaatc 1020 atcaaacagc ttgacgaatc tggatataag atcgttggtg tcgatgtcag ctccggagtt 1080 gagacaaatg gtgttcagga tctcgataag atacgttcat ttgtccaagc agcaaagagt 1140 gccttctagt gatttaatag ctccatgtca acaagaataa aacgcgtttc gggtttacct 1200 cttccagata cagctcatct gcaatgcatt aatgcattgg acctcgcaac cctagtacgc 1260 ccttcaggct ccggcgaagc agaagaatag cttagcagag tctattttca ttttcgggag 1320 acgagatcaa gcagatcaac ggtcgtcaag agacctacga gactgaggaa tccgctcttg 1380 gctccacgcg actatatatt tgtctctaat tgtactttga catgctcctc ttctttactc 1440 tgatagcttg actatgaaaa ttccgtcacc agcccctggg ttcgcaaaga taattgcact 1500 gtttcttcct tgaactctca agcctacagg acacacattc atcgtaggta taaacctcga 1560 aaatcattcc tactaagatg ggtatacaat agtaaccatg catggttgcc tagtgaatgc 1620 tccgtaacac ccaatacgcc ggccgaaact tttttacaac tctcctatga gtcgtttacc 1680 cagaatgcac aggtacactt gtttagaggt aatccttctt tctagaagga gaatttaaat 1740 catgacttgg ttacgaatga gctacgacat gttcaattga gtgactcttt actaccaaag 1800 tactgctacc atgacactcg aatcgtctcg tgactgaaag gagaatcatg ttggcattgg 1860 ttcgcgtagt acggagtaac gacaacggca ttggtcaaca tctggcaggt atttgaggta 1920 gaatatacca acctgcctga ggctctcggt atcaagattt ggaaggccaa agggttggat 1980 gagcacttga gagcaaagtc ggactactgg ctgaagaagg taaacaaact aacgtacagt 2040 acctacttaa cttatgatac acgtcggcgc gcccgcgcgc gacgggcagg tgagaaatcg 2100 atgtgtgtct ccgtcacaaa cctctgcagc agctcgcggc cggcgaacat cggtatgtaa 2160 gttaggtagg ttgacaagac gggcatggtg caggtgtggt tggtagggga gatgtctagc 2220 ctgaagccat acgaagaatg tattgtccat gtgtatgtac aagcgaagcg aatgaaatgc 2280 ccaaaccggg ggcaaaacac tgaacgatag gtacaacatg aaagaaacac catgcatcga 2340 tgtgtgtgct cgcaagcata ccactggtcc tcccgagccc caagaagcgg tcccgcaaag 2400 cgaaggagga ggaggaggag gaagaagaag aagaagaaga agaagaagaa gaagtgaaaa 2460 gagaaatgag aagaagaaaa aaggcccagg gccaaacaat gaacaacaag aggaaaacaa 2520 aacaaaaaat atgtataacg aatggagaga aaaaagaaaa gcggctaata ataatgcaaa 2580 ccatccaaga agagaaaacg aaggtaaaca tgtccaggct tcaaaatggt ttgccgaatc 2640 agtacggctt catgctccct ctctctctct ctctctctct ctctccagct cccctctctc 2700 gaccaggact cgggaggtca tagggcctta attaattact tgccgaggga caggctgagc 2760 gacttctggg tgtagtggtt gtggagggcc tcgtgcatga cggagcagct gaagacgttg 2820 ccctcttgcc agcggctctt gtcgacggtg aggcgggagt acaggaagaa cgagccgtcc 2880 gagtccagga cgggcggggt ggtcttgtag ttgttctcgg gctggccgtt ggactcccac 2940 tcgacggcga tgtcgctggg gtagaagccc ttgacgaggc aggtcagcga gacctggttc 3000 ttggtcatct cctcttggga gggcgggagg gtgtagacct ggggctcgcg gggctggccc 3060 ttggccttcg agatggtctt ctcgatcgag gaggggaggc ccttgttcga gaccttgcac 3120 ttgtactcct tgccgttcag ccagtcctgg tggaggacgg tcaggaccga gacgacgcgg 3180 taggtggagt tgaactgctc ctcgcggggc ttggtcttgg cgttgtggac ctcgacgccg 3240 tcgacgtacc agttgaactg gacctcgggg tcctcttggg agacgtcgac gacgacgcag 3300 gtgacctcgg gcgtgcgcga gatcatgagg gtgtccttgg gcttgggcgg gaagaggaag 3360 acggaggggc cgcccaggaa ctcgggggcg gggcagggcg ggcagggagg gccgtacttg 3420 ctctcgacgc gcttgtcgac cttggtgttc gagggcttgt ggtcgacgtt gcaggtgtag 3480 gtcttggtgc ccaggctgga ggaggggacg gtgacgacgc tcgagagcga gtacaggccc 3540 gagctctgga ggacggcggg gaaggtgtgg acgcccgagg tcagggcgcc cgagttccac 3600 gagacggtga cgggctcggg gaagtagtcc ttgacgaggc agcccagggc ggcggtcgac 3660 tccgaggtgc tgcgcgagca gggggccagg gggaagacgc tggggccctt ggtggaggcg 3720 gaggagacgg tgaccagggt gccctggccc cagtagtcgt cgttggtggc gcagtagtag 3780 acggcggtgt cctcggcgcg cagggagttc atctgcagga agagggtgtt cttggagttg 3840 tcgcggctga tggtgaagcg gcccttgacg gagtcggcgt agtagcgctt gctgccgtcg 3900 taccagatga cggcgaccca ctcgaggccc ttgccggggg cctggcggac ccagtgcatg 3960 ccggagttgc tgaaggtgat gcccgaggcc ttgcagtcca ggcggaggga gcggccgggc 4020 tggacgacgc cgccgccgga ctcgaccagc tggacctggg cggcggcgcc ggcgacgagg 4080 gcggcgaggg tggcgaactt ggcgtacatg gtggacgatg gacgattgtc tgtgtgagta 4140 agggaaaggt ggataggaga aaggggaagg aagttctgag gagggatgga agacggatga 4200 tgatgtgcta gtaggcccca atgagccgag gagggaaggc ctgatctcct ttatatccag 4260 gaaccatcac ggccgtttcc cgccatgatc tgcccccatc tctcccgcga gtttcggacc 4320 gtcaacaccg atgaaaaaaa gctgggcatc gcttgagaga tccgggccct gtgttacgct 4380 gagtgcacag cgtgggcgat gtgggcagcc ggggcctcga caaggatcca agaacaaccc 4440 cccaccgcgg ggtaggttga ccctggcgaa ggactggcaa acgaagggcc gtgaatggcc 4500 aacggtcagc aatccggggg gctgttgata gtgggcaagg gccttgcgcg ttgcgatgca 4560 cgatattgcg gagactgagg agccccacta gcgcaccctt gggccccgcc aacccccaac 4620 gggccaaagg gccagctctg ggagcacgga aggagaaccc gaaacacatg tttctggaaa 4680 gagaaagctt gagcatggta tgatagtgta tttttttcct gcctttcttt tctttcccaa 4740 ccccaagtta ggcaggtatt cccgtgcctt acatgggcac ctgggagaga ctattttggc 4800 gcgggggggg ggtaaacctc cgaattcgac ctctccttcc attgttgatt gaattgaaga 4860 aggtcagctt tcgcagttac cgcgccctcg aaaactcgcc agaataatcg cgaaagtcgc 4920 tccgagtcgc tctctccacc ttcgcatagt ttccggatcc acggcccgtg aaggacctga 4980 cgagcgctcc ggctgggtaa acctcggctg attctggggg tgaacaaacc aaaaacacgc 5040 tggtcacgcg caggggcgtc gttctagctc agcaaacgaa ccacggcacc acgccgcccg 5100 cgccgagagg agcatctcgc aagccaggct ttctagccaa ggcacggggt atccatctct 5160 ctgaggcgag acgagacgca tccgggccaa ggagcacttt agcgatgcgc gccctctctg 5220 gcaaaactcc ggattttgct ttcttgccgt ggctaaacct cggtcgctct ggcgattcac 5280 gtcccttcgc tcccaggaaa ccgaaccgtg cggccgactc tgaacgagcc gggcggctct 5340 cttcttcttt tctcttcttt cttctcgtcc catacgctta cttggaacac tatgggcgac 5400 ggcaactcgg gctggctgtt ccggagcatg gacatcgccg ctctgcttat cgagtgtttg 5460 gtgtgtcaga cccgctccat cattccgtga ccgtggcaac ccgccggcga cgaacctctc 5520 tgaaggaggt tctgagacac gcgcgattct tctgtatata gttttatttt tcactctgga 5580 gtgcttcgct ccaccagtac ataaaccttt tttttcacgt aacaaaatgg cttcttttca 5640 gaccatgtga accatcttga tgccttgacc tcttcagttc tcactttaac gtagttcgcg 5700 tttgtctgta tgtcccagtt gcatgtagtt gagataaata cccctggaag tgggtctggg 5760 cctttgtggg acggagccct ctttctgtgg tctggagagc ccgctctcta ccgcctacct 5820 tcttaccaca gtacactact cacacattgc tgaactgacc catcataccg tactttatcc 5880 tgttaattcg tggtgctgtc gactattcta tttgctcaaa tggagagcac attcatcggc 5940 gcagggatac acggtttatg gaccccaaga gtgtaaggac tattattagt aatattatat 6000 gcctctaggc gccttaactt caacaggcga gcactactaa tcaacttttg gtagacccaa 6060 ttacaaacga ccatacgtgc cggaaatttt gggattccgt ccgctctccc caaccaagct 6120 agaagaggca acgaacagcc aatcccggtg ctaattaaat tatatggttc atttttttta 6180 aaaaaatttt ttcttcccat tttcctctcg cttttctttt tcgcatcgta gttgatcaaa 6240 gtccaagtca agcgagctat ttgtgcgttt aaacgctgtt tcctgtgtga aattgttatc 6300 cgctcacaat tccacacaac ataggagccg gaagcataaa gtgtaaagcc tggggtgcct 6360 aatgagtgag gtaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 6420 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 6480 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 6540 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 6600 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 6660 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 6720 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 6780 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 6840 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 6900 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 6960 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 7020 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 7080 agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 7140 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 7200 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 7260 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 7320 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 7380 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 7440 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 7500 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 7560 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 7620 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 7680 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 7740 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 7800 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 7860 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 7920 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 7980 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 8040 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 8100 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 8160 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 8220 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 8280 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 8340 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 8400 ttccccgaaa agtgccacct gaacgaagca tctgtgcttc attttgtaga acaaaaatgc 8460 aacgcgagag cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa 8520 tgcaacgcga aagcgctatt ttaccaacga agaatctgtg cttcattttt gtaaaacaaa 8580 aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 8640 agaaatgcaa cgcgagagcg ctattttacc aacaaagaat ctatacttct tttttgttct 8700 acaaaaatgc atcccgagag cgctattttt ctaacaaagc atcttagatt actttttttc 8760 tcctttgtgc gctctataat gcagtctctt gataactttt tgcactgtag gtccgttaag 8820 gttagaagaa ggctactttg gtgtctattt tctcttccat aaaaaaagcc tgactccact 8880 tcccgcgttt actgattact agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc 8940 ccgattatat tctataccga tgtggattgc gcatactttg tgaacagaaa gtgatagcgt 9000 tgatgattct tcattggtca gaaaattatg aacggtttct tctattttgt ctctatatac 9060 tacgtatagg aaatgtttac attttcgtat tgttttcgat tcactctatg aatagttctt 9120 actacaattt ttttgtctaa agagtaatac tagagataaa cataaaaaat gtagaggtcg 9180 agtttagatg caagttcaag gagcgaaagg tggatgggta ggttatatag ggatatagca 9240 cagagatata tagcaaagag atacttttga gcaatgtttg tggaagcggt attcgcaata 9300 ttttagtagc tcgttacagt ccggtgcgtt tttggttttt tgaaagtgcg tcttcagagc 9360 gcttttggtt ttcaaaagcg ctctgaagtt cctatacttt ctagagaata ggaacttcgg 9420 aataggaact tcaaagcgtt tccgaaaacg agcgcttccg aaaatgcaac gcgagctgcg 9480 cacatacagc tcactgttca cgtcgcacct atatctgcgt gttgcctgta tatatatata 9540 catgagaaga acggcatagt gcgtgtttat gcttaaatgc gtacttatat gcgtctattt 9600 atgtaggatg aaaggtagtc tagtacctcc tgtgatatta tcccattcca tgcggggtat 9660 cgtatgcttc cttcagcact accctttagc tgttctatat gctgccactc ctcaattgga 9720 ttagtctcat ccttcaatgc tatcatttcc tttgatattg gatcatacta agaaaccatt 9780 attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt 9840 ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 9900 ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 9960 tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatacc 10020 acagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 10080 tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 10140 cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 10200 ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 10260 acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 10320 atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 10380 ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 10440 ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 10500 aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 10560 tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 10620 gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 10680 agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 10740 actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 10800 caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 10860 ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 10920 tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 10980 aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 11040 cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 11100 gcttcaattt aattatatca gttattaccc tatgcggtgt gaaataccgc acagatgcgt 11160 aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 11220 aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 11280 aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 11340 ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 11400 ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 11460 aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 11520 gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 11580 gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 11640 cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 11700 ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca 11760 gggttttccc agtcacgacg gtttaaac 11788 <210> 21 <211> 18 <212> DNA <213> Primer <400> 21 atcagaccac gacgggac 18 <210> 22 <211> 21 <212> DNA <213> Primer <400> 22 caggtaggag gagaccgact g 21 <210> 23 <211> 20 <212> DNA <213> Primer <400> 23 tagcgcgaat actgctgtgg 20 <210> 24 <211> 19 <212> DNA <213> Primer <400> 24 catgccggag ttgctgaag 19 <210> 25 <211> 19 <212> DNA <213> Primer <400> 25 gctgacgcga atgacacag 19 <210> 26 <211> 19 <212> DNA <213> Primer <400> 26 catgcccttg ccgtagaag 19 <210> 27 <211> 750 <212> PRT <213> Myceliophthora thermophila <400> 27 Met Ser Ala Asp Pro Leu Gln Val Leu Ala Ser Val Gly Lys Gly Lys 1 5 10 15 Ser Thr Arg Gly Val Leu Arg Val Ile Ile Leu Ala Leu Ile Ala Ala 20 25 30 Ala Ala Ile Ala Ser Arg Leu Phe Ser Val Ile Arg Phe Glu Ser Ile 35 40 45 Ile His Glu Phe Asp Pro Trp Phe Asn Phe Arg Ala Thr Lys Tyr Leu 50 55 60 Val Ala Asn Gly Phe Tyr Asn Phe Trp Asp Trp Phe Asp Asp Arg Thr 65 70 75 80 Trp His Pro Leu Gly Arg Val Thr Gly Gly Thr Leu Tyr Pro Gly Leu 85 90 95 Met Val Thr Ser Gly Val Ile Tyr His Ala Leu Arg Ala Leu Thr Ile 100 105 110 Pro Val Asp Ile Arg Asn Ile Cys Val Leu Leu Ala Pro Gly Phe Ser 115 120 125 Gly Leu Thr Ala Ile Ala Ala Tyr Leu Leu Thr Asn Glu Met Thr Pro 130 135 140 Ser Pro Ser Ala Gly Leu Leu Ala Ala Leu Phe Met Gly Ile Ala Pro 145 150 155 160 Gly Tyr Ile Ser Arg Ser Val Ala Gly Ser Tyr Asp Asn Glu Ala Ile 165 170 175 Ala Ile Phe Leu Leu Val Phe Thr Phe Tyr Leu Trp Ile Lys Ala Leu 180 185 190 Lys Gln Gly Ser Met Leu Trp Gly Ala Leu Cys Ala Leu Ser Tyr Gly 195 200 205 Tyr Met Val Ala Ser Trp Gly Gly Tyr Ala Phe Ile Thr Cys Leu Val 210 215 220 Pro Leu His Ser Phe Val Leu Ile Cys Met Gly Arg Tyr Ser Thr Arg 225 230 235 240 Leu Tyr Val Ala Tyr Thr Thr Trp Tyr Ala Leu Gly Thr Leu Ala Ser 245 250 255 Met Gln Ile Pro Phe Val Gly Phe Leu Pro Val Lys Thr Ser Glu His 260 265 270 Met Pro Ala Leu Gly Ile Phe Gly Phe Leu Gln Leu Leu Gly Phe Leu 275 280 285 Asp Tyr Val Arg Ser Ala Ile Pro Ser Arg Gln Phe Gln Thr Phe Leu 290 295 300 Trp Leu Phe Ala Gly Ala Thr Phe Gly Leu Gly Leu Leu Gly Leu Val 305 310 315 320 Ile Ala Thr Ser Ala Gly Phe Ile Ala Pro Trp Ser Gly Arg Phe Tyr 325 330 335 Ser Leu Trp Asp Thr Gly Tyr Ala Lys Ile His Ile Pro Ile Ile Ala 340 345 350 Ser Val Ser Glu His Gln Pro Thr Ala Trp Pro Ala Phe Phe Phe Asp 355 360 365 Leu Asn Leu Leu Val Trp Leu Phe Pro Val Gly Val Tyr Leu Cys Phe 370 375 380 Gln Gln Leu Ala Asp Glu His Val Phe Ile Val Val Tyr Ala Leu Phe 385 390 395 400 Gly Ser Tyr Phe Ala Gly Val Met Val Arg Leu Met Leu Thr Leu Thr 405 410 415 Pro Val Val Cys Val Ala Ala Ala Ile Ala Val Ser Thr Leu Leu Asp 420 425 430 Thr Tyr Leu Ser Thr Lys Ser Leu Lys Pro Gln Glu Ser Gln Ala Thr 435 440 445 Glu Gly Pro Glu Ser Lys Lys Ala Ala Lys Ser Ser Gly Leu Lys Ser 450 455 460 Thr Ser Lys Pro Val Val Gly Val Tyr Ala Leu Trp Gly Lys Ser Met 465 470 475 480 Met Val Gly Ala Leu Ala Val Tyr Leu Leu Leu Phe Val Leu His Cys 485 490 495 Thr Trp Val Thr Ser Asn Ala Tyr Ser Ser Pro Ser Val Val Leu Ala 500 505 510 Ser Arg Leu Pro Asp Gly Ser Gln His Ile Ile Asp Asp Tyr Arg Glu 515 520 525 Ala Tyr Gln Trp Leu Arg Gln Asn Thr Arg Glu Asp Ala Lys Ile Met 530 535 540 Ser Trp Trp Asp Tyr Gly Tyr Gln Ile Gly Gly Met Ala Asp Arg Pro 545 550 555 560 Thr Leu Val Asp Asn Asn Thr Trp Asn Asn Thr His Ile Ala Thr Val 565 570 575 Gly Lys Ala Met Ser Ser Arg Glu Glu Val Ser Tyr Pro Ile Met Arg 580 585 590 Gln His Glu Val Asp Tyr Val Leu Val Val Phe Gly Gly Leu Leu Gly 595 600 605 Tyr Ser Gly Asp Asp Ile Asn Lys Phe Leu Trp Met Val Arg Ile Ala 610 615 620 Glu Gly Ile Trp Pro Asp Glu Val Asn Glu Arg Ser Phe Phe Thr Ala 625 630 635 640 Arg Gly Glu Tyr Arg Val Asp Gly Glu Ala Thr Glu Thr Met Lys Asn 645 650 655 Ser Leu Met Tyr Lys Met Ser Tyr Tyr Asn Tyr Asn Asn Leu Phe Pro 660 665 670 Pro Gly Gln Ala Val Asp Arg Met Arg Gly Ala Arg Leu Pro Glu Val 675 680 685 Gly Pro Thr Leu Ser Thr Leu Glu Glu Ala Phe Thr Ser Glu Asn Trp 690 695 700 Ile Ile Arg Ile Tyr Lys Val Lys Asp Leu Asp Asn Leu Gly Arg Asp 705 710 715 720 His Met Ser Ala Ala Ala Phe Asp Arg Gly His Lys Lys Lys Ser Lys 725 730 735 Gly Ile Thr Lys Lys Lys Gly Pro Arg Gln Leu Arg Ile Asp 740 745 750 <210> 28 <211> 309 <212> PRT <213> Myceliophthora thermophila <400> 28 Met Ala Ala Asp Asp Asp Ile Thr Pro Leu Ala Ser Leu Ser Leu Thr 1 5 10 15 His Val Tyr Tyr Asn Pro Thr Asp Pro Leu Ser Thr Ala Ser Ala Phe 20 25 30 Leu Ser Leu Leu Pro Gln Ala Leu Cys Val Val Tyr Ala Thr Leu Leu 35 40 45 Trp Ser Thr Arg Glu Ala Glu Val Leu Leu Met Phe Leu Gly Gln Leu 50 55 60 Ala Cys Glu Ala Ile Asn Phe Ala Leu Lys Arg Leu Ile Lys Glu Glu 65 70 75 80 Arg Pro Pro Arg Leu Gly Val Gly Lys Gly Tyr Gly Met Pro Ser Ser 85 90 95 His Ala Gln Phe Ala Ala Phe Trp Ala Val Ala Leu Ala Leu Phe Leu 100 105 110 Cys Val Arg His Arg Pro Ala Arg Leu Gly Pro Pro Arg Arg Pro Pro 115 120 125 Arg Leu Arg Leu Gly Gly Arg Ala Val Val Pro Pro Gly Lys Gly Asp 130 135 140 Arg Ala Ala Ala Thr Val Ala Asp Gly Asn Arg Asn Gly Asn Gly Asn 145 150 155 160 Gly Asp Ala Glu Pro Arg Leu Ser Asp Val His Arg Ala Tyr Val Ser 165 170 175 Gly Gly Leu Ala Ala Ala Ser Arg Ser Ile Glu Ala Tyr Ser His Ser 180 185 190 His Trp Thr Met Ala Gln Arg Val Val Val Ser Ala Gly Ala Leu Leu 195 200 205 Val Ala Gly Leu Val Ala Trp Ser Arg Val Tyr Leu Gly Tyr His Thr 210 215 220 Val Arg Gln Val Val Ala Gly Ser Ala Ala Gly Ala Gly Cys Ala Ala 225 230 235 240 Ala Trp Phe Ala Val Thr Tyr Leu Met Arg Glu Thr Gly Met Val Ala 245 250 255 Trp Ala Leu Glu Leu Pro Pro Ala Arg Trp Phe Arg Met Arg Asp Leu 260 265 270 Val Val Glu Glu Asp Leu Cys Gln Ala Gly Trp Glu Lys Trp Gln Glu 275 280 285 Lys Arg Gln Leu Ala Leu Glu Arg Glu Gln Ser Arg Glu Arg Val Arg 290 295 300 Glu Lys Lys Gly Gln 305 <210> 29 <211> 8017 <212> DNA <213> Myceliophthora thermophila <400> 29 agggtaggtg ggatgggcgg ggtgtagggt aggtcggtgt agggtaggtc ggctgggcgg 60 ggtgtagggt aggtcggttg ggcggggtgt agggtaggtc ggttgggatg ggtgtagggt 120 aggtcggccg ggtgtagggt aggtcggctg ggcggggtgt agggtaggtc ggtgtagggt 180 aggtgggatg gggcgctatg tgcggccgcg agctcgcgag cccattttta gcgaaggcca 240 tacaaacgag ttttgcggaa cccgggattc cacccccgaa gccgccggcg cgtgcgcccc 300 gctgcgcatc ggtcggtggg tatatgagaa gggggcgggc aagccggaag ccagaggcaa 360 ctgctactgt tagctgccgc tggcctccgc ggcccagggc gcggcacggc tgcgttgaag 420 tctcccagtc tcccacccgt tggctgcgcg gatccgcccg tcttggtggt tgcgagctcg 480 cgagcccatt tttagcgaag gccatacaaa cgagttttgc ggggcccggg attccacccc 540 ggaacccgcc ggcgcgtgcg ccccgctgcg catcggtcgg tgggtatgtg agggaggaag 600 aagaaaaaaa aaaaaagctc ctgcgggggg gctgtcgggc acgcctactt tcgggcgacc 660 cggcacctct ccgcggcagc cttcgcaggc cgctgttggt cccatttcat acgtcgccgc 720 cttcgcgtgg tgccctacgg tctgccgggg taccgacgat tgcggcgagc accgcctcag 780 caccgctgct gccaccggcg cgacctcgcc cgggggtgcg cgcggcatct gggaagactc 840 tgcaggcgta agggaatacc ccatgtgcgc cgaggggtgg gctatgtggg tgcttggcgg 900 ttcgccagac ctttctaaag ccaccggggg tacctaccgg ttggggacgc ctacagggct 960 gaacctcccg gtcgggcctc ctcttggggc gcttaggcgg cgacttcggg gcgcgatcgc 1020 tccccgctct cgcccgccga cggcgctctg gggaattcag gaggggaaag cagatgtgac 1080 ccgcggctcg accggcgcat tgccggacga gctgcgcggc cacgcgggcc cccgcgcccg 1140 ccgacccagt aacttagtga actcttccgc cctgaaacac gggcggttgg ccctaaccgg 1200 ctcacgatag ttacctggtt gattctgcca gtagtcatat gcttgtctca aagattaagc 1260 catgcatgtc taagtataag caattataca gcgaaactgc gaatggctca ttaaatcagt 1320 tatcgtttat ttgatagtac cttactacat ggataaccgt ggtaattcta gagctaatac 1380 atgctaaaaa tcccgacttc ggaagggatg tatttattag attaaaaacc aatgccctcc 1440 ggggctctct ggtgattcat gataacttct cgaatcgcac ggccttgcgc cggcgatggt 1500 tcattcaaat ttctgcccta tcaactttcg acggctgggt cttggccagc cgtggtgaca 1560 acgggtaacg gagggttagg gctcgacccc ggagaaggag cctgagaaac ggctactaca 1620 tccaaggaag gcagcaggcg cgcaaattac ccaatcccga cacggggagg tagtgacaat 1680 aaatactgat acagggctct tttgggtctt gtaattggaa tgagtacaat ttaaatccct 1740 taacgaggaa caattggagg gcaagtctgg tgccagcagc cgcggtaatt ccagctccaa 1800 tagcgtatat taaagttgtt gaggttaaaa agctcgtagt tgaaccttgg gcctagccgg 1860 ccggtccgcc tcaccgcgtg cactggctcg gctgggtctt tccttctgga gaaccgcatg 1920 cccttcactg ggtgtgccgg ggaaccagga cttttactct gaacaaatta gatcgcttaa 1980 agaaggccta tgctcgaata cattagcatg gaataataga ataggacgtg tggttctatt 2040 ttgttggttt ctaggaccgc cgtaatgatt aatagggaca gtcgggggca tcagtattca 2100 attgtcagag gtgaaattct tggatttatt gaagactaac tactgcgaaa gcatttgcca 2160 aggatgtttt cattaatcag gaacgaaagt taggggatcg aagacgatca gataccgtcg 2220 tagtcttaac cataaactat gccgattagg gatcggacgg cgttattttt tgacccgttc 2280 ggcaccttac gataaatcaa aatgtttggg ctcctggggg agtatggtcg caaggctgaa 2340 acttaaagaa attgacggaa gggcaccacc aggggtggag cctgcggctt aatttgactc 2400 aacacgggga aactcaccag gtccagacac gatgaggatt gacagattga gagctctttc 2460 ttgatttcgt gggtggtggt gcatggccgt tcttagttgg tggagtgatt tgtctgctta 2520 attgcgataa cgaacgagac cttaacctgc taaatagccc gtattgcttt ggcagtacgc 2580 cggcttctta gagggactat cggctcaagc cgatggaagt ttgaggcaat aacaggtctg 2640 tgatgccctt agatgttctg ggccgcacgc gcgctacact gacagagcca gcgagtactc 2700 ccttggccgg aaggcccggg taatcttgtt aaactctgtc gtgctgggga tagagcattg 2760 caattattgc tcttcaacga ggaatcccta gtaagcgcaa gtcatcagct tgcgttgatt 2820 acgtccctgc cctttgtaca caccgcccgt cgctactacc gattgaatgg ctcagtgagg 2880 ctttcggact ggcccagaga ggtcggcaac gaccactcag ggccggaaag ttatccaaac 2940 tcggtcattt agaggaagta aaagtcgtaa caaggtctcc gttggtgaac cagcggaggg 3000 atcattacag agctgcaaaa ctccctaaac catcgtgaac gctacctaga ccgttgcttc 3060 ggcgggcggc gccctcgcgc gccccccctg gggcccgcac cgcgggcgcc cgccggaggt 3120 acaccaaact cttgatatgt tatggccact ctgagtctcc tgtactgaat aagtcaaaac 3180 tttcaacaac ggatctcttg gttctggcat cgatgaagaa cgcagcgaaa tgcgataagt 3240 aatgtgaatt gcagaattca gtgaatcatc gaatctttga acgcacattg cgcccgccag 3300 catcctggcg ggcatgcctg ttcgagcgtc atttcaaccc atcaagccca cggcttgtgt 3360 tggggacctg cggctgcccg caggccctga aaaccagtgg cgggctcgct agtcacaccg 3420 ggcgtagtag catacgacct cgctcagggc gtgctgcggg ttccagccgt aaaacgacct 3480 tcacaaccca aggttgacct cggatcaggt aggaggaccc gctgaactta agcatatcaa 3540 taagcggagg aaaagaaacc aacagggatt gccctagtaa cggcgagtga agcggcaaca 3600 gctcaaattt gaaatctggc ttcggcccga gttgtaattt gcagaggaag ctttaggcgc 3660 ggcaccttct gagtcccctg gaacggggcg ccatagaggg tgagagcccc gtatagttgg 3720 atgcctagcc tgtgtaaagc tccttcgacg agtcgagtag tttgggaatg ctgctcaaaa 3780 tgggaggtaa atttcttcta aagctaaata ccggccagag accgatagcg cacaagtaga 3840 gtgatcgaaa gatgaaaagc actttgaaaa gagggttaaa tagcacgtga aattgttgaa 3900 agggaagcgc ttgtgaccag acttgcgccg ggctgatcat ccggtgttct caccggtgca 3960 ctctgcccgg ctcaggccag catcggttct cgcgggggga taaaggcccg gggaatgtag 4020 ctcctccggg agtgttatag ccccgggtgt aataccctcg cggggaccga ggttcgcgca 4080 tctgcaagga tgctggcgta atggtcatca gcgacccgtc ttgaaacacg gaccaaggag 4140 tcaaggtttt gcgcgagtgt ttgggtgtaa aacccgcacg cgtaatgaaa gtgaacgtag 4200 gtgagagctt cggcgcatca tcgaccgatc ctgatgtttt cggatggatt tgagtaggag 4260 cgttaagcct tggacccgaa agatggtgaa ctatgcttgg atagggtgaa gccagaggaa 4320 actctggtgg aggctcgcag cggttctgac gtgcaaatcg atcgtcaaat ctgagcatgg 4380 gggcgaaaga ctaatcgaac catctagtag ctggttaccg ccgaagtttc cctcaggata 4440 gcagtgttgt cttcagtttt atgaggtaaa gcgaatgatt agggactcgg gggcgctttt 4500 tagccttcat ccattctcaa actttaaata tgtaagaagc ccttgttact tagttgaacg 4560 tgggccttcg aatgtatcaa cactagtggg ccatttttgg taagcagaac tggcgatgcg 4620 ggatgaaccg aacgcggggt taaggtgccg gagtggacgc tcatcagaca ccacaaaagg 4680 cgttagtaca tcttgacagc aggacggtgg ccatggaagt cggaatccgc taaggactgt 4740 gtaacaactc acctgccgaa tgtactagcc ctgaaaatgg atggcgctca agcgtcccac 4800 ccataccccg ccctcagggt agaaacgacg ccctgaggag taggcggccg tggaggtcag 4860 tgacgaagcc tagggcgtga gcccgggtcg aacggcctct agtgcagatc ttggtggtag 4920 tagcaaatac ttcaatgaga acttgaagga ccgaagtggg gaaaggttcc atgtgaacag 4980 cggttggaca tgggttagtc gatcctaagc catagggaag ttccgtttca aaggggcact 5040 cgtgccccgt gtggcgaaag ggaagccggt taacattccg gcacctggat gtgggttttg 5100 cgcggtaacg caactgaacg cggagacgac ggcgggggcc ccgggcagag ttctcttttc 5160 ttcttaacgg tctatcaccc tggaaacagt ttgtctggag atagggttta acggccggaa 5220 gagcccgaca cttctgtcgg gtccggtgcg ctctcgacgt cccttgaaaa tccgcgggag 5280 ggaataattc tcacgccagg tcgtactcat aaccgcagca ggtccccaag gtgaacagcc 5340 tctggttgat agaacaatgt agataaggga agtcggcaaa atagatccgt aacttcggga 5400 taaggattgg ctctaagggt tgggcacgtt gggctttggg cggacgccct gggagcaggt 5460 cgcctctagc cgggcaaccg gcggggggct tccagcatcc gggtgcagat gcccttagca 5520 ggcttcggcc gtccggcgcg cggttaacaa ccaacttaga actggtacgg acagggggaa 5580 tctgactgtc taattaaaac atagcattgc gatggccaga aagtggtgtt gacgcaatgt 5640 gatttctgcc cagtgctctg aatgtcaaag tgaagaaatt caaccaagcg cgggtaaacg 5700 gcgggagtaa ctatgactct cttaaggtag ccaaatgcct cgtcatctaa ttagtgacgc 5760 gcatgaatgg attaacgaga ttcccactgt ccctatctac tatctagcga aaccacagcc 5820 aagggaacgg gcttggcaga atcagcgggg aaagaagacc ctgttgagct tgactctagt 5880 ttgacattgt gaaaagacat aggaggtgta gaataggtgg gagcttcggc gccggtgaaa 5940 taccactact cctattgttt ttttacttat tcaatgaagc ggggctggat tttcgtccaa 6000 cttctggttt taaggtcctt cgcgggccga cccgggttga agacattgtc aggtggggag 6060 tttggctggg gcggcacatc tgttaaacca taacgcaggt gtcctaaggg gggctcatgg 6120 agaacagaaa tctccagtag aacaaaaggg taaaagtccc cttgattttg attttcagtg 6180 tgaatacaaa ccatgaaagt gtggcctatc gatcctttag tccctcgaaa tttgaggcta 6240 gaggtgccag aaaagttacc acagggataa ctggcttgtg gcggccaagc gttcatagcg 6300 acgtcgcttt ttgatccttc gatgtcggct cttcctatca taccgaagca gaattcggta 6360 agcgttggat tgttcaccca ctaataggga acgtgagctg ggtttagacc gtcgtgagac 6420 aggttagttt taccctactg atgaactcat cgcaatggta attcagctta gtacgagagg 6480 aaccgctgat tcagataatt ggtttttgcg gttgtccgac cgggcagtgc cgcgaagcta 6540 ccatctgctg gataatggct gaacgcctct aagtcagaat ccatgccaga acgcgatgat 6600 actacccgca cgttgtagac gtataagaat aggctccggc ctcgtatcct agcaggcgat 6660 tcctccgccg gcctcgaagt tggccggcgg taattcgcgt attgcaattt cgacacgcgc 6720 gggatcaaat cctttgcaga cgacttagat gtgcgaaagg gtcctgtaag cagtagagta 6780 gccttgttgt tacgatctgc tgagggtaag ccctccttcg cctagatttc ccagcgagag 6840 cccgccggcg gaacagccgg gcgagcctta cgggggaagc cttaagggga ttgagaagtg 6900 gtgccgtgcg ttcgcgcgcc cctaggtcct ttagccggcc gcaggtgtag ggtaggtcgg 6960 ttgggaggat ggggtgtagg gtaggtcggt gtagggtagg ttggttggga ggatggggtg 7020 tagggtaggt cggccgggtg tagggtaggt cggtgtaggg taggtgggat ggggcgctat 7080 atgcggccgc gagctcgcga gcctattttt agtgaaggct atataaataa gctttacgtt 7140 accgggcctt gctaccctcg agtggcgtgg gccgtgctgc ctactgggca ttgctcgccg 7200 ggctgtataa gggaggggtc ggggtcgcgg tctagggtag gtcgggtggg atggggtgta 7260 gggtaggaga agcgctctag tcgtgtgtct ttttctctag gtctattatt agtactggct 7320 gtagggcgac gtgccctgcc ttgttataat attatattgt atgtttaggc ctatactagc 7380 ttgtaatcta tttgtatctg gcttattagg tacggcttcc tttgtatata actagagagg 7440 ctctggtatg cttcttagta tagcggtata ggattcataa tcatagtaat gataatcata 7500 atagtaataa taataataat agtaatgata ataataataa tctatttata tcttatttaa 7560 aatgcttgta cggctgcctg ctcttaagga gtagctagat atgagatggt agggtagcta 7620 gctaacctag gctagacgtt ctcgtccctt agctatataa gtgctatata ttatagttag 7680 ttatctaacc taccttctta cttgagcaga agaggtaggg ttctagtata gctagtaggg 7740 cttctaggcc taagggcctg ttattcgagt tattataggt tagtatttaa tatagttata 7800 gggataggcc tcgattacgg gtataggata ggtaggatag gtatagggta ggtcggttag 7860 gaggataggg tgtaaggtag gtcggccggg tatagggtag gtagtaggtt aggcggggtg 7920 tagggtaggt cggtgtaggg taggtgggat gggcggggtg tagggtaggt cggttgggag 7980 gatggggtgt agggtaggtc ggtgtagggt aggtcgg 8017

Claims

N-연결된 글리코실화(N-linked glycosylation)가 감소되거나 없는 목적한 단백질을 생산할 수 있는 유전적으로 변형된 자낭균류 사상 진균(genetically modified ascomycetous filamentous fungus)으로서, 이러한 유전적으로 변형된 사상 진균은 STT3 및/또는 CWH8의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함하는, 유전적으로 변형된 자낭균류 사상 진균.
제1항에 있어서, 적어도 하나의 세포가 목적한 단백질을 암호화하는 적어도 하나의 외인성 폴리뉴클레오타이드를 포함하는, 유전적으로 변형된 자낭균류 사상 진균.
제1항 또는 제2항에 있어서, 적어도 하나의 세포가 STT2의 감소된 발현 및/또는 활성을 갖는, 유전적으로 변형된 자낭균류 사상 진균.
제3항에 있어서, STT3이 써모텔로마이세스 헤테로탈리카(Thermothelomyces heterothallica) STT3의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성(identity)을 갖는 아미노산 서열을 포함하는, 유전적으로 변형된 사상 진균.
제4항에 있어서, 써모텔로마이세스 헤테로탈리카 STT3이 서열 번호: 27의 아미노산을 포함하는, 유전적으로 변형된 사상 진균.
제1항 내지 제5항 중 어느 한 항에 있어서, 적어도 하나의 세포가 CWH3의 감소된 발현 및/또는 활성을 갖는, 유전적으로 변형된 사상 진균.
제6항에 있어서, CWH3가 써모텔로마이세스 헤테로탈리카 CWH3의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성을 갖는 아미노산 서열을 포함하는, 유전적으로 변형된 사상 진균.
제7항에 있어서, 써모텔로마이세스 헤테로탈리카 CWH3가 서열 번호: 28의 아미노산 서열을 포함하는, 유전적으로 변형된 사상 진균.
제1항 내지 제8항 중 어느 한 항에 있어서, STT3 및 CWH8의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함하는, 유전적으로 변형된 사상 진균.
제1항 내지 제9항 중 어느 한 항에 있어서, 유전적 변형이 stt3 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 올리고사카릴트랜스퍼라제(OST) 복합체(complex)의 촉매 소단위(catalytic subunit)를 생산하지 못하도록 하는, 유전적으로 변형된 사상 진균.
제1항 내지 제10항 중 어느 한 항에 있어서, 유전적 변형이 cwh8 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 기능성 돌리칠 피로포스페이트 포스파타제(functional dolichyl pyrophosphate phosphatase)를 생산하지 못하도록 하는, 유전적으로 변형된 사상 진균.
제1항 내지 제11항 중 어느 한 항에 있어서, 자낭균류 사상 진균이 페지조마이코티나(Pezizomycotina) 내의 속(genus)의 것인, 유전적으로 변형된 사상 진균.
제12항에 있어서, 자낭균류 사상 진균이 써모텔로마이세스(Thermothelomyces), 마이셀리오프토라(Myceliophthora), 트리초데르마(Trichoderma), 아스퍼길러스(Aspergillus), 페니실리움(Penicillium), 라삼소니아(Rasamsonia), 크리소스포리움(Chrysosporium), 코리나스쿠스(Corynascus), 푸사리움(Fusarium), 뉴로스포라(Neurospora), 및 탈라로마이세스(Talaromyces)로 이루어진 그룹으로부터 선택된 속의 것인, 유전적으로 변형된 사상 진균.
제13항에 있어서, 자낭균류 사상 진균이 써모텔로마이세스 헤테로탈리카(또한 마이셀리오프토라 써모필라(Myceliophthora thermophila)로서 나타냄) 종(species)의 것인, 유전적으로 변형된 사상 진균.
제14항에 있어서, 자낭균류 사상 진균이 서열 번호: 29로 제시된 핵산 서열에 대해 적어도 95%, 또는 적어도 96%, 또는 적어도 97%, 또는 적어도 98%, 또는 적어도 99%또는 100%의 동일성을 갖는 rDNA를 포함하는 써모텔로마이세스 헤테로탈리카 균주인, 유전적으로 변형된 사상 진균.
제15항에 있어서, 자낭균류 사상 진균이 써모텔로마이세스 헤테로탈리카 C1인, 유전적으로 변형된 사상 진균.
제1항 내지 제16항 중 어느 한 항에 있어서, 목적한 단백질이 항원, 치료학적 단백질, 항체, 효소, 백신 및 구조적 단백질(structural protein)로 이루어진 그룹으로부터 선택되는, 유전적으로 변형된 사상 진균.
제1항 내지 제17항 중 어느 한 항에 있어서, 목적한 단백질이 분비된 단백질인, 유전적으로 변형된 사상 진균.
제1항 내지 제18항 중 어느 한 항에 있어서, 자낭균류 사상 진균이 내인성 단백질을 암호화하는 하나 이상의 유전자를 결실하도록 추가로 변형된 균주인, 유전적으로 변형된 사상 진균.
제1항 내지 제19항 중 어느 한 항에 있어서, 상기 진균이 적어도 5개의 프로테아제의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함하는, 유전적으로 변형된 사상 진균.
(a) 자낭균류 사상 진균의 STT3 단백질의 발현 및/또는 활성을 감소시키는 단계; 및/또는
(b) 자낭균류 사상 진균의 CHW8 단백질의 발현 및/또는 활성을 감소시키는 단계를 포함하여, N-글리칸이 감소되어 있거나 없는 단백질을 생산할 수 있는 자낭균류 사상 진균을 생성하기 위한 방법.
제21항에 있어서,
(a) 자낭균류 사상 진균의 stt3 유전자를 결실시키거나 파괴함으로써 올리고사카릴트랜스퍼라제(oligosacchryltransferase; OST) 복합체의 기능성 촉매분해 소단위의 생산을 감소시키는 단계; 및/또는
(b) 자낭균류 사상 진균의 chw8 유전자를 결실시키거나 파괴함으로써 기능적 돌리칠 피로포스페이트 포스파타제의 생산을 감소시키는 단계를 포함하는, 방법.
제22항에 있어서, 목적한 이종 단백질을 암호화하는 외인성 폴리뉴클레오타이드를 자낭균류 사상 진균 내로 도입시킴으로써 진균 내에서 N-글리칸이 감소되어 있거나 없는 이종 단백질을 발현시키는 단계를 추가로 포함하는, 방법.
N-글리칸 변형이 감소되어 있거나 없는 이종 단백질을 생산하기 위한 방법으로서, 이러한 방법이:
a) 제1항 내지 제20항 중 어느 한 항에 따른 유전적으로 변형된 자낭균류 사상 진균을 제공하는 단계로서, 여기서 상기 진균이 목적한 이종 단백질을 암호화(encoding)하는 외인성 폴리뉴클레오타이드를 포함하는, 단계;
b) 자낭균류 사상 진균을 이종 단백질을 발현하기에 적합한 조건 하에서 배양하는 단계; 및
c) 이종 단백질을 회수하는 단계를 포함하는, 방법.
제24항에 있어서, 이종 단백질이 자낭균류 사상 진균 내에서 재조합적으로 발현된 이종 포유동물 단백질인, 방법.
제1항 내지 제20항 중 어느 한 항에 따라 유전적으로 변형된 자낭균류 사상 진균에 의해 생산된 재조합 단백질(recombinant protein).
제26항에 있어서, 단백질이 약제학적 등급인, 재조합 단백질.