KR102001129B1

KR102001129B1 - 재조합 종속영양성 미생물에서 맞춤 오일의 제조

Info

Publication number: KR102001129B1
Application number: KR1020177026170A
Authority: KR
Inventors: 스코트 프랭클린; 아라빈드 소만치; 카렌 에스피나; 조지 루덴코; 페넬로피 츄아
Original assignee: 테라비아 홀딩스 인코포레이티드
Priority date: 2008-11-28
Filing date: 2009-11-30
Publication date: 2019-07-17
Also published as: US9062294B2; KR20110096555A; US20150218604A1; US8268610B2; KR101763878B1; EP2370554B1; WO2010063032A3; EP2370555A2; BRPI0921543A2; SG171428A1; US20110203168A1; US8187860B2; US20130089916A1; US9353389B2; EP3098321A2; CO6400153A2; AU2016250460A1; CA2745129C; US8222010B2; AU2009319721A1

Abstract

오일 함유 미생물 및 상기 미생물의 저렴한 배양 방법을 포함하여, 프로토테카에서 오일, 연료, 함유화학물질 및 기타 화합물을 제조하기 위한 방법 및 조성물이 제공된다. 예를 들어, 리파제, 슈크로스 수송체, 슈크로스 인버타제, 프럭토키나제, 폴리사카라이드-분해 효소, 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 리덕타제, 지방 아실-CoA 리덕타제, 지방 알데하이드 리덕타제, 지방 알데하이드 데카보닐라제 및/또는 아실 운반 단백질을 암호화하는 외인성 유전자를 포함하는 프로토테카 세포는 재생가능한 디젤, 바이오디젤 및 재생가능한 제트 연료를 포함하는 수송 연료를 제조하는데 유용하다.

Description

재조합 종속영양성 미생물에서 맞춤 오일의 제조{Manufacturing of tailored oils in recombinant heterotrophic microorganisms}

관련 출원의 상호 참조

본 출원은 35 U.S.C. 119(e)하에 2008년 11월 28일자로 출원된 미국 가특허 출원 번호 제61/118,590호, 2008년 12월 1일자로 출원된 미국 가특허 출원 번호 제61/118,994호, 2009년 4월 30일자로 출원된 미국 가특허 출원 번호 제61/174,357호, 및 2009년 6월 23일자로 출원된 미국 가특허 출원 번호 제61/219,525호에 대한 우선권을 주장한다. 이들 각각의 출원은 이의 전문이 모든 목적을 위해 본원에 참조문헌으로서 인용된다.

서열목록에 대한 참조

본 출원은 이에 첨부된 제1면 내지 제72면에 나타낸 서열 목록을 포함한다.

본 발명은 미생물로부터 만들어진 오일, 연료 및 오일 함유 화학제품의 제법에 관한 것이다. 특히, 본원은 오일 함유 미세조류, 지질, 지방산 에스테르, 지방산, 알데하이드, 알콜 및 알칸을 포함하는 유용한 화합물의 제조를 위해 상기 조류를 배양하는 방법, 및 상기 조류를 유전학적으로 변형시켜 제조 효율을 개선시키고 상기 조류에 의해 생성된 오일의 유형과 조성을 변화시키는 방법 및 시약에 관한 것이다.

화석 연료는 썩은 식물 및 동물로부터 형성되어 10억년 이상 동안 지각에서 열 및 압력에 노출됨에 의해 원유, 석탄, 천연 가스 또는 중질유로 전환된, 매장된 유기 물질의 연소성 지질학적 퇴적물에 대한 관용어이다. 화석 연료는 한정된 재생가능하지 않은 자원이다.

세계 경제의 에너지에 대한 수요 증가는 또한 탄화수소 비용에 대한 가중된 압력을 부여하였다. 에너지외에도 플라스틱 및 화학물질 제조업체를 포함하는 많은 산업은 이들의 제조 공정을 위한 공급 연료로서 탄화수소의 유용성에 크게 의존한다. 현재 공급 자원에 대한 저렴한 대용물이 에너지 및 이들의 원료 비용에 대한 상승된 압력을 완화시키는데 일조할 수 있었다.

PCT 공개 번호 제2008/151149호는 오일 제조용의 미세조류를 배양하기 위한 방법 및 재료를 기재하고 있고 특히 미세조류 클로렐라 프로토테코이데스(Chlorella protothecoides)에 의해 생성된 오일로부터 디젤 연료의 제조를 예시하고 있다. 미세조류에서의 개선된 오일 제조 방법, 특히 단쇄의 길이를 갖고 고도로 포화된 안료 부재인 오일을 보다 높은 수율 및 효율로 제조하는 방법이 여전히 요구되고 있다. 본 발명은 상기 필요성을 충족시킨다.

발명의 요약

본 발명은 외인성 유전자를 포함하는 프로토테카(Prototheca) 속의 세포를 제공하고 몇몇 양태에서, 상기 세포는 프로토테카 모리포르미스(Prototheca moriformis), 프로토테카 크루가니(Prototheca krugani), 프로토테카 스타그노라(Prototheca stagnora) 또는 프로토테카 조프피(Prototheca zopfii) 종의 균주이고 다른 양태에서 상기 세포는 서열번호 11 내지 19중 하나 이상과 70, 75, 80, 85 또는 95% 이상의 뉴클레오타이드 동일성을 갖는 23S rRNA 서열을 갖는다. 몇몇 세포에서, 외인성 유전자는 암호화 서열이고 프로모터와 작동가능하게 연결되어 있으며 몇몇 양태에서, 상기 프로모터는 프로토테카 속의 종에 대한 내인성 유전자로부터 기원한다. 추가의 양태에서, 상기 암호화 서열은 슈크로스 인버타제, 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 리덕타제, 지방 아실-CoA 리덕타제, 지방 알데하이드 리덕타제, 지방 알데하이드 데카보닐라제, 아실 운반 단백질 및 항생제에 대해 내성을 부여하는 단백질로 이루어진 그룹으로부터 선택된 단백질을 암호화한다. 쇄 길이가 C8, C10, C12 또는 C14인 하나 이상의 지방 아실-ACP 기질에 대해 가수분해 활성을 갖는 지방 아실-ACP 티오에스테라제의 몇몇 양태는 서열번호 59, 61, 63 및 138 내지 140으로 이루어진 그룹으로부터 선택된 하나 이상의 서열과 50, 60, 70, 80, 또는 90% 이상의 아미노산 동일성을 갖는 아실-ACP 티오에스테라제를 포함한다. 추가의 양태에서, 상기 암호화 서열은 미세조류 기원의 플라스티드(plastid) 표적화 서열을 포함하고 몇몇 양태에서 상기 미세조류는 클로렐라세애(Chlorellaceae)과 기원의 다른 속 뿐만 아니라 프로토테카 또는 클로렐라(Chlorella) 속의 종이다. 몇몇 양태에서, 상기 플라스티드 표적화 서열은 서열번호 127 내지 133의 하나 이상과 20, 25, 35, 45, 또는 55% 이상의 아미노산 서열 동일성을 갖고 플라스티드 게놈에 위치하지 않는 플라스티드에 대한 외인성 유전자에 의해 암호화된 단백질을 표적화할 수 있다. 다른 양태에서, 상기 프로모터는 세포의 배양 배지내 질소의 감소 또는 고갈에 응답하여 상향조절되고, 예를 들어, 세포외 환경이 10mM 또는 5mM 이상의 질소 함유로부터 질소 부재로 변화하는 경우 프로토테카 속의 세포에 전사체가 풍부해짐에 의해 결정되는 바와 같이 3배 이상 상향조절된다. 추가의 양태에서, 상기 프로모터는 서열번호 91 내지 102중 하나의 50개 이상의 뉴클레오타이드 절편을 포함한다. 다른 양태에서, 상기 세포는 서열번호 11 내지 19중 하나 이상과 70, 75, 80, 85 또는 95% 이상의 뉴클레오타이드 동일성을 갖는 23S rRNA 서열을 갖는다. 다른 양태에서, 외인성 유전자는 세포의 염색체내로 통합된다.

본 발명의 세포의 추가의 양태에서, 상기 세포는 프로토테카 속 기원이고 외인성 지방 아실-ACP 티오에스테라제 유전자 및 세포의 총 지질중 C8-C14가 4% 이상인 지질 프로필을 포함하고, 이때, C8의 양은 세포의 총 지질중 0.3% 이상이고 C10의 양은 세포의 총 지질중 2% 이상이고, C12의 양은 세포의 총 지질중 2% 이상이고, C14의 양은 세포의 총 지질중 4% 이상이고 C8-C14의 양은 세포의 총 지질중 10-30%, 20-30%, 또는 10, 20, 또는 30% 이상이다. 몇몇 양태에서, 상기 세포는 외인성 슈크로스 인버타제 유전자를 추가로 포함한다. 몇몇 양태에서, 상기 세포는 프로토테카 모리포르미스, 프로토테카 크루가니, 프로토테카 스타그노라 또는 프로토테카 조프피 종의 균주이고 다른 양태에서 상기 세포는 서열번호 11 내지 19중 하나 이상과 70, 75, 80, 85 또는 95% 이상의 뉴클레오타이드 동일성을 갖는 23S rRNA 서열을 갖는다. 다른 양태에서, 외인성 지방 아실-ACP 티오에스테라제 유전자는 세포의 염색체내로 통합된다. 본 발명의 다른 양태는 트리글리세라이드 조성물중 4% 이상의 C8-C14 w/w 또는 면적%의 지질 프로필의 트리글리세라이드 조성물을 제조하는 방법을 포함하고, 이때, C8의 양은 0.3% 이상의 w/w 또는 면적%이고, C10의 양은 2% 이상의 w/w 또는 면적%이고, C12의 양은 2% 이상의 w/w 또는 면적%이고 C14의 양은 4% 이상의 w/w 또는 면적%이고 C8-C14의 양은 10-30%, 20-30%, 또는 10, 20, 또는 30% 이상의 w/w 또는 면적%이다. 본 발명은 또한 상기 세포를 배양함을 포함하는 트리글리세라이드 조성물을 제조하는 방법을 포함하고, 여기서, 상기 세포는 슈크로스 인버타제를 암호화하는 외인성 유전자를 더욱 포함하고 슈크로스는 탄소원으로서 제공된다. 몇몇 양태에서, 상기 슈크로스 인버타제는 서열번호 3, 20 내지 29 및 90중 하나 이상과 50, 60, 70, 80, 또는 90% 이상의 아미노산 동일성을 갖는다.

본 발명의 양태는 트리글리세라이드 오일 조성물을 함유하는 세포 뿐만 아니라 트리글리세라이드 오일 조성물을 포함하고 상기 조성물은 4% 이상의 C8 내지 C14의 지질 프로필 및 하기의 특성중 하나 이상을 포함한다: 0.1-0.4 마이크로그램/ml의 총 카로테노이드, 0.4 마이크로그램/ml 미만의 총 카로테노이드, 0.001 마이크로그램/ml 미만의 리코펜; 0.02 마이크로그램/ml 미만의 베타 카로틴, 오일 kg당 0.02 밀리그램 미만의 클로로필; 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤; 오일 그램당 0.2-0.5 밀리그램의 총 토코트리에놀, 오일 그램당 0.4 밀리그램 미만의 총 토코트리에놀, 오일의 100그램당 4-8 mg의 캄페스테롤, 및 오일 100 그램당 40-60 mg의 스티그마스테롤. 본 발명의 몇몇 양태에서, 트리글리세라이드 오일 조성물은 트리글리세라이드 조성물 중 4% 이상의 C8-C14 w/w 또는 면적%를 갖고, 이때 C8의 양은 0.3% 이상의 w/w 또는 면적%이고, C10의 양은 2% w/w 또는 면적%이고 C12의 양은 2% 이상의 w/w 또는 면적%이고, C14의 양은 4% w/w 또는 면적%이고, C8-C14의 양은 10-30%, 20-30%, 또는 10, 20, 또는 30% 이상의 w/w 또는 면적%이다. 다른 양태에서, 트리글리세라이드 오일 조성물은 대두, 평지씨, 카놀라, 팜, 팜 커넬, 코코넛, 옥수수, 폐기 식물, 차이니즈 탈로우, 올리브, 해바라기, 면화씨, 치킨 지방, 소 탈로우, 돼지 탈로우, 미세조류, 거대조류, 쿠페아, 아마, 피넛, 쵸이스 백색 그리스, 라드, 카멜리나 사티바, 머스타드 씨, 캐슈 너트, 귀리, 루핀, 케나프, 금잔화, 헴프, 커피, 아마인(아마), 헤이즐넛, 유포비아, 호박씨, 코리안더, 카멜리아, 참깨, 홍화, 쌀, 유동, 코코아, 코프라(copra), 양귀비(opium poppy), 아주까리, 피칸, 호호바, 자트로파, 마카다미아, 브라질 너트, 아보카도, 석유 또는 상기 오일 중 임의의 증류 분획물로 이루어진 그룹으로부터 선택된 하나 이상의 다른 조성물과 블렌딩된다.

본 발명의 방법은 또한 트랜스에스테르화, 수소화, 수소크랙킹화, 탈산소화, 이성체화, 상호에스테르화, 하이드록실화, 유리 지방산을 수득하기 위한 가수분해, 그리고 비누화로 이루어진 목록으로부터 기원하는 하나 이상의 화학적 반응을 수행하여 상기 오일을 가공처리함을 포함한다. 본 발명은 또한 상기 언급된 오일의 수소화 및 이성체화로부터 제조된 탄화수소 연료 및 상기 언급된 오일의 트랜스에스테르화로부터 제조된 지방산 알킬 에스테르를 포함한다. 몇몇 양태에서, 탄화수소 연료는 프로토테카 속의 세포로부터 분리된 트리글리세라이드로부터 제조되고 이때, ASTM D86 T10-T90 증류 범위는 25℃ 이상이다. 다른 양태에서, 지방산 알킬 에스테르 연료는 프로토테카 속의 세포로부터 분리된 트리글리세라이드로부터 제조되고, 이때 상기 조성물은 120초 미만의 ASTM D6751 A1 냉 침지 시간을 갖는다.

본 발명은 또한 (a) 20 내지 30몰%의 갈락토스; 55 내지 65몰%의 글루코스 및 5 내지 15몰%의 만노스로 이루어진 그룹으로부터 기원하는 하나 이상의 모노사카라이드를 포함하는 폴리사카라이드; (b) 단백질; 및 (c) 서열번호 11 내지 19중 하나 이상과 70, 75, 80, 85 또는 95% 이상의 뉴클레오타이드 동일성을 갖는 23S rRNA 서열을 포함하는 DNA; 및 (d) 외인성 유전자를 포함하는 조성물을 포함한다. 몇몇 양태에서, 외인성 유전자는 슈크로스 인버타제 및 지방 아실-ACP 티오에스테라제로부터 선택되고 추가의 양태에서 상기 조성물은 지질 프로필이 4% 이상의 C8-C14인 지질을 추가로 포함한다. 다른 양태에서, 상기 조성물은 동물 사료 소비용으로 제형화된다.

본 발명은 프로토테카 속의 세포의 배양 배지에서 질소의 감소 또는 고갈에 응답하여 상향조절되는 프로모터를 암호화하는 재조합 핵산을 포함하고, 예를 들어, 세포외 환경이 10mM 또는 5mM 이상의 질소 함유로부터 질소 부재로 변화하는 경우 전사체의 풍부함으로 측정되는 바와 같이 3배 이상 상향조절된다. 몇몇 양태에서, 재조합 핵산은 서열번호 91 내지 102중 하나의 50개 이상의 뉴클레오타이드 절편을 포함한다. 본 발명은 또한 (a) 프로토테카 속의 세포에서 활성인 프로모터; 및 (b) 프로모터와 작동적으로 연결되고, 암호화 서열의 코돈중 20, 30, 40, 50, 60, 또는 80% 이상이 표 1의 가장 바람직하거나 두번째 바람직한 코돈을 함유하는 암호화 서열을 포함하는 발현 카세트를 포함하는 핵산 벡터를 포함한다. 몇몇 벡터에서, 상기 암호화 서열은 쇄 길이가 C8, C10, C12 또는 C14인 하나 이상의 지방 아실-ACP 기질에 대해 가수분해 활성을 갖는 티오에스테라제를 포함하는, 지방 아실-ACP 티오에스테라제와 프레임내에 있는 플라스티드 표적화 서열을 포함한다. 몇몇 벡터는 미세조류로부터 기원하는 것들 및 플라스티드 표적화 서열이 서열번호 127 내지 133중 하나 이상과 20, 25, 35, 45, 또는 55% 이상의 아미노산 서열 동일성을 갖고 단백질을 프로토테카 속의 세포의 플라스티드로 표적화시킬 수 있는 것들을 포함하는, 프로토테카 속의 세포의 플라스티드로 단백질을 표적화시킬 수 있는 펩타이드를 암호화하는 플라스티드 표적화 서열을 포함한다. 본 발명의 추가의 벡터는 프로토테카 속의 세포의 핵 게놈에 내인성인 핵산 서열을 포함하고, 상기 서열은 길이가 200개 이상의 뉴클레오타이드이고 몇몇 벡터는 프로토테카 속의 세포의 핵 게놈에 내인성인 제1 및 제2 핵산 서열을 포함하고, 여기서, 제1 및 제2 서열은 (a) 각각 길이가 200개 이상의 뉴클레오타이드이고; (b) 발현 카세트를 플랭킹하고; (c) 동일한 프로토테카 염색체상에서 5, 10, 15, 20, 및 5OkB 이하로 이격되어 위치하고 있다.

본 발명은 또한 서열번호 134-135중 하나 또는 둘다와 80, 90, 95 또는 98% 이상의 뉴클레오타이드 동일성을 갖는 재조합 핵산 및 서열번호 136-137중 하나 또는 둘다와 80, 90, 95 또는 98% 이상의 아미노산 동일성을 갖는 단백질을 암호화하는 재조합 핵산을 포함한다.

본 발명은 또한 (a) 고정 탄소원의 존재하에 프로토테카 속의 세포 집단(여기서, (i) 세포는 외인성 유전자를 함유하고, (ii) 상기 세포는 지질을 이들의 무수 세포 중량의 10, 20, 30, 40, 60, 또는 70% 이상으로 축적시키고; (iii) 고정 탄소원은 수수 및 탈중합된 셀룰로스 물질로 이루어진 그룹으로부터 선택된다)을 배양하는 단계; 및 (b) 배양된 미생물로부터 지질 성분을 분리하는 단계를 포함하는, 트리글리세라이드 조성물을 제조하는 방법을 포함한다. 몇몇 양태에서, 고정 탄소원은 옥수수 스토버, 미스칸투스, 가축 수수, 사탕무 펄프 및 사탕수수 바가스(bagasse)로 이루어진 그룹으로부터 선택되는 탈중합된 셀룰로스 물질이고, 이것은 임의로 배양 단계 전에 물로 세척한다. 몇몇 양태에서, 고정 탄소원은 탈중합된 셀룰로스 물질이고 탈중합된 셀룰로스 물질의 글루코스 수준은 배양 단계전에 300 g/리터 이상, 400 g/리터 이상, 500 g/리터 이상, 또는 600 g/리터 이상의 수준으로 농축시키고 세포가 성장하고 지질을 축적시킴으로써 시간 경과에 따라 배양물에 공급된다. 몇몇 양태에서, 외인성 유전자는 쇄 길이가 C8, C10, C12 또는 C14인 하나 이상의 지방 아실-ACP 기질에 대해 가수분해 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하고 몇몇 방법에서, 상기 트리글리세라이드는 4% 이상의 C8-C14의 지질 프로필 및 하기의 특성중 하나 이상을 갖는다: 0.1-0.4 마이크로그램/ml의 총 카로테노이드; 오일 kg당 0.02 밀리그램 미만의 클로로필; 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤; 오일 그램당 0.2-0.5 밀리그램의 총 토코트리에놀, 오일 100 그램당 4-8 mg의 캄페스테롤 및 오일 100 그램당 40-60 mg의 스티그마스테롤.

본 발명의 추가의 방법은 (a) 탈중합된 셀룰로스 물질의 존재하에 미생물 집단(여기서, (i) 탈중합된 셀룰로스 물질은 배양 단계 전에 물로 세척하고; (ii) 상기 세포는 지질을 이의 무수 세포 중량의 10, 20, 30, 40, 60, 또는 70% 이상으로 축적시키고; (iii) 탈중합된 셀룰로스 물질은 배양 단계 전에 300, 400, 500, 또는 600 g/리터 이상의 글루코스로 농축시키고; (iv) 미생물은 유가식 반응으로 배양하고 이때, 글루코스가 300, 400, 500, 또는 600 g/리터 이상인 탈중합된 셀룰로스 물질이 미생물에 공급된다)을 배양하는 단계; 및 (b) 배양된 미생물로부터 지질 성분을 분리하는 단계를 포함하는, 트리글리세라이드 조성물을 제조함을 포함한다. 몇몇 양태에서, 고정 탄소원은 옥수수 스토버, 미스칸투스, 가축 수수, 사탕무 펄프 및 사탕수수 바가스로 이루어진 그룹으로부터 선택된 탈중합된 셀룰로스 물질이다. 추가의 양태에서, 상기 미생물은 프로토테카 속의 종이고, 쇄 길이가 C8, C10, C12 또는 C14인 하나 이상의 지방 아실-ACP 기질에 대해 가수분해 활성을 갖는 지방 아실-ACP 티오에스테라제를 포함하는, 외인성 유전자를 함유한다. 본 발명의 추가의 방법은 탄소원으로서 슈크로스의 존재하에 서열번호 30과 90 또는 96% 이상의 뉴클레오타이드 동일성을 갖는 23S rRNA 서열을 갖는 세포를 배양함을 포함하는, 트리글리세라이드 오일을 제조하는 방법을 포함한다.

본 발명은 또한 트랜스에스테르화, 수소화, 수소크랙킹화, 탈산소화, 이성체화, 상호에스테르화, 하이드록실화, 가수분해 및 비누화로 이루어진 그룹으로부터의 하나 이상의 화학 반응을 트리글리세라이드 오일상에 수행함을 포함하는 화학물질의 제조 방법을 포함하고, 여기서, 상기 트리글리세라이드 오일은 4% 이상의 C8-C14의 지질 프로필 및 하기의 특성중 하나 이상을 갖는다: 0.1-0.4 마이크로그램/ml의 총 카로테노이드, 오일 kg당 0.02 밀리그램 미만의 클로로필; 오일 100그램당 0.10-0.60 밀리그램의 감마 토코페롤; 오일 그램당 0.1-0.5 밀리그램의 총 토코트리에놀, 오일 100그램당 1 내지 8mg의 캄페스테롤, 및 오일 100 그램당 10-60 mg의 스티그마스테롤. 몇몇 방법은 쇄 길이가 C8, C10, C12 또는 C14인 하나 이상의 지방 아실-ACP 기질에 대해 가수분해 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 지방 아실-ACP 티오에스테라제 유전자를 포함하는 프로토테카 속의 세포를 배양함에 의해 오일을 제조하여 수행된다. 몇몇 방법에서, 상기 가수분해 반응은 오일이 글리세롤 및 지방산으로 분리되는 촉매 가수분해 반응을 포함하는, 비누화, 산 가수분해, 알칼린 가수분해, 효소 가수분해, 촉매 가수분해 및 고온-압착 물 가수분해로 이루어진 그룹으로부터 선택된다. 추가의 방법에서, 지방산은 아민화 반응을 진행하여 지방 질소 화합물을 생성하거나 오존분해 반응으로 일염기성- 및 이염기성-산을 생성한다. 몇몇 양태에서, 상기 오일은 효소 분리 및 압력 분리로 이루어진 그룹으로부터 선택되는 트리글리세라이드 분리 방법(splitting method)에 적용된다. 몇몇 방법에서, 응축 반응은 가수분해 반응 후에 수행한다. 다른 방법은 오일중에서 수소화처리 반응(hydroprocessing reaction)을 수행함을 포함하고, 이때 임의로 수소화처리 반응 생성물은 수소화처리 반응 전에 또는 이와 동시에 탈산소 반응 또는 응축 반응을 진행한다. 몇몇 방법은 추가로 가스 제거 반응을 포함한다. 추가의 방법은 수소분해 반응, 수소화, 연속 수소화-수소분해 반응, 연속 수소분해-수소화 반응 및 조합된 수소화-수소분해 반응으로 이루어진 그룹으로부터 선택된 탈산소화 반응을 수행함에 의해 상기 언급된 오일을 가공시킴을 포함한다. 몇몇 방법에서, 응축 반응은 탈산소화 반응 후에 수행한다. 다른 방법은 상기 언급된 오일에 대해, 에스테르화 반응, 임의로 상호에스테르화 반응 또는 트랜스에스테르화 반응을 수행함을 포함한다. 다른 방법은 상기 언급된 오일에 대해 하이드록실화 반응을 수행함을 포함하고, 이때 임의로 응축 반응은 하이드록실화 반응 후에 수행한다.

도 1 및 2는 탄소원으로서 수수상에서 성장한 프로토테카 종 및 클로렐라 루테오비리디스(Chlorella luteoviridis) 균주 SAG 2214의 성장 곡선을 설명한다.
도 3은 글루코스 및 슈크로스상에서의 SAG 2214의 시간 경과 성장을 보여준다.
도 4는 실시예 3에 기재된 바와 같이, 프로토테카 형질전환에 사용하는 카세트 맵을 보여준다.
도 5는 실시예 3에 기재된 바와 같이 UTEX 균주 1435의 3개의 형질전환체에 대한 서던 블롯 분석 결과를 보여준다.
도 6은 코돈 최적화되고 비-코돈 최적화된 suc2(효모 슈크로스 인버타제ylnv)) 전이유전자 작제물을 도시한다. 관련 제한 클로닝 부위를 나타내고 화살표는 전사 방향을 지적한다.
도 7a는 셀룰로스 유래된 당(옥수수 스토버, 사탕무, 사탕수수, 미스칸투스 및 글루코스 대조군)상에서 성장한 프로토테카 모리포르미스의 결과를 보여준다. 성장은 광학 밀도 측정으로 표현한다 (A750 판독).
도 7b는 글루코스/크실로스 대조군과 비교하여, 옥수수 스토버-유래된 셀룰로스 당의 상이한 수준을 사용한 프로토테카 모리포르미스를 사용하는 성장 실험의 결과를 보여준다.
도 7c는 크실로스가 프로토테카 배양에서 지질 생산에 미치는 영향을 보여준다.
도 7d는 프로토테카의 성장(무수 세포 중량(DCW)에서)에 대한 염 농도(Na₂SO₄) 및 소포제의 영향을 보여준다.
도 8은 프로토테카 성장에 대한 다양한 셀룰로스 물질(사탕수수 바가스, 수수 케인(sorghum cane), 미스칸투스 및 비트 펄프)의 열수 처리 및 수득한 당 스트림에 대한 영향을 보여준다.
도 9는 반복되는 열수 처리 사이클 후 셀룰로스 바이오매쓰에서 하이드록시메틸 푸르푸랄(HMF) 및 푸르푸랄의 수준이 감소함을 보여준다.
도 10은 발효기에서 종속영양성 오일 생성에 사용하기에 적합한 당 스트림을 생성하기 위한 셀룰로스 물질의 당화 공정을 도시한 것이다.
도 11은 반복적인 열수 처리 사이클 후 분해된 사탕수수 바가스에서 HMF 및 푸르푸랄의 수준이 감소함을 보여준다.
도 12는 프로토테카 형질전환에 사용되는 티오에스테라제 작제물을 도시한 것이다. 이종성 베타-튜불린(Neo^R 구동시킴) 및 글루타메이트 데하이드로게나제 프로모터는 각각 클라미도모나스 레인하르드티(Chlamydomonas reinhardtii) 및 클로렐라 소로키니아나(Chlorella sorokiniana)로부터 유래한다. 니트레이트 리덕타제 3'UTR은 클로렐라 불가리스로부터 유래하였다. 관련 제한 클로닝 부위를 나타내고 화살표는 전사 방향을 지적한다.
도 13은 프로토테카 트리글리세라이드 오일로부터 제조된 재생가능한 디젤의 크로마토그램을 보여준다.

본 발명은 프로토테카 및 특정 관련 미생물이 예상치 않게 오일, 연료 및 기타 탄화수소 또는 지질 조성물을 경제적으로 및 대량으로 생성하기에 유리한 성질을 갖는다는 발견 및 이들 미생물을 유전학적으로 변형시켜 당해 성질을 개선시키는 방법 및 시약의 발견을 기초로 한다. 이들 미생물에 의해 생성된 오일은 무엇보다 운송 연료, 석유 및/또는 식품 및 화장품 산업에서 사용될 수 있다. 지질의 트랜스에스테르화는 바이오디젤로서 유용한 장쇄의 지방산 에스테르를 생성시킨다. 다른 효소 및 화학적 공정은 지방산, 알데하이드, 알콜, 알칸 및 알켄을 수득하기 위해 개조될 수 있다. 몇몇 응용에서, 재생가능한 디젤, 제트 연료 또는 기타 탄화수소 화합물이 제조된다. 본 발명은 또한 생산성 증가 및 지질 수율 증가 및/또는 본원에 기재된 조성물의 보다 저렴한 생산을 위해 미세조류를 배양하는 방법을 제공한다.

본 발명의 상세한 설명은 구독자의 편리를 위해 여러 섹션으로 나누어진다. 섹션 1은 본원에 사용되는 용어의 정의를 제공한다. 섹션 2는 본 발명의 방법에 유용한 배양 조건을 기재한다. 섹션 3은 유전자 가공 기술 및 재료를 기재한다. 섹션 4는 슈크로스를 이용가능할 수 있게 하는 프로토테카의 유전자 가공을 기재한다. 섹션 5는 지질 생합성을 변형시키기 위한 프로토테카의 유전자 가공을 기재한다. 섹션 6은 연료 및 화학물질을 제조하는 방법을 기재한다. 섹션 7은 발명의 실시예 및 양태를 기재한다. 본 발명의 상세한 설명에 이어서 발명의 다양한 측면 및 양태를 설명하는 예가 제공된다.

I. 정의

달리 정의되지 않는 경우, 본원에 사용된 모든 기술적 및 과학적 용어는 본 발명의 속하는 분야의 당업자가 통상적으로 이해하는 의미를 갖는다. 하기의 참조문헌은 본 발명에 사용되는 많은 용어의 일반적인 정의를 당업자에게 제공한다: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). 본원에 사용된 바와 같이, 하기의 용어는 달리 특정되지 않는 경우 이들 본래의 의미를 갖는다.

핵산에 관하여 "미세조류에서 활성(active in microalgae)"은 미세조류에서 기능성인 핵산을 지칭한다. 예를들어, 유전자전이 미세조류에 항생제 내성을 부여하는 항생제 내성 유전자를 구동하기 위해 사용된 프로모터는 미세조류에서 활성이다.

"아실 운반 단백질" 또는 "ACP"는 4'-포스포판테테인 잔기의 원위 티올에서 티올 에스테르로서 지방산 합성 동안에 성장하는 아실 쇄와 결합하는 단백질이고 지방산 신타제 복합체의 성분을 포함한다.

"아실-CoA 분자" 또는 "아실-CoA"는 조효소 A의 4'-포스포판테테인 잔기의 원위 티올에서 티올 에스테르 연결을 통해 조효소 A에 공유적으로 부착된 아실 잔기를 포함하는 분자이다.

"면적%"는 FAME GC/FID 검출 방법을 사용하여 관찰된 피크 면적을 언급하고 상기 방법에서, 샘플내 모든 지방산은 검출 전에 지방산 메틸 에스테르(FAME)로 전환된다. 예를 들어, 분리 피크는 C14:1과 같은 임의의 다른 지방산과 비교하여 불포화성(C14:0)을 갖지 않는 14개 탄소원자의 지방산에 대해서 관찰된다. 각각의 부류의 FAME에 대한 면적%는 혼합물내 이의 % 조성물과 직비례하고 샘플내 존재하는 모든 피크의 합계를 기준으로 계산된다(즉, [특정 피크하의 면적/모든 측정된 피크의 총 면적] X 100). 본 발명의 오일 및 세포의 지질 프로필을 언급하는 경우, "4% 이상의 C8-C14"는 세포내 또는 추출된 글리세로지질 조성물내의 총 지방산의 4% 이상이 탄소원자 8, 10, 12 또는 14개를 포함하는 쇄 길이를 가짐을 의미한다.

"무균성"은 다른 생존 유기체에 의해 오염되지 않은 유기체 배양물이다.

"바이오디젤"은 디젤 엔진에서 연료로서 사용하기에 적합한 생물학적으로 생산된 지방산 알킬 에스테르이다.

"바이오매쓰"는 세포의 성장 및/또는 증식에 의해 생산된 물질이다. 바이오매쓰는 세포에 의해 분비되는 화합물을 포함하지만 이에 제한되지 않는, 세포외 물질 뿐만 아니라 세포 및/또는 세포내 내용물을 함유할 수 있다.

"생물반응기"는 임의로 현탁된 세포가 배양된 인클로저(enclosure) 또는 부분적 인클로저이다.

"촉매"는 생성물의 일부가 되지 않고 반응물의 생성물로의 화학적 반응을 용이하게 하거나 촉진시킬 수 있는 분자 또는 거대분자 복합체와 같은 제제이다. 촉매는 반응 속도를 증가시키고 이후 촉매는 또 다른 반응물에 작용하여 생성물을 형성시킬 수 있다. 촉매는 일반적으로 반응을 위해 요구되는 총 활성화 에너지를 저하시켜 반응이 보다 신속하게 또는 보다 저온에서 진행되도록 한다. 따라서, 반응 평형은 보다 신속하게 도달할 수 있다. 촉매의 예는 생물학적 촉매인 효소; 비생물학적 촉매인 열; 및 화석 오일 정련 공정에 사용되는 금속을 포함한다.

"셀룰로스 물질"은 글루코스 및 크실로스, 및 디사카라이드, 올리고사카라이드, 리그닌, 푸르푸랄 및 기타 화합물과 같은 임의의 추가의 화합물을 포함하는, 셀룰로스의 분해 생성물이다. 셀룰로스 물질의 공급원의 비제한적인 예는 사탕수수 바가스, 사탕무 펄프, 옥수수 스토버, 목재 칩, 톱밥 및 지팽이풀을 포함한다.

"동시배양", 및 이의 변형어구인 "동시 배양하다" 및 "동시-발효시키다"는 동일한 생물반응기에 2개 이상의 세포 유형이 존재함을 언급한다. 2개 이상의 세포 유형은 미세조류와 같은 미생물일 수 있거나 상이한 세포 유형과 함께 배양되는 미세조류 세포일 수 있다. 상기 배양 조건은 2개 이상의 세포 유형의 성장 및/또는 증식을 조성하는 것들 또는 다른 나머지 세포 성장을 유지하면서 2개 이상의 세포중 하나 또는 서브세트의 성장 및/또는 증식을 촉진시키는 것들일 수 있다.

"조인자"는 이의 효소 활성을 수행하는 효소에 대해 요구되는 기질 이외의 임의의 분자이다.

"상보적 DNA" 또는 "cDNA"는 전령 RNA(mRNA) 또는 증포(예를 들어, 폴리머라제 연쇄 반응("PCR")을 통한)에 의해 보통 수득되는 mRNA의 DNA 카피이다.

"배양된", 및 이의 변형어 예를 들어, "변형된" 및 "발효된"은 선택되고/되거나 제어된 조건을 사용함에 의한 하나 이상의 세포의 성장의 의도적인 조성(세포 크기, 세포 함량 및/또는 세포 활성의 증가) 및/또는 번식(유사분열을 통한 세포수의 증가)을 언급한다. 성장 및 번식 둘다의 조합은 증식으로 통합될 수 있다. 선택되고/되거나 제어된 조건의 예는 생물반응기에서 합성 배지(pH, 이온 강도 및 탄소원과 같은 공지된 특성과 함께), 특정 온도, 산소압, 이산화탄소 수준 및 성장의 사용을 포함한다. 배양하다는 천연적인 또는 사람 간섭이 없는 미생물의 성장 또는 번식을 언급하지 않고, 예를 들어, 궁극적으로 지질학적 조악한 오일을 생성하기 위해 화석화된 유기체의 천연의 증식은 배양이 아니다.

"세포용해"는 저장성 환경내에서의 세포의 용해이다. 세포 용해는 과도한 삼투압, 또는 세포 내부를 향한 물의 이동(과수화)에 의해 유발된다. 상기 세포는 내부 물의 삼투압을 견딜 수 없어서 터진다.

"탈지질화된 음식물" 및 "탈지질화된 미생물 바이오매쓰"는 오일(지질을 포함)이 기계적 추출(즉, 익스펠러 프레스에 의해 수행되는) 또는 용매 추출 또는 이 둘다를 통해 이로부터 추출되거나 분리된 후의 미생물 바이오매쓰이다. 탈지질화된 음식물은 미생물 바이오매쓰로부터 오일/지질의 추출 또는 분리 전과 비교하여 감소된 양의 오일/지질을 갖지만 일부 잔류하는 오일/지질을 함유한다.

"발현 벡터" 또는 "발현 작제물" 또는 "플라스미드" 또는 "재조합 DNA 작제물"은 숙주 세포에서 특정 핵산의 전사 및/또는 해독을 허용하는 일련의 특정 핵산 요소를 사용한 재조합 수단 또는 직접적인 화학적 합성에 의한 것을 포함하는, 사람 간섭을 통해 생성된 핵산을 언급한다. 발현 벡터는 플라스미드, 바이러스 또는 핵산 단편의 일부일 수 있다. 전형적으로, 상기 발현 벡터는 프로모터에 작동적으로 연결되어 전사된 핵산을 포함한다.

"외인성 유전자"는 세포로 도입된("형질전환된") RNA 및/또는 단백질의 발현을 위해 이들을 암호화하는 핵산이다. 형질전환된 세포는 추가의 외인성 유전자(들)가 도입될 수 있는 재조합 세포로서 언급될 수 있다. 상기 외인성 유전자는 형질전환된 세포에 대해 상이한 종(및 따라서 이종성) 또는 동일한 종(따라서 동종성)의 기원일 수 있다. 따라서, 외인성 유전자는 유전자의 내인성 카피물에 비해 세포의 게놈내에서 상이한 위치를 차지하거나 상이한 제어하에 있는 동종성 유전자를 포함한다. 외인성 유전자는 세포내에서 하나 이상의 카피물로 존재할 수 있다. 외인성 유전자는 게놈내로의 삽입물로서 또는 에피좀 분자로서 세포내 유지될 수 있다.

"외인성으로 제공된"은 세포 배양의 배양 배지에 공급된 분자를 언급한다.

"익스펠러 프레싱"은 대두 및 평지씨와 같은 원료로부터 오일을 추출하는 기계적 방법이다. 익스펠러 프레스는 스크류형의 기계이고 케이지 배럴형 공극을 통해 물질을 압착시킨다. 원료는 프레스의 한 측면으로 들어가고 적용된 케이크는 다른 측면에서 빠져 나오며 오일은 케이지내 막대 사이에서 스며나오고 수거된다. 상기 기계는 원료를 움직이고 압착시키는 스크류 구동체로부터의 마찰 및 연속적인 가압을 사용한다. 상기 오일은 고체가 통과하지 못하도록 하는 작은 구멍을 통해 스며나온다. 원료가 압착되므로써, 마찰은 전형적으로 이를 가열시킨다.

"지방 아실-ACP 티오에스테라제"는 지질 합성동안에 아실 운반 단백질(ACP)로부터 지방산의 절단을 촉매하는 효소이다.

"지방 아실-CoA/알데하이드 리덕타제"는 아실-CoA 분자의 1급 알콜로의 환원을 촉매하는 효소이다.

"지방 아실-CoA 리덕타제"는 아실-CoA 분자의 알데하이드로의 환원을 촉매하는 효소이다.

"지방 알데하이드 데카보닐라제"는 지방 알데하이드의 알칸으로의 전환을 촉매하는 효소이다.

"지방 알데하이드 리덕타제"는 알데하이드의 1급 알콜로의 환원을 촉매하는 효소이다.

"고정 탄소원"은 본원에서 배양된 미생물에 의해 사용될 수 있는 배양 배지내 고체 또는 액체 형태로 실온 및 압력에서 존재하는 탄소 함유 분자(들), 전형적으로 유기 분자이다.

"파쇄물"은 물리적으로 파쇄된 바이오매쓰이다.

"탄화수소"는 (a) 수소 및 탄소 원자만을 함유하는 분자이고, 여기서, 탄소원자는 공유 결합되어 직쇄, 측쇄, 사이클릭 또는 부분적인 사이클릭 골격을 형성하고 상기 골격에는 수소 원자가 부착되어 있다. 탄화수소 화합물의 분자 구조는 천연 가스 성분인 메탄(CH₄) 형태의 가장 단순한 형태에서 매우 무겁고 복잡한, 예를 들어, 원유, 석유 및 역청에서 발견되는 아스팔텐과 같은 몇몇 분자까지 다양하다. 탄화수소는 가스, 액체 또는 고체 형태, 또는 이들의 조합된 형태일 수 있고 골격내 인접한 탄소원자간에 하나 이상의 이중 결합 또는 삼중 결합을 가질 수 있다. 따라서, 당해 용어는 직쇄, 측쇄, 사이클릭 또는 부분적인 사이클릭 알칸, 알켄, 지질 및 파라핀을 포함한다. 이의 예는 프로판, 부탄, 펜탄, 헥산, 옥탄, 및 스쿠알렌을 포함한다.

"수소:탄소 비율"은 원자 대 원자를 기준으로 분자 내 탄소 원자에 대한 질소 원자의 비율이다. 상기 비율은 탄화수소 분자내 탄소 원자 및 수소 원자의 수를 언급하기 위해 사용될 수 있다. 예를 들어, 최고 비율의 탄화수소는 메탄CH4 (4:1)이다.

"소수성 분획"은 수성상과 비교하여 소수성상에서 보다 가용성인 물질의 일부 또는 분획이다. 소수성 분획은 실질적으로 물에 불용성이고 통상적으로 비극성이다.

"지질 수율을 증가시킨다"는 예를 들어, 배양 리터당 세포의 무수 중량을 증가시키거나 지질로 구성된 세포의 %를 증가시키거나 단위 시간당 배양 용적 리터당 지질의 전체 양을 증가시킴에 의한 미생물 배양의 생산성의 증가를 언급한다.

"유도성 프로모터"는 특정 자극에 응답하여 작동적으로 연결된 유전자의 전사를 매개하는 프로모터이다.

"작동가능한 연결로"는 2개의 핵산 서열, 예를 들어, 조절 서열(전형적으로 프로모터)과 연결된 서열(전형적으로 단백질을 암호화하는 서열, 또한 소위 암호화 서열)간의 기능적 연결이다. 프로모터는 이것이 유전자의 전사를 매개할 수 있다면 외인성 유전자와 작동가능하게 연결되어 있다.

"동일계"는 "원위치" 또는 "본래의 위치"를 의미한다.

"영양물의 제한 농도"는 배양된 유기체의 번식을 제한하는 배양물내 화합물의 농도이다. "영양물의 비제한 농도"는 소정의 배양 기간동안에 최대 번식을 지지하는 농도이다. 따라서, 소정의 배양 기간동안에 생성되는 세포의 수는 영양물이 비제한적인 경우 보다 영양물의 제한 농도의 존재하에 보다 낮다. 영양물은 영양물이 최대 번식을 지지하는 것 보다 큰 농도로 존재하는 경우 배양물에 과량인 것으로 언급된다.

"리파제"는 수불용성 지질 기질에서 에스테르 결합의 가수분해를 촉매하는 수용성 효소이다. 리파제는 지질의 글리세롤 및 지방산으로의 가수분해를 촉매한다.

"지질 변형 효소"는 지질의 공유 구조물을 변형시키는 효소를 언급한다. 지질 변형 효소의 예는 리파제, 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 리덕타제, 지방 아실-CoA 리덕타제, 지방 알데하이드 리덕타제 및 지방 알데하이드 데카보닐라제를 포함한다.

"지질 경로 효소"는 지질 대사, 즉 지질 합성, 변형 또는 분해에 역할을 하는 임의의 효소 및 운반 단백질 뿐만 아니라 지질을 화학적으로 변형시키는 임의의 단백질이다.

"지질"은 비극성 용매(예를 들어, 에테르 및 클로로포름)에 가용성이고 물에 상대적으로 또는 완전히 불용성인 부류의 분자이다. 지질 분자는 이들이 주로 천연적으로 소수성인 장쇄의 탄화수소 꼬리로 이루어지기 때문에 상기 성질을 갖는다. 지질의 예는 지방산(포화되고 불포화된); 글리세라이드 또는 글리세로지질(예를 들어, 모노글리세라이드, 디글리세라이드, 트리글리세라이드 또는 천연 지방 및 포스포글리세라이드 또는 글리세로인지질); 난글리세라이드(스핑고지질, 스테롤 지질(콜레스테롤 및 스테로이드 호르몬 포함), 프레놀 지질(터페노이드 포함), 지방 알콜, 왁스 및 폴리케타이드); 및 복합 지질 유도체(당-연결된 지질 또는 당지질 및 단백질 연결된 지질)을 포함한다. "지방"은 소위 "트리글리세라이드"인 지질의 서브그룹이다.

"용해물"은 용해된 세포의 내용물을 함유하는 용액이다.

"용해"는 유기체의 일체성을 손상시키는 흔히, 기계적, 바이러스 또는 삼투압 기작에 의해 적어도 일부의 세포내 내용물을 방출하기에 충분한 생물학적 유기체의 세포질 막 및 임의로 세포 벽의 파괴이다.

"용해시키는"은 적어도 일부 세포내 내용물을 방출시키기에 충분한 생물학적 유기체 또는 세포의 세포막 및 임의로 세포벽을 파괴시키는 것이다.

"미세조류"는 엽록체 또는 플라스티드를 함유하고 임의로 광합성을 수행할 수 있는 진핵 미생물 유기체, 또는 광합성을 수행할 수 있는 원핵 미생물 유기체이다. 미세조류는 고정 탄소원으로부터 유일하게 생존할 수 있는 종속영양생물 뿐만 아니라 에너지로서 고정 탄소원을 대사시킬 수 없는 절대 광합성독립영양생물을 포함한다. 미세조류는 2개의 독특한 세포 유형의 단순한 다중세포 광합성 미생물인, 예를 들어, 볼복스(Volvox)와 같은 미생물 뿐만 아니라 세포 분열 후 단시간에 자매세포로부터 분리되는 단일 세포 유기체, 예를 들어, 클라미도모나스(Chlamydomonas)를 포함한다. 미세조류는 클로렐라, 두날리엘라(Dunaliella), 및 프로토테카와 같은 세포를 포함한다. 미세조류는 또한 아그메넬룸(Agmenellum), 아나바에나(Anabaena), 및 피로보트리스(Pyrobotrys)와 같은 세포-세포 접착을 나타내는 다른 미생물 광합성 유기체를 포함한다. 미세조류는 또한 특정 디노플라겔레이트 조류 종 및 프로토테카 속의 종과 같은 광합성을 수행하는 능력을 상실한 절대 종속영양 미생물을 포함한다.

"미생물(microorganism)" 및 "미생물(microbe)"은 현미경적 단일 세포 유기체이다.

2개의 단백질 또는 유전자와 관련하여 "천연적으로 동시 발현된"은 단백질 또는 이들의 유전자가 이들이 유래된 조직 또는 유기체에서 천연적으로 동시 발현됨을 의미하고, 상기 동시 발현 이유는 2개의 단백질을 암호화하는 유전자가 공통된 조절 서열의 제어하에 있기 때문이거나 이들이 동일한 자극에 응답하여 발현되기 때문이다.

"삽투압 쇼크"는 삼투압의 급작스런 감소 후 용액내 세포의 붕괴이다. 삽투압 쇼크는 때때로 상기 세포의 세포 성분을 용액내로 방출하도록 유도된다.

"폴리사카라이드-분해 효소"는 임의의 폴리사카라이드의 가수분해 또는 당화를 촉매할 수 있는 임의의 효소이다. 예를 들어, 셀룰라제는 셀룰로스의 가수분해를 촉매한다.

"폴리사카라이드" 또는 "글리칸"은 글리코시드 결합에 의해 서로 함께 연결된 모노사카라이드로 구성된 탄수화물이다. 셀룰로스는 특정 식물 세포 벽을 구성하는 폴리사카라이드이다. 셀룰로스는 보다 큰 디사카라이드 및 올리고사카라이드 뿐만 아니라 크실로스 및 글루코스와 같은 모노사카라이드를 생성하도록 효소에 의해 탈중합될 수 있다.

"프로모터"는 핵산의 전사를 지시하는 핵산 조절 서열이다. 본원에 사용된 바와 같이, 프로모터는 전사 개시 부위 근처에 필수 핵산 서열, 예를 들어, 폴리머라제 II형 프로모터의 경우에, TATA 요소를 포함한다. 프로모터는 또한 임의로 전사 개시 부위로부터 수천 염기쌍 정도로 멀리 위치할 수 있는 원거리 인핸서 또는 리프레서 요소를 포함한다.

"재조합체"는 외인성 핵산의 도입 또는 고유 핵산의 변화로 인해 변형된 세포, 핵산, 단백질 또는 벡터이다. 따라서, 예를 들어, 재조합 세포는 천연(비-재조합체) 형태의 세포내에서 발견되지 않는 유전자를 발현하거나 비-재조합 세포에 의해 발현되는 유전자와는 상이하게 천연 유전자를 발현한다. "재조합 핵산"은 예를 들어, 폴리머라제 및 엔도뉴클레아제를 사용하는 핵산의 조작에 의해 일반적으로 시험관내 형성된 본래의 핵산이거나 통상적으로 천연적으로 존재하지 않는 형태로 존재한다. 재조합 핵산은 예를 들어, 2개 이상의 핵산을 작동가능하게 연결시키도록 하여 생성시킬 수 있다. 따라서, 통상적으로 천연적으로 연결되어 있지 않은 DNA 분자를 연결함에 의해 시험관내 형성된 분리된 핵산 또는 발현 벡터는 둘다 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 재조합 핵산이 제조되고 숙주 세포 또는 유기체로 도입되는 경우, 이것은 숙주 세포의 생체내 세포 기구를 사용하여 복제할 수 있지만 일단 재조합적으로 생성되는 경우 당해 핵산은 후속적으로 세포내에서 복제된다 하더라도 여전히 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 유사하게, "재조합 단백질"은 즉, 재조합 핵산의 발현을 통해 재조합 기술을 사용하여 제조된 단백질이다.

"재생가능한 디젤"은 지질의 수소화 및 탈산소화를 통해 생성된 알칸(예를 들어, C10:0, C12:0, C14:0, C16:0 및 C 18:0)의 혼합물이다.

"당화"는 바이오매쓰, 통상적으로 셀룰로스 또는 리그노셀룰로스 바이오매쓰를 글루코스 및 크실로스와 같은 단량체성 당으로 전환시키는 공정이다. "당화된" 또는 "탈중합된" 셀룰로스 물질 또는 바이오매쓰는 당화를 통해 단량체 당으로 전환되는 셀룰로스 물질 또는 바이오매쓰를 언급한다.

"초음파 처리"는 초음파 에너지를 사용하여 세포와 같은 생물학적 물질을 파괴시키는 공정이다.

"푸르푸랄 종"은 동일한 염기성 구조 특성을 보유한 2-푸란카복스알데하이드 또는 유도체이다.

"스토버"는 낟알이 수거된 후 잔류하는 작물의 무수 줄기 및 잎이다.

"슈크로스 이용 유전자"는 발현되는 경우 에너지원으로서 슈크로스를 이용하는 세포의 능력을 도와주는 유전자이다. 슈크로스 이용 유전자에 의해 암호화된 단백질은 본원에서 "슈크로스 이용 효소"로 언급되고 슈크로스 수송체, 슈크로스 인버타제, 및 글루코키나제 및 프럭토키나제와 같은 헥소키나제를 포함한다.

II. 배양

본 발명은 지질의 생성을 위해 일반적으로 프로토테카 균주, 특히 재조합 프로토테카 균주를 배양하는 것에 관한 것이다. 구독자의 편이를 위해, 본 섹션은 여러 서브섹션으로 세분된다. 서브섹션 1은 프로토테카 종 및 균주를 기재하고 게놈 DNA 비교에 의해 새로운 프로토테카 종 및 균주 및 관련 미세조류를 동정하는 방법을 기재한다. 서브섹션 2는 배양을 위해 유용한 생물반응기를 기재한다. 서브섹션 3은 배양을 위한 배지를 기재한다. 서브섹션 4는 본 발명의 예시적인 배양 방법에 따른 오일 생성을 기재한다.

1. 프로토테카 종 및 균주

프로토테카는 고수준의 지질, 특히, 연료 생산을 위해 적합한 지질을 생산할 수 있기 때문에 지질의 생산에 사용하기 위해 주목할만 한 미생물이다. 프로토테카에 의해 생산된 지질은 다른 미세조류에 의해 생산되는 것 보다 단쇄 길이 및 고도의 포화를 갖는 탄화수소 쇄를 갖는다. 더욱이, 프로토테카 지질은 일반적으로 색소 부재(클로로필 및 특정 카로테노이드의 낮거나 검출가능하지 않은 수준)이고 임의의 경우에 다른 미세조류 기원의 지질 보다 색소를 훨씬 적게 포함한다. 더욱이 본 발명에 의해 제공된 재조합 프로토테카 세포는 다른 미생물로부터 지질을 생산하는 것과 비교하여 보다 큰 수율 및 효율로 저렴하게 지질을 생산하기 위해 사용될 수 있다. 본 발명의 방법에 사용하기 위한 예시적인 프로토테카 균주가 포함된다. 추가로, 상기 미세조류는 종속영양적으로 성장하고 프로토테카 윅게르하미(Prototheca wickerhamii), 프로토테카 스타그노라(Prototheca stagnora) (UTEX 327을 포함), 프로토테카 포르토리센시스(Prototheca portoricensis), 프로토테카 모리포르미스(Prototheca moriformis)(UTEX 균주 1441, 1435를 포함), 및 프로토테카 조프리(Prototheca zopfii)로서 유전자 조작될 수 있다. 프로토테카 속의 종은 절대 종속영양생물이다.

본 발명에 사용하기 위한 프로토테카 종은 게놈의 특정 표적 영역의 증폭으로 동정될 수 있다. 예를 들어, 특정 프로토테카 종 또는 균주의 동정은 프라이머 및 게놈의 임의의 영역을 사용하는 방법, 예를 들어, 문헌[참조: Wu et al., Bot. Bull. Acad. Sin. (2001) 42: 115-121 Identification of Chlorella spp. isolates using ribosomal DNA sequences]에 기재된 방법을 사용하여 핵 및/또는 엽록체 DNA의 증폭 및 서열분석을 통해 성취할 수 있다. 리보솜 내부 전사된 스페이서 (ITSl 및 ITS2 rDNA), 23S rRNA, 18S rRNA, 및 기타 보존된 게놈 영역의 증폭 및 서열분석과 같은 계통발생적 분석에 대해 널리 확립된 방법은 당업자에 의해 사용되어 프로토테카의 종 뿐만 아니라 유사한 지질 프로필 및 생산 능력을 갖는 다른 탄화수소 및 지질 생산 미생물 종을 동정할 수 있다. 조류의 동정 및 분류 방법에 대한 예는 또한 문헌[참조: Genetics, 2005 Aug;170(4): 1601-10 and RNA, 2005 Apr;11(4):361-4]을 참조한다.

따라서, 게놈 DNA 비교를 사용하여 본 발명에 사용되는 미세조류의 적합한 종을 동정할 수 있다. 이에 제한되지 않는 23S rRNA를 암호화하는 DNA와 같은 보존된 게놈 DNA의 영역은 미세조류 종으로부터 증폭시키고 컨센서스 서열과 비교하여 본 발명에 사용되는 바람직한 미세조류와 분류학적으로 관련된 미세조류 종을 스크리닝할 수 있다. 프로토테카 속 내의 종에 대한 상기 DNA 서열 비교의 예는 하기에 나타낸다. 게놈 DNA 비교는 또한 균주 수거에서 잘못 동정된 미생물 종을 동정하기 위해 유용할 수 있다. 흔히 균주 수거는 표현형 및 형태적 특성을 기본으로 미세조류 종을 동정한다. 이들 특성의 사용은 미세조류의 종 또는 속의 잘못된 분류를 유도할 수 있다. 게놈 DNA 비교를 사용하는 것이 이들의 계통발생 관계를 기준으로 미세조류 종을 분류하는데 보다 우수한 방법일 수 있다.

본 발명에 사용하기 위한 미세조류는 전형적으로 서열번호 11 내지 19에 목록된 서열중 하나 이상과 99%, 95%, 90%, 또는 85% 이상의 뉴클레오타이드 동일성을 갖는 23S rRNA를 암호화하는 게놈 DNA 서열을 갖는다.

% 뉴클레오타이드 또는 아미노산 동일성을 결정하기 위한 서열 비교를 위해, 전형적으로 하나의 서열이 참조 서열로서 작용하고 이것과 시험 서열을 비교한다. 서열 비교 알고리듬을 사용하는 경우, 시험 및 참조 서열을 컴퓨터에 입력하고 경우에 따라 세부서열의 좌표를 지정하고 서열 알고리듬 프로그램 파라미터를 지정한다. 이어서 서열 비교 알고리듬을 사용하여 지정된 프로그램 파라미터를 기준으로 표준 서열에 대한 시험 서열의 % 서열 동일성을 계산한다.

비교용 서열의 최적의 정렬은 예를 들어, 문헌[참조: Smith & Waterman, Adv. Appl. Math. 2:482 (1981)]의 국소 상동성 알고리듬, 문헌[참조: Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)]의 상동성 정렬 알고리듬, 문헌[참조: Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988)]의 유사성 검색 방법, 문헌[참조: GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI)]의 당해 알고리듬의 컴퓨터에 의한 수행, 또는 육안 검사[문헌참조: generally Ausubel et al., supra]에 의해 수행될 수 있다.

% 서열 동일성 및 서열 유사성을 결정하기 위해 적합한 또 다른 예시적 알고리듬은 문헌[참조: Altschul et al., J. Mol. Biol. 215:403-410 (1990)]에 기재된 BLAST 알고리듬이다. BLAST 분석을 수행하기 위한 소프트웨어는 기관[National Center for Biotechnology Information (웹 주소: www.ncbi.nlm.nih.gov)]을 통해 입수할 수 있다. 상기 알고리듬은 먼저 탐색 서열에서 길이에 대한 단축어 W를 동정으로 높은 점수의 서열쌍(HSP)를 동정함을 포함하고 이는 데이타베이스 서열중에 동일한 길이의 단어와 정렬되는 경우 몇몇 양성값의 역치 점수 T와 일치하거나 이를 충족한다. T는 이웃 단어 점수 역치로서 언급된다(Altschul et al., supra.). 이들 초기 이웃 단어 히트는 이들을 함유하는 보다 긴 HSP를 발견하기 위한 검색을 개시하기 위한 근원으로서 작용한다. 단어 히트를 이어서 누적 정렬 점수가 증가될 수 있는 한 각각의 서열을 따라 양방향으로 확장시킨다. 누적 점수는 뉴클레오타이드 서열에 대해 파라미터 M(일치하는 잔기쌍에 대한 보상 점수: 항상 > 0임) 및 N(불일치 잔기에 대한 페널티 점수: 항상 < 0)을 사용하여 계산한다. 아미노산 서열에 대해, 스코어링 매트릭스를 사용하여 누적 점수를 계산한다. 각각의 방향에서의 단어 히트의 확장은 다음의 경우에 중지한다: 누적 정렬 점수가 이의 최대 성취 값으로부터 X 양으로 이탈하는 경우; 누적 점수가 하나 이상의 음성 스코어링 잔기 정렬의 누적으로 인해 0 이하로 되는 경우; 또는 서열의 말단에 도달하는 경우. 핵산 또는 폴리펩타이드가 본 발명의 범위내에 있는지의 여부를 동정하기 위해, BLAST 프로그램의 디폴트(default) 파라미터가 적합하다. BLASTN 프로그램 (뉴클레오타이드 서열용)은 11의 단어 길이(W), 10의 예상치(E), M=5, N=-4, 및 양쪽 서열가닥의 비교를 디폴트로서 사용한다. 아미노산 서열을 위해, BLASTP 프로그램은 3의 단어 길이(W), 10의 예상치(E) 및 BLOSUM62 스코어링 매트릭스를 디폴트로서 사용한다. TBLATN 프로그램(뉴클레오타이드 서열용 단백질 서열을 사용하는)은 3의 단어 길이(W), 10의 예상값(E) 및 BLOSUM 62 스코어링 매트릭스를 디폴트로서 사용한다(문헌참조: Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989)].

% 서열 동일성을 계산하는 것 뿐만 아니라, BLAST 알고리듬은 또한 2개의 서열간의 유사성에 대한 통계학적 분석을 수행한다(문헌참조: 예를 들어, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)). BLAST 알고리듬에 의해 제공된 한가지의 유사성 측정은 최소 합계 가능성(P(N))이고 이는 2개의 뉴클레오타이드 또는 아미노산 서열간의 일치가 우연히 발생할 가능성을 지적한다. 예를 들어, 표준 핵산에 대한 시험 핵산의 비교에 있어서 최소의 합계 가능성이 약 0.1 미만, 보다 바람직하게는 약 0.01 미만 및 가장 바람직하게는 약 0.001 미만인 경우 핵산은 참조 서열과 유사한 것으로 간주된다.

본 발명에 사용하기 위한 미생물의 선별에 영향을 주는 다른 고려사항은 오일, 연료 및 함유화학제품(oleochemicals)의 생산을 위해 적합한 지질 또는 탄화수소의 생성 뿐만 아니라 다음을 포함한다: (1) 세포 중량%로서 고지질 함량; (2) 성장의 용이함; (3) 유전자 가공의 용이함; 및 (4) 바이오매쓰 가공처리의 용이함. 특정 양태에서, 야생형 또는 유전자 조작된 미생물은 40%, 45%, 50%, 55%, 60%, 65%, 또는 70% 이상의 지질인 세포가 생성되도록 한다. 바람직한 유기체는 (빛의 부재하에 당을 기초로) 종속영양적으로 성장한다.

2. 생물반응기

미생물은 유전자 조작을 수행하고 탄화수소(예를 들어, 지질, 지방산, 알데하이드, 알콜 및 알칸)를 생성할 2가지 목적을 위해 배양한다. 전자 유형의 배양은 소규모 및 처음에는 적어도 출발 미생물이 성장할 수 있는 조건하에서 수행한다. 탄화수소를 생산하기 위한 배양은 생물반응기에서 통상적으로 대규모(예를 들어, 10,000 L, 40,000 L, 100,000 L 또는 보다 대형의 생물반응기)로 수행한다. 프로토테카는 전형적으로 생물반응기내 액체 배재중에서 본 발명의 방법으로 배양한다. 전형적으로, 생물반응기는 빛이 입사되지 않도록 한다.

생물반응기 또는 발효기를 사용하여 다양한 단계의 세포의 생리학적 사이클을 통해 미세조류 세포를 배양한다. 생물반응기는 종속영양 성장 및 번식 방법에 사용하기 위해 많은 잇점을 제공한다. 식품에 사용하기 위한 바이오매쓰를 생산하기 위해 미세조류를 바람직하게 액체중에서, 예를 들어, 하나의 예로서 현탁 배양으로 대량으로 발효시킨다. 강철 발효기와 같은 생물반응기는 매우 큰 배양 용적(40,000 리터 이상의 용량을 갖는 생물반응기가 본 발명의 다양한 양태에서 사용된다)을 수용할 수 있다. 생물반응기는 또한 전형적으로 온도, pH, 산소압 및 이산화탄소 수준과 같은 배양 조건의 제어를 허용한다. 예를 들어, 생물반응기는 전형적으로 예를 들어, 튜빙에 부착된 포트를 사용하여 산소 또는 질소와 같은 가스 성분이 액체 배양물을 통해 기포 주입될 수 있도록 하는 형태를 취할 수 있다. 배양 배지의 pH, 미량 요소의 종류 및 농도 및 기타 배지 성분과 같은 다른 배양 파라미터가 또한 생물반응기를 사용하여 보다 용이하게 조작될 수 있다.

생물반응기는 미세조류가 증식하고 수적으로 증가하는 전반적인 시간에 걸쳐 생물반응기를 통해 배양 배지가 유입되도록 하는 형태를 취할 수 있다. 몇몇 양태에서, 예를 들어, 배지는 접종 후 세포가 목적하는 밀도에 도달하기 전에 생물반응기로 주입될 수 있다. 다른 경우에, 생물반응기에는 배양 초기에 배양 배지가 충전되고 배양물이 접종된 후에는 더이상의 배양 배지가 주입되지 않는다. 다른 말로, 미세조류 바이오매쓰는 미세조류가 증식하고 수적으로 증가하는 기간동안 수성 배지에서 배양되지만 수성 배양 배지의 양이 그 기간에 걸쳐 생물반응기를 통해 유입되지 않는다. 따라서, 몇몇 양태에서, 수성 배양 배지는 접종 후 생물반응기를 통해 유입되지 않는다.

회전 블레이드 및 임펠러, 락킹 기구, 교반 막대, 가압 가스 주입용 수단과 같은 장치가 장착된 생물반응기를 사용하여 미세조류 배양물이 혼합되도록 할 수 있다. 혼합은 연속적이거나 간헐적일 수 있다. 예를 들어, 몇몇 양태에서, 가스 주입 및 배지 주입의 난기류가 목적하는 수로 미세조류가 증가할때까지는 미세조류의 증식동안에 유지되지 않는다.

생물반응기 포트를 사용하여 가스, 고체, 반고체 및 액체를, 미세조류를 함유하는 생물반응기 챔버에 도입하거나 추출할 수 있다. 많은 생물반응기는 하나 이상의 포트(예를 들어, 배지 주입을 위한 하나 및 샘플링을 위한 또 다른 하나)를 갖고 단지 하나의 물질이 포트를 출입할 필요는 없다. 예를 들어, 포트를 사용하여 배양 배지가 생물반응기로 유입될 수 있도록 하고 이후에 샘플링, 가스 주입, 가스 배출 또는 기타 목적을 위해 사용될 수 있다. 바람직하게, 샘플링 포트는 배양의 무균 특성을 손상시키지 않고 반복적으로 사용될 수 있다. 샘플링 포트는 샘플의 흐름이 중지되고 개시되거나 연속 샘플링의 수단을 제공하도록 하는 밸브 또는 기타 장치로 구성될 수 있다. 생물반응기는 전형적으로 배양의 접종을 허용하는 하나 이상의 포트를 갖고 상기 포트는 또한 배지 또는 가스 주입과 같은 다른 목적을 위해 사용될 수 있다.

생물반응기 포트는 미세조류의 배양의 가스 함량이 조작되도록 할 수 있다. 설명하자면 생물반응기 용적의 일부는 액체 보다는 가스일 수 있고 생물반응기의 가스 주입구는 가스를 생물반응기로 펌핑될 수 있도록 한다. 생물반응기내로 이롭계 펌핑될 수 있는 가스는 공기, 공기/CO₂ 혼합물, 희가스(예를 들어, 아르곤) 및 기타 가스를 포함한다. 생물반응기는 전형적으로 사용자가 생물반응기로의 가스 주입 속도를 조절할 수 있도록 구성된다. 상기된 바와 같이, 생물반응기로의 가스 주입 증가를 사용하여 배양물의 혼합을 증가시킬 수 있다.

증가된 가스 유입은 또한 배양물의 탁도에 영향을 미친다. 난기류는 수성 배양 배지의 수위 하부에 가스 주입 포트를 위치시켜 생물반응기로 주입되는 가스가 배양 표면으로 기포 주입되도록 함에 의해 성취할 수 있다. 하나 이상의 가스 배출 포트는 가스가 배출되도록 하여 생물반응기내 압력 증강을 차단한다. 바람직하게, 가스 배출 포트는 생물반응기로 오염 미생물이 들어가는 것을 차단하는 '원-웨이' 밸브를 유도한다.

3. 배지

미생물 배양 배지는 전형적으로 고정 질소원, 고정 탄소원, 미량 요소, 임의로 pH 유지를 위한 완충제 및 포스페이트(전형적으로 포스페이트 염으로서 제공됨)과 같은 성분들을 함유한다. 기타 성분은 특히 해양 미세조류를 위해 염화나트륨과 같은 염을 함유할 수 있다. 질소 공급원은 예를 들어, 제한 없이 분자 질소, 니트레이트, 니트레이트 염, 암모니아(순수 형태 또는 염 형태, 예를 들어, (NH₄)₂SO₄ 및 NH₄OH), 단백질, 대두 음식물, 옥수수침지액, 및 효모 추출물을 포함하는 유기 및 무기 질소원을 함유한다. 미량 요소의 예는 아연, 붕소, 코발트, 구리, 망간, 및 몰리브덴을 포함하고 예를 들어, 이의 각각의 형태는 ZnCl₂, H₃BO₃, CoCl₂ㆍ6H₂O, CuCl₂ㆍ2H₂O, MnCl₂ㆍ4H₂O 및 (NH₄)6Mo₇O₂₄ㆍ4H₂O이다.

본 발명의 방법에 따라 유용한 미생물은 전세계적으로 다양한 장소 및 환경에서 발견된다. 다른 종 및 이들의 궁극적인 분화 분기점으로부터의 분리 결과로서, 최적의 성장 및 지질 및/또는 탄화수소 성분들의 최적의 생산을 위한 특정 성장 배지는 예측하기 어려울 수 있다. 몇몇 경우에, 특정 미생물 균주는 몇몇 억제 성분의 존재 또는 특정 미생물 균주에 의해 요구되는 임의의 필수 영양 요구성 물질의 부재 때문에 특정 성장 배지상에서 성장할 수 없다.

고체 및 액체 성장 배지는 일반적으로 다양한 공급원으로부터 시판되고 광범위한 미생물 균주를 위해 적합한 특정 배지를 제조하기 위한 지침은 예를 들어, 기관[University of Texas at Austin, 1 University Station A6700, Austin, Texas, 78712-0183, for its culture collection of algae (UTEX)]에서 운영하는 온라인 사이트(http://www.utex.org/)에서 찾을 수 있다. 예를 들어, 다양한 담수 및 염수 배지는 본원에 참조로서 인용된 문헌[참조: PCT Pub. No. 2008/151149]에 기재된 것들을 포함한다.

특정 예에서, 프로테오스 배지(Proteose Medium)는 무균 조건을 위해 적합하고 배지의 1L 용적의 배지(pH ~ 6.8)는 1리터의 Bristol 배지에 1g의 프로테오스 펩톤을 첨가하여 제조할 수 있다. Bristol 배지는 수용액중에 2.94 mM NaNO₃, 0.17 mM CaCl₂ㆍ2H₂O, 0.3 mM MgSO₄ㆍ7H₂O, 0.43 mM, 1.29 mM KH₂PO₄, 및 1.43 mM NaCl를 포함한다. 1.5% 한천 배지에 대해, 15g의 한천을 1L의 용액에 첨가할 수 있다. 상기 용액을 덮고 오토클레이빙하고 이어서 사용전에 냉장 온도에 저장한다. 또 다른 예는 10g/L의 수소칼륨 프탈레이트(KHP), 0.9g/L의 수산화나트륨, 0.1g/L의 황산마그네슘, 0.2g/L의 인산수소칼륨, 0.3g/L의 염화암모늄, 10g/L의 글루코스, 0.001 g/L의 티아민 하이드로클로라이드, 20g/L 한천, 0.25g/L의 5-플루오로사이토신을 포함하고 pH 범위가 5.0 내지 5.2인 프로토테카 분리 배지(PIM)이다(문헌참조: Pore, 1973, App. Microbiology, 26: 648-649). 본 발명의 방법에 사용하기에 적합한 다른 배지는 상기된 URL에 문의하거나 미생물 배양물을 유지하는 다른 기관(예를 들어, SAG, CCAP, 또는 CCALA)에 문의하여 용이하게 확인할 수 있다. SAG는 기탁기관[the University of Gottingen (Gottingen, Germany)]에서의 조류 배양 수거물을 언급하고, CCAP는 기탁기관[the Scottish Association for Marine Science (Scotland, United Kingdom)]에 의해 관리되는 조류 및 원생동물의 배양 수거물을 언급하고, CCALA는 기탁기관[the Institute of Botany (Trebon, Czech Republic)]의 조류 연구소의 배양 수거물을 언급한다. 추가로, 미국 특허 제5,900,370호는 프로토테카 종의 종속영양 발효에 적합한 배지 제형 및 조건을 기재하고 있다.

오일 생산을 위해, 고정 탄소원의 선택이 중요한데 그 이유는 고정 탄소원의 비용이 경제적인 오일 생산을 위해 충분히 낮아야 하기 때문이다. 따라서, 적합한 탄소원은 예를 들어, 아세테이트, 플로리도사이드, 프럭토스, 갈락토스, 글루쿠론산, 글루코스, 글리세롤, 락토스, 만노스, N-아세틸글루코사민, 람노스, 슈크로스, 및/또는 크실로스를 포함하고 상기 화합물을 함유하는 공급원료의 선택이 본 발명의 방법의 중요한 측면이다. 본 발명의 방법에 따라 유용한 적합한 공급원료는 예를 들어, 블랙 음료, 옥수수 전분, 탈중합된 셀룰로스 물질, 유청, 당밀, 감자, 수수, 슈크로스, 사탕수수, 사탕무, 쌀 및 밀을 포함한다. 탄소원은 또한 슈크로스와 탈중합된 사탕무 펄프의 혼합물과 같은 혼합물로서 제공될 수 있다. 하나 이상의 탄소원(들)은 하나 이상의 외인성으로 제공된 고정 탄소원(들)의 약 50 μM 이상, 약 100 μM 이상, 약 500 μM 이상, 약 5 mM 이상, 약 50 mM 이상, 및 약 500 mM 이상의 농도로 제공될 수 있다. 본 발명의 목적을 위해 특히 유리한 탄소원은 셀룰로스(탈중합된 형태), 글리세롤, 슈크로스 및 수수를 포함하고, 이들 각각은 하기에서 보다 상세히 논의된다

본 발명에 따라, 미생물은 공급원료로서 탈중합된 셀룰로스 바이오매쓰를 사용하여 배양할 수 있다. 셀룰로스 바이오매쓰(예를 들어, 스토버)는 저렴하고 용이하게 입수할 수 있지만, 효모용 공급원료서 상기 물질을 사용하기 위한 시도는 실패했었다. 특히, 상기 공급원료는 효모 성장에 억제 작용을 하는 것으로 밝혀졌고 효모는 셀룰로스 물질로부터 생성된 5탄당(예를 들어, 헤미-셀룰로스 기원의 크실로스)을 사용할 수 없다. 대조적으로, 미세조류는 가공된 셀룰로스 물질상에서 성장할 수 있다. 셀룰로스 물질은 일반적으로 약 40-60%의 셀룰로스; 약 20-40%의 헤미셀룰로스 및 10-30%의 리그닌을 포함한다.

적합한 셀룰로스 물질은 농작물, 즉, 식물 일부, 1차 식품 또는 섬유 생성물과 함께 야생에서 제거되지 않는 주로 줄기 및 잎 뿐만 아니라 초본성 및 목재 에너지 작물로부터의 잔사를 포함한다. 이의 예는 농업 폐기물, 예를 들어, 사탕 수수 바가스, 쌀겨, 옥수수 섬유(줄기, 잎, 껍질 및 코브), 밀짚, 쌀짚, 사탕무 펄프, 감귤 펄프, 감귤 과피; 산림 폐기물, 예를 들어, 경목재 및 연목재 간벌, 및 수목 작업으로부터의 경목재 및 연목재 잔사; 목재 폐기물, 예를 들어, 톱 가루 폐기물(목재 칩, 톱밥) 및 펄프 가루 폐기물; 도시 폐기물, 예를 들어, 시의 고형 폐기물의 종이 분획물, 도시 목재 폐기물 및 도시 녹색 폐기물, 예를 들어, 시의 유리 클립핑; 및 목재 건축 폐기물을 포함한다. 추가의 셀룰로스는 스위치그래스, 하이브리드 포플라 목재 및 미스칸투스, 섬유 케인(cane) 및 섬유 수수와 같은 전용 셀룰로스 작물을 포한한다. 상기 물질로부터 생성된 5탄당은 크실로스를 포함한다.

셀룰로스 물질은 상기 물질내 함유된 당(들)을 미생물이 이용할 수 있도록 효율이 증가되도록 처리된다. 본 발명은 산 분해 후 셀룰로스 물질을 처리하여 물질이 미생물(예를 들어, 미세조류 및 유성 효모)의 종속영양성 배양에 사용하기에 적합하도록 하는 신규 방법을 제공한다. 상기 논의된 바와 같이, 리그노셀룰로스 바이오매쓰는 셀룰로스, 베타 1,4 연결된 글루코스(6탄당)의 결정성 중합체, 헤미셀룰로스, 크실로스(5탄당)로 주로 구성된 보다 느슨하게 연합된 중하체 및 보다 드문 정도의 만노스, 갈락토스, 아라비노스, 리그닌, 시나필 알콜 및 이의 유도체로 구성된 복합 방향족 중합체, 및 알파 1,4-연결된 폴리갈락투론산의 직쇄인 펙틴을 포함하는, 다양한 분획물로 구성된다. 셀룰로스 및 헤미셀룰로스의 중합체 구조때문에 이들내 당(예를 들어, 단량체 글루코스 및 크실로스)은 많은 미생물에 의해 효율적으로 사용될 수 있는(대사되는) 형태로 존재하지 않는다. 상기 미생물을 위해 중합체를 구성하는 단량체 당을 생성하도록 셀룰로스 바이오매쓰를 추가로 가공하면 셀룰로스 물질이 공급원료(탄소원)로서 효율적으로 확실히 사용되는데 매우 도움이 될 수 있다.

셀룰로스 또는 셀룰로스 바이오매쓰는, 바이오매쓰가 승온 및 승압에서 희석 황산(또는 다른 산)으로 처리되는 "분해(explosion)"로 호칭되는 공정에 적용된다. 상기 공정 조건은 셀룰로스 및 헤미셀룰로스 분획물의 글루코스 및 크실로스 단량체로 효소적 가수분해에 바이오매쓰가 효율적으로 적용될 수 있도록 한다. 수득한 단량체 당은 셀룰로스 당으로 호칭된다. 셀룰로스 당은 이어서 미생물에 의해 이용되어 다양한 대사물(예를 들어, 지질)이 생성될 수 있도록 한다. 산 분해 단계는 헤미셀룰로스 분획물이 구성 모노사카라이드로 부분 가수분해되도록 한다. 이들 당은 추가의 처리로 바이오매쓰로부터 완전히 유리될 수 있다. 몇몇 양태에서, 추가의 처리는 열수 처리이고 이는 분해된 물질을 고온수로 세척하여 염과 같은 오염물을 제거하도록 함을 포함한다. 상기 단계는 상기 공정에 사용되는 보다 희석된 당 농도로 인해 셀룰로스 에탄올 발효를 위해 필요하지 않다. 다른 양태에서, 추가의 처리는 추가의 산 처리이다. 여전히 다른 양태에서, 추가의 처리는 분해된 물질의 효소적 가수분해이다. 이들 처리는 또한 임의의 조합으로 사용될 수 있다. 처리 유형은 유리되는 당(예를 들어, 5탄당 대 6탄당), 및 이들이 당해 공정에서 유리되는 단계의 유형에 영향을 미칠 수 있다. 결과로서, 이들이 5탄당 또는 6탄당이든 상관없이 상이한 당 스트림이 생성될 수 있다. 이들 집적된 5탄당 또는 6탄당 스트림은 따라서 상이한 탄소 이용 능력을 갖는 특이적 미생물에 지시될 수 있다.

본 발명의 방법은 전형적으로 에탄올 발효에서 성취되는 것 보다 높은 세포 밀도로 발효시킴을 포함한다. 종속영양성 셀룰로스 오일 생산을 위한 배양물의 보다 높은 밀도 때문에, 고정 탄소원(예를 들어, 셀룰로스 유래된 당 스트림(들))은 바람직하게 농축된 형태로 존재한다. 탈중합된 셀룰로스 물질의 글루코스 수준은 바람직하게 배양 단계 전에 300 g/리터 이상, 400 g/리터 이상, 500 g/리터 이상 또는 600 g/리터 이상이고 상기 배양 단계는 임의로 유가식 배양이고 여기서, 상기 물질은 세포가 성장하고 지질을 축적시킴으로써 시간 경과에 따라 세포에 공급된다. 셀룰로스 당 스트림은 셀룰로스 에탄올 생산에서 상기 농도 범위에서 또는 이의 근처에서 사용되지 않는다. 따라서, 리그노셀룰로스 오일의 생산 동안에 매우 높은 세포 밀도를 생성하고 유지하기 위해서는 탄소 공급원료(들)가 고농축된 형태로 종속영양 배양물로 전달되어야만 한다. 그러나, 이에 대한 기질이 아니고 유성 미생물에 의해 대사되지 않는 공급 스트림에서 임의의 성분은 생물반응기에 축적되고 이것은 성분이 목적하는 최종 생성물의 생산에 독성이거나 억제성인 경우 문제를 유발할 수 있다. 분해 공정 및 후속적인 중화 공정 둘다에서 셀룰로스 물질의 생성으로부터 유래된 푸르푸랄 및 하이드록시메틸 푸르푸랄 및 염과 같은 리그닌 및 리그닌 유래 부산물, 탄수화물 유래된 부산물 및 심지어 비대사된 펜토스/헥소스 당은 에탄올 발효에서 문제점을 제공할 수 있고 이들 효과는 초기 공급원료에서 이들의 농도가 높은 공정에서 상당히 증폭된다. 본 발명에 기재된 리그노셀룰로스 오일의 대규모 생산에 사용될 수 있는 6탄당에 대한 300g/L 범위 (또는 이보다 높은)의 당 농도를 성취하기 위해, 이들 독성 물질의 농도는 셀룰로스 바이오매쓰의 에탄올 발효에 전형적으로 존재하는 농도 보다 20배 높을 수 있다.

셀룰로스 물질의 분해 공정 처리는 상당한 양의 황산, 열 및 압력을 사용하므로써 탄수화물의 부산물, 즉 푸르푸랄 및 하이드록시메틸 푸르푸랄을 유리시킨다. 푸르푸랄 및 하이드록시메틸 푸르푸랄은 크실로스의 푸르푸랄 및 물로의 탈수를 통한 헤미셀룰로스의 가수분해동안에 생성된다. 본 발명의 몇몇 양태에서, 이들 부산물(예를 들어, 푸르푸랄 및 하이드록시메틸 푸르푸랄)은 생물반응기로 도입하기 전에 당화된 리그노셀룰로스 물질로부터 제거된다. 본 발명의 특정 양태에서, 탄수화물의 부산물의 제거 공정은 분해된 셀룰로스 물질의 열수 처리이다. 또한, 본 발명은 푸르푸랄 또는 하이드록시메틸 푸르푸랄과 같은 화합물에 내성일 수 있는 균주가 리그노셀룰로스 오일 생산에 사용되는 방법을 제공한다. 또 다른 양태에서, 본 발명은 또한 발효 배지에서 푸르푸랄에 내성일 수 있는 것 뿐만 아니라 실제로 리그노셀룰로스 오일의 생산 동안에 당해 부산물을 대사시킬 수 있는 미생물 및 방법을 제공한다.

상기 분해 공정은 또한 상당한 수준의 염을 생성한다. 예를 들어, 분해를 위한 전형적인 조건은 분해된 셀룰로스 바이오매쓰가 10:1의 물:고체(무수 중량)로 재현탁되는 경우 5 mS/cm 초과의 전도성을 유도할 수 있다. 본 발명의 특정 양태에서, 희석된 분해된 바이오매쓰는 효소 당화에 적용되고 수득한 현탁액은 생물반응기에 사용하기 위해 25배까지 농축된다. 농축된 당 스트림(들)에서 염 수준(전도성에 의해 측정된 바와 같이)은 허용가능하지 않게 높을 수 있다(1.5M까지의 Na⁺ 당량). 추가의 염은 또한 후속적인 효소 당화 공정을 위해 분해된 물질의 중화 즉시 생성된다. 본 발명은 이들 염을 제거하기 위한 방법을 제공하여 수득한 농축된 셀룰로스 당 스트림(들)은 리그노셀룰로스 오일을 생산하기 위한 종속영양 공정에 사용될 수 있도록 한다. 몇몇 양태에서, 상기 염을 제거하는 방법은 예를 들어, 이에 제한되지 않지만 DOWEX Marathon MR3과 같은 수지를 사용한 탈이온화이다. 특정 양태에서, 수지 단계를 사용하는 탈이온화는 당화 전에, 당 농축 또는 pH 조정 전 및 바이오매쓰의 열수 처리 전 또는 이들의 임의의 조합전에 수행한다; 다른 양태에서, 상기 단계는 이들 공정중 하나 이상 후에 수행한다. 다른 양태에서, 분해 공정 자체는 허용가능하지 않게 고수준으로 염의 생성을 피하도록 변화시킨다. 예를 들어, 셀룰로스 바이오매쓰의 황산(또는 다른 산) 분해에 대한 적합한 대용법은 기계적 펄핑으로 셀룰로스 바이오매쓰가 효소적 가수분해(당화)에 민감해지도록 하는 것이다. 여전히 다른 양태에서, 고수준의 염에 내성인 미생물의 본래의 균주 또는 고수준의 염에 내성을 갖는 유전자 조작된 균주가 사용된다.

유성 미생물을 사용하는 종속영양 오일 생산에 사용하기 위한 분해된 셀룰로스 바이오매쓰를 제조하는 방법에 대한 바람직한 양태는 도 10에 도시되어 있다. 단계 I은 재현탁된 분해된 셀룰로스 바이오매쓰를 5.0 내지 5.3의 범위로 pH를 조정하고 이어서 셀룰로스 바이오매쓰를 3회 세척함을 포함한다. 상기 세척 단계는 탈염 및 이온 교환 수지, 역삼투압, 열수 처리(상기된 바와 같이) 또는 단지 반복적인 재현탁 및 탈이온수중에서 원심분리의 사용을 포함하는 다양한 수단에 의해 성취될 수 있다. 상기 세척 단계는 전도성이 100-300 μS/cm인 셀룰로스 스트림을 유도하고 상당한 양의 푸르푸랄 및 하이드록시메틸 푸르푸랄을 제거시킨다. 상기 세척 단계로부터 이동은 헤미셀룰로스 분획물로부터 유리된 5탄당을 농축시키는 단계를 배제할 수 있다. 단계 II는 세척된 셀룰로스 바이오매쓰의 효소적 당화를 포함한다. 바람직한 양태에서, 아셀레라제(Genencor)를 사용한다. 단계 III은 상기 당화된 바이오매쓰의 원심분리 또는 이동시키기 및 세정을 통한 당의 회수를 포함한다. 수득한 바이오매쓰(고체)는 연료로서 사용될 수 있거나 폐기물로 보내질 수 있는 에너지 집적된 리그닌 풍부 성분이다. 원심분리/이동시키기 및 세정 공정에서 회수된 당 스트림을 수거한다. 단계 IV는 투과물의 회수와 함께 오염 고체를 제거하기 위한 마이크로여과를 포함한다. 단계 V는 진공 증발기를 사용하여 성취될 수 있는 농축 단계를 포함한다. 상기 단계는 수득한 당 공급원료의 단백질 함량으로 인해 때때로 필요한 P'2000(Sigma/Fluka)과 같은 소포제의 첨가를 임의로 포함할 수 있다.

본 발명의 방법의 또 다른 양태에서, 탄소원은 바이오디젤 트랜스에스테르화로부터 산성화되고 비-산성화된 글리세롤 부산물을 포함하는 글리세롤이다. 하나의 양태에서, 탄소원은 글리세롤 및 하나 이상의 다른 탄소원을 포함한다. 몇몇 경우에, 글리세롤 및 하나 이상의 다른 고정 탄소원 모두는 발효 초기에 미생물에 제공된다. 몇몇 경우에, 글리세롤 및 하나 이상의 다른 고정 탄소원이 소정의 비율로 동시에 미생물에 제공된다. 몇몇 경우에, 글리세롤 및 하나 이상의 다른 고정 탄소원은 발효 과정 동안에 소정의 속도로 미생물에 공급된다.

몇몇 미세조류는 글루코스의 존재때보다 글리세롤의 존재하에서 보다 신속하게 세포 분열을 진행한다(문헌참조: PCT 공개번호 제2008/151149호). 이들 경우에, 처음에 세포에게 글리세롤을 공급하여 세포 밀도를 신속하게 증가시킴에 이어서 글루코스를 공급하여 지질을 축적시키는 2단계 성장 공정은 지질이 생산되는 효율을 개선시킬 수 있다. 트랜스에스테르화 공정의 글리세롤 부산물의 사용은 생산 공정으로 도입되는 경우 상당한 경제적인 잇점을 제공한다. 글리세롤 및 글루코스의 혼합물과 같은 다른 공급 방법이 제공된다. 상기 혼합물의 공급은 또한 동일한 경제적 이득을 취득한다. 또한, 본 발명은 글리세롤과 다양하게 배합된 슈크로스와 같은 대안적인 당을 미생물에 공급하는 방법을 제공한다.

본 발명의 방법의 또 다른 양태에서, 탄소원은 슈크로스이고 사탕무 가공 기원의 진한 사탕무 쥬스와 같이 슈크로스를 함유하는 복합 공급원료를 포함한다. 하나의 양태에서, 배양 배지는 추가로 하나 이상의 슈크로스 이용 효소를 추가로 포함한다. 몇몇 경우에, 배양 배지는 슈크로스 인버타제를 포함한다. 하나의 양태에서, 슈크로스 인버타제 효소는 미생물 집단에 의해 발현되는 외인성 슈크로스 인버타제 유전자에 의해 암호화된 분비가능한 슈크로스 인버타제 효소이다. 따라서, 몇몇 경우에 하기 섹션 IV에 보다 상세하게 기재된 바와 같이, 미세조류는 슈크로스 수송체, 슈크로스 인버타제, 헥소키나제, 글루코키나제 또는 프럭토키나제와 같은 슈크로스 이용 효소를 발현하도록 유전자 조작하였다.

슈크로스를 함유하는 복합 공급원료는 사탕무 가공 기원의 폐기 당밀을 포함한다: 사탕무 가공의 낮은 가치의 폐기물의 사용은 탄화수소 및 기타 오일의 제조에 상당한 비용 절감을 제공할 수 있다. 본 발명의 방법에 유용한 또 다른 복합 공급원료는 수수 시럽 및 순수한 수수를 포함하는 수수이다. 수수 시럽은 달콤한 수수 케인의 쥬스로부터 생산된다. 이의 당 프로필은 주로 글루코스(덱스트로스), 프럭토스 및 슈크로스로 이루어진다.

4. 오일 생산

본 발명의 방법에 따른 오일 생산을 위해, 예를 들어, 빛이 배양물에 입사되지 않도록 하는 매우 대용량(40,000 리터 이상)의 발효기를 사용하는 경우에서와 같이 암실에서 세포를 배양하는 것이 바람직할 수 있다. 프로토테카 종은 고정 탄소원을 함유하는 배지에서 빛의 부재하에 오일 생산을 위해 성장시키고 번식시킨다; 상기 성장은 종속영양 성장으로서 공지되어 있다.

하나의 예로서, 지질 생산 미새물 세포의 접종물을 배지에 도입하고 세포가 번식을 시작하기 전에 지체(lag) 기간(지체 단계)이 있다. 지체 기간 후, 번식율은 일정하게 증가하고 로그 또는 대수증식기로 진입한다. 대수증식기에 이어서 질소와 같은 영양물의 감소 및 독성 물질의 증가 및 정족수 감지 기작으로 번식이 느려진다. 상기와 같이 느려진 후, 번식은 멈추고 세포는 정체기 또는 일정한 성장 상태로 진입하고 이는 세포에 제공된 특정 환경에 의존한다. 지질 풍부 바이오매쓰를 수득하기 위해, 상기 배양물은 전형적으로 질소 또는 또 다른 주요 영양물(탄소 이외의 다른 영양물)이 고갈됨으로써 조기에 종결되어 세포가 과량으로 존재하는 탄소원을 지질로 전환하도록 강요되는 대수증식기 말기 후에 수거한다. 배양 조건 파라미터는 총 오일 생산, 생산된 지질 종의 배합 및/또는 특정 오일의 생성을 최적화하도록 조작될 수 있다.

상기 논의된 바와 같이, 생물반응기 또는 발효기는 세포가 이들의 성장 사이클의 다양한 단계를 진행하도록 사용된다. 하나의 예로서, 지질 생산 세포의 접종물은 배지에 도입될 수 있고 이어서 세포가 성장을 시작하기 전에 지체 기간(지체 기)이 도래한다. 상기 지체 기간 후, 성장 속도는 일정하게 증가하고 로그기 또는 대수증식기로 진입한다. 대수증식기에 이어서 영양물의 감소 및/또는 독성 물질의 증가로 인해 성장이 느려진다. 상기 느려진 후, 성장은 멈추고 당해 세포는 정체기 또는 일정 상태로 진입하고 이는 세포에 제공되는 특정 환경에 의존한다. 본원에 기재된 세포에 의한 지질 생산은 영양물이 공급되거나 세포 분열의 부재하에 계속적인 지질 생산을 허용하기에 여전히 가용한 정체기를 포함하는, 로그기 또는 이후 기간 동안에 일어날 수 있다.

바람직하게, 본원에 기재되고 당업계에 공지된 조건을 사용하여 성장한 미생물은 약 20중량% 이상의 지질, 바람직하게는 약 40중량% 이상의 지질, 보다 바람직하게는 약 50중량% 이상의 지질 및 가장 바람직하게는 약 60중량% 이상의 지질을 포함한다. 가공 조건은 특정 용도를 위해 적합한 지질의 수율을 증가시키도록 및/또는 생산 비용을 절감시키도록 조정될 수 있다. 예를 들어, 특정 양태에서, 미세조류는 예를 들어, 질소, 인 또는 황과 같은 하나 이상의 영양물의 제한 농도의 존재하에 배양하고 글루코스와 같은 과량의 고정 탄소 에너지를 제공한다. 질소 제한은 질소가 과량으로 공급된 배양물에서의 미생물 지질 수율 이상으로 미생물 지질 수율을 증가시키는 경향이 있다. 특정 양태에서, 지질 수율의 증가는 약 10%, 50%, 100%, 200%, 또는 500% 이상이다. 상기 미생물은 전체 배양 기간중 일부 동안 또는 전체 기간동안 제한된 양의 영양물의 존재하에 배양할 수 있다. 특정 양태에서, 총 배양 기간동안 2회 이상 영양물 농도는 제한 농도와 비제한 농도 사이에서 순환한다. 세포의 지질 함량은 과량의 탄소를 제공하지만 질소를 제한하거나 제공하지 않으면서 증가된 기간동안 배양을 계속하여 증가시킬 수 있다.

또 다른 양태에서, 지질 수율은 지질 경로 효소(예를 들어, 지방산 합성 효소)를 위한 하나 이상의 조인자(들)의 존재하에 지질 생산 미생물(예를 들어, 미세조류)를 배양함에 의해 증가된다. 일반적으로, 조인자(들)의 농도는 조인자(들)의 부재하에 미생물 지질 수율 보다 미생물 지질(예를 들어, 지방산) 수율을 증가시키기에 충분하다. 특정 양태에서, 상기 조인자(들)는 배양물에 조인자(들)를 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세조류)을 포함시킴에 의해 배양물에 제공된다. 또는, 조인자(들)는 조인자의 합성에 관여하는 단백질을 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세조류)를 포함사킴에 의해 배양물에 제공할 수 있다. 특정 양태에서, 적합한 조인자는 예를 들어, 비오틴 또는 판토테네이트와 같은 지질 경로 효소에 의해 요구되는 임의의 비타민을 포함한다. 본 발명에 사용하기에 적합한 조인자를 암호화하거나 상기 조인자의 합성에 관여하는 유전자는 널리 공지되어 있고 상기된 것들과 같은 기술 및 전략을 사용하여 미생물(예를 들어, 미세조류)에 도입될 수 있다.

본원에 기재된 생물반응기, 배양 조건 및 종속영양 성장 및 번식 방법의 특정 예는 임의의 적합한 방식으로 조합하여 미생물 성장 및 지질 및/또는 단백질 생산의 효율을 개선시키킬 수 있다.

무수 중량을 기준으로 높은 %의 오일/지질 축적과 함께 미세조류 바이오매쓰는 당업계에 공지된 상이한 배양 방법을 사용하여 생산되었다(문헌참조: PCT 공개번호 제2008/151149호). 본원에 기재되고 본 발명에 따라 유용한 배양 방법에 의해 생성된 미세조류 바이오매쓰는 무수 중량을 기준으로 10% 이상의 미세조류 오일을 포함한다. 몇몇 양태에서, 미생물 바이오매쓰는 무수 중량을 기준으로 25% 이상, 50% 이상, 55% 이상, 또는 60% 이상의 미세조류 오일을 포함한다. 몇몇 양태에서, 미세조류 바이오매쓰는 무수 중량을 기준으로 10-90%의 미세조류 오일, 25-75%의 미세조류 오일, 40-75%의 미세조류 오일 또는 50-70%의 미세조류 오일을 함유한다.

본원에 기재된 바이오매쓰의 미세조류 오일 또는 본 발명의 방법 및 조성물에 사용하기 위해 바이오매쓰로부터 추출된 오일은 하나 이상의 독특한 지방산 에스테르 측쇄를 갖는 글리세로지질을 포함할 수 있다. 글리세로지질은 다양한 길이 및 다양한 정도의 포화를 가질 수 있는 1개, 2개 또는 3개의 지방산 분자에 에스테르화된 글리세롤 분자로 구성된다. 지방산 분자(및 미세조류 오일)의 길이 및 포화 특성은 하기 섹션 IV에서 보다 상세하게 기재된 바와 같은 배양 조건을 통해 또는 지질 경로 가공을 통해 본 발명의 미세조류 오일내에서 지방산 분자의 성질 또는 비율을 변형시키기 위해 조작될 수 있다. 따라서, 조류 오일의 특이적 블렌드는 2개 이상의 미세조류 종으로부터 바이오매쓰 또는 조류 오일을 함께 혼합함에 의해 또는 대두, 평지씨, 카놀라, 팜, 팜 커넬, 코코넛, 옥수수, 폐기 식물, 차이니즈 탈로우, 올리브, 해바라기, 면화씨, 치킨 지방, 소 탈로우, 돼지 탈로우, 미세조류, 거대조류, 미생물, 쿠페아, 아마, 피넛, 쵸이스 백색 그리스, 라드, 카멜리나 사티바, 머스타드 씨, 캐슈 너트, 귀리, 루핀, 케나프, 금잔화, 헴프, 커피, 아마인(아마), 헤이즐넛, 유포비아, 호박씨, 코리안더, 카멜리아, 참깨, 홍화, 쌀, 유동, 코코아, 코프라, 양귀비, 아주까리, 피칸, 호호바, 마카다미아, 브라질 너트, 아보카도, 석유 또는 상기 오일 중 임의의 증류 분획물과 같은 다른 공급원 기원의 오일과 본 발명의 조류 오일을 블렌딩함에 의해 조류의 단일 종내에서 생산할 수 있다.

오일 조성물, 즉, 글리세로지질의 지방산 성분의 성질 및 비율은 또한 2개 이상의 독특한 종의 미세조류 기원의 바이오매쓰 또는 오일을 배합함에 의해 조작할 수 있다. 몇몇 양태에서, 독특한 종의 미세조류중 2개 이상은 상이한 글리세로지질 프로필을 갖는다. 미세조류의 독특한 종은 바람직하게 종속영양 조건하에 본원에 기재된 바와 같이 함께 배양하거나 별도로 배양하여 각각의 오일을 생성할 수 있다. 상이한 종의 미세조류는 세포의 글리세로지질 내 상이한 %의 독특한 지방산 성분을 함유할 수 있다.

일반적으로, 프로토테카 균주는 쇄 길이가 C8-C14인 지방산을 거의 갖지 않는다. 예를 들어, 프로토테타 모리포르미스(UTEX 1435), 프로토테카 크루가니(Prototheca krugani)(UTEX 329), 프로토테카 스타그노라(UTEX 1442) 및 프로토테카 조프피(UTEX 1438)는 C8 지방산을 함유하지 않고(검출가능하지 않은 양) C10 지방산이 0 내지 0.01%이고 C12 지방산은 0.03 내지 2.1%이고 C14 지방산은 1.0 내지 1.7%이다.

몇몇 경우에, 쇄 길이가 C8-10인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 쇄 길이가 C8인 지방산을 0.3% 이상, 0.8% 이상, 1.5% 이상 갖고 쇄 길이가 C10인 지방산을 0.3% 이상, 1.0% 이상, 3.0% 이상, 5% 이상 갖는다. 다른 경우에, 쇄 길이가 C12인 지방 아실-ACP 기질에 대해 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 쇄 길이가 C12인 지방산을 3.0% 이상, 5% 이상, 7% 이상, 10% 이상, 13% 이상 갖고 쇄 길이가 C14인 지방산을 1.5% 이상, 2% 이상, 또는 3% 이상 갖는다. 다른 경우에, 쇄 길이가 C14인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 쇄 길이가 C14인 지방산을 4.0% 이상, 7% 이상, 10% 이상, 15% 이상, 20% 이상, 25% 이상 갖고 쇄 길이가 C12인 지방산을 0.4% 이상, 1% 이상, 1.5% 이상 갖는다.

비제한적인 예에서, 쇄 길이가 C8 및 C10인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 쇄 길이가 C8인 지방산을 0.3 내지 1.58% 갖고 쇄 길이가 C10인 지방산을 0.35 내지 6.76% 갖는다. 다른 비제한적인 예에서, 쇄 길이가 C12인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 쇄 길이가 C12인 지방산을 3.9 내지 14.11% 갖고 쇄 길이가 C14인 지방산을 1.95 내지 3.05% 갖는다. 다른 비제한적인 예에서, 쇄 길이가 C14인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 쇄 길이가 C14인 지방산을 4.40 내지 17.35% 갖고 쇄 길이가 C12인 지방산을 0.4 내지 1.83 면적% 갖는다. 몇몇 경우에, 쇄 길이가 C8 내지 C14인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 전이유전자를 함유하는 프로토테카 균주는 중간쇄(C8-C14)의 지방산을 3.5 내지 20% 갖는다. 몇몇 경우에, 외인성 유전자를 유지하기 위한 일정하고 높은 선별압하에 유전자전이 프로토테카 균주를 유지시키는 것이 특이적 쇄 길이의 목적하는 지방산의 증가로 인해 유리하다. 비제한적인 예에서, 실시예 5는 C14 선호 티오에스테라제 외인성 유전자를 함유하는 프로토테카 모리포르미스의 배양물이 유지되는 경우 C14 쇄 길이의 지방산(30% 초과의 C8-C14 쇄 길이의 지방산)이 2배 증가함을 입증한다. 고수준의 외인성 유전자 보유는 본원에 기재된 상동성 재조합 벡터 및 방법을 사용하여 세포의 핵 염색체내로 외인성 유전자를 삽입함에 의해 성취될 수 있다. 핵 염색체로 통합된 외인성 유전자를 함유하는 재조합 세포가 본 발명의 목적이다.

미세조류 오일은 또한 미세조류에 의해 생산되거나 배양 배지로부터 미세조류 오일로 혼입된 다른 성분을 포함할 수 있다. 이들 다른 성분들은 미세조류를 배양하기 위해 사용되는 배양 조건, 미세조류 종, 바이오매쓰로부터 미세조류 오일을 회수하기 위해 사용되는 추출 방법 및 미세조류 오일 조성물에 영향을 줄 수 있는 다른 인자에 따라 다양한 양으로 존재할 수 있다. 상기 성분의 비제한적인 예는 0.1-0.4 마이크로그램/ml로 존재하는 카로테노이드, 오일의 킬로그램당 0 내지 0.02 밀리그램으로 존재하는 클로로필, 오일의 100그램당 0.4 내지 0.6 밀리그램으로 존재하는 감마 토코페롤, 및 오일의 그램당 0.2 내지 0.5 밀리그램으로 존재하는 총 토코트리에놀을 포함한다.

다른 성분은 제한 없이, 인지질, 토코페롤, 토코트리에놀, 카로테노이드(예를 들어, 알파-카로틴, 베타-카로틴, 리코펜 등), 크산토필(예를 들어, 루테인, 제악산틴, 알파-크립토산틴 및 베타-크립토산틴), 및 다양한 유기 또는 무기 화합물을 함유할 수 있다.

몇몇 경우에, 프로토테카 종으로부터 추출된 오일은 0.02mg/kg 이하의 클로로필을 포함한다. 몇몇 경우에, 프로토테카 종으로부터 추출된 오일은 총 0.4 mcg/ml 이하의 카로테노이드를 포함한다. 몇몇 경우에, 상기 프로토테카 오일은 오일 100그램당 0.40 내지 0.60 밀리그램의 감마 토코페롤을 포함한다. 다른 경우에, 프로토테카 오일은 오일 그램당 총 0.2-0.5 밀리그램의 토코트리에놀을 포함한다.

III. 유전자 조작 방법 및 재료

본 발명은 프로토테카 세포를 유전자 변형시키기 위한 방법 및 재료 및 본 발명의 방법에 유용한 재조합 숙주 세포를 제공하고, 당해 숙주 세포는 재조합 프로토테카 모리포르미스, 프로토테카 조프피, 프로토테카 조프피, 프로토테카 크루가니 및 프로토테카 스타그노라 숙주 세포를 포함하지만 이에 제한되지 않는다. 이들 방법 및 재료의 기재는 구독자의 편의를 위해 서브섹션으로 나눈다. 서브섹션 1에서, 형질전환 방법을 기재한다. 서브섹션 2에서 상동성 재조합을 사용한 유전자 조작 방법을 기재한다. 서브섹션 3에서 발현 벡터 및 성분을 기재한다.

1. 조작 방법 - 형질전환

세포를, 예를 들어, 유전자주입, 전기천공(참조: Maruyama et al. (2004), Biotechnology Techniques 8:821-826)), 유리 비드 형질전환 및 탄화규소 휘스커 형질전환을 포함하는 임의의 적합한 기술에 의해 형질전환시킬 수 있다. 사용될 수 있는 또 다른 방법은 원형질세포를 형성하고 CaCl₂ 및 폴리에틸렌 글리콜(PEG)를 사용하여 재조합 DNA를 미세조류 세포에 도입하는 것이다[문헌참조: Kim et al. (2002), Mar. Biotechnol. 4:63-73, 본 문헌은 클로렐라 엘리프소이데아(Chorella ellipsoidea)의 형질전환을 위한 상기 방법의 사용을 보고한다]. 미세조류의 동시 형질감염을 사용하여 2개의 독특한 벡터 분자를 세포에 동시에 도입할 수 있다[문헌참조: 예를 들어 Protist 2004 Dec;155(4):381-93].

또한 유전자 주입 방법[문헌참조: 예를 들어, Sanford, Trends In Biotech. (1988) 6:299 302, U.S. Patent No. 4,945,050]; 전기천공[문헌참조: Fromm et al., Proc. Nat'l. Acad. Sci. (USA) (1985) 82:5824 5828]; 레이져 빔, 미세주입 또는 DNA를 미세조류로 도입할 수 있는 임의의 다른 방법의 사용으로 프로토테카 세포를 형질전환시킬 수 있다.

2. 조작 방법 - 상동성 재조합

상동성 재조합은 상동성 영역을 정렬하고 교환하는 상보적 DNA 서열의 능력이다. 표적화된 게놈 서열("주형")과 상동성인 서열을 함유하는 유전자전이 DNA ("공여체")를 유기체에 도입함에 이어서 상응하는 게놈 상동성 서열 부위에서 게놈으로 재조합을 진행한다. 많은 경우에 상기 공정의 기계론적 단위는 다음을 포함한다: (1) 상동성 DNA 절편의 쌍형성; (2) 이중가닥 브레이크의 공여체 DNA 분자로의 도입; (3) 유리된 공여체 DNA 말단에 의한 주형 DNA 분자의 공격에 이어서 DNA의 합성; 및 (4) 이중가닥 브레이크 복구 반응으로 최종 재조합 생성물 생성.

숙주 유기체에서 상동성 재조합을 수행하기 위한 능력은 분자 유전학적 수준에서 수행될 수 있는 것에 대한 많은 실제 연관성을 갖고 맞춤 오일을 생성할 수 있는 유성 미생물의 생성에 유용한 많은 실제 연관성을 갖는다. 이의 천연의 상동성 재조합이란 정확한 유전자 표적화 반응이고 따라서 동일한 표적화 서열로 생성된 대부분의 유전자 전이 계열은 근본적으로 표현형과 관련해서 동일하고 극소수의 형질전환 반응의 스크리닝을 필요로 한다. 상동성 재조합은 또한 숙주 염색체로의 유전자 삽입 반응을 표적화하여 유전자 선별 부재하에서도 우수한 유전학적 안정성을 수득한다. 상이한 염색체 유전자좌는 심지어 이종성 프로모터/UTR로부터 유전자 발현에 영향을 줄 가능성이 있기 때문에 상동성 재조합은 유사하지 않은 게놈 환경내에서 유전자좌를 탐색하고 유전자 발현에 대한 이들 환경의 영향을 평가하는 방법일 수 있다.

특히 유용한 상동성 재조합을 사용하는 유전자 조작 응용은 고도로 특이적인 양상으로 이종성 유전자 발현을 구동시키는 프로모터/UTR과 같은 특이적 숙주 조절 요소를 선택하는 것이다. 예를 들어, 이종성 C12:0 특이적 FATB(티오에스테라제) 유전자 카세트와 적합한 선택적 마커를 사용한 내인성 스테아로일 ACP 데스타우라제 유전자의 정확한 절단은 C18:1의 지방산 수준을 급격히 감소시키고 동시에 C12:0 지방산의 수준을 증가시키는 것으로 예측할 수 있다. 실시예 13은 내인성 프로토테카 모리포르미스 스테아로일 ACP 데스타우라제 유전자의 절단을 위해 적합한 상동성 재조합 표적화 작제물을 기재한다.

상동성 재조합은 정확한 유전자 표적화 반응이기 때문에, 충분한 플랭킹 영역이 확인된 이상 목적하는 유전자 또는 영역내 임의의 뉴클레오타이드(들)를 정확히 변형시키는데 사용될 수 있다. 따라서, 상동성 재조합은 RNA 및/또는 단백질의 유전자 발현에 영향을 주는 조절 서열을 변형시키기 위한 수단으로서 사용될 수 있다. 이것은 또한 기질 특이성, 친화성 및 Km과 같은 효소 활성을 변형시킴에 따라서 숙주 세포 대사의 목적하는 변화에 영향을 주고자 단백질 암호화 영역을 변형시키는데 사용될 수 있다. 상동성 재조합은 유전자 표적화, 유전자 전환, 유전자 결실, 유전자 복제, 유전자 역위를 유도하고 프로모터, 인핸서 및 3'UTR과 같은 유전자 발현 조절 요소를 교환하여 고스트(gost) 게놈을 조작하기 위한 강력한 수단을 제공한다.

상동성 재조합은 내인성 숙주 세포 게놈내에 목적하는 유전자 또는 영역을 "표적화"하기 위한 내인성 서열 조각을 함유하는 표적화 작제물을 사용하여 성취될 수 있다. 상기 표적화 서열은 목적하는 유전자 또는 영역의 5'에 위치하거나 목적하는 유전자/영역의 3'에 위치하거나 심지어 목적하는 유전자/영역을 플랭킹할 수 있다. 상기 표적화 작제물은 추가의 벡터 골격과 함께 슈퍼코일된 플라스미드 DNA로서, 벡터 골격을 갖지 않는 PCR 생성물로서 또는 선형화된 분자로서 숙주 세포를 형질전환시킬 수 있다. 몇몇 경우에, 이것은 먼저 제한 효소에 유전자전이 DNA(공여체 DNA)내의 상동성 서열을 노출시키는 것이 유리할 수 있다. 상기 단계는 재조합 효율을 증가시킬 수 있고 목적하지 않은 반응의 발생을 감소시킬 수 있다. 재조합 효율을 증가시키는 다른 방법은 PCR을 사용하여 표적화된 게놈 서열에 상동성인 선형 말단을 함유하는 형질전환 유전자전이 DNA를 생성시킴을 포함한다.

3. 벡터 및 벡터 성분

본 발명에 따라 미생물을 형질전환시키기 위한 벡터는 본원에 기재된 바를 토대로 당업자에게 유사한 공지된 기술에 의해 제조할 수 있다. 벡터는 전형적으로 하나 이상의 유전자를 함유하고 여기서 각각의 유전자는 목적하는 생성물(유전자 생성물)의 발현을 암호화하고 유전자 발현을 조절하거나 유전자 생성물을 재조합 세포내 특정 위치에 표적화하는 하나 이상의 제어 서열에 작동적으로 연결되어 있다. 구독자를 도와주기 위해 본 서브섹션은 여러 서브섹션으로 나누어진다. 서브섹션 A는 본 발명에 의해 제공된 신규 제어 서열 뿐만 아니라 전형적으로 벡터상에 함유된 제어 서열을 기재한다. 서브섹션 B는 신규 최적화 방법 및 본 발명에 의해 제공된 것들을 사용하여 제조된 유전자 뿐만 아니라 벡터내 전형적으로 함유된 유전자를 기재한다.

A. 제어 서열

제어 서열은 암호화 서열의 발현을 조절하거나 유전자 생성물을 세포 내부 또는 외부의 특정 위치로 지시하는 핵산이다. 발현을 조절하는 제어 서열은 예를 들어, 암호화 서열의 전사를 조절하는 프로모터 및 암호화 서열의 전사를 종결시키는 터미네이터를 포함한다. 또 다른 제어 서열은 폴리아데닐화 시그날을 암호화하는 암호화 서열의 말단에 위치한 3' 비해독 서열이다. 유전자 생성물을 특정 위치로 지시하는 제어 서열은 단백질이 세포 내부 또는 외부의 특정 위치에 부착되는 위치로 지시하는 시그날 펩타이드를 암호화하는 것들을 포함한다.

따라서, 미세조류내 외인성 유전자의 발현을 위한 예시적인 벡터 디자인은 미세조류내에서 활성인 프로모터에 작동적으로 연결된 목적하는 유전자 생성물(예를 들어, 선택가능한 마커, 지질 경로 변형 효소 또는 슈크로스 이용 효소)에 대한 암호화 서열을 함유한다. 또한, 벡터가 목적하는 암호화 서열과 작동가능하게 연결된 프로모터를 함유하지 않는 경우, 상기 암호화 서열은 이것이 벡터 통합 부위에서 내인성 프로모터와 작동가능하게 연결되도록 세포를 형질전환시킬 수 있다. 형질전환의 프로모터 부재 방법은 미세조류에서 작동하는 것으로 입증되었다[문헌참조: 예를 들어, Plant Journal 14:4, (1998), pp.441-447].

많은 프로모터는 미세조류내에서 활성이고 형질전환된 조류에 내인성이 아닌 프로모터(즉, 다른 조류 기원의 프로모터, 고등 식물 기원의 프로모터 및 식물 바이러스 또는 조류 바이러스 기원의 프로모터) 뿐만 아니라 형질전환된 조류에 내인성인 프로모터를 포함한다. 미세조류내에서 활성인 예시적인 외인성 및/또는 내인성 프로모터(또한 미세조류에서 기능하는 항생제 내성 유전자)는 문헌[참조: PCT 공개 번호 제2008/151149호 및 본원에 인용된 문헌]에 기재되어 있다.

외인성 유전자를 발현시키기 위해 사용되는 프로모터는 천연적으로 상기 유전자 또는 이종성 유전자에 연결된 프로모터일 수 있다. 몇몇 프로모터는 하나 이상의 미세조류 종에서 활성이다. 다른 프로모터는 종 특이적이다. 예시적인 프로모터는 하기 실시예에 사용된 클라미도모나스 레인하르드티(Chlamydomonas reinhardtii) 기원의 β-튜불린과 같은 프로모터 및 다수의 미세조류 종에서 활성인 것으로 밝혀진 콜리플라워 모자이크 바이러스(CMV) 및 클로렐라 바이러스와 같은 바이러스 프로모터를 포함한다[문헌참조: 예를 들어, Plant Cell Rep. 2005 Mar;23(10-11):727-35; J Microbiol. 2005 Aug;43(4):361-5; Mar Biotechnol (NY). 2002 Jan;4(l):63-73]. 프로토테카에서 외인성 유전자의 발현에 사용하기에 적합할 수 있는 또 다른 프로모터는 클로렐라 소로키니아나(Chlorella sorokiniana) 글루타메이트 데하이드로게나제 프로모터/5 'UTR (서열번호 69)이다. 임의로, 프로모터를 함유하는 상기 서열중 10, 20, 30, 40, 50, 또는 60개 이상의 뉴클레오타이드가 사용되다. 프로토테카 외인성 유전자의 발현에 유용한 프로모터는 본원의 서열 목록에 열거되어 있고 예를 들어 클로렐라 HUP1 유전자(서열번호 1)의 프로모터 및 클로렐라 엘립소이데아 니트레이트 리덕타제 프로모터(서열번호 2)가 있다. 클로렐라 바이러스 프로모터는 또한 프로토테카에서 미국 특허 제6,395,965호의 서열번호 1 내지 7과 같은 유전자를 발현시키는데 사용될 수 있다. 프로토테카에서 활성인 추가의 프로모터는 예를 들어 문헌[참조: Biochem Biophys Res Commun. 1994 Oct 14;204(l): 187-94; Plant Mol Biol. 1994 Oct;26(l):85-93; Virology. 2004 Aug 15;326(1): 150-9; and Virology. 2004 Jan 5;318(l):214-23]에서 찾을 수 있다.

프로모터는 일반적으로 항상성이거나 유도성인 것으로서 특성화될 수 있다. 항상성 프로모터는 일반적으로 동일한 수준에서 항상(또는 세포 생활 사이클에서 특정 시점에서) 활성이거나 기능성이다. 역으로, 유도성 프로모터는 활성(또는 불활성)이거나 단지 자극에 응답하여 상당히 상향 조절되거나 하향 조절된다. 상기 프로모터 유형 둘다는 본원의 방법에 적용된다. 본 발명에서 유용한 유도성 프로모터는 외인성으로 제공된 소분자(예를 들어, 서열번호 1에서와 같이 글루코스), 온도(열 또는 냉), 배양 배지내 질소 부재 등과 같은 자극에 응답하여 작동적으로 연결된 유전자의 전사를 매개하는 것들을 포함한다. 적합한 프로모터는 근본적으로 사일런트 유전자의 전사를 활성화시킬 수 있거나 바람직하게 낮은 수준으로 전사된 작동가능하게 연결된 유전자의 전사를 상당히 상향 조절한다.

종결 영역 제어 서열의 내포는 임의적이고 사용되는 경우 상기 선택은 상기 종결 영역이 비교적 상호교환가능하므로 주로 편의를 위한 것이다. 상기 종결 영역은 전사 개시 영역(프로모터)에 특정된 것일 수 있거나 목적하는 DNA 서열에 특정된 것일 수 있거나 또 다른 공급원으로부터 수득할 수 있다[문헌참조: 예를 들어, Chen and Orozco, Nucleic Acids Res. (1988) 16:8411].

본 발명은 또한 제어 서열 및 재조합 유전자, 및 목적하는 유전자의 구분된 발현을 제공하는 것들을 함유하는 벡터를 제공한다. 표적화를 위한 기관은 엽록체, 플라스티드, 미토콘드리아, 및 소포체이다. 또한, 본 발명은 제어 서열 및 재조합 유전자, 및 세포 외부로의 단백질의 분비를 제공하는 것들을 함유하는 벡터를 제공한다.

프로토테카 핵 게놈에서 발현되는 단백질은 플라스티드 표적화 시그날을 사용하여 플라스티드로 표적화될 수 있다. 클로렐라에 내인성인 플라스티드 표적화 서열은 공지되어 있고 예를 들어, 플라스티드로 표적화되는 단백질을 암호화하는 클로렐라 핵 게놈내 유전자들이 있고[문헌참조: 예를 들어, GenBank 승인 번호 AY646197 및 AF499684], 하나의 양태에서, 상기 제어 서열은 단백질의 발현을 프로토테카 플라스티드로 표적화하는 본 발명의 벡터내에 사용된다.

하기 실시예는 숙주 세포내 올바른 구획으로 이종성 단백질을 표적화하는 조류 플라스티드 표적화 서열의 용도를 기재한다. cDNA 라이브러리는 프로토테카 모리포르미스 및 클로렐라 프로토테코디에스 세포를 사용하여 제조되고 하기 실시예 12 및 11에 기재되어 있다. 서열은 BLAST이고 플라스티드/엽록체로 수송되는 공지된 단백질과의 상동성에 대해 분석된다. 상기 단백질을 암호화하는 cDNA를 클로닝하고 플라스티드 표적화 서열은 상기 cDNA로부터 분리하였다. cDNA 라이브러리로부터 동정된 조류 플라스티드 표적화 서열의 아미노산 서열 및 하기 이종성 발현 실시예에 사용된 식물 지방 아실-ACP 티오에스테라제의 아미노산 서열은 서열번호 127 내지 133에 열거되어 있다.

본 발명의 또 다른 양태에서, 프로토테카내에서 폴리펩타이드의 발현은 소포체로 표적화된다. 발현 벡터내 적절한 보유 또는 분류 시그날의 내포는 단백질이 소포체(ER)에 보유되고 골지체로 다운스트림되지 않도록 하는 것을 보장한다. 예를 들어, IMPACT VECTOR 1.3 벡터[제조원:Wageningen UR- Plant Research International]는 널리 공지된 KDEL 보유 또는 분류 시그날을 포함한다. 상기 벡터와 함께, ER 보유는 이것이 발현 수준을 5배 이상으로 개선시킴이 보고되었다는 점에서 실제 잇점을 갖는다. 이에 대한 주요 이유는 ER이 세포질내 존재하는 것 보다 발현된 단백질의 해독후 분해에 관여하는 프로테아제가 보다 낮은 농도이고/이거나 상이하다는 점에 있는 것으로 나타난다. 녹색 미세조류에서 기능하는 ER 보유 시그날은 문헌[참조: 예를 들어, Proc Natl Acad Sci USA. 2005 Apr 26;102(17):6225-30]에 공지되어 있다.

본 발명의 또 다른 양태에서, 폴리펩타이드는 배양 배지내로 세포 외부로의 분비를 위해 표적화된다. 프로토테카에서 본 발명에 방법에 따라 사용될 수 있는 클로렐라중에서 활성인 분비 시그날에 대한 예는 문헌[참조: Hawkins et al., Current Microbiology Vol. 38 (1999), pp. 335-341]을 참조한다.

B. 유전자 및 코돈 최적화

전형적으로, 유전자는 프로모터, 암호화 서열 및 종결 제어 서열을 포함한다. 재조합 DNA 기술에 의해 어셈블리되는 경우, 유전자는 발현 카세트로 호칭될 수 있고 재조합 유전자를 숙주 세포로 도입하는데 사용되는 벡터로의 편리한 삽입을 위한 제한 부위에 의해 플랭킹될 수 있다. 상기 발현 카세트는 상동성 재조합에 의한 발현 카세트의 게놈으로의 안정적인 통합을 촉진시키는, 게놈 또는 다른 핵산 표적 기원의 DNA 서열에 의해 플랭킹될 수 있다. 또는, 상기 벡터 및 이의 발현 카세트는 통합되지 않은 상태로 유지될 수 있고, 이 경우에, 상기 벡터는 전형적으로, 이종성 벡터 DNA의 복제를 제공할 수 있는 복제 오리진을 포함한다.

벡터상에 존재하는 통상의 유전자는 단백질을 암호화하는 유전자이고 이의 발현은 상기 단백질을 함유하는 재조합 세포가 상기 단백질을 발현하지 않는 세포로부터 구분될 수 있도록 한다. 상기 유전자 및 이의 상응하는 유전자 생성물은 선택가능한 마커로서 호칭된다. 임의의 광범위한 선택가능한 마커는 프로토테카를 형질전환시키기 위해 유용한 전이유전자 작제물에 사용될 수 있다. 적합한 선택가능한 마커의 예는 G418 내성 유전자, 니트레이트 리덕타제 유전자(문헌참조: Dawson et al. (1997), Current Microbiology 35:356-362), 하이그로마이신 포스포트랜스퍼라제 유전자(HPT; 참조: Kim et al. (2002), Mar. Biotechnol. 4:63-73), 네오마이신 포스포트랜스퍼라제 유전자, 및 플레오마이신(문헌참조: Huang et al. (2007), Appl. Microbiol. Biotechnol. 72:197-205)에 대해 내성을 부여하는 ble 유전자를 포함한다. 항생제에 대한 미세조류의 민감성을 측정하는 방법은 널리 공지되어 있다[문헌참조: 예를 들어, Mol Gen Genet. 1996 Oct 16;252(5):572-9].

본 발명의 목적을 위해, 본 발명의 재조합 숙주 세포를 제조하기 위해 사용되는 발현 벡터는 상기 유전자들중 하나가 선택가능한 마커인 경우, 2개 이상 및 흔히 3개의 유전자를 포함한다. 예를 들어, 본 발명의 유전자 조작된 프로토테카는 선택가능한 마커 뿐만 아니라 하나 이상의 외인성 유전자, 예를 들어, 슈크로스 인버타제 유전자 또는 아실 ACP-티오에스테라제 유전자를 포함하는 본 발명의 벡터로 형질전환시킬 수 있다. 하나 또는 2개의 유전자는 지질 수율 및 지방산 에스테르로의 전환을 증진시키기 위해 상기 유전자들의 발현과 관련된 타이밍을 허용하는 유도성 프로모터를 사용하여 발현될 수 있다. 2개 이상의 외인성 유전자의 발현은 동일한 유도성 프로모터의 제어하게 또는 상이한 유도성(또는 항상성) 프로모터의 제어하에 있을 수 있다. 후자 상황에서, 제1 외인성 유전자의 발현은 제1 기간동안 유도될 수 있고(이동안에 제2 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있다) 제2 외인성 유전자의 발현은 제2 기간동안 유도될 수 있다(이동안에 제1 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있다).

다른 양태에서, 2개 이상의 외인성 유전자(임의의 선택가능한 마커에 추가로)는 지방 아실-ACP 티오에스테라제 및 지방 아실-CoA/알데하이드 리덕타제이고, 상기 수율의 조합 작용은 알콜 생성물을 생성시킨다. 추가로 제한 없이 알데하이드를 생성하기 위한 지방 아실-ACP 티오에스테라제 및 지방 아실-CoA 리덕타제를 포함하는 외인성 유전자의 다른 조합이 제공된다. 하나의 양태에서, 벡터는 알칸을 생성하기 위해 지방 아실-ACP 티오에스테라제, 지방 아실-CoA 리덕타제 및 지방 알데하이드 데카보닐라제의 조합을 제공한다. 이들 각각의 양태에서, 외인성 유전자중 하나 이상은 유도성 프로모터를 사용하여 발현될 수 있다.

2개 이상의 외인성 유전자를 발현하는 본 발명의 다른 예시적인 벡터는 슈크로스 수송체 및 슈크로스 인버타제 효소 둘다를 암호화하는 것들 및 선택가능한 마커 및 분비된 슈크로스 인버타제 둘다를 암호화하는 것들을 포함한다. 벡터중 어느 하나의 유형으로 형질전환된 재조합 프로토테카는 탄소원으로서 사탕무(및 사탕무 유래 당)를 사용하는 능력으로 조작되었으므로 보다 낮은 제조 비용으로 지질을 생산한다. 상기된 2개의 외인성 유전자의 삽입은, 보다 큰 탄소 유입이 지질 생산과 맞물리도록 지시되고/되거나 무작위 돌연변이 유발을 통해 폴리사카라이드 생합성의 파괴와 조합될 수 있다. 개별적으로 및 조합적으로, 영양성 전환, 지질 생산을 변화시키기 위한 조작 및 외인성 효소를 사용한 처리는 미생물에 의해 생산되는 지질 조성물을 변형시킨다. 상기 변형은 미생물내에서 생산되는 지질의 양의 변화, 다른 지질과 비교하여 생산되는 하나 이상의 탄화수소 종의 양 및/또는 생산되는 지질 종의 유형의 변화일 수 있다. 예를 들어, 미세조류는 보다 높은 양의 TAG 및/또는 %를 생산하도록 조작될 수 있다.

재조합 단백질의 최적의 발현을 위해, 형질전환된 숙주 세포에 의해 우선적으로 사용되는 코돈으로 mRNA를 생산하는 암호화 서열을 사용하는 것이 이롭다. 따라서, 전이유전자의 적당한 발현은 전이유전자의 코돈 용법이 전이유전자가 발현되는 유기체의 특이적 코돈 편력에 부합되도록 하는 것이 요구될 수 있다. 상기 효과가 근거하는 정확한 기작은 많지만, 상기 필요성이 충족되는 경우 전이유전자 전령 RNA(mRNA)의 보다 효율적인 해독과 커플링되는, 세포내에서 합성되는 단백질과 가용하게 아미노아실화된 tRNA 풀의 적당한 균형을 포함한다. 전이유전장내 코돈 용법이 최적화되지 않은 경우, 가용한 tRNA 풀은 이종성 mRNA의 효율적인 해독을 허용하기에 충분하지 않고 리보솜 스톨링 및 종결 및 전이유전자 mRNA의 가능한 불안정성을 유도한다.

본 발명은 프로토테카내에서 재조합 단백질의 성공적인 발현을 위해 유용한 코돈 최적화된 핵산을 제공한다. 프로토테카 종에서 코돈 용법은 프로토테카 모리포르미스로부터 분리된 cDNA 서열을 연구함에 의해 분석된다. 상기 분석은 24,000개 코돈에 대한 탐색이고 이의 결과는 하기의 표 1에 나타낸다.

다른 양태에서, 재조합 벡터내 유전자는 프로토테카 균주 이외의 다른 미세조류 균주를 참조하여 코돈 최적화되었다. 예를 들어, 미세조류내 발현용 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다. 암호화 최적화를 위한 추가의 정보는 예를 들어, GenBank의 코돈 용법 데이타베이스에서 수득할 수 있다.

본 발명의 방법 및 재료가 외인성 유전자의 프로토테카로의 도입을 허용하고 슈크로스 이용 및 지질 경로 변형에 관한 유전자가 하기의 섹션에서 논의되는 바와 같이 관심 대상이다.

IV. 슈크로스 이용

하나의 양태에서, 본 발명의 재조합 프로토테카 세포는 하나 이상의 외인성 슈크로스 이용 유전자를 함유한다. 다양한 양태에서, 하나 이상의 유전자는 프럭토키나제, 글루코키나제, 헥소키나제, 슈크로스 인버타제 및 슈크로스 수송체로 이루어진 그룹으로부터 선택된 하나 이상의 단백질을 암호화한다. 예를 들어, 슈크로스 수송체 및 슈크로스 인버타제의 발현은 프로토테카가 슈크로스를 배양 배지로부터 세포에 수송하여 슈크로스를 가수분해시켜 글루코스 및 프럭토스를 생성하도록 한다. 임의로, 내인성 헥소키나제 활성이 프럭토스의 최대 인산화를 위해 불충분한 경우에도 프럭토키나제는 발현될 수 있다. 적합한 슈크로스 수송체의 예는 Genbank 승인 번호 제CAD91334호, 제CAB92307호, 및 제CAA53390호이다. 적합한 프럭토키나제의 예는 Genbank 승인 번호 제P26984호, 제P26420호 및 제CAA43322호이다.

하나의 양태에서, 본 발명은 슈크로스 인버타제를 분비하는 프로토테카 숙주 세포를 제공한다. 슈크로스 인버타제의 분비는 슈크로스를 세포내로 수송할 수 있는 수송체를 발현할 필요성을 제거한다. 이것은 분비된 인버타제가 슈크로스 분자의 글루코스 및 프럭토스 분자로의 전환을 촉매하기 때문이고, 이들 분자 둘다는 본 발명에 의해 제공된 미생물에 의해 수송되고 이용될 수 있다. 예를 들어, 분비 시그날 (예를 들어, 서열번호 4의 시그날(효모 기원), 예를 들어, 서열번호 5의 시그날(고등 식물 기원), 서열번호 6의 시그날(진핵 컨센서스 분비 시그날) 및 서열번호의 시그날(고등 식물 및 진핵 컨센서스 기원의 시그날 서열의 조합체))와 함께 슈크로스 인버타제(예를 들어, 서열번호 3)의 발현은 세포 외부에서 인버타제 활성을 생성시킨다. 본원에 기재된 유전자 조작 방법에 가능한 상기 단백질의 발현은 이미 에너지원으로서 세포외 글루코스를 이용할 수 있는 세포가 세포외 에너지원으로 슈크로스를 이용할 수 있게 해준다.

슈크로스 함유 배지에서 인버타제를 발현하는 프로토테카 종은 오일 생산을 위해 바람직한 미세조류 종이다. 실시예 3은 본 발명의 방법 및 시약이 어떻게 재조합 효모 인버타제를 발현하고 이를 재조합 프로토테카 세포로부터 분비하기 위해 사용될 수 있는지를 설명한다. 상기 완전 활성 단백질의 발현 및 세포외 표적화는 수득한 숙주 세포가 슈크로상에서 성장하도록 하는 반면, 이들의 비형질전환된 대응 숙주 세포는 성장할 수 없다. 따라서, 본 발명은 효모 인버타제 유전자를 포함하지만 이에 제한되지 않는 코돈 최적화된 인버타제 유전자를 갖는 프로토테카 재조합 세포를 제공하고, 이때 상기 효모 인버타제 유전자는 게놈에 통합되어 있어 상기 인버타제 유전자는 인버타제 활성 및 슈크로스 가수분해에 의해 평가되는 바와 같이 발현된다. 본 발명은 또한 세포가 슈크로스상에 성장할 수 있는 반면 이들의 비형질전환된 대응 세포는 발현할 수 없으므로 프로토테카 재조합 세포에서 선택가능한 마커로서 유용한 인버타제 유전자; 및 조류 분자 유전자에 대한 강력한 선택가능한 마커로서 인버타제를 사용하여 재조합 숙주 세포를 선택하기 위한 방법을 제공한다.

프로토테카에서 슈크로스 인버타제의 성공적인 발현은 또한 이것이, 이종성(재조합) 단백질이 완전한 활성 및 기능적 형태로서 세포 외부로 및 배양 배지내로 성공적으로 분비됨을 입증한다는 점에서 본 발명의 또 다른 측면을 설명한다. 따라서, 본 발명은 미세조류내 광범위한 이종성 단백질을 발현하고 이들을 숙주 세포 외부로 분비시키기 위한 방법 및 시약을 제공한다. 상기 단백질은 예를 들어, 산업용 효소, 예를 들어, 리파제, 프로테아제, 셀룰라제, 펙티나제, 아밀라제, 에스테라제, 옥시도리덕타제, 트랜스퍼라제, 락타제, 이소머라제 및 인버타제, 및 치료학적 단백질, 예를 들어, 성장 인자, 사이토킨, 2개의 경쇄 및 2개의 중쇄를 포함하는 전장 항체, Fab, scFv (단일쇄 가변 단편), 카멜리드형 항체, 항체 단편, 항체-단편 융합체, 항체-수용체 융합체, 인슐린, 인터페론 및 인슐린형 성장 인자를 포함한다.

프로토테카내 슈크로스 인버타제의 성공적인 발현은 또한 이것이 프로토테카내 단백질의 분비를 지시하기 위한 조류내 진균류 수송 펩타이드의 사용을 위한 방법 및 시약을 제공하고 펩타이드가 기능할 수 있는지의 여부 및 이것이 프로토테카 세포에서 수송 펩타이드로서 기능하는 능력을 결정하기 위한 방법 및 시약을 제공한다는 점에서 본 발명의 또 다른 측면을 설명한다. 본 발명의 방법 및 시약은 단백질을 세포외로 성공적으로 수송할 수 있는 다른 수송 펩타이드를 동정하기 위한 도구 및 플랫폼으로서 사용될 수 있고, 이때 효모 인버타제가 이들 방법에서 우수한 용도를 갖는다. 본 실시예에서 입증된 바와 같이, 내인성 효모 인버타제 수송 펩타이드의 제거 및 숙주 조류에 내인성이거나 다른 공급원(진핵, 원핵 및 바이러스)으로부터 기원하는 다른 수송 펩타이드로의 이의 대체가 목적하는 임의의 펩타이드가 세포로부터 단백질의 방출을 유도하는 수송 펩타이드로서 기능할 수 있는지의 여부를 동정할 수 있다.

적합한 슈크로스 인버타제의 예는 Genbank 승인 번호 제CAB95010호, 제NP_012104호 및 제CAA06839호에 의해 동정된 것들을 포함한다. 적합한 인버타제의 비제한적인 예는 하기 표 2에 열거되어 있다. 각각의 열거된 인버타제에 대한 아미노산 서열은 하기의 서열 목록에 포함된다. 몇몇 경우에, 본 발명의 방법 및 벡터에 사용하기에 적합한 외인성 슈크로스 이용 유전자는 표 2로부터 선택되는 슈크로스 인버타제와 40, 50, 60, 75, 또는 90% 이상의 아미노산 동일성을 갖는 슈크로스 인버타제를 암호화한다.

프로토테카에 의한 배양 배지로의 인버타제의 분비는 세포가 이들이 순수 시약 등급의 글루코스상에 성장하는 바와 같이 사탕무 가공으로부터 비롯된 폐기 당밀상에서 성장할 수 있도록 해주고 사탕무 가공의 상기 낮은 가치의 폐기물의 사용은 지질 및 다른 오일의 제조에서 상당한 비용 절감을 제공할 수 있다. 따라서, 본 발명은 (i) 슈크로스 및 (ii) 슈크로스 인버타제 효소를 포함하는 배양 배지 및 프로토테카 미생물 집단을 함유하는 미생물 배양물을 제공한다. 다양한 양태에서 배양물내 슈크로스는 수수, 사탕무, 사탕 수수, 당밀 또는 탈중합된 셀룰로스 물질(이것은 임의로 리그닌을 함유할 수 있다)로부터 기원한다. 또 다른 측면에서, 본 발명의 방법 및 시약은 재조합 프로토테카에 의해 사용될 수 있는 공급원료의 수 및 유형을 상당히 증가시킨다. 본원에 예시된 미생물은 이들이 슈크로스를 이용할 수 있도록 변형되고 본 발명의 방법 및 시약이 적용되어 셀룰로스와 같은 공급원료가 셀룰라제, 펙티나제, 이소머라제 등을 분비하는 능력을 갖는 본 발명의 조작된 숙주 미생물에 의해 이용될 수 있도록 하고 효소 반응의 분해 생성물은 더 이상 단순히 내성이 아니고 숙주에 의해 탄소원으로 이용된다.

V. 지질 경로 조작

슈크로스 함유 공급원료와 같은 공급원료를 사용하는 프로토테카의 능력을 변형시키는 것에 추가로, 본 발명은 생산된 지질의 성질 및/또는 비율이 변화하도록 변형된 재조합 프로토테카를 제공한다. 상기 경로는 추가로 또는 대안적으로 지장산 경로에서 지질 및 중간체의 효소적 가공을 통해 생성된 다양한 지질 분자의 성질 및/또는 비율이 변화되도록 변형될 수 있다. 다양한 양태에서, 본 발명의 재조합 프로토테카 세포는 이들의 비형질전환된 대응 세포에 비해 단위 용적당 및/또는 단위 시간당 최적화된 지질 수율, 탄소 쇄 길이(예를 들어, 재생가능한 디젤 생산 또는 지질 공급원료를 요구하는 산업적 화학 제품), 감소된 수의 이중 결합 또는 삼중 결합, 임의로 0개를 갖고 지질 또는 독특한 지질 집단의 수소:탄소 비율을 증가시킨다.

특정 양태에서, 지방산 합성으로의 대사에서 측쇄 지점을 제어하는 하나 이상의 주요 효소는 지질 생산을 개선시키기 위해 상향 조절되거나 하향 조절된다. 상향조절은 예를 들어, 전사를 증가시키는 강한 프로모터 및/또는 인핸서 요소를 사용하여, 목적하는 효소를 암호화하는 유전자가 발현되는 발현 작제물로 세포를 형질전환시킴에 의해 성취될 수 있다. 상기 작제물은 선택가능한 마커를 함유하여 상기 형질전환체는 선택될 수 있고 이에 의해 작제물을 증폭시키고 암호화된 효소의 발현 수준을 증가시킬 수 있다. 본 발명의 방법에 다른 상향 조절을 위해 적합한 효소의 예는 피루베이트를 아세틸-CoA로 전환시키는 역할을 하는 피루베이트 데하이드로게나제(예를 들어, 미세조류 기원의 일부는 Genbank 승인 번호 제NP_415392호; 제AAA53047호; 제QlXDMl호; 및 제CAF05587호를 포함한다)를 포함한다. 피루베이트 데하이드로게나제의 상향조절은 아세틸-CoA의 생산을 증가시킬 수 있고 이에 의해 지방산 합성을 증가시킬 수 있다. 아세틸-CoA 카복실라제는 지방산 합성에서 초기 단계를 촉매한다. 따라서, 상기 효소는 지방산의 생산을 증가시키기 위해 상향조절될 수 있다(예를 들어, 미세조류 기원의 일부는 Genbank 승인번호 제BAA94752호; 제AAA75528호; 제AA A81471호; 제YP_537052호; 제YP_536879호; 제NP_045833호; 및 제BAA57908호를 포함한다). 지방산 생산은 또한 지방산 합성 동안에 성장하는 아실 쇄를 운반하는 아실 운반 단백질(ACP)의 상향 조절될 수 있다(예를 들어, 미세조류 기원의 일부는 Genbank 승인 번호 제A0T0F8호; 제P51280호; 제NP_849041호; 제YP_874433호를 포함한다). 글리세롤-3-포스페이트 아실트랜스퍼라제는 지방산 합성의 율속 단계를 촉매한다. 상기 효소의 상향 조절은 지방산 생산을 증가시킬 수 있다(예를 들어, 미세조류 기원의 일부는 Genbank 승인번호 제AAA74319호; 제AAA33122호; 제AAA37647호; 제P44857호; 및 제ABO94442호를 포함한다).

유전자의 상향- 및/또는 하향 조절은 지방산 생합성 경로의 유전자의 발현을 제어하는 범용 조절제에 적용될 수 있다. 따라서, 지방산 합성의 하나 이상의 범용 조절제는 적당히 각각 다수의 지방산 합성 유전자의 발현을 억제하거나 증진시키고 궁극적으로 지질 생산을 증가시키도록 상향 또는 하향 조절될 수 있다. 이의 예는 스테롤 조절 요소 결합 단백질(SREBP), 예를 들어, SREBP-1a 및 SREBP-1c (예를 들어, Genbank 승인 번호 제NP_035610호 및 제Q9WTN3호를 참조)를 포함한다.

본 발명은 또한 예를 들어, 지방 아실-ACP 티오에스테라제(표 3 참조), 지방 아실-CoA/알데하이드 리덕타제(표 4 참조), 지방 아실-CoA 리덕타제(표 5 참조), 지방 알데하이드 데카보닐라제(표 6 참조), 지방 알데하이드 리덕타제 및 스쿠알렌 신타제(GenBank 승인 번호 제AF205791호 참조)와 같은 지질 변형 효소를 암호화하는 하나 이상의 외인성 유전자를 함유하도록 변형된 재조합 프로토테카 세포를 제공한다. 몇몇 양태에서, 지방 아실-ACP 티오에스테라제 및 천연적으로 동시 발현되는 아실 운반 단백질을 암호화하는 유전자는 임의로 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께 프로토테카 세포에 형질전환시킨다. 다른 양태에서, ACP 및 지방 아실-ACP 티오에스테라제는 이들이 특정 조직 또는 유기체중에서 천연적으로 동시 발현되거나 발현되지 않는 것과 상관없이 2개가 함께 본 발명의 미생물 및 방법에 사용되는 경우 잇점을 부여하는, 서로에 대한 친화성을 가질 수 있다. 따라서, 본 발명은 ACP로부터 길이 특이적 탄소쇄의 절단을 촉진시키기 위해 서로간에 상호작용하는 친화성을 공유하는 것들 뿐만 아니라 이들 효소의 동시 발현된 쌍 둘다를 고려한다.

여전히 다른 양태에서, 데사투라제를 암호화하는 외인성 유전자를 지질 포화와 관련하여 변형을 제공하기 위해 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 연계하여 프로토테카 세포에 형질전환시킨다. 스테아로일-ACP 데사투라제(문헌참조: 예를 들어, GenBank 승인 번호 제AAF15308호; 제ABM45911호; 및 제 AAY86086호)는 예를 들어, 스테아로일-ACP의 올레오일-ACP로의 전환을 촉매한다. 상기 유전자의 상향 조절은 세포에 의해 생산된 단일불포화 지방산의 비율을 증가시킬 수 있는 반면, 하향 조절은 단일불포화 비율을 감소시킬 수 있다. 유사하게, ω-6 지방산 데사투라제, 코-3 지방산 데사투라제, 또는 ω-6-올레에이트 데사투라제와 같은 하나 이상의 글리세로지질 데사투라제의 발현은 포화 지방산에 대한 불포화 지방산의 비율을 변화시키기 위해 제어될 수 있다. 몇몇 양태에서, 데사투라제는 데사투라제가 특정 탄소-길이 기질 또는 특정 범위내 탄소-길이를 갖는 기질내에서 위치 특이적 변형을 만들 수 있도록 목적하는 탄소 쇄 길이와 관련하여 선택될 수 있다.

따라서, 특정 양태에서, 본 발명의 미생물은 아실-ACP 티오에스테라제, 아실-CoA/알데하이드 리덕타제, 지방 아실-CoA 리덕타제, 지방 알데하이드 리덕타제, 지방 알데하이드 데카보닐라제 또는 천연적으로 동시 발현되는 아실 운반 단백질로 부터 선택되는 하나 이상의 외인성 유전자를 발현하도록 유전자 조작된다. 적합한 발현 방법은 기타 방법중에서 유도성 발현 및 구분된 발현을 포함하는 리파제 유전자와 관련하여 상기 기재된다. 지방 아실-ACP 티오에스테라제는 지질 합성동안에 아실 운반 단백질(ACP)로부터 지방산을 절단한다. 추가의 효소적 가공을 통해, 절단된 지방산은 이어서 조효소와 조합되어 아실-CoA 분자를 생성한다. 이러한 아실-CoA는 알콜을 생성하기 위한 지방 아실-CoA 알데하이드 리덕타제에 대한 것 뿐만 아니라 알데하이드를 생성하기 위한 지방 아실-CoA 리덕타제의 효소 활성에 대한 기질이다. 상기된 지방 아실-CoA 리덕타제의 작용에 의해 생산된 알데하이드는 알콜을 생성하기 위한 지방 알데하이드 리덕타제 또는 알칸 또는 알켄을 생성하기 위한 지방 알데하이드 리덕타제에 의한 추가의 효소적 활성에 대한 기질이다.

몇몇 양태에서, 본원에 기재된 방법에 의해 생산되는 지방산, 글리세로지질, 또는 상응하는 1급 알콜, 알데하이드, 알칸 또는 알켄은 8, 10, 12, 또는 14개의 탄소원자를 함유한다. 디젤, 바이오디젤, 재생가능한 디젤 또는 제트 연료를 위해 바람직한 지방산 또는 산업용을 위한 상응하는 1급 알콜, 알데하이드, 알칸 및 알켄은 8 내지 14개의 탄소원자를 함유한다. 특정 양태에서, 다른 상응하는 탄화수소 분자 뿐만 아니라 상기 지방산은 포화되거나(어떠한 탄소-탄소 이중 또는 삼중 결합을 갖지 않는다); 단일 불포화되거나(단일 이중 결합); 다중 불포화되거나(2개 이상의 이중 결합); 선형(환형이 아님)이거나 측쇄이다. 연료 생산을 위해 보다 큰 포화가 바람직하다.

상기 직접 기재된 효소는 특정 수의 탄소원자를 함유하는 기질의 가수분해에 대해 우선적인 특이성을 갖는다. 예를 들어, 지방 아실-ACP 티오에스테라제는 ACP로부터 12개의 탄소원자를 갖는 지방산을 절단하는 것을 선호할 수 있다. 몇몇 양태에서, ACP 및 쇄 특이적 티오에스테라제는 이들이 조합체로서 특히 유용하게 하는 서로에 대해 친화성을 가질 수 있다(예를 들어, 외인성 ACP 및 티오에스테라제 유전자는 이들이 유래하는 특정 조직 또는 유기체에서 천연적으로 동시 발현될 수 있다). 따라서, 다양한 양태에서, 본 발명의 재조합 프로토테카 세포는 기질내 함유된 탄소원자수와 관련하여 효소적 활성을 촉매하기 위한 특이성(예를 들어, ACP로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알콜로의 환원, 또는 알데하이드의 알칸으로의 전환)을 갖는 단백질을 암호화하는 외인성 유전자를 함유할 수 있다. 다양한 양태에서 효소적 특이성은 8 내지 34개의 탄소원자, 바람직하게는 8 내지 18개의 탄소원자 및 보다 바람직하게는 8 내지 14개의 탄소원자를 갖는 기질에 대한 것일 수 있다. 바람직한 특이성은 즉 18개 탄소원자 보다는 적은 즉, 12개를 갖는 기질에 대한 것이다.

비제한적이고 예시적인 실시예에서, 본 발명은 티오에스테라제가 특이적인 쇄 길이에서 비형질전환된 프로토테카 세포의 지질 프로필에 비해, 외인성 티오에스테라제를 발현하고 따라서 풍부한 지질을 생산하는 벡터 및 프로토테카 숙주 세포를 제공한다. 예시된 티오에스테라제는 (i) 14의 탄소쇄 길이를 갖는 지방 아실-ACP 기질을 선호하는 시나모몸 캄포럼(Cinnamomum camphorum) FatBl (GenBank 승인 번호 제Q39473호, 아미노산 서열은 서열번호 59중에 있고, 플라스티드 표적화 서열(PTS) 부재인 아미노산 서열은 서열번호 139중에 있고 표 1을 기초로 한 코돈 최적화된 cDNA 서열은 서열번호 60중에 있다); (ii) 8 내지 10의 탄소쇄 길이를 갖는 지방 아실-ACP 기질을 선호하는 쿠페아 후케리아나(Cuphea hookeriana) FatB2 (GenBank 승인번호 제AAC49269호, 아미노산 서열은 서열번호 61중에 있고 PTS 부재인 아미노산 서열은 서열번호 138중에 있고 표 1을 기초로 하는 코돈 최적화된 cDNA 서열은 서열번호 62중에 있다); 및 (iii) 12의 탄소쇄 길이를 갖는 지방 아실-ACP 기질을 선호하는 움벨루라리아(Umbellularia) 지방 Bl (GenBank 승인 번호 제Q41635호, 아미노산 서열은 서열번호 63중에 있고 PTS 부재인 아미노산 서열은 서열번호 139중에 있고 표 1을 기초로 하는 코돈 최적화된 cDNA 서열은 서열번호 64중에 포함된다)이다.

본 발명의 미생물 및 방법과 함께 사용하기에 적합한 다른 지방 아실-ACP 티오에스테라제는 표 3에 열거된 것들을 제한없이 포함한다.

하기 실시예는 프로토테카 종중에서 쿠페아 후케리아나, 움벨루라리아 캘리포니카(Umbellularia californica), 시나모멈 캄포라(Cinnamomun camphora) 기원의 이종성 지방 아실-ACP 티오에스테라제의 성공적인 표적화 및 발현을 기재한다. 추가로, 지방산 프로필중의 변형은 숙주 세포 발현에서 이들 이종성 지방 아실-ACP 티오에스테라제중에서 확인되었다. 이들 결과는 일반적으로 조류와 고등 식물 티오에스테라제간에 서열 상동성의 부재 및 프로토테카 모리포르미스 지방 아실-ACP 티오에스테라제와 상기 열거된 이종성 지방-아실-ACP 티오에스테라제간의 서열 상동성의 부재를 고려할때 전혀 예상치 못한 것이었다. 2개의 프로토테카 모리포르미스 아실-ACP 티오에스테라제를 분리하고 서열분석하였다. 2개 cDNA의 서열은 서로간에 고도의 동일성을 나타내었고 뉴클레오타이드 수준에서 단지 12개의 위치에서 상이하였고 아미노산 수준에서 5개의 위치에서 상이하였으며 플라스티드 수송 펩타이드에서 이들 중 4개가 상이하였다. 프로토테카 모리포르미스 기원의 게놈 서열의 추가 분석은 실제로 이들 2개의 cDNA가 별도의 콘티그상에 암호화되어 있고 고도로 상동성이지만 2개의 별도의 유전자에 의해 암호화되어 있음을 확인시켜 주었다. 2개의 프로토테카 모리포르미스 지방 아실-ACP 티오에스테라제인 프로토테카 모리포르미스 지방 아실-ACP 티오에스테라제-1과 프로토테카 모리포르미스 지방 아실-ACP 티오에스테라제-2의 cDNA 및 아미노산 서열은 서열번호 134 내지 137로서 열거되어 있다.

이들 2개의 cDNA의 아미노산 서열이 NCBI 데이타베이스에 대해 BLAST되는 경우, 2개의 최대 상동성 서열은 클라미도모나스 레인하르드티 및 아라비도프시스 탈리아나 기원의 지방 아실-ACP 티오에스테라제였다. 놀랍게도, 프로토테카 모리포르미스 지방 아실-ACP 티오에스테라제와 고등 식물 티오에스테라제간의 아미노산 동일성 수준은 단지 49 및 37% 동일성으로 매우 낮았다. 또한, 이들 지방 아실-ACP 티오에스테라제중에서 촉매 트리아드(NXHX₃₆C)의 아미노 말단 부분 주변의 서열에 상당한 차이가 있다. 조사된 40개의 고등 식물 지방 아실-ACP 티오에스테라제중 39개는 상기 트리아드의 아미노 말단에서 N 및 H 잔기 주변에 서열 LDMNQH를 나타내었지만 동정된 조류 서열 모두는 MDMNGH를 가졌다. 티오에스테라제의 촉매 트리아드 주변의 낮은 아미노산 서열 동일성 및 차이를 고려할때, 특히 외인성 지방 아실-ACP 티오에스테라제의 활성이 내인성 프로토테카 아실 운반 단백질과 기능성 단백질-단백질 상호작용에 의존한다는 사실을 고려할때 실시예에서 수득되고 기재된 외인성 지방 아실-ACP 티오에스테라제 발현의 성공적인 결과는 예상치 못한 것이다.

본 발명의 미생물 및 방법과 함께 사용하기에 적합한 지방 아실-CoA/알데하이드 리덕타제는 제한없이 표 4에 열거된 것들을 포함한다.

본 발명의 미생물 및 방법과 함께 사용하기에 적합한 지방 아실-CoA 리덕타제는 제한 없이 표 5에 기재된 것들을 포함한다.

본 발명의 미생물 및 방법과 함께 사용하기에 적합한 지방 알데하이드 데카보닐라제는 제한 없이 표 6에 열거된 것들을 포함한다.

천연적으로 동시 발현된 지방 아실-ACP 티오에스테라제 및 아실 운반 단백질의 조합은 본 발명의 미생물 및 방법과 사용하기에 적합하다.

탄화수소 또는 지질 변형 효소의 추가의 예는 미국 특허 제6,610,527호; 제6,451,576호; 제6,429,014호; 제6,342,380호; 제6,265,639호; 제6,194,185호; 제6,114,160호; 제6,083,731호; 제6,043,072호; 제5,994,114호; 제5,891,697호; 제5,871,988호; 제6,265,639호중 어느 하나에 포함되거나 참조되거나, 함유되거나 참조된 핵산 서열에 의해 암호화된 아미노산 서열을 포함하고 추가로 GenBank 승인 번호 제AAO18435호; 제ZP_00513891호; 제Q38710호; 제AAK60613호; 제AAK60610호; 제AAK60611호; 제NP_113747호; 제CAB75874호; 제AAK60612호; 제AAF20201호; 제BAAl 1024호; 제AF205791호; 및 제CAA03710호에 기재되어 있다.

본 발명의 미생물 및 방법과 사용하기에 적합한 다른 효소는 표 3 내지 6에 열거된 단백질중 하나와 70% 이상의 아미노산 동일성을 갖고 상응하는 목적하는 효소 활성(예를 들어, 아실 운반 단백질로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알콜로의 환원 또는 알데하이드의 알칸으로의 전환)을 나타내는 것들을 포함한다. 추가의 양태에서, 효소적 활성은 상기된 서열중 하나와 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 99% 이상의 동일성을 갖는 서열중에 존재하고 이 모두는 완전하게 제시된 것처럼 본원에 참조로서 인용된다.

발현되는 외인성 유전자의 목적하는 조합을 선택함에 의해, 수성 바이오매쓰로부터 추출될 수 있는 미생물에 의해 생산되는 생성물을 절단 개조할 수 있다. 예를 들어, 상기 미생물은 다음을 함유할 수 있다: (i) 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자; 및, 임의로, (ii) 천연적으로 동시 발현된 아실 운반 단백질 또는 지방 아실-ACP 티오에스테라제(또는 역으로)에 대해 친화성을 또한 갖는 아실 운반 단백질; 및, 임의로, (iii) 지방 아실-CoA/알데하이드 리덕타제 또는 지방 아실-CoA 리덕타제를 암호화하는 외인성 유전자; 및, 임의로, (iv) 지방 알데하이드 리덕타제 또는 지방 알데하이드 데카보닐라제를 암호화하는 외인성 유전자. 본원에 기재된 배양 조건하의 미생물은 ACP에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스테라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 효소적 가공을 통해 지방 아실-CoA 분자를 생산한다. 존재하는 경우, 지방 아실-CoA/알데하이드 리덕타제는 아실-CoA의 알콜로의 환원을 촉매한다. 유사하게, 존재하는 경우 지방 아실-CoA 리덕타제는 아실-CoA의 알데하이드로의 환원을 촉매한다. 지방 아실-CoA 리덕타제를 암호화하는 외인성 유전자가 존재하고 알데하이드 생성물을 생산하기 위해 발현되는 상기 양태에서, 제3 외인성 유전자에 의해 암호화된 지방 알데하이드 리덕타제는 알데하이드의 알콜로의 환원을 촉매한다. 유사하게, 지방 알데하이드 데카보닐라제는 존재하는 경우 알데하이드의 알칸 또는 알켄으로의 전환을 촉매한다.

상기 효소를 암호화하는 유전자는 클로렐라 프로토테코이데스(Chlorella protothecoides)와 같이 상당한 지질 생산을 나타내는 것으로 이미 공지된 세포로부터 수득될 수 있다. 지질 생산에 역할을 하는 것으로 이미 공지된 유전자, 예를 들어, 이중 결합을 포화시키는 효소를 암호화하는 유전자를 개별적으로 수용 세포에 형질전환시킬 수 있다. 그러나, 본 발명을 실시하기 위해 어느 유전자가 요구되는지에 관해 우선적으로 추측할 필요는 없다. 미세조류내 지질 생산을 변형(개선)시킬 수 있는 유전자를 동정하는 방법은 PCT 공개 번호 제2008/151149호에 기재되어 있다.

따라서, 본 발명은 동일 종의 야생형 세포에 비해 변화된 수준에서 지질 경로 효소를 발현하도록 유전자 조작된 프로토테카 세포를 제공한다. 몇몇 경우에, 상기 세포는 2개 세포가 동일한 조건하에서 성장하는 경우 야생형 세포에 비해 보다 많은 세포를 생산한다. 몇몇 경우에, 상기 세포는 야생형 세포 보다 높은 수준에서 지질 경로 효소를 발현하도록 유전자 조작되고/되거나 선택되었다. 몇몇 경우에, 지질 경로 효소는 피루베이트 데하이드로게나제, 아세틸-CoA 카복실라제, 아실 운반 단백질 및 글리세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 그룹으로부터 선택된다. 몇몇 경우에, 상기 세포는 야생형 세포 보다 낮은 수준에서 지질 경로 효소를 발현하도록 유전자 조작되고/되거나 선택된다. 세포가 보다 낮은 수준에서 지질 경로 효소를 발현하는 하나 이상의 양태에서, 지질 경로 효소는 시트레이트 신타제를 포함한다.

몇몇 양태에서, 상기 세포는 야생형 세포와 비교하여 변화된 수준에서 지방산 합성의 범용 조절제를 발현하도록 유전자 조작되고/되거나 선택됨으로써 다수의 지방산 합성 유전자의 발현 수준은 야생형 세포와 비교하여 변화된다. 몇몇 경우에, 지질 경로 효소는 지방산을 변형시키는 효소를 포함한다. 몇몇 경우에, 지질 경로 효소는 스테아로일-ACP 데사투라제 및 글리세로지질 데사투라제로부터 선택된다.

다른 양태에서, 본 발명은 하나 이상의 외인성 유전자를 함유하는 오일 생산 미생물에 관한 것이고 여기서, 외인성 유전자는 지방 아실-ACP 티오에스테라제, 지방 아실-CoA 리덕타제, 지방 알데하이드 리덕타제, 지방 아실-CoA/알데하이드 리덕타제, 지방 알데하이드 데카보닐라제 및 아실 운반 단백질로 이루어진 그룹으로부터 선택된 단백질(들)을 암호화한다. 하나의 양태에서, 외인성 유전자는 자극에 응답하여 유도성이거나 억제성인 프로모터에 작동가능하게 연결되어 있다. 몇몇 경우에, 상기 자극은 외부적으로 제공되는 작은 분자, 열, 냉 및 배양 배지에서 제한되거나 부재인 질소로 이루어진 그룹으로부터 선택된다. 몇몇 경우에, 외인성 유전자는 세포 구획에서 발현된다. 몇몇 양태에서, 세포 구획은 엽록체, 플라스티드 및 미토콘드리아로 이루어진 그룹으로부터 선택된다. 몇몇 양태에서 미생물은 프로토테카 모리포르미스, 프로토테카 크루가니, 프로토테카 스타그노라 또는 프로토테카 조프피이다.

하나의 양태에서, 외인성 유전자는 지방산 아실-ACP 티오에스테라제를 암호화한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 티오에스테라제는 아실 운반 단백질(ACP)로부터 8 내지 18개의 탄소 지방산의 절단을 촉매한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 10 내지 14개 탄소 지방산의 절단을 촉매한다. 하나의 양태에서, 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 12 탄소 지방산의 절단을 촉매한다.

하나의 양태에서, 외인성 유전자는 지방 아실-CoA/알데하이드 리덕타제를 암호화한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 리덕타제는 8 내지 18개의 탄소 지방 아실-CoA의 상응하는 1급 알콜로의 환원을 촉매한다. 몇몇 경우에, 외인성 유전자에 의해 암호화된 리덕타제는 10 내지 14개의 탄소 지방 아실-CoA의 상응하는 1급 알콜로의 환원을 촉매한다. 하나의 양태에서, 외인성 유전자에 의해 암호화된 리덕타제는 12-탄소 지방 아실-CoA의 도데칸올로의 환원을 촉매한다.

본 발명은 또한 2개의 외인성 유전자를 함유하는 재조합 프로토테카 세포를 제공하고 여기서, 제1 외인성 유전자는 지방 아실-ACP 티오에스테라제를 암호화하고 제2 외인성 유전자는 지방 아실-CoA 리덕타제, 지방 아실-CoA/알데하이드 리덕타제, 및 아실 운반 단백질로 이루어진 그룹으로부터 선택되는 단백질을 암호화한다. 몇몇 경우에, 2개의 외인성 유전자는 각각 자극에 응답하여 유도성인 프로모터와 작동가능하게 연결되어 있다. 몇몇 경우에, 각각의 프로모터는 배양 배지내 제한된 질소 또는 질소 부재와 같은 동일한 자극에 응답하여 유도성이다. 배양 배지에서 질소의 제한 또는 완전한 부재는 프로토테카 종과 같은 몇몇 미생물에서 오일 생산을 자극하고 높은 수준으로 오일 생산을 유도하기 위한 유발제로서 사용될 수 있다. 본원에 기재된 유전자 조작 방법과 조합하여 사용되는 경우, 무수 세포 중량의 %로서 지질은 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상 및 75% 이상과 같은 높은 수준으로 상승될 수 있고; 본원에 기재된 방법은 상기 수준의 지질을 갖는 세포에 대해 제공하고, 여기서 지질은 4% 이상의 C8-C14, 0.3% 이상의 C8, 2% 이상의 C10, 2% 이상의 C12, 및 2% 이상의 C14이다. 몇몇 양태에서, 상기 세포는 무수 세포 중량을 기준으로 25% 초과의 지질이고 10% 이상의 C8-C14, 20% 이상의 C8-C14, 30% 이상의 C8-C14, 10-30%의 C8-C14 및 20-30%의 C8-C14인 지질을 함유한다.

본원에 기재된 신규 오일은 mic-쇄 지방산(예를 들어, 팜유, 팜 커넬 오일 및 코코넛 오일)의 함량이 높은 다른 천연적으로 존재하는 오일과는 구분된다. 예를 들어, 카로테노이드와 같은 오염물 수준은 본 발명의 오일에서 보다 팜유 및 팜 커넬 오일에서 보다 높다. 특히 팜유 및 팜 커넬 오일은 본 발명의 오일에서 보다 보다 높은 양으로 알파 및 베타 카로틴 및 리코펜을 함유한다. 추가로, 20개 초과의 상이한 카로테노이드가 팜유 및 팜 커넬 오일에서 발견된 반면 실시예는 본 발명의 오일이 매우 소수의 카로테노이드 종을 매우 낮은 수준으로 함유함을 입증한다. 추가로, 토코트리에놀과 같은 비타민 E 화합물의 수준은 본 발명의 오일에서 보다 팜유, 팜 커넬 및 코코넛유에서 훨씬 높다.

하나의 양태에서, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 8 내지 18-탄소 지방산의 절단을 촉매한다. 몇몇 양태에서, 제2 외인성 유전자는 8 내지 18-탄소 지방 아실-CoA의 상응하는 1급 알콜로의 환원을 촉매하는 지방 아실-CoA/알데하이드 리덕타제를 암호화한다. 몇몇 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 10 내지 14-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 리덕타제는 10 내지 14-탄소 지방 아실-CoA의 상응하는 1급 알콜로의 환원을 촉매하고 여기서, 티오에스테라제 및 리덕타제는 동일한 탄소 쇄 길이상에 작용한다. 하나의 양태에서, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 12-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 리덕타제는 12-탄소 지방 아실-CoA의 도데칸올로의 환원을 촉매한다. 몇몇 양태에서, 제2 외이넝 유전자는 8 내지 18-탄소 지방 아실-CoA의 상응하는 알데하이드로의 환원을 촉매하는 지방 아실-CoA 리덕타제를 암호화한다. 몇몇 양태에서, 제2 외인성 유전자는 천연적으로 지방 아실-ACP 티오에스테라제와 함께 동시 발현되는 아실 운반 단백질을 암호화한다.

몇몇 양태에서, 제2 외인성 유전자는 지방 아실-CoA 리덕타제를 암호화하고 상기 미생물은 추가로 지방 알데하이드 데카보닐라제를 암호화하는 제3 외인성 유전자를 함유한다. 몇몇 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스테라제는 ACP로부터 8 내지 18-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 리덕타제는 8 내지 18-탄소 지방 아실-CoA의 상응하는 지방 알데하이드로의 환원을 촉매하고 제3 외인성 유전자에 의해 암호화된 데카보닐라제는 8 내지 18-탄소 지방 아실-CoA의 상응하는 지방 알데하이드의 상응하는 알칸으로의 전환을 촉매하고, 여기서, 티오에스테라제, 리덕타제 및 데카보닐라제는 동일한 탄소 쇄 길이에 대해서 작용한다.

몇몇 양태에서, 제2 외인성 유전자는 아실 운반 단백질을 암호화하고 상기 미생물은 지방 아실-CoA 리덕타제 및 지방 아실-CoA/알데하이드 리덕타제로 이루어진 그룹으로부터 선택된 단백질을 암호화하는 제3 외인성 유전자를 함유한다. 몇몇 경우에 제3 외인성 유전자는 지방 아실-CoA 리덕타제를 암호화하고 상기 미생물은 지방 알데하이드 데카보닐라제를 암호화하는 제4 외인성 유전자를 추가로 함유한다.

본 발명은 또한 배양 배지에서 재조합 프로토테카 세포의 집단을 배양함을 포함하는 알콜을 생산하는 방법을 제공하고, 여기서, 상기 세포는 (i) 지방 아실-ACP 티오에스테라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA/알데하이드 리덕타제를 암호화하는 제2 외인성 유전자를 함유하고 상기 세포는 아실 운반 단백질(ACP)에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스테라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 가공을 통해 지방 아실-CoA를 생산하고 지방 아실-CoA/알데하이드 리덕타제는 아실-CoA의 알콜로의 환원을 촉매한다.

본 발명은 또한 프로토테카 세포에서 지질 분자를 생산하는 방법을 제공한다. 하나의 양태에서, 상기 방법은 배양 배지에서 프로토테카 세포 집단을 배양함을 포함하고, 상기 세포는 (i) 지방 아실-ACP 티오에스테라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA 리덕타제를 암호화하는 제2 외인성 유전자를 함유하고 상기 미생물은 아실 운반 단백질(ACP)에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스테라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 가공을 통해 지방 아실-CoA를 생산하고 지방 아실-CoA 리덕타제는 아실-CoA의 알데하이드로의 환원을 촉매한다.

본 발명은 또한 프로토테카 세포에서 특정된 탄소 쇄 길이를 갖는 지방산 분자를 생산하는 방법을 제공한다. 하나의 양태에서, 상기 방법은 배양 배지에서 지질 생산 프로토테카 세포 집단을 배양함을 포함하고 여기서 상기 미생물은 8, 10, 12 또는 14개 탄소 원자와 같은 특정 탄소 쇄 길이에 특이적이거나 우선적인 활성을 갖는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 함유하고, 상기 미생물은 아실 운반 단백질(ACP)에 연결된 지방 산을 합성하고 상기 티오에스테라제는 지방산이 특정 탄소 쇄 길이로 합성되는 경우 ACP로부터 지방산의 절단을 촉매한다.

상기된 다양한 양태에서, 상기 프로토테카 세포는 지질 경로 효소를 암호화하는 하나 이상의 외인성 유전자를 함유할 수 있다. 몇몇 경우에, 지질 경로 효소는 스테아로일-ACP 데사투라제, 글리세로지질 데사투라제, 피루베이트 데하이드로게나제, 아세틸-CoA 카복실라제, 아실 운반 단백질 및 글리세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 그룹으로부터 선택된다. 다른 경우에, 프로토테카 세포는 지방 아실-ACP 티오에스테라제, 지방 아실-CoA/알데하이드 리덕타제, 지방 아실-CoA 리덕타제, 지방 알데하이드 리덕타제, 지방 알데하이드 데카보닐라제 및/또는 아실 운반 단백질로 이루어진 그룹으로부터 선택되는 지질 변형 효소를 함유한다.

VI. 연료 및 화학물질 생산

본 발명의 방법에 따른 연료의 생산을 위해, 본 발명의 세포에 의해 생산된 지질을 수거하거나 다르게는 임의의 편리한 수단에 의해 수거한다. 지질은 전체 세포 추출에 의해 분리될 수 있다. 상기 세포를 우선 파쇄시키고 이어서 세포내 및 세포막/세포벽 연합 지질 및 세포외 탄화수소를 예를 들어, 상기된 바와 같은 원심분리를 사용하여 세포 매쓰로부터 분리할 수 있다. 미생물내에서 생성된 세포내 지질은 몇몇 양태에서 미생물의 세포를 용해시킨 후 추출된다. 일단 추출된 후 지질을 추가로 정련하여 오일, 연료 또는 유성화학물질을 생성한다.

배양을 완료 한 후, 미생물을 발효 브로쓰로부터 분리할 수 있다. 임의로, 상기 분리는 원심분리로 수행하여 농축된 페이스트를 생성한다. 원심분리는 미생물로부터 상당양의 세포내 물을 제거하지 못하고 건조 단계가 아니다. 이어서 상기 바이오매쓰는 임의로 세척액(예를 들어, 탈이온수)로 세척하여 발효 브로쓰 및 잔해를 제거할 수 있다. 임의로 세척된 미생물 바이오매쓰는 또한 세포 분쇄 전에 건조(오븐 건조, 동결 건조 등)시킬 수 있다. 또한, 세포는 발효가 완료된 경우 발효 브로쓰의 일부 또는 전부로부터 분리 없이 용해시킬 수 있다. 예를 들어, 상기 세포는 세포가 용해된 경우 세포외 액체에 대한 세포의 비율이 1:1(v:v) 미만일 수 있다.

액체를 함유하는 미생물은 용해시켜 용해물을 생성시킬 수 있다. 본원에 상세하게 기재된 바와 같이 미생물 용해시키는 단계(또한 세포 용해로서 언급됨)는 열-유도된 용해, 염기의 첨가, 산의 첨가, 프로테아제와 같은 효소 및 아밀라제와 같은 폴리사카라이드 분해 효소의 사용, 초음파, 기계적 용해의 사용, 삼투압 쇼크의 사용, 용해성 바이러스에 의한 감염 및/또는 하나 이상의 용해성 유전자의 발현을 포함하는 임의의 간편한 수단에 의해 성취될 수 있다. 용해를 수행하여 미생물에 의해 생성된 세포내 분자를 방출시킨다. 미생물을 용해시키기 위한 이들 방법 각각은 단일 방법으로 또는 동시에 또는 연속적으로 조합하여 사용할 수 있다. 세포 파쇄 정도는 현미경 분석에 의해 관찰할 수 있다. 본원에 기재된 방법중 하나 이상을 사용하여, 전형적으로 70% 초과의 세포 파괴가 관찰된다. 바람직하게, 세포 파괴는 80% 초과, 보다 바람직하게는 90% 초과 및 가장 바람직하게는 약 100%이다.

특정 양태에서, 미생물은 예를 들어, 추출 또는 추가의 가공을 위해 세포 지질 및/또는 탄화수소의 노출을 증가시키기 위해 성장 후 용해시킨다. 리파제 발현 및 세포 용해의 타이밍(예를 들어, 유도성 프로모터를 통한)은 지질 및/또는 탄화수소의 수율을 최적화하기 위해 조정할 수 있다. 다수의 용해 기술은 하기에 기재한다. 이들 기술은 개별적으로 또는 조합하여 사용할 수 있다.

본 발명의 하나의 양태에서, 미생물을 용해시키는 단계는 미생물을 함유하는 세포 현탁액의 가열을 포함한다. 이러한 양태에서, 미생물을 함유하는 발효 브로쓰(또는 발효 브로쓰로부터 분리된 미생물 현탁액)는 미생물, 즉 미생물의 세포벽 및 막이 분해하거나 파괴될때까지 가열한다. 전형적으로, 적용되는 온도는 5O℃ 이상이다. 보다 효율적인 세포 용해를 위해, 보다 고온, 예를 들어, 30℃ 이상, 6O℃ 이상, 70℃ 이상, 80℃ 이상, 9O℃ 이상, 100℃ 이상, 11O℃ 이상, 12O℃ 이상, 13O℃ 이상을 사용한다. 가열 처리에 의한 세포 용해는 미생물을 비등시킴에 의해 수행할 수 있다. 또는, 열 처리(비등 없이)는 오토클레이브에서 수행할 수 있다. 열 처리된 용해물은 추가의 처리를 위해 냉각시킬 수 있다. 세포 파쇄는 또한 증기 처리, 즉 가압된 증기의 부가를 통해 수행할 수 있다. 세포 파쇄를 위한 미세조류의 증기 처리는 예를 들어, 문헌[참조: 미국 특허 제6,750,048호]에 기재되어 있다. 몇몇 양태에서, 증기 처리는 발효기로 증기를 살포하고 브로쓰를 약 90분 미만, 바람직하게는 약 60분 미만 및 보다 바람직하게는 약 30분 미만 동안 목적하는 온도에 유지시킴에 의해 성취할 수 있다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 염기를, 미생물을 함유하는 세포 현탁액에 첨가함을 포함한다. 상기 염기는 사용되는 미생물의 단백질성 화합물의 적어도 일부를 가수분해하기에 충분히 강해야만 한다. 단백질을 가용화시키기 위해 유용한 염기는 화학 기술 분야에 공지되어 있다. 본 발명의 방법에 유용한 예시적인 염기는 리튬, 나트륨, 칼륨, 칼슘의 수산화물, 카보네이트 및 바이카보네이트 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다. 바람직한 염기는 KOH이다. 세포 파쇄를 위한 미세조류의 염기 처리는 예를 들어, 미국 특허 제6,750,048호에 기재되어 있다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 산을, 미생물을 함유하는 세포 현탁액에 첨가함을 포함한다. 산 용해는 10-500 mN 또는 바람직하게 40-160 nM의 농도로 산을 사용하여 수행할 수 있다. 산 용해는 바람직하게 실온 이상(예를 들어, 40 내지 160℃, 및 바람직하게 50 내지 130℃)에서 수행한다. 적당한 온도(예를 들어, 실온 내지 100℃ 및 특히 실온 내지 65℃)에 대해서, 산 처리는 통상적으로 초음파 처리 또는 다른 세포 파쇄 방법과 조합할 수 있다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단게는 효소를 사용함에 의해 미생물을 용해시킴을 포함한다. 미생물을 용해시키기 위해 바람직한 효소는 프로테아제 및 폴리사카라이드-분해 효소, 예를 들어, 헤미셀룰라제(예를 들어, 아스퍼질러스 나이거(Aspergillus niger); Sigma Aldrich, St. Louis, MO; #H2125), 펙티나제(예를 들어, 리조푸스 종 기원의 펙티나제; Sigma Aldrich, St. Louis, MO; #P2401), 만나웨이(Mannaway) 4.0 L (노보자임(Novozymes)), 셀룰라제(예를 들어, 트리코더마 비리드 기원의 셀룰라제; Sigma Aldrich, St. Louis, MO; #C9422), 및 드리셀라제 (예를 들어, 바시디오마이세테스 종 기원의 드리셀라제; Sigma Aldrich, St. Louis, MO; #D9515)이다.

본 발명의 또 다른 양태에서, 용해는 예를 들어, 임의로 클로렐라 또는 클로렐라 바이러스 기원의 폴리사카라이드 분해 효소와 같은 셀룰라제 또는 스트렙토마이세스 그리세우스(Streptomyces griseus) 프로테아제, 키모트립신, 프로테이나제 K, 문헌[참조: proteases listed in Degradation of Polylactide by Commercial Proteases, Oda Yet al., Journal of Polymers and the Environment, Volume 8, Number 1, January 2000 , pp. 29-32(4)]에 기재된 프로테아제, 알칼라제 2.4 FG (노보자임), 및 플라보우르짐 100 L (노보자임)과 같은 프로테아제와 같은 효소를 사용하여 성취한다. 프로테아제 및 폴리사카라이드-분해 효소의 임의의 조합은 또한 이전의 프로테아제 및 폴리사카라이드 분해 효소의 임의의 조합을 포함하여 사용할 수 있다.

또 다른 양태에서, 용해는 익스펠러 프레스를 사용하여 수행할 수 있다. 상기 공정에서, 바이오매쓰는 고압에서 스크류형 장치를 통해 강제 주입하고 세포를 용해시키고 세포내 지질이 방출되고 세포내 단백질 및 섬유(및 기타 성분)로부터 분리되도록 한다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 초음파, 즉, 초음파 처리를 사용하여 수행한다. 따라서, 세포는 또한 고주파 음파로 용해시킬 수 있다. 상기 음파는 전기적으로 생성될 수 있고 금속 팁을 통해 적당히 농축된 세포 현탁액으로 운반된다. 상기 초음파 처리(또는 초음파 처리(ultrasonication))는 세포 현탁액중 공극의 형성을 기준으로 세포 통합성을 붕괴시킨다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 기계적 용해에 의해 수행한다. 세포는 기계적으로 용해시키고 파쇄하여 탄화수소 (예를 들어, 지질) 수집을 촉진시킬 수 있다. 예를 들어, 압력 분쇄기를 사용하여 세포 함유 슬러리를 제한된 오리피스 밸브를 통과하도록 펌핑시킬 수 있다. 고압( 1500 바 이하)을 적용함에 이어서 출구 노출을 통해 즉시 확장시킨다. 세포 분쇄는 3개의 상기한 기작에 의해 성취한다: 밸브상에 충돌, 오리피스내 액체 고전단, 및 방출시 급작스런 압력 강하로 세포 분해의 유도. 상기 방법은 세포내 분자를 방출시킨다. 또는, 볼 밀을 사용할 수 있다. 볼 밀에서, 세포는 비드와 같은 작은 연마 입자와 함께 현탁 상태로 진탕시킨다. 전단력 때문에 세포는 분해되고 비드 사이에서 분쇄되며 비드와 충돌한다. 상기 비드는 세포를 파쇄하여 세포 내용물을 방출시킨다. 세포는 예를 들어, 블렌딩의 사용과 함께(예를 들어, 고속 또는 와링 블렌더(Waring blender)), 프레치 프레스 또는 심지어 약한 세포 벽의 경우에 세포 파쇄를 위한 원심분리의 사용과 같은 전단력에 의해 파쇄될 수 있다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 삼투압 쇼크를 적용함에 의해 수행한다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 용해성 바이러스로 미생물을 감염시킴을 포함한다. 광범위한 바이러스는 본 발명에 사용하기 위해 적합한 미생물을 용해시키는 것으로 공지되어 있고 특정 미생물에 대한 특정 용해성 바이러스의 선택 및 용도는 당업계의 기술 범위내에 있다. 예를 들어, 파라메시움 부르사리아 클로렐라 바이러스(Paramecium bursaria chlorella virus)(PBCV-l)는 특정 단일 세포 진핵 클로렐라형 녹색 조류내에서 복제하고 이를 용해시키는 대형의 20면체 플라크 형성 이중가닥의 DNA 바이러스의 원형이다(필코드나비리대( Phycodnaviridae) 계열, 클로로바이러스(Chlorovirus) 속). 따라서, 임의의 민감성 미세조류는 적합한 클로렐라 바이러스로 배양물을 감염시킴에 의해 용해시킬 수 있다. 클로렐라 바이러스로 클로렐라 종을 감염시키는 방법은 공지되어 있다. 예를 들어, 문헌[참조: Adv. Virus Res. 2006;66:293-336; Virology, 1999 Apr 25;257(1): 15-23; Virology, 2004 Jan 5;318(l):214-23; Nucleic Acids Symp. Ser. 2000;(44): 161-2; J. Virol. 2006 Mar;80(5):2437-44; and Annu. Rev. Microbiol. 1999;53:447-94]을 참조한다.

본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 자가용해를 포함한다. 상기 양태에서, 본 발명에 따른 미생물은 미생물을 용해시키는 용해성 단백질을 생성하도록 유전자 조작한다. 상기 용해성 유전자는 유도성 프로모터를 사용하여 발현시켜 세포가 처음에 발효기내에서 목적하는 밀도로 성장한 후 프로모터를 유도하여 용해성 유전자를 발현시키므로써 세포를 용해시킬 수 있다. 하나의 양태에서, 상기 용해성 유전자는 폴리사카라이드-분해 효소를 암호화한다. 특정 다른 양태에서, 상기 용해성 유전자는 용해성 바이러스 기원의 유전자이다. 따라서, 예를 들어, 클로렐라 바이러스 기원의 용해성 유전자는 조류 세포에서 발현시킬 수 있고 문헌[참조: Virology 260, 308-315 (1999); FEMS Microbiology Letters 180 (1999) 45-53; Virology 263, 376-387 (1999); and Virology 230, 361-368 (1997)]을 참조한다. 용해성 유전자의 발현은 바람직하게 유도성 프로모터, 예를 들어, 소분자, 광, 열과 같은 자극 및 다른 자극의 존재하에 유도되는 미세조류에서 활성인 프로모터를 사용하여 수행한다.

상기 방법에 의해 생성된 세포 용해물로부터 지질을 분리하기 위한 다양한 방법이 유용하다. 예를 들어, 지방 알데하이드, 지방 알콜 및 탄화수소(예를 들어, 알칸)와 같은 지질 및 지질 유도체는 헥산과 같은 소수성 용매로 추출할 수 있다(문헌참조: Frenz et al. 1989, Enzyme Microb. Technol., 11:717). 지질 및 지질 유도체는 또한 액화(문헌참조: Sawayama et al. 1999, Biomass and Bioenergy 17:33-39 and Inoue et al. 1993, Biomass Bioenergy 6(4):269-274); 오일 액화(문헌참조: 예를 들어, Minowa et al. 1995, Fuel 74(12): 1735-1738); 및 초임계 CO₂ 추출(문헌참조: 예를 들어, Mendes et al. 2003, Inorganica Chimica Acta 356:328-334)를 사용하여 추출할 수 있다. 미아오(Miao) 및 우(Wu)는 클로렐라 프로토테오코이데스의 배양으로부터 미세조류 지질 회수의 프로토콜을 기재하고 있고 여기서, 상기 세포는 원심분리에 의해 수거되고 증류수로 세척되며 동결 건조에 의해 건조시킨다. 수득한 세포 분말을 모르타르에서 분쇄하고 이어서 n-헥산으로 추출한다[문헌참조: Miao and Wu, Biosource Technology (2006) 97:841-846].

따라서, 본 발명의 미생물에 의해 생성된 지질, 지질 유도체 및 탄화수소는 유기 용매로 추출하여 회수할 수 있다. 몇몇 경우에, 바람직한 유기 용매는 헥산이다. 전형적으로, 유기 용매는 용해 성분의 사전 분리 없이 용해물에 직접 첨가한다. 하나의 양태에서, 상기된 하나 이상의 방법에 의해 생성된 용해물은 지질 및/또는 탄화수소 성분이 유기 용매와 용액을 형성하도록하기에 충분한 시간 동안 유기 용매와 접촉시킨다. 몇몇 경우에, 상기 용액을 이어서 추가로 정련하여 특정 목적하는 지질 또는 탄화수소 성분을 회수한다. 헥산 추출 방법은 당업계에 널리 공지되어 있다.

본원에 기재된 세포에 의해 생성된 지방 알데하이드, 지방 알콜 및 탄화수소(예를 들어, 알칸)과 같은 지질 및 지질 유도체는 상기된 바와 같은 리파제를 포함하는 하나 이상의 효소를 사용함에 의해 변형시킬 수 있다. 탄화수소가 세포의 세포외 환경에 존재하는 경우, 하나 이상의 효소는, 효소가 탄화수소를 변형시키거나 탄화수소 전구체로부터 이의 합성을 완성하도록 하는 조건하에서 상기 환경에 첨가할 수 있다. 또는, 상기 탄화수소는 효소와 같은 하나 이상의 촉매의 첨가 전에 세포 물질로부터 부분적으로 또는 완전하게 분리될 수 있다. 상기 촉매는 외인성으로 첨가되고 이들의 활성은 세포 외부에서 또는 시험관내에서 발생한다.

따라서, 본원에 기재된 바와 같이 생체내 세포에 의해 생성되거나 시험관내에서 효소적으로 변형된 지질 및 탄화수소는 임의로 통상적인 수단에 의해 추가로 가공될 수 있다. 상기 가공은 탄화수소의 크기를 감소시키고 이어서 이의 수소화 비율을 증가시키기 위한 "크랙킹(cracking)"을 포함할 수 있다. 촉매 및 열 크랙킹방법은 통상적으로 탄화수소 및 트리글리세라이드 오일 가공에 사용한다. 촉매 방법은 고체 산 촉매와 같은 촉매의 사용을 포함한다. 상기 촉매는 실리카-알루미나 또는 제올라이트일 수 있고 이로써 탄소-탄소 결합을 이종용해 또는 비대칭 분해시켜 카보양이온(carbocation) 및 수소화물 음이온을 수득할 수 있다. 이들 반응성 중간체를 이어서 또 다른 탄화수소와 함께 재배열하거나 수소화 전달을 진행시킨다. 상기 반응은 따라서 중간체를 재생성시켜 자가-증폭 쇄 기작을 유도할 수 있다. 또한 탄화수소는 여기서의 탄소-탄소 이중 또는 삼중 결합의 수가 임의로 제로까지 감소하도록 가공할 수 있다. 또한 탄화수소를 가공하여 여기서의 환 또는 사이클릭 구조를 제거할 수 있다. 탄화수소를 또한 가공하여 수소화 비율을 증가시킬 수 있다. 이것은 수소의 첨가("수소화") 및/또는 탄화수소의 보다 작은 탄화수소로의 "크랙킹"을 포함할 수 있다.

열 방법은 탄화수소 크기를 감소시키기 위한 상승된 온도 및 압력의 용도를 포함한다. 약 800℃의 승온 및 약 700kPa의 압력을 사용할 수 있다. 이들 조건은 때때로 수소 풍부 탄화수소 분자(양성자 플럭스와는 구분되는 바와 같이)를 언급하는데 사용되는 용어 '가벼운 탄화수소 분자'를 생성하고 또한 응축에 의해 상대적으로 수소가 고갈된 보다 무거운 탄화수소 분자를 생성한다. 상기 방법은 등방성 또는 대칭적 절단을 제공하고 상기된 바와 같이 임의로 효소적으로 포화될 수 있는 알켄을 생성한다.

촉매 및 열 방법은 탄화수소 가공 및 오일 정련을 위한 식물에서의 표준 방법이다. 따라서, 본원에 기재된 바와 같은 세포에 의해 생성된 탄화수소가 수거될 수 있고 통상적인 수단에 의해 가공되거나 정련될 수 있다. 미세조류 생산 탄화수소의 수소크랙킹에 대한 보고에 대해 문헌[Hillen et al. (Biotechnology and Bioengineering, Vol. XXIV: 193-205 (1982))]을 참조한다. 또 다른 양태에서, 상기 분획물은 또 다른 촉매, 예를 들어, 유기 화합물, 열 및/또는 무기 화합물로 처리한다. 지질의 바이오디젤로의 가공을 위해, 트랜스에스테르화 공정이 본원의 섹션 IV에 기재된 바와 같이 사용된다.

본 발명의 방법을 통해 생성되는 탄화수소는 다양한 산업 응용 분야에서 유용하다. 예를 들어, 거의 모든 유형의 세제 및 세정제에서 사용되는 음이온 게면활성제인 직쇄 알킬벤젠 설포네이트(LAS)의 생산은 일반적으로 10 내지 14개의 탄소원자 쇄를 포함하는 탄화수소를 사용한다. 예를 들어, 문헌[미국 특허 번호: 제6,946,430호; 제5,506,201호; 제6,692,730호; 제6,268,517호; 제6,020,509호; 제6,140,302호; 제5,080,848호; 및 제5,567,359호]를 참조한다. LAS와 같은 계면활성제는 퍼스널 케어 조성물 및 세제[예를 들어, 미국 특허 제5,942,479호; 제6,086,903호; 제5,833,999호; 제6,468,955호; 및 제6,407,044호에 기재된 것들]의 제조에 사용할 수 있다.

관심이 고조되고 있는 것은 화석 연료로부터 유래된 출발 물질을 대체할 수 있는 재생가능한 생물학적 출발 물질이 가용하고 이의 사용이 바람직할 수 있기 때문에 바이오디젤, 재생가능한 디젤 및 제트 연료와 같은 연료에서의 생물학적 기원의 탄화수소 성분의 용도에 대한 것이다. 생물학적 물질로부터 탄화수소 성분을 생산하기 위한 방법이 시급히 요구되고 있다. 본 발명은 바이오디젤, 재생가능한 디젤 및 제트 연료를 제조하기 위해 본원에 기재된 방법에 의해 생성된, 생물학적 재료로서의 지질을 사용하여, 바이오디젤, 재생가능한 디젤 및 제트 연료의 생산 방법을 제공하므로써 상기 필요성을 충족시킨다.

통상적인 디젤 연료는 파라핀 탄화수소가 풍부한 석유 증류물이다. 이들은 370° 내지 78O°F 정도로 넓은 비등 범위를 갖고 이는 디젤 엔진 승용차와 같은 압착 점화 엔진에서 연소용으로서 적합하다. 기관[The American Society of Testing and Materials (ASTM)]은 세탄수, 혼탁점, 플래쉬 포인트, 점도, 아닐린 포인트, 황 함량, 물 함량, 재 함량, 구리 스트립 부식 및 탄소 잔기와 같은 허용 가능한 범위의 다른 연료 성질과 함께 비등 범위에 따라 디젤 등급을 확립한다. 기술적으로, 적당한 ASTM 세부항목을 충족하는 바이오매쓰 또는 기타로부터 유래된 임의의 탄화수소 증류 재료는 디젤 연료(ASTM D975), 제트 연료(ASTM D1655), 또는 이것이 지방산 메틸 에스테르인 경우 바이오디젤(ASTM D6751)로서 정의될 수 있다.

추출 후, 본원에 기재된 미생물 바이오매쓰로부터 회수된 지질 및/또는 탄화수소 성분은 디젤 승용차 및 제트 엔진에 사용하기 위한 연료를 제조하기 위해 화학적 처리에 적용될 수 있다.

바이오디젤은 금색에서 암갈색으로 생산 공급원료에 따라 색상이 다양한 액체이다. 이것은 실제로 수불혼화성이고 고융점 및 저증기압을 갖는다. 바이오디젤은 디젤-엔진 승용차에 사용하기 위한 디젤-등가의 가공된 연료를 언급한다. 바이오디젤은 생분해성이고 비독성이다. 통상적인 디젤 연료에 비해 바이오디젤의 추가의 이득은 보다 낮은 엔진 마모이다. 전형적으로, 바이오디젤은 C14-C18 알킬 에스테르를 포함한다. 다양한 가공은 본원에 기재된 바와 같이 생성되고 분리된 바이오매쓰 또는 지질을 디젤 연료로 전환시킨다. 바이오디젤을 생산하기 위한 바람직한 방법은 본원에 기재된 바와 같이 지질의 트랜스에스테르화에 의한 것이다. 바이오디젤로서 사용하기 위한 바람직한 알킬 에스테르는 메틸 에스테르 또는 에틸 에스테르이다.

본원에 기재된 방법에 의해 생성된 바이오디젤은 대부분의 모뎀 디젤-엔진 승용차에서 임의의 농도로 단독으로 사용하거나 통상적인 디젤 연료와 블렌딩하여 사용될 수 있다. 통상적인 디젤 연료(석유 디젤)와 블렌딩되는 경우, 바이오디젤은 약 0.1% 내지 약 99.9%로 존재할 수 있다. 많은 국가에서는 임의의 연료 혼합물에서 바이오디젤의 양을 지칭하기 위해 "B" 인자로서 공지된 시스템을 사용한다. 예를 들어, 20% 바이오디젤을 함유하는 연료는 B20으로 표시된다. 순수한 바이오디젤은 BlOO으로 언급된다.

바이오디젤은 또한 가정용 및 상업용 보일러에서 가열 연료로서 사용될 수 있다. 기존의 오일 보일러는 고무 구성품을 함유할 수 있고 바이오디젤상에서의 운행을 위해서는 전환을 필요로 할 수 있다. 전환 과정은 일반적으로 비교적 단순하고 바이오디젤이 강한 용매임으로 고무 구성품의 합성 구성품으로의 교환을 포함한다. 이의 강한 용해력 때문에, 바이오디젤의 연소는 보일러의 효율을 증가시킨다. 바이오디젤은 수순한 울트라-로우 황 디젤(ULSD) 연료의 윤활성을 증가시키기 위해 디젤 제형중에 첨가제로서 사용될 수 있고, 이는 이것이 실제로 황을 내포하지 않기 때문에 유리하다. 바이오디젤은 석유디젤 보다 양호한 용매이고 이전에 석유디젤상에서 운행된 자동차 연료 라인중에 잔류 침적물을 분해시키는데 사용될 수 있다.

바이오디젤은 오일 풍부 바이오매쓰중에 함유된 트리글리세라이드의 트랜스에스테르화에 의해 생성될 수 있다. 따라서, 본 발명의 또 다른 측면에서, 바이오디젤을 생산하기 위한 방법이 제공된다. 바람직한 양태에서, 바이오디젤을 생산하는 방법은 (a) 본원에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성시키는 단계, (c) 용해된 미생물로부터 지질을 분리하는 단계 및 (d) 지질 조성물을 트랜스에스테르화하여 바이오디젤을 생성시키는 단계를 포함한다. 미생물의 성장 방법, 미생물을 용해시켜 용해물을 생성하는 방법, 유기 용매를 포함하는 배지에서 용해물을 처리하여 이종성 혼합물을 형성시키는 방법 및 처리된 용해물을 지질 조성물로 분리하는 방법은 상기되었고 또한 바이오디젤을 생산하는 방법에 사용될 수 있다.

바이오디젤의 지질 프로필은 일반적으로 공급원료 오일의 지질 프로필과 고도로 유사하다. 본 발명의 방법 및 조성물에 의해 제공된 다른 오일은 트랜스에스테르화시켜 바이오디젤을 생산할 수 있고 이때 지질 프로필은 (a) 4% 이상의 C8-C14; (b) 0.3% 이상의 C8; (c) 2% 이상의 C10; (d) 2% 이상의 C12; 및 (3) 30% 이상의 C8-C14를 포함한다.

지질 조성물은 트랜스에스테르화시켜 바이오디젤로서 유용한 장쇄의 지방산 에스테르를 생산할 수 있다. 바람직한 트랜스에스테르화 반응은 하기에 명시되고 염기 촉매된 트렌스에스테르화 및 재조합 리파제를 사용하는 트랜스에스테르화를 포함한다. 염기 촉매된 트랜스에스테르화 공정에서, 트리아실글리세라이드는 알칼린 촉매인, 전형적으로 수산화칼륨의 존재하에 메탄올 또는 에탄올과 같은 알콜과 반응시킨다. 상기 반응은 부산물로서 메틸 또는 에틸 에스테르 및 글리세린(글리세롤)을 형성한다.

동물 및 식물 오일은 전형적으로 트리하이드릭 알콜인 글리세롤과 유리된 지방산의 에스테르인 트리글리세라이드로 구성된다. 트랜스에스테르화에서, 트리글리세라이드(TAG)중의 글리세롤은 메탄올 또는 에탄올과 같은 단쇄 알콜로 대체한다. 전형적인 반응 계획은 다음과 같다:

상기 반응에서, 상기 알콜은 염기로 탈양성자화되어 보다 강한 친핵성이 된다. 통상적으로, 에탄올 또는 메탄올은 매우 과량(50배 이하)으로 사용된다. 정상적으로 상기 반응은 상당히 느리게 진행하거나 전혀 진행하지 않는다. 산 또는 염기 뿐만 아니라 열을 사용하여 반응의 보다 신속한 진행을 도와줄 수 있다. 산 또는 염기는 트랜스에스테르화에 의해 소비되지 않고 따라서 이들은 반응물이 아니고 촉매이다. 거의 모든 바이오디젤은 이것이 단지 저온 및 저압을 요구하고 98% 초과의 전환 수율을 나타내므로(단, 출발 오일은 수분 및 유리된 지방산이 낮아야 한다) 염기 촉매된 기술을 사용하여 생산될 수 있다.

트랜스에스테르화는 또한 염기 대신 리파제와 같은 효소를 사용하여 수행하였다. 리파제-촉매된 트랜스에스테르화는 예를 들어, 실온 내지 80℃의 온도 및 1:1 초과, 바람직하게는 약 3:1인 TAG 대 저급 알콜의 몰비에서 수행할 수 있다. 트랜스에스테르화에 사용하기에 적합한 리파제는 표 7에 기재된 것들을 포함하지만 이에 제한되지 않는다. 트랜스에스테르화를 위해 유용한 리파제의 다른 예는 예를 들어, 미국 특허 제4,798,793호; 제4,940,845호; 제5,156,963호; 제5,342,768호; 제5,776,741호 및 WO89/01032에서 찾을 수 있다. 상기 리파제는 리조푸스 (Rhizopus), 아스퍼질러스(Aspergillus), 캔디다(Candida), 뮤코(Mucor), 슈도모나스(Pseudomonas), 리조뮤코(Rhizomucor), 캔디다 및 휴미콜라(Humicola)에 의해 생성된 리파제 및 췌장 리파제를 포함하지만 이에 제한되지 않는다.

바이오디젤용으로 적합한 지방산 에스테르의 제조를 위해 리파제를 사용하는 문제는 리파제 가격이 강염기 공정에 의해 사용되는 수산화나트륨(NaOH)의 가격보다 훨씬 고가라는 것이다. 상기 문제점은 재활용될 수 있는 고정화된 리파제를 사용하므로써 해결되었다. 그러나, 고정화된 리파제의 활성은 리파제-기본 공정이 생산 단가의 측면에서 강염기 공정과 경쟁을 위해서는 최소의 사이클동안 재활용된 후 유지되어야만 한다. 고정화된 리파제는 트랜스에스테르화에 전형적으로 사용되는 저급 알콜에 의해 독성이 된다. 미국 특허 제6,398,707호(우 등에게 2002년 6월 4일자로 허여됨)는 고정화된 리파제의 활성을 증진시키는 방법 및 감소된 활성을 갖는 고정화된 리파제를 재생시키는 방법을 기재하고 있다. 몇몇 적합한 방법은 일정 기간의 시간, 바람직하게는 0.5 내지 48시간 및 보다 바람직하게는 0.5 내지 1.5시간 동안 3개 이상의 탄소 원자수를 갖는 알콜중에 고정화된 리파제를 침지시킴을 포함한다. 몇몇 적합한 방법은 또한 3개 이상의 탄소원자수를 갖는 알콜과 불활성화된 고정화된 리파제를 세척함에 이어서 식물성 오일중에 0.5 내지 48시간 동안 불활성화된 고정화된 리파제를 침지시킴을 포함한다.

특정 양태에서, 재조합 리파제는 리파제가 작용하는 지질을 생산하는 동일한 미생물내에서 발현된다. 적합한 재조합 리파제는 표 7에 상기 열거되고/되거나 표 7에 상기 열거된 GenBank 승인 번호를 갖는 것들, 또는 표 7에 상기 열거된 리파제중 하나와 70% 이상의 아미노산 동일성을 갖고 리파제 활성을 나타내는 폴리펩타이드를 포함한다. 추가의 양태에서, 효소 활성은 상기된 서열중 하나와 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 99% 이상 동일성을 갖는 서열중에 존재하고 상기 서열 모두는 완전히 제시된 바와 같이 참조로서 인용된다. 리파제 및 선택가능한 마커를 암호화하는 DNA는 바람직하게 코돈 최적화된 cDNA이다. 미세조류중에서 발현하기 위해 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다.

바이오디젤에 대한 통상의 국제 표준은 EN 14214이다. ASTM D6751은 미국 및 캐나다에서 참조되는 가장 공통된 바이오디젤 표준이다. 독일은 DIN EN 14214을 사용하고 UK는 BS EN 14214을 준수할 것으로 요구한다. 생성물이 이들 표준에 부합하는지의 여부를 결정하기 위한 기본 산업적 시험은 전형적으로 가스 크로마토그래피, HPLC 등을 포함한다. 품질 표준을 충족하는 바이오디젤은 매우 비독성이고 독성 등급(LD₅₀)은 50 mL/kg을 초과한다.

ASTM 표준을 충족하는 바이오디젤이 비독성이어야만 하지만 결정화하고/하거나 침전하고 용액으로부터 침강하는 경향이 있는 오염물이 있을 수 있다. 침강물 형성은 특히 바이오디젤이 보다 저온에서 사용되는 경우 문제이다. 침강 또는 침전은 연료 흐름을 감소시키고, 연료 라인을 막히게하고 여과기를 막히게하는 것과 같은 문제를 유발할 수 있다. 고품질의 생성물을 제조하기 위해 바이오디젤에서 상기 오염물 및 침강물을 제거하는 것과 관련된 공정들은 당업계에 널리 공지되어 있다. 상기 공정들의 예는 인지질 및 유리 지방산과 같은 오염물을 제거하기 위한 오일의 전처리(예를 들어, 정련, 부식성 정련 및 실리카 흡착 여과) 및 냉각 여과를 포함하지만 이에 제한되지 않는다. 냉각 여과는 생성 후 바이오디젤에 존재하는 임의의 미립자 및 침강물을 제거하기 위해 특별히 개발된 공정이다. 상기 공정은 바이오디젤을 냉각시키고 연료가 보다 저온에서 사용되는 경우 형성될 수 있는 임의의 침강물 또는 침전물을 여과 제거한다. 상기 공정은 당업계에 널리 공지되어 있고 미국 특허원 공개 번호 제2007-0175091호에 기재되어 있다. 적합한 방법은 바이오디젤을 약 38℃ 미만의 온도로 냉각시켜 불순물 및 오염물이 바이오디젤 액체중에서 미립자로서 침전하도록 함을 포함할 수 있다. 이어서 규조토 또는 다른 여과 재료를 냉각된 바이오디젤에 첨가하여 슬러리를 형성시킬 수 있고 이것은 이어서 압력 리프(pressure leaf) 또는 다른 유형의 여과기를 통해 여과하여 미립자를 제거할 수 있다. 이어서 여과된 바이오디젤은 가연성 여과기에 통과시켜 임의의 잔류 침강물 및 규조토를 제거하여 최종 바이오디젤 생성물을 생성할 수 있다.

실시예 14는 프로토테카 모리포르미스로부터 트리글리세라이드를 사용하는 바이오디젤의 제조법을 기재하였다. 실시예 14에서 제조된 바이오디젤의 The Cold Soak Filterability by the ASTM D6751 Al 방법에 의한 냉각 담금 여과능(Cold Soak Filterability)은 300ml의 용적에 대해 120초였다. 상기 시험은 16시간 동안 40°Ｆ로 냉각시키고 실온으로 가온되도록 방치하고 스테인레스 강철 지지체를 가진 0.7마이크론 유리 섬유 필터를 사용하여 진공 여과하는, 300ml의 B100의 여과를 포함한다. 본 발명의 오일은 120초 미만, 100초 미만 및 90초 미만의 냉각 담금 시간과 함께 트랜스에스테르화되어 바이오디젤을 생성할 수 있다.

후속 공정은 또한 바이오디젤이 특히 냉온에서 사용되는 경우 사용될 수 있다. 상기 공정은 동결방지처리(winterization) 및 분획화를 포함한다. 2개 공정은 혼탁점(바이오디젤이 결정화하기 시작하는 온도)을 저하시킴에 의해 연료의 냉각 흐름 및 동결방지 수행능을 개선시키도록 디자인된다. 바이오디젤의 동결방지처리에는 다수의 방법이 있다. 한가지 방법은 바이오디젤을 석유 디젤과 블렌딩하는 것이다. 또 다른 방법은 바이오디젤의 혼탁점을 저하시킬 수 있는 첨가제를 사용하는 것이다. 또 다른 방법은 첨가제중에 혼합하고 포화물이 결정화하도록 방치하고 이어서 결정을 여과 제거함에 의해 무분별하게 포화된 메틸 에스테를 제거하는 것이다. 분획화는 선택적으로 메틸 에스테르를 개별 성분 또는 분획으로 분리하여 특정 메틸 에스테르가 제거 또는 포함되도록 할 수 있다. 분획화 방법은 우레아 분획화, 용매 분획화 및 열 증류를 포함한다.

본 발명의 방법에 의해 제공될 수 있는 또 다른 가치있는 연료는 C10:0, C12:0, C14:0, C16:0 및 C18:0과 같은 알칸을 포함하여 바이오디젤과는 구분될 수 있는 재생가능한 디젤이다. 고품질의 재생가능한 디젤은 ASTM D95 표준에 부합한다. 본 발명의 방법에 의해 생성된 지질은 공급원료로서 작용하여 재생가능한 디젤을 생성할 수 있다. 따라서 본 발명의 또 다른 측면에서,재생가능한 디젤을 생성하는 방법이 제공된다. 재생가능한 디젤은 3개 이상의 공정에 의해 생성될 수 있다: 열수 가공(수소 처리); 수소화처리; 및 간접적인 액화. 이들 공정으로 비-에스테르 증류물을 수득한다. 이들 공정동안에, 본원에 기재된 바와 같이 생성되고 분리된 트리아실글리세라이드는 알칸으로 전환된다.

하나의 양태에서, 재생가능한 디젤을 생성하는 방법은 (a) 본원에 기재된 방법을 사용하여 지질 함유 미생물을 배양하고 (b) 미생물을 용해시켜 용해물을 생성하고, (c) 용해된 미생물로부터 지질을 분리하고 (d) 지질을 탈산화하고 수소화처리하여 알칸을 생성하므로써 재생가능한 디젤이 생성되도록 함을 포함한다. 재생가능한 디젤을 제조하기에 적합한 지질은 헥산과 같은 유기 용매를 사용하거나 미국 특허 제5,928,696호에 기재된 것들과 같은 다른 방법을 통해 미생물 바이오매쓰로부터 추출을 통해 수득할 수 있다. 몇몇 적합한 방법은 기계적 프레싱 및 원심분리를 포함할 수 있다.

몇몇 방법에서, 미생물 지질은 먼저 수소화처리와 연계하여 크랙킹하여 각각 탄소쇄 길이를 감소시키고 이중 결합을 포화시킨다. 상기 물질을 또한 이어서 수소화처리와 연계하여 이성체화한다. 이어서 나프타 분획을 증류를 통해 제거함에 이어서 추가 증류하여 디젤 연료에 요구되는 성분을 증발시키고 증류시키므로써 ASTM D975에 충족하도록 하고 D975 표준을 충족시키기 위해 요구되는 것 보다 무거운 성분을 잔류시킨다. 트리글리세라이드 오일을 포함하는 화학적으로 변형된 오일의 수소 처리, 수소 크랙킹, 탈산소화 및 이성체화 방법은 당업계에 널리 공지되어 있다. 예를 들어, 유럽 특허원 제EP1741768호 (A1); 제EP1741767호 (A1); 제EP1682466호 (A1); 제EP1640437호 (A1); 제EP1681337호 (A1); 제EP1795576호 (A1); 및 미국 특허 제7,238,277호; 제6,630,066호; 제6,596,155호; 제6,977,322호; 제7,041,866호; 제6,217,746호; 제5,885,440호; 제6,881,873호를 참조한다.

재생가능한 디젤을 생성하기 위한 방법의 하나의 양태에서, 알칸을 생성하기 위한 지질의 처리는 지질 조성물의 수소 처리에 의해 수행한다. 열수 가공에서, 전형적으로 바이오매쓰는 승온 및 승압에서 물중에서 반응시켜 오일 및 잔류 고체를 형성시킨다. 전환 온도는 전형적으로 300°F 내지 660°F이고, 이때 압력은 주로 액체로서 물을 유지하게 충분한 100 내지 170 표준 대기압(atm)이다. 반응 시간은 15 내지 30분 정도이다. 반응을 종결한 후 유기물을 물로부터 분리한다. 이로써 디젤을 위해 적합한 증류물이 생성된다.

재생가능한 디젤을 제조하는 몇몇 양태에서, 트리글리세라이드를 처리하는 제1 단계는 이중 결합을 포화시키기 위한 수소 가공에 이어서 수소 및 촉매의 존재하에 승온에서 탈산소화시키는 것이다. 몇몇 방법에서, 수소화 및 탈산소화는 동일한 반응에서 발생한다. 다른 방법에서 탈산소화는 수소화 전에 수행한다. 이어서 이성체화는 임의로 또한 수소 및 촉매의 존재하에서 수행한다. 나프타 성분은 바람직하게 증류를 통해 제거한다. 예를 들어, 미국 특허 제5,475,160호 (트리글리세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 가스 제거); 제6,391,815호 (수소화); 및 제5,888,947호(이성체화)를 참조한다.

트리글리세라이드의 수소화를 위한 하나의 적합한 방법은 구리, 아연, 마그네슘 및 란탄염의 수용액 및 알칼리 금속 또는 바람직하게 탄산암모늄의 또 다른 용액을 제조함을 포함한다. 상기 2개의 용액을 약 20℃ 내지 약 85℃의 온도로 가열하고 침전 용기내 pH가 5.5 내지 7.5로 유지되어 촉매를 형성하도록 하는 비율로 침전 용기내로 함께 계량하여 부가할 수 있다. 추가의 물은 초기에 침전 용기내에사용할 수 있거나 염 용액 및 침전 용액과 동시에 첨가할 수 있다. 이어서 수득한 침전물을 약 300℃에서 세척하고 건조시키고 하소시키고 약 100℃ 내지 약 400℃의 온도 범위에서 수소중에서 활성화시킬 수 있다. 이어서 하나 이상의 트리글리세라이드는 반응기내 상기된 촉매의 존재하에 수소와 접촉시키고 반응시킬 수 있다. 상기 반응기는 트리클 상 반응기, 고정 상 가스-고체 반응기, 팩킹된 기포 칼럼 반응기, 연속 교반 탱크 반응기, 슬러리 상 반응기 또는 당업계에 공지된 임의의 다른 적합한 반응기 유형일 수 있다. 상기 방법은 배치식으로 또는 연속식으로 수행할 수 있다. 반응 온도는 전형적으로 약 170℃ 내지 약 250℃의 범위이고 반응 압력은 전형적으로 약 300 psig 내지 약 2000 psig 범위이다. 더욱이, 본 발명의 방법에서 수소 대 트리글리세라이드의 몰 비는 전형적으로 약 20: 1 내지 약 700: 1 범위이다. 상기 방법은 전형적으로 중량 시간 공간 속도(WHSV)에서 수행하고 이의 범위는 약 0.1hr^-1 내지 약 5hr^-1이다. 당업자는 반응을 위해 요구되는 시간은 사용되는 온도, 수소 대 트리글리세라이드의 몰비 및 수소 분압에 따라 다양함을 인지할 것이다. 상기 수소화 공정에 의해 생성되는 생성물은 지방 알콜, 글리세롤, 미량의 파라핀 및 미반응 트리글리세라이드를 포함한다. 이들 생성물은 전형적으로 예를 들어, 증류, 추출, 여과, 결정화 등과 같은 통상적인 수단에 의해 분리한다.

석유 정련업자는 수소화처리을 사용하여 공급물을 수소로 처리하므로써 불순물을 제거한다. 수소화처리 전환 온도는 전형적으로 300°F 내지 700°F이다. 상기 압력은 전형적으로 40 내지 100atm이다. 상기 반응 시간은 전형적으로 10 내지 60분 정도이다. 고체 촉매를 사용하여 특정 반응 속도를 증가시키고 특정 생성물에 대한 선택성을 개선시키고 수소 소비를 최적화한다.

오일의 탈산소화를 위해 적합한 방법은 오일을 약 350°F 내지 약 55O°F 범위의 온도로 가열하고 연속적으로 가열된 오일을 약 5분 이상 동안 적어도 약 대기압 이상의 압력하에서 수소와 접촉시킴을 포함한다.

이성체화를 위해 적합한 방법은 알칼리 이성체화 및 당업계에 공지된 다른 오일 이성체화를 사용함을 포함한다.

수소 처리 및 수소 가공은 궁극적으로 트리글리세라이드 공급물의 중량 감소를 유도한다. 상기 트리글리세라이드 분자는 수소 가공 조건하에 4개의 탄화수소 분자, 즉 프로판 분자 및 전형적으로 C8 내지 C18 범위의 3개의 보다 무거운 탄화수소 분자로 감소한다.

따라서, 하나의 양태에서, 본 발명의 지질 조성물상에서 수행되는 하나 이상의 화학 반응(들)의 생성물은 ASTM D975 재생가능한 디젤을 포함하는 알칸 혼합물이다. 미생물에 의한 탄화수소의 생성은 문헌[참조: Metzger et al. Appl Microbiol Biotechnol (2005) 66: 486-196 and A Look Back at the U.S. Department of Energy's Aquatic Species Program: Biodiesel from Algae, NREL/TP-580-24190, John Sheehan, Terri Dunahay, John Benemann and Paul Roessler (1998)]에 의해 검토되었다.

디젤 연료의 증류 성질은 T10-T90 (각각 10% 및 90%의 용적이 증류되는 온도)의 관점에서 기재한다. 재생가능한 디젤은 프로토테카 모리포르미스 트리글리세라이드로부터 생성되고 실시예 14에 기재된다. 실시예 14에 생성된 물질의 T10-T90은 57.9℃였다. 본원에 기재된 오일의 수소 처리, 이성체화 및 본원에 기재된 다른 공유 변형 방법 및 증류 및 본원에 기재된 분획화(예를 들어, 냉각 여과) 방법을 사용하면서, 본원에 기재된 방법에 따라 생성된 트리글리세라이드를 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T10-T90 범위는 20, 25, 30, 35, 40, 45, 50, 60 및 65℃이다.

실시예 14에서 생성된 물질의 T10은 242.1℃이다. 본원에 기재된 오일의 수소 처리, 이성체화 및 다른 공유 변형 방법 및 본원에 기재된 증류 및 분획화(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T10 값은 예를 들어, 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 290 이상의 T10이다.

실시예 14에서 생성된 물질의 T90은 300℃이다. 본원에 기재된 오일의 수소 처리, 이성체화 및 다른 공유 변형 방법 및 본원에 기재된 증류 및 분획화(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T90 값은 예를 들어, 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 및 290 이상의 T90이다.

실시예 14에서 생성된 물질의 FBP는 300℃이다. 본원에 기재된 오일의 수소 처리, 이성체화 및 다른 공유 변형 방법 및 본원에 기재된 증류 및 분획화(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 FBP 값은 예를 들어, 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 및 300 이상의 FBP이다.

본 발명의 방법 및 조성물에 의해 제공된 기타 오일은 수소화처리, 이성체화 및 다른 공유 변형의 조합에 적용될 수 있고 (a) 4% 이상의 C8-C14; (b) 0.3% 이상의 C8; (c) 2% 이상의 C10; (d) 2% 이상의 C12; 및 (3) 30% 이상의 C8-C14를 포함하는 지질 프로필을 갖는 오일을 포함한다.

통상적인 초-저 황 디젤은 2단계 공정에 의해 임의의 형태의 바이오매쓰로부터 생성될 수 있다. 먼저, 바이오매쓰를 수소 및 일산화탄소가 풍부한 가스 혼합물인 합성가스로 전환시킨다. 이어서, 합성가스를 촉매적으로 액체로 전환시킨다. 전형적으로, 액체의 생성은 피셔-트로프쉬(Fischer-Tropsch)(FT) 합성을 사용하여 성취한다. 상기 기술은 석탄, 천연 가스 및 중유에 적용한다. 따라서, 재생가능한 디젤을 생성하기 위한 방법의 여전히 또 다른 바람직한 양태에서, 알칸을 생성하기 위한 액체 조성물의 처리는 액체 조성물의 간접적인 액화에 의해 수행한다.

본 발명은 또한 제트 연료를 제조하는 방법을 제공한다. 제트 연료는 스트로 색상으로 투명하다. 가장 일반적인 연료는 국제 표준 세트의 세부 항목으로 제조되는 항공기 A-l로서 분류되는 무연/석유 오일계 연료이다. 제트 연료는 다수의 상이한, 가능하게는 수천개 이상의 많은 상이한 탄화수소의 혼합물이다. 이들의 크기 범위(분자량 또는 탄소수)는 생성물에 대한 요건, 예를 들어, 동결점 또는 발연점에 의해 제한된다. 케로손형(Kerosone-type) 항공기 연료(제트 A 및 제트 A-l을 포함함)는 약 8 내지 16개 탄소수의 탄소수 분포를 갖는다. 와이드-컷 또는 나프타형 항공기 연료(제트 B를 포함함)는 전형적으로 약 5 내지 15개 탄소의 탄소수 분포를 갖는다.

2개의 항공기(제트 A 및 제트 B)는 다수의 부가제를 함유할 수 있다. 유용한 부가제는 항산화제, 대전방지제, 부식 억제제, 및 연료 시스템 아이싱 억제제(FSII)를 포함하지만 이에 제한되지 않는다. 항산화제는 검화(gumming)를 방지하고 일반적으로 알킬화된 페놀, 예를 들어, AO-30, AO-31, 또는 AO-37을 기초로 한다. 대전방지제는 정전기를 소멸시켜 스파킹을 차단한다. 활성 성분으로서 디노닐나프틸설폰산(DINNSA)을 갖는 Stadis 450이 하나의 예이다. 부식 억제제, 예를 들어, DCI-4A는 대중 및 군사 연료용으로 사용되고 DCI-6A는 군사 연료용으로 사용된다. FSII 제제는 예를 들어, Di-EGME를 포함한다.

본 발명의 하나의 양태에서, 제트 연료는 기존의 제트 연료와 조류 연료를 블렌딩함에 의해 제조된다. 본 발명의 방법에 의해 생성된 지질은 공급원료서 작용하여 제트 연료를 생성할 수 있다. 따라서, 본 발명의 또 다른 측면에서, 제트 연료를 제조하는 방법이 제공된다. 이와 함께 본 발명의 방법에 의해 생성된 지질로부터 제트 연료를 제조하는 2가지 방법으로서 유동 촉매 크랙킹(FCC); 및 수소탈산소화(HDO)가 제공된다.

유동 촉매 크랙킹(FCC)은 중질 분획물 기원의 올레핀, 특히 프로필렌을 제조하기 위해 사용되는 하나의 방법이다. 본 발명의 방법에 의해 생성된 지질은 올레핀으로 전환시킬 수 있다. 상기 방법은 FCC 영역을 통해 생성된 지질을 유동시키고 제트 연료로서 유용한 올레핀으로 구성된 생성물 스트림을 수거함을 포함한다. 생성된 지질은 크랙킹 조건에서 크랙킹 촉매와 접촉시켜 제트 연료로서 유용한 올레핀 및 탄화수소를 포함하는 생성물 스트림을 제공한다.

하나의 양태에서, 제트 연료를 제조하는 방법은 (a) 본원에 기재된 방법을 사용하여 지질 함유 미생물을 배양하고, (b) 지질 함유 미생물을 용해시켜 용해물을 생성하고, (c) 용해물로부터 지질을 분리하고 (d) 지질 조성물을 처리하므로써 제트 연료를 생성함을 포함한다. 제트 연료를 제조하는 방법의 하나의 양태에서, 상기 지질 조성물은 유체 촉매 크랙킹 영역을 통류할 수 있고 이는 하나의 양태에서 지질 조성물을 크랙킹 조건에서 크랙킹 촉매와 접촉시켜 C₂-C₅ 올레핀을 포함하는 생성물을 제공함을 포함할 수 있다.

상기 방법의 특정 양태에서, 지질 조성물에 존재할 수 있는 임의의 오염물을 제거하는 것이 바람직할 수 있다. 따라서, 유체 촉매 크랙킹 영역을 통해 지질 조성물을 유동시키기 전에, 지질 조성물을 전처리한다. 전처리는 지질 조성물을 이온 교환 수지와 접촉시킴을 포함할 수 있다. 이온 교환 수지는 산성 이온 교환 수지, 예를 들어 Amberlyst™-15이고 지질 조성물이 통류(상향 통류 또는 하향 통류)하는 반응기내 상으로서 사용될 수 있다. 다른 전처리는 액체 조성물을 산, 예를 들어, 황산, 아세트산, 질산 또는 염산과 접촉시킴에 의한 약산 세척을 포함할 수 있다. 접촉은 일반적으로 주위 온도 및 대기압에서 희석 산 용액과 수행된다.

임의로 전처리된 지질 조성물은 탄화수소 성분이 올레핀으로 크랙킹되는 FCC 영역으로 유동한다. 촉매 크랙킹은 반응 영역중의 지질 조성물을 미분된 미립자 물질로 구성된 촉매와 접촉시킴에 의해 성취한다. 상기 반응은 수소크랙킹과는 반대로 촉매 크랙킹이고 부가되는 수소의 부재 또는 수소의 소비에서 수행한다. 크랙킹 반응이 진행하므로써 상당한 양의 코크가 촉매상에 침적된다. 상기 촉매는 재생 영역에서 촉매 기원의 코크를 연소시킴에 의해 고온에서 재생된다. 본원에서, "코크 촉매"로서 언급되는 코크 함유 촉매는 반응 영역으로부터 재생될 재생 영역으로 연속으로 수송되고 재생 영역 기원의 필수적 코크 부재의 재생된 촉매에 의해 대체된다. 다양한 가스 스트림에 의한 촉매 입자의 유동화는 반응 영역과 재생 영역간에 촉매의 수송을 허용한다. 촉매의 유동화 스트림에서 본원에 기재된 지질 조성물의 탄화수소와 같은 탄화수소를 크랙킹하고, 반응 영역 및 재생 영역간에 촉매를 수송하고 재생기내 코크를 연소시키는 방법은 FCC 방법 기술 분야의 당업자에게 널리 공지되어 있다. C₂-C₅ 올레핀을 제조하기 위해 지질 조성물을 크랙킹하는데 유용한 예시적인 FCC 적용 및 촉매는 이의 전문이 본원에 참조로서 인용된 미국 특허 제6,538,169호 및 제7,288,685호에 기재되어 있다.

적합한 FCC 촉매는 일반적으로 동일한 매트릭스에 존재하거나 존재하지 않을 수 있는 2개 이상의 성분을 포함한다. 몇몇 양태에서, 2개의 성분 둘다는 전체 반응 용기를 거쳐 순환할 수 있다. 제1 성분은 일반적으로 유동화된 촉매 크랙킹의 분야에 사용되는 임의의 널리 공지된 촉매를 포함하고, 예를 들어, 활성 무정형 점토형 촉매 및/또는 고활성의 결정 분자체가 있다. 분자체 촉매는 목적하는 생성물에 대한 이의 매우 개선된 선택성때문에 무정형 촉매 보다 바람직할 수 있다. 몇몇 바람직한 양태에서, 제올라이트는 FCC 공정에서 분자체로서 사용할 수 있다. 바람직하게, 제1 촉매 성분은 실리카 또는 알루미나 및 카올린과 같은 불활성 충전제를 포함하는, 대형 공극 제올라이트, 예를 들어, Y형 제올라이트, 활성 알루미나 물질, 결합제 물질을 포함한다.

하나의 양태에서, 본 발명의 지질 조성물의 크랙킹은 FCC 영역의 상위 섹션 또는 리프트 섹션에서 발생한다. 상기 지질 조성물은 노즐에 의해 상부로 도입되어 지질 조성물의 신속한 증발을 유도한다. 촉매와 접촉시키기 전에, 상기 지질 조성물은 통상적으로 약 149℃ 내지 약 316℃(300°F 내지 600°F)의 온도를 갖는다. 상기 촉매는 블렌딩 용기로부터 상부로 유동하여 여기서 이것은 약 2초이하의 시간 동안 지질 조성물과 접촉한다.

블렌딩된 촉매 및 반응된 지질 조성물 증기는 이어서 출구를 통해 상부로부터 배출되고 올레핀, 및 상당한 양의 코크로 덮여지고 일반적으로 "코크된 촉매"로 언급되는 촉매 입자의 수거물을 포함하는 크랙킹된 생성물 증기로 분리된다. 목적하는 생성물이 바람직하지 못한 다른 생성물로 추가로 전환되는 것을 촉진시킬 수 있는, 지질 조성물과 촉매의 접촉시간을 최소화하기 위한 일환으로 스월 암 배열 장치(swirl arm arrangement)와 같은 임의의 배열된 분리기를 사용하여 생성물 스트림으로부터 신속하게 코크된 촉매를 제거할 수 있다. 분리기, 예를 들어, 스월 암 분리기는 챔버의 하한부에 위치한 스트립핑 영역(stripping zone)과 함께 챔버의 챔버의 상한부에 위치한다. 스월 암 배열 장치에 의해 분리된 촉매는 스트립핑 영역으로 적가된다. 가벼운 올레핀 및 몇몇 촉매를 포함하는 크랙킹된 탄화수소를 포함하는 크랙킹된 생성물 증기는 사이클론과 소통하는 도관을 통해 챔버로부터 배출된다. 상기 사이클론은 생성물 증기로부터 잔류 촉매 입자를 제거하여 입자 농도를 매우 낮은 수준으로 감소시킨다. 이어서 상기 생성물 증기는 분리 용기의 상부를 상부로부터 배출된다. 사이클론에 의해 분리된 촉매는 분리 용기에 이어서 스트립팅 영역으로 복귀한다. 스트립핑 영역은 증기와의 역류 접촉에 의해 촉매 표면으로터 흡착된 탄화수소를 제거한다.

낮은 탄화수소 분압은 가벼운 올레핀이 우선적으로 생성되도록 작용한다. 따라서, 상부압은 약 172 내지 241 kPa (25 내지 35 psia)로 설정되고 탄화수소 분압은 약 35 내지 172 kPa (5 내지 25 psia)이고 바람직한 탄화수소 분압은 약 69 내지 138 kPa (10 내지 20 psia)이다. 탄화수소에 대한 상대적 낮은 분압은 희석제가 지질 조성물의 10 내지 55중량% 및 바람직하게는 지질 조성물의 약 15중량% 정도인 희석제로서 증기를 사용함에 의해 성취된다. 다른 희석제, 예를 들어, 무수 가스를 사용하여 등가의 탄화수소 분압에 도달할 수 있도록 할 수 있다.

상부 출구에서 크랙킹된 증기의 온도는 약 510℃ 내지 621℃ (950°F 내지 1150°F)이다. 그러나, 566℃(1050°F) 초과의 상부 출구 온도는 보다 무수의 가스 및 보다 많은 올레핀을 생성시킨다. 반면에, 566℃(1050°F) 미만의 상부 출구 온도는 에틸렌 및 프로필렌을 적게 생성시킨다. 따라서, 약 566℃ 내지 약 63O℃의 바람직한 온도, 약 138 kPa 내지 약 240 kPa (20 내지 35 psia)의 바람직한 압력에서 FCC 공정을 수행하는 것이 바람직하다. 상기 공정의 또 다른 조건은 약 5 내지 약 20 및 바람직하게는 약 10 내지 약 15로 다양할 수 있는 지질 조성물에 대한 촉매 비율이다.

제트 연료를 생성하는 방법의 하나의 양태에서, 상기 지절 조성물은 FCC 반응기의 리프트 섹션으로 도입된다. 리프트 섹션에서 온도는 매우 고온이고 약 700℃(1292°F) 내지 약 760℃ (1400°F)의 범위이고 지질 조성물에 대한 촉매의 비율은 약 100 내지 약 150이다. 이것은 지질 조성물의 리프트 섹션으로의 도입이 상당양의 프로필렌 및 에틸렌을 생성시킬 것으로 예상된다.

본원에 기재된 바와같이 생성된 지질 조성물 또는 지질을 사용하여 제트 연료를 생성시키는 방법의 또 다른 양태에서, 지질 조성물 또는 지질의 구조는 수소탈산소화(HDO)로서 언급되는 공정에 의해 파괴된다. HDO는 수소에 의한 산소의 제거를 의미하는데, 즉 산소는 물질의 구조를 파괴시키면서 제거된다. 올레핀 이중 결합을 수소화시키고 임의의 황 및 질소 화합물을 제거한다. 황 제거는 소위 수소탈황화(HDS)로 불리운다. 원료(지질 조성물 또는 지질)의 전처리 및 순도는 촉매의 작용 수명에 기여한다.

일반적으로, HDO/HDS 단계에서, 수소는 공급 스톡(지질 조성물 또는 지질)과 혼합하고 이어서 상기 혼합물을 단일상 또는 2개상 공급 스톡으로서 동시 유류물로서 촉매 상에 통과시킨다. HDO/HDS 단계 후, 생성물 분획을 분리하고 별도의 이성체화 반응기에 통과시킨다. 생물학적 출발 물질용 이성체화 반응기는 동시 유류 반응기로서 문헌(FI 100 248)에 기재되어 있다.

탄화수소 공급물, 예를 들어, 본원에서의 지질 조성물 또는 지질을 수소화시킴에 의한 연료의 제조 방법은 또한 지질 조성물 또는 지질을 동시 유류물로서 제1 수소화 영역을 통해 수소 가스와 함께 통과시킴에 의해 수행될 수 있고 이후 탄화수소 유출물은, 수소 가스를 탄화수소 유출물과는 반대로 역류 유동물로서 제2 수소화 영역에 통과시킴에 의해 제2 수소화 영역에서 추가로 수소화시킨다. 지질 조성물을 크랙킹하여 C₂-C₅ 올레핀을 제조하는데 유용한 예시적인 HDO 적용 및 용매는 전문이 본원에 참조로서 인용되는 미국 특허 제7,232,935호에 기재되어 있다.

전형적으로, 수소탈산소화 단계에서, 본원에서의 지질 조성물 또는 지질과 같은 생물학적 성분의 구조는 산소, 질소, 인 및 황 화합물로 분해되고 가스로서의 가벼운 탄화수소가 제거되며 올레핀 결합은 수소화된다. 상기 방법의 제2 단계에서, 즉 소위 이성체화와 단계에서, 이성체화는 낮은 온도에서 탄화수소 쇄를 측쇄화하고 파라핀의 수행능을 개선시킴에 의해 수행된다.

제1 단계, 즉 크랙킹 공정의 HDO 단계에서 수소 가스, 및 수소화되어야만 하는 본원의 지질 조성물 또는 지질은 HDO 촉매 상 시스템에 동시 유류물로서 또는 역류물로서 통과시키고 상기 촉매 상 시스템은 하나 이상의 촉매 상, 바람직하게 1 내지 3개의 촉매 상을 포함한다. HDO 단계는 전형적으로 동시 유류 방식으로 작동한다. 2개 이상의 촉매 상을 포함하는 HDO 촉매 상 시스템의 경우에, 상기 상중 하나 이상은 역류물 원칙을 사용하여 작동할 수 있다. HDO 단계에서, 압력은 20 내지 150바(bar), 바람직하게는 50 내지 100바로 다양하고 온도는 200 내지 500℃, 바람직하게는 300 내지 400℃로 다양하다. HDO 단계에서, 원소주기율표의 VII 족 및/또는 VIB족 금속을 함유하는 공지된 수소화 촉매가 사용될 수 있다. 바람직하게, 수소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고, 상기 지지체는 알루미나 및/또는 실리카이다. 전형적으로, NiMo/Al₂O₃ 및 CoMo/Al₂O₃ 촉매가 사용된다.

HDO 단계 전에, 본원에서 지질 조성물 또는 지질은 임의로 보다 온화한 조건하에서 예비수소화로 처리하여 이중 결합의 부반응을 회피할 수 있다. 상기 예비수소화는 50 내지 400℃의 온도 및 1 내지 200바의 수소 압력, 바람직하게는 150 내지 250℃의 온도 및 10 내지 100바의 수소 압력에서 수행한다. 상기 촉매는 원소주기율표의 VIII족 및/또는 VIB족 기원의 금속을 함유할 수 있다. 바람직하게, 예비소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고 상기 지지체는 알루미나 및/또는 실리카이다.

수소를 함유하는 HDO 단계 기원의 가스 기류를 냉각시킴에 이어서 일산화탄소, 이산화탄소, 질소, 인 및 황 화합물, 가벼운 가스 탄화수소 및 다른 불순물을 이로부터 제거한다. 압착시킨 후 정제된 수소 또는 재활용된 수소를 제1 촉매 상으로 및/또는 촉매 상 사이로 복귀시켜 인출된 기류를 구성하도록 한다. 물은 응축 액체로부터 제거한다. 상기 액체는 제1 촉매 상 또는 촉매 상 사이로 통과시킨다.

HDO 단계 후, 생성물은 이성체화 단계에 적용한다. 이것은 탄화수소를 이성체화 촉매와 접촉시키기전에 불순물을 가능한한 완전히 제거하는 공정을 위해 필요하다. 상기 이성체화 단계는 임의의 교반 단계를 포함하고, 이때, HDO 단계 기원의 반응 생성물은 수증기 또는 가벼운 탄화수소, 질소 또는 수소와 같은 적합한 가스 증기를 스트립핑시킴에 의해 정제될 수 있다. 임의의 스트립핑 단계는 이성체화 촉매의 상부 유니트에서 역류 방식(여기서, 여기서, 가스 및 액체는 서로 접촉한다)으로 수행하거나 역류 원칙을 사용하는 별도의 스트립핑 유니트 역류 원리에서 실제 이성체화 반응기 전에 수행한다.

스트립핑 단계 후, 수소 가스 및 본원에서의 수소화된 지질 조성물 또는 지질 및 n-파라핀 혼합물을 하나 이상의 촉매 상(들)을 포함하는 반응성 이성체화 유니트에 통과시킨다. 이성체화 단계의 촉매 상은 동시 유류 또는 역류 방식으로 작동할 수 있다.

역류 원리가 이성체화 단계에 적용되는 것이 상기 공정을 위해 중요하다. 이성화체 단계에서, 이것은 임의의 스트립핑 단계 또는 이성체화 반응 단계중 하나 또는 둘다를 역류 방식으로 진행함에 의해 수행한다. 이성체화 단계에서, 압력은 20 내지 150바, 바람직하게는 20 내지 100 바로 다양하고, 온도는 200 내지 500℃, 바람직하게는 300 내지 400℃이다. 이성체화 단계에서, 당업계에 공지된 이성체화 촉매가 사용될 수 있다. 적합한 이성체화 촉매는 분자체 및/또는 VII족 금속 및/또는 담체를 함유한다. 바람직하게, 이성체화 촉매는 SAPO-11 또는 SAPO41 또는 ZSM-22 또는 ZSM-23 또는 페리어라이트(ferrierite) 및 Pt, Pd 또는 Ni 및 Al₂O₃ 또는 SiO₂를 함유한다. 전형적인 이성체화 촉매는 예를 들어, Pt/S APO-11/Al₂O₃, Pt/ZSM-22/Al₂O₃, Pt/ZSM-23/Al₂O₃ 및 Pt/SAPO-11/SiO₂이다. 이성체화 단계 및 HDO 단계는 동일한 압력 용기 또는 별도의 압력 용기에서 수행할 수 있다. 임의의 예비수소화는 별도의 압력 용기 또는 HDO 및 이성체화 단계와 동일한 압력 용기에서 수행할 수 있다.

따라서, 하나의 양태에서, 하나 이상의 화학적 반응 생성물은 ASTM D1655 제트 연료를 포함하는 알칸 혼합물이다. 몇몇 양태에서, ASTM 1655 제트 연료의 세부 항목을 준수하는 조성물은 10 ppm 미만의 황 함량을 갖는다. 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 205℃ 미만의 증기 곡선의 T10값을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 300℃ 미만의 최종 비점(FBP)을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 38℃ 이상의 인화점을 갖는다. 또 다른 양태에서, ASTM 1655 제트 염료의 세부항목을 준수하는 조성물은 775K/M₃ 내지 840K/M₃의 밀도를 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 -47℃ 미만의 동결점을 갖는다. 또 다른 양태에서, ASTM 제트 연료의 세부항목을 준수하는 조성물은 42.8 MJ/K 이상의 총 연소열(Heat of Combustion)을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 13.4 질량% 이상의 수소 함량을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 Hg의 3mm 미만인, 260℃에서의 정량적 정량적 중량 JFTOT에 의한 시험시 열 안정성을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 7mg/dl 미만인 실제 검을 갖는다.

따라서, 본 발명은 미세조류 지질의 화학적 변형으로 다양한 산업적 및 다른 적용 분야에 유용한 생성물을 수득하는 다양한 방법을 기재하고 있다. 본원에 기재된 방법에 의해 생성된 오일을 변형시키는 방법의 예는 오일 가수분해, 오일의 수소화처리 및 오일의 에스테르화를 포함하지만 이에 제한되지 않는다. 미세조류 오일의 변형은 기본 함유화학물질을 생성하고 이는 추가로 목적하는 기능을 위해 선택된 유도체 함유화학물질로 변형시킬 수 있다. 연료 생성 공정과 관련하여 상기된 것과 유사한 방식으로, 이들 화학적 변형은 또한 본원에 기재된 미생물 배양으로부터 생성된 오일상에서 수행할 수 있다. 기본 함유화학물질의 예는 비누, 지방산, 지방산 메틸 에스테르 및 글리세롤을 포함하지만 이에 제한되지 않는다. 유도체 함유화학물질의 예는 지방 니트릴, 에스테르, 이량체 산, 쿠아트(quat), 계면활성제, 지방 알칸올아미드, 지방 알콜 설페이트, 수지, 유화제, 지방 알콜, 올레핀 및 고급 알칸을 포함하지만 이에 제한되지 않는다.

본 발명의 방법에 의해 생성된 글리세로지질 기원의 지방산 성분의 가수분해는 다른 유용한 화학물질을 생성하도록 유도체화될 수 있는 유리된 지방산을 생성시킨다. 가수분해는 산 또는 염기일 수 있는 물 및 촉매의 존재하에 수행한다. 유리된 지방산을 유도체화하여 하기에 보고된 바와 같은 다양한 생성물을 수득할 수 있다: 미국 특허 제5,304,664호(고도로 황화된 지방산); 제7,262,158호(세정 조성물); 제7,115,173호(직물 연화 조성물); 제6,342,208호(피부 처리용 에멀젼); 제7,264,886호(방수 조성물); 제6,924,333호 (페인트 첨가제); 제6,596,768호 (지질 풍부 반추동물 공급원료); 및 제6,380,410호(세제 및 세정제용 계면활성제).

본 발명의 하나의 양태에서 가수분해와 관련하여 트리글리세라이드 오일은 임의로 먼저 물 또는 수산화나트륨과 같은 액체 매질중에서 가수분해하여 글리세롤 및 비누를 수득한다. 다양한 적합한 트리글리세라이드 가수분해 방법이 있고 여기에는 비누화, 산 가수분해, 알칼린 가수분해, 효소 가수분해(본원에서 스프릿팅으로서 언급됨), 및 고온 압착수를 사용한 가수분해가 포함되지만 이에 제한되지 않는다. 당업자는 트리글리세라이드 오일이 함유화학물질을 생성하기 위해 가수분해될 필요가 없고 차라리 상기 오일이 다른 공지된 방법에 의해 목적하는 함유화학물질로 직접 전환될 수 있다. 예를 들어, 트리글리세라이드 오일은 에스테르화를 통해 메틸 에스테르 지방산으로 직접 전환될 수 있다.

몇몇 양태에서, 본원에 기재된 방법에 의해 생성된 오일의 촉매 가수분해는 오일을 글리세롤 및 지방산으로 분리시킴에 의해 발생한다. 상기 논의된 바와 같이, 지방산은 이어서 여러 다른 변형을 통해 수득된 유도체 함유화학물질로 추가로 가공될 수 있다. 예를 들어, 하나의 양태에서, 지방산은 아민화 반응하도록 진행시켜 지방 질소 화합물을 생성할 수 있다. 또 다른 양태에서, 지방산은 일염기성 및 이염기성 산을 생성하도록 오존용해에 적용될 수 있다.

다른 양태에서, 가수분해는 오일 분리를 통해 발생하여 함유화학물질을 생성할 수 있다. 본 발명의 몇몇 바람직한 양태에서, 트리글리세라이드 오일은 다른 공정을 수행하기전에 분리될 수 있다. 당업자는 많은 적합한 트리글리세라이드 분리 방법이 존재함을 인지할 수 있고 상기 방법은 효소 분리 및 압력 분리를 포함하지만 이에 제한되지 않는다.

일반적으로, 효소적 오일 분리 방법은 물/오일 혼합물에 대해 작용하는 생촉매로서 효소인 리판제를 사용한다. 효소적 분리는 이어서 오일 또는 지방을 글리세롤 및 유리된 지방산으로 분리한다. 상기 글리세롤은 물상으로 이동하는 반면 상기 유기상에는 유리된 지방산이 풍부해진다.

효소 분리 반응은 일반적으로 유기 및 수성 상간의 경계상에서 일어나고 여기서 효소는 단지 경계상에 존재한다. 이어서 경계상과 만나는 트리글리세라이드는 분리 반응에 기여하거나 이에 관여한다. 반응이 진행됨에 따라, 유리된 지방산과는 대조적으로 여전히 글리세라이드로 화학적으로 결합되어 있는 지방산의 작업 밀도 또는 농도는 경계상에서 감소하여 반응은 느려진다. 특정 양태에서, 효소 분리는 실온에서 일어날 수 있다. 당업자는 오일을 목적하는 지방산으로 분리시키는데 적합한 조건에 정통하고 있다.

예를 들어, 반응 속도는 상호 경계 표면을 증가시킴에 의해 가속화될 수 있다. 일단 반응이 완료되면, 유리된 지방산을 이어서 효소로부터 유리된 유기상으로부터 분리하고 글리세라이드로 여전히 화학적으로 결합되어 있는 지방산을 함유하는 잔사는 역 공급되거나 재활용되고 새로운 오일 또는 지방과 혼합되어 분리방법에 적용시킨다. 이어서 상기 방식으로 재활용된 글리세라이드는 추가의 효소적 분리 방법에 적용된다. 몇몇 양태에서, 유리된 지방산은 상기 방식으로 부분적으로 분리된 오일 또는 지방으로부터 추출된다. 상기 방식으로, 화학적으로 결합된 지방산(트리글리세라이드)이 분리 공정으로 복귀하거나 역 공급되는 경우 효소 소비는 급격히 감소할 수 있다.

분리 정도는 측정된 산 값을, 소정의 오일 또는 지방에 대해 계산될 수 있는 이론적으로 가능한 산 값으로 나눈 비율로서 결정한다. 바람직하게, 산 값은 표준 일반 방법에 따른 적정을 사용하여 측정한다. 또한, 수성 글리세롤 상의 밀도는 분리 정도에 대한 척도로서 취할 수 있다.

하나의 양태에서, 본원에 기재된 바와 같은 분리 방법은 또한 생성된 오일의 알칼리 정련 공정 기원의 소위 비누-스톡에 함유된 모노-, 디- 및 트리글리세라이드에 적합하다. 상기 방식으로, 비누 스톡은 사전 비누화 없이 천연 오일의 지방산으로 정량적으로 전환될 수 있다. 상기 목적을 위해, 비누에 화학적으로 결합된 지방산을 바람직하게는 분리 전에 산의 부가를 통해 방출시킨다. 특정 양태에서, 완충액은 분리 공정을 위한 물 및 효소에 추가로 사용된다.

하나의 양태에서, 본 발명의 방법에 따라 생성된 오일은 또한 가수분해 방법으로서 비누화에 적용될 수 있다. 동물성 및 식물성 오일은 트리하이드릭 알콜인 글리세롤과 지방산의 에스테르인 트리아실글리세롤(TAG)로 이루어진다. 알칼린 가수분해 반응에서, TAG내 글리세롤이 제거되어 3개의 카복실산 음이온이 생성되고 이는 나트륨 또는 칼륨과 같은 알칼리 금속 양이온과 연합하여 지방산 염을 생성할 수 있다. 상기 기획에서, 카복실산 성분들은 글리세롤 잔기로부터 절단되고 하이드록실 그룹으로 대체된다. 상기 반응에 사용되는 염기(예를 들어, KOH)의 양은 목적하는 비누화 정도에 의해 측정된다. 예를 들어, 상기 목적이 본래 TAG 조성물중에 존재하는 오일의 일부를 포함하는 생성물을 제조하기 위한 것인 경우, 모든 TAG를 지방산 염으로 전환시키기에 불충한 양의 염기가 반응 혼합물로 도입된다. 통상적으로, 상기 반응은 수용액중에 수행하여 서서히 진행시키지만 가열에 의해 촉진될 수 있다. 지방산 염의 침전은 수용성 알칼리 금속 할라이드(예를 들어, NaCl 또는 KCl)와 같은 염을 반응 혼합물에 부가하여 촉진될 수 있다. 바람직하게, 상기 염기는 알칼리 금속 수산화물(예를 들어, NaOH 또는 KOH)이다. 또는 예를 들어, 트리에탄올아민 및 아미노메틸프로판올을 포함하는 알칸올아민과 같은 다른 염기를 상기 반응 기획에 사용할 수 있다. 몇몇 경우에, 이들 대안이 투명한 비누 생성물을 제조하는데 바람직할 수 있다.

몇몇 방법에서, 화학적 변형의 제1 단계는 수소 및 촉매의 존재하에 승온에서 이중 결합을 포화시키기 위한 수소화처리에 이어서 탈산소화하는 것이다. 다른 방법에서, 수소화 및 탈산소화는 동일한 반응중에서 일어날 수 있다. 여전히 다른 방법에서, 탈산소화는 수소화전에 발생한다. 이어서 이성체화는 또한 수소 및 촉매의 존재하에서 임의로 수행할 수 있다. 최종적으로, 가스 및 나프타 성분은 경우에 따라 제거할 수 있다. 예를 들어, 문헌[미국 특허 5,475,160호(트리글리세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 가스 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성체화)]을 참조한다.

본 발명의 몇몇 양태에서, 트리글리세라이드 오일은 부분적으로 또는 완전히 탈산소화된다. 탈산소화 반응은 지방산, 지방 알콜, 폴리올, 케톤 및 알데하이드를 포함하지만 이에 제한되지 않는 목적하는 생성물을 생성시킨다. 일반적으로, 임의의 특정 이온에 구애되지 않고 탈산소화 반응은, 지방산 또는 지방산 에스테르로부터 산소를 적어도 부분적으로 제거하여 추가의 공정에 의해 목적하는 화학물질로 용이하게 전환될 수 있는 지방 알콜과 같은 반응 생성물을 생성시키는 반응으로서, 제한 없이 수소용해, 수소생성, 연속 수소화-수소용해, 연속 수소용해-수소화 및 조합된 수소화-수소용해 반응을 포함하는 다양하고 상이한 반응 경로의 조합을 포함한다. 예를 들어, 하나의 양태에서, 지방 알콜은 FCC 반응을 통해 올레핀으로 또는 응축 반응을 통해 고급 알칸으로 전환될 수 있다.

하나의 상기 화학적 변형은 글리세로지질 또는 유리 지방산의 지방산 성분에서 이중 결합으로 수소를 첨가하는 수소화이다. 수소화 반응으로 액체 오일은 특정 응용을 위해 보다 적합할 수 있는 반고체 또는 고체 지질로 전환될 수 있다.

본원에 기재된 방법에 의해 생성된 오일의 수소화는 하기에 보고된 바와 같이 본원에 제공된 방법 및/또는 재료중 하나 이상과 연계하여 수행할 수 있다: 미국 특허 제7,288,278호 (식품 첨가제 또는 의약); 제5,346,724호(윤활 생성물); 제5,475,160호(지방 알콜); 제5,091,116호(식용 오일); 제6,808,737호(마가린 및 스프레드용 구조적 지방); 제5,298,637호(감소된 칼로리 지방 대용물); 제6,391,815호(수소화 촉매 및 황 흡착제); 제5,233,099호 및 제5,233,100호(지방 알콜); 제4,584,139호(수소화 촉매); 제6,057,375호(소포제); 및 제7,118,773호(식용 에멀젼 스프레드).

당업자는 탄수화물을 수소화시키기 위해 다양한 방법이 사용될 수 있음을 인지할 것이다. 하나의 적합한 방법은 수소화 반응기에서 수소화된 생성물을 형성하기 위해 충분한 조건하에서 적합한 가스 및 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시킴을 포함한다. 수소화 촉매는 일반적으로 단독으로, 또는 W, Mo, Au, Ag, Cr, Zn, Mn, Sn, B, P, Bi, 및 합금 또는 이의 조합체와 같은 촉진제와 함께 Cu, Re, Ni, Fe, Co, Ru, Pd, Rh, Pt, Os, Ir, 및 합금 또는 이의 조합체를 포함할 수 있다. 다른 효과적인 수소화 촉매 물질은 지지된 니켈 또는 레늄으로 변형된 루테늄을 포함한다. 하나의 양태에서, 수소화 촉매는 또한 촉매의 목적하는 기능성에 따라, 지지체중 임의의 하나를 포함한다. 수소화 촉매는 당업자에게 공지된 방법에 의해 제조할 수 있다.

몇몇 양태에서, 수소화 촉매는 지지된 VIII족 금속 촉매 및 금속 스폰지 물질(예를 들어, 스폰지 니켈 촉매)을 포함한다. 라니 니켈은 본 발명에 사용하기에 적합한 활성화된 스폰지 니켈 촉매의 예를 제공한다. 다른 양태에서, 본 발명의 수소화 반응은 니켈-레늄 촉매 또는 텅스텐-변형된 니켈 촉매를 포함하는 촉매를 사용하여 수행한다. 본 발명의 수소화 반응을 위해 적합한 촉매의 예는 탄소 지지된 니켈-레늄 촉매이다.

하나의 양태에서, 적합한 라니 니켈 촉매는 예를 들어, 약 25중량%의 수산화나트륨을 함유하는 알칼리 수용액으로 대략 균등 중량의 니켈 및 알루미늄의 합금을 처리함에 의해 제조할 수 있다. 상기 알루미늄은 선택적으로 알칼리 수용액에 의해 용해되어 알루미늄이 최소량인 대부분 니켈을 포함하는 스폰지형 물질을 수득한다. 초기 합금은 약 1 내지 2중량%가 형성된 스폰지 니켈 촉매중에 잔류하도록 하는 양으로 촉진제 금속(즉, 몰리브덴 또는 크로뮴)을 포함한다. 또 다른 양태에서, 수소화 촉매는 물중에서 루테늄(III) 니트로실니트레이트, 루테늄(III) 클로라이드의 용액을 사용하여 적합한 지지체 물질을 침지시키기 위해 제조한다. 이어서 상기 용액을 건조시켜 수분 함량이 약 1중량% 미만인 고체를 형성한다. 상기 고체는 이어서 4시간 동안 회전볼 로내 300℃(하소되지 않음) 또는 400℃(하소됨)에서 수소 스트림중에 대기압으로 감소시킬 수 있다. 촉매를 냉각시키고 질소로 촉매가 불활성이도록 한 후, 질소중에 5용적%의 산소를 2시간 동안 촉매상에 통과시킨다.

특정 양태에서, 본원에 기재된 촉매는 촉매 지지체를 포함한다. 상기 촉매 지지체는 촉매을 안정화시키고 지지한다. 사용되는 촉매 지지체의 유형은 선택된 촉매 및 반응 조건에 따라 다양하다. 본 발명에 적합한 지지체는 탄소, 실리카, 실리카-알루미나, 지르코니아, 티타니아, 세리아, 바나디아, 질화물, 질화붕소, 헤테로폴리산, 하이드록시애퍼타이트, 산화아연, 크로미아, 제올라이트, 탄소 나노튜브, 탄소 플러렌 및 이들의 임의의 조합체를 포함하지만 이에 제한되지 않는다.

본 발명에 사용되는 촉매는 당업자에게 공지된 통상적인 방법을 사용하여 제조할 수 있다. 적합한 방법은 초기 습윤화, 증발 침지, 화학적 증착, 세척-피복, 마그네트론 스퍼터링 기술 등을 포함할 수 있지만 이에 제한되지 않는다.

수소화 반응을 수행하기 위한 이의 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 본원의 이득과 함께 당업자는 적당한 반응 조건을 인지할 것이다. 일반적으로, 수소화 반응은 80℃ 내지 250℃ 및 바람직하게는 90℃ 내지 200℃, 및 가장 바람직하게는 100℃ 내지 150℃의 온도에서 수행한다. 몇몇 양태에서, 수소화 반응은 500 KPa 내지 14000 KPa에서 수행한다.

본 발명의 수소용해 반응에 사용되는 수소는 외부 소수, 재활용된 수소, 동일계 생성 수소 및 이의 임의의 조합을 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "외부 수소"는 바이오매쓰 반응 자체 기원이 아니고 또 다른 공급원으로부터 시스템에 첨가되는 수소를 언급한다.

본 발명의 몇몇 양태에서, 출발 탄수화물을, 목적하는 고급 탄화수소로 보다 용이하게 전환될 수 있는 소분자로 전환시키는 것이 바람직할 수 있다. 상기 전환을 위해 적합한 하나의 방법은 수소용해 반응을 통한 것이다. 다양한 방법이 탄수화물의 수소용해를 수행하기 위해 공지되어 있다. 하나의 적합한 방법은 소분자 또는 폴리올을 포함하는 반응 생성물을 형성하기에 충분한 조건하에서 수소용해 반응기내에서 적합한 가스 및 수소용해 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시킴을 포함한다. 본원에 사용된 바와 같이, 용어 "소분자 또는 폴리올"은 출발 탄수화물보다 소수의 탄소원자 또는 산소 원자를 포함할 수 있는, 소분자량을 갖는 임의의 분자를 포함한다. 하나의 양태에서, 반응 생성물은 폴리올 및 알콜을 포함하는 보다 작은 분자를 포함한다. 당업자는 수소용해 반응을 수행하기 위한 적당한 방법을 선택할 수 있다

몇몇 양태에서, 5 및/또는 6개 탄소 당 또는 당 알콜은 수소용해 촉매를 사용하여 프로필렌 글리콜, 에틸렌 글리콜 및 글리세롤로 전환시킬 수 있다. 수소용해 촉매는 단독으로 또는 Au, Ag, Cr, Zn, Mn, Sn, Bi, B, O, 및 이의 합금 또는 이의 조합체와 같은 촉진제와 함께 Cr, Mo, W, Re, Mn, Cu, Cd, Fe, Co, Ni, Pt, Pd, Rh, Ru, Ir, Os, 및 이의 합금 또는 조합체를 포함할 수 있다. 수소용해 촉매는 또한 전이 금속(예를 들어, 크로뮴, 몰리브덴, 텅스텐, 레늄, 망간, 구리, 카드뮴) 또는 VIII족 금속(예를 들어, 철, 코발트, 니켈, 백금, 팔라듐, 로듐, 루테늄, 이리듐 및 오스뮴)을 함유하는 탄소성 피로중합체를 포함할 수 있다. 특정 양태에서, 수소용해 촉매는 알칼린 토금속 산화물과 배합되거나 촉매적 활성 지지체에 부착된 임의의 상기 금속을 포함할 수 있다. 특정 양태에서, 수소용해 반응에 기재된 촉매는 수소화 반응을 위해 상기된 바와 같은 촉매 지지체를 포함할 수 있다.

수소용해 반응을 수행하기 위한 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 당업자는 본원의 이득과 함께 반응을 수행하기 위해 사용하는 적당한 조건을 인지할 것이다. 일반적으로, 이들 수소용해 반응은 110℃ 내지 300℃ 및 바람직하게는 170℃ 내지 220℃, 및 가장 바람직하게는 200℃ 내지 225℃의 온도에서 수행한다. 몇몇 양태에서, 수소용해 반응은 염기성 조건, 바람직하게는 pH 8 내지 13, 및 보다 더 바람직하게는 pH 10 내지 12에서 수행한다. 몇몇 양태에서, 수소용해 반응은 60 KPa 내지 16500 KPa, 및 바람직하게는 1700 KPa 내지 14000 KPa의 범위, 및 보다 바람직하게는 4800 KPa 내지 11000 KPa의 압력에서 수행한다.

본 발명의 수소용해 반응에 사용되는 수소는 외부 수소, 재활용된 수소, 동일계 생성된 수소 및 이의 임의의 조합체를 포함할 수 있다.

몇몇 양태에서, 상기 논의된 반응 생성물은 응축 반응기(도 1에 응축 반응기 110으로서 도식된)에서 응축 반응을 통해 고급 탄화수소로 전환시킬 수 있다. 상기 양태에서, 반응 생성물의 응축은 고급 타화수소를 형성할 수 있는 촉매의 존재하에 수행한다. 본 이론에 의해 구애되는 것 없이 고급 탄화수소의 생산은 탄소-탄소 또는 탄소-산소 결합의 형성을 포함하는 단계적 부가 반응을 통해 진행하는 것으로 사료된다. 수득한 반응 생성물은 하기에서 보다 상세하게 기재된 상기 잔기를 함유하는 임의의 수의 화합물을 포함한다.

특정 양태에서, 적합한 응축 촉매는 산 촉매, 염기 촉매 또는 산/염기 촉매를 포함한다. 본원에 사용된 바와 같이, 용어 "산/염기 촉매"는 산 및 염기 기능 둘다를 갖는 촉매를 언급한다. 몇몇 양태에서, 상기 응축 촉매는 제한없이, 제올라이트, 카바이드, 질화물, 지르코니아, 알루미나, 실리카, 알루미노실리케이트, 포스페이트, 산화티탄, 산화아연, 산화바나듐, 산화란탄, 산화이트륨, 산화스캔듐, 산화마그네슘, 산화세륨, 산화바륨, 산화칼슘, 수산화물, 헤테로폴리산, 무기산, 산 변형된 수지, 염기 변형된 수지 및 이들의 임의의 조합체를 포함할 수 있다. 몇몇 양태에서, 응축 촉매는 또한 변형제를 포함할 수 있다. 적합한 변형제는 La, Y, Sc, P, B, Bi, Li, Na, K, Rb, Cs, Mg, Ca, Sr, Ba, 및 이들의 임의의 조합체를 포함한다. 몇몇 양태에서, 상기 응축 촉매는 또한 금속을 포함할 수 있다. 적합한 금속은 Cu, Ag, Au, Pt, Ni, Fe, Co, Ru, Zn, Cd, Ga, In, Rh, Pd, Ir, Re, Mn, Cr, Mo, W, Sn, Os, 합금 및 이들의 임의의 조합체를 포함한다.

특정 양태에서, 응축 반응에 기재된 촉매는 수소화 반응을 위해 상기된 바와 같은 촉매 지지체를 포함할 수 있다. 특정 양태에서, 응축 촉매는 자가 지지형이다. 본원에 사용된 바와 같이, 상기 용어 "자가 지지형"은 촉매가 지지체로서 작용하기 위해 또 다른 물질을 필요로 하지 않음을 의미한다. 특정 양태에서, 상기 응축 촉매는 촉매를 현탁시키기에 적합한 별도의 지지체와 연계하여 사용된다. 하나의 양태에서, 응축 촉매 지지체는 실리카이다.

응축 반응을 수행하는 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 당업자는 본원의 이득과 함께 반응을 수행하는 적당한 조건을 인지할 것이다. 몇몇 양태에서, 응축 반응은 제안된 반응에 대한 열역학이 선호될 수 있는 온도에서 수행한다. 응축 반응을 위한 온도는 특정 출발 폴리올 또는 알콜에 따라 다양하다. 몇몇 양태에서, 응축 반응을 위한 온도는 80℃ 내지 500℃ 및 바람직하게는 125℃ 내지 450℃ 및 가장 바람직하게는 125℃ 내지 250℃의 범위이다. 몇몇 양태에서, 응축 반응은 0 Kpa 내지 9000 KPa 범위, 및 바람직하게는 0 KPa 내지 7000 KPa 범위, 및 보다 더 바람직하게는 0 KPa 내지 5000 KPa 범위의 압력에서 수행한다.

본 발명에 의해 형성되는 고급 알칸은 4 내지 30개의 탄소원자를 갖는 측쇄 또는 직쇄 알칸, 4 내지 30개의 탄소원자를 갖는 측쇄 또는 직쇄 알켄, 5 내지 30개의 탄소원자를 갖는 사이클로알칸, 5 내지 30개의 탄소원자를 갖는 사이클로알켄, 아릴, 융합된 아릴, 알콜 및 케톤을 포함하지만 이에 제한되지 않는다. 적합한 알칸은 부탄, 펜탄, 펜텐, 2-메틸부탄, 헥산, 헥센, 2-메틸펜탄, 3-메틸펜탄, 2,2-디메틸부탄, 2,3-디메틸부탄, 헵탄, 헵텐, 옥탄, 옥텐, 2,2,4-트리메틸펜탄, 2,3-디메틸헥산, 2,3,4-트리메틸펜탄, 2,3-디메틸펜탄, 노난, 노넨, 데칸, 데센, 운데칸, 운데센, 도데칸, 도데센, 트리데칸, 트리데센, 테트라데칸, 테트라데센, 펜타데칸, 펜타데센, 노닐데칸, 노닐데센, 에이코산, 에이코센, 운데이코산, 운데이코센, 도에이코산, 도에이코센, 트리에이코산, 트리에이코센, 테트라에이코산, 테트라에이코센 및 이들의 이성체를 포함하지만 이에 제한되지 않는다. 이들 생성물중 일부는 연료용으로 적합할 수 있다.

몇몇 양태에서, 사이클로알칸 및 사이클로알켄은 비치환된다. 다른 양태에서, 사이클로알칸 및 사이클로알켄은 1치환된다. 여전히 또 다른 양태에서, 사이클로알칸 및 사이클로알켄은 다치환된다. 치환된 사이클로알칸 및 사이클로알켄을 포함하는 양태에서, 치환된 그룹은 제한없이, 1 내지 12개의 탄소원자를 갖는 측쇄 또는 직쇄 알킬, 1 내지 12개의 탄소원자를 갖는 측쇄 또는 직쇄 알킬렌, 페닐 및 이의 조합체를 포함한다. 적합한 사이클로알칸 및 사이클로알켄은 사이클로펜탄, 사이클로펜텐, 사이클로헥산, 사이클로헥센, 메틸-사이클로펜탄, 메틸-사이클로펜텐, 에틸-사이클로펜탄, 에틸-사이클로펜텐, 에틸-사이클로헥산, 에틸-사이클로헥센, 이들의 이성체 및 임의의 조합체를 포함하지만 이에 제한되지 않는다.

몇몇 양태에서, 형성된 아릴은 비치환된다. 또 다른 양태에서, 형성된 아릴은 1치환된다. 치환된 아릴을 포함하는 양태에서, 치환된 그룹은 제한없이 1 내지 12개의 탄소원자를 갖는 직쇄 또는 측쇄 알킬, 1 내지 12개의 탄소원자를 갖는 측쇄 또는 직쇄의 알킬렌, 페닐, 및 이들의 임의의 조합체를 포함한다. 본 발명을 위해 적합한 아릴은 벤젠, 톨루엔, 크실렌, 에틸 벤젠, 파라실렌, 메타실렌 및 이들의 조합체를 포함한다.

본 발명에서 생성된 알콜은 4 내지 30개의 탄소원자를 갖는다. 몇몇 양태에서, 알콜은 사이클릭이다. 다른 양태에서, 알콜은 측쇄이다. 또 다른 양태에서, 알콜은 직쇄이다. 본 발명의 적합한 알콜은 부탄올, 펜탄올, 헥산올, 헵탄올, 옥탄올, 노난올, 데칸올, 운데칸올, 도데칸올, 트리데칸올, 테트라데칸올, 펜타데칸올, 헥사데칸올, 헵틸데칸올, 옥틸데칸올, 노닐데칸올, 에이코산올, 우네이코산올, 도에이코산올, 트리에이코산올, 테트라에이코산올 및 이들의 이성체를 포함하지만 이에 제한되지 않는다.

본 발명에서 생성된 케톤은 4 내지 30개의 탄소원자를 갖는다. 하나의 양태에서, 케톤은 사이클릭이다. 또 다른 양태에서, 상기 케톤은 측쇄이다. 또 다른 양태에서, 케톤은 직쇄이다. 본 발명을 위해 적합한 케톤은 부타논, 펜타논,헥사논, 헵타논, 옥타논, 노나논, 데카논, 운데카논, 도데카논, 트리데카논, 테트라데카논, 펜타데카논, 헥사데카논, 헵틸데카논, 옥틸데카논, 노닐데카논, 에이코사논, 우네이코사논, 도에이코사논, 트리에이코사논, 테트라에이코사논, 및 이들의 이성체를 포함하지만 이에 제한되지 않는다.

또 다른 상기 화학적 변형은 상호에스테르화이다. 천연적으로 생성된 글리세로지질은 지방산 성분의 균일한 분포를 갖지 않는다. 오일과 관련하여, 상호에스테르화는 상이한 글리세로지질의 2개의 에스테르간의 아실 라디칼의 교환을 언급한다. 상호에스테르화 공정은 글리세로지질의 혼합물의 지방산 성분이 재배열되어 분포 패턴을 변형시킬 수 있는 기작을 제공한다. 상호에스테르화는 널리 공지된 화학적 공정이고 일반적으로 알칼리 금속 또는 알칼리 금속 알킬레이트(예를 들어, 나트륨 메톡시드)와 같은 촉매의 존재하에 일정 시간(예를 들어, 30분)동안 오일의 혼합물을 가열(약 200℃로)함을 포함한다. 이러한 공정을 사용하여 오일 혼합물의 지방산 성분의 분포 패턴을 무작위화 할 수 있거나 목적하는 분포 패턴을 생성하도록 지시될 수 있다. 지질의 화학적 변형에 대한 상기 방법은, 지질로서 무수 세포 중량%가 적어도 20%인 미생물 바이오매쓰와 같은 본원에 제공된 물질에 대해 수행할 수 있다.

지방산의 특정 분포 패턴이 요구되는 직접적인 상호에스테르화는 존재할 수 있는 몇몇 TAG의 융점 미만의 온도에서 오일을 유지시킴에 의해 수행할 수 있다. 이것은 이들 TAG를 선택적으로 결정화하고 이는 이들이 결정화하으로써 반응 혼합물로부터 이들을 효과적으로 제거한다. 상기 방법은 예를 들어, 오일중 대부분의 지방산이 침전할때까지 계속할 수 있다. 지시된 상호에스테르화 방법은 예를 들어 장쇄 지방산의 단쇄 대응물로의 치환을 통해 보다 낮은 칼로리 함량을 갖는 생성물을 제조하기 위해 사용될 수 있다. 직접적인 상호에스테르화는 또한 원치않는 트랜스 이성체를 생성시킬 수 있는 수소화에 의지하는 것 없이 식품 부가물 또는 제품(예를들어, 마가린)에서 요구되는 목적하는 융점 특성 및 구조적 특징을 제공할 수 있는 지방 혼합물을 갖는 생성물을 제조하기 위해 사용될 수 있다.

본원에 기재된 방법에 의해 생성된 오일의 상호에스테르화는 하기에 보고된 바와 같이 방법 및/또는 물질중 하나 이상과 연계하여 또는 생성물을 생성하기 위해 수행할 수 있다: 미국 특허 제6,080,853호(비분해성 지방 대용물); 제4,288,378호 (피넛 버터 안정화제); 제5,391,383호(식용 스프레이 오일); 제6,022,577호(식품 생성물에 대한 식용 지방); 제5,434,278호(식품 생성물에 대한 식용 지방);제 5,268,192호(저칼로리 너트 생성물); 제5,258,197호(감소된 칼로리의 식용 조성물); 제4,335,156호(식용 지방 생성물); 제7,288,278호(식품 부가물 또는 의약); 제7,115,760호(분획 방법); 제6,808,737호(구조적 지방); 제5,888,947호(엔진 윤활제); 제5,686,131호(식용 오일 혼합물); 및 제4,603,188호(경화성 우레탄 조성물).

본 발명에 따른 하나의 양태에서, 이어서 상기된 바와 같은 오일의 트랜스에스테르화는 미국 특허 제6,465,642호에 보고된 바와 같이 트랜스에스테르화된 생성물을 폴리올과 반응시켜 폴리올 지방산 폴리에스테르를 생성시킨다. 상기 에스테르화 및 포화 공정은 하기와 같은 단계를 포함할 수 있다: 저급 알킬 에스테를 비누의 존재하에 폴리올과 반응시키는 단계; 생성물 혼합물로부터 잔여 비누를 제거하는 단계; 생성물 혼합물을 물 세척 및 건조시켜 불순물을 제거하는 단계; 정련을 위해 생성물 혼합물을 표백시키는 단계; 생성물 혼합물중에 폴리올 지방산 폴리에스테르로부터 미반응된 저급 알킬 에스테르의 적어도 일부를 분리하는 단계; 및 분리된 미반응된 저급 알킬 에스테르를 재활용하는 단계.

트랜스에스테르화는 또한 미국 특허 제6,278,006호에 보고된 바와 같은 단쇄 지방산 에스테를 갖는 미생물 바이오매쓰상에서 수행할 수 있다. 일반적으로, 트랜스에스테르화는 단쇄 지방산 에스테르를 적합한 촉매의 존재하에 오일에 부가하고 혼합물을 가열시킴에 의해 수행할 수 있다. 몇몇 양태에서, 상기 오일은 약 5중량% 내지 약 90중량%의 반응 혼합물을 포함한다. 몇몇 양태에서, 단쇄 지방산 에스테르는 반응 혼합물의 약 10중량% 내지 약 50중량%일 수 있다. 촉매의 비제한적인 예는 염기 촉매, 나트륨 메톡사이드, 황산 및 산성화된 점토와 같은 무기산, 메탄 설폰산, 벤젠설폰산 및 톨루엔설폰산과 같은 유기산 및 Amberlyst 15와 같은 산성 수지를 포함하는 산 촉매를 포함한다. 나트륨 및 마그네슘과 같은 금속 및 금속 수소화물은 또한 유용한 촉매이다.

또 다른 당해 화학적 변형은 하이드록실화이고 이는 물을 이중 결합으로 부가하여 하이드록실 잔기의 포화 및 혼입을 유도한다. 상기 하이드록실화 공정은 글리세로지질의 하나 이상의 지방산을 하이드록시 지방산으로 전환시키기 위한 기작을 제공한다. 하이드록실화는 예를 들어, 미국 특허 제5,576,027호에 보고된 바와 같은 방법을 통해 수행할 수 있다. 아주까리유를 포함하는 하이드록실화된 지방산 및 이의 유도체는 식품 첨가제, 계면활성제, 안료 습윤제, 소포제, 방수 첨가제, 가소화제, 화장품 유화제 및/또는 탈취제를 포함하는 다수의 산업 응용 분야 및 전자, 약제, 페인트, 잉크, 접착제 및 윤활제에서 성분으로서 유용하다. 글리세라이드가 하이드록실화되는 방법의 한가지 예는 다음과 같다: 지방은 바람직하게 헵탄과 배합하여 약 30 내지 50℃로 가열할 수 있고 30분 이상 동안 온도에 유지시키며; 이어서 아세트산을 혼합물에 첨가함에 이어서 황산 수용액, 과산화소수 수용액을 점진적 증가량으로 1시간 이상 동안 혼합물에 첨가하고; 수성 과산화수소 후에 온도를 이어서 약 60℃ 이상으로 증가시키고 6시간 이상 동안 교반시키고; 교반 후 상기 혼합물이 침강하도록 방치하고 반응에 의해 형성된 저급 수성 층을 제거하면서 반응에 의해 형성된 상부 헵탄층을 약 60℃의 온도를 갖는 고온수로 세척할 수 있고; 세척된 헵탄 층을 이어서 수산화칼륨 수용액을 사용하여 pH 약 5 내지 7로 중화시키고 이어서 진공 증류에 의해 제거할 수 있고; 반응 생성물을 이어서 100℃에서 진공 건조시킬 수 있고 건조된 생성물을 진공 조건하에 증기 탈취시키고 규조토를 사용하여 약 50℃ 내지 60℃에서 여과한다.

본원에 기재된 방법에 의해 생성된 미생물 오일의 하이드록실화는 하기에 보고된 바와 같이 상기 방법 및/또는 물질의 하나 이상과 연계하여 또는 생성물을 생성하기 위해 수행할 수 있다: 미국 특허 제6,590,113호(오일계 피복 및 잉크); 제4,049,724호(하이드록실화 반응); 제6,113,971호(올리브유 버터); 제4,992,189호 (윤활제 및 루브 첨가제); 제5,576,027호(하이드록실화된 밀크); 및 제6,869,597호 (화장품).

하이드록실화된 글리세로지질은 에스톨리드로 전환시킬 수 있다. 에스톨리드는 글리세로지질로 이루어지고 여기서, 하이드록실화된 지방산 성분은 또 다른 지방산 분자에 에스테르화시켰다. 하이드록실화된 글리세로리피드의 에스톨리드의 전환은 글리세로지질 및 지방산의 혼합물을 가온시키고 상기 혼합물을 문헌[참조: Isbell et al., JAOCS 71(2): 169-174 (1994)]에 기재된 바와 같이 무기산과 접촉시킴에 의해 수행할 수 있다. 에스톨리드는 제한없이 하기에 보고된 것들을 포함하는, 다양한 응용 분야에서 유용하다: 미국 특허 제7,196,124호(탄성 물질 및 바닥덮개); 제5,458,795호(고온 응용을 위한 증점 오일); 제5,451,332호(산업적 응용을 위한 유체); 제5,427,704호(연료 첨가제); 및 제5,380,894호(윤활제, 그리스, 기가소제 및 인쇄 잉크).

미생물 오일상에서 수행될 수 있는 다른 화학적 반응은 미국 특허 제6,051,539호에 보고된 바와 같이 트리아실글리세롤과 사이클로프로판화제와 반응시켜 유동성 및/또는 산화성 안정을 증진시키는는 것; 미국 특허 제6,770,104호에 보고된 바와 같이 트리아실글리세롤로부터 왁스를 제조하는 것; 및 문헌[참조: "The effect of fatty acid composition on the acrylation kinetics of epoxidized triacylglycerols", Journal of the American Oil Chemists' Society, 79:1, 59-63, (2001) and Free Radical Biology and Medicine, 37:1, 104-114 (2004)]에 보고된 바와 같이 트리아실글리세롤을 에폭시화시키는 것을 포함한다.

상기된 바와 같이 연료 및 화학적 생성물에 대한 오일 함유 마생물 바이오매스의 생성은 탈지된 바이오매쓰 밀을 생성시킨다. 탈지된 밀은 조류 오일을 제조하는데 있어서의 부산물이고 농장 동물, 예를 들어, 반추동물, 가금류, 돼지 및 양식물고기에 대한 동물 사료로서 유용하다. 수득한 밀은 오일 함량이 감소하였지만 여전히 단백질, 탄수화물, 섬유, 재, 잔류 오일 및 동물 사료에 적당한 다른 영양물 함량이 높다. 세포는 주로 오일 분리 공정에 의해 용해되기 때문에 탈지된 밀은 상기 동물에 의해 쉽게 소화될 수 있다. 탈지된 밀은 임의로 동물 사료에서 곡물과 같은 다른 성분과 배합될 수 있다. 탈지된 밀은 분말성 점도를 갖기 때문에 이것은 압출기 또는 확장기 또는 시판되는 다른 유형의 기계를 사용하여 펠렛으로 압착될 수 있다.

상기에서 상세하게 기재된 본 발명은 하기의 실시예에 예시되지만 이는 청구된 발명을 설명하기 위해 제공될 뿐 이에 제한되지 않는다.

VII. 실시예

실시예 1: 프로토테카를 배양하기 위한 방법

프로토테카 균주는 무수 세포 중량을 기준으로 높은 %의 오일을 성취하기 위해 배양하였다. 동결보존된 세포를 실온에서 해동시키고 500㎕의 세포를 4.5ml의 배지(4.2 g/L K₂HPO₄, 3.1 g/L NaH₂PO₄, 0.24 g/L MgSO₄·7H₂O, 0.25 g/L 시트르산 1수화물, 0.025 g/L CaCl₂ 2H₂O, 2g/L 효모 추출물) + 2% 글루코스에 첨가하고 6웰 플레이트에서 진탕(200rpm)과 함께 7일 동안 28℃에서 배양하였다. 무수 세포 중량은 1ml의 배양물을 예비 칭량된 에펜도르프 튜브에서 5분 동안 14,000 rpm에서 원심분리하여 결정하였다. 배양 상등액을 버리고 수득한 세포 펠렛을 1ml의 탈이온수로 세척하였다. 배양물을 다시 원심분리하고 상등액을 버리고 세포 펠렛을 동결될때까지 -80℃에 위치시켰다. 이어서 샘플을 24시간 동안 동결건조시키고 무수 세포 중량을 계산하였다. 배양물중 총 지질을 결정하기 위해, 3 ml의 배양물을 제거하고 제조업자의 프로토콜에 따라 Ankom 시스템(Ankom Inc., Macedon, NY)을 사용하여 분석하였다. 샘플은 제조업자의 프로토콜에 따라 Amkom XTlO 추출기로 용매 추출에 적용하였다. 총 지질은 산 가수분해된 무수 샘플 및 용매 용매 추출된 무수 샘플간의 샘플 차이로서 결정하였다. % 오일 무수 세포 중량 측정은 표 8에 나타낸다.

상기 표 22에 열거된 균주 기원의 미세조류 샘플을 유전자형으로 분류하였다. 게놈 DNA를 다음과 같이 조류 바이오매쓰로부터 분리하였다. 세포(대략 200mg)를 14,000 x g에서 5분 동안 배양물로부터 원심분리하였다. 세포를 이어서 멸균 증류수에 재현탁시키고 14,000 x g에서 5분 동안 원심분리하고 상등액을 버렸다. 직경이 약 2mm인 단일 유리 비이드를 바이오매쓰에 첨가하고 튜브를 15분 이상 동안 -80℃에 위치시켰다. 샘플을 제거하고 150 μl의 분쇄 완충액(1% 사르코실(Sarkosyl), 0.25 M 슈크로스, 50 mM NaCl, 20 mM EDTA, 100 mM Tris-HCl, pH 8.0, RNase A 0.5 ug/ul)을 첨가하였다. 펠렛을 간단히 볼텍싱하여 재현탁시키고 이어서 40㎕의 5M NaCl를 첨가하였다. 샘플을 간략하게 볼텍싱하고 이어서 66 μl의 5% CTAB (세틸 트리메틸암모늄 브로마이드)를 첨가하고 최종적으로 간략하게 볼텍싱하였다. 다음에 샘플을 10분 동안 65℃에서 배양하고 이후 이들을 10분 동안 14,000 x g에서 원심분리하였다. 상기 상등액을 새로운 튜브로 옮기고 300 μl의 페놀: 클로로포름: 이소아밀 알콜 12:12:1로 1회 추출함에 이어서 14,000 x g에서 5분 동안 원심분리하였다. 수득한 수성 상을 0.7 용적의 이소프로판올(약 190㎕)을 함유하는 새로운 튜브로 옮기고 뒤집어서 혼합하고 40℃에서 30분 동안 또는 밤새 실온에서 항온처리하였다. DNA를 10분 동안 14,000 x g에서 원심분리를 통해 회수하였다. 이어서 수득한 펠렛을 70% 에탄올로 2회 세척함에 이어서 100% 에탄올로 최종 세척하였다. 펠렛을 실온에서 20분 내지 30분 동안 공기 건조시킴에 이어서 50 μl의 1OmM TrisCl, 1mM EDTA (pH 8.0)중에 현탁시켰다.

상기된 바와 같이 제조된 5 μl의 총 조류 DNA를 10mM Tris(pH 8.0)중에서 1:50으로 희석시켰다. 최종 용적 20㎕의 PCR 반응물을 다음과 같이 셋-업하였다. 10 μl의 2 x iProof HF 마스터 믹스(BIO-RAD)를 0.4 μl의 프라이머 SZ02613 (10mM 스톡 농도에서 5'-TGTTGAAGAATGAGCCGGCGAC-3'(서열번호 9))에 첨가하였다. 상기 프라이머 서열은 GenBank 승인 번호 L43357에서 567번 내지 588번이고 고등 식물 및 조류 플라스티드 게놈에서 고도로 보존되어 있다. 이어서 0.4 μl의 프라이머 SZ02615 (10mM 스톡 농도에서 5'-CAGTGAGCTATTACGCACTC-S' (서열번호 10))를 첨가하였다. 상기 프라이머 서열은 GenBank 승인번호 L43357에서 1112번 내지 1093번 위치에 상보적이고 고등 식물 및 조류 플라스티드 게놈에서 고도로 보존되어 있다. 다음에, 5μl의 희석된 총 DNA 및 3.2 μl의 dH₂O를 첨가하였다. PCR 반응을 다음과 같이 수행하였다: 35사이클동안 98℃, 45"; 98℃, 8"; 53℃, 12"; 72℃, 20" 에 이어서 1분 동안 72℃에서 수행하고 25℃에 유지시킨다. PCR 생성물의 정제를 위해, 20 μl의 10 mM Tris(pH 8.0)를 각각의 반응물에 첨가하고 이어서 40 μl의 페놀:클로로포름:이소아밀 알콜 12:12:1로 추출하고, 볼텍싱하고 5분 동안 14,000 x g에서 원심분리한다. PCR 반응을 S-400 칼럼(GE Healthcare)에 적용하고 3,000 x g에서 2분 동안 원심분리하였다. 정제된 PCR 생성물을 이어서 PCR8/GW/TOPO으로 TOPO 클로닝하고 양성 클론을 LB/Spec 플레이트를 위해 선택하였다. 정제된 플라스미드 DNA를 M13 정배향 및 역배향 프라이머를 사용하여 양 방향으로 서열분석하였다. 전체적으로, 12개의 프로토테카 균주는 서열분석된 이들의 23S rRNA DNA를 갖도록 선택하고 상기 서열을 서열 목록중에 열거한다. 균주 및 서열 번호에 대한 요약은 하기에 포함된다. 상기 서열은 UTEX 1435(서열번호 15) 서열로부터 총 분기점에 대해 분석하였다. 2개의 쌍(UTEX 329/UTEX 1533 및 UTEX 329/UTEX 1440)이 가장 분기된 것으로서 나타났다. 양 경우에, 쌍형성 정렬은 75.0% 쌍형성 서열 동일성을 나타내었다. UTEX 1435에 대한 % 서열 동일성은 또한 하기에 포함된다.

상기된 균주의 서브셋트 기원의 지질 샘플은 HPLC를 사용하여 지질 프로필에 대해 분석하였다. 결과는 하기 표 9에 나타낸다.

조류 플라스티드 수송 펩타이드는 하기 실시예 12 및 실시예 11에 기재된 바와 같이 UTEX 1435 (프로토테카 모리포르미스) 또는 UTEX 250 (클로렐라 프로토테코이데스) cDNA 라이브러리의 분석을 통해 동정하였다. 다른 공지된 플라스티드 표적화된 단백질에 대한 BLAST 히트 상동성을 기초로 하는 잠재적 플라스티드 표적화된 단백질을 암호화하는 cDNA를 소프트웨어 프로그램 PSORT (http://psort.ims.u-tokyo.ac.jp/form.html), ChloroP (http://www.cbs.dtu.dk/services/ChloroP/) 및 TargetP (http://www.cbs.dtu.dk/services/TargetP/)에 의해 추가 분석하였다. 이들 3개의 프로그램중 하나 이상을 통해 동정된 후보물 플라스티드 수송 펩타이드는 이어서 적당한 게놈 DNA로부터 PCR 증폭시켰다. 하기에서는 상기 스크리닝으로부터 동정된 조류 플라스티드 표적화 서열(PTS)의 아미노산 서열을 요약한다. 또한 하기 실시예의 이종성 발현에서 사용되는 식물 지방 아실-ACP 티오에스테라제의 아미노산 서열이 포함된다.

실시예 2: 다양한 공급원료상에서 프로토테카의 배양

A. 수수

하기의 균주는 유일한 탄소원으로서 수수를 사용할 수 있는 것으로 나타났다: 프로토테카 모리포르미스 균주 UTEX 1435, UTEX 1437, UTEX 288, UTEX 1439, UTEX 1441 및 UTEX 1434, 및 프로토테카 스타그노라 균주 UTEX 1442. "UTEX" 표시는 기관[University of Texas, 1 University State A6700, Austin, Texas 78712-0183]의 조류 배양 수집물로부터 균주 번호를 지적한다.

순수 수수는 제조사[Maasdam Sorghum Mills (Lynnville, Iowa)]로부터 구입하였고 당 프로필은 프럭토스 21.0% w/w, 덱스트로스 28.0% w/w, 슈크로스 16.0% w/w 및 말토스 <0.5%w/w이다. 상기 배양물을, 유일한 탄소원으로서 2%, 5%, 또는 7% (v/v)의 순수 수수(순수 스톡으로부터 희석됨)를 함유하는 액체 배지에서 성장시키고 상기 용액은 약 350rpm에서 진탕시키면서 암실에서 종속영양으로 배양하였다. 배양물로부터 샘플을 24, 40, 48, 67 및 89시간째에 인출하고 성장은 분광측정기상에서 A750 판독을 사용하여 측정하였다. 성장은 도 1 및 2에서 보여진 바와 같이 시험된 균주 각각에 대해서 관찰되었다.

B. 셀룰로스

습윤 분해된 옥수수 스토버, 미스칸투스, 포라지 수수(forage sorghum), 비트 펄프 및 사탕 수수 바사지는 1.4% 황산 용액중에서 쿠킹하고 수득한 슬러리를 탕수시킴에 의해 제조원[National Renewable Energy Laboratory (Golden, CO)]으로부터 제조되었다. % 고체는 건조시킴에 의해 중량적으로 측정하였고 다음과 같았다: 옥수수 스토버, 25%의 고체; 미스칸투스, 28.7%의 고체; 포라지 수수, 26.7%의 고체; 및 사탕 수수 바사지, 26% 고체.

분해된 셀룰로스 물질(옥수수 스토버 또는 스위치 그래스)의 100그램 습윤 샘플을 탈이온수에 재현탁시켜 최종 용적 420ml까지 재현탁시키고 pH를 10N NaOH를 사용하여 4.8로 조정하였다. 비트 펄프에 대해, 9.8그램의 무수 고체를 탈이온수로 350ml가 되게 하고 pH를 10N NaOH를 사용하여 4.8로 조정하였다. 상기 모든 공급원료에 대해, 아셀러라제 1000 (Genencor, New York)을 셀룰로스 물질의 당화를 위해 무수 바이오매쓰의 그램당 0.25ml의 비율로 사용하였다. 샘플은 50℃에서 72시간 동안 진탕(110rpm)과 함께 항온처리하였다. 샘플 각각의 pH는 NaOH(무시할만한 용적 변화와 함께)를 사용하여 7.0으로 조정하고, 0.22㎛의 여과기를 통해 여과 멸균시키고 하기의 상세한 공정에서 사용하였다. 대규모 공정을 위해, 접선 유동 여과(TFF)의 추가의 단계 또는 미세여과 단계가 공급원료의 여과기 멸균을 도와주기기 위해 수행되는 것을 제외하고는 당화를 위한 동일한 과정에 따른다. 제조된 각각의 공급원료 기원의 샘플은 HPLC/ELSD계 시스템 또는 헥소키나제계 키트 (Sigma)를 사용하여 글루코스 및 크실로스 농도의 결정을 위해 보존하였다. 추가로, 비트 펄프를 위해, 상기 물질을 처음에 다른 공급원료와 같이 용적으로 하고 이어서 pH를 4.0으로 조정하고 펙티나제 처리는 24시간 동안 50℃에서 수행하였다. 이어서, pH는 어떠한 세척 단계가 수행되지 않는 경우 4.8로 조정하고 세척 단계가 수행되는 경우에는 5.3으로 조정하였다. 이어서 효소적 당화는 상기된 다른 공급원료를 위해 사용된 동일한 과정을 사용하여 수행하였다.

미세조류 프로토테카 모리포르미스 균주 UTEX 1435는 상기된 바와 같이 제조된 일련의 셀룰로스 공급원료(옥수수 스토버, 비트 펄프, 슈가 케인, 미스칸투스 및 글루코스 대조군)상에서 성장하는 능력에 대해 평가하였다. 미세조류 배양물은 탄소원을 제외하고는 상기 실시예 1에 기재된 조건에서 성장시켰다. 탄소원은 셀룰로스 물질에서 가용한 글루코스에 의한 측정시 4% 글루코스(대조군 조건에 대해) 또는 4% 글루코스였다. 성장은 A750의 판독으로 평가하고 배양 시간은 168시간이었고 A50 판독값은 배양 개시 후 48, 72, 96, 120, 144 및 168시간에 대한 것이다. 도 7a에 나타낼 수 있는 바와 같이, 프로토테카 모리포르미스 배양물이 옥수수 소토버에서 가장 잘 성장하였다. 사용되는 다른 셀룰로스 공급원료, 미스칸투스, 사탕 수수 및 비트 펄프 모두는 성장 억제를 나타내었다.

옥수수 스토버 유래된 셀룰로스 당을 사용한 상기 결과를 토대로, 지질 축적은 또한 상이한 수준의 옥수수 스토버 유래된 셀룰로스 당 및 대조군으로서 시약 당을 사용하여 프로토테카 모리포르미스에서 평가하였다. 배양물을 완전히 옥수수 스토버 유래된 셀룰로스 당(도 7b에서 100% 옥수수 스토버 조건) 기원의 18g/L 글루코스, 9g/L 시약 글루코스가 보충된 옥수수 스토버 유래된 셀룰로스 당(도 7b에서 18g/L 조건으로 글루코스가 보충된 50% 옥수수 스토버) 기원의 9g/L 글루코스, 옥수수 스토버 유래된 셀룰로스 당(50% 옥수수 스토버, 보충되지 않음; 도 7b에서 9g/L 조건에서의 글루코스) 기원의 9g/L 글루코스 및 42g/L 시약 글루코스의 대조군 배양물 및 삼투압 조절을 위한 13g/L의 시약 크실로스중에서 성장시켰다. 모든 배양물에는 시약 글루코스가 공급되어 글루코스 농도를 20g/L로 유지하는 대조군 배양물을 제외하고는 셀룰로스 당을 공급하여 글루코스 농도를 20g/L로 유지시킨다. 성장은 배양물의 무수 세포 중량을 기준으로 측정하고 지질 생산성은 % 무수 세포 중량으로서 측정하였다. 총 지질은 상기 실시예 1에 기재된 바와 같이 안콤산 가수분해/용매 추출 시스템을 사용하여 중량적으로 측정하였다.

도 7b에서 알 수 있는 바와 같이, 바이오매쓰 축적을 기준으로(DCW에 의해 측정된 바와 같이), 옥수수 스토버 유래딘 셀룰로스의 모든 농도는 단독의 글루코스가 공급된 대조군 배지를 능가하였다(보다 높은 DCW). DCW의 %로서 지질 생산은 또한 모든 조건에 대해 계산하였다. 옥수수 스토버상에서의 성장에 대해 나타낸 보다 높은 바이오매쓰 축적에 추가로, 지질 축적은 또한 글루코스 대조군 조건과 비교하여 옥수수 스토버 유래된 셀룰로스 조건에서 보다 높았다. 이들 데이타는 셀룰로스 유래 당을 제공하는 것 뿐만 아니라 옥수수 스토버가 추가의 영양물/성분을 제공하여 증가된 바이오매쓰 축적(성장) 및 증가된 생성물 수율에 기여함을 입증한다.

셀룰로스 공급원료는 글루코스에 추가로 성분을 함유하고 있기 때문에 이들 추가의 성분의 일부는 배양 동안에 보다 많은 셀룰로스 유래 당이 주요 탄소원(보통 글루코스이지만 이에 제한되지 않음)이 소비됨에 따라 배양물에 공급되어 배양 동안에 목적하지 않은 수준까지 축적할 수 있다. 예를 들어, 셀룰로스 유래 당 공급원료에 존재하는 크실로스는 미세조류의 성장 및 최종 생성물 생산을 억제하는 수준까지의 고밀도 배양 동안에 증강될 수 있다. 프로토테카 배양 동안에 증가된 크실로스의 효과를 시험하기 위해, 배양물은 배지에서 4%의 글루코스와 함께 성장시키고 0, 10 g/L, 25 g/L, 50 g/L 및 100 g/L의 크실로스 보충하였다. 배양 6일 후, 성장 및 지질 축적은 상기된 방법을 사용하여 평가하였다. 도 7c에 나타낸 바와 같이, 놀랍게도 시험된 크실로스의 최고 농도는 프로토테카 모리포르미스가 성장하고 지질을 축적하는 능력을 억제하지 않았고 상기 배양물은 실제로 보다 우수하게 성장하고 최고의 크실로스 농도에서 보다 많은 지질을 축적시켰다. 상기 현상을 분석하기 위해, 유사한 실험은 야생형 프로토테카 모리포르미스가 대사할 수 없는 탄소원인 슈크로스를 사용하여 수행하였다. 어떠한 양성 효과가 슈크로스를 사용해서는 관찰되지 않았고 이것은 크실로스에 대해서 나타나는 증가된 성장 및 지질 축적이 배지에서 고농도의 대사되지 않은 성분으로부터의 삼투압 스트레스 이외의 기작에 기여할 수 있고 크실로스 특이적임을 시사한다.

대사되지 않은 당에 추가로, 염은 리그노셀룰로스 유래 당을 농축시키는 결과로서 억제 수준까지 축적할 수 있다. 셀룰로스 물질의 전형적인 제조동안에 H₂SO₄를 사용한 산 가수분해 단계에 이어서 NaOH를 사용한 산의 중화로 인해, Na₂SO₄는 리그노셀룰로스 당의 생성동안에 형성된다. 성장 및 지질 생산에 대한 염 농도의 효과를 평가하기 위해, 프로토테카 모리포르미스 배양물을 4% 글루코스가 보충된 배지에서 0 내지 700mM 범위의 Na₂SO₄ 농도에서 성장시켰다. 도 7d에 나타낸 바와 같이 DCW 축적에 의한 측정시 상당한 성장의 억제가 관찰되었고, 이때 Na₂SO₄ 농도는 25mM을 초과하여 구체적으로 80mM, 240mM 및 700mM 농도였다. 추가로, 소포제 P2000의 효과는 동일한 시험에서 평가하였다. 소포제 화합물은 바이오매쓰 생산성에 대해 상당한 양성 효과를 나타냈다. 지질 생산성은 또한 각각의 조건을 위해 평가하고 80mM 초과, 구체적으로 240mM 및 700mM의 Na₂SO₄ 농도는 억제성이었고 소포제 P2000의 첨가는 지질 생산성을 상당히 증가시켰다. 따라서, 하나의 양태에서, 본 발명의 방법의 배양 단계는 소포제를 함유하는 배지에서 배양시킴을 포함한다.

상기 논의되고 도 7a에 요약된 결과를 토대로, 억제제는 불량한 성장을 나타내는 셀룰로스 공급원료에 존재할 가능성이 있었다. 본 발명은 고온수(열수 처리)로 물질을 세척함에 의해 상기 화합물을 제거하는 수단을 제공한다. 도 8은 단일 고온수 세척과 함께 셀룰로스 공급원료로부터 유래된 당을 사용한 A750에 의한 측정시 성장 결과를 요약한다. 배양 조건은 도 7a에 요약된 공정에 사용되는 것들과 동일하다. 도 7a에 나타낸 결과와 비교하여, 단 1회 고온수 세척 후, 프로토테카 모리포르미스 배양물은 글루코스 대조군과 비교하여 시험된 모든 셀룰로스 공급원료, 특히 사탕 수수 바사지, 사탕 수수, 미스캔투스 및 비트 펄프에서 보다 우수하게 성장하였다. 지질 생산성은 또한 각각의 조건에서 평가하였다. 글루코스 대조군에 필적할 수 있는 비트 펄프 조건을 제외하고는 1회 고온수 세척에 적용된 셀룰로스 물질로부터 유래된 당에서 성장한 배양물은 글루코스 대조군보다 양호한 지질 생산성을 나타내었다.

셀룰로스 바이오매쓰의 열수 처리(고온수 세척)에 대한 하나의 잠재적인 효과는 물질의 산 분해에 의해 방출되는 푸르푸랄 및 하이드록시메틸 푸르푸랄의 제거이다. 푸르푸랄 및 하이드록시메틸 푸르푸랄의 존재는 도 7a에 요약된 몇몇 공정에서 관찰된 제한된 성장에 기여할 수 있었다. 열수 처리가 푸르푸랄(FA) 및 하이드록시메틸 푸르푸랄(HMF)의 수준에 어떻게 영향을 주는가를 평가하기 위해, 사탕수수 바가스(B), 사탕 수수(S), 미스캔투스(M) 또는 비트 펄프(BP)로부터 유래된 셀룰로스 바이오매쓰의 1 내지 3회 세척으로부터 수득한 상등액을 HPLC에 의해 FA 및 HMF에 대해 분석하였다. 도 8에 나타낸 바와 같이, FA 및 HMF 수준은 각 세척 단계와 함께 상당히 감소한다. 상기 결과는 FA 및 HMF가 (도 7a에 나타낸 바와 같이) 미세조류 성장을 억제할 수 있고 열수처리가 이들 화합물을 제거하고 대조군 글루코스 조건에서의 성장(도 8에 나타낸 바와 같이) 보다 더 우수한 성장을 유도한다는 관찰과 일치한다.

다양한 열수 처리된 리그노셀룰로스 유래된 당상에서 성장한 프로토테카 모리포르미스 배양물의 지질 프로필에 대한 효과를 평가하였다. 프로토테카 모리포르미스 배양물을 하기의 4회 세척된 셀룰로스 공급원료상에서 성장시켰다: 셀룰로스 당의 공급을 통해 당 수준이 20g/L로 유지되는 매스캔투스, 사탕 수수 바사지 및 수수 케인. 배양을 종료 시점에 각각의 조건으로부터 미세조류 바이오매쓰는 실시예 1에 기재된 방법을 사용하여 지질 프로필에 대해 분석하였다. 지질 프로필 분석(면적%로 표시) 결과는 하기 표 10에 요약한다. 각각의 조건을 2회 시험하고 2회 시험 각각으로부터의 결과가 포함된다. 셀룰로스 공급원료상에서의 성장은 글루코스 대조군과 비교하여 지질 프로필이 상당히 재분포된다. 예를 들어, 글루코스 대조군 조건과 비교하여 셀룰로스 공급원료 조건 모두에서 C18:0 면적%가 상당히 증가하였다.

n.d.는 검출되지 않았음을 나타낸다

셀룰로스 당 스트림은 분해된 옥수수 스토버로부터 생성시키고 아셀러라제 효소를 사용하여 당화시키고 진공 증발을 사용하여 농축시켰다. 상기 당 스트림은 4% 글루코스 농도에서 프로토테카 모리포르미스 성장 분석에서 시험하였다. 성장 분석 결과는 매우 불량한 성장을 보여주고 셀룰로스 당 스트림은 전도성(염 함량)에 대해 시험하였다. 상기 전도성은, 상기된 바와 같고 도 7d에 나타낸 바와 같은 성장에 억제성인 것으로 보여지는 수준인 700mM 나트륨 등가물 보다 훨씬 높았다. 본 발명의 방법은 리그노셀룰로스 유래 미세조류 오일의 생산에서 이들 공급원료를 사용하기 전에 리그노셀룰로스 유래 당으로부터 염이 감소되거나 제거되는 방법을 포함한다. 그러나, 당업자는 놀랍게도 농축된 당 스트림을 탈염시키기 위해 수지를 사용할 수 없고 농축된 당 스트림을 먼저 희석시켜야만 한다. 이러한 양태의 발명을 입증하기 위해, 옥수수 스토버 물질로부터 유래된 셀룰로스 당을 수지를 사용하여 오염된 염을 제거하기 전에 8배 희석시켰다. 농축된 출발 물질의 초기 전도성은 87 mS/cm이었고 8배 희석된 스트림의 전도성은 pH 5.61에서 10990 μS/cm이었다. 이전의 연구는 탈이온전에 농축된 당 스트림을 희석시키지 못하여 당 스트림으로부터 글루코스의 상당한 손실 뿐만 아니라 염을 정량적으로 제거할 수 없었음을 지적하였다. IEX 수지(DOWEX Marathon MR3)의 3가지 상이한 상 용적을 사용하였다(1:2, 1:4 및 1:10). 표 11은 희석된 공급원료에서 이전에 농축된 옥수수 스토버 유래의 셀룰로스 당 스트림에서 염을 상당히 감소시키기 위해(전도성 측정시) 혼합된 상 이온 교환(IEX) 수지의 능력을 입증하는 결과를 요약하고 있다.

1:4 상 용적:셀룰로스 공급원료를 사용하는 방법 및 물질의 8배 재농축은 나트륨 농도가 정상적인 바이오매쓰 및 지질 축적을 위한 범위내에 있도록 한다. 또는, 탈이온화 또는 염 제거는 당화 전에 또는 당화 후에 수행할 수 있지만 당 스트림의 농축 전일 수 있다. 염 제거가 당 스트림의 농축 전에 수행되는 경우, 염 제거전에 당 스트림의 희석 단계가 필수적이지 않을 수 있다.

상기 실시예는 셀룰로스 오일 생산에 사용하기 위한 분해된 셀룰로스 물질의 세척 효능을 입증한다. 상기된 바와 같이, 염 제거 없이 셀룰로스 유래 당(분해된 셀룰로스 물질 및 후소적 처리에 고유한)의 농축은 최적 이하의 발효를 유도하였다. 하기된 방법으로 처리된 물질은 후속적 당화를 위해 적당한 pH를 가졌다. 또한, 상기 물질의 전도성은 출발 공급원료부터 상당히 감소(100배 이상)하였다. 따라서, 발효에 사용될 후속적인 농축된 당은 과량의 염의 존재로 인한 억제성이 아니었다. 추가의 잇점은 셀룰로스 물질로부터 푸르푸랄의 제거에 의해 나타난다. 헤미셀룰로스 분획에서 제거된 크실로스 또는 글루코스는 처분되거나 바람직하게 발효에 사용하기 위해 재농축될 수 있다.

65kg의 습윤 중량의 초기 출발 질량을 갖고 15,000 μS/cm의 전도성(pH 2.4)을 갖는 습윤 분해된 사탕 수수 바사지(NREL, Colorado)는 탈이온수로 128kg이 되게하고 pH를 10N NaOH를 사용하여 4.6으로 조정하므로써 수득한 전도성이 6,800 μS/cm이 되게하였다. % 고체는 테어드(tared)(중량=t) 알루미늄 팬으로 현탁된 물질 분취액을 제거하고 습윤 중량(중량 = w)을 기록함에 이어서 110℃에서 3시간 동안 건조시켜 평가하였다. 무수 샘플을 데시케이터로 제거하고 이 시점에서 실온(25℃)이 되게 방치시킨 후, 이들을 다시 칭량한다(중량 = d). % 고체는 다음과 같이 계산하였다: % 고체 = [(d-t/w-t)]x 100. 전도성은 열 전자 오리온 3 스타 전도성 계측기(Thermo Electron Orion 3 Star Conductivity meter)상에서 측정하였다.

사탕 수수 바사지는 스테인레스 반응기(150L 용량)에서 50℃의 온도에서 셀룰로스 슬러리(8.2%의 초기 % 고체)를 연속으로 혼합함에 의해 반 연속 양상으로 세척하였다. 셀룰로스는 유속 1.9-3.8 kg/분으로 회전 로드 펌프를 통해 반응기 용기로부터 Sharpies Model 660 데칸터 원심분리기로 방출시켰다. 액체 침투물은 배치식으로 유지시키고(약 35 내지 175kg 분취액, 하기 표 12 참조) 균질의 분취액을 표 12에 기재된 바와 같이 총 당(글루코스 및 크실로스) 및 % 고체의 평가를 위해 제거하였다. 셀룰로스 물질의 전도성 및 pH는 각각 탈이온수 및 10N NaOH의 첨가를 통해 조절하였다. 표 12에서 샘플 1-10은 버려진 원심분리 침투물을 나타내고 그와 같이, 이들 분획중에 존재하는 고체 및 당은 최종 세척된 셀룰로스 물질로부터 제거한다. 제거된 고체와 비교하여 총 고체 - 손실된 고체 + 당화를 위한 최종 고체의 질량 균형 계산은 상기 공정에서 99%의 회수율을 유도하였다. 도 8은 수거되고 표 12에 기재된 11개의 원심분리 침투물 각각에서 푸르푸랄 및 하이드록시메틸 푸르푸랄 농도(mg/L)를 요약한다. 이들 데이타는 사탕 수수 바사지로부터 루프푸랄 및 하이드록시메틸 푸르푸랄의 명백한 제거를 입증한다.

프로토테카가 셀룰로스 유래된 공급원료를 사용하는 능력에 대한 또 다른 입증에서, 프로토테카 모리포르미스(UTEX 1435)를 고정된 탄소 공급원료로서 셀룰로스 유래 당을 사용하여 3리터의 생물반응기에서 배양하였다. 상기 접종물은 실온에서 해동시킨 동결보존된 세포로부터 제조하고 1ml의 세포를, 1 g/L (NH₄)₂SO₄, 4 g/L 효모 추출물 및 미량 원소 용액 +4% 글루코스를 사용하는 실시예 1에 기재된 기본 미세조류 배지를 기초로 하는 300ml의 접종 배지에 첨가하고 진탕(200rpm)과 함께 28℃에서 1일 동안 성장시켰다. 상기 배양물을 1L 배지 + 0.26ml의 Antifoam 204(Sigma, USA)를 함유하는 3리터 생물반응기에 접종하는데 사용하였다. 발효기는 28℃로 조정하고 pH를 KOH를 첨가하여 6.8로 유지시켰다. 용존 산소는 단계적 교반과 공기주입에 의해 30% 포화로 유지시켰다. 옥수수 스토버 기원의 셀룰로스 당 공급원료를 배양물에 주입하여 0 내지 10g/L의 글루코스를 유지시켰다. 셀룰로스 당 공급원료를 300mM 미만의 염으로 탈염시키는 것이 정제된 당 공급원료 대조군에 비해 유사한 무수 세포 중량 및 지질 축적 수행능을 보장하는데 필수적이다. 셀룰로스 당 공급원료의 탈염은 상기된 방법을 사용하여 수행하였다. 발효기 샘플은 발효 수행능을 모니터링하기 위해 제거하였다. 세포 매쓰 축적은 광학 밀도 및 무수 세포 중량으로 모니터링하였다. 글루코스, 크실로스, 암모니아, 칼륨, 나트륨 및 푸르푸랄 농도는 또한 발효 과정 전반에 걸쳐 측정하고 모니터링하였다. 지질 농도는 상기 논의된 중량 측정 방법에 의해 측정하였다.

실시예 3: 프로토테카를 형질전환시키는 방법

A. 프로토테카의 유전자주입 형질전환을 위한 일반적인 방법

제조원[Seashell technology]으로부터 시판되는 S550d 골드 캐리어를 제조업자의 프로토콜에 따라 제조하였다. 선형화된 플라스미드 (20 μg)를 50 μl의 결합 완충액과 60 μl (30 mg)의 S55Od 골드 캐리어와 혼합하고 1분 동안 빙상에서 항온처리하였다. 침전 완충액(100 μl)을 첨가하고 상기 혼합물을 또 다른 1분 동안 빙내에서 항온처리하였다. 볼텍싱한 후, DNA-피복된 입자를 10초 동안 에펜도르프 5415C 소형원심분리기내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500 μl의 냉 100% 에탄올로 1회 세척하고, 소형원심분리기에서 간단히 회전시켜 펠렛화하고 50 μl의 빙냉 에탄올로 재현탁시켰다. 간략한 (1 내지 2초) 초음파 처리 후, 10 μl의 DNA-피복된 입자를 즉시 캐리어 막으로 이동시켰다.

프로토테카 균주를 이의 세포 밀도가 2 x 10⁶ 세포/ml가 될 때까지 회전 진탕기상에서 프로테오스 배지(2g/L 효모 추출물, 2.94mM NaNO3, 0.17mM CaC12ㆍ2H2O, 0.3mM MgSO4ㆍ7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl)내에서 성장시켰다. 상기 세포를 수거하고 멸균 증류수로 1회 세척하고 50 μl의 배지에 재현탁시켰다. 1 x 10⁷ 세포를 비선택적 프로테오스 배지 플레이트의 3번째 중앙에 도말하였다. 상기 세포를 PDS-1000/He 유전자주입 입자 전달 시스템(Biolistic Particle Delivery system )(Bio-Rad)으로 충격을 가했다. 파열 디스크(1100 및 1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 어셈블리 9 및 12cm 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회복시 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100 μl의 배지와 혼합하고 적당한 선별 항생제를 함유하는 플레이트상에 도말하였다 25℃에서 배양 7 내지 10일 후에, 1100 및 1350 psi 파열 디스크로부터 및 9 및 12cm 거리로부터 플레이트상에 형질전환 세포를 나타내는 콜로니가 확인되었다. 콜로니를 집어내고 제2 차 선별용 선택 한천 플레이트상에 스팟팅하였다.

B. G418 내성 유전자를 사용한 프로토테카의 형질전환

G418에 민감한 프로토테카 모리포르미스 및 다른 프로토테카 균주는 하기된 방법을 사용하여 형질전환시킬 수 있다. G418은 80S 리보솜의 기능을 억제하여 단백질 합성을 억제하는 아미노글리코시드 항생제이다. 상기 상응하는 내성 유전자는 인산화를 통해 기능하고 G418을 불활성화시킨다. 프로토테카 균주 UTEX 1435, UTEX 1439 및 UTEX 1437은 형질전환을 위해 선택하였다. 모든 3개의 프로토테카 균주는 상기된 방법을 사용하여 유전자형 분류하였다. 모든 3개의 프로토테카 균주는 동일한 23s rRNA 게놈 서열(서열번호 15)을 가졌다.

모든 형질전환 카세트는 EcoRI-SacI 단편으로서 pUC19에 클로닝하였다. 표준 분자 생물학 기술은 문헌[참조: Sambrook and Russell, 2001]에 따른 모든 벡터의 작제에 사용하였다. 클라미도모나스 레인하르드티(C. reinhardtii) 베타-튜불린 프로모터/5 'UTR을 플라스미드 pHyg3 (문헌참조: Berthold et al, (2002) Protist: 153(4), pp 401-412)로부터 EcoRI-AscI 단편으로서 PCR에 의해 수득하였다. 클로렐라 불가리스 니트레이트 리덕타제 3'UTR은 하기의 프라이머 쌍을 사용한 PCR을 통해 UTEX 균주 1803으로부터 분리된 게놈 DNA로부터 수득하였다:

정배향:

5' TGACCTAGGTGATTAATTAACTCGAGGCAGCAGCAGCTCGGATAGTATCG 3'

(서열번호 35)

역배향:

5' CTACGAGCTCAAGCTTTCCATTTGTGTTC CCATCCCACTACTTCC 3'

(서열번호 36)

클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터/UTR은 하기의 프라이머 쌍을 사용하여 UTEX 균주 1230으로부터 분리된 게놈 DNA의 PCR을 통해 수득하였다:

정배향: 5' GATCAGAATTCCGCCTGCAACGCAAGG GCAGC 3' (서열번호 37)

역배향: 5' GCATACTAGTGGCGGGACGGAGAGA GGGCG 3' (서열번호 38)

코돈 최적화는 프로토테카 모리포르미스을 위한 표 1의 코돈을 기준으로 하였다.

비-코된 최적화된 네오마이신 포스포트랜스퍼라제(nptII) 카세트의 서열은 AscI-XhoI 단편으로서 합성하고 GenBank 승인번호 YP_788126을 기준으로 하였다. 코돈 최적화된 nptII 카세트는 또한 상기 GenBank 승인 번호를 기초로 하였다.

3개의 프로토테카 균주를 상기된 유전자주입 방법을 사용하여 형질전환시켰다. 간략하게, 상기 프로토테카 균주는 종속영양으로 이들의 목적하는 세포 밀도(1 x 10⁷ 세포/ml 내지 5 x 10⁷ 세포/ml)가 될때까지 2% 글루코스를 함유하는 액체 배지에서 성장시켰다. 상기 세포를 수거하고 멸균 증류수로 1회 세척하고 1 x 10⁸ 세포/ml로 재현탁시켰다. 이어서 0.5mL의 세포를 비-선택 고체 배지 플레이트상에 도말하고 멸균 후드에서 건조되도록 방치하였다. 세포를 PDS-1000/He 유전자주입 입자 전달 시스템(BioRad)을 사용하여 충격을 가하였다. 상기 세포가 24시간 동안 25℃에서 회복하도록 방치하였다. 회복 즉시 세포를 1ml의 멸균 배지로 플레이트를 세척하고 100μg/mL의 G418을 함유하는 새로운 플레이트로 이동시켜 제거하였다. 세포가 멸균 후드에서 건조되도록 방치하고 콜로니가 3주 이하동안 실온에서 상기 플레이트상에 나타날때까지 방치하였다. UTEX 1435, UTEX 1439 및 UTEX 1437의 콜로니를 집어내고 제2차 선별을 위해 선택 한천 플레이트상에 스팟팅하였다.

상기된 제2차 선택으로부터 생존한 콜로니 서브세트를 작은 용적으로 배양하고 게놈 DNA 및 RNA를 표준 분자 생물학 방법을 사용하여 추출하였다. 서던 블롯은 비형질전환된(WT) 야생형 및 형질전환체로부터 추출된 게놈 DNA 및 플라스미드 DNA에 대해서 수행하였다. 각각의 샘플 기원의 DNA를 하기의 처리 후에 0.8% 아가로스 겔에 적용하였다: 비분해된(U), AvrII(A)로 분해된, NcoI(N)로 분해된, SacI(S)로 분해된. 상기 겔 기원의 DNA를 Nylon+ 막(Amersham)상에 블롯팅하였다. 이들 막을 nptII 유전자(NeoR 프로브)의 전체 암호화 영역에 상응하는 단편으로 탐침시켰다. 도 4는 형질전환에 사용되는 카세트의 맵을 보여준다. 도 5는 베타-튜불린::neo::nit(서열번호 39)(형질전환체 1 및 2) 또는 글루타메이트 데하이드로게나제 :neo:nit(서열번호 40)(형질전환체 3)로 형질전환된 3개의 형질전환체(모두는 UTEX 균주 1435)(1, 2 및 3)에 대한 서던 블롯 분석 결과를 보여준다. 글루타메이트 데하이드로게나제:neo:nit 형질전환 플라스미드를 대조군으로서 적용하고 NcoI 및 SacI로 절단하였다. AvrII는 상기 플라스미드에서 절단하지 않는다. 비형질전환된 UTEX 균주 1435로부터 분리된 게놈 DNA는 NeoR 프로브와의 하이브리드화를 나타내지 않는다.

코돈 최적화된 글루타메이트 데하이드로게나제:neo:nit(서열번호 41) 및 코돈 최적화된 β-튜불린::neo::nit(서열번호 42) 작제물을 함유하는 추가의 형질전환체를 집어내고 서던 블롯 분석으로 분석하였다. 예상된 바와 같이, SacI을 사용한 분해물만이 선형화된 형질전환 DNA를 나타낸다. 이들 형질전환 반응은 형질전환 플라스미드의 올리고머 형태로 발생하는 통합 반응과 일치한다. 형질전환 플라스미드 DNA를 절단하는 제한 효소를 사용한 분해시에 만, 이들 분자는 형질전환 플라스미드 크기 미만으로 붕괴한다.

서던 블롯 분석은 또한 글루타메이트 데하이드로게나제::neo::nit 카세트를 사용한 프로토테카 균주 UTEX 1437 및 UTEX 1439의 형질전환시 생성된 형질전환체에 대해 수행하였다. 상기 블롯은 NeoR 프로브 프로브로 탐침하였고 상기 결과는 UTEX 1435 형질전환체와 유사하다. 상기 결과는 형질전환 플라스미드의 올리고머화 및 통합을 특징으로 하는 통합 반응을 나타낸다. 상기 유형의 통합 반응은 딕티오스텔리움 디스코이데움(Dictyostelium discoideum)에서 매우 통상적으로 발생하는 것으로 공지되어 있다(문헌참조: 예를 들어, Kuspa, A. and Loomis, W. (1992) PNAS, 89:8803-8807 and Morio et al., (1995) J. Plant Res. 108: 111-114).

형질전환 플라스미드의 발현을 추가로 확인하기 위해, 노던 블롯 분석 및 RT-PCR 분석은 선택된 형질전환체에 대해 수행하였다. RNA 추출은 제조업자의 지침에 따라 Trizol 시약을 사용하여 수행하였다. 노던 블롯 분석은 문헌[참조: Sambrook and Russel, 2001]에 공개된 방법에 따라 수행하였다. 5개의 UTEX 1435 형질전환체 및 비형질전환된 UTEX 1435(대조군 레인)으로부터 분리된 총 RNA (15 μg)을 1% 아가로스-포름알데하이드 겔상에서 분리하고 나일론 막상에 블롯팅하였다. 상기 블롯은 형질전환체 1 및 3에서 전이유전자 서열에 특이적인 neo-비-최적화된 프로브에 하이브리드화하였다. 2개의 다른 형질전환체 RNA는 예상된 바와 같이 neo-전이유전자의 코돈 최적화된 버젼을 발현하고 최적화된 neo 유전자와 비최적화된 neo 유전자간의 서열 상동성을 기준으로 상당히 낮은 하이브리드화 시그날을 나타냈다.

RNA (1 μg)를 비형질전환된 프로토테카 균주 UTEX 1435 및 2개의 대표적인 UTEX 1435 형질전환체로부터 추출하고 올리고 dT 프라이머 또는 유전자 특이적 프라이머를 사용하여 역전사시켰다. 이어서 이들 cDNA (이중)를 하기의 프라이머(nptII)를 사용하여, SYBR-Green qPCR 화학물질을 사용하는 ABI Veriti 열 순환기상에서 qPCR 분석에 적용하였다:

정배향: 5' GCCGCGACTGGCTGCTGCTGG 3' (서열번호 43)

역배향: 5' AGGTCCTCGCCGTCGGGCATG 3' (서열번호 44)

가능한 게놈 DNA 오염은 역전사효소 음성 대조군 샘플을 사용하지 않음에 의해 배제되었다. 상기 결과는 상기 균주를 형질전환시키기 위해 사용되는 NeoR 유전자가 형질전환체에서 활성적으로 전사됨을 지적했다.

C. 분비된 이종성 슈크로스 인버타제를 사용한 프로토테카의 형질전환

모든 하기의 실험은 미국 특허 제5,900,370호에 기재된 미량 무기물 및 1x DAS 비타민 칵테일(1000x 용액): 트리신: 9g의 티아민 HCL: 0.67g의 비오틴: 0.01g의 시아노코발라민(비타민 B 12): 0.008g의 칼슘 판토테네이트: 0.02g 및 p-아미노벤조산: 0.04g의 첨가와 함께 문헌[참조: Ueno et al., (2002) J Bioscience and Bioengineering 94(2): 160-65]에 기재된 기본 배지를 기본으로하는 액체 배지/한천 플레이트를 사용하여 수행하였다.

2개의 플라스미드 작제물은 표준 재조합 DNA 기술을 사용하여 어셈블리하였다. 효모 슈크로스 인버타제 유전자(최적화된 하나의 코돈 및 최적화된 하나의 비코돈)인 suc2를 클라미도모나스 레인하르드티 베타-튜불린 프로모터/5' UTR의 조절하에 있도록 하고 클로렐라 불가리스 니트레이트 리덕타제 3' UTR을 가졌다. 비-코돈 최적화된 (Crβ-tub::NCO-suc2::CvNitRed) 작제물, 서열번호 57 및 코돈 최적화된(Crβ-tub::CO-suc2::CvNitRed) 작제물, 서열번호 58에 대한 서열(5' UTR 및 3' UTR 서열을 포함하는)은 서열목록에 열거되어 있다. 코돈 최적화는 프로토테카 종에 대한 표 1을 기초로 하였다. 도 6은 관련 제한 클로닝 부위를 갖는 2개의 작제물을 도시하고 화살표는 전사 방향을 나타낸다. 선택은 NeoR에 의해 제공되었다(표 1의 코돈 최적화된).

DNA/골드 미세캐리어의 제조: DNA/골드 마이크로캐리어를 사용직전에 제조하고 마크로캐리어에 적용할때까지 빙상에 저장하였다. 상기 플라스미드 DNA (TE 완충액중)를 50 μl의 결합 완충액에 첨가하였다. 골드 비드의 포화는 3mg 골드 캐리어에 대해 15 μg 플라스미드 DNA에서 성취하였다. 상기 결합 완충액 및 DNA를 볼텍싱을 통해 잘 혼합하였다. 상기 DNA 및 결합 완충액은 골드 첨가전에 예비혼합하여 골드 캐리어 입자에 플라스미드가 균일하게 결합되도록 해야만 한다. 60 μl의 S550d (Seashell Technologies, San Diego, CA) 골드 캐리어를 DNA/결합 완충액 혼합물에 첨가하였다. 50mg/ml의 골드 스탁을 위해, 60 μl의 첨가는 15 μg DNA/3 mg 골드 캐리어의 최적의 비를 유도한다. 상기 골드 캐리어/DNA 혼합물을 1분 동안 빙상에 방치하여 항온처리하고 이어서 100 μl의 침전 완충액을 첨가하였다. 상기 혼합물을 1분 동안 빙상에 다시 방치하여 항온처리함에 이어서 간략하게 볼텍싱하고 10초 동안 실온에서 10,000rpm으로 원심분리하여 골드 캐리어를 펠렛화한다. 상기 상등액을 주의깊게 피펫으로 제거하고 상기 펠렛을 500㎕의 빙냉 100% 에탄올로 세척하였다. 상기 골드 입자를 다시 10초 동안 10,000rpm에서 원심분리하여 재펠렛화하였다. 상기 에탄올을 제거하고 50 μl의 빙냉 에탄올을 골드 혼합물에 첨가하였다. 골드를 마크로캐리어에 적용하기 직전에, 골드/에탄올은 마이크로 칩을 사용하여 MISONIX 초음파 처리기상의 2단계에서 간략하게 1 내지 2초 펄스를 가하여 재현탁시켰다. 재현탁 직후, 10 μl의 분산된 골드 입자를 마크로캐리어에 전달하고 멸균 후드에서 건조되도록 방치하였다.

2개의 프로토테카 모리포르미스 균주(UTEX 1435 및 1441)를 종속영양으로 냉동보존된 바이엘로부터 2% 글루코스를 함유하는 액체 배지에서 성장시켰다. 각각의 균주를 10⁷의 세포/ml의 밀도로 성장시켰다. 상기 씨드 배양물을 이어서 새로운 배지로 희석하여 밀도가 10⁵ 세포/ml가 되도록 하고 12 내지 15시간 동안 성장하도록 방치하여 최종 세포 밀도가 대략 10⁶ 세포/ml가 되도록 하였다. 미세조류를 50ml의 원뿔 튜브로 적정하고 3500rpm에서 10분 동안 원심분리하였다. 상기 세포를 새로운 배지로 세척하고 3500 rpm에서 10분 동안 다시 원심분리하였다. 상기 세포를 이어서 새로운 배지에서 1.25 x 10⁸ 세포/ml의 밀도로 재현탁시켰다.

멸균 후드에서, 0.4ml의 상기 제조된 세포를 제거하고 한천 플레이트(선택 제제 부재)의 중앙에 직접 위치시켰다. 상기 플레이트를 회전 모션 수준으로 약하게 빙빙 돌게하여 세포가 균등하게 3cm 이하의 직경으로 분포하도록 하였다. 상기 세포는 대략 30 내지 40분 동안 멸균 후드에서 플레이트상에서 건조되도록 방치하고 이어서 1350 psi의 파열 디스크 압력에서 충격을 가하고 플레이트가 6cm의 마크로캐리어 거리에 있도록 하였다. 상기 플레이트를 이어서 덮고 파라필름으로 감싸고 24시간 동안 낮은 광하에서 배양하도록 방치하였다.

24시간 회복 후, 1 ml의 멸균 배지(글루코스 부재)를 세포 론에 첨가하였다. 상기 세포를 멸균 루프를 사용하여 재현탁시키고 환상 모션으로 세포의 론에 적용하고 재현탁된 세포를 멸균 피펫을 사용하여 수거하였다. 이어서 상기 세포를 2% 글루코스 및 100㎍/ml의 G418을 갖는 새로운 한천 플레이트상에 도말하였다. 도말한지 7일 내지 12일에 콜로니가 출현하였다. 개별 콜로니를 집어내고 2% 글루코스 및 100 μg/ml G418을 갖는 선택 배지에서 성장시켰다. 야생형(비형질전환된) 및 유전자전이 세포를 이어서 전이유전자의 성공적인 도입, 통합 및 발현에 대해 분석하였다.

형질전환된 프로토테카 모리포르미스 UTEX 1435 및 1441 및 이들의 야생형(비형질전환된) 대응물로부터의 게놈 DNA를 표준 방법을 사용하여 분리하였다. 간략하게 상기 세포를 표준 탁상 탑 에펜도르프 원심분리기(모델 5418)에서 5분 동안 14,000rpm에서 원심분리하고 DNA 추출전에 급속 동결시켰다. 세포 펠렛은 200㎕의 용해 완충액 (100 mM Tris HCl, pH 8.0, 1% 라우릴 사르코신, 50 mM NaCl, 20 mM EDTA, 0.25 M 슈크로스, 0.5 mg/ml RNase A)을 세포 100 내지 200mg(습윤 중량)에 대해 첨가하고 30초 내지 60초 동안 볼텍싱하여 용해시켰다. 세틸 트리메틸암모늄 브로마이드(CTAB) 및 NaCl을 각각 1% 및 1M로 하고 세포 추출물을 10분 동안 60 내지 65℃에서 항온처리하였다. 이어서, 추출물을 10분 동안 14,000rpm에서 원심분리를 통해 세정하고 수득한 상등액을 동일한 용적의 페놀/클로로포름/이소아밀 알콜 (25:24:1)의 동일 용적으로 추출하였다. 이어서 샘플을 14,000 rpm에서 5분 동안 원심분리하고 수성상을 제거하였다. DNA를 0.7 용적의 이소프로판올로 침전시켰다. 10분 동안 14,000rpm에서 원심분리를 통해 DNA를 펠렛화하고 80% 에탄올로 2회 세척하고 에탄올로 1회 세척하였다. 건조시킨 후, DNA를 10mM Tris HCl(pH 8.0)중에 재현탁시키고 DNA 농도는 PicoGreen 형광 정량 분석(Molecular Probes)을 사용하여 측정하였다.

형질전환된 프로토테카 모리포르미스 UTEX 1435 및 1441 및 이들의 야생형(비형질전환된) 대응물로부터의 RNA는 표준 방법을 사용하여 분리하였다. 간략하게 상기 세포를 표준 탁상 탑 에펜도르프 원심분리기(모델 5418)에서 5분 동안 14,000 rpm으로 원심분리하고 RNA 추출전에 급속 동결시켰다. 세포 펠렛을 1mL의 트리졸 시약(Sigma)을 세포의 100mg(습윤 중량)에 대해 첨가하고 1 내지 2분 동안 볼텍싱함에 의해 용해시켰다. 샘플을 5분 동안 실온에서 항온처리하고 이어서 트리졸 시약 1ml당 200 uL의 클로로포름으로 조정하였다. 연장된 진탕 후 세포를 냉장된 탁상 탑 소형원심분리기에서 15분 동안 14000rpm의 원심분리에 적용하였다. 상부 수성 상으로 분획화된 RNA를 제거하고 이소프로판올(1ml의 트리졸 시약 당 500ul)을 첨가하여 침전시켰다. RNA를 10분 동안 원심분리하여 수거하고 수득한 펠렛을 1ml의 80% 에탄올로 2회 세척하고 건조시키고 RNAse 유리수중에 재현탁시켰다. RNA 농도는 RiboGreen 형광 정량 분석(Molecular Probes)을 사용하여 측정하였다.

G418 항생제 내성을 부여하는 네오마이신 포스포트랜스퍼라제 유전자 및 효모 인버타제의 발현은 비형질전환된 프로토테카 모리포르미스 UTEX 1435 및 1441 및 형질전환체 T98 (UTEX 1435 형질전환체) 및 T97 (UTEX 1441 형질전환체)에서 역전사 정량 PCR 분석(RT-qPCR)을 사용하여 분석하였다. 20 ng의 총 RNA (상기된 바와 같이 분리된)을 iScript SYBR Green RT-PCR 키트(BioRad Laboratories) 및 네오마이신 내성 유전자를 표적화하는 프라이머 쌍(정배향 프라이머 5 'CCGCCGTGCTGGACGTGGTG 3' 및 역배향 프라이머 5' GGTGGCGGGGTCCAGGGTGT 3'; 각각 서열번호 65 및 66) 및 suc2 인버타제 전사체를 표적화하는 프라이머 쌍(정배향 프라이머 5' CGGCCGGCGGCTCCTTCAAC 3' 및 역배향 프라이머 5' GGCGCTCCCGTAGGTCGGGT 3'; 각각 서열번호 67 및 68)을 사용한 1단계 RT-qPCR 분석에 적용하였다. 내인성 베타-튜불린 전사체는 상대적 전사체 수준을 평가하기 위한, PCR 증폭에 대한 내부 양성 대조군으로서 및 표준 참조물로서 작용하였다.

코돈 최적화되고 비코돈 최적화된 작제물 둘다를 사용하여 UTEX 1435 및 1441 프로토테카 모리포르미스를 상기된 바와 같이 형질전환시켰다. 처음에, 형질전환체는 상기 2개 작제물을 사용하여 수득하고 전이유전자의 존재는 서던 블롯 분석에 이어서 RTPCR로 입증하여 전이유전자 기원의 DNA 및 mRNA의 존재를 확인하였다. 서던 블롯 분석을 위해, 상기된 바와 같이 분리된 게놈 DNA를 1 x TAE 완충액중의 0.7% 아가로스 겔상에서 전기영동하였다. 겔은 문헌[참조: Sambrook et al. (Molecular Cloning; A Laboratory Manual, 2^nd Edition. Cold Spring Harbor Laboratory Press, 1989)]에 기재된 바와 같이 가공하였다. 프로브는 문헌[Sambrook et al]에 기재된 바와 같이 수행된 무작위 프라이밍 및 하이브리드화에 의해 제조하였다. 코돈 최적화되고 비코돈 최적화된 작제물 둘다로부터의 형질전환체는 인버타제 카세트의 존재를 나타내었고 비형질전환된 대조군은 음성이었다. 인버타제 mRNA는 또한 코돈 최적화되고 비코돈 최적화된 작제물을 갖는 형절전환체에서 검출되었다.

형질전환체가 활성 인버타제 단백질을 발현하는지의 여부를 확인하기 위해, 형질전환체를 슈크로스 플레이트상에 도말하였다. 비코돈 최적화된 카세트를 함유하는 형질전환체는 슈크로스 함유 플레이트상에서 성장하는데 실패하였고 이는 상기 유전자 및 SUC2 단백질을 암호화하는 mRNA가 존재하지만 상기 단백질은 (1) 해독되지 않거나 (2) 해독되지만 유일 탄소원으로서 슈크로스상에서 성장하는데 충분한 수준으로 축적되지 못함을 지적한다. 코돈 최적화된 카세트를 갖는 형질전환체는 슈크로스 함유 플레이트상에서 성장시켰다. 이들 형질전환체에 의해 발현된 인버타제의 수준을 평가하기 위해, 2개의 클론(T98 및 T97)을 고체 배지로부터 박리 제거된 전체 세포의 인버타제를 분석하고 직접적으로 샘플링하고 유일 탄소원으로서 2% 슈크로스를 함유하는 액체 배지에서 48시간 성장시킨 후 배양 상등액중에서의 당을 정량하였다.

인버타제 분석을 위해, 세포(T98 및 T97)를 2% 슈크로스를 함유하는 플레이트상에서 성장시키고 박리 제거하고 인버타제 활성에 대해 분석하였다. 10 μl의 박리 제거된 세포는 40 μl의 5OmM NaOAc(pH 5.1)와 혼합하였다. 12.5 μl의 0.5M 슈크로스를 세포 혼합물에 첨가하고 10 내지 30분 동안 37℃에서 항온처리하였다. 반응을 종료하기 위해, 75 μl의 0.2M K₂HPO₄를 첨가하였다. 유리된 글루코스를 분석하기 위해, 500 μl의 재구성된 시약(글루코스 옥시다제/퍼옥시다제 + o-디아니시딘)(제조원: Sigma)(GAGO-20 분석 키트)을 각각의 튜브에 첨가하고 30분 동안 37℃에서 항온처리하였다. 글루코스 표준 곡선을 또한 이 시점에서 작성하였다 (범위: 25 μg 내지 0.3 μg의 글루코스). 항온처리 후, 500 μl의 6N HCl을 첨가하여 반응을 종료하고 발색되도록 하였다. 샘플은 540nm에서 판독하였다. 유리된 글루코스의 양은 수학식 y=mx+c(여기서, y는 540nm 판독값이고 x는 μg의 글루코스이다)을 사용하는 글루코스 표준 곡선으로부터 계산하였다. 글루코스 중량은 글루코스 몰로 환산하고 가수분해된 슈크로스 몰과 생성된 글루코스 몰간의 동몰 관계가 주어진 경우 데이타를 단위 시간당 가수분해된 슈크로스 몰로서 표현하였다. 상기 분석은 T98 및 T97 클론 둘다가 슈크로스를 가수분해할 수 있음을 보여주었고 이것은 기능성 슈크로스 인버타제가 세포에 의해 생성되고 분비됨을 지적한다.

48시간의 조류 성장 후 액체 배양 배지상에서의 당 분석을 위해, T97 및 T98 세포를 48시간 동안 2% 슈크로스 함유 배지에서 성장시키고 배양 배지를 당 분석을 위해 가공하였다. 각각의 형질전환체(및 음성 비-형질전환된 세포 대조군)으로부터의 배양 브로쓰를 5분 동안 14,000rpm에서 원심분리하였다. 수득한 상등액을 제거하고 HPLC/ELSD (증발 광 산란 검출)에 적용하였다. 각각의 샘플중의 당의 양은 외부 표준 및 선형 회귀 분석을 사용하여 측정하였다. 형질전환체의 배양 배지에서 슈크로스 수준은 매우 낮았다(1.2g/L 미만, 및 대부분의 경우 0g/L). 음성 대조군에서, 슈크로스 수준은 48시간의 성장 후 대략 19g/L로 높게 유지되었다.

이들 결과는 인버타제 활성 결과와 일치하고 이를 종합하면 코돈 최적화된 형질전환체 T97 및 T98이 활성 슈크로스 인버타제를 분비하여 미세조류가 유일한 탄소원으로서 슈크로스를 사용가능하게 함을 지적하는 반면, 이는 (1) 비-코돈 최적화된 형질전환체 및 (2)비-형질전환된 야생형 미세조류 둘다가 배양 배지에서 유일한 탄소원으로 슈크로스를 사용할 수 없는 것과는 대조적이다.

기능성 분비된 슈크로스 인버타제(SUC2) 전이유전자를 발현하는 프로토테카 모리포르미스 균주, T98 및 T97은 유일 탄소원으로서 슈크로스를 사용하는 성장 및 지질 생산에 대해 분석하였다.

야생형(비형질전환된), T98 및 T97 균주는 종속영양 조건하에 대략 6일 동안 유일 탄소원으로서 4% 글루코스 또는 4% 슈크로스를 함유하는 성장 배지(상기된 바와 같음)에서 성장시켰다. A750 광학 밀도 판독에 의한 측정시 성장에 대해 24시간 마다 모든 4개의 샘플을 채취하고 배양물의 무수 세포 중량 및 지질 프로필을 성장 6일 후 측정하였다. 글루코스 및 슈크로스 조건 둘다에서 성장한 유전자전이 균주의 광학 밀도 판독값은 글루코스 조건에서 성장한 야생형 균주에 필적하였다. 이들 결과는 유전자전이 균주가 글루코스 조건의 야생형 균주와 동등한 비율로 유일 탄소원으로서 글루코스 또는 슈크로스상에서 성장할 수 있음을 지적한다. 비형질전환된 야생형 균주는 슈크로스 단독의 조건에서는 성장하지 않았다.

글루코스상에서 성장한 야생형 균주 및 슈크로스상에서 성장한 T98 균주에 대한 바이오매쓰는 지질 프로필에 대해 분석하였다. 지질 샘플은 제조업자의 지침에 따라 산 가수분해 시스템(Acid Hydrolysis System) (Ankom Technology, NY)을 사용하여 무수 바이오매쓰(동결건조된)로부터 제조하였다. 지질 프로필 측정은 실시예 4에 기재된 바와 같이 수행하였다. 유일한 탄소원으로서 글루코스상에서 성장한 비형질전환된 프로토테카 모리포르미스 UTEX 1435 균주 및 유일 탄소원으로서 슈크로스상에서 성장한 2개의 클론 T98 균주(슈크로스 인버타제 전이유전자로 형질전환된 UTEX 1435)에 대한 지질 프로필은 표 13에 기재한다(하기, 야생형 UTEX 1435 및 T98 클론 8 및 클론 11). C:19:0 지질을 내부 계산 대조군으로서 사용하였다.

용매 추출을 통해 또는 익스펠러 프레스(상기 실시예 44에 기재된 방법을 참조)를 사용하여 야생형 프로토테카 모리포르미스 UTEX 1435로부터 추출된 오일은 카로테노이드, 클로로프로필, 토코페롤, 다른 스테롤 및 토코트리에놀에 대해 분석하였다. 그 결과는 하기 표 14에 요약한다.

G418(또는 다른 항생제) 대신 suc2 전이유전자 작제물을 함유하는 클론에 대한 선택 인자로서, 유일한 탄소원으로서 슈크로스를 사용하는 능력은 양성 suc2 유전자 형질전환체를 사용하여 평가하였다. 양성 형질전환체 서브세트는 24회 증식동안 항생제 없이 유일한 탄소원으로서 슈크로스를 함유하는 플레이트상에서 성장시켰다. 이어서 상기 클론을 유일한 탄소원으로서 글루코스 및 G418을 함유하는 플레이트에 적용하였다. 글루코스 + G418 조건상에서는 성장하지 않는 클론의 서브세트가 있고, 이는 전이유전자의 발현이 상실되었음을 지적한다. 추가의 실험은 G418이 부재이고 유일한 탄소원으로서 슈크로스를 함유하는 플레이트를 사용하고 suc2 전이유전자 발현 클론을 플레이트의 반쪽에 스트리킹하고 야생형 프로토테카 모리포르미스를 플레이트의 다른 반쪽에 스트리킹하여 수행하였다. 성장은 야생형 및 전이유전자 함유 프로토테카 모리포르미스 세포 둘다에서 나타났다. 야생형 프로토테카 모리포르미스는 슈크로스상에서 성장하는 능력을 입증하지 못하였고 따라서 상기 결과는 항생제 내성 같지 않게 슈크로스/인버타제 선택의 사용이 세포-자가가 아님을 보여준다. 상기 형질전환체는 충분한 슈크로스 인버타제를 플레이트/배지로 분비하여 슈크로스가 프럭토스 및 글루코스로 가수분해됨에 따라 야생형 성장을 지지할 가능성이 매우 높다.

실시예 4: 외인성 TE 유전자를 사용한 재조합 프로토테카

상기된 바와 같이, 프로토테카 균주를 외인성 유전자로 형질전환시킬 수 있다. 프로토테카 모리포르미스(UTEX 1435)는 상기된 방법을 사용하여 움벨루라리아 칼리프 오르니카(Umbellularia calif ornica) C12 티오에스테라제 유전자 또는 시나모뭄 캄포라 C14 티오트에스테라제 유전자(2개의 코돈은 표 1에 따라 최적화됨)로 형질전환시켰다. 형질전환 작제물 각각은 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터/5 'UTR 영역(서열번호 69)를 함유하여 티오에스테라제 전이유전자의 발현을 구성시켰다. 움벨루라리아 칼리프 오르니카 C12 티오에스테라제(서열번호 70) 또는 시나모뭄 캄포라 C14 티오에스테라제(서열번호 71)의 티오에스테라제 전이유전자 암호화 영역은 각각 본래의 추정 플라스티드 표적화 서열을 갖는다. 티오에스테라제 암호화 서열 바로 뒤에 c-말단 3x-FLAG 태그의 암호화 서열(서열번호 72)에 이어서 클로렐라 불가리스 니트레이트 리덕타제 3'UTR(서열번호 73)이 있다. 프로토테카 모리포르미스 형질전환에 사용되는 티오에스테라제 작제물의 다이아그램은 도 9에 나타낸다.

DNA, 골드 마이크로캐리어 및 프로토테카 모리포르미스(UTEX 1435) 세포의 제조는 실시예 3에 기재된 바와 같은 방법을 사용하여 수행하였다. 미세조류에 골드 마이크로캐리어-DNA 혼합물을 사용하여 충격을 가하고 2% 글루코스 및 lOOμg/ml의 G418을 함유하는 선택 플레이트상에 도말하였다. 콜로니가 7 내지 12일 동안 나타나도록 방치하고 콜로니를 각각의 형질전환 플레이트로부터 집어내고 서던 블롯 분석을 사용한 DNA 작제물 혼입에 의해 스크리닝하고 티오에스테라제 작제물의 발현은 RT-PCR을 사용하여 스크리닝하였다.

양성 클론은 C12 및 C14 티오에스테라제 형질전환 플레이트 둘다로부터 집어내고 서던 블롯 분석을 사용하여 작제물 혼입에 대해 스크리닝하였다. 서던 블롯 분석은 서열번호 70 및 서열번호 71의 서열을 기초로 최적화된 c 프로브를 사용한 표준 방법(및 실시예 3에 기재된 방법)을 사용하여 수행하였다. 플라스미드 DNA로 형질전환된 것을 양성 대조군으로서 사용하였다. 작제물 혼입에 대해 양성인 클론중에서 C12 티오에스테라제 및 C14 티오에스테라제 발현에 대한 역전사 정량 PCR (RT-qPCR) 분석을 위한 서브세트를 선택하였다.

RNA 분리는 상기 실시예 3에 기재된 방법을 사용하여 수행하고 양성 클론의 RT-qPCR은 제조업자의 프로토콜에 따라 하기된 프라이머 쌍 및 iScript SYBR Green RT-PCR 키트(Bio-Rad Laboratories)를 사용한 각각의 클론 기원의 총 20ng의 RNA를 사용하여 수행하였다. 야생형(비형질전환된) 프로토테카 모리포르미스 총 RNA는 음성 대조군으로서 포함되었다. mRNA 발현은 음성 대조군과 비교하여 상대적 배수 발현(RFE)으로서 표현하였다. C12 티오에스테라제 형질전환 RT-qPCR 스크리닝에 사용되는 프라이머는 다음과 같다:

움벨루라리아 칼리포르니카 C 12 티오에스테라제 PCR 프라이머:

정배향: 5' CTGGGCGACGGCTTCGGCAC 3' (서열번호 74)

역배향: 5' AAGTCGCGGCGCATGCCGTT 3' (서여번호 75)

C14 티오에스테라제 형질전환 RT-qPCR 스크리닝에서 사용된 프라이머는 다음과 같았다:

시나모뭄 캄포라 C14 티오에스테라제 PCR 프라이머:

정배향: 5' TACCCCGCCTGGGGCGACAC 3' (서열번호 76)

역배향: 5' CTTGCTCAGGCGGCGGGTGC 3' (서열번호 77)

양성 클론중에서 C12 티오에스테라제 발현에 대한 RT-qPCR 결과는 음성 대조군과 비교하여 약 40배 내지 2000배 초과로 발현이 증진된 RFE를 보여주었다. 유사한 결과는 음성 대조군과 비교하여 약 60 배 내지 1200배 초과로 발현이 증가된 RFE와 함께 양성 클론에서 C14 티오에스테라제 발현이 나타났다.

각각의 형질전환체로부터 양성 클론의 서브세트(서던 블롯팅 및 RT-qPCR 분석에 의해 스크리닝된 바와 같이)를 선택하고 질소 풍부 조건하에서 성장시키고 총 지질 생산 및 프로필에 대해 분석하였다. 지질 샘플은 각각의 클론으로부터 건조된 바이오매쓰로부터 제조하였다. 각각의 유전자전이 클론 기원의 20 내지 40 mg의 무수 바이오매쓰는 MeOH중 2ml의 3% H₂SO₄중에 재현탁시키고 적합한 내부 표준물(C19:0)의 적당량을 함유하는 200ul의 톨루엔을 첨가하였다. 상기 혼합물을 간략하게 초음파 처리하여 바이오매쓰를 분산시킴에 이어서 2시간 동안 65 내지 70℃에서 가열하였다. 2 mL의 헵탄을 첨가하여 지방산 메틸 에스테르를 추출함에 이어서 2ml의 6% K₂CO₃(aq)를 첨가하여 산을 중화시켰다. 상기 혼합물을 왕성하게 진탕시키고 상부층 일부를 표준 FAME GC/FID(지방산 메틸 에스테르 가스 크로마토그래피 플레임 이온화 검출) 방법을 사용한 가스 크로마토그래피 분석을 위해 Na₂SO₄(무수)를 함유하는 바이엘에 이동시켰다. 야생형 음성 대조군과 비교하여 양성 클론의 지질 프로필(면적%로서 표현됨)은 하기 표 15 및 16에 요약한다. 표 15에 나타낸 바와 같이, C12 형질전환체중 C12 생산의 배수 증가는 약 5배 증가(클른 C12-5) 내지 11배 초과의 증가(클론 C12-1) 범위이다. C14 형질전환체중에서 C14 생산의 배수 증가는 약 1.5배 증가 내지 약 2.5배 증가 범위이다

상기된 실험은 형질전환 결과로서 전이유전자의 성공적인 발현 뿐만 아니라 발현 단백질의 플라스티로의 올바른 표적화 및 기능성 효과를 포함하는 2개의 상이한 티오에스테라제(C12 및 C14)의 전이유전자 작제물을 사용한 프로토테카 모리포르미스(UTEX 1435)의 성공적인 형질전환(예상되는 지질 프로필의 변화)을 나타낸다. 동일한 형질전환 실험은 지질 프로필에 어떠한 변화를 나타내지 않는 본래의 플라스티드 표적화 서열(서열번호 78)와 함께 표 1에 따라 코돈 최적화된 쿠에파 후케리아나 C8-C10 티에오에스테라제 암호화 영역을 함유하는 발현 작제물을 사용하여 수행하였다. 쿠페아 후케리아나 C8-C10 전이유전자의 프로토테카 모리포르미스(UTEX 1435)로의 도입이 성공적이고 서던 블롯 분석에 의해 확인되었지만 C8 또는 C10 지방산 생산에서는 야생형 균주와 비교하여 형질전환체에서 어떠한 변화가 검출되지 않았다.

실시예 5: 조류 플라스티드 표적화 서열을 갖는 외인성 시물 TE를 사용한 프로토테카 모리포르미스 균주의 생성

조류 엽록체/플라스티드 표적화 서열이 프로토테카 모리포르미스(UTEX 1435)에서 중간 쇄(C8-C14) 티오에스테라제 발현 및 후속적 중간 쇄 지질 생산을 개선시키는지의 여부를 조사하기 위해, 여러 추정 조류 플라스티드 표적화 서열을 클로렐라 프로토테코이데스 및 프로토테카 모리포르미스로부터 클로닝하였다. 쿠페아 훅케리아나 C8-C10 티오에스테라제, 움벨루라리아 칼리프 오르니카 C12 티오에스테라제 및 시나모뭄 캄포라 C14 티오에스테라제를 기본으로 하는 티오에스테라제 작제물을, 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터/5'UTR 및 클로렐라 불가리스 니트레이트 리덕타제 3'UTR을 사용하여 제조된 것을 사용하여 제조하였다. 티오에스테라제 암호화 서열은 본래의 플라스티드 표적화 서열을 제거하고 이들을 클로렐라 프로토테코이데스 및 프로토테카 모리포르미스 게놈 기원의 플라스티드 표적화 서열로 대체함에 의해 변형시켰다. 티오에스테라제 발현 작제물 및 이들의 상응하는 서열 동일성 번호는 하기에 열거한다. 각각의 형질전환 플라스미드는 또한 상기 실시예 3에 기재된 것과 동일한 Neo 내성 작제물을 함유하였다. 추가로, 또 다른 조류-유래 프로모터, 클라미도모나스 레인하르드티 β-튜불린 프로모터는 또한 티오에스테라제 작제물과 연계하여 시험하였다. "본래의" 플라스티드 표적화 서열은 고등 식물 티오에스테라제 플라스티드 표적화 서열을 언급한다. 이들 실험에 사용된 작제물의 요약은 하기에 제공한다:

각각의 작제물을 프로토테카 모리포르미스(UTEX 1435)로 형질전환시키고 상기 실시예 4에 기재된 방법을 사용한, G418을 사용하여 선택하였다. 각각의 형질전환체로부터 여러 양성 클론을 집어내고 서던 블롯팅 분석을 사용하여 티오에스테라제 전이유전자의 존재에 대해 스크리닝하였다. 티오에스테라제 전이유전자의 발현은 RT-PCR을 사용하여 확인하였다. 각각의 형질전환으로부터 양성 클론(서던 블롯팅 분석 및 RT-PCR에 의해 확인된 바와 같이)의 서브세트를 선택하고 지질 프로필 분석을 위해 성장시켰다. 지질 샘플은 각각의 클론의 무수 바이오매쓰 샘플로부터 제조하고 지질 프로필 분석은 실시예 4에 기재된 가수분해 방법을 사용하여 수행하였다. 티오에스테라제 전이유전자에 상응하는 지방산의 면역 %의 변화를 야생형 수준 및 본래의 플라스티드 표적화 서열을 갖는 티오에스테르라제로 형질전환된 클론과 비교하였다.

실시예 4에 언급된 바와 같이, 본래의 플라스티드 표적화 서열을 갖는 쿠에파 후케리아나 C8-C10 티오에스테라제 작제물로 형질전환된 클론은 야생형과 동일한 수준의 C8 및 C10 지방산을 가졌다. 조류 플라스티드 표적화 서열을 갖는 쿠에파 후케리아나 C8-C10 티오에스테라제 작제물(작제물 1-3)로 형질전환된 클론은 야생형과 비교하여 작제물 3에 있어서 C10 지방산이 10배 이상 증가하였고 작제물 1 및 2에 있어서 C10 지방산이 40배 이상 증가하였다. 본래의 플라스티드 표적화 서열을 갖는 움벨루라리아 칼리프 오르니카 C12 티오에스테라제 작제물로 형질전환된 클론은 야생형과 비교하여 C12 지방 수준에 있어서 중간 정도의 6 내지 9배의 증가를 가졌다. 조류 플라스티드 표적화 작제물(작제물 4 내지 7)을 갖는 움벨루라리아 칼리프 오르니카 C12 티오에스테라제 작제물로 형질전환된 클론은 (모두 야생형과 비교하여) 작제물 4에 있어서 C12 지방산 수준이 80배 이상 증가하였고 작제물 6에 있어서 C12 지방산이 약 20배 증가하였고 작제물 7에 있어서 C12 지방산 수준이 약 10배 증가하였고 작제물 5에 있어서 C12 지방산 수준이 약 3배 증가하였다. 본래의 플라스티드 표적화 서열을 갖는 시노모뭄 캄포라 C14 티오에스테라제 또는 작제물 8(클로렐라 프로토테코이데스 스테아로일 ACP 데사투라제 플라스티드 표적화 서열을 갖는)로 형질전환된 클론은 야생형과 비교하여 C14 지방산 수준이 2 내지 3배 증가하였다. 일반적으로, 조류 플라스티드 표적화 서열 티오에스테라제 작제물로 형질전환된 클론은 본래의 고등 식물 표적화 서열을 사용하는 경우 보다 상응하는 쇄 길이의 지방산 수준이 보다 높은 배수로 증가하였다.

A. 클라미도모나스 레인하르티 β-튜불린 프로모터

추가의 이종성 티오에스테라제 발현 작제물은 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터 대신 클라미도모나스 레인하르드티 β-튜불린 프로모터를 사용하여 제조하였다. 작제물 요소 및 발현 작제물의 서열은 상기 열거되어 있다. 각각의 작제물은 상기된 방법을 사용하여 프로토테카 모리포르미스 UTEX 1435 숙주 세포로 형질전환시켰다. 지질 프로필은 각각의 작제물에 대한 양성 클론의 서브세트로부터 제조하여 각각의 작제물의 성공 및 생산성을 평가하였다. 상기 지질 프로필은 야생형 숙주 세포에 대한 지방산 수준(면적%로 표현함)을 비교한다. "평균" 칼럼은 양성 클론의 서브세트의 수치 평균을 나타낸다. "샘플" 칼럼은 스크리닝된 최상의 양성 클론(상응하는 쇄길이의 지방산 생산의 면적%에서 최상의 변화를 생성하는 샘플이 최상인 것으로서 정의된다)을 나타낸다. "저-고" 칼럼은 스크리닝된 클론으로부터 최저의 면적% 및 최고의 면적%를 나타낸다. 작제물 9 내지 23의 지질 프로필 결과는 하기에 요약한다.

작제물 9-13은 쿠페아 훅케리아나 C8-C10 티오에스테라제 작제물을 함유하는 발현 벡터이다. 상기 데이타 용약에서 알 수 있는 바와 같이, 최상의 결과는 작제물 11에서 나타나고 샘플 C8 지방산은 1.57면적%(야생형 0과 비교하여)이고 C10 지방산은 6.76의 면적%(야생형 0과 비교하여)를 나타낸다. 또한 C12 지방산에서는 약간의 증가(대략 2 내지 5배 증가)가 있었다. 본래의 플라스티드 표적화 서열은 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터의 조절하에 있는 경우 어떠한 변화를 나타내지 않고, 클라미도모나스 레인하르드티 β-튜불린 프로모터에 의해 구동되는 동일한 발현 작제물은 숙주 세포에서 C8-C10 지방산에서 상당한 변화를 나타냈다. 이것은 추가로 프로토테카 종에서 티오에스테라제의 이종성 발현의 특이성에 대해 추가의 증거가 있다. 클라미도모나스 레인하르드티 β-튜불린 프로모터 C8-C10 티오에스테라제 작제물을 함유하는 모든 클론은 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터 C8-C10 티오에스테라제 작제물을 함유하는 클론 보다 C8-C10 지방산에서 보다 크게 증가하였다. 작제물 13에 대한 지질 프로필 데이타는 수득되지 않았고 따라서 상기에 포함되지 않았다.

작제물 14-18은 움벨루라리아 칼리프 오르니카 C12 티오에스테라제 작제물을 함유하는 발현 벡터이었다. 상기 데이타 요약에서 알 수 있는 바와 같이, 최상의 결과는 작제물 15(프로토테카 모리포르미스 이소펜테닐 디포스페이트 신타제 플라스티드 표적화 서열) 및 17(클로렐라 프로토테코이데스 스테아로일 ACP 데사투라제 플라스티드 표적화 서열)에서 나타났다. C12 지방산 생산에서 최상의 변화는 작제 17에서 나타났고 C12 지방산 수준은 야생형에서 0.04 면적%인 것과 비교하여 14.11 면적%이하였다. 약간의 변화(약 2배)가 또한 C14 지방산 수준에서 나타났다. 동일한 작제물과 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터를 비교하는 경우, 클라미도모나스 레인하르드티 β-튜불린 프로모터-클로렐라 프로토테코이데스 스테아로일 ACP 데사투라제에서 동일한 경향이 나타났고 프로토테카 모리포르미스 이소펜테닐 디포스페이트 신타제 플라스티드 표적화 서열은 2개의 프로모터와 함께 C12 지방산 수준에서 가장 큰 변화를 나타냈다.

작제물 19-23은 시나모뭄 캄포라 C14 티오에스테라제 작제물을 함유하는 발현 벡터였다. 상기 데이타 요약에서 알 수 있는 바와 같이, 최상의 결과는 작제물 22 및 23에서 나타났다. C14 지방산 생산에서 가장 큰 변화는 작제물 22에서 나타났고 C14 지방산 수준은 야생형에서 1.40%인 것과 비교하여 (C140 및 C141에 대한 수치가 조합되는 경우) 17.35면적%였다. C12 지방산의 변화를 또한 나타냈다(5 내지 60배). 동일한 작제물과 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터를 비교하는 경우, 클라미도모나스 레인하르드티 β-튜불린 프로모터-클로렐라 프로토테코이데스 스테아로일 ACP 데사투라제에서도 동일한 경향이 나타났고 프로토테카 모리포르미스 스테아로일 ACP 데사투라제 플라스티드 표적화 서열은 2개의 프로모터와 함께 C14 지방산 수준에서 최고의 변화를 나타냈다. 모든 티오에스테라제 발현 작제물과 일치되게, 클라미도모나스 레인하르드티 β-튜불린 프로모터 작제물은 클로렐라 소로키니아나 글루타메이트 데하이로게나제 보다 C8-14 지방산 수준에서 보다 큰 변화를 나타내었다.

작제물 22로부터 2개의 양성 클론을 선택하고 고선택압(50mg/L G418)하에서 성장시켰다. 배양 6일 후, 상기 클론을 수거하고 이들의 지질 프로필은 상기된 방법을 사용하여 측정하였다. 지질 프로필 데이타는 하기에 요약하고 면적%로 표현하였다.

일정한 고 선택압하에 성장하는 경우 2개의 클론은 C14 및 C12 지방산의 양이 상기 작제물 22에서 나타난 수준 보다 약 2배 증가하였다. 이들 클론은 야생형 세포에서 C12-14 지방산이 1.5면적%인 것과 비교하여 C12-14 지방산이 30면적% 이상이었다.

실시예 6: 프로토테카에서 쿠페아 팔루스트리스 및 울무스 아메리칸카 티오에스테라제의 이종성 발현

프로토테카 종에서 상기된 이종성 발현 티오에스테라제가 성공한 경우, 쿠페아 팔루스트리스 및 울무스 아메리카타 기원의 지방 아실-ACP 티오에스테라제를 암호화하는 코돈 최적화된(표 1에 따라) 서열을 함유하는 발현 카세트를 작제하고 하기한 바와 같다.

울무스 아메리카나 (코돈 최적화된 암호화 서열)는 상기 발현 카세트로 삽입될 수 있다. 울무스 아메리카나 티오에스테라제에 대한 본래의 플라스티드 표적화 서열이 부재인 코돈 최적화된 암호화 서열은 서열번호 108로서 기재되고 임의의 목적하는 플라스티드 표적화 서열 및 발현 요소(즉, 프로모터/5'UTR 및 3'UTR)와 융합될 수 있다.

이들 발현 카세트로 상기된 방법을 사용하여 프로토테카를 형질전환시킬 수 있다. 양성 클론은 발현 작제물상에 항생제 내성 유전자(예를 들어, neoR)를 포함하여 스크리닝될 수 있고 G418 함유 플레이트/배지상에서 스크리닝하였다. 양성 클론은 이종성 티오에스테라제 암호화 영역에 특이적인 프로브와 함께 서던 블롯 분석을 사용하여 확인할 수 있고 작제물의 발현은 또한 이종성 티오에스테라제의 암호화 영역에 특이적인 RT-PCR 및 프라이머를 사용하여 확인될 수 있다. 양성 클론의 2차 확인은 숙주 세포의 지질 프로필에서 지방산의 수준 변화를 관찰하여 성취할 수 있다. 상기 실시예에 나타낸 바와 같이, 프로토테카 종에서 티오에스테라제의 이종성 발현은 특정 티오에스테라제에 특이적일 수 있다. 프로모터 요소 및 플라스티드 표적화 서열(및 다른 발현 조절 요소)은 티오에스테라제의 발현(및 상응하는 지방산의 후속적인 증가)이 목적하는 수준에 도달할때까지 상호 변화될 수 있다.

실시예 7: 이중 형질전환체 - 2개 이종성 단백질의 동시 발현

미세조류 균주 프로토테카 모리포르미스 (UTEX 1435)를 에스. 세레비지애 인버타제의 분비된 형태를 암호화하는 효모 슈크로스 인버타제 suc2 유전자를 함유하는 발현 작제물과 함께 상기된 방법을 사용하여 형질전환시켰다. 상기 유전자의 성공적인 발현 및 세포막주변으로의 표적화는 종속영양 조건에서 유일 탄소원으로서 슈크로스상에서 성장하는(이를 사용하는) 숙주 세포의 능력을 유도한다(상기 실시예 3에서 입증된 바와 같이). 발현된 유전자의 제2 세트는 아실 운반 단백질로부터 아실 잔기의 절단에 관여하는 티오에스테라제이다. 구체적으로, 티오에스테라제는 쿠페아 후케리아나(C8-10 선호 티오에스테라제), 움벨루라리아 칼리포르니카(C12 선호 티오에스테라제), 및 시나모뭄 캄포라(C14 우선 티오에스테라제)로부터 기원한다. 이들 티오에스테라제 발현 카세트는, (상기 실시예에서) 본래의 고등 식물 플라스티드 표적화 서열 보다 최적인 것으로 나타난 프로토테카 모리포르미스 또는 클로렐라 프로토테코이데스 기원의 N-말단 미세조류 플라스티드 표적화 서열과의 융합체로서 클로닝하였다. 티오에스테라제 유전자의 성공적인 발현과 플라스티드로의 표적화는 숙주 세포내에서 지방산 프로필의 측정가능한 변화를 유도하였다. 프로필에서 이들 변화는 각각의 티오에스테라제의 효소적 특이성 또는 선호도와 일치한다. 하기에서 프로토테카 모리포르미스 (UTEX 1435)로 어셈블리되고 형질전환된 이중 발현 작제물은 하기에 요약한다. 각각의 작제물은 클라미도모나스 레인하르드티 β-튜불린 5'UTR/프로모터의 조절하에 효모 suc2 유전자를 함유하고 클로렐라 불가리스 니트레이트 리덕타제 3'UTR 및 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 5'UTR의 조절하의 본래의 서열을 대체하는 미세조류 플라스티드 표적화 서열을 갖는 고등 식물 티오에스테라제를 함유하며 클로렐라 불가리스 니트레이트 리덕타제 3'UTR을 함유하였다. 하기에서 프로토테카 모리포르미스(UTEX 1435)로 어셈블리되고 형질전환된 작제물의 티오에스테라제 부분을 요약한다. suc2 유전자 및 티오에스테라제 유전자를 갖는 전체 이중 발현 카세트는 서열 확인 목록에 열거한다.

실시예 5에 기재된 티오에스테라제 카세트를 갖는 유사한 이중 발현 작제물(예를 들어, 클라미도모나스 레인하르드티 β-튜불린 프로모터/5' UTR와 같은 상이한 프로모터의 조절하에)은 또한 표준 분자 생물학 방법 및 본원에 기재된 방법을 사용하여 제조할 수 있다.

각각의 발현 작제물을 함유하는 양성 클론은 슈크로스 함유 플레이트상에서 성장하는 이들의 능력을 사용하여 스크리닝하였고, 여기서 슈크로스는 선택 인자로서 유일한 탄소원이다. 각각의 작제물 형질전환 기원의 이들 양성 클론의 서브세트를 선택하고 발현 작제물의 존재는 서던 블롯 분석을 사용하여 확인하였다. 효모 슈크로스 인버타제의 기능은 또한 슈크로스 가수분해 분석을 사용하여 확인하였다. 양성 클론을 선택하고 40g/L의 출발 농도에서 유일한 탄소원으로서 슈크로스 함유 배지에서 성장시켰다. 동일한 40g/L 출발 농도에서 유일한 탄소원으로서 글루코스를 함유하는 배지에서 성장한 야생형 프로토테카 모리포르미스(UTEX 1435)의 음성 대조군을 또한 포함시켰다. 슈크로스의 사용은 슈크로스-특이적 막을 갖는 YSI 2700 생화학 분석기를 사용하여 배지중의 슈크로스 수준을 측정하므로써 실험 과정 전반에 걸쳐 측정하였다. 배양 6일 후, 배양물을 수거하고 상기된 바와 동일한 방법을 사용하여 지질 프로필에 대해 가공하였다. 지질 프로필 결과는 하기 표 17에 요약하고 면적%로 나타낸다.

슈크로스 이용 분석을 위해 선택된 모든 양성 클론은 배지에서 및 6일 배양 기간 말기에 슈크로스를 가수분해시킬 수 있고 배지에는 어떠한 측정 가능한 수준의 슈크로스가 없다. 양성 클론에 대한 선택 도구로서 슈크로스의 성공적인 사용 뿐만 아니라 상기 데이타는 외인성 효모 suc2 슈크로스 인버타제 유전자가 형질전환체에서 올바르게 표적화하고 발현되었음을 지적한다. 상기 표 17에 나타낸 바와 같이, 작제물 24(C8-10 티오에스테라제)를 발현하는 클론은 C10 지방산이 측정가능하게 증가(8배 증가와 같이 높게)하였다. 또한, 상응하는 배지 쇄 지방산에서 작제물 25(C12 티오에스테라제) 및 작제물 26(C14 티오에스테라제)(C 14 티오에스테라제)를 발현하는 클론에서 측정가능한 증가를 나타내었다. 이를 종합하면, 상기 데이타는 2개의 재조합 단백질(예를 들어, 슈크로스 인버타제 및 지방산 아실-ACP 티오에스테라제)에서의 성공적인 동시 발현을 보여주고, 이 둘다는 숙주 기관상에 유용하고 정량가능한 표현형 변화를 부여한다

실시예 8: C14 티오에스테라제 형질전환체에서 C10-C14 지방산 생산에 대한 글리세롤의 효과

모든 티오에스테라제 형질전환 기원의 클론을 선택하고 추가로 평가하였다. 작제물 8을 발현하는 하나의 클론(시나모뭄 캄포라 C14 TE)을 종속영양으로 상이한 탄소원으로서 단독의 글루코스, 단독의 프럭토스 및 단독의 글리세롤을 사용하여 성장시켰다. 상기 단독의 글루코스 조건은 단독의 프럭토스 및 단독의 글리세롤 조건과 비교하는 경우 보다 높은 세포 성장 및 지질 총 생산을 유도하였다. 그러나, 단독의 글리세롤 조건에서 생성된 C12-14 지방산의 생산은 단독의 글루코스 조건에서 달성되는 것 보다 2배 이상 높았다.

실시예 9: 프로토테카 모리포르미스에서 아라비도프시스 탈리아나 인버타제의 발현

미세조류 균주 모리포르미스(UTEX 1435)는 아라비도프시스 탈리아나 기원의 코돈 최적화된(표 1에 따른) 세포벽 연합 인버타제를 함유하는 발현 작제물로 상기된 방법을 사용하여 형질전환시켰다. 아라비도프시스 인버타제 서열은 효모 인버타제(SUC2 단백질) 기원의 N-말단 39개 아미노산을 포함하도록 변형시켜 ER 및 궁극적으로 세포막주변으로 효율적으로 표적화되는 것을 확실히 한다. 검출을 보조하기 위해, 플래그(Flag) 에피토프를 재조합 단백질의 C-말든으로 첨가하였다. 전이유전자를 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터/5' UTR 영역 및 클로렐라 불가리스 니트레이트 리덕타제 3'UTR 영역과 함께 발현 벡터에 클로닝시켰다. 상기 전이유전자 카세트의 DNA 서열은 서열번호 89로서 기재되고 해독된 아미노산 서열은 서열번호 90으로서 기재한다. 양성 클론을 슈크로스 함유 배지/플레이트를 사용하여 스크리닝하고 선택하였다. 양성 클론의 서브세트는 플래그 태그된 인버타제에 대한 서던 블롯 분석 및 웨스턴 블롯 분석을 사용하여 전이유전자의 존재 및 인버타제의 발현에 대해 확인하였다. 이들 스크리닝으로부터 10개의 양성 클론은 지질 생산성 및 슈크로스 이용 분석을 위해 선택하였다. 모든 10개의 클론을 유일 탄소원으로서 슈크로스를 함유하는 배지상에서 성장시키고 양성 대조군 suc2 인버타제 형질전환체를 또한 포함시켰다. 음성 대조군인 야생형 프로토테카 모리포르미스를 또한 글루코스 함유 배지상에서 성장시켰다. 6일 후, 상기 세포를 수거하고 건조시키고 무수 세포 중량을 기준으로 총 % 지질을 측정하였다. 상기 배지를 또한 총 슈크로스 소비에 대해 분석하였다.

모든 10개의 양성 클론은 슈크로스를 가수분해시킬 수 있지만 대부분의 클론은 실험 말기에 무수 세포 중량에 의해 측정된 바와 같이 야생형 또는 양성 대조군 suc2 효모 인버타제 형질전환체의 약 절반 정도로 성장하였다. 유사하게, 모든 10개의 양성 클론은 야생형 또는 양성 대조군 형질전환체와 비교하는 경우 약 절반 정도로 총 지질을 생성하였다. 이러한 데이타는 프로토테카에서 다양한 슈크로스 인버타제의 성공적인 이종성 발현을 입증한다.

실시예 10: 프로토테카 크루가니, 프로토테카 스타그노라 및 프로토테카 조프피에서 효모 인버타제 (suc2)의 이종성 발현

프로토테카 속의 종에 사용하기 위한 형질전환 방법의 일반적인 적용성을 시험하기 위해, 3개의 다른 프로토테카 종을 선택하였다: 프로토테카 크루가니 (UTEX 329), 프로토테카 스타그노라(UTEX 1442) 및 프로토테카 조프피 (UTEX 1438). 이들 3개의 균주를 실시예 1에 기재된 배지 및 조건에서 성장시키고 이들 지질 프로필을 상기된 방법을 사용하여 측정하였다. 3개의 프로토테카 균주 기원의 지질 프로필은 하기에 면적%로서 요약한다.

이들 3개의 균주는 상기 실시예 3에 기재된 방법을 사용하여 효모 인버타제(suc2) 발현 카세트(서열번호 58)로 형질전환시켰다. 상기 효모 인버타제(suc2) 발현 카세트는 실시예에서 상기 프로토테카 모리포르미스(UTEX 1435)에서 작용하는 것으로 입증되었다. 상기 형질전환체는 슈크로스 함유 플레이트/배지를 사용하여 스크리닝하였다. 각각의 프로토테카 종에 대한 양성 클론의 서브세트를 선택하고 전이유전자의 존재는 서던 블롯 분석으로 확인하였다. 각각의 종으로부터 기원하는 확인된 양성 클론중 10개는 슈크로스 가수분해 분석 및 지질 생산성에 대해 선택하였다. 상기 클론을 유일 탄소원으로서 슈크로스를 함유하는 배지에서 성장시키고 글루코스상에서 성장한 이의 야생형 대응물과 비교하였다. 6일 후, 상기 배양물을 수거하고 건조시키고 총 % 지질 및 무수 세포 중량을 평가하였다. 각각의 배양물 기원의 배지를 또한 실험 과정 동안 슈크로스 함량에 대해 YSI12700 생화학 분석기를 사용하여 슈크로스 가수분해에 대해 분석하였다. 모든 3개의 종 기원의 클론은 슈크로스를 가수분해시킬 수 있고 프로토테카 스타그노라 및 프로토테카 조프피 형질전환체는 프로토테카 크루가니 보다 효율적으로 슈크로스를 가수분해시킬 수 있다. 3개의 형질전환체 종의 총 지질 생산 및 무수 세포 중량을 글루코스상에서 성장한 이들의 야생형 대응물에 상응하였다. 상기 데이타는 프로토테카 속의 다중 종에서 성공적인 형질전환 및 발현 외인성 유전자를 입증한다.

실시예 11: 미세조류에서 사용하기 위한 조류 유래 프로모터 및 유전자

A. 클로렐라 프로토테코이데스 기원의 5'UTR 및 프로모터 서열

cDNA 라이브러리를 표준 기술을 사용하여 혼합영양(mixotrophically)으로 성장한 클로렐라 프로토테코이데스(UTEX 250)로부터 생성하였다. cDNA 서열을 기준으로, 씨진의 DNA 워킹 키트(Seegene's DNA Walking kit)(Rockville, MD)를 사용하여 암호화 영역의 업스트림을 "워크(walk)"하기 위해 특정 공지된 하우스키핑(housekeeping) 유전자에서 디자인하였다. 분리된 서열은 액틴(서열번호 31) 및 연장 인자-Ia(EFIa)(서열번호 32) 프로모터/UTR를 포함하고 이 둘다는 인트론(하한부에 나타낸 바와 같이) 및 엑손(이탤릭체의 상한부) 및 예측된 개시 부위(볼드체) 및 2개의 베타-튜불린 프로모터/UTR 요소, 이소형 A (서열번호 33) 및 이소형 B (SEQ ID NO:34)를 함유한다.

B. 클로렐라 프로토테코이데스 기원의 지질 생합성 효소 및 플라스티드 표적화 서열

상기된 cDNA 라이브러리로부터, 클로렐라 프로토테코이데스(UTEX 250)에서 지질 대사에서 작용성인 단백질을 암호화하는 3개의 cDNA를 상기된 바와 동일한 방법을 사용하여 클로닝하였다. 아실 ACP 데사투라제(서열번호 45 및 46) 및 2개의 게라닐 게라닐 디포스페이트 신타제(서열번호 47 내지 50)에 대한 뉴클레오타이드 및 아미노산 서열은 하기 서열목록에 포함된다. 추가로, 플라스티드에 표적화하는 추정 시그날 서열을 갖는 3개의 cDNA를 또한 클로닝하였다. 글리세르알데하이드-3-포스페이트 데하이드로게나제(서열번호 51 및 52)에 대한 뉴클레오타이드 및 아미노산 서열, 산소 방출 복합 단백질 OEE33(서열번호 53 및 54) 및 CIp 프로테아제(서열번호 55 및 56)은 하기 서열목록에 포함된다. 추정 플라스티드 표적화 서열은 뉴클레오타이드 및 아미노산 서열 둘다에서 밑줄쳐져 있다. 상기 플라스티드 표적화 서열은 지질 변형 효소와 같은 전이유전자 생성물을 미생물의 플라스티드에 표적화시키는데 사용될 수 있다.

실시예 12: 프로토테카 모리포르미스로부터 질소 반응성인 5'UTR/프로모터

cDNA 라이브러리는 표준 기술을 사용하여 프로토테카 모리포르미스(UTEX 1435)로부터 작제하였다. 상기 프로토테카 모리포르미스를 질소 풍부 조건하에서 48시간 동안 성장시켰다. 이어서 5%의 접종물(v/v)을 낮은 질소로 이동시키고 상기 세포를 7일 동안 24시간 마다 수거하였다. 배양 약 24시간 후, 배지내 질소 공급은 완전히 고갈되었다. 수거된 샘플은 무수 빙상 및 이소프로판올을 사용하여 즉시 동결시켰다. 후속적으로 총 RNA는 동겨된 세포 펠렛 샘플로부터 분리하고 각각의 샘플로부터 기원하는 일부는 RT-PCR 연구를 위해 보존하였다. 상기 샘플로부터 수거된 총 RNA의 나머지는 폴리A 선택에 적용하였다. 이어서 각각의 조건으로부터 동몰량의 폴리A 선택된 RNA를 모으고 이를 사용하여 벡터 pcDNA 3.0(Invirogen)중에서 cDNA 라이브러리를 작제하였다. 대략적으로 1200개 클론을 무작위로 수득한 모아진 cDNA 라이브러리로부터 집어내고 양쪽 가닥상의 서열분석에 적용하였다. 대략적으로 68개의 상이한 cDNA는 이들 1200개의 서열로부터 선택하고 이를 사용하여 실시간 RT-PCR 연구에 사용하기 위한 cDNA 특이적 프라이머를 디자인하였다.

보존된 세포 펠렛 샘플로부터 분리된 RNA를 상기 생성된 cDNA 특이적 프라이머를 사용한 실시간 RT-PCR 연구에서 기질로서 사용하였다. 상기 보존된 RNA를 cDNA로 전환시키고 68개 유전자 특이적인 프라이머 세트 각각에 대한 RT-PCR의 기질로서 사용하였다. 역치 사이클 또는 C_T 수를 사용하여 시간 전반에 걸쳐 수거된 각각의 RNA 샘플내에서 68개 cDNA 각각에 대한 상대적인 전사체 풍부함을 나타내었다. 질소 풍부와 질소 고갈된 조건간의 상당한 증가(3배 초과)를 나타내는 cDNA는 잠재적인 유전자로서 플래그하고 이의 발현은 질소 고갈에 의해 상향조절된다. 명세서에서 논의된 바와 같이, 질소 고갈/제한은 유성 미생물에서 지질 합성의 공지된 유도인자이다.

질소 고갈/제한 동안에 발현이 상향조절되는 cDNA 기원의 추정 프로모터/5'UTR 서열을 동정하기 위해, 총 RNA를 질소 풍부 조건하에서 성장한 프로토테카 모리포르미스(UTEX 1435)로부터 분리하고 이어서 454 서열분석 기술(Roche)를 사용하는 서열분석에 적용하였다. 상기 RT-PCR 결과에 의해 상향 조절된 바와 같은 플래그된 cDNA는 454 게놈 서열분석 판독으로부터 비롯된 어셈블리된 콘티그에 대한 BLAST를 사용하여 비교하였다. cDNA의 5' 말단은 특이적 콘티그로 맵핑하고 가능한 경우 500bp 초과의 5' 플랭킹 DNA를 사용하여 추정적으로 프로모터/UTR을 동정하였다. 이어서 프로모터/5'UTR의 존재는 게놈 DNA의 PCR 증폭을 사용하여 확인하고 클로닝하였다. 개별 cDNA 5' 말단을 사용하여 3' 프라이머를 디자인하고 454 콘티그 어셈블리의 5' 말단을 사용하여 5' 유전자 특이적 프라이머를 디자인하였다.

제1 스크리닝으로서, 추정 프로모터중 하나인 Aat2(암모늄 수송체, 서열번호 99)로부터 분리된 5'UTR/프로모터를 상기 실시예 5에 기재된 클로렐라 프로토테코이데스 스테아로일 ACP 데사투라제 수송 펩타이드와 함께 시나모뭄 캄포라 C14 티오에스테라제 작제물에 클로닝하여 클로렐라 소로키니아나 글루타메이트 데하이드로게나제 프로모터를 대체한다. 상기 작제물을 서열번호 112로서 나타낸다. 추정 프로모터를 시험하기 위해, 티오에스테라제 작제물을 프로토테카 모리포르미스 세포로 형질전환시켜 상기된 방법을 사용하여 낮은/무 질소 조건하에서 C14/C12 지방산 증가에 대해 스크리닝하여 실제 프로모터 활성을 확인하였다. cDNA/게놈 스크리닝으로부터 분리된 추정 질소 조정된 프로모터의 유사한 실험은 동일한 방법을 사용하여 수행할 수 있다.

cDNA/게놈 스크리닝으로부터 분리된 또 다른 추정 질소-조절된 프로모터/5' UTR은 다음과 같다:

실시예 13: 프로토테카 종에서 상동성 재조합

전이유전자의 상동성 재조합은 상기 실시예에 기재된 형질전환 방법 보다 여러 잇점을 갖는다. 첫번째로, 상동성 재조합 없이 전이유전자의 도입은 세포에 도입된 플라스미드의 카피수에 대한 조절이 없기때문에 예측할 수 없다. 또한, 상동성 재조합 없이 전이유전자의 도입은 플라스미드가 에피좀으로 존재할 수 있고 후속적인 세포 분열에 따라 상실되기 때문에 불안정할 수 있다. 상동성 재조합의 또 다른 잇점은 유전자 표적물을 "녹-아웃"시키고 에피토프 태그를 도입하고 내인성 유전자의 프로모터를 스위칭시키고 다르게는 유전자 표적물을 변형시키는(예를 들어, 점 돌연변이의 도입) 능력이다.

KE858로 지정된 프로토테카 모리포르미스(UTEX 1435)의 특정 영역을 사용하여 2개의 벡터를 작제하였다. KE858은 단백질의 전달 RNA(tRNA)와 상동성을 공유하는 단백질에 대한 암호화 영역의 일부를 포함하는 1.3kb의 게놈 단편이다. 서던 블롯은 KE858 서열이 프로토테카 모리포르미스(UTEX 1435) 게놈에서 단일 카피로 존재한다. (서열번호 103)으로 지정된, 작제된 제1 유형의 벡터는 상기 실시예 3에 사용된 최적화된 효모 인버타제(suc2) 유전자를 함유하는 pUC19 벡터 골격으로 클로닝된 전체 1.3kb KE858 단편으로 이루어진다. KE858 단편은 표적화 작제물에 어디에도 존재하지 않는 유일한 SnaB1 부위를 함유한다. SZ726 (서열번호 126)으로 지정된 작제된 제2 유형의 벡터는 KE858 게놈 서열내 SnaB1 부위에서 효모 인버타제 유전자(suc2)의 삽입에 의해 파괴된 KE858 서열로 이루어졌다. 효모 인버타제 유전자를 플랭킹하는 KE858 서열을 함유하는 전체 DNA 단편은 KE858 영역의 어느 한 말단을 절단하는 EcoRI로 분해하여 벡터 골격으로부터 절단될 수 있다.

벡터 둘다를 사용하여 효모 인버타제 유전자(suc2)의 프로토테카 모리포르미스(UTEX 1435) 게놈의 상응하는 KE858 영역으로의 상동성 재조합을 지시하였다. 상동성 재조합을 위해 표적화된 게놈 영역에 상응하는 선형 DNA 말단을, SnaB1으로 작제물 SZ725를 분해하고 벡터 작제물 SZ726을 EcoRI로 분해함에 의해 노출시켰다. 분해된 벡터 작제물을 이어서 실시예 3에서 상기된 방법을 사용하여 프로토테카 모리포르미스 배양물에 도입하였다. 이어서 각각의 벡터 작제물 기원의 형질전환체를 슈크로스 플레이트를 사용하여 선택하였다. 각각의 벡터 형질전환 기원의 10개의 독립적인 크론적으로 순수한 형질전환체는 목적하는 게놈 위치로의 효모 인버타제 유전자의 성공적인 재조합(서던 블롯을 사용하여) 및 전이유전자의 안정성에 대해 분석하였다.

SZ725 형질전환체의 서던 블롯 분석은 분석을 위해 집어낸 10개의 형질전환체중 4개가 예측된 재조합 밴드를 함유함을 보여주었고 이는 단일 크로스오버 반응이 벡터상의 KE858 서열과 게놈내 KE858 서열사이에서 발생하였음을 지적한다. 대조적으로, SZ726 형질전환체중 모든 10개는 예측된 재조합 밴드를 함유하였고 이는 이중 크로스오버 반응이 효모 인버타제 전이유전자를 플랭킹하는 KE858 서열을 함유한 pSZ726의 EcoRI 단편과 게놈의 상응하는 KE858 영역 사이에서 발생하였음을 지적한다.

슈크로스 인버타제 발현 및 전이유전자 안정성은 선택의 부재하에 15 세대 이상 동안 형질전환체를 성장시킴에 의해 평가하였다. 서던 블롯팅에 의한 전이유전자에 대해 양성인 4개의 SZ725 형질전환체 및 10개의 SZ276 형질전환체를 선택하고 형질전환체 각각으로부터 48개 단일 콜로니를 먼저 글루코스 함유 배지에서 선택 없이 및 이어서 유일한 탄소원으로부터 슈크로스 함유 배지에서 선택과 함께 연속으로 성장시켰다. 서던 블롯팅에 의해 전이유전자에 대해 양성인 4개의 SZ725 형질전환체 및 10개의 SZ276 형질전환체를 선택하고 형질전환체 각각으로부터 기원하는 48개 단일 콜로니를 먼저 글루코스 함유 배지에서 선택 없이 및 유일 탄소원으로서 슈크로스를 함유하는 배지에서 선택과 함께 연속으로 성장시켰다. 모든 10개의 SZ276 형질전환체(100%)는 15세대 후 슈크로스상에서 성장하는 능력을 보유한 반면 SZ725 형질전환체의 약 97%는 15세대 후 글루코스상에서 성장하는 능력을 보유하였다. 이중 크로스오버 반응에 의해 도입된 전이유전자(SZ726 벡터)는 세대 증식과 함께 극히 높은 안정성을 갖는다. 대조적으로, 단일 크로스오버 반응에 의해 도입된 전이유전자(SZ725 벡터)는 탠덤 카피의 전이유전자가 도입되고 전이유전자를 플랭킹하는 반복되는 상동성 영역이 재조합되고 이들 사이에 위치한 전이유전자 DNA를 절단할 수 있기때문에 세대 증식 동안 몇몇 불안정성을 유발할 수 있다.

이들 실험은 유기체의 핵 염색체로 안정하게 통합되는 이종성 슈크로스 인버타제 유전자를 함유하는 프로토테카 형질전환체를 제조하기 위한 상동성 재조합의 성공적인 사용을 입증한다. 상동성 재조합의 성공은 유전자 결실, 점 돌연변이 및 목적하는 유전자 생성물을 태깅하는 에피토프를 포함하는, 프로토테카 내 다른 유게놈 변형을 가능하게 할 수 있다. 이들 실험은 또한 진핵 미세조류의 핵 게놈에서 상동성 재조합을 위해 먼저 보고된 시스템을 입증한다.

A. 내인성 프로토테카 모리포르미스 유전자를 녹-아웃 시키기 위한 상동성 재조합의 용도

상기 실시예 11에 기재된 프로토테카 모리포르미스 cDNA/게놈 스크리닝에서, 내인성 스테아로일 ACP 데사투라제 (SAPD) cDNA를 동정하였다. 스테아로일 ACP 데사투라제 효소는 지질 합성 경로의 일부이고 이들은 지방 아실 쇄로 이중 결합을 도입하는 기능을 한다. 몇몇 경우에, 이것은 지방산 프로필을 변형시키기 위해 지질 경로 효소의 발현을 녹-아웃시키거나 감소시키는데 유리할 수 있다. 상동성 재조합 작제물은 내인성 스테아로일 ACP 데사투라제 효소의 발현이 감소될 수 있는지(또는 녹아웃될 수 있는지)의 여부 및 불포화된 지방산의 상응하는 감소가 숙주 세포의 지질 프로필에서 관찰될 수 있는지의 여부를 평가하기 위해 작제하였다. 대략적으로, 프로토테카 모리포르미스 (UTEX 1435) 기원의 스테아로일 ACP 데사투라제 유전자의 1.5kb 암호화 서열을 동정하여쏘 클로닝하였다(서열번호 104). 상동성 재조합 작제물은 5'말단(5' 표적화 부위)에서 SAPD 암호화 서열을 사용함에 이어서 클로렐라 불가리스 3'UR과 함께 코돈 최적화된 효모 슈크로스 인버타제 suc2 유전자를 구동시키는 클라미도모나스 레인하르드티 β-튜불린 프로모터를 사용하여 작제하였다. 프로토테카 모리포르미스 SAPD 암호화 서열의 나머지(약 1kb)를 이어서 3' 표적화 부위를 구성하기 위해 클로렐라 불가리스 3' UTR 이후에 삽입하였다. 상기 상동성 재조합 카세트에 대한 서열은 서열번호 105로 나타낸다. 상기된 바와 같이, 상동성 재조합 카세트의 핵 게놈으로의 통합을 위한 성공율은 미세조류를 형질전환시키기 전에 카세트를 선형화하여 말단이 노출되도록 함에 의해 증가될 수 있다. 프로토테카 모리포르미스에서 내인성 SAPD 효소를 표적화하는 상동성 재조합 카세트를 선형화시키고 이어서 숙주 세포(프로토테카 모리포르미스, UTEX 1435)에 형질전환시킨다. 성공적인 통합은 이중 상호 재조합 반응을 통해 숙주 게놈으로부터 내인성 SAPD 효소 암호화 영역을 제거할 거이고 새롭게 삽입된 suc2 유전자의 발현은 클라미도모나스 레인하르드티 β-튜불린 프로모터에 의해 조절된다. 수득한 클론은 유일한 탄소원으로서 슈크로스를 함유하는 플레이트/배지를 사용하여 스크리닝할 수 있다. 상동성 재조합 카세트의 성공적인 통합을 함유하는 클론은 유일한 탄소원으로서 슈크로스상에서 성장하는 능력을 갖고 지질 프로필내 지방산의 총 포화의 변화는 2차 확인 인자로서 작용한다. 추가로, 효모 슈크로스 인버타제 suc2 유전자에 특이적인 프로브를 사용하는 블롯팅 분석 및 RT-PCR은 또한 양성 클론에서 인버타제 유전자의 존재 및 발현을 확인시켜줄 수 있다. 대안으로서, β-튜불린 프로모터가 부재인 동일한 작제물을 사용하여 내인성 SAPD 효소 암호화 영역을 절단할 수 있다. 이 경우에, 새롭게 삽입된 효모 슈크로스 인버타제 suc2 유전자는 내인성 SAPD 프로모터/5'UTR에 의해 조절될 것이다.

실시예 14: 연료 생산

A. 익스펠러 프레스 및 프레스 보조기를 사용한 미세조류로부터 오일의 추출

DCW를 기준으로 38%의 오일을 함유하는 미세조류 바이오매쓰는 드럼 건조기로 건조시켜 수분 함량이 5 내지 5.5%가 되게하였다. 상기 바이오매쓰는 프렌치 L250 프레스에 공급하였다. 30.4 kg (67 lbs.)의 바이오매쓰를 프레스를 통해 공급하고 오일을 회수하였다. 프레스 보조기로서 다양한 %의 스위치그래스와 조합된 동일한 건조된 미세조류 바이오매쓰를 프레스를 통해 공급하였다. 건조된 미생물 바이오매쓰와 20% w/w의 스위치그래스의 조합으로 최상의 총 %의 오일을 회수하였다. 프레스된 케이크를 이어서 헥산 추출에 적용하고 20% 스위치그래스 조건에 대한 최종 수율은 총 61.6%의 가용 오일(중량으로 계산하여)이었다. 상기 50% 오일 무수 세포 중량을 갖는 바이오매쓰는 오일을 유리시키기 위해 스위치그래스와 같은 프레싱 보조기의 사용을 요구하지 않는다.

B. 탈지된 프로토테카 모리포르미스 바이오매쓰의 모노사카라이드 조성물

프로토테카 모리포르미스(UTEX 1435)는 상기 실시예 45에 기재된 바와 같은 조건 및 영양 배지(4% 글루코스를 갖는)에서 성장시켰다. 미세조류 바이오매쓰를 이어서 수거하고 드럼 건조기를 사용하여 건조시켰다. 건조된 조류 바이오매쓰를 가수분해시키고 오일은 상기 실시예 44에 기재된 바와 같이 익스펠러 프레스를 사용하여 추출하였다. 프레스된 바이오매쓰에서 잔여 오일을 이어서 석유 에테르를 사용하여 용매 추출하였다. 잔류 석유 에테르는 회전증발기(Buchi Labortechnik AG, Switzerland)를 사용하여 탈지된 밀로부터 증발시켰다. 이어서 글리코실(모노사카라이드) 조성 분석은 산성 메탄올용해에 의해 샘플로부터 제조된 모노사카라이드 메틸 글리코사이드의 퍼-O-트리메틸실릴(TMS) 유도체의 조합된 가스 크로마토그래피/질량 분광기(GC/MS)를 사용하여 탈지된 밀상에서 수행하였다. 탈지된 밀의 샘플을 대략 20시간 동안 80℃에서 메탄올중 1M HCl에서 메탄올 용해에 적용하고 메탄올중에서(아미노당 검출을 위해) 피리딘 및 무수 아세트산으로 다시 N-아세틸화하였다. 이어서 상기 샘플은 30분 동안 80℃에서 Tri-Sil(Pierce)을 사용한 처리에 의해 퍼-O-트리메티릴릴화하였다(문헌참조: methods in Merkle and Poppe (1994) Methods Enzymol. 230: 1-15 and York et al., (1985) Methods Enzymol. 118:3-40). TMS 메틸 글리코시드의 GC/MS 분석은 모든 Tech EC-l 융합된 실리카 모세관 칼럼 (30m x 0.25 mm ID)을 사용하여 5975b MSD로 상호접지된 HP 6890 GC상에서 수행하였다. 상기 모노사카라이드는 표준물과 비교하여 이들의 체류 시간으로 동정하였고 이들의 탄수화물 특성은 이들의 질량 분광기에 의해 입증된다. 샘플 당 20마이코그램의 이노시톨을 내부 표준물로서 유도체화전에 샘플에 첨가하였다. 탈지된 프로토테카 모리포르미스(UTEX 1435) 바이오매쓰의 모노사카라이드 프로필은 하기 표 18에 요약되어 있다. 샘플 기원의 총 % 탄수화물은 28.7%인 것으로 계산되었다.

n.d. = 검출되지 않음

탈지된 밀의 탄수화물 함량 및 모노사카라이드 조성은 이것이 동물 사료로서 또는 동물 사료 제형의 일부로서 사용하기에 적합하게 한다. 따라서, 하나의 측면에서, 본 발명은 상기 표에 제시된 생성물 함량을 갖는 탈지된 밀을 제공한다.

C. 프로토테카 오일로부터 바이오디젤의 생성

상기된 방법에 따라 생성된 프로토테카 모리포르미스 UTEX 1435 기원의 탈검화된 오일을 트랜스에스테르화에 적용하여 지방산 메틸 에스테르를 생성하였다. 결과는 하기에 나타낸다:

오일의 지질 프로필은 다음과 같다:

바이오디젤의 지질 프로필은 원료공급 오일의 지질 프로필과 매우 유사하였다. 본 발명의 방법 및 조성물에 의해 제공된 기타 오일은 트랜스에스테르화에 적용하여 (a) 4% 이상의 C8-C14; (b) 0.3% 이상의 C8; (c) 2% 이상의 C10; (d) 2% 이상의 C12; 및 (3) 30% 이상의 C8-C14을 포함하는 지질 프로필을 갖는 바이오디젤을 수득할 수 있다.

생성된 바이오디젤의 ASTM D6751 A1 방법에 의한 냉침지 여과기 능력은 300ml의 용적에 대해 120 초였다. 이러한 시험은 16시간 동안 40°F로 냉각되고 실온으로 가온되도록 방치되며 스테인레스강 지지체와 함께 0.7마이크론 유리 섬유 필터를 사용한 진공 여과하는 300ml의 B100의 여과를 포함한다. 본 발명의 오일은 트랜스에스테르화하여 바이오디젤을 생성시킬 수 있고 냉침지 시간은 120초 미만, 100초 미만 및 90초 미만이다.

D. 재생가능한 디젤의 생산

상기된 방법에 따라 제조되고 상기 실시예 X에서 바이오디젤을 제조하기 위해 사용되는 오일과 동일한 지질 프로필을 갖는, 프로토테카 모리포르미스 UTEX 1435 기원의 탈검화된 오일은 트랜스에스테르화하여 재생가능한 디젤을 생성하였다.

상기 오일을 먼저 수소화처리하여 산소 및 글리세롤 골격을 제거하여 n-파라핀을 수득한다. 상기 n-파라핀을 이어서 크랙킹 및 이성체화에 적용하였다. 상기 물질의 크로마토그램은 도 13에 나타낸다. 상기 물질을 이어서 냉 여과시켜 C18 물질의 약 5%를 제거하였다. 냉 여과 후, 총 용적의 물질을 인화점으로 컷팅하고 인화점, ASTM D-86 증기 분포, 혼탁점 및 점도에 대해 평가하였다. 인화점은 63℃이었고; 점도는 2.86 cSt (센티스트로크)이었고; 혼탁점은 4℃이었다. ASTM D86 증기 값은 표 20에 나타낸다:

생성된 물질의 T10-T90은 57.9℃이었다. 본원에 기재된 오일의 수소화처리, 이성체화 및 기타 공유적 변형 방법 및 본원에 기재된 증류 및 분획화(냉각 여과와 같은) 방법을 사용하여, 본원에 기재된 방법에 따라 생성된 트리글리세라이드 오일을 사용하는 20, 25, 30, 35, 40, 45, 50, 60 및 65℃와 같은 다른 T10-T90 범위를 갖는 재생가능한 디젤 조성물 생성할 수 있다.

생성된 물질의 TlO은 242.1℃이었다. 본원에 기재된 오일의 수소화처리, 이성체화 및 기타 공유적 변형 방법 및 본원에 기재된 증류 및 분획화(예를 들어, 냉각 여과) 방법을 사용하여, 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 290 이상의 T10과 같은 다른 T10 값을 갖는 재생가능한 디젤 조성물을 생성할 수 있다.

생성된 물질의 TlO은 300℃이었다. 본원에 기재된 오일의 수소화처리, 이성체화 및 기타 공유적 변형 방법 및 본원에 기재된 증류 및 분획화(예를 들어, 냉각 여과) 방법을 사용하여, 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 및 290 이상의 T90과 같은 다른 T90 값을 갖는 재생가능한 디젤 조성물을 생성할 수 있다.

생성된 물질의 FBP는 300℃이었다. 본원에 기재된 오일의 수소화처리, 이성체화 및 기타 공유적 변형 방법 및 본원에 기재된 증류 및 분획화(예를 들어, 냉각 여과) 방법을 사용하여, 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 및 300 이상의 FBP와 같은 다른 FBP 값을 갖는 재생가능한 디젤 조성물을 생성할 수 있다.

(a) 4% 이상의 C8-C14; (b) 0.3% 이상의 C8; (c) 2% 이상의 C10; (d) 2% 이상의 C12; 및 (3) 30% 이상의 C8-C14를 포함하는 지질 프로필을 갖는 오일을 포함하는, 본 발명의 방법 및 조성물에 의해 제공된 기타 오일은 조합된 수소화처리, 이성체화 및 기타 공유적 변형에 적용될 수 있다.

실시예 15: 클로렐라 루테오비리디스(Chlorella luteoviridis)에 의한 슈크로스의 이용

A. 글루코스 및 슈크로스상에서의 SAG 2214 성장

SAG 2214 (클로렐라 루테오비리디스로서 지정됨)는 글루코스 또는 슈크로스중 하나를 함유하는 배지상에서 암실에서의 성장에 대해 시험하였다. 종속영양 액체 배양은 유일한 탄소원으로서 4% 글루코스 또는 4% 슈크로스를 함유하는 배지중 동결된 바이엘 기원의 접종물을 사용하여 개시하였다. 배양물은 200rpm에서 진탕시키면서 암실에서 성장시켰다. 배양물로부터의 샘플은 0, 24, 48 및 72시간 시점에 채취하고 성장은 750nm에서의 상대적 흡광도 (UV Minil240, Shimadzu)로 측정하였다. SAG 2214는 슈크로스 또는 글루코스에서 동등하게 잘 성장하였고 이는 상기 미세조류가 유일한 탄소원으로부터 글루코스와 같이 효과적으로 슈크로스를 이용할 수 있음을 보여준다. 상기 실험 결과는 도 3에 그래프로 나타낸다.

B. SAG 2214에 대한 지질 생산성 및 지방산 프로필

미세조류 균주 SAG 2214를 상기 실시예 32에 기재된 바와 같은 유사한 조건에서 유일 탄소원으로부터 글루코스 또는 슈크로스를 함유하는 액체 배지에서 배양하였다. 7일 후, 세포를 무수 세포중량 계산을 위해 수거하였다. 세포를 원심분리하고 24시간 동안 동결건조시켰다. 무수 세포 펠렛을 칭량하고 리터당 무수 세포 중량을 계산하였다. 지질 분석을 위해 세포를 또한 수거하고 실온에서 10분 동안 4000 x g에서 원심분리하였다. 상등액을 버리고 상기 샘플은 표준 가스 크로마토그래피 (GC/FID) 과정을 사용하여 지질 분석 및 지방산 프로필을 위해 가공하였다. 상기 결과는 하기 표 21 및 22에 요약한다.

C. SAG 2214와 다른 클로렐라 루테오비리디스 균주의 게놈 비교

미세조류 균주 SAG 2214가 탄소원으로서 슈크로스상에서 성장하는 능력(상기 설명된 바와 같이)으로 인해 일반적인 관심대상임을 입증하였다. 상기 균주의 성장 특성 뿐만 아니라, 다른 미세조류 종과 이의 분류학적 관계가 또한 관심 대상이다. 클로렐라 루테오비리디스 균주로서 SAG 수거에 의해 저정된 SAG 2214의 23s rRNA 유전자를 서열분석하고 또한 클로렐라 루테오비리디스로서 SAG 및 UTEX 수거에 의해 또한 동정된 9개의 다른 균주의 23s rRNA 게놈 서열과 비교하였다. 이들 균주는 UTEX 21, 22, 28, 257 및 258이고, SAG 균주는 2133, 2196, 2198 및 2203이다. 사용되는 DNA 유전자분류 방법은 실시예 1에서 상기된 방법과 동일하다. 서열 정렬 및 언루티드 트리(unrooted tree)는 유전자 DNA 분석 소프트웨어를 사용하여 수행하였다. 9개 다른 균주중에서 유전자형 UTEX 21, 22, 28 및 257이 동일한 23s rRNA DNA 서열(서열번호 106)을 가졌다. 기타 다른 5개의 클로렐라 루테오비리디스 균주는 UTEX 21, 22, 28, 및 257과 고도로 상동성인 23s rRNA 서열을 가졌다.

SAG 2214(서열번호 30) 기원의 23s rRNA 유전자 서열은 결정적으로 다른 다른 균주에서 발견되지 않았던 대형 삽입체를 갖는 다른 9개의 클로렐라 루테오비리디스 균주의 서열과 상이하다. BLAST를 사용하는 상기 23s rRNA 유전자 서열의 추가 분석은 이것이 펩토시라 및 트레보욱시아(리켄의 피코비온트 부분의 구성원) 속의 구성원과 최대 상동성을 공유함을 지적하였다. 이들 결과는 SAG2214가 균주 수거에 의해 분류된 바와 같은 클로렐라 루테오비리디스 균주가 아닐 수 있고 대신 리켄에서 발견되는 조류 공생자와 상당한 23S rRNA 뉴클레오타이드 동일성을 공유함을 지적한다. 성장 특성과 함께 게놈 분석은 SAG 2214가 슈크로스 대사에 관여하는 유전자 및 단백질, 및 상기 효소의 올바른 위치화에 관여하는 시그날 전달 및 수송 펩타이드의 공급원일 수 있음을 지적한다. 고도의 게놈 유사성을 갖는 SAG 2214 및 기타 균주는 또한 고정 탄소원으로서 슈크로스를 사용하는 오일 생산에 유용한 균주일 수 있다.

본 발명은 이의 특정 양태와 연계하여 기재하였지만 이것은 추가의 변형이 있을 수 있는 것으로 이해되어야만 한다. 본원은 일반적으로 본 발명의 원리에 따르고 본 발명이 속하는 기술 분야에서 공지되거나 통상적인 실시 범위내 있고 이전에 제시된 필수적 특징에 적용될 수 있는 바와 같이, 본원으로부터 비롯되는 것을 포함하는 임의의 변형, 용도 또는 적용을 포함하는 것으로 의도된다.

특허, 특허원 및 공보를 포함하는 본원에 인용된 모든 참조문헌은 이전에 구체적으로 인용되거나 인용되지 않는 것에 상관 없이 이의 전문이 참조로서 인용된다. 본원에 언급된 공보는 본 발명과 연계하여 사용될 수 있는 시약, 방법 및 개념을 기술하고 기재할 목적으로 인용된다. 본원에서 어떠한 것도 이들 문헌이 본원에 기재된 발명과 관련된 선행 기술임을 인정하는 것으로 해석되지 말아야 한다. 특히, 하기의 특허원은 모든 목적을 위해 이들의 전문이 참조로 인용된다: US 가출원 번호 제60/941,581호, 2007년 6월 1일 출원, 표제("Production of Hydrocarbons in Microorganisms"); US 가출원 번호 제60/959,174호, 2007년 7월 10일 출원, 표제("Production of Hydrocarbons in Microorganisms"); 미국 가출원 번호 제60/968,291호, 2007년 8월 27일 출원, 표제("Production of Hydrocarbons in Microorganisms"); 미국 가출원 번호 제61/024,069호, 2008년 1월 28일 출원, 표제("Production of Hydrocarbons in Microorganims"); PCT 출원 번호 제PCT/US08/65563호, 2008년 6월 2일 출원, 표제("Production of Oil in Microorganisms"); 미국 특허원 제12/131,783호, 2008년 6월 2일 출원, 표제("Use of Cellulosic Material for Cultivation of Microorganisms"); 미국 특허 출원 번호 제12/131,773호, 2008년 6월 2일 출원, 표제("Renewable Diesel and Jet Fuel from Microbial Sources"); 미국 특허 출원 번호 제12/131,793호, 2008년 6월 2일 출원, 표제("Sucrose Feedstock Utilization for Oil-Based Fuel Manufacturing"); 미국 특허 출원 번호 제12/131,766호, 2008년 6월 2일 출원, 표제("Glycerol Feedstock Utilization for Oil-Based Fuel Manufacturing"); 미국 특허 출원 번호제12/131,804호, 2008년 6월 2일 출원, 표제("Lipid Pathway Modification in Oil- Bearing Microorganisms"); 미국 특허 출원 번호 제61/118,590호, 2008년 11월 28일 출원, 표제("Production of Oil in Microorganisms"); 미국 가특허 출원 번호 제61/118,994호, 2008년 12월 1일 출원, 표제("Production of Oil in Microorganisms"); 미국 가특허 출원 번호 제61/174,357호, 2009년 4월 3일 출원, 표제("Production of Oil in Microorganisms"); 미국 가특허 출원 번호 제61/219,525호, 2009년 6월 23일 출원, 표제("Production of Oil in Microorganisms"); 및 PCT 출원 번호 [[대리인 도켓 번호 026172-005010PC]], 2009년 11월 30일 출원, 표제("Production of Tailored Oils in Heterotrophic Microorganisms").

SEQUENCE LISTING <110> SOLAZYME, INC. <120> MANUFACTURING OF TAILORED OILS IN RECOMBINANT HETEROTROPHIC MICROORGANISMS <130> 026172-005020PC <140> PCT/US2009/066141 <141> 2009-11-30 <150> 61/219,525 <151> 2009-06-23 <150> 61/174,357 <151> 2009-04-30 <150> 61/118,994 <151> 2008-12-01 <150> 61/118,590 <151> 2008-11-28 <160> 143 <170> PatentIn version 3.5 <210> 1 <211> 1187 <212> DNA <213> Chlorella sp. <400> 1 gatcagacgg gcctgacctg cgagataatc aagtgctcgt aggcaaccaa ctcagcagct 60 gcttggtgtt gggtctgcag gatagtgttg cagggcccca aggacagcag gggaacttac 120 accttgtccc cgacccagtt ttatggagtg cattgcctca agagcctagc cggagcgcta 180 ggctacatac ttgccgcacc ggtatgaggg gatatagtac tcgcactgcg ctgtctagtg 240 agatgggcag tgctgcccat aaacaactgg ctgctcagcc atttgttggc ggaccattct 300 gggggggcca gcaatgcctg actttcgggt agggtgaaaa ctgaacaaag actaccaaaa 360 cagaatttct tcctccttgg aggtaagcgc aggccggccc gcctgcgccc acatggcgct 420 ccgaacacct ccatagctgt aagggcgcaa acatggccgg actgttgtca gcactctttc 480 atggccatac aaggtcatgt cgagattagt gctgagtaag acactatcac cccatgttcg 540 attgaagccg tgacttcatg ccaacctgcc cctgggcgta gcagacgtat gccatcatga 600 ccactagccg acatgcgctg tcttttgcca ccaaaacaac tggtacaccg ctcgaagtcg 660 tgccgcacac ctccgggagt gagtccggcg actcctcccc ggcgggccgc ggccctacct 720 gggtagggtc gccatacgcc cacgaccaaa cgacgcagga ggggattggg gtagggaatc 780 ccaaccagcc taaccaagac ggcacctata ataataggtg gggggactaa cagccctata 840 tcgcaagctt tgggtgccta tcttgagaag cacgagttgg agtggctgtg tacggtcgac 900 cctaaggtgg gtgtgccgca gcctgaaaca aagcgtctag cagctgcttc tataatgtgt 960 cagccgttgt gtttcagtta tattgtatgc tattgtttgt tcgtgctagg gtggcgcagg 1020 cccacctact gtggcgggcc attggttggt gcttgaattg cctcaccatc taaggtctga 1080 acgctcactc aaacgccttt gtacaactgc agaactttcc ttggcgctgc aactacagtg 1140 tgcaaaccag cacatagcac tcccttacat cacccagcag tacaaca 1187 <210> 2 <211> 1414 <212> DNA <213> Chlorella ellipsoidea <400> 2 cgctgcgcac cagggccgcc agctcgctga tgtcgctcca aatgcggtcc cccgattttt 60 tgttcttcat cttctccacc ttggtggcct tcttggccag ggccttcagc tgcatgcgca 120 cagaccgttg agctcctgat cagcatcctc aggaggccct ttgacaagca agcccctgtg 180 caagcccatt cacggggtac cagtggtgct gaggtagatg ggtttgaaaa ggattgctcg 240 gtcgattgct gctcatggaa ttggcatgtg catgcatgtt cacaatatgc caccaggctt 300 tggagcaaga gagcatgaat gccttcaggc aggttgaaag ttcctggggg tgaagaggca 360 gggccgagga ttggaggagg aaagcatcaa gtcgtcgctc atgctcatgt tttcagtcag 420 agtttgccaa gctcacagga gcagagacaa gactggctgc tcaggtgttg catcgtgtgt 480 gtggtggggg ggggggggtt aatacggtac gaaatgcact tggaattccc acctcatgcc 540 agcggaccca catgcttgaa ttcgaggcct gtggggtgag aaatgctcac tctgccctcg 600 ttgctgaggt acttcaggcc gctgagctca aagtcgatgc cctgctcgtc tatcagggcc 660 tgcacctctg ggctgaccgg ctcagcctcc ttcgcgggca tggagtaggc gccggcagcg 720 ttcatgtccg ggcccagggc agcggtggtg ccataaatgt cggtgatggt ggggaggggg 780 gccgtcgcca caccattgcc gttgctggct gacgcatgca catgtggcct ggctggcacc 840 ggcagcactg gtctccagcc agccagcaag tggctgttca ggaaagcggc catgttgttg 900 gtccctgcgc atgtaattcc ccagatcaaa ggagggaaca gcttggattt gatgtagtgc 960 ccaaccggac tgaatgtgcg atggcaggtc cctttgagtc tcccgaatta ctagcagggc 1020 actgtgacct aacgcagcat gccaaccgca aaaaaatgat tgacagaaaa tgaagcggtg 1080 tgtcaatatt tgctgtattt attcgtttta atcagcaacc aagttcgaaa cgcaactatc 1140 gtggtgatca agtgaacctc atcagactta cctcgttcgg caaggaaacg gaggcaccaa 1200 attccaattt gatattatcg cttgccaagc tagagctgat ctttgggaaa ccaactgcca 1260 gacagtggac tgtgatggag tgccccgagt ggtggagcct cttcgattcg gttagtcatt 1320 actaacgtga accctcagtg aagggaccat cagaccagaa agaccagatc tcctcctcga 1380 caccgagaga gtgttgcggc agtaggacga caag 1414 <210> 3 <211> 512 <212> PRT <213> Unknown <220> <223> Description of Unknown: Yeast sequence <400> 3 Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His Phe Thr Pro Asn 1 5 10 15 Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr Asp Glu Lys Asp 20 25 30 Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn Asp Thr Val Trp 35 40 45 Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp Asp Leu Thr Asn 50 55 60 Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg Asn Asp Ser Gly 65 70 75 80 Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn Thr Ser Gly Phe 85 90 95 Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val Ala Ile Trp Thr 100 105 110 Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser Tyr Ser Leu Asp 115 120 125 Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro Val Leu Ala Ala 130 135 140 Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp Tyr Glu Pro Ser 145 150 155 160 Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp Tyr Lys Ile Glu 165 170 175 Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu Glu Ser Ala Phe 180 185 190 Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys Pro Gly Leu Ile 195 200 205 Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr Trp Val Met Phe 210 215 220 Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser Phe Asn Gln Tyr 225 230 235 240 Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala Phe Asp Asn Gln 245 250 255 Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala Leu Gln Thr Phe 260 265 270 Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly Ile Ala Trp Ala 275 280 285 Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn Pro Trp Arg Ser 290 295 300 Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr Glu Tyr Gln Ala 305 310 315 320 Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu Pro Ile Leu Asn 325 330 335 Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr Asn Thr Thr Leu 340 345 350 Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn Ser Thr Gly Thr 355 360 365 Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr Gln Thr Ile Ser 370 375 380 Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys Gly Leu Glu Asp 385 390 395 400 Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser Ala Ser Ser Phe 405 410 415 Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val Lys Glu Asn Pro 420 425 430 Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro Phe Lys Ser Glu 435 440 445 Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu Asp Gln Asn Ile 450 455 460 Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser Thr Asn Thr Tyr 465 470 475 480 Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn Met Thr Thr Gly 485 490 495 Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val Arg Glu Val Lys 500 505 510 <210> 4 <211> 20 <212> PRT <213> Unknown <220> <223> Description of Unknown: Yeast sequence <400> 4 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala Ser 20 <210> 5 <211> 18 <212> PRT <213> Unknown <220> <223> Description of Unknown: Higher plant secretion signal <400> 5 Met Ala Asn Lys Ser Leu Leu Leu Leu Leu Leu Leu Gly Ser Leu Ala 1 5 10 15 Ser Gly <210> 6 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic consensus sequence <400> 6 Met Ala Arg Leu Pro Leu Ala Ala Leu Gly 1 5 10 <210> 7 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Met Ala Asn Lys Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Pro Leu 1 5 10 15 Ala Ala Ser Gly 20 <210> 8 <211> 2615 <212> DNA <213> Saccharomyces cerevisiae <400> 8 gaattcccca acatggtgga gcacgacact ctcgtctact ccaagaatat caaagataca 60 gtctcagaag accaaagggc tattgagact tttcaacaaa gggtaatatc gggaaacctc 120 ctcggattcc attgcccagc tatctgtcac ttcatcaaaa ggacagtaga aaaggaaggt 180 ggcacctaca aatgccatca ttgcgataaa ggaaaggcta tcgttcaaga tgcctctgcc 240 gacagtggtc ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt 300 ccaaccacgt cttcaaagca agtggattga tgtgaacatg gtggagcacg acactctcgt 360 ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg agacttttca 420 acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct gtcacttcat 480 caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg ataaaggaaa 540 ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 600 gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 660 tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc 720 tatataagga agttcatttc atttggagag gacacgctga aatcaccagt ctctctctac 780 aaatctatct ctggcgcgcc atatcaatgc ttcttcaggc ctttcttttt cttcttgctg 840 gttttgctgc caagatcagc gcctctatga cgaacgaaac ctcggataga ccacttgtgc 900 actttacacc aaacaagggc tggatgaatg accccaatgg actgtggtac gacgaaaaag 960 atgccaagtg gcatctgtac tttcaataca acccgaacga tactgtctgg gggacgccat 1020 tgttttgggg ccacgccacg tccgacgacc tgaccaattg ggaggaccaa ccaatagcta 1080 tcgctccgaa gaggaacgac tccggagcat tctcgggttc catggtggtt gactacaaca 1140 atacttccgg ctttttcaac gataccattg acccgagaca acgctgcgtg gccatatgga 1200 cttacaacac accggagtcc gaggagcagt acatctcgta tagcctggac ggtggataca 1260 cttttacaga gtatcagaag aaccctgtgc ttgctgcaaa ttcgactcag ttccgagatc 1320 cgaaggtctt ttggtacgag ccctcgcaga agtggatcat gacagcggca aagtcacagg 1380 actacaagat cgaaatttac tcgtctgacg accttaaatc ctggaagctc gaatccgcgt 1440 tcgcaaacga gggctttctc ggctaccaat acgaatgccc aggcctgata gaggtcccaa 1500 cagagcaaga tcccagcaag tcctactggg tgatgtttat ttccattaat ccaggagcac 1560 cggcaggagg ttcttttaat cagtacttcg tcggaagctt taacggaact catttcgagg 1620 catttgataa ccaatcaaga gtagttgatt ttggaaagga ctactatgcc ctgcagactt 1680 tcttcaatac tgacccgacc tatgggagcg ctcttggcat tgcgtgggct tctaactggg 1740 agtattccgc attcgttcct acaaaccctt ggaggtcctc catgtcgctc gtgaggaaat 1800 tctctctcaa cactgagtac caggccaacc cggaaaccga actcataaac ctgaaagccg 1860 aaccgatcct gaacattagc aacgctggcc cctggagccg gtttgcaacc aacaccacgt 1920 tgacgaaagc caacagctac aacgtcgatc tttcgaatag caccggtaca cttgaatttg 1980 aactggtgta tgccgtcaat accacccaaa cgatctcgaa gtcggtgttc gcggacctct 2040 ccctctggtt taaaggcctg gaagaccccg aggagtacct cagaatgggt ttcgaggttt 2100 ctgcgtcctc cttcttcctt gatcgcggga acagcaaagt aaaatttgtt aaggagaacc 2160 catattttac caacaggatg agcgttaaca accaaccatt caagagcgaa aacgacctgt 2220 cgtactacaa agtgtatggt ttgcttgatc aaaatatcct ggaactctac ttcaacgatg 2280 gtgatgtcgt gtccaccaac acatacttca tgacaaccgg gaacgcactg ggctccgtga 2340 acatgacgac gggtgtggat aacctgttct acatcgacaa attccaggtg agggaagtca 2400 agtgagatct gtcgatcgac aagctcgagt ttctccataa taatgtgtga gtagttccca 2460 gataagggaa ttagggttcc tatagggttt cgctcatgtg ttgagcatat aagaaaccct 2520 tagtatgtat ttgtatttgt aaaatacttc tatcaataaa atttctaatt cctaaaacca 2580 aaatccagta ctaaaatcca gatcccccga attaa 2615 <210> 9 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 9 tgttgaagaa tgagccggcg ac 22 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 10 cagtgagcta ttacgcactc 20 <210> 11 <211> 541 <212> DNA <213> Prototheca kruegani <400> 11 tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa tactctggag 60 ccatagcgaa agcaagttta gtaagcttag gtcattcttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttagta aaataacatg gaggcccgaa ccgactaatg 180 ttgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcag tacaaataga ggggtaaagc 300 actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 12 <211> 573 <212> DNA <213> Prototheca wickerhamii <400> 12 tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagattt aataactcga 60 aacctaagcg aaagcaagtc ttaatagggc gtcaatttaa caaaacttta aataaattat 120 aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180 gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240 tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300 gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360 ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420 gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480 ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540 gccatccttt aaagagtgcg taatagctca ctg 573 <210> 13 <211> 541 <212> DNA <213> Prototheca stagnora <400> 13 tgttgaagaa tgagccggcg agttaaaaaa aatggcatgg ttaaagatat ttctctgaag 60 ccatagcgaa agcaagtttt acaagctata gtcatttttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggtc aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggacgt gagtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 14 <211> 541 <212> DNA <213> Prototheca moriformis <400> 14 tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagataa ttctctggag 60 ccatagcgaa agcaagttta acaagctaaa gtcacccttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtta 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 15 <211> 573 <212> DNA <213> Prototheca moriformis <400> 15 tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagaatt aataactcga 60 aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120 aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180 gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240 tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300 gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360 ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420 gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480 ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540 gccatccttt aaagagtgcg taatagctca ctg 573 <210> 16 <211> 573 <212> DNA <213> Prototheca wickerhamii <400> 16 tgttgaagaa tgagccgtcg acttaaaata aatggcaggc taagagaatt aataactcga 60 aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120 aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180 gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240 tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300 gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360 ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420 gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480 ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540 gccatccttt aaagagtgcg taatagctca ctg 573 <210> 17 <211> 541 <212> DNA <213> Prototheca moriformis <400> 17 tgttgaagaa tgagccggcg agttaaaaag agtggcgtgg ttaaagaaaa ttctctggaa 60 ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt ttgtgggctc cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcgaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 18 <211> 541 <212> DNA <213> Prototheca zopfii <400> 18 tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa ttctctggag 60 ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt tcgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 19 <211> 565 <212> DNA <213> Prototheca moriformis <400> 19 tgttgaagaa tgagccggcg acttagaaaa ggtggcatgg ttaaggaaat attccgaagc 60 cgtagcaaaa gcgagtctga atagggcgat aaaatatatt aatatttaga atctagtcat 120 tttttctaga cccgaacccg ggtgatctaa ccatgaccag gatgaagctt gggtgatacc 180 aagtgaaggt ccgaaccgac cgatgttgaa aaatcggcgg atgagttgtg gttagcggtg 240 aaataccagt cgaacccgga gctagctggt tctccccgaa atgcgttgag gcgcagcagt 300 acatctagtc tatctagggg taaagcactg tttcggtgcg ggctgtgaga acggtaccaa 360 atcgtggcaa actctgaata ctagaaatga cgatgtagta gtgagactgt gggggataag 420 ctccattgtc aagagggaaa cagcccagac caccagctaa ggccccaaaa tggtaatgta 480 gtgacaaagg aggtgaaaat gcaaatacaa ccaggaggtt ggcttagaag cagccatcct 540 ttaaagagtg cgtaatagct cactg 565 <210> 20 <211> 550 <212> PRT <213> Cichorium intybus <400> 20 Met Ser Asn Ser Ser Asn Ala Ser Glu Ser Leu Phe Pro Ala Thr Ser 1 5 10 15 Glu Gln Pro Tyr Arg Thr Ala Phe His Phe Gln Pro Pro Gln Asn Trp 20 25 30 Met Asn Asp Pro Asn Gly Pro Met Cys Tyr Asn Gly Val Tyr His Leu 35 40 45 Phe Tyr Gln Tyr Asn Pro Phe Gly Pro Leu Trp Asn Leu Arg Met Tyr 50 55 60 Trp Ala His Ser Val Ser His Asp Leu Ile Asn Trp Ile His Leu Asp 65 70 75 80 Leu Ala Phe Ala Pro Thr Glu Pro Phe Asp Ile Asn Gly Cys Leu Ser 85 90 95 Gly Ser Ala Thr Val Leu Pro Gly Asn Lys Pro Ile Met Leu Tyr Thr 100 105 110 Gly Ile Asp Thr Glu Asn Arg Gln Val Gln Asn Leu Ala Val Pro Lys 115 120 125 Asp Leu Ser Asp Pro Tyr Leu Arg Glu Trp Val Lys His Thr Gly Asn 130 135 140 Pro Ile Ile Ser Leu Pro Glu Glu Ile Gln Pro Asp Asp Phe Arg Asp 145 150 155 160 Pro Thr Thr Thr Trp Leu Glu Glu Asp Gly Thr Trp Arg Leu Leu Val 165 170 175 Gly Ser Gln Lys Asp Lys Thr Gly Ile Ala Phe Leu Tyr His Ser Gly 180 185 190 Asp Phe Val Asn Trp Thr Lys Ser Asp Ser Pro Leu His Lys Val Ser 195 200 205 Gly Thr Gly Met Trp Glu Cys Val Asp Phe Phe Pro Val Trp Val Asp 210 215 220 Ser Thr Asn Gly Val Asp Thr Ser Ile Ile Asn Pro Ser Asn Arg Val 225 230 235 240 Lys His Val Leu Lys Leu Gly Ile Gln Asp His Gly Lys Asp Cys Tyr 245 250 255 Leu Ile Gly Lys Tyr Ser Ala Asp Lys Glu Asn Tyr Val Pro Glu Asp 260 265 270 Glu Leu Thr Leu Ser Thr Leu Arg Leu Asp Tyr Gly Met Tyr Tyr Ala 275 280 285 Ser Lys Ser Phe Phe Asp Pro Val Lys Asn Arg Arg Ile Met Thr Ala 290 295 300 Trp Val Asn Glu Ser Asp Ser Glu Ala Asp Val Ile Ala Arg Gly Trp 305 310 315 320 Ser Gly Val Gln Ser Phe Pro Arg Ser Leu Trp Leu Asp Lys Asn Gln 325 330 335 Lys Gln Leu Leu Gln Trp Pro Ile Glu Glu Ile Glu Met Leu His Gln 340 345 350 Asn Glu Val Ser Phe His Asn Lys Lys Leu Asp Gly Gly Ser Ser Leu 355 360 365 Glu Val Leu Gly Ile Thr Ala Ser Gln Ala Asp Val Lys Ile Ser Phe 370 375 380 Lys Leu Ala Asn Leu Glu Glu Ala Glu Glu Leu Asp Pro Ser Trp Val 385 390 395 400 Asp Pro Gln Leu Ile Cys Ser Glu Asn Asp Ala Ser Lys Lys Gly Lys 405 410 415 Phe Gly Pro Phe Gly Leu Leu Ala Leu Ala Ser Ser Asp Leu Arg Glu 420 425 430 Gln Thr Ala Ile Phe Phe Arg Val Phe Arg Lys Asn Gly Arg Tyr Val 435 440 445 Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Met Lys Asn Gly Ile 450 455 460 Glu Lys Arg Thr Tyr Gly Ala Phe Val Asp Ile Asp Pro Gln Gln Asp 465 470 475 480 Glu Ile Ser Leu Arg Thr Leu Ile Asp His Ser Ile Val Glu Ser Phe 485 490 495 Gly Gly Arg Gly Lys Thr Cys Ile Thr Thr Arg Val Tyr Pro Thr Leu 500 505 510 Ala Ile Gly Glu Gln Ala Arg Leu Phe Ala Phe Asn His Gly Thr Glu 515 520 525 Ser Val Glu Ile Ser Glu Leu Ser Ala Trp Ser Met Lys Lys Ala Gln 530 535 540 Met Lys Val Glu Glu Pro 545 550 <210> 21 <211> 581 <212> PRT <213> Schizosaccharomyces pombe <400> 21 Met Phe Leu Lys Tyr Ile Leu Ala Ser Gly Ile Cys Leu Val Ser Leu 1 5 10 15 Leu Ser Ser Thr Asn Ala Ala Pro Arg His Leu Tyr Val Lys Arg Tyr 20 25 30 Pro Val Ile Tyr Asn Ala Ser Asn Ile Thr Glu Val Ser Asn Ser Thr 35 40 45 Thr Val Pro Pro Pro Pro Phe Val Asn Thr Thr Ala Pro Asn Gly Thr 50 55 60 Cys Leu Gly Asn Tyr Asn Glu Tyr Leu Pro Ser Gly Tyr Tyr Asn Ala 65 70 75 80 Thr Asp Arg Pro Lys Ile His Phe Thr Pro Ser Ser Gly Phe Met Asn 85 90 95 Asp Pro Asn Gly Leu Val Tyr Thr Gly Gly Val Tyr His Met Phe Phe 100 105 110 Gln Tyr Ser Pro Lys Thr Leu Thr Ala Gly Glu Val His Trp Gly His 115 120 125 Thr Val Ser Lys Asp Leu Ile His Trp Glu Asn Tyr Pro Ile Ala Ile 130 135 140 Tyr Pro Asp Glu His Glu Asn Gly Val Leu Ser Leu Pro Phe Ser Gly 145 150 155 160 Ser Ala Val Val Asp Val His Asn Ser Ser Gly Leu Phe Ser Asn Asp 165 170 175 Thr Ile Pro Glu Glu Arg Ile Val Leu Ile Tyr Thr Asp His Trp Thr 180 185 190 Gly Val Ala Glu Arg Gln Ala Ile Ala Tyr Thr Thr Asp Gly Gly Tyr 195 200 205 Thr Phe Lys Lys Tyr Ser Gly Asn Pro Val Leu Asp Ile Asn Ser Leu 210 215 220 Gln Phe Arg Asp Pro Lys Val Ile Trp Asp Phe Asp Ala Asn Arg Trp 225 230 235 240 Val Met Ile Val Ala Met Ser Gln Asn Tyr Gly Ile Ala Phe Tyr Ser 245 250 255 Ser Tyr Asp Leu Ile His Trp Thr Glu Leu Ser Val Phe Ser Thr Ser 260 265 270 Gly Tyr Leu Gly Leu Gln Tyr Glu Cys Pro Gly Met Ala Arg Val Pro 275 280 285 Val Glu Gly Thr Asp Glu Tyr Lys Trp Val Leu Phe Ile Ser Ile Asn 290 295 300 Pro Gly Ala Pro Leu Gly Gly Ser Val Val Gln Tyr Phe Val Gly Asp 305 310 315 320 Trp Asn Gly Thr Asn Phe Val Pro Asp Asp Gly Gln Thr Arg Phe Val 325 330 335 Asp Leu Gly Lys Asp Phe Tyr Ala Ser Ala Leu Tyr His Ser Ser Ser 340 345 350 Ala Asn Ala Asp Val Ile Gly Val Gly Trp Ala Ser Asn Trp Gln Tyr 355 360 365 Thr Asn Gln Ala Pro Thr Gln Val Phe Arg Ser Ala Met Thr Val Ala 370 375 380 Arg Lys Phe Thr Leu Arg Asp Val Pro Gln Asn Pro Met Thr Asn Leu 385 390 395 400 Thr Ser Leu Ile Gln Thr Pro Leu Asn Val Ser Leu Leu Arg Asp Glu 405 410 415 Thr Leu Phe Thr Ala Pro Val Ile Asn Ser Ser Ser Ser Leu Ser Gly 420 425 430 Ser Pro Ile Thr Leu Pro Ser Asn Thr Ala Phe Glu Phe Asn Val Thr 435 440 445 Leu Ser Ile Asn Tyr Thr Glu Gly Cys Thr Thr Gly Tyr Cys Leu Gly 450 455 460 Arg Ile Ile Ile Asp Ser Asp Asp Pro Tyr Arg Leu Gln Ser Ile Ser 465 470 475 480 Val Asp Val Asp Phe Ala Ala Ser Thr Leu Val Ile Asn Arg Ala Lys 485 490 495 Ala Gln Met Gly Trp Phe Asn Ser Leu Phe Thr Pro Ser Phe Ala Asn 500 505 510 Asp Ile Tyr Ile Tyr Gly Asn Val Thr Leu Tyr Gly Ile Val Asp Asn 515 520 525 Gly Leu Leu Glu Leu Tyr Val Asn Asn Gly Glu Lys Thr Tyr Thr Asn 530 535 540 Asp Phe Phe Phe Leu Gln Gly Ala Thr Pro Gly Gln Ile Ser Phe Ala 545 550 555 560 Ala Phe Gln Gly Val Ser Phe Asn Asn Val Thr Val Thr Pro Leu Lys 565 570 575 Thr Ile Trp Asn Cys 580 <210> 22 <211> 550 <212> PRT <213> Pichia anomala <400> 22 Met Ile Gln Leu Ser Pro Leu Leu Leu Leu Pro Leu Phe Ser Val Phe 1 5 10 15 Asn Ser Ile Ala Asp Ala Ser Thr Glu Tyr Leu Arg Pro Gln Ile His 20 25 30 Leu Thr Pro Asp Gln Gly Trp Met Asn Asp Pro Asn Gly Met Phe Tyr 35 40 45 Asp Arg Lys Asp Lys Leu Trp His Val Tyr Phe Gln His Asn Pro Asp 50 55 60 Lys Lys Ser Ile Trp Ala Thr Pro Val Thr Trp Gly His Ser Thr Ser 65 70 75 80 Lys Asp Leu Leu Thr Trp Asp Tyr His Gly Asn Ala Leu Glu Pro Glu 85 90 95 Asn Asp Asp Glu Gly Ile Phe Ser Gly Ser Val Val Val Asp Arg Asn 100 105 110 Asn Thr Ser Gly Phe Phe Asn Asp Ser Thr Asp Pro Glu Gln Arg Ile 115 120 125 Val Ala Ile Tyr Thr Asn Asn Ala Gln Leu Gln Thr Gln Glu Ile Ala 130 135 140 Tyr Ser Leu Asp Lys Gly Tyr Ser Phe Ile Lys Tyr Asp Gln Asn Pro 145 150 155 160 Val Ile Asn Val Asn Ser Ser Gln Gln Arg Asp Pro Lys Val Leu Trp 165 170 175 His Asp Glu Ser Asn Gln Trp Ile Met Val Val Ala Lys Thr Gln Glu 180 185 190 Phe Lys Val Gln Ile Tyr Gly Ser Pro Asp Leu Lys Lys Trp Asp Leu 195 200 205 Lys Ser Asn Phe Thr Ser Asn Gly Tyr Leu Gly Phe Gln Tyr Glu Cys 210 215 220 Pro Gly Leu Phe Lys Leu Pro Ile Glu Asn Pro Leu Asn Asp Thr Val 225 230 235 240 Thr Ser Lys Trp Val Leu Leu Leu Ala Ile Asn Pro Gly Ser Pro Leu 245 250 255 Gly Gly Ser Ile Asn Glu Tyr Phe Ile Gly Asp Phe Asp Gly Thr Thr 260 265 270 Phe His Pro Asp Asp Gly Ala Thr Arg Phe Met Asp Ile Gly Lys Asp 275 280 285 Phe Tyr Ala Phe Gln Ser Phe Asp Asn Thr Glu Pro Glu Asp Gly Ala 290 295 300 Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asn Thr Val Pro 305 310 315 320 Thr Glu Asn Trp Arg Ser Ser Met Ser Leu Val Arg Asn Tyr Thr Leu 325 330 335 Lys Tyr Val Asp Val Asn Pro Glu Asn Tyr Gly Leu Thr Leu Ile Gln 340 345 350 Lys Pro Val Tyr Asp Thr Lys Glu Thr Arg Leu Asn Glu Thr Leu Lys 355 360 365 Thr Leu Glu Thr Ile Asn Glu Tyr Glu Val Asn Asp Leu Lys Leu Asp 370 375 380 Lys Ser Ser Phe Val Ala Thr Asp Phe Asn Thr Glu Arg Asn Ala Thr 385 390 395 400 Gly Val Phe Glu Phe Asp Leu Lys Phe Thr Gln Thr Asp Leu Lys Met 405 410 415 Gly Tyr Ser Asn Met Thr Thr Gln Phe Gly Leu Tyr Ile His Ser Gln 420 425 430 Thr Val Lys Gly Ser Gln Glu Thr Leu Gln Leu Val Phe Asp Thr Leu 435 440 445 Ser Thr Thr Trp Tyr Ile Asp Arg Thr Thr Gln His Ser Phe Gln Arg 450 455 460 Asn Ser Pro Val Phe Thr Glu Arg Ile Ser Thr Tyr Val Glu Lys Ile 465 470 475 480 Asp Thr Thr Asp Gln Gly Asn Val Tyr Thr Leu Tyr Gly Val Val Asp 485 490 495 Arg Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Ser Ile Ala Met Thr 500 505 510 Asn Thr Phe Phe Phe Arg Glu Gly Lys Ile Pro Thr Ser Phe Glu Val 515 520 525 Val Cys Asp Ser Glu Lys Ser Phe Ile Thr Ile Asp Glu Leu Ser Val 530 535 540 Arg Glu Leu Ala Arg Lys 545 550 <210> 23 <211> 533 <212> PRT <213> Debaryomyces occidentalis <400> 23 Met Val Gln Val Leu Ser Val Leu Val Ile Pro Leu Leu Thr Leu Phe 1 5 10 15 Phe Gly Tyr Val Ala Ser Ser Ser Ile Asp Leu Ser Val Asp Thr Ser 20 25 30 Glu Tyr Asn Arg Pro Leu Ile His Phe Thr Pro Glu Lys Gly Trp Met 35 40 45 Asn Asp Pro Asn Gly Leu Phe Tyr Asp Lys Thr Ala Lys Leu Trp His 50 55 60 Leu Tyr Phe Gln Tyr Asn Pro Asn Ala Thr Ala Trp Gly Gln Pro Leu 65 70 75 80 Tyr Trp Gly His Ala Thr Ser Asn Asp Leu Val His Trp Asp Glu His 85 90 95 Glu Ile Ala Ile Gly Pro Glu His Asp Asn Glu Gly Ile Phe Ser Gly 100 105 110 Ser Ile Val Val Asp His Asn Asn Thr Ser Gly Phe Phe Asn Ser Ser 115 120 125 Ile Asp Pro Asn Gln Arg Ile Val Ala Ile Tyr Thr Asn Asn Ile Pro 130 135 140 Asp Leu Gln Thr Gln Asp Ile Ala Phe Ser Leu Asp Gly Gly Tyr Thr 145 150 155 160 Phe Thr Lys Tyr Glu Asn Asn Pro Val Ile Asp Val Ser Ser Asn Gln 165 170 175 Phe Arg Asp Pro Lys Val Phe Trp His Glu Arg Phe Lys Ser Met Asp 180 185 190 His Gly Cys Ser Glu Ile Ala Arg Val Lys Ile Gln Ile Phe Gly Ser 195 200 205 Ala Asn Leu Lys Asn Trp Val Leu Asn Ser Asn Phe Ser Ser Gly Tyr 210 215 220 Tyr Gly Asn Gln Tyr Gly Met Ser Arg Leu Ile Glu Val Pro Ile Glu 225 230 235 240 Asn Ser Asp Lys Ser Lys Trp Val Met Phe Leu Ala Ile Asn Pro Gly 245 250 255 Ser Pro Leu Gly Gly Ser Ile Asn Gln Tyr Phe Val Gly Asp Phe Asp 260 265 270 Gly Phe Gln Phe Val Pro Asp Asp Ser Gln Thr Arg Phe Val Asp Ile 275 280 285 Gly Lys Asp Phe Tyr Ala Phe Gln Thr Phe Ser Glu Val Glu His Gly 290 295 300 Val Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asp Gln Val 305 310 315 320 Pro Thr Asn Pro Trp Arg Ser Ser Thr Ser Leu Ala Arg Asn Tyr Thr 325 330 335 Leu Arg Tyr Val Ile Gln Met Leu Lys Leu Thr Ala Asn Ile Asp Lys 340 345 350 Ser Val Leu Pro Asp Ser Ile Asn Val Val Asp Lys Leu Lys Lys Lys 355 360 365 Asn Val Lys Leu Thr Asn Lys Lys Pro Ile Lys Thr Asn Phe Lys Gly 370 375 380 Ser Thr Gly Leu Phe Asp Phe Asn Ile Thr Phe Lys Val Leu Asn Leu 385 390 395 400 Asn Val Ser Pro Gly Lys Thr His Phe Asp Ile Leu Ile Asn Ser Gln 405 410 415 Glu Leu Asn Ser Ser Val Asp Ser Ile Lys Ile Gly Phe Asp Ser Ser 420 425 430 Gln Ser Leu Phe Tyr Ile Asp Arg His Ile Pro Asn Val Glu Phe Pro 435 440 445 Arg Lys Gln Phe Phe Thr Asp Lys Leu Ala Ala Tyr Leu Glu Pro Leu 450 455 460 Asp Tyr Asp Gln Asp Leu Arg Val Phe Ser Leu Tyr Gly Ile Val Asp 465 470 475 480 Lys Asn Ile Ile Glu Leu Tyr Phe Asn Asp Gly Thr Val Ala Met Thr 485 490 495 Asn Thr Phe Phe Met Gly Glu Gly Lys Tyr Pro His Asp Ile Gln Ile 500 505 510 Val Thr Asp Thr Glu Glu Pro Leu Phe Glu Leu Glu Ser Val Ile Ile 515 520 525 Arg Glu Leu Asn Lys 530 <210> 24 <211> 654 <212> PRT <213> Oryza sativa <400> 24 Met Ala Thr Ser Arg Leu Thr Pro Ala Tyr Asp Leu Lys Asn Ala Ala 1 5 10 15 Ala Ala Val Tyr Thr Pro Leu Pro Glu Gln Pro His Ser Ala Glu Val 20 25 30 Glu Ile Arg Asp Arg Lys Pro Phe Lys Ile Ile Ser Ala Ile Ile Leu 35 40 45 Ser Ser Leu Leu Leu Leu Ala Leu Ile Leu Val Ala Val Asn Tyr Gln 50 55 60 Ala Pro Pro Ser His Ser Ser Gly Asp Asn Ser Gln Pro Ala Ala Val 65 70 75 80 Met Pro Pro Ser Arg Gly Val Ser Gln Gly Val Ser Glu Lys Ala Phe 85 90 95 Arg Gly Ala Ser Gly Ala Gly Asn Gly Val Ser Phe Ala Trp Ser Asn 100 105 110 Leu Met Leu Ser Trp Gln Arg Thr Ser Tyr His Phe Gln Pro Val Lys 115 120 125 Asn Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr 130 135 140 His Leu Phe Tyr Gln Tyr Asn Pro Asp Ser Ala Val Trp Gly Asn Ile 145 150 155 160 Thr Trp Gly His Ala Val Ser Thr Asp Leu Ile Asn Trp Leu His Leu 165 170 175 Pro Phe Ala Met Val Pro Asp Gln Trp Tyr Asp Val Asn Gly Val Trp 180 185 190 Thr Gly Ser Ala Thr Ile Leu Pro Asp Gly Arg Ile Val Met Leu Tyr 195 200 205 Thr Gly Asp Thr Asp Asp Tyr Val Gln Asp Gln Asn Leu Ala Phe Pro 210 215 220 Ala Asn Leu Ser Asp Pro Leu Leu Val Asp Trp Val Lys Tyr Pro Asn 225 230 235 240 Asn Pro Val Ile Tyr Pro Pro Pro Gly Ile Gly Val Lys Asp Phe Arg 245 250 255 Asp Pro Thr Thr Ala Gly Thr Ala Gly Met Gln Asn Gly Gln Arg Leu 260 265 270 Val Thr Ile Gly Ser Lys Val Gly Lys Thr Gly Ile Ser Leu Val Tyr 275 280 285 Glu Thr Thr Asn Phe Thr Thr Phe Lys Leu Leu Tyr Gly Val Leu His 290 295 300 Ala Val Pro Gly Thr Gly Met Trp Glu Cys Val Asp Leu Tyr Pro Val 305 310 315 320 Ser Thr Thr Gly Glu Asn Gly Leu Asp Thr Ser Val Asn Gly Leu Gly 325 330 335 Val Lys His Val Leu Lys Thr Ser Leu Asp Asp Asp Lys His Asp Tyr 340 345 350 Tyr Ala Leu Gly Thr Tyr Asp Pro Val Lys Asn Lys Trp Thr Pro Asp 355 360 365 Asn Pro Asp Leu Asp Val Gly Ile Gly Leu Arg Leu Asp Tyr Gly Lys 370 375 380 Tyr Tyr Ala Ala Arg Thr Phe Tyr Asp Gln Asn Lys Gln Arg Arg Ile 385 390 395 400 Leu Trp Gly Trp Ile Gly Glu Thr Asp Leu Glu Ala Val Asp Leu Met 405 410 415 Lys Gly Trp Ala Ser Leu Gln Ala Ile Pro Arg Thr Ile Val Phe Asp 420 425 430 Lys Lys Thr Gly Thr Asn Val Leu Gln Arg Pro Glu Glu Glu Val Glu 435 440 445 Ser Trp Ser Ser Gly Asp Pro Ile Thr Gln Arg Arg Ile Phe Glu Pro 450 455 460 Gly Ser Val Val Pro Ile His Val Ser Gly Ala Thr Gln Leu Asp Ile 465 470 475 480 Thr Ala Ser Phe Glu Val Asp Glu Thr Leu Leu Glu Thr Thr Ser Glu 485 490 495 Ser His Asp Ala Gly Tyr Asp Cys Ser Asn Ser Gly Gly Ala Gly Thr 500 505 510 Arg Gly Ser Leu Gly Pro Phe Gly Leu Leu Val Val Ala Asp Glu Lys 515 520 525 Leu Ser Glu Leu Thr Pro Val Tyr Leu Tyr Val Ala Lys Gly Gly Asp 530 535 540 Gly Lys Ala Lys Ala His Leu Cys Ala Tyr Gln Thr Arg Ser Ser Met 545 550 555 560 Ala Ser Gly Val Glu Lys Glu Val Tyr Gly Ser Ala Val Pro Val Leu 565 570 575 Asp Gly Glu Asn Tyr Ser Ala Arg Ile Leu Ile Asp His Ser Ile Val 580 585 590 Glu Ser Phe Ala Gln Ala Gly Arg Thr Cys Val Arg Ser Arg Asp Tyr 595 600 605 Pro Thr Lys Asp Ile Tyr Gly Ala Ala Arg Cys Phe Phe Phe Asn Asn 610 615 620 Ala Thr Glu Ala Ser Val Arg Ala Ser Leu Lys Ala Trp Gln Met Lys 625 630 635 640 Ser Phe Ile Arg Pro Tyr Pro Phe Ile Pro Asp Gln Lys Ser 645 650 <210> 25 <211> 690 <212> PRT <213> Allium cepa <400> 25 Met Ser Ser Asp Asp Leu Glu Ser Pro Pro Ser Ser Tyr Leu Pro Ile 1 5 10 15 Pro Pro Ser Asp Glu Phe His Asp Gln Pro Pro Pro Leu Arg Ser Trp 20 25 30 Leu Arg Leu Leu Ser Ile Pro Leu Ala Leu Met Phe Leu Leu Phe Leu 35 40 45 Ala Thr Phe Leu Ser Asn Leu Glu Ser Pro Pro Ser Asp Ser Gly Leu 50 55 60 Val Ser Asp Pro Val Thr Phe Asp Val Asn Pro Ala Val Val Arg Arg 65 70 75 80 Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser Gly 85 90 95 Phe Val Leu Asp Pro Val Ala Val Asp Ala Asn Ser Val Val Val His 100 105 110 Arg Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser 115 120 125 Gly Leu Leu Lys Asp Ser Pro Leu Gly Pro Tyr Pro Trp Thr Asn Gln 130 135 140 Met Leu Ser Trp Gln Arg Thr Gly Phe His Phe Gln Pro Val Lys Asn 145 150 155 160 Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr His 165 170 175 Phe Phe Tyr Gln Tyr Asn Pro Glu Gly Ala Val Trp Gly Asn Ile Ala 180 185 190 Trp Gly His Ala Val Ser Arg Asp Leu Val His Trp Thr His Leu Pro 195 200 205 Leu Ala Met Val Pro Asp Gln Trp Tyr Asp Ile Asn Gly Val Trp Thr 210 215 220 Gly Ser Ala Thr Ile Leu Pro Asp Gly Gln Ile Val Met Leu Tyr Thr 225 230 235 240 Gly Ala Thr Asn Glu Ser Val Gln Val Gln Asn Leu Ala Val Pro Ala 245 250 255 Asp Gln Ser Asp Thr Leu Leu Leu Arg Trp Lys Lys Ser Glu Ala Asn 260 265 270 Pro Ile Leu Val Pro Pro Pro Gly Ile Gly Asp Lys Asp Phe Arg Asp 275 280 285 Pro Thr Thr Ala Trp Tyr Glu Pro Ser Asp Asp Thr Trp Arg Ile Val 290 295 300 Ile Gly Ser Lys Asp Ser Ser His Ser Gly Ile Ala Ile Val Tyr Ser 305 310 315 320 Thr Lys Asp Phe Ile Asn Tyr Lys Leu Ile Pro Gly Ile Leu His Ala 325 330 335 Val Glu Arg Val Gly Met Trp Glu Cys Val Asp Phe Tyr Pro Val Ala 340 345 350 Thr Ala Asp Ser Ser His Ala Asn His Gly Leu Asp Pro Ser Ala Arg 355 360 365 Pro Ser Pro Ala Val Lys His Val Leu Lys Ala Ser Met Asp Asp Asp 370 375 380 Arg His Asp Tyr Tyr Ala Ile Gly Thr Tyr Asp Pro Ala Gln Asn Thr 385 390 395 400 Trp Val Pro Asp Asp Ala Ser Val Asp Val Gly Ile Gly Leu Arg Tyr 405 410 415 Asp Trp Gly Lys Phe Tyr Ala Ser Lys Thr Phe Tyr Asp His Ala Lys 420 425 430 Lys Arg Arg Ile Leu Trp Ser Trp Ile Gly Glu Thr Asp Ser Glu Thr 435 440 445 Ala Asp Ile Ala Lys Gly Trp Ala Ser Leu Gln Gly Val Pro Arg Thr 450 455 460 Val Leu Leu Asp Val Lys Thr Gly Ser Asn Leu Ile Thr Trp Pro Val 465 470 475 480 Val Glu Ile Glu Ser Leu Arg Thr Arg Pro Arg Asp Phe Ser Gly Ile 485 490 495 Thr Val Asp Ala Gly Ser Thr Phe Lys Leu Asp Val Gly Gly Ala Ala 500 505 510 Gln Leu Asp Ile Glu Ala Glu Phe Lys Ile Ser Ser Glu Glu Leu Glu 515 520 525 Ala Val Lys Glu Ala Asp Val Ser Tyr Asn Cys Ser Ser Ser Gly Gly 530 535 540 Ala Ala Glu Arg Gly Val Leu Gly Pro Phe Gly Leu Leu Val Leu Ala 545 550 555 560 Asn Gln Asp Leu Thr Glu Gln Thr Ala Thr Tyr Phe Tyr Val Ser Arg 565 570 575 Gly Met Asp Gly Gly Leu Asn Thr His Phe Cys Gln Asp Glu Lys Arg 580 585 590 Ser Ser Lys Ala Ser Asp Ile Val Lys Arg Ile Val Gly His Ser Val 595 600 605 Pro Val Leu Asp Gly Glu Ser Phe Ala Leu Arg Ile Leu Val Asp His 610 615 620 Ser Ile Val Glu Ser Phe Ala Gln Gly Gly Arg Ala Ser Ala Thr Ser 625 630 635 640 Arg Val Tyr Pro Thr Glu Ala Ile Tyr Asn Asn Ala Arg Val Phe Val 645 650 655 Phe Asn Asn Ala Thr Gly Ala Lys Val Thr Ala Gln Ser Leu Lys Val 660 665 670 Trp His Met Ser Thr Ala Ile Asn Glu Ile Tyr Asp Pro Ala Thr Ser 675 680 685 Val Met 690 <210> 26 <211> 501 <212> PRT <213> Beta vulgaris <220> <221> MOD_RES <222> (382)..(382) <223> Any amino acid <400> 26 Leu Phe Tyr Gln Tyr Asn Pro Asn Gly Val Ile Trp Gly Pro Pro Val 1 5 10 15 Trp Gly His Ser Thr Ser Lys Asp Leu Val Asn Trp Val Pro Gln Pro 20 25 30 Leu Thr Met Glu Pro Glu Met Ala Ala Asn Ile Asn Gly Ser Trp Ser 35 40 45 Gly Ser Ala Thr Ile Leu Pro Gly Asn Lys Pro Ala Ile Leu Phe Thr 50 55 60 Gly Leu Asp Pro Lys Tyr Glu Gln Val Gln Val Leu Ala Tyr Pro Lys 65 70 75 80 Asp Thr Ser Asp Pro Asn Leu Lys Glu Trp Phe Leu Ala Pro Gln Asn 85 90 95 Pro Val Met Phe Pro Thr Pro Gln Asn Gln Ile Asn Ala Thr Ser Phe 100 105 110 Arg Asp Pro Thr Thr Ala Trp Arg Leu Pro Asp Gly Val Trp Arg Leu 115 120 125 Leu Ile Gly Ser Lys Arg Gly Gln Arg Gly Leu Ser Leu Leu Phe Arg 130 135 140 Ser Arg Asp Phe Val His Trp Val Gln Ala Lys His Pro Leu Tyr Ser 145 150 155 160 Asp Lys Leu Ser Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Tyr 165 170 175 Ala Asn Gly Asp Gln Met Gly Val Asp Thr Ser Ile Ile Gly Ser His 180 185 190 Val Lys His Val Leu Lys Asn Ser Leu Asp Ile Thr Lys His Asp Ile 195 200 205 Tyr Thr Ile Gly Asp Tyr Asn Ile Lys Lys Asp Ala Tyr Thr Pro Asp 210 215 220 Ile Gly Tyr Met Asn Asp Ser Ser Leu Arg Tyr Asp Tyr Gly Lys Tyr 225 230 235 240 Tyr Ala Ser Lys Thr Phe Phe Asp Asp Ala Lys Lys Glu Arg Ile Leu 245 250 255 Leu Gly Trp Ala Asn Glu Ser Ser Ser Val Glu Asp Asp Ile Lys Lys 260 265 270 Gly Trp Ser Gly Ile His Thr Ile Pro Arg Lys Ile Trp Leu Asp Lys 275 280 285 Leu Gly Lys Gln Leu Ile Gln Trp Pro Ile Ala Asn Ile Glu Lys Leu 290 295 300 Arg Gln Lys Pro Val Asn Ile Tyr Arg Lys Val Leu Lys Gly Gly Ser 305 310 315 320 Gln Ile Glu Val Ser Gly Ile Thr Ala Ala Gln Ala Asp Val Glu Ile 325 330 335 Ser Phe Lys Ile Lys Asp Leu Lys Asn Val Glu Lys Phe Asp Ala Ser 340 345 350 Trp Thr Ser Pro Gln Leu Leu Cys Ser Lys Lys Gly Ala Ser Val Lys 355 360 365 Gly Gly Leu Gly Pro Phe Gly Leu Leu Thr Leu Ala Ser Xaa Gly Leu 370 375 380 Glu Glu Tyr Thr Ala Val Phe Phe Arg Ile Phe Lys Ala Tyr Asp Asn 385 390 395 400 Lys Phe Val Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Leu Asn 405 410 415 Pro Thr Asn Asp Lys Thr Thr Tyr Gly Thr Phe Val Asp Val Asn Pro 420 425 430 Ile Arg Glu Gly Leu Ser Leu Arg Val Leu Ile Asp His Ser Val Val 435 440 445 Glu Ser Phe Gly Ala Lys Gly Lys Asn Val Ile Thr Ala Arg Val Tyr 450 455 460 Pro Thr Leu Ala Ile Asn Glu Lys Ala His Leu Tyr Val Phe Asn Arg 465 470 475 480 Gly Thr Ser Asn Val Glu Ile Thr Gly Leu Thr Ala Trp Ser Met Lys 485 490 495 Lys Ala Asn Ile Ala 500 <210> 27 <211> 518 <212> PRT <213> Bifidobacterium breve <400> 27 Met Thr Asp Phe Thr Pro Glu Thr Pro Val Leu Thr Pro Ile Arg Asp 1 5 10 15 His Ala Ala Glu Leu Ala Lys Ala Glu Ala Gly Val Ala Glu Met Ala 20 25 30 Ala Lys Arg Asn Asn Arg Trp Tyr Pro Lys Tyr His Ile Ala Ser Asn 35 40 45 Gly Gly Trp Ile Asn Asp Pro Asn Gly Leu Cys Phe Tyr Lys Gly Arg 50 55 60 Trp His Val Phe Tyr Gln Leu His Pro Tyr Gly Thr Gln Trp Gly Pro 65 70 75 80 Met His Trp Gly His Val Ser Ser Thr Asp Met Leu Asn Trp Lys Arg 85 90 95 Glu Pro Ile Met Phe Ala Pro Ser Leu Glu Gln Glu Lys Asp Gly Val 100 105 110 Phe Ser Gly Ser Ala Val Ile Asp Asp Asn Gly Asp Leu Arg Phe Tyr 115 120 125 Tyr Thr Gly His Arg Trp Ala Asn Gly His Asp Asn Thr Gly Gly Asp 130 135 140 Trp Gln Val Gln Met Thr Ala Leu Pro Asp Asn Asp Glu Leu Thr Ser 145 150 155 160 Ala Thr Lys Gln Gly Met Ile Ile Asp Cys Pro Thr Asp Lys Val Asp 165 170 175 His His Tyr Arg Asp Pro Lys Val Trp Lys Thr Gly Asp Thr Trp Tyr 180 185 190 Met Thr Phe Gly Val Ser Ser Glu Asp Lys Arg Gly Gln Met Trp Leu 195 200 205 Phe Ser Ser Lys Asp Met Val Arg Trp Glu Tyr Glu Arg Val Leu Phe 210 215 220 Gln His Pro Asp Pro Asp Val Phe Met Leu Glu Cys Pro Asp Phe Phe 225 230 235 240 Pro Ile Lys Asp Lys Asp Gly Asn Glu Lys Trp Val Ile Gly Phe Ser 245 250 255 Ala Met Gly Ser Lys Pro Ser Gly Phe Met Asn Arg Asn Val Asn Asn 260 265 270 Ala Gly Tyr Met Ile Gly Thr Trp Glu Pro Gly Gly Glu Phe Lys Pro 275 280 285 Glu Thr Glu Phe Arg Leu Trp Asp Cys Gly His Asn Tyr Tyr Ala Pro 290 295 300 Gln Ser Phe Asn Val Asp Gly Arg Gln Ile Val Tyr Gly Trp Met Ser 305 310 315 320 Pro Phe Val Gln Pro Ile Pro Met Glu Asp Asp Gly Trp Cys Gly Gln 325 330 335 Leu Thr Leu Pro Arg Glu Ile Thr Leu Asp Asp Asp Gly Asp Val Val 340 345 350 Thr Ala Pro Val Ala Glu Met Glu Gly Leu Arg Glu Asp Thr Leu Asp 355 360 365 His Gly Ser Ile Thr Leu Asp Met Asp Gly Glu Gln Val Ile Ala Asp 370 375 380 Asp Ala Glu Ala Val Glu Ile Glu Met Thr Ile Asp Leu Ala Ala Ser 385 390 395 400 Thr Ala Asp Arg Ala Gly Leu Lys Ile His Ala Thr Glu Asp Gly Ala 405 410 415 Tyr Thr Tyr Val Ala Tyr Asp Asp Gln Ile Gly Arg Val Val Val Asp 420 425 430 Arg Gln Ala Met Ala Asn Gly Asp His Gly Tyr Arg Ala Ala Pro Leu 435 440 445 Thr Asp Ala Glu Leu Ala Ser Gly Lys Leu Asp Leu Arg Val Phe Val 450 455 460 Asp Arg Gly Ser Val Glu Val Tyr Val Asn Gly Gly His Gln Val Leu 465 470 475 480 Ser Ser Tyr Ser Tyr Ala Ser Glu Gly Pro Arg Ala Ile Lys Leu Val 485 490 495 Ala Glu Phe Gly Asn Leu Lys Val Glu Ser Leu Lys Leu His His Met 500 505 510 Lys Ser Ile Gly Leu Glu 515 <210> 28 <211> 532 <212> PRT <213> Saccharomyces cerevisiae <400> 28 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala Ser Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His 20 25 30 Phe Thr Pro Asn Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr 35 40 45 Asp Glu Lys Asp Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn 50 55 60 Asp Thr Val Trp Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp 65 70 75 80 Asp Leu Thr Asn Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg 85 90 95 Asn Asp Ser Gly Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn 100 105 110 Thr Ser Gly Phe Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val 115 120 125 Ala Ile Trp Thr Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser 130 135 140 Tyr Ser Leu Asp Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro 145 150 155 160 Val Leu Ala Ala Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp 165 170 175 Tyr Glu Pro Ser Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp 180 185 190 Tyr Lys Ile Glu Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu 195 200 205 Glu Ser Ala Phe Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys 210 215 220 Pro Gly Leu Ile Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr 225 230 235 240 Trp Val Met Phe Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser 245 250 255 Phe Asn Gln Tyr Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala 260 265 270 Phe Asp Asn Gln Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala 275 280 285 Leu Gln Thr Phe Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly 290 295 300 Ile Ala Trp Ala Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn 305 310 315 320 Pro Trp Arg Ser Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr 325 330 335 Glu Tyr Gln Ala Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu 340 345 350 Pro Ile Leu Asn Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr 355 360 365 Asn Thr Thr Leu Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn 370 375 380 Ser Thr Gly Thr Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr 385 390 395 400 Gln Thr Ile Ser Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys 405 410 415 Gly Leu Glu Asp Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser 420 425 430 Ala Ser Ser Phe Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val 435 440 445 Lys Glu Asn Pro Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro 450 455 460 Phe Lys Ser Glu Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu 465 470 475 480 Asp Gln Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser 485 490 495 Thr Asn Thr Tyr Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn 500 505 510 Met Thr Thr Gly Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val 515 520 525 Arg Glu Val Lys 530 <210> 29 <211> 512 <212> PRT <213> Zymomonas mobilis <400> 29 Met Glu Ser Pro Ser Tyr Lys Asn Leu Ile Lys Ala Glu Asp Ala Gln 1 5 10 15 Lys Lys Ala Gly Lys Arg Leu Leu Ser Ser Glu Trp Tyr Pro Gly Phe 20 25 30 His Val Thr Pro Leu Thr Gly Trp Met Asn Asp Pro Asn Gly Leu Ile 35 40 45 Phe Phe Lys Gly Glu Tyr His Leu Phe Tyr Gln Tyr Tyr Pro Phe Ala 50 55 60 Pro Val Trp Gly Pro Met His Trp Gly His Ala Lys Ser Arg Asp Leu 65 70 75 80 Val His Trp Glu Thr Leu Pro Val Ala Leu Ala Pro Gly Asp Leu Phe 85 90 95 Asp Arg Asp Gly Cys Phe Ser Gly Cys Ala Val Asp Asn Asn Gly Val 100 105 110 Leu Thr Leu Ile Tyr Thr Gly His Ile Val Leu Ser Asn Asp Ser Pro 115 120 125 Asp Ala Ile Arg Glu Val Gln Cys Met Ala Thr Ser Ile Asp Gly Ile 130 135 140 His Phe Gln Lys Glu Gly Ile Val Leu Glu Lys Ala Pro Met Pro Gln 145 150 155 160 Val Ala His Phe Arg Asp Pro Arg Val Trp Lys Glu Asn Asp His Trp 165 170 175 Phe Met Val Val Gly Tyr Arg Thr Asp Asp Glu Lys His Gln Gly Ile 180 185 190 Gly His Val Ala Leu Tyr Arg Ser Glu Asn Leu Lys Asp Trp Ile Phe 195 200 205 Val Lys Thr Leu Leu Gly Asp Asn Ser Gln Leu Pro Leu Gly Lys Arg 210 215 220 Ala Phe Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asn Arg Ser 225 230 235 240 Val Leu Met Phe Ser Pro Gln Gly Leu Lys Ala Ser Gly Tyr Lys Asn 245 250 255 Arg Asn Leu Phe Gln Asn Gly Tyr Ile Leu Gly Lys Trp Gln Ala Pro 260 265 270 Gln Phe Thr Pro Glu Thr Ser Phe Gln Glu Leu Asp Tyr Gly His Asp 275 280 285 Phe Tyr Ala Ala Gln Arg Phe Glu Ala Lys Asp Gly Arg Gln Ile Leu 290 295 300 Ile Ala Trp Phe Asp Met Trp Glu Asn Gln Lys Pro Ser Gln Arg Asp 305 310 315 320 Gly Trp Ala Gly Cys Met Thr Leu Pro Arg Lys Leu Asp Leu Ile Asp 325 330 335 Asn Lys Ile Val Met Thr Pro Val Arg Glu Met Glu Ile Leu Arg Gln 340 345 350 Ser Glu Lys Ile Glu Ser Val Val Thr Leu Ser Asp Ala Glu His Pro 355 360 365 Phe Thr Met Asp Ser Pro Leu Gln Glu Ile Glu Leu Ile Phe Asp Leu 370 375 380 Glu Lys Ser Ser Ala Tyr Gln Ala Gly Leu Ala Leu Arg Cys Asn Gly 385 390 395 400 Lys Gly Gln Glu Thr Leu Leu Tyr Ile Asp Arg Ser Gln Asn Arg Ile 405 410 415 Ile Leu Asp Arg Asn Arg Ser Gly Gln Asn Val Lys Gly Ile Arg Ser 420 425 430 Cys Pro Leu Pro Asn Thr Ser Lys Val Arg Leu His Ile Phe Leu Asp 435 440 445 Arg Ser Ser Ile Glu Ile Phe Val Gly Asp Asp Gln Thr Gln Gly Leu 450 455 460 Tyr Ser Ile Ser Ser Arg Ile Phe Pro Asp Lys Asp Ser Leu Lys Gly 465 470 475 480 Arg Leu Phe Ala Ile Glu Gly Tyr Ala Val Phe Asp Ser Phe Lys Arg 485 490 495 Trp Thr Leu Gln Asp Ala Asn Leu Ala Ala Phe Ser Ser Asp Ala Cys 500 505 510 <210> 30 <211> 987 <212> DNA <213> Chlorella luteoviridis <400> 30 tgttgaagaa tgagccggcg acttatagga agtggcttgg ttaaggatac tttccgaagc 60 ctaagcgaaa gcaagttgta acaatagcga tatacctctt tgtaggtcag tcacttctta 120 tggacccgaa cccgggtgat ctaaccatga ccaggatgaa gcttgggtaa caccaagtga 180 aggtccgaac tcttcgatct ttaaaaatcg tgagatgagt tatggttagg ggtaaatctg 240 gcagttttgc cccgcaaaag ggtaaccttt tgtaattact gactcataac ggtgaagcct 300 aaggcgttag ctatggtaat accgtgggaa gtttcaatac cttcttgcat attttttatt 360 tgcaccttta gtgcaaacag tgtaaagaaa gcgttttgaa accccttaac gactaatttt 420 ttgcttttgc aagaacgtca gcactcacca atacactttc cgtttttttc ttttattaat 480 taaagcaaca taaaaatata ttttatagct ttaatcataa aactatgtta gcacttcgtg 540 ctaatgtgct aatgtgctaa tcaaatgaaa agtgttctta aaagtgagtt gaaggtagag 600 tctaatcttg cctgaaaggg caagctgcac attttttttt gaatgtgcaa caatggaaat 660 gccaatcgaa ctcggagcta gctggttctc cccgaaatgt gttgaggcgc agcgattcat 720 gattagtacg gtgtaggggt aaagcactgt ttcggtgcgg gctgtgaaaa cggtaccaaa 780 tcgtggcaaa ctaagaatac tacgcttgta taccatggat cagtgagact atgggggata 840 agctccatag tcaagaggga aacagcccag atcaccagtt aaggccccaa aatgacagct 900 aagtggcaaa ggaggtgaaa gtgcagaaac aaccaggagg tttgcccaga agcagccatc 960 ctttaaagag tgcgtaatag ctcactg 987 <210> 31 <211> 1412 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 gaattcgagt ttaggtccag cgtccgtggg gggggacggg ctgggagctt gggccgggaa 60 gggcaagacg atgcagtccc tctggggagt cacagccgac tgtgtgtgtt gcactgtgcg 120 gcccgcagca ctcacacgca aaatgcctgg ccgacaggca ggccctgtcc agtgcaacat 180 ccacggtccc tctcatcagg ctcaccttgc tcattgacat aacggaatgc gtaccgctct 240 ttcagatctg tccatccaga gaggggagca ggctccccac cgacgctgtc aaacttgctt 300 cctgcccaac cgaaaacatt attgtttgag gggggggggg ggggggcaga ttgcatggcg 360 ggatatctcg tgaggaacat cactgggaca ctgtggaaca cagtgagtgc agtatgcaga 420 gcatgtatgc taggggtcag cgcaggaagg gggcctttcc cagtctccca tgccactgca 480 ccgtatccac gactcaccag gaccagcttc ttgatcggct tccgctcccg tggacaccag 540 tgtgtagcct ctggactcca ggtatgcgtg caccgcaaag gccagccgat cgtgccgatt 600 cctggggtgg aggatatgag tcagccaact tggggctcag agtgcacact ggggcacgat 660 acgaaacaac atctacaccg tgtcctccat gctgacacac cacagcttcg ctccacctga 720 atgtgggcgc atgggcccga atcacagcca atgtcgctgc tgccataatg tgatccagac 780 cctctccgcc cagatgccga gcggatcgtg ggcgctgaat agattcctgt ttcgatcact 840 gtttgggtcc tttccttttc gtctcggatg cgcgtctcga aacaggctgc gtcgggcttt 900 cggatccctt ttgctccctc cgtcaccatc ctgcgcgcgg gcaagttgct tgaccctggg 960 ctggtaccag ggttggaggg tattaccgcg tcaggccatt cccagcccgg attcaattca 1020 aagtctgggc caccaccctc cgccgctctg tctgatcact ccacattcgt gcatacacta 1080 cgttcaagtc ctgatccagg cgtgtctcgg gacaaggtgt gcttgagttt gaatctcaag 1140 gacccactcc agcacagctg ctggttgacc ccgccctcgc aactccctac catgtctgct 1200 ggtaggtcca gggatctttg ccatgcacac aggaccccgt ttgtgggggt ccccggtgca 1260 tgctgtcgct gtgcaggcgc cggtgtgggg cctgggcccc gcgggagctc aactcctccc 1320 catatgcctg ccgtccctcc cacccaccgc gacctggccc cctttgcaga ggaaggcgaa 1380 gtcagcgcca tcgtgtgcga taatggatcc gg 1412 <210> 32 <211> 1627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 gaattcgccc ttgagtttag gtccagcgtc cgtggggggg gcgtgagact cccccctgac 60 cttcgtatgg cagggactcc tacttgccaa gtaatcagtt gacaatgcca cttcaatgct 120 cgttgtggta cactgacgcg ggtctaacat actgggaagc atgaattgcc gacatggact 180 cagttggaga cagtaacagc tctttgtgtt ctatcttcag gaacacattt ggcagcgcac 240 ccatacagtg gcgcacacgc agctgtacct gatgtggctc tattcccaca tgtttcaact 300 tgatccaaaa gtcactcaga ctctcagcag ctagacttga tcgcatcttt ggccatgaag 360 atgcttgcgc aactctagga atgggacgag aaaagagcct gctctgatcg gatatttcca 420 ttctctggat gggactgaga tgattctgaa gaaatgctgc tcgacttatt tggaagaaca 480 gcacctgacg catgctttga ggctgctgtg gctgggatgt gctgtatttg tcagcattga 540 gcatctacgg gtagatggcc ataaccacgc gctgcctatc atgcggtggg ttgtgtggaa 600 aacgtacaat ggacagaaat caatcccatt gcgagcctag cgtgcagcca tgcgctccct 660 ctgtagcccc gctccaagac aaagccagcc aatgccagaa cccacataga gagggtatct 720 tcctaatgac ctcgcccatc atttcctcca aattaactat aatgccttga ttgtggagtt 780 ggctttggct tgcagctgct cgcgctggca cttttgtagg cagcacaggg tatgccagcg 840 ccgaactttg tgcccttgag caggccacaa gggcacaaga ctacaccatg cagctggtat 900 acttggaact gataccattc ttaccaagca aggcacagca cagcctgcac cgactcactt 960 tgcttgagcg gggcacagcg ccgcgactga tcctgcgagc tgtggggagt tccgactgtt 1020 ctggacctcg gtctctgaaa gatgtgtacg atgggatcaa gtcattcaag tatgctcttc 1080 acatgagcaa tcgggggaga cacggtggcc ctaaaggtgt tcatctgatt caagtgtagt 1140 gggggggtgc tgtttgtccc ggggcgcccc ccgctccccg accccggaga agggccccag 1200 aggactcggc cgcccacaga ggaataaccg ggcgtggctc ggccctgcgc ctccctcttt 1260 caatatttca cctggtgttc agtgcacgga cacgtaaaga actagataca atggccgagg 1320 gaaagacggt gagagcttgg cgttggtgga ccgggcagca tcagaaactc ctcttccccg 1380 cccgccttga aactcactgt aactccctcc tcttccccct cgcagcatct gtctatcgtt 1440 atcgtgagtg aaagggactg ccatgtgtcg ggtcgttgac cacggtcggc tcgggcgctg 1500 ctgcccgcgt cgcgaacgtt ccctgcaaac gccgcgcagc cgtccctttt tctgccgccg 1560 ccccaccccc tcgctccccc cttcaatcac accgcagtgc ggacatgtcg attccggcaa 1620 gtccacc 1627 <210> 33 <211> 570 <212> DNA <213> Chlorella protothecoides <400> 33 gaattccctg caggaagaag gccggcagca gctggtactt gtccttcacc tccttgatcg 60 gctgggtgag cttggccggg tcgcagtcgt cgatgccggc atcgcccagc acgctgtgcg 120 gggagccggc atcgacaacc ttggcactgc tcaccttggt caccggcatg gggtcatggc 180 gctgcagacc agcggcctgt cagcatgctg caggcatctg tgttttgtag tagatacttt 240 ctgatgcatc accacacgtt tggaaggtcc ccaagcccct tcaacagtct cgacatatga 300 cactcgcgcc ctcttcctcg tcccgtggcc tgatgagggt acgcaggtac cgcagctgcg 360 ccccgtcccg ccagttgccc tggccccgcc gggcccaatc tgttcattgc cgctccctgg 420 cagccgtgaa cttcacacta ccgctctctg tgaccttcag cacagcagga atcgccattt 480 caccggcggt cgttgctgcg gagcctcagc tgatctcgcc tgcgagaccc cacagtttga 540 atttgcggtc cccacacaac ctctgacgcc 570 <210> 34 <211> 568 <212> DNA <213> Chlorella protothecoides <220> <221> modified_base <222> (133)..(133) <223> a, c, t, g, unknown or other <400> 34 gaattccctc aggaagaagg ccggcagcag ctggtacttg tccttcacct ccttgatcgg 60 ctgggtgagc ttcgcaggat cgcagtcgtc gatgccggca tcgcccagca cgctgtgcgg 120 ggagccggca tcnacaacct tggcactgct ccccttggtc accggcatgg ggtcatggcg 180 ctgcagccca gcggcctgtc agcatgctgc aggcatctgt gtattgtagt aggtacttcc 240 tgatgcatca acacacgttt ggaagctccc caagcccctt caacagtctc gacgtatgac 300 actcgcgccc tcttcctcgc cccgtggcct gatgagggta cgcaggtacc acagctgcgc 360 cccgtcccgc cagttgccct ggcccggccg ggcccaatct gttcattgcc gctccctggt 420 agccgtgaac tcacattacc gctctctgtg accttcagca cagcaggaat cgccatttca 480 ccggcggtcg ttgctgcgga gcctcagctg atctcgcctg cgagacccca cagtttgaat 540 ttgcggtccc cacacaacct ctgacgcc 568 <210> 35 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 35 tgacctaggt gattaattaa ctcgaggcag cagcagctcg gatagtatcg 50 <210> 36 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 36 ctacgagctc aagctttcca tttgtgttcc catcccacta cttcc 45 <210> 37 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 37 gatcagaatt ccgcctgcaa cgcaagggca gc 32 <210> 38 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 38 gcatactagt ggcgggacgg agagagggcg 30 <210> 39 <211> 1568 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaacgg cgcgccatat caatgattga acaagatgga ttgcacgcag 360 gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg 420 gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca 480 agaccgacct gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc 540 tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg 600 actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg 660 ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta 720 cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag 780 ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac 840 tgttcgccag gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg 900 atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg 960 gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg 1020 aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg 1080 attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctaagat ctgtcgatcg 1140 acaagtgact cgaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt 1200 gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta 1260 tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct 1320 tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc 1380 ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca 1440 ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt 1500 aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc 1560 ttgagctc 1568 <210> 40 <211> 2571 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (997)..(999) <223> a, c, t, g, unknown or other <400> 40 gaattccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggacgtg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaactaac catagctgat caacactgca atcatcggcg gctgatgcaa 540 gcatcctgca agacacatgc tgtgcgatgc tgcgctgctg cctgctgcgc acgccgttga 600 gttggcagca gctcagccat gcactggatc aggctgggct gccactgcaa tgtggtggat 660 aggatgcaag tggagcgaat accaaaccct ctggctgctt gctgggttgc atggcatcgc 720 accatcagca ggagcgcatg cgaagggact ggccccatgc acgccatgcc aaaccggagc 780 gcaccgagtg tccacactgt caccaggccc gcaagctttg cagaaccatg ctcatggacg 840 catgtagcgc tgacgtccct tgacggcgct cctctcgggt gtgggaaacg caatgcagca 900 caggcagcag aggcggcggc agcagagcgg cggcagcagc ggcgggggcc acccttcttg 960 cggggtcgcg ccccagccag cggtgatgcg ctgatcnnnc caaacgagtt cacattcatt 1020 tgcagcctgg agaagcgagg ctggggcctt tgggctggtg cagcccgcaa tggaatgcgg 1080 gaccgccagg ctagcagcaa aggcgcctcc cctactccgc atcgatgttc catagtgcat 1140 tggactgcat ttgggtgggg cggccggctg tttctttcgt gttgcaaaac gcgccacgtc 1200 agcaacctgt cccgtgggtc ccccgtgccg atgaaatcgt gtgcacgccg atcagctgat 1260 tgcccggctc gcgaagtagg cgccctcttt ctgctcgccc tctctccgtc ccgccactag 1320 tggcgcgcca tatcaatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg 1380 gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc 1440 gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt 1500 gccctgaatg aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt 1560 ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc 1620 gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc 1680 atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac 1740 caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag 1800 gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag 1860 gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat 1920 atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg 1980 gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa 2040 tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc 2100 ttctatcgcc ttcttgacga gttcttctaa gatctgtcga tcgacaagtg actcgaggca 2160 gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg 2220 ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt 2280 gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata 2340 ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct 2400 acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc 2460 ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg 2520 ctgatgcacg ggaagtagtg ggatgggaac acaaatggaa agcttgagct c 2571 <210> 41 <211> 2550 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> modified_base <222> (997)..(999) <223> a, c, t, g, unknown or other <400> 41 gaattccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggacgtg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaactaac catagctgat caacactgca atcatcggcg gctgatgcaa 540 gcatcctgca agacacatgc tgtgcgatgc tgcgctgctg cctgctgcgc acgccgttga 600 gttggcagca gctcagccat gcactggatc aggctgggct gccactgcaa tgtggtggat 660 aggatgcaag tggagcgaat accaaaccct ctggctgctt gctgggttgc atggcatcgc 720 accatcagca ggagcgcatg cgaagggact ggccccatgc acgccatgcc aaaccggagc 780 gcaccgagtg tccacactgt caccaggccc gcaagctttg cagaaccatg ctcatggacg 840 catgtagcgc tgacgtccct tgacggcgct cctctcgggt gtgggaaacg caatgcagca 900 caggcagcag aggcggcggc agcagagcgg cggcagcagc ggcgggggcc acccttcttg 960 cggggtcgcg ccccagccag cggtgatgcg ctgatcnnnc caaacgagtt cacattcatt 1020 tgcagcctgg agaagcgagg ctggggcctt tgggctggtg cagcccgcaa tggaatgcgg 1080 gaccgccagg ctagcagcaa aggcgcctcc cctactccgc atcgatgttc catagtgcat 1140 tggactgcat ttgggtgggg cggccggctg tttctttcgt gttgcaaaac gcgccacgtc 1200 agcaacctgt cccgtgggtc ccccgtgccg atgaaatcgt gtgcacgccg atcagctgat 1260 tgcccggctc gcgaagtagg cgccctcttt ctgctcgccc tctctccgtc ccgccactag 1320 tggcgcgcca tatcaatgat cgagcaggac ggcctccacg ccggctcccc cgccgcctgg 1380 gtggagcgcc tgttcggcta cgactgggcc cagcagacca tcggctgctc cgacgccgcc 1440 gtgttccgcc tgtccgccca gggccgcccc gtgctgttcg tgaagaccga cctgtccggc 1500 gccctgaacg agctgcagga cgaggccgcc cgcctgtcct ggctggccac caccggcgtg 1560 ccctgcgccg ccgtgctgga cgtggtgacc gaggccggcc gcgactggct gctgctgggc 1620 gaggtgcccg gccaggacct gctgtcctcc cacctggccc ccgccgagaa ggtgtccatc 1680 atggccgacg ccatgcgccg cctgcacacc ctggaccccg ccacctgccc cttcgaccac 1740 caggccaagc accgcatcga gcgcgcccgc acccgcatgg aggccggcct ggtggaccag 1800 gacgacctgg acgaggagca ccagggcctg gcccccgccg agctgttcgc ccgcctgaag 1860 gcccgcatgc ccgacggcga ggacctggtg gtgacccacg gcgacgcctg cctgcccaac 1920 atcatggtgg agaacggccg cttctccggc ttcatcgact gcggccgcct gggcgtggcc 1980 gaccgctacc aggacatcgc cctggccacc cgcgacatcg ccgaggagct gggcggcgag 2040 tgggccgacc gcttcctggt gctgtacggc atcgccgccc ccgactccca gcgcatcgcc 2100 ttctaccgcc tgctggacga gttcttctga ctcgaggcag cagcagctcg gatagtatcg 2160 acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 2220 gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 2280 cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 2340 ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 2400 gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 2460 ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 2520 gatgggaaca caaatggaaa gcttgagctc 2550 <210> 42 <211> 1547 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 42 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaacgg cgcgccatat caatgatcga gcaggacggc ctccacgccg 360 gctcccccgc cgcctgggtg gagcgcctgt tcggctacga ctgggcccag cagaccatcg 420 gctgctccga cgccgccgtg ttccgcctgt ccgcccaggg ccgccccgtg ctgttcgtga 480 agaccgacct gtccggcgcc ctgaacgagc tgcaggacga ggccgcccgc ctgtcctggc 540 tggccaccac cggcgtgccc tgcgccgccg tgctggacgt ggtgaccgag gccggccgcg 600 actggctgct gctgggcgag gtgcccggcc aggacctgct gtcctcccac ctggcccccg 660 ccgagaaggt gtccatcatg gccgacgcca tgcgccgcct gcacaccctg gaccccgcca 720 cctgcccctt cgaccaccag gccaagcacc gcatcgagcg cgcccgcacc cgcatggagg 780 ccggcctggt ggaccaggac gacctggacg aggagcacca gggcctggcc cccgccgagc 840 tgttcgcccg cctgaaggcc cgcatgcccg acggcgagga cctggtggtg acccacggcg 900 acgcctgcct gcccaacatc atggtggaga acggccgctt ctccggcttc atcgactgcg 960 gccgcctggg cgtggccgac cgctaccagg acatcgccct ggccacccgc gacatcgccg 1020 aggagctggg cggcgagtgg gccgaccgct tcctggtgct gtacggcatc gccgcccccg 1080 actcccagcg catcgccttc taccgcctgc tggacgagtt cttctgactc gaggcagcag 1140 cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac 1200 acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt 1260 gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac 1320 ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc 1380 tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg 1440 tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga 1500 tgcacgggaa gtagtgggat gggaacacaa atggaaagct tgagctc 1547 <210> 43 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 43 gccgcgactg gctgctgctg g 21 <210> 44 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 44 aggtcctcgc cgtcgggcat g 21 <210> 45 <211> 1292 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 atcaaaggca tagattcaca tttgttggca ttgcagagca atcatcgcgc aggacgaaca 60 tcgctcacca agcacgtact gggcatccgg aggcctccgc aaattcctgc aacaggactc 120 gctgatcagt tcgcccaagg tctacgacgc tccctatcgg cgctagactt caacacatat 180 ttcactgtca cagcctcggc atgcatcagg cctcagtctc caccatgaag accatccagt 240 ctcggcacgc cggtcccatc ggacatgtgc agtcgggtcg ccgatcggcg gggcgcgcgg 300 gatcccgcat ggcgaccccc gtggccgcag ctaccgtcgc agcccctcgc tcggccctca 360 acctctcccc caccatcatt cgacaggagg tgctccactc cgccagcgcc cagcaactag 420 actgcgtggc ctccctggcg cccgtcttcg agtcccagat cctccccctc ctgacgcccg 480 tggacgagat gtggcagccc accgacttcc tccccgcctc gaactcggag gcattcttcg 540 accagatcgg cgacctgcgg gcgcgatcgg cggccatccc cgacgacctg ctggtctgcc 600 tggtggggga catgatcacg gaggaggccc tgcccaccta catggccatg ctgaacaccc 660 tggacgtcgt gcgcgatgag acagggcaca gccagcaccc ctacgccaag tggaccaggg 720 cttggatcgc ggaggagaac cgccatggcg acctgctgaa caagtacatg tggctgacgg 780 ggcgggtggg acatgctggc ggtggagcgc accatccagc catgctggcg gtggagcgca 840 ccatccagcg cctcatctca tcgggcatgg acccgggcac ggagaaccac ccctaccacg 900 cctttgtgtt caccagcttc caggagcgcg ccaccaagct gagccacggc tccaccgccc 960 gcctggcggt cgccgccggg gacgaggccc tggccaagat ctgcgggacc attgcgcggg 1020 acgagtcgcg ccacgaggcg gcgtacacgc ggaccatgga tgccatcttc cagcgcgacc 1080 ccagcggggc catggtggcg tttgcgcaca tgatgatgcg caagatcacc atgcccgccc 1140 acctcatgga cgacggccag cacggcgcgc gcaacggggg ggcgcaactt gttcgacgac 1200 tttgcggcag tggcggagcg ggcaggggtg tacaccgccg gcgactacat cggcatcctg 1260 cgccacctca tccggcgctg ggacgtggag gg 1292 <210> 46 <211> 364 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Met His Gln Ala Ser Val Ser Thr Met Lys Thr Ile Gln Ser Arg His 1 5 10 15 Ala Gly Pro Ile Gly His Val Gln Ser Gly Arg Arg Ser Ala Gly Arg 20 25 30 Ala Gly Ser Arg Met Ala Thr Pro Val Ala Ala Ala Thr Val Ala Ala 35 40 45 Pro Arg Ser Ala Leu Asn Leu Ser Pro Thr Ile Ile Arg Gln Glu Val 50 55 60 Leu His Ser Ala Ser Ala Gln Gln Leu Asp Cys Val Ala Ser Leu Ala 65 70 75 80 Pro Val Phe Glu Ser Gln Ile Leu Pro Leu Leu Thr Pro Val Asp Glu 85 90 95 Met Trp Gln Pro Thr Asp Phe Leu Pro Ala Ser Asn Ser Glu Ala Phe 100 105 110 Phe Asp Gln Ile Gly Asp Leu Arg Ala Arg Ser Ala Ala Ile Pro Asp 115 120 125 Asp Leu Leu Val Cys Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu 130 135 140 Pro Thr Tyr Met Ala Met Leu Asn Thr Leu Asp Val Val Arg Asp Glu 145 150 155 160 Thr Gly His Ser Gln His Pro Tyr Ala Lys Trp Thr Arg Ala Trp Ile 165 170 175 Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Met Trp Leu 180 185 190 Thr Gly Arg Val Gly His Ala Gly Gly Gly Ala His His Pro Ala Met 195 200 205 Leu Ala Val Glu Arg Thr Ile Gln Arg Leu Ile Ser Ser Gly Met Asp 210 215 220 Pro Gly Thr Glu Asn His Pro Tyr His Ala Phe Val Phe Thr Ser Phe 225 230 235 240 Gln Glu Arg Ala Thr Lys Leu Ser His Gly Ser Thr Ala Arg Leu Ala 245 250 255 Val Ala Ala Gly Asp Glu Ala Leu Ala Lys Ile Cys Gly Thr Ile Ala 260 265 270 Arg Asp Glu Ser Arg His Glu Ala Ala Tyr Thr Arg Thr Met Asp Ala 275 280 285 Ile Phe Gln Arg Asp Pro Ser Gly Ala Met Val Ala Phe Ala His Met 290 295 300 Met Met Arg Lys Ile Thr Met Pro Ala His Leu Met Asp Asp Gly Gln 305 310 315 320 His Gly Ala Arg Asn Gly Gly Ala Gln Leu Val Arg Arg Leu Cys Gly 325 330 335 Ser Gly Gly Ala Gly Arg Gly Val His Arg Arg Arg Leu His Arg His 340 345 350 Pro Ala Pro Pro His Pro Ala Leu Gly Arg Gly Gly 355 360 <210> 47 <211> 1395 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 attatacatc ggcatcgtct caggtttcac gatctgcatg ctatctatgg gactgtgact 60 ccgccggcca ggttgtggtg cgcgagaatc ctccccgctc ctgccttctc atttccctga 120 cgggagtcgc cgctgagcac cgggcggatc atgggcgtcg gcacactcca aaccccatat 180 acatgtggtc gtgcattcac gcatagcgca cggtatgtcc cgcgacgcgc ggctcgaagc 240 cgtggccatc cgacgcgctg cacggccgag gtgagggcac gcccctccgc caatggcgcg 300 cagcccatga ccgccttcga cttccggcag tacatgcagc agcgcgccgc gctggtggac 360 gcagcgctgg acctggcagt gccgctgcag taccccgaga agatcaacga ggccatgcgg 420 tacagcctgc tggccggggg caagcgcgtg cgccccgcgc tctgcctcgc tgcctgcgag 480 ctcgtgggcg gccccctgga ggcggccatg cccgccgcct gcgccatgga gatgatccac 540 accatgagcc tcatccacga cgacctcccc gccatggaca acgacgactt ccggcgcggc 600 cagcccgcca accacaaggc ctatggcgag gagattgcga tcctggcggg cgacgcgctg 660 ctgtcgctga gctttgagca catcgcgcgc gagacgcgag gcgtggaccc ggtgcgcgtc 720 ctggccgcca tctcggagtg gcgcgcggtg ggcagccgcg ggctggtggc ggggcaggtg 780 gtggacctgg gtttcgaggg cggcggcgtg gggctggccc cgctgcgcta catccacgag 840 cacaaaaccg cggcgctgct ggaggcggcg gtggtgtccg gcgcgctgct gggcggcgcg 900 gaggaggcgg acctggagcg cctgcgcacc tacaaccgcg ccatcggcct cgctttccag 960 gtggtggggg acatcctgga catcccgggg accagcgagg agctgggcaa gaccgcgggc 1020 aaggacctga gctcccccaa aaccccctac ccgtccctgg tggggctggc caggtccaaa 1080 aaaattgcgg acgaactgat tgaggacgcg aaaacccaac tcacccagta cgagccggcc 1140 cgagcggcgc ccctcgtaac cctggccgaa aacatttgaa accggaagaa ctgactgggg 1200 gccccccctg cccccagata cggcggggct cctccatcca gttttgggat gggaggagcg 1260 acaaccgacc ccgtaaccct gtgacgcgtt tgccttgcat acgtacgcat gccttgaaac 1320 ccatccatga ccctcaacaa tacctggttg tgtgtagctt ggtcctgaaa aaaaaaaaaa 1380 aaaaaaaaaa aaaaa 1395 <210> 48 <211> 342 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Met Gly Val Gly Thr Leu Gln Thr Pro Tyr Thr Cys Gly Arg Ala Phe 1 5 10 15 Thr His Ser Ala Arg Tyr Val Pro Arg Arg Ala Ala Arg Ser Arg Gly 20 25 30 His Pro Thr Arg Cys Thr Ala Glu Val Arg Ala Arg Pro Ser Ala Asn 35 40 45 Gly Ala Gln Pro Met Thr Ala Phe Asp Phe Arg Gln Tyr Met Gln Gln 50 55 60 Arg Ala Ala Leu Val Asp Ala Ala Leu Asp Leu Ala Val Pro Leu Gln 65 70 75 80 Tyr Pro Glu Lys Ile Asn Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly 85 90 95 Gly Lys Arg Val Arg Pro Ala Leu Cys Leu Ala Ala Cys Glu Leu Val 100 105 110 Gly Gly Pro Leu Glu Ala Ala Met Pro Ala Ala Cys Ala Met Glu Met 115 120 125 Ile His Thr Met Ser Leu Ile His Asp Asp Leu Pro Ala Met Asp Asn 130 135 140 Asp Asp Phe Arg Arg Gly Gln Pro Ala Asn His Lys Ala Tyr Gly Glu 145 150 155 160 Glu Ile Ala Ile Leu Ala Gly Asp Ala Leu Leu Ser Leu Ser Phe Glu 165 170 175 His Ile Ala Arg Glu Thr Arg Gly Val Asp Pro Val Arg Val Leu Ala 180 185 190 Ala Ile Ser Glu Trp Arg Ala Val Gly Ser Arg Gly Leu Val Ala Gly 195 200 205 Gln Val Val Asp Leu Gly Phe Glu Gly Gly Gly Val Gly Leu Ala Pro 210 215 220 Leu Arg Tyr Ile His Glu His Lys Thr Ala Ala Leu Leu Glu Ala Ala 225 230 235 240 Val Val Ser Gly Ala Leu Leu Gly Gly Ala Glu Glu Ala Asp Leu Glu 245 250 255 Arg Leu Arg Thr Tyr Asn Arg Ala Ile Gly Leu Ala Phe Gln Val Val 260 265 270 Gly Asp Ile Leu Asp Ile Pro Gly Thr Ser Glu Glu Leu Gly Lys Thr 275 280 285 Ala Gly Lys Asp Leu Ser Ser Pro Lys Thr Pro Tyr Pro Ser Leu Val 290 295 300 Gly Leu Ala Arg Ser Lys Lys Ile Ala Asp Glu Leu Ile Glu Asp Ala 305 310 315 320 Lys Thr Gln Leu Thr Gln Tyr Glu Pro Ala Arg Ala Ala Pro Leu Val 325 330 335 Thr Leu Ala Glu Asn Ile 340 <210> 49 <211> 833 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 49 cagatgccat gcgccctcgg gccgcgggcc tgagggtcca cgcagcgtcc tcggtggccc 60 agacgcacca ggccgccccc ccggcggaca ggaggttcga cgactaccag ccccgcaccg 120 ccatcctctt ccccggccag ggcgcgcaga gcgtgggcat ggcgggagag ctggcgaagg 180 ccgtccccgc cgccgcggcg ctgttcgacg ccgcctccga ccagctcggc tatgacctgc 240 tccgcgtgtg cgttgagggc cccaaggcgc gcctggacag caccgccgtc agccagcccg 300 ccatctacgt ggccagcctg gcggcggtgg agaagctgcg cgcggagggc ggggaggagg 360 cactggccgc catcgacgtc gctgccggtc tgtccttggg cgagtacacc gcgctggcct 420 ttgccggcgc cttctccttc gccgacgggc tgcgcctggt ggccctgcgc ggcgccagca 480 tgcaggccgc cgccgacgcc gcaccctcgg gcatggtctc cgtcatcggt ctgccctccg 540 acgcggtggc cgcgctgtgc gaggccgcca acgcgcaggt ggcccccgac caggccgtgc 600 gcatcgccaa ctacctctgc gacggcaact acgccgtcag cggtgggctg gagggctgcg 660 cggcggtgga gggcctggcc aaggcccaca aggcgcgcat gacggtgcgc ctggcggtgg 720 cgggcgcctt ccacaccccc ttcatgcagc cggcggtgga ggcgctgagc gcgggcgctg 780 gcggacacgc cgctggtcgc gccgcgcatc cccgtggtca gcaacgggac gcc 833 <210> 50 <211> 275 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 50 Met Arg Pro Arg Ala Ala Gly Leu Arg Val His Ala Ala Ser Ser Val 1 5 10 15 Ala Gln Thr His Gln Ala Ala Pro Pro Ala Asp Arg Arg Phe Asp Asp 20 25 30 Tyr Gln Pro Arg Thr Ala Ile Leu Phe Pro Gly Gln Gly Ala Gln Ser 35 40 45 Val Gly Met Ala Gly Glu Leu Ala Lys Ala Val Pro Ala Ala Ala Ala 50 55 60 Leu Phe Asp Ala Ala Ser Asp Gln Leu Gly Tyr Asp Leu Leu Arg Val 65 70 75 80 Cys Val Glu Gly Pro Lys Ala Arg Leu Asp Ser Thr Ala Val Ser Gln 85 90 95 Pro Ala Ile Tyr Val Ala Ser Leu Ala Ala Val Glu Lys Leu Arg Ala 100 105 110 Glu Gly Gly Glu Glu Ala Leu Ala Ala Ile Asp Val Ala Ala Gly Leu 115 120 125 Ser Leu Gly Glu Tyr Thr Ala Leu Ala Phe Ala Gly Ala Phe Ser Phe 130 135 140 Ala Asp Gly Leu Arg Leu Val Ala Leu Arg Gly Ala Ser Met Gln Ala 145 150 155 160 Ala Ala Asp Ala Ala Pro Ser Gly Met Val Ser Val Ile Gly Leu Pro 165 170 175 Ser Asp Ala Val Ala Ala Leu Cys Glu Ala Ala Asn Ala Gln Val Ala 180 185 190 Pro Asp Gln Ala Val Arg Ile Ala Asn Tyr Leu Cys Asp Gly Asn Tyr 195 200 205 Ala Val Ser Gly Gly Leu Glu Gly Cys Ala Ala Val Glu Gly Leu Ala 210 215 220 Lys Ala His Lys Ala Arg Met Thr Val Arg Leu Ala Val Ala Gly Ala 225 230 235 240 Phe His Thr Pro Phe Met Gln Pro Ala Val Glu Ala Leu Ser Ala Gly 245 250 255 Ala Gly Gly His Ala Ala Gly Arg Ala Ala His Pro Arg Gly Gln Gln 260 265 270 Arg Asp Ala 275 <210> 51 <211> 787 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 tgtccatctc cccccaccct ccatccaacc atcgtcgacg gcatgcaggc gctgtgttct 60 caccccgcgt ccctcacggc gcgtgcggta ccccatgggc gggccagccc agcacagcgg 120 gtgtccagcg ccggcccggc ctacaccggc ctgtcccggc acaccctggg ctgccccagc 180 acccccaccc tccagtcccg cgccgcggtc cagacccgcg gctcctcctc cggctccacc 240 acgcgcatga ccaccaccgc ccagcgcaag atcaaggtgg ccatcaacgg gttcggccgc 300 atcggccgcc agttcctgcg ctgcgtggag gggcgcgagg actcgctgct ggagatcgtg 360 gccgtgaacg actccggcgg cgtgaagcag gccagccacc tgctcaagta cgactccacc 420 atgggcacct tcaacgccga catcaagatc tcgggcgagg gcaccttctc cgtcaacggc 480 cgcgacatcc gcgtcgtctc ctcccgcgac cccctggccc tgccctgggg cgagctgggc 540 gtggacctgg tgatcgaggg gacgggagtg tttgtggacc gcaagggtgc cagcaagcac 600 ctgcaggcgg gggccaagaa ggtcatcatc accgcgccgg ccaagggctc cgacgtgccc 660 acctacgtca tgggcgtgaa cgcggaccag tactccaact ccgacgacat catctccaac 720 gcctcctgca ccaccaactg cctggcgccc tttgtcaagg tgctcaacga ccgcttcggc 780 atcgtga 787 <210> 52 <211> 248 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 52 Met Gln Ala Leu Cys Ser His Pro Ala Ser Leu Thr Ala Arg Ala Val 1 5 10 15 Pro His Gly Arg Ala Ser Pro Ala Gln Arg Val Ser Ser Ala Gly Pro 20 25 30 Ala Tyr Thr Gly Leu Ser Arg His Thr Leu Gly Cys Pro Ser Thr Pro 35 40 45 Thr Leu Gln Ser Arg Ala Ala Val Gln Thr Arg Gly Ser Ser Ser Gly 50 55 60 Ser Thr Thr Arg Met Thr Thr Thr Ala Gln Arg Lys Ile Lys Val Ala 65 70 75 80 Ile Asn Gly Phe Gly Arg Ile Gly Arg Gln Phe Leu Arg Cys Val Glu 85 90 95 Gly Arg Glu Asp Ser Leu Leu Glu Ile Val Ala Val Asn Asp Ser Gly 100 105 110 Gly Val Lys Gln Ala Ser His Leu Leu Lys Tyr Asp Ser Thr Met Gly 115 120 125 Thr Phe Asn Ala Asp Ile Lys Ile Ser Gly Glu Gly Thr Phe Ser Val 130 135 140 Asn Gly Arg Asp Ile Arg Val Val Ser Ser Arg Asp Pro Leu Ala Leu 145 150 155 160 Pro Trp Gly Glu Leu Gly Val Asp Leu Val Ile Glu Gly Thr Gly Val 165 170 175 Phe Val Asp Arg Lys Gly Ala Ser Lys His Leu Gln Ala Gly Ala Lys 180 185 190 Lys Val Ile Ile Thr Ala Pro Ala Lys Gly Ser Asp Val Pro Thr Tyr 195 200 205 Val Met Gly Val Asn Ala Asp Gln Tyr Ser Asn Ser Asp Asp Ile Ile 210 215 220 Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Phe Val Lys Val 225 230 235 240 Leu Asn Asp Arg Phe Gly Ile Val 245 <210> 53 <211> 860 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 gatgttgaga atagtagctt gctgccttgt cgccatgcag agcgtgtgcg cgcagtcggt 60 ttcatgcaag ggggccttca cccagtccct gcggaccccc cgatgcagca ggagccagct 120 cgtctgccgg gctgatggca aggccggagc cttcatcaag accgtaaaga gcggtgctgc 180 cgctctggct gcctccctcc tcctgtctgg gggtgcgggc gcactgacct ttgatgagct 240 gcagggcctg acctacctgc aggtgaaggg ctctggcatc gccaacacct gccccaccct 300 gtctggcggc tcctccaaca tcaaggacct gaagagcggg acctactccg tcaacaagat 360 gtgcctggag cccacgtcct tcaaggtcaa ggaggaggca cagttcaaga acggcgaggc 420 cgactttgtg cccaccaagc tcgtcacgcg tctgacctac accctggacg agatctctgg 480 ccagatgaag atcgacggca gcggcggcgt ggagttcaag gaggaggatg gcatcgacta 540 tgctgcagtc accgtgcagc ttccgggcgg ggagcgcgtg cccttcctct tcaccatcaa 600 ggagcttgac gccaagggga ctgccgacgg cttcaagggc gagttcaccg tgccctccta 660 ccgtgggtcc tccttcctgg accccaaggg ccgcggcgcc tccaccggct acgacaacgc 720 cgtggccctg cccgccgccg gcgattccga ggagttggag aaggagaaca acaagtccac 780 caaggctctg aagggggagg ccatcttctc catcgccaag gtggacgccg ggacagggga 840 ggtggcgggc atctttgagt 860 <210> 54 <211> 275 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 54 Met Gln Ser Val Cys Ala Gln Ser Val Ser Cys Lys Gly Ala Phe Thr 1 5 10 15 Gln Ser Leu Arg Thr Pro Arg Cys Ser Arg Ser Gln Leu Val Cys Arg 20 25 30 Ala Asp Gly Lys Ala Gly Ala Phe Ile Lys Thr Val Lys Ser Gly Ala 35 40 45 Ala Ala Leu Ala Ala Ser Leu Leu Leu Ser Gly Gly Ala Gly Ala Leu 50 55 60 Thr Phe Asp Glu Leu Gln Gly Leu Thr Tyr Leu Gln Val Lys Gly Ser 65 70 75 80 Gly Ile Ala Asn Thr Cys Pro Thr Leu Ser Gly Gly Ser Ser Asn Ile 85 90 95 Lys Asp Leu Lys Ser Gly Thr Tyr Ser Val Asn Lys Met Cys Leu Glu 100 105 110 Pro Thr Ser Phe Lys Val Lys Glu Glu Ala Gln Phe Lys Asn Gly Glu 115 120 125 Ala Asp Phe Val Pro Thr Lys Leu Val Thr Arg Leu Thr Tyr Thr Leu 130 135 140 Asp Glu Ile Ser Gly Gln Met Lys Ile Asp Gly Ser Gly Gly Val Glu 145 150 155 160 Phe Lys Glu Glu Asp Gly Ile Asp Tyr Ala Ala Val Thr Val Gln Leu 165 170 175 Pro Gly Gly Glu Arg Val Pro Phe Leu Phe Thr Ile Lys Glu Leu Asp 180 185 190 Ala Lys Gly Thr Ala Asp Gly Phe Lys Gly Glu Phe Thr Val Pro Ser 195 200 205 Tyr Arg Gly Ser Ser Phe Leu Asp Pro Lys Gly Arg Gly Ala Ser Thr 210 215 220 Gly Tyr Asp Asn Ala Val Ala Leu Pro Ala Ala Gly Asp Ser Glu Glu 225 230 235 240 Leu Glu Lys Glu Asn Asn Lys Ser Thr Lys Ala Leu Lys Gly Glu Ala 245 250 255 Ile Phe Ser Ile Ala Lys Val Asp Ala Gly Thr Gly Glu Val Ala Gly 260 265 270 Ile Phe Glu 275 <210> 55 <211> 818 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 55 ataatcggaa cccagctgca cgcaccatca gtgcggcagc atgcagaccg tcgcagccag 60 ctatggcgta ttggcgccct ccggctccag cgtgacccgg ggctcgacca gcagcaagca 120 gcacttcacc accctcactc ccttttccgg cttcaggcgc ctgaatcatg tggatcgggc 180 ggggcaggcg gggtctggga gcccccagac cctgcagcag gccgtgggca aggccgtgcg 240 ccggtcgcgg ggccgcacca ccagcgccgt gcgcgtgacc cgcatgatgt ttgagcggtt 300 caccgagaag gccatcaagg tggtcatgct cgcgcaggag gaggctcgcc gtctgggcca 360 caacttcgtg gggacggagc aaatcctgct ggggttgatt ggggagtcca caggcatcgc 420 cgccaaggtc ctcaagtcga tgggcgtcac gctgaaagat gcgcgtgtgg aggtcgagaa 480 gatcatcggc cgggggagcg gctttgtggc cgtggagatc cccttcaccc cccgcgccaa 540 gcgtgtgctg gagctgtccc tggaggaggc tcgccagctc ggccacaact acattggcac 600 ggagcacatc ctgctgggcc tgctgcgcga gggtgagggc gtggcctccc gcgtgctgga 660 gaccctgggc gccgaccccc agaagatccg cactcaggtg gtacgcatgg tgggtgagtc 720 gcaggagccc gtgggcacca cggtgggcgg agggtccacc ggctccaaca agatgcccac 780 cctggaggag tacggcacca acctgaccgc ccaggccg 818 <210> 56 <211> 259 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 56 Met Gln Thr Val Ala Ala Ser Tyr Gly Val Leu Ala Pro Ser Gly Ser 1 5 10 15 Ser Val Thr Arg Gly Ser Thr Ser Ser Lys Gln His Phe Thr Thr Leu 20 25 30 Thr Pro Phe Ser Gly Phe Arg Arg Leu Asn His Val Asp Arg Ala Gly 35 40 45 Gln Ala Gly Ser Gly Ser Pro Gln Thr Leu Gln Gln Ala Val Gly Lys 50 55 60 Ala Val Arg Arg Ser Arg Gly Arg Thr Thr Ser Ala Val Arg Val Thr 65 70 75 80 Arg Met Met Phe Glu Arg Phe Thr Glu Lys Ala Ile Lys Val Val Met 85 90 95 Leu Ala Gln Glu Glu Ala Arg Arg Leu Gly His Asn Phe Val Gly Thr 100 105 110 Glu Gln Ile Leu Leu Gly Leu Ile Gly Glu Ser Thr Gly Ile Ala Ala 115 120 125 Lys Val Leu Lys Ser Met Gly Val Thr Leu Lys Asp Ala Arg Val Glu 130 135 140 Val Glu Lys Ile Ile Gly Arg Gly Ser Gly Phe Val Ala Val Glu Ile 145 150 155 160 Pro Phe Thr Pro Arg Ala Lys Arg Val Leu Glu Leu Ser Leu Glu Glu 165 170 175 Ala Arg Gln Leu Gly His Asn Tyr Ile Gly Thr Glu His Ile Leu Leu 180 185 190 Gly Leu Leu Arg Glu Gly Glu Gly Val Ala Ser Arg Val Leu Glu Thr 195 200 205 Leu Gly Ala Asp Pro Gln Lys Ile Arg Thr Gln Val Val Arg Met Val 210 215 220 Gly Glu Ser Gln Glu Pro Val Gly Thr Thr Val Gly Gly Gly Ser Thr 225 230 235 240 Gly Ser Asn Lys Met Pro Thr Leu Glu Glu Tyr Gly Thr Asn Leu Thr 245 250 255 Ala Gln Ala <210> 57 <211> 2357 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300 caacccgcaa acggcgcgcc atatcaatgc ttcttcaggc ctttcttttt cttcttgctg 360 gttttgctgc caagatcagc gcctctatga cgaacgaaac ctcggataga ccacttgtgc 420 actttacacc aaacaagggc tggatgaatg accccaatgg actgtggtac gacgaaaaag 480 atgccaagtg gcatctgtac tttcaataca acccgaacga tactgtctgg gggacgccat 540 tgttttgggg ccacgccacg tccgacgacc tgaccaattg ggaggaccaa ccaatagcta 600 tcgctccgaa gaggaacgac tccggagcat tctcgggttc catggtggtt gactacaaca 660 atacttccgg ctttttcaac gataccattg acccgagaca acgctgcgtg gccatatgga 720 cttacaacac accggagtcc gaggagcagt acatctcgta tagcctggac ggtggataca 780 cttttacaga gtatcagaag aaccctgtgc ttgctgcaaa ttcgactcag ttccgagatc 840 cgaaggtctt ttggtacgag ccctcgcaga agtggatcat gacagcggca aagtcacagg 900 actacaagat cgaaatttac tcgtctgacg accttaaatc ctggaagctc gaatccgcgt 960 tcgcaaacga gggctttctc ggctaccaat acgaatgccc aggcctgata gaggtcccaa 1020 cagagcaaga tcccagcaag tcctactggg tgatgtttat ttccattaat ccaggagcac 1080 cggcaggagg ttcttttaat cagtacttcg tcggaagctt taacggaact catttcgagg 1140 catttgataa ccaatcaaga gtagttgatt ttggaaagga ctactatgcc ctgcagactt 1200 tcttcaatac tgacccgacc tatgggagcg ctcttggcat tgcgtgggct tctaactggg 1260 agtattccgc attcgttcct acaaaccctt ggaggtcctc catgtcgctc gtgaggaaat 1320 tctctctcaa cactgagtac caggccaacc cggaaaccga actcataaac ctgaaagccg 1380 aaccgatcct gaacattagc aacgctggcc cctggagccg gtttgcaacc aacaccacgt 1440 tgacgaaagc caacagctac aacgtcgatc tttcgaatag caccggtaca cttgaatttg 1500 aactggtgta tgccgtcaat accacccaaa cgatctcgaa gtcggtgttc gcggacctct 1560 ccctctggtt taaaggcctg gaagaccccg aggagtacct cagaatgggt ttcgaggttt 1620 ctgcgtcctc cttcttcctt gatcgcggga acagcaaagt aaaatttgtt aaggagaacc 1680 catattttac caacaggatg agcgttaaca accaaccatt caagagcgaa aacgacctgt 1740 cgtactacaa agtgtatggt ttgcttgatc aaaatatcct ggaactctac ttcaacgatg 1800 gtgatgtcgt gtccaccaac acatacttca tgacaaccgg gaacgcactg ggctccgtga 1860 acatgacgac gggtgtggat aacctgttct acatcgacaa attccaggtg agggaagtca 1920 agtgagatct gtcgatcgac aagctcgagg cagcagcagc tcggatagta tcgacacact 1980 ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 2040 tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 2100 gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 2160 catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 2220 tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 2280 ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 2340 acacaaatgg aaagctt 2357 <210> 58 <211> 2335 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 58 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300 caacccgcaa acggcgcgcc atgctgctgc aggccttcct gttcctgctg gccggcttcg 360 ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 420 cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 480 agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 540 ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 600 cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 660 ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 720 acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 780 ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 840 tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 900 agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 960 acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 1020 aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 1080 gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 1140 acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 1200 acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 1260 ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 1320 tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 1380 tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 1440 aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 1500 tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 1560 ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 1620 cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 1680 tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 1740 acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 1800 tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 1860 cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgat 1920 taattaactc gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 1980 tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 2040 caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt 2100 gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc gcttgcatcc 2160 caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac 2220 tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact gcaacctgta 2280 aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa atgga 2335 <210> 59 <211> 382 <212> PRT <213> Cinnamomum camphorum <400> 59 Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val 1 5 10 15 Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu 20 25 30 Gln Leu Arg Ala Gly Asn Ala Gln Thr Ser Leu Lys Met Ile Asn Gly 35 40 45 Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Lys Leu Pro Asp Trp Ser 50 55 60 Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln 65 70 75 80 Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu 85 90 95 Asp Asp His Phe Gly Pro His Gly Leu Val Phe Arg Arg Thr Phe Ala 100 105 110 Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Val Ala 115 120 125 Val Met Asn His Leu Gln Glu Ala Ala Leu Asn His Ala Lys Ser Val 130 135 140 Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu Met Ser Lys Arg 145 150 155 160 Asp Leu Ile Trp Val Val Lys Arg Thr His Val Ala Val Glu Arg Tyr 165 170 175 Pro Ala Trp Gly Asp Thr Val Glu Val Glu Cys Trp Val Gly Ala Ser 180 185 190 Gly Asn Asn Gly Arg Arg His Asp Phe Leu Val Arg Asp Cys Lys Thr 195 200 205 Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val Met Met Asn Thr 210 215 220 Arg Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile 225 230 235 240 Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp Glu Glu Ile Lys 245 250 255 Lys Pro Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly 260 265 270 Leu Thr Pro Arg Trp Asn Asp Leu Asp Ile Asn Gln His Val Asn Asn 275 280 285 Ile Lys Tyr Val Asp Trp Ile Leu Glu Thr Val Pro Asp Ser Ile Phe 290 295 300 Glu Ser His His Ile Ser Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys 305 310 315 320 Thr Met Asp Ser Val Leu Gln Ser Leu Thr Thr Val Ser Gly Gly Ser 325 330 335 Ser Glu Ala Gly Leu Val Cys Glu His Leu Leu Gln Leu Glu Gly Gly 340 345 350 Ser Glu Val Leu Arg Ala Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp 355 360 365 Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Ser Ser Val 370 375 380 <210> 60 <211> 1240 <212> DNA <213> Cinnamomum camphorum <400> 60 ggcgcgccat ggccaccacc tccctggcct ccgccttctg cagcatgaag gccgtgatgc 60 tggcccgcga cggccgcggc atgaagcccc gctccagcga cctgcagctg cgcgccggca 120 acgcccagac ctccctgaag atgatcaacg gcaccaagtt ctcctacacc gagagcctga 180 agaagctgcc cgactggtcc atgctgttcg ccgtgatcac caccatcttc tccgccgccg 240 agaagcagtg gaccaacctg gagtggaagc ccaagcccaa ccccccccag ctgctggacg 300 accacttcgg cccccacggc ctggtgttcc gccgcacctt cgccatccgc agctacgagg 360 tgggccccga ccgctccacc agcatcgtgg ccgtgatgaa ccacctgcag gaggccgccc 420 tgaaccacgc caagtccgtg ggcatcctgg gcgacggctt cggcaccacc ctggagatgt 480 ccaagcgcga cctgatctgg gtggtgaagc gcacccacgt ggccgtggag cgctaccccg 540 cctggggcga caccgtggag gtggagtgct gggtgggcgc ctccggcaac aacggccgcc 600 gccacgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc tgcacctccc 660 tgagcgtgat gatgaacacc cgcacccgcc gcctgagcaa gatccccgag gaggtgcgcg 720 gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgaggag atcaagaagc 780 cccagaagct gaacgactcc accgccgact acatccaggg cggcctgacc ccccgctgga 840 acgacctgga catcaaccag cacgtgaaca acatcaagta cgtggactgg atcctggaga 900 ccgtgcccga cagcatcttc gagagccacc acatctcctc cttcaccatc gagtaccgcc 960 gcgagtgcac catggacagc gtgctgcagt ccctgaccac cgtgagcggc ggctcctccg 1020 aggccggcct ggtgtgcgag cacctgctgc agctggaggg cggcagcgag gtgctgcgcg 1080 ccaagaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc gtgatccccg 1140 ccgagtccag cgtgatggac tacaaggacc acgacggcga ctacaaggac cacgacatcg 1200 actacaagga cgacgacgac aagtgactcg agttaattaa 1240 <210> 61 <211> 415 <212> PRT <213> Cuphea hookeriana <400> 61 Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala Pro 1 5 10 15 Gly Ala Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu 20 25 30 Ser Pro Ser Phe Lys Pro Lys Ser Ile Pro Asn Gly Gly Phe Gln Val 35 40 45 Lys Ala Asn Asp Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Ser 50 55 60 Leu Lys Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro 65 70 75 80 Pro Pro Arg Thr Phe Leu His Gln Leu Pro Asp Trp Ser Arg Leu Leu 85 90 95 Thr Ala Ile Thr Thr Val Phe Val Lys Ser Lys Arg Pro Asp Met His 100 105 110 Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Phe Gly Leu 115 120 125 Glu Ser Thr Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Thr Asp Arg Thr Ala Ser Ile Glu Thr Leu 145 150 155 160 Met Asn His Leu Gln Glu Thr Ser Leu Asn His Cys Lys Ser Thr Gly 165 170 175 Ile Leu Leu Asp Gly Phe Gly Arg Thr Leu Glu Met Cys Lys Arg Asp 180 185 190 Leu Ile Trp Val Val Ile Lys Met Gln Ile Lys Val Asn Arg Tyr Pro 195 200 205 Ala Trp Gly Asp Thr Val Glu Ile Asn Thr Arg Phe Ser Arg Leu Gly 210 215 220 Lys Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 225 230 235 240 Glu Ile Leu Val Arg Ala Thr Ser Ala Tyr Ala Met Met Asn Gln Lys 245 250 255 Thr Arg Arg Leu Ser Lys Leu Pro Tyr Glu Val His Gln Glu Ile Val 260 265 270 Pro Leu Phe Val Asp Ser Pro Val Ile Glu Asp Ser Asp Leu Lys Val 275 280 285 His Lys Phe Lys Val Lys Thr Gly Asp Ser Ile Gln Lys Gly Leu Thr 290 295 300 Pro Gly Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys 305 310 315 320 Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu Thr 325 330 335 Gln Glu Leu Cys Ser Leu Ala Leu Glu Tyr Arg Arg Glu Cys Gly Arg 340 345 350 Asp Ser Val Leu Glu Ser Val Thr Ala Met Asp Pro Ser Lys Val Gly 355 360 365 Val Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Ala 370 375 380 Ile Val Asn Gly Ala Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn 385 390 395 400 Gly Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Val Ser 405 410 415 <210> 62 <211> 1339 <212> DNA <213> Cuphea hookeriana <400> 62 ggcgcgccat ggtggccgcc gccgcctcca gcgccttctt ccccgtgccc gcccccggcg 60 cctcccccaa gcccggcaag ttcggcaact ggccctccag cctgagcccc tccttcaagc 120 ccaagtccat ccccaacggc ggcttccagg tgaaggccaa cgacagcgcc caccccaagg 180 ccaacggctc cgccgtgagc ctgaagagcg gcagcctgaa cacccaggag gacacctcct 240 ccagcccccc cccccgcacc ttcctgcacc agctgcccga ctggagccgc ctgctgaccg 300 ccatcaccac cgtgttcgtg aagtccaagc gccccgacat gcacgaccgc aagtccaagc 360 gccccgacat gctggtggac agcttcggcc tggagtccac cgtgcaggac ggcctggtgt 420 tccgccagtc cttctccatc cgctcctacg agatcggcac cgaccgcacc gccagcatcg 480 agaccctgat gaaccacctg caggagacct ccctgaacca ctgcaagagc accggcatcc 540 tgctggacgg cttcggccgc accctggaga tgtgcaagcg cgacctgatc tgggtggtga 600 tcaagatgca gatcaaggtg aaccgctacc ccgcctgggg cgacaccgtg gagatcaaca 660 cccgcttcag ccgcctgggc aagatcggca tgggccgcga ctggctgatc tccgactgca 720 acaccggcga gatcctggtg cgcgccacca gcgcctacgc catgatgaac cagaagaccc 780 gccgcctgtc caagctgccc tacgaggtgc accaggagat cgtgcccctg ttcgtggaca 840 gccccgtgat cgaggactcc gacctgaagg tgcacaagtt caaggtgaag accggcgaca 900 gcatccagaa gggcctgacc cccggctgga acgacctgga cgtgaaccag cacgtgtcca 960 acgtgaagta catcggctgg atcctggaga gcatgcccac cgaggtgctg gagacccagg 1020 agctgtgctc cctggccctg gagtaccgcc gcgagtgcgg ccgcgactcc gtgctggaga 1080 gcgtgaccgc catggacccc agcaaggtgg gcgtgcgctc ccagtaccag cacctgctgc 1140 gcctggagga cggcaccgcc atcgtgaacg gcgccaccga gtggcgcccc aagaacgccg 1200 gcgccaacgg cgccatctcc accggcaaga ccagcaacgg caactccgtg tccatggact 1260 acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac gacgacgaca 1320 agtgactcga gttaattaa 1339 <210> 63 <211> 382 <212> PRT <213> Umbellularia sp. <400> 63 Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val 1 5 10 15 Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu 20 25 30 Gln Leu Arg Ala Gly Asn Ala Pro Thr Ser Leu Lys Met Ile Asn Gly 35 40 45 Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Arg Leu Pro Asp Trp Ser 50 55 60 Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln 65 70 75 80 Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Lys Leu Pro Gln Leu Leu 85 90 95 Asp Asp His Phe Gly Leu His Gly Leu Val Phe Arg Arg Thr Phe Ala 100 105 110 Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Leu Ala 115 120 125 Val Met Asn His Met Gln Glu Ala Thr Leu Asn His Ala Lys Ser Val 130 135 140 Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu Met Ser Lys Arg 145 150 155 160 Asp Leu Met Trp Val Val Arg Arg Thr His Val Ala Val Glu Arg Tyr 165 170 175 Pro Thr Trp Gly Asp Thr Val Glu Val Glu Cys Trp Ile Gly Ala Ser 180 185 190 Gly Asn Asn Gly Met Arg Arg Asp Phe Leu Val Arg Asp Cys Lys Thr 195 200 205 Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val Leu Met Asn Thr 210 215 220 Arg Thr Arg Arg Leu Ser Thr Ile Pro Asp Glu Val Arg Gly Glu Ile 225 230 235 240 Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp Asp Glu Ile Lys 245 250 255 Lys Leu Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly 260 265 270 Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn 275 280 285 Leu Lys Tyr Val Ala Trp Val Phe Glu Thr Val Pro Asp Ser Ile Phe 290 295 300 Glu Ser His His Ile Ser Ser Phe Thr Leu Glu Tyr Arg Arg Glu Cys 305 310 315 320 Thr Arg Asp Ser Val Leu Arg Ser Leu Thr Thr Val Ser Gly Gly Ser 325 330 335 Ser Glu Ala Gly Leu Val Cys Asp His Leu Leu Gln Leu Glu Gly Gly 340 345 350 Ser Glu Val Leu Arg Ala Arg Thr Glu Trp Arg Pro Lys Leu Thr Asp 355 360 365 Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Pro Arg Val 370 375 380 <210> 64 <211> 1240 <212> DNA <213> Umbellularia sp. <400> 64 ggcgcgccat ggccaccacc agcctggcct ccgccttctg ctccatgaag gccgtgatgc 60 tggcccgcga cggccgcggc atgaagcccc gcagctccga cctgcagctg cgcgccggca 120 acgcccccac ctccctgaag atgatcaacg gcaccaagtt cagctacacc gagagcctga 180 agcgcctgcc cgactggtcc atgctgttcg ccgtgatcac caccatcttc agcgccgccg 240 agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag ctgctggacg 300 accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc tcctacgagg 360 tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag gaggccaccc 420 tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc ctggagatgt 480 ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag cgctacccca 540 cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac aacggcatgc 600 gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc tgcacctccc 660 tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac gaggtgcgcg 720 gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag atcaagaagc 780 tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc ccccgctgga 840 acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg gtgttcgaga 900 ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg gagtaccgcc 960 gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc ggcagctccg 1020 aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag gtgctgcgcg 1080 cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc gtgatccccg 1140 ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac cacgacatcg 1200 actacaagga cgacgacgac aagtgactcg agttaattaa 1240 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 65 ccgccgtgct ggacgtggtg 20 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 66 ggtggcgggg tccagggtgt 20 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 67 cggccggcgg ctccttcaac 20 <210> 68 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 68 ggcgctcccg taggtcgggt 20 <210> 69 <211> 1335 <212> DNA <213> Chlorella sorokiniana <400> 69 cgcctgcaac gcaagggcag ccacagccgc tcccacccgc cgctgaaccg acacgtgctt 60 gggcgcctgc cgcctgcctg ccgcatgctt gtgctggtga ggctgggcag tgctgccatg 120 ctgattgagg cttggttcat cgggtggaag cttatgtgtg tgctgggctt gcatgccggg 180 caatgcgcat ggtggcaaga gggcggcagc acttgctgga gctgccgcgg tgcctccagg 240 tggttcaatc gcggcagcca gagggatttc agatgatcgc gcgtacaggt tgagcagcag 300 tgtcagcaaa ggtagcagtt tgccagaatg atcggttcag ctgttaatca atgccagcaa 360 gagaaggggt caagtgcaaa cacgggcatg ccacagcacg ggcaccgggg agtggaatgg 420 caccaccaag tgtgtgcgag ccagcatcgc cgcctggctg tttcagctac aacggcagga 480 gtcatccaac gtaaccatga gctgatcaac actgcaatca tcgggcgggc gtgatgcaag 540 catgcctggc gaagacacat ggtgtgcgga tgctgccggc tgctgcctgc tgcgcacgcc 600 gttgagttgg cagcaggctc agccatgcac tggatggcag ctgggctgcc actgcaatgt 660 ggtggatagg atgcaagtgg agcgaatacc aaaccctctg gctgcttgct gggttgcatg 720 gcatcgcacc atcagcagga gcgcatgcga agggactggc cccatgcacg ccatgccaaa 780 ccggagcgca ccgagtgtcc acactgtcac caggcccgca agctttgcag aaccatgctc 840 atggacgcat gtagcgctga cgtcccttga cggcgctcct ctcgggtgtg ggaaacgcaa 900 tgcagcacag gcagcagagg cggcggcagc agagcggcgg cagcagcggc gggggccacc 960 cttcttgcgg ggtcgcgccc cagccagcgg tgatgcgctg atcccaaacg agttcacatt 1020 catttgcatg cctggagaag cgaggctggg gcctttgggc tggtgcagcc cgcaatggaa 1080 tgcgggaccg ccaggctagc agcaaaggcg cctcccctac tccgcatcga tgttccatag 1140 tgcattggac tgcatttggg tggggcggcc ggctgtttct ttcgtgttgc aaaacgcgcc 1200 agctcagcaa cctgtcccgt gggtcccccg tgccgatgaa atcgtgtgca cgccgatcag 1260 ctgattgccc ggctcgcgaa gtaggcgccc tcctttctgc tcgccctctc tccgtcccgc 1320 cactagtggc gcgcc 1335 <210> 70 <211> 1146 <212> DNA <213> Umbellularia californica <400> 70 atggccacca ccagcctggc ctccgccttc tgctccatga aggccgtgat gctggcccgc 60 gacggccgcg gcatgaagcc ccgcagctcc gacctgcagc tgcgcgccgg caacgccccc 120 acctccctga agatgatcaa cggcaccaag ttcagctaca ccgagagcct gaagcgcctg 180 cccgactggt ccatgctgtt cgccgtgatc accaccatct tcagcgccgc cgagaagcag 240 tggaccaacc tggagtggaa gcccaagccc aagctgcccc agctgctgga cgaccacttc 300 ggcctgcacg gcctggtgtt ccgccgcacc ttcgccatcc gctcctacga ggtgggcccc 360 gaccgcagca cctccatcct ggccgtgatg aaccacatgc aggaggccac cctgaaccac 420 gccaagagcg tgggcatcct gggcgacggc ttcggcacca ccctggagat gtccaagcgc 480 gacctgatgt gggtggtgcg ccgcacccac gtggccgtgg agcgctaccc cacctggggc 540 gacaccgtgg aggtggagtg ctggatcggc gccagcggca acaacggcat gcgccgcgac 600 ttcctggtgc gcgactgcaa gaccggcgag atcctgaccc gctgcacctc cctgagcgtg 660 ctgatgaaca cccgcacccg ccgcctgagc accatccccg acgaggtgcg cggcgagatc 720 ggccccgcct tcatcgacaa cgtggccgtg aaggacgacg agatcaagaa gctgcagaag 780 ctgaacgact ccaccgccga ctacatccag ggcggcctga ccccccgctg gaacgacctg 840 gacgtgaacc agcacgtgaa caacctgaag tacgtggcct gggtgttcga gaccgtgccc 900 gacagcatct tcgagtccca ccacatcagc tccttcaccc tggagtaccg ccgcgagtgc 960 acccgcgact ccgtgctgcg cagcctgacc accgtgagcg gcggcagctc cgaggccggc 1020 ctggtgtgcg accacctgct gcagctggag ggcggcagcg aggtgctgcg cgcccgcacc 1080 gagtggcgcc ccaagctgac cgactccttc cgcggcatca gcgtgatccc cgccgagccc 1140 cgcgtg 1146 <210> 71 <211> 1146 <212> DNA <213> Cinnamomum camphora <400> 71 atggccacca cctccctggc ctccgccttc tgcagcatga aggccgtgat gctggcccgc 60 gacggccgcg gcatgaagcc ccgctccagc gacctgcagc tgcgcgccgg caacgcccag 120 acctccctga agatgatcaa cggcaccaag ttctcctaca ccgagagcct gaagaagctg 180 cccgactggt ccatgctgtt cgccgtgatc accaccatct tctccgccgc cgagaagcag 240 tggaccaacc tggagtggaa gcccaagccc aacccccccc agctgctgga cgaccacttc 300 ggcccccacg gcctggtgtt ccgccgcacc ttcgccatcc gcagctacga ggtgggcccc 360 gaccgctcca ccagcatcgt ggccgtgatg aaccacctgc aggaggccgc cctgaaccac 420 gccaagtccg tgggcatcct gggcgacggc ttcggcacca ccctggagat gtccaagcgc 480 gacctgatct gggtggtgaa gcgcacccac gtggccgtgg agcgctaccc cgcctggggc 540 gacaccgtgg aggtggagtg ctgggtgggc gcctccggca acaacggccg ccgccacgac 600 ttcctggtgc gcgactgcaa gaccggcgag atcctgaccc gctgcacctc cctgagcgtg 660 atgatgaaca cccgcacccg ccgcctgagc aagatccccg aggaggtgcg cggcgagatc 720 ggccccgcct tcatcgacaa cgtggccgtg aaggacgagg agatcaagaa gccccagaag 780 ctgaacgact ccaccgccga ctacatccag ggcggcctga ccccccgctg gaacgacctg 840 gacatcaacc agcacgtgaa caacatcaag tacgtggact ggatcctgga gaccgtgccc 900 gacagcatct tcgagagcca ccacatctcc tccttcacca tcgagtaccg ccgcgagtgc 960 accatggaca gcgtgctgca gtccctgacc accgtgagcg gcggctcctc cgaggccggc 1020 ctggtgtgcg agcacctgct gcagctggag ggcggcagcg aggtgctgcg cgccaagacc 1080 gagtggcgcc ccaagctgac cgactccttc cgcggcatca gcgtgatccc cgccgagtcc 1140 agcgtg 1146 <210> 72 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 60 gacgacaagt ga 72 <210> 73 <211> 408 <212> DNA <213> Chlorella vulgaris <400> 73 ctcgaggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60 ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120 cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180 ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240 aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300 cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360 actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatgga 408 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 74 ctgggcgacg gcttcggcac 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 75 aagtcgcggc gcatgccgtt 20 <210> 76 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 76 taccccgcct ggggcgacac 20 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 77 cttgctcagg cggcgggtgc 20 <210> 78 <211> 1317 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 78 atggtggccg ccgccgcctc cagcgccttc ttccccgtgc ccgcccccgg cgcctccccc 60 aagcccggca agttcggcaa ctggccctcc agcctgagcc cctccttcaa gcccaagtcc 120 atccccaacg gcggcttcca ggtgaaggcc aacgacagcg cccaccccaa ggccaacggc 180 tccgccgtga gcctgaagag cggcagcctg aacacccagg aggacacctc ctccagcccc 240 cccccccgca ccttcctgca ccagctgccc gactggagcc gcctgctgac cgccatcacc 300 accgtgttcg tgaagtccaa gcgccccgac atgcacgacc gcaagtccaa gcgccccgac 360 atgctggtgg acagcttcgg cctggagtcc accgtgcagg acggcctggt gttccgccag 420 tccttctcca tccgctccta cgagatcggc accgaccgca ccgccagcat cgagaccctg 480 atgaaccacc tgcaggagac ctccctgaac cactgcaaga gcaccggcat cctgctggac 540 ggcttcggcc gcaccctgga gatgtgcaag cgcgacctga tctgggtggt gatcaagatg 600 cagatcaagg tgaaccgcta ccccgcctgg ggcgacaccg tggagatcaa cacccgcttc 660 agccgcctgg gcaagatcgg catgggccgc gactggctga tctccgactg caacaccggc 720 gagatcctgg tgcgcgccac cagcgcctac gccatgatga accagaagac ccgccgcctg 780 tccaagctgc cctacgaggt gcaccaggag atcgtgcccc tgttcgtgga cagccccgtg 840 atcgaggact ccgacctgaa ggtgcacaag ttcaaggtga agaccggcga cagcatccag 900 aagggcctga cccccggctg gaacgacctg gacgtgaacc agcacgtgtc caacgtgaag 960 tacatcggct ggatcctgga gagcatgccc accgaggtgc tggagaccca ggagctgtgc 1020 tccctggccc tggagtaccg ccgcgagtgc ggccgcgact ccgtgctgga gagcgtgacc 1080 gccatggacc ccagcaaggt gggcgtgcgc tcccagtacc agcacctgct gcgcctggag 1140 gacggcaccg ccatcgtgaa cggcgccacc gagtggcgcc ccaagaacgc cggcgccaac 1200 ggcgccatct ccaccggcaa gaccagcaac ggcaactccg tgtccatgga ctacaaggac 1260 cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga caagtga 1317 <210> 79 <211> 1170 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 79 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccagctg 120 cccgactgga gccgcctgct gaccgccatc accaccgtgt tcgtgaagtc caagcgcccc 180 gacatgcacg accgcaagtc caagcgcccc gacatgctgg tggacagctt cggcctggag 240 tccaccgtgc aggacggcct ggtgttccgc cagtccttct ccatccgctc ctacgagatc 300 ggcaccgacc gcaccgccag catcgagacc ctgatgaacc acctgcagga gacctccctg 360 aaccactgca agagcaccgg catcctgctg gacggcttcg gccgcaccct ggagatgtgc 420 aagcgcgacc tgatctgggt ggtgatcaag atgcagatca aggtgaaccg ctaccccgcc 480 tggggcgaca ccgtggagat caacacccgc ttcagccgcc tgggcaagat cggcatgggc 540 cgcgactggc tgatctccga ctgcaacacc ggcgagatcc tggtgcgcgc caccagcgcc 600 tacgccatga tgaaccagaa gacccgccgc ctgtccaagc tgccctacga ggtgcaccag 660 gagatcgtgc ccctgttcgt ggacagcccc gtgatcgagg actccgacct gaaggtgcac 720 aagttcaagg tgaagaccgg cgacagcatc cagaagggcc tgacccccgg ctggaacgac 780 ctggacgtga accagcacgt gtccaacgtg aagtacatcg gctggatcct ggagagcatg 840 cccaccgagg tgctggagac ccaggagctg tgctccctgg ccctggagta ccgccgcgag 900 tgcggccgcg actccgtgct ggagagcgtg accgccatgg accccagcaa ggtgggcgtg 960 cgctcccagt accagcacct gctgcgcctg gaggacggca ccgccatcgt gaacggcgcc 1020 accgagtggc gccccaagaa cgccggcgcc aacggcgcca tctccaccgg caagaccagc 1080 aacggcaact ccgtgtccat ggactacaag gaccacgacg gcgactacaa ggaccacgac 1140 atcgactaca aggacgacga cgacaagtga 1170 <210> 80 <211> 1170 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 80 atggctatca agacgaacag gcagcctgtg gagaagcctc cgttcacgat cgggacgctg 60 cgcaaggcca tccccgcgca ctgtttcgag cgctcggcgc ttcgtgggcg cgcccagctg 120 cccgactgga gccgcctgct gaccgccatc accaccgtgt tcgtgaagtc caagcgcccc 180 gacatgcacg accgcaagtc caagcgcccc gacatgctgg tggacagctt cggcctggag 240 tccaccgtgc aggacggcct ggtgttccgc cagtccttct ccatccgctc ctacgagatc 300 ggcaccgacc gcaccgccag catcgagacc ctgatgaacc acctgcagga gacctccctg 360 aaccactgca agagcaccgg catcctgctg gacggcttcg gccgcaccct ggagatgtgc 420 aagcgcgacc tgatctgggt ggtgatcaag atgcagatca aggtgaaccg ctaccccgcc 480 tggggcgaca ccgtggagat caacacccgc ttcagccgcc tgggcaagat cggcatgggc 540 cgcgactggc tgatctccga ctgcaacacc ggcgagatcc tggtgcgcgc caccagcgcc 600 tacgccatga tgaaccagaa gacccgccgc ctgtccaagc tgccctacga ggtgcaccag 660 gagatcgtgc ccctgttcgt ggacagcccc gtgatcgagg actccgacct gaaggtgcac 720 aagttcaagg tgaagaccgg cgacagcatc cagaagggcc tgacccccgg ctggaacgac 780 ctggacgtga accagcacgt gtccaacgtg aagtacatcg gctggatcct ggagagcatg 840 cccaccgagg tgctggagac ccaggagctg tgctccctgg ccctggagta ccgccgcgag 900 tgcggccgcg actccgtgct ggagagcgtg accgccatgg accccagcaa ggtgggcgtg 960 cgctcccagt accagcacct gctgcgcctg gaggacggca ccgccatcgt gaacggcgcc 1020 accgagtggc gccccaagaa cgccggcgcc aacggcgcca tctccaccgg caagaccagc 1080 aacggcaact ccgtgtccat ggactacaag gaccacgacg gcgactacaa ggaccacgac 1140 atcgactaca aggacgacga cgacaagtga 1170 <210> 81 <211> 1167 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 81 atgacgttcg gggtcgccct cccggccatg ggccgcggtg tctcccttcc ccggcccagg 60 gtcgcggtgc gcgcccagtc ggcgagtcag gttttggaga gcgggcgcgc ccagctgccc 120 gactggagcc gcctgctgac cgccatcacc accgtgttcg tgaagtccaa gcgccccgac 180 atgcacgacc gcaagtccaa gcgccccgac atgctggtgg acagcttcgg cctggagtcc 240 accgtgcagg acggcctggt gttccgccag tccttctcca tccgctccta cgagatcggc 300 accgaccgca ccgccagcat cgagaccctg atgaaccacc tgcaggagac ctccctgaac 360 cactgcaaga gcaccggcat cctgctggac ggcttcggcc gcaccctgga gatgtgcaag 420 cgcgacctga tctgggtggt gatcaagatg cagatcaagg tgaaccgcta ccccgcctgg 480 ggcgacaccg tggagatcaa cacccgcttc agccgcctgg gcaagatcgg catgggccgc 540 gactggctga tctccgactg caacaccggc gagatcctgg tgcgcgccac cagcgcctac 600 gccatgatga accagaagac ccgccgcctg tccaagctgc cctacgaggt gcaccaggag 660 atcgtgcccc tgttcgtgga cagccccgtg atcgaggact ccgacctgaa ggtgcacaag 720 ttcaaggtga agaccggcga cagcatccag aagggcctga cccccggctg gaacgacctg 780 gacgtgaacc agcacgtgtc caacgtgaag tacatcggct ggatcctgga gagcatgccc 840 accgaggtgc tggagaccca ggagctgtgc tccctggccc tggagtaccg ccgcgagtgc 900 ggccgcgact ccgtgctgga gagcgtgacc gccatggacc ccagcaaggt gggcgtgcgc 960 tcccagtacc agcacctgct gcgcctggag gacggcaccg ccatcgtgaa cggcgccacc 1020 gagtggcgcc ccaagaacgc cggcgccaac ggcgccatct ccaccggcaa gaccagcaac 1080 ggcaactccg tgtccatgga ctacaaggac cacgacggcg actacaagga ccacgacatc 1140 gactacaagg acgacgacga caagtga 1167 <210> 82 <211> 1149 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 82 atgacgttcg gggtcgccct cccggccatg ggccgcggtg tctcccttcc ccggcccagg 60 gtcgcggtgc gcgcccagtc ggcgagtcag gttttggaga gcgggcgcgc ccccgactgg 120 tccatgctgt tcgccgtgat caccaccatc ttcagcgccg ccgagaagca gtggaccaac 180 ctggagtgga agcccaagcc caagctgccc cagctgctgg acgaccactt cggcctgcac 240 ggcctggtgt tccgccgcac cttcgccatc cgctcctacg aggtgggccc cgaccgcagc 300 acctccatcc tggccgtgat gaaccacatg caggaggcca ccctgaacca cgccaagagc 360 gtgggcatcc tgggcgacgg cttcggcacc accctggaga tgtccaagcg cgacctgatg 420 tgggtggtgc gccgcaccca cgtggccgtg gagcgctacc ccacctgggg cgacaccgtg 480 gaggtggagt gctggatcgg cgccagcggc aacaacggca tgcgccgcga cttcctggtg 540 cgcgactgca agaccggcga gatcctgacc cgctgcacct ccctgagcgt gctgatgaac 600 acccgcaccc gccgcctgag caccatcccc gacgaggtgc gcggcgagat cggccccgcc 660 ttcatcgaca acgtggccgt gaaggacgac gagatcaaga agctgcagaa gctgaacgac 720 tccaccgccg actacatcca gggcggcctg accccccgct ggaacgacct ggacgtgaac 780 cagcacgtga acaacctgaa gtacgtggcc tgggtgttcg agaccgtgcc cgacagcatc 840 ttcgagtccc accacatcag ctccttcacc ctggagtacc gccgcgagtg cacccgcgac 900 tccgtgctgc gcagcctgac caccgtgagc ggcggcagct ccgaggccgg cctggtgtgc 960 gaccacctgc tgcagctgga gggcggcagc gaggtgctgc gcgcccgcac cgagtggcgc 1020 cccaagctga ccgactcctt ccgcggcatc agcgtgatcc ccgccgagcc ccgcgtgatg 1080 gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa ggacgacgac 1140 gacaagtga 1149 <210> 83 <211> 1146 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 83 atggcttccg cggcattcac catgtcggcg tgccccgcga tgactggcag ggcccctggg 60 gcacgtcgct ccggacggcc agtcgccacc cgcctgaggg ggcgcgcccc cgactggtcc 120 atgctgttcg ccgtgatcac caccatcttc agcgccgccg agaagcagtg gaccaacctg 180 gagtggaagc ccaagcccaa gctgccccag ctgctggacg accacttcgg cctgcacggc 240 ctggtgttcc gccgcacctt cgccatccgc tcctacgagg tgggccccga ccgcagcacc 300 tccatcctgg ccgtgatgaa ccacatgcag gaggccaccc tgaaccacgc caagagcgtg 360 ggcatcctgg gcgacggctt cggcaccacc ctggagatgt ccaagcgcga cctgatgtgg 420 gtggtgcgcc gcacccacgt ggccgtggag cgctacccca cctggggcga caccgtggag 480 gtggagtgct ggatcggcgc cagcggcaac aacggcatgc gccgcgactt cctggtgcgc 540 gactgcaaga ccggcgagat cctgacccgc tgcacctccc tgagcgtgct gatgaacacc 600 cgcacccgcc gcctgagcac catccccgac gaggtgcgcg gcgagatcgg ccccgccttc 660 atcgacaacg tggccgtgaa ggacgacgag atcaagaagc tgcagaagct gaacgactcc 720 accgccgact acatccaggg cggcctgacc ccccgctgga acgacctgga cgtgaaccag 780 cacgtgaaca acctgaagta cgtggcctgg gtgttcgaga ccgtgcccga cagcatcttc 840 gagtcccacc acatcagctc cttcaccctg gagtaccgcc gcgagtgcac ccgcgactcc 900 gtgctgcgca gcctgaccac cgtgagcggc ggcagctccg aggccggcct ggtgtgcgac 960 cacctgctgc agctggaggg cggcagcgag gtgctgcgcg cccgcaccga gtggcgcccc 1020 aagctgaccg actccttccg cggcatcagc gtgatccccg ccgagccccg cgtgatggac 1080 tacaaggacc acgacggcga ctacaaggac cacgacatcg actacaagga cgacgacgac 1140 aagtga 1146 <210> 84 <211> 1155 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 84 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120 tggtccatgc tgttcgccgt gatcaccacc atcttcagcg ccgccgagaa gcagtggacc 180 aacctggagt ggaagcccaa gcccaagctg ccccagctgc tggacgacca cttcggcctg 240 cacggcctgg tgttccgccg caccttcgcc atccgctcct acgaggtggg ccccgaccgc 300 agcacctcca tcctggccgt gatgaaccac atgcaggagg ccaccctgaa ccacgccaag 360 agcgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420 atgtgggtgg tgcgccgcac ccacgtggcc gtggagcgct accccacctg gggcgacacc 480 gtggaggtgg agtgctggat cggcgccagc ggcaacaacg gcatgcgccg cgacttcctg 540 gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgctgatg 600 aacacccgca cccgccgcct gagcaccatc cccgacgagg tgcgcggcga gatcggcccc 660 gccttcatcg acaacgtggc cgtgaaggac gacgagatca agaagctgca gaagctgaac 720 gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacgtg 780 aaccagcacg tgaacaacct gaagtacgtg gcctgggtgt tcgagaccgt gcccgacagc 840 atcttcgagt cccaccacat cagctccttc accctggagt accgccgcga gtgcacccgc 900 gactccgtgc tgcgcagcct gaccaccgtg agcggcggca gctccgaggc cggcctggtg 960 tgcgaccacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgcccg caccgagtgg 1020 cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gccccgcgtg 1080 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140 gacgacaagt gatga 1155 <210> 85 <211> 1152 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 85 atggctatca agacgaacag gcagcctgtg gagaagcctc cgttcacgat cgggacgctg 60 cgcaaggcca tccccgcgca ctgtttcgag cgctcggcgc ttcgtgggcg cgcccccgac 120 tggtccatgc tgttcgccgt gatcaccacc atcttcagcg ccgccgagaa gcagtggacc 180 aacctggagt ggaagcccaa gcccaagctg ccccagctgc tggacgacca cttcggcctg 240 cacggcctgg tgttccgccg caccttcgcc atccgctcct acgaggtggg ccccgaccgc 300 agcacctcca tcctggccgt gatgaaccac atgcaggagg ccaccctgaa ccacgccaag 360 agcgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420 atgtgggtgg tgcgccgcac ccacgtggcc gtggagcgct accccacctg gggcgacacc 480 gtggaggtgg agtgctggat cggcgccagc ggcaacaacg gcatgcgccg cgacttcctg 540 gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgctgatg 600 aacacccgca cccgccgcct gagcaccatc cccgacgagg tgcgcggcga gatcggcccc 660 gccttcatcg acaacgtggc cgtgaaggac gacgagatca agaagctgca gaagctgaac 720 gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacgtg 780 aaccagcacg tgaacaacct gaagtacgtg gcctgggtgt tcgagaccgt gcccgacagc 840 atcttcgagt cccaccacat cagctccttc accctggagt accgccgcga gtgcacccgc 900 gactccgtgc tgcgcagcct gaccaccgtg agcggcggca gctccgaggc cggcctggtg 960 tgcgaccacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgcccg caccgagtgg 1020 cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gccccgcgtg 1080 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140 gacgacaagt ga 1152 <210> 86 <211> 1155 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 86 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120 tggtccatgc tgttcgccgt gatcaccacc atcttctccg ccgccgagaa gcagtggacc 180 aacctggagt ggaagcccaa gcccaacccc ccccagctgc tggacgacca cttcggcccc 240 cacggcctgg tgttccgccg caccttcgcc atccgcagct acgaggtggg ccccgaccgc 300 tccaccagca tcgtggccgt gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag 360 tccgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420 atctgggtgg tgaagcgcac ccacgtggcc gtggagcgct accccgcctg gggcgacacc 480 gtggaggtgg agtgctgggt gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg 540 gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgatgatg 600 aacacccgca cccgccgcct gagcaagatc cccgaggagg tgcgcggcga gatcggcccc 660 gccttcatcg acaacgtggc cgtgaaggac gaggagatca agaagcccca gaagctgaac 720 gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacatc 780 aaccagcacg tgaacaacat caagtacgtg gactggatcc tggagaccgt gcccgacagc 840 atcttcgaga gccaccacat ctcctccttc accatcgagt accgccgcga gtgcaccatg 900 gacagcgtgc tgcagtccct gaccaccgtg agcggcggct cctccgaggc cggcctggtg 960 tgcgagcacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg 1020 cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gtccagcgtg 1080 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140 gacgacaagt gatga 1155 <210> 87 <211> 1893 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 87 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 360 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 420 cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 480 tccgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa ccccccccag 540 ctgctggacg accacttcgg cccccacggc ctggtgttcc gccgcacctt cgccatccgc 600 agctacgagg tgggccccga ccgctccacc agcatcgtgg ccgtgatgaa ccacctgcag 660 gaggccgccc tgaaccacgc caagtccgtg ggcatcctgg gcgacggctt cggcaccacc 720 ctggagatgt ccaagcgcga cctgatctgg gtggtgaagc gcacccacgt ggccgtggag 780 cgctaccccg cctggggcga caccgtggag gtggagtgct gggtgggcgc ctccggcaac 840 aacggccgcc gccacgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 900 tgcacctccc tgagcgtgat gatgaacacc cgcacccgcc gcctgagcaa gatccccgag 960 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgaggag 1020 atcaagaagc cccagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 1080 ccccgctgga acgacctgga catcaaccag cacgtgaaca acatcaagta cgtggactgg 1140 atcctggaga ccgtgcccga cagcatcttc gagagccacc acatctcctc cttcaccatc 1200 gagtaccgcc gcgagtgcac catggacagc gtgctgcagt ccctgaccac cgtgagcggc 1260 ggctcctccg aggccggcct ggtgtgcgag cacctgctgc agctggaggg cggcagcgag 1320 gtgctgcgcg ccaagaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 1380 gtgatccccg ccgagtccag cgtgatggac tacaaggacc acgacggcga ctacaaggac 1440 cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 1500 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 1560 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 1620 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 1680 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 1740 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 1800 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 1860 aagtagtggg atgggaacac aaatggaaag ctt 1893 <210> 88 <211> 1887 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 88 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaacac tagtatggct tccgcggcat tcaccatgtc ggcgtgcccc 360 gcgatgactg gcagggcccc tggggcacgt cgctccggac ggccagtcgc cacccgcctg 420 agggggcgcg cccccgactg gtccatgctg ttcgccgtga tcaccaccat cttctccgcc 480 gccgagaagc agtggaccaa cctggagtgg aagcccaagc ccaacccccc ccagctgctg 540 gacgaccact tcggccccca cggcctggtg ttccgccgca ccttcgccat ccgcagctac 600 gaggtgggcc ccgaccgctc caccagcatc gtggccgtga tgaaccacct gcaggaggcc 660 gccctgaacc acgccaagtc cgtgggcatc ctgggcgacg gcttcggcac caccctggag 720 atgtccaagc gcgacctgat ctgggtggtg aagcgcaccc acgtggccgt ggagcgctac 780 cccgcctggg gcgacaccgt ggaggtggag tgctgggtgg gcgcctccgg caacaacggc 840 cgccgccacg acttcctggt gcgcgactgc aagaccggcg agatcctgac ccgctgcacc 900 tccctgagcg tgatgatgaa cacccgcacc cgccgcctga gcaagatccc cgaggaggtg 960 cgcggcgaga tcggccccgc cttcatcgac aacgtggccg tgaaggacga ggagatcaag 1020 aagccccaga agctgaacga ctccaccgcc gactacatcc agggcggcct gaccccccgc 1080 tggaacgacc tggacatcaa ccagcacgtg aacaacatca agtacgtgga ctggatcctg 1140 gagaccgtgc ccgacagcat cttcgagagc caccacatct cctccttcac catcgagtac 1200 cgccgcgagt gcaccatgga cagcgtgctg cagtccctga ccaccgtgag cggcggctcc 1260 tccgaggccg gcctggtgtg cgagcacctg ctgcagctgg agggcggcag cgaggtgctg 1320 cgcgccaaga ccgagtggcg ccccaagctg accgactcct tccgcggcat cagcgtgatc 1380 cccgccgagt ccagcgtgat ggactacaag gaccacgacg gcgactacaa ggaccacgac 1440 atcgactaca aggacgacga cgacaagtga tgactcgagg cagcagcagc tcggatagta 1500 tcgacacact ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga 1560 cctgtgaata tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac 1620 gcgcttttgc gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct 1680 tccctcgttt catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc 1740 tcagcgctgc tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct 1800 gtattctcct ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag 1860 tgggatggga acacaaatgg aaagctt 1887 <210> 89 <211> 3631 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 89 gaattccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgccact agtatgctgc tgcaggcctt cctgttcctg ctggccggct tcgccgccaa 1380 gatcagcgcc tccatgacga acgagacgtc cgaccgcccc ctggtgcact tcacccccaa 1440 caagggctgg gggcgcgcca gccaccacgt gtacaagcgc ctgacccaga gcaccaacac 1500 caagtccccc agcgtgaacc agccctaccg caccggcttc cacttccagc cccccaagaa 1560 ctggatgaac gaccccaacg gccccatgat ctacaagggc atctaccacc tgttctacca 1620 gtggaacccc aagggcgccg tgtggggcaa catcgtgtgg gcccactcca ccagcaccga 1680 cctgatcaac tgggaccccc acccccccgc catcttcccc agcgccccct tcgacatcaa 1740 cggctgctgg tccggcagcg ccaccatcct gcccaacggc aagcccgtga tcctgtacac 1800 cggcatcgac cccaagaacc agcaggtgca gaacatcgcc gagcccaaga acctgtccga 1860 cccctacctg cgcgagtgga agaagagccc cctgaacccc ctgatggccc ccgacgccgt 1920 gaacggcatc aacgcctcca gcttccgcga ccccaccacc gcctggctgg gccaggacaa 1980 gaagtggcgc gtgatcatcg gctccaagat ccaccgccgc ggcctggcca tcacctacac 2040 cagcaaggac ttcctgaagt gggagaagtc ccccgagccc ctgcactacg acgacggcag 2100 cggcatgtgg gagtgccccg acttcttccc cgtgacccgc ttcggcagca acggcgtgga 2160 gacctccagc ttcggcgagc ccaacgagat cctgaagcac gtgctgaaga tctccctgga 2220 cgacaccaag cacgactact acaccatcgg cacctacgac cgcgtgaagg acaagttcgt 2280 gcccgacaac ggcttcaaga tggacggcac cgccccccgc tacgactacg gcaagtacta 2340 cgccagcaag accttcttcg actccgccaa gaaccgccgc atcctgtggg gctggaccaa 2400 cgagtcctcc agcgtggagg acgacgtgga gaagggctgg tccggcatcc agaccatccc 2460 ccgcaagatc tggctggacc gcagcggcaa gcagctgatc cagtggcccg tgcgcgaggt 2520 ggagcgcctg cgcaccaagc aggtgaagaa cctgcgcaac aaggtgctga agtccggcag 2580 ccgcctggag gtgtacggcg tgaccgccgc ccaggccgac gtggaggtgc tgttcaaggt 2640 gcgcgacctg gagaaggccg acgtgatcga gccctcctgg accgaccccc agctgatctg 2700 cagcaagatg aacgtgtccg tgaagtccgg cctgggcccc ttcggcctga tggtgctggc 2760 cagcaagaac ctggaggagt acacctccgt gtacttccgc atcttcaagg cccgccagaa 2820 cagcaacaag tacgtggtgc tgatgtgctc cgaccagtcc cgcagctccc tgaaggagga 2880 caacgacaag accacctacg gcgccttcgt ggacatcaac ccccaccagc ccctgagcct 2940 gcgcgccctg atcgaccact ccgtggtgga gagcttcggc ggcaagggcc gcgcctgcat 3000 cacctcccgc gtgtacccca agctggccat cggcaagtcc agccacctgt tcgccttcaa 3060 ctacggctac cagtccgtgg acgtgctgaa cctgaacgcc tggagcatga actccgccca 3120 gatcagcatg gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa 3180 ggacgacgac gacaagtgat taattaaccg gctcgaggca gcagcagctc ggatagtatc 3240 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 3300 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 3360 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 3420 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 3480 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 3540 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 3600 ggatgggaac acaaatggaa agcttgagct c 3631 <210> 90 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 90 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala Ser Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His 20 25 30 Phe Thr Pro Asn Lys Gly Trp Gly Arg Ala Ser His His Val Tyr Lys 35 40 45 Arg Leu Thr Gln Ser Thr Asn Thr Lys Ser Pro Ser Val Asn Gln Pro 50 55 60 Tyr Arg Thr Gly Phe His Phe Gln Pro Pro Lys Asn Trp Met Asn Asp 65 70 75 80 Pro Asn Gly Pro Met Ile Tyr Lys Gly Ile Tyr His Leu Phe Tyr Gln 85 90 95 Trp Asn Pro Lys Gly Ala Val Trp Gly Asn Ile Val Trp Ala His Ser 100 105 110 Thr Ser Thr Asp Leu Ile Asn Trp Asp Pro His Pro Pro Ala Ile Phe 115 120 125 Pro Ser Ala Pro Phe Asp Ile Asn Gly Cys Trp Ser Gly Ser Ala Thr 130 135 140 Ile Leu Pro Asn Gly Lys Pro Val Ile Leu Tyr Thr Gly Ile Asp Pro 145 150 155 160 Lys Asn Gln Gln Val Gln Asn Ile Ala Glu Pro Lys Asn Leu Ser Asp 165 170 175 Pro Tyr Leu Arg Glu Trp Lys Lys Ser Pro Leu Asn Pro Leu Met Ala 180 185 190 Pro Asp Ala Val Asn Gly Ile Asn Ala Ser Ser Phe Arg Asp Pro Thr 195 200 205 Thr Ala Trp Leu Gly Gln Asp Lys Lys Trp Arg Val Ile Ile Gly Ser 210 215 220 Lys Ile His Arg Arg Gly Leu Ala Ile Thr Tyr Thr Ser Lys Asp Phe 225 230 235 240 Leu Lys Trp Glu Lys Ser Pro Glu Pro Leu His Tyr Asp Asp Gly Ser 245 250 255 Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Thr Arg Phe Gly Ser 260 265 270 Asn Gly Val Glu Thr Ser Ser Phe Gly Glu Pro Asn Glu Ile Leu Lys 275 280 285 His Val Leu Lys Ile Ser Leu Asp Asp Thr Lys His Asp Tyr Tyr Thr 290 295 300 Ile Gly Thr Tyr Asp Arg Val Lys Asp Lys Phe Val Pro Asp Asn Gly 305 310 315 320 Phe Lys Met Asp Gly Thr Ala Pro Arg Tyr Asp Tyr Gly Lys Tyr Tyr 325 330 335 Ala Ser Lys Thr Phe Phe Asp Ser Ala Lys Asn Arg Arg Ile Leu Trp 340 345 350 Gly Trp Thr Asn Glu Ser Ser Ser Val Glu Asp Asp Val Glu Lys Gly 355 360 365 Trp Ser Gly Ile Gln Thr Ile Pro Arg Lys Ile Trp Leu Asp Arg Ser 370 375 380 Gly Lys Gln Leu Ile Gln Trp Pro Val Arg Glu Val Glu Arg Leu Arg 385 390 395 400 Thr Lys Gln Val Lys Asn Leu Arg Asn Lys Val Leu Lys Ser Gly Ser 405 410 415 Arg Leu Glu Val Tyr Gly Val Thr Ala Ala Gln Ala Asp Val Glu Val 420 425 430 Leu Phe Lys Val Arg Asp Leu Glu Lys Ala Asp Val Ile Glu Pro Ser 435 440 445 Trp Thr Asp Pro Gln Leu Ile Cys Ser Lys Met Asn Val Ser Val Lys 450 455 460 Ser Gly Leu Gly Pro Phe Gly Leu Met Val Leu Ala Ser Lys Asn Leu 465 470 475 480 Glu Glu Tyr Thr Ser Val Tyr Phe Arg Ile Phe Lys Ala Arg Gln Asn 485 490 495 Ser Asn Lys Tyr Val Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser 500 505 510 Leu Lys Glu Asp Asn Asp Lys Thr Thr Tyr Gly Ala Phe Val Asp Ile 515 520 525 Asn Pro His Gln Pro Leu Ser Leu Arg Ala Leu Ile Asp His Ser Val 530 535 540 Val Glu Ser Phe Gly Gly Lys Gly Arg Ala Cys Ile Thr Ser Arg Val 545 550 555 560 Tyr Pro Lys Leu Ala Ile Gly Lys Ser Ser His Leu Phe Ala Phe Asn 565 570 575 Tyr Gly Tyr Gln Ser Val Asp Val Leu Asn Leu Asn Ala Trp Ser Met 580 585 590 Asn Ser Ala Gln Ile Ser Met Asp Tyr Lys Asp His Asp Gly Asp Tyr 595 600 605 Lys Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys 610 615 620 <210> 91 <211> 997 <212> DNA <213> Prototheca moriformis <400> 91 cctgtcgatc gaagagaagg agacatgtgt acattattgg tgtgagggcg ctgaatcggc 60 cattttttaa aatgatcacg ctcatgccaa tagacgcggc acataacgac gttcaaaccc 120 ccgccaaagc cgcggacaac cccatccctc cacacccccc acacaaagaa cccgccaccg 180 cttaccttgc ccacgaggta ggcctttcgt tgcgcaaaac cggcctcggt gatgaatgca 240 tgcccgttcc tgacgagcgc tgcccgggcc aacacgctct tttgctgcgt ctcctcaggc 300 ttgggggcct ccttgggctt gggtgccgcc atgatctgcg cgcatcagag aaacgttgct 360 ggtaaaaagg agcgcccggc tgcgcaatat atatataggc atgccaacac agcccaacct 420 cactcgggag cccgtcccac cacccccaag tcgcgtgcct tgacggcata ctgctgcaga 480 agcttcatga gaatgatgcc gaacaagagg ggcacgagga cccaatcccg gacatccttg 540 tcgataatga tctcgtgagt ccccatcgtc cgcccgacgc tccggggagc ccgccgatgc 600 tcaagacgag agggccctcg accaggaggg gctggcccgg gcgggcactg gcgtcgaagg 660 tgcgcccgtc gttcgcctgc agtcctatgc cacaaaacaa gtcttctgac ggggtgcgtt 720 tgctcccgtg cgggcaggca acagaggtat tcaccctggt catggggaga tcggcgatcg 780 agctgggata agagatactt ctggcaagca atgacaactt gtcaggaccg gaccgtgcca 840 tatatttctc acctagcgcc gcaaaaccta acaatttggg agtcactgtg ccactgagtt 900 cgactggtag ctgaatggag tcgctgctcc actaaacgaa ttgtcagcac cgccagccgg 960 ccgaggaccc gagtcatagc gagggtagta gcgcgcc 997 <210> 92 <211> 753 <212> DNA <213> Prototheca moriformis <400> 92 actaattgca atcgtgcagt aatcatcgat atggtcacaa gtagatcccc tactgacacc 60 ctctcgtaca tgtaggcaat gtcatcggcg ccgtcctgct gaccgatgcc gacgtagcag 120 agcagacccg ggccgatctg ggatacgagc cggccctcca cctgcgctcg aggtggaatc 180 aagtaaataa ccaatacact tttcgacacc acacagagtt gcacggacgg tggcgtacct 240 ctacgctcgc gctcttcacg cgctggacga ccgcacgcat gagcccgggt ggcttggtct 300 gggctgcaaa aatgcacaac aaacaagtat cagacgctca tggatgcaca cgcgctccca 360 agcacgctca gactaaatat tacagtagct cgtatctgat aagatatcga gacataccgc 420 tcaactcacc cgcaaactgc gccccgccag gtgatgcgca cagggcccca ccatgcgatc 480 catcgcatcg ctcctcgagg gcgctatcac gtggccggag agcgttcaca gcgtacgcca 540 ctgtatctgg gcggtatgcg gtccgtcaac atggagacag atacccgcac caccaccttg 600 caagctcttc catattggaa gtagaaaatt gtaattgtat catcgcacga ggggccaact 660 tgccgtcggc gagctgggcg acgaacacca cctggacgtt gtcgagactc gctcgtgccg 720 tgcgccgggc cgctgggtat ccagaccgtc gcc 753 <210> 93 <211> 1122 <212> DNA <213> Prototheca moriformis <400> 93 caacgacaac cagcaggcaa ctcggtcagc gacccaacac gcgagtcaaa ttgttgcgtg 60 ttcttgcctt gtctatttac tgtgatagca agactgtcgg tcagtcaata ccgcggtgcg 120 cacgtcgggg tgccaagcct agcagagcac gggacggctg gtgctgtgcg ccagctcagc 180 tcgcttcgcg accaattgta ggaccggcaa agtcaccaaa acatgccagc ggtgcgattc 240 aattggtcat gagctctaca aaattgtttt gtgcgtcgcg caggtatcca acggcgcggc 300 agagaaagtt tgacagctct cgatttcatc tcggaaaaat ggggagaatt tatgacacac 360 aagtgcgcag gcggcccagg cggccagcat attctggcgt gacctgggcc gcccacaaaa 420 tgcttggatg cactctaaaa taattatatt tgccatgaac aagggaagag ttaccgcacc 480 cagccctaga cttgggcgcc cgagcaaggt tacgtcaagc caccttcgcc catcgcccaa 540 ctccgtattc cccgacagcc gcacgtggcc ctcgccggaa tgaaccctga atcggcatca 600 cgccacgcgt tcgccaatcg ttccgctctc tggcttcatc ggcctgcgcc ttcacgtcgt 660 ggtcacgaca gtgcattcat acttccattt gcacctcggc acacactttt acgcatcgcc 720 tacccttgct gcggcagtct agggtcactt tgcagccatg ggacagtgct acaccaccgt 780 cggtgcgcaa agctatttca agtgaaccgt gggcggaaaa aaggaatgta cactgtctca 840 accgactcct acaattgttt accatgcaga tcagagctcg acggccatca tcgagcaggt 900 gtggggcctt ggtggcgcgg cgcggggccc cagggcgtcg caggcattga tggcactctg 960 agactttcgc acgcgcatga gggaccccat caagagaaga gtgtgtcttt atgtccccat 1020 tcatgatgat gtatcttgtg attgtcgcag tttggcaagt ttaaccggat cgccgctcca 1080 ggtgtggcgt ggcggatttt tctaggggtg cttgagcagt cg 1122 <210> 94 <211> 574 <212> DNA <213> Prototheca moriformis <400> 94 ggcccagggc cctgcggatg gcccacacca gatctagcct ctcttatgcc atgcccgcct 60 cgctgcccgt cgtatccccc cgccgatccg cgcgtagggg accgcggcct gacccacgcc 120 acgaaagagc tttgctcctc aatttctcgc caacagaacc gtatcaaacg ctcaacgcct 180 atcccgaaca atccgtattc acaccaaatc gagtataccg gactggtttg cctagtcttg 240 aaggaaatga tcccgtccat gctcggaagg gggagcgggc ggaggatcct actcatctct 300 gaaatgggat tggtccgaag atgggttggg caagcacgtg ccaaacccca gcgagttgct 360 gacgagcagg ctcatccaat cccccggcga atcctccctc acgccccgca tgcatacaag 420 tccctcccac acgccccctc ccatccattt tcgcctggtc cgaacgcgag cggcgtcgag 480 gcggaccact tgctccgcag cgccgtctgg gtctccaccc cacagcggct ttgctgccag 540 aggcaccccc cttgccccac ctcctcttgc agcc 574 <210> 95 <211> 1096 <212> DNA <213> Prototheca moriformis <400> 95 ccaggcaggc ggtagggttg ccgattgctt gagcgaattg gaagatataa ttttttgtgg 60 tgtccctgga cgctgtttgt ggcgctcctt tttggagaag attgcgtggg ggagctttcc 120 atgtaccacg cttccttctg aaaggattct ggccgagtcc tgatgagccc aaagaaaaca 180 cctgcctttc agtgctggca ctctgaaaac gtcaacagat gattatacat gtcacaaaag 240 gcagccgatt aggaacggga gctctggccg ttcgtttggc tgcctgggct gattgaagtg 300 atccaccctg ttcgaatgaa ggcggtcgag tcgaattatc gaccggagct gtcgggaagg 360 cgtccggggc agagtgaggt gctgcggcct ggttgtcgtt caaaaagacc ccggtagccc 420 aacaatcacg aacgaaagga atataattgc ttgcatacta tacattcagt ttctatgtgg 480 cgggtagaca agtctcatgg gcttctaaag gctgtccctt gaaggctact tataaaaact 540 tgctgcgcca tggcacggat cgcgcttgcg caggctgcaa ccctgcgcgc aaggtcaaat 600 acacagcaaa agatactaac agaatttcta aaaacattta aatatttgtt tcgaccagcc 660 aattgtggtc gtaggcacgc aaaagacttt gttttgcgcc caccgagcat ccacgctggc 720 agtcaagcca gtccgatgtg cattgcgtgg cagcatcgag gagcatcaaa aacctcgtgc 780 acgcttttct gtcaatcatc atcaaccact ccaccatgta tacccgatgc atcgcggtgc 840 gcagcgcgcc acgcgtccca gacccgccca aaaacccagc agcggcgaaa gcaaatcttc 900 acttgcccga aaccccgagc agcggcattc acacgtgggc gaaaacccca cttgccctaa 960 caggcgtatg tctgctgtca cgatgcctga caacggtatt atagatatac actgattaat 1020 gtttgagtgt gtgcgagtcg cgaatcagga atgaattgct agtaggcact ccgaccgggc 1080 gggggccgag ggacca 1096 <210> 96 <211> 1075 <212> DNA <213> Prototheca moriformis <400> 96 ggccgacagg acgcgcgtca aaggtgctgg gcgtgtatgc cctggtcggc aggtcgttgc 60 tgttgctgcg ctcgtggttc cgcaaccctg attttggcgt cttattctgg cgtggcaagc 120 gctgacgccc gcgagccggg ccggcggcga tgcggtgtct cacggctgcc gagctccaag 180 ggaggcaaga gcgcccggat cagctgaagg gctttacacg caaggtacag ccgctcctgc 240 aaggctgcgt ggtggacttg aacctgtagg tcctctgctg aagttcctcc actacctcac 300 caggcccagc agaccaaagc acaggctttt caggtccgtg tcatccactc taaaacactc 360 gactacgacc tactgatggc cctagattct tcatcaacaa tgcctgagac acttgctcag 420 aattgaaact ccctgaaggg accaccagag gccctgagtt gttccttccc cccgtggcga 480 gctgccagcc aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca 540 ggtcatggga ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc 600 taatcagcta tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt 660 gatccttcgt gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc 720 aactcgcgcg agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat 780 gcgcggcgcc tttcttgcga taatttatgc aatggactgc tctgcaaatt tctgggtctg 840 tcgccaaccc taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta 900 ccgactaccc taatatcagc ccggctgcct gacgccagcg tccacttttg cgtacacatt 960 ccattcgtgc ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt 1020 tcccgacctc cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1075 <210> 97 <211> 772 <212> DNA <213> Prototheca moriformis <400> 97 tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agagctcgac 60 tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 120 tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 180 gccagccagg ctgtacctgt gatcggggct ggcgggaaaa caggcttcgt gtgctcaggt 240 tatgggaggt gcaggacagc tcattaaacg ccaacaatcg cacaattcat ggcaagctaa 300 tcagttattt cccattaacg agctataatt gtcccaaaat tctggtctac cgggggtgat 360 ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc acatgcggtc gccgcgcaac 420 gcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 480 tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 540 ccaaccctag gatcagcggt gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 600 actgccctag tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 660 ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgatccc 720 caacctcctt attgttctgt cgacagagtg ggcccagagg ccggtcgcag cc 772 <210> 98 <211> 991 <212> DNA <213> Protoheca moriformis <400> 98 cgaaggggtc tgcatcgatt cgcgcggtct ggaggccagc gtgactgctc gcgaaaatgc 60 tctgccgtgt cgggctctgg ctggggcggc cagagatctc accgtgccac acgcaactgc 120 cgcactctgt gcccgccacc tggcgcgcac atgcgacctc ttccccgtca taccctctcc 180 tcatgtgatc tttccacacg agtgacgcag gtgcgcggag tggagggaat caggacgttt 240 tcaaggtacc tgctcgagcc gtaccaacag ctgccgcccg gcaaggaaga gatcgaggca 300 gagattgccc ggctggaggc ccggataacg gagctcaaga gcaagctgtc cgagtgagac 360 cgcccaggtg cacgtgtcga ctcgctatga catgtactcg acacaacatg aggaattcat 420 cgaatttgta ggaagcgggc attggtacgg gagtgggaaa gcgaaaaaac ctccctccgg 480 cagtgccatc tgccggagtc gaacgttgat agggttctcg tgacagggtg tgacctctca 540 gccttgcatc aattaaacgc tatagacatt atcagtaacc gtgaatcccg cattggatgc 600 cacccgcgcg accattgggg acctgcatta cagatctagg tgagatgaca gcgaggcaac 660 ttcggcccgc ggcccagctt gcggcgcacc aatattggtc acgggaagcc acacaccgac 720 cataaatgaa tacttgtaag ctatgtcaac cgatcaatgg cgtcgaaagt gtgccacgag 780 gatccatctg gcggggcggc gtggcgcaca agcgcagtcg caatttctcg gacccatctg 840 acctaggccc agcgccgcgg gagaaatccc cggcgggtcc tccacgcagt aaccctaatg 900 agtatcgagc gccgaccatt tacaccatcg cccccgaaat ccttccgaca ttattattat 960 cttttagatc ttggaacaga ctctgccaac c 991 <210> 99 <211> 1347 <212> DNA <213> Prototheca moriformis <400> 99 agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60 cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120 gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180 ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240 cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300 cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360 tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420 gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480 attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540 tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600 gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660 catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720 tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780 tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840 caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900 atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960 attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020 agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080 gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140 acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200 ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260 cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320 attttccagt cgtcagcgaa atcaagt 1347 <210> 100 <211> 1180 <212> DNA <213> Prototheca moriformis <400> 100 gatggtgggg tgtctgcctt gggctgggtg atggaggctg gtggtgcgcg ggtttcctga 60 tgcattctat ctacgcagtg tcatggtgtc cattccacac accagtacac ccttacacta 120 aggatccatc cctccttccc tcttcaggac tacatggacc ccacgagcta ccgaccgggc 180 tttctcaaaa acgtcaaggt catgtttgac atgcgggacg tggtggacga cgtgcaaggt 240 gcgtccggag tgcgcgcaaa tgagcaagtc gggcaatgtg tcggggtggg caccggggct 300 ggagatccgc gatccccgag aaaacgccgt accacccccc gcgctattcc ctcgattgcg 360 cgcagatgtg gtgaccgaca cgggggacaa cctggcggac atggggcgcc ggacctggaa 420 gcacgccaag tcgcacacgg ggaggctcgt gcagtccccc ccatcgtacc tcaagggtct 480 ctttggtcgc gatccaaagt acgctggtgg catggcatgc ccgaaatgaa catcatgtgt 540 gatctccgat tgccaatggc cacctccacg gaccaccttg caggcggaag cgcaatccag 600 ggcccgagcc tgacgaggac ggagactcct cgtccagcgc ggggtccccg acccgacgca 660 gcagccgacc cctgctaacc cggcaacgat cggaccagca accttgctgt agttccgatc 720 cgtgatgacg ggcattgccg ccgctcgatc cgctttgatg actgtctatt atttgcgcgg 780 agccccctcg gaaccctacc ccgctcttgc aagccccttg catcggagat cctcgtgcgc 840 ccgccatgac cccactggat tgcccaacat ccttctttat cgtgtaaaat gtgattcctc 900 ggctgcaatc gactggcctt cgcttctggc cccaagaggg ctcgaacgtg cggcagcgag 960 ggcgctgaca cacccaagcc ctagggcttt caacgtcggc tgccaggccg gataggggga 1020 tcgcctcctt tccaccaccc acctacgagg gattcgagtc ggcttccagc tcagctattc 1080 ggccgcgccc ccggccctgc agacgtcctc cagtttccga acaggtcgct ctcagaacac 1140 ctgccgcggc tgcgatacgg caggctctca aagcgtcgac 1180 <210> 101 <211> 1263 <212> DNA <213> Prototheca moriformis <400> 101 cgcgtggagc ggtgcgtgcg gatgccgcgc gcctgccaag gccttttgta tgcctggcct 60 gggaagtttc ctgactgaag catcttcaag atgctctctc acgaccagcg acaccaacac 120 cgtcactttt tgcccctcct gccgcaggtg ccactttcta ctttgacgtc ttctccaggc 180 ggtacattgc gggactgagc gccaattcgg ccaagaacag cgctgtcgac ttgaggaggc 240 aggggtccgt cgactctgcc gagtgacacg ccttcgaccc gactgtacta cggcctgctg 300 aagagtgggt ctcgccggcc ggcgtgaccg gccctgtgcc cacaatcgac catctattcg 360 ctccttgtca tctggcgccg tcaattgccc gcgacttgac ggcaactggc tcgatcgagt 420 cgtattgaaa aagcacgttt tgtcctacag ggccgcggtc cgttaccaac gtggttctcg 480 ttaggttttc gtcgggcggt ggtgcgcgaa ctgtccgatg ccatcccggc aaaccccagc 540 aaggtcgcca gtctggttct gacgcaatag agtgcgtttt gggccagtct aaaaattcgt 600 ctggcatgac gtggctccac atcgtacccg gagcctgcct tggtaatgtg aggcaccggt 660 gccaactcca ttatggcagg catcgagcgc gcaggtgagt acatgacctt ccgtgaattg 720 ggaaggcgag cttgtgtaac gcctgcgatc gtgccagtga ggcatcgtaa actcaaaata 780 ttttgtagaa agtgtctgat gcctggtgag gctgcgtagg gcaagggcaa gcccttggca 840 gatgggtaat gggtccggac ctcacaacag caaccccgcg tcccccttag ggcccctgag 900 gctcgatggc agggccagcg agcccgcggc caaagggcgc catcccacgg tcgcccaacg 960 actccacggg tcctatacct catcttgaat ggcactaaaa actatagaat atcgggcact 1020 ggtgggcgtc tggggtacag ctggccgagc gcagtggcaa accctaggtc ccgcctcaag 1080 ggcgattccc gggtcaatga cacgcaagca agatcacatg gcgcggtccg cctcgcggct 1140 ccacacccag gccctagttt cgcaacccat aaatatcgcc ccgataccat cataagccag 1200 caaataattt tttatcagag ttccaaacct cctcagctgt gggaaaccag cccactctga 1260 acg 1263 <210> 102 <211> 1400 <212> DNA <213> Prototheca moriformis <400> 102 ccgagcagtt catggccaag tacaaggact agagaccgga ggtcggtagg ctgaatggag 60 ctggcgtcgt cgtgcgcgac gtgcacgcga tgcgatacta cgaccccaca aacgcatgcc 120 tcccatcttg atgcctttcc ggccatttat actatttctc atttcgctgt aacatcttga 180 ataatagaat tgccctgtgt caagtggatt ccaagaaata ttctgtccca acaaaacaac 240 ccaacctgaa aacaacctca aataccacca gccctgccca cctgcccagt acacttttcc 300 aataccatct ccctaccttc acgcgcaagc ggcacccatg cgcgaccagg ctcgaaagga 360 tttcacgact caggacgagc gagtggcggc gcgaccgcct gcctgttcgt cacgtgccgt 420 acgtcggcga ccgctagagc tttgcctggc aacccccggc ttcgtcaacc cggccagcca 480 ggatctcgac cactctaccg cgaaatcgcc tcaagaagtc gccaaaagtg ccgtacacca 540 tgcttcgcag cgctgttcaa acttgatgcc aatcttgaca atcaggttgc tcgttggctg 600 cgtccacatc ggccgtgatt gcagcaggcg gggatcggac acggaggacg cggcgtcacg 660 ccgcgaacgc agcccgtaac tctacatcaa cgcgatatgt tgcgtaatcc cgcccggctg 720 cgcattgtga caacccattc gcgatggatg gtcggaaaat ggtgtgccaa ctgccctgag 780 ggactctctc gcgaaacggg cacgtccctg tatccgaaac tgtggcatgg ccttgtcgac 840 cacgcaagca cgtggaccct aacaccacga aaataagtaa aaaaggttga catcctctac 900 gagcgaattg tttgctcgac ccttcatcgc acactgtcat tataatgcat ctagctcggc 960 gacaagttta aaaaaggcag gctgcattat tccattttgc cgtggcggca tgggtgccca 1020 ttttatgagg tttgggctct tgggcagcga ccgagccagg ttgagtccct ctcgcccgtc 1080 gacaacgttc caaagcccat aagtggctaa taaacaactt gatggtacct gtacactgcc 1140 agttccttct tccccggccg aggtttacac gtgatggcca tggcttcgcg tttcaggctg 1200 acttcccatt ccgactttcc agagggtccg cggacgccgg gggttggctg cgtgaggccc 1260 accccttgtt ccccgcgtcc cgacaaacac aattgcgtta cataaggggg aagccgcccc 1320 ccgttcagag tgcaaacatc tttcattata tttttcagtc gtcagcgaaa tcaagtatgt 1380 cgctgacagg catgaaggcc 1400 <210> 103 <211> 3681 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 103 gccctttgtc atcgttggca tgctttttgc gtatgtacca tatgttgaat gtataatacg 60 aacggttgac cgtctgagat gcgagctttg ggtcttgtca aatgcgtggc cgcacggctc 120 cctcgcaccc agccccgagg cgtcgcgcac ctggcgagga gcagacccac gccaagaaag 180 tctagtccag catgtaacaa catcaggcaa tgtgacgttt tcggttcccg atttctctgc 240 cgctctttga cggcaggcac gggcgagcaa ccggcggcgc tcgcgtcagg cacgatggat 300 gcggcgctgc ccacctgtca atgtacccca ccagtctgtc gatcgctaca agcaaccttg 360 tgctccacat tcccacttgc agacagtcta gtcgattttg ccaagctgga tgtgaggatt 420 ggccatatct tggaggccaa gattcacccg gatgctgatg ggtacgtacg cgagccaggc 480 aggcagctgc gttgactttc tgattggcac aaagctttgg ctactctcaa taccaaccac 540 gtgccccttc tgcacacctg cttccttctg atgaccactc gccacgcatg tcgcagtctg 600 tacgtcgagc agatcgacct cggcgaggag gggggccctc gcaccatcgt gagtggcctg 660 gtccggcacg tgaccctgga ggaccttgtc ggccggcggg tggtggtgct ggccaacctc 720 aagcctcgga gcatgcgcgg ggtcaaatcg gctgggatgc tgctctgcgc cgccaacgcg 780 gatcacaccg cggtggagcc gctgcgggtc ccggacgccg ccgtgacggg ggagcgggtc 840 tgggcggggg acgaggcact cctgtccacg gagcctgcca cacccaatca ggtaaggaca 900 cgttattggt gcgcatggtg cgaatgcgtg gtctgacctg ctgtgggtat gtgttgtggg 960 attggaaacc gaatgagggc cgttcaggat tgagcccttg gccccaccct gctcatcctc 1020 tcacgcccgc aggtccagaa gaagaaaatc tgggaggcag tacagccgct gctgagagtg 1080 aacgcccagg ggatcgctac tgtggcagga gaggctatgg tgaccagtgc ggggccactg 1140 accgcgccca cgctggttga cgccgcgatt tcctgacgcg agcgactgat tcttgacctt 1200 tgagaagcca ccacagcacc attttcattg ttcatccttg atttcagtac gacttctcac 1260 catttcagta ctgtaggacc cccaaaatag tgtgatcacg ctcgcaaggc acctgtgtga 1320 tcacggggaa gggcgaattc ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg 1380 gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac cccccgaagc 1440 tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc 1500 aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa acacctagat 1560 cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa gggggcgcct 1620 cttcctcttc gtttcagtca caacccgcaa acggcgcgcc atgctgctgc aggccttcct 1680 gttcctgctg gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga 1740 ccgccccctg gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg 1800 gtacgacgag aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt 1860 ctgggggacg cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga 1920 ccagcccatc gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt 1980 ggtggactac aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg 2040 cgtggccatc tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct 2100 ggacggcggc tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac 2160 ccagttccgc gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc 2220 ggccaagtcc caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa 2280 gctggagtcc gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct 2340 gatcgaggtc cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat 2400 caaccccggc gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg 2460 cacccacttc gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta 2520 cgccctgcag accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg 2580 ggcctccaac tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc 2640 cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat 2700 caacctgaag gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc 2760 caccaacacc acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg 2820 caccctggag ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt 2880 gttcgcggac ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat 2940 gggcttcgag gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt 3000 cgtgaaggag aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag 3060 cgagaacgac ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct 3120 gtacttcaac gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc 3180 cctgggctcc gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca 3240 ggtgcgcgag gtcaagtgat taattaactc gaggcagcag cagctcggat agtatcgaca 3300 cactctggac gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg 3360 aatatccctg ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt 3420 ttgcgagttg ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc 3480 gtttcatatc gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg 3540 ctgctcctgc tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc 3600 tcctggtact gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat 3660 gggaacacaa atggaaagct t 3681 <210> 104 <211> 3850 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 104 tttggccccg ctttccagct ccggatctgc tggcgtccgc cgcgagacgt gacatcgcac 60 gtcgccggga gcgccagctt gatcacttgg cagggggccg tgctctacaa ataccaggcc 120 ccgcggcggt cagttcgcac atccaatacc tgccgagcca tcttgcctac actttttatc 180 gactcctcta ctctgttcgc gagagcgctc ggtccaggct tggaattcgc cgaattcagc 240 tcgatcagtc gcttctgcaa ctgatctcgg ccgttcgcag actgcctttt ctcagcttgt 300 caggtagcga gttgttgttt tatatttatt cgatttcatc tgtgttgcat gtcttgttcg 360 tgctgtgcgt tctttctggg ccgcgctgtc gggtcgcatg ggctagctgt actcatgtta 420 gtcatgccgg tccgaccttg ttcgaggaag gccccacact gagcgtgccc tctttctaca 480 ccccttgtgc agaaattaga tagaaagcag aattcctttc ttgcgctatg acacttccag 540 caaaaggtag ggcgggctgc gagacggctt cccggcgctg catgcaacac cgatgatgct 600 tcgacccccc gaagctcctt cggggctgca tgggcgctcc gatgccgctc cagggcgagc 660 gctgtttaaa tagccaggcc cccgattgca aagacattat agcgagctac caaagccata 720 ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 780 gctaaggggg cgcctcttcc tcttcgtttc agtcacaacc cgcaaacggc gcgccatgct 840 gctgcaggcc ttcctgttcc tgctggccgg cttcgccgcc aagatcagcg cctccatgac 900 gaacgagacg tccgaccgcc ccctggtgca cttcaccccc aacaagggct ggatgaacga 960 ccccaacggc ctgtggtacg acgagaagga cgccaagtgg cacctgtact tccagtacaa 1020 cccgaacgac accgtctggg ggacgccctt gttctggggc cacgccacgt ccgacgacct 1080 gaccaactgg gaggaccagc ccatcgccat cgccccgaag cgcaacgact ccggcgcctt 1140 ctccggctcc atggtggtgg actacaacaa cacctccggc ttcttcaacg acaccatcga 1200 cccgcgccag cgctgcgtgg ccatctggac ctacaacacc ccggagtccg aggagcagta 1260 catctcctac agcctggacg gcggctacac cttcaccgag taccagaaga accccgtgct 1320 ggccgccaac tccacccagt tccgcgaccc gaaggtcttc tggtacgagc cctcccagaa 1380 gtggatcatg accgcggcca agtcccagga ctacaagatc gagatctact cctccgacga 1440 cctgaagtcc tggaagctgg agtccgcgtt cgccaacgag ggcttcctcg gctaccagta 1500 cgagtgcccc ggcctgatcg aggtccccac cgagcaggac cccagcaagt cctactgggt 1560 gatgttcatc tccatcaacc ccggcgcccc ggccggcggc tccttcaacc agtacttcgt 1620 cggcagcttc aacggcaccc acttcgaggc cttcgacaac cagtcccgcg tggtggactt 1680 cggcaaggac tactacgccc tgcagacctt cttcaacacc gacccgacct acgggagcgc 1740 cctgggcatc gcgtgggcct ccaactggga gtactccgcc ttcgtgccca ccaacccctg 1800 gcgctcctcc atgtccctcg tgcgcaagtt ctccctcaac accgagtacc aggccaaccc 1860 ggagacggag ctgatcaacc tgaaggccga gccgatcctg aacatcagca acgccggccc 1920 ctggagccgg ttcgccacca acaccacgtt gacgaaggcc aacagctaca acgtcgacct 1980 gtccaacagc accggcaccc tggagttcga gctggtgtac gccgtcaaca ccacccagac 2040 gatctccaag tccgtgttcg cggacctctc cctctggttc aagggcctgg aggaccccga 2100 ggagtacctc cgcatgggct tcgaggtgtc cgcgtcctcc ttcttcctgg accgcgggaa 2160 cagcaaggtg aagttcgtga aggagaaccc ctacttcacc aaccgcatga gcgtgaacaa 2220 ccagcccttc aagagcgaga acgacctgtc ctactacaag gtgtacggct tgctggacca 2280 gaacatcctg gagctgtact tcaacgacgg cgacgtcgtg tccaccaaca cctacttcat 2340 gaccaccggg aacgccctgg gctccgtgaa catgacgacg ggggtggaca acctgttcta 2400 catcgacaag ttccaggtgc gcgaggtcaa gtgattaatt aactcgaggc agcagcagct 2460 cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2520 ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2580 tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2640 gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2700 tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2760 gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2820 gggaagtagt gggatgggaa cacaaatgga ccgacacgcc cccggcccag gtccagttct 2880 cctgggtctt ccagaggccc gtcgccatgt aaagtggcag agattggcgc ctgattcgat 2940 ttggatccaa ggatctccaa tcggtgatgg ggactgagtg cccaactacc acccttgcac 3000 tatcgtcctc gcactattta ttcccacctt ctgctcgccc tgccgggcga ttgcgggcgt 3060 ttctgccctt gacgtatcaa tttcgcccct gctggcgcga ggattcttca ttctaataag 3120 aactcactcc cgccagctct gtacttttcc tgcggggccc ctgcatggct tgttcccaat 3180 gcttgctcga tcgacggcgc ccattgccca cggcgctgcc gcatccatgt gaagaaacac 3240 ggaagagtgc gaagactgga agtgaattaa gagtataaga agaggtacca agggattctc 3300 aggtgctctt aggaacggct tttccttcgc caagagaaac tgctactgct cgtgtcgcca 3360 cggtggtcaa gccgccccat ctgcgatcca ccaggcccat ccgcggactc gcgatcagcc 3420 tgctggatcc ggactgccga cctgaccgct cgcatccacc attacaaccc tccaattgga 3480 caccactccc acgtcctaaa gttcaccatg caagctgatc gatcgcattc gccgatgcac 3540 tcgcctgcca cagaggtgtg cgcttcggac tagcgtgcag gcgccccgag gccaccagca 3600 tgcaccgatg gaagcgggca cggccgctgc tccaggtcgc tggctcgctc agacccatag 3660 caacctccgc tgcgtcccta aatgtcacac agagcgtctt tgatgggtac ggatgggaga 3720 gaatctgatt gggcattgct ggtgcagtgc aggaagatgg caagtgcaca gtcagtcatg 3780 ctgtacaaac tggtgcctcg tagtattgac tcgtatagtg catagtatca tgcatggtcg 3840 ttacttgcaa 3850 <210> 105 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 105 tttggccccg ctttccagct ccggatctgc tggcgtccgc cgcgagacgt gacatcgcac 60 gtcgccggga gcgccagctt gatcacttgg cagggggccg tgctctacaa ataccaggcc 120 ccgcggcggt cagttcgcac atccaatacc tgccgagcca tcttgcctac actttttatc 180 gactcctcta ctctgttcgc gagagcgctc ggtccaggct tggaattcgc cgaattcagc 240 tcgatcagtc gcttctgcaa ctgatctcgg ccgttcgcag actgcctttt ctcagcttgt 300 caggtagcga gttgttgttt tatatttatt cgatttcatc tgtgttgcat gtcttgttcg 360 tgctgtgcgt tctttctggg ccgcgctgtc gggtcgcatg ggctagctgt actcatgtta 420 gtcatgccgg tccgaccttg ttcgaggaag gccccacact gagcgtgccc tctttctaca 480 ccccttgtgc agaaattaga tagaaagcaa tgctgctgca ggccttcctg ttcctgctgg 540 ccggcttcgc cgccaagatc agcgcctcca tgacgaacga gacgtccgac cgccccctgg 600 tgcacttcac ccccaacaag ggctggatga acgaccccaa cggcctgtgg tacgacgaga 660 aggacgccaa gtggcacctg tacttccagt acaacccgaa cgacaccgtc tgggggacgc 720 ccttgttctg gggccacgcc acgtccgacg acctgaccaa ctgggaggac cagcccatcg 780 ccatcgcccc gaagcgcaac gactccggcg ccttctccgg ctccatggtg gtggactaca 840 acaacacctc cggcttcttc aacgacacca tcgacccgcg ccagcgctgc gtggccatct 900 ggacctacaa caccccggag tccgaggagc agtacatctc ctacagcctg gacggcggct 960 acaccttcac cgagtaccag aagaaccccg tgctggccgc caactccacc cagttccgcg 1020 acccgaaggt cttctggtac gagccctccc agaagtggat catgaccgcg gccaagtccc 1080 aggactacaa gatcgagatc tactcctccg acgacctgaa gtcctggaag ctggagtccg 1140 cgttcgccaa cgagggcttc ctcggctacc agtacgagtg ccccggcctg atcgaggtcc 1200 ccaccgagca ggaccccagc aagtcctact gggtgatgtt catctccatc aaccccggcg 1260 ccccggccgg cggctccttc aaccagtact tcgtcggcag cttcaacggc acccacttcg 1320 aggccttcga caaccagtcc cgcgtggtgg acttcggcaa ggactactac gccctgcaga 1380 ccttcttcaa caccgacccg acctacggga gcgccctggg catcgcgtgg gcctccaact 1440 gggagtactc cgccttcgtg cccaccaacc cctggcgctc ctccatgtcc ctcgtgcgca 1500 agttctccct caacaccgag taccaggcca acccggagac ggagctgatc aacctgaagg 1560 ccgagccgat cctgaacatc agcaacgccg gcccctggag ccggttcgcc accaacacca 1620 cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa cagcaccggc accctggagt 1680 tcgagctggt gtacgccgtc aacaccaccc agacgatctc caagtccgtg ttcgcggacc 1740 tctccctctg gttcaagggc ctggaggacc ccgaggagta cctccgcatg ggcttcgagg 1800 tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa ggtgaagttc gtgaaggaga 1860 acccctactt caccaaccgc atgagcgtga acaaccagcc cttcaagagc gagaacgacc 1920 tgtcctacta caaggtgtac ggcttgctgg accagaacat cctggagctg tacttcaacg 1980 acggcgacgt cgtgtccacc aacacctact tcatgaccac cgggaacgcc ctgggctccg 2040 tgaacatgac gacgggggtg gacaacctgt tctacatcga caagttccag gtgcgcgagg 2100 tcaagtgacc gacacgcccc cggcccaggt ccagttctcc tgggtcttcc agaggcccgt 2160 cgccatgtaa agtggcagag attggcgcct gattcgattt ggatccaagg atctccaatc 2220 ggtgatgggg actgagtgcc caactaccac ccttgcacta tcgtcctcgc actatttatt 2280 cccaccttct gctcgccctg ccgggcgatt gcgggcgttt ctgcccttga cgtatcaatt 2340 tcgcccctgc tggcgcgagg attcttcatt ctaataagaa ctcactcccg ccagctctgt 2400 acttttcctg cggggcccct gcatggcttg ttcccaatgc ttgctcgatc gacggcgccc 2460 attgcccacg gcgctgccgc atccatgtga agaaacacgg aagagtgcga agactggaag 2520 tgaattaaga gtataagaag aggtaccaag ggattctcag gtgctcttag gaacggcttt 2580 tccttcgcca agagaaactg ctactgctcg tgtcgccacg gtggtcaagc cgccccatct 2640 gcgatccacc aggcccatcc gcggactcgc gatcagcctg ctggatccgg actgccgacc 2700 tgaccgctcg catccaccat tacaaccctc caattggaca ccactcccac gtcctaaagt 2760 tcaccatgca agctgatcga tcgcattcgc cgatgcactc gcctgccaca gaggtgtgcg 2820 cttcggacta gcgtgcaggc gccccgaggc caccagcatg caccgatgga agcgggcacg 2880 gccgctgctc caggtcgctg gctcgctcag acccatagca acctccgctg cgtccctaaa 2940 tgtcacacag agcgtctttg atgggtacgg atgggagaga atctgattgg gcattgctgg 3000 tgcagtgcag gaagatggca agtgcacagt cagtcatgct gtacaaactg gtgcctcgta 3060 gtattgactc gtatagtgca tagtatcatg catggtcgtt acttgcaa 3108 <210> 106 <211> 559 <212> DNA <213> Chlorella luteoviridis <400> 106 tgttgaagaa tgagccggcg acttatagga agtggcgtgg ttaaggaatt ttccgaagcc 60 caagcgaaag caagttttaa aaatagcgat atttgtcact ttttatggac ccgaacccgg 120 gtgatctaac cgtgaccagg atgaagcttg ggtaacacca agtgaaggtc cgaactcttc 180 gatctttaaa aatcgtgaga tgagttgcgg ttagtaggtg aaatgccaat cgaactcgga 240 gctagctggt tctccccgaa atgtgttgag gcgcagcgat gaatgacaaa acaaatagta 300 cggtgtaggg gtaaagcact gtttcggtgc gggctgcgaa agcggtacca aatcgtggca 360 aactcagaat actacgcttg tataccattc atcagtgaga ctgtggggga taagctccat 420 agtcaagagg gaaacagccc agatcaccag ttaaggcccc aaaatgacag ctaagtggca 480 aaggaggtga aagtgcagaa acaaccagga ggtttgccca gaagcagcca tcctttaaag 540 agtgcgtaat agctcactg 559 <210> 107 <211> 1841 <212> DNA <213> Cuphea palustris <400> 107 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 360 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 420 cccgtgcgcg ggcgcgccag catgctgctg tcggcggtga ccacggtctt cggcgtggcc 480 gagaagcagt ggcccatgct ggaccgcaag tccaagcgcc ccgacatgct ggtcgagccc 540 ctgggcgtgg accgcatcgt ctacgacggc gtgagcttcc gccagtcgtt ctccatccgc 600 agctacgaga tcggcgccga ccgcaccgcc tcgatcgaga cgctgatgaa catgttccag 660 gagacctccc tgaaccactg caagatcatc ggcctgctga acgacggctt cggccgcacg 720 cccgagatgt gcaagcgcga cctgatctgg gtcgtgacca agatgcagat cgaggtgaac 780 cgctacccca cgtggggcga caccatcgag gtcaacacgt gggtgagcgc ctcgggcaag 840 cacggcatgg gccgcgactg gctgatctcc gactgccaca ccggcgagat cctgatccgc 900 gcgacgagcg tctgggcgat gatgaaccag aagacccgcc gcctgtcgaa gatcccctac 960 gaggtgcgcc aggagatcga gccccagttc gtcgactccg cccccgtgat cgtggacgac 1020 cgcaagttcc acaagctgga cctgaagacg ggcgacagca tctgcaacgg cctgaccccc 1080 cgctggacgg acctggacgt gaaccagcac gtcaacaacg tgaagtacat cggctggatc 1140 ctgcagtcgg tccccaccga ggtgttcgag acgcaggagc tgtgcggcct gaccctggag 1200 taccgccgcg agtgcggccg cgactccgtg ctggagagcg tcacggccat ggacccctcg 1260 aaggagggcg accgctccct gtaccagcac ctgctgcgcc tggaggacgg cgcggacatc 1320 gtgaagggcc gcaccgagtg gcgccccaag aacgccggcg ccaagggcgc catcctgacg 1380 ggcaagacca gcaacggcaa ctcgatctcc tgactcgagt taattaactc gaggcagcag 1440 cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac 1500 acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt 1560 gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac 1620 ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc 1680 tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg 1740 tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga 1800 tgcacgggaa gtagtgggat gggaacacaa atggaaagct t 1841 <210> 108 <211> 1010 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 108 ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc ctgttcctgg 60 cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac atgctggtgg 120 accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac aacttcagca 180 tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg atgaaccacc 240 tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac ggcctgggca 300 gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg caggtggcgg 360 tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg accgccatcg 420 gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc gagaccctgc 480 tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc agcaagatcc 540 ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc ctgcccaccg 600 tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac ttcatccgca 660 agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac aacgtgaagt 720 acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac gagatcgcca 780 gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac agcgccacca 840 aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac ctggtgcgcc 900 tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag cgccccctgt 960 acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag ctgactcgag 1010 <210> 109 <211> 5472 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 109 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 360 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 420 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 480 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 540 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 600 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 660 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 720 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 780 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 840 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 900 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 960 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1020 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1080 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1140 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1200 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1260 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 1320 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 1380 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 1440 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 1500 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 1560 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 1620 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 1680 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 1740 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 1800 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 1860 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 1920 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 1980 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2040 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2100 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2160 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2220 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 2280 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 2340 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 2400 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 2460 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 2520 gctgatggtc gaaacgttca cagcctaggg atatcgaatt ccgcctgcaa cgcaagggca 2580 gccacagccg ctcccacccg ccgctgaacc gacacgtgct tgggcgcctg ccgcctgcct 2640 gccgcatgct tgtgctggtg aggctgggca gtgctgccat gctgattgag gcttggttca 2700 tcgggtggaa gcttatgtgt gtgctgggct tgcatgccgg gcaatgcgca tggtggcaag 2760 agggcggcag cacttgctgg agctgccgcg gtgcctccag gtggttcaat cgcggcagcc 2820 agagggattt cagatgatcg cgcgtacagg ttgagcagca gtgtcagcaa aggtagcagt 2880 ttgccagaat gatcggttca gctgttaatc aatgccagca agagaagggg tcaagtgcaa 2940 acacgggcat gccacagcac gggcaccggg gagtggaatg gcaccaccaa gtgtgtgcga 3000 gccagcatcg ccgcctggct gtttcagcta caacggcagg agtcatccaa cgtaaccatg 3060 agctgatcaa cactgcaatc atcgggcggg cgtgatgcaa gcatgcctgg cgaagacaca 3120 tggtgtgcgg atgctgccgg ctgctgcctg ctgcgcacgc cgttgagttg gcagcaggct 3180 cagccatgca ctggatggca gctgggctgc cactgcaatg tggtggatag gatgcaagtg 3240 gagcgaatac caaaccctct ggctgcttgc tgggttgcat ggcatcgcac catcagcagg 3300 agcgcatgcg aagggactgg ccccatgcac gccatgccaa accggagcgc accgagtgtc 3360 cacactgtca ccaggcccgc aagctttgca gaaccatgct catggacgca tgtagcgctg 3420 acgtcccttg acggcgctcc tctcgggtgt gggaaacgca atgcagcaca ggcagcagag 3480 gcggcggcag cagagcggcg gcagcagcgg cgggggccac ccttcttgcg gggtcgcgcc 3540 ccagccagcg gtgatgcgct gatcccaaac gagttcacat tcatttgcat gcctggagaa 3600 gcgaggctgg ggcctttggg ctggtgcagc ccgcaatgga atgcgggacc gccaggctag 3660 cagcaaaggc gcctccccta ctccgcatcg atgttccata gtgcattgga ctgcatttgg 3720 gtggggcggc cggctgtttc tttcgtgttg caaaacgcgc cagctcagca acctgtcccg 3780 tgggtccccc gtgccgatga aatcgtgtgc acgccgatca gctgattgcc cggctcgcga 3840 agtaggcgcc ctcctttctg ctcgccctct ctccgtcccg ccactagtat ggccaccgca 3900 tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc gggctccggg 3960 ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg cccagctgcc cgactggagc 4020 cgcctgctga ccgccatcac caccgtgttc gtgaagtcca agcgccccga catgcacgac 4080 cgcaagtcca agcgccccga catgctggtg gacagcttcg gcctggagtc caccgtgcag 4140 gacggcctgg tgttccgcca gtccttctcc atccgctcct acgagatcgg caccgaccgc 4200 accgccagca tcgagaccct gatgaaccac ctgcaggaga cctccctgaa ccactgcaag 4260 agcaccggca tcctgctgga cggcttcggc cgcaccctgg agatgtgcaa gcgcgacctg 4320 atctgggtgg tgatcaagat gcagatcaag gtgaaccgct accccgcctg gggcgacacc 4380 gtggagatca acacccgctt cagccgcctg ggcaagatcg gcatgggccg cgactggctg 4440 atctccgact gcaacaccgg cgagatcctg gtgcgcgcca ccagcgccta cgccatgatg 4500 aaccagaaga cccgccgcct gtccaagctg ccctacgagg tgcaccagga gatcgtgccc 4560 ctgttcgtgg acagccccgt gatcgaggac tccgacctga aggtgcacaa gttcaaggtg 4620 aagaccggcg acagcatcca gaagggcctg acccccggct ggaacgacct ggacgtgaac 4680 cagcacgtgt ccaacgtgaa gtacatcggc tggatcctgg agagcatgcc caccgaggtg 4740 ctggagaccc aggagctgtg ctccctggcc ctggagtacc gccgcgagtg cggccgcgac 4800 tccgtgctgg agagcgtgac cgccatggac cccagcaagg tgggcgtgcg ctcccagtac 4860 cagcacctgc tgcgcctgga ggacggcacc gccatcgtga acggcgccac cgagtggcgc 4920 cccaagaacg ccggcgccaa cggcgccatc tccaccggca agaccagcaa cggcaactcc 4980 gtgtccatgg actacaagga ccacgacggc gactacaagg accacgacat cgactacaag 5040 gacgacgacg acaagtgact cgaggcagca gcagctcgga tagtatcgac acactctgga 5100 cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct 5160 gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt 5220 gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat 5280 cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg 5340 ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac 5400 tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca 5460 aatggaaagc tt 5472 <210> 110 <211> 5451 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 110 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 360 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 420 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 480 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 540 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 600 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 660 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 720 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 780 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 840 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 900 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 960 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1020 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1080 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1140 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1200 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1260 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 1320 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 1380 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 1440 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 1500 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 1560 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 1620 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 1680 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 1740 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 1800 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 1860 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 1920 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 1980 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2040 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2100 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2160 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2220 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 2280 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 2340 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 2400 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 2460 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 2520 gctgatggtc gaaacgttca cagcctaggg atatcgaatt ccgcctgcaa cgcaagggca 2580 gccacagccg ctcccacccg ccgctgaacc gacacgtgct tgggcgcctg ccgcctgcct 2640 gccgcatgct tgtgctggtg aggctgggca gtgctgccat gctgattgag gcttggttca 2700 tcgggtggaa gcttatgtgt gtgctgggct tgcatgccgg gcaatgcgca tggtggcaag 2760 agggcggcag cacttgctgg agctgccgcg gtgcctccag gtggttcaat cgcggcagcc 2820 agagggattt cagatgatcg cgcgtacagg ttgagcagca gtgtcagcaa aggtagcagt 2880 ttgccagaat gatcggttca gctgttaatc aatgccagca agagaagggg tcaagtgcaa 2940 acacgggcat gccacagcac gggcaccggg gagtggaatg gcaccaccaa gtgtgtgcga 3000 gccagcatcg ccgcctggct gtttcagcta caacggcagg agtcatccaa cgtaaccatg 3060 agctgatcaa cactgcaatc atcgggcggg cgtgatgcaa gcatgcctgg cgaagacaca 3120 tggtgtgcgg atgctgccgg ctgctgcctg ctgcgcacgc cgttgagttg gcagcaggct 3180 cagccatgca ctggatggca gctgggctgc cactgcaatg tggtggatag gatgcaagtg 3240 gagcgaatac caaaccctct ggctgcttgc tgggttgcat ggcatcgcac catcagcagg 3300 agcgcatgcg aagggactgg ccccatgcac gccatgccaa accggagcgc accgagtgtc 3360 cacactgtca ccaggcccgc aagctttgca gaaccatgct catggacgca tgtagcgctg 3420 acgtcccttg acggcgctcc tctcgggtgt gggaaacgca atgcagcaca ggcagcagag 3480 gcggcggcag cagagcggcg gcagcagcgg cgggggccac ccttcttgcg gggtcgcgcc 3540 ccagccagcg gtgatgcgct gatcccaaac gagttcacat tcatttgcat gcctggagaa 3600 gcgaggctgg ggcctttggg ctggtgcagc ccgcaatgga atgcgggacc gccaggctag 3660 cagcaaaggc gcctccccta ctccgcatcg atgttccata gtgcattgga ctgcatttgg 3720 gtggggcggc cggctgtttc tttcgtgttg caaaacgcgc cagctcagca acctgtcccg 3780 tgggtccccc gtgccgatga aatcgtgtgc acgccgatca gctgattgcc cggctcgcga 3840 agtaggcgcc ctcctttctg ctcgccctct ctccgtcccg ccactagtat gacgttcggg 3900 gtcgccctcc cggccatggg ccgcggtgtc tcccttcccc ggcccagggt cgcggtgcgc 3960 gcccagtcgg cgagtcaggt tttggagagc gggcgcgccc ccgactggtc catgctgttc 4020 gccgtgatca ccaccatctt cagcgccgcc gagaagcagt ggaccaacct ggagtggaag 4080 cccaagccca agctgcccca gctgctggac gaccacttcg gcctgcacgg cctggtgttc 4140 cgccgcacct tcgccatccg ctcctacgag gtgggccccg accgcagcac ctccatcctg 4200 gccgtgatga accacatgca ggaggccacc ctgaaccacg ccaagagcgt gggcatcctg 4260 ggcgacggct tcggcaccac cctggagatg tccaagcgcg acctgatgtg ggtggtgcgc 4320 cgcacccacg tggccgtgga gcgctacccc acctggggcg acaccgtgga ggtggagtgc 4380 tggatcggcg ccagcggcaa caacggcatg cgccgcgact tcctggtgcg cgactgcaag 4440 accggcgaga tcctgacccg ctgcacctcc ctgagcgtgc tgatgaacac ccgcacccgc 4500 cgcctgagca ccatccccga cgaggtgcgc ggcgagatcg gccccgcctt catcgacaac 4560 gtggccgtga aggacgacga gatcaagaag ctgcagaagc tgaacgactc caccgccgac 4620 tacatccagg gcggcctgac cccccgctgg aacgacctgg acgtgaacca gcacgtgaac 4680 aacctgaagt acgtggcctg ggtgttcgag accgtgcccg acagcatctt cgagtcccac 4740 cacatcagct ccttcaccct ggagtaccgc cgcgagtgca cccgcgactc cgtgctgcgc 4800 agcctgacca ccgtgagcgg cggcagctcc gaggccggcc tggtgtgcga ccacctgctg 4860 cagctggagg gcggcagcga ggtgctgcgc gcccgcaccg agtggcgccc caagctgacc 4920 gactccttcc gcggcatcag cgtgatcccc gccgagcccc gcgtgatgga ctacaaggac 4980 cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga caagtgactc 5040 gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg 5100 ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct 5160 cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg 5220 cgaataccac ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac 5280 ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc 5340 acagccttgg tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact 5400 gcaatgctga tgcacgggaa gtagtgggat gggaacacaa atggaaagct t 5451 <210> 111 <211> 5454 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 111 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 60 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 120 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 180 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 240 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 300 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 360 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 420 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 480 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 540 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 600 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 660 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 720 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 780 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 840 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 900 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 960 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1020 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1080 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1140 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1200 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1260 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 1320 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 1380 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 1440 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 1500 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 1560 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 1620 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 1680 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 1740 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 1800 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 1860 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 1920 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 1980 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2040 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2100 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2160 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2220 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 2280 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 2340 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 2400 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 2460 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 2520 gctgatggtc gaaacgttca cagcctaggg atatcgaatt ccgcctgcaa cgcaagggca 2580 gccacagccg ctcccacccg ccgctgaacc gacacgtgct tgggcgcctg ccgcctgcct 2640 gccgcatgct tgtgctggtg aggctgggca gtgctgccat gctgattgag gcttggttca 2700 tcgggtggaa gcttatgtgt gtgctgggct tgcatgccgg gcaatgcgca tggtggcaag 2760 agggcggcag cacttgctgg agctgccgcg gtgcctccag gtggttcaat cgcggcagcc 2820 agagggattt cagatgatcg cgcgtacagg ttgagcagca gtgtcagcaa aggtagcagt 2880 ttgccagaat gatcggttca gctgttaatc aatgccagca agagaagggg tcaagtgcaa 2940 acacgggcat gccacagcac gggcaccggg gagtggaatg gcaccaccaa gtgtgtgcga 3000 gccagcatcg ccgcctggct gtttcagcta caacggcagg agtcatccaa cgtaaccatg 3060 agctgatcaa cactgcaatc atcgggcggg cgtgatgcaa gcatgcctgg cgaagacaca 3120 tggtgtgcgg atgctgccgg ctgctgcctg ctgcgcacgc cgttgagttg gcagcaggct 3180 cagccatgca ctggatggca gctgggctgc cactgcaatg tggtggatag gatgcaagtg 3240 gagcgaatac caaaccctct ggctgcttgc tgggttgcat ggcatcgcac catcagcagg 3300 agcgcatgcg aagggactgg ccccatgcac gccatgccaa accggagcgc accgagtgtc 3360 cacactgtca ccaggcccgc aagctttgca gaaccatgct catggacgca tgtagcgctg 3420 acgtcccttg acggcgctcc tctcgggtgt gggaaacgca atgcagcaca ggcagcagag 3480 gcggcggcag cagagcggcg gcagcagcgg cgggggccac ccttcttgcg gggtcgcgcc 3540 ccagccagcg gtgatgcgct gatcccaaac gagttcacat tcatttgcat gcctggagaa 3600 gcgaggctgg ggcctttggg ctggtgcagc ccgcaatgga atgcgggacc gccaggctag 3660 cagcaaaggc gcctccccta ctccgcatcg atgttccata gtgcattgga ctgcatttgg 3720 gtggggcggc cggctgtttc tttcgtgttg caaaacgcgc cagctcagca acctgtcccg 3780 tgggtccccc gtgccgatga aatcgtgtgc acgccgatca gctgattgcc cggctcgcga 3840 agtaggcgcc ctcctttctg ctcgccctct ctccgtcccg ccactagtat ggccaccgca 3900 tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc gggctccggg 3960 ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg cccccgactg gtccatgctg 4020 ttcgccgtga tcaccaccat cttctccgcc gccgagaagc agtggaccaa cctggagtgg 4080 aagcccaagc ccaacccccc ccagctgctg gacgaccact tcggccccca cggcctggtg 4140 ttccgccgca ccttcgccat ccgcagctac gaggtgggcc ccgaccgctc caccagcatc 4200 gtggccgtga tgaaccacct gcaggaggcc gccctgaacc acgccaagtc cgtgggcatc 4260 ctgggcgacg gcttcggcac caccctggag atgtccaagc gcgacctgat ctgggtggtg 4320 aagcgcaccc acgtggccgt ggagcgctac cccgcctggg gcgacaccgt ggaggtggag 4380 tgctgggtgg gcgcctccgg caacaacggc cgccgccacg acttcctggt gcgcgactgc 4440 aagaccggcg agatcctgac ccgctgcacc tccctgagcg tgatgatgaa cacccgcacc 4500 cgccgcctga gcaagatccc cgaggaggtg cgcggcgaga tcggccccgc cttcatcgac 4560 aacgtggccg tgaaggacga ggagatcaag aagccccaga agctgaacga ctccaccgcc 4620 gactacatcc agggcggcct gaccccccgc tggaacgacc tggacatcaa ccagcacgtg 4680 aacaacatca agtacgtgga ctggatcctg gagaccgtgc ccgacagcat cttcgagagc 4740 caccacatct cctccttcac catcgagtac cgccgcgagt gcaccatgga cagcgtgctg 4800 cagtccctga ccaccgtgag cggcggctcc tccgaggccg gcctggtgtg cgagcacctg 4860 ctgcagctgg agggcggcag cgaggtgctg cgcgccaaga ccgagtggcg ccccaagctg 4920 accgactcct tccgcggcat cagcgtgatc cccgccgagt ccagcgtgat ggactacaag 4980 gaccacgacg gcgactacaa ggaccacgac atcgactaca aggacgacga cgacaagtga 5040 ctcgaggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 5100 ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 5160 cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 5220 ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 5280 aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 5340 cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 5400 actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggaaa gctt 5454 <210> 112 <211> 2933 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 112 agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60 cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120 gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180 ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240 cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300 cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360 tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420 gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480 attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540 tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600 gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660 catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720 tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780 tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840 caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900 atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960 attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020 agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080 gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140 acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200 ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260 cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320 attttccagt cgtcagcgaa atcaagtact agtatggcca ccgcatccac tttctcggcg 1380 ttcaatgccc gctgcggcga cctgcgtcgc tcggcgggct ccgggccccg gcgcccagcg 1440 aggcccctcc ccgtgcgcgg gcgcgccccc gactggtcca tgctgttcgc cgtgatcacc 1500 accatcttct ccgccgccga gaagcagtgg accaacctgg agtggaagcc caagcccaac 1560 cccccccagc tgctggacga ccacttcggc ccccacggcc tggtgttccg ccgcaccttc 1620 gccatccgca gctacgaggt gggccccgac cgctccacca gcatcgtggc cgtgatgaac 1680 cacctgcagg aggccgccct gaaccacgcc aagtccgtgg gcatcctggg cgacggcttc 1740 ggcaccaccc tggagatgtc caagcgcgac ctgatctggg tggtgaagcg cacccacgtg 1800 gccgtggagc gctaccccgc ctggggcgac accgtggagg tggagtgctg ggtgggcgcc 1860 tccggcaaca acggccgccg ccacgacttc ctggtgcgcg actgcaagac cggcgagatc 1920 ctgacccgct gcacctccct gagcgtgatg atgaacaccc gcacccgccg cctgagcaag 1980 atccccgagg aggtgcgcgg cgagatcggc cccgccttca tcgacaacgt ggccgtgaag 2040 gacgaggaga tcaagaagcc ccagaagctg aacgactcca ccgccgacta catccagggc 2100 ggcctgaccc cccgctggaa cgacctggac atcaaccagc acgtgaacaa catcaagtac 2160 gtggactgga tcctggagac cgtgcccgac agcatcttcg agagccacca catctcctcc 2220 ttcaccatcg agtaccgccg cgagtgcacc atggacagcg tgctgcagtc cctgaccacc 2280 gtgagcggcg gctcctccga ggccggcctg gtgtgcgagc acctgctgca gctggagggc 2340 ggcagcgagg tgctgcgcgc caagaccgag tggcgcccca agctgaccga ctccttccgc 2400 ggcatcagcg tgatccccgc cgagtccagc gtgatggact acaaggacca cgacggcgac 2460 tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgactcga gttaattaac 2520 tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 2580 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2640 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2700 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2760 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2820 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2880 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag ctt 2933 <210> 113 <211> 4817 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 113 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacgg cgcgccatgg tggccgccgc cgcctccagc gccttcttcc 3120 ccgtgcccgc ccccggcgcc tcccccaagc ccggcaagtt cggcaactgg ccctccagcc 3180 tgagcccctc cttcaagccc aagtccatcc ccaacggcgg cttccaggtg aaggccaacg 3240 acagcgccca ccccaaggcc aacggctccg ccgtgagcct gaagagcggc agcctgaaca 3300 cccaggagga cacctcctcc agcccccccc cccgcacctt cctgcaccag ctgcccgact 3360 ggagccgcct gctgaccgcc atcaccaccg tgttcgtgaa gtccaagcgc cccgacatgc 3420 acgaccgcaa gtccaagcgc cccgacatgc tggtggacag cttcggcctg gagtccaccg 3480 tgcaggacgg cctggtgttc cgccagtcct tctccatccg ctcctacgag atcggcaccg 3540 accgcaccgc cagcatcgag accctgatga accacctgca ggagacctcc ctgaaccact 3600 gcaagagcac cggcatcctg ctggacggct tcggccgcac cctggagatg tgcaagcgcg 3660 acctgatctg ggtggtgatc aagatgcaga tcaaggtgaa ccgctacccc gcctggggcg 3720 acaccgtgga gatcaacacc cgcttcagcc gcctgggcaa gatcggcatg ggccgcgact 3780 ggctgatctc cgactgcaac accggcgaga tcctggtgcg cgccaccagc gcctacgcca 3840 tgatgaacca gaagacccgc cgcctgtcca agctgcccta cgaggtgcac caggagatcg 3900 tgcccctgtt cgtggacagc cccgtgatcg aggactccga cctgaaggtg cacaagttca 3960 aggtgaagac cggcgacagc atccagaagg gcctgacccc cggctggaac gacctggacg 4020 tgaaccagca cgtgtccaac gtgaagtaca tcggctggat cctggagagc atgcccaccg 4080 aggtgctgga gacccaggag ctgtgctccc tggccctgga gtaccgccgc gagtgcggcc 4140 gcgactccgt gctggagagc gtgaccgcca tggaccccag caaggtgggc gtgcgctccc 4200 agtaccagca cctgctgcgc ctggaggacg gcaccgccat cgtgaacggc gccaccgagt 4260 ggcgccccaa gaacgccggc gccaacggcg ccatctccac cggcaagacc agcaacggca 4320 actccgtgtc catggactac aaggaccacg acggcgacta caaggaccac gacatcgact 4380 acaaggacga cgacgacaag tgactcgagg cagcagcagc tcggatagta tcgacacact 4440 ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 4500 tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 4560 gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 4620 catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 4680 tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 4740 ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 4800 acacaaatgg aaagctt 4817 <210> 114 <211> 4665 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 114 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatgacg ttcggggtcg ccctcccggc catgggccgc 3120 ggtgtctccc ttccccggcc cagggtcgcg gtgcgcgccc agtcggcgag tcaggttttg 3180 gagagcgggc gcgcccagct gcccgactgg agccgcctgc tgaccgccat caccaccgtg 3240 ttcgtgaagt ccaagcgccc cgacatgcac gaccgcaagt ccaagcgccc cgacatgctg 3300 gtggacagct tcggcctgga gtccaccgtg caggacggcc tggtgttccg ccagtccttc 3360 tccatccgct cctacgagat cggcaccgac cgcaccgcca gcatcgagac cctgatgaac 3420 cacctgcagg agacctccct gaaccactgc aagagcaccg gcatcctgct ggacggcttc 3480 ggccgcaccc tggagatgtg caagcgcgac ctgatctggg tggtgatcaa gatgcagatc 3540 aaggtgaacc gctaccccgc ctggggcgac accgtggaga tcaacacccg cttcagccgc 3600 ctgggcaaga tcggcatggg ccgcgactgg ctgatctccg actgcaacac cggcgagatc 3660 ctggtgcgcg ccaccagcgc ctacgccatg atgaaccaga agacccgccg cctgtccaag 3720 ctgccctacg aggtgcacca ggagatcgtg cccctgttcg tggacagccc cgtgatcgag 3780 gactccgacc tgaaggtgca caagttcaag gtgaagaccg gcgacagcat ccagaagggc 3840 ctgacccccg gctggaacga cctggacgtg aaccagcacg tgtccaacgt gaagtacatc 3900 ggctggatcc tggagagcat gcccaccgag gtgctggaga cccaggagct gtgctccctg 3960 gccctggagt accgccgcga gtgcggccgc gactccgtgc tggagagcgt gaccgccatg 4020 gaccccagca aggtgggcgt gcgctcccag taccagcacc tgctgcgcct ggaggacggc 4080 accgccatcg tgaacggcgc caccgagtgg cgccccaaga acgccggcgc caacggcgcc 4140 atctccaccg gcaagaccag caacggcaac tccgtgtcca tggactacaa ggaccacgac 4200 ggcgactaca aggaccacga catcgactac aaggacgacg acgacaagtg actcgaggca 4260 gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg 4320 ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt 4380 gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata 4440 ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct 4500 acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc 4560 ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg 4620 ctgatgcacg ggaagtagtg ggatgggaac acaaatggaa agctt 4665 <210> 115 <211> 4668 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 115 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240 gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300 ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360 ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420 aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480 ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540 atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600 cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660 atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720 aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780 gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840 ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900 atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960 ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020 atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080 ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140 gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200 gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260 gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320 ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380 tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440 ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500 tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560 gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620 atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 4668 <210> 116 <211> 4668 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 116 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240 gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300 ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360 ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420 aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480 ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540 atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600 cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660 atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720 aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780 gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840 ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900 atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960 ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020 atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080 ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140 gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200 gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260 gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320 ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380 tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440 ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500 tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560 gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620 atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 4668 <210> 117 <211> 4656 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 117 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct tccgcggcat tcaccatgtc ggcgtgcccc 3120 gcgatgactg gcagggcccc tggggcacgt cgctccggac ggccagtcgc cacccgcctg 3180 agggggcgcg cccccgactg gagccgcctg ctgaccgcca tcaccaccgt gttcgtgaag 3240 tccaagcgcc ccgacatgca cgaccgcaag tccaagcgcc ccgacatgct ggtggacagc 3300 ttcggcctgg agtccaccgt gcaggacggc ctggtgttcc gccagtcctt ctccatccgc 3360 tcctacgaga tcggcaccga ccgcaccgcc agcatcgaga ccctgatgaa ccacctgcag 3420 gagacctccc tgaaccactg caagagcacc ggcatcctgc tggacggctt cggccgcacc 3480 ctggagatgt gcaagcgcga cctgatctgg gtggtgatca agatgcagat caaggtgaac 3540 cgctaccccg cctggggcga caccgtggag atcaacaccc gcttcagccg cctgggcaag 3600 atcggcatgg gccgcgactg gctgatctcc gactgcaaca ccggcgagat cctggtgcgc 3660 gccaccagcg cctacgccat gatgaaccag aagacccgcc gcctgtccaa gctgccctac 3720 gaggtgcacc aggagatcgt gcccctgttc gtggacagcc ccgtgatcga ggactccgac 3780 ctgaaggtgc acaagttcaa ggtgaagacc ggcgacagca tccagaaggg cctgaccccc 3840 ggctggaacg acctggacgt gaaccagcac gtgtccaacg tgaagtacat cggctggatc 3900 ctggagagca tgcccaccga ggtgctggag acccaggagc tgtgctccct ggccctggag 3960 taccgccgcg agtgcggccg cgactccgtg ctggagagcg tgaccgccat ggaccccagc 4020 aaggtgggcg tgcgctccca gtaccagcac ctgctgcgcc tggaggacgg caccgccatc 4080 gtgaacggcg ccaccgagtg gcgccccaag aacgccggcg ccaacggcgc catctccacc 4140 ggcaagacca gcaacggcaa ctccgtgtcc atggactaca aggaccacga cggcgactac 4200 aaggaccacg acatcgacta caaggacgac gacgacaagt gactcgaggc agcagcagct 4260 cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 4320 ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 4380 tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 4440 gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 4500 tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 4560 gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 4620 gggaagtagt gggatgggaa cacaaatgga aagctt 4656 <210> 118 <211> 4721 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 118 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacgg cgcgccatgg ccaccaccag cctggcctcc gccttctgct 3120 ccatgaaggc cgtgatgctg gcccgcgacg gccgcggcat gaagccccgc agctccgacc 3180 tgcagctgcg cgccggcaac gcccccacct ccctgaagat gatcaacggc accaagttca 3240 gctacaccga gagcctgaag cgcctgcccg actggtccat gctgttcgcc gtgatcacca 3300 ccatcttcag cgccgccgag aagcagtgga ccaacctgga gtggaagccc aagcccaagc 3360 tgccccagct gctggacgac cacttcggcc tgcacggcct ggtgttccgc cgcaccttcg 3420 ccatccgctc ctacgaggtg ggccccgacc gcagcacctc catcctggcc gtgatgaacc 3480 acatgcagga ggccaccctg aaccacgcca agagcgtggg catcctgggc gacggcttcg 3540 gcaccaccct ggagatgtcc aagcgcgacc tgatgtgggt ggtgcgccgc acccacgtgg 3600 ccgtggagcg ctaccccacc tggggcgaca ccgtggaggt ggagtgctgg atcggcgcca 3660 gcggcaacaa cggcatgcgc cgcgacttcc tggtgcgcga ctgcaagacc ggcgagatcc 3720 tgacccgctg cacctccctg agcgtgctga tgaacacccg cacccgccgc ctgagcacca 3780 tccccgacga ggtgcgcggc gagatcggcc ccgccttcat cgacaacgtg gccgtgaagg 3840 acgacgagat caagaagctg cagaagctga acgactccac cgccgactac atccagggcg 3900 gcctgacccc ccgctggaac gacctggacg tgaaccagca cgtgaacaac ctgaagtacg 3960 tggcctgggt gttcgagacc gtgcccgaca gcatcttcga gtcccaccac atcagctcct 4020 tcaccctgga gtaccgccgc gagtgcaccc gcgactccgt gctgcgcagc ctgaccaccg 4080 tgagcggcgg cagctccgag gccggcctgg tgtgcgacca cctgctgcag ctggagggcg 4140 gcagcgaggt gctgcgcgcc cgcaccgagt ggcgccccaa gctgaccgac tccttccgcg 4200 gcatcagcgt gatccccgcc gagccccgcg tgatggacta caaggaccac gacggcgact 4260 acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgatgactc gaggcagcag 4320 cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac 4380 acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt 4440 gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac 4500 ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc 4560 tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg 4620 tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga 4680 tgcacgggaa gtagtgggat gggaacacaa atggaaagct t 4721 <210> 119 <211> 4650 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 119 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatgacg ttcggggtcg ccctcccggc catgggccgc 3120 ggtgtctccc ttccccggcc cagggtcgcg gtgcgcgccc agtcggcgag tcaggttttg 3180 gagagcgggc gcgcccccga ctggtccatg ctgttcgccg tgatcaccac catcttcagc 3240 gccgccgaga agcagtggac caacctggag tggaagccca agcccaagct gccccagctg 3300 ctggacgacc acttcggcct gcacggcctg gtgttccgcc gcaccttcgc catccgctcc 3360 tacgaggtgg gccccgaccg cagcacctcc atcctggccg tgatgaacca catgcaggag 3420 gccaccctga accacgccaa gagcgtgggc atcctgggcg acggcttcgg caccaccctg 3480 gagatgtcca agcgcgacct gatgtgggtg gtgcgccgca cccacgtggc cgtggagcgc 3540 taccccacct ggggcgacac cgtggaggtg gagtgctgga tcggcgccag cggcaacaac 3600 ggcatgcgcc gcgacttcct ggtgcgcgac tgcaagaccg gcgagatcct gacccgctgc 3660 acctccctga gcgtgctgat gaacacccgc acccgccgcc tgagcaccat ccccgacgag 3720 gtgcgcggcg agatcggccc cgccttcatc gacaacgtgg ccgtgaagga cgacgagatc 3780 aagaagctgc agaagctgaa cgactccacc gccgactaca tccagggcgg cctgaccccc 3840 cgctggaacg acctggacgt gaaccagcac gtgaacaacc tgaagtacgt ggcctgggtg 3900 ttcgagaccg tgcccgacag catcttcgag tcccaccaca tcagctcctt caccctggag 3960 taccgccgcg agtgcacccg cgactccgtg ctgcgcagcc tgaccaccgt gagcggcggc 4020 agctccgagg ccggcctggt gtgcgaccac ctgctgcagc tggagggcgg cagcgaggtg 4080 ctgcgcgccc gcaccgagtg gcgccccaag ctgaccgact ccttccgcgg catcagcgtg 4140 atccccgccg agccccgcgt gatggactac aaggaccacg acggcgacta caaggaccac 4200 gacatcgact acaaggacga cgacgacaag tgatgactcg aggcagcagc agctcggata 4260 gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320 tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380 tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440 ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500 ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560 cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620 tagtgggatg ggaacacaaa tggaaagctt 4650 <210> 120 <211> 4653 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 120 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300 ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360 tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420 gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540 cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600 aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780 atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900 gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960 gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020 ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620 aagtagtggg atgggaacac aaatggaaag ctt 4653 <210> 121 <211> 4653 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 121 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300 ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360 tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420 gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540 cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600 aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780 atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900 gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960 gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020 ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620 aagtagtggg atgggaacac aaatggaaag ctt 4653 <210> 122 <211> 4647 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 122 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct tccgcggcat tcaccatgtc ggcgtgcccc 3120 gcgatgactg gcagggcccc tggggcacgt cgctccggac ggccagtcgc cacccgcctg 3180 agggggcgcg cccccgactg gtccatgctg ttcgccgtga tcaccaccat cttcagcgcc 3240 gccgagaagc agtggaccaa cctggagtgg aagcccaagc ccaagctgcc ccagctgctg 3300 gacgaccact tcggcctgca cggcctggtg ttccgccgca ccttcgccat ccgctcctac 3360 gaggtgggcc ccgaccgcag cacctccatc ctggccgtga tgaaccacat gcaggaggcc 3420 accctgaacc acgccaagag cgtgggcatc ctgggcgacg gcttcggcac caccctggag 3480 atgtccaagc gcgacctgat gtgggtggtg cgccgcaccc acgtggccgt ggagcgctac 3540 cccacctggg gcgacaccgt ggaggtggag tgctggatcg gcgccagcgg caacaacggc 3600 atgcgccgcg acttcctggt gcgcgactgc aagaccggcg agatcctgac ccgctgcacc 3660 tccctgagcg tgctgatgaa cacccgcacc cgccgcctga gcaccatccc cgacgaggtg 3720 cgcggcgaga tcggccccgc cttcatcgac aacgtggccg tgaaggacga cgagatcaag 3780 aagctgcaga agctgaacga ctccaccgcc gactacatcc agggcggcct gaccccccgc 3840 tggaacgacc tggacgtgaa ccagcacgtg aacaacctga agtacgtggc ctgggtgttc 3900 gagaccgtgc ccgacagcat cttcgagtcc caccacatca gctccttcac cctggagtac 3960 cgccgcgagt gcacccgcga ctccgtgctg cgcagcctga ccaccgtgag cggcggcagc 4020 tccgaggccg gcctggtgtg cgaccacctg ctgcagctgg agggcggcag cgaggtgctg 4080 cgcgcccgca ccgagtggcg ccccaagctg accgactcct tccgcggcat cagcgtgatc 4140 cccgccgagc cccgcgtgat ggactacaag gaccacgacg gcgactacaa ggaccacgac 4200 atcgactaca aggacgacga cgacaagtga tgactcgagg cagcagcagc tcggatagta 4260 tcgacacact ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga 4320 cctgtgaata tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac 4380 gcgcttttgc gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct 4440 tccctcgttt catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc 4500 tcagcgctgc tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct 4560 gtattctcct ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag 4620 tgggatggga acacaaatgg aaagctt 4647 <210> 123 <211> 4721 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 123 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacgg cgcgccatgg ccaccacctc cctggcctcc gccttctgca 3120 gcatgaaggc cgtgatgctg gcccgcgacg gccgcggcat gaagccccgc tccagcgacc 3180 tgcagctgcg cgccggcaac gcccagacct ccctgaagat gatcaacggc accaagttct 3240 cctacaccga gagcctgaag aagctgcccg actggtccat gctgttcgcc gtgatcacca 3300 ccatcttctc cgccgccgag aagcagtgga ccaacctgga gtggaagccc aagcccaacc 3360 ccccccagct gctggacgac cacttcggcc cccacggcct ggtgttccgc cgcaccttcg 3420 ccatccgcag ctacgaggtg ggccccgacc gctccaccag catcgtggcc gtgatgaacc 3480 acctgcagga ggccgccctg aaccacgcca agtccgtggg catcctgggc gacggcttcg 3540 gcaccaccct ggagatgtcc aagcgcgacc tgatctgggt ggtgaagcgc acccacgtgg 3600 ccgtggagcg ctaccccgcc tggggcgaca ccgtggaggt ggagtgctgg gtgggcgcct 3660 ccggcaacaa cggccgccgc cacgacttcc tggtgcgcga ctgcaagacc ggcgagatcc 3720 tgacccgctg cacctccctg agcgtgatga tgaacacccg cacccgccgc ctgagcaaga 3780 tccccgagga ggtgcgcggc gagatcggcc ccgccttcat cgacaacgtg gccgtgaagg 3840 acgaggagat caagaagccc cagaagctga acgactccac cgccgactac atccagggcg 3900 gcctgacccc ccgctggaac gacctggaca tcaaccagca cgtgaacaac atcaagtacg 3960 tggactggat cctggagacc gtgcccgaca gcatcttcga gagccaccac atctcctcct 4020 tcaccatcga gtaccgccgc gagtgcacca tggacagcgt gctgcagtcc ctgaccaccg 4080 tgagcggcgg ctcctccgag gccggcctgg tgtgcgagca cctgctgcag ctggagggcg 4140 gcagcgaggt gctgcgcgcc aagaccgagt ggcgccccaa gctgaccgac tccttccgcg 4200 gcatcagcgt gatccccgcc gagtccagcg tgatggacta caaggaccac gacggcgact 4260 acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgatgactc gaggcagcag 4320 cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac 4380 acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt 4440 gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac 4500 ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc 4560 tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg 4620 tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga 4680 tgcacgggaa gtagtgggat gggaacacaa atggaaagct t 4721 <210> 124 <211> 4650 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 124 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatgacg ttcggggtcg ccctcccggc catgggccgc 3120 ggtgtctccc ttccccggcc cagggtcgcg gtgcgcgccc agtcggcgag tcaggttttg 3180 gagagcgggc gcgcccccga ctggtccatg ctgttcgccg tgatcaccac catcttctcc 3240 gccgccgaga agcagtggac caacctggag tggaagccca agcccaaccc cccccagctg 3300 ctggacgacc acttcggccc ccacggcctg gtgttccgcc gcaccttcgc catccgcagc 3360 tacgaggtgg gccccgaccg ctccaccagc atcgtggccg tgatgaacca cctgcaggag 3420 gccgccctga accacgccaa gtccgtgggc atcctgggcg acggcttcgg caccaccctg 3480 gagatgtcca agcgcgacct gatctgggtg gtgaagcgca cccacgtggc cgtggagcgc 3540 taccccgcct ggggcgacac cgtggaggtg gagtgctggg tgggcgcctc cggcaacaac 3600 ggccgccgcc acgacttcct ggtgcgcgac tgcaagaccg gcgagatcct gacccgctgc 3660 acctccctga gcgtgatgat gaacacccgc acccgccgcc tgagcaagat ccccgaggag 3720 gtgcgcggcg agatcggccc cgccttcatc gacaacgtgg ccgtgaagga cgaggagatc 3780 aagaagcccc agaagctgaa cgactccacc gccgactaca tccagggcgg cctgaccccc 3840 cgctggaacg acctggacat caaccagcac gtgaacaaca tcaagtacgt ggactggatc 3900 ctggagaccg tgcccgacag catcttcgag agccaccaca tctcctcctt caccatcgag 3960 taccgccgcg agtgcaccat ggacagcgtg ctgcagtccc tgaccaccgt gagcggcggc 4020 tcctccgagg ccggcctggt gtgcgagcac ctgctgcagc tggagggcgg cagcgaggtg 4080 ctgcgcgcca agaccgagtg gcgccccaag ctgaccgact ccttccgcgg catcagcgtg 4140 atccccgccg agtccagcgt gatggactac aaggaccacg acggcgacta caaggaccac 4200 gacatcgact acaaggacga cgacgacaag tgatgactcg aggcagcagc agctcggata 4260 gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320 tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380 tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440 ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500 ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560 cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620 tagtgggatg ggaacacaaa tggaaagctt 4650 <210> 125 <211> 4653 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 125 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 tccgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa ccccccccag 3300 ctgctggacg accacttcgg cccccacggc ctggtgttcc gccgcacctt cgccatccgc 3360 agctacgagg tgggccccga ccgctccacc agcatcgtgg ccgtgatgaa ccacctgcag 3420 gaggccgccc tgaaccacgc caagtccgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatctgg gtggtgaagc gcacccacgt ggccgtggag 3540 cgctaccccg cctggggcga caccgtggag gtggagtgct gggtgggcgc ctccggcaac 3600 aacggccgcc gccacgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgat gatgaacacc cgcacccgcc gcctgagcaa gatccccgag 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgaggag 3780 atcaagaagc cccagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga catcaaccag cacgtgaaca acatcaagta cgtggactgg 3900 atcctggaga ccgtgcccga cagcatcttc gagagccacc acatctcctc cttcaccatc 3960 gagtaccgcc gcgagtgcac catggacagc gtgctgcagt ccctgaccac cgtgagcggc 4020 ggctcctccg aggccggcct ggtgtgcgag cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg ccaagaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagtccag cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620 aagtagtggg atgggaacac aaatggaaag ctt 4653 <210> 126 <211> 3669 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 126 cccgtgatca cacaggtgcc ttgcgagcgt gatcacacta ttttgggggt cctacagtac 60 tgaaatggtg agaagtcgta ctgaaatcaa ggatgaacaa tgaaaatggt gctgtggtgg 120 cttctcaaag gtcaagaatc agtcgctcgc gtcaggaaat cgcggcgtca accagcgtgg 180 gcgcggtcag tggccccgca ctggtcacca tagcctctcc tgccacagta gcgatcccct 240 gggcgttcac tctcagcagc ggctgtactg cctcccagat tttcttcttc tggacctgcg 300 ggcgtgagag gatgagcagg gtggggccaa gggctcaatc ctgaacggcc ctcattcggt 360 ttccaatccc acaacacata cccacagcag gtcagaccac gcattcgcac catgcgcacc 420 aaataacgtg tccttacctg attgggtgtg gcaggctccg tggacaggag tgcctcgtcc 480 cccgcccaga cccgctcccc cgtcacggcg gcgtccggga cccgcagcgg ctccaccgcg 540 gtgtgatccg cgttggcggc gcagagcagc atcccagccg atttgacccc gcgcatgctc 600 cgaggcttga ggttggccag caccaccacc cgccggccga caaggtcctc cagggtcacg 660 tgccggacca ggccactcac gatggtgcga gggcccccct cctcgccgag gtcgatctgc 720 tcgacgtaca gactgcgaca tgcgtggcga gtggtcatca gaaggaagca ggtgtgcaga 780 aggggcacgt ggttggtatt gagagtagcc aaagctttgt gccaatcaga aagtcaacgc 840 agctgcctgc ctggctcgcg tacaattcct ttcttgcgct atgacacttc cagcaaaagg 900 tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat gcttcgaccc 960 cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg agcgctgttt 1020 aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc atattcaaac 1080 acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac tccgctaagg 1140 gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac ggcgcgccat gctgctgcag 1200 gccttcctgt tcctgctggc cggcttcgcc gccaagatca gcgcctccat gacgaacgag 1260 acgtccgacc gccccctggt gcacttcacc cccaacaagg gctggatgaa cgaccccaac 1320 ggcctgtggt acgacgagaa ggacgccaag tggcacctgt acttccagta caacccgaac 1380 gacaccgtct gggggacgcc cttgttctgg ggccacgcca cgtccgacga cctgaccaac 1440 tgggaggacc agcccatcgc catcgccccg aagcgcaacg actccggcgc cttctccggc 1500 tccatggtgg tggactacaa caacacctcc ggcttcttca acgacaccat cgacccgcgc 1560 cagcgctgcg tggccatctg gacctacaac accccggagt ccgaggagca gtacatctcc 1620 tacagcctgg acggcggcta caccttcacc gagtaccaga agaaccccgt gctggccgcc 1680 aactccaccc agttccgcga cccgaaggtc ttctggtacg agccctccca gaagtggatc 1740 atgaccgcgg ccaagtccca ggactacaag atcgagatct actcctccga cgacctgaag 1800 tcctggaagc tggagtccgc gttcgccaac gagggcttcc tcggctacca gtacgagtgc 1860 cccggcctga tcgaggtccc caccgagcag gaccccagca agtcctactg ggtgatgttc 1920 atctccatca accccggcgc cccggccggc ggctccttca accagtactt cgtcggcagc 1980 ttcaacggca cccacttcga ggccttcgac aaccagtccc gcgtggtgga cttcggcaag 2040 gactactacg ccctgcagac cttcttcaac accgacccga cctacgggag cgccctgggc 2100 atcgcgtggg cctccaactg ggagtactcc gccttcgtgc ccaccaaccc ctggcgctcc 2160 tccatgtccc tcgtgcgcaa gttctccctc aacaccgagt accaggccaa cccggagacg 2220 gagctgatca acctgaaggc cgagccgatc ctgaacatca gcaacgccgg cccctggagc 2280 cggttcgcca ccaacaccac gttgacgaag gccaacagct acaacgtcga cctgtccaac 2340 agcaccggca ccctggagtt cgagctggtg tacgccgtca acaccaccca gacgatctcc 2400 aagtccgtgt tcgcggacct ctccctctgg ttcaagggcc tggaggaccc cgaggagtac 2460 ctccgcatgg gcttcgaggt gtccgcgtcc tccttcttcc tggaccgcgg gaacagcaag 2520 gtgaagttcg tgaaggagaa cccctacttc accaaccgca tgagcgtgaa caaccagccc 2580 ttcaagagcg agaacgacct gtcctactac aaggtgtacg gcttgctgga ccagaacatc 2640 ctggagctgt acttcaacga cggcgacgtc gtgtccacca acacctactt catgaccacc 2700 gggaacgccc tgggctccgt gaacatgacg acgggggtgg acaacctgtt ctacatcgac 2760 aagttccagg tgcgcgaggt caagtgatta attaactcga ggcagcagca gctcggatag 2820 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 2880 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 2940 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 3000 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 3060 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 3120 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 3180 agtgggatgg gaacacaaat ggaaagcttg agctcggtac ccgtacccat cagcatccgg 3240 gtgaatcttg gcctccaaga tatggccaat cctcacatcc agcttggcaa aatcgactag 3300 actgtctgca agtgggaatg tggagcacaa ggttgcttgt agcgatcgac agactggtgg 3360 ggtacattga caggtgggca gcgccgcatc catcgtgcct gacgcgagcg ccgccggttg 3420 ctcgcccgtg cctgccgtca aagagcggca gagaaatcgg gaaccgaaaa cgtcacattg 3480 cctgatgttg ttacatgctg gactagactt tcttggcgtg ggtctgctcc tcgccaggtg 3540 cgcgacgcct cggggctggg tgcgagggag ccgtgcggcc acgcatttga caagacccaa 3600 agctcgcatc tcagacggtc aaccgttcgt attatacatt caacatatgg tacatacgca 3660 aaaagcatg 3669 <210> 127 <211> 39 <212> PRT <213> Prototheca moriformis <400> 127 Met Thr Phe Gly Val Ala Leu Pro Ala Met Gly Arg Gly Val Ser Leu 1 5 10 15 Pro Arg Pro Arg Val Ala Val Arg Ala Gln Ser Ala Ser Gln Val Leu 20 25 30 Glu Ser Gly Arg Ala Gln Leu 35 <210> 128 <211> 40 <212> PRT <213> Prototheca moriformis <400> 128 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Gln Leu 35 40 <210> 129 <211> 36 <212> PRT <213> Prototheca moriformis <400> 129 Met Ala Ser Ala Ala Phe Thr Met Ser Ala Cys Pro Ala Met Thr Gly 1 5 10 15 Arg Ala Pro Gly Ala Arg Arg Ser Gly Arg Pro Val Ala Thr Arg Leu 20 25 30 Arg Gly Arg Ala 35 <210> 130 <211> 40 <212> PRT <213> Chlorella protothecoides <400> 130 Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp 1 5 10 15 Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu 20 25 30 Pro Val Arg Gly Arg Ala Gln Leu 35 40 <210> 131 <211> 87 <212> PRT <213> Cuphea hookeriana <400> 131 Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala Pro 1 5 10 15 Gly Ala Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu 20 25 30 Ser Pro Ser Phe Lys Pro Lys Ser Ile Pro Asn Gly Gly Phe Gln Val 35 40 45 Lys Ala Asn Asp Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Ser 50 55 60 Leu Lys Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro 65 70 75 80 Pro Pro Arg Thr Phe Leu His 85 <210> 132 <211> 60 <212> PRT <213> Umbellularia californica <400> 132 Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val 1 5 10 15 Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu 20 25 30 Gln Leu Arg Ala Gly Asn Ala Pro Thr Ser Leu Lys Met Ile Asn Gly 35 40 45 Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Arg Leu 50 55 60 <210> 133 <211> 60 <212> PRT <213> Cinnamomum camphora <400> 133 Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val 1 5 10 15 Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu 20 25 30 Gln Leu Arg Ala Gly Asn Ala Gln Thr Ser Leu Lys Met Ile Asn Gly 35 40 45 Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Lys Leu 50 55 60 <210> 134 <211> 1104 <212> DNA <213> Prototheca moriformis <400> 134 atggcaccga ccagcctgct tgccagtact ggcgtctctt ccgcttctct gtggtcctct 60 gcgcgctcca gcgcgtgcgc ttttccggtg gatcatgcgg tccgtggcgc accgcagcgg 120 ccgctgccca tgcagcgccg ctgcttccga acagtggcgg tcagggccgc acccgcggta 180 gccgtccgtc cggaacccgc ccaagagttt tgggagcagc ttgagccctg caagatggcg 240 gaggacaagc gcatcttcct ggaggagcac cgcattcggg gcaacgaggt gggcccctcg 300 cagcggctga cgatcacggc ggtggccaac atcctgcagg aggcggcggg caaccacgcg 360 gtggccatgt ggggccggag ctcggagggt ttcgcgacgg acccggagct gcaggaggcg 420 ggtctcatct ttgtgatgac gcgcatgcag atccaaatgt accgctaccc gcgctggggc 480 gacctgatgc aggtggagac ctggttccag acggcgggca agctaggcgc gcagcgcgag 540 tgggtgctgc gcgacaagct gaccggcgag gcgctgggcg cggccacctc cagctgggtc 600 atgatcaaca tccgcacgcg ccggccgtgc cgcatgcccg agctcgtccg cgtcaagtcg 660 gccttcttcg cgcgcgagcc gccgcgcctg gcgctgccgc ccacggtcac gcgcgccaag 720 ctgcccaaca tcgcgacgcc ggcgccgctg cgcgggcacc gccaggtcgc gcgccgcacc 780 gacatggaca tgaacgggca cgtgaacaac gtggcctacc tggcctggtg cctggaggcc 840 gtgcccgagc acgtcttcag cgactaccac ctctaccaga tggagatcga cttcaaggcc 900 gagtgccacg cgggcgacgt catctcctcc caggccgagc agatcccgcc ccaggaggcg 960 ctcacgcaca acggcgccgg ccgcaacccc tcctgcttcg tccatagcat tctgcgcgcc 1020 gagaccgagc tcgtccgcgc gcgaaccaca tggtcggccc ccatcgacgc gcccgccgcc 1080 aagccgccca aggcgagcca ctga 1104 <210> 135 <211> 1104 <212> DNA <213> Prototheca moriformis <400> 135 atggcaccga ccagcctgct tgcccgtact ggcgtctctt ccgcttctct gtgctcctct 60 acgcgctccg gcgcgtgcgc ttttccggtg gatcatgcgg tccgtggcgc accgcagcgg 120 ccgctgccca tgcagcgccg ctgcttccga acagtggctg tcagggccgc acccgcagta 180 gccgtccgtc cggaacccgc ccaagagttt tgggagcagc ttgagccctg caagatggcg 240 gaggacaagc gcatcttcct ggaggagcac cgcattcgtg gcaacgaggt gggcccctcg 300 cagcggctga cgatcacggc ggtggccaac atcctgcagg aggcggcggg caaccacgcg 360 gtggccatgt ggggtcggag ctcggagggt ttcgcgacgg acccggagct gcaggaggcg 420 ggcctcatct ttgtgatgac gcgcatgcag atccaaatgt accgctaccc gcgctggggc 480 gacctgatgc aggtggagac ctggttccag acggcgggca agctaggcgc gcagcgcgag 540 tgggtgctgc gcgacaagct gaccggcgag gcgctgggcg cggccacctc cagctgggtc 600 atgatcaaca tccgcacgcg ccggccgtgc cgcatgcccg agctcgtccg cgtcaagtcg 660 gccttcttcg cgcgcgagcc gccgcgcctg gcgctgccgc ccgcggtcac gcgtgccaag 720 ctgcccaaca tcgcgacgcc ggcgccgctg cgcgggcacc gccaggtcgc gcgccgcacc 780 gacatggaca tgaacggcca cgtgaacaac gttgcctacc tggcctggtg cctggaggcc 840 gtgcccgagc acgtcttcag cgactaccac ctctaccaga tggagatcga cttcaaggcc 900 gagtgccacg cgggcgacgt catctcctcc caggccgagc agatcccgcc ccaggaggcg 960 ctcacgcaca acggcgccgg ccgcaacccc tcctgcttcg tccatagcat tctgcgcgcc 1020 gagaccgagc tcgtccgcgc gcgaaccaca tggtcggccc ccatcgacgc gcccgccgcc 1080 aagccgccca aggcgagcca ctga 1104 <210> 136 <211> 367 <212> PRT <213> Prototheca moriformis <400> 136 Met Ala Pro Thr Ser Leu Leu Ala Ser Thr Gly Val Ser Ser Ala Ser 1 5 10 15 Leu Trp Ser Ser Ala Arg Ser Ser Ala Cys Ala Phe Pro Val Asp His 20 25 30 Ala Val Arg Gly Ala Pro Gln Arg Pro Leu Pro Met Gln Arg Arg Cys 35 40 45 Phe Arg Thr Val Ala Val Arg Ala Ala Pro Ala Val Ala Val Arg Pro 50 55 60 Glu Pro Ala Gln Glu Phe Trp Glu Gln Leu Glu Pro Cys Lys Met Ala 65 70 75 80 Glu Asp Lys Arg Ile Phe Leu Glu Glu His Arg Ile Arg Gly Asn Glu 85 90 95 Val Gly Pro Ser Gln Arg Leu Thr Ile Thr Ala Val Ala Asn Ile Leu 100 105 110 Gln Glu Ala Ala Gly Asn His Ala Val Ala Met Trp Gly Arg Ser Ser 115 120 125 Glu Gly Phe Ala Thr Asp Pro Glu Leu Gln Glu Ala Gly Leu Ile Phe 130 135 140 Val Met Thr Arg Met Gln Ile Gln Met Tyr Arg Tyr Pro Arg Trp Gly 145 150 155 160 Asp Leu Met Gln Val Glu Thr Trp Phe Gln Thr Ala Gly Lys Leu Gly 165 170 175 Ala Gln Arg Glu Trp Val Leu Arg Asp Lys Leu Thr Gly Glu Ala Leu 180 185 190 Gly Ala Ala Thr Ser Ser Trp Val Met Ile Asn Ile Arg Thr Arg Arg 195 200 205 Pro Cys Arg Met Pro Glu Leu Val Arg Val Lys Ser Ala Phe Phe Ala 210 215 220 Arg Glu Pro Pro Arg Leu Ala Leu Pro Pro Thr Val Thr Arg Ala Lys 225 230 235 240 Leu Pro Asn Ile Ala Thr Pro Ala Pro Leu Arg Gly His Arg Gln Val 245 250 255 Ala Arg Arg Thr Asp Met Asp Met Asn Gly His Val Asn Asn Val Ala 260 265 270 Tyr Leu Ala Trp Cys Leu Glu Ala Val Pro Glu His Val Phe Ser Asp 275 280 285 Tyr His Leu Tyr Gln Met Glu Ile Asp Phe Lys Ala Glu Cys His Ala 290 295 300 Gly Asp Val Ile Ser Ser Gln Ala Glu Gln Ile Pro Pro Gln Glu Ala 305 310 315 320 Leu Thr His Asn Gly Ala Gly Arg Asn Pro Ser Cys Phe Val His Ser 325 330 335 Ile Leu Arg Ala Glu Thr Glu Leu Val Arg Ala Arg Thr Thr Trp Ser 340 345 350 Ala Pro Ile Asp Ala Pro Ala Ala Lys Pro Pro Lys Ala Ser His 355 360 365 <210> 137 <211> 367 <212> PRT <213> Prototheca moriformis <400> 137 Met Ala Pro Thr Ser Leu Leu Ala Arg Thr Gly Val Ser Ser Ala Ser 1 5 10 15 Leu Cys Ser Ser Thr Arg Ser Gly Ala Cys Ala Phe Pro Val Asp His 20 25 30 Ala Val Arg Gly Ala Pro Gln Arg Pro Leu Pro Met Gln Arg Arg Cys 35 40 45 Phe Arg Thr Val Ala Val Arg Ala Ala Pro Ala Val Ala Val Arg Pro 50 55 60 Glu Pro Ala Gln Glu Phe Trp Glu Gln Leu Glu Pro Cys Lys Met Ala 65 70 75 80 Glu Asp Lys Arg Ile Phe Leu Glu Glu His Arg Ile Arg Gly Asn Glu 85 90 95 Val Gly Pro Ser Gln Arg Leu Thr Ile Thr Ala Val Ala Asn Ile Leu 100 105 110 Gln Glu Ala Ala Gly Asn His Ala Val Ala Met Trp Gly Arg Ser Ser 115 120 125 Glu Gly Phe Ala Thr Asp Pro Glu Leu Gln Glu Ala Gly Leu Ile Phe 130 135 140 Val Met Thr Arg Met Gln Ile Gln Met Tyr Arg Tyr Pro Arg Trp Gly 145 150 155 160 Asp Leu Met Gln Val Glu Thr Trp Phe Gln Thr Ala Gly Lys Leu Gly 165 170 175 Ala Gln Arg Glu Trp Val Leu Arg Asp Lys Leu Thr Gly Glu Ala Leu 180 185 190 Gly Ala Ala Thr Ser Ser Trp Val Met Ile Asn Ile Arg Thr Arg Arg 195 200 205 Pro Cys Arg Met Pro Glu Leu Val Arg Val Lys Ser Ala Phe Phe Ala 210 215 220 Arg Glu Pro Pro Arg Leu Ala Leu Pro Pro Ala Val Thr Arg Ala Lys 225 230 235 240 Leu Pro Asn Ile Ala Thr Pro Ala Pro Leu Arg Gly His Arg Gln Val 245 250 255 Ala Arg Arg Thr Asp Met Asp Met Asn Gly His Val Asn Asn Val Ala 260 265 270 Tyr Leu Ala Trp Cys Leu Glu Ala Val Pro Glu His Val Phe Ser Asp 275 280 285 Tyr His Leu Tyr Gln Met Glu Ile Asp Phe Lys Ala Glu Cys His Ala 290 295 300 Gly Asp Val Ile Ser Ser Gln Ala Glu Gln Ile Pro Pro Gln Glu Ala 305 310 315 320 Leu Thr His Asn Gly Ala Gly Arg Asn Pro Ser Cys Phe Val His Ser 325 330 335 Ile Leu Arg Ala Glu Thr Glu Leu Val Arg Ala Arg Thr Thr Trp Ser 340 345 350 Ala Pro Ile Asp Ala Pro Ala Ala Lys Pro Pro Lys Ala Ser His 355 360 365 <210> 138 <211> 328 <212> PRT <213> Cuphea hookeriana <400> 138 Gln Leu Pro Asp Trp Ser Arg Leu Leu Thr Ala Ile Thr Thr Val Phe 1 5 10 15 Val Lys Ser Lys Arg Pro Asp Met His Asp Arg Lys Ser Lys Arg Pro 20 25 30 Asp Met Leu Val Asp Ser Phe Gly Leu Glu Ser Thr Val Gln Asp Gly 35 40 45 Leu Val Phe Arg Gln Ser Phe Ser Ile Arg Ser Tyr Glu Ile Gly Thr 50 55 60 Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr 65 70 75 80 Ser Leu Asn His Cys Lys Ser Thr Gly Ile Leu Leu Asp Gly Phe Gly 85 90 95 Arg Thr Leu Glu Met Cys Lys Arg Asp Leu Ile Trp Val Val Ile Lys 100 105 110 Met Gln Ile Lys Val Asn Arg Tyr Pro Ala Trp Gly Asp Thr Val Glu 115 120 125 Ile Asn Thr Arg Phe Ser Arg Leu Gly Lys Ile Gly Met Gly Arg Asp 130 135 140 Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu Ile Leu Val Arg Ala Thr 145 150 155 160 Ser Ala Tyr Ala Met Met Asn Gln Lys Thr Arg Arg Leu Ser Lys Leu 165 170 175 Pro Tyr Glu Val His Gln Glu Ile Val Pro Leu Phe Val Asp Ser Pro 180 185 190 Val Ile Glu Asp Ser Asp Leu Lys Val His Lys Phe Lys Val Lys Thr 195 200 205 Gly Asp Ser Ile Gln Lys Gly Leu Thr Pro Gly Trp Asn Asp Leu Asp 210 215 220 Val Asn Gln His Val Ser Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu 225 230 235 240 Ser Met Pro Thr Glu Val Leu Glu Thr Gln Glu Leu Cys Ser Leu Ala 245 250 255 Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Glu Ser Val 260 265 270 Thr Ala Met Asp Pro Ser Lys Val Gly Val Arg Ser Gln Tyr Gln His 275 280 285 Leu Leu Arg Leu Glu Asp Gly Thr Ala Ile Val Asn Gly Ala Thr Glu 290 295 300 Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly Ala Ile Ser Thr Gly Lys 305 310 315 320 Thr Ser Asn Gly Asn Ser Val Ser 325 <210> 139 <211> 322 <212> PRT <213> Umbellularia californica <400> 139 Pro Asp Trp Ser Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala 1 5 10 15 Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Lys Leu 20 25 30 Pro Gln Leu Leu Asp Asp His Phe Gly Leu His Gly Leu Val Phe Arg 35 40 45 Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr 50 55 60 Ser Ile Leu Ala Val Met Asn His Met Gln Glu Ala Thr Leu Asn His 65 70 75 80 Ala Lys Ser Val Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu 85 90 95 Met Ser Lys Arg Asp Leu Met Trp Val Val Arg Arg Thr His Val Ala 100 105 110 Val Glu Arg Tyr Pro Thr Trp Gly Asp Thr Val Glu Val Glu Cys Trp 115 120 125 Ile Gly Ala Ser Gly Asn Asn Gly Met Arg Arg Asp Phe Leu Val Arg 130 135 140 Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val 145 150 155 160 Leu Met Asn Thr Arg Thr Arg Arg Leu Ser Thr Ile Pro Asp Glu Val 165 170 175 Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp 180 185 190 Asp Glu Ile Lys Lys Leu Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr 195 200 205 Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln 210 215 220 His Val Asn Asn Leu Lys Tyr Val Ala Trp Val Phe Glu Thr Val Pro 225 230 235 240 Asp Ser Ile Phe Glu Ser His His Ile Ser Ser Phe Thr Leu Glu Tyr 245 250 255 Arg Arg Glu Cys Thr Arg Asp Ser Val Leu Arg Ser Leu Thr Thr Val 260 265 270 Ser Gly Gly Ser Ser Glu Ala Gly Leu Val Cys Asp His Leu Leu Gln 275 280 285 Leu Glu Gly Gly Ser Glu Val Leu Arg Ala Arg Thr Glu Trp Arg Pro 290 295 300 Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Pro 305 310 315 320 Arg Val <210> 140 <211> 345 <212> PRT <213> Cinnamomum camphora <400> 140 Pro Asp Trp Ser Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala 1 5 10 15 Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Asn Pro 20 25 30 Pro Gln Leu Leu Asp Asp His Phe Gly Pro His Gly Leu Val Phe Arg 35 40 45 Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr 50 55 60 Ser Ile Val Ala Val Met Asn His Leu Gln Glu Ala Ala Leu Asn His 65 70 75 80 Ala Lys Ser Val Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu 85 90 95 Met Ser Lys Arg Asp Leu Ile Trp Val Val Lys Arg Thr His Val Ala 100 105 110 Val Glu Arg Tyr Pro Ala Trp Gly Asp Thr Val Glu Val Glu Cys Trp 115 120 125 Val Gly Ala Ser Gly Asn Asn Gly Arg Arg His Asp Phe Leu Val Arg 130 135 140 Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val 145 150 155 160 Met Met Asn Thr Arg Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val 165 170 175 Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp 180 185 190 Glu Glu Ile Lys Lys Pro Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr 195 200 205 Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn Asp Leu Asp Ile Asn Gln 210 215 220 His Val Asn Asn Ile Lys Tyr Val Asp Trp Ile Leu Glu Thr Val Pro 225 230 235 240 Asp Ser Ile Phe Glu Ser His His Ile Ser Ser Phe Thr Ile Glu Tyr 245 250 255 Arg Arg Glu Cys Thr Met Asp Ser Val Leu Gln Ser Leu Thr Thr Val 260 265 270 Ser Gly Gly Ser Ser Glu Ala Gly Leu Val Cys Glu His Leu Leu Gln 275 280 285 Leu Glu Gly Gly Ser Glu Val Leu Arg Ala Lys Thr Glu Trp Arg Pro 290 295 300 Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Ser 305 310 315 320 Ser Val Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp 325 330 335 Ile Asp Tyr Lys Asp Asp Asp Asp Lys 340 345 <210> 141 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 141 Lys Asp Glu Leu 1 <210> 142 <211> 6 <212> PRT <213> Unknown <220> <223> Description of Unknown: Higher plant fatty acyl-ACP thioesterase sequence <400> 142 Leu Asp Met Asn Gln His 1 5 <210> 143 <211> 6 <212> PRT <213> Unknown <220> <223> Description of Unknown: Algal fatty acyl-ACP thioesterase sequence <400> 143 Met Asp Met Asn Gly His 1 5

Claims

(i) 프로토테카(Prototheca) 속의 세포로부터 분리된 오일을 제공하는 단계로서, 상기 세포는 스테아로일 ACP 데사투라제를 암호화하는 외인성 유전자; 또는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 포함하거나; 내인성 스테아로일 ACP 데사투라제 유전자의 발현이 제거(ablation)된 것인, 단계;
(ii) 오일이,
(a) 4% 이상의 C8-C14의 지방산 프로필; 및
(b) i. 0.4 마이크로그램/ml 미만의 총 카로테노이드;
ii. 0.001 마이크로그램/ml 미만의 리코펜;
iii. 0.02 마이크로그램/ml 미만의 베타 카로틴;
iv. 오일 킬로그램당 0.02 밀리그램 미만의 클로로필;
v. 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤;
vi. 오일 100 그램당 3-9 mg의 캄페스테롤; 및
vii. 오일 그램당 0.5 밀리그램 미만의 총 토코트리에놀 중 하나 이상의 특성을 갖는, 분리된 트리글리세라이드 오일에 트랜스에스테르화, 수소화, 수소크랙킹화, 탈산소화, 이성체화, 상호에스테르화, 하이드록실화, 가수분해 및 비누화로 이루어진 그룹으로부터 선택되는 하나 이상의 화학적 반응을 수행하는 단계를 포함하는, 화학물질의 제조 방법.
제1항에 있어서, 상기 세포가 외인성 슈크로스 인버타제 유전자를 추가로 포함하는 방법.
제1항 또는 제2항에 있어서, 가수분해 반응을 수행함을 포함하는 방법.
제3항에 있어서, 가수분해 반응이 비누화, 산 가수분해, 알칼린 가수분해, 효소적 가수분해, 촉매 가수분해 및 고온-압착 물 가수분해로 이루어진 그룹으로부터 선택되는 가수분해 반응을 포함하는 방법.
제3항에 있어서, 가수분해 반응이 촉매 가수분해 반응을 포함하고 오일이 글리세롤 및 지방산으로 분해되는 방법.
제5항에 있어서, 형성된 지방산이 아민화 반응을 진행하여 지방 질소 화합물을 생성하는 방법.
제5항에 있어서, 형성된 지방산이 오존가수분해 반응을 진행하여 1염기성 및 2염기성 산을 생성하는 방법.
제1항 또는 제2항에 있어서, 가수분해 반응이 효소적 분해 및 압력 분해로 이루어진 그룹으로부터 선택되는 트리글리세라이드 분해 방법인 방법.
제3항에 있어서, 가수분해 반응이 비누화 반응을 포함하는 방법.
제1항 또는 제2항에 있어서, 응축 반응이 가수분해 반응 후 수행되는 방법.
(i) 프로토테카(Prototheca) 속의 세포로부터 분리된 오일을 제공하는 단계로서, 상기 세포는 스테아로일 ACP 데사투라제를 암호화하는 외인성 유전자; 또는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 포함하거나; 내인성 스테아로일 ACP 데사투라제 유전자의 발현이 제거(ablation)된 것인, 단계;
(ii) 분리된 트리글리세라이드 오일이,
(a) 4% 이상의 C8-C14의 지방산 프로필; 및
(b) i. 0.4 마이크로그램/ml 미만의 총 카로테노이드;
ii. 0.001 마이크로그램/ml 미만의 리코펜;
iii. 0.02 마이크로그램/ml 미만의 베타 카로틴;
iv. 오일 킬로그램당 0.02 밀리그램 미만의 클로로필;
v. 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤;
vi. 오일 100 그램당 3-9 mg의 캄페스테롤; 및
vii. 오일 그램당 0.5 밀리그램 미만의 총 토코트리에놀 중 하나 이상의 특성을 갖는, 분리된 트리글리세라이드 오일에 수소화처리 반응을 수행하는 단계를 포함하는, 화학물질을 제조하는 방법.
제11항에 있어서, 상기 세포가 외인성 슈크로스 인버타제 유전자를 추가로 포함하는 방법.
제11항 또는 제12항에 있어서, 수소화처리 반응 생성물이 탈산소화 반응에 적용되는 방법.
제11항 또는 제12항에 있어서, 오일이 수소화처리 반응의 수행 전에 탈산소화 반응에 적용되는 방법.
제11항 또는 제12항에 있어서, 오일이 수소화처리 반응 및 탈산소화 반응에 동시에 적용되는 방법.
제11항 또는 제12항에 있어서, 이성체화 반응을 추가로 포함하는 방법.
제11항 또는 제12항에 있어서, 가스 제거 반응을 추가로 포함하는 방법.
제11항 또는 제12항에 있어서, 응축 반응이 수소화처리 반응 후 수행되는 방법.
(i) 프로토테카(Prototheca) 속의 세포로부터 분리된 오일을 제공하는 단계로서, 상기 세포는 스테아로일 ACP 데사투라제를 암호화하는 외인성 유전자; 또는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 포함하거나; 내인성 스테아로일 ACP 데사투라제 유전자의 발현이 제거(ablation)된 것인, 단계;
(ii) 분리된 트리글리세라이드 오일이,
(a) 4% 이상의 C8-C14의 지방산 프로필; 및
(b) i. 0.4 마이크로그램/ml 미만의 총 카로테노이드;
ii. 0.001 마이크로그램/ml 미만의 리코펜;
iii. 0.02 마이크로그램/ml 미만의 베타 카로틴;
iv. 오일 킬로그램당 0.02 밀리그램 미만의 클로로필;
v. 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤;
vi. 오일 100 그램당 3-9 mg의 캄페스테롤; 및
vii. 오일 그램당 0.5 밀리그램 미만의 총 토코트리에놀 중 하나 이상의 특성을 갖는, 분리된 트리글리세라이드 오일에 수소가수분해 반응, 수소화, 연속 수소화-수소가수분해 반응, 연속 수소가수분해-수소화 반응 및 조합된 수소화-수소가수분해 반응으로 이루어진 그룹으로부터 선택되는 탈산소화 반응을 수행하는 단계를 포함하는, 화학물질을 제조하는 방법.
제19항에 있어서, 상기 세포가 외인성 슈크로스 인버타제 유전자를 추가로 포함하는 방법.
제19항 또는 제20항에 있어서, 응축 반응이 탈산소화 반응 후 수행되는 방법.
(i) 프로토테카(Prototheca) 속의 세포로부터 분리된 오일을 제공하는 단계로서, 상기 세포는 스테아로일 ACP 데사투라제를 암호화하는 외인성 유전자; 또는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 포함하거나; 내인성 스테아로일 ACP 데사투라제 유전자의 발현이 제거(ablation)된 것인, 단계;
(ii) 분리된 트리글리세라이드 오일이,
(a) 4% 이상의 C8-C14의 지방산 프로필; 및
(b) i. 0.4 마이크로그램/ml 미만의 총 카로테노이드;
ii. 0.001 마이크로그램/ml 미만의 리코펜;
iii. 0.02 마이크로그램/ml 미만의 베타 카로틴;
iv. 오일 킬로그램당 0.02 밀리그램 미만의 클로로필;
v. 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤;
vi. 오일 100 그램당 3-9 mg의 캄페스테롤; 및
vii. 오일 그램당 0.5 밀리그램 미만의 총 토코트리에놀 중 하나 이상의 특성을 갖는, 분리된 트리글리세라이드 오일에 에스테르화 반응을 수행하는 단계를 포함하는, 화학물질을 제조하는 방법.
제22항에 있어서, 상기 세포가 외인성 슈크로스 인버타제 유전자를 추가로 포함하는 방법.
제22항 또는 제23항에 있어서, 에스테르화 반응이 상호에스테르화 반응을 포함하는 방법.
제22항 또는 제23항에 있어서, 에스테르화 반응이 트랜스에스테르화 반응을 포함하는 방법.
제22항 또는 제23항에 있어서, 응축 반응이 에스테르화 반응 후 수행되는 방법.
(i) 프로토테카(Prototheca) 속의 세포로부터 분리된 오일을 제공하는 단계로서, 상기 세포는 스테아로일 ACP 데사투라제를 암호화하는 외인성 유전자; 또는 지방 아실-ACP 티오에스테라제를 암호화하는 외인성 유전자를 포함하거나; 내인성 스테아로일 ACP 데사투라제 유전자의 발현이 제거(ablation)된 것인, 단계;
(ii) 분리된 트리글리세라이드 오일이,
(a) 4% 이상의 C8-C14의 지질 프로필; 및
(b) i. 0.4 마이크로그램/ml 미만의 총 카로테노이드;
ii. 0.001 마이크로그램/ml 미만의 리코펜;
iii. 0.02 마이크로그램/ml 미만의 베타 카로틴;
iv. 오일 킬로그램당 0.02 밀리그램 미만의 클로로필;
v. 오일 100그램당 0.40-0.60 밀리그램의 감마 토코페롤;
vi. 오일 100 그램당 3-9 mg의 캄페스테롤; 및
vii. 오일 그램당 0.5 밀리그램 미만의 총 토코트리에놀 중 하나 이상의 특성을 갖는, 분리된 트리글리세라이드 오일에 하이드록실화 반응을 수행하는 단계를 포함하는, 화학물질을 제조하는 방법.
제27항에 있어서, 상기 세포가 외인성 슈크로스 인버타제 유전자를 추가로 포함하는 방법.
제27항 또는 제28항에 있어서, 응축 반응이 하이드록실화 반응 후 수행되는 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제