KR102148462B1 - 종속영양 미생물유기체로부터 생성된 맞춤 오일 - Google Patents

종속영양 미생물유기체로부터 생성된 맞춤 오일 Download PDF

Info

Publication number
KR102148462B1
KR102148462B1 KR1020187031842A KR20187031842A KR102148462B1 KR 102148462 B1 KR102148462 B1 KR 102148462B1 KR 1020187031842 A KR1020187031842 A KR 1020187031842A KR 20187031842 A KR20187031842 A KR 20187031842A KR 102148462 B1 KR102148462 B1 KR 102148462B1
Authority
KR
South Korea
Prior art keywords
delete delete
acyl
oil
microalgae
gene
Prior art date
Application number
KR1020187031842A
Other languages
English (en)
Other versions
KR20180122486A (ko
Inventor
스코트 프랭클린
아라빈드 소만치
자니스 위
조지 루덴코
제프리 엘 모슬리
월트 라키트스카이
Original Assignee
테라비아 홀딩스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 테라비아 홀딩스 인코포레이티드 filed Critical 테라비아 홀딩스 인코포레이티드
Publication of KR20180122486A publication Critical patent/KR20180122486A/ko
Application granted granted Critical
Publication of KR102148462B1 publication Critical patent/KR102148462B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D7/00Edible oil or fat compositions containing an aqueous phase, e.g. margarines
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/158Fatty acids; Fats; Products containing oils or fats
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B1/00Production of fats or fatty oils from raw materials
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11CFATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
    • C11C3/00Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2431Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2465Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on alpha-galactose-glycoside bonds, e.g. alpha-galactosidase (3.2.1.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6463Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/19Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with oxidation of a pair of donors resulting in the reduction of molecular oxygen to two molecules of water (1.14.19)
    • C12Y114/19001Stearoyl-CoA 9-desaturase (1.14.19.1), i.e. DELTA9-desaturase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • C12Y301/02014Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01022Alpha-galactosidase (3.2.1.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01026Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P30/00Technologies relating to oil refining and petrochemical industry
    • Y02P30/20Technologies relating to oil refining and petrochemical industry using bio-feedstock
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T50/00Aeronautics or air transport
    • Y02T50/60Efficient propulsion technologies, e.g. for aircraft
    • Y02T50/678Aviation using fuels of non-fossil origin

Abstract

오일-함유 미생물 유기체 및 이러한 미생물 유기체의 저비용 배양방법을 포함하는, 오일, 연료, 함유화학물질, 및 재조합 미생물 유기체 내 다른 화합물의 생성을 위한 방법 및 조성물이 제공된다. 예를 들어 리파제, 수크로스 수송체, 수크로스 인버타제, 프럭토키나제, 다당류-분해 효소, 케토 아실-ACP 신타제 효소, 지방 아실-ACP 티오에스터라제, 지방 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 알데하이드 데카보닐라제를 함유하는 미세조류 세포, 및/또는 아실 운반체 단백질은 재생 디젤, 바이오디젤, 및 재생 제트 연료와 같은 운송 연료의 제조뿐만 아니라 기능성 유체, 계면활성제, 비누 및 윤활제의 제조에 유용하다.

Description

종속영양 미생물유기체로부터 생성된 맞춤 오일{TAILORED OILS PRODUCED FROM RECOMBINANT HETEROTROPHIC MICROORGANISMS}
관련출원과의 상호참조
본 출원은 미국 특허법(35 U.S.C. 119(e)) 하에서 2010년 5월 28일 출원된 미국 가특허출원 제61/349,774호, 2010년 8월 18일 출원된 미국 가특허출원 제61/374,992호, 2010년 11월 16일 출원된 미국 가특허출원 제61/414,393호, 및 2010년 12월 29일 출원된 미국 가특허출원 제61/428,192호의 우선권을 주장한다. 각각의 이들 출원은 그것의 전문이 모든 목적을 위하여 본 명세서에 참조로 포함된다.
서열목록에 대한 참조
본 출원은 본 명세서에 첨부된 1 내지 195 페이지에 나타낸 것과 같은 서열목록을 포함한다.
본 발명의 기술분야
본 발명은 미생물 유기체로부터 만들어진 오일, 연료, 및 함유화학물질(oleochemical)의 생산에 관한 것이다. 특히, 본 명세서는 오일-함유 미세조류(microalgae), 지질, 지방산 에스터, 지방산, 알데하이드, 알코올, 및 알칸을 포함하는 유용한 화합물의 생산을 위해 그것들을 배양하는 방법, 및 그것들을 유전적으로 변경하여 생산 효율을 개선하고 그것들에 의해 생성된 오일의 유형 및 조성을 변경시키는 방법 및 시약에 관한 것이다.
화석연료는 유기물질의 매장된 가연성 퇴적물에 대한 일반적 용어이며, 부패한 식물 및 동물이 수억년에 걸쳐 지각 내 열 및 압력에 노출됨으로써 원유, 석탄, 천연가스 또는 중유로 변환되어 형성된다. 화석연료는 한정된 비-재생 자원이다. 세계 경제에 의해 증가된 에너지 수요는 또한 탄화수소 비용 증가의 압력에 놓여있다. 에너지 이외에, 플라스틱 및 화학물질 제조자를 포함하는 다수의 산업은 그들의 공정을 위한 공급원료로서 탄화수소의 유용성에 크게 의존한다. 현존하는 공급원에 대해 비용-효과적인 대체물은 증가하는 에너지 및 이들 원료 비용상의 압력을 완화시킬 수 있었다.
국제특허 공개 제2008/151149호는 오일생성을 위한 미세조류 배양 방법 및 재료를 기재하며, 특히 미세조류 클로렐라 프로토테코이데스(Chlorella protothecoides)에 의해 생성된 오일로부터 디젤 연료의 생성을 예시한다. 미세조류 내 오일 생성을 위한 개선된 방법, 특히 더 짧은 쇄 길이 및 더 높은 포화도를 가지며, 색소가 없는 오일을 더 큰 수율과 효율로 생성하는 방법에 대한 필요가 남아있다. 본 방법은 이런 필요를 충족시킨다.
본 발명은 별개의 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공하며, 지방-아실 ACP 티오에스터라제와 같은 단백질을 암호화하는 외인성 유전자를 발현시키는 재조합 세포를 포함한다. 본 발명은 또한 이러한 세포로부터 바이오디젤, 재생 디젤 및 제트 연료를 포함하는 지질 및 오일-기재 제품(oil-based product)을 만드는 방법을 제공한다.
제1 양태에서, 본 발명은 적어도 1% 또는 적어도 5%, 바람직하게는 적어도 3%의 C8:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 10% 또는 적어도 15%, 바람직하게는 적어도 12%, C8:0이다. 일부 실시형태에서, 세포는 재조합 세포이다. 일부 경우에, 재조합 세포는 쇄 길이 C8의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 외인성 유전자는 쿠페아 팔루스트리스(Cuphea palustris) 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 세포는 프로토테카(prototheca) 세포이다. 일부 경우에, 세포는 표 1에서 확인되는 미세조류로부터 선택되는 미세조류 속 또는 종을 가진다.
제2 양태에서, 본 발명은 적어도 4%의 C10:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 20%, 적어도 25% 또는 적어도 30%, 바람직하게는 적어도 24%, C10:0이다. 일부 경우에, C10:0 대 C12:0의 비는 적어도 6:1이다. 일부 실시형태에서, 세포는 재조합 세포이다. 일부 경우에, 재조합 세포는 쇄 길이 C10의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 외인성 유전자는 쿠페아 후커리아나(Cuphea hookeriana) 및 미국 느릅나무(Ulmus americana)로 이루어진 군으로부터 선택된 종으로부터의 아실-ACP 티오에스터라제 단백질을 암호화한다. 일부 경우에, 세포는 프로노테카 세포이다. 일부 실시형태에서, 세포는 표 1에서 확인되는 미세조류로부터 선택된 미세조류속 또는 종을 가진다.
제3 양태에서, 본 발명은 적어도 10% 또는 적어도 15%, 바람직하게는 적어도 13%, C12:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 30%, 적어도 35% 또는 적어도 40%, 바람직하게는 적어도 34%, C12:0이다. 일부 경우에, C12 대 C14의 비는 적어도 5:1이다. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C12의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 경우에, 재조합 세포는 쇄 길이 C12의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 캘리포니아 월계수(Umbellularia californica) 및 녹나무(Cinnamomum camphora)로부터의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함한다. 일부 실시형태에서, 세포는 프로토테카 세포이다.
제4양태에서, 본 발명은 적어도 5% 또는 적어도 15%, 바람직하게는 적어도 10%, C14:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 40%, 적어도 45%, 또는 적어도 50%, 바람직하게는 적어도 43%, C14:0이다. 일부 경우에, C14:0 대 C12:0의 비는 적어도 7:1이다. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 장쇄 C14의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 아실-ACP 티오에스터라제 단백질은 녹나무 및 미국 느릅나무로 이루어진 군으로부터 선택된 종으로부터 유래된다. 일부 경우에, 세포는 프로토테카 세포이다. 일부 실시형태에서, 세포는 표 1에서 확인되는 미세조류로부터 선택된 미세조류 속 또는 종을 가진다.
제5 양태에서, 본 발명은 적어도 10% 또는 적어도 20%, 바람직하게는 적어도 15%, C16:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 30%, 적어도 35% 또는 적어도 40%, 바람직하게는 적어도 37%, C16:0. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C16의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C16의 지방 아실-ACP 기질에 대한 가수분해 활성을 가지는 캘리포니아 월계수 및 녹나무로부터의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함한다. 일부 경우에, 세포는 프로토테카 세포이다.
제6 양태에서, 본 발명은 적어도 55% 또는 적어도 65%, 바람직하게는 적어도 60%, 포화 지방산인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 세포는 적어도 80%, 적어도 85%, 또는 적어도 90%, 바람직하게는 적어도 86%, 포화된 지방산인 지질 프로파일을 가진다. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C10-C16의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 세포는 케토아실 신타제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 경우에, 세포는 프로토테카 세포이다.
제7 양태에서, 본 발명은 돌연변이된 내인성 불포화효소 유전자를 포함하는, 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공하되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다. 일부 경우에, 세포는 적어도 40% 또는 적어도 50%, 바람직하게는 적어도 45%, 포화된 지방산인 지질 프로파일을 가진다. 일부 경우에, 세포는 적어도 15%, 적어도 20% 또는 적어도 25%, 바람직하게는 적어도 19%, C18:0인 지질 프로파일을 가진다. 일부 실시형태에서, 세포는 야생형 세포와 비교하여 C18:0 지방산에서 적어도 2배 증가를 초래하는 돌연변이된 내인성 불포화효소를 포함한다. 일부 경우에, 미세조류 세포는 1% 이하 또는 5% 이하, 바람직하게는 2% 이하, C18:2인 지질 프로파일이다. 일부 실시형태에서, 미세조류 세포는 5% 이하, 또는 10% 이하, 바람직하게는 7%, 18:1인 지질 프로파일을 가진다.
본 명세서에 논의되는 재조합 세포의 일부 실시형태에서, 해당 세포는 돌연변이된 내인성 불포화효소 유전자를 포함하되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다.
제8 양태에서, 본 발명은 지질 제조 방법을 제공한다. 한 실시형태에서, 본 발명은 (a) 상기 세포가 건조중량으로 적어도 15% 또는 적어도 25%, 바람직하게는 적어도 20%의 지질일 때까지 상기 논의한 세포를 배양하는 단계, 및 (b) 수용성 바이오매스 성분으로부터 지질을 분리하는 단계를 포함한다.
제9 양태에서, 본 발명은 다른 지질 제조방법을 제공한다. 한 실시형태에서, 본 방법은 (a) 두 개의 별개의 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자를 함유하는 유지성 미생물, 바람직하게는 미세조류 세포를 배양하는 단계(해당 세포의 지질 프로파일은 (i) 외인성 유전자가 없는 세포의 프로파일, 및 (ii) 외인성 유전자 중 단지 하나를 가지는 세포의 프로파일과 다름), (b) 수용성 바이오매스 성분으로부터 지질을 분리하는 단계를 포함한다. 일부 경우에, 외인성 유전자 중 적어도 하나는 표 4에서 확인된 티오에스터라제로 이루어진 군으로부터 선택된 지방 아실-ACP 티오에스터라제를 암호화한다.
제10 양태에서, 본 발명은 오일-기재 제품을 만드는 방법을 제공한다. 한 실시형태에서, 해당 방법은 (a) 세포가 건조중량으로 적어도 5% 또는 적어도 15%, 바람직하게는 적어도 10%의 지질이 될 때까지 상기 논의한 바와 같은 세포를 배양하는 단계, (b) 수용성 바이오매스 성분으로부터 지질을 분리하는 단계, 및 (c) 지질에 비누화, 복분해; 산 가수분해; 알칼리 가수분해; 효소적 가수분해; 촉매적 가수분해; 열간 압수(hot-compressed water) 가수분해; 촉매적 가수분해 반응(해당 지질은 글라이세롤 및 지방산으로 분할된다); 지방 질소 화합물을 생성하기 위한 아미노화 반응; 1염기성 및 2염기성-산을 생성하기 위한 오존분해 반응; 효소적 분열 및 압력 분열로 이루어진 군으로부터 선택된 트라이글라이세라이드 분열 반응; 가수분해 반응 다음의 축합 반응; 수소화 처리 반응; 수소화처리 반응 및 탈산소 반응 또는 수소화처리 전 또는 동시에 축합 반응; 기체 제거 반응; 수소화개열반응(hydrogenolysis reaction), 수소화, 연속적 수소화-수소화개열 반응, 연속적 수소화개열반응-수소화 반응, 및 조합된 수소화-수소화개열 반응으로 이루어진 군으로부터 선택된 탈산소 반응; 탈산소 반응 후 축합 반응; 에스터화 반응; 에스터교환 반응(interesterification); 에스터결합전이(transesterification) 반응; 하이드록실화 반응; 및 하이드록실화 반응 후 축합 반응으로 이루어진 군으로부터 선택된 적어도 하나의 화학 반응을 실시하는 단계를 포함하며, 이에 의해 오일-기재 제품이 생성된다.
일부 경우에, 오일-기재 제품은 비누 또는 연료 제품으로부터 선택된다. 일부 실시형태에서, 오일-기재 제품은 바이오디젤, 재생 디젤, 및 제트 연료로 이루어진 군으로부터 선택된 연료 제품이다. 일부 경우에, 연료 제품은 다음의 속성 중 하나 이상을 갖는 바이오디젤이다: (i) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05-0.244mcg/g, 전체 카로테노이드; (ii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 라이코펜; (iii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 베타 카로텐; (iv) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045-0.268mcg/g, 엽록소 A; (v) 1-500mcg/g, 35-175mcg/g, 바람직하게는 38.3-164mcg/g, 감마 토코페롤; (vi) 1% 미만, 0.5% 미만, 바람직하게는 0.25% 미만, 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6-325.3mcg/g, 전체 토코트라이엔올; (viii) 0.001-0.1mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003-0.039mcg/g, 루테인; 또는 (ix) 10-500mcg/g, 50-300mcg/g, 바람직하게는 60.8-261.7mcg/g, 토코페롤. 일부 경우에, 연료 제품은 적어도 20℃, 40℃ 또는 60℃의 T10-T90을 가지는 재생 디젤이다. 일부 경우에, 연료 제품은 HRJ-5 및/또는 ASTM 세부항목 D1655를 충족시키는 제트 연료이다.
제11 양태에서, 본 발명은 (a) 적어도 3% C8:0, 적어도 4% C10:0, 적어도 13% C12:0, 적어도 10% C14:0, 및/또는 적어도 60% 포화된 지방산의 지질 프로파일, 및 (b) 다음의 속성 중 하나 이상: (i) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05-0.244mcg/g, 전체 카로테노이드; (ii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 라이코펜; (iii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 베타 카로텐; (iv) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045-0.268mcg/g, 엽록소 A; (v) 1-300mcg/g, 35-175mcg/g, 바람직하게는 38.3-164mcg/g, 감마 토코페롤; (vi) 1% 미만, 0.5% 미만, 바람직하게는 0.25% 미만, 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6-325.3mcg/g, 전체 토코트라이엔올; (viii) 0.001-0.1mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003-0.039mcg/g, 루테인; 또는 (ix) 10-500mcg/g, 50-300mcg/g, 바람직하게는 60.8-261.7mcg/g, 토코페롤을 포함하는 트라이글라이세라이드 오일을 제공한다.
제12 양태에서, 본 발명은 적어도 5:1의 C8:C10 지방산 비를 가지는 미세조류로부터 분리된 오일을 제공한다. 관련된 양태에서, 본 발명은 적어도 50% 내지 75%, 바람직하게는 적어도 60%, 포화된 지방산을 갖는 미세조류로부터 분리된 오일을 제공한다. 다른 관련 양태에서, 본 발명은 약 2:1의 C16:14 지방산 비를 가지는 미세조류로부터 분리된 오일을 제공한다. 또 다른 관련된 양태에서, 본 발명은 적어도 5:1의 C12:C14 지방산 비를 가지는 미세조류로부터 분리된 오일을 제공한다. 일부 실시형태에서, 미세조류는 적어도 하나의 외인성 유전자를 함유한다. 일부 경우에, 미세조류는 프로토테카 속이다.
제13 양태에서, 본 발명은 (a) 5% 미만 또는 2% 미만, 바람직하게는 1% 미만의 지질 프로파일, <C12; 1%-10%, 바람직하게는 2%-7%, C14:0; 20%-35%, 바람직하게는 23%-30%, C16:0; 5%-20%, 바람직하게는 7%-15%, C18:0; 35-60%, 바람직하게는 40-55%, C18:1; 및 1%-20%, 바람직하게는 2-15%, C18:2 지방산; 및 (b) 다음 속성 중 하나 이상: (i) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05-0.244mcg/g, 총 카르테노이드; (ii) 0.01 mcg/g 미만, 0.005mcg/g, 바람직하게는 0.003 mcg/g 미만, 라이코펜; (iii) 0.01 mcg/g 미만, 바람직하게는 0.005 mcg/g 미만, 0.003 mcg/g 미만, 베타 카로텐; (iv) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045-0.268mcg/g, 엽록소 A; (v) 1-300mcg/g, 35-175mcg/g, 바람직하게는 38.3-164mcg/g, 감마 토코페롤; (vi) 1% 미만, 0.5%, 바람직하게는 0.25% 미만, 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6-325.3mcg/g, 전체 토코트라이엔올; (viii) 0.001-0.1mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003-0.039mcg/g, 루테인; 또는 (ix) 10-500mcg/g, 50-300, 바람직하게는 60.8-261.7mcg/g, 토코페롤을 포함하는 트라이글라이세라이드 오일을 제공한다.
일부 경우에, 트라이글라이세라이드 오일은 하나 이상의 외인성 유전자를 포함하는 미생물로부터 분리된다. 일부 실시형태에서, 하나 이상의 외인성 유전자는 지방 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 쇄 길이 C14의 지방 아실-ACP 티오에스터라제는 지방 아실-ACP 기질에 대해 가수분해 활성을 가진다. 일부 실시형태에서, 미생물은 돌연변이된 내인성 불포화효소 유전자를 추가로 포함하되, 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다.
제14 양태에서, 본 발명은 5% 미만, 또는 2% 미만, 바람직하게는 1% 미만의 지질 프로파일, <C12; 1%-10%, 바람직하게는 2%-7%, C14:0; 20%-35%, 바람직하게는 23%-30%, C16:0; 5%-20%, 바람직하게는 7%-15%, C18:0; 35%-60%, 바람직하게는 40-55%, C18:1; 및 1%-20%, 바람직하게는 2-15%, C18:2 지방산을 포함하는 트라이글라이세라이드 오일의 생성 방법을 제공하되, 트라이글라이세라이드 오일은 하나 이상의 외인성 유전자를 포함하는 미생물로부터 분리된다. 일부 경우에, 트라이글라이세라이드 오일은 1%-10%, 바람직하게는 3-5%, C14:0; 20%-30%, 바람직하게는 25-27%, C16:0; 5%-20%, 바람직하게는 10-15%, C18:0; 및 35%-50%, 바람직하게는 40-45%, C18:1의 지질 프로파일을 포함한다. 일부 실시형태에서, 하나 이상의 외인성 유전자는 지방 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 지방 아실-ACP 티오에스터라제는 쇄 길이 C14의 지방 아실-ACP 기질에 대한 가수분해 활성을 가진다. 일부 경우에, 미생물은 돌연변이된 내인성 불포화효소 유전자를 추가로 포함하되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다. 일부 경우에, 하나 이상의 외인성 유전자는 수크로스 인버타제이다. 일부 실시형태에서, 돌연변이된 내인성 불포화효소 유전자는 스테아로일-아실 운반체 단백질 불포화효소(stearyl-acyl carrier protein desaturase, SAD)(예를 들어, 서열번호 199 내지 200)이다. 일부 실시형태에서, 돌연변이된 내인성 불포화효소 유전자는 지방산 불포화효소(fatty desaturase, FAD)이다.
제15 양태에서, 본 발명은 트라이글라이세라이드 오일을 포함하는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공하되, 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 1% C8:0, 적어도 약 1% C10:0, 적어도 약 1% C12:0, 적어도 약 2% C14:0, 적어도 약 30% C16:0, 적어도 약 5% C18:0, 적어도 약 60% C18:1, 약 7% 미만의 C18:2, 및 적어도 약 35% 포화된 지방산으로 이루어진 군으로부터 선택된다. 일부 경우에, 유지성 미생물 세포는 외인성 유전자를 포함하며, 선택적으로 유지성 미생물 세포의 내인성 불포화효소는 더 적은 효소적 활성을 가지도록 불활성화되거나 또는 돌연변이될 수 있었다.
일부 경우에, 트라이글라이세라이드 오일의 지방산 프로파일은 자연적으로 발생하는 오일의 지방산 프로파일과 유사하다. 일부 경우에, 자연적으로 발생하는 오일은 코코아 버터, 코코넛 오일, 팜 오일, 팜커넬 오일, 쉬어 버터, 탤로 및 라드로 이루어진 군으로부터 선택된다. 일부 경우에, 트라이글라이세라이드 오일의 지방산 프로파일은 C8:0 및 C10:0의 전체 조합량이 적어도 약 10%이고, C10:0, C12:0, 및 C14:0의 전체 조합량이 적어도 약 50%이며, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%이고, C18:0, C18:1 및 C18:2의 전체 조합량은 적어도 약 60%이며, C14:0, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%이고, C18:1 및 C18:2의 전체 조합량은 약 30% 미만인 것으로 이루어진 군으로부터 선택된 프로파일을 포함한다. 일부 경우에, 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 5 대 1의 C8:0 대 C10:0 비, 적어도 약 6 대 1의 C10:0 대 C12:0, 적어도 약 5 대 1의 C12:0 대 C14:0 비, 적어도 약 7:1의 C14:0 대 C12:0, 및 적어도 약 1 내지 2의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 지방산의 비를 포함한다.
일부 경우에, 내인성 불포화효소는 스테아릴 ACP 불포화효소 및 델타 12 지방산 불포화효소로 이루어진 군으로부터 선택된다. 일부 경우에, 외인성 유전자는 아실-ACP 티오에스터라제를 암호화하는 유전자로 이루어진 군으로부터 선택된다. 일부 경우에, 외인성 유전자는 표 4에서 확인되는 것으로 이루어진 군으로부터 선택된 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 유지성 미생물 세포는 수크로스 인버타제를 암호화하는 유전자를 추가로 포함한다.
다양한 실시형태에서, 유지성 미생물 세포는 아크난데스 오리엔탈리스(Achnanthes orientalis), 아그메넬룸(Agmenellum), 암피프로라 하이알린(Amphiprora hyaline), 암포라 코페이포미스(Amphora coffeiformis), 암포라 코페이포미스 리네아(Amphora coffeiformis linea), 암포라 코페이포미스 펑타타(Amphora coffeiformis punctata), 암포라 코페이포미스 테일로리(Amphora coffeiformis taylori), 암포라 코페이포미스 테누스(Amphora coffeiformis tenuis), 암포라 델리카티시마(Amphora delicatissima), 암포라 델리카티시마 카피타타(Amphora delicatissima capitata), 암포라 속(Amphora sp .), 아나배나(Anabaena), 안키스트로데스무스(Ankistrodesmus), 안키스트로데스무스 팔카투스(Ankistrodesmus falcatus), 보에켈로비아 후글란디(Boekelovia hooglandii), 보로디넬라 속(Borodinella sp .), 보트라이오코커스 브라우니(Botryococcus braunii), 보트라이오코커스 스데티쿠스(Botryococcus sudeticus), 카르테리아(Carteria), 캐토세로스 그라실리스(Chaetoceros gracilis), 캐토세로스 무엘러리(Chaetoceros muelleri), 캐토세로스 무엘러리 서브살숨(Chaetoceros muelleri subsalsum), 캐토세로스 속(Chaetoceros sp .), 클로렐라 아니트라타(Chlorella anitrata), 클로렐라 안탁티카(Chlorella Antarctica), 클로렐라 오레오비리디스(Chlorella aureoviridis), 클로렐라 칸디다(Chlorella candida), 클로렐라 캡슐레이트(Chlorella capsulate), 클로렐라 데시케이트(Chlorella desiccate), 클로렐라 엘립소이데아(Chlorella ellipsoidea), 클로렐라 에머소니(Chlorella emersonii), 클로렐라 푸스카(Chlorella fusca), 클로렐라 푸스카 변종 바큐오라타(Chlorella fusca var. vacuolata), 클로렐라 글루코트로파(Chlorella glucotropha), 클로렐라 인퓨지오눔(Chlorella infusionum), 클로렐라 인퓨지오눔 변종 악토필라(Chlorella infusionum var. actophila), 클로렐라 인퓨지오눔 변종 악세노필라(Chlorella infusionum var. auxenophila), 클로렐라 케슬러리(Chlorella kessleri), 클로렐라 로보포라(Chlorella lobophora)(균주 SAG 37.88), 클로렐라 루테오비리디스(Chlorella luteoviridis), 클로렐라 루테오비리디스 변종 아우레오비리디스(Chlorella luteoviridis var. aureoviridis), 클로렐라 루테오비리디스 변종 루테센스(Chlorella luteoviridis var. lutescens), 클로렐라 미니아타(Chlorella miniata), 클로렐라 미누티시마(Chlorella minutissima), 클로렐라 무타빌리스(Chlorella mutabilis), 클로렐라 녹투나(Chlorella nocturna), 클로렐라 파바(Chlorella parva), 클로렐라 포토필라(Chlorella photophila), 클로렐라 프링세이미(Chlorella pringsheimii), 클로렐라 프로토테코이데스(임의의 UTEX 균주 1806, 411, 264, 256, 255, 250, 249, 31, 29, 25, 및 CCAP 균주 211/17 및 211/8d를 포함), 클로렐라 프로토테코이데스 변종 아시디콜라(Chlorella protothecoides var. acidicola), 클로렐라 레글라리스(Chlorella regularis), 클로렐라 레글라리스 변종 미니마(Chlorella regularis var. minima), 클로렐라 레글라리스 변종 엄브리카타(Chlorella regularis var. umbricata), 클로렐라 레이시글라이(Chlorella reisiglii), 클로렐라 사카로필라(Chlorella saccharophila), 클로렐라 사카로필라 변종 엘립소이데아(Chlorella saccharophila var. ellipsoidea), 클로렐라 살리나(Chlorella salina), 클로렐라 심플렉스(Chlorella simplex), 클로렐라 소로키니아나(Chlorella sorokiniana), 클로렐라 속(Chlorella sp .), 클로렐라 스패리카(Chlorella sphaerica), 클로렐라 스티그마토포라(Chlorella stigmatophora), 클로렐라 반니엘리(Chlorella vanniellii), 클로렐라 불가리스(Chlorella vulgaris), 클로렐라 불가리스(Chlorella vulgaris), 클로렐라 불가리스 품종 테르티아(Chlorella vulgaris f. tertia), 클로렐라 불가리스 변종 오토트로피카(Chlorella vulgaris var. autotrophica), 클로렐라 불가리스 변종 비리디스(Chlorella vulgaris var. viridis), 클로렐라 불가리스 변종 불가리스(Chlorella vulgaris var. vulgaris), 클로렐라 불가리스 변종 불가리스 품종 테르티아(Chlorella vulgaris var. vulgaris f. tertia), 클로렐라 불가리스 변종 불가리스 품종 비리디스(Chlorella vulgaris var. vulgaris f. viridis), 클로렐라 잔텔라(Chlorella xanthella), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클로렐라 트레복시오이데스(Chlorella trebouxioides), 클로렐라 불가리스(Chlorella vulgaris), 클로로코컴 인퓨시오눔(Chlorococcum infusionum), 클로로코컴 속(Chlorococcum sp .), 클로로고늄(Chlorogonium), 크루모나스 속(Chroomonas sp .), 크립소스패라 속(Chrysosphaera sp .), 크리코스패라 속(Cricosphaera sp .), 크립토모나스 속(Cryptomonas sp .), 사이클로텔라 크립티카(Cyclotella cryptica), 사이클로텔라 메네기니아나(Cyclotella meneghiniana), 사이클로텔라 속(Cyclotella sp .), 두날리엘라 속(Dunaliella sp .), 두날리엘라 바다윌(Dunaliella bardawil), 두날리엘라 바이오쿨라타(Dunaliella bioculata), 두날리엘라 그라눌레이트(Dunaliella granulate), 두날리엘라 마리티메(Dunaliella maritime), 두날리엘라 미누타(Dunaliella minuta), 두날리엘라 파바(Dunaliella parva), 두날리엘라 페이세이(Dunaliella peircei), 두날리엘라 프리몰렉타(Dunaliella primolecta), 두날리엘라 살리나(Dunaliella salina), 두날리엘라 테리콜라(Dunaliella terricola), 두날리엘라 테티올렉타(Dunaliella tertiolecta), 두날리엘라 비리디스(Dunaliella viridis), 두날리엘라 테르티올렉타(Dunaliella tertiolecta), 에레모스패라 비리디스(Eremosphaera viridis), 에레모스패라 속(Eremosphaera sp .), 엘립소이돈 속(Ellipsoidon sp .), 유글레나(Euglena), 프란세이아 속(Franceia sp .), 프라질라리아 크로토넨시스(Fragilaria crotonensis), 프라질라리아 속(Fragilaria sp .), 글레오캡사 속(Gleocapsa sp .), 글로에오타미니온 속(Gloeothamnion sp .), 하이메노모나스 속(Hymenomonas sp .), 아이소크리시스 아피니스 갈바나(Isochrysis aff . galbana), 아이소크리시스 갈바나(Isochrysis galbana), 레포신클리스(Lepocinclis), 마이크락티늄(Micractinium), 마이크락티늄(Micractinium)(UTEX LB 2614), 모노라피듐 미누툼(MonoraphidiumMinutum), 모노라피둠 속(Monoraphidium sp .), 나노클로리스 속(Nannochloris sp .), 난노클로롭시스 살리나(Nannochloropsis salina), 난노클로롭시스 속(Nannochloropsis sp .), 나비쿨라 아셉타타(Navicula acceptata), 나비쿨라 비스칸테래(Navicula biskanterae), 나비쿨라 슈도테넬로이데스(Navicula pseudotenelloides), 나비쿨라 펠리쿨로사(Navicula pelliculosa), 나비쿨라 사프로파일라(Navicula saprophila), 나비쿨라 속(Navicula sp .), 네프로클로리스 속(Nephrochloris sp.), 네프로셀미스 속(Nephroselmis sp .), 니츠키아 코뮤니스(Nitschia communis), 니츠키아 알렉산드리나(Nitzschia alexandrina), 니츠키아 코뮤니스(Nitzschia communis), 니츠키아 디시파타(Nitzschia dissipata), 니츠키아 프러츨럼(Nitzschia frustulum), 니츠키아 한츠키아나(Nitzschia hantzschiana), 니츠키아 인컨스피쿠아(Nitzschia inconspicua), 니츠키아 인터메디아(Nitzschia intermedia), 니츠키아 마이크로세팔라(Nitzschia microcephala), 니츠키아 푸실라(Nitzschia pusilla), 니츠키아 퍼실라 엘립티카(Nitzschia pusilla elliptica), 니츠키아 퍼실라 모노엔시스(Nitzschia pusilla monoensis), 니츠키아 쿼드란글라(Nitzschia quadrangular), 니츠키아 속(Nitzschia sp .), 오크로모나스 속(Ochromonas sp .), 오시스티스 파바(Oocystis parva), 오시스티스 퍼실라(Oocystis pusilla), 오시스티스 속(Oocystis sp .), 오실라토리아 림네티카(Oscillatoria limnetic), 오실락토리아 속(Oscillatoria sp .), 오실라토리아 서브브레비스(Oscillatoria subbrevis), 파셰리아 아시도필라(Pascheria acidophila), 파블로바 속(Pavlova sp .), 파구스(Phagus), 포르미디움(Phormidium), 플라티모나스 속(Platymonas sp .), 플레우로크리시스 카르테래(Pleurochrysis carterae), 플레우로크리시스 덴테이트(Pleurochrysis dentate), 플레우로크리시스 속(Pleurochrysis sp .), 프로토테카 윅케르하미(Prototheca wickerhamii), 프로토테카 스타그노라(Prototheca stagnora), 프로토테카 포르토리센시스(Prototheca portoricensis), 프로토테카 모리포미스(Prototheca moriformis), 프로토테카 좁피(Prototheca zopfii), 파이라미모나스 속(Pyramimonas sp .), 피로보트라이스(Pyrobotrys), 사르시노이드 크리소파이트(Sarcinoid chrysophyte), 센데스무스 아르마투스(Scenedesmus armatus), 스피로지라(Spirogyra), 스피룰리나 플라텐시스(Spirulina platensis), 스티코코커스 속(Stichococcus sp .), 시네코코커스 속(Synechococcus sp .), 테트래드론(Tetraedron), 테트라셀미스 속(Tetraselmis sp .), 테트라셀미스 수에시카(Tetraselmis suecica), 탈라시오시라 웨이스프로기(Thalassiosira weissflogii), 및 비리디엘라 프리데리시아나(Viridiella fridericiana)로부터 선택된 미세조류 속 또는 종의 세포이다.
일부 경우에, 유지성 미생물 세포는 프로토테카 속의 세포이다. 일부 경우에, 유지성 미생물 세포는 프로토테카 모리포미스 속의 세포이다.
일부 경우에, 유지성 미생물 세포는 유지성 효모 세포이다. 일부 경우에, 유지성 미생물 세포는 유지성 박테리아 세포이다.
일부 경우에, 자연적으로 발생하는 오일은 코코아 버터이며 외인성 유전자는 카르타무스 틴토리우스(Carthamus tinctorius) 티오에스터라제 유전자를 포함한다. 일부 경우에, 자연적으로 발생하는 오일은 코코넛 오일이다. 일부 경우에, 자연적으로 발생하는 오일은 팜 오일이며 외인성 유전자는 인도네시아 기름야자(Elaeis guineensis) 티오에스터라제 유전자, 쿠페아 후커리아나 티오에스터라제 유전자, 쿠페아 후커리아나 KAS IV 유전자 및 쿠페아 라이티(Cuphea wrightii) FATB2 유전자, 또는 내인성 KAS II 유전자를 파괴하도록 설계된 구성체를 포함한다. 일부 경우에, 자연적으로 발생하는 오일은 팜커넬 오일이며, 외인성 유전자는 쿠페아 라이티 FATB2 유전자 및 내인성 SAD2B 유전자를 파괴하도록 설계된 구성체의 조합을 포함한다. 일부 경우에, 자연적으로 발생하는 오일은 쉬어 버터이다. 일부 경우에, 자연적으로 발생하는 오일은 탤로이다. 일부 경우에, 자연적으로 발생하는 오일은 라드이며, 외인성 유전자는 캘리포니아 월계수 티오에스터라제 유전자와 외인성 SAD2B 유전자를 파괴하도록 설계된 구성체의 조합, 가르시니아 망고스타나(Garcinia mangostana) 티오에스터라제 유전자와 외인성 SAD2B 유전자를 파괴하도록 설계된 구성체의 조합, 브라시카 나푸스 티오에스터라제 유전자, 또는 쿠페아 후커리아나 티오에스터라제 유전자를 포함한다.
제16 양태에서, 본 발명은 유지성 미생물 트라이글라이세라이드 오일 조성물을 제공하되, 해당 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 1% C8:0, 적어도 약 1% C10:0, 적어도 약 1% C12:0, 적어도 약 2% C14:0, 적어도 약 30% C16:0, 적어도 약 5% C18:0, 적어도 약 60% C18:1, 약 7% C18:2 미만, 및 적어도 약 35% 포화된 지방산으로 이루어진 군으로부터 선택된다. 다양한 실시형태에서, 트라이글라이세라이드 오일 조성물은 배양 배지 내에서 유지성 미생물 세포 또는 재조합 유지성 미생물 세포의 집단을 배양하는 것에 의해 생성되되, 해당 유지성 미생물 세포는 상기 기재한 것, 특히 본 발명의 제15 양태와 관련하여 상기 기재한 것이다.
일부 경우에, 유지성 미생물 트라이글라이세라이드 오일 조성물은 하기로 이루어진 군으로부터 선택된 속성을 추가로 포함한다: (i) 0.3 mcg/g 미만 총 카르테노이드; (ii) 0.005 mcg/g 미만 라이코펜; (iii) 0.005 mcg/g 미만 베타 카로텐; (iv) 0.3 mcg/g 미만 엽록소 A; (v) 175 mcg/g 미만 감마 토코페롤; (vi) 0.25% 미만 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 350 mcg/g 미만 전체 토코트라이엔올; (viii) 0.05 mcg/g 미만 루테인; 또는 (ix) 275 mcg/g 미만 토코페롤.
제17 양태에서, 본 발명은 적어도 약 1% C8:0, 적어도 약 1% C10:0, 적어도 약 1% C12:0, 적어도 약 2% C14:0, 적어도 약 30% C16:0, 적어도 약 5% C18:0, 적어도 약 60% C18:1, 7% 미만 C18:2, 및 적어도 약 35% 포화된 지방산으로 이루어진 군으로부터 선택된 지방산 프로파일을 가지는 유지성 미생물 트라이글라이세라이드 오일 조성물을 생성하는 방법을 제공하되, 해당 방법은 (a) 적어도 10%의 건조 세포 중량의 유지성 미생물 세포가 트라이글라이세라이드 오일이 될 때까지 배양 배지 내에서 유지성 미생물 세포 집단을 배양하는 단계; 및 (b) 유지성 미생물 세포로부터 트라이글라이세라이드 오일 조성물을 분리하는 단계를 포함한다. 다양한 실시형태에서, 트라이글라이세라이드 오일 조성물은 유지성 미생물 세포 또는 상기 기재한 것, 특히 본 발명의 제5 양태와 관련하여 상기 기재한 것과 같은 재조합 유지성 미생물 세포 집단의 배양을 통해 생성된다.
제18 양태에서, 본 발명은 오일-기재 제품의 제조 방법을 제공하되, 해당 방법은 (a) 본 발명의 제16 양태와 관련하여 상기 기재한 것과 같은 유지성 미생물 트라이글라이세라이드 오일 조성물에 비누화, 복분해; 산 가수분해; 알칼리 가수분해; 효소적 가수분해; 촉매적 가수분해; 열간 압수 가수분해; 촉매적 가수분해 반응(해당 지질은 글라이세롤 및 지방산으로 분할된다); 지방 질소 화합물을 생성하기 위한 아미노화 반응; 1염기성 및 2염기성-산을 생성하기 위한 오존분해 반응; 효소적 분열 및 압력 분열로 이루어진 군으로부터 선택된 트라이글라이세라이드 분열 반응; 가수분해 반응 다음의 축합 반응; 수소화 처리 반응; 수소화처리 반응 및 탈산소 반응 또는 수소화처리 전 또는 동시에 축합 반응; 기체 제거 반응; 수소화개열반응, 수소화, 연속적 수소화-수소화개열 반응, 연속적 수소화개열반응-수소화 반응, 및 조합된 수소화-수소화개열 반응으로 이루어진 군으로부터 선택된 탈산소 반응; 탈산소 반응 후 축합 반응; 에스터화 반응; 에스터교환 반응; 에스터결합 전이반응; 하이드록실화 반응; 및 하이드록실화 반응 후 축합 반응으로 이루어진 군으로부터 선택된 적어도 하나의 화학 반응을 실시하는 단계; 및 (b) 다른 성분으로부터 반응 생성물을 분리하는 단계를 포함한다.
일부 경우에, 오일-기재 제품은 비누, 연료, 절연용제, 유압액, 가소제, 윤활제, 열전달유체, 및 금속 작업 유체로 이루어진 군으로부터 선택된다. 일부 경우에, 오일-기재 제품은 (a) 바이오디젤; (b) 재생 디젤; 및 (c) 제트 연료로 이루어진 군으로부터 선택된 연료 제품이다.
일부 경우에, 연료 제품은 다음의 속성 중 하나 이상을 갖는 바이오디젤이다: (i) 0.3 mcg/g 미만 전체 카로테노이드; (ii) 0.005 mcg/g 미만 라이코펜; (iii) 0.005 mcg/g 미만 베타 카로텐; (iv) 0.3 mcg/g 미만 엽록소 A; (v) 175 mcg/g 미만 감마 토코페롤; (vi) 0.25% 미만 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 350 mcg/g 미만 전체 토코트라이엔올; (viii) 0.05 mcg/g 미만 루테인; 또는 (ix) 275 mcg/g 미만 토코페롤.
일부 경우에, 연료 제품은 적어도 20℃, 40℃ 또는 60℃의 T10-T90을 갖는 재생 디젤이다.
일부 경우에, 연료 제품은 HRJ-5 및/또는 ASTM 세부항목 D1655를 충족시키는 제트 연료이다.
본 발명의 이들 및 다른 양태 및 실시형태는 수반하는 도면, 바로 다음의 간단한 설명, 이하의 본 발명의 상세한 설명에 기재되며, 이하의 실시예에서 예시된다. 상기 및 본 명세서를 통해 논의한 임의의 또는 모든 특징은 본 발명의 다양한 실시형태에서 조합될 수 있다.
도 1은 프로토테카 트라이글라이세라이드 오일로부터 생성된 재생 디젤의 크로마토그램.
본 발명은 프로토테카 및 특정 관련 미생물 유기체가 경제적으로 및 다량으로 오일, 연료 및 다른 탄화수소 또는 지질 조성물을 생산하기 위한 예상치 못한 유리한 특성을 가진다는 발견뿐만 아니라 이들 특성을 개선시키는 이들 미생물 유기체를 유전적으로 변경시키기 위한 방법 및 시약의 발견으로부터 발생한다. 이들 미생물 유기체에 의해 생성된 오일은 특히 운송 연료, 함유화학물질 및/또는 식품 및 화장품 산업에 사용될 수 있다. 지질의 에스터결합 전이반응으로 바이오디젤로 유용한 장쇄 지방산 에스터를 수득한다. 다른 효소적 및 화학적 공정은 지방산, 알데하이드, 알코올, 알칸, 및 알켄을 수득하도록 맞춰질 수 있다. 일부 적용에서, 재생 디젤, 제트 연료, 또는 다른 탄화수소 화합물이 생성된다. 본 발명은 또한 증가된 생산성 및 증가된 지질 수율을 위해 및/또는 본 명세서에 설명된 조성물의 더 비용 효과적인 생산을 위해 미세조류를 배양하는 방법을 제공한다.
본 발명의 이런 상세한 설명은 제공의 편리함을 위해 부분이 나누어진다. 부문 I은 본 명세서에 사용된 용어의 정의를 제공한다. 부분 II는 본 명세서의 방법에 유용한 배양 조건의 설명을 제공한다. 부문 III은 유전자 조작 방법 및 재료의 설명을 제공한다. 부문 IV는 수크로스 이용을 가능하게 하는 미생물 유기체(예를 들어, 프로토테카)의 유전자 조작의 설명을 제공한다. 부문 V는 지질 생합성을 변형하기 위한 미생물 유기체(예를 들어 프로토테카)의 유전자 조작의 설명을 제공한다. 부문 VI은 연료 및 화학물질의 제조방법을 기재한다. 부문 VII은 본 발명의 실시예 및 실시형태를 개시한다. 본 발명의 상세한 설명 다음에는 본 발명의 다양한 양태 및 실시형태를 설명하는 실시예가 제공된다.
I. 정의
달리 정의되지 않는 경우, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 본 발명의 속하는 분야의 당업자가 통상적으로 이해하는 의미를 가진다. 하기의 참조문헌은 본 발명에 사용되는 많은 용어의 일반적인 정의를 당업자에게 제공한다: 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology(2nd ed. 1994); The Cambridge Dictionary of Science and Technology(Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 및 Hale & Marham, The Harper Collins Dictionary of Biology(1991)]. 본 명세서에 사용된 바와 같이, 하기의 용어는 달리 특정되지 않는 경우 이들 본래의 의미를 가진다.
"미세조류에서 활성"은 미세조류에서 기능성인 핵산을 지칭한다. 예를 들어, 유전자 이식 미세조류에 항생제 내성을 부여하는 항생제 내성 유전자를 구동하기 위해 사용된 프로모터는 미세조류에서 활성이다.
"아실 운반 단백질" 또는 "ACP"는 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스터로서 지방산 합성 동안에 성장하는 아실 쇄와 결합하며 지방산 신타제 복합체의 성분을 포함하는 단백질이다.
"아실-CoA 분자" 또는 "아실-CoA"는 조효소 A의 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스터 연결을 통해 조효소 A에 공유적으로 부착된 아실 모이어티를 포함하는 분자이다.
"면적%"는 FAME GC/FID 검출 방법을 사용하여 관찰된 피크 면적을 말하는데, 여기서, 샘플내 모든 지방산은 검출 전에 지방산 메틸 에스터(fatty acid methyl ester, FAME)로 전환된다. 예를 들어, 분리 피크는 C14:1과 같은 임의의 다른 지방산과 비교하여 불포화성을 갖지 않는 14개 탄소 공급원자의 지방산(C14:0)에 대해서 관찰된다. 각각의 부류의 FAME에 대한 면적%는 혼합물 내 이의 조성물%과 직접적으로 비례하고 샘플 내 존재하는 모든 피크의 합계를 기준으로 계산된다(즉, [특정 피크하의 면적/모든 측정된 피크의 총 면적] X 100). 본 발명의 오일 및 세포의 지질 프로파일을 언급하는 경우, "적어도 4%의 C8-C14"는 세포 내 또는 추출된 글라이세로지질 조성물 내 총 지방산의 적어도 4%가 8, 10, 12 또는 14개의 탄소 공급원자를 포함하는 쇄 길이를 가진다는 것을 의미한다.
"무균성"은 다른 살아있는 유기체에 의해 오염되지 않은 유기체 배양물이다.
"바이오디젤"은 디젤 엔진에서 연료로서 사용하기에 적합한 생물학적으로 생산된 지방산 알킬 에스터이다.
"바이오매스"는 세포의 성장 및/또는 번식에 의해 생성된 물질이다. 바이오매스는 세포 및/또는 세포 내 내용물을 함유할 뿐만 아니라, 이에 제한되는 것은 아니지만 세포에 의해 분비되는 화합물을 포함한다.
"생물반응기"는 선택적으로 현탁액 중에서 세포가 배양되는 인클로저(enclosure) 또는 부분적 인클로저이다.
"촉매"는 생성물의 일부가 되지 않고 반응물에서 생성물로의 화학적 반응을 용이하게 하거나 촉진할 수 있는 분자 또는 거대분자 복합체와 같은 작용제(agent)이다. 촉매는 반응 속도를 증가시키고 이후 촉매는 다른 반응물에 작용하여 생성물을 형성할 수 있다. 촉매는 일반적으로 반응에 필요한 전체 활성화 에너지를 낮추어서 반응이 더 빨리 또는 더 저온에서 진행되도록 한다. 따라서, 반응 평형은 더 빠르게 달성될 수 있다. 촉매의 예는 생물학적 촉매인 효소; 비생물학적 촉매인 열; 및 화석 오일 정련 공정에 사용되는 금속을 포함한다.
"셀룰로스 물질"은 글루코스 및 자일로스, 및 선택적으로 이당류, 올리고당, 리그닌, 푸르푸랄 및 기타 화합물과 같은 추가적인 화합물을 포함하는, 셀룰로스의 분해 생성물이다. 셀룰로스 물질의 공급원의 비 제한적인 예는 사탕수수 바가스, 사탕무 펄프, 옥수수 스토버, 목재 칩, 톱밥 및 지팽이풀을 포함한다.
"공동-배양", 및 이의 변형어구인 "공동-배양하다" 및 "공동-발효"는 동일한 생물반응기에 2개 이상의 세포 유형이 존재함을 언급한다. 2개 이상의 세포 유형은 미세조류와 같은 미생물 유기체일 수 있거나 상이한 세포 유형과 함께 배양되는 미세조류 세포일 수 있다. 상기 배양 조건은 2개 이상의 세포 유형의 성장 및/또는 번식을 조성하는 것 또는 2개 이상의 세포 중 하나 또는 서브세트의 성장 및/또는 번식을 촉진시키는 한편, 나머지에 대한 세포 성장을 유지하는 것일 수 있다.
"조인자"는 이의 효소 활성을 수행하는 효소에 필요한 기질 이외의 임의의 분자이다.
"상보적 DNA" 또는 "cDNA"는 전령 RNA(mRNA)의 역전사 또는 증폭(예를 들어, 중합효소 연쇄 반응(polymerase chain reaction, "PCR")을 통한)에 의해 보통 얻어지는 mRNA의 DNA 복제물이다.
"배양된" 및 이것의 변형어, 예를 들어 "배양된" 및 "발효된"은 선택되고/되거나 제어된 조건을 사용함에 의한 하나 이상의 세포의 성장(세포 크기, 세포 함량 및/또는 세포 활성의 증가) 및/또는 번식(유사 분열을 통한 세포 수의 증가)의 의도적인 조성을 말한다. 성장 및 번식 둘 다의 조합은 증식으로 칭해질 수 있다. 선택되고/되거나 제어된 조건의 예는 한정된 배지(pH, 이온 강도 및 탄소 공급원과 같은 공지된 특성과 함께), 특정 온도, 산소압, 이산화탄소 수준 및 생물반응기에서 성장의 사용을 포함한다. 배양은 천연적인 또 다르게는 사람 간섭이 없는 미생물 유기체의 성장 또는 번식을 말하지 않으며; 예를 들어, 궁극적으로 지질학적 원유를 생성하도록 화석화된 유기체의 자연적 성장은 배양이 아니다.
"세포용해"는 저장성 환경에서의 세포의 용해이다. 세포 용해는 세포 내부에 대한 과도한 삼투압, 또는 물의 이동(과수화)에 의해 유발된다. 해당 세포는 내부 물의 삼투압을 견뎌낼 수 없어서 터진다.
"탈지질화된 음식물" 및 "탈지질화된 미생물 바이오매스"는 오일(지질을 포함)이 기계적 추출(즉, 익스펠러 프레스에 의해 수행됨) 또는 용매 추출 또는 이 둘 다를 통해 이로부터 추출되거나 분리된 후의 미생물 바이오매스이다. 탈지질화된 음식물은 미생물 바이오매스로부터 오일/지질의 추출 또는 분리 전과 비교하여 감소된 양의 오일/지질을 갖지만 일부 잔류하는 오일/지질을 함유한다.
"발현 벡터" 또는 "발현 구성체" 또는 "플라스미드" 또는 "재조합 DNA 구성체"는 숙주 세포에서 특정 핵산을 전사 및/번역하도록 하는 일련의 구체화된 핵산 요소에 의한 재조합 수단 또는 직접적인 화학적 합성에 의하는 것을 포함하는, 인간 개입을 통해 만들어진 핵산을 말한다. 발현 벡터는 플라스미드, 바이러스 또는 핵산 단편의 부분일 수 있다. 전형적으로, 상기 발현 벡터는 프로모터에 작동가능하게 연결되어 전사된 핵산을 포함한다.
"외인성 유전자"는 세포에 도입된("형질전환된") RNA 및/또는 단백질의 발현을 위해 암호화하는 핵산이다. 형질전환된 세포는 추가의 외인성 유전자(들)가 도입될 수 있는 재조합 세포로서 언급될 수 있다. 상기 외인성 유전자는 형질전환된 세포에 대해 상이한 종(및 따라서 이종성) 또는 동일한 종(및 따라서 동종성)으로부터 유래될 수 있다. 따라서, 외인성 유전자는 유전자의 내인성 복제물에 비해 세포의 게놈 내에서 상이한 위치를 차지하거나 상이한 제어 하에 있는 동종성 유전자를 포함한다. 외인성 유전자는 세포 내에서 하나 이상의 복제물로 존재할 수 있다. 외인성 유전자는 게놈 내로 삽입물로서 또는 에피좀 분자로서 세포 내에서 유지될 수 있다.
"외인성으로 제공된"은 세포 배양의 배양 배지에 공급된 분자를 말한다.
"익스펠러 프레싱"은 대두 및 평지씨와 같은 원료로부터 오일을 추출하는 기계적 방법이다. 익스펠러 프레스는 스크류형의 기계이고 케이지 배럴-유사 구멍을 통해 재료를 압착시킨다. 원료는 프레스의 한 측면으로 들어가고, 소모된 케이크는 다른 측면에서 빠져나오는 한편, 오일은 케이지 내 막대 사이에서 스며나오고 수집된다. 상기 기계는 원료를 움직이고 압착시키는 스크류 구동체로부터의 마찰 및 연속적인 압력을 사용한다. 상기 오일은 고체가 통과하지 못하도록 하는 작은 구멍을 통해 스며나온다. 원료가 압착됨에 따라, 마찰은 전형적으로 이를 가열시킨다.
"지방 아실-ACP 티오에스터라제"는 지질 합성 동안 아실 운반 단백질(ACP)로부터 지방산의 절단을 촉매하는 효소이다.
"지방 아실-CoA/알데하이드 환원효소"는 아실-CoA 분자의 1차 알코올로 환원을 촉매하는 효소이다.
"지방 아실-CoA 환원효소"는 아실-CoA 분자의 알데하이드로의 환원을 촉매하는 효소이다.
"지방 알데하이드 데카보닐라제"는 지방 알데하이드의 알칸으로의 전환을 촉매하는 효소이다.
"지방 알데하이드 환원효소"는 알데하이드의 1차 알코올로 환원을 촉매하는 효소이다.
"고정된 탄소 공급원"은 배양되는 미생물에 의해 이용될 수 있는 배양 배지 내에서 고체 또는 액체 형태로 주변 온도 및 압력에서 존재하는 탄소, 전형적으로 유기 분자를 함유하는 분자(들)이다.
"호모제네이트"는 생리적으로 파괴된 바이오매스이다.
"탄화수소"는 (a) 수소 및 탄소 원자만을 함유하는 분자이고, 여기서, 탄소 공급원자는 공유 결합되어 선형, 분지형, 고리형 또는 부분적으로 고리형인, 수소 원자가 부착된 백본을 형성한다. 탄화수소 화합물의 분자 구조는 천연 가스 구성 성분인 가장 단순한 메탄(CH4) 형태로부터 매우 무겁고 복잡한, 예를 들어, 원유, 석유 및 역청에서 발견되는 아스팔텐과 같은 일부 분자까지 다양하다. 탄화수소는 가스, 액체 또는 고체 형태, 또는 이들 형태의 임의의 조합일 수 있고, 골격 내 인접한 탄소 공급원자 사이에 하나 이상의 이중 결합 또는 삼중 결합을 가질 수 있다. 따라서, 해당 용어는 선형, 분지형, 고리형 또는 부분적으로 고리형인 알칸, 알켄, 지질 및 파라핀을 포함한다. 이의 예는 프로판, 뷰탄, 펜탄, 헥산, 옥탄, 및 스쿠알렌을 포함한다.
"수소:탄소 비"는 원자 대 원자를 기준으로 분자 내 탄소 원자에 대한 수소 원자의 비이다. 해당 비율은 탄화수소 분자 내 탄소 및 수소 원자의 수를 언급하기 위해 사용될 수 있다. 예를 들어, 가장 높은 비의 탄화수소는 메탄 CH4(4:1)이다.
"소수성 분획"은 수성 상과 비교하여 소수성 상에서 더 가용성인 물질의 일부 또는 분획이다. 소수성 분획은 실질적으로 물에 불용성이고 보통 비극성이다.
"지질 수율을 증가시킨다"는, 예를 들어 배양물의 리터당 세포의 건조 중량을 증가시키거나, 지질을 구성하는 세포의 %를 증가시키거나, 단위 시간당 배양물 부피의 리터당 지질의 전체 양을 증가시키는 것에 의한 미생물 배양물의 생산성 증가를 말한다.
"유도성 프로모터"는 특정 자극에 응하여 작동가능하게 연결된 유전자의 전사를 매개하는 프로모터이다. 이러한 프로모터의 예는 pH 또는 질소 수준을 변화시키는 조건에서 유발된 프로모터 서열일 수 있다.
"작동가능한 연결에서"는 2개의 핵산 서열 간, 예를 들어, 제어 서열(전형적으로 프로모터)과 연결된 서열(전형적으로 단백질을 암호화하는 서열, 또한 소위 암호화 서열)간의 기능적 연결이다. 프로모터는 이것이 유전자의 전사를 매개할 수 있다면 외인성 유전자와 작동가능하게 연결되어 있다.
"인시츄"는 "제자리" 또는 "그것의 본래의 위치"를 의미한다.
"영양분의 제한 농도"는 배양된 유기체의 번식을 제한하는 배양물 내 화합물의 농도이다. "영양분의 비제한 농도"는 주어진 배양기간 동안 최대 번식을 지원하는 농도이다. 따라서, 소정의 배양기간 동안 생성되는 세포의 수는 영양분이 비제한적일 때보다 영양분의 제한 농도의 존재에서 더 낮다. 영양분은 영양분이 최대 번식을 지지하는 것보다 큰 농도로 존재하는 경우 배양물에서 과량인 것으로 언급된다.
"리파제"는 수불용성 지질 기질에서 에스터 결합의 가수분해를 촉매하는 수용성 효소이다. 리파제는 지질의 글라이세롤 및 지방산으로의 가수분해를 촉매한다.
"지질 변형 효소"는 지질의 공유 구조를 변경하는 효소를 말한다. 지질 변형 효소의 예는 리파제, 지방 아실-ACP 티오에스터라제, 지방 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 스테아릴 아실 운반 단백질 불포화효소(SAD) 및 지방 아실 불포화효소(FAD)를 포함하는 불포화효소 및 지방 알데하이드 데카보닐라제를 포함한다.
"지질 경로 효소"는 지질 대사, 즉 지질 합성, 변형 또는 분해에 역할을 하는 임의의 효소 및 지질을 화학적으로 변형시키는 임의의 단백질뿐만 아니라 운반 단백질이다.
"지질"은 비극성 용매(예를 들어, 에테르 및 클로로포름)에 가용성이고 물에 상대적으로 또는 완전히 불용성인 부류의 분자이다. 지질 분자는 이들이 주로 자연에서 소수성인 대다수의 긴 탄화수소 꼬리로 이루어지기 때문에 상기 성질을 가진다. 지질의 예는 지방산(포화 및 불포화); 글라이세라이드 또는 글라이세로지질(예를 들어, 모노글라이세라이드, 다이글라이세라이드, 트라이글라이세라이드 또는 중성 지방 및 포스포글라이세라이드 또는 글라이세로인지질); 비글라이세라이드(nonglyceride)(스핑고지질, 콜레스테롤 및 스테로이드 호르몬을 포함하는 스테롤 지질, 터페노이드를 포함하는 프레놀 지질, 지방 알코올, 왁스 및 폴리케타이드); 및 복합 지질 유도체(당-연결 지질 또는 당지질 및 단백질 연결된 지질)를 포함한다. "지방"은 소위 "트라이글라이세라이드"인 지질의 하위그룹이다.
"용해물"은 용해된 세포의 내용물을 함유하는 용액이다.
"용해"는 종종 유기체의 완전함을 손상시키는 기계적, 바이러스 또는 삼투압 메커니즘에 의한, 적어도 일부의 세포 내 내용물을 방출하기에 충분한 생물학적 유기체의 원형질막 및 선택적으로 세포벽의 파괴이다.
"용해하는"은 적어도 일부 세포 내 내용물을 방출하기에 충분한 생물학적 유기체 또는 세포의 세포막 및 선택적으로 세포벽을 파괴하는 것이다.
"미세조류"는 엽록체 또는 플라스티드를 함유하고, 선택적으로 광합성을 수행할 수 있는 진핵 미생물 유기체, 또는 광합성을 수행할 수 있는 원핵 미생물 유기체이다. 미세조류는 에너지로서 고정된 탄소 공급원을 대사시킬 수 없는 절대 광합성독립영양생물뿐만 아니라 고정된 탄소 공급원으로부터 유일하게 생존할 수 있는 종속영양생물을 포함한다. 미세조류는 세포 분열 후 단시간에 자매세포로부터 분리되는 단일 세포 유기체, 예를 들어, 클라미도모나스(Chlamydomonas)뿐만 아니라 2개의 별개의 세포 유형의 단순한 다중세포 광합성 미생물인, 예를 들어, 볼복스(Volvox)와 같은 미생물을 포함한다. 미세조류는 클로렐라, 두날리엘라, 및 프로토테카와 같은 세포를 포함한다. 미세조류는 또한 아그메넬룸(Agmenellum), 아나바에나(Anabaena), 및 피로보트라이스(Pyrobotrys)와 같은 세포-세포 접착을 나타내는 다른 미생물 광합성 유기체를 포함한다. 미세조류는 또한 특정 디노플라겔레이트 조류 종 및 프로토테카 속의 종과 같은 광합성을 수행하는 능력을 상실한 절대 종속영양 미생물 유기체를 포함한다.
"미생물 유기체" 및 "미생물(microbe)"은 현미경적 단일 세포 유기체이다.
2개의 단백질 또는 유전자와 관련하여 "자연적으로 공동 발현된"은 단백질 또는 이들의 유전자가 이들이 유래된 조직 또는 유기체에서 자연적으로 공동 발현됨을 의미하는데, 이는 예를 들어 2개의 단백질을 암호화하는 유전자가 공통된 조절 서열의 제어 하에 있거나 또는 이들이 동일한 자극에 응하여 발현되기 때문이다.
"삽투압 쇼크"는 삼투압의 급작스런 감소 후 용액 내 세포의 붕괴이다. 삽투압 쇼크는 때때로 상기 세포의 세포 성분을 용액 내로 방출하도록 유도된다.
"다당류-분해 효소"는 임의의 다당류의 가수분해 또는 당화를 촉매할 수 있는 임의의 효소이다. 예를 들어 셀룰라제는 셀룰로스의 가수분해를 촉매한다.
"다당류" 또는 "글라이칸"은 글라이코사이드 결합에 의해 서로 함께 연결된 단당류로 구성된 탄수화물이다. 셀룰로스는 특정 식물 세포 벽을 구성하는 다당류이다. 셀룰로스는 자일로스 및 글루코스와 같은 단당류뿐만 아니라 더 큰 이당류 및 올리고당을 수득하기 위하여 효소에 의해 탈중합될 수 있다.
"프로모터"는 핵산의 전사를 지시하는 핵산 제어 서열이다. 본 명세서에 사용된 바와 같이, 프로모터는 전사 개시 부위 근처에 필수 핵산 서열, 예를 들어, 폴리머라제 II형 프로모터의 경우 TATA 요소를 포함한다. 프로모터는 또한 선택적으로 전사 개시 부위로부터 수천 염기쌍 정도로 멀리 위치할 수 있는 말단 인핸서 또는 리프레서 요소를 포함한다.
"재조합체"는 외인성 핵산의 도입 또는 본래 핵산의 변경으로 인해 변형된 세포, 핵산, 단백질 또는 벡터이다. 따라서, 예를 들어, 재조합 세포는 본래(비-재조합) 형태의 세포 내에서 발견되지 않는 유전자를 발현하거나 비-재조합 세포에 의해 발현되는 유전자와는 상이하게 본래 유전자를 발현한다. "재조합 핵산"은 예를 들어, 폴리머라제 및 엔도뉴클레아제를 사용하는 핵산의 조작에 의해 일반적으로 시험관 내 형성된 본래의 핵산이거나 통상적으로 천연에서 존재하지 않는 형태로 존재한다. 예를 들어 작동가능한 연결에서 2개 이상의 핵산을 위치시키기 위해 재조합 핵산이 생성될 수 있다. 따라서, 통상적으로 천연에서 연결되어 있지 않은 DNA 분자를 결찰하는 것에 의해 시험관 내 형성된 분리된 핵산 또는 발현 벡터는 둘 다 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 일단 재조합 핵산이 제조되고 숙주 세포 또는 유기체로 도입되면, 이것은 숙주 세포의 생체 내 세포 기구를 사용하여 복제할 수 있지만; 일단 재조합적으로 생성되면, 이러한 핵산은 후속적으로 세포 내에서 복제된다 하더라도 여전히 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 유사하게, "재조합 단백질"은, 즉, 재조합 핵산의 발현을 통해 재조합 기술을 사용하여 제조된 단백질이다.
"재생 디젤"은 지질의 수소화 및 탈산소화를 통해 생성된 알칸(예를 들어, C10:0, C12:0, C14:0, C16:0 및 C18:0)의 혼합물이다.
"당화"는 바이오매스, 통상적으로 셀룰로스 또는 리그노셀룰로스 바이오매스를 글루코스 및 자일로스와 같은 단량체성 당으로 전환시키는 공정이다. "당화된" 또는 "탈중합된" 셀룰로스 물질 또는 바이오매스는 당화를 통해 단량체 당으로 전환되는 셀룰로스 물질 또는 바이오매스를 말한다.
용어 "유사한"은 자연적으로 발생하는 오일과 비교하는 내용에서 사용될 때, 추가 정량화 없이, 자연적으로 발생하는 오일과 비교되는 오일이 자연적으로 발생하는 오일의 최고 2가지 트라이글라이세라이드의 약 +/- 15%, 또는 +/- 10%를 함유하는 것을 의미한다. 예를 들어 쉬어버터(부티로스퍼멈 파키(B. Parkii)의 오일)는 2가지의 가장 흔한 트라이글라이세라이드 성분으로서 41.2-56.8% C18:0 및 34.0-46.9% C18:1을 함유한다(표 5를 참조). +/- 10% 내의 "유사한" 오일은 2가지 가장 흔한 트라이글라이세라이드로서 약 37% 내지 약 62% C18:0 및 31% 내지 약 52% C18:1을 함유한다. 이 내용에서 사용될 때, 용어 "유사한"은 +/- 9%, +/- 8%, +/- 7%, +/- 6%, +/- 5%, +/- 4%, +/- 3%, +/- 2%, 또는 +/- 1%를 포함하며, 자연적으로 발생하는 오일의 최고 3가지 또는 최고 4가지의 트라이글라이세라이드, 또는 최고 3가지 트라이글라이세라이드 이외의 2가지, 또는 최고 4가지 트라이글라이세라이드 이외의 3가지와 비교를 추가로 표시할 수 있다.
"초음파 처리"는 초음파 에너지를 사용하여 세포와 같은 생물학적 물질을 파괴시키는 공정이다.
"푸르푸랄 종"은 동일한 염기성 구조 특성을 보유한 2-푸란카복스알데하이드 또는 유도체이다.
"스토버"는 낟알이 채취된 후 남아있는 작물의 무수 줄기 및 잎이다.
"수크로스 이용 유전자"는 발현되는 경우 에너지원으로서 수크로스를 이용하는 세포의 능력을 도와주는 유전자이다. 수크로스 이용 유전자에 의해 암호화된 단백질은 본 명세서에서 "수크로스 이용 효소"로 언급되고 수크로스 수송체, 수크로스 인버타제, 및 글루코키나제 및 프럭토키나제와 같은 헥소키나제를 포함한다.
II. 배양
본 발명은 지질의 생성을 위해 일반적으로 미생물 유기체(예를 들어, 미세조류, 유지성 효모, 진균 및 박테리아), 특히 재조합 프로토테카 균주를 포함하는 미세조류 균주를 배양하는 것에 관한 것이다. 독자의 편이를 위해, 본 부분은 여러 하위부문으로 세분된다. 하위부문 1은 프로토테카 종 및 균주를 기재하고 게놈 DNA 비교에 의해 새로운 프로토테카 종 및 균주 및 관련 미세조류뿐만 아니라 다른 미생물 유기체를 확인하는 방법을 기재한다. 하위부문 2는 배양에 유용한 생물반응기를 기재한다. 하위부문 3은 배양을 위한 배지를 기재한다. 하위부문 4는 본 발명의 예시적인 배양 방법에 따른 오일 생성을 기재한다. 이들 기재는 또한 다른 미생물 유기체에 대해 더 일반적으로 적용가능하다.
1. 프로토테카 종 및 균주 및 다른 미생물 유기체
프로토테카는 고수준의 지질, 특히, 연료 생산을 위해 적합한 지질을 생산할 수 있기 때문에 지질의 생산에 사용하기 위해 주목할만한 미생물이다. 프로토테카에 의해 생산된 지질은 다른 미세조류에 의해 생산되는 것보다 단쇄 길이 및 고도의 포화를 갖는 탄화수소 쇄를 가진다. 더욱이, 프로토테카 지질은 일반적으로 색소 부재(엽록소 및 특정 카로테노이드의 낮거나 검출가능하지 않은 수준)이고 임의의 경우에 다른 미세조류 유래의 지질 보다 색소를 훨씬 적게 포함한다. 더욱이 본 발명에 의해 제공된 재조합 프로토테카 세포는 다른 미생물로부터 지질을 생산하는 것과 비교하여 보다 큰 수율 및 효율로 저렴하게 지질을 생산하기 위해 사용될 수 있다. 본 발명의 방법에 사용하기 위한 예시적인 프로토테카 균주가 포함된다. 추가로, 상기 미세조류는 종속영양적으로 성장하고 프로토테카 프로토테카 윅케르하미, 프로토테카 스타그노라(UTEX 327을 포함), 프로토테카 포르토리센시스, 프로토테카 모리포미스(UTEX 균주 1441, 1435를 포함), 및 프로토테카 좁피로서 유전자 조작될 수 있다. 프로토테카 속의 종은 절대 종속영양생물이다.
본 발명에 사용하기 위한 프로토테카 종은 게놈의 특정 표적 영역의 증폭으로 확인될 수 있다. 예를 들어, 특정 프로토테카 종 또는 균주의 확인은 프라이머 및 게놈의 임의의 영역을 사용하는 방법, 예를 들어, 문헌[Wu et al., Bot. Bull. Acad. Sin. (2001) 42: 115-121 Identification of Chlorella spp . isolates using ribosomal DNA sequences]에 기재된 방법을 사용하여 핵 및/또는 엽록체 DNA의 증폭 및 서열분석을 통해 달성할 수 있다. 리보솜 내부 전사된 스페이서(ITS1 및 ITS2 rDNA), 23S rRNA, 18S rRNA, 및 기타 보존된 게놈 영역의 증폭 및 서열분석과 같은 계통발생적 분석에 대해 널리 확립된 방법은 당업자에 의해 사용되어 프로토테카의 종뿐만 아니라 유사한 지질 프로파일 및 생산 능력을 갖는 다른 탄화수소 및 지질 생산 미생물 종을 확인할 수 있다. 조류의 확인 및 분류 방법에 대한 예는 또한 문헌[Genetics, 2005 Aug;170(4): 1601-10 및 RNA, 2005 Apr;11(4):361-4]을 참조한다.
따라서, 게놈 DNA 비교를 사용하여 본 발명에 사용되는 미세조류의 적합한 종을 확인할 수 있다. 이에 제한되지 않는 23S rRNA를 암호화하는 DNA와 같은 보존된 게놈 DNA의 영역은 미세조류 종으로부터 증폭시키고 컨센서스 서열과 비교하여 본 발명에 사용되는 바람직한 미세조류와 분류학적으로 관련된 미세조류 종을 스크리닝할 수 있다. 프로토테카 속 내의 종에 대한 상기 DNA 서열 비교의 예는 하기에 나타낸다. 게놈 DNA 비교는 또한 균주 수거에서 잘못 확인된 미생물 종을 확인하는데 유용할 수 있다. 흔히 균주 수거는 표현형 및 형태적 특성을 기본으로 미세조류 종을 확인한다. 이들 특성의 사용은 미세조류의 종 또는 속의 잘못된 분류를 유도할 수 있다. 게놈 DNA 비교를 사용하는 것이 이들의 계통발생 관계를 기준으로 미세조류 종을 분류하는데 더 우수한 방법일 수 있다.
본 발명에 사용하기 위한 미세조류는 전형적으로 서열번호 11 내지 19에 열거된 서열 중 하나 이상과 적어도 99%, 적어도 95%, 적어도 90%, 또는 적어도 85%의 뉴클레오타이드 동일성을 갖는 23S rRNA를 암호화하는 게놈 DNA 서열을 가진다.
뉴클레오타이드 또는 아미노산 동일성%을 결정하기 위한 서열 비교를 위해, 전형적으로 하나의 서열이 기준 서열로 작용하고 이것과 시험 서열을 비교한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열을 컴퓨터에 입력하고 경우에 따라 세부서열의 좌표를 지정하며 서열 알고리즘 프로그램 파라미터를 지정한다. 이어서 서열 비교 알고리즘을 사용하여 지정된 프로그램 파라미터를 기준으로 표준 서열에 대한 시험 서열의 서열 동일성%를 계산한다.
비교용 서열의 최적의 정렬은 예를 들어, 문헌[Smith & Waterman, Adv . Appl. Math. 2:482 (1981)]의 국소 상동성 알고리즘, 문헌[Needleman & Wunsch, J. Mol. Biol . 48:443 (1970)]의 상동성 정렬 알고리즘, 문헌[Pearson & Lipman, Proc. Nat'l . Acad . Sci . USA 85:2444 (1988)]의 유사성 검색 방법, (Wisconsin Genetics 소프트웨어 패키지의 GAP, BESTFIT, FASTA, 및 TFASTA, 위스콘신주 매디슨시 사이언스 드라이브 575에 소재한 Genetics Computer Group)]의 당해 알고리즘의 컴퓨터에 의한 수행, 또는 육안 검사(일반적으로 문헌[Ausubel et al., 상기 참조])에 의해 수행될 수 있다.
서열 동일성 및 서열 유사성 %를 결정하기 위해 적합한 또 다른 예시적 알고리즘은 문헌[Altschul et al., J. Mol . Biol . 215:403-410 (1990)]에 기재된 BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국가생물공학센터(National Center for Biotechnology Information)(웹 주소: www.ncbi.nlm.nih.gov)를 통해 입수할 수 있다. 상기 알고리즘은 먼저 탐색 서열에서 길이에 대한 단축어 W를 확인하는 것으로 높은 점수의 서열 쌍(high scoring sequence pair, HSP)을 확인하는 것을 포함하고 이는 데이타베이스 서열 중에 동일한 길이의 단어와 정렬되는 경우 몇몇 양성 값의 역치 점수 T와 일치하거나 이를 충족시킨다. T는 이웃 단어 점수 역치로서 언급된다(Altschul et al., 상기 참조). 이들 초기 이웃 단어 히트는 이들을 함유하는 보다 긴 HSP를 발견하기 위한 검색을 개시하기 위한 근거로서 작용한다. 단어 히트를 이어서 누적 정렬 점수가 증가될 수 있는 한 각각의 서열을 따라 양방향으로 확장시킨다. 누적 점수는 뉴클레오타이드 서열에 대해 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수: 항상 > 0임) 및 N(불일치 잔기에 대한 페널티 점수: 항상 < 0)을 사용하여 계산한다. 아미노산 서열에 대해, 스코어링 매트릭스를 사용하여 누적 점수를 계산한다. 각각의 방향에서의 단어 히트의 확장은 다음의 경우에 중지한다: 누적 정렬 점수가 이의 최대 달성 값으로부터 X 양으로 이탈하는 경우; 누적 점수가 하나 이상의 음성 스코어링 잔기 정렬의 누적으로 인해 0 이하로 되는 경우; 또는 서열의 말단에 도달하는 경우. 핵산 또는 폴리펩타이드가 본 발명의 범위 내에 있는지의 여부를 확인하기 위해, BLAST 프로그램의 디폴트(default) 파라미터가 적합하다. BLASTN 프로그램(뉴클레오타이드 서열용)은 11의 단어 길이(W), 10의 예상치(E), M=5, N=-4, 및 양쪽 서열가닥의 비교를 디폴트로서 사용한다. 아미노산 서열을 위해, BLASTP 프로그램은 3의 단어 길이(W), 10의 예상치(E) 및 BLOSUM62 스코어링 매트릭스를 디폴트로서 사용한다. TBLATN 프로그램(뉴클레오타이드 서열용 단백질 서열을 사용하는)은 3의 단어 길이(W), 10의 예상값(E) 및 BLOSUM 62 스코어링 매트릭스를 디폴트로서 사용한다(문헌[Henikoff & Henikoff, Proc . Natl . Acad . Sci . USA 89:10915 (1989)] 참조).
서열 동일성%를 계산하는 것뿐만 아니라, BLAST 알고리즘은 또한 2개의 서열 간의 유사성에 대한 통계학적 분석을 수행한다(예를 들어, 문헌[Karlin & Altschul, Proc . Nat'l . Acad . Sci . USA 90:5873-5787(1993)] 참조). BLAST 알고리즘에 의해 제공된 한가지의 유사성 측정은 최소 합계 가능성(P(N))이고 이는 2개의 뉴클레오타이드 또는 아미노산 서열 간의 일치가 우연히 발생할 가능성을 지적한다. 예를 들어, 표준 핵산에 대한 시험 핵산의 비교에 있어서 최소의 합계 가능성이 약 0.1 미만, 더 바람직하게는 약 0.01 미만 및 가장 바람직하게는 약 0.001 미만인 경우 핵산은 기준 서열과 유사한 것으로 간주된다.
본 발명에 사용하기 위한 미생물의 선택에 영향을 주는 다른 고려사항은 오일, 연료 및 함유화학물질의 생산을 위해 적합한 지질 또는 탄화수소의 생성 뿐만 아니라 다음을 포함한다: (1) 세포 중량%로서 고지질 함량; (2) 성장의 용이함; (3) 유전자 가공의 용이함; 및 (4) 바이오매스 가공처리의 용이함. 특정 양태에서, 야생형 또는 유전자 조작된 미생물은 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 또는 적어도 70%의 지질인 세포가 생성되도록 한다. 바람직한 유기체는 (빛의 부재 하에 당에서) 종속영양적으로 성장한다.
본 발명의 실행에 사용될 수 있는 조류의 예는, 이에 제한되는 것은 아니지만, 표 1에 열거된 다음의 조류를 포함한다.
Figure 112018108415035-pat00001
본 발명의 실행에 사용될 수 있는 유지성 효모의 예는, 이에 제한되는 것은 아니지만, 표 26에서 열거되는 다음의 유지성 효모를 포함한다.
Figure 112018108415035-pat00002
본 발명의 실행에 사용될 수 있는 다른 진균의 예는, 이에 제한되는 것은 아니지만, 표 27에 열거된 다음의 진균을 포함한다.
Figure 112018108415035-pat00003
본 발명의 일부 실시형태에서, 미생물 유기체는 박테리아이다. 대장균(E. coli)와 같은 박테리아의 외인성 유전자의 발현 예는 잘 공지되어 있다; 예를 들어 문헌[Molecular Cloning: A Laboratory Manual, Sambrook et al. (3d edition, 2001, Cold Spring Harbor Press)]을 참조한다.
2. 생물반응기
미생물은 유전적 유전자 조작을 수행하고 탄화수소(예를 들어, 지질, 지방산, 알데하이드, 알코올 및 알칸)를 생성할 2가지 목적을 위해 배양한다. 전자 유형의 배양은 소규모 및 처음에는 적어도 출발 미생물이 성장할 수 있는 조건 하에서 수행한다. 탄화수소를 생산하기 위한 배양은 생물반응기에서 통상적으로 대규모(예를 들어, 10,000ℓ, 40,000ℓ, 100,000ℓ 또는 더 대형의 생물반응기)로 수행한다. 프로토테카 종을 포함하는 미세조류는 전형적으로 생물반응기 내 액체 배지 중에서 본 발명의 방법으로 배양한다. 전형적으로, 생물반응기는 빛이 입사되지 않도록 한다.
생물반응기 또는 발효기를 사용하여 다양한 단계의 생리적 주기를 통해 유지성 미생물 세포, 바람직하게는 미세조류 세포를 배양한다. 생물반응기는 종속영양 성장 및 번식 방법에 사용하기 위해 많은 이점을 제공한다. 식품에 사용하기 위한 바이오매스를 생산하기 위해 미세조류를 예로서 현탁액 배양물과 같은 액체 중에서 다량으로 바람직하게 발효시킨다. 강철 발효기와 같은 생물반응기는 매우 큰 배양 부피(40,000 리터 이상의 용량을 갖는 생물반응기가 본 발명의 다양한 양태에서 사용된다)을 수용할 수 있다. 생물반응기는 또한 전형적으로 온도, pH, 산소압 및 이산화탄소 수준과 같은 배양 조건의 제어를 허용한다. 예를 들어, 생물반응기는 전형적으로 예를 들어, 튜빙에 부착된 포트를 사용하여 산소 또는 질소와 같은 가스 성분이 액체 배양물을 통해 기포 주입될 수 있도록 하는 형태를 취할 수 있다. 배양 배지의 pH, 미량 요소의 종류 및 농도 및 기타 배지 성분과 같은 다른 배양 파라미터가 또한 생물반응기를 사용하여 더 용이하게 조작될 수 있다.
생물반응기는 미세조류가 증식하고 수적으로 증가하는 전반적인 시간에 걸쳐 생물반응기를 통해 배양 배지가 유입되도록 하는 형태를 취할 수 있다. 일부 경우에, 예를 들어, 배지는 접종 후 세포가 목적하는 밀도에 도달하기 전에 생물반응기로 주입될 수 있다. 다른 경우에, 생물반응기에는 배양 초기에 배양 배지가 충전되고 배양물이 접종된 후에는 더 이상의 배양 배지가 주입되지 않는다. 다른 말로, 미세조류 바이오매스는 미세조류가 증식하고 수적으로 증가하는 기간 동안 수성 배지에서 배양되지만 수성 배양 배지의 양이 그 기간에 걸쳐 생물반응기를 통해 유입되지 않는다. 따라서, 일부 경우에, 수성 배양 배지는 접종 후 생물반응기를 통해 유입되지 않는다.
회전 블레이드 및 임펠러, 잠금 기구, 교반 막대, 가압 가스 주입용 수단과 같은 장치가 장착된 생물반응기를 사용하여 미세조류 배양물이 혼합되도록 할 수 있다. 혼합은 연속적이거나 간헐적일 수 있다. 예를 들어, 일부 경우에, 가스 주입 및 배지 주입의 난기류가 목적하는 수로 미세조류가 증가할 때까지는 미세조류의 증식 동안 유지되지 않는다.
생물반응기 포트를 사용하여 가스, 고체, 반고체 및 액체를, 미세조류를 함유하는 생물반응기 챔버에 도입하거나 추출할 수 있다. 많은 생물반응기는 하나 이상의 포트(예를 들어, 배지 주입을 위한 하나 및 샘플링을 위한 또 다른 하나)를 갖고 단지 하나의 물질이 포트를 출입할 필요는 없다. 예를 들어, 포트를 사용하여 배양 배지가 생물반응기로 유입될 수 있도록 하고 이후에 샘플링, 가스 주입, 가스 배출 또는 기타 목적을 위해 사용될 수 있다. 바람직하게는, 샘플링 포트는 배양의 무균 특성을 손상시키지 않고 반복적으로 사용될 수 있다. 샘플링 포트는 샘플의 흐름이 중지되고 개시되거나 연속 샘플링의 수단을 제공하도록 하는 밸브 또는 기타 장치로 구성될 수 있다. 생물반응기는 전형적으로 배양의 접종을 허용하는 하나 이상의 포트를 갖고 상기 포트는 또한 배지 또는 가스 주입과 같은 다른 목적을 위해 사용될 수 있다.
생물반응기 포트는 미세조류의 배양의 가스 함량이 조작되도록 할 수 있다. 설명하자면 생물반응기 부피의 일부는 액체보다는 가스일 수 있고 생물반응기의 가스 주입구는 가스를 생물반응기로 펌핑될 수 있도록 한다. 생물반응기 내로 유리하게 펌핑될 수 있는 가스는 공기, 공기/CO2 혼합물, 비활성기체(예를 들어, 아르곤) 및 기타 가스를 포함한다. 생물반응기는 전형적으로 사용자가 생물반응기로의 가스 주입 속도를 조절할 수 있도록 구성된다. 상기된 바와 같이, 생물반응기로의 가스 주입 증가를 사용하여 배양물의 혼합을 증가시킬 수 있다.
증가된 가스 유입은 또한 배양물의 탁도에 영향을 미친다. 난기류는 수성 배양 배지의 수위 하부에 가스 주입 포트를 위치시켜 생물반응기로 주입되는 가스가 배양 표면으로 기포 주입되도록 함에 의해 달성할 수 있다. 하나 이상의 가스 배출 포트는 가스가 배출되도록 하여 생물반응기 내 압력 증강을 차단한다. 바람직하게, 가스 배출 포트는 생물반응기로 오염 미생물이 들어가는 것을 차단하는 '원-웨이' 밸브를 유도한다.
3. 배지
미생물 배양 배지는 전형적으로 고정 질소 공급원, 고정 탄소 공급원, 미량 요소, 임의로 pH 유지를 위한 완충제 및 포스페이트(전형적으로 포스페이트 염으로서 제공됨)과 같은 성분들을 함유한다. 기타 성분은 특히 해양 미세조류를 위해 염화나트륨과 같은 염을 함유할 수 있다. 질소 공급원은 예를 들어, 제한 없이 분자 질소, 나이트레이트, 나이트레이트 염, 암모니아(순수 형태 또는 염 형태, 예를 들어, (NH4)2SO4 및 NH4OH), 단백질, 대두 음식물, 옥수수 침지액, 및 효모 추출물을 포함하는 유기 및 무기 질소 공급원을 함유한다. 미량 요소의 예는 아연, 붕소, 코발트, 구리, 망간, 및 몰리브덴을 포함하고 예를 들어, 이의 각각의 형태는 ZnCl2, H3BO3, CoCl2ㆍ6H2O, CuCl2ㆍ2H2O, MnCl2ㆍ4H2O 및 (NH4)6Mo7O24ㆍ4H2O이다.
본 발명의 방법에 따라 유용한 미생물은 전세계적으로 다양한 장소 및 환경에서 발견된다. 다른 종 및 이들의 궁극적인 분화 분기점으로부터의 분리 결과로서, 최적의 성장 및 지질 및/또는 탄화수소 구성성분들의 최적의 생산을 위한 특정 성장 배지는 예측하기 어려울 수 있다. 일부 경우에, 특정 미생물 균주는 몇몇 억제 성분의 존재 또는 특정 미생물 균주에 의해 요구되는 임의의 필수 영양 요구성 물질의 부재 때문에 특정 성장 배지 상에서 성장할 수 없다.
고체 및 액체 성장 배지는 일반적으로 다양한 공급원으로부터 시판되고 광범위한 미생물 균주를 위해 적합한 특정 배지를 제조하기 위한 지침은, 예를 들어 조류의 배양물 수집을 위해 미국 텍사스주 78712-0183 오스틴시 유니버시티 스테이션 A6700 1에 소재한 오스틴 텍사스 유니버시티(UTEX)에서 운영하는 온라인 사이트(http://www.utex.org/)에서 찾을 수 있다. 예를 들어, 다양한 담수 및 염수 배지는 본 명세서에 참조로서 포함된 국제특허출원 공개번호 2008/151149에 기재된 것들을 포함한다.
특정 예에서, 프로테오스 배지(Proteose Medium)는 무균 조건에 적합하고 배지의 1ℓ 부피의 배지(pH ~ 6.8)는 1리터의 Bristol 배지에 1g의 프로테오스 펩톤을 첨가하여 제조할 수 있다. Bristol 배지는 수용액 중에 2.94 mm NaNO3, 0.17 mm CaCl2ㆍ2H2O, 0.3 mmMgSO4ㆍ7H2O, 0.43 mM, 1.29 mm KH2PO4, 및 1.43 mm NaCl를 포함한다. 1.5% 한천 배지에 대해, 15g의 한천을 1ℓ의 용액에 첨가할 수 있다. 상기 용액을 덮고 오토클레이빙하고 이어서 사용 전에 냉장 온도에 저장한다. 또 다른 예는 10g/ℓ의 수소칼륨 프탈레이트(postassium hydrogen phthalate, KHP), 0.9g/ℓ의 수산화나트륨, 0.1g/ℓ의 황산마그네슘, 0.2g/ℓ의 인산수소칼륨, 0.3g/ℓ의 염화암모늄, 10g/ℓ의 글루코스, 0.001g/ℓ의 티아민 하이드로클로라이드, 20g/ℓ 한천, 0.25g/ℓ의 5-플루오로사이토신을 포함하고 pH 범위가 5.0 내지 5.2인 프로토테카 분리 배지(Prototheca isolation medium, PIM)이다(Pore, 1973, App. Microbiology, 26: 648-649). 본 발명의 방법에 사용하기에 적합한 다른 배지는 상기된 URL에 문의하거나 미생물 배양물을 유지하는 다른 기관(예를 들어, SAG, CCAP, 또는 CCALA)에 문의하여 용이하게 확인할 수 있다. SAG는 괴팅겐 유니버시티(University of Gottingen)(독일 괴팅겐에 소재)에서의 조류 배양 수거물을 언급하고, CCAP는 스코틀랜드 해양연구기관(Scottish Association for Marine Science)(영국 스코틀랜드에 소재)에 의해 관리되는 조류 및 원생동물의 배양 수거물을 언급하고, CCALA는 식물학 연구소(Institute of Botany)(체코 공화국 트레본에 소재)의 조류 연구소의 배양 수거물을 언급한다. 추가로, 미국 특허 제5,900,370호는 프로토테카 종의 종속영양 발효에 적합한 배지 제형 및 조건을 기재하고 있다.
오일 생산을 위해, 고정 탄소 공급원의 선택이 중요한데 그 이유는 고정 탄소 공급원의 비용이 경제적인 오일 생산을 위해 충분히 낮아야 하기 때문이다. 따라서, 적합한 탄소 공급원은 예를 들어, 아세테이트, 플로리도사이드, 프럭토스, 갈락토스, 글루쿠론산, 글루코스, 글라이세롤, 락토스, 만노스, N-아세틸글루코사민, 람노스, 수크로스, 및/또는 자일로스를 포함하고 상기 화합물을 함유하는 공급원료의 선택이 본 발명의 방법의 중요한 측면이다. 본 발명의 방법에 따라 유용한 적합한 공급원료는 예를 들어, 블랙 음료, 옥수수 전분, 탈중합된 셀룰로스 물질, 유청, 당밀, 감자, 수수, 수크로스, 사탕수수, 사탕무, 쌀 및 밀을 포함한다. 탄소 공급원은 또한 수크로스와 탈중합된 사탕무 펄프의 혼합물과 같은 혼합물로서 제공될 수 있다. 하나 이상의 탄소 공급원(들)은 하나 이상의 외인성으로 제공된 고정 탄소 공급원(들)의 적어도 약 50μM, 적어도 약 100μM, 적어도 약 500μM, 적어도 약 5 mM, 적어도 약 50 mM, 및 적어도 약 500 mM의 농도로 제공될 수 있다. 본 발명의 목적을 위해 특히 유리한 탄소 공급원은 셀룰로스(탈중합된 형태), 글라이세롤, 수크로스 및 수수를 포함하고, 이들 각각은 이하에서 더욱 상세하게 논의된다
본 발명에 따라, 미생물은 공급원료로서 탈중합된 셀룰로스 바이오매스를 사용하여 배양할 수 있다. 셀룰로스 바이오매스(예를 들어, 스토버)는 저렴하고 용이하게 입수할 수 있지만, 효모용 공급원료서 상기 물질을 사용하기 위한 시도는 실패했었다. 특히, 상기 공급원료는 효모 성장에 억제 작용을 하는 것으로 밝혀졌고 효모는 셀룰로스 물질로부터 생성된 5탄당(예를 들어, 헤미-셀룰로스 유래의 자일로스)을 사용할 수 없다. 대조적으로, 미세조류는 가공된 셀룰로스 물질상에서 성장할 수 있다. 셀룰로스 물질은 일반적으로 약 40-60%의 셀룰로스; 약 20-40%의 헤미셀룰로스 및 10-30%의 리그닌을 포함한다.
적합한 셀룰로스 물질은 농작물, 즉, 식물 일부, 1차 식품 또는 섬유 생성물과 함께 야생에서 제거되지 않는 주로 줄기 및 잎뿐만 아니라 초본성 및 목재 에너지 작물로부터의 잔사를 포함한다. 이의 예는 농업 폐기물, 예를 들어, 사탕 수수 바가스, 쌀겨, 옥수수 섬유(줄기, 잎, 껍질 및 코브), 밀짚, 쌀짚, 사탕무 펄프, 감귤 펄프, 감귤 과피; 산림 폐기물, 예를 들어, 경목재 및 연목재 간벌, 및 수목 작업으로부터의 경목재 및 연목재 잔사; 목재 폐기물, 예를 들어, 톱 가루 폐기물(목재 칩, 톱밥) 및 펄프 가루 폐기물; 도시 폐기물, 예를 들어, 시의 고형 폐기물의 종이 분획물, 도시 목재 폐기물 및 도시 녹색 폐기물, 예를 들어, 시의 유리 클립핑; 및 목재 건축 폐기물을 포함한다. 추가의 셀룰로스는 스위치그래스, 하이브리드 포플라 목재 및 미스칸투스, 섬유질 케인(cane) 및 섬유질 수수와 같은 전용 셀룰로스 작물을 포함한다. 상기 물질로부터 생성된 5탄당은 자일로스를 포함한다.
셀룰로스 물질은 상기 물질내 함유된 당(들)을 미생물이 이용할 수 있도록 효율이 증가되도록 처리된다. 본 발명은 산 분해 후 셀룰로스 물질을 처리하여 물질이 미생물(예를 들어, 미세조류 및 유성 효모)의 종속영양성 배양에 사용하기에 적합하도록 하는 신규 방법을 제공한다. 상기 논의된 바와 같이, 리그노셀룰로스 바이오매스는 셀룰로스, 베타 1,4 연결된 글루코스(6탄당)의 결정성 중합체, 헤미셀룰로스, 자일로스(5탄당)로 주로 구성된 더 느슨하게 연합된 중합체 및 더 드문 정도의 만노스, 갈락토스, 아라비노스, 리그닌, 시나필 알코올 및 이의 유도체로 구성된 복합 방향족 중합체, 및 알파 1,4-연결된 폴리갈락투론산의 직쇄인 펙틴을 포함하는, 다양한 분획물로 구성된다. 셀룰로스 및 헤미셀룰로스의 중합체 구조때문에 이들내 당(예를 들어, 단량체 글루코스 및 자일로스)은 많은 미생물에 의해 효율적으로 사용될 수 있는(대사되는) 형태로 존재하지 않는다. 상기 미생물을 위해 중합체를 구성하는 단량체 당을 생성하도록 셀룰로스 바이오매스를 추가로 가공하면 셀룰로스 물질이 공급원료(탄소 공급원)로서 효율적으로 확실히 사용되는데 매우 도움이 될 수 있다.
셀룰로스 또는 셀룰로스 바이오매스는, 바이오매스가 승온 및 승압에서 희석 황산(또는 다른 산)으로 처리되는 "폭발(explosion)"로 칭해지는 공정에 적용된다. 상기 공정 조건은 셀룰로스 및 헤미셀룰로스 분획물의 글루코스 및 자일로스 단량체로 효소적 가수분해에 바이오매스가 효율적으로 적용될 수 있도록 한다. 수득한 단량체 당은 셀룰로스 당으로 호칭된다. 셀룰로스 당은 이어서 미생물에 의해 이용되어 다양한 대사물(예를 들어, 지질)이 생성될 수 있도록 한다. 산 분해 단계는 헤미셀룰로스 분획물이 구성 모노사카라이드로 부분 가수분해 되도록 한다. 이들 당은 추가의 처리로 바이오매스로부터 완전히 유리될 수 있다. 일부 경우에, 추가의 처리는 열수 처리이고 이는 분해된 물질을 고온수로 세척하여 염과 같은 오염물을 제거하도록 함을 포함한다. 상기 단계는 상기 공정에 사용되는 더 희석된 당 농도로 인해 셀룰로스 에탄올 발효를 위해 필요하지 않다. 다른 양태에서, 추가의 처리는 추가의 산 처리이다. 여전히 다른 양태에서, 추가의 처리는 분해된 물질의 효소적 가수분해이다. 이들 처리는 또한 임의의 조합으로 사용될 수 있다. 처리 유형은 유리되는 당(예를 들어, 5탄당 대 6탄당), 및 이들이 당해 공정에서 유리되는 단계의 유형에 영향을 미칠 수 있다. 결과로서, 이들이 5탄당 또는 6탄당이든 상관없이 상이한 당 스트림이 생성될 수 있다. 이들 집적된 5탄당 또는 6탄당 스트림은 따라서 상이한 탄소 이용 능력을 갖는 특이적 미생물에 지시될 수 있다.
본 발명의 방법은 전형적으로 에탄올 발효에서 달성되는 것보다 높은 세포 밀도로 발효시키는 단계를 포함한다. 종속 영양성 셀룰로스 오일 생산을 위한 배양물의 보다 높은 밀도 때문에, 고정 탄소 공급원(예를 들어, 셀룰로스 유래된 당 스트림(들))은 바람직하게 농축된 형태로 존재한다. 탈중합된 셀룰로스 물질의 글루코스 수준은 바람직하게 배양 단계 전에 바람직하게는 적어도 300g/리터, 적어도 400g/리터, 적어도 500g/리터 또는 적어도 600g/리터이고, 상기 배양 단계는 임의로 유가식 배양이며, 여기서 상기 물질은 세포가 성장하고 지질을 축적시킴으로써 시간 경과에 따라 세포에 공급된다. 셀룰로스 당 스트림은 셀룰로스 에탄올 생산에서 상기 농도 범위에서 또는 이의 근처에서 사용되지 않는다. 따라서, 리그노셀룰로스 오일의 생성 동안에 매우 높은 세포 밀도를 생성하고 유지하기 위해서는 탄소 공급원료(들)가 고농축된 형태로 종속영양 배양물로 전달되어야만 한다. 그러나, 이에 대한 기질이 아니고 유성 미생물에 의해 대사되지 않는 공급 스트림에서 임의의 성분은 생물반응기에 축적되고 이것은 성분이 목적하는 최종 생성물의 생산에 독성이거나 억제성인 경우 문제를 유발할 수 있다. 분해 공정 및 후속적인 중화 공정 둘 다에서 셀룰로스 물질의 생성으로부터 유래된 푸르푸랄 및 하이드록시메틸 푸르푸랄 및 염과 같은 리그닌 및 리그닌 유래 부산물, 탄수화물 유래된 부산물 및 심지어 비대사된 펜토스/헥소스 당은 에탄올 발효에서 문제점을 제공할 수 있고 이들 효과는 초기 공급원료에서 이들의 농도가 높은 공정에서 상당히 증폭된다. 본 발명에 기재된 리그노셀룰로스 오일의 대규모 생산에 사용될 수 있는 6탄당에 대한 300g/ℓ 범위 (또는 이보다 높은)의 당 농도를 달성하기 위해, 이들 독성 물질의 농도는 셀룰로스 바이오매스의 에탄올 발효에 전형적으로 존재하는 농도 보다 20배 높을 수 있다.
셀룰로스 물질의 폭발 공정 처리는 상당한 양의 황산, 열 및 압력을 사용함으로써, 탄수화물의 부산물, 즉 푸르푸랄 및 하이드록시메틸 푸르푸랄을 유리시킨다. 푸르푸랄 및 하이드록시메틸 푸르푸랄은 크실로스의 푸르푸랄 및 물로의 탈수를 통한 헤미셀룰로스의 가수분해 동안 생성된다. 본 발명의 일부 경우에, 이들 부산물(예를 들어, 푸르푸랄 및 하이드록시메틸 푸르푸랄)은 생물반응기로 도입하기 전에 당화된 리그노셀룰로스 물질로부터 제거된다. 본 발명의 특정 양태에서, 탄수화물의 부산물의 제거 공정은 분해된 셀룰로스 물질의 열수 처리이다. 또한, 본 발명은 푸르푸랄 또는 하이드록시메틸 푸르푸랄과 같은 화합물에 내성일 수 있는 균주가 리그노셀룰로스 오일 생산에 사용되는 방법을 제공한다. 또 다른 양태에서, 본 발명은 또한 발효 배지에서 푸르푸랄에 내성일 수 있는 것뿐만 아니라 실제로 리그노셀룰로스 오일의 생산 동안에 당해 부산물을 대사시킬 수 있는 미생물 및 방법을 제공한다.
상기 분해 공정은 또한 상당한 수준의 염을 생성한다. 예를 들어, 분해를 위한 전형적인 조건은 분해된 셀룰로스 바이오매스가 10:1의 물:고체(건조 중량)로 재현탁되는 경우 5 mS/㎝ 초과의 전도성을 유도할 수 있다. 본 발명의 특정 양태에서, 희석된 분해된 바이오매스는 효소 당화에 적용되고 수득한 현탁액은 생물반응기에 사용하기 위해 25배까지 농축된다. 농축된 당 스트림(들)에서 염 수준(전도성에 의해 측정된 바와 같이)은 허용가능하지 않게 높을 수 있다(1.5M까지의 Na+ 당량). 추가의 염은 또한 후속적인 효소 당화 공정을 위해 분해된 물질의 중화 즉시 생성된다. 본 발명은 이들 염을 제거하기 위한 방법을 제공하여 수득한 농축된 셀룰로스 당 스트림(들)은 리그노셀룰로스 오일을 생산하기 위한 종속영양 공정에 사용될 수 있도록 한다. 일부 경우에, 상기 염을 제거하는 방법은 예를 들어, 이에 제한되지 않지만 DOWEX Marathon MR3과 같은 수지를 사용한 탈이온화이다. 특정 양태에서, 수지 단계를 사용하는 탈이온화는 당화 전에, 당 농축 또는 pH 조정 전 및 바이오매스의 열수 처리 전 또는 이들의 임의의 조합 전에 수행한다; 다른 양태에서, 상기 단계는 이들 공정 중 하나 이상 후에 수행한다. 다른 양태에서, 분해 공정 자체는 허용가능하지 않게 고수준으로 염의 생성을 피하도록 변화시킨다. 예를 들어, 셀룰로스 바이오매스의 황산(또는 다른 산) 분해에 대한 적합한 대용법은 기계적 펄핑으로 셀룰로스 바이오매스가 효소적 가수분해(당화)에 민감해지도록 하는 것이다. 여전히 다른 양태에서, 고수준의 염에 내성인 미생물의 본래의 균주 또는 고수준의 염에 내성을 갖는 유전자 조작된 균주가 사용된다.
유성 미생물을 사용하는 종속영양 오일 생산에 사용하기 위한 분해된 셀룰로스 바이오매스를 제조하는 방법. 제1 단계는 재현탁된 분해된 셀룰로스 바이오매스를 5.0 내지 5.3의 범위로 pH를 조정하고 이어서 셀룰로스 바이오매스를 3회 세척함을 포함한다. 상기 세척 단계는 탈염 및 이온 교환 수지, 역삼투압, 열수 처리(상기 기재) 또는 단지 반복적인 재현탁 및 탈이온수중에서 원심분리의 사용을 포함하는 다양한 수단에 의해 달성될 수 있다. 상기 세척 단계는 전도성이 100-300 μS/cm인 셀룰로스 스트림을 유도하고 상당한 양의 푸르푸랄 및 하이드록시메틸 푸르푸랄을 제거시킨다. 상기 세척 단계로부터 이동은 헤미셀룰로스 분획물로부터 유리된 5탄당을 농축시키는 단계를 배제할 수 있다. 제2 단계는 세척된 셀룰로스 바이오매스의 효소적 당화를 포함한다. 바람직한 양태에서, 아셀레라제(Genencor)를 사용한다. 제3 단계는 상기 당화된 바이오매스의 원심분리 또는 이동시키기 및 세정을 통한 당의 회수를 포함한다. 수득한 바이오매스(고체)는 연료로서 사용될 수 있거나 폐기물로 보내질 수 있는 에너지 집적된 리그닌 풍부 성분이다. 원심분리/이동시키기 및 세정 공정에서 회수된 당 스트림을 수거한다. 제4 단계는 투과물의 회수와 함께 오염 고체를 제거하기 위한 마이크로여과를 포함한다. 제5 단계는 진공 증발기를 사용하여 달성될 수 있는 농축 단계를 포함한다. 상기 단계는 수득한 당 공급원료의 단백질 함량으로 인해 때때로 필요한 P'2000(Sigma/Fluka)과 같은 소포제의 첨가를 임의로 포함할 수 있다.
본 발명의 방법의 또 다른 양태에서, 탄소 공급원은 바이오디젤 에스터결합 전이반응으로부터 산성화되고 비-산성화된 글라이세롤 부산물을 포함하는 글라이세롤이다. 하나의 양태에서, 탄소 공급원은 글라이세롤 및 하나 이상의 다른 탄소 공급원을 포함한다. 일부 경우에, 글라이세롤 및 하나 이상의 다른 고정 탄소 공급원 모두는 발효 초기에 미생물에 제공된다. 일부 경우에, 글라이세롤 및 하나 이상의 다른 고정 탄소 공급원이 사전 결정된 비율로 동시에 미생물에 제공된다. 일부 경우에, 글라이세롤 및 하나 이상의 다른 고정 탄소 공급원은 발효 과정 동안에 소정의 속도로 미생물에 공급된다.
몇몇 미세조류는 글루코스의 존재에서보다 글라이세롤의 존재 하에서 보다 빠르게 세포 분열을 진행한다(국제특허출원 공개번호 제2008/151149호 참조). 이들 경우에, 처음에 세포에게 글라이세롤을 공급하여 세포 밀도를 신속하게 증가시킴에 이어서 글루코스를 공급하여 지질을 축적시키는 2단계 성장 공정은 지질이 생산되는 효율을 개선시킬 수 있다. 에스터결합 전이반응 공정의 글라이세롤 부산물의 사용은 생산 공정으로 도입되는 경우 상당한 경제적인 이점을 제공한다. 글라이세롤 및 글루코스의 혼합물과 같은 다른 공급 방법이 제공된다. 상기 혼합물의 공급은 또한 동일한 경제적 이득을 취득한다. 또한, 본 발명은 글라이세롤과 다양하게 배합된 수크로스와 같은 대안적인 당을 미생물에 공급하는 방법을 제공한다.
본 발명의 다른 실시형태에서, 탄소 공급원은 전화당이다. 전화당은 수크로스를 그것의 단당류 성분인 프럭토스 및 글루코스로 분할하는 것으로 생성된다. 전화당의 생성은 당업계에 공지된 몇몇 방법을 통해 달성될 수 있다. 하나의 이러한 방법은 수크로스 수용액을 가열하는 것이다. 종종, 촉매는 수크로스를 전화당으로 전환하는 것을 가속화하기 위하여 사용된다. 이들 촉매는 예를 들어 인버타제와 같은 생물학적 효소일 수 있고, 수크라제는 수크로스에 첨가되어 전화당을 생성하는 가수분해 반응을 가속화할 수 있다. 산은 비생물학적 촉매의 예이며, 가열과 짝지어질 때 가수분해 반응을 가속화할 수 있다. 일단 전화당이 만들어지면, 수크로스와 비교하여 결정화되는 경향이 더 적으며, 따라서 미세조류를 포함하는 미생물의 종속 영양 배양의 경우에, 농축된 탄소 공급원에 대한 필요가 있다. 한 실시형태에서, 탄소 공급원은 전화당으로서, 바람직하게는 농축된 형태이며, 배양 단계 전 바람직하게는 적어도 800g/리터, 적어도 900g/리터, 적어도 1000g/리터 또는 적어도 1100g/리터인데, 이는 선택적으로 유가배양물이다. 바람직하게는 농축된 형태인 전화당은 세포가 성장하고 지질을 축적함에 따라 시간에 걸쳐 세포에 공급된다.
본 발명의 방법의 또 다른 양태에서, 탄소 공급원은 수크로스이고 사탕무 가공으로부터의 진한 사탕무 액즙과 같이 수크로스를 함유하는 복합 공급원료를 포함한다. 종속 영양 오일 생성을 위한 배양물의 더 높은 밀도 때문에, 고정된 탄소 공급원(예를 들어, 수크로스, 글루코스 등)은 바람직하게는 농축된 형태이며, 배양 단계 전 바람직하게는 적어도 500g/리터, 적어도 600g/리터, 적어도 700g/리터 또는 적어도 800g/리터의 고정된 탄소 공급원인데, 이는 선택적으로 유가배양물이며, 이때 해당 물질은 세포가 성장하고 지질을 축적함에 따라 시간에 걸쳐 세포에 공급된다. 일부 경우에, 탄소 공급원은 배양 단계 전 사탕무 액즙의 형태, 바람직하게는 농축된 형태로, 바람직하게는 적어도 60% 고체 또는 약 770g/리터 당, 적어도 70% 고체 또는 약 925g/리터 당, 또는 적어도 80% 고체 또는 약 1125g/리터 당이며, 이는 선택적으로 유가배양물이다. 농축된 사탕무 액즙은 세포가 성장하고 지질을 축적함에 따라 시간에 걸쳐 세포에 공급된다.
하나의 양태에서, 배양 배지는 추가로 하나 이상의 수크로스 이용효소를 추가로 포함한다. 일부 경우에, 배양 배지는 수크로스 인버타제를 포함한다. 하나의 양태에서, 수크로스 인버타제 효소는 미생물 집단에 의해 발현되는 외인성 수크로스 인버타제 유전자에 의해 암호화된 분비가능한 수크로스 인버타제 효소이다. 따라서, 일부 경우에 하기 부문 IV에 더 상세하게 기재되는 바와 같이, 미세조류는 수크로스 수송체, 수크로스 인버타제, 헥소키나제, 글루코키나제 또는 프럭토키나제와 같은 수크로스 이용 효소를 발현하도록 유전적으로 유전자 조작하였다.
수크로스를 함유하는 복합 공급원료는 사탕무 가공 유래의 폐기 당밀을 포함한다: 사탕무 가공의 낮은 가치의 폐기물의 사용은 탄화수소 및 기타 오일의 제조에 상당한 비용 절감을 제공할 수 있다. 본 발명의 방법에 유용한 또 다른 복합 공급원료는 수수 시럽 및 순수한 수수를 포함하는 수수이다. 수수 시럽은 단맛의 사탕수수의 액즙로부터 생산된다. 이의 당 프로파일은 주로 글루코스(덱스트로스), 프럭토스 및 수크로스로 이루어진다.
4. 오일 생성
본 발명의 방법에 따른 오일 생성을 위해, 예를 들어, 빛이 배양물에 입사되지 않도록 하는 매우 대용량(40,000 리터 이상)의 발효기를 사용하는 경우에서와 같이 암실에서 세포를 배양하는 것이 바람직할 수 있다. 프로토테카 종은 고정 탄소 공급원을 함유하는 배지에서 빛의 부재 하에 오일 생성을 위해 성장시키고 번식시킨다; 상기 성장은 종속영양 성장으로서 공지되어 있다.
예로서, 지질-생성 유지성 미생물 세포, 바람직하게는 미세조류 세포의 접종물을 배지에 도입하고 세포가 번식을 시작하기 전에 지체(lag) 기간(지체 단계)이 있다. 지체 기간 후, 번식률은 일정하게 증가하고 로그 또는 대수증식기로 진입한다. 대수증식기에 이어서 질소와 같은 영양물의 감소 및 독성 물질의 증가 및 정족수 감지 메커니즘으로 번식이 느려진다. 상기와 같이 느려진 후, 번식은 멈추고 세포는 정체기 또는 일정한 성장 상태로 진입하고 이는 세포에 제공된 특정 환경에 의존한다. 지질 풍부 바이오매스를 수득하기 위해, 상기 배양물은 전형적으로 질소 또는 또 다른 주요 영양물(탄소 이외의 다른 영양물)이 고갈됨으로써 조기에 종결되어 세포가 과량으로 존재하는 탄소 공급원을 지질로 전환하도록 강요되는 대수증식기 말기 후에 수거한다. 배양 조건 파라미터는 총 오일 생산, 생산된 지질 종의 배합 및/또는 특정 오일의 생성을 최적화하도록 조작될 수 있다.
상기 논의한 바와 같이, 생물반응기 또는 발효기는 세포가 이들의 성장 주기의 다양한 단계를 진행하도록 사용된다. 하나의 예로서, 지질 생산 세포의 접종물은 배지에 도입될 수 있고 이어서 세포가 성장을 시작하기 전에 지체 기간(지체 기)이 도래한다. 상기 지체 기간 후, 성장 속도는 일정하게 증가하고 로그기 또는 대수증식기로 진입한다. 대수증식기에 이어서 영양물의 감소 및/또는 독성 물질의 증가로 인해 성장이 느려진다. 이런 느려지는 단계 후, 성장은 멈추고 당해 세포는 정체기 또는 일정 상태로 진입하고 이는 세포에 제공되는 특정 환경에 의존한다. 본 명세서에 기재된 세포에 의한 지질 생산은 영양물이 공급되거나 세포 분열의 부재 하에 계속적인 지질 생산을 허용하기에 여전히 가용한 정체기를 포함하는, 로그기 또는 이후 기간 동안에 일어날 수 있다.
바람직하게, 본 명세서에 기재되고 당업계에 공지된 조건을 사용하여 성장한 미생물은 적어도 약 20중량%의 지질, 바람직하게는 적어도 약 40중량%의 지질, 더 바람직하게는 적어도 약 50중량%의 지질 및 가장 바람직하게는 약 60중량% 지질을 포함한다. 가공 조건은 특정 용도를 위해 적합한 지질의 수율을 증가시키도록 및/또는 생산 비용을 절감시키도록 조정될 수 있다. 예를 들어, 특정 양태에서, 미세조류는 예를 들어, 질소, 인 또는 황과 같은 하나 이상의 영양물의 제한 농도의 존재 하에 배양하고 글루코스와 같은 과량의 고정 탄소 에너지를 제공한다. 질소 제한은 질소가 과량으로 공급된 배양물에서의 미생물 지질 수율 이상으로 미생물 지질 수율을 증가시키는 경향이 있다. 특정 양태에서, 지질 수율의 증가는 적어도 약 10%, 50%, 100%, 200%, 또는 500%이다. 상기 미생물은 전체 배양 기간중 일부 동안 또는 전체 기간 동안 제한된 양의 영양물의 존재 하에 배양할 수 있다. 특정 양태에서, 총 배양 기간 동안 2회 이상 영양물 농도는 제한 농도와 비제한 농도 사이에서 순환한다. 세포의 지질 함량은 과량의 탄소를 제공하지만 질소를 제한하거나 제공하지 않으면서 증가된 기간 동안 배양을 계속하여 증가시킬 수 있다.
또 다른 양태에서, 지질 수율은 지질 경로 효소(예를 들어, 지방산 합성 효소)를 위한 하나 이상의 조인자(들)의 존재 하에 지질 생산 미생물(예를 들어, 미세조류)를 배양함에 의해 증가된다. 일반적으로, 조인자(들)의 농도는 조인자(들)의 부재 하에 미생물 지질 수율 보다 미생물 지질(예를 들어, 지방산) 수율을 증가시키기에 충분하다. 특정 양태에서, 상기 조인자(들)는 배양물에 조인자(들)를 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세조류)을 포함시킴으로써 배양물에 제공된다. 또는, 조인자(들)는 조인자의 합성에 관여하는 단백질을 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세조류)을 포함시킴으로써 배양물에 제공할 수 있다. 특정 양태에서, 적합한 조인자는 예를 들어, 바이오틴 또는 판토테네이트와 같은 지질 경로 효소에 의해 요구되는 임의의 비타민을 포함한다. 본 발명에 사용하기에 적합한 조인자를 암호화하거나 상기 조인자의 합성에 관여하는 유전자는 널리 공지되어 있고 상기된 것들과 같은 기법 및 전략을 사용하여 미생물(예를 들어, 미세조류)에 도입될 수 있다.
본 명세서에 기재된 생물반응기, 배양 조건 및 종속영양 성장 및 번식 방법의 특정 예는 임의의 적합한 방식으로 조합하여 미생물 성장 및 지질 및/또는 단백질 생산의 효율을 개선시킬 수 있다.
건조 중량으로 높은 %의 오일/지질 축적과 함께 미세조류 바이오매스는 당업계에 공지된 상이한 배양 방법을 사용하여 생산되었다(국제특허출원 공개번호 제2008/151149호 참조). 본 명세서에 기재되고 본 발명에 따라 유용한 배양 방법에 의해 생성된 미세조류 바이오매스는 건조 중량으로 적어도 10%의 미세조류 오일을 포함한다. 일부 경우에, 미생물 바이오매스는 건조 중량으로 적어도 25%, 적어도 50%, 적어도 55%, 또는 적어도 60%의 미세조류 오일을 포함한다. 일부 경우에, 미세조류 바이오매스는 건조 중량으로 10-90%의 미세조류 오일, 25-75%의 미세조류 오일, 40-75%의 미세조류 오일 또는 50-70%의 미세조류 오일을 함유한다.
본 명세서에 기재된 바이오매스의 미세조류 오일 또는 본 발명의 방법 및 조성물에 사용하기 위해 바이오매스로부터 추출된 오일은 하나 이상의 독특한 지방산 에스터 측쇄를 갖는 글라이세로지질을 포함할 수 있다. 글라이세로지질은 다양한 길이 및 다양한 정도의 포화를 가질 수 있는 1개, 2개 또는 3개의 지방산 분자에 에스터화된 글라이세롤 분자로 구성된다. 지방산 분자(및 미세조류 오일)의 길이 및 포화 특성은 하기 부문 IV에서 보다 상세하게 기재된 바와 같은 배양 조건을 통해 또는 지질 경로 가공을 통해 본 발명의 미세조류 오일 내에서 지방산 분자의 성질 또는 비율을 변형시키기 위해 유전자 조작될 수 있다. 따라서, 조류 오일의 특이적 블렌드는 2개 이상의 미세조류 종으로부터 바이오매스 또는 조류 오일을 함께 혼합함에 의해 또는 대두, 평지씨, 카놀라, 팜, 팜커넬, 코코넛, 옥수수, 폐기 식물, 차이니즈 탈로우, 올리브, 해바라기, 면화씨, 치킨 지방, 소 탈로우, 돼지 탈로우, 미세조류, 거대조류, 미생물, 쿠페아, 아마, 피넛, 쵸이스 백색 그리스, 라드, 카멜리나 사티바, 머스타드 씨, 캐슈 너트, 귀리, 루핀, 케나프, 금잔화, 헴프, 커피, 아마인(아마), 헤이즐넛, 유포비아, 호박씨, 코리안더, 카멜리아, 참깨, 홍화, 쌀, 유동, 코코아, 코프라, 양귀비, 아주까리, 피칸, 호호바, 마카다미아, 브라질 너트, 아보카도, 석유 또는 상기 오일 중 임의의 증류 분획물과 같은 다른 공급원 유래의 오일과 본 발명의 조류 오일을 배합함으로써 조류의 단일 종 내에서 생성할 수 있다.
오일 조성물, 즉, 글라이세로지질의 지방산 성분의 성질 및 비율은 또한 2개 이상의 독특한 종의 미세조류 유래의 바이오매스 또는 오일을 배함하여 조작할 수 있다. 일부 경우에, 독특한 종의 미세조류 중 2개 이상은 상이한 글라이세로지질 프로파일을 가진다. 미세조류의 독특한 종은 바람직하게 종속영양 조건하에 본 명세서에 기재된 바와 같이 함께 배양하거나 별도로 배양하여 각각의 오일을 생성할 수 있다. 상이한 종의 미세조류는 세포의 글라이세로지질 내 상이한 백분율의 독특한 지방산 성분을 함유할 수 있다.
일반적으로, 프로토테카 균주는 쇄 길이가 C8-C14인 지방산을 거의 갖지 않는다. 예를 들어, 프로토테타 모리포미스(UTEX 1435), 프로토테카 크루가니(Prototheca krugani)(UTEX 329), 프로토테카 스타그노라(UTEX 1442) 및 프로토테카 좁피(UTEX 1438)는 C8 지방산을 함유하지 않고(검출가능하지 않은 양) C10 지방산이 0 내지 0.01%이고 C12 지방산은 0.03 내지 2.1%이고 C14 지방산은 1.0 내지 1.7%이다.
일부 경우에, 쇄 길이가 C8 또는 C8-10의 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 1.5%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 12%, 또는 적어도 15% 또는 그 이상의 쇄 길이 C8인 지방산을 가진다. 다른 예에서, 쇄 길이 C10의 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 24%, 또는 적어도 25% 또는 그 이상의 쇄 길이 C10인 지방산을 가진다. 다른 경우에, 쇄 길이가 C12인 지방 아실-ACP 기질에 대해 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 34%, 적어도 35% 또는 적어도 40% 또는 그 이상의 쇄 길이 C12인 지방산을 가진다. 다른 경우에, 쇄 길이가 C14인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 10%, 적어도 15%, 적어도 30%, 적어도 43%, 또는 적어도 45% 또는 그 이상의 쇄 길이가 C14인 지방산을 가진다.
비제한적인 예에서, 쇄 길이 C8의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-25%, 또는 1%-15%, 바람직하게는 1.8-12.29%의 쇄 길이 C8의 지방산을 가진다. 다른 비제한적 예에서, 쇄 길이 C10의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-50%, 또는 1%-25%, 바람직하게는 1.91-23.97%의 쇄 길이 C10의 지방산을 가진다. 다른 비제한적 예에서, 쇄 길이 C12의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 5%-50%, 또는 10%-40, 바람직하게는 13.55-34.01%의 쇄 길이 C12의 지방산을 가진다. 다른 비제한적 예에서, 쇄 길이 C14의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-60%, 또는 2%-45%, 바람직하게는 2.59-43.27 %, 쇄 길이 C14의 지방산을 가진다. 다른 비제한적 예에서, 다양한 쇄 길이의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 30%까지, 35%까지, 또는 바람직하게는 39.45%까지의 쇄 길이 C16의 지방산을 가진다. 일부 경우에, C8 내지 C14쇄 길이의 지방 아실-ACP 기질에 대해 활성을 가지는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-75%, 또는 2%-60%, 바람직하게는 2.69-57.98%의 중간 쇄(C8-C14) 지방산을 가진다. 일부 경우에, C12 내지 C14쇄 길이의 지방 아실-ACP 기질에 대해 활성을 가지는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 30%, 적어도 40%, 또는 적어도 49% C12-C14 지방산을 가진다. 일부 예에서, 외인성 유전자를 보유하기 위하여 일정하고 높은 선택적 압력하에 유전자이식 프로토테카 균주를 유지하는 것은 특정 쇄 길이의 원하는 지방산의 증가 때문에 유리하다. 높은 수준의 외인성 유전자 보유는 또한 본 명세서에 개시된 상동성 재조합 벡터 및 방법을 사용하여 세포의 핵 염색체 내로 외인성 유전자를 삽입함으로써 달성될 수 있다. 핵 염색체 내로 통합된 외인성 유전자를 함유하는 재조합 세포가 본 발명의 목적이다.
미세조류 오일은 또한 미세조류에 의해 생성되고, 또는 배양 배지로부터 유래된 미세조류 오일에 포함된 다른 구성성분을 포함할 수 있다. 이들 구성성분은 미세조류, 미세조류의 종을 배양하기 위하여 사용된 배양 조건, 미세조류 오일 조성에 영향을 미칠 수 있는 바이오매스 또는 다른 인자로부터 미세조류 오일을 회수하는데 사용되는 추출방법에 따라서 다양한 양으로 제시될 수 있다. 이러한 구성성분의 비제한적 예는 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05 내지 0.244 미생물 유기체/그램의 오일로 존재하는 카로테노이드; 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045 내지 0.268 미생물 유기체/그램의 오일로 존재하는 엽록소 A; 0.1 mcg/g 미만, 0.05 mcg/g 미만, 바람직하게는 0.025 미만 미생물 유기체/그램의 오일의 전체 엽록소; 1-300mcg/g, 35-175mcg/g, 바람직하게는 38.3-164 미생물 유기체/그램의 오일로 존재하는 감마 토코페롤; 10-500mcg/g, 50-300mcg/g, 바람직하게는 60.8 내지 261.7 마이크로그램/그램의 오일로 존재하는 전체 토코페롤; 1% 미만, 0.5% 미만, 바람직하게는 0.25% 미만의 브라시카스테롤, 캄페스테롤, 스티그마스테롤 또는 베타시토스테롤; 400 mcg/g 미만, 바람직하게는 300 미생물 유기체/그램 미만의 오일인 전체 토코트라이엔올; 또는 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6 내지 325.3 미생물 유기체/그램의 오일로 제공되는 전체 토코트라이엔올을 포함한다.
다른 구성성분은, 제한 없이, 인지질, 토코페롤, 토코트라이에놀, 카로테노이드(예를 들어, 알파-카로틴, 베타-카로틴, 라이코펜 등), 크산토필(예를 들어, 루테인, 제악산틴, 알파-크립토산틴 및 베타-크립토산틴), 및 다양한 유기 또는 무기 화합물을 함유할 수 있다. 일부 경우에, 프로토테카 종으로부터 추출된 오일은 0.001-0.01mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003 내지 0.039 마이크로그램 루테인/그램의 오일, 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 마이크로그램 미만 라이코펜/그램의 오일; 및 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 마이크로그램 미만 베타 카로텐/그램의 오일을 포함한다.
일부 실시형태에서, 본 발명은 트라이글라이세라이드 오일을 포함하는 유지성 미생물 세포를 제공하되, 해당 트라이글라이세라이드 오일의 지방산은 적어도 약 1%, 적어도 약 2%, 적어도 약 5%, 적어도 약 7%, 적어도 약 10%, 또는 적어도 약 15%, C8:0에서; 적어도 약 1%, 적어도 약 5%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 또는 적어도 약 30%에서, C10:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 또는 적어도 약 80%에서, C12:0; 적어도 약 2%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C14:0; 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C16:0; 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C18:0; 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C18:1; 약 7% 미만, 약 5% 미만, 약 3% 미만, 약 1% 미만, 또는 약 0%에서, C18:2; 및 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, 포화된 지방산으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 유지성 미생물 세포는 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C8:0 및 C10:0의 전체 조합량; 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C10:0, C12:0, 및 C14:0의 전체 조합량; 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C16:0, C18:0 및 C18:1의 전체 조합량; 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C18:0, C18:1 및 C18:2의 전체 조합량; 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C14:0, C16:0, C18:0 및 C18:1의 전체 조합량; 및 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 또는 약 0%의 C18:1 및 C18:2의 전체 조합량으로 이루어진 군으로부터 선택된 지방산 프로파일을 포함하는 트라이글라이세라이드 오일을 포함한다.
일부 실시형태에서, 유지성 미생물 세포는 적어도 약 5 대 1, 적어도 6 대 1, 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C8:0 대 C10:0 비; 적어도 약 6 대 1, 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C10:0 대 C12:0 비; 적어도 약 5 대 1, 적어도 6 대 1, 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C12:0 대 C14:0 비; 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C14:0 대 C12:0 비; 및 적어도 1 대 2, 적어도 1 대 3, 적어도 1 대 4, 적어도 1 대 5, 적어도 1 대 6, 적어도 1 대 7, 적어도 1 대 8, 적어도 1 대 9, 또는 적어도 1 대 10의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 지방산 비를 포함하는 지방산 프로파일을 가지는 트라이글라이세라이드 오일을 포함한다.
일부 실시형태에서, 본 발명은 유지성 미생물 트라이글라이세라이드 오일 조성물을 제공하되, 해당 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 1%, 적어도 약 2%, 적어도 약 5%, 적어도 약 7%, 적어도 약 10%, 또는 적어도 약 15%에서, C8:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 또는 적어도 약 30%에서 C10:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 또는 적어도 약 80%에서, C12:0; 적어도 약 2%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C14:0; 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C16:0; 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C18:0; 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C18:1; 약 7% 미만, 약 5% 미만, 약 3% 미만, 약 1% 미만, 또는 약 0%에서, C18:2; 및 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서 포화된 지방산으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물은 지방산 프로파일을 포함하는 트라이글라이세라이드 오일을 포함하며, 이때 C10:0, C12:0 및 C14:0의 전체 조합량은 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있으며; C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C18:0, C18:1 및 C18:2의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있으며; C14:0, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C8:0 및 C10:0의 전체 조합량은 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 또는 약 0%이다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물은 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C8:0 대 C10:0 비; 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C10:0 대 C12:0 비; 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C12:0 대 C14:0 비; 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C14:0 대 C12:0 비; 적어도 약 1 내지 2, 적어도 약 1 대 3, 적어도 약 1 대 4, 적어도 약 1 대 5, 적어도 약 1 대 6, 적어도 약 1 대 7, 적어도 약 1 대 8, 적어도 약 1 대 9, 또는 적어도 약 1 대 10의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 지방산의 비를 포함하는 지방산 프로파일을 가지는 트라이글라이세라이드 오일을 포함한다.
일부 실시형태에서, 본 발명은 적어도 약 1%, 적어도 약 2%, 적어도 약 5%, 적어도 약 7%, 적어도 약 10%, 또는 적어도 약 15%에서, C8:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 또는 적어도 약 30%에서, C10:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 또는 적어도 약 80%에서, C12:0; 적어도 약 2%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C14:0; 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C16:0; 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서 C18:0; 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C18:1; 약 7% 미만, 약 5% 미만, 약 3% 미만, 약 1% 미만, 또는 약 0%, C18:2; 및 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%, 포화된 지방산으로 이루어진 군으로부터 선택된 지방산을 가지는 유지성 미생물 트라이글라이세라이드 오일 조성물의 생산 방법을 제공하되, 해당 방법은 (a) 유지성 미생물 세포의 건조 세포 중량의 적어도 10%가 트라이글라이세라이드 오일이 될 때까지 배양 배지 내 유지성 미생물 세포의 집단을 배양하는 단계; 및 (b) 유지성 미생물 세포로부터 유래된 트라이글라이세라이드 오일을 분리하는 단계를 포함한다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물의 제조방법은 지방산 프로파일을 포함하는 트라이글라이세라이드 오일을 수득하며, 이때: C10:0, C12:0 및 C14:0의 전체 조합량은 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C18:0, C18:1 및 C18:2의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있으며; C14:0, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C8:0 및 C10:0의 전체 조합량은 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 또는 약 0%이다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물의 제조방법은 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C8:0 대 C10:0 비; 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C10:0 대 C12:0 비; 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C12:0 대 C14:0 비; 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C14:0 대 C12:0 비; 및 적어도 약 1 대 2, 적어도 약 1 대 3, 적어도 약 1 대 4, 적어도 약 1 대 5, 적어도 약 1 대 6, 적어도 약 1 대 7, 적어도 약 1 대 8, 적어도 약 1 대 9, 또는 적어도 약 1 대 10에서의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 트라이글라이세라이드 오일의 비를 포함하는 지방산 프로파일을 가지는 트라이글라이세라이드 오일을 수득한다.
III. 유전자 조작 방법 및 재료
본 발명은 프로토테카 세포를 유전자 변형시키기 위한 방법 및 재료 및 본 발명의 방법에 유용한 재조합 숙주 세포를 제공하고, 당해 숙주 세포는 재조합 프로토테카 모리포미스, 프로토테카 좁피, 프로토테카 크루가니 및 프로토테카 스타그노라 숙주 세포를 포함하지만 이에 제한되지 않는다. 이들 방법 및 재료의 기재는 독자의 편의를 위해 하위부문으로 나눈다. 하위부문 1에서, 형질전환 방법이 기재된다. 하위부문 2에서 상동성 재조합을 사용한 유전적 유전자 조작 방법이 기재된다. 하위부문 3에서 발현 벡터 및 성분이 기재된다.
본 발명의 특정 실시형태에서, 지질 생성을 향상시키고, 미생물 유기체에 의해 만들어진 성분의 특성 또는 비율을 변형시키거나, 또는 다양한 공급원료 재료 상의 데노보(de novo) 성장 특징을 개선하거나 제공하기 위해 미생물 유기체를 유전자적으로 변형시키는 것이 바람직하다. 다른 클로렐라 종뿐만 아니라 다른 다양한 미생물 유기체가 사용될 수 있지만, 클로렐라 프로토테코이데스, 클로렐라 미누티시마, 클로렐라 소로키니아나, 클로렐라 엘립소이데아, 클로렐라 속, 및 클로렐라 에머소니는 본 명세서에 기재된 유전적 유전자조작 방법에서 사용을 위해 선호되는 미생물 유기체이다.
프로모터, cDNA, 및 3'UTR뿐만 아니라 다른 벡터 구성요소는 천연 공급원으로부터 분리된 단편을 사용하는 클로닝 기법을 통해 만들어질 수 있다(예를 들어 문헌[Molecular Cloning: A Laboratory Manual, Sambrook et al. 3d edition, 2001, Cold Spring Harbor Press]; 및 미국특허 제4,683,202호 참조). 대안으로, 구성요소는 공지된 방법을 사용하여 합성적으로 만들어질 수 있다(예를 들어 문헌[Gene. 1995 Oct 16;164(1):49-53] 참조).
1. 유전자 조작 방법 - 형질전환
예를 들어 유전자주입, 전기천공(문헌[Maruyama et al. (2004), Biotechnology Techniques 8:821-826] 참조), 유리 비드 형질전환 및 탄화규소 휘스커 형질전환을 포함하는 임의의 적합한 기술에 의해 세포를 형질전환할 수 있다. 사용될 수 있는 또 다른 방법은 원형질 세포를 형성하고 CaCl2 및 폴리에틸렌 글라이콜(polyethylene glycol, PEG)을 사용하여 재조합 DNA를 미세조류 세포에 도입하는 것이다(문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73]을 참조하며, 이 문헌은 클로렐라 엘리프소이데아의 형질전환을 위해 상기 방법의 사용을 보고한다). 미세조류의 동시 형질전환을 사용하여 2개의 독특한 벡터 분자를 세포에 동시에 도입할 수 있다(예를 들어 문헌[Protist 2004 Dec;155(4):381-93] 참조).
또한 유전자 주입 방법(예를 들어, 문헌[Sanford, Trends In Biotech. (1988) 6:299 302], 미국특허 제4,945,050호 참조); 전기천공(문헌[Fromm et al., Proc. Nat'l. Acad. Sci. (USA)(1985) 82:5824 5828] 참조); 레이져 빔, 미세주입 또는 DNA를 미세조류로 도입할 수 있는 임의의 다른 방법의 사용으로 프로토테카 세포를 형질전환시킬 수 있다.
클로렐라와 같은 미생물 유기체 내로 이식유전자를 도입하는 임의의 편리한 기법은 본 발명에서 사용될 수 있다. 문헌[Dawson et al. (1997)(상기 참조)]은 NR-결핍 클로렐라 소로키니아나 돌연변이체 내에 클로렐라 불가리스로부터 유래된 나이트레이트 환원효소(nitrate reductase, NR) 유전자를 도입하여, 안정 형질전환체를 초래하는 입자총 방법(micro-projectile bombardment)의 사용을 기재한다. 간략하게, 0.4 마이크론 텅스텐 비드를 플라스미드로 코팅하였고; 3 X 107개의 클로렐라 소로키니아나 세포를 비선택적 한천 플레이트의 삼등분의 중앙에서 도말하였고, PDS-1000/He Biolistic Particle Delivery(등록상표) 시스템(Bio-Rad)으로 충격을 주었다.
클로렐라와 같은 미생물 유기체 내에 이식유전자를 도입하는 바람직한 방법은 문헌[Kim et al. (2002), Mar. Biotechnol . 4:63-73]에 의해 기재된 방법이다. K김(Kim)은 CaCl2 및 폴리에틸렌 글라이콜(PEG)을 사용하여 클로렐라 엘립소이데아 원형질체의 형질전환을 보고한다. 특히, 원형질체는 1-2 X 108/㎖의 밀도에서 클로렐라 엘립소이데아 세포를 성장시킴으로써 제조하였다. 세포를 회수하였고, 1600 g에서 5분 동안 원심분리로 세척하였으며, 0.6 M 소르비톨, 0.6 M 만니톨, 4%(중량/부피) 셀룰로스(Calbiochem), 2%(중량/부피) 마세라제(Calbiochem), 및 50 유닛 펙티나제(Sigma)를 함유하는 5 Ml의 인산염 완충제(Ph 6.0) 중에서 재현탁하였다. 세포 현탁액을 암실에서 25℃로 16시간 동안 부드럽게 진탕하면서 인큐베이션하였다. 결과물 원형질체를 400 g에서 원심분리로 5분 동안 회수하였다. 펠렛을 0.6 M 소르비톨 및 0.6 M 만니톨을 함유하는 5 Ml의 f/2 배지 내에서 부드럽게 재현탁하였고, 400 g에서 5분 동안 원심분리하였다. 이 펠렛을 50 mMCaCl2를 함유하는 1 Ml의 0.6M 소르비톨/만니톨 용액 내에서 재현탁하였다. 그 다음에 5㎎의 이식유전자 DNA를 25㎍ 송아지 흉선 DNA(Sigma)와 함께 0.4 Ml 내 107-108 원형질체에 첨가하였다. 실온에서 15분 후, 200㎕의 PNC(40% 폴리에틸렌 글라이콜 4000, 0.8 M NaCl, 50 mm CaCl2)를 첨가하였고, 실온에서 30분 동안 부드럽게 혼합하였다. 이후에, 0.6 M 소르비톨/만니톨 용액, 1% 효모 추출물 및 1% 글루코스로 보충한 0.6 Ml의 f/2 배지를 첨가하였고, 형질전환된 세포를 암실에서 25℃로 12시간 동안 세포벽 재생을 위해 인큐베이션하였다. 클로렐라 속 DT 내에 수은 환원효소를 도입하기 위하여 유사한 방법을 문헌[Huang et al. (2007)(상기 참조)]에서 사용하였다.
클로렐라와 같은 미생물을 형질전환하기 위하여 전기천공을 사용하였다. 문헌[Maruyama et al. (2004), Biotechnology Techniques 8:821-826(본 명세서에 그것의 전문이 참조로 포함됨)]에서 보고되는 바와 같이, 이 기법은 고정상 내 세포로부터 제조된 클로렐라 사카로필라 c-211-1a의 원형질체 내로 이식유전자를 도입하기 위하여 사용되었다. 도입된 플라스미드의 일시적 발현을 600 내지 900 V/㎝의 전계 강도(field strength), 및 약 400 ms의 펄스 지속시간 하에 관찰하였으며, 여기서 70-kDa FITC-덱스트란에 대해 높은 막 침투성이 확인되었다.
클로렐라와 같은 미생물 내 이식유전자 발현의 예를 문헌에서 발견할 수 있다(예를 들어 [Current Microbiology Vol. 35 (1997), pp. 356-362; Sheng Wu Gong Cheng Xue Bao. 2000 Jul;16(4):443-6; Current Microbiology Vol. 38 (1999), pp. 335-341; Appl Microbiol Biotechnol (2006) 72: 197-205; Marine Biotechnology 4, 63-73, 2002; Current Genetics 39:5, 365-370 (2001); Plant Cell Reports 18:9, 778-780, (1999); Biologia Plantarium 42(2): 209-216, (1999); Plant Pathol. J 21(1): 13-20, (2005)] 참조). 또한 본 명세서의 실시예를 참조한다.
유지성 효모(예를 들어, 야로이야 리폴리티카) 내 이식유전자 발현의 예를 문헌에서 발견할 수 있다(예를 들어, 문헌[Bordes et al., J Microbiol Methods, Jun 27 (2007)] 참조). 진균(예를 들어, 모르티에렐라 알핀, 무코르 시르시넬로이데스, acl 아스페르길루스 오크라세우스) 내 이식유전자 발현의 예는 문헌에서 발견할 수 있다(예를 들어 문헌[Microbiology, Jul; 153(Pt. 7):2013-25 (2007); Mol Genet Genomics, Jun; 271(5):595-602 (2004); Curr Genet, Mar;21(3):215-23 (1992); Current Microbiology, 30(2):83-86 (1995); Sakuradani, NISR Research Grant, "Studies of Metabolic Engineering of Useful Lipid-producing Microorganisms" (2004); 및 PCT/JP2004/012021] 참조). 대장균과 같은 박테리아 내 외인성 유전자 발현의 예는 잘 공지되어 있으며; 예를 들어 문헌[Molecular Cloning: A Laboratory Manual, Sambrook et al.(3d edition, 2001, Cold Spring Harbor Press]을 참조한다.
본 발명에 따르는 미생물 유기체의 형질전환을 위한 벡터는 당업자에게 친숙한 공지된 기법으로 제조될 수 있다. 다양한 클로렐라 종의 형질전환을 위해 사용단 구성체의 뉴클레오타이드 서열은 서열번호 8에 대응한다. 한 실시형태에서, 미세조류와 같은 미생물 유기체 내 리파제 유전자의 발현을 위한 예시적인 벡터 설계는 미세조류 내 프로모터 활성을 갖는 작동가능한 연결에서 리파제를 암호화하는 유전자를 함유한다. 대안으로 벡터가 관심의 유전자를 갖는 작동가능한 연결에서 프로모터를 함유하지 않는다면, 유전자는 벡터 통합 지점에서 내인성 프로모터에 작동가능하게 연결되도록 세포로 형질전환될 수 있다. 프로모터가 없는 형질전환 방법은 미세조류 내에서 작동하는 경향이 있다(예를 들어, 문헌[Plant Journal 14:4, (1998), pp.441-447] 참조). 해당 벡터는 또한 예를 들어 항생제 또는 제초제에 내성을 부여하는 단백질, 즉 선택가능한 마커를 암호화하는 제2 유전자를 함유할 수 있다. 선택적으로, 하나 또는 둘 다의 유전자(들)는 그 뒤에 폴리아데닐화 신호를 함유하는 3' 미번역 서열이 있다. 두 유전자를 암호화하는 발현 카세트는 벡터 내 또는 별개의 벡터 상에 물리적으로 연결될 수 있다. 미세조류의 공동 형질전환이 또한 사용될 수 있으며, 이때 별개의 벡터 분자는 동시에 사용되어 세포를 형질전환한다(예를 들어 문헌[Protist 2004 Dec;155(4):381-93] 참조). 형질전환된 세포는 내성 카세트가 없는 세포가 성장하지 않는 조건 하에서 항생제 또는 다른 선택가능한 마커의 존재에서 성장하는 능력을 기반으로 선택적으로 선택될 수 있다.
2. 유전자 조작 방법 - 상동성 재조합
상동성 재조합은 상동성 영역을 정렬하고 교환하는 상보적 DNA 서열의 능력이다. 표적화된 게놈 서열("주형")과 상동성인 서열을 함유하는 유전자전이 DNA ("공여체")를 유기체에 도입함에 이어서 대응하는 게놈 상동성 서열 부위에서 게놈으로 재조합을 진행한다. 많은 경우에 상기 공정의 기계론적 단위는 다음을 포함한다: (1) 상동성 DNA 절편의 쌍형성; (2) 이중가닥 브레이크의 공여체 DNA 분자로의 도입; (3) 유리된 공여체 DNA 말단에 의한 주형 DNA 분자의 공격에 이어서 DNA의 합성; 및 (4) 이중가닥 파손 복구 반응으로 최종 재조합 생성물 생성.
숙주 유기체에서 상동성 재조합을 수행하기 위한 능력은 분자 유전학적 수준에서 수행될 수 있는 것에 대한 많은 실제 연관성을 갖고 맞춤 오일을 생성할 수 있는 유성 미생물의 생성에 유용한 많은 실제 연관성을 갖는다. 이의 본래의 상동성 재조합은 정확한 유전자 표적화 반응이고 따라서 동일한 표적화 서열로 생성된 대부분의 유전자 전이 계열은 근본적으로 표현형과 관련해서 동일하고 극소수의 형질전환 반응의 스크리닝을 필요로 한다. 상동성 재조합은 또한 숙주 염색체로의 유전자 삽입 반응을 표적화하여 유전자 선택 부재 하에서도 우수한 유전학적 안정성을 수득한다. 상이한 염색체 유전자 좌위는 심지어 이종성 프로모터/UTR로부터 유전자 발현에 영향을 줄 가능성이 있기 때문에 상동성 재조합은 유사하지 않은 게놈 환경내에서 유전자 좌위를 탐색하고 유전자 발현에 대한 이들 환경의 영향을 평가하는 방법일 수 있다.
상동성 재조합을 사용하는 특히 유용한 유전자 조작 응용은 고도로 특이적인 방식으로 이종성 유전자 발현을 구동시키는 프로모터/UTR과 같은 특이적 숙주 조절 요소를 끌어들이는 것이다. 예를 들어, 선택적 마커를 암호화하는 이종성 유전자를 갖는 불포화효소 유전자들/유전자 패밀리의 절제 또는 녹아웃은 숙주 세포에서 생성된 포화된 지방산의 전체 백분율을 증가시키는 것으로 기대될 수 있다. 실시예 11은 프로토테카 모리포르미스에서 생성된 이러한 불포화효소 유전자 절제 또는 녹아웃의 상동성 재조합 표적 구성체 및 작업예를 기재한다.
상동성 재조합은 정확한 유전자 표적화 반응이기 때문에, 충분한 옆에 있는 영역이 확인된다면, 원하는 유전자 또는 영역내 임의의 뉴클레오타이드(들)를 정확히 변형시키는데 사용될 수 있다. 따라서, 상동성 재조합은 RNA 및/또는 단백질의 유전자 발현에 영향을 주는 조절 서열을 변형시키기 위한 수단으로서 사용될 수 있다. 이것은 또한 기질 특이성, 친화성 및 Km과 같은 효소 활성을 변형시킴에 따라서 숙주 세포 대사의 목적하는 변화에 영향을 주고자 단백질 암호화 영역을 변형시키는데 사용될 수 있다. 상동성 재조합은 유전자 표적화, 유전자 전환, 유전자 결실, 유전자 복제, 유전자 역위를 유도하고 프로모터, 인핸서 및 3'UTR과 같은 유전자 발현 조절요소를 교환하여 고스트(gost) 게놈을 조작하기 위한 강력한 수단을 제공한다.
상동성 재조합은 내인성 숙주 세포 게놈내에 목적하는 유전자 또는 영역을 "표적화"하기 위한 내인성 서열 조각을 함유하는 표적화 구성체을 사용하여 달성될 수 있다. 이러한 표적화 서열은 관심의 유전자 또는 영역의 5'에 위치하거나, 관심의 유전자/영역의 3'에 위치하거나, 심지어 관심의 유전자/영역 옆에도 위치할 수 있다. 상기 표적화 구성체은 추가의 벡터 골격과 함께 슈퍼코일된 플라스미드 DNA로서, 벡터 골격을 갖지 않는 PCR 생성물로서 또는 선형화된 분자로서 숙주 세포를 형질전환시킬 수 있다. 일부 경우에, 이것은 제한 효소에 유전자 전이 DNA(공여체 DNA) 내의 상동성 서열을 우선 노출시키는 것이 유리할 수 있다. 상기 단계는 재조합 효율을 증가시킬 수 있고 목적하지 않은 반응의 발생을 감소시킬 수 있다. 재조합 효율을 증가시키는 다른 방법은 PCR을 사용하여 표적화된 게놈 서열에 상동성인 선형 말단을 함유하는 형질전환 유전자전이 DNA를 생성하는 것을 포함한다.
비제한적 예시의 목적을 위해, 상동성 재조합에 유용한 공여체 DNA 서열의 영역은 프로토테카 모리포미스 내 DNA의 KE858 영역을 포함한다. KE858은 1.3 kb이며, 단백질의 전달 RNA(tRNA) 패밀리와 상동성을 공유하는 단백질을 위한 암호화 영역의 부분을 포함하는 게놈 단편이다. 사우던 블롯은 KE858 서열이 프로토테카 모리포미스(UTEX 1435) 게놈 내 단일 복제물로 존재한다는 것을 나타내었다. 이 영역 및 상동성 재조합 표적화를 위해 이 영역을 사용하는 예는 국제특허출원 PCT/US2009/66142호에 기재되어 있다. 유용한 공여체 DNA의 다른 영역은 6S rRNA 게놈 서열의 일부이다. 프로토테카 모리포미스 내 상동성 재조합 내 이 서열의 사용은 이하의 실시예에서 기재한다.
3. 벡터 및 벡터 성분
본 발명에 따르는 미생물 유기체의 형질전환을 위한 벡터는 본 명세서에 기재된 바를 토대로 당업자에게 유사한 공지된 기술에 의해 제조할 수 있다. 벡터는 전형적으로 하나 이상의 유전자를 함유하고 여기서 각각의 유전자는 목적하는 생성물(유전자 생성물)의 발현을 암호화하고 유전자 발현을 조절하거나 유전자 생성물을 재조합 세포 내 특정 위치에 표적화하는 하나 이상의 제어 서열에 작동가능하게 연결되어 있다. 독자를 도와주기 위해 본 하위부문은 여러 하위부문으로 나누어진다. 하위부문 A는 본 발명에 의해 제공된 신규 제어 서열뿐만 아니라 전형적으로 벡터상에 함유된 제어 서열을 기재한다. 하위부문 B는 신규 최적화 방법 및 본 발명에 의해 제공된 것들을 사용하여 제조된 유전자뿐만 아니라 벡터 내에 전형적으로 함유된 유전자를 기재한다.
A. 제어 서열
제어 서열은 암호화 서열의 발현을 조절하거나 유전자 생성물을 세포 내부 또는 외부의 특정 위치로 지시하는 핵산이다. 발현을 조절하는 제어 서열은 예를 들어, 암호화 서열의 전사를 조절하는 프로모터 및 암호화 서열의 전사를 종결시키는 종결자를 포함한다. 또 다른 제어 서열은 폴리아데닐화 신호를 암호화하는 암호화 서열의 말단에 위치한 3' 비해독 서열이다. 유전자 생성물을 특정 위치로 지시하는 제어 서열은 단백질이 세포 내부 또는 외부의 특정 위치에 부착되는 위치로 지시하는 신호 펩타이드를 암호화하는 것들을 포함한다.
따라서, 미세조류내 외인성 유전자의 발현을 위한 예시적인 벡터 설계는 미세조류내에서 활성인 프로모터에 작동적으로 연결된 목적하는 유전자 생성물(예를 들어, 선택가능한 마커, 지질 경로 변형 효소 또는 수크로스 이용 효소)에 대한 암호화 서열을 함유한다. 또한, 벡터가 목적하는 암호화 서열과 작동가능하게 연결된 프로모터를 함유하지 않는 경우, 상기 암호화 서열은 이것이 벡터 통합 부위에서 내인성 프로모터와 작동가능하게 연결되도록 세포를 형질전환시킬 수 있다. 형질전환의 프로모터 부재 방법은 미세조류에서 작동하는 것으로 입증되었다(예를 들어[문헌 Plant Journal 14:4, (1998), pp.441-447] 참조).
많은 프로모터는 미세조류 내에서 활성이고 형질전환된 조류에 내인성이 아닌 프로모터(즉, 다른 조류 유래의 프로모터, 고등 식물 유래의 프로모터 및 식물 바이러스 또는 조류 바이러스 유래의 프로모터)뿐만 아니라 형질전환된 조류에 내인성인 프로모터를 포함한다. 미세조류내에서 활성인 예시적인 외인성 및/또는 내인성 프로모터(또한 미세조류에서 기능하는 항생제 내성 유전자)는 국제특허출원 공개 번호 제2008/151149호 및 본 명세서에 인용된 문헌에 기재되어 있다.
외인성 유전자를 발현시키기 위해 사용되는 프로모터는 천연적으로 상기 유전자 또는 이종성 유전자에 연결된 프로모터일 수 있다. 몇몇 프로모터는 하나 이상의 미세조류 종에서 활성이다. 다른 프로모터는 종 특이적이다. 예시적인 프로모터는 하기 실시예에 사용된 클라미도모나스 레인하르드티(Chlamydomas reinhardtii) 유래의 β-튜불린과 같은 프로모터 및 다수의 미세조류 종에서 활성인 것으로 밝혀진 콜리플라워 모자이크 바이러스(cauliflower mosaic virus, CMV) 및 클로렐라 바이러스와 같은 바이러스 프로모터를 포함한다(예를 들어, 문헌[Plant Cell Rep. 2005 Mar;23(10-11):727-35; J Microbiol. 2005 Aug;43(4):361-5; Mar Biotechnol (NY). 2002 Jan;4(1):63-73] 참조). 프로토테카에서 외인성 유전자의 발현에 사용하기에 적합할 수 있는 또 다른 프로모터는 클로렐라 소로키니아나 글루타메이트 탈수소효소 프로모터/5 'UTR이다. 선택적으로, 프로모터를 함유하는 상기 서열 중 적어도 10, 20, 30, 40, 50, 또는 60개의 뉴클레오타이드가 사용되다. 프로토테카 외인성 유전자의 발현에 유용한 프로모터는 본 명세서의 서열 목록에 열거되어 있고 예를 들어 클로렐라 HUP1 유전자(서열번호 1)의 프로모터 및 클로렐라 엘립소이데아 나이트레이트 환원효소 프로모터(서열번호 2)가 있다. 클로렐라 바이러스 프로모터는 또한 프로토테카에서 미국 특허 제6,395,965호의 서열번호 1 내지 7과 같은 유전자를 발현시키는데 사용될 수 있다. 프로토테카에서 활성인 추가의 프로모터는 예를 들어 문헌[Biochem Biophys Res Commun. 1994 Oct 14;204(1): 187-94; Plant Mol Biol. 1994 Oct;26(1):85-93; Virology. 2004 Aug 15;326(1): 150-9; 및 Virology. 2004 Jan 5;318(1):214-23]에서 찾을 수 있다.
프로모터는 일반적으로 항상성이거나 유도성인 것으로서 특성화될 수 있다. 항상성 프로모터는 일반적으로 동일한 수준에서 항상(또는 세포 생활 주기에서 특정 시점에서) 활성이거나 기능성이다. 역으로, 유도성 프로모터는 활성(또는 불활성)이거나 단지 자극에 응답하여 상당히 상향 조절되거나 하향 조절된다. 상기 프로모터 유형 둘 다는 본 명세서의 방법에 적용된다. 본 발명에서 유용한 유도성 프로모터는 외인성으로 제공된 소분자(예를 들어, 서열번호 1에서와 같이 글루코스), 온도(가열 또는 냉각), 배양 배지 내 질소 부재 등과 같은 자극에 응답하여 작동적으로 연결된 유전자의 전사를 매개하는 것들을 포함한다. 적합한 프로모터는 근본적으로 사일런트 유전자의 전사를 활성화하거나 바람직하게는 실질적으로 낮은 수준으로 전사된 작동가능하게 연결된 유전자의 전사를 상향 조절할 수 있다. 이하의 실시예는 프로토테카 세포에 유용한 추가적인 유도성 프로모터를 기재한다.
종결 영역 제어 서열의 내포는 선택적이고 사용되는 경우 상기 선택은 상기 종결 영역이 비교적 상호호환가능하므로 주로 편의를 위한 것이다. 상기 종결 영역은 전사 개시 영역(프로모터)에 특정된 것일 수 있거나 목적하는 DNA 서열에 특정된 것일 수 있거나 또 다른 공급원으로부터 수득할 수 있다(문헌[예를 들어, Chen and Orozco, Nucleic Acids Res. (1988) 16:8411] 참조).
본 발명은 또한 제어 서열 및 재조합 유전자, 및 목적하는 유전자의 구분된 발현을 제공하는 것들을 함유하는 벡터를 제공한다. 표적화를 위한 기관은 엽록체, 플라스티드, 미토콘드리아, 및 소포체이다. 또한, 본 발명은 제어 서열 및 재조합 유전자, 및 세포 외부로의 단백질의 분비를 제공하는 것들을 함유하는 벡터를 제공한다.
프로토테카 핵 게놈에서 발현되는 단백질은 플라스티드 표적화 신호를 사용하여 플라스티드로 표적화될 수 있다. 클로렐라에 내인성인 플라스티드 표적화 서열은 공지되어 있고 예를 들어, 플라스티드로 표적화되는 단백질을 암호화하는 클로렐라 핵 게놈내 유전자들이 있고(예를 들어, GenBank 등록 번호 AY646197 및 AF499684를 참조), 하나의 양태에서, 상기 제어 서열은 단백질의 발현을 프로토테카 플라스티드로 표적화하는 본 발명의 벡터 내에 사용된다.
이하의 실시예는 숙주 세포 내 올바른 구획으로 이종성 단백질을 표적화하는 조류 플라스티드 표적화 서열의 용도를 기재한다. cDNA 라이브러리는 프로토테카 모리포르미스 및 클로렐라 프로토테코디에스 세포를 사용하여 제조되며 국제특허출원 PCT/US2009/066142에 기재되어 있다.
본 발명의 또 다른 양태에서, 프로토테카 내에서 폴리펩타이드의 발현은 소포체로 표적화된다. 발현 벡터 내 적절한 보유 또는 분류 신호의 내포는 단백질이 소포체(endoplasmic reticulum, ER)에 보유되고 골지체로 다운스트림되지 않도록 하는 것을 보장한다. 예를 들어, Wageningen UR- Plant Research International제의 IMPACT VECTOR 1.3 벡터는 널리 공지된 KDEL 보유 또는 분류 신호를 포함한다. 상기 벡터와 함께, ER 보유는 이것이 발현 수준을 5배 이상으로 개선한다는 것이 보고되었다는 점에서 실제 이점을 갖는다. 이에 대한 주요 이유는 ER이 세포질 내 존재하는 것보다 발현된 단백질의 해독 후 분해에 관여하는 프로테아제가 보다 낮은 농도이고/이거나 상이하다는 점에 있는 것으로 나타난다. 녹색 미세조류에서 기능하는 ER 보유 신호는 예를 들어, 문헌[Proc Natl Acad Sci USA. 2005 Apr 26;102(17):6225-30]에 공지되어 있다.
본 발명의 또 다른 양태에서, 폴리펩타이드는 배양 배지 내로 세포 외부로의 분비를 위해 표적화된다. 프로토테카에서 본 발명에 방법에 따라 사용될 수 있는 클로렐라중에서 활성인 분비 신호에 대한 예는 문헌[Hawkins et al., Current Microbiology Vol. 38 (1999), pp. 335-341]을 참조한다.
다수의 프로모터는 형질전환된 조류에 내인성인 프로모터뿐만 아니라 형질전환된 조류에 내인성이 아닌 프로모터(즉, 다른 조류로부터의 프로모터, 더 높은 식물로부터의 프로모터, 및 식물 바이러스 또는 조류 바이러스로부터의 프로모터)를 포함하는 미세조류에서 활성이다. 미세조류에 활성인 외인성 및/또는 내인성 프로모터, 및 미세조류에 작용성인 항생제 내성 유전자는, 예를 들어 문헌[Curr Microbiol. 1997 Dec;35(6):356-62(클로렐라 불가리스); Mar Biotechnol(NY). 2002 Jan;4(1):63-73(클로렐라 엘립소이데아); Mol Gen Genet. 1996 Oct 16;252(5):572-9(파이오덱틸룸 트라이코뉴툼(Phaeodactylum tricornutum)); Plant Mol Biol. 1996 Apr;31(1):1-12(볼복스 카르테리(Volvox carteri)); Proc Natl Acad Sci U S A. 1994 Nov 22;91(24):11562-6(볼복스 카르테리); Falciatore A, Casotti R, Leblanc C, Abrescia C, Bowler C, PMID: 10383998, 1999 May;1(3):239-251(이탈리아 나폴리 아이-80121 빌라 코무날레 스타지오네 주로지카에 소재한 Laboratory of Molecular Plant Biology)(파이오덱틸룸 트라이코뉴툼 및 탈라시오시라 웨이스프로기); Plant Physiol. 2002 May;129(1):7-12.(포르피리디움 속); Proc Natl Acad Sci U S A. 2003 Jan 21;100(2):438-42.(클라미도모나스 레인하르드티); Proc Natl Acad Sci U S A. 1990 Feb;87(3):1228-32.(클라미도모나스 레인하르드티); Nucleic Acids Res. 1992 Jun 25;20(12):2959-65; Mar Biotechnol(NY). 2002 Jan;4(1):63-73(클로렐라); BiochemMol Biol Int. 1995 Aug;36(5):1025-35(클라미도모나스 레인하르드티); J Microbiol. 2005 Aug;43(4):361-5(두날리엘라); Yi Chuan Xue Bao. 2005 Apr;32(4):424-33(두날리엘라); Mar Biotechnol (NY). 1999 May;1(3):239-251.(탈라시오시라 및 패닥틸룸(Phaedactylum)); Koksharova, Appl Microbiol Biotechnol 2002 Feb;58(2):123-37(다양한 종); Mol Genet Genomics. 2004 Feb;271(1):50-9(서모시네코코커스 연장체); J. Bacteriol. (2000), 182, 211-215; FEMS Microbiol Lett. 2003 Apr 25;221(2):155-9; Plant Physiol. 1994 Jun;105(2):635-41; Plant Mol Biol. 1995 Dec;29(5):897-907(시네코코커스 PCC 7942); Mar Pollut Bull. 2002;45(1-12):163-7(아나배나 PCC 7120); Proc Natl Acad Sci U S A. 1984 Mar;81(5):1561-5(아나배나(다양한 균주)); Proc Natl Acad Sci U S A. 2001 Mar 27;98(7):4243-8(시네코사이스티스); Wirth, Mol Gen Genet 1989 Mar;216(1):175-7(다양한 종); Mol Microbiol, 2002 Jun;44(6):1517-31 and Plasmid, 1993 Sep;30(2):90-105(프레미엘라 디플로시폰(Fremyella diplosiphon)); Hall et al. (1993) Gene 124: 75-81(클라미도모나스 레인하르드티); Gruber et al. (1991). Current Micro. 22: 15-20; Jarvis et al. (1991) Current Genet. 19: 317-322(클로렐라)]에 기재되며; 추가적인 프로모터에 대해 또한 미국특허 제6,027,900호의 표 1을 참조한다.
외인성 유전자를 발현하기 위해 사용되는 프로모터는 유전자에 자연적으로 연결된 프로모터일 수 있고 또는 이종성 유전자일 수 있다. 일부 프로모터는 한 종 이상의 미세조류에서 활성이다. 다른 프로모터는 종 특이적이다. 바람직한 프로모터는 클라미도모나스 레인하르드티로부터 유래된 RBCS2와 같은 프로모터 및 카울리플라워 모자이크 바이러스(CMV) 및 바이러스 프로모터와 같은 바이러스 프로모터를 포함하는데, 이들은 다양한 종의 미세조류에서 활성인 것으로 나타났다(예를 들어, 문헌[Plant Cell Rep. 2005 Mar;23(10-11):727-35; J Microbiol. 2005 Aug;43(4):361-5; Mar Biotechnol (NY). 2002 Jan;4(1):63-73] 참조). 다른 실시형태에서, 보트라이오코커스 말레이트(Botryococcus malate) 탈수소효소 프로모터, 서열번호 150의 임의의 부분을 포함하는 핵산, 또는 클라미도모나스 레인하르티 RBCS2 프로모터(서열번호 151)이 사용될 수 있다. 선택적으로, 적어도 10, 20, 30, 40, 50, 또는 60개의 뉴클레오타이드 또는 프로모터를 함유하는 더 많은 이들 서열이 사용된다. 클로렐라 속의 종에 내인성인 바람직한 프로모터는 서열번호 1 및 서열번호 2이다.
클로렐라 내 외인성 유전자의 발현에 유용한 바람직한 프로모터는 클로렐라 HUP1 유전자(서열번호 1)의 프로모터 및 클로렐라 엘립소이데아 나이트레이트 환원효소 프로모터(서열번호 2)와 같은 본 출원의 서열목록에 열거된다. 클로렐라 바이러스 프로모터는 또한 미국특허 제6,395,965호의 서열번호 1 내지 7과 같은 클로렐라 내 유전자를 발현시키기 위해 사용될 수 있다. 클로렐라 내 활성인 추가적인 프로모터는, 예를 들어 문헌[Biochem Biophys Res Commun. 1994 Oct 14;204(1):187-94; Plant Mol Biol. 1994 Oct;26(1):85-93; Virology. 2004 Aug 15;326(1):150-9; 및 Virology. 2004 Jan 5;318(1):214-23]에서 발견될 수 있다.
B. 유전자 및 코돈 최적화
전형적으로, 유전자는 프로모터, 암호화 서열 및 종결 제어 서열을 포함한다. 재조합 DNA 기술에 의해 조립될 때, 유전자는 발현 카세트로 칭해질 수 있고 재조합 유전자를 숙주 세포로 도입하는데 사용되는 벡터로의 편리한 삽입을 위한 제한 부위 옆에 있을 수 있다. 상기 발현 카세트는 상동성 재조합에 의한 발현 카세트의 게놈으로의 안정적인 통합을 촉진하는, 게놈 또는 다른 핵산 표적 유래의 DNA 서열 옆에 있을 수 있다. 또는, 상기 벡터 및 이의 발현 카세트는 통합되지 않은 상태로 유지될 수 있고, 이 경우에, 상기 벡터는 전형적으로, 이종성 벡터 DNA의 복제를 제공할 수 있는 복제원점을 포함한다.
벡터 상에 존재하는 통상의 유전자는 단백질을 암호화하는 유전자이고 이의 발현은 상기 단백질을 함유하는 재조합 세포가 상기 단백질을 발현하지 않는 세포로부터 구분될 수 있도록 한다. 상기 유전자 및 이의 대응하는 유전자 생성물은 선택가능한 마커로 칭한다. 임의의 광범위한 선택가능한 마커는 프로토테카를 형질전환시키기 위해 유용한 이식유전자 구성체에 사용될 수 있다. 적합한 선택가능한 마커의 예는 G418 내성 유전자, 나이트레이트 환원효소 유전자(문헌[Dawson et al. (1997), Current Microbiology 35:356-362] 참조), 하이그로마이신 포스포트랜스퍼라제 유전자(hygromycin phosphotransferase gene, HPT; 문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73] 참조), 네오마이신 포스포트랜스퍼라제 유전자, 및 플레오마이신(문헌[Huang et al. (2007), Appl. Microbiol. Biotechnol. 72:197-205] 참조)에 대해 내성을 부여하는 ble 유전자, 및 카나마이신에 내성을 부여하는 아미노글라이코사이드-3'-O-포스포트랜스퍼라제(서열번호 194)를 포함한다. 항생제에 대한 미세조류의 민감성을 측정하는 방법은 널리 공지되어 있다(예를 들어, 문헌[Mol Gen Genet. 1996 Oct 16;252(5):572-9] 참조).
항생제 기반이 아닌 다른 선택가능한 마커는 또한 일반적으로 프로토테카 종을 포함하는 미세조류를 형질전환하는데 유용한 이식유전자 구성체에 사용될 수 있다. 미세조류에 의해 이전에 이용될 수 없었던 특정 탄소 공급원을 이용하는 능력을 부여하는 유전자가 또한 선택가능한 마커로서 사용될 수 있다. 예로서, 프로토테카 모리포미스 균주는 전형적으로 수크로스 상에서 성장한다고 하더라고, 불량하게 성장한다. 수크로스 인버타제 유전자를 함유하는 구성체를 사용하는 것은 탄소 기질로서 수크로스를 성장시키는 포지티브 형질전환체의 능력을 부여할 수 있다. 다른 선택가능한 마커와 함께 선택가능한 마커로서 수크로스 이용에 대한 추가적인 상세한 설명은 이하의 하위부문 IV에서 논의한다.
발명의 목적을 위해, 본 발명의 재조합 숙주 세포를 제조하기 위해 사용되는 발현 벡터는 상기 유전자들 중 하나가 선택가능한 마커인 경우, 2개 이상 및 흔히 3개의 유전자를 포함한다. 예를 들어, 본 발명의 유전자 조작된 프로토테카는 선택가능한 마커뿐만 아니라 하나 이상의 외인성 유전자, 예를 들어, 수크로스 인버타제 유전자 또는 아실 ACP-티오에스터라제 유전자를 포함하는 본 발명의 벡터로 형질전환시킬 수 있다. 하나 또는 2개의 유전자는 지질 수율 및 지방산 에스터로의 전환을 증진시키기 위해 상기 유전자들의 발현과 관련된 타이밍을 허용하는 유도성 프로모터를 사용하여 발현될 수 있다. 2개 이상의 외인성 유전자의 발현은 동일한 유도성 프로모터의 제어 하에 또는 상이한 유도성(또는 항상성) 프로모터의 제어 하에 있을 수 있다. 후자 상황에서, 제1 외인성 유전자의 발현은 제1 기간 동안 유도될 수 있고(이 동안 제2 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있다) 제2 외인성 유전자의 발현은 제2 기간 동안 유도될 수 있다(이 동안 제1 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있다).
다른 양태에서, 2개 이상의 외인성 유전자(임의의 선택가능한 마커에 추가로)는 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA/알데하이드 환원효소이고, 상기 수율의 조합 작용은 알코올 생성물을 생성시킨다. 추가로 제한 없이 알데하이드를 생성하기 위한 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA 환원효소를 포함하는 외인성 유전자의 다른 조합이 제공된다. 하나의 양태에서, 벡터는 알칸을 생성하기 위해 지방 아실-ACP 티오에스터라제, 지방 아실-CoA 환원효소 및 지방 알데하이드 데카보닐라제의 조합을 제공한다. 이들 각각의 양태에서, 외인성 유전자중 하나 이상은 유도성 프로모터를 사용하여 발현될 수 있다.
2개 이상의 외인성 유전자를 발현하는 본 발명의 다른 예시적인 벡터는 수크로스 수송체 및 수크로스 인버타제 효소 둘 다를 암호화하는 것들 및 선택가능한 마커 및 분비된 수크로스 인버타제 둘 다를 암호화하는 것들을 포함한다. 벡터 중 어느 하나의 유형으로 형질전환된 재조합 프로토테카는 탄소 공급원으로서 사탕무(및 사탕무 유래 당)를 사용하기 위한 유전자 조작된 능력 때문에 더 낮은 제조 비용으로 지질을 생산한다. 상기된 2개의 외인성 유전자의 삽입은, 보다 큰 탄소 유입이 지질 생산과 맞물리도록 지시되고/되거나 무작위 돌연변이 유발을 통해 다당류 생합성의 파괴와 조합될 수 있다. 개별적으로 및 조합적으로, 영양성 전환, 지질 생산을 변화시키기 위한 조작 및 외인성 효소를 사용한 처리는 미생물에 의해 생산되는 지질 조성물을 변형시킨다. 상기 변형은 미생물 내에서 생산되는 지질의 양의 변화, 다른 지질과 비교하여 생산되는 하나 이상의 탄화수소 종의 양 및/또는 생산되는 지질 종의 유형의 변화일 수 있다. 예를 들어, 미세조류는 더 높은 양 및/또는 %의 TAG를 생산하도록 유전자 조작될 수 있다.
재조합 단백질의 최적의 발현을 위해, 형질전환된 숙주 세포에 의해 우선적으로 사용되는 코돈으로 mRNA를 생산하는 암호화 서열을 사용하는 것이 유리하다. 따라서, 전이유전자의 적당한 발현은 전이유전자의 코돈 용법이 전이유전자가 발현되는 유기체의 특이적 코돈 편력에 부합되도록 하는 것이 요구될 수 있다. 상기 효과가 근거하는 정확한 메커니즘은 많지만, 상기 필요성이 충족되는 경우 전이유전자 전령 RNA(mRNA)의 보다 효율적인 해독과 커플링되는, 세포 내에서 합성되는 단백질과 가용하게 아미노아실화된 tRNA 풀의 적당한 균형을 포함한다. 이식 유전자 내 코돈 용법이 최적화되지 않은 경우, 가용한 tRNA 풀은 이종성 mRNA의 효율적인 해독을 허용하기에 충분하지 않고 리보솜 멈춤(stalling) 및 종결 및 유전자이식mRNA의 가능한 불안정성을 유도한다.
본 발명은 프로토테카 내에서 재조합 단백질의 성공적인 발현을 위해 유용한 코돈 최적화된 핵산을 제공한다. 프로토테카 종에서 코돈 용법은 프로토테카 모리포르미스로부터 분리된 cDNA 서열을 연구함에 의해 분석된다. 이 분석은 24,000개 코돈에 대한 탐색이고 이의 결과는 이하의 표 2에 나타낸다.
Figure 112018108415035-pat00004
다른 양태에서, 재조합 벡터내 유전자는 프로토테카 균주 이외의 다른 미세조류 균주를 참조하여 코돈 최적화되었다. 예를 들어, 미세조류내 발현용 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다. 암호화 최적화를 위한 추가의 정보는 예를 들어, GenBank의 코돈 용법 데이타베이스에서 입수할 수 있다.
클로렐라 피레노이도사, 두나리엘라살리나, 및 클로렐라 프로토테코이데스 내 코돈 사용 빈도(codon usage)의 다른 비제한적 예는 표 28, 표 29 및 표 30에서 각각 나타낸다.
Figure 112018108415035-pat00005
Figure 112018108415035-pat00006
Figure 112018108415035-pat00007
C. 유도성 발현
본 발명은 또한 관심의 유전자를 발현하기 위한 유도성 프로모터의 사용을 제공한다. 특히, 리파제 유전자의 유도성 프로모터 사용은 필요하다면 조건이 조절된 때, 예를 들어 세포의 파괴, 반응 혼합물의 물 함량 감소 후, 및/또는 TAG를 지방산 에스터로 전환을 구동시키는 충분한 알코올의 첨가 후 미생물 유기체의 성장 후 리파제를 생성시킨다.
본 발명에 유용한 유도성 프로모터는 자극에 반응하는 작동가능하게 연결된 유전자의 전사를 매개하는 것, 예컨대 외인성으로 제공된 소분자(예를 들어 서열번호 1에서와 같은 글루코스), 온도(가열 또는 냉각), 빛 등을 포함한다. 적합한 프로모터는 본질적으로 침묵 유전자의 전사를 활성화할 수 있고, 바람직하게는 실질적으로 낮은 수준에서 전사된 작동가능하게 연결된 유전자의 전사를 상향조절할 수 있다. 후자의 경우에, 리파제의 전사 수준은 바람직하게는 그것이 발현된 미생물 유기체의 성장을 상당히 방해하지 않는다.
클로렐라 내 이식유전자의 발현은 클로렐라 헥소스 수송체 유전자(서열번호 1)을 구동시키는 프로모터와 같은 프로모터를 통해 유도가능하게 수행될 수 있다. 이 프로모터는 배양 배지 내 글루코스의 존재에 의해 강하게 활성화된다.
D. 2 이상의 외인성 유전자의 발현
추가로, 미세조류와 같은 유전자적으로 조작된 미생물 유기체는 예를 들어 리파제와 같은 2 이상의 외인성 유전자 및 예를 들어 다당류 분해 효소를 암호화하는 용균성 유전자를 포함하고 발현할 수 있다. 하나 또는 유전자 둘 다는 지질 수율 및 지방산 에스터로 전환을 향상시키도록 제어되는 이들 유전자를 상대적 발현 시간을 허용하는 유도성 프로모터를 사용하여 발현될 수 있다. 2 이상의 외인성 유전자 발현은 동일한 유도성 프로모터의 제어 하에 또는 상이한 유도성 프로모터의 제어 하에 있을 수 있다. 후자의 상황에서, 제1 외인성 유전자 발현은 제1 시간 기간 동안(이 동안 제2 외인성 유전자의 발현이 유도되거나 유도되지 않을 수 있음) 유도될 수 있고, 제2 외인성 유전자의 발현은 제2 시간 기간 동안 유도될 수 있다( 이 동안 제1 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있음). 수크로스를 대사 작용하기 위한 지질-생성 미생물을 유전자 조작하기 위한 벡터 및 방법이 본 명세서에서 제공되는데, 이는 사탕수수 공급원료를 지질로 전환하기 위한 세포를 유전자조작하기 때문에 유리한 특성이다.
2 이상의 외인성 유전자, 예를 들어 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA/알데하이드 환원효소를 발현시키는 미생물(예를 들어, 미세조류, 유지성 효모, 박테리아 또는 진균)의 유전자 조작된 균주가 본 명세서에 제공되며, 이것의 조합된 작용으로 알코올 생성물을 수득한다. 알데하이드를 만들어내기 위해 제한 없이, 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA 환원효소를 포함하는 외인성 유전자의 다른 조합이 추가로 제공된다. 추가로, 이 출원은 알칸을 만들어내기 위해 지방 아실-ACP 티오에스터라제, 지방 아실-CoA 환원효소, 및 지방 알데하이드 데카보닐라제의 조합을 제공한다. 하나 이상의 외인성 유전자는 유도성 프로모터를 사용하여 발현될 수 있다.
본 발명의 사용에 적합한 추가 변형의 예는, 하나는 고정된 탄소 공급원(예컨대 수크로스)의 수송체를 암호화하고, 두 번째는 수크로스 인버타제 효소를 암호화하는, 2 이상의 외인성 유전자를 발현시키기 위해 미세조류의 유전자 조작된 균주를 포함한다. 얻어진 발효가능한 유기체는 이전에 알려진 방법의 생물학적 탄화수소 생성으로 얻을 수 있는 것보다 더 낮은 제조 비용으로 탄화수소를 생성한다. 상기 기재한 2개의 외인성 유전자 삽입은 탄화수소 생성으로 훨씬 더 큰 탄소 유입을 조종하는 직접 및/또는 무작위 돌연변이를 통해 다당류 생합성의 파괴와 조합될 수 있다. 개개로 및 조합으로, 외인성 효소에 의한 탄화수소 생성 및 처리를 변경하는 유전자 조작인 영양 전환은 미생물 유기체에 의해 생성된 탄화수소 조성물을 변경한다. 해당 변경은 생성된 탄화수소의 양, 다른 탄화수소에 대해 생성된 하나 이상의 탄화수소 종의 양 및/또는 미생물 유기체에 대해 생성된 하나 이상의 탄화수소 종의 양을 변화시킬 수 있다. 예를 들어, 미세조류는 더 많은 양 및/또는 백분율의 TAG를 생성하도록 유전자조작될 수 있다.
E. 구분된 발현
본 발명은 또한 관심 유전자의 구분된 발현을 제공한다. 특히, 특정 실시형태에서, 에스터결합전이 반응의 개시까지 대부분의 세포 지질로부터 격리되는 하나 이상의 세포 구획에 대해 리파제의 발현을 표적화시키는 것이 유리할 수 있다. 표적화를 위한 바람직한 세포 기관은 엽록체, 미토콘드리아, 및 소포체이다.
(1) 엽록체 내 발현
본 발명의 한 실시형태에서, 미생물 유기체 내 폴리펩타이드의 발현은 엽록체에 표적화된다. 엽록체에 대해 이종성인 유전자의 발현을 표적화하는 방법은 공지되어 있으며 본 발명에서 사용될 수 있다. 엽록체 내로 외래 유전자 생성물을 표적화하는 방법은 문헌[Shrier et al., EMBO J. (1985) 4:25 32]에 기재되어 있다. 또한 핵 유전자를 엽록체에 전위시키는 수송 펩타이드의 사용에 대해 문헌[Tomai et al. Gen. Biol. Chem. (1988) 263:15104 15109] 및 미국특허 제4,940,835호를 참조한다. 엽록체에 단백질의 수송을 지시하는 방법은 또한 문헌[Kenauf TIBTECH (1987) 5:40 47]에서 검토된다. 클로렐라에 내인성인 서열을 표적화하는 엽록체는, 예컨대 엽록체에 표적화된 단백질을 암호화하는 클로렐라 핵 게놈 내 유전자가 공지되어 있으며; 예를 들어 GenBank 등록번호 AY646197 및 AF499684를 참조한다.
와게닝겐 UR- 식물 연구 국제기구(Wageningen UR- Plant Research International)는 이중 막 시스템을 가로질러 왕복하는 엽록체 스트로마(세포질) 환경 내로 이종성 단백질을 전달하기 위한 크립산테뭄 모리폴리움 소단위체 단백질의 분비 신호를 사용하는 IMPACTVECTOR1.4 벡터를 판매한다. 해당 단백질은 신호 펩타이드의 적절한 처리를 위하여 성숙 루비스코 단백질의 처음 11개 아미노산에 융합된다(Wong et al., Plant Molecular Biology 20: 81-93 (1992)). 신호 펩타이드는 RbcS 유전자로부터 본래의 인트론을 함유한다.
다른 접근에서, 엽록체 게놈은 이종성 단백질을 발현하도록 유전자 조작된다. 외래 DNA로 코팅된 고속 텅스텐 입자총에 의한 수용 세포의 충격을 사용하는 클라미도모나스 레인하르티(녹조류) 엽록체의 안정한 형질전환이 기재되었다. 예를 들어, 문헌[Boynton et al., Science (1988) 240: 1534 1538; Blowers et al. Plant Cell (1989) 1:123 132 및 Debuchy et al., EMBO J. (1989) 8: 2803 2809]을 참조한다. 텅스텐 입자총을 사용하는 형질전환 기법은 문헌[Klein et al., Nature (London)(1987) 7:70 73]에 의해 기재된다. 식물과 미세조류 둘 다에 대한 엽록체 형질전환의 다른 방법은 공지되어 있다. 예를 들어 미국특허 제5,693,507호; 제6,680,426호; 및 문헌[Plant Physiol. 2002 May;129(1):7-12; 및 Plant Biotechnol J. 2007 May;5(3):402-12]을 참조한다.
미국특허 제6,320,101호(Kaplan 등에 대해 2001년 11월 20일 발행됨; 본 명세서에 참조로 포함됨)에서 기재된 바와 같이, 세포는 약 하나의 세포마다 엽록체 수를 감소시키기 위하여 화학적으로 처리될 수 있다. 그 다음에, 이종성 핵산은 엽록체 내에 적어도 하나의 이종성 핵산 분자를 도입하는 목적으로 입자 충격을 통해 세포 내에 도입될 수 있다. 이종성 핵산은 엽록체에 내재된 효소에 의해 용이하게 달성되는 상동성 재조합을 통해 엽록체의 게놈 내로 통합가능하도록 선택된다. 이것의 마지막에, 이종성 핵산은 관심의 유전자에 더하여, 엽록체 게놈으로부터 유래된 적어도 하나의 핵산 서열을 포함한다. 추가로, 이종성 핵산은 전형적으로 선택가능한 마커를 포함한다. 이 기법에 대한 추가적인 상세한 설명은 본 명세서에 참조로 포함된 미국특허 제4,945,050호 및 제5,693,507호에서 발견된다. 따라서 폴리펩타이드는 엽록체의 단백질 발현 시스템에 의해 생성될 수 있다.
미국특허 제7,135,620호(Daniell에 대해 2006년 11월 14일 발행됨; 본 명세서에 참조로 포함됨)는 엽록체 발현 벡터 및 관련 방법을 기재한다. 발현 카세트는 엽록체 내 암호화 서열의 적절한 발현을 제공하기 위한 암호화 서열 및 적합한 제어 서열을 포함하는 DNA 구성체이다. 전형적인 발현 카세트는 다음의 성분을 포함한다: 엽록체 내 관심의 폴리펩타이드를 암호화하는 DNA 서열의 전사 및 번역을 제공하는 psbA와 같은 미생물 유기체 유전자 또는 엽록체로부터 유래된 5' 미번역 영역; 관심의 폴리펩타이드를 암호화하는 DNA 서열; 및 도입된 유전자의 RNA를 안정화하고, 이에 의해 외래 유전자 발현을 향상시킬 수 있는 엽록체 유전자의 3' 전화 반복 영역과 같은 번역 및 전사 종결 영역. 카세트는 선택적으로 항생제 내성 유전자를 포함할 수 있다.
전형적으로 발현 카세트는 적절한 게놈 내로 삽입을 위해 편리한 제한 부위 옆에 있다. 발현 카세트는 엽록체 DNA로부터 DNA 서열 옆에 위치하여 특히 상동성 재조합에 의해 엽록체 게놈 내로 발현 카세트의 안정한 통합을 용이하게 할 수 있다. 대안적으로, 발현 카세트는 통합되지 않고 남아있을 수도 있는데, 이 경우에 해당 발현 카세트는 엽록체 내에서 이종성인 복제를 제공할 수 있는 엽록체 복제원점을 전형적으로 포함한다.
발현 카세트는 일반적으로 엽록체 내에서 발현시킬 수 있는 유전자로부터 유래된 프로모터 영역을 포함한다. 프로모터 영역은 엽록체 유전자, 예컨대 시금치 또는 완두콩으로부터의 psbA 유전자로부터 얻을 수 있는 프로모터, 또는 메이즈 및 Rrna 프로모터로부터의 rbcL 및 atpB 프로모터 영역을 포함할 수 있다. 프로모터의 예는 문헌[Hanley-Bowdoin and Chua, TIBS (1987) 12:67 70; Mullet et al., Plant Molec Biol. (1985) 4: 39 54; Hanley-Bowdoin (1986) PhD. Dissertation, the Rockefeller University; Krebbers et al., Nucleic Acids Res. (1982) 10: 4985 5002; Zurawaki et al., Nucleic Acids Res. (1981) 9:3251 3270; 및 Zurawski et al., Proc. Nat'l Acad Sci. U.S.A. (1982) 79: 7699 7703]에 기재되어 있다. 다른 프로모터가 확인될 수 있고, 이렇게 확인된 프로모터의 상대적 강도는 관심의 5'프로모터를 프로모터가 없는 마커 유전자에 위치시키고, 예를 들어 psbA 유전자로부터의 프로모터, 상대적으로 강한 엽록체 프로모터로부터 얻은 전사에 대해 그것의 유효성을 관찰함으로써 평가될 수 있다. 이종성 유전자 발현의 효율은 임의의 다양한 기법에 의해 향상될 수 있다. 이들은 이종성 유전자, 예를 들어 이중 psbA 프로모터에 나란히 5'에서 삽입된 다양한 프로모터 사용, 인핸서 서열 등의 추가를 포함한다.
클로렐라 엽록체에서 활성인 수많은 프로모터는 클로렐라 엽록체 내 외인성 유전자, 예컨대 GenBank 등록번호 NC_001865(클로렐라 불가리스 엽록체, 완전 게놈)에서 발견되는 것의 발현을 위해 사용될 수 있다.
이종성 유전자의 유도성 발현을 제공하도록 설계된 경우, 전사 및/또는 번ㅇ겨(3'말단에서) 수준의 조절을 제공하는 서열을 함유하는 유도성 프로모터 및/또는 5'미번역 영역은 발현 카세트 내에 포함될 수 있다. 예를 들어, 5'미번역 영역은 발현이 빛에 의해 조절가능한 유전자로부터 유래될 수 있다. 유사하게, 3' 역반복 말단은 이종성 유전자의 RNA를 안정화하기 위하여 사용될 수 있었다. 유도성 유전자는 관심의 특정 자극에 반응하는 발현이 향상되는 것과 자극의 부재에서 발현이 낮거나 없는 것으로 확인될 수 있다. 예를 들어, 빛-유도성 유전자는 향상된 발현이 빛에 의한 조사 동안 생기는 경우를 확인할 수 있는 한편, 빛이 낮거나 없을 때 발현은 실질적으로 감소되거나 발현이 일어나지 않는다. 녹색 미세조류로부터 유래된 빛 조절 프로모터는 공지되어 있다(예를 들어 문헌[Mol Genet Genomics. 2005 Dec;274(6):625-36] 참조).
사용되는 종결 영역은 주로 편리함을 위한 것인데, 종결 영역은 엽록체 및 박테리아 중에서 상대적으로 상호호관가능한 것으로 나타났기 때문이다. 종결 영역은 전사 개시 영역에 본래 있을 수도 있고, 관심의 DNA 서열에 본래 있을 수도 있으며, 또는 다른 공급원으로부터 얻을 수도 있다. 예를 들어 문헌[Chen and Orozco, Nucleic Acids Res. (1988) 16:8411]을 참조한다.
발현 카세트는 임의의 다수의 방법에 의해 관심의 식물 세포로 형질전환될 수 있다. 이들 방법은, 예를 들어 바이오리스틱(biolistic) 방법을 포함한다(예를 들어, 문헌[Sanford, Trends In Biotech. (1988) 6:299 302], 미국특허 제4,945,050호); 전기천공(Fromm et al., Proc. Nat'l. Acad. Sci. (USA)(1985) 82:5824 5828); 레이저 빔, 미소주입 또는 엽록체에 DNA를 도입할 수 있는 임의의 다른 방법을 포함한다.
미세조류와 같은 미생물 유기체에서 사용에 적합한 엽록체 발현 벡터의 추가적인 기재는 미국특허 제7,081,567호 (Xue에 대해 2006년 7월 25일 발행); 제6,680,426호(Daniell 등에 대해 2004년 1월 20일 발행); 및 5,693,507(Daniell 등에 대해 1997년 12월 2일 발행)에서 발견된다.
클로렐라의 핵 게놈에서 발현된 단백질은 엽록체 표적화 신호를 사용하여 엽록체에 표적화될 수 있다. 클로렐라에 내인성인 엽록체 표적화 서열은 예컨대 엽록체에 표적화된 단백질을 암호화하는 클로렐라 핵 게놈 내 유전자가 공지되어 있으며; 예를 들어 GenBank 등록번호 AY646197 및 AF499684를 참조한다. 단백질은 또한 엽록체 게놈 내에 직접적으로 유전자의 삽입에 의해 클로렐라 엽록체 내에서 발현될 수 있다. 엽록체 형질전환은 전형적으로 상동성 재조합을 통해 일어나며, 엽록체 게놈이 표적화 벡터의 생성에 대해 알려져 있다면, 엽록체 형질전환이 수행될 수 있다(예를 들어 클로렐라 엽록체의 완전한 게놈 서열; Genbank 등록번호 NC_001865를 참조). 엽록체 형질전환의 상세한 설명에 대해 본 명세서의 앞의 부문을 참조한다.
(2) 미토콘드리아 내 발현
본 발명의 다른 실시형태에서, 미생물 유기체 내 폴리펩타이드의 발현은 미토콘드리아로 표적화된다. 녹색 미세조류를 포함하는 미토콘드리아에 외래 유전자 생성물을 표적화하기 위한 방법(Boutry et al. Nature (London)(1987) 328:340 342)은 기재되었다(예를 들어, 문헌[Mol Gen Genet. 1993 Jan;236(2-3):235-44] 참조).
예를 들어, 적합한 분비 신호를 암호화하는 발현 벡터는 미토콘드리아에 이종성인 단백질을 표적화할 수 있다. 와게닝겐 UR- 식물 연구 국제기구제의 MPACTVECTOR1.5 벡터는 미토콘드리아 매트릭스 내에서 단백질을 전달하는 것으로 나타난 효모 CoxIV 분비 신호를 사용한다. 단백질은 신호 펩타이드를 적절하게 처리하기 위하여 효모 CoxIV 단백질의 처음 4개 아미노산에 융합된다(Kohler et al. Plant J 11: 613-621 (1997)). 녹색 미세조류에서 기능적인 것을 포함하는 다른 미토콘드리아 표적화 서열은 공지되어 있다. 예를 들어 문헌[FEBS Lett. 1990 Jan 29;260(2):165-8; 및 J Biol Chem. 2002 Feb 22;277(8):6051-8]을 참조한다.
클로렐라의 핵 게놈에서 발현된 단백질은 미토콘드리아 표적화 신호를 사용하여 미토콘드리아에 표적화될 수 있다. 미토콘드리아 단백질 표적화 및 형질전환의 상세한 설명에 대해 본 명세서의 이전의 부문을 참조한다.
(3) 소포체 내 발현
본 발명의 다른 실시형태에서, 미생물 유기체 내 폴리펩타이드의 발현은 소포체로 표적화된다. 발현 벡터 내 적절한 보유 또는 분류 신호의 포함은 단백질이 소포체(ER) 내에 유지되고, 골지체 내로 하류로 가지 않는다는 것을 보장한다. 예를 들어, 와게닝겐 UR- 식물 연구 국제기구제의 IMPACTVECTOR1.3 벡터는 잘 공지된 KDEL 보유 또는 정렬 신호를 포함한다. 이 벡터에 의해, ER 보유는 현실적 이점을 가지며, 즉, 발현 수준을 5배 또는 그 이상으로 개선시키는 것으로 보고되었다. 이에 대한 주된 이유는 ER이 세포질에 존재하는 발현된 단백질의 번역 후 분해를 초래하는 더 낮은 농도 및/또는 상이한 프로테아제를 함유한다는 것을 나타낸다. 녹색 미세조류에서 기능적인 ER 보유 신호는 공지되어 있다. 예를 들어, 문헌[Proc Natl Acad Sci U S A. 2005 Apr 26;102(17):6225-30]을 참조한다.
본 발명의 방법 및 재료가 미생물 유기체 내애 임의의 외인성 유전자를 도입시키는 반면, 수크로스 이용 및 지질 경로 변형에 대한 유전자는 다음의 부문에서 논의되는 것과 같은 특정 관심을 가진다.
IV. 선택가능한 마커
1. 수크로스 이용
하나의 양태에서, 본 발명의 재조합 프로토테카 세포는 하나 이상의 외인성 수크로스 이용 유전자를 함유한다. 다양한 양태에서, 하나 이상의 유전자는 프럭토키나제, 글루코키나제, 헥소키나제, 수크로스 인버타제 및 수크로스 수송체로 이루어진 그룹으로부터 선택된 하나 이상의 단백질을 암호화한다. 예를 들어, 수크로스 수송체 및 수크로스 인버타제의 발현은 프로토테카가 수크로스를 배양 배지로부터 세포에 수송하여 수크로스를 가수분해시켜 글루코스 및 프럭토스를 생성하도록 한다. 임의로, 내인성 헥소키나제 활성이 프럭토스의 최대 인산화를 위해 불충분한 경우에도 프럭토키나제는 발현될 수 있다. 적합한 수크로스 수송체의 예는 Genbank 등록번호 제CAD91334호, 제CAB92307호, 및 제CAA53390호이다. 적합한 프럭토키나제의 예는 Genbank 등록번호 제P26984호, 제P26420호 및 제CAA43322호이다.
하나의 양태에서, 본 발명은 수크로스 인버타제를 분비하는 프로토테카 숙주 세포를 제공한다. 수크로스 인버타제의 분비는 수크로스를 세포 내로 수송할 수 있는 수송체를 발현할 필요성을 제거한다. 이것은 분비된 인버타제가 수크로스 분자의 글루코스 및 프럭토스 분자로의 전환을 촉매하기 때문이고, 이들 분자 둘 다는 본 발명에 의해 제공된 미생물에 의해 수송되고 이용될 수 있다. 예를 들어, 분비 신호 (예를 들어, 서열번호 4의 신호(효모 유래), 예를 들어, 서열번호 5의 신호(고등 식물 유래), 서열번호 6의 신호(진핵 컨센서스 분비 신호) 및 서열번호 7의 신호(고등 식물 및 진핵 컨센서스 유래의 신호 서열의 조합체))와 함께 수크로스 인버타제(예를 들어, 서열번호 3)의 발현은 세포 외부에서 인버타제 활성을 생성시킨다. 본 명세서에 기재된 유전자 조작 방법에 가능한 상기 단백질의 발현은 이미 에너지원으로서 세포외 글루코스를 이용할 수 있는 세포가 세포외 에너지원으로 수크로스를 이용할 수 있게 해준다.
수크로스 함유 배지에서 인버타제를 발현하는 프로토테카 종은 오일 생산을 위해 바람직한 미세조류 종이다. 이런 완전히 활성인 단백질의 발현 및 세포외 표적화는 수득한 숙주 세포가 수크로스 상에서 성장하도록 하는 반면, 이들의 비형질전환된 대응 숙주 세포는 성장할 수 없다. 따라서, 본 발명은 효모 인버타제 유전자를 포함하지만 이에 제한되지 않는 코돈 최적화된 인버타제 유전자를 갖는 프로토테카 재조합 세포를 제공하고, 이때 상기 효모 인버타제 유전자는 게놈에 통합되어 있어 상기 인버타제 유전자는 인버타제 활성 및 수크로스 가수분해에 의해 평가되는 바와 같이 발현된다. 본 발명은 또한 세포가 수크로스상에 성장할 수 있는 반면 이들의 비형질전환된 대응 세포는 발현할 수 없으므로 프로토테카 재조합 세포에서 선택가능한 마커로서 유용한 인버타제 유전자; 및 조류 분자 유전자에 대한 강력한 선택가능한 마커로서 인버타제를 사용하여 재조합 숙주 세포를 선택하기 위한 방법을 제공한다.
프로토테카에서 수크로스 인버타제의 성공적인 발현은 또한 이것이, 이종성(재조합) 단백질이 완전한 활성 및 기능적 형태로서 세포 외부로 및 배양 배지 내로 성공적으로 분비됨을 입증한다는 점에서 본 발명의 또 다른 측면을 설명한다. 따라서, 본 발명은 미세조류 내 광범위한 이종성 단백질을 발현하고 이들을 숙주 세포 외부로 분비시키기 위한 방법 및 시약을 제공한다. 상기 단백질은 예를 들어, 산업용 효소, 예를 들어, 리파제, 프로테아제, 셀룰라제, 펙티나제, 아밀라제(예를 들어, 서열번호 190 내지 191), 에스터라제, 옥시도환원효소, 트랜스퍼라제, 락타제, 아이소머라제 및 인버타제, 및 치료학적 단백질, 예를 들어, 성장 인자, 사이토킨, 2개의 경쇄 및 2개의 중쇄를 포함하는 전장 항체, Fab, scFv(단일쇄 가변 단편), 카멜리드형 항체, 항체 단편, 항체-단편 융합체, 항체-수용체 융합체, 인슐린, 인터페론 및 인슐린형 성장 인자를 포함한다.
프로토테카내 수크로스 인버타제의 성공적인 발현은 또한 이것이 프로토테카내 단백질의 분비를 지시하기 위한 조류 내 진균류 수송 펩타이드의 사용을 위한 방법 및 시약을 제공하고 펩타이드가 기능할 수 있는지의 여부 및 이것이 프로토테카 세포에서 수송 펩타이드로서 기능하는 능력을 결정하기 위한 방법 및 시약을 제공한다는 점에서 본 발명의 또 다른 측면을 설명한다. 본 발명의 방법 및 시약은 단백질을 세포 외로 성공적으로 수송할 수 있는 다른 수송 펩타이드를 확인하기 위한 도구 및 플랫폼으로서 사용될 수 있고, 이때 효모 인버타제가 이들 방법에서 우수한 용도를 갖는다. 본 실시예에서 입증된 바와 같이, 내인성 효모 인버타제 수송 펩타이드의 제거 및 숙주 조류에 내인성이거나 다른 공급원(진핵, 원핵 및 바이러스)으로부터 유래하는 다른 수송 펩타이드로 이의 대체가 목적하는 임의의 펩타이드가 세포로부터 단백질의 방출을 유도하는 수송 펩타이드로서 기능할 수 있는지의 여부를 확인할 수 있다.
적합한 수크로스 인버타제의 예는 Genbank 등록번호 제CAB95010호, 제NP_012104호 및 제CAA06839호에 의해 확인된 것들을 포함한다. 적합한 인버타제의 비제한적인 예는 하기 표 3에 열거되어 있다. 각각의 열거된 인버타제에 대한 아미노산 서열은 하기의 서열 목록에 포함된다. 일부 경우에, 본 발명의 방법 및 벡터에 사용하기에 적합한 외인성 수크로스 이용 유전자는 표 3로으부터 선택되는 수크로스 인버타제와 40, 50, 60, 75, 또는 90% 이상의 아미노산 동일성을 갖는 수크로스 인버타제를 암호화한다.
Figure 112018108415035-pat00008
프로토테카에 의한 배양 배지로의 인버타제의 분비는 세포가 이들이 순수 시약 등급의 글루코스 상에 성장하는 바와 같이 사탕무 가공으로부터 비롯된 폐기 당밀상에서 성장할 수 있도록 해주고 사탕무 가공의 상기 낮은 가치의 폐기물의 사용은 지질 및 다른 오일의 제조에서 상당한 비용 절감을 제공할 수 있다. 따라서, 본 발명은 (i) 수크로스 및 (ii) 수크로스 인버타제 효소를 포함하는 배양 배지 및 프로토테카 미생물 집단을 함유하는 미생물 배양물을 제공한다. 다양한 양태에서 배양물내 수크로스는 수수, 사탕무, 사탕 수수, 당밀 또는 탈중합된 셀룰로스 물질(이것은 임의로 리그닌을 함유할 수 있다)로부터 유래한다. 또 다른 측면에서, 본 발명의 방법 및 시약은 재조합 프로토테카에 의해 사용될 수 있는 공급원료의 수 및 유형을 상당히 증가시킨다. 본 명세서에 예시된 미생물은 이들이 수크로스를 이용할 수 있도록 변형되고 본 발명의 방법 및 시약이 적용되어 셀룰로스와 같은 공급원료가 셀룰라제, 펙티나제, 아이소머라제 등을 분비하는 능력을 갖는 본 발명의 유전자조작된 숙주 미생물에 의해 이용될 수 있도록 하고 효소 반응의 분해 생성물은 더 이상 단순히 내성이 아니고 숙주에 의해 탄소 공급원으로 이용된다. 이것의 예는 이하에서 및 농업폐기물 스트림에서 발견되는 2가지의 올리고당인 라피노스 및 스타키오스에 함유된 것과 같은 올리고당 내 α-갈락토실 결합을 가수분해하는 능력을 부여하는 선택가능한 α-갈락토시다제로 유전자 조작된 미생물의 예에서 기재된다.
2. 알파-갈락토시다제 발현
상기 기재한 바와 같은 수크로스 인버타제의 발현이 탄소 공급원과 같은 수크로스를 더 효율적으로 이용하기 위하여 프로토테카 세포에 대해 능력을 부여하는 한편(이당류 수크로스 내 프럭토스와 글루코스 분자 사이의 α-연결을 가수분해하는 효소를 통해), 올리고당 내 다른 유형의 α-연결을 가수분해하는 다른 효소의 발현은 다른 탄소 공급원을 이용하기 위하여 프로토테카 세포에 대한 능력을 부여할 수 있다. 이들 효소의 발현(및 프로토테카 및 다른 미세조류 세포가 보통 사용될 수 없는 탄소 공급원을 이용하는 결과 능력)은 이들 탄소 공급원을 성장시킬 수 있는 포지티브 클론을 선택하도록 하여 이들 유전자 이식 프로토테카 세포에 대한 선택가능한 마커로 사용될 수 있다.
실시형태에서, 본 발명의 재조합 프로토테카 세포는 다당류 분해 효소를 암호화하는 하나 이상의 외인성 유전자를 추가로 함유한다. 다양한 실시형태에서, 다당류 분해 효소를 암호화하는 하나 이상의 유전자는 분비된 α-갈락토시다제를 암호화하는 유전자이다. 프로토테카 세포 내 외인성의 분비된 α-갈락토시다제의 발현은 갈락토스와 글루코스 단당류 단위 사이의 α-연결과 같은 D-갈락토실 연결을 함유하는 당(탄소 공급원)에서 성장하는 이러한 형질전환된 균주의 능력을 부여한다. 외인성의 분비된 α-갈락토시다제를 발현하는 프로토테카 균주는 멜리비오스(α-D-갈락토스-글루코스로 구성된 이당류)와 같은 이당류를 이용할 수 있다.
라피노스(α-연결된 갈락토스-글루코스-프럭토스를 포함하는 삼당류) 및 스타키오스(2개의 α-연결 D-갈락토스 단위 다음에 α-연결된 글루코스 및 프럭토스로 구성되는 삼당류)와 같은 당은 사탕 무박(라피노스) 및 대두 음식물(스타키오스)와 같은 농업폐기물 스트림에서 상당한 비율로 존재한다. 이러한 농업 잔여물은 그것을 이용할 수 있는 미생물(프로토테카를 포함)에 의해 오일로 전환을 위하여 상당한 이용되지 않은 탄소 공급원을 표시한다.
프로토테카 균주는 임의의 상당한 양으로 또는 전혀 라피노스 및 스타키오스와 같은 올리고당을 이용할 수 없었다. 라피노스 및 스타키오스의 경우에, 수크로스 인버타제를 발현하는 유전자이식 균주(상기 기재함)가 수크로스의 α-갈락토실 유도체 내 프럭토스와 글루코스 사이의 α-연결을 가수분해하는 능력을 가지지만, 수크로스 인버타제가 이러한 당 내 남아있는 α-연결을 절단하지 않고, 결과 이당류가 이용가능하지 않기 때문에 올리고당의 나머지는 이용되지 않고 남아있다. 다른 실시형태에서, 본 발명의 재조합 프로토테카 세포는 수크로스 인버타제를 암호화하는 외인성 유전자와 α-갈락토시다제를 암호화하는 외인성를 둘 다 포함한다. 따라서 수크로스 인버타제와 α-갈락토시다제를 둘 다 발현하는 균주는 성분 모노머를 소모시키는 라피노스 및 스타키오스와 같은 올리고당을 완전히 가수분해할 것이다. 추가로, α-갈락토시다제 암호화 유전자는 형질전환을 위한 선택가능한 마커로 사용될 수 있다. 외인성 α-갈락토시다제 유전자를 함유하는 클론은 멜리비오스 상에서 성장하는 능력을 가질 것이다. 프로토테카 균주 내 사용을 위한 적합한 α-갈락토시다제의 예는 사카로마이세스 카를베겐시스(Saccharomyces carlbergensis)로부터 유래된 MEL1 유전자, 아스퍼질러스 니거(Aspergilus niger)로부터 유래된 AglC 유전자를 포함한다. 흥미롭게도, α-갈락토시다제 유전자는 해당 유전자가 프로토테카 균주 내 선호되는 코돈 사용빈도에 따라서 최적화될 때조차, 프로토테카 종에서 반드시 기능적인 것은 아니다. 이하의 예는 사카로마이세스 카를베겐시스의 코돈 최적화된 MEL1 유전자와 아스퍼질러스 니거로부터의 AglC 유전자에 의해 형질전환될 때 멜리비오스 상에서 성장하는 유전자이식 프로토테카 세포의 능력을 증명하지만, 더 고차의 식물, 시아몹시스 테트라고노볼라(Cyamopsis tetragonobola)(구아콩)로부터 유래된 α-갈락토시다제 암호화 유전자는 그렇지 않다.
3. 티아민 영양요구성 상보성
프로토테카 모리포미스를 포함하는 프로토테카 균주는 티아민 영양요구성인 것으로 공지되어 있는데(예를 들어 문헌[Ciferri, O. (1956) Nature, v.178, pp. 1475-1476] 참조), 이는 이들 균주가 성장을 위한 영양 배지에서 티아민을 필요로 한다는 것을 의미한다. 티아민 영양요구성은 티아민 생합성 경로에서 돌연변이 또는 효소 발현의 결여의 결과일 수 있다. 티아민 생합성 경로에서 없어진 효소(들)를 발현하는 상보적 유전자이식 균주는 그 다음에 첨가되는 티아민 없이 성장될 수 있으며, 따라서 영양 배지 비용을 감소시킬 뿐만 아니라 동물 영양 관점으로부터 더 바람직한 결과의 미세조류 바이오매스를 제공한다.티아민 생합성 경로 효소와 상보성은 또한 유전자이식 유전자가 티아민을 함유하지 않는 플레이트/배지 상에서 성장하는 능력을 부여함에 따라 선택가능한 마커로 사용될 수 있다.
실시형태에서, 본 발명의 재조합 프로토테카 세포는 티아민 생합성 경로 효소를 암호화하는 하나 이상의 외인성 유전자를 추가로 함유한다. 다른 실시형태에서, 본 발명의 재조합 프로토테카 세포는 조류, 식물 또는 시아노박테리아 공급원으로부터의 하이드록시메틸피리미딘 포스페이트 신타제를 암호화하는 외인성 유전자(예를 들어 서열번호 192)를 포함한다. 또 다른 실시형태에서, 하이드록시메틸피리미딘 포스페이트 신타제는 THIC 유전자에 의해 암호화된다. 또 다른 실시형태에서, THIC 유전자는 콕코믹사(Coccomyxa) C-169 THIC, 아라비돕시스 탈리아나(Arabidopsis thaliana) THIC, 시네코시스티스 속(Synechocystis sp .) PCC 6803 THIC, 또는 살모넬라 엔테리카 아종 엔테리카 혈청형 티피무리움 THIC(Salmonella enterica subsp . enterica serovar Typhimurium str . THIC)(서열번호 193)이다. 이하의 예는 회복된 티아민 영양원에 의한 프로토테카 모리포미스 UTEX 1435의 유전자 조작을 상술한다.
4. 다른 선택가능한 마커
임의의 매우 다양한 선택가능한 마커는 클로렐라와 같은 미생물 유기체를 형질전환하는데 유용한 이식유전자 구성체 내에서 사용될 수 있다. 적합한 선택가능한 마커의 예는 나이트레이트 환원효소 유전자, 하이그로마이신 포스포트랜스퍼라제 유전자(HPT), 네오마이신 포스포트랜스퍼라제 유전자, 및 플레오마이신에 내성을 부여하는 ble 유전자를 포함한다. 항생제에 대한 미세조류의 민감성을 결정하는 방법은 잘 공지되어 있다. 예를 들어 문헌[Mol Gen Genet. 1996 Oct 16;252(5):572-9]을 참조한다.
더 구체적으로, 문헌[Dawson et al. (1997), Current Microbiology 35:356-362(그것의 전문이 본 명세서에 참조로 포함됨)]은 NR-결여 클로렐라 소로키니아나 돌연변이체에 대한 선택가능한 마커로서 클로렐라 불가리스로부터의 나이트레이트 환원효소(NR)의 사용을 기재한다. 문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73(그것의 전문이 본 명세서에 참조로 포함됨)]은 클로렐라 엘립소이데아를 형질전환하기 위한 선택가능한 마커로서 HPT 유전자의 사용을 개시한다. 문헌[Huang et al. (2007), Appl. Microbiol. Biotechnol. 72:197-205(그것의 전문이 본 명세서에 참조로 포함됨)]은 클로렐라 속 DT에 대한 선택가능한 마커로서 Sh ble의 사용에 보고되었다.
V. 지질 경로 유전자조작
수크로스-함유 공급원료와 같은 공급원료를 사용하는 프로토테카와 같은 미생물 유기체(예를 들어, 미세조류, 유지성 효모, 진균 또는 박테리아)의 능력을 변형시키는 것에 추가로, 본 발명은 또한 생산된 지질의 성질 및/또는 비율이 변화하도록 변형된 재조합 미생물 유기체(예를 들어, 프로토테카)를 제공한다. 상기 경로는 추가로 또는 대안적으로 지방산 경로에서 지질 및 중간체의 효소적 가공을 통해 생성된 다양한 지질 분자의 성질 및/또는 비율이 변화되도록 변형될 수 있다. 다양한 양태에서, 본 발명의 재조합 미생물 유기체(예를 들어, 프로토테카 세포)는 이들의 비형질전환된 대응 세포에 비해 단위 부피당 및/또는 단위 시간당 최적화된 지질 수율, 탄소 쇄 길이(예를 들어, 재생가능한 디젤 생산 또는 지질 공급원료를 요구하는 산업적 화학 제품), 감소된 수의 이중 결합 또는 삼중 결합, 임의로 0개를 갖고 지질 또는 독특한 지질 집단의 수소:탄소 비율을 증가시킨다. 추가로, 바람직한 탄화수소를 생성하는 미생물 유기체는 더 높은 양으로, 또는 더 큰 특이성을 가지는 이러한 성분을 생성하도록 유전자조작될 수 있다.
미세조류의 경우에, 일부 야생형 세포는 이미 양호한 성장 특징을 가지지만, 원하는 유형 또는 양의 지질을 생성하지 않는다. 예는, 제한 없이, 피로보트라이스, 포르미디움, 아그메넬룸, 카테리아, 레포신클리스, 피로보트라이스, 니츠키아, 레포신클리스, 아나배나, 유글레나, 스피로지라, 클로로코쿰, 테트래드론, 오실라토리아, 파구스 및 클로로고늄을 포함하며, 이들은 도시하수 또는 폐수에서 성장하는 바람직한 성장 특징을 가진다. 이들 세포뿐만 아니라 클로렐라, 프로토테카 및 다른 미생물 종은 개선된 지질 생성 특징을 가지도록 유전자조작될 수 있다. 원하는 특징은 단위 부피 당 및/또는 단위 시간 당 지질 수율, 탄소 쇄 길이(예를 들어 바이오디젤 생성을 위해 또는 탄화수소 공급원료를 필요로 하는 산업적 용도를 위해)를 최적화하는 것, 이중 또는 삼중 결합 수를 선택적으로 0으로 감소하는 것, 고리 및 고리형 구조를 제거하거나 없애는 것, 및 특정 지질 종의 또는 별개의 지질 집단의 수소:탄소 비를 증가시키는 것을 포함한다. 추가로, 적합한 탄화수소를 생성하는 미세조류는 또한 심지어 더 바람직한 탄화수소 결과를 가지도록 유전자조작될 수 있다. 이러한 미세조류의 예는 클로렐라속 및 프로토테카 속의 종을 포함한다.
특정 실시형태에서, 지방산 합성에 대한 대사에서 분지 지점을 제어하는 하나 이상의 중요한 효소는 지질 생성을 개선하도록 상향조절 또는 하향조절되었다. 상향 조절은, 예를 들어 관심의 효소를 암호화하는 유전자가 발현되는 발현 구성체를 가지는 세포를 형질전환하는 것에 의해, 예를 들어 전사를 증가시키는 강한 프로모터 및/또는 인핸서 구성요소를 사용하여 달성될 수 있다. 이러한 구성체는 형질전환체가 선택될 수 있도록 하기 위한 선택가능한 마커를 포함하는데, 이는 구성체의 증폭 및 암호화된 효소 발현 수준의 증가를 초래할 수 있다. 본 발명의 방법에 따르는 상향 조절에 적합한 효소의 예는 파이루베이트를 아세틸-CoA로 전환하는 역할을 하는 파이루베이트 탈수소효소를 포함한다(예를 들어, 미세조류의 일부는 Genbank 등록번호 NP_415392; AAA53047; Q1XDM1; 및 CAF05587을 포함한다). 파이루베이트 탈수소효소의 상향조절은 아세틸-CoA의 생산을 증가시키고, 이에 의해 지방산 합성을 증가시킬 수 있다. 아세틸-CoA 카복실라제는 지방산 합성 내 초기 단계를 촉매한다. 따라서, 이 효소는 지방산의 생성을 증가시키도록 상향조절될 수 있다(예를 들어 미세조류의 일부는 Genbank 등록번호 BAA94752; AAA75528; AAA81471; YP_537052; YP_536879; NP_045833; 및 BAA57908을 포함한다). 지방산 생성은 또한 지방산 합성 동안 성장하는 아실 쇄를 운반하는 아실 운반체 단백질(acyl carrier protein, ACP)의 상향 조절에 의해 증가될 수 있다(예를 들어, 미세조류의 일부는 Genbank 등록번호 A0T0F8; P51280; NP_849041; YP_874433를 포함한다). 글라이세롤-3-포스페이트 아실트랜스퍼라제는 지방산 합성의 속도-제한 단계를 촉매한다. 이 효소의 상향 조절은 지방상 생성을 증가시킬 수 있다(예를 들어 일부 미세조류는 Genbank 등록번호 AAA74319; AAA33122; AAA37647; P44857; 및 ABO94442를 포함한다).
유전자의 상향- 및/또는 하향-조절은 지방산 생합성 경로의 유전자 발현을 제어하는 전체적 조절자에 적용될 수 있다. 따라서, 지방산 합성의 하나 이상의 전체 조절자는 적절하게 상향- 또는 하향-조절되어 다수의 지방산 합성 유전자 발현을 각각 억제하거나 향상시키고, 궁극적으로 지질 생성을 증가시킬 수 있다. 예는 스테롤 조절 요소 결합 단백질(sterol regulatory element binding protein, SREBP), 예컨대 SREBP-1a 및 SREBP-1c(예를 들어 Genbank 등록번호 NP_035610 및 Q9WTN3 참조)을 포함한다.
본 발명은 또한, 예를 들어, 지방 아실-ACP 티오에스터라제(예를 들어, 카파리스 칼로필라(C. callophylla)(서열번호 145 및 서열번호 146; 또한 표 4를 참조), 지방 아실-CoA/알데하이드 환원효소(표 6 참조), 지방 아실-CoA 환원효소(표 7 참조), 지방 알데하이드 데카보닐라제(표 8 참조), 지방 알데하이드 환원효소, 불포화효소(예컨대 스테아릴-ACP 불포화효소(예를 들어, 코돈 최적화된 리시누스 코뮤니스(R. communis) SAD, 서열번호 147 및 서열번호 148) 및 지방 아실 불포화효소 및 스쿠알렌 신타제(GenBank 등록번호 AF205791)와 같은 지질 변형 효소를 암호화하는 하나 이상의 외인성 유전자를 함유하도록 변형된 재조합 미생물 유기체(예를 들어, 프로토테카 세포)를 제공한다. 일부 실시형태에서, 지방 아실-ACP 티오에스터라제 및 자연적으로 공동발현된 아실 운반체 단백질을 암호화하는 유전자는 프로토테카 세포로, 선택적으로 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께 형질전환된다. 다른 실시형태에서, ACP 및 지방 아실-ACP 티오에스터라제는 서로에 대한 친화성을 가질 수 있는데, 이는 이들이 특정 조직 또는 유기체 중에서 자연적으로 동시 발현되든 발현되지 않든 2개가 함께 본 발명의 미생물 및 방법에 사용될 때 이점을 부여한다. 따라서, 본 발명은 ACP로부터 길이 특이적 탄소 쇄의 절단을 촉진시키기 위해 서로 간에 상호작용하는 친화성을 공유하는 것뿐만 아니라 이들 효소의 동시 발현된 쌍 둘 다를 고려한다.
또 다른 실시형태에서, 불포화효소를 암호화하는 외인성 유전자는 지질 포화와 관련하여 변형을 제공하기 위해 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께 미생물 유기체(예를 들어, 프로토테카 세포)로 형질전환된다. 다른 실시형태에서, 내인성 불포화효소는 미생물 유기체(예를 들어 프로토테카 세포)에서 과발현된다(예를 들어 해당 유전자의 추가적인 복제물이 없는 도입을 통해) 과발현된다. 스테아로일-ACP 불포화효소(예를 들어, 문헌[GenBank 등록번호 제AAF15308호; 제ABM45911호; 및 제AAY86086호])는, 예를 들어 스테아로일-ACP의 올레오일-ACP로의 전환을 촉매한다. 상기 유전자의 상향 조절은 세포에 의해 생산된 단일불포화 지방산의 비율을 증가시킬 수 있는 반면; 하향 조절은 단일불포화 비율을 감소시킬 수 있다. 예시적 목적을 위해, 스테아릴-ACP 불포화효소(SAD)는 C18:0 전구체로부터 C18:1 지방산의 합성을 초래한다. 불포화효소의 다른 패밀리는 델타 12 지방산 불포화효소(Δ12 FAD)를 포함하는 지방 아실 불포화효소(FAD)이다. 이들 불포화효소는 또한 지질 포화에 대해 변형을 제공한다. 예시적 목적을 위해, 델타 12 지방산 불포화효소는 C18:1 전구체로부터 C18:2 지방산의 합성을 초래한다. 유사하게, ω-6 지방산 불포화효소, ω-3 지방산 불포화효소, 또는 ω-6-올레이트 불포화효소와 같은 하나 이상의 글라이세로지질 불포화효소의 발현은 포화 지방산에 대한 불포화 지방산의 비율을 변화시키기 위해 제어될 수 있다. 일부 실시형태에서, 불포화효소는 불포화효소가 특정 탄소-길이 기질 또는 특정 범위 내 탄소-길이를 갖는 기질 내에서 위치 특이적 변형을 만들 수 있도록 목적하는 탄소 쇄 길이와 관련하여 선택될 수 있다. 다른 실시형태에서, 원하는 지방산 프로파일이 단일불포화물(예컨대 C16:1 및/또는 C18:1)에서 증가된다면, SAD의 과발현 또는 이종성 SAD의 발현은 지방 아실 불포화효소(FAD)의 침묵 또는 불활성화(예를 들어, 돌연변이, RNAi, 내인성 불포화효소 유전자의 녹아웃 등을 통해)와 결합될 수 있다.
다른 실시형태에서, 미생물 유기체(예를 들어 프로토테카 세포)는 돌연변이된 불포화효소 유전자를 가지도록 변형되되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다. 일부 경우에, 해당 돌연변이 내인성 불포화효소 유전자는 지방산 불포화효소(FAD)이다. 다른 경우에, 돌연변이된 내인성 불포화효소 유전자는 스테라일 아실 운반체 단백질 불포화효소(SAD)이다. 이하의 실시예 11은 스테아릴-ACP 불포화효소 및 델타 12 지방산 불포화효소의 표적화된 절제 또는 녹아웃을 기재한다.
일부 경우에, 원하는 지질 프로파일을 생성하는 유전자이식 세포를 달성하기 위한 하나 이상의 유전자 조작 기법과 쌍을 이루기에 유리할 수 있다. 한 실시형태에서, 미생물 유기체(예를 들어, 프로토테카 세포)는 돌연변이된 내인성 불포화효소 유전자 및 하나 이상의 외인성 유전자를 포함한다. 비제한적 예에서, 돌연변이된 내인성 불포화효소 유전자를 갖는 프로토테카 세포는 또한 외인성 지방 아실-ACP 티오에스터라제 유전자 및/또는 수크로스 인버타제 유전자를 발현할 수 있다. 이하의 실시예 11은 내인성 SAD의 표적화된 절제 또는 녹아웃을 함유하며 유전자이식 프로토테카 세포를 기재하는데, 이는 티오에스터라제 및 수크로스 인버타제를 선호하는 녹나무 C14를 발현한다. 이 경우에, 유전자이식 프로토테카 세포는 탤로에서 발견되는 지질 프로파일에 거의 근접하는 지질 프로파일을 생성한다. 탤로는 제공된 소고기 또는 양고기 지방으로부터 전형적으로 유래되며, 실온에서 고체이고, 음식, 화장품, 및 화학물질 산업에서 다양한 용도로 이용된다. 탤로의 지방산 프로파일은 4% C14:0; 26% C16:0; 3% C16:1; 14% C18:0; 41% C18:1; 3% C18:2; 및 1% C18:3이다. 이하의 실시예 11에서 나타내는 바와 같이, 내인성 SAD의 표적화된 절제 또는 녹아웃을 갖는 유전자이식 프로토테카 세포의 클론 및 녹나무 C14-선호 티오에스터라제의 발현은 다음의 지질 프로파일을 가진다: 1% C12 미만 및 더 짧은 탄소 쇄 길이 지방산; 2.74% 내지 6.13% C14:0; 23.07% 내지 25.69% C16:0; 7.02% 내지 11.08% C18:0; 42.03% 내지 51.21% C18:1; 및 9.37% 내지 13.45% C18:2(면적%로 표현). 일부 경우에, 유전자이식 프로토테카 세포는 다음의 지질 프로파일을 가진다: 3-5% C14:0; 25-27% C16:0; 10-15% C18:0; 및 40-45% C18:1.
따라서, 특정 실시형태에서, 본 발명의 미생물은 아실-ACP 티오에스터라제, 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 알데하이드 데카보닐라제, 또는 자연적으로 공동 발현된 아실 운반체 단백질로부터 선택된 하나 이상의 외인성 유전자를 발현하도록 유전자 조작된다. 적합한 발현 방법은 특히 유도성 발현 및 구분된 발현을 포함하는 리파제 유전자의 발현에 대해 상기 기재되었다. 지방 아실-ACP 티오에스터라제는 지질 합성 동안 아실 운반체 단백질(ACP)로부터 지방산을 절단한다. 추가적 효소 처리를 통해, 그 다음에 절단된 지방산은 조효소와 조합되어 아실-CoA 분자를 수득한다. 이런 알데하이드를 수득하기 위한 아실-CoA는 지방 아실-CoA 환원효소의 효소 활성을 위한 기질뿐만 아니라 알코올을 수득하기 위한 지방 아실-CoA/알데하이드 환원효소이다. 상기 확인한 지방 아실-CoA 환원효소의 작용에 의해 생성된 알데하이드는 알코올을 수득하기 위한 지방 알데하이드 환원효소, 또는 알칸 또는 알켄을 수득하기 위한 지방 알데하이드 데카보닐라제 중 하나에 의한 추가 효소 활성을 위한 기질이다.
일부 실시형태에서, 본 명세서에 기재된 방법에 의해 만들어지는 지방산, 글라이세로지질, 또는 대응하는 1차 알코올, 알데하이드, 알칸 또는 알켄은 8, 10, 12, 또는 14개의 탄소 원자를 함유한다. 디젤, 바이오디젤, 재생 디젤, 또는 제트 연료의 생산을 위한 바람직한 지방산, 또는 산업적 용도를 위한 대응하는 1차 알코올, 알데하이드, 알칸 및 알켄은 8 내지 14개의 탄소 원자를 함유한다. 특정 실시형태에서, 상기 지방산뿐만 아니라 다른 대응하는 탄화수소 분자는 포화되고(탄소-탄소 이중 또는 삼중 결합이 없다); 단일불포화되며(하나의 이중 결합); 다중불포화되고(2 이상의 이중 결합); 선형(고리형이 아님) 또는 분지형이다. 연료 생산을 위해, 더 큰 포화도가 바람직하다.
상기 직접 기재된 효소는 특정 수의 탄소 원자를 함유하는 기질의 가수분해에 대해 우선적인 특이성을 갖는다. 예를 들어, 지방 아실-ACP 티오에스터라제는 ACP로부터 12개의 탄소 원자를 갖는 지방산을 절단하는 것을 선호할 수 있다. 일부 경우에, ACP 및 쇄 특이적 티오에스터라제는 이들이 조합체로서 특히 유용하게 하는 서로에 대해 친화성을 가질 수 있다(예를 들어, 외인성 ACP 및 티오에스터라제 유전자는 이들이 유래하는 특정 조직 또는 유기체에서 자연적으로 동시 발현될 수 있다). 따라서, 다양한 양태에서, 본 발명의 재조합 프로토테카 세포는 기질내 함유된 탄소 원자수와 관련하여 효소적 활성을 촉매하기 위한 특이성(예를 들어, ACP로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알코올로 환원, 또는 알데하이드의 알칸으로 전환)을 갖는 단백질을 암호화하는 외인성 유전자를 함유할 수 있다. 다양한 양태에서 효소적 특이성은 8 내지 34개의 탄소 원자, 바람직하게는 8 내지 18개의 탄소 원자 및 더 바람직하게는 8 내지 14개의 탄소 원자를 갖는 기질에 대한 것일 수 있다. 바람직한 특이성은 즉 18개 탄소 원자보다 적은, 즉, 12개를 갖는 기질에 대한 것이다.
본 발명의 미생물 및 방법과 함께 사용하기에 적합한 다른 지방 아실-ACP 티오에스터라제는 표 4에 열거된 것을 제한 없이 포함한다
지방 아실-ACP 티오에스터라제 및 GenBank 등록번호
캘리포니아 월계수 지방 아실-ACP 티오에스터라제(GenBank #AAC49001)(서열번호 203)
녹나무 지방 아실-ACP 티오에스터라제(GenBank #Q39473)
캘리포니아 월계수 지방 아실-ACP 티오에스터라제(GenBank #Q41635)
육두구나무(Myristica fragrans) 지방 아실-ACP 티오에스터라제(GenBank #AAB71729)(서열번호 224)
육두구나무 지방 아실-ACP 티오에스터라제(GenBank #AAB71730)(서열번호 222)
인도네시아 기름야자 지방 아실-ACP 티오에스터라제(GenBank #ABD83939)(서열번호 204)
인도네시아 기름야자 지방 아실-ACP 티오에스터라제(GenBank #AAD42220)
팝퓰러스 토멘토사(Populus tomentosa) 지방 아실-ACP 티오에스터라제(GenBank #ABC47311)(서열번호 207)
아라비돕시스 탈리아나 지방 아실-ACP 티오에스터라제(GenBank #NP_172327)(서열번호 208)
아라비돕시스 탈리아나 지방 아실-ACP 티오에스터라제(GenBank #CAA85387)(서열번호 209)
아라비돕시스 탈리아나 지방 아실-ACP 티오에스터라제(GenBank #CAA85388)(서열번호 210)
멕시코목화(Gossypium hirsutum) 지방 아실-ACP 티오에스터라제(GenBank #Q9SQI3)(서열번호 211)
쿠페아 란세올라타(Cuphea lanceolata) 지방 아실-ACP 티오에스터라제(GenBank #CAA54060)(서열번호 212)
쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #AAC72882)(서열번호 202)
쿠페아 칼로필라 아종 메조스테몬(Cuphea calophylla subsp. mesostemon) 지방 아실-ACP 티오에스터라제(GenBank #ABB71581)(서열번호 213)
쿠페아 란세올라타 지방 아실-ACP 티오에스터라제(GenBank #CAC19933)
인도네시아 기름야자 지방 아실-ACP 티오에스터라제(GenBank #AAL15645)(서열번호 206)
쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #Q39513)
멕시코 목화 지방 아실-ACP 티오에스터라제(GenBank #AAD01982)(서열번호 214)
비티스 비니훼라(Vitis vinifera) 지방 아실-ACP 티오에스터라제(GenBank #CAN81819)(서열번호 215)
가르시니아 망고스타나 지방 아실-ACP 티오에스터라제(GenBank #AAB51525)
브라씨카 준세아(Brassica juncea) 지방 아실-ACP 티오에스터라제(GenBank #ABI18986)(서열번호 216)
마드후카 롱기폴리아(Madhuca longifolia) 지방 아실-ACP 티오에스터라제(GenBank #AAX51637)(서열번호 217)
브라씨카 나푸스(Brassica napus) 지방 아실-ACP 티오에스터라제(GenBank #ABH11710)
오리자 사티바(Oryza sativa)(인디카(indica) 품종 그룹) 지방 아실-ACP 티오에스터라제(GenBank #EAY86877)(서열번호 218)
오리자 사티바(자포니카(japonica) 품종 그룹) 지방 아실-ACP 티오에스터라제(GenBank #NP_001068400)(서열번호 219)
오리자 사티바(인디카 품종 그룹) 지방 아실-ACP 티오에스터라제(GenBank #EAY99617)(서열번호 220)
쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #AAC49269)
미국 느릅나무 지방 아실-ACP 티오에스터라제(GenBank #AAB71731)
쿠페아 란세올라타 지방 아실-ACP 티오에스터라제(GenBank #CAB60830)(서열번호 221)
쿠페아 팔루스트리스 지방 아실-ACP 티오에스터라제(GenBank #AAC49180)
아이리스 게르마니카 지방 아실-ACP 티오에스터라제(GenBank #AAG43858)
아이리스 게르마니카 지방 아실-ACP 티오에스터라제(GenBank #AAG43858.1)
쿠페아 팔루스트리스 지방 아실-ACP 티오에스터라제(GenBank #AAC49179)
육두구나무 지방 아실-ACP 티오에스터라제(GenBank# AAB71729)
육두구나무 지방 아실-ACP 티오에스터라제(GenBank# AAB717291.1)
쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #U39834)(서열번호 197)
캘리포니아 월계수 지방 아실-ACP 티오에스터라제(GenBank # M94159)(서열번호 285)
녹나무 지방 아실-ACP 티오에스터라제(GenBank #U31813)(서열번호 223)
쿠페아 라이티 지방 아실-ACOP 티오에스터라제(GenBank #U56103)(서열번호 183)
피마자(Ricinus communis) 지방 아실-ACP 티오에스터라제(GenBank #ABS30422)(서열번호 198)
하기 실시예는 프로토테카 종 중에서 쿠페아 후커리아나, 캘리포니아 월계수, 녹나무, 쿠페아 팔루스트리스, 쿠페아 란세올라타, 아이리스 게르마니카, 미리스티카 프라그란스 및 미국 느릅나무 유래의 이종성 지방 아실-ACP 티오에스터라제의 성공적인 표적화 및 발현을 기재한다. 추가로, 지방산 프로파일 중의 변형은 숙주 세포 발현에서 이들 이종성 지방 아실-ACP 티오에스터라제 내에서 확인되었다. 이들 결과는 일반적으로 조류와 고등 식물 티오에스터라제 간에 서열 상동성의 부재 및 프로토테카 모리포르미스 지방 아실-ACP 티오에스터라제와 상기 열거된 이종성 지방-아실-ACP 티오에스터라제 간의 서열 상동성의 부재를 고려할 때 전혀 예상치 못한 것이었다.
예에서 나타내는 바와 같이 프로토테카 중에서 이들 이종성 티오에스터라제의 발현은 상업적 종자 작물로부터 현재 입수가능하지 않은 정말 독특한 지방산 프로파일을 갖는 오일/지질, 몇몇 종자 작물 오일의 배합도 생성할 수 있는 이식유전자 미세조류를 만들어낸다. 표 5는 보통의 상업적 종자 오일의 지방산 프로파일을 나타낸다. 이하의 모든 상업적 종자 오일 데이터는 문헌[US Pharmacopeias Food and Chemicals Codes, 7th Ed. 2010-2011]으로부터 편집된다. 탤로 데이터는 문헌[National 부터 얻는다.
Figure 112018108415035-pat00009
예로서, 이들 보통의 종자 오일 중 어떤 것 고량의 C8 또는 C10 지방산을 함유하지 않으며, 코코넛 오일 및 팜커넬 오일은 가장 큰 공급원이 되지만 둘의 비는 1:1(C8:C10 지방산)이다. 예에서 나타내는 바와 같이, 쿠페아 팔루스트리스 C8 선호 티오에스터라제로 형질전환된 프로토테카는 12% 이상의 C8 지방산 수준을 달성할 수 있을 뿐만 아니라 C8:C10 지방산의 비는 약 5:1이 되었다. 지방산 수준의 변화는 다양한 상업적 용도를 위한 맞춤 지방산 프로파일을 함유하는 오일을 생성하는데 유용하다. 추가적으로, 상이한 지방산 쇄 길이 사이 비의 변화는 더 저렴한 화학 공정(예컨대 에스터화, 증류, 부분 분리, 및 재에스터화)을 통하지 않은 오일 중에서 상업적으로 입수가능하지 않은 어떤 것에 있다. 다른 예에서, 팜 오일은 가장 높은 C16:0 지방산(32-47%) 함유 오일이지만, 팜 오일은 C14:0 지방산이 거의 없다. 미국 느릅나무 티오에스터라제를 함유하는 프로토테카는 약 33-38% C16:0 지방산 및 10-16% C14:0 지방산(약 2:1 C16:0 대 C14:0 비)을 달성하였다. 16:0 지방산이 높은 종자 오일은 보통 많은 14:0 지방산을 함유하지 않기 때문에 상업적 수준에서 존재하는 오일의 배합을 통해서 이런 지방산 프로파일은 달성가능하지 않다.
이하의 예는 또한 처음으로 하나의 클론에서 적어도 2개의 지방 아실-ACP 티오에스터라제의 성공적인 표적화 및 발현을 기재한다. 지방산 프로파일의 변형은 이들 클론에서 확인되었고, 2개의 티오에스터라제가 하나의 클론 내에서 공동 발현된 것에 의존하여, 지방산 프로파일은 상이한 방법으로 영향을 미쳤다. 예로서, 상기 표 5로부터, 코코넛 오일 및 팜커넬 오일은 거의 3:1의 C12:C14 비를 가진다. 이하의 예에서 기재하는 바와 같이, 2개의 이종성 티오에스터라제 유전자를 함유하는 프로토테카 형질전환체는 거의 5:1의 C12:C14 지방산 수준을 생성할 수 있었다. C12:C14 지방산 비의 이런 종류는, 지금까지 상업적 수준에서 달성가능하지 않았다(즉, 종자 오일의 배합을 통함).
유전자이식 미세조류에 의해 생성된 오일의 다른 신규한 양태는 지방산의 포화정도이다. 팜 오일은 52% 내지 48의 포화 내지 불포화를 갖는 현재 포화 오일의 가장 큰 공급원이다. 이하의 예에서 나타내는 바와 같이, 미국 느릅나무 및 녹나무로부터 유래된 이종성 티오에스터라제를 갖는 프로토테카는 그것이 생성된 오일 중에서 60% 이상의 전체 포화 수준을 달성하였다. 또한 이하의 예에서, 미국 느릅나무로부터 유래된 이종성 티오에스터라제를 갖는 프로토테카는 그것이 생성된 오일 중에서 86% 이상의 전체 포화 수준을 달성하였다는 것을 나타내었다.
본 발명의 미생물 및 방법에 의한 사용에 적합한 지방 아실-CoA/알데하이드 환원효소는, 제한 없이, 표 6에서 열거된 것을 포함한다.
Figure 112018108415035-pat00010
본 발명의 미생물 및 방법과 함께 사용에 적합한 지방 아실-CoA 환원효소는 표 7에서 열거된 것을 포함한다.
Figure 112018108415035-pat00011
본 발명의 미생물 및 방법과 함께 사용에 적합한 지방 알데하이드 데카보닐라제는, 제한 없이, 표 8에서 열거되는 것을 포함한다.
Figure 112018108415035-pat00012
자연적으로 공동발현된 지방 아실-ACP 티오에스터라제 및 아실-ACP 티오에스터라제 및 아실 운반체 단백질의 조합은 본 발명의 미생물 및 방법과 함께 사용에 적합하다.
탄화수소 또는 지질 변형 효소의 추가의 예는 미국 특허 제6,610,527호; 제6,451,576호; 제6,429,014호; 제6,342,380호; 제6,265,639호; 제6,194,185호; 제6,114,160호; 제6,083,731호; 제6,043,072호; 제5,994,114호; 제5,891,697호; 제5,871,988호; 제6,265,639호 중 어느 하나에 포함되거나 참조되거나, 함유되거나 참조된 핵산 서열에 의해 암호화된 아미노산 서열을 포함하고 추가로 GenBank 등록 번호 AAO18435; ZP_00513891; Q38710; AAK60613; AAK60610; AAK60611; NP_113747; CAB75874; AAK60612; AAF20201; BAA11024; AF205791; 및 CAA03710에 기재되어 있다.
지질 생합성 경로 내 다른 효소는 또한 본 발명의 미생물 및 방법과 함께 사용에 적합하다. 예를 들어, 케토 아실-ACP 신타제(keto acyl-ACP synthase, Kas) 효소는 지질 생합성 경로 내에서 상기 열거된 효소의 일부와 함께 작동한다. 상이한 부류의 Kas 효소가 있으며: Kas I은 계속 늘어나는 아실 ACP 쇄 및 말로닐-ACP 사이의 계속적인 축합 단계에 참여한다. Kas II는 전형적으로 말로닐-ACP를 포함하는 C16:0-ACP 내지 C18:0-ACP를 유발하는 최종 축합 단계에 참여한다. 이와 같이, 고차의 식물 및 일부 미세조류 종/균주에서 이는 C16-C18:0 지방산(및 그것의 불포화 유도체)을 우선적으로 합성하며, Kas II 효소는 FatA 유전자의 생성물(아실-ACP 티오에스터라제)과 상호작용한다.
아실-ACP 티오에스터라제는 더 고차 식물(및 일부 미세조류 종) 지방산 생합성의 종결자이며, 대부분의 식물 종에서, 이는 FatA 유전자 패밀리의 구성원에 의해 수행되고, 전체 역할은 C16:0 대 C18:0 단계에서 연장을 종결하는 것이다. 더 짧은 지방산을 합성하는 종에서(예컨대 쿠페아, 엘래이스, 미리스티카, 또는 엄벨루라리아), FatB 유전자에 의해 암호화되는 아실-ACP 티오에스터라제의 상이한 군은 이 종결 단계를 수행한다(예를 들어 코코스 누시페라 FatB3-B의 코돈 최적화된 암호 영역, 서열번호 189). Kas II 효소와 아실-Acp 티오에스터라제 사이의 상호작용은 지방산 쇄 연장의 정확한 종결을 위해 중요하다. 결과로서, 더 짧은 쇄 지질 생합성이 가능한 FatB 유전자가 발달된 고차 식물 종(및 미세조류 종)에서 Kas IV 유전자로 칭해지는 Kas 유전자의 추가적인 부류의 대응하는 공진화(co-evolution)가 있었다. Kas IV 유전자는 길이로 4-14개 탄소인 특정 크기 범위의 지방산의 쇄 길이 연장을 초래한다.
본 발명의 미생물 및 방법과 사용하기에 적합한 다른 효소는 표 4, 6 내지 8에 열거된 단백질 중 하나와 적어도 70%의 아미노산 동일성을 갖고 대응하는 목적하는 효소 활성(예를 들어, 아실 운반 단백질로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알코올로의 환원 또는 알데하이드의 알칸으로의 전환)을 나타내는 것들을 포함한다. 추가의 양태에서, 효소적 활성은 상기된 서열 중 하나와 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 99%의 동일성을 갖는 서열 중에 존재하고 이 모두는 완전하게 제시된 것처럼 본 명세서에 참조로서 인용된다.
발현되는 외인성 유전자의 목적하는 조합을 선택함에 의해, 수성 바이오매스로부터 추출될 수 있는 미생물에 의해 생산되는 생성물을 절단 개조할 수 있다. 예를 들어, 상기 미생물은 다음을 함유할 수 있다: (i) 지방 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자; 및, 임의로, (ii) 천연적으로 동시 발현된 아실 운반 단백질 또는 지방 아실-ACP 티오에스터라제(또는 역으로)에 대해 친화성을 또한 갖는 아실 운반 단백질; 및, 임의로, (iii) 지방 아실-CoA/알데하이드 환원효소 또는 지방 아실-CoA 환원효소를 암호화하는 외인성 유전자; 및, 임의로, (iv) 지방 알데하이드 환원효소 또는 지방 알데하이드 데카보닐라제를 암호화하는 외인성 유전자. 본 명세서에 기재된 배양 조건하의 미생물은 ACP에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스터라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 효소적 가공을 통해 지방 아실-CoA 분자를 생산한다. 존재하는 경우, 지방 아실-CoA/알데하이드 환원효소는 아실-CoA의 알코올로의 환원을 촉매한다. 유사하게, 존재하는 경우 지방 아실-CoA 환원효소는 아실-CoA의 알데하이드로의 환원을 촉매한다. 지방 아실-CoA 환원효소를 암호화하는 외인성 유전자가 존재하고 알데하이드 생성물을 생산하기 위해 발현되는 상기 양태에서, 제3 외인성 유전자에 의해 암호화된 지방 알데하이드 환원효소는 알데하이드의 알코올로의 환원을 촉매한다. 유사하게, 지방 알데하이드 데카보닐라제는 존재하는 경우 알데하이드의 알칸 또는 알켄으로의 전환을 촉매한다.
다른 실시형태에서, 미생물은 (i) 지방 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자; (ii) 선택적으로, 자연적으로 공동 발현된 아실 운반체 단백질 또는 지방산 아실-ACP 티오에스터라제에 대한 친화도를 가지는 아실 운반체 단백질; (iii) 돌연변이된 내인성 불포화효소 유전자(돌연변이는 불포화효소 녹아웃과 같은 불포화효소 유전자 또는 불포화효소 단백질 불활성을 제공한다); (iv) 내인성 스테아릴 아실 운반체 단백질 불포화효소의 과발현 또는 이종성 SAD의 발현; 및 (v) 앞서 언급한 것의 임의의 조합을 함유할 수 있다.
아실 ACP 티오에스터라제와 같은 이러한 효소를 암호화하는 유전자는 클로렐라 프로토테코이데스와 같이 상당한 지질생산을 나타내는 것으로 이미 공지된 세포로부터 수득될 수 있다. 지질 생산에 역할을 하는 것으로 이미 공지된유전자, 예를 들어, 이중 결합을 포화시키는 효소를 암호화하는 유전자를 개별적으로 수용 세포에 형질전환시킬 수 있다. 그러나, 본 발명을 실시하기 위해 어느 유전자가 요구되는지에 관해 우선적으로 추측할 필요는 없다. 미세조류 내 지질 생산을 변형(개선)시킬 수 있는 유전자를 동정하는 방법은 국제특허출원 공개 번호 제2008/151149호에 기재되어 있다.
따라서, 본 발명은 동일 종의 야생형 세포에 비해 변화된 수준에서 지질 경로 효소를 발현하도록 유전자 조작된 미생물 유기체(예를 들어, 프로토테카 세포)를 제공한다. 일부 경우에, 상기 세포는 세포가 둘 다 동일한 조건하에서 성장하는 경우 야생형 세포에 비해 더 많은 세포를 생산한다. 일부 경우에, 상기 세포는 야생형 세포보다 높은 수준에서 지질 경로 효소를 발현하도록 유전자 조작되고/되거나 선택되었다. 일부 경우에, 지질 경로 효소는 파이루베이트 탈수소효소, 아세틸-CoA 카복실라제, 아실 운반 단백질 및 글라이세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 그룹으로부터 선택된다. 일부 경우에, 상기 세포는 야생형 세포 보다 낮은 수준에서 지질 경로 효소를 발현하도록 유전자 조작되고/되거나 선택된다. 세포가 보다 낮은 수준에서 지질 경로 효소를 발현하는 하나 이상의 실시형태에서, 지질 경로 효소는 시트레이트 신타제를 포함한다.
일부 실시형태에서, 상기 세포는 야생형 세포와 비교하여 변화된 수준에서 지방산 합성의 범용 조절제를 발현하도록 유전자 조작되고/되거나 선택됨으로써 다수의 지방산 합성 유전자의 발현 수준은 야생형 세포와 비교하여 변화된다. 일부 경우에, 지질 경로 효소는 지방산을 변형시키는 효소를 포함한다. 일부 경우에, 지질 경로 효소는 스테아로일-ACP 불포화효소 및 글라이세로지질 불포화효소로부터 선택된다. 일부 경우에, 해당 세포는 유전자 조작되고/되거나 선택되어 더 낮은 지질 경로 효소 수준을 발현하거나, 특정 지질 경로를 전혀 발현하지 않는다(즉, 여기서 지질 경로 효소는 녹아웃이었거나, 외인성 유전자로 대체되었다).
일부 미세조류는 예를 들어 다당류와 같은 비지질 대사산물의 상당한 양을 생성한다. 다당류 생합성이 세포에 대해 이용가능한 전체 대사 에너지의 상당 부분을 사용할 수 있기 때문에, 지질-생성 세포의 돌연변이유발 다음에 감소된 또는 제거된 다당류 생성을 위한 스크리닝은 더 높은 지질 수율을 생성할 수 있는 신규한 균주를 만들어낸다.
다른 실시형태에서, 본 발명은 하나 이상의 외인성 유전자를 함유하는 오일 생산 미생물에 관한 것이고 여기서, 외인성 유전자는 지방 아실-ACP 티오에스터라제, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 아실-CoA/알데하이드 환원효소, 지방 알데하이드 데카보닐라제, 불포화효소 및 아실 운반 단백질로 이루어진 그룹으로부터 선택된 단백질(들)을 암호화한다. 다른 실시형태에서, 외인성 불포화효소 유전자는 상기 외인성 유전자 중 하나 이상을 함유하는 미생물 내에서 과발현된다. 한 실시형태에서, 외인성 유전자는 자극에 응하여 유도성이거나 억제성인 프로모터에 작동가능하게 연결되어 있다. 일부 경우에, 상기 자극은 외부적으로 제공되는 소분자, 가열, 냉각 및 배양 배지에서 제한되거나 부재인 질소로 이루어진 군로부터 선택된다. 일부 경우에, 외인성 유전자는 세포 구획에서 발현된다. 일부 경우에, 세포 구획은 엽록체, 플라스티드 및 미토콘드리아로 이루어진 그룹으로부터 선택된다. 일부 경우에 미생물은 프로토테카 모리포미스, 프로토테카 크루가니, 프로토테카 스타그노라 또는 프로토테카 좁피이다.
한 실시형태에서, 외인성 유전자는 지방산 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 외인성 유전자에 의해 암호화된 티오에스터라제는 아실 운반 단백질(ACP)로부터 8 내지 18개의 탄소 지방산의 절단을 촉매한다. 일부 경우에, 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 10 내지 14개 탄소 지방산의 절단을 촉매한다. 하나의 양태에서, 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 12-탄소 지방산의 절단을 촉매한다.
한 실시형태에서, 외인성 유전자는 지방 아실-CoA/알데하이드 환원효소를 암호화한다. 일부 경우에, 외인성 유전자에 의해 암호화되는 환원효소는 8 내지 18-탄소 지방 아실-CoA를 대응하는 1차 알코올로 환원을 촉매한다. 일부 경우에, 외인성 유전자에 의해 암호화되는 환원효소는 10 내지 14-탄소 지방 아실-CoA를 대응하는 1차 알코올로 환원을 촉매한다. 한 실시형태에서, 외인성 유전자에 의해 암호화되는 환원효소는 12-탄소 지방 아실-CoA를 도데칸올로 환원을 촉매한다.
본 발명은 또한 2개의 외인성 유전자를 함유하는 재조합 프로토테카 세포를 제공하고 여기서, 제1 외인성 유전자는 지방 아실-ACP 티오에스터라제를 암호화하고 제2 외인성 유전자는 지방 아실-CoA 환원효소, 지방 아실-CoA/알데하이드 환원효소, 및 아실 운반 단백질로 이루어진 그룹으로부터 선택되는 단백질을 암호화한다. 일부 경우에, 2개의 외인성 유전자는 각각 자극에 응하여 유도성인 프로모터와 작동가능하게 연결되어 있다. 일부 경우에, 각각의 프로모터는 배양 배지 내 제한된 질소 또는 질소 부재와 같은 동일한 자극에 응답하여 유도성이다. 배양 배지에서 질소의 제한 또는 완전한 부재는 프로토테카 종과 같은 몇몇 미생물에서 오일 생산을 자극하고 높은 수준으로 오일 생산을 유도하기 위한 유발제로서 사용될 수 있다. 본 명세서에 기재된 유전자 조작 방법과 조합하여 사용되는 경우, 건조 세포 중량%로서 지질은 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70% 및 적어도 75%와 같은 높은 수준으로 상승될 수 있고; 본 명세서에 기재된 방법은 상기 수준의 지질을 갖는 세포에 대해 제공하고, 여기서 지질은 적어도 1%-5%, 바람직하게는 적어도 4%의 C8-C14, 적어도 0.25%-1%, 바람직하게는 적어도 0.3%의 C8, 적어도 1%-5%, 바람직하게는 적어도 2%의 C10, 적어도 1%-5%, 바람직하게는 적어도 2%의 C12, 및 적어도 1%-5%, 바람직하게는 적어도 2%의 C14이다. 일부 실시형태에서, 상기 세포는 건조 세포 중량으로 25% 초과의 지질이고 10% 이상, 15% 이상, 20% 또는 25% 이상의 지질이며, 적어도 5%, 적어도 10% 또는 적어도 15%인 C8-C14, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25% 또는 적어도 30%인 C8-C14, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 40%인 C8-C14, 5%-40%, 바람직하게는 10-30%, C8-C14 및 10%-40%, 바람직하게는 20-30%인 C8-C14인 지질을 함유한다.
본 명세서에 기재된 신규 오일은 중간쇄 지방산(예를 들어, 팜 오일, 팜커넬 오일 및 코코넛 오일)의 함량이 높은 다른 자연적으로 존재하는 오일과는 구분된다. 예를 들어, 카로테노이드와 같은 오염물 수준은 본 발명의 오일에서보다 팜 오일 및 팜커넬 오일에서보다 높다. 특히 팜 오일 및 팜커넬 오일은 본 발명의 오일에서보다 더 높은 양으로 알파 및 베타 카로틴 및 라이코펜을 함유한다. 추가로, 20개 초과의 상이한 카로테노이드가 팜 오일 및 팜커넬 오일에서 발견된 반면 실시예는 본 발명의 오일이 매우 소수의 카로테노이드 종을 매우 낮은 수준으로 함유한다는 것을 입증한다. 추가로, 토코트라이에놀과 같은 비타민 E 화합물의 수준은 본 발명의 오일에서 보다 팜 오일, 팜커넬 및 코코넛 오일에서 훨씬 높다.
하나의 양태에서, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 8 내지 18-탄소 지방산의 절단을 촉매한다. 일부 경우에, 제2 외인성 유전자는 8 내지 18-탄소 지방 아실-CoA의 대응하는 1차 알코올로의 환원을 촉매하는 지방 아실-CoA/알데하이드 환원효소를 암호화한다. 몇몇 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 10 내지 14-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 환원효소는 10 내지 14-탄소 지방 아실-CoA의 대응하는 1차 알코올로의 환원을 촉매하고 여기서, 티오에스터라제 및 환원효소는 동일한 탄소 쇄 길이상에 작용한다. 하나의 양태에서, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 12-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 환원효소는 12-탄소 지방 아실-CoA의 도데칸올로의 환원을 촉매한다. 일부 경우에, 제2 외인성 유전자는 8 내지 18-탄소 지방 아실-CoA의 대응하는 알데하이드로의 환원을 촉매하는 지방 아실-CoA 환원효소를 암호화한다. 일부 경우에, 제2 외인성 유전자는 천연적으로 지방 아실-ACP 티오에스터라제와 함께 동시 발현되는 아실 운반 단백질을 암호화한다.
일부 실시형태에서, 제2 외인성 유전자는 지방 아실-CoA 환원효소를 암호화하고 상기 미생물은 추가로 지방 알데하이드 데카보닐라제를 암호화하는 제3 외인성 유전자를 함유한다. 일부 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 8 내지 18-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 환원효소는 8 내지 18-탄소 지방 아실-CoA의 대응하는 지방 알데하이드로의 환원을 촉매하고 제3 외인성 유전자에 의해 암호화된 데카보닐라제는 8 내지 18-탄소 지방 아실-CoA의 대응하는 지방 알데하이드의 대응하는 알칸으로의 전환을 촉매하고, 여기서, 티오에스터라제, 환원효소 및 데카보닐라제는 동일한 탄소 쇄 길이에 대해서 작용한다.
일부 실시형태에서, 제2 외인성 유전자는 아실 운반 단백질을 암호화하고 상기 미생물은 지방 아실-CoA 환원효소 및 지방 아실-CoA/알데하이드 환원효소로 이루어진 그룹으로부터 선택된 단백질을 암호화하는 제3 외인성 유전자를 함유한다. 몇몇 경우에 제3 외인성 유전자는 지방 아실-CoA 환원효소를 암호화하고 상기 미생물은 지방 알데하이드 데카보닐라제를 암호화하는 제4 외인성 유전자를 추가로 함유한다.
본 발명은 또한 배양 배지에서 재조합 미생물 유기체(예를 들어, 프로토테카 세포)의 집단을 배양 단계를 포함하는 알코올의 생성 방법을 제공하고, 여기서, 상기 세포는 (i) 지방 아실-ACP 티오에스터라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA/알데하이드 환원효소를 암호화하는 제2 외인성 유전자를 함유하고 상기 세포는 아실 운반 단백질(ACP)에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스터라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 가공을 통해 지방 아실-CoA를 생성하고 지방 아실-CoA/알데하이드 환원효소는 아실-CoA의 알코올로의 환원을 촉매한다.
본 발명은 또한 프로토테카 세포에서 지질 분자를 생산하는 방법을 제공한다. 하나의 양태에서, 상기 방법은 배양 배지에서 미생물 유기체(예를 들어, 프로토테카 세포) 집단을 배양하는 단계를 포함하고, 상기 세포는 (i) 지방 아실-ACP 티오에스터라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA 환원효소를 암호화하는 제2 외인성 유전자를 함유하고 상기 미생물은 아실 운반 단백질(ACP)에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스터라제는 ACP로부터 지방산의 절단을 촉매하여 추가 처리를 통해 지방 아실-CoA를 생성하고 지방 아실-CoA 환원효소는 아실-CoA의 알데하이드로의 환원을 촉매한다.
본 발명은 또한 프로토테카 세포에서 특정된 탄소 쇄 길이를 갖는 지방산 분자를 생성 방법을 제공한다. 하나의 양태에서, 상기 방법은 배양 배지에서 지질 생성 미생물 유기체(예를 들어, 프로토테카 세포) 집단을 배양하는 단계를 포함하고 여기서 상기 미생물은 8, 10, 12 또는 14개 탄소 원자와 같은 특정 탄소 쇄 길이에 특이적이거나 우선적인 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자를 함유하고, 상기 미생물은 아실 운반 단백질(ACP)에 연결된 지방 산을 합성하고 상기 티오에스터라제는 지방산이 특정 탄소 쇄 길이로 합성되는 경우 ACP로부터 지방산의 절단을 촉매한다.
상기된 다양한 양태에서, 상기 미생물 유기체(예를 들어, 프로토테카 세포)는 지질 경로 효소를 암호화하는 하나 이상의 외인성 유전자를 함유할 수 있다. 몇몇 경우에, 지질 경로 효소는 스테아로일-ACP 불포화효소, 글라이세로지질 불포화효소, 파이루베이트 탈수소효소, 아세틸-CoA 카복실라제, 아실 운반 단백질 및 글라이세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 그룹으로부터 선택된다. 다른 경우에, 프로토테카 세포는 지방 아실-ACP 티오에스터라제, 지방 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 알데하이드 데카보닐라제 및/또는 아실 운반 단백질로 이루어진 그룹으로부터 선택되는 지질 변형 효소를 함유한다.
다양한 지질 경로 효소 및 지질 변형 효소를 발현하는데 사용되는 다수의 예시적 형질전환 카세트 또는 구성체는 실시예에서 제공된다. 다른 유용한 구성체는, 제한 없이, 이하의 표 37에 열거한다.
예시적 형질전환 구성체, 코돈 최적화된 암호화 영역, 및 효소
형질전환 구성체/암호화 영역/효소 서열번호
쿠페아 후커리아나 C10:0 특이적 티오에스터라제 구성체 243
쿠페아 후커리아나 C10:0 특이적 티오에스터라제에 대한 암호화 영역(코돈 최적화됨) 244
쿠페아 후커리아나 KAS IV효소 구성체 245
쿠페아 후커리아나 KAS IV 효소에 대한 암호화 영역(코돈 최적화됨) 246
쿠페아 후커리아나 KAS IV 효소 247
쿠페아 후커리아나 C10:0 특이적 티오에스터라제 + 쿠페아 후커리아나 KAS IV 효소 구성체 248
UTEX 1435 D12 지방산 불포화효소와 함께 쿠페아 란세올라타 C10:0 특이적 티오에스터라제에 대한 암호화 영역 249
캘리포니아 월계수 C12:0 특이적 티오에스터라제 구성체 250
캘리포니아 월계수 C12:0 특이적 티오에스터라제에 대한 암호화 영역(코돈 최적화됨) 251
가르시니아 망고스타나 C16:0 티오에스터라제 구성체 252
가르시니아 망고스타나 C16:0 티오에스터라제에 대한 암호화 영역(코돈 최적화됨) 253
브라씨카 나푸스 C18:0 티오에스터라제 구성체 254
브라씨카 나푸스 C18:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) 255
올리아 유로페아 스테아로일-ACP 불포화효소 구성체 256
올리아 유로페아 스테아로일-ACP 불포화효소에 대한 암호화 영역(코돈-최적화됨) 257
쿠페아 후커리아나 C16:0 티오에스터라제 구성체 258
쿠페아 후커리아나 C16:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) 259
인도네시아 기름야자 C16:0 티오에스터라제 구성체 260
인도네시아 기름야자 C16:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) 261
Δ12 지방산 불포화효소 좌위 구성체에서 카르타무스 틴토리우스 ACP-티오에스터라제 262
카르타무스 틴토리우스 ACP-티오에스터라제에 대한 암호화 영역 (코돈-최적화됨) 263
육두구나무 C14:0-C18:0 넓은 특이성의 티오에스터라제 구성체 264
육두구나무 C14:0-C18:0 넓은 특이성 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) 265
육두구나무 C:14:0 특이적 티오에스터라제에 대한 암호화 영역 266
D12 FAD 수송 펩타이드와 함께 육두구나무 C14:0 특이적 티오에스터라제 267
피마자 ACP-티오에스터라제 구성체 268
피마자 ACP-티오에스터라제에 대한 암호화 영역(코돈-최적화됨) 269
녹나무 C14:0 티오에스터라제 구성체 270
녹나무 C14:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) 271
녹나무 C14:0 특이적 티오에스터라제 구성체 272
녹나무 C14:0 특이적 티오에스터라제 구성체 273
SAD 좌위에서 미국 느릅나무 C10:0-C16:0 특이적 티오에스터라제 274
미국 느릅나무 C10:0-C16:0 특이적 티오에스터라제에 대한 암호화 영역(코돈-최적화) 275
쿠페아 라이티 KASA1 + 쿠페아 라이티 FatB2 티오에스터라제 + suc2 구성체 276
쿠페아 라이티 KASA1에 대한 암호화 영역(코돈-최적화) 277
쿠페아 라이티 FatB2 티오에스터라제에 대한 암호화 영역(코돈-최적화) 278
VI. 연료 및 화학물질 생성
본 발명의 방법에 따른 연료의 생산을 위해, 본 발명의 세포에 의해 생산된 지질을 수거하거나 다르게는 임의의 편리한 수단에 의해 채취한다. 지질은 전체 세포 추출에 의해 분리될 수 있다. 상기 세포를 우선 파쇄시키고 이어서 세포 내 및 세포막/세포벽 연합 지질 및 세포외 탄화수소를, 예를 들어 상기된 바와 같은 원심분리를 사용하여 세포 덩어리로부터 분리할 수 있다. 미생물 내에서 생성된 세포 내 지질은 몇몇 양태에서 미생물의 세포를 용해시킨 후 추출된다. 일단 추출된 후 지질을 추가로 정련하여 오일, 연료 또는 유성화학물질을 생성한다.
배양을 완료 한 후, 미생물을 발효 브로스로부터 분리할 수 있다. 선택적으로, 상기 분리는 원심분리로 수행하여 농축된 페이스트를 생성한다. 원심분리는 미생물로부터 상당한 양의 세포 내 물을 제거하지 못하고 건조 단계가 아니다. 이어서 상기 바이오매스는 임의로 세척액(예를 들어, 탈이온수)으로 세척하여 발효 브로스 및 잔해를 제거할 수 있다. 임의로 세척된 미생물 바이오매스는 또한 세포 분쇄 전에 건조(오븐 건조, 동결 건조 등)시킬 수 있다. 또한, 세포는 발효가 완료된 경우 발효 브로스의 일부 또는 전부로부터 분리 없이 용해시킬 수 있다. 예를 들어, 상기 세포는 세포가 용해된 경우 세포 외 액체에 대한 세포의 비율이 1:1(v:v) 미만일 수 있다.
액체를 함유하는 미생물은 용해시켜 용해물을 생성시킬 수 있다. 본 명세서에 상세하게 기재된 바와 같이 미생물 용해시키는 단계(또한 세포 용해로서 언급됨)는 열-유도된 용해, 염기의 첨가, 산의 첨가, 프로테아제와 같은 효소 및 아밀라제와 같은 다당류 분해 효소의 사용, 초음파, 기계적 용해의 사용, 삼투압 쇼크의 사용, 용해성 바이러스에 의한 감염 및/또는 하나 이상의 용해성 유전자의 발현을 포함하는 임의의 간편한 수단에 의해 달성될 수 있다. 용해를 수행하여 미생물에 의해 생성된 세포 내 분자를 방출시킨다. 미생물을 용해시키기 위한 이들 방법 각각은 단일 방법으로 또는 동시에 또는 연속적으로 조합하여 사용할 수 있다. 세포 파괴 정도는 현미경 분석에 의해 관찰할 수 있다. 본 명세서에 기재된 방법 중 하나 이상을 사용하여, 전형적으로 70% 초과의 세포 파괴가 관찰된다. 바람직하게, 세포 파괴는 80% 초과, 더 바람직하게는 90% 초과 및 가장 바람직하게는 약 100%이다.
특정 실시형태에서, 미생물은 예를 들어, 추출 또는 추가의 가공을 위해 세포 지질 및/또는 탄화수소의 노출을 증가시키기 위해 성장 후 용해시킨다. 리파제 발현 및 세포 용해 시간(예를 들어, 유도성 프로모터를 통한)은 지질 및/또는 탄화수소의 수율을 최적화하기 위해 조정될 수 있다. 다수의 용해 기술은 이하에 기재한다. 이들 기술은 개별적으로 또는 조합하여 사용할 수 있다.
본 발명의 한 실시형태에서, 미생물을 용해시키는 단계는 미생물을 함유하는 세포 현탁액의 가열을 포함한다. 이러한 양태에서, 미생물을 함유하는 발효 브로스(또는 발효 브로스로부터 분리된 미생물 현탁액)는 미생물, 즉 미생물의 세포벽 및 막이 분해하거나 파괴될 때까지 가열한다. 전형적으로, 적용되는 온도는 적어도 50℃이다. 더 효율적인 세포 용해를 위해, 더 고온, 예를 들어, 적어도 30℃, 적어도 60℃, 적어도 70℃, 적어도 80℃, 적어도 90℃, 적어도 100℃, 적어도 110℃, 적어도 120℃, 적어도 130℃ 또는 그 이상을 사용한다. 가열 처리에 의한 세포 용해는 미생물을 비등시킴에 의해 수행할 수 있다. 또는, 열 처리(비등 없이)는 오토클레이브에서 수행할 수 있다. 열 처리된 용해물은 추가의 처리를 위해 냉각시킬 수 있다. 세포 파쇄는 또한 증기 처리, 즉 가압된 증기의 부가를 통해 수행할 수 있다. 세포 파쇄를 위한 미세조류의 증기 처리는, 예를 들어, 미국 특허 제6,750,048호에 기재되어 있다. 몇몇 양태에서, 증기 처리는 발효기로 증기를 살포하고 브로스를 약 90분 미만, 바람직하게는 약 60분 미만 및 더 바람직하게는 약 30분 미만 동안 원하는 온도에 유지하는 것에 의해 달성될 수 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 염기를, 미생물을 함유하는 세포 현탁액에 첨가함을 포함한다. 상기 염기는 사용되는 미생물의 단백질성 화합물의 적어도 일부를 가수분해하기에 충분히 강해야만 한다. 단백질을 가용화시키기 위해 유용한 염기는 화학 기술 분야에 공지되어 있다. 본 발명의 방법에 유용한 예시적인 염기는 리튬, 나트륨, 칼륨, 칼슘의 수산화물, 카보네이트 및 바이카보네이트 및 이들의 혼합물을 포함하지만, 이에 제한되지 않는다. 바람직한 염기는 KOH이다. 세포 파쇄를 위한 미세조류의 염기 처리는 예를 들어, 미국 특허 제6,750,048호에 기재되어 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 산을, 미생물을 함유하는 세포 현탁액에 첨가함을 포함한다. 산 용해는 10-500 mN 또는 바람직하게 40-160 nM의 농도로 산을 사용하여 수행할 수 있다. 산 용해는 바람직하게 실온 이상(예를 들어, 40 내지 160℃, 및 바람직하게 50 내지 130℃)에서 수행한다. 적당한 온도(예를 들어, 실온 내지 100℃ 및 특히 실온 내지 65℃)에 대해서, 산 처리는 통상적으로 초음파 처리 또는 다른 세포 파괴 방법과 조합할 수 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 효소를 사용함에 의해 미생물을 용해시키는 것을 포함한다. 미생물을 용해시키기 위해 바람직한 효소는 프로테아제 및 다당류-분해 효소, 예를 들어, 헤미셀룰라제(예를 들어, 아스퍼질러스 니거; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #H2125), 펙티나제(예를 들어, 리조푸스 종 유래의 펙티나제; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #P2401), 만나웨이(Mannaway) 4.0ℓ(노보자임(Novozymes)), 셀룰라제(예를 들어, 트라이코더마 비리드 유래의 셀룰라제; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #C9422), 및 드리셀라제(예를 들어, 바시디오마이세테스 종 유래의 드리셀라제; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #D9515)이다.
본 발명의 또 다른 실시형태에서, 용해는 예를 들어, 임의로 클로렐라 또는 클로렐라 바이러스 유래의 다당류 분해 효소와 같은 셀룰라제 또는 스트렙토마이세스 그리세우스(Streptomyces griseus) 프로테아제, 키모트립신, 프로테이나제 K, 문헌[Degradation of Polylactide by Commercial Proteases, Oda Yet al., Journal of Polymers 및 the Environment, Volume 8, Number 1, January 2000 , pp. 29-32(4)]에 열거된된 프로테아제, 알칼라제 2.4 FG(노보자임), 및 플라보우르짐 100ℓ(노보자임)과 같은 프로테아제와 같은 효소를 사용하여 달성한다. 프로테아제 및 다당류-분해 효소의 임의의 조합은 또한 이전의 프로테아제 및 다당류 분해 효소의 임의의 조합을 포함하여 사용할 수 있다.
또 다른 양태에서, 용해는 익스펠러 프레스를 사용하여 수행할 수 있다. 상기 공정에서, 바이오매스는 고압에서 스크류형 장치를 통해 강제 주입하고 세포를 용해시키고 세포 내 지질이 방출되고 세포 내 단백질 및 섬유(및 기타 성분)로부터 분리되도록 한다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 초음파, 즉, 초음파 처리를 사용하여 수행한다. 따라서, 세포는 또한 고주파 음파로 용해시킬 수 있다. 상기 음파는 전기적으로 생성될 수 있고 금속 팁을 통해 적당히 농축된 세포 현탁액으로 운반된다. 상기 음파 처리(또는 초음파 처리)는 세포 현탁액 내 공극의 형성을 기준으로 세포 통합성을 붕괴시킨다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 기계적 용해에 의해 수행한다. 세포는 기계적으로 용해시키고 균질화하여 탄화수소(예를 들어, 지질) 수집을 용이하게할 수 있다. 예를 들어, 압력 분쇄기를 사용하여 세포 함유 슬러리를 제한된 오리피스 밸브를 통과하도록 펌핑시킬 수 있다. 고압(1500 바 이하)을 적용함에 이어서 출구 노출을 통해 즉시 확장시킨다. 세포 분쇄는 3개의 상기한 메커니즘에 의해 달성한다: 밸브 상에 충돌, 오리피스내 액체 고전단, 및 방출시 급작스런 압력 강하로 세포 분해의 유도. 상기 방법은 세포 내 분자를 방출시킨다. 또는, 볼 밀을 사용할 수 있다. 볼 밀에서, 세포는 비드와 같은 작은 연마 입자와 함께 현탁 상태로 진탕시킨다. 전단력 때문에 세포는 분해되고 비드 사이에서 분쇄되며 비드와 충돌한다. 상기 비드는 세포를 파쇄하여 세포 내용물을 방출시킨다. 세포는 예를 들어, 블렌딩의 사용과 함께(예를 들어, 고속 또는 와링 블렌더(Waring blender)), 프레치 프레스 또는 심지어 약한 세포 벽의 경우에 세포 파쇄를 위한 원심분리의 사용과 같은 전단력에 의해 파쇄될 수 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 삼투압 쇼크를 적용함으로써 수행한다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 용해성 바이러스로 미생물을 감염시키는 것을 포함한다.
광범위한 바이러스는 본 발명에 사용하기 위해 적합한 미생물을 용해시키는 것으로 공지되어 있고 특정 미생물에 대한 특정 용해성 바이러스의 선택 및 용도는 당업계의 기술 범위 내에 있다. 예를 들어, 파라메시움 부르사리아 클로렐라 바이러스(Paramecium bursaria chlorella virus, PBCV-1)는 특정 단일 세포 진핵 클로렐라형 녹색 조류 내에서 복제하고 이를 용해시키는 대형의 20면체 플라크 형성 이중가닥의 DNA 바이러스의 원형이다(필코드나비리대(Phycodnaviridae) 계열, 클로로바이러스(Chlorovirus) 속). 따라서, 임의의 민감성 미세조류는 적합한 클로렐라 바이러스로 배양물을 감염시킴에 의해 용해시킬 수 있다. 클로렐라 바이러스로 클로렐라 종을 감염시키는 방법은 공지되어 있다. 예를 들어, 문헌[Adv. Virus Res. 2006;66:293-336; Virology, 1999 Apr 25;257(1): 15-23; Virology, 2004 Jan 5;318(1):214-23; Nucleic Acids Symp. Ser. 2000;(44): 161-2; J. Virol. 2006 Mar;80(5):2437-44; 및 Annu. Rev. Microbiol. 1999;53:447-94]을 참조한다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 자가용해를 포함한다. 상기 양태에서, 본 발명에 따른 미생물은 미생물을 용해시키는 용해성 단백질을 생성하도록 유전자 조작한다. 상기 용해성 유전자는 유도성 프로모터를 사용하여 발현시켜 세포가 처음에 발효기내에서 목적하는 밀도로 성장한 후 프로모터를 유도하여 용해성 유전자를 발현시키는 것에 의해 세포를 용해시킬 수 있다. 하나의 양태에서, 상기 용해성 유전자는 다당류-분해 효소를 암호화한다. 특정 다른 양태에서, 상기 용해성 유전자는 용해성 바이러스 유래의 유전자이다. 따라서, 예를 들어, 클로렐라 바이러스 유래의 용해성 유전자는 조류 세포에서 발현시킬 수 있고 문헌[Virology 260, 308-315 (1999); FEMS Microbiology Letters 180 (1999) 45-53; Virology 263, 376-387(1999); 및 Virology 230, 361-368 (1997)]을 참조한다. 용해성 유전자의 발현은 바람직하게 유도성 프로모터, 예를 들어, 소분자, 광, 열과 같은 자극 및 다른 자극의 존재 하에 유도되는 미세조류에서 활성인 프로모터를 사용하여 수행한다.
상기 방법에 의해 생성된 세포 용해물로부터 지질을 분리하기 위한 다양한 방법이 이용가능하다. 예를 들어, 지방 알데하이드, 지방 알코올 및 탄화수소(예를 들어, 알칸)와 같은 지질 및 지질 유도체는 헥산과 같은 소수성 용매로 추출할 수 있다(문헌[Frenz et al. 1989, Enzyme Microb. Technol., 11:717] 참조). 지질 및 지질 유도체는 또한 액화(문헌[Sawayama et al. 1999, Biomass and Bioenergy 17:33-39 및 Inoue et al. 1993, Biomass Bioenergy 6(4):269-274] 참조); 오일 액화(예를 들어, 문헌[Minowa et al. 1995, Fuel 74(12): 1735-1738] 참조); 및 초임계 CO2 추출(예를 들어, 문헌[Mendes et al. 2003, Inorganica Chimica Acta 356:328-334] 참조)을 사용하여 추출할 수 있다. 미아오(Miao) 및 우(Wu)는 클로렐라 프로토테오코이데스의 배양으로부터 미세조류 지질 회수의 프로토콜을 기재하고 있고, 여기서 상기 세포는 원심분리에 의해 수거되고 증류수로 세척되며 동결 건조에 의해 건조시킨다. 수득한 세포 분말을 모르타르에서 분쇄하고 이어서 n-헥산으로 추출한다. 문헌[Miao and Wu, Biosource Technology (2006) 97:841-846].
따라서, 본 발명의 미생물에 의해 생성된 지질, 지질 유도체 및 탄화수소는 유기 용매로 추출하여 회수할 수 있다. 몇몇 경우에, 바람직한 유기 용매는 헥산이다. 전형적으로, 유기 용매는 용해 성분의 사전 분리 없이 용해물에 직접 첨가한다. 하나의 양태에서, 상기된 하나 이상의 방법에 의해 생성된 용해물은 지질 및/또는 탄화수소 성분이 유기 용매와 용액을 형성하도록 하기에 충분한 시간 동안 유기 용매와 접촉시킨다. 몇몇 경우에, 상기 용액을 이어서 추가로 정련하여 특정 목적하는 지질 또는 탄화수소 성분을 회수한다. 헥산 추출 방법은 당업계에 널리 공지되어 있다.
본 명세서에 기재된 세포에 의해 생성된 지질 및 지질 유도체, 예컨대 지방 알데하이드, 지방 알코올, 및 탄화수소 알칸은 상기된 바와 같은 리파제를 포함하는 하나 이상의 효소의 사용에 의해 변형될 수 있다. 탄화수소가 세포의 세포 외 환경에 존재하는 경우, 하나 이상의 효소는, 효소가 탄화수소를 변형시키거나 탄화수소 전구체로부터 이의 합성을 완성하도록 하는 조건하에서 상기 환경에 첨가할 수 있다. 또는, 상기 탄화수소는 효소와 같은 하나 이상의 촉매의 첨가 전에 세포 물질로부터 부분적으로 또는 완전하게 분리될 수 있다. 상기 촉매는 외인성으로 첨가되고 이들의 활성은 세포 외부에서 또는 시험관 내에서 발생한다.
따라서, 본 명세서에 기재된 바와 같이 생체내 세포에 의해 생성되거나 시험관내에서 효소적으로 변형된 지질 및 탄화수소는 임의로 통상적인 수단에 의해 추가로 가공될 수 있다. 상기 가공은 탄화수소의 크기를 감소시키고 이어서 이의 수소화 비율을 증가시키기 위한 "크랙킹(cracking)"을 포함할 수 있다. 촉매 및 열 크랙킹 방법은 통상적으로 탄화수소 및 트라이글라이세라이드 오일 가공에 사용한다. 촉매 방법은 고체 산 촉매와 같은 촉매의 사용을 포함한다. 상기 촉매는 실리카-알루미나 또는 제올라이트일 수 있고 이로써 탄소-탄소 결합을 이종용해 또는 비대칭 분해시켜 카보양이온(carbocation) 및 수소화물 음이온을 수득할 수 있다. 이들 반응성 중간체를 이어서 또 다른 탄화수소와 함께 재정렬하거나 수소화 전달을 진행시킨다. 상기 반응은 따라서 중간체를 재생성시켜 자가-증폭 쇄 메커니즘을 유도할 수 있다. 또한 탄화수소는 여기서 탄소-탄소 이중 또는 삼중 결합의 수가 선택적으로 0까지 감소하도록 처리될 수 있다. 또한 탄화수소를 가공하여 여기서 고리 또는 사이클릭 구조를 제거할 수 있다. 탄화수소를 또한 처리하여 수소화 비율을 증가시킬 수 있다. 이것은 수소의 첨가("수소화") 및/또는 탄화수소의 보다 작은 탄화수소로 "크랙킹"을 포함할 수 있다.
열 방법은 탄화수소 크기를 감소시키기 위한 상승된 온도 및 압력의 용도를 포함한다. 약 800℃의 승온 및 약 700kPa의 압력을 사용할 수 있다. 이들 조건은 때때로 수소 풍부 탄화수소 분자(양성자 플럭스와는 구분되는 바와 같이)를 언급하는데 사용되는 용어 '가벼운 탄화수소 분자'를 생성하고 또한 축합에 의해 상대적으로 수소가 고갈된 보다 무거운 탄화수소 분자를 생성한다. 상기 방법은 등방성 또는 대칭적 절단을 제공하고 상기된 바와 같이 임의로 효소적으로 포화될 수 있는 알켄을 생성한다.
촉매 및 열 방법은 탄화수소 가공 및 오일 정련을 위한 식물에서의 표준 방법이다. 따라서, 본 명세서에 기재된 바와 같은 세포에 의해 생성된 탄화수소가 수거될 수 있고 통상적인 수단에 의해 가공되거나 수집될 수 있다. 미세조류 생산 탄화수소의 수소 크랙킹에 대한 보고에 대해 문헌[Hillen et al. (Biotechnology and Bioengineering, Vol. XXIV: 193-205 (1982))]을 참조한다. 또 다른 양태에서, 상기 분획물은 또 다른 촉매, 예를 들어, 유기 화합물, 열 및/또는 무기 화합물로 처리한다. 지질의 바이오디젤로의 가공을 위해, 에스터결합전이 공정은 이 부분의 이하에 기재되는 바와 같이 사용된다.
본 발명의 방법을 통해 생성되는 탄화수소는 다양한 산업 응용 분야에서 유용하다. 예를 들어, 거의 모든 유형의 세제 및 세정제에서 사용되는 음이온 게면활성제인 직쇄 알킬벤젠 설포네이트(LAS)의 생산은 일반적으로 10 내지 14개의 탄소 공급원자 쇄를 포함하는 탄화수소를 사용한다. 예를 들어, 미국 특허 번호: 제6,946,430호; 제5,506,201호; 제6,692,730호; 제6,268,517호; 제6,020,509호; 제6,140,302호; 제5,080,848호; 및 제5,567,359호를 참조한다. LAS와 같은 계면활성제는 퍼스널 케어 조성물 및 세제, 예컨대, 미국 특허 제5,942,479호; 제6,086,903호; 제5,833,999호; 제6,468,955호; 및 제6,407,044호에 기재된 것의 제조에 사용할 수 있다.
관심이 고조되고 있는 것은 화석 연료로부터 유래된 출발 물질을 대체할 수 있는 재생가능한 생물학적 출발 물질이 가용하고 이의 사용이 바람직할 수 있기 때문에 바이오디젤, 재생가능한 디젤 및 제트 연료와 같은 연료에서의 생물학적 기원의 탄화수소 성분의 용도에 대한 것이다. 생물학적 물질로부터 탄화수소 성분을 생산하기 위한 방법이 시급히 요구되고 있다. 본 발명은 바이오디젤, 재생가능한 디젤 및 제트 연료를 제조하기 위해 본 명세서에 기재된 방법에 의해 생성된, 생물학적 재료로서의 지질을 사용하여, 바이오디젤, 재생가능한 디젤 및 제트 연료의 생산 방법을 제공하여 상기 필요성을 충족시킨다.
통상적인 디젤 연료는 파라핀 탄화수소가 풍부한 석유 증류물이다. 이들은 370° 내지 780℉ 정도로 넓은 비등 범위를 갖고 이는 디젤 엔진 승용차와 같은 압착 점화 엔진에서 연소용으로서 적합하다. 미국재료시험협회(The American Society of Testing and Materials, ASTM)은 세탄수, 혼탁점, 플래쉬 포인트, 점도, 아닐린 포인트, 황 함량, 물 함량, 재 함량, 구리 스트립 부식 및 탄소 잔기와 같은 허용 가능한 범위의 다른 연료 성질과 함께 비등 범위에 따라 디젤 등급을 확립한다. 기술적으로, 적당한 ASTM 세부항목을 충족하는 바이오매스 또는 기타로부터 유래된 임의의 탄화수소 증류 재료는 디젤 연료(ASTM D975), 제트 연료(ASTM D1655), 또는 이것이 지방산 메틸 에스터인 경우 바이오디젤(ASTM D6751)로 정의될 수 있다.
추출 후, 본 명세서에 기재된 미생물 바이오매스로부터 회수된 지질 및/또는 탄화수소 성분은 디젤 승용차 및 제트 엔진에 사용하기 위한 연료를 제조하기 위해 화학적 처리에 적용될 수 있다.
바이오디젤은 금색에서 암갈색으로 생산 공급원료에 따라 색상이 다양한 액체이다. 이것은 실제로 수불혼화성이고 고융점 및 저증기압을 갖는다. 바이오디젤은 디젤-엔진 승용차에 사용하기 위한 디젤-등가의 가공된 연료를 언급한다. 바이오디젤은 생분해성이고 비독성이다. 통상적인 디젤 연료에 비해 바이오디젤의 추가의 이득은 보다 낮은 엔진 마모이다. 전형적으로, 바이오디젤은 C14-C18 알킬 에스터를 포함한다. 다양한 가공은 본 명세서에 기재된 바와 같이 생성되고 분리된 바이오매스 또는 지질을 디젤 연료로 전환시킨다. 바이오디젤을 생산하기 위한 바람직한 방법은 본 명세서에 기재된 바와 같이 지질의 에스터결합전이에 의한 것이다. 바이오디젤로서 사용하기 위한 바람직한 알킬 에스터는 메틸 에스터 또는 에틸 에스터이다.
본 명세서에 기재된 방법에 의해 생성된 바이오디젤은 대부분의 모뎀 디젤-엔진 승용차에서 임의의 농도로 단독으로 사용하거나 통상적인 디젤 연료와 배합하여 사용될 수 있다. 통상적인 디젤 연료(석유 디젤)와 배합되는 경우, 바이오디젤은 약 0.1% 내지 약 99.9%로 존재할 수 있다. 많은 국가에서는 임의의 연료 혼합물에서 바이오디젤의 양을 지칭하기 위해 "B" 인자로서 공지된 시스템을 사용한다. 예를 들어, 20% 바이오디젤을 함유하는 연료는 B20으로 표시된다. 순수한 바이오디젤은 B100으로 언급된다.
바이오디젤은 또한 가정용 및 상업용 보일러에서 가열 연료로서 사용될 수 있다. 기존의 오일 보일러는 고무 구성품을 함유할 수 있고 바이오디젤상에서의 운행을 위해서는 전환을 필요로 할 수 있다. 전환 과정은 일반적으로 비교적 단순하고 바이오디젤이 강한 용매임으로 고무 구성품의 합성 구성품으로의 교환을 포함한다. 이의 강한 용해력 때문에, 바이오디젤의 연소는 보일러의 효율을 증가시킨다. 바이오디젤은 수순한 울트라-로우 황디젤(ULSD) 연료의 윤활성을 증가시키기 위해 디젤 제형 중에 첨가제로서 사용될 수 있고, 이는 이것이 실제로 황을 내포하지 않기 때문에 유리하다. 바이오디젤은 석유 디젤 보다 양호한 용매이고 이전에 석유 디젤 상에서 운행된 자동차 연료 라인 중에 잔류 침전물을 분해시키는데 사용될 수 있다.
바이오디젤은 오일 풍부 바이오매스중에 함유된 트라이글라이세라이드의 에스터결합전이에 의해 생성될 수 있다.
따라서, 본 발명의 또 다른 측면에서, 바이오디젤을 생산하기 위한 방법이 제공된다. 바람직한 양태에서, 바이오디젤을 생산하는 방법은 (a) 본 명세서에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성하는 단계, (c) 용해된 미생물로부터 지질을 분리하는 단계 및 (d) 지질 조성물을 에스터결합전이에 의해 바이오디젤을 생성하는 단계를 포함한다. 미생물의 성장 방법, 미생물을 용해시켜 용해물을 생성하는 방법, 유기 용매를 포함하는 배지에서 용해물을 처리하여 이종성 혼합물을 형성시키는 방법 및 처리된 용해물을 지질 조성물로 분리하는 방법은 상기 기재되었고 또한 바이오디젤을 생산하는 방법에 사용될 수 있다.
바이오디젤의 지질 프로파일은 일반적으로 공급원료 오일의 지질 프로파일과 고도로 유사하다. 본 발명의 방법 및 조성물에 의해 제공된 다른 오일은 에스터결합전이에 의해 바이오디젤을 생산할 수 있고 이때 지질 프로파일은 (a) 적어도 1%-5%, 바람직하게는 적어도 4%의 C8-C14; (b) 적어도 0.25%-1%, 바람직하게는 적어도 0.3%의 C8; (c) 적어도 1%-5%, 바람직하게는 적어도 2%의 C10; (d) 적어도 1%-5%, 바람직하게는 적어도 2%의 C12; 및 (3) 적어도 20%-40%, 바람직하게는 적어도 30%의 C8-C14를 포함한다.
지질 조성물은 에스터결합전이로 바이오디젤로서 유용한 장쇄의 지방산 에스터를 생산할 수 있다. 바람직한 에스터결합전이는 이하에 약술되고 염기 촉매된 에스터결합전이 및 재조합 리파제를 사용하는 에스터결합전이 반응을 포함한다. 염기 촉매된 에스터결합전이 공정에서, 트라이아실글라이세라이드는 알칼린 촉매인, 전형적으로 수산화칼륨의 존재 하에 메탄올 또는 에탄올과 같은 알코올과 반응시킨다. 상기 반응은 부산물로서 메틸 또는 에틸 에스터 및 글라이세린(글라이세롤)을 형성한다.
동물 및 식물 오일은 전형적으로 트라이하이드릭 알코올인 글라이세롤과 유리된 지방산의 에스터인 트라이글라이세라이드로 구성된다. 에스터결합전이에서, 트라이리세라이드(TAG) 중의 글라이세롤은 메탄올 또는 에탄올과 같은 단쇄 알코올로 대체한다. 전형적인 반응 계획은 다음과 같다:
Figure 112018108415035-pat00013
상기 반응에서, 상기 알코올은 염기로 탈양성자화되어 보다 강한 친핵성이 된다. 통상적으로, 에탄올 또는 메탄올은 매우 과량(50배 까지)으로 사용된다. 정상적으로 상기 반응은 상당히 느리게 진행하거나 전혀 진행하지 않는다. 산 또는 염기뿐만 아니라 열을 사용하여 반응의 보다 신속한 진행을 도와줄 수 있다. 산 또는 염기는 에스터결합전이 반응에 의해 소비되지 않고 따라서 이들은 반응물이 아니고 촉매이다. 거의 모든 바이오디젤은 이것이 단지 저온 및 저압을 요구하고 98% 이상의 전환 수율을 나타내므로(단, 출발 오일은 수분 및 유리된 지방산이 낮아야 한다) 염기 촉매 기술을 사용하여 생산될 수 있다.
에스터결합전이는 또한 염기 대신 리파제와 같은 효소를 사용하여 수행하였다. 리파제-촉매된 에스터결합전이는 예를 들어, 실온 내지 80℃의 온도 및 1:1 초과, 바람직하게는 약 3:1인 TAG 대 저급 알코올의 몰비에서 수행할 수 있다. 에스터결합전이에 사용하기에 적합한 리파제는 표 9에 기재된 것들을 포함하지만 이에 제한되지 않는다. 에스터결합전이를 위해 유용한 리파제의 다른 예는 예를 들어, 미국 특허 제4,798,793호; 제4,940,845호; 제5,156,963호; 제5,342,768호; 제5,776,741호 및 WO89/01032에서 찾을 수 있다. 상기 리파제는 리조푸스 (Rhizopus), 아스퍼질러스(Aspergillus), 칸디다(Candida), 뮤코(Mucor), 슈도모나스(Pseudomonas), 리조뮤코(Rhizomucor), 칸디다 및 휴미콜라(Humicola)에 의해 생성된 리파제 및 췌장 리파제를 포함하지만 이에 제한되지 않는다.
에스터결합전이에서 사용에 적합한 리파제
아스퍼질러스 니거 리파제 ABG73614, 칸디다 안탁티카(Candida antarctica) 리파제 B(노보자임-435) CAA83122, 칸디다 실린드라새(Candida cylindracea) 리파제 AAR24090, 칸디다 리폴리티카(Candida lipolytica) 리파제(리파제 L; Amano Pharmaceutical Co., Ltd.), 칸디다 루고사(Candida rugosa) 리파제(예를 들어, Meito Sangyo Co., Ltd.의 리파제), 뮤코 미에헤이(Mucor miehei) 리파제(리포자임 IM 20), 슈도모나스 플루오레센스(Pseudomonas fluorescens) 리파제 AAA25882, 리조푸스 자포니카스(Rhizopus japonicas) 리파제(릴리파스 A-10FG) Q7M4U7_1, 리조뮤코 미에헤이 (Rhizomucor miehei) 리파제 B34959, 리조푸스 오리재(Rhizopus oryzae) 리파제(리파제 F) AAF32408, 세라티아 마르세센스(Serratia marcescens) 리파제(SM 효소) ABI13521, 써모마이세스 라누기노사(Thermomyces lanuginosa) 리파제 CAB58509, 리파제 P(Nagase ChemteX Corporation), 및 리파제 QLM (일본 나고야에 소재한 Meito Sangyo Co., Ltd.)
바이오디젤 용으로 적합한 지방산 에스터의 제조를 위해 리파제를 사용하는 문제는 리파제 가격이 강염기 공정에 의해 사용되는 수산화나트륨(NaOH)의 가격보다 훨씬 고가라는 것이다. 상기 문제점은 재활용될 수 있는 고정화된 리파제를 사용함으로써 해결되었다. 그러나, 고정화된 리파제의 활성은 리파제-기본 공정이 생산 단가의 측면에서 강염기 공정과 경쟁을 위해서는 최소의 주기동안 재사용된 후 유지되어야만 한다. 고정화된 리파제는 에스터결합전이에 전형적으로 사용되는 저급 알코올에 의해 독성이 된다. 미국 특허 제6,398,707호(우 등에게 2002년 6월 4일자로 발행됨)는 고정화된 리파제의 활성을 증진시키는 방법 및 감소된 활성을 갖는 고정화된 리파제를 재생시키는 방법을 기재하고 있다. 몇몇 적합한 방법은 일정 기간의 시간, 바람직하게는 0.5 내지 48시간 및 보다 바람직하게는 0.5 내지 1.5시간 동안 3개 이상의 탄소 원자수를 갖는 알코올 중에 고정화된 리파제를 침지시키는 것을 포함한다. 몇몇 적합한 방법은 또한 3개 이상의 탄소 원자 수를 갖는 알코올과 불활성화된 고정화된 리파제를 세척함에 이어서 식물성 오일 중에 0.5 내지 48시간 동안 불활성화된 고정화된 리파제를 침지시키는 것을 포함한다.
특정 양태에서, 재조합 리파제는 리파제가 작용하는 지질을 생산하는 동일한 미생물 내에서 발현된다. 적합한 재조합 리파제는 표 9에 상기 열거되고/되거나 표 9에 상기 열거된 GenBank 등록번호를 갖는 것들, 또는 표 9에 상기 열거된 리파제중 하나와 적어도 70%의 아미노산 동일성을 갖고 리파제 활성을 나타내는 폴리펩타이드를 포함한다. 추가의 양태에서, 효소 활성은 상기된 서열중 하나와 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 99% 동일성을 갖는 서열 중에 존재하고 상기 서열 모두는 완전히 제시된 바와 같이 참조로서 인용된다. 리파제 및 선택가능한 마커를 암호화하는 DNA는 바람직하게 코돈 최적화된 cDNA이다. 미세조류 중에서 발현하기 위해 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다.
바이오디젤에 대한 통상의 국제 표준은 EN 14214이다. ASTM D6751은 미국 및 캐나다에서 참조되는 가장 공통된 바이오디젤 표준이다. 독일은 DIN EN 14214를 사용하고 UK는 BS EN 14214를 준수할 것으로 요구한다. 생성물이 이들 표준에 부합하는지의 여부를 결정하기 위한 기본 산업적 시험은 전형적으로 가스 크로마토그래피, HPLC 등을 포함한다. 품질 표준을 충족하는 바이오디젤은 매우 비독성이고 독성 등급(LD50)은 50 ㎖/㎏을 초과한다.
ASTM 표준을 충족하는 바이오디젤이 비독성이어야 하지만 결정화하고/하거나 침전하고 용액으로부터 침강하는 경향이 있는 오염물이 있을 수 있다. 침강물 형성은 특히 바이오디젤이 보다 저온에서 사용되는 경우 문제이다. 침강 또는 침전은 연료 흐름을 감소시키고, 연료 라인을 막히게 하고 여과기를 막히게 하는 것과 같은 문제를 유발할 수 있다. 고품질의 생성물을 제조하기 위해 바이오디젤에서 상기 오염물 및 침강물을 제거하는 것과 관련된 공정들은 당업계에 널리 공지되어 있다. 상기 공정들의 예는 인지질 및 유리 지방산과 같은 오염물을 제거하기 위한 오일의 전처리(예를 들어, 정련, 부식성 정련 및 실리카 흡착 여과) 및 냉각 여과를 포함하지만 이에 제한되지 않는다. 냉각 여과는 생성 후 바이오디젤에 존재하는 임의의 미립자 및 침강물을 제거하기 위해 특별히 개발된 공정이다. 상기 공정은 바이오디젤을 냉각시키고 연료가 보다 저온에서 사용되는 경우 형성될 수 있는 임의의 침강물 또는 침전물을 여과 제거한다. 상기 공정은 당업계에 널리 공지되어 있고 미국 특허원 공개번호 제2007-0175091호에 기재되어 있다. 적합한 방법은 바이오디젤을 약 38℃ 미만의 온도로 냉각시켜 불순물 및 오염물이 바이오디젤 액체 중에서 미립자로서 침전하는 단계를 포함할 수 있다. 이어서 규조토 또는 다른 여과 재료를 냉각된 바이오디젤에 첨가하여 슬러리를 형성시킬 수 있고 이것은 이어서 압력 리프(pressure leaf) 또는 다른 유형의 여과기를 통해 여과하여 미립자를 제거할 수 있다. 이어서 여과된 바이오디젤은 가연성 여과기에 통과시켜 임의의 잔류 침강물 및 규조토를 제거하여 최종 바이오디젤 생성물을 생성할 수 있다.
실시예 13는 프로토테카 모리포르미스로부터 트라이글라이세라이드를 사용하는 바이오디젤의 제조법을 기재하였다. 실시예 13에서 제조된 바이오디젤의 ASTM D6751 A1 방법에 의한 냉각 담금 여과능(Cold Soak Filterability)은 300㎖의 부피에 대해 120초이었다. 상기 시험은 16시간 동안 40℉로 냉각시키고 실온으로 가온되도록 방치하고 스테인레스 강철 지지체를 가진 0.7 마이크론 유리 섬유 필터를 사용하여 진공 여과하는, 300㎖의 B100의 여과를 포함한다. 본 발명의 오일은 120초 미만, 100초 미만 및 90초 미만의 냉각 담금 시간과 함께 에스터교환되어 바이오디젤을 생성할 수 있다.
후속 공정은 또한 바이오디젤이 특히 냉온에서 사용되는 경우 사용될 수 있다. 상기 공정은 동결방지처리(winterization) 및 부분 분리를 포함한다. 2개 공정은 혼탁점(바이오디젤이 결정화하기 시작하는 온도)을 저하시킴에 의해 연료의 냉각 흐름 및 동결방지 수행능을 개선시키도록 설계된다. 바이오디젤의 동결방지처리에는 다수의 방법이 있다. 한 가지 방법은 바이오디젤을 석유 디젤과 배합하는 것이다. 또 다른 방법은 바이오디젤의 혼탁점을 저하시킬 수 있는 첨가제를 사용하는 것이다. 또 다른 방법은 첨가제 중에 혼합하고 포화물이 결정화하도록 방치하고 이어서 결정을 여과 제거함에 의해 무분별하게 포화된 메틸 에스터를 제거하는 것이다. 부분 분리는 선택적으로 메틸 에스터를 개별 성분 또는 분획으로 분리하여 특정 메틸 에스터가 제거 또는 포함되도록 할 수 있다. 부분 분리 방법은 우레아 부분 분리, 용매 부분 분리 및 열 증류를 포함한다.
본 발명의 방법에 의해 제공될 수 있는 또 다른 가치있는 연료는 C10:0, C12:0, C14:0, C16:0 및 C18:0과 같은 알칸을 포함하여 바이오디젤과는 구분될 수 있는 재생가능한 디젤이다. 고품질의 재생가능한 디젤은 ASTM D975 표준에 부합한다. 본 발명의 방법에 의해 생성된 지질은 공급원료로서 작용하여 재생가능한 디젤을 생성할 수 있다. 따라서 본 발명의 또 다른 측면에서,재생가능한 디젤을 생성하는 방법이 제공된다. 재생가능한 디젤은 3개 이상의 공정에 의해 생성될 수 있다: 열수 가공(수소 처리); 수소화처리; 및 간접적인 액화. 이들 공정으로 비-에스터 증류물을 수득한다. 이들 공정 동안에, 본 명세서에 기재된 바와 같이 생성되고 분리된 트라이아실글라이세라이드는 알칸으로 전환된다.
한 실시형태에서, 재생가능한 디젤을 생성하는 방법은 (a) 본 명세서에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 미생물을 용해시켜 용해물을 생성하는 단계, (c) 용해된 미생물로부터 지질을 분리하는 단계, (d) 지질을 탈산화하고 수소화처리하여 알칸을 생성함으로써 재생가능한 디젤이 생성되도록 하는 단계를 포함한다. 재생가능한 디젤을 제조하기에 적합한 지질은 헥산과 같은 유기 용매를 사용하거나 미국 특허 제5,928,696호에 기재된 것들과 같은 다른 방법을 통해 미생물 바이오매스로부터 추출을 통해 수득할 수 있다. 몇몇 적합한 방법은 기계적 프레싱 및 원심분리를 포함할 수 있다.
일부 방법에서, 미생물 지질은 먼저 수소화처리와 연계하여 크랙킹하여 각각 탄소쇄 길이를 감소시키고 이중 결합을 포화시킨다. 상기 물질을 또한 이어서 수소화처리와 연계하여 이성질체화한다. 이어서 나프타 분획을 증류를 통해 제거함에 이어서 추가 증류하여 디젤 연료에 요구되는 성분을 증발시키고 증류시킴으로써 ASTM D975에 충족하도록 하고 D975 표준을 충족시키기 위해 요구되는 것 보다 무거운 성분을 잔류시킨다. 트라이글라이세라이드 오일을 포함하는 화학적으로 변형된 오일의 수소 처리, 수소 크랙킹, 탈산소화 및 이성질체화 방법은 당업계에 널리 공지되어 있다. 예를 들어, 유럽 특허 출원 EP1741768(A1); EP1741767(A1); EP1682466(A1); EP1640437(A1); EP1681337(A1); EP1795576(A1); 및 미국 특허 제7,238,277호; 제6,630,066호; 제6,596,155호; 제6,977,322호; 제7,041,866호; 제6,217,746호; 제5,885,440호; 제6,881,873호를 참조한다.
재생가능한 디젤을 생성하기 위한 방법의 하나의 양태에서, 알칸을 생성하기 위한 지질의 처리는 지질 조성물의 수소 처리에 의해 수행한다. 열수 가공에서, 전형적으로 바이오매스는 승온 및 승압에서 물 중에서 반응시켜 오일 및 잔류 고체를 형성시킨다. 전환 온도는 전형적으로 300℉ 내지 660℉이고, 이때 압력은 주로 액체로서 물을 유지하게 충분한 100 내지 170 표준 대기압(atm)이다. 반응 시간은 15 내지 30분 정도이다. 반응을 종결한 후 유기물을 물로부터 분리한다. 이에 의해 디젤에 적합한 증류물이 생성된다.
재생가능한 디젤을 제조하는 일부 방법에서, 트라이글라이세라이드를 처리하는 제1 단계는 이중 결합을 포화시키기 위한 수소 처리에 이어서 수소 및 촉매의 존재 하에 승온에서 탈산소화시키는 것이다. 몇몇 방법에서, 수소화 및 탈산소화는 동일한 반응에서 발생한다. 다른 방법에서 탈산소화는 수소화 전에 수행한다. 이어서 이성질체화는 임의로 또한 수소 및 촉매의 존재 하에서 수행한다. 나프타 성분은 바람직하게 증류를 통해 제거한다. 예를 들어, 미국 특허 제5,475,160호(트라이글라이세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 기체 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성질체화)를 참조한다.
트라이글라이세라이드의 수소화를 위한 하나의 적합한 방법은 구리, 아연, 마그네슘 및 란탄염의 수용액 및 알칼리금속 또는 바람직하게 탄산암모늄의 또 다른 용액을 제조하는 것을 포함한다. 상기 2가지의 용액을 약 20℃ 내지 약 85℃의 온도로 가열하고 침전 용기 내 pH가 5.5 내지 7.5로 유지되어 촉매를 형성하도록 하는 비율로 침전 용기 내로 함께 계량하여 부가할 수 있다. 추가의 물은 초기에 침전 용기 내에 사용할 수 있거나 염 용액 및 침전 용액과 동시에 첨가할 수 있다. 이어서 수득한 침전물을 약 300℃에서 세척하고 건조시키고 하소시키고 약 100℃ 내지 약 400℃의 온도 범위에서 수소중에서 활성화시킬 수 있다. 이어서 하나 이상의 트라이글라이세라이드는 반응기 내 상기된 촉매의 존재 하에 수소와 접촉시키고 반응시킬 수 있다. 상기 반응기는 트라이클 상 반응기, 고정 상 가스-고체 반응기, 팩킹된 기포 칼럼 반응기, 연속 교반 탱크 반응기, 슬러리 상 반응기 또는 당업계에 공지된 임의의 다른 적합한 반응기 유형일 수 있다. 상기 방법은 배치식으로 또는 연속식으로 수행할 수 있다. 반응 온도는 전형적으로 약 170℃ 내지 약 250℃의 범위이고 반응 압력은 전형적으로 약 300 psig 내지 약 2000 psig 범위이다. 더욱이, 본 발명의 방법에서 수소 대 트라이글라이세라이드의 몰 비는 전형적으로 약 20:1 내지 약 700:1의 범위이다. 상기 방법은 전형적으로 중량 시간 공간 속도(WHSV)에서 수행하고 이의 범위는 약 0.1시간-1 내지 약 5시간-1이다. 당업자는 반응을 위해 요구되는 시간은 사용되는 온도, 수소 대 트라이글라이세라이드의 몰비 및 수소 분압에 따라 다양함을 인지할 것이다. 상기 수소화 공정에 의해 생성되는 생성물은 지방 알코올, 글라이세롤, 미량의 파라핀 및 미반응 트라이글라이세라이드를 포함한다. 이들 생성물은 전형적으로 예를 들어, 증류, 추출, 여과, 결정화 등과 같은 통상적인 수단에 의해 분리한다.
석유 정련업자는 수소화처리를 사용하여 공급물을 수소로 처리하는 것에 의해 불순물을 제거한다. 수소화처리 전환 온도는 전형적으로 300℉ 내지 700℉이다. 상기 압력은 전형적으로 40 내지 100atm이다. 상기 반응 시간은 전형적으로 10 내지 60분 정도이다. 고체 촉매를 사용하여 특정 반응 속도를 증가시키고, 특정 생성물에 대한 선택성을 개선시키며 수소 소모를 최적화한다.
오일의 탈산소화를 위해 적합한 방법은 오일을 약 350℉ 내지 약 550℉ 범위의 온도로 가열하고 연속적으로 가열된 오일을 약 5분 이상 동안 적어도 약 대기압 이상의 압력하에서 수소와 접촉시키는 단계를 포함한다.
이성질체화를 위해 적합한 방법은 알칼리 이성질체화 및 당업계에 공지된 다른 오일 이성질체화를 사용하는 단계를 포함한다.
수소 처리 및 수소 가공은 궁극적으로 트라이글라이세라이드 공급물의 중량 감소를 유도한다. 상기 트라이글라이세라이드 분자는 수소 가공 조건하에 4개의 탄화수소 분자, 즉 프로판 분자 및 전형적으로 C8 내지 C18 범위의 3개의 더 무거운 탄화수소 분자로 감소한다.
따라서, 하나의 양태에서, 본 발명의 지질 조성물 상에서 수행되는 하나 이상의 화학 반응(들)의 생성물은 ASTM D975 재생가능한 디젤을 포함하는 알칸 혼합물이다. 미생물에 의한 탄화수소의 생성은 문헌[Metzger et al. Appl Microbiol Biotechnol (2005) 66: 486-496 and A Look Back at the U.S. Department of Energy's Aquatic Species Program: Biodiesel from Algae, NREL/TP-580-24190, John Sheehan, Terri Dunahay, John Benemann and Paul Roessler (1998)]에 의해 검토되었다.
디젤 연료의 증류 성질은 T10-T90 (각각 10% 및 90%의 부피가 증류되는 온도)의 관점에서 기재한다. 재생가능한 디젤은 프로토테카 모리포미스 트라이글라이세라이드로부터 생성되고 실시예 13에 기재된다. 실시예 13에 생성된 물질의 T10-T90은 57.9℃였다. 본 명세서에 기재된 오일의 수소 처리, 이성질체화 및 본 명세서에 기재된 다른 공유 변형 방법 및 증류 및 본 명세서에 기재된 부분 분리(예를 들어, 냉각 여과) 방법을 사용하면서, 본 명세서에 기재된 방법에 따라 생성된 트라이글라이세라이드를 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T10-T90 범위는 20, 25, 30, 35, 40, 45, 50, 60 및 65℃이다.
실시예 13에서 생성된 물질의 T10은 242.1℃이다. 본 명세서에 개시된 오일의 수소 처리, 이성질체화 및 다른 공유 변형 방법 및 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T10 값은 예를 들어, 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 적어도 290의 T10이다.
실시예 13에서 생성된 물질의 T90은 300℃이다. 본 명세서에 기재된 오일의 수소 처리, 이성질체화 및 다른 공유 변형 방법 및 본 명세서에 기재된 증류 및 부분 분리(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T90 값은 예를 들어, 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 및 적어도 290의 T90이다.
실시예 13에서 생성된 물질의 FBP는 300℃이다. 본 명세서에 기재된 오일의 수소 처리, 이성질체화 및 다른 공유 변형 방법 및 본 명세서에 기재된 증류 및 부분 분리(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 FBP 값은 예를 들어, 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 및 적어도 300의 FBP이다.
본 발명의 방법 및 조성물에 의해 제공된 기타 오일은 수소화처리, 이성질체화 및 다른 공유 변형의 조합에 적용될 수 있고 (a) 적어도 1%-5%, 바람직하게는 적어도 4%의 C8-C14; (b) 적어도 0.25%-1%, 바람직하게는 적어도 0.3%의 C8; (c) 적어도 1%-5%의 바람직하게는 적어도 2%의 C10; (d) 적어도 1%-5%, 바람직하게는 적어도 2%의 C12; 및 (3) 적어도 20%-40%, 바람직하게는 적어도 30% C8-C14를 포함하는 지질 프로파일을 갖는 오일을 포함한다.
전통적인 초-저 황 디젤은 2단계 공정에 의해 임의의 형태의 바이오매스로부터 생성될 수 있다. 먼저, 바이오매스를 수소 및 일산화탄소가 풍부한 가스 혼합물인 합성가스로 전환한다. 이어서, 합성가스를 촉매적으로 액체로 전환한다. 전형적으로, 액체의 생성은 피셔-트로프쉬(Fischer-Tropsch, FT) 합성을 사용하여 달성한다. 상기 기술은 석탄, 천연 가스 및 중유에 적용한다. 따라서, 재생가능한 디젤을 생성하기 위한 방법의 여전히 또 다른 바람직한 양태에서, 알칸을 생성하기 위한 액체 조성물의 처리는 액체 조성물의 간접적인 액화에 의해 수행된다.
본 발명은 또한 제트 연료를 제조하는 방법을 제공한다. 제트 연료는 스트로 색상으로 투명하다. 가장 일반적인 연료는 국제 표준 세트의 세부 항목으로 제조되는 항공기 A-1로서 분류되는 무연/석유 오일계 연료이다. 제트 연료는 다수의 상이한, 가능하게는 수천 개 이상의 많은 상이한 탄화수소의 혼합물이다. 이들의 크기 범위(분자량 또는 탄소수)는 생성물에 대한 요건, 예를 들어, 동결점 또는 발연점에 의해 제한된다. 케로손형(Kerosone-type) 항공기 연료(제트 A 및 제트 A-1을 포함함)는 약 8 내지 16개 탄소 수의 탄소 수 분포를 갖는다. 와이드-컷 또는 나프타형 항공기 연료(제트 B를 포함)는 전형적으로 약 5 내지 15개 탄소의 탄소 수 분포를 갖는다.
항공기(제트 A 및 제트 B)는 둘 다 다수의 부가제를 함유할 수 있다. 유용한 부가제는 항산화제, 대전방지제, 부식 억제제, 및 연료 시스템 아이싱 억제제(FSII)를 포함하지만 이에 제한되지 않는다. 항산화제는 검화(gumming)를 방지하고 일반적으로 알킬화된 페놀, 예를 들어, AO-30, AO-31, 또는 AO-37을 기초로 한다. 대전방지제는 정전기를 소멸시켜 스파킹을 차단한다. 활성 성분으로서 다이노닐나프틸설폰산(dinonylnaphthylsulfonic acid, DINNSA)을 갖는 Stadis 450이 하나의 예이다. 부식 억제제, 예를 들어, DCI-4A는 대중 및 군사 연료용으로 사용되고 DCI-6A는 군사 연료용으로 사용된다. FSII 제제는 예를 들어, Di-EGME를 포함한다.
본 발명의 하나의 양태에서, 제트 연료는 기존의 제트 연료와 조류 연료를 배합하는 것에 의해 제조된다. 본 발명의 방법에 의해 생성된 지질은 공급원료서 작용하여 제트 연료를 생성할 수 있다. 따라서, 본 발명의 또 다른 측면에서, 제트 연료를 제조하는 방법이 제공된다. 이와 함께 본 발명의 방법에 의해 생성된 지질로부터 제트 연료를 제조하는 2가지 방법으로서 유동 촉매 크랙킹(fluid catalytic cracking, FCC); 및 수소탈산소화(hydrodeoxygenation, HDO)가 제공된다.
유동 촉매 크랙킹(FCC)은 중질 분획물 기원의 올레핀, 특히 프로필렌을 제조하기 위해 사용되는 하나의 방법이다. 본 발명의 방법에 의해 생성된 지질은 올레핀으로 전환할 수 있다. 상기 방법은 FCC 영역을 통해 생성된 지질을 유동시키고 제트 연료로서 유용한 올레핀으로 구성된 생성물 스트림을 수거함을 포함한다. 생성된 지질은 크랙킹 조건에서 크랙킹 촉매와 접촉시켜 제트 연료로서 유용한 올레핀 및 탄화수소를 포함하는 생성물 스트림을 제공한다.
한 실시형태에서, 제트 연료를 제조하는 방법은 (a) 본 명세서에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성하고, (c) 용해물로부터 지질을 분리하는 단계, (d) 지질 조성물을 처리함으로써 제트 연료를 생성하는 단계를 포함한다. 제트 연료를 제조하는 방법의 한 실시형태에서, 상기 지질조성물은 유체 촉매 크랙킹 영역을 통류할 수 있고 이는 하나의 양태에서 지질 조성물을 크랙킹 조건에서 크랙킹 촉매와 접촉시켜 C2-C5 올레핀을 포함하는 생성물을 제공하는 단계를 포함할 수 있다.
상기 방법의 특정 양태에서, 지질 조성물에 존재할 수 있는 임의의 오염물을 제거하는 것이 바람직할 수 있다. 따라서, 유체 촉매 크랙킹 영역을 통해 지질 조성물을 유동시키기 전에, 지질 조성물을 전처리한다. 전처리는 지질 조성물을 이온 교환 수지와 접촉시키는 것을 포함할 수 있다. 이온 교환 수지는 산성 이온 교환 수지, 예를 들어 Amberlyst(상표명)-15이고 지질 조성물이 통류(상향 통류 또는 하향 통류)하는 반응기 내 상으로서 사용될 수 있다. 다른 전처리는 액체 조성물을 산, 예를 들어, 황산, 아세트산, 질산 또는 염산과 접촉시킴에 의한 약산 세척을 포함할 수 있다. 접촉은 일반적으로 주위 온도 및 대기압에서 희석 산 용액과 수행된다.
임의로 전처리된 지질 조성물은 탄화수소 성분이 올레핀으로 크랙킹되는 FCC 영역으로 유동한다. 촉매 크랙킹은 반응 영역중의 지질 조성물을 미분된 미립자 물질로 구성된 촉매와 접촉시킴에 의해 달성한다. 상기 반응은 수소 크랙킹과는 반대로 촉매 크랙킹이고 부가되는 수소의 부재 또는 수소의 소비에서 수행한다. 크랙킹 반응이 진행함으로써 상당한 양의 코크가 촉매상에 침착된다. 상기 촉매는 재생 영역에서 촉매 기원의 코크를 연소시킴에 의해 고온에서 재생된다. 본 명세서에서, "코크 촉매"로서 언급되는 코크 함유 촉매는 반응 영역으로부터 재생될 재생 영역으로 연속으로 수송되고 재생 영역 기원의 필수적 코크 부재의 재생된 촉매에 의해 대체된다. 다양한 가스 스트림에 의한 촉매 입자의 유동화는 반응 영역과 재생 영역간에 촉매의 수송을 허용한다. 촉매의 유동화 스트림에서 본 명세서에 기재된 지질 조성물의 탄화수소와 같은 탄화수소를 크랙킹하고, 반응 영역 및 재생 영역간에 촉매를 수송하고 재생기내 코크를 연소시키는 방법은 FCC 방법 기술 분야의 당업자에게 널리 공지되어 있다. C2-C5 올레핀을 제조하기 위해 지질 조성물을 크랙킹하는데 유용한 예시적인 FCC 적용 및 촉매는 전문이 본 명세서에 참조로서 포함된 미국 특허 제6,538,169호 및 제7,288,685호에 기재되어 있다.
적합한 FCC 촉매는 일반적으로 동일한 매트릭스에 존재하거나 존재하지 않을 수 있는 2개 이상의 성분을 포함한다. 몇몇 양태에서, 2개의 성분 둘 다는 전체 반응 용기를 거쳐 순환할 수 있다. 제1 성분은 일반적으로 유동화된 촉매 크랙킹의 분야에 사용되는 임의의 널리 공지된 촉매를 포함하고, 예를 들어, 활성 무정형 점토형 촉매 및/또는 고활성의 결정 분자체가 있다. 분자체 촉매는 목적하는 생성물에 대한 이의 매우 개선된 선택성 때문에 무정형 촉매 보다 바람직할 수 있다. 몇몇 바람직한 양태에서, 제올라이트는 FCC 공정에서 분자체로서 사용할 수 있다. 바람직하게, 제1 촉매 성분은 실리카 또는 알루미나 및 카올린과 같은 불활성 충전제를 포함하는, 대형 공극 제올라이트, 예를 들어, Y형 제올라이트, 활성 알루미나 물질, 결합제 물질을 포함한다.
하나의 양태에서, 본 발명의 지질 조성물의 크랙킹은 FCC 영역의 상위 부문 또는 리프트 부문에서 발생한다. 상기 지질 조성물은 노즐에 의해 상부로 도입되어 지질 조성물의 신속한 증발을 유도한다. 촉매와 접촉시키기 전에, 상기 지질 조성물은 통상적으로 약 149℃ 내지 약 316℃(300℉ 내지 600℉)의 온도를 갖는다. 상기 촉매는 배합 용기로부터 상부로 유동하며, 여기서 이것은 약 2초 이하의 시간 동안 지질 조성물과 접촉한다.
배합된 촉매 및 반응된 지질 조성물 증기는 이어서 출구를 통해 상부로부터 배출되고 올레핀, 및 상당한 양의 코크로 덮여지고 일반적으로 "코크된 촉매"로 언급되는 촉매 입자의 수거물을 포함하는 크랙킹된 생성물 증기로 분리된다. 목적하는 생성물이 바람직하지 못한 다른 생성물로 추가로 전환되는 것을 촉진시킬 수 있는, 지질 조성물과 촉매의 접촉시간을 최소화하기 위한 일환으로 스월 암 정렬 장치(swirl arm arrangement)와 같은 임의의 정렬된 분리기를 사용하여 생성물 스트림으로부터 신속하게 코크된 촉매를 제거할 수 있다. 분리기, 예를 들어, 스월 암 분리기는 챔버의 하한부에 위치한 스트립핑 영역(stripping zone)과 함께 챔버의 챔버의 상한부에 위치한다. 스월 암 정렬 장치에 의해 분리된 촉매는 스트립핑 영역으로 적가된다. 가벼운 올레핀 및 몇몇 촉매를 포함하는 크랙킹된 탄화수소를 포함하는 크랙킹된 생성물 증기는 사이클론과 소통하는 도관을 통해 챔버로부터 배출된다. 상기 사이클론은 생성물 증기로부터 잔류 촉매 입자를 제거하여 입자 농도를 매우 낮은 수준으로 감소시킨다. 이어서 상기 생성물 증기는 분리 용기의 상부를 상부로부터 배출된다. 사이클론에 의해 분리된 촉매는 분리 용기에 이어서 스트립팅 영역으로 복귀한다. 스트립핑 영역은 증기와의 역류 접촉에 의해 촉매 표면으로터 흡착된 탄화수소를 제거한다.
낮은 탄화수소 분압은 가벼운 올레핀이 우선적으로 생성되도록 작용한다. 따라서, 상부압은 약 172 내지 241 kPa(25 내지 35 psia)로 설정되고 탄화수소 분압은 약 35 내지 172 kPa(5 내지 25 psia)이고 바람직한 탄화 수소 분압은 약 69 내지 138 kPa(10 내지 20 psia)이다. 탄화수소에 대한 상대적 낮은 분압은 희석제가 지질 조성물의 10중량% 내지 55중량% 및 바람직하게는 지질 조성물의 약 15중량% 정도인 희석제로서 증기를 사용함에 의해 달성된다. 다른 희석제, 예를 들어, 무수 가스를 사용하여 등가의 탄화수소 분압에 도달할 수 있도록 할 수 있다.
상부 출구에서 크랙킹된 증기의 온도는 약 510℃ 내지 621℃ (950℉ 내지 1150℉)이다. 그러나, 566℃(1050℉) 초과의 상부 출구 온도는 보다 무수의 가스 및 더 많은 올레핀을 생성시킨다. 반면에, 566℃(1050℉) 미만의 상부 출구 온도는 에틸렌 및 프로필렌을 적게 생성시킨다. 따라서, 약 566℃ 내지 약 630℃의 바람직한 온도, 약 138 kPa 내지 약 240 kPa (20 내지 35 psia)의 바람직한 압력에서 FCC 공정을 수행하는 것이 바람직하다. 상기 공정의 또 다른 조건은 약 5 내지 약 20 및 바람직하게는 약 10 내지 약 15로 다양할 수 있는 지질 조성물에 대한 촉매 비이다.
제트 연료를 생성하는 방법의 하나의 양태에서, 상기 지절 조성물은 FCC 반응기의 리프트 부문으로 도입된다. 리프트 부문에서 온도는 매우 고온이고 약 700℃(1292℉) 내지 약 760℃ (1400℉)의 범위이고 지질 조성물에 대한 촉매의 비율은 약 100 내지 약 150이다. 이것은 지질 조성물의 리프트 부문으로의 도입이 상당한 양의 프로필렌 및 에틸렌을 생성할 것으로 예상된다.
본 명세서에 기재된 바와 같이 생성된 지질 조성물 또는 지질을 사용하여 제트 연료를 생성시키는 방법의 또 다른 양태에서, 지질 조성물 또는 지질의 구조는 수소탈산소화(HDO)로 언급되는 공정에 의해 파괴된다. HDO는 수소에 의한 산소의 제거를 의미하는데, 즉 산소는 물질의 구조를 파괴시키면서 제거된다. 올레핀 이중 결합을 수소화시키고 임의의 황 및 질소 화합물을 제거한다. 황 제거는 소위 수소탈황화(hydrodesulphurization, HDS)로 불린다. 원료(지질 조성물 또는 지질)의 전처리 및 순도는 촉매의 작용 수명에 기여한다.
일반적으로, HDO/HDS 단계에서, 수소는 공급 스톡(지질 조성물 또는 지질)과 혼합하고 이어서 상기 혼합물을 단일상 또는 2개 상 공급 스톡으로서 동시 유류물로서 촉매상에 통과시킨다. HDO/HDS 단계 후, 생성물 분획을 분리하고 별도의 이성질체화 반응기에 통과시킨다. 생물학적 출발 물질용 이성질체화 반응기는 동시 유류 반응기로서 문헌(FI 100 248)에 기재되어 있다.
탄화수소 공급물, 예를 들어, 본 명세서에서의 지질 조성물 또는 지질을 수소화시키는 단계에 의한 연료의 제조 방법은 또한 지질 조성물 또는 지질을 동시 유류물로서 제1 수소화 영역을 통해 수소 가스와 함께 통과시킴으로써 수행될 수 있고 이후 탄화수소 유출물은, 수소 가스를 탄화수소 유출물과는 반대로 역류 유동물로서 제2 수소화 영역에 통과시킴으로써 제2 수소화 영역에서 추가로 수소화시킨다. 지질 조성물을 크랙킹하여 C2-C5 올레핀을 제조하는데 유용한 예시적인 HDO 적용 및 용매는 전문이 본 명세서에 참조로서 인용되는 미국 특허 제7,232,935호에 기재되어 있다.
전형적으로, 수소탈산소화 단계에서, 본 명세서에서의 지질 조성물 또는 지질과 같은 생물학적 성분의 구조는 산소, 질소, 인 및 황 화합물로 분해되고 가스로서의 가벼운 탄화수소가 제거되며 올레핀 결합은 수소화된다. 상기 방법의 제2 단계에서, 즉 소위 이성질체화와 단계에서, 이성질체화는 낮은 온도에서 탄화수소 쇄를 측쇄화하고 파라핀의 수행능을 개선시키는 단계에 의해 수행된다.
제1 단계, 즉 크랙킹 공정의 HDO 단계에서 수소 가스, 및 수소화되어야만 하는 본 명세서의 지질 조성물 또는 지질은 HDO 촉매상 시스템에 동시 유류물로서 또는 역류물로서 통과시키고 상기 촉매상 시스템은 하나 이상의 촉매상, 바람직하게 1 내지 3개의 촉매상을 포함한다. HDO 단계는 전형적으로 동시 유류 방식으로 작동한다. 2개 이상의 촉매상을 포함하는 HDO 촉매상 시스템의 경우에, 상기 상 중 하나 이상은 역류물 원칙을 사용하여 작동할 수 있다. HDO 단계에서, 압력은 20 내지 150 bar, 바람직하게는 50 내지 100 bar로 다양하고 온도는 200 내지 500℃, 바람직하게는 300 내지 400℃로 다양하다. HDO 단계에서, 원소 주기율표의 VII 족 및/또는 VIB족 금속을 함유하는 공지된 수소화 촉매가 사용될 수 있다. 바람직하게, 수소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고, 상기 지지체는 알루미나 및/또는 실리카이다. 전형적으로, NiMo/Al2O3 및 CoMo/Al2O3 촉매가 사용된다.
HDO 단계 전에, 본 명세서에서 지질 조성물 또는 지질은 임의로 보다 온화한 조건하에서 예비수소화로 처리하여 이중결합의 부반응을 회피할 수 있다. 상기 예비수소화는 50 내지 400℃의 온도 및 1 내지 200 바의 수소 압력, 바람직하게는 150 내지 250℃의 온도 및 10 내지 100 바의 수소 압력에서 수행한다. 상기 촉매는 원소주기율표의 VIII족 및/또는 VIB족 기원의 금속을 함유할 수 있다. 바람직하게, 예비소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고 상기 지지체는 알루미나 및/또는 실리카이다.
수소를 함유하는 HDO 단계 기원의 가스 기류를 냉각시킴에 이어서 일산화탄소, 이산화탄소, 질소, 인 및 황 화합물, 가벼운 가스 탄화수소 및 다른 불순물을 이로부터 제거한다. 압착시킨 후 정제된 수소 또는 재활용된 수소를 제1 촉매상으로 및/또는 촉매상 사이로 복귀시켜 인출된 기류를 구성하도록 한다. 물은 축합 액체로부터 제거한다. 상기 액체는 제1 촉매상 또는 촉매상 사이로 통과시킨다.
HDO 단계 후, 생성물은 이성질체화 단계에 적용한다. 이것은 탄화수소를 이성질체화 촉매와 접촉시키기전에 불순물을 가능한 완전히 제거하는 공정을 위해 필요하다. 상기 이성질체화 단계는 임의의 교반 단계를 포함하고, 이때, HDO 단계 기원의 반응 생성물은 수증기 또는 가벼운 탄화수소, 질소 또는 수소와 같은 적합한 가스 증기를 스트립핑함으로써 정제될 수 있다. 임의의 스트립핑 단계는 이성질체화 촉매의 상부 유닛에서 역류 방식(여기서, 여기서, 가스 및 액체는 서로 접촉한다)으로 수행되거나 역류 원칙을 사용하는 별도의 스트립핑 유닛 역류 원리에서 실제 이성질체화 반응기 전에 수행한다.
스트립핑 단계 후, 수소 가스 및 본 명세서에서의 수소화된 지질 조성물 또는 지질 및 n-파라핀 혼합물을 하나 이상의 촉매상(들)을 포함하는 반응성 이성질체화 유닛에 통과시킨다. 이성질체화 단계의 촉매상은 동시 유류 또는 역류 방식으로 작동할 수 있다.
역류 원리가 이성질체화 단계에 적용되는 것은 상기 공정을 위해 중요하다. 이성화체 단계에서, 이것은 임의의 스트립핑 단계 또는 이성질체화 반응 단계 중 하나 또는 둘 다를 역류 방식으로 진행하는 것으로 수행한다. 이성질체화 단계에서, 압력은 20 내지 150 bar, 바람직하게는 20 내지 100 bar로 다양하고, 온도는 200 내지 500℃, 바람직하게는 300 내지 400℃이다. 이성질체화 단계에서, 당업계에 공지된 이성질체화 촉매가 사용될 수 있다. 적합한 이성질체화 촉매는 분자체 및/또는 VII족 금속 및/또는 운반체를 함유한다. 바람직하게, 이성질체화 촉매는 SAPO-11 또는 SAPO41 또는 ZSM-22 또는 ZSM-23 또는 페리어라이트(ferrierite) 및 Pt, Pd 또는 Ni 및 Al2O3 또는 SiO2를 함유한다. 전형적인 이성질체화 촉매는 예를 들어, Pt/S APO-11/Al2O3, Pt/ZSM-22/Al2O3, Pt/ZSM-23/Al2O3 및 Pt/SAPO-11/SiO2이다. 이성질체화 단계 및 HDO 단계는 동일한 압력 용기 또는 별도의 압력 용기에서 수행할 수 있다. 임의의 예비수소화는 별도의 압력 용기 또는 HDO 및 이성질체화 단계와 동일한 압력 용기에서 수행할 수 있다.
따라서, 한 실시형태에서, 하나 이상의 화학 반응의 생성물은 HRJ-5를 포함하는 알칸 혼합물이다. 다른 실시형태에서, 하나 이상의 화학적 반응 생성물은 ASTM D1655 제트 연료를 포함하는 알칸 혼합물이다. 일부 실시형태에서, ASTM 1655 제트 연료의 세부 항목을 준수하는 조성물은 10 ppm 미만의 황 함량을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 205℃ 미만의 증기 곡선의 T10값을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 300℃ 미만의 최종 비점(FBP)을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 38℃ 이상의 인화점을 갖는다. 또 다른 실시형태에서, ASTM 1655 제트 염료의 세부항목을 준수하는 조성물은 775K/M3 내지 840K/M3의 밀도를 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 -47℃ 미만의 빙점을 갖는다. 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 42.8 MJ/K 이상의 총 연소열을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 13.4 질량% 이상의 수소 함량을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 Hg의 3㎜ 미만인, 260℃에서의 정량적 정량적 중량 JFTOT에 의한 시험시 열 안정성을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 7㎎/㎗ 미만인 실제 검을 갖는다.
따라서, 본 발명은 미세조류 지질의 화학적 변형으로 다양한 산업적 및 다른 적용 분야에 유용한 생성물을 수득하는 다양한 방법을 기재하고 있다. 본 명세서에 기재된 방법에 의해 생성된 오일을 변형시키는 방법의 예는 오일 가수분해, 오일의 수소화처리 및 오일의 에스터화를 포함하지만 이에 제한되지 않는다. 미세조류 지질의 다른 화학적 변헝은, 이에 제한되는 것은 아니지만, 에폭시화, 산화, 가수분해, 황산화, 술폰산화, 에톡실화, 프로폭실화, 아미드화 및 비누화를 포함한다. 미세조류 오일의 변형은 기본 함유화학물질을 생성하고 이는 추가로 목적하는 기능을 위해 선택된 유도체 함유화학물질로 변형시킬 수 있다. 연료 생성 공정과 관련하여 상기된 것과 유사한 방식으로, 이들 화학적 변형은 또한 본 명세서에 기재된 미생물 배양으로부터 생성된 오일상에서 수행할 수 있다. 기본 함유화학물질의 예는 비누, 지방산, 지방 에스터, 지방 알코올, 지방 질소 화합물, 지방산 메틸 에스터 및 글라이세롤을 포함하지만 이에 제한되지 않는다. 유도체 함유화학물질의 예는 지방 니트릴, 에스터, 이량체 산, 쿠아트(quat), 계면활성제, 지방 알칸올아마이드, 지방 알코올 설페이트, 수지, 유화제, 지방 알코올, 올레핀, 굴착 이수, 폴리올, 폴리우레탄, 폴리아크릴레이트, 고무, 양초, 화장품, 금속성 비누, 비누, 알파-설폰화된 메틸 에스터, 지방 알코올 설페이트, 지방 알코올 에톡실레이트, 지방 알코올 에터 설페이트,이미다졸린, 계면활성제, 세정제, 에스터, 쿠아트, 오존분해 생성물, 지방 아민, 지방 알칸올아마이드, 에톡시설페이트, 모노글라이세라이드, 다이글라이세라이드, 트라이글라이세라이드(중간쇄 트라이글라이세라이드를 포함), 윤활제, 작동유, 그리스, 유전성 유체, 이형제, 금속가공유제, 열전달유체, 기타 기능성 유체, 산업적 화학물질(예를 들어 세정제, 텍스타일 가공 보조제, 가소제, 안정제, 첨가제), 표면 코팅, 페인트 및 라커, 전기 배선 절연 및 고급 알칸을 포함하지만 이에 제한되지 않는다.
본 발명의 방법에 의해 생성된 글라이세로지질 기원의 지방산 성분의 가수분해는 다른 유용한 화학물질을 생성하도록 유도체화될 수 있는 유리된 지방산을 생성시킨다. 가수분해는 산 또는 염기일 수 있는 물 및 촉매의 존재 하에 수행한다. 유리된 지방산을 유도체화하여 다음에 보고되는 바와 같은 다양한 생성물을 수득할 수 있다: 미국특허 제5,304,664호(고도로 황화된 지방산); 제7,262,158호(세정 조성물); 제7,115,173호(직물 연화 조성물); 제6,342,208호(피부 처리용 에멀젼); 제7,264,886호(방수 조성물); 제6,924,333호(페인트 첨가제); 제6,596,768호 (지질 풍부 반추동물 공급원료); 및 제6,380,410호(세제 및 세정제용 계면활성제).
본 발명의 하나의 양태에서 가수분해와 관련하여 트라이글라이세라이드 오일은 임의로 먼저 물 또는 수산화나트륨과 같은 액체 매질 중에서 가수분해하여 글라이세롤 및 비누를 수득한다. 다양한 적합한 트라이글라이세라이드 가수분해 방법이 있고 여기에는 비누화, 산 가수분해, 알칼린 가수분해, 효소 가수분해(본 명세서에서 분할으로서 언급됨), 및 고온 압착수를 사용한 가수분해가 포함되지만 이에 제한되지 않는다. 당업자는 트라이글라이세라이드 오일이 함유화학물질을 생성하기 위해 가수분해될 필요가 없고 차라리 상기 오일이 다른 공지된 방법에 의해 목적하는 함유화학물질로 직접 전환될 수 있다. 예를 들어, 트라이글라이세라이드 오일은 에스터화를 통해 메틸 에스터 지방산으로 직접 전환될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 방법에 의해 생성된 오일의 촉매 가수분해는 오일을 글라이세롤 및 지방산으로 분리시킴으로써 발생한다. 상기 논의된 바와 같이, 지방산은 이어서 여러 다른 변형을 통해 수득된 유도체 함유화학물질로 추가로 가공될 수 있다. 예를 들어 한 실시형태에서, 지방산은 아민화 반응하도록 진행시켜 지방 질소 화합물을 생성할 수 있다. 다른 실시형태에서, 지방산은 일염기성 및 이염기성 산을 생성하도록 오존용해에 적용될 수 있다.
다른 양태에서, 가수분해는 오일 분리를 통해 발생하여 함유화학물질을 생성할 수 있다. 본 발명의 몇몇 바람직한 양태에서, 트라이글라이세라이드 오일은 다른 공정을 수행하기 전에 분리될 수 있다. 당업자는 많은 적합한 트라이글라이세라이드 분리 방법이 존재한다는 것을 인지할 수 있고 상기 방법은 효소 분리 및 압력 분리를 포함하지만 이에 제한되지 않는다.
일반적으로, 효소적 오일 분리 방법은 물/오일 혼합물에 대해 작용하는 생촉매로서 효소인 리파제를 사용한다. 효소적 분리는 그 다음에 오일 또는 지방을 글라이세롤 및 유리된 지방산으로 분리한다. 상기 글라이세롤은 수층으로 이동하는 반면 상기 유기층에는 유리된 지방산이 풍부해진다.
효소 분할 반응은 일반적으로 유기 및 수성 상간의 경계상에서 일어나고 여기서 효소는 단지 경계상에 존재한다. 이어서 경계상과 만나는 트라이글라이세라이드는 분리 반응에 기여하거나 이에 관여한다. 반응이 진행됨에 따라, 유리된 지방산과는 대조적으로 여전히 글라이세라이드로 화학적으로 결합되어 있는 지방산의 작업 밀도 또는 농도는 경계상에서 감소하여 반응은 느려진다. 특정 양태에서, 효소 분할은 실온에서 일어날 수 있다. 당업자는 오일을 원하는 지방산으로 분리시키는데 적합한 조건에 정통하고 있다.
예로서, 반응 속도는 상호 경계 표면을 증가시키는 것으로 가속화될 수 있다. 일단 반응이 완료되면, 유리된 지방산을 이어서 효소로부터 유리된 유기상으로부터 분리하고 글라이세라이드로 여전히 화학적으로 결합되어 있는 지방산을 함유하는 잔사는 역 공급되거나 재활용되고 새로운 오일 또는 지방과 혼합되어 분리방법에 적용시킨다. 이어서 상기 방식으로 재활용된 글라이세라이드는 추가의 효소적 분할 방법에 적용된다. 몇몇 양태에서, 유리된 지방산은 상기 방식으로 부분적으로 분리된 오일 또는 지방으로부터 추출된다. 상기 방식으로, 화학적으로 결합된 지방산(트라이글라이세라이드)이 분리 공정으로 복귀하거나 역 공급되는 경우 효소 소비는 급격히 감소할 수 있다.
분할 정도는 측정된 산 값을, 소정의 오일 또는 지방에 대해 계산될 수 있는 이론적으로 가능한 산 값으로 나눈 비율로서 결정한다. 바람직하게, 산 값은 표준 일반 방법에 따른 적정을 사용하여 측정한다. 또한, 수성 글라이세롤 상의 밀도는 분리 정도에 대한 척도로서 취할 수 있다.
한 실시형태에서, 본 명세서에 기재된 바와 같은 분리 방법은 또한 생성된 오일의 알칼리 정련 공정 기원의 소위 비누-스톡에 함유된 모노-, 다이- 및 트라이글라이세라이드에 적합하다. 상기 방식으로, 비누 스톡은 사전 비누화 없이 천연 오일의 지방산으로 정량적으로 전환될 수 있다. 상기 목적을 위해, 비누에 화학적으로 결합된 지방산을 바람직하게는 분리 전에 산의 부가를 통해 방출시킨다. 특정 양태에서, 완충제은 분할 공정을 위한 물 및 효소에 추가로 사용된다.
한 실시형태에서, 본 발명의 방법에 따라 생성된 오일은 또한 가수분해 방법으로서 비누화에 적용될 수 있다. 동물성 및 식물성 오일은 트라이하이드릭 알코올인 글라이세롤과 지방산의 에스터인 트라이아실글라이세롤(TAG)로 이루어진다. 알칼린 가수분해 반응에서, TAG내 글라이세롤이 제거되어 3개의 카복실산 음이온이 생성되고 이는 나트륨 또는 칼륨과 같은 알칼리 금속 양이온과 연합하여 지방산 염을 생성할 수 있다. 상기 기획에서, 카복실산 성분들은 글라이세롤 잔기로부터 절단되고 하이드록실 그룹으로 대체된다. 상기 반응에 사용되는 염기(예를 들어, KOH)의 양은 목적하는 비누화 정도에 의해 측정된다. 예를 들어, 상기 목적이 본래 TAG 조성물중에 존재하는 오일의 일부를 포함하는 생성물을 제조하기 위한 것인 경우, 모든 TAG를 지방산 염으로 전환시키기에 불충한 양의 염기가 반응 혼합물로 도입된다. 통상적으로, 상기 반응은 수용액중에 수행하여 서서히 진행시키지만 가열에 의해 촉진될 수 있다. 지방산 염의 침전은 수용성 알칼리 금속 할라이드(예를 들어, NaCl 또는 KCl)와 같은 염을 반응 혼합물에 부가하여 촉진될 수 있다. 바람직하게, 상기 염기는 알칼리 금속 수산화물(예를 들어, NaOH 또는 KOH)이다. 대안으로, 예를 들어 트라이에탄올아민 및 아미노메틸프로판올을 포함하는 알칸올아민과 같은 다른 염기가 상기 반응 계획에 사용될 수 있다. 일부 경우에, 이들 대안은 투명한 비누 생성물을 제조하는데 바람직할 수 있다. 한 실시형태에서 비누화되는 지질 조성물은 본 명세서에 기재된 바와 같이 생성된 탤로 모방체(즉, 탤로와 유사한 지질 조성물), 또는 탤로 모방체와 다른 트라이글라이세라이드 오일의 배합물이다.
몇몇 방법에서, 화학적 변형의 제1 단계는 수소 및 촉매의 존재 하에 승온에서 이중 결합을 포화시키기 위한 수소화처리 후에 탈산소화하는 것이다. 다른 방법에서, 수소화 및 탈산소화는 동일한 반응중에서 일어날 수 있다. 여전히 다른 방법에서, 탈산소화는 수소화 전에 발생한다. 이어서 이성질체화는 또한 수소 및 촉매의 존재 하에서 임의로 수행할 수 있다. 최종적으로, 가스 및 나프타 성분은 경우에 따라 제거할 수 있다. 예를 들어, 미국 특허 5,475,160호(트라이글라이세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 가스 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성질체화)를 참조한다.
본 발명의 일부 실시형태에서, 트라이글라이세라이드 오일은 부분적으로 또는 완전히 탈산소화된다. 탈산소화 반응은 지방산, 지방 알코올, 폴리올, 케톤 및 알데하이드를 포함하지만, 이에 제한되지 않는, 원하는 생성물을 생성시킨다. 일반적으로, 임의의 특정 이온에 구애되지 않고 탈산소화 반응은, 지방산 또는 지방산 에스터로부터 산소를 적어도 부분적으로 제거하여 추가의 공정에 의해 목적하는 화학물질로 용이하게 전환될 수 있는 지방 알코올과 같은 반응 생성물을 생성시키는 반응으로서, 제한 없이 수소용해, 수소생성, 연속 수소화-수소용해, 연속 수소용해-수소화 및 조합된 수소화-수소용해 반응을 포함하는 다양하고 상이한 반응 경로의 조합을 포함한다. 예를 들어, 하나의 양태에서, 지방 알코올은 FCC 반응을 통해 올레핀으로 또는 축합 반응을 통해 고급 알칸으로 전환될 수 있다.
하나의 상기 화학적 변형은 글라이세로지질 또는 유리 지방산의 지방산 성분에서 이중 결합으로 수소를 첨가하는 수소화이다. 수소화 반응으로 액체 오일은 특정 응용을 위해 보다 적합할 수 있는 반고체 또는 고체 지질로 전환될 수 있다.
본 명세서에 기재된 방법에 의해 생성된 오일의 수소화는 하기에 보고된 바와 같이 본 명세서에 제공된 방법 및/또는 재료 중 하나 이상과 연계하여 수행할 수 있다: 미국 특허 제7,288,278호 (식품 첨가제 또는 의약); 제5,346,724호(윤활 생성물); 제5,475,160호(지방 알코올); 제5,091,116호(식용 오일); 제6,808,737호(마가린 및 스프레드용 구조적 지방); 제5,298,637호(감소된 칼로리 지방 대용물); 제6,391,815호(수소화 촉매 및 황 흡착제); 제5,233,099호 및 제5,233,100호(지방 알코올); 제4,584,139호(수소화 촉매); 제6,057,375호(소포제); 및 제7,118,773호(식용 에멀젼 스프레드).
당업자는 탄수화물을 수소화시키기 위해 다양한 방법이 사용될 수 있음을 인지할 것이다. 하나의 적합한 방법은 수소화 반응기에서 수소화된 생성물을 형성하기 위해 충분한 조건하에서 적합한 가스 및 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시키는 단계를 포함한다. 수소화 촉매는 일반적으로 단독으로, 또는 W, Mo, Au, Ag, Cr, Zn, Mn, Sn, B, P, Bi, 및 합금 또는 이의 조합체와 같은 촉진제와 함께 Cu, Re, Ni, Fe, Co, Ru, Pd, Rh, Pt, Os, Ir, 및 합금 또는 이의 조합체를 포함할 수 있다. 다른 효과적인 수소화 촉매 물질은 지지된 니켈 또는 레늄으로 변형된 루테늄을 포함한다. 하나의 양태에서, 수소화 촉매는 또한 촉매의 목적하는 기능성에 따라, 지지체 중 임의의 하나를 포함한다. 수소화 촉매는 당업자에게 공지된 방법에 의해 제조할 수 있다.
일부 실시형태에서, 수소화 촉매는 지지된 VIII족 금속 촉매 및 금속 스폰지 물질(예를 들어, 스폰지 니켈 촉매)을 포함한다. 라니 니켈은 본 발명에 사용하기에 적합한 활성화된 스폰지 니켈 촉매의 예를 제공한다. 다른 양태에서, 본 발명의 수소화 반응은 니켈-레늄 촉매 또는 텅스텐-변형된 니켈 촉매를 포함하는 촉매를 사용하여 수행한다. 본 발명의 수소화 반응을 위해 적합한 촉매의 예는 탄소 지지된 니켈-레늄 촉매이다.
하나의 양태에서, 적합한 라니 니켈 촉매는 예를 들어, 약 25중량%의 수산화나트륨을 함유하는 알칼리 수용액으로 대략 균등 중량의 니켈 및 알루미늄의 합금을 처리함에 의해 제조할 수 있다. 상기 알루미늄은 선택적으로 알칼리 수용액에 의해 용해되어 알루미늄이 최소량인 대부분 니켈을 포함하는 스폰지형 물질을 수득한다. 초기 합금은 약 1 내지 2중량%가 형성된 스폰지 니켈 촉매중에 잔류하도록 하는 양으로 촉진제 금속(즉, 몰리브덴 또는 크로뮴)을 포함한다. 또 다른 양태에서, 수소화 촉매는 물중에서 루테늄(III) 니트로실니트레이트, 루테늄(III) 클로라이드의 용액을 사용하여 적합한 지지체 물질을 침지시키기 위해 제조한다. 이어서 상기 용액을 건조시켜 수분 함량이 약 1중량% 미만인 고체를 형성한다. 상기 고체는 이어서 4시간 동안 회전볼 로내 300℃(하소되지 않음) 또는 400℃(하소됨)에서 수소 스트림 중에 대기압으로 감소시킬 수 있다. 촉매를 냉각시키고 질소로 촉매가 불활성이도록 한 후, 질소 중에 5 부피%의 산소를 2시간 동안 촉매 상에 통과시킨다.
특정 양태에서, 본 명세서에 기재된 촉매는 촉매 지지체를 포함한다. 상기 촉매 지지체는 촉매를 안정화시키고 지지한다. 사용되는 촉매 지지체의 유형은 선택된 촉매 및 반응 조건에 따라 다양하다. 본 발명에 적합한 지지체는 탄소, 실리카, 실리카-알루미나, 지르코니아, 티타니아, 세리아, 바나디아, 질화물, 질화붕소, 헤테로폴리산, 하이드록시애퍼타이트, 산화아연, 크로미아, 제올라이트, 탄소 나노튜브, 탄소 플러렌 및 이들의 임의의 조합체를 포함하지만 이에 제한되지 않는다.
본 발명에 사용되는 촉매는 당업자에게 공지된 통상적인 방법을 사용하여 제조할 수 있다. 적합한 방법은 초기 습윤화, 증발 침지, 화학적 증착, 세척-피복, 마그네트론 스퍼터링 기술 등을 포함할 수 있지만 이에 제한되지 않는다.
수소화 반응을 수행하기 위한 조건은 출발 물질 및 원하는 생성물의 유형에 따라 다양하다. 당업자는 본 명세서의 이점과 함께 적당한 반응 조건을 인식할 것이다. 일반적으로, 수소화 반응은 80℃ 내지 250℃ 및 바람직하게는 90℃ 내지 200℃, 및 가장 바람직하게는 100℃ 내지 150℃의 온도에서 수행한다. 일부 실시형태에서, 수소화 반응은 500 KPa 내지 14000 KPa에서 수행한다.
본 발명의 수소용해 반응에 사용되는 수소는 외부 소수, 재활용된 수소, 동일계 생성 수소 및 이의 임의의 조합을 포함할 수 있다. 본 명세서에 사용된 바와 같이, 용어 "외부 수소"는 바이오매스 반응 자체 기원이 아니고 또 다른 공급원으로부터 시스템에 첨가되는 수소를 언급한다.
본 발명의 몇몇 양태에서, 출발 탄수화물을, 목적하는 고급 탄화수소로 보다 용이하게 전환될 수 있는 소분자로 전환시키는 것이 바람직할 수 있다. 상기 전환을 위해 적합한 하나의 방법은 수소용해 반응을 통한 것이다. 다양한 방법이 탄수화물의 수소용해를 수행하기 위해 공지되어 있다. 하나의 적합한 방법은 소분자 또는 폴리올을 포함하는 반응 생성물을 형성하기에 충분한 조건하에서 수소용해 반응기내에서 적합한 가스 및 수소용해 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시키는 단계를 포함한다. 본 명세서에 사용된 바와 같이, 용어 "소분자 또는 폴리올"은 출발 탄수화물보다 소수의 탄소 공급원자 또는 산소 원자를 포함할 수 있는, 소분자량을 갖는 임의의 분자를 포함한다. 하나의 양태에서, 반응 생성물은 폴리올 및 알코올을 포함하는 더 작은 분자를 포함한다. 당업자는 수소용해 반응을 수행하기 위한 적당한 방법을 선택할 수 있다
일부 실시형태에서, 5 및/또는 6개 탄소 당 또는 당 알코올은 수소용해 촉매를 사용하여 프로필렌 글라이콜, 에틸렌 글라이콜 및 글라이세롤로 전환될 수 있다. 수소용해 촉매는 단독으로 또는 Au, Ag, Cr, Zn, Mn, Sn, Bi, B, O, 및 이의 합금 또는 이의 조합체와 같은 촉진제와 함께 Cr, Mo, W, Re, Mn, Cu, Cd, Fe, Co, Ni, Pt, Pd, Rh, Ru, Ir, Os, 및 이의 합금 또는 조합체를 포함할 수 있다. 수소용해 촉매는 또한 전이 금속(예를 들어, 크로뮴, 몰리브덴, 텅스텐, 레늄, 망간, 구리, 카드뮴) 또는 VIII족 금속(예를 들어, 철, 코발트, 니켈, 백금, 팔라듐, 로듐, 루테늄, 이리듐 및 오스뮴)을 함유하는 탄소성 파이로중합체를 포함할 수 있다. 특정 양태에서, 수소용해 촉매는 알칼린 토금속 산화물과 배합되거나 촉매적 활성 지지체에 부착된 임의의 상기 금속을 포함할 수 있다. 특정 양태에서, 수소용해 반응에 기재된 촉매는 수소화 반응을 위해 상기된 바와 같은 촉매 지지체를 포함할 수 있다.
수소용해 반응을 수행하기 위한 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 당업자는 본 명세서의 이득과 함께 반응을 수행하기 위해 사용하는 적당한 조건을 인지할 것이다. 일반적으로, 이들 수소용해 반응은 110℃ 내지 300℃ 및 바람직하게는 170℃ 내지 220℃, 및 가장 바람직하게는 200℃ 내지 225℃의 온도에서 수행한다. 일부 실시형태에서, 수소용해 반응은 염기성 조건, 바람직하게는 pH 8 내지 13, 및 보다 더 바람직하게는 pH 10 내지 12에서 수행한다. 일부 실시형태에서, 수소용해 반응은 60 KPa 내지 16500 KPa, 및 바람직하게는 1700KPa 내지 14000 KPa의 범위, 및 더 바람직하게는 4800 KPa 내지 11000 KPa의 압력에서 수행한다.
본 발명의 수소용해 반응에 사용되는 수소는 외부 수소, 재활용된 수소, 인시츄 생성 수소 및 이의 임의의 조합체를 포함할 수 있다.
몇몇 양태에서, 상기 논의된 반응 생성물은 축합 반응기에서 축합 반응을 통해 고급 탄화수소로 전환할 수 있다. 상기 양태에서, 반응 생성물의 축합은 고급 탄화수소를 형성할 수 있는 촉매의 존재 하에 수행한다. 본 이론에 의해 구속되지 않고, 고급 탄화수소의 생산은 탄소-탄소 또는 탄소-산소 결합의 형성을 포함하는 단계적 부가 반응을 통해 진행하는 것으로 믿어진다. 수득한 반응 생성물은 하기에 더 상세하게 기재되는 상기 잔기를 함유하는 임의의 수의 화합물을 포함한다.
특정 양태에서, 적합한 축합 촉매는 산 촉매, 염기 촉매 또는 산/염기 촉매를 포함한다. 본 명세서에 사용된 바와 같이, 용어 "산/염기 촉매"는 산 및 염기 기능 둘 다를 갖는 촉매를 언급한다. 몇몇 양태에서, 상기 축합 촉매는 제한 없이, 제올라이트, 카바이드, 질화물, 지르코니아, 알루미나, 실리카, 알루미노실리케이트, 포스페이트, 산화티탄, 산화아연, 산화바나듐, 산화란탄, 산화이트륨, 산화스칸듐, 산화마그네슘, 산화세륨, 산화바륨, 산화칼슘, 수산화물, 헤테로폴리산, 무기산, 산 변형된 수지, 염기 변형된 수지 및 이들의 임의의 조합체를 포함할 수 있다. 몇몇 양태에서, 축합 촉매는 또한 변형제를 포함할 수 있다. 적합한 변형제는 La, Y, Sc, P, B, Bi, Li, Na, K, Rb, Cs, Mg, Ca, Sr, Ba, 및 이들의 임의의 조합체를 포함한다. 몇몇 양태에서, 상기 축합 촉매는 또한 금속을 포함할 수 있다. 적합한 금속은 Cu, Ag, Au, Pt, Ni, Fe, Co, Ru, Zn, Cd, Ga, In, Rh, Pd, Ir, Re, Mn, Cr, Mo, W, Sn, Os, 합금 및 이들의 임의의 조합체를 포함한다.
특정 양태에서, 축합 반응에 기재된 촉매는 수소화 반응을 위해 상기된 바와 같은 촉매 지지체를 포함할 수 있다. 특정 양태에서, 축합 촉매는 자가 지지형이다. 본 명세서에 사용된 바와 같이, 상기 용어 "자가 지지형"은 촉매가 지지체로서 작용하기 위해 또 다른 물질을 필요로 하지 않는 것을 의미한다. 특정 양태에서, 상기 축합 촉매는 촉매를 현탁하기에 적합한 별도의 지지체와 함께 사용된다. 하나의 양태에서, 축합 촉매 지지체는 실리카이다.
응축 반응을 수행하는 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 당업자는 본 명세서의 이점과 함께 반응을 수행하는 적당한 조건을 인지할 것이다. 몇몇 양태에서, 응축 반응은 제안된 반응에 대한 열역학이 선호될 수 있는 온도에서 수행한다. 응축 반응을 위한 온도는 특정 출발 폴리올 또는 알코올에 따라 다양하다. 일부 실시형태에서, 응축 반응을 위한 온도는 80℃ 내지 500℃ 및 바람직하게는 125℃ 내지 450℃ 및 가장 바람직하게는 125℃ 내지 250℃의 범위이다. 일부 실시형태에서, 응축 반응은 0 Kpa 내지 9000 KPa 범위, 및 바람직하게는 0 KPa 내지 7000 KPa 범위, 및 더욱더 바람직하게는 0 KPa 내지 5000 KPa 범위의 압력에서 수행한다.
본 발명에 의해 형성되는 고급 알칸은 4 내지 30개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알칸, 4 내지 30개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알켄, 5 내지 30개의 탄소 공급원자를 갖는 사이클로알칸, 5 내지 30개의 탄소 공급원자를 갖는 사이클로알켄, 아릴, 융합된 아릴, 알코올 및 케톤을 포함하지만 이에 제한되지 않는다. 적합한 알칸은 뷰탄, 펜탄, 펜텐, 2-메틸뷰탄, 헥산, 헥센, 2-메틸펜탄, 3-메틸펜탄, 2,2-디메틸뷰탄, 2,3-디메틸뷰탄, 헵탄, 헵텐, 옥탄, 옥텐, 2,2,4-트라이메틸펜탄, 2,3-디메틸헥산, 2,3,4-트라이메틸펜탄, 2,3-디메틸펜탄, 노난, 노넨, 데칸, 데센, 운데칸, 운데센, 도데칸, 도데센, 트라이데칸, 트라이데센, 테트라데칸, 테트라데센, 펜타데칸, 펜타데센, 노닐데칸, 노닐데센, 에이코산, 에이코센, 운데이코산, 운데이코센, 도에이코산, 도에이코센, 트라이에이코산, 트라이에이코센, 테트라에이코산, 테트라에이코센 및 이들의 이성질체를 포함하지만 이에 제한되지 않는다. 이들 생성물 중 일부는 연료용으로 적합할 수 있다.
일부 실시형태에서, 사이클로알칸 및 사이클로알켄은 비치환된다. 다른 양태에서, 사이클로알칸 및 사이클로알켄은 1치환 된다. 여전히 또 다른 양태에서, 사이클로알칸 및 사이클로알켄은 다치환된다. 치환된 사이클로알칸 및 사이클로알켄을 포함하는 양태에서, 치환된 그룹은 제한 없이, 1 내지 12개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알킬, 1 내지 12개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알킬렌, 페닐 및 이의 조합체를 포함한다. 적합한 사이클로알칸 및 사이클로알켄은 사이클로펜탄, 사이클로펜텐, 사이클로헥산, 사이클로헥센, 메틸-사이클로펜탄, 메틸-사이클로펜텐, 에틸-사이클로펜탄, 에틸-사이클로펜텐, 에틸-사이클로헥산, 에틸-사이클로헥센, 이들의 이성질체 및 임의의 조합체를 포함하지만, 이에 제한되지 않는다.
일부 실시형태에서, 형성된 아릴은 비치환된다. 또 다른 양태에서, 형성된 아릴은 1치환된다. 치환된 아릴을 포함하는 양태에서, 치환된 그룹은 제한없이 1 내지 12개의 탄소 공급원자를 갖는 직쇄 또는 측쇄 알킬, 1 내지 12개의 탄소 공급원자를 갖는 측쇄 또는 직쇄의 알킬렌, 페닐, 및 이들의 임의의 조합체를 포함한다. 본 발명을 위해 적합한 아릴은 벤젠, 톨루엔, 크실렌, 에틸 벤젠, 파라실렌, 메타실렌 및 이들의 조합체를 포함한다.
본 발명에서 생성된 알코올은 4 내지 30개의 탄소 공급원자를 갖는다. 몇몇 양태에서, 알코올은 사이클릭이다. 다른 양태에서, 알코올은 측쇄이다. 또 다른 양태에서, 알코올은 직쇄이다. 본 발명의 적합한 알코올은 뷰탄올, 펜탄올, 헥산올, 헵탄올, 옥탄올, 노난올, 데칸올, 운데칸올, 도데칸올, 트라이데칸올, 테트라데칸올, 펜타데칸올, 헥사데칸올, 헵틸데칸올, 옥틸데칸올, 노닐데칸올, 에이코산올, 우네이코산올, 도에이코산올, 트라이에이코산올, 테트라에이코산올 및 이들의 이성질체를 포함하지만, 이에 제한되지 않는다.
본 발명에서 생성된 케톤은 4 내지 30개의 탄소 원자를 갖는다. 하나의 양태에서, 케톤은 사이클릭이다. 또 다른 양태에서, 상기 케톤은 측쇄이다. 또 다른 양태에서, 케톤은 직쇄이다. 본 발명을 위해 적합한 케톤은 뷰타논, 펜타논, 헥사논, 헵타논, 옥타논, 노나논, 데카논, 운데카논, 도데카논, 트라이데카논, 테트라데카논, 펜타데카논, 헥사데카논, 헵틸데카논, 옥틸데카논, 노닐데카논, 에이코사논, 우네이코사논, 도에이코사논, 트라이에이코사논, 테트라에이코사논, 및 이들의 이성질체를 포함하지만, 이에 제한되지 않는다.
또 다른 상기 화학적 변형은 상호에스터화가다. 천연적으로 생성된 글라이세로지질은 지방산 성분의 균일한 분포를 갖지 않는다. 오일과 관련하여, 상호에스터화는 상이한 글라이세로지질의 2개의 에스터간의 아실 라디칼의 교환을 언급한다. 상호 에스터화 공정은 글라이세로지질의 혼합물의 지방산 성분이 재정렬되어 분포 패턴을 변형시킬 수 있는 메커니즘을 제공한다. 상호 에스터화는 널리 공지된 화학적 공정이고 일반적으로 알칼리 금속 또는 알칼리 금속 알킬레이트(예를 들어, 나트륨 메톡시드)와 같은 촉매의 존재 하에 일정 시간(예를 들어, 30분) 동안 오일의 혼합물을 가열(약 200℃로)하는 단계를 포함한다. 이러한 공정을 사용하여 오일 혼합물의 지방산 성분의 분포 패턴을 무작위화 할 수 있거나 원하는 분포 패턴을 생성하도록 할 수 있다. 지질의 화학적 변형에 대한 상기 방법은, 지질로서 건조 세포 중량%가 적어도 20%인 미생물 바이오매스와 같은 본 명세서에 제공된 물질에 대해 수행할 수 있다.
지방산의 특정 분포 패턴이 요구되는 직접적인 상호 에스터화는 존재할 수 있는 몇몇 TAG의 융점 미만의 온도에서 오일을 유지시킴에 의해 수행할 수 있다. 이것은 이들 TAG를 선택적으로 결정화하고 이는 이들의 결정화에 의해 반응 혼합물로부터 이들을 효과적으로 제거한다. 상기 방법은 예를 들어, 오일 중 대부분의 지방산이 침전할 때까지 계속할 수 있다. 지시된 상호 에스터화 방법은 예를 들어 장쇄 지방산의 단쇄 대응물로 치환을 통해 더 낮은 칼로리 함량을 갖는 생성물을 제조하기 위해 사용될 수 있다. 직접적인 상호 에스터화는 또한 원치않는 트랜스 이성질체를 생성시킬 수 있는 수소화에 의지하는 것 없이 식품 부가물 또는 제품(예를 들어, 마가린)에서 요구되는 목적하는 융점 특성 및 구조적 특징을 제공할 수 있는 지방 혼합물을 갖는 생성물을 제조하기 위해 사용될 수 있다.
본 명세서에 기재된 방법에 의해 생성된 오일의 상호에스터화는 하기에 보고된 바와 같이 방법 및/또는 물질 중 하나 이상과 연계하여 또는 생성물을 생성하기 위해 수행할 수 있다: 미국 특허 제6,080,853호(비분해성 지방 대용물); 제4,288,378호(피넛 버터 안정제); 제5,391,383호(식용 스프레이 오일); 제6,022,577호(식품 생성물에 대한 식용 지방); 제5,434,278호(식품 생성물에 대한 식용 지방);제 5,268,192호(저칼로리 너트 생성물); 제5,258,197호(감소된 칼로리의 식용 조성물); 제4,335,156호(식용 지방 생성물); 제7,288,278호(식품 부가물 또는 의약); 제7,115,760호(분획 방법); 제6,808,737호(구조적 지방); 제5,888,947호(엔진 윤활제); 제5,686,131호(식용 오일 혼합물); 및 제4,603,188호(경화성 우레탄 조성물).
본 발명에 따른 하나의 양태에서, 이어서 상기된 바와 같은 오일의 에스터결합전이는 미국 특허 제6,465,642호에 보고된 바와 같이 에스터결합전이된 생성물을 폴리올과 반응시켜 폴리올 지방산 폴리에스터를 생성시킨다. 상기 에스터화 및 포화 공정은 하기와 같은 단계를 포함할 수 있다: 저급 알킬 에스테를 비누의 존재 하에 폴리올과 반응시키는 단계; 생성물 혼합물로부터 잔여 비누를 제거하는 단계; 생성물 혼합물을 물 세척 및 건조시켜 불순물을 제거하는 단계; 정련을 위해 생성물 혼합물을 표백시키는 단계; 생성물 혼합물중에 폴리올 지방산 폴리에스터로부터 미반응된 저급 알킬 에스터의 적어도 일부를 분리하는 단계; 및 분리된 미반응된 저급 알킬 에스터를 재사용하는 단계.
에스터결합전이는 또한 미국 특허 제6,278,006호에 보고된 바와 같은 단쇄 지방산 에스테를 갖는 미생물 바이오매스상에서 수행할 수 있다. 일반적으로, 에스터결합전이는 단쇄 지방산 에스터를 적합한 촉매의 존재 하에 오일에 부가하고 혼합물을 가열시킴에 의해 수행할 수 있다. 몇몇 양태에서, 상기 오일은 약 5중량% 내지 약 90중량%의 반응 혼합물을 포함한다. 몇몇 양태에서, 단쇄 지방산 에스터는 반응 혼합물의 약 10중량% 내지 약 50중량%일 수 있다. 촉매의 비제한적인 예는 염기 촉매, 나트륨 메톡사이드, 황산 및 산성화된 점토와 같은 무기산, 메탄 설폰산, 벤젠설폰산 및 톨루엔설폰산과 같은 유기산 및 Amberlyst 15와 같은 산성 수지를 포함하는 산 촉매를 포함한다. 나트륨 및 마그네슘과 같은 금속 및 금속 수소화물은 또한 유용한 촉매이다.
또 다른 당해 화학적 변형은 하이드록실화이고 이는 물을 이중 결합으로 부가하여 하이드록실 잔기의 포화 및 혼입을 유도한다. 상기 하이드록실화 공정은 글라이세로지질의 하나 이상의 지방산을 하이드록시 지방산으로 전환하기 위한 메커니즘을 제공한다. 하이드록실화는, 예를 들어 미국 특허 제5,576,027호에 보고된 바와 같은 방법을 통해 수행할 수 있다. 피마자 오일을 포함하는 하이드록실화된 지방산 및 이의 유도체는 식품 첨가제, 계면활성제, 안료 습윤제, 소포제, 방수 첨가제, 가소화제, 화장품 유화제 및/또는 탈취제를 포함하는 다수의 산업 응용 분야 및 전자, 약제, 페인트, 잉크, 접착제 및 윤활제에서 성분으로서 유용하다. 글라이세라이드의 하이드록실화가 수행되는 방법의 한 가지 예는 다음과 같다: 지방이 헵탄과 함께 바람직하게는 약 30 내지 50℃로 가열되고, 30분 이상 동안 그 온도에서 유지하며; 그 다음에 아세트산을 혼합물에 첨가한 후 황산 수용액, 과산화수소 수용액을 점진적 증가량으로 1시간 이상 동안 혼합물에 첨가하고; 수성 과산화수소 후에 온도를 이어서 약 60℃ 이상으로 증가시키고 6시간 이상 동안 교반하며; 교반 후 상기 혼합물이 침강하도록 두고, 반응에 의해 형성된 저급 수성 층을 제거하면서 반응에 의해 형성된 상부 헵탄층을 약 60℃의 온도를 갖는 고온수로 세척할 수 있고; 세척된 헵탄 층을 이어서 수산화칼륨 수용액을 사용하여 pH 약 5 내지 7로 중화시키고 이어서 진공 증류에 의해 제거할 수 있고; 반응 생성물을 이어서 100℃에서 진공 건조시킬 수 있고 건조된 생성물을 진공 조건하에 증기 탈취시키고 규조토를 사용하여 약 50℃ 내지 60℃에서 여과한다.
본원에 기재된 방법에 의해 생성된 미생물 오일의 하이드록실화는 하기에 보고된 바와 같이 상기 방법 및/또는 물질의 하나 이상과 연계하여 또는 생성물을 생성하기 위해 수행할 수 있다: 미국 특허 제6,590,113호(오일계 피복 및 잉크); 제4,049,724호(하이드록실화 반응); 제6,113,971호(올리브유 버터); 제4,992,189호 (윤활제 및 루브 첨가제); 제5,576,027호(하이드록실화된 우유); 및 제6,869,597호 (화장품).
하이드록실화된 글라이세로지질은 에스톨라이드로 전환시킬 수 있다. 에스톨라이드는 글라이세로지질로 이루어지고 여기서, 하이드록실화된 지방산 성분은 또 다른 지방산 분자에 에스터화시켰다. 하이드록실화된 글라이세로리피드의 에스톨라이드의 전환은 글라이세로지질 및 지방산의 혼합물을 가온하고 상기 혼합물을 문헌[Isbell et al., JAOCS 71(2): 169-174 (1994)]에 기재된 바와 같이 무기산과 접촉하는 것으로 수행할 수 있다. 에스톨라이드는, 제한없이 하기에 보고된 것들을 포함하는, 다양한 응용 분야에서 유용하다: 미국 특허 제7,196,124호(탄성 물질 및 바닥덮개); 제5,458,795호(고온 응용을 위한 증점 오일); 제5,451,332호(산업적 응용을 위한 유체); 제5,427,704호(연료 첨가제); 및 제5,380,894호(윤활제, 그리스, 기가소제 및 인쇄 잉크).
다른 이러한 화학적 변형은 올레핀 복분해이다. 올레핀 복분해에서, 촉매는 알켄(올레핀) 내 알킬리덴 탄소를 자르며, 상이한 알킬리덴 탄소와 그것들 각각을 짝지음으로써 새로운 알켄을 형성한다. 올레핀 복분해 반응은 에텐올분해(ethenolysis)에 의해 알켄에서 불포화 지방산 알킬쇄를 절단하는 단계, 자기-복분해에 의한 알켈 연결을 통해 지방산을 가교하는 단계, 유도체화된 알켄에 의한 교차-복분해로 지방산 상에 새로운 작용기를 포함하는 단계와 같은 공정을 위한 메커니즘을 제공한다.
에스터결합전이 및 수소화와 같은 다른 반응과 함께, 올레핀 복분해는 불포화 글라이세로지질을 다양한 최종 생성물로 전환할 수 있다. 이들 생성물은 왁스를 위한 글라이세로지질 올리고머; 윤활제를 위한 단쇄 글라이세로지질; 화학물질 및 폴리머를 위한 호모- 및 헤테로-2작용성 알킬쇄; 생물연료를 위한 단쇄 에스터; 및 제트 연료를 위한 단쇄 탄화수소를 포함한다. 올레핀 복분해는, 예를 들어 미국특허 제7,119,216호, 미국특허 공개번호 제2010/0160506호, 및 미국특허 공개번호 제2010/0145086호에 보고된 촉매 및 방법을 사용하여 트라이아실글라이세롤 및 지방산 유도체 상에서 수행될 수 있다.
바이오-오일의 올레핀 복분해는 일반적으로 다른 알켄의 존재(교차-복분해) 또는 부재(자기-복분해)에서 불포화 지방산 에스터에 대해 비활성인 조건 하에 약 10 내지 250 ppm의 부하에서 Ru 촉매 용액을 첨가하는 단계를 포함한다. 반응은 전형적으로 몇 시간 내지 며칠에 진행시키며, 궁극적으로 알켄 생성물의 분포를 얻는다. 올레핀 복분해가 지방산 유도체 상에서 수행될 수 있는 방법의 한 가지 예는 다음과 같다: 222 ppm의 촉매 부하에서 톨루엔 내 제1 세대 그럽스 촉매(Grubbs Catalyst)(다이클로로[(1-메틸에톡시-α-O)페닐]메틸렌-α-C](트라이사이클로헥실-포스핀) 용액이 탈기되고 건조된 메틸 올레이트를 함유하는 용기에 첨가될 수 있다. 그 다음에 용기는 약 60 psig의 에틸렌 기체와 함께 가압될 수 있고 약 30℃에서 또는 미만에서 3시간 동안 유지되며, 이에 의해 대략 50% 수율의 메틸 9-데세노에이트가 생성될 수 있다.
본 명세서에 기재된 방법으로 생성된 오일의 올레핀 복분해는 한 가지 이상의 방법 및/또는 재료와 함께, 또는 생성물을 생성하기 위해 다음에 보고되는 바와 같이 수행될 수 있다: 국제특허출원 PCT/US07/081427(α-올레핀 지방산) 및 미국특허 출원 제12/281,938호(페트로륨 크림), 12/281,931(페인트볼 건 캡슐), 12/653,742(가소제 및 윤활제), 12/422,096(2작용성 유기 화합물), 및 11/795,052(양초 왁스).
미생물 오일상에서 수행될 수 있는 다른 화학적 반응은 미국 특허 제6,051,539호에 보고된 바와 같이 트라이아실글라이세롤과 사이클로프로판화제와 반응시켜 유동성 및/또는 산화성 안정을 향상시키는 것; 미국 특허 제6,770,104호에 보고된 바와 같이 트라이아실글라이세롤로부터 왁스를 제조하는 것; 및 문헌["The effect of fatty acid composition on the acrylation kinetics of epoxidized triacylglycerols", Journal of the American Oil Chemists' Society, 79:1, 59-63, (2001) 및 Free Radical Biology and Medicine, 37:1, 104-114 (2004)]에 보고된 바와 같이 트라이아실글라이세롤을 에폭시화시키는 것을 포함한다.
상기된 바와 같이 연료 및 화학적 생성물에 대한 오일 함유 마생물 바이오매스의 생성은 탈지된 바이오매스 음식물을 생성시킨다. 탈지된 음식물은 조류 오일을 제조하는데 있어서의 부산물이고 농장 동물, 예를 들어, 반추동물, 가금류, 돼지 및 양식물고기에 대한 동물 사료로서 유용하다. 수득한 밀은 오일 함량이 감소하였지만 여전히 단백질, 탄수화물, 섬유, 재, 잔류 오일 및 동물 사료에 적당한 다른 영양물 함량이 높다. 세포는 주로 오일 분리공정에 의해 용해되기 때문에 탈지된 음식물은 상기 동물에 의해 쉽게 소화될 수 있다. 탈지된 음식물은 임의로 동물 사료에서 곡물과 같은 다른 성분과 배합될 수 있다. 탈지된 음식물은 분말성 점도를 갖기 때문에, 이것은 압출기 또는 확장기 또는 상업적으로 입수가능한 다른 유형의 기계를 사용하여 펠렛으로 압착될 수 있다.
상기에서 상세하게 기재된 본 발명은 하기의 실시예에 예시되지만 이는 청구된 발명을 설명하기 위해 제공되지만, 이에 제한되지 않는다.
VII. 실시예
실시예 1: 프로토테카의 배양 방법
프로토테카 균주는 건조 세포 중량을 기준으로 높은 %의 오일을 달성하기 위해 배양하였다. 동결보존된 세포를 실온에서 해동시키고 500㎕의 세포를 4.5㎖의 배지(4.2g/ℓ K2HPO4, 3.1g/ℓ NaH2PO4, 0.24g/ℓ MgSO4·7H2O, 0.25g/ℓ 시트르산 1수화물, 0.025g/ℓ CaCl2 2H2O, 2g/ℓ 효모 추출물) + 2% 글루코스에 첨가하고 6웰 플레이트에서 진탕(200rpm)과 함께 7일 동안 28℃에서 배양하였다. 건조 세포 중량은 1㎖의 배양물을 사전 칭량한 에펜도르프 튜브에서 5분 동안 14,000 rpm에서 원심분리하여 결정하였다. 배양 상청액을 버리고 수득한 세포 펠렛을 1㎖의 탈이온수로 세척하였다. 배양물을 다시 원심분리하고 상청액을 버리고 세포 펠렛을 동결될 때까지 -80℃에 두었다. 이어서 샘플을 24시간 동안 동결건조시키고 건조 세포 중량을 계산하였다. 배양물 중 총 지질을 결정하기 위해, 3㎖의 배양물을 제거하고 제조업자의 프로토콜에 따라 Ankom 시스템(뉴욕주 메이스던에 소재한 Ankom Inc.)을 사용하여 분석하였다. 샘플은 제조업자의 프로토콜에 따라 Amkom XT10 추출기로 용매 추출에 적용하였다. 총 지질은 산 가수분해된 건조 샘플 및 용매 용매 추출된 건조 샘플 간의 샘플 차이로서 결정하였다. 오일 건조 세포 중량 % 측정은 표 10에 나타낸다.
건조세포 중량으로 오일%
균주 오일%
프로토테카 스타그노라 UTEX 327 13.14
프로토테카 모리포미스 UTEX 1441 18.02
프로토테카 모리포미스 UTEX 1435 27.17
프로토테카 속 유래의 다양한 균주로부터의 미세조류 샘플을 유전자형으로 분류하였다. 게놈 DNA를 다음과 같이 조류 바이오매스로부터 분리하였다. 세포(대략 200㎎)를 14,000 x g에서 5분 동안 배양물로부터 원심분리하였다. 세포를 이어서 멸균 증류수에 재현탁시키고 14,000 x g에서 5분 동안 원심분리하고 상청액을 버렸다. 직경이 약 2㎜인 단일 유리 비드를 바이오매스에 첨가하고 튜브를 15분 이상 동안 -80℃에 위치시켰다. 샘플을 제거하고 150㎕의 분쇄 완충제(1% 사르코실(Sarkosyl), 0.25 M 수크로스, 50 mM NaCl, 20 mM EDTA, 100 mM Tris-HCl, pH 8.0, RNase A 0.5㎍/㎕)를 첨가하였다. 펠렛을 간단히 교반하여 재현탁시키고 이어서 40㎕의 5M NaCl를 첨가하였다. 샘플을 간단하게 교반하고 이어서 66㎕의 5% CTAB(세틸 트라이메틸암모늄 브로마이드)를 첨가하고 최종적으로 간단하게 교반하였다. 다음에 샘플을 10분 동안 65℃에서 배양하고 이후 이들을 10분 동안 14,000 x g에서 원심분리하였다. 상기 상청액을 새로운 튜브로 옮기고 300㎕의 페놀:클로로포름:아이소아밀알코올 12:12:1로 1회 추출함에 이어서 14,000 x g에서 5분 동안 원심분리하였다. 수득한 수성 상을 0.7 용적의 아이소프로판올(약 190㎕)을 함유하는 새로운 튜브로 옮기고 뒤집어서 혼합하고 30분 동안 실온에서 또는 밤새 4℃에서 인큐베이션하였다. DNA를 10분 동안 14,000 x g에서 원심분리를 통해 회수하였다. 이어서 수득한 펠렛을 70% 에탄올로 2회 세척함에 이어서 100% 에탄올로 최종 세척하였다. 펠렛을 실온에서 20분 내지 30분 동안 공기 건조시킨 후 50㎕의 1OmM TrisCl, 1mM EDTA (pH 8.0)중에 현탁시켰다.
상기된 바와 같이 제조된 5㎕의 총 조류 DNA를 10mM Tris(pH 8.0)중에서 1:50으로 희석시켰다. 최종 용적 20㎕의 PCR 반응물을 다음과 같이 셋-업하였다. 10㎕의 2 x iProof HF 마스터 믹스(BIO-RAD)를 0.4㎕의 프라이머 SZ02613(10mM 스톡 농도에서 5'-TGTTGAAGAATGAGCCGGCGAC-3'(서열번호9))에 첨가하였다. 상기 프라이머 서열은 GenBank 등록번호 L43357에서 567번 내지 588번이고 고등 식물 및 조류 플라스티드 게놈에서 고도로 보존되어 있다. 이어서 0.4㎕의 프라이머 SZ02615(10mM 스톡 농도에서 (5'-CAGTGAGCTATTACGCACTC-3'(서열번호10))를 첨가하였다. 상기 프라이머 서열은 GenBank 등록번호 L43357에서 1112번 내지 1093번 위치에 상보적이고 고등 식물 및 조류 플라스티드 게놈에서 고도로 보존되어 있다. 다음에, 5㎕의 희석된 총 DNA 및 3.2㎕의 dH2O를 첨가하였다. PCR 반응을 다음과 같이 수행하였다: 35주기 동안 98℃, 45"; 98℃, 8"; 53℃, 12"; 72℃, 20" 에 이어서 1분 동안 72℃에서 수행하고 25℃에 유지시킨다. PCR 생성물의 정제를 위해, 20㎕의 10 mM Tris(pH 8.0)를 각각의 반응물에 첨가하고 이어서 40㎕의 페놀:클로로포름:아이소아밀 알코올 12:12:1로 추출하고, 교반하고 5분 동안 14,000 x g에서 원심분리한다. PCR 반응을 S-400 칼럼(GE Healthcare)에 적용하고 3,000 x g에서 2분 동안 원심분리하였다. 정제된 PCR 생성물을 이어서 PCR8/GW/TOPO으로 TOPO 클로닝하고 포지티브 클론을 LB/Spec 플레이트를 위해 선택하였다. 정제된 플라스미드 DNA를 M13 전방 및 역방향 프라이머를 사용하여 양 방향으로 서열 분석하였다. 전체적으로, 12개의 프로토테카 균주는 서열분석된 이들의 23S rRNA DNA를 갖도록 선택하고 상기 서열을 서열 목록중에 열거한다. 균주 및 서열 번호에 대한 요약은 하기에 포함된다. 상기 서열은 UTEX 1435(서열번호 15) 서열로부터 총 분기점에 대해 분석하였다. 2개의 쌍(UTEX 329/UTEX 1533 및 UTEX 329/UTEX 1440)이 가장 분기된 것으로서 나타났다. 양 경우에, 쌍 형성 정렬은 75.0% 쌍 형성 서열 동일성을 나타내었다. UTEX 1435에 대한 서열 동일성%는 또한 하기에 포함된다.
Figure 112018108415035-pat00014
상기된 균주의 서브셋트 기원의 지질 샘플은 HPLC를 사용하여 지질 프로파일에 대해 분석하였다. 결과는 하기 표 11에 나타낸다.
프로토테카 종에서 지질 쇄의 다양성
균주 C14:0 C16:0 C16:1 C18:0 C18:1 C18:2 C18:3 C20:0 C20:1
UTEX 327 0 12.01 0 0 50.33 17.14 0 0 0
UTEX 1441 1.41 29.44 0.70 3.05 57.72 12.37 0.97 0.33 0
UTEX 1435 1.09 25.77 0 2.75 54.01 11.90 2.44 0 0
프로토테카 모리포미스 UTEX 1435로부터 추출된 오일(용매 추출을 통해 또는 익스펠러 프레스를 사용하여)을 카르테노이드, 엽록소, 토코페롤, 기타 스테롤 및 토코트라이엔올에 대해 분석하였다. 결과를 이하의 표 12에 요약한다.
프로토테카 모리포미스(UTEX 1435)로부터 추출된 오일 내 카로테노이드, 엽록소, 토코페롤/스테롤 및 토코트라이엔올
압축 오일
(mcg/㎖)
용매 추출 오일(mcg/㎖)
시스-루테인 0.041 0.042
트랜스-루테인 0.140 0.112
트랜스-제아잔틴 0.045 0.039
시스-제아잔틴 0.007 0.013
t-알파-크립토잔틴 0.007 0.010
t-베타-크립토잔틴 0.009 0.010
t-알파-카로텐 0.003 0.001
c-알파-카로텐 검출되지 않음 검출되지 않음
t-베타-카로텐 0.010 0.009
9-시스-베타-카로텐 0.004 0.002
라이코펜 검출되지 않음 검출되지 않음
전체 카로테노이드 0.267 0.238
엽록소 <0.01 ㎎/㎏ <0.01 ㎎/㎏
토코페롤 및 스테롤
압축 오일 (㎎/100g) 용매 추출 오일 (㎎/100g)
감마 토코페롤 0.49 0.49
캄페스테롤 6.09 6.05
스티그마스테롤 47.6 47.8
베타-시토스테롤 11.6 11.5
기타 스테롤 445 446
토코트라이엔올
압축 오일 (㎎/g) 용매 추출 오일 (㎎/g)
알파 토코트라이엔올 0.26 0.26
베타 토코트라이엔올 <0.01 <0.01
감마 토코트라이엔올 0.10 0.10
델타 토코트라이엔올 <0.01 <0.01
전체 토코트라이엔올 0.36 0.36
4개의 별개의 로트로부터 프로토테카 모르포미스로부터 추출한 오일을 정제하고 표쥰 식물 오일 처리 방법을 사용하여 표백하였다. 간략하게, 프로토테카 모르포미스로부터 추출한 미정제 오일을 수평 디캔터 내에서 정제하며, 고체를 오일로부터 분리하였다. 그 다음에 정제한 오일을 시트르산 및 물과 함께 탱크에 옮겼고, 대략 24시간 동안 방치하였다. 24시간 후, 탱크 내 혼합물은 2개의 별개의 층을 형성하였다. 바닥층은 물 및 검을 포함하였고, 그 다음에 디캔테이션으로 제거한 후, 탈검화된 오일을 표백 탱크에 옮겼다. 그 다음에 다른 용량의 시트르산과 함께 가열하였다. 그 다음에 표백토를 표백 탱크에 첨가하였고, 혼합물을 진공 하에 추가로 가열하여 존재하는 어떤 물을 증발시켰다. 그 다음에 표백토를 제거하기 위하여 혼합물을 잎 여과기를 통해 펌핑하였다. 이어서 여과한 오일을 최종 5㎛ 폴리슁 필터를 통과시킨 다음, 사용까지 저장을 위해 수집하였다. 그 다음에 정제하고 표백한(refined and bleached, RB) 오일을 카로테노이드, 엽록소, 스테롤, 토코트라이엔올 및 토코페롤에 대해 분석하였다. 이들 분석의 결과를 이하의 표 13에 요약한다. "Nd"는 검출되지 않음을 의미하며 검출의 민감도는 이하에 열거한다:
검출의 민감도
카로테노이드(mcg/g) nd = <0.003 mcg/g
엽록소(mcg/g) nd = <0.03 mcg/g
스테롤(%) nd = 0.25%
토코페롤(mcg/g); nd = 3 mcg/g
정제 및 표백한 프로토테카 모리포미스 오일로부터 유래된 카로테노이드 , 엽록소, 스테롤, 토코트라이엔 및 토코페롤 분석
로트 A 로트 B 로트 C 로트 D
카로테노이드 ( mcg /g)
루테인 0.025 0.003 nd 0.039
제아잔틴 nd nd nd nd
시스-루테인/제아잔틴 nd nd nd nd
트랜스-알파-크립토잔틴 nd nd nd nd
트랜스-베타-크립토잔틴 nd nd nd nd
트랜스-알파-카로텐 nd nd nd nd
시스-알파-카로텐 nd nd nd nd
트랜스-베타-카로텐 nd nd nd nd
시스-베타-카로텐 nd nd nd nd
라이코펜 nd nd nd nd
미확인 0.219 0.066 0.050 0.026
전체 카로테노이드 0.244 0.069 0.050 0.065
엽록소 ( mcg /g)
엽록소 A 0.268 0.136 0.045 0.166
엽록소 B nd nd nd nd
전체 엽록소 0.268 0.136 0.045 0.166
스테롤 ( % )
브라시카스테롤 nd nd nd nd
캄페스테롤 nd nd nd nd
스티그마스테롤 nd nd nd nd
베타-시토스테롤 nd nd nd nd
전체 스테롤 nd nd nd nd
토코페롤 ( mcg /g)
알파-토코페롤 23.9 22.8 12.5 8.2
베타-토코페롤 3.72 nd nd nd
감마-토코페롤 164 85.3 43.1 38.3
델타-토코페롤 70.1 31.1 18.1 14.3
전체 토코페롤 262 139.2 73.7 60.8
토코트라이엔올 ( mcg /g)
알파-토코트라이엔올 190 225 253 239
베타-토코트라이엔올 nd nd nd nd
감마-토코트라이엔올 47.3 60.4 54.8 60.9
델타-토코트라이엔올 12.3 16.1 17.5 15.2
전체 토코트라이엔올 250 302 325 315
프로토테카 포리포미스의 동일한 4가지 로트를 또한 미량원소에 대해 분석하였고, 결과를 이하의 표 14에 요약한다.
정제 및 표백한 프로토테카 모리포미스 오일의 원소 분석
로트 A 로트 B 로트 C 로트 D
원소 분석(ppm)
칼슘 0.08 0.07 < 0.04 0.07
< 0.2 0.38 < 0.2 0.33
나트륨 < 0.5 0.55 < 0.5 < 0.5
칼륨 1.02 1.68 < 0.5 0.94
마그네슘 < 0.04 < 0.04 < 0.04 0.07
망간 < 0.05 < 0.05 < 0.05 < 0.05
< 0.02 < 0.02 < 0.02 < 0.02
아연 < 0.02 < 0.02 < 0.02 < 0.02
구리 < 0.05 < 0.05 < 0.05 < 0.05
2.55 4.45 2.36 4.55
< 0.2 < 0.2 < 0.2 < 0.2
규소 0.37 0.41 0.26 0.26
니켈 < 0.2 < 0.2 < 0.2 < 0.2
유기 염화물 < 1.0 < 1.0 < 1.0 2.2
무기 염화물 < 1.0 < 1.0 < 1.0 < 1.0
질소 4.4 7.8 4.2 6.9
리튬 < 0.02 < 0.02 < 0.02 < 0.02
붕소 0.07 0.36 0.09 0.38
알루미늄 -- < 0.2 < 0.2 < 0.2
바나듐 < 0.05 < 0.05 <0.05 < 0.05
로비본드 색도( °L )
적색 5.0 4.3 3.2 5.0
황색 70.0 70.0 50.0 70.0
HPLC에 의한 모노 및 다이글라이세라이드 ( % )
다이글라이세라이드 1.68 2.23 1.25 1.61
모노글라이세라이드 0.03 0.04 0.02 0.03
유리 지방산(Free fatty acid, FFA) 1.02 1.72 0.86 0.83
비누 0 0 0
산화 및 폴리머화된 트라이글라이세라이드
산화된 트라이글라이세라이드(%) 3.41 2.41 4.11 1.00
폴리머화된 트라이글라이세라이드(%) 1.19 0.45 0.66 0.31
과산화물값(meg/kg) 0.75 0.80 0.60 1.20
p-아니시딘값(무차원)
5.03 9.03 5.44 20.1
물 및 기타 불순물( % )
카를 피셔 수분 0.8 0.12 0.07 0.18
전체 극성 화합물 5.02 6.28 4.54 5.23
불검화물 0.92 1.07 0.72 1.04
불용성 불순물 <0.01 <0.01 0.01 < 0.01
전체 오일( % )
중성오일 98.8 98.2 99.0 98.9
실시예 2: 프로토테카의 바이오리스틱 형질전환을 위한 일반적 방법
Seashell Gold Microcarriers 550 나노미터를 제조업자의 프로토콜에 따라 제조하였다. 플라스미드(20㎍)를 50㎕의 결합 완충제와 60㎕(30 mg)의 S550d 골드 캐리어와 혼합하고 얼음 상에서 1분 동안 인큐베이션하였다. 침전 완충제(100㎕)를 첨가하고 상기 혼합물을 또 다른 1분 동안 얼음에서 인큐베이션하였다. 교반한 후, DNA-코팅된 입자를 10초 동안 에펜도르프 5415C 소형 원심분리기 내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500㎕의 차가운 100% 에탄올로 1회 세척하고, 소형 원심분리기에서 간단히 회전시켜 펠렛화하고 50㎕의 빙냉 에탄올과 함께 재현탁하였다. 간략한 (1 내지 2초) 초음파 처리 후, 10㎕의 DNA-코팅된 입자를 즉시 캐리어 막에 이동시켰다.
프로토테카 균주를 이의 세포 밀도가 2 x 106 세포/㎖가 될 때까지 회전 진탕기 상에서 2% 글루코스와 함께 프로테오스 배지(2g/ℓ 효모 추출물, 2.94mM NaNO3, 0.17mM CaCl2ㆍ2H2O, 0.3mmMgSO4ㆍ7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 중에서 성장시켰다. 상기 세포를 채취하고 멸균 증류수로 1회 세척하고 50㎕의 배지에 재현탁시켰다. 1 x 107 세포를 비선택적 프로테오스 배지 플레이트의 삼등분의 가운데 지점에 도말하였다. 상기 세포를 PDS-1000/He 유전자 주입 입자 전달 시스템(Biolistic Particle Delivery system)(Bio-Rad)으로 충격을 가했다. 파열 디스크(1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 조립체 6㎝ 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회수 시 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100㎕의 배지와 혼합하고 적당한 선택 항생제를 함유하는 플레이트상에 도말하였다. 배양 7 내지 10일 후에 25℃에서, 플레이트 상에 형질전환 세포를 나타내는 콜로니가 확인되었다. 콜로니를 집어내고 두 번째 선택용 선택(항생제 또는 탄소 공급원 중 하나) 한천 플레이트상에 스팟팅하였다.
실시예 3: 클로렐라의 형질전환
벡터 구성
CMV 프로모터, 하이드로마이신 내성 cDNA, 및 CMV 3'UTR(서열번호 152, pCAMBIA1380 벡터의 하위 서열, 호주 캔버라 캄비아)을 함유하는 BamHI-SacII 단편을 pBluescript의 BamHI 및 SacII 부위에 클로닝하였고, 본 명세서에서 pHyg로 언급한다.
클로렐라의 바이오리스틱 형질전환
Seashell Technology제의 S550d 골드 캐리어를 제조업자의 프로토콜에 따라서 제조하였다. 선형화된 pHyg 플라스미드(20㎍)를 50㎕의 결합 완충제와 60㎕(30 mg)의 S550d 골드 캐리어와 혼합하고 얼음 상에서 1분 동안 인큐베이션하였다. 침전 완충제(100㎕)를 첨가하고 상기 혼합물을 또 다른 1분 동안 얼음에서 인큐베이션하였다. 교반한 후, DNA-코팅된 입자를 10초 동안 에펜도르프 5415C 소형 원심분리기 내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500㎕의 차가운 100% 에탄올로 1회 세척하고, 소형 원심분리기에서 간단히 회전시켜 펠렛화하고 50㎕의 빙냉 에탄올과 함께 재현탁하였다. 간략한 (1 내지 2초) 초음파 처리 후, 10㎕의 DNA-코팅된 입자를 즉시 캐리어 막에 이동시켰다.
클로렐라 프로토테카 배양물(Univeristy of Texas Culture Collection 250)을 이의 세포 밀도가 2 x 106 세포/㎖가 될 때까지, 75㎛ol 광자 m-2 sec-1의 연속적 빛 하에 선회 진탕기 상에서 프로테오스 배지(2g/ℓ 효모 추출물, 2.94mM NaNO3, 0.17mM CaC12ㆍ2H2O, 0.3mmMgSO4ㆍ7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 중에서 성장시켰다. 상기 세포를 채취하고 멸균 증류수로 1회 세척하고 50㎕의 배지에 재현탁시켰다. 1 x 107 세포를 비선택적 프로테오스 배지 플레이트의 삼등분의 가운데 지점에 도말하였다. 상기 세포를 PDS-1000/He 유전자 주입 입자 전달 시스템(Biolistic Particle Delivery system)(Bio-Rad)으로 충격을 가했다. 파열 디스크(1100 및 1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 조립체 9 및 12㎝ 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회수 시 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100㎕의 배지와 혼합하고 하이그로마이신 함유 플레이트 상에 도말하였다(200㎍/㎖). 25℃에서 배양 7 내지 10일 후에, 1100 및 1350 psi 파열 디스크로부터 및 9 및 12㎝ 거리로부터 플레이트상에 형질전환 세포를 나타내는 콜로니가 확인되었다. 콜로니를 집어내고 두 번째 선택용 선택 한천 플레이트 상에 스팟팅하였다.
전기천공에 의한 클로렐라의 형질전환
클로렐라 프로토테코이데스 배양물을 세포 밀도가 2 x 106 세포/㎖가 될 때까지 75㎛ol 광자 m-2 sec-1의 연속적 빛 하에 선회 진탕기 상에서 프로테오스 배지 중에서 성장시켰다. 상기 세포를 채취하고 멸균 증류수로 1회 세척하고 50mM 수크로스를 함유하는 트리스-인산염 완충제(20mM Tris-HCl, pH 7.0; 1 mM 인산칼륨) 중에서 4 x 108세포/㎖ 밀도로 재현탁하였다. 약 250㎕ 세포 현탁액(1x108 세포)를 4㎜ 갭의 일회용 전기천공 큐벳에 넣었다. 세포 현탁액에, 5㎍의 선형화된 pHyg 플라스미드 DNA 및 200㎍의 운반 DNA(절단한 연어 정자 DNA)를 첨가하였다. 그 다음에 전기천공 큐벳을 16℃ 수욕 내에서 10분 동안 인큐베이션하였다. 그 다음에 Gene Pulser II(캘리포니아주 허큘리스에 소재한 Bio-Rad Labs) 전기천공 장치를 사용하여 전기적 펄스(1100 V/cm)를 25 μF(전기천공에 사용되는 분류기는 없다)의 정전 용량에서 큐벳에 적용하였다. 그 다음에 큐벳을 실온에서 5분 동안 인큐베이션한 후, 세포 현탁액을 50㎖의 프로테아제 배지에 옮겼으며, 2일 동안 선회 진탕기 상에서 진탕하였다. 회수 후, 세포를 저속에서 원심분리로 채취하였고, 프로테오스 배지 내에서 재현탁하였으며, 200㎍/㎖ 하이그로마이신으로 보충한 플레이트 상에서 저밀도로 플레이팅하였다. 플레이트를 75㎛ol 광자 m-2 sec-1에서 연속적 빛 하에 인큐베이션하였다. 형질전환체는 1 내지 2주 내 콜로니로 나타났다. 콜로니를 집어내고 두 번째 선택용 선택 한천 플레이트상에 스팟팅하였다.
지노타이핑
2차 선택에서 살아남은 콜로니의 서브세트를 작은 부피로 배양하였고 채취하였다. 대략 5 내지 10㎕ 부피를 50㎕의 10mM NaEDTA 중에서 재현탁한 다음, 100℃에서 10분 동안 인큐베이션하였다. 그 다음에 튜브를 간단히 교반하였고 10초 동안 음파처리한 다음, 12,000 x g에서 1분 동안 원심분리하였다. 주형으로서 2㎕의 상청액을 50㎕ PCR 반응 중에서 사용하였다. 지노타이핑을 위해 사용한 프라이머는 서열번호 153 및 서열번호 154이었다. PCR 조건은 다음과 같다: 95℃ 5 분 x 1 주기; 95℃ 30 초 - 58℃ 30 초 - 72℃ 1 분 30초 x 35 주기; 72℃ 10 분 x 1 주기. 예상한 992 bp 단편을 바이오리스틱 방법으로부터 및 단일 전기천공 콜로니로부터 10개 중 6개 콜로니에서 발견하였다. 더 작은 크기의 비특이적 밴드가 모든 레인에 존재하였다. 증폭된 992bp 단편의 동일성을 확인하기 위하여, 2개의 바이오리스틱 밴드 및 전기천공 밴드를 겔로부터 절단하였고, 개별적으로 시퀀싱하였다. 모든 3개의 밴드 서열은 예상한 992 bp 단편에 대응한다(DNA 래더: Bionexus(등록상표) All Purpose Hi-Lo(등록상표) DNA 래더 카탈로그 # BN2050).
실시예 4: 미세조류에서 사용을 위한 조류-유래 프로모터 및 유전자
A. 클로렐라 프로토테코이데스 유래의 5'UTR 및 프로모터 서열
cDNA 라이브러리를 표준 기술을 사용하여 혼합영양(mixotrophically)으로 성장한 클로렐라 프로토테코이데스(UTEX 250)로부터 생성하였다. cDNA 서열을 기준으로, 씨진의 DNA 워킹 키트(Seegene's DNA Walking kit)(매릴랜드주 락빌에 소재)를 사용하여 암호화 영역의 상류를 "워크(walk)"하기 위해 특정 공지된 하우스키핑(housekeeping) 유전자에서 설계하였다. 분리된 서열은 액틴(서열번호 155) 및 연장 인자-1a(EF1a)(서열번호 156) 프로모터/UTR를 포함하고 이 둘 다는 인트론(하한부에 나타낸 바와 같이) 및 엑손(이탤릭체의 대문자) 및 예측된 개시 부위(볼드체) 및 2개의 베타-튜불린 프로모터/UTR 요소, 아이소폼 A(서열번호 157) 및 아이소폼 B(서열번호 158)를 함유한다.
B. 클로렐라 프로토테코이데스 유래의 지질 생합성 효소 및 플라스티드 표적화 서열
상기된 cDNA 라이브러리로부터, 클로렐라 프로토테코이데스(UTEX 250)에서 지질 대사에서 작용성인 단백질을 암호화하는 3개의 cDNA를 상기된 바와 동일한 방법을 사용하여 클로닝하였다. 아실 ACP 불포화효소(서열번호 159 및 160) 및 2개의 게라닐 게라닐 디포스페이트 신타제(서열번호 161 내지 164)에 대한 뉴클레오타이드 및 아미노산 서열은 하기 서열목록에 포함된다. 추가로, 플라스티드에 표적화하는 추정 신호 서열을 갖는 3개의 cDNA를 또한 클로닝하였다. 글라이세르알데하이드-3-포스페이트 탈수소효소(서열번호 165 및 166)에 대한 뉴클레오타이드 및 아미노산 서열, 산소 방출 복합 단백질 OEE33(서열번호 167 및 168) 및 CIp 프로테아제(서열번호 169 및 170)은 하기 서열목록에 포함된다. 추정 플라스티드 표적화 서열은 뉴클레오타이드 및 아미노산 서열 둘 다에 밑줄쳐 있다. 상기 플라스티드 표적화 서열은 지질 변형 효소와 같은 전이유전자 생성물을 미생물의 플라스티드에 표적화하는데 사용될 수 있다.
실시예 5: 외인성 수크로스 인버타제를 발현하기 위한 클로렐라 프로토테코이데스의 유전자조작
균주 및 배지: 클로렐라 프로토테코이데스(UTEX 250)를 텍사스 유니버시티의 조류 배양물 수집 기관(미국 텍사스주 오스틴에 소재한 Culture Collection of Alga at the University of Texas)으로부터 얻었다. 변형 프로테오스 배지 상에서 보존 배양을 유지하였다. 변형 프로테오스 배지는 0.25 g NaNO3, 0.09 g K2HPO4, 0.175 g KH2PO4 0.025 g, 0.025 g CaCl2·2H2O, 0.075 g MgSO4·7H2O, 및 리터 당 2 g의 효모 추출물(g/ℓ)로 이루어진다.
플라스미드 구성: 클로렐라 프로토테코이데스 내 인버타제의 분비 형태를 표현하기 위하여, 사카로마이세스 세레비시애 SUC2 유전자를 3개의 상이한 프로모터 대조군 하에 두었다: 카울리플라워 모자이크 바이러스 35S 프로모터(CMV), 클로렐라 바이러스 프로모터(NC-1A), 및 클로렐라 HUP1 프로모터. 클로렐라 프로토테코이데스에 대해 최적화된 코돈 사용빈도를 수용하기 위해 효모 SUC2 유전자를 합성하였고, 인버타제의 세포외 분비를 지시하는데 필요한 단일 서열을 포함한다. pBluescript KS+, 및 EcoRI/AscI, AscI/XhoI, 및 XhoI/BamHI 부위에 구성된 각 구성체는 특정 프라이머를 사용하는 PCR 증폭에 의해 각 프로모터, 인버타제 유전자, 및 CMV 3'UTR에 각각 도입되었다. 정제된 PCR 생성물을 순차적으로 클로닝하였다.
클로렐라 프로테코이데스의 형질전환: 클로렐라 프로테코이데스 배양물을 세포 밀도가 6 x 106 세포/㎖가 될 때까지 75㎛ol 광자 m-2 sec-1의 연속적 빛 하에 선회 진탕기 상에서 프로테오스 배지 중에서 성장시켰다.
바이오리스틱 형질전환을 위하여, Seashell Technology제의 S550d 골드 캐리어를 제조업자의 프로토콜에 따라서 제조하였다. 간략하게, BsaI로 선형화된 구성체(20㎍)를 50㎕의 결합 완충제와 60㎕(3 ㎎)의 S550d 골드 캐리어와 혼합하고 얼음 상에서 1분 동안 인큐베이션하였다. 침전 완충제(100㎕)를 첨가하고 상기 혼합물을 또 다른 1분 동안 얼음에서 인큐베이션하였다. 약하게 교반한 후, DNA-코팅된 입자를 10초 동안 에펜도르프 원심분리기 내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500㎕의 차가운 100% 에탄올로 1회 세척하고, 소형 원심분리기에서 간단히 회전시켜 펠렛화하고 50㎕의 빙냉 에탄올과 함께 재현탁하였다. 간략한 (1 내지 2초) 초음파 처리 후, 10㎕의 DNA-코팅된 입자를 즉시 캐리어 막에 이동시켰다. 세포를 채취하였고, 멸균증류수로 1회 세척하였으며, 50㎕의 배지(1 x 107 세포) 중에서 재현탁하였으며, 비선택적 프로테오스 플레이트의 삼등분의 가운데 지점에 도말하였다. 상기 세포를 PDS-1000/He 유전자 주입 입자 전달 시스템(Bio-Rad)으로 충격을 가했다. 파열 디스크(1100 및 1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 조립체 9 및 12㎝ 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회수 시, 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100㎕의 배지와 혼합하고 적당한 1% 수크로스가 있는 변형 프로테오스 플레이트 상에 도말하였다. 암실 내 25℃에서 배양 7 내지 10일 후에, 형질전환 세포를 나타내는 콜로니가 플레이트 상에 보였다.
전기천공에 의한 형질전환을 위하여, 세포를 채취하였고, 멸균 증류수로 1회 세척하고 50mM 수크로스를 함유하는 트리스-인산염 완충제(20mM Tris-HCl, pH 7.0; 1 mM 인산칼륨) 중에서 4 x 108세포/㎖ 밀도로 재현탁하였다. 약 250㎕ 세포 현탁액(1x108 세포)을 4㎜ 갭의 일회용 전기천공 큐벳에 넣었다. 세포 현탁액에, 5㎍의 선형화된 플라스미드 DNA 및 200㎍의 운반 DNA(절단한 연어 정자 DNA)를 첨가하였다. 그 다음에 전기천공 큐벳을 16℃ 수욕 내에서 10분 동안 인큐베이션하였다. 그 다음에 Gene Pulser II(캘리포니아주 허큘리스에 소재한 Bio-Rad Labs) 전기천공 장치를 사용하여 전기적 펄스(1100 V/cm)를 25 μF(전기천공에 사용되는 분류기는 없다)의 정전 용량에서 큐벳에 적용하였다. 그 다음에 큐벳을 실온에서 5분 동안 인큐베이션한 후, 세포 현탁액을 50㎖의 프로테아제 배지에 옮겼으며, 2일 동안 선회 진탕기 상에서 진탕하였다. 회수 후, 세포를 저속에서(4000 rpm) 원심분리로 채취하였고, 프로테오스 배지 내에서 재현탁하였으며, 1% 수크로스와 함께 변형 프로테오스 플레이트 상에서 저밀도로 플레이팅하였다. 암실 내 25℃에서 인큐베이션의 7 내지 10일 후, 형질전환 세포를 나타내는 콜로니가 플레이트 상에 보였다.
스크리닝 형질전환체 및 지노타이핑: 콜로니를 1% 수크로스가 있는 암실 성장-변형 프로테오스 플레이트로부터 선택하였고, 대략 동일한 양의 세포를 1% 수크로스와 함께 1㎖의 변형 프로테오스 액체 배지를 함유하는 24 웰-플레이트에 옮겼다. 배양물을 암실에서 유지하였고, Labnet(영국 버크셔 소재)제의 오비탈 진탕기로 430 rpm에서 5일 동안 교반하였다.
클로렐라 형질전환체에 도입된 인버타제 유전자의 존재를 증명하기 위하여, 각 형질전환체의 DNA를 분리하였고, 한 세트의 유전자 특이적 프라이머(CMV 구성체: 전방 프라이머 (CAACCACGTCTTCAAAGCAA)(서열번호 153)/역방향 프라이머(TCCGGTGTGTTGTAAGTCCA)(서열번호 171), CV 구성체: 전방 프라이머(TTGTCGGAATGTCATATCAA)(서열번호 172)/역방향 프라이머(TCCGGTGTGTTGTAAGTCCA)(서열번호 171), 및 HUP1 구성체: 전방 프라이머(AACGCCTTTGTACAACTGCA)(서열번호 173)/역방향 프라이머(TCCGGTGTGTTGTAAGTCCA)(서열번호 171))로 증폭하였다. 빠른 DNA 분리를 위해, 세포 부피(크기로 대략 5-10㎕)를 50㎕의 10 mM Na-EDTA 중에서 재현탁하였다. 세포 현탁액을 100℃에서 10분 동안 인큐베이션하였고 10초 동안 음파처리하였다. 12000g에서 1분 동안 원심분리 후, 3㎕의 상청액을 PCR 반응을 위해 사용하였다. PCR 증폭을 DNA 열 사이클러(Perkin-Elmer GeneAmp 9600) 내에서 수행하였다. 반응 혼합물(50㎕)은 제조업자의 설명서에 따라서 3㎕ 추출 DNA, 상기 설명한 각 프라이머 각각의 100 pmol, 200 uM dNTP, 0.5 유닛의 태그 DNA 폴리머라제(NEB), 및 태그 DNA 폴리머라제 완충제를 함유하였다. 제1 주기를 위해 95℃에서 5분 동안 DNA 변성을 수행한 다음, 30초 동안 수행하였다. 프라이머 어닐링 및 확장 반응을 58℃에서 30초 동안 및 72℃에서 1분 동안 각각 수행하였다. 그 다음에 PCR 생성물을 브롬화 에티듐으로 염색한 1% 아가로스 겔 상에서 시각화하였다.
액체 배양물 내 성장: 암실에서 5일 성장 후, 유전자형-포지티브 형질전환체는 암실에서 최소 액체 프로테오스 배지 + 1% 수크로스 상에서 성장을 나타낸 반면, 야생형 세포는 암실 내 동일 배지 중에서 성장을 나타내지 않았다.
실시예 6: 사카로마이세스 세레비시애로부터 유래된 분비된 인버타제에 의한 조류 균주의 형질전환
분비된 인버타제: 각각 EcoR I/Asc I 및 Xho/Sac I 카세트로서 카울리플라워 모자이크 바이러스 35s 프로모터 및 3' UTR을 소유하는 pUC19 유도체 내로 후속하여 서브클로닝된 1599 bp Asc I-Xho 단편으로서 분비된 수크로스 인버타제를 암호화하는 유전자(사카로마이세스 세레비시애로부터 유래된 Gen Bank 등록번호 NP_012104)를 데노보 합성하였다.
조류 세포의 성장: 이들 실험에 사용한 배지는 액체 기본 배지(2g/ℓ 효모 추출물, 2.94mM NaNO3, 0.17mm CaCl2·2H2O, 0.3mmMgSO4·7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 및 1%의 최종 농도에서 수크로스 또는 글루코스(지정됨) 형태로 고정된 탄소를 함유하는 고체 기본 배지(+ 1.5% 아가로스)이었다. 이 실험에 사용한 균주는 추가적인 고정 탄소 공급원의 부재에서 암실 내 기본 배지 상에서 성장하지 않았다. 종들을 플레이트 상에서 퇴출시켰고, 암실 내 28℃에서 성장시켰다. 단일 콜로니를 선택하였고, 1 % 글루코스를 함유하는 500㎖의 액체 기본 배지를 접종하기 위하여 사용하였으며, 중기 로그기까지 암실 내에서 성장시키고, 각 날짜에 세포수를 측정하였다. 각각의 다음 균주를 암실 내 단독 탄소 공급원으로서 수크로스 상의 성장에 대해 이전에 시험하였으며, 이는 성장을 나타내지 않았고, 따라서 분비된 인버타제로 형질전환을 위해 선택하였다: (1) 클로렐라 프로토테코이데스(UTEX 31); (2) 클로렐라 미누티시마(UTEX 2341); 및 (3) 클로렐라 에머소니(CCAP 211/15).
유전자총을 통한 조류의 형질전환: 충분한 배양물을 원심분리하여 대략 1-5 x 108개의 전체 세포를 제공하였다. 결과 펠렛을 고정 탄소 공급원을 첨가하지 않은 기본 배지로 세척하였다. 세포를 다시 원심분리하였고, 펠렛을 5 x 107 내지 2 x 108 세포/㎖를 제공하기에 충분한 기본 배지 부피 중에서 재현탁하였다. 그 다음에 250-1000㎕의 세포를 1% 수크로스로 보충한 고체 기본 배지 상에 플레이팅하고, 멸균 후드 내 플레이트 상에서 건조시켰다. 플라스미드 DNA를 제조업자의 설명서(캘리포니아주 라호야에 소재한 Seashell Technology)에 따라서 금 입자에 침전시켰다. 파열판 홀더로부터 9㎝에 설정된 거대운반체 조립체가 있는 1350 psi 파열판을 사용하는 BioRad PDS He-1000 입자 전달 시스템을 사용하여 형질전환을 수행하였다. 형질전환 후, 플레이트를 28℃에서 암실 내에서 인큐베이션하였다. 모든 균주는 다양한 형질전환체 콜로니를 만들어냈다. 대조군 플레이트는 인버타제 삽입물로 형질전환되지 않았지만, 다르게는 콜로니를 함유하지 않는 동일한 방식으로 제조하였다.
클로렐라 프로토테코이데스 형질전환체의 분석: 게놈 DNA를 클로렐라 프로토테코이데스 야생형 세포 및 다음과 같은 형질전환체 콜로니로부터 추출하였다: 세포를 100 ㎕ 추출 완충제(87.5 mm Tris Cl, pH 8.0, 50 mm NaCl, 5 mm EDTA, pH 8.0, 0.25% SDS) 중에서 재현탁하였고, 30분 동안 전화를 통해 가끔식 혼합하면서 60℃에서 인큐베이션하였다. PCR을 위해, 샘플을 20 mM Tris Cl, pH 8.0 내 1:100으로 희석하였다.
WT, 형질전환체 및 플라스미드 DNA로부터 추출한 게놈 DNA 상에서 지노타이핑을 행하였다. 샘플을 마커 유전자에 대해 지노타이핑하였다. 프라이머 2383(5' CTGACCCGACCTATGGGAGCGCTCTTGGC 3')(서열번호 174) 및 2279(5' CTTGACTTCCCTCACCTGGAATTTGTCG 3')(서열번호 175)을 이런 지노타이핑 PCR에서 사용하였다. 사용한 PCR 프로파일은 다음과 같다: 5분 동안 94℃ 변성; 35주기의 94℃-30초, 60℃-30초 72℃-3분 72℃-5분. 동일 크기의 밴드를 양성 대조군(플라스미드) 및 클로렐라 프로토테코이데스(UTEX 31)의 2개 형질전환체로부터 증폭하였다.
클로렐라 미누티시마 및 클로렐라 에머소니 형질전환체의 분석: 게놈 DNA를 클로렐라 WT로부터 추출하였고, 형질전환체는 다음과 같다: 세포를 100㎕ 추출 완충제(87.5 mM Tris Cl, pH 8.0, 50 mM NaCl, 5 mM EDTA, pH 8.0, 0.25% SDS) 중에서 재현탁하였고, 30분 동안 전화를 통해 가끔식 혼합하면서 60℃에서 인큐베이션하였다. PCR을 위해, 샘플을 20 mM Tris Cl, pH 8.0 내 1:100으로 희석하였다. WT, 형질전환체 및 플라스미드 DNA로부터 추출한 게놈 DNA 상에서 지노타이핑을 행하였다. 샘플을 마커 유전자에 대해 지노타이핑하였다. 프라이머 2336(5' GTGGCCATATGGACTTACAA 3')(서열번호 176) 및 2279(5' CTTGACTTCCCTCACCTGGAATTTGTCG 3')(서열번호 175)는 프라이머 세트 2(1215 bp의 예상된 생성물)를 지정한 반면, 프라이머 2465(5' CAAGGGCTGGATGAATGACCCCAATGGACTGTGGTACGACG 3')(서열번호 177) 및 2470(5' CACCCGTCGTCATGTTCACGGAGCCCAGTGCG 3')(서열번호 178)은 프라이머 세트 4(1442 bp의 예상된 생성물)을 지정하였다. 사용한 PCR 프로파일은 다음과 같다: 2분 동안 94℃ 변성; 29주기의 94℃-30초, 60℃-30초 72℃-1분 30초; 72℃-5분. 분비 인버타제를 함유하는 플라스미드 대조군을 PCR 대조군으로 사용하였다.
인버타제 구성체의 서열은 서열번호 8에 대응한다.
실시예 7: 프로토테카 종 내 상동성 재조합
이식유전자의 상동성 재조합은 몇몇 이점을 가진다. 첫째로, 세포에 도입되는 플라스미드 복제물 수 이상의 대조군이 없기 때문에 상동성 재조합이 없는 이식유전자의 도입은 예측가능하지 않다. 또한 상동성 재조합이 없는 이식유전자의 도입은 안정하지 않은데, 플라스미드가 에피솜으로 남아있을 수 있고, 후속하는 세포 분할을 거쳐서 상실되기 때문이다. 상동성 재조합의 다른 이점은 "녹-아웃"유전자 표적에 대한 능력이며, 이는 에피토프 태그, 내인성 유전자의 스위치 프로모터를 도입하고, 다르게는 유전자 표적을 변경한다(예를 들어 점 돌연변이의 도입).
두 벡터를 프로토테카 모리포미스(UTEX 1435) 게놈의 특정 영역을 사용하여 구성하였고, KE858을 지정하였다. KE858은 1.3 kb이며, 단백질의 전달 RNA(tRNA)와 상동성을 공유하는 단백질에 대해 암호 영역 부분을 포함하는 게놈 단편이다. 사우던 블롯은 KE858 서열이 프로토테카 모리포미스(UTEX 1435) 게놈에서 단일 복사체 중에 존재한다는 것을 나타냈다. 구성된 제1 유형의 벡터는 SZ725(서열번호 179)를 지정하며, 최적화된 효모 인버타제(suc2) 유전자를 또한 함유하는 pUC19 벡터 백본 내로 클로닝된 전체 1.3 kb KE858 단편으로 이루어진다. KE858 단편은 표적 구성체 내 다른 어느 곳에도 생기지 않는 독특한 SnaB1 부위를 함유한다. 구성된 제2 유형의 벡터는 SZ726(서열번호 180)를 지정하며, KE858 게놈 서열 내 SnaB1 부위에서 효모 인버타제 유전자(suc2)의 전화에 의해 파쇄된 KE858 서열로 이루어진다. 효모 인버타제 유전자 옆에 있는 KE858 서열을 함유하는 전체 DNA 단편은 EcoRI에 의한 소화에 의해 벡터 백본으로부터 절단될 수 있는데, 이는 KE858 영역 말단 중 하나에서 절단된다.
두 벡터는 모두 프로토테카 모리포미스(UTEX 1435) 게놈의 대응하는 KE858 영역 내로 효모 인버타제 유전자(suc2)의 직접적인 상동성 재조합을 사용하였다. 상동성 재조합을 위해 표적화된 게놈 영역과 상동성인 선형 DNA 말단은 SnaB1이 있는 벡터 구성체 SZ725 및 EcoRI가 있는 벡터 구성체 SZ726를 분해하는 것으로 노출되었다. 그 다음에 분해된 벡터 구성체는 상기 기재한 방법을 사용하여 프로토테카 모리포미스 배양물 내로 도입하였다. 그 다음에 각 벡터 구성체로부터 유래된 형질전환체를 수크로스 플레이트를 사용하여 선택하였다. 각 벡터 형질전환으로부터 10개의 독립적인, 클론적으로 순수한 형질전환체를 원하는 게놈 위치(사우던 블롯을 사용) 내로 효모 인버타제 유전자의 성공적인 조합을 위해 및 이식유전자 안정성을 위해 분석하였다.
SZ725 형질전환체의 사우던 블롯 분석은 분석을 위해 선택한 10개의 형질전환체 중 4개가 예측된 재조합 밴드를 함유한다는 것을 나타내었고, 이는 하나의 크로스오버 사건이 벡터 상의 KE858 서열과 게놈 내 KE858 서열 사이에 일어났다는 것을 나타낸다. 대조적으로, 모두 10개의 SZ726 형질전환체는 예측된 재조합체 밴드를 나타내었고, 이는 이중 크로스오버 사건이 효모 인버타제 이식유전자 옆에 있는 KE858 서열을 운반하는 pSZ726의 EcoRI 단편과 게놈의 대응하는 KE858 영역 사이에 일어났다는 것을 나타낸다.
선택의 부재에서 15 세대에 거쳐서 형질전환체를 성장시킴으로써 수크로스 인버타제 발현 및 이식유전자 안정성을 평가하였다. 사우던 블롯에 의해 이식유전자에 양성인 4개의 SZ725 형질전환체 및 10개의 SZ276 형질전환체를 선택하였고, 형질전환체 각각으로부터 48개의 단일 콜로니를, 우선 글루쿠스 함유 배지에서 선택 없이, 그 다음에 단일 탄소 공급원으로서 수크로스를 함유하는 배지 내 선택과 함께 단계적으로 성장시켰다. 모든 10개의 SZ276 형질전환체(100%)는 15세대 후 수크로스 상에서 성장하는 능력을 보유한 한편, SZ725 형질전환체의 약 97%는 15세대 후 수크로스 상에서 성장하는 능력을 보유하였다. 이중 크로스오버 사건에 의해 도입된 이식유전자(SZ726 벡터)는 세대 배가를 거쳐서 극도로 높은 안정성을 가진다. 대조적으로, 단일 크로스오버 사건에 의해 도입된 이식유전자(SZ725 벡터)는 세대배가를 거쳐서 일부 불안정성을 초래할 수 있는데, 이는 이식유전자의 탠덤 복제물이 도입되고, 이식유전자 옆의 반복된 상동성 영역은 그것들 사이에 위치된 유전자이식 DNA를 재조합하고 절단할 수 있기 때문이다.
이들 실험은 유기체의 핵 염색체 내로 안정하게 도입되는 이종성 수크로스 인버타제를 함유하는 프로토테카 형질전환체를 만들기 위한 상동성 재조합의 성공적인 사용을 증명한다. 상동성 재조합의 성공은 유전자 결실, 점 돌연변이 및 원하는 유전자 생성물을 태그하는 에피토프를 포함하여, 프로토테카 내 다른 게놈 변경을 가능하게 한다. 이들 실험은 또한 진핵 미세조류의 핵 게놈 내 상동성 재조합을 위한 제1 기록 시스템을 증명한다.
내인성 포로토테카 모리포미스 유전자을 녹- 아웃하기 위한 상동성 재조합의 사용: 프로토테카 모리포미스 cDNA/게놈 스크리닝에서, 실시예 4에 기재한 것과 같이, 내인성 스테아릴 ACP 불포화효소(SAPD) cDNA를 확인하였다. 스테아릴 ACP 불포화효소는 지질 합성 경로의 부분이며 그것은 지방 아실 쇄 내로 이중결합을 도입하는 작용을 한다. 일부 경우에, 지방산 프로파일을 변경시키기 위하여 지질 경로 효소의 발현을 녹-아웃하거나 감소시키는 것이 유리하다. 내인성 스테아릴 ACP 불포화효소의 발현이 감소될 수 있는지(또는 녹아웃될 수 있는지) 여부 및 불포화된 지방산 내 대응하는 감소가 숙주 세포의 지질 프로파일에서 관찰될 수 있는지 여부를 평가하기 위하여 상동성 재조합 구성체를 만들었다. 프로토테카 모리포미스(UTEX 1435)의 스테아릴 ACP 불포화효소 유전자의 대략 1.5kb 암호화 서열을 확인하였고 클로닝하였다(서열번호 181). 5'말단(5'표적 부위)에서 0.5kb의 SAPD 암호화 서열을 사용한 다음, 클로렐라 불가리스 3'UTR이 있는 코돈-최적화된 효소 수크로스 인버타제 suc2 유전자를 구동하는 클라미도모나스 레인하르티 β-튜불린 프로모터를 사용하여 상동성 재조합 구성체를 구성하였다. 그 다음에 나머지(~1kb) 프로토테카 모리포미스 SAPD 암호화 서열 클로렐라 불가리스 3'UTR 다음에 삽입하여 3'표적 부위를 구성하였다. 이 상동성 재조합 카세트에 대한 서열은 서열번호 182에 열거한다. 상기 나타낸 바와 같이, 핵 게놈 내 상동성 재조합 카세트의 도입을 위한 성공률은 미세조류를 형질전환하기 전 카세트를 선형화하고, 노출된 말단을 남김으로써 증가될 수 있다. 프로토테카 모리포미스 내 내인성 SAPD 효소를 표적화하는 상동성 재조합 카세트는 선형화한 다음 숙주 세포(프로토테카 모리포미스, UTEX 1435) 내로 형질전환한다. 성공적인 통합은 이중 상호 재조합 사건을 통해 숙주 게놈으로부터 내인성 SAPD 효소 암호화 영역을 제거하는 한편, 새로 삽입된 suc2 유전자의 발현은 클라미도모나스 레인하르드티 β-튜불린 프로모터에 의해 조절될 것이다. 결과 클론은 유일한 탄소 공급원으로서 수크로스를 함유하는 플레이트/배지를 사용하여 스크리닝할 수 있다. 상동성 재조합 카세트의 성공적인 도입을 함유하는 클론은 유일한 탄소 공급원으로서 수크로스 상에서 성장하는 능력을 가질 것이며, 지질 프로파일 내 지방산의 전반적인 포화도 변화는 부차적인 확인 인자로 작용할 것이다. 추가적으로 효모 수크로스 인버타제 suc2 유전자 및 RT-PCR에 특이적인 프로브를 사용하는 사우던 블롯팅 분석은 또한 포지티브 클론 내 인버타제 유전자의 존재 및 발현을 확인할 수 있다. 대안으로서, β-튜불린 프로모터가 없는 동일 구성체를 내인성 SAPD 효소 암호화 영역을 절단하기 위하여 사용할 수 있다. 이 경우에, 새로 삽입된 효모 수크로스 인버타제 suc2 유전자는 내인성 SAPD 프로모터/5'UTR에 의해 조절될 것이다.
실시예 8: 프로토테카 내 다양한 티오에스터라제의 발현
프로토테카 종 내 이종성 티오에스터라제 유전자를 발현하는 방법 및 효과는 본 명세서에 참조로 포함되는 국제특허출원 PCT/US2009/66142에 앞서 기재되었다. 고등 식물 종으로부터 다른 티오에스터라제 유전자/유전자 생성물의 효과를 추가로 조사하였다. 이들 티오에스터라제는 다음의 고등 식물로부터 유래된 티오에스터라제를 포함한다:
Figure 112018108415035-pat00015
모든 경우에, 각각의 상기 티오에스터라제 구성체는 바이오리스틱 유전자총을 사용하여 프로토테카 모리포미스(UTEX 1435) 내로 형질전환하였다. 국제특허 출원 PCT/US2009/66142에 개시된 상동성 재조합을 포함하는 다른 형질전환 방법은 또한 관심의 이종성 유전자 발현에 적합하다. 각각의 상기 티오에스터라제 구성체에 의한 프로토테카 모리포미스(UTEX 1435)의 형질전환은 실시예 2에 기재한 방법을 사용하여 수행하였다. 각각의 구성체는 NeoR 유전자를 함유하였고 100㎍/㎖ G418을 사용하여 포지티브 클론에 대한 선택을 수행하였다. 모든 암호화 영역은 프로토테카 모리포미스 UTEX 1435(표 2) 핵 유전자 내 고유한 코돈 바이어스를 반영하도록 최적화되었다. 구성체에 대한 아미노산 서열과 cDNA 서열은 둘 다 서열 동일성 목록에서 열거한다. 각각의 고등 식물 티오에스터라제에 대한 수송 펩타이드를 프로토테카 모리포미스 델타 12 지방산 불포화효소(서열번호 48)로부터의 또는 클로렐라 프로토코이데스 스테아릴 ACP 불포화효소(서열번호 49)로부터의 조류 코돈 최적화된 수송 펩타이드로 대체하였다. 모든 티오에스터라제 구성체는 클라미도모나스 레인하르티 베타-튜불린 프로모터/5'UTR에 의해 구동되었다. 선택한 포지티브 클론의 성장 및 지질 생성을 야생형(형질전환되지 않음) 프로토테카 모리포미스(UTEX 1435)와 비교하였다. 야생형 및 선택한 포지티브 클론을 2% 글루코스 G418 플레이트에서 성장시켰다. 각 구성체에 대해 선택한 포지티브 클론 상의 지질 프로파일 분석을 이하의 표 15에서 요약한다(면적%로 표현).
다양한 이종성 티오에스터라제를 발현시키는 프로토테카 모리포미스의 지질 프로파일
지방산 UTEX 1435
wt
티오에스터라제
캘리포니아 월계수 녹나무 아이리스 게르마니카 미리스티카 프라그란스 쿠페아 팔루스트리스 C8:0 쿠페아 후커리아나 쿠페아 란세올라타 쿠페아 팔루스트리스 C14:0 미국 느릅나무
C8:0 0 0 0 0 3.1 1.8 0 0 .09
C10:0 0.02 .07 .02 .01 .09 .56 6.85 1.91 .01 2.85
C12:0 0.05 14 1.82 .09 .05 .25 .2 .29 .06 .74
C14:0 1.65 3 17.3 2.59 5.31 1.45 1.8 1.83 2.87 10.45
C16:0 28.0 21.4 24.3 26.52 31.08 22.84 23.9 25.55 27.23 33.3
C18:0 2.9 2.9 2.7 3.11 2.71 3.24 2.8 3.26 3.62 3.47
C18:1 53.8 45.2 41.3 49.96 39.77 56.62 49.8 55.43 51.04 38.71
C18:2 10.95 10 9.7 11.86 14.17 8.24 9.7 8.17 10.81 7.38
C18:3 α 0.8 .86 .8 .40 .64 .61 .9 .58 .97 .52
전체 포화도
( 면적% )
32.62 44.97 46.14 32.32 39.24 31.44 37.35 32.84 33.79 50.9
결과는 모든 티오에스터라제가 일정 수준으로 영향받은 프로파일을 발현한다는 것을 나타낸다. "전체 포화도" 열을 보면, 포화도는 캘리포니아 월계수, 녹나무 및 가장 현저하게는 미국 느릅나무로부터 유래된 것을 포함하는 몇몇 티오에스터라제의 발현에 의해 크게 영향받는다. 전체 포화도%의 이런 변화는 고등 식물로부터의 티오에스터라제의 이종성 발현이 단지 지질 쇄 길이보다 더 명확하게 영향을 미칠 수 있다는 것을 예상치 못했는데; 이는 또한 미세조류에 의해 생성된 지질 프로파일의 다른 속성, 즉 지방산의 포화도에 영향을 미칠 수 있다.
쿠페아 팔루스트리스 C8 티오에스터라제, 쿠페아 후커리아나 티오에스터라제, 캘리포니아 월계수 및 녹나무 티오에스터라제에 의해 형질전환된 선택 클론을 다양한 양의 G418(25㎎/ℓ 내지 50㎎/ℓ) 및 다양한 온도(22℃ 내지 25℃)에서 추가로 성장시켰으며, 이들 클론에 대해 지질 프로파일을 결정하였다. 표 16은 각각의 티오에스터라제를 함유하는 대표적인 클론의 지질 프로파일(면적%)을 요약한다. 미국 느릅나무 티오에스터라제를 함유하는 제2 구성체를 구성하였고 상기 기재한 바이오리스틱 방법을 사용하여 프로토테카 모리포미스(UTEX 1435) 내로 형질전환하였다. 이런 제2 구성체를 상동성 재조합을 통해 세포 내로 도입하였다. 프로토테카 종 내 상동성 재조합 방법은 국제특허출원 PCT/US2009/66142에서 앞서 기재되었다. 사용한 상동성 DNA는 프로토테카 모리포미스 UTEX 1435로부터의 6S rRNA의 게놈 DNA 서열로부터 유래되었다. 선택 작용제는 클라미도모나스 레인하르티 베타-튜불린 프로모터에 의해 구동된 사카로마이세스 세레비시애로부터 유래된 코돈 최적화 suc2 유전자를 사용하여 수크로스 상에서 성장하는 능력이 있다. 본래의 미국 느릅나무 수송 펩타이드를 클로렐라 프로토테코이데스(UTEX 250) 스테아릴 ACP 불포화효소 수송 펩타이드로 대체하였다. 이 구성체의 cDNA를 서열번호 50으로서 서열목록에 열거한다. 포지티브 클론의 선택을 2% 수크로스 플레이트 상에서 수행하였고, 지질 프로파일 결정을 위한 결과 배양물을 또한 2% 수크로스 함유 배지 상에서 성장시켰다. 상동적으로 재조합된 이종성 미국 느릅나무 티오에스터라제를 함유하는 이런 프로토테카 모리포미스 균주에 대한 대표적인 지질 프로파일을 표 16에 요약한다.
이종성 티오에스터라제 유전자를 함유하는 프로토테카 모리포미스 균주의 지질 프로파일
쿠페아 팔루스트리스 C8 쿠페아 후커리아나 녹나무 미국 느릅나무 2
C8:0 12.28 2.37 0 0
C10:0 2.17 12.09 0.02 4.69
C12:0 0.34 0.33 3.81 1.02
C14:0 1.59 2.08 32.73 16.21
C16:0 15.91 20.07 24.03 38.39
C18:0 1.59 1.57 1.21 2.83
C18:1 50.64 41.80 18.64 27.22
C18:2 13.02 16.37 16.57 7.65
C18:3 α 1.52 1.75 1.66 0.74
전체 포화도 33.88 38.51 61.80 63.14
상기 기재한 클론과 같이, 이종성 티오에스터라제 유전자를 함유하는 모든 형질전환체는 일정한 수준으로 영향받은 지방상 프로파일을 나타내었고, 야생형(형질전환되지 않음) 프로토테카 모리포미스와 비교하여 포화된 지방산의 전체%는 또한 변하였다. 상동성 재조합으로 도입된 미국 느릅나무 티오에스터라제를 함유하는 프로토테카 모리포미스는 전체 포화도의 가장 큰 증가를 가졌다.
추가적으로 외인성 쿠페아 후커리아나, 녹나무, 캘리포니아 월계수 또는 미국 느릅나무 티오에스터라제를 함유하는 유전자이식 클론을 신규한 지질 프로파일에 대해 평가하였다. 쿠페아 후커리아나 티오에스터라제 함유 클론은 22℃에서 2% 글루코스, 25㎎/㎖ G418에서 성장할 때 다음의 지질 프로파일을 달성하였다: 5.10% C8:0; 18.28% C10:0; 0.41% C12:0; 1.76% C14:0; 16.31% C16:0; 1.40% C18:0; 40.49% C18:1; 및 13.16% C18:2. 녹나무 티오에스터라제-함유 클론(또한 외인성 수크로스 인버타제를 함유)는 25℃에서 2% 수크로스 중에서 성장시킬 때 다음의 지질 프로파일을 달성하였다: 0.04% C10:0; 6.01% C12:0; 35.98% C14:0; 19.42 C16:0; 1.48% C18:0; 25.44% C18:1; 및 9.34% C18:2. 캘리포니아 월계수 티오에스터라제 함유 클론은 22℃에서 2% 글루코스, 25-100 ㎎/㎖ G418 중에서 성장시킬 때 다음의 지질 프로파일을 달성하였다: 0% C8:0; 0.11% C10:0; 34.01% C12:0; 5.75% C14:0; 14.02% C16:0; 1.10% C18:0; 28.93% C18:1; 및 13.01% C18:2. 미국 느릅나무 티오에스터라제 함유 클론은 28℃에서 2% 글루코스 중에서 성장시킬 때 다음의 지질 프로파일을 달성하였다: 1.54% C10:0; 0.43% C12:0; 7.56% C14:0; 39.45% C16:0; 2.49% C18:0; 38.49% C18:1; 및 7.88% C18:2.
실시예 9: 다수의 외인성 이종성 티오에스터라제 유전자를 갖는 프로토테카의 형질전환
미세조류 균주 프로토테카 모리포미스(UTEX 1435)를 상기 개시한 방법을 사용하여 형질변환하여 단일 클론 중에서 다수의 티오에스터라제를 발현시켰다. 단일 클론 내 다양한 티오에스터라제의 발현은 임의의 단일 티오에스터라제가 단독으로 발현될 때 미세조류가 상술한 것과 완전히 상이한 지방산 프로파일을 갖는 오일을 생성하도록 한다(상기 예에서 증명). 상동성 재조합을 사용하여 사카로마이세스 세레비시애(선택은 수크로스 상에서 성장하는 능력임)로부터의 suc2인 수크로스 인버타제 유전자와 함께 프로토테카 모리포미스(UTEX 1435)를 녹나무 티오에스터라제(C14 선호 티오에스터라제)로 우선 형질전환하였다. 이 상동성 재조합 구성체에 사용된 DNA는 상기 부문 III에 기재한 것과 같은 프로토테카 모리포미스 게놈 DNA의 KE858 영역으로부터 유래된다. 이 구성체의 상대적 부분은 서열번호 51로 서열목록에 열거한다. 포지티브 클론을 수크로스-함유 플레이트 상에서 스크리닝하였다. 그 다음에 수크로스-함유 플레이트 상에서 스크리닝하였다. 그 다음에 3개 중 하나의 카세트로 재형질전환하였고, 이들 각각은 항생제 G418뿐만 아니라 추가적인 티오에스터라제에 대한 내성을 암호화한다: (1) 쿠페아 후커리아나의 티오에스터라제 유전자(C8-10 선호), 서열번호 52; (2) 캘리포니아 월계수의 티오에스터라제 유전자(C12 선호), 서열번호 53; 또는 미국 느릅나무의 티오에스터라(넓음; C10-C16 선호), 서열번호 54. 서열목록은 각 구성체의 적절한 서열 부분을 포함한다. 티오에스터라제 유전자를 발현시키는 클론을 50㎍/㎖ G418을 갖는 배지를 함유하는 수크로스 상에 스크리닝하였다. 포지티브 클론을 선택하였고, 성장 및 지질 프로파일을 분석하였다. 표 17은 대표적인 포지티브 클론의 지질 프로파일(면적%로 표현)을 요약한다.
다양한 티오에스터라제로 형질전환된 프로토테카 모리포미스의
지질 프로파일
지방산 UTEX 1435 UTEX 1435 +
녹나무 TE
UTEX 1435 + 녹나무 TE 유전적 배경
+
쿠페아 후커리아나 TE
+
캘리포니아 월계수 TE
+
미국 느릅나무 TE
C8:0 0 0 0.19 0 0.06
C10:0 0.02 0.02 2.16 0.07 1.87
C12:0 0.05 0.66 0.53 13.55 1.61
C14:0 1.65 10.52 7.64 8.0 14.58
C16:0 28.0 22.56 22.31 19.98 29.53
C18:0 2.9 6.67 3.23 2.24 2.93
C18:1 53.8 47.78 48.54 42.55 37.3
C18:2 10.95 12.3 11.76 10.13 8.9
C18:3 α 0.8 0.93 0.91 0.91 0.76
전체 포화도
(면적 %)
32.62 40.43 36.06 43.84 50.58
추가적으로 녹나무와 캘리포니아 월계수 티오에스터라제를 갖는 이중 티오에스터라제를 22℃에서 50㎎/ℓ G418을 갖는 배지를 함유하는 2% 수크로스 내에서 성장시켰다. 성장 조건 하에 이 균주로부터 얻은 지방산 프로파일은 C8:0(0); C10:0(0.10); C12:0(31.03); C14:0(7.47); C16:0(15.20); C18:0(0.90); C18:1(30.60); C18:2(12.44); 및 C18:3α(1.38)이며, 54.7의 전체 포화도를 가진다.
녹나무 티오에스터라제를 함유하는 2개의 이종성 재조합 구성체(하나는 6S 영역을 표적화하며, 나머지는 KE858 영역을 표적화함)를 갖는 이중 티오에스터라제 클론를 생성하였다. 대표적인 포지티브 클론은 0% C8:0; 0.06% C10:0; 5.91% C12:0; 43.27% C14:0; 19.63% C16:0; 0.87% C18:0; 13.96% C18:1; 및 13.78% C18:2의 지방산 프로파일을 가지며, 69.74%의 전체 포화도를 가진다. 이 클론은 49% 이상으로 C12-C14 수준을 가지는데, 이는 야생형 세포에서 C12-C14 수준의 37배 이상이다.
상기 데이터는 다양한 티오에스터라제가 미세조류 내에서 성공적으로 공동발현될 수 있다는 것을 나타낸다. 다양한 티오에스터라제의 공동발현은 야생형 균주뿐만 아니라 임의의 개개의 티오에스터라제의 발현에 의해 얻어지는 지방산 프로파일과 상당히 다른 변경된 지방산 프로파일을 초래한다. 중복 쇄 길이 특이성을 갖는 다양한 티오에스터라제의 발현은 특정 지방산에서 누적적인 증가를 초래할 수 있다.
프로토테카 모리포미스에서 이종성 티오에스터라제의 발현(단독으로 또는 조합으로)은 숙주 균주에서 지방산/지질 프로파일을 변경시킬 뿐만 아니라, 다양한 종자 식물로부터 현재 이용가능한 오일과 비교할 때(표 5), 이들 프로파일은 다른 현재 이용가능한 시스템에서 발견되는 정말 독특한 오일을 가진다. 유전자이식 균주는 미번역 야생형 균주와 상당한 차이를 나타낼 뿐만 아니라, 표 5에서 나타내는 임의의 상업적 오일과 현저하게 상이한 프로파일을 가진다. 예로서, 코코넛 오일과 팜커넬 오일은 둘 다 5.5-17% 범위의 C8-C10 지방산 수준을 가진다. 쿠페아 팔루스트리스 C8-선호 티오에스터라제 또는 쿠페아 후커리아나 C10-선호 티오에스터라제를 발현하는 유전자이식 균주는 각각 3.66 내지 8.65% 어디에서나 축적된다. 이들 C8-C10 지방산 수준은 코코넛 오일 및 팜커넬과 유사하지만, 유전자이식 조류 균주는 상대적으로 더 높은 C12:0 지방산이 없으며, 그것들은 극도로 높은 C16:0 (각각 유전자이식에서 23% 대 코코넛 오일 또는 팜커넬 오일에서 11-16%) 및/또는 18:1(각각 유전자이식에서 50-57% 대 코코넛 또는 팜커넬 오일에서 8-19%).
실시예 10: 내인성 질소-의존적 프로토테카 프로모터의 확인
A. 내인성 질소-의존적 프로코터의 확인 및 특징화
cDNA 라이브러리는 표준 기술을 사용하여 프로토테카 모리포르미스(UTEX 1435)로부터 만들었다. 상기 프로토테카 모리포르미스를 질소 풍부 조건하에서 48시간 동안 성장시켰다. 이어서 5%의 접종물(v/v)을 낮은 질소로 이동시키고 상기 세포를 7일 동안 24시간 마다 채취하였다. 배양 약 24시간 후, 배지 내 질소 공급은 완전히 고갈되었다. 수거된 샘플은 무수 얼음 상 및 아이소프로판올을 사용하여 즉시 동결시켰다. 후속적으로 전체 RNA는 냉동 세포 펠렛 샘플로부터 분리하고 각각의 샘플의 일부는 RT-PCR 연구를 위해 보존하였다. 상기 샘플로부터 수거된 총 RNA의 나머지는 폴리A 선택에 적용하였다. 이어서 각각의 조건으로부터 동몰량의 폴리A 선택된 RNA를 모으고 이를 사용하여 벡터 pcDNA 3.0(Invirogen) 중에서 cDNA 라이브러리를 만들었다. 대략적으로 1200개 클론을 무작위로 수득한 모아진 cDNA 라이브러리로부터 집어내고 양쪽 가닥 상의 서열분석에 적용하였다. 대략적으로 68개의 상이한 cDNA는 이들 1200개의 서열로부터 선택하고 이를 사용하여 실시간 RT-PCR 연구에 사용하기 위한 cDNA 특이적 프라이머를 설계하였다.
보존된 세포 펠렛 샘플로부터 분리된 RNA를 상기 생성된 cDNA 특이적 프라이머를 사용한 실시간 RT-PCR 연구에서 기질로서 사용하였다. 상기 보존된 RNA를 cDNA로 전환시키고 68개 유전자 특이적인 프라이머 세트 각각에 대한 RT-PCR의 기질로서 사용하였다. 역치 사이클 또는 CT 수를 사용하여 시간 전반에 걸쳐 수거된 각각의 RNA 샘플 내에서 68개 cDNA 각각에 대한 상대적인 전사체 풍부함을 나타내었다. 질소 풍부와 질소 고갈된 조건간의 상당한 증가(3배 초과)를 나타내는 cDNA는 잠재적인 유전자로서 플래그하고 이의 발현은 질소 고갈에 의해 상향조절된다. 명세서에서 논의된 바와 같이, 질소 고갈/제한은 유지성 미생물에서 지질 합성의 공지된 유도인자이다.
질소 고갈/제한 동안에 발현이 상향조절되는 cDNA 기원의 추정 프로모터/5'UTR 서열을 동정하기 위해, 총 DNA를 질소 풍부 조건하에서 성장한 프로토테카 모리포르미스(UTEX 1435)로부터 분리하고 이어서 454 서열분석 기술(Roche)을 사용하는 서열분석에 적용하였다. 상기 RT-PCR 결과에 의해 상향 조절된 바와 같은 플래그된 cDNA는 454 게놈 서열분석 판독으로부터 비롯된 조립된 콘티그에 대한 BLAST를 사용하여 비교하였다. cDNA의 5' 말단은 특이적 콘티그로 맵핑하고 가능한 경우 500bp 초과의 5' 옆에 있는 DNA를 사용하여 추정적으로 프로모터/UTR을 동정하였다. 이어서 프로모터/5'UTR의 존재는 게놈 DNA의 PCR 증폭을 사용하여 확인하고 클로닝하였다. 개별 cDNA 5' 말단을 사용하여 3' 프라이머를 설계하고 454 콘티그 조립체의 5' 말단을 사용하여 5' 유전자 특이적 프라이머를 설계하였다.
제1 스크리닝으로서, 추정 프로모터중 하나인 Aat2(암모늄 수송체, 서열번호 63)로부터 분리된 5'UTR/프로모터를 클로렐라 프로토테코이데스 스테아로일 ACP 불포화효소 수송 펩타이드와 함께 녹나무 C14 티오에스테라제 구성체에 클로닝하여 클로렐라 소로키니아나 글루타메이트 탈수소효소 프로모터를 대체한다. 상기 구성체을 서열번호 81로서 나타낸다. 추정 프로모터를 시험하기 위해, 티오에스테라제 구성체를 프로토테카 모리포르미스 세포로 형질전환시켜 상기된 방법을 사용하여 낮은/무 질소 조건하에서 C14/C12 지방산 증가에 대해 스크리닝하여 실제 프로모터 활성을 확인하였다. cDNA/게놈 스크리닝으로부터 분리된 추정 질소 조정된 프로모터의 유사한 실험은 동일한 방법을 사용하여 수행할 수 있다.
cDNA/게놈 스크리닝으로부터 분리된 또 다른 추정 질소-조절된 프로모터/5' UTR은 다음과 같다:
Figure 112018108415035-pat00016
배수 증가는 낮은 질소 배지 내 배양의 24시간 후 cDNA 존재도의 몇 배 증가를 말한다.
이들 추청 프로모터/5'UTR의 잠재적 조절에 대해 추가로 파악하기 위하여, 8개의 서열을 추가 시험을 위해 선택하였다: (1) FatB/A; (2) SulfRed 설파이트 환원효소; (3) SugT 당 수송체; (4) Amt02-암모늄 수송체 02; (5) Aat01-아미노산 수송체 01; (6) Aat03-아미노산 수송체 03; (7) Aat04-아미노산 수송체 04; 및 (8) Aat05-아미노산 수송체 05. Illumina 서열 판독을 이용하는 고해상도 전사체를 다양한 시점에 프로토테카 모리포미스 세포로부터 분리한 RNA 상에서 수송하였다: 종자로부터 접종 후 T0(종자); 20 시간; 32 시간; 48 시간; 62 시간; 및 114 시간. T0(종자) 배지는 질소가 풍부한 반면, 20시간 이상의 시점에서, 배지는 질소를 거의 함유하지 않았다. 그 다음에 각 시점에 분리한 RNA로부터 만들어진 조립체화된 전사 콘티그를 앞서 확인한 각각 8개의 전사물과 함께 독립적으로 BLAST 분석을 하였다. 결과를 이하의 표 18에 요약한다.
8개의 추정 프로모터/ 5'UTR에 대한 전사체 발현 프로파일
cDNA TS T20 T32 T48 T62 T114
aa 트랜스_01 절대 98 96 321 745 927 1300
상대 1 0.98 3.28 7.61 9.47 13.28
aa 트랜스_03 절대 7 21 51 137 102 109
상대 1 2.95 7.2 19.42 14.47 15.45
aa 트랜스_04 절대 1 6 25 90 131 160
상대 1 5.16 21.29 74.97 109.35 133.31
aa 트랜스_05 절대 109 88 123 210 214 273
상대 1 0.81 1.13 1.93 1.97 2.51
ammon 트랜스_02 절대 683 173 402 991 1413 1397
상대 1 0.25 0.59 1.45 2.07 2.04
fatA/B-1_cDNA 절대 13 36 654 617 544 749
상대 1 2.8 51.57 48.65 42.9 59.1
sug 트랜스_01 절대 25 25 106 261 266 251
상대 1 1 4.22 10.4 10.63 10
설파이트 환원효소_01 절대 634 238 138 145 163 155
상대 1 0.38 0.22 0.22 0.26 0.24
상기 요약한 결과로부터, 흥미롭게도 설페이트 환원효소 mRNA가 시간에 걸쳐 mRNA 축적의 분명한 감소를 나타내지만, 몇몇 전사는 시간에 걸쳐 증가된 축적을 나타내었다.
이들 8개의 추정 프로모터/5'UTR 영역은 본래의 수송 펩타이드가 빠지거나 클로렐라 프로토테코이데스(UTEX 250) 스테아릴 ACP 불포화효소로부터의 수송 펩타이드로 치환된 녹나무 티오에스터라제 암호화 영역의 상류를 클로닝하였다. 각각의 추정 프로모터/5'UTR 영역 구성체를 6S rRNA의 게놈 서열로부터 DNA를 사용하는 상동성 재조합을 통해 프로토테카 모리포미스 UTEX 1435 내로 도입하였다. 또한 배지/플레이트를 함유하는 수크로스 상에서 포지티브 클론의 선택을 위해 구성체 내에 사카로마이세스 세레비시애로부터 유래된 suc2 수크로스 인버타제 유전자를 함유한다. Aat01에 대한 구성체의 상대적 부분에 대한 cDNA 서열은 서열번호 67로 서열목록에서 열거한다. 다른 구성체에 대해, 동일한 백본을 사용하였고, 유일한 변수는 추정 프로모터/5'UTR 서열이었다. 추가적인 대조군 유전자이식 균주를 만들었으며, 이때 클라미도모나스 레인하르드티 베타 튜불린 프로모터를 녹나무 티오에스터라제 유정자의 발현을 구동하기 위하여 사용하였다. 이 프로모터는 관심의 유전자의 구성적 발현을 구동하는 것으로 나타났고, 따라서 시험한 다양한 추정적 N-조절 프로모터/5'UTR에 의해 구동될 때 동일한 티오에스터라제의 발현을 측정하기에 유용한 대조군을 제공한다.
일단 유전자이식 클론이 만들어지면, 3가지 별개의 실험을 수행하였다. 첫 번째 2가지 실험은 RT-PCR을 통해 고정적 상태의 티오에스터라제 mRNA 수준, 배양 상청액 내 지방산 프로파일 및 암모니아 수준을 측정함으로써 모두 8개의 추정적 프로모터의 잠재적 질소 조절능력을 평가한다. 클론을 초기에 질소가 풍부한 배지(1g/ℓ 질산암모늄-암모니아로서 15mM 질소, 4g/ℓ 효소 추출물) 내에서 28℃에서 교반(200rpm)과 함께 24시간 내지 48시간 동안 성장시켰으며, 이 시점에 20 OD 유닛(A750)은 50㎖의 저질소 배지(0.2g/ℓ 황산암모늄-암모니아로서 3mM 질소, 0.2g/ℓ 효소 추출물)를 접종하기 위하여 사용하였다. 6일 동안 24시간마다 세포를 샘플링하였고, 또한 샘플을 정확하게 수집한 후 저 질소 조건으로 전환하였다. 그 다음에 전체 RNA 추출을 위해 트라이졸 시약을 사용하여 각 샘플로부터 세포 일부를 사용하였다(제조업자의 제시 방법에 따라). 암모니아 분석은 저 질소 배지 내에서 24시간 후 상청액 내 암모니아 수준이 검출 한계(~ 100㎛) 이하로 떨어졌음을 나타내었다.
실시간 RT-PCR을 위해, 모든 RNA 수준을 각 시점에 프로토테카 모리포미스(UTEX 1435) 내에서 발현된 내부 대조군 RNA 수준으로 정상화하였다. cd189로 칭해지는 내부 대조군 RNA는 N-아세틸 오르니틴 아미노트랜스퍼라제를 암호화하는 ARG9 유전자의 생성물이다. 이 실험에서 실시간 RT-PCR을 위해 사용한 프라이머 세트는 하기와 같다:
특이적인 유전자 프라이머 서열 5'-3' 서열번호
녹나무 TE 전방 TACCCCGCCTGGGGCGACAC 서열번호 68
녹나무 TE 역방향 CTTGCTCAGGCGGCGGGTGC 서열번호 69
cd189 전방 CCGGATCTCGGCCAGGGCTA 서열번호 70
cd189 역방향 TCGATGTCGTGCACCGTCGC 서열번호 71
각 시점에 각각의 형질전환체로부터 지질 프로파일을 또한 만들었고 RT-PCR 결과와 비교하였다. 암모니아 수준, RT-PCR 결과 및 C12-C14 지방산 수준의 변화를 기준으로, 아미노산 수송체 01(Aat-01), 아미노산 수송체 04(Aat-04), 및 암모늄 수송체 02(Amt-02) 서열은 기능적 질소-조절가능 프로모터/5'UTR를 함유하는 것으로 결론을 내렸다.
RT-PCR 결과로부터, Aat-01은 대조군(클라미도모나스 레인하르드티 베타 튜불린 프로모터)보다 4배까지 더 큰 정상상태 녹나무 티오에스터라제 mRNA를 구동하는 능력을 증명하였다. 또한 mRNA 수준은 질소 제한 및 C12-C14 지방산 수준의 표시 증가와 관련되었다. 이들 결과는 Aat-01 프로모터와 관련된 5'UTR이 대조군 클라미도모나스 레인하르드티 프로모터보다 지질 생합성 하에서 단백질 합성 구종에 더 효율적일 수 있다는 것을 증명한다. Aat-01 프로모터와 같이, Aat-04 프로모터는 클라미도모나스 레인하르드티 대조군 프로모터보다 5배까지 더 큰 mRNA 축적을 구동할 수 있었다. 그러나, Aat-04 프로모터 구성체는 단지 C12-C14 지방산 수준에 영향을 미치는 보통의 능력을 생성하였다. 이들 데이터는 Aat-04 프로모터가 질소 고갈에 의해 조절가능하지만, UTR은 번역 인핸서로서 불량하게 작용할 수 있다는 것을 증명하였다. 최종적으로, Amt-02 프로모터는 Aat-01 프로모터와 유사하며, 즉, 대조군 프로모터보다 3배까지 더 큰 mRNA 축적을 구동할 수 있었다. mRNA 수준은 질소 제한 및 C12-C14 지방산 수준의 표시된 증가와 관련되었다. 모두 합쳐서, 모두 3가지의 이들 프로모터는 질소-조절되는 것임을 증명하였다.
B. 암모늄 수송체 3( amt03 ) 프로모터의 추가적인 특징 및 다양한 티오에스터라제의 발현 .
상기 기재한 바와 같이, 암모늄 수송체 02 및 03(amt02 및 amt03)으로 칭해지는 부분적 cDNA를 확인하였다. 이들 2개의 부분적 cDNA와 함께, 수송체 01(amt01)로 칭해지는 제3의 부분적 cDNA를 확인하였다. 부분적 cDNA 및 추정적 번역 아미노산 서열의 정렬을 비교하였다. 결과는 amt01이 3개의 서열과 더 멀리 관련된 한편, amt02 및 amt03은 단지 하나의 아미노산이 다르다는 것을 나타낸다.
프로모터/5'UTR은 상기 기재한 바와 같이 Roche 454 게놈 DNA 조립체 및 Illumina 전사체 조립체에 대한 부분적 cDNA 서열을 블라스팅함으로써 처음에 인실리코로 만들었다. amt01, amt02, 및 amt03을 암호화하는 cDNA와 동일성을 나타내는 전사 코팅을 확인하였지만, 전사 코팅 서열은 3개 모두에 의해 공유되는 콘티그 함유 서열로서 3개의 mRNA 사이에 구별될 수 없었다. Roche 454 게놈 DNA 조립체는 amt02 및 amt03 cDNA 서열에 타격을 주며, N-말단 단백질 서열을 함유하였다. PCR은 5'옆에 있는 영역의 클로닝을 수행하였다. amt02 및 amt03 프로모터/UTR을 입증하기 위하여 사용한 PCR 프라이머는 하기와 같다:
Amt03 전방: 5'-GGAGGAATTCGGCCGACAGGACGCGCGTCA-3'(서열번호 85)
Amt03 역방향:5'-GGAGACTAGTGGCTGCGACCGGCCTGTG-3'(서열번호 86)
Amt02 전방: 5'-GGAGGAATTCTCACCAGCGGACAAAGCACCG-3'(서열번호 87)
Amt02 역방향: 5'-GGAGACTAGTGGCTGCGACCGGCCTCTGG-3'(서열번호 88)
두 경우에, 5' 및 3'프라이머는 이들 프로모터/5'UTR 영역의 기능성을 입증하기 위하여 발현 벡터 내에 참여된 클로닝을 위한 유용한 제한 부위를 함유하였다.
이 조합된 인실리코 및 PCR-기반 방법을 통해 클로닝한 DNA와 amt02(서열번호 61) 및 amt03(서열번호 60)를 암호화하는 본래의 cDNA 사이의 쌍 정렬(Pair wise alignment)을 수행하였다. 이들 정렬 결과는 본래의 cDNA와 클로닝된 게놈 서열 사이의 상당한 차이를 보여주었으며, 이는 암모늄 수송체가 다양한 유전자 패밀리를 표시한다는 것을 나타낸다. 추가적으로, amt03에 대한 조합 방법을 기반으로 한 프로모터/5'UTR 클론은 본래의 amt03 서열과 상이한 반면, amt02 서열은 동일하였다. amt03 프로모터/UTR 서열(서열번호 89)을 특징화하는 추가 실험을 수행하였고 이하에 기재한다
상기 확인한 amt03 프로모터/UTR 서열(서열번호 89)을 이런 추정 프로모터/UTR 서열을 클로닝하여 4개의 상이한 티오에스터라제 발현을 구동함으로써 시험하였다. 발현 카세트는 게놈의 6S 좌위에 상류 및 하류의 상동성 재조합 서열을 함유하였다(각각 서열번호 82 및 84). 카세트는 또한 수크로스 함유 배지 상에서 포지티브 클론에 대한 선택을 가능하게 하는 사카로마이세스 세레비시애 SUC2 수크로스 인버타제 cDNA를 함유한다. 수크로스 인버타제 발현은 클라미도모나스 레인하르드티 베타 튜불린 프로모터에 의해 구동되었고, 또한 클로렐라 불가리스 나이트레이트 환원효소 3'UTR을 함유하였다. 그 다음에 amt03 프로모터/UTR 서열은 수크로스 인버타제 카세트의 하류 다음에 4개의 티오에스터라제 유전자: (1) 녹나무의 C14 티오에스터라제; (2) 캘리포니아 월계수의 C12 티오에스터라제; (3) 미국 느릅나무의 C10-C16 티오에스터라제; 또는 (4) 쿠페아 후커리아나의 C10 티오에스터라제 중 하나의 뼈대가 완성된 티오에스터라제 cDNA 서열을 클로닝하였고, 클로렐라 불가리스 나이트레이트 환원효소 3'UTR을 함유하였다. C14 녹나무 티오에스터라제, C12 캘리포니아 월계수 티오에스터라제, 및 C10-C16 미국 느릅나무 모두는 클로렐라 프로토테코이데스 스테아릴 ACP 불포화효소로부터의 수송 펩타이드를 함유하였다. C10 쿠페아 후커리아나 티오에스터라제는 프로토테카 모리포미스 델타 12 지방산 불포화효소(FAD)의 수송 펩타이드를 함유하였다. 모든 경우에, 서열은 프로토테카 모리포미스에서 발현에 대해 코돈 최적화되었다. 앞서 언급한 티오에스터라제 구성체에 대한 서열을 하기 서열목록에 기재한다:
amt03 프로모터/UTR::녹나무 티오에스터라제 구성체 서열번호 90
녹나무 티오에스터라제 구성체 서열번호 91
캘리포니아 월계수 티오에스터라제 구성체 서열번호 92
미국 느릅나무 티오에스터라제 구성체 서열번호 93
쿠페아 후커리아나 티오에스터라제 구성체 서열번호 94
실시예 2에서 상기 기재한 바이오리스틱 형질전환 방법을 통해 유전자이식 계통을 야생형 프로토테카 모리포미스 세포로 만들었고, 수크로스 함유 플레이트/배지 상에서 선택을 수행하였다. 그 다음에 지방산 프로파일이 변경되는 정도에 대해 포지티브 계통을 스크리닝하였다. 그 다음에 각각 4개의 상기 기재한 구성체에 의한 형질전환으로부터 초래된 것인 4개의 계통에 추가적인 분석을 실시하였다. 계통 76은 녹나무 C14 티오에스터라제를 발현하였고, 계통 37은 캘리포니아 월계수 C12 티오에스터라제를 발현하였으며, 계통 60은 미국 느릅나무 C10-C16 티오에스터라제를 발현하였고, 계통 56은 쿠페아 후커리아나 C10 티오에스터라제를 발현하였다. 각 계통을 유일한 탄소 공급원으로서 수크로스를 함유하는 배지 내에서 48시간 동안 성장시켰고, 지방산 메틸 에스터로 직접적인 에스터결합전이 및 후속하는 GC-FID(상기 기재)에 의한 분석을 통한 지방산 프로파일의 결정을 위해 및 전체 RNA의 분리를 위해 세포의 샘플을 14, 24, 36 및 48 시간(종자 배양물)에 제거하였다. 48시간의 마지막에, pH 5.0(완충된 시트레이트, 0.05M 최종 농도) 또는 pH 7.0(완충된 HEPES, 0.1M 최종 농도)에서 유지한 질소 수준이 없거나 낮은 배양물을 접종하기 위하여 이들 세포를 사용하였다. 배양물 샘플을 지방산 프로파일링 및 전체 RNA의 분리를 위해 12, 24, 72 및 108 시간(지질 생성)에 제거하였다. 이들 배양물의 암모니아 분석은 암모니아 수준이 저 질소 배지 내에서 24시간 후 검출 한계(약 100㎛) 미만으로 떨어진 것을 나타내었다.
티오에스터라제 mRNA 수준 상의 실시간 RT-PCR을 상기 수집한 각각의 시점으로부터의 전체 RNA에서 수행하였고, 모든 mRNA 수준을 내부 대조군 RNA(cd189)의 수준으로 정상화하였다. 실시간 PCR에서 사용한 프라이머를 이하의 표 19에 나타낸다:
프라이머는 실시간 PCR을 설정한다
특이적 유전자 프라이머 서열 5'-3' 서열번호
녹나무 TE 전방 TACCCCGCCTGGGGCGACAC 서열번호 68
녹나무 TE 역방향 CTTGCTCAGGCGGCGGGTGC 서열번호 69
캘리포니아 월계수 TE 전방 CTGGGCGACGGCTTCGGCAC 서열번호 95
캘리포니아 월계수 TE 역방향 AAGTCGCGGCGCATGCCGTT 서열번호 96
미국 느릅나무 TE 전방 CCCAGCTGCTCACCTGCACC 서열번호 97
미국 느릅나무 TE 역방향 CACCCAAGGCCAACGGCAGCGCCGTG 서열번호 98
쿠페아 후커리아나 TE 전방 TACCCCGCCTGGGGCGACAC 서열번호 99
쿠페아 후커리아나 TE 역방향 AGCTTGGACAGGCGGCGGGT 서열번호 100
cd189 역방향 TCGATGTCGTGCACCGTCGC 서열번호 71
cd189 전방 CCGGATCTCGGCCAGGGCTA 서열번호 70
종자 배양물 층에서 각 시점에 지방산 프로파일로부터의 결과는 티오에스터라제로부터의 영향이 매우 적다는 것을 나타내었다. 지질 생성층의 시작으로, 지방산 프로파일은 상당히 영향을 받았으며, 배양물에 대해 훨씬 더 극적인 증가는 pH 5.0에서 배양물과 비교하여 pH 7.0에서 유지되었다. pH 7.0과 5.0 사이의 차이의 중대성이 시험한 각 티오에스터라제와 다른 지방산 축적을 표적화하는 반면, 전반적인 효과는 동일하였다: pH 5.0에서 성장한 세포는 상당히 더 낮은 축적된 표적 지방산을 나타내었지만, 대조군 야생형 세포와 비교할 때 더 높았다.
이들 동일한 샘플로부터 분리된 RNA 분석은 지방산 프로파일 데이터와 매우 상관관계가 있을 것이며, 즉 각각의 티오에스터라제의 정상상태 mRNA 수준 상에서 배양물 pH의 분명한 영향이 있었다. 지방산 축적 데이터와 mRNA 데이터는 함께, amt03 프로모터/UTR에 의해 구동되는 티오에스터라제 유전자 발현의 pH 조절을 전사 수준, mRNA 안정성에서 또는 둘 다에서 분명히 매개하였다. 추가적으로, 캘리포니아 월계수 mRNA의 정상상태 수준은 쿠페아 후커리아나 mRNA의 정상상태 수준과 비교하여 4 로그 더 낮다는 것을 관찰하였다. 이 관찰은 개개의 mRNA 서열이 발연을 제어하는 역할을 할 수 있다는 가설과 일치한다. 이들 데이터는 수송체의 amt03 패밀리에 의한 프로토테카 모리포미스의 암모늄 흡수가 pH에 직접적으로 결합된다는 것을 암시한다.
미국 느릅나무 C10-C16 티오에스터라제의 발현을 구동하는 구성체 amt03 프로모터/UTR에 의한 프로토테카 모리포미스 세포의 형질전환으로부터 만들어진 12개의 계통상에서 추가적인 지방산 프로파일 분석을 수행하였다. 상기 기재한 계통 60은 다음의 분석의 부분이다. 이하의 표 20은 야생형 대조군과 함께 분석한 12개의 계통 중 3개의 지질 프로파일을 나타낸다.
amt03 프로모터/UTR에 의해 구동되는 미국 느릅나무 TE를 함유하는
형질전환체의 지방산 프로파일
면적% C8:0 C10:0 C12:0 C14:0 C16:0 C18:0 C18:1 C18:2 전체 포화도
야생형 0.00 0.01 0.04 1.27 27.20 3.85 58.70 7.18 32.36
계통 40 2.38 20.61 3.41 28.41 29.92 1.91 8.57 3.74 86.64
계통 44 1.50 20.16 4.44 31.88 26.66 1.88 6.95 5.42 86.50
계통 60 0.98 14.56 3.15 27.49 31.76 2.14 12.23 6.36 80.06
상기 표에서 나타내는 바와 같이, 전체 포화도 수준은 야생형과 비교하여 계통 40의 경우에 야생형의 2.6배 이상으로 극적으로 상승되었다(12 계통으로부터 전체 포화도를 약 63% 내지 86% 범위로 분석하였다). 추가적으로, 이 수준에서 발현될 때, 미국 느릅나무 티오에스터라제는 불포화도 수준, 특히 C18:1 및 C18:2(계통 40 및 44)를 극적으로 감소시켰으며, 계통 44에서, C18:1 수준은 야생형과 비교하여 8배 이상으로 감소되었다. 또한, 미국 느릅나무 티오에스터라제(amt03 프로모터에 의해 구동됨)는 중간쇄 지방산의 수준을 크게 증가시켰다. 계통 44는 야생형 균주에서 보이는 수준보다 더 큰 56% 초과, 대략 42배 더 큰 C10:0-C14:0 수준 및 및 57% 초과의 C8:0-C14:0 수준을 나타낸다. 미국 느릅나무 티오에스터라제의 발현을 구동하는 Amt03 프로모터의 구성체로 형질전환된 추가적인 균주는 0.23% C8:0; 9.64% C10:0; 2.62% C12:0; 31.52% C14:0; 37.63% C16:0; 5.34% C18:0; 7.05% C18:1; 및 5.03% C18:2의 대표적인 지질 프로파일을 가지며, 전체 포화도%는 86.98%이다.
추가적인 지질 프로파일을 쿠페아 후커리아나 C10 티오에스터라제(서열번호 94)의 발현을 구동하는 구성체 amt03 프로모터/UTR(서열번호 89)에 의한 프로토테카 모리포미스 세포의 형질전환으로부터 만들었다. 이 구성체를 발현하는 포지티브 클론을 선택하였고 pH 7.0 조건에서 성장시켰다. 포지티브 클론으로부터의 대표적인 지질 프로파일은 9.87% C8:0; 23.97% C10:0; 0.46% C12:0; 1.24% C14:0; 10.24% C16:0; 2.45% C18:0; 42.81% C18:1; 및 7.32% C18:2이다. 이 클론은 33.84%의 C8-C10을 가진다.
모두 합쳐서, 데이트는 amt03 프로모터/UTR, 및 그것과 유사한 다른 프로모터가 잠재적으로 독성인 화합물의 발현에 특히 유용하고 유전자 발현의 엄격한 시행이 필요한 완전히 조절된 프로모터로서 사용될 수 있다는 것을 시사한다. 넓은 범위의(적어도 pH 5.0 내지 7.0) pH 섭생 하에 성장하기 위한 프로토테카 모리포미스의 능력은 이 유기체를 amt03 프로모터/UTR과 같은 조절 요소와 조합하여 특히 유용하게 한다. 추가적으로, 상기 지질 프로파일 데이터는 유전자 발현을 구동하기 위한 amt03 프로모터/UTR의 인상적인 능력을 증명한다.
실시예 11: 미세조류 프로토테카 모리포미스 내 포화된 지방산의 수준 변경
cDNA에 기반한 생물정보학 기반 접근을 사용하는 게놈 스크리닝의 부분으로서, 프로토테카 모리포미스로(UTEX 1435부터 유래된 게놈 DNA의 Illumia 전사체 및 Roche 454 시퀀싱, 지방산 불포화에 수반된 유전자의 2개의 특정 군을 확인하였다: 스테아릴 ACP 불포화효소(SAD) 및 델타 12 지방산 불포화효소(Δ12 FAD). 스테아릴 ACP 불포화효소 효소는 지질 합성 경로의 부분이며, 그것들은 지방 아실 쇄에 이중 결합을 도입하는, 예를 들어 C18:0 지방산으로부터 C18:1 지방산의 합성하는 작용을 한다. 델타 12 지방산 불포화효소는 또한 지질 합성 경로의 부분이며, 그것들은 이미 불포화된 지방산 내로 이중 결합을 도입하는, 예를 들어 C18:1 지방산으로부터 C18:2 지방산의 합성하는 작용을 한다. 생물정보학적 노력 동안 확인한 2 부류의 지방산 불포화효소 유전자에 기반한 프로브를 사용하는 사우던 블롯 분석은 각 부류의 불포화효소 유전자가 다수의 패밀리 구성원을 포함할 가능성이 있다는 것을 나타내었다. 추가적으로 스테아릴 ACP 불포화효소를 암호화하는 유전자는 2개의 별개의 패밀리로 나뉜다. 이들 결과를 기반으로, 불포화효소의 각 패밀리 내에 더 고도로 보존된 암호화 영역을 표적화함으로써 다수의 유전자 패밀리 구성원을 파괴하도록 3개의 유전자 파쇄 구성체를 설계하였다.
3개의 상동성 재조합 표적 구성체를 다음을 사용하여 설계하였다: (1) 델타 12 지방산 불포화효소(d12FAD) 패밀리 구성원의 암호화 서열의 고도로 보존된 일부 및 (2) 각각의 2개의 별개의 SAD 패밀리를 표적화하는 2개의 구성체(각각은 각 패밀리로부터 암호화 서열 영역을 보존하였다). 이 전략은 고전적 유전자 대체 전략보다 이런 고도로 보존된 암호화 영역(다수의 패밀리 구성원을 표적화)에 선택가능한 마커 유전자(수크로스를 가수분해하는 능력을 전달하는 사카로마이세스 세레비시애로부터 유래된 suc2 수크로스 인버타제 카세트)를 포매하되, 해당 상동성 재조합은 표적화된 유전자의 옆에 있는 영역을 표적화하였다.
상기 기재한 방법을 사용하여 모든 구성체를 바이오리스틱 형질전환에 의해 세포 내에 도입하였고, 구성체를 선형화한 후 세포 내로 쏘았다. 형질전환체를 플레이트/배지를 함유하는 수크로스 상에서 선택하였고, 지질 프로파일 상의 변화를 상기-기재한 방법을 사용하여 분석하였다. 각각 3개의 표적화 구성체로부터의 상대적 서열을 이하에 열거한다.
설명 서열번호
표적화 구성체로부터의 d12FAD 암호화영역의 5'서열 서열번호 72
표적화 구성체로부터의 d12FAD 암호화영역의 3'서열 서열번호 73
구성체 cDNA 서열을 표적화하는 d12FAD 서열번호 74
SAD2A의 암호화 영역의 5' 서열 서열번호 75
SAD2A의 암호화 영역의 3'서열 서열번호 76
구성체 cDNA 서열을 표적화하는 SAD2A 서열번호 77
SAD2B의 암호화 영역의 5'서열 서열번호 78
SAD2B의 암호화 영역의 3'서열 서열번호 79
구성체 cDNA 서열을 표적화하는 SAD2B 서열번호 80
각각의 구성체에 의한 형질전환의 대표적인 포지티브 클론을 선택하였고, 이들 클론에 대한 지질 프로파일을 결정하였으며(면적%로 표현), 이하의 표 21에서 요약한다.
불포화효소 녹아웃을 위한 지질 프로파일
지방산 d12FAD KO SAD2A KO SAD2B KO wt UTEX 1435
C8:0 0 0 0 0
C10:0 0.01 0.01 0.01 0.01
C12:0 0.03 0.03 0.03 0.03
C14:0 1.08 0.985 0.795 1.46
C16:0 24.42 25.335 23.66 29.87
C18:0 6.85 12.89 19.555 3.345
C18:1 58.35 47.865 43.115 54.09
C18:2 7.33 10.27 9.83 9.1
C18:3 알파 0.83 0.86 1 0.89
C20:0 0.48 0.86 1.175 0.325
각각의 구성체는 원하는 부류의 지방산에서 측정가능한 영향을 가지며, 모두 3가지 경우에 C18:0 수준은, 특히 2번의 SAD 녹아웃에 의해 현저하게 증가하였다. 양한 클론과 SAD 녹아웃의 추가적인 비교는 SAD2B 녹아웃 계통이 SAD2A 계통과 함께 관찰한 C18:1 지방산 수준보다 C18:1 지방산에서 상당히 더 큰 감소를 가진다는 것을 나타낸다.
추가적인 Δ12 지방산 불포화효소(FAD) 녹아웃을 상기 기재한 방법을 사용하여 프로토테카 모리포미스 배경에서 만들었다. Δ12FAD의 잠재적 상동성을 확인하기 위하여, 다음의 프라이머를 사용하여 추정 FAD를 암호화하는 게놈 영역을 증폭하였다:
프라이머 1 5'-TCACTTCATGCCGGCGGTCC-3' 서열번호 101
프라이머 2 5'- GCGCTCCTGCTTGGCTCGAA-3' 서열번호 102
상기 프라이머를 사용하는 프로토테카 모리포미스 게놈 DNA의 게놈 증폭으로부터 초래된 서열은 매우 유사하였지만, Δ12FAD의 다양한 유전자 또는 대립유전자가 프로토테카에 존재한다는 것을 나타내었다.
이 결과를 기준으로, 2개의 유전자 파쇄 구성체를 하나 이상의 Δ12FAD 유전자를 불활성화하는 것을 추구하도록 설계하였다. 전략은 수크로스 인버타제(사카로마이세스 세레비시애 유래의 (suc2) 카세트를 포매하는 것이며, 따라서 이는 고전적 유전자 대체 전략의 사용보다 고도로 보존된 암호화 영역 내에 선택가능한 마커로서 수크로스를 가수분해하는 능력을 부여한다. pSZ1124로 칭해지는 제1 구성체는 사카로마이세스 세레비시애 suc2 유전자와 클로렐라 불가리스 나이트레이트 3'UTR(사카로마이세스 세레비시애 suc2 카세트)의 발현을 구동하는 클라미도모나스 레인하르드티 β-튜불린 프로모터 옆에 있는 5' 및 3'게놈 표적화 서열을 함유하였다. pSZ1125로 칭해지는 제2 구성체는 사카로마이세스 세레비시애 suc2 유전자 및 클로렐라 불가리스 나이트레이트 환원효소 3'UTR의 발현을 구동하는 클라미도모나스 레인하르드티 β-튜불린 프로모터 옆에 있는 5' 및 3'게놈 표적화 서열을 함유하였다. 구성체의 상대적 서열은 서열 목록에서 열거한다:
pSZ1124 (FAD2B) 5' 게놈 표적화 서열 서열번호 103
pSZ1124 (FAD2B) 3' 게놈 표적화 서열 서열번호 104
사카로마이세스 세레비시애 suc2 카세트 서열번호 105
pSZ1125 (FAD2C) 5' 게놈 표적화 서열 서열번호 106
pSZ1125 (FAD2C) 3' 게놈 표적화 서열 서열번호 107
pSZ1124 및 pSZ1125를 각각 프로토테카 모리포미스 배경에 도입하였고, 수크로스를 가수분해하는 능력을 기반으로 포지티브 클론을 선택하였다. 표 22는 pSZ1124 및 pSZ1125 표적화 벡터를 이용한 2개의 유전자이식 계통에서 얻은 지질 프로파일을 요약한다(면적%, 상기 기재한 방법을 사용하여 만든다).
Δ12 FAD 녹아웃의 지질 프로파일
C10:0 C12:0 C14:0 C16:0 C16:1 C18:0 C18:1 C18:2 C18:3α
모체 0.01 0.03 1.15 26.13 1.32 4.39 57.20 8.13 0.61
FAD2B 0.02 0.03 0.80 12.84 1.92 0.86 74.74 7.08 0.33
FAD2C 0.02 0.04 1.42 25.85 1.65 2.44 66.11 1.39 0.22
FAD2B(pSZ1124) 구성체를 함유하는 유전자이식은 지질 프로파일에서 매우 흥미로우며 예상치 못한 결과를 제공하였고, 즉 감소할 것으로 예상되는 C18:2 수준은 단지 하나의 면적%에 대해서만 감소되었다. 그러나, C18:1 지방산 수준은 상당히 감소된 C16:0 수준을 훼손시키면서 거의 배타적으로 상당히 증가하였다. FAD2C(pSZ1125) 구성체를 함유하는 유전자이식은 또한 지질 프로파일의 변화를 제공하였다: C18:2 수준은 C18:1 수준의 대응하는 증가와 함께 상당히 감소되었다.
우지 모방체
상기 기재한 바와 같은 상기 SAD2B 녹아웃으로부터 만든 하나의 포지티브 클론을 C14-선호 지방 아실-ACP 티오에스터라제 유전자의 추가 도입을 위해 배경으로 사용하도록 선택하였다. 녹나무 C14-선호 티오에스터라제를 도입하는 구성체는 6S rRNA 게놈 영역에 대한 표적화 서열(상동성 재조합을 통해 DNA를 형질전환하는 표적화된 도입을 허용)을 함유하였고, 발현 구성체는 클로렐라 불가리스 나이트레이트 환원효소 3'UTR로 neoR 유전자의 발현을 구동하는 클라미도모나스 레인하르드티 β-튜불린 프로모터, 다음에 제2 클로렐라 불가리스 나이트레이트 환원효소 3'UTR로 클로렐라 프로토테코이데스 스테아릴 ACP 불포화효소 수송 펩타이드에 의한 코돈-최적화된 녹나무 티오에스터라제의 발현을 구동하는 제2 클라미도모나스 레인하르드티 β-튜불린 프로모터를 함유하였다. 5' 6S rRNA 게놈 공여체 서열을 서열번호 82에 열거하며; 3' 6S rRNA 게놈 공여체 서열을 서열번호 84에 열거하고; 녹나무 티오에스터라제에 대한 적절한 발현 구성체를 서열번호 83에 열거한다.
상기 기재한 바와 같은 바이오리스틱 방법을 사용하여 형질전환을 수행하였고, 세포를 2% 수크로스를 함유하는 플레이트 상에서 24 시간 동안 회수하였다. 이 시간 후, 세포를 재현탁하였고, 선택을 위해 2% 수크로스 및 50㎍/㎖ G418를 함유하는 플레이트 상에 재플레이팅하였다. 만든 포지티브 클론 중 9개의 클론을 지질 생성 및 지질 프로파일을 위해 선택하였다. 9개의 유전자이식 클론(SAD2B KO 및 발현 녹나무 C14-선호 티오에스터라제를 지님)을 상기 기재한 바와 같이 배양하였고, 지질 프로파일에 대해 분석하였다. 결과를 이하의 표 23에 요약한다. 탤로에 대한 지질 프로파일을 또한 이하의 표 23에 포함한다(National Research Council 1976: Fat Content and Composition of Animal Product).
티오에스터라제 형질전환된 클론의 지질 프로파일
C10:0 C12:0 C14:0 C16:0 C16:1 C18:0 C18:1 C18:2 C18:3 C20
SAD2BKO
녹나무 TE 클론 1
0.01 0.33 6.13 24.24 0.19 11.08 42.03 13.45 0.98 0.73
SAD2BKO
녹나무 TE 클론 2
0.01 0.16 3.42 23.80 0.40 9.40 50.62 10.2 0.62 0.70
SAD2BKO
녹나무 TE 클론 3
0.01 0.20 4.21 25.69 0.40 7.79 50.51 9.37 0.66 0.63
SAD2BKO
녹나무 TE 클론 4
0.01 0.21 4.29 23.57 0.31 9.44 50.07 10.07 0.70 0.70
SAD2BKO
녹나무 TE 클론 5
0.01 0.18 3.87 24.42 0.32 9.24 49.75 10.17 0.71 0.71
SAD2BKO
녹나무 TE 클론 6
0.01 0.28 5.34 23.78 0.33 9.12 49.12 10.00 0.68 0.70
SAD2BKO
녹나무 TE 클론 7
0.01 0.15 3.09 23.07 0.32 10.08 51.21 10.00 0.66 0.74
SAD2BKO
녹나무 TE 클론 8
0.01 0.29 5.33 24.62 0.37 7.02 49.67 10.74 0.69 0.70
SAD2BKO
녹나무 TE 클론 9
0.01 0.12 2.74 25.13 0.30 10.17 50.18 9.42 0.71 0.71
wt UTEX 1435 0.01 0.02 0.96 23.06 0.79 3.14 61.82 9.06 0.46 0.27
SAD2BKO 0.01 0.03 0.80 23.66 0.13 19.56 43.12 9.83 1.00 1.18
탤로 0.00 0.00 4.00 26.00 3.00 14.00 41.00 3.00 1.00 0.00
표 23에서 나타내는 바와 같이, 유전자이식 계통의 지질 프로파일은 탤로의 질 프로파일과 상당히 유사하다. 종합적으로, 해당 데이터는 이 경우에, 즉 C14-선호 티오에스터라제(녹나무 유래)에 의한 SAD2B 녹아웃에서 탤로의 지질 프로파일과 유사한 오일을 생성하는 유전자이식 조류 균주를 만드는 특정 유전자이식 배경을 조합하는 효용을 증명한다.
표적화된 녹-아웃 접근에 의한 β- 케토아실 신타제 II( KASII )의 발현을 하향조절하기 위하여 사용된 구성체
표적화된 녹-아웃 접근에 의한 벡터 하향조절 KASII 유전자 발현을 UTEX 1435, S1331의 고전적으로 돌연변이유발된 유도체 내에 도입하였다. 사카로마이세스 세레비시애 인버타지 유전자를 선택가능한 마커로서 이용하여, 수크로스상에서 성장 능력을 부여하였다. 클라미도모나스 레인하르드티 B-튜불린 프로모터의 제어 하에 인버타제 발현 카세트를 315bp의 긴 KASII 게놈 영역의 중간에 삽입하여 표적화된 통합을 허용하였다(pSZ1503).
pSZ1503 내 적절한 제한 부위를 소문자, 볼드체 및 밑줄로 나타내었고, 이는 각각 5'-3' BspQ 1, Kpn I, AscI, Xho I, Sac I, BspQ I이었다. BspQI 부위는 DNA를 형질전환하는 5' 및 3'말단의 범위를 정한다. 볼드체, 소문자 서열은 상동성 재조합을 통해 KASII 좌위에서 표적화된 통합을 허용하는 S1331으로부터의 게놈 DNA를 나타낸다. 5'에서 3'방향으로 진행하면, 효모 수크로스 인버타제 유전자의 발현을 구동하는 클라미도모나스 레인하르드티 B-튜불린 프로모터(수크로스를 대사하는 S1331의 능력을 부여)는 박스로 표시된다. 인버타제에 대한 개시자 ATG 및 종결자 TGA를 대문자, 볼드 이탤릭체로 표시하는 한편, 암호화 영역을 소문자 이탤릭체로 표시하였다. 클로렐라 불가리스 나이트레이트 환원효소 3' UTR을 소문자 밑줄로 표시한다.
pSZ1503_[KASII_btub-y.inv-nr_KASII]에 함유된 DNA를 형질전환하는 뉴클레오타이드 서열:
Figure 112018108415035-pat00017
KAS II 대립유전자 1 및 대립유전자 2의 cDNA를 각각 서열번호 279 및 280에서 확인하였다. 대립유전자 1 및 2의 아미노산 서열을 서열번호 281 및 282에서 각각 확인하였다.
지질 조성물에서 KASII 불활성화의 영향을 결정하기 위하여, pSZ1503 벡터 DNA를 S1331로 형질전환하여 표적화된 KASII 녹-아웃 표현형을 만들어냈다. 처음에 하나의 클론을 분리하였고, pH5.0에서 표준 지질 생성 조건 하에 성장시켰다. 가장 대표적인 클론 및 야생형 세포의 결과 프로파일을 이하의 표 31에 나타낸다.
Figure 112018108415035-pat00018
실시예 12: 대안의 선택가능한 마커에 의한 프로토테카 유전자조작
A. 프로토테카 모리포미스 내 분비성 α-갈락토시다제의 발현
프로토테카 종 내 이종성 수크로스 인버타제 유전자의 발현 방법 및 효과는 본 명세서에 참조로 포함되는 국제특허출원 PCT/US2009/66142에서 앞서 기재되었다. 다른 이종성 다당류 분해 효소의 발현은 이 실시예에서 시험하였다. α-갈락토시다제를 암호화하는 다음의 외인성 유전자 외의 프로토테카 모리포미스 UTEX 1435에 의한 멜리비오스(α-D-gal-glu)를 성장시키는 능력을 시험하였다: 사카로마이세스 카를베젠시스(Saccharomyces carlbergensis) 유래의 MEL1 유전자(NCBI 등록번호 P04824에 대응하는 아미노산 서열(서열번호 108)), 아스퍼질러스 니거로부터 유래된 AglC 유전자(NCBI 접수번호 Q9UUZ4에 대응하는 아미노산 서열(서열번호 116)), 및 고등 식물로부터의 α-갈락토시다제(구아콩)(NCBI 접수번호 P14749에 대응하는 아미노산 서열(서열번호 120). 상기 접수 번호 및 대응하는 아미노산 서열을 본 명세서에 참조로 포함한다. 모든 경우에, 프로토테카 모리포미스에서 선호되는 코돈 사용빈도에 따라서 유전자를 최적화하였다. 발현 카세트의 적절한 일부를 서열목록 번호와 함께 이하에 열거한다. 모든 발현 카세트는 안정한 게놈 통합을 위한 5'및 3'Clp 상동성 재조합 표적화 서열, 클라미도모나스 레인하르티 TUB2 프로모터/5'UTR, 및 클로렐라 불가리스 나이트레이트 환원효소 3'UTR을 사용하였다.
Figure 112018108415035-pat00019
프로토테카 모리포미스 세포를 상기 실시예 2에 기재한 바이오리스티기 형질전환 방법을 사용하여 사카로마이세스 카를베젠시스 MEL1, 아스퍼질러스 니거 AlgC, 또는 시아몹시스 테트라고노볼라 α-갈락토시다제 유전자를 함유하는 각각 3개의 발현 카세트로 형질전환하였다. 포지티브 클론을 유일한 탄소 공급원으로서 2% 멜리비오스를 함유하는 플레이트를 사용하여 스크리닝하였다. 콜로니는 시아몹시스 테트라고노볼라 발현 카세트 형질전환체에 대한 플레이트 상에 나타나지 않았다. 포지티브 클론을 사카로마이세스 카를베젠시스 MEL1 형질전환체 및 아스퍼질러스 니거 AlgC 형질전환체를 함유하는 플레이트로부터 취했다. 표적화하는 프라이머에 의해 PCR을 사용하여 형질전환 DNA의 통합을 클로렐라 불가리스 3'UTR 및 3' Clp 상동성 재조합 표적 서열의 일부를 확인하였다.
5' 프라이머 클로렐라 불가리스 3'UTR:하류 Clp 서열(서열번호 123)
ACTGCAATGCTGATGCACGGGA
3'프라이머 클로렐라 불가리스 3'UTR:하류 Clp 서열(서열번호 124)
TCCAGGTCCTTTTCGCACT
음성 대조군으로서, 미번역 프로토테카 모리포미스 세포로부터의 게놈 DNA를 또한 프라이머 세트를 증폭하였다. 생성물은 야생형 세포로부터의 게놈 DNA로부터 증폭되지 않았다.
각각의 사카로마이세스 카를베젠시스 MEL1 형질전환체 및 아스퍼질러스 니거 AlgC 형질전환체으로부터의 몇몇 포지티브 클론(PCR로 확인)을 액체 배지 내 유일한 탄소 공급원으로서 멜리비오스를 성장시키는 능력에 대해 시험하였다. 이 분비 클론을 유일한 탄소 공급원으로서 멜리비오스와 함께 상기 실시예 1에 기재한 조건 및 기본 배지 중에서 3일 동안 성장시켰다. α-갈락토시다제-암호화 유전자 중 하나를 함유하는 모든 클론이 이 시간 동안 강하게 성장하는 한편, 형질전환되지 않은 사카로마이세스 세레비시애 SUC2 수크로스를 발현시키는 야생형 균주와 프로토테카 모리포르미스는 둘 다 멜리비오스 배지 상에서 불량하게 성장한다. 이들 결과는 α-갈락토시다제 암호화 유전자가 형질전환을 위한 선택가능한 마커로서 사용될 수 있다는 것을 시사한다. 또한, 이들 데이터는 사카로마이세스 카를베젠시스 MEL1(서열번호 109) 또는 아스퍼질러스 니거 AlgC(서열번호 117)에 존재하는 본래의 신호 펩타이드가 프로토테카 모리포미스 세포 내 주변세포질에 단백질을 표적화하는데 유용하다는 것을 나타낸다.
B. THIC 유전자는 프로토테카 내에서 티아민 영양요구성을 보완한다
프로토테카 모리포미스 세포 내 티아민 원영양성(prototrophy)을 외인성 THIC 유전자의 발현을 사용하여 시험하였다. 식물 및 조류 내 티아민 생합성은 전형적으로 플라스티드 내에서 수행되며, 따라서 그것의 생성에 수반되는 대부분의 핵 암호화된 단백질이 플라스티트로 효율적으로 표적화될 필요가 있을 것이다. 프로토테카 모리포미스의 DNA 시퀀싱 및 전사체 시퀀싱은 티아민 생합성 효소를 암호화하는 모든 유전자가 THIC의 발현과 함께 게놈 내에 존재하는 것을 나타내었다. 생화학 수준에서 티아민 영양요구성을 초래하는 손상을 나누기 위하여, 5개의 상이한 섭생 하에: (1) 2㎛ 티아민 하이드로클로라이드의 존재 하에; (2) 티아민 없이; (3) 티아민은 없지만, 2㎛ 하이드록시에틸 티아졸(hydroxyethyl thiazole, THZ)과 함께; (4) 티아민은 없지만, 2㎛ 2-메틸-4-아미노-5-(아미노메틸)피리미딘(2-methyl-4-amino-5-(aminomethyl)pyrimidine, PYR); 및 티아민은 없지만, 2㎛ THZ 및 2㎛ PYR과 함께 프로토테카 모리포미스 세포의 성장을 시험하였다. 5개의 상이한 조건 하에서 성장 실험으로부터의 결과는 프로토테카 모리포미스 세포는 드노보 합성을 할 수 있지만, PYR 전구체가 제공된다면 단지 티아민 파이로포스페이트(TPP)를 생성할 수 있는 것으로 나타났다. 이는 프로토테카 모리포미스의 티아민 영양요구성이 THIC 효소에 의해 전환을 촉매하는 아미노이미다졸 리보뉴클레오타이드로부터 하이드록시메틸피리미딘 포스페이트(hydroxymethylpyrimidine phosphate, HMP-P)를 합성할 수 없음에 기인한다는 것과 일치한다.
프로토테카 모리포미스 세포를 실시예 2에서 상기 지재한 바이오리스틱 형질전환 방법을 사용하여 형질전환하였으며, 이는 콕코믹사 C-169 THIC(JGI 단백질 ID 30481에 대응하는 아미노산 서열, 본 명세서에 참조로 포함됨) 및 선택적 마커로서 사카로마이세스 세레비시애 SUC2 수크로스 인버타제를 발현한다. 이 발현 구성체는 콕코믹사 C-169 THIC의 본래의 수송 펩타이드 서열, 게놈 DNA의 6S 영역에 대한 상류 및 하류의 상동성 재조합 표적 서열, 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR 영역(서열번호 104), 및 클로렐라 불가리스 나이트레이트 환원효소 3'UTR(서열번호 115)을 함유하였다. 사카로마이세스 세레비시애 SUC2 발현은 또한 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR 영역(서열번호 114)에 의해 구동되었고 클로렐라 불가리스 나이트레이트 환원효소 3'UTR(서열번호 115)을 함유하였다. 유전자는 프로토테카 모리포미스에서 바람직한 코톤 사용빈도에 따라서 최적화되었다. 적절한 발현 카세트 서열을 서열목록에서 열거하며, 이하에서 상술한다:
콕코믹사 C-169 THIC 아미노산 서열 서열번호 125
콕코믹사 C-169 THIC 아미노산 서열 본래의 수송 펩타이드 서열번호 126
콕코믹사 C-169 THIC 형질전환 카세트 서열번호 127
콕코믹사 C-169 THIC 서열(코돈 최적화) 서열번호 128
사카로마이세스 세레비시애 SUC2 서열(코돈 최적화) 서열번호 129
5'6S 상동성 재조합 표적 서열 서열번호 82
3'6S 상동성 재조합 표적 서열 서열번호 84
포지티브 클론의 선택을 티아민 없이 플레이트 상에서 수행하였고 유일한 탄소 공급원으로서 수크로스를 함유하였다. 콕코믹사 C-169 THIC 유전자 내에서 결합하는 5'프라이머 및 6S 좌위 내 형질전환 DNA의 하류를 어닐링하는 3' 프라이머에 의한 PCR을 사용하여 포지티브 클론을 확인하였다. 또한 사우던 블롯 분석을 사용하여 PCR 확인 포지티브 클론을 확인하였다.
야생형 프로토테카 모리포미스 세포의 티아민 영양요구성을 관찰하기 위하여, 내부 티아민을 보유하는 제1 고갈 세포가 필요하다. 티아민이 없는 배지 내에서 성장을 시험하기 위하여, 2㎛ 티아민을 함유하는 배지 내 고정상에 대해 세포를 우선 성장시킨 다음 해당 세포를 티아민이 없는 배지 내 750㎚에서 대략 0.05의 광학 밀도(OD750)로 희석하였다. 그 다음에 희석한 세포를 티아민이 없는 배지 내 고정상에 대해 한번 더 성장시켰다(약 2-3일). 이들 티아민-고갈 세포를 티아민이 없는 배지 내에서 성장 연구를 위한 배양물을 접종하기 위하여 사용하였다. 야생형 세포를 탄소 공급원으고서 글루코스와 함께 매지 내에서 성장시켰고(티아민과 함께 또는 티아민 없이), 본래의 수송 펩타이드 콕코믹사 C-169 THIC 구성체가 있는 포지티브 클론을 유일한 탄소 공급원으로서 수크로스와 함께 배지 내에서 성장시켰다. 750㎚에서 흡광도를 모니터링함으로써 성장을 측정하였다. 성장 실험의 결과는 무티아민 배지 내 야생형 세포와 비교하여 이식유전자를 발현시키는 균주의 무티아민 배지 내 실질적으로 더 큰 성장을 나타내었다. 그러나, 형질전환체는 티아민-함유 배지 내 야생형 세포의 성장속도 및 세포밀도를 달성하지 못하였다. 또한 무티아민 배지 내 형질전환체 클론의 성장량과 통합된 콕코믹사 효소의 복제물 수 사이에는 강한 상관관계가 있었다(즉, 이식유전자의 더 많은 복제물 수, 무티아민 배지 내 더 많은 세포 성장).
추가적인 형질전환체를 콕코믹사 THIC를 함유하는 발현 구성체, 아라비돕시스 탈리아나(애기장대) THIC 유전자, 및 시네코시스티스 속 PCC 6803 thiC 유전자를 사용하여 만들었다. 콕코믹사 및 아라비돕시스 탈리아나 THIC 유전자의 경우에, 본래의 수송 펩타이드 서열을 클로렐라 프로토테코이데스 스테아릴-ACP 불포화효소(SAD) 유전자로부터의 수송 펩타이드 서열로 대체하였다. 시네코시스티스 속은 시아노박테리아이며, thiC 단백질은 본래의 수송 펩타이드 서열을 함유하지 않는다. 시네코시스티스 속 thiC 구성체에서, 클로렐라 프로토테코이데스 SAD 유전자로부터의 수송 펩타이드 서열을 시테코시스티스 속 thiC의 N-말단에 융합하였다. 모든 경우에, 프로토테카 모리포미스의 발현을 위해 서열을 코돈 최적화하였다. 앞서 언급한 구성체 3가지 모두는 게놈의 6S에 대한 상류 및 하류의 상동성 재조합 표적 서열(서열번호 82 및 84), 클로렐라 프로토테코이데스 액틴 프로모터/5' UTR, 및 클로렐라 프로토테코이데스 EF1A 유전자 3'UTR을 함유하였다. 3가지 구성체 모두는 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR(서열번호 114)에 의해 구동되는 neoR 유전자를 함유하였고, 클로렐라 불가리스 3'UTR(서열번호 115)을 함유하였으며, G418에 의한 선택을 부여하였다. 아라비돕시스 탈리아나 THIC의 아미노산 서열은 NCBI 접수 번호 NP_180524에 대응하며 및 시네코시스티스 속 thiC 의 아미노산 서열은 NCBI 접수 번호 NP_442586에 대응하며, 둘 다 본 명세서에 참조로 포함된다. 적절한 발현 카세트 서열은 서열 목록에서 열거하며, 이하에 상세하게 설명한다:
Figure 112018108415035-pat00020
G418을 함유하는 플레이트 상에서 포지티브 클론을 스크리닝 하였고, 각 형질전환으로부터 몇몇 클론을 PCR로 확인을 위해 선택하였다. 콕코믹사 C-169(클로렐라 프로토테코이데스 수송 펩타이드를 가짐), 아라비돕시스 탈리아나 및 시네코시스티스 속 PCC 6803 THIC 유전자를 각각 함유하는 형질전환 DNA 구성체의 게놈의 6S 좌위에 통합을 다음의 프라이머에 의한 PCR 분석을 사용하여 확인하였다:
5' THIC 콕코믹사 확인 프라이머 서열(서열번호 141)
ACGTCGCGACCCATGCTTCC
3' THIC 확인 프라이머 서열(서열번호 142)
GGGTGATCGCCTACAAGA
5' THIC 아라비돕시스 탈리아나 확인 프라이머 서열(서열번호 143)
GCGTCATCGCCTACAAGA
5' thiC 시네코시스티스 속. 확인 프라이머 서열(서열번호 144)
CGATGCTGTGCTACGTGA
G418을 함유하는 배지 내 각각의 상이한 구성체의 형질전환체로부터 선택 확인한 포지티브 클론을 사용하여 티아민 고갈 세포 상의 성장 실험(상기 기재)을 수행하였다. 모든 형질전환체를 (다양한 정도의 견고성으로) 무티아민 배지 내에서 성장시킬 수 있었다. 무티아민 배지 내 형질전환체의 성장과 티아민 함유 배지 상에서 야생형 세포의 성장의 비교는 무티아민 배지 내 성장을 지원하는 능력에 대한 다음의 순위를 나타내었다: (1) 아라비돕시스 탈리아나 형질전환체; (2) 콕코믹사 C-169(클로렐라 프로토테코이데스 수송 펩타이드를 가짐) 형질전환체; 및 (3) 시네코시스티스 속 형질전환체. 이들 결과는 아라비돕시스 탈리아나 THIC의 단일 복제물이 프로토테카 모리포미스 세포, 다양한 콕코믹사 C-169 복제물(본래의 수송 펩타이드 서열 또는 클로렐라 프로토테코이데스로부터의 수송 펩타이드 서열 중 하나를 가짐) 및 시네코시스티스 속에서 티아민 영양요구성을 보완할 수 있다는 것을 시사한다. 티아민의 부재에서 THIC는 빠른 성장을 가능하게 할 것을 필요로 한다. 상이한 공급원으로부터 상이한 THIC 결과의 변동성이 주어지면, 프로토테카 종에 존재하는 손상을 완전히 보완하기 위한 임의의 특정 THIC 유전자 능력은 예측가능하지 않다.
3개의 THIC 아미노산 서열의 정렬을 수행하였다. 콕코믹사 및 아라비돕시스 탈리아나의 THIC와 비교하여 시네코시스티스 속의 thiC 사이에 상당한 서열 보존이 존재하지만(아미노산 수준에서 41% 동일성), 시아노박테리아 단백질은 조류 및 식물 단백질에 잘 보존된 N-말단에서 도메인을 상실한다. 상실 도메인(및 추정적으로 구조적 차이를 초래)에도 불구하고, 시테코시스티스 속 thiC를 발현시키는 구성체는 프로토테카 모리포미스 세포 내 티아민 원영양성을 적어도 부분적으로 회복할 수 있었다.
실시예 13: 연료 생산
A. 익스펠러 프레스 및 프레스 보조기를 사용한 미세조류로부터 오일의 추출
DCW를 기준으로 38%의 오일을 함유하는 미세조류 바이오매스는 드럼 건조기로 건조시켜 5 내지 5.5%의 수분함량을 초래하였다. 상기 바이오매스는 프렌치 L250 프레스에 공급하였다. 30.4 kg (67 lbs.)의 바이오매스를 프레스를 통해 공급하고 오일을 회수하였다. 프레스 보조기로서 다양한 %의 스위치그래스와 조합된 동일한 건조된 미세조류 바이오매스를 프레스를 통해 공급하였다. 건조된 미생물 바이오매스와 20% w/w의 스위치그래스의 조합으로 최고 오일을 회수%를 수득하였다. 프레스된 케이크를 이어서 헥산 추출에 적용하고 20% 스위치그래스 조건에 대한 최종 수율은 총 61.6%의 가용 오일(중량으로 계산하여)이었다. 상기 50% 오일 건조 세포 중량을 갖는 바이오매스는 오일을 유리시키기 위해 스위치그래스와 같은 프레싱 보조기의 사용을 요구하지 않는다. 익스펠러 프레스를 사용하여 미세조류로부터 오일을 추출하는 다른 방법은 국제특허출원 PCT/US2010/031108에 기재되며, 본 명세서에 참조로 포함된다.
B. 프로토테카 오일로부너 바이오디젤의 생성
상기 기재한 방법에 따라서 생성된 프로토테카 모리포미스 UTEX 1435의 탈검 오일에 에스터결합전이를 실시하여 지방산 메틸 에스터를 생성하였다. 결과를 이하의 표 24에 나타낸다.
오일의 지질 프로파일은 하기와 같다:
C10:0 0.02
C12:0 0.06
C14:0 1.81
C14.1 0.07
C16:0 24.53
C16:1 1.22
C18:0 2.34
C18:1 59.21
C18:2 8.91
C18:3 0.28
C20:0 0.23
C20:1 0.10
C20:1 0.08
C21:0 0.02
C22:0 0.06
C24:0 0.10
프로토테카 모리포미스 트라이글라이세라이드 오일로부터의 바이오디젤 프로파일
방법 시험 결과 단위
ASTM D6751 A1 바이오디젤 배합 연료의 콜드 소킹 여과성 여과시간 120
여과된 부피 300
ASTM D93 펜스키 마텐스(Pensky-Martens) 밀폐컵 인화점 사용한 절차 A
보정한 인화점 165.0
ASTM D2709 중질유 연료 내 물 및 침전물
(원심분리 방법)
침전물 및 물 0.000 Vol %
EN 14538 ICP OES에 의한 Ca 및 Mg 함량의 결정 (Ca 및 Mg)의 합 <1 ㎎/㎏
EN 14538 ICP OES에 의한 Ca 및 Mg 함량의 결정 (Na 및 K)의 합 <1 ㎎/㎏
ASTM D445 동적/역학적 점성도 104 ℉/40 ℃에서 동적 점성도 4.873 ㎟/s
ASTM D874 윤활오일 및 첨자제로부터의 황산회분 황산회분 < 0.005 Wt %
ASTM D5453 자외선 형광에 의한 경질탄화수소, 불꽃점화 엔진 연료, 디젤 엔진 연료, 및 엔진 오일의 전체 황 결정 황, ㎎/㎏ 1.7 mg/kg
ASTM D130 부식- 구리 스트립 바이오디질-Cu 부식 50℃(122℉)/3시간 1a
ASTM D2500 혼탁점 혼탁점 6
ASTM D4530 미세 탄소 잔류물 평균 미분화 방법 탄소 잔류물 < 0.10 Wt %
ASTM D664 전위차 적정에 의한 석유제품의 산가 사용한 절차 A
산가 0.20 mg KOH/g
ASTM D6584 기체 크로마토그래피에 의한 B-100 바이오디젤 내 유리 글라이세린 및 전체 글라이세린의 결정 유리 글라이세린 <0.005 Wt %
전체 글라이세린 0.123 Wt %
ASTM D4951 ICP-AES에 의한 윤활 오일 내 추가적인 요소 0.000200 Wt %
ASTM D1160 감압에서 석유 제품의 증류 IBP 248
% 회수에서 AET 336
10% 회수에서 AET 338
20% 회수에서 AET 339
30% 회수에서 AET 340
40% 회수에서 AET 342
50% 회수에서 AET 344
60% 회수에서 AET 345
70% 회수에서 AET 347
80% 회수에서 AET 349
90% 회수에서 AET 351
95% 회수에서 AET 353
FBP 362
회수% 98.5 %
손실% 1.5 %
잔류% 0.0 %
콜드 트랩 부피 0.0
IBP

248
EN 14112 산화 안정성의 결저(가속화된 산화 시험) 산화 안정성 > 12 시간
작동 온도(보통 110℃) 110
ASTM D4052 디지털 밀도계에 의한 액체 밀도 60℉에서 API 비중 29.5 °API
ASTM D 6890 점화지연(Ignition Delay, ID) 및 유도 세탄가(Derived Cetane Number, DCN)의 결정 유도 세탄가(DCN) > 61.0
바이오디젤의 지질 프로파일은 공급원료 오일의 지질 프로파일과 매우 유사하였다. 본 발명의 방법 및 조성물에 의해 제공되는 다른 오일은 에스터결합전이로 (a) 적어도 4% C8-C14; (b) 적어도 0.3% C8; (c) 적어도 2% C10; (d) 적어도 2% C12; 및 (3) 적어도 30% C8-C14를 포함하는 지질 프로파일을 가지는 바이오디젤을 얻을 수 있다.
생성된 바이오디젤의 ASTM D6751 A1 방법에 의한 콜드소킹 여과성은 300㎖의 부피에 대해 120초 이었다. 이 시험은 300㎖의 B100의 여과를 수반하며, 16시간 동안 40℉로 냉각시켰고, 실온으로 가온하며, 스테인레스 스틸 지지체를 가지는 0.7 마이크론 유리 섬유 필터를 사용하여 진공하에 여과하였다. 본 발명의 오일은 에스터결합전이에 의해 120초 미만, 100초 미만, 및 90초 미만의 콜드 소킹 시간으로 바이오디젤을 만들수 있다.
C. 재생 디젤의 생성
상기 기재한 방법에 따라서 생산되고 본 실시예에서 바이오디젤을 만들기 위하여 사용한 오일과 동일한 지질 프로파일을 가지는 프로토테카 모리포미스 UTEX 1435의 탈검 오일에 에스터결합전이를 실시하여 재생 디젤을 생성하였다.
오일을 우선 수소처리하여 산소 및 글라이세롤 백본을 제거하였고, n-파라핀을 수득하였다. 그 다음에 n-파라핀에 크래킹 및 이성질체화를 실시하였다. 물질의 크로마토그램을 도 1에 나타낸다. 그 다음에 물질에 냉각 여과를 실시하여, C18 물질의 약 5%를 제거하였다. 냉각 여과 후, 전체 부피 물질은 인화점이 바뀌었고, 인화점, ASTM D-86 증류 분포, 혼탁도 및 점성도를 평가하였다. 인화점은 63℃이었고; 점성도는 2.86 cSt(센티스톡, centistokes)이었으며; 혼탁도는 4℃이었다. ASTM D86 증류값을 표 25에 나타낸다:
ASTM D86 증류 값
℃로 판독
부피 온도
IBP 173
5 217.4
10 242.1
15 255.8
20 265.6
30 277.3
40 283.5
50 286.6
60 289.4
70 290.9
80 294.3
90 300
95 307.7
IBP 331.5
생성된 물질의 T10-T90는 57.9℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 본 명세서에 개시된 방법에 따라서 생성된 트라이글라이세라이드 오일을 사용하여 다른 T10-T90 범위, 예컨대 20, 25, 30, 35, 40, 45, 50, 60 및 65℃를 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
생성된 물질의 T10은 242.1℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 다른 T10값, 예컨대 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 적어도 290의 T10을 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
생성된 물질의 T90은 300℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 다른 T90값, 예컨대 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 적어도 290의 T90을 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
생성된 물질의 FBP는 300℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 다른 FBP값, 예컨대 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 적어도 300의 FBP를 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
본 발명의 방법 및 조성물에 의해 제공된 다른 오일은 수소처리, 이성질체화, 및 다른 공유적 변형의 조합이 실시되며, (a) 적어도 4% C8-C14; (b) 적어도 0.3% C8; (c) 적어도 2% C10; (d) 적어도 2% C12; 및 (3) 적어도 30% C8-C14를 포함하는 지질 프로파일을 갖는 오일을 포함한다.
실시예 14: 맞춤 오일의 생성
본 명세서에 개시된 방법 및 물질을 사용하여, 다양한 맞춤 오일을 생성하였다. 표 32는 균주, 유전자 및 표현형을 부여하는 유전자의 genbank 등록 번호 및 표시된 균주에 의해 생성된 다양한 지방산 프로파일을 나타낸다. 균주 A 및 B는 둘 다 프로토테카 모리포미스(UTEX 1435) 균주이며, 이들 둘 다 오일 수율을 개선하기 위하여 행위별수가 연구에 의해 고전적으로 돌연변이유발된다. 그 다음에 균주 A 및 B는 원하는 유전자를 발현시키기 위하여 적절한 DNA 구성체와 함께 본 명세서에 기재된 바와 같이 유전자 조작한다. 또한 균주를 표시한 바와 같은 내인성 불포화효소를 불활성화하기 위하여 유전자조작하였다. 티오에스터라제의 뉴클레오타이드 서열을 프로토테카에서 발현 및 사용을 위해 코돈 최적화하였다.
유전자 조작하지 않은 프로토테카의 야생형 지방산 프로파일을 표 32의 첫 번째 라인에 나타낸다. 알 수 있는 바와 같이, 지방산 프로파일은 상이한 균주에서 상이한 방법으로 극적으로 변경되었다. 예를 들어 비유전적으로 유전자조작된 프로토테카 모리포미스 세포에 의해 생성된 C8:0의 백분율은 0%이다. 그러나, 쿠페아 후커리아나 티오에스터라제를 발현시키기 위하여 유전자 조작된 프로토테카 모리포미스 세포는 전체 트라이글라이세라이드의 0% 내지 13.2%로 C8:0 생성을 증가시켰다. 다른 예에서, 유전자 조작된 균주의 C8:0 및 C10:0의 전체 합한 양은 전체 지방산의 약 39%이었다. 대조적으로, 야생형 세포 내 C8:0 및 C10:0의 전체 합한 양은 0.01%이다. 다른 예에서, 포화된 지방산의 전체 양은 내인성 SAD2b의 발현이 파쇄되는 세포 내 미국 느릅나무 티오에스터라제의 발현에 의해 약 32% 내지 약 90%로 증가하였다. 이는 거의 300%의 증가이다.
이하에 개시된 다양한 지방산 프로파일은 트라이글라이세라이드 오일을 수반하는 무수히 많은 용도에서 유용하다. 예를 들어, 트라이글라이세라이드를 포함하는 더 낮은 탄소 쇄 길이 포화된 지방산(C12:0, C14:0, C16:0)의 높은 수준은 재생 제트 연료 생성에서 특히 유용하다. 바이오디젤 생성을 위해, 고량의 C18:1이 바람직하다. 바형(bar) 비누 생성을 위해, 포화 수준과 더 짧은 쇄의 지방선 사이의 적절한 균형을 제어하고 달성하는 것은 바람직하다. 예로서, 고량의 C12:0는 비누거품 특성에 바람직한 반면, 더 긴 쇄 길이는 더 구조적이며, 한편으로 트라이글라이세라이드를 함유하는 리놀레산 및 리놀렌산은 그것들이 산화적 불안정성에 기여하기 때문에 덜 바람직하다. 액체 비누에 대해, 고량의 C12:0 및 C14:0이 바람직하다. 추가적으로, 바형 비누와 액체 비누 제품 둘 다에 대해, C6:0, C8:0 및 C10:0의 낮은 양이 바람직한데, 이들 더 낮은 쇄 트라이글라이세라이드는 피부 자극물이기 때문이다.
Figure 112018108415035-pat00021
Figure 112018108415035-pat00022
팜커넬 오일
본 발명자들은 팜커넬 오일(PKO)과 유사한 미생물 팜커넬 오일 모방체를 생산하였다. 팜커넬 오일 모방체에, 플라스미드를 구성하였고, 사용하여 균주 A를 형질전환하였고, 오일 생성을 수행하였다. 구성체, pSZ1413(서열번호 231)은 코돈 최적화 쿠페아 라이티 FATB2 유전자(서열번호 284)(Gen bank 등록번호 U56106) 및 SAD2B (스테아릴 ACP 불포화효소) 유전자 파쇄를 포함하였다.
이하의 표 33에서 나타내는 바와 같이, 팜 커넬 오일 모방체는 팜커넬 오일과 유사하였다. PKO 모방체의 3가지의 가장 흔한 지방산(C12:0, C14:0 및 C18:1)의 백분율은 팜 커넬 오일의 10%와 동일하거나 그 이내이다.
팜커넬 오일 모방체의 트라이글라이세라이드 프로파일
C8:0 C10:0 C12:0 C14:0 C16:0 C18:0 C18:1 C18:2
인도네시아 기름야자
(팜 커넬)
3.0-5.0 2.5-6.0 40-52 14.0-18.0 7.0-10.0 1.0-3.0 11.0-
19.0
0.5-4.0
pSZ1413 8.33 37.45 18.22 13.52 1.25 15.29 4.95
팜커넬
본 발명자들은 팜커넬 오일과 유사한 미생물 팜커넬 오일을 생성하였다. 몇몇 상이한 플라스미드를 구성하였고, 개별적으로 균주 A로 형질전환되었으며, 오일 생성을 수행하였다. 구성체, pSZ1503(서열번호 283)을 내인성 KASII 유전자를 파쇄하기 위하여 설계하였다. 구성체, pSZ1439(서열번호 237)는 코돈 최적화 인도네시아 기름야자 TE 유전자(서열번호 205)(Gen bank 등록번호 AAD42220.2)를 포함하였다. 구성체, pSZ1420(서열번호 225)은 코돈 최적화 쿠페아 후커리아나 TE 유전자(서열번호 201)(Gen Bank 등록번호 Q39513)를 포함하였다. 구성체, pSZ1119(서열번호 227)는 코돈 최적화 쿠페아 후커리아나 KAS IV 유전자(서열번호 186)(Gen Bank 등록번호 AF060519)뿐만 아니라 쿠페아 라이티 FATB2 유전자(서열번호 184)(Gen Bank 등록번호 U56104)를 포함하였다.
이하의 표 34에서 나타내는 바와 같이, 팜 커넬 오일 모방체는 팜 오일과 유사하였다. 팜 오일 모방체의 3가지 가장 흔한 지방산(C16:0, C18:1 및 C18:2)의 백분율은 팜 오일의 10%와 동일하거나 그 이내이었다.
팜 오일 모방체의 트라이글라이세라이드 프로파일
C10:0 C12:0 C14:0 C16:0 C18:0 C18:1 C18:2
인도네시아 기름야자
(팜)
0 0 0.5-5.9 32.0-47.0 2.0-8.0 34-44 7.2-12.0
pSZ1503 0.01 0.01 0.83 38.36 2.21 48.31 7.60
pSZ1439 0.01 0.04 1.88 43.50 3.32 39.95 9.16
pSZ1420 0.02 0.04 2.44 48.04 2.76 35.62 8.91
pSZ1119 1.77 0.40 7.85 35.45 2.47 42.85 8.15
코코아 버터
본 발명자들은 코코아 버터와 유사한 미생물 코코아 버터 모방체를 생성하였다. 구성체, pSZ1451를 구성하였고, 균주 A로 형질전환하였으며, 오일 생성을 수행하였다. 구성체, pSZ1451(서열번호 239)은 코돈 최적화 카타무스 틴토리우스(Carthamus tinctorus) TE 유전자(서열번호 187)(Gen Bank 등록번호 AAA33019.1)를 포함하였다.
이하의 표 35에서 나타내는 바와 같이, 코코아 버터 오일 모방체는 코코아 버터와 유사하였다. 코코아 버터 모방체의 3가지(C16:0, C18:0 및 C18:1) 가장 흔한 지방산의 백분율은 코코아 버터와 동일하거나 10% 이내이었다.
코코아 버터 모방체의 트라이글라이세라이드 프로파일
C8:0 C10:0 C12:0 C14:0 C16:0 C18:0 C18:1 C18:2
코코아 버터 0 0-1 0-1 0-4 22-38 24-37 29-38 0-3
pSZ1451 0.05 0.14 0.99 28.34 27.39 29.40 10.26
본 발명자들은 라드와 유사한 미생물 라드 모방체를 생성하였다. 몇몇 상이한 플라스미드를 구성하였고, 개별적으로 균주 A로 형질전환하였으며, 오일 생성을 수행하였다. 구성체, pSZ1493(서열번호 241)을 내인성 SAD 2B 유전자를 파괴하고 코돈 최적화 캘리포니아 월계수 TE 유전자(서열번호 285)(Gen Bank 등록번호 M94159)를 동시에 발현하도록 설계하였다. 구성체, pSZ1452(서열번호 240)를 내인성 SAD 2B 유전자를 파괴하고 코돈 최적화 가르시니아 망고스타나 TE 유전자(서열번호 196)(Gen Bank 등록번호 AAB51525.1)를 발현하도록 설계하였다. 구성체, pSZ1449(서열번호 238)를 브라씨카 나푸스 TE 유전자(서열번호 195)(Gen Bank 등록번호 CAA52070.1)를 발현하도록 설계하였다. 구성체 pSZ1458의 폴리뉴클레오타이드 서열은 쿠페아 후커리아나 티오에스터라제(Gen Bank 등록번호 U39834)를 암호화하는 코돈 최적화 폴리뉴클레오타이드를 브라씨카 나푸스 TE 유전자를 암호화하는 폴리뉴클레오타이드 서열(서열번호 195)(Gen Bank 등록번호 CAA52070.1)로 대신하는 것을 제외하고 pSZ1449와 동일하였다.
이하의 표 36에서 나타낸 바와 같이, 라드 모방체는 라드와 유사하였다. 라드 모방체의 3가지 가장 흔한 지방산(C16:0, C18:0 및 C18:1)은 라드의 10%와 동일하거나 그 이내에 있다.
라드 모방체의 트라이글라이세드 프로파일
C14:0 C16:0 C18:0 C18:1 C18:2
라드 3-4 22-26 13-18 39-45 8-15
pSZ1493 1.32 24.79 17.49 41.87 10.01
pSZ1452 1.16 24.49 17.94 45.49 8.05
pSZ1449 1.16 23.98 15.79 47.88 8.29
본 발명은 그것의 특정 실시형태와 함께 기재되지만, 추가 변형이 가능한 것으로 이해될 것이다. 일반적으로 본 발명의 원칙에 따르는 본 출원은 본 발명의 변형, 사용, 또는 적용 중 어떤 것을 다루며, 본 발명이 속하는 당업계에서 공지되고 관례적인 실행 내에서 실현되며, 본 명세서에서 설명하는 필수 특징으로 적용될 수 있는 본 발명으로부터의 일탈을 포함한다.
특허, 특허 출원, 및 간행물을 포함하며, Genbank 등록번호를 포함하는 본 명세서에서 인용되는 모든 참조문헌은 이전에 구체적으로 포함되었든 그렇지 않든 그것의 전문이 참조로 본 명세서에 포함된다. 본 명세서에 언급된 간행물은 본 발명과 함께 사용될 수 있는 시약, 방법 및 개념을 기개하고 개시하는 목적을 위해 인용된다. 이들 참조문헌은 본 명세서에 기재된 본 발명에 관하여 선행기술이라는 용인으로서 해석되어서는 안 된다. 특히, 다음의 특허 출원은 모든 목적을 위하여 본 명세서에 참조로 포함된다: 2008년 6월 2일 출원된 국제특허출원 PCT/US2008/065563(발명의 명칭:"Production of Oil in Microorganisms"), 2010년 4월 14일 출원된 국제특허출원 PCT/US2010/31108(발명의 명칭 "Methods of Microbial Oil Extraction and Separation") 및 2009년 11월 30일 출원된 국제특허출원 PCT/US2009/066142(발명의 명칭: "Production of Tailored Oils in Heterotrophic Microorganisms").
SEQUENCE LISTING <110> SOLAZYME, INC. <120> Tailored Oils Produced from Recombinant Heterotrophic Microorganisms <130> 057518-406220 <140> PCT/US11/038463 <141> 2011-05-27 <150> US 61/349,774 <151> 2010-05-28 <150> US 61/374,992 <151> 2010-08-18 <150> US 61/414,393 <151> 2010-11-16 <150> US 61/428,192 <151> 2010-12-29 <160> 287 <170> PatentIn version 3.5 <210> 1 <211> 1187 <212> DNA <213> Unknown <220> <223> Chlorella species <400> 1 gatcagacgg gcctgacctg cgagataatc aagtgctcgt aggcaaccaa ctcagcagct 60 gcttggtgtt gggtctgcag gatagtgttg cagggcccca aggacagcag gggaacttac 120 accttgtccc cgacccagtt ttatggagtg cattgcctca agagcctagc cggagcgcta 180 ggctacatac ttgccgcacc ggtatgaggg gatatagtac tcgcactgcg ctgtctagtg 240 agatgggcag tgctgcccat aaacaactgg ctgctcagcc atttgttggc ggaccattct 300 gggggggcca gcaatgcctg actttcgggt agggtgaaaa ctgaacaaag actaccaaaa 360 cagaatttct tcctccttgg aggtaagcgc aggccggccc gcctgcgccc acatggcgct 420 ccgaacacct ccatagctgt aagggcgcaa acatggccgg actgttgtca gcactctttc 480 atggccatac aaggtcatgt cgagattagt gctgagtaag acactatcac cccatgttcg 540 attgaagccg tgacttcatg ccaacctgcc cctgggcgta gcagacgtat gccatcatga 600 ccactagccg acatgcgctg tcttttgcca ccaaaacaac tggtacaccg ctcgaagtcg 660 tgccgcacac ctccgggagt gagtccggcg actcctcccc ggcgggccgc ggccctacct 720 gggtagggtc gccatacgcc cacgaccaaa cgacgcagga ggggattggg gtagggaatc 780 ccaaccagcc taaccaagac ggcacctata ataataggtg gggggactaa cagccctata 840 tcgcaagctt tgggtgccta tcttgagaag cacgagttgg agtggctgtg tacggtcgac 900 cctaaggtgg gtgtgccgca gcctgaaaca aagcgtctag cagctgcttc tataatgtgt 960 cagccgttgt gtttcagtta tattgtatgc tattgtttgt tcgtgctagg gtggcgcagg 1020 cccacctact gtggcgggcc attggttggt gcttgaattg cctcaccatc taaggtctga 1080 acgctcactc aaacgccttt gtacaactgc agaactttcc ttggcgctgc aactacagtg 1140 tgcaaaccag cacatagcac tcccttacat cacccagcag tacaaca 1187 <210> 2 <211> 1414 <212> DNA <213> Chlorella ellipsoidea <400> 2 cgctgcgcac cagggccgcc agctcgctga tgtcgctcca aatgcggtcc cccgattttt 60 tgttcttcat cttctccacc ttggtggcct tcttggccag ggccttcagc tgcatgcgca 120 cagaccgttg agctcctgat cagcatcctc aggaggccct ttgacaagca agcccctgtg 180 caagcccatt cacggggtac cagtggtgct gaggtagatg ggtttgaaaa ggattgctcg 240 gtcgattgct gctcatggaa ttggcatgtg catgcatgtt cacaatatgc caccaggctt 300 tggagcaaga gagcatgaat gccttcaggc aggttgaaag ttcctggggg tgaagaggca 360 gggccgagga ttggaggagg aaagcatcaa gtcgtcgctc atgctcatgt tttcagtcag 420 agtttgccaa gctcacagga gcagagacaa gactggctgc tcaggtgttg catcgtgtgt 480 gtggtggggg ggggggggtt aatacggtac gaaatgcact tggaattccc acctcatgcc 540 agcggaccca catgcttgaa ttcgaggcct gtggggtgag aaatgctcac tctgccctcg 600 ttgctgaggt acttcaggcc gctgagctca aagtcgatgc cctgctcgtc tatcagggcc 660 tgcacctctg ggctgaccgg ctcagcctcc ttcgcgggca tggagtaggc gccggcagcg 720 ttcatgtccg ggcccagggc agcggtggtg ccataaatgt cggtgatggt ggggaggggg 780 gccgtcgcca caccattgcc gttgctggct gacgcatgca catgtggcct ggctggcacc 840 ggcagcactg gtctccagcc agccagcaag tggctgttca ggaaagcggc catgttgttg 900 gtccctgcgc atgtaattcc ccagatcaaa ggagggaaca gcttggattt gatgtagtgc 960 ccaaccggac tgaatgtgcg atggcaggtc cctttgagtc tcccgaatta ctagcagggc 1020 actgtgacct aacgcagcat gccaaccgca aaaaaatgat tgacagaaaa tgaagcggtg 1080 tgtcaatatt tgctgtattt attcgtttta atcagcaacc aagttcgaaa cgcaactatc 1140 gtggtgatca agtgaacctc atcagactta cctcgttcgg caaggaaacg gaggcaccaa 1200 attccaattt gatattatcg cttgccaagc tagagctgat ctttgggaaa ccaactgcca 1260 gacagtggac tgtgatggag tgccccgagt ggtggagcct cttcgattcg gttagtcatt 1320 actaacgtga accctcagtg aagggaccat cagaccagaa agaccagatc tcctcctcga 1380 caccgagaga gtgttgcggc agtaggacga caag 1414 <210> 3 <211> 512 <212> PRT <213> Unknown <220> <223> Yeast sequence <400> 3 Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His Phe Thr Pro Asn 1 5 10 15 Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr Asp Glu Lys Asp 20 25 30 Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn Asp Thr Val Trp 35 40 45 Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp Asp Leu Thr Asn 50 55 60 Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg Asn Asp Ser Gly 65 70 75 80 Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn Thr Ser Gly Phe 85 90 95 Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val Ala Ile Trp Thr 100 105 110 Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser Tyr Ser Leu Asp 115 120 125 Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro Val Leu Ala Ala 130 135 140 Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp Tyr Glu Pro Ser 145 150 155 160 Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp Tyr Lys Ile Glu 165 170 175 Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu Glu Ser Ala Phe 180 185 190 Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys Pro Gly Leu Ile 195 200 205 Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr Trp Val Met Phe 210 215 220 Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser Phe Asn Gln Tyr 225 230 235 240 Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala Phe Asp Asn Gln 245 250 255 Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala Leu Gln Thr Phe 260 265 270 Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly Ile Ala Trp Ala 275 280 285 Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn Pro Trp Arg Ser 290 295 300 Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr Glu Tyr Gln Ala 305 310 315 320 Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu Pro Ile Leu Asn 325 330 335 Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr Asn Thr Thr Leu 340 345 350 Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn Ser Thr Gly Thr 355 360 365 Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr Gln Thr Ile Ser 370 375 380 Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys Gly Leu Glu Asp 385 390 395 400 Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser Ala Ser Ser Phe 405 410 415 Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val Lys Glu Asn Pro 420 425 430 Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro Phe Lys Ser Glu 435 440 445 Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu Asp Gln Asn Ile 450 455 460 Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser Thr Asn Thr Tyr 465 470 475 480 Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn Met Thr Thr Gly 485 490 495 Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val Arg Glu Val Lys 500 505 510 <210> 4 <211> 20 <212> PRT <213> Unknown <220> <223> Yeast sequence <400> 4 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala Ser 20 <210> 5 <211> 18 <212> PRT <213> Unknown <220> <223> source organism never identified, higher plants secretion signal <400> 5 Met Ala Asn Lys Ser Leu Leu Leu Leu Leu Leu Leu Gly Ser Leu Ala 1 5 10 15 Ser Gly <210> 6 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> source organism never identified <400> 6 Met Ala Arg Leu Pro Leu Ala Ala Leu Gly 1 5 10 <210> 7 <211> 20 <212> PRT <213> Unknown <220> <223> source organism never identified <400> 7 Met Ala Asn Lys Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Pro Leu 1 5 10 15 Ala Ala Ser Gly 20 <210> 8 <211> 2615 <212> DNA <213> Saccharomyces cerevisiae <400> 8 gaattcccca acatggtgga gcacgacact ctcgtctact ccaagaatat caaagataca 60 gtctcagaag accaaagggc tattgagact tttcaacaaa gggtaatatc gggaaacctc 120 ctcggattcc attgcccagc tatctgtcac ttcatcaaaa ggacagtaga aaaggaaggt 180 ggcacctaca aatgccatca ttgcgataaa ggaaaggcta tcgttcaaga tgcctctgcc 240 gacagtggtc ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt 300 ccaaccacgt cttcaaagca agtggattga tgtgaacatg gtggagcacg acactctcgt 360 ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg agacttttca 420 acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct gtcacttcat 480 caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg ataaaggaaa 540 ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 600 gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 660 tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc 720 tatataagga agttcatttc atttggagag gacacgctga aatcaccagt ctctctctac 780 aaatctatct ctggcgcgcc atatcaatgc ttcttcaggc ctttcttttt cttcttgctg 840 gttttgctgc caagatcagc gcctctatga cgaacgaaac ctcggataga ccacttgtgc 900 actttacacc aaacaagggc tggatgaatg accccaatgg actgtggtac gacgaaaaag 960 atgccaagtg gcatctgtac tttcaataca acccgaacga tactgtctgg gggacgccat 1020 tgttttgggg ccacgccacg tccgacgacc tgaccaattg ggaggaccaa ccaatagcta 1080 tcgctccgaa gaggaacgac tccggagcat tctcgggttc catggtggtt gactacaaca 1140 atacttccgg ctttttcaac gataccattg acccgagaca acgctgcgtg gccatatgga 1200 cttacaacac accggagtcc gaggagcagt acatctcgta tagcctggac ggtggataca 1260 cttttacaga gtatcagaag aaccctgtgc ttgctgcaaa ttcgactcag ttccgagatc 1320 cgaaggtctt ttggtacgag ccctcgcaga agtggatcat gacagcggca aagtcacagg 1380 actacaagat cgaaatttac tcgtctgacg accttaaatc ctggaagctc gaatccgcgt 1440 tcgcaaacga gggctttctc ggctaccaat acgaatgccc aggcctgata gaggtcccaa 1500 cagagcaaga tcccagcaag tcctactggg tgatgtttat ttccattaat ccaggagcac 1560 cggcaggagg ttcttttaat cagtacttcg tcggaagctt taacggaact catttcgagg 1620 catttgataa ccaatcaaga gtagttgatt ttggaaagga ctactatgcc ctgcagactt 1680 tcttcaatac tgacccgacc tatgggagcg ctcttggcat tgcgtgggct tctaactggg 1740 agtattccgc attcgttcct acaaaccctt ggaggtcctc catgtcgctc gtgaggaaat 1800 tctctctcaa cactgagtac caggccaacc cggaaaccga actcataaac ctgaaagccg 1860 aaccgatcct gaacattagc aacgctggcc cctggagccg gtttgcaacc aacaccacgt 1920 tgacgaaagc caacagctac aacgtcgatc tttcgaatag caccggtaca cttgaatttg 1980 aactggtgta tgccgtcaat accacccaaa cgatctcgaa gtcggtgttc gcggacctct 2040 ccctctggtt taaaggcctg gaagaccccg aggagtacct cagaatgggt ttcgaggttt 2100 ctgcgtcctc cttcttcctt gatcgcggga acagcaaagt aaaatttgtt aaggagaacc 2160 catattttac caacaggatg agcgttaaca accaaccatt caagagcgaa aacgacctgt 2220 cgtactacaa agtgtatggt ttgcttgatc aaaatatcct ggaactctac ttcaacgatg 2280 gtgatgtcgt gtccaccaac acatacttca tgacaaccgg gaacgcactg ggctccgtga 2340 acatgacgac gggtgtggat aacctgttct acatcgacaa attccaggtg agggaagtca 2400 agtgagatct gtcgatcgac aagctcgagt ttctccataa taatgtgtga gtagttccca 2460 gataagggaa ttagggttcc tatagggttt cgctcatgtg ttgagcatat aagaaaccct 2520 tagtatgtat ttgtatttgt aaaatacttc tatcaataaa atttctaatt cctaaaacca 2580 aaatccagta ctaaaatcca gatcccccga attaa 2615 <210> 9 <211> 22 <212> DNA <213> Prototheca moriformis <400> 9 tgttgaagaa tgagccggcg ac 22 <210> 10 <211> 20 <212> DNA <213> Prototheca moriformis <400> 10 cagtgagcta ttacgcactc 20 <210> 11 <211> 541 <212> DNA <213> Prototheca kruegani <400> 11 tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa tactctggag 60 ccatagcgaa agcaagttta gtaagcttag gtcattcttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttagta aaataacatg gaggcccgaa ccgactaatg 180 ttgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcag tacaaataga ggggtaaagc 300 actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 12 <211> 573 <212> DNA <213> Prototheca wickerhamii <400> 12 tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagattt aataactcga 60 aacctaagcg aaagcaagtc ttaatagggc gtcaatttaa caaaacttta aataaattat 120 aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180 gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240 tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300 gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360 ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420 gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480 ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540 gccatccttt aaagagtgcg taatagctca ctg 573 <210> 13 <211> 541 <212> DNA <213> Prototheca stagnora <400> 13 tgttgaagaa tgagccggcg agttaaaaaa aatggcatgg ttaaagatat ttctctgaag 60 ccatagcgaa agcaagtttt acaagctata gtcatttttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggtc aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggacgt gagtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 14 <211> 541 <212> DNA <213> Prototheca moriformis <400> 14 tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagataa ttctctggag 60 ccatagcgaa agcaagttta acaagctaaa gtcacccttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtta 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 15 <211> 573 <212> DNA <213> Prototheca moriformis <400> 15 tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagaatt aataactcga 60 aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120 aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180 gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240 tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300 gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360 ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420 gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480 ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540 gccatccttt aaagagtgcg taatagctca ctg 573 <210> 16 <211> 573 <212> DNA <213> Prototheca wickerhamii <400> 16 tgttgaagaa tgagccgtcg acttaaaata aatggcaggc taagagaatt aataactcga 60 aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120 aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180 gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240 tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300 gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360 ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420 gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480 ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540 gccatccttt aaagagtgcg taatagctca ctg 573 <210> 17 <211> 541 <212> DNA <213> Prototheca moriformis <400> 17 tgttgaagaa tgagccggcg agttaaaaag agtggcgtgg ttaaagaaaa ttctctggaa 60 ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt ttgtgggctc cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcgaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 18 <211> 541 <212> DNA <213> Prototheca zopfii <400> 18 tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa ttctctggag 60 ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120 tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180 gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240 ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300 actgtttctt tcgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360 tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420 cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480 aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540 g 541 <210> 19 <211> 565 <212> DNA <213> Prototheca moriformis <400> 19 tgttgaagaa tgagccggcg acttagaaaa ggtggcatgg ttaaggaaat attccgaagc 60 cgtagcaaaa gcgagtctga atagggcgat aaaatatatt aatatttaga atctagtcat 120 tttttctaga cccgaacccg ggtgatctaa ccatgaccag gatgaagctt gggtgatacc 180 aagtgaaggt ccgaaccgac cgatgttgaa aaatcggcgg atgagttgtg gttagcggtg 240 aaataccagt cgaacccgga gctagctggt tctccccgaa atgcgttgag gcgcagcagt 300 acatctagtc tatctagggg taaagcactg tttcggtgcg ggctgtgaga acggtaccaa 360 atcgtggcaa actctgaata ctagaaatga cgatgtagta gtgagactgt gggggataag 420 ctccattgtc aagagggaaa cagcccagac caccagctaa ggccccaaaa tggtaatgta 480 gtgacaaagg aggtgaaaat gcaaatacaa ccaggaggtt ggcttagaag cagccatcct 540 ttaaagagtg cgtaatagct cactg 565 <210> 20 <211> 550 <212> PRT <213> Chicorium intybus <400> 20 Met Ser Asn Ser Ser Asn Ala Ser Glu Ser Leu Phe Pro Ala Thr Ser 1 5 10 15 Glu Gln Pro Tyr Arg Thr Ala Phe His Phe Gln Pro Pro Gln Asn Trp 20 25 30 Met Asn Asp Pro Asn Gly Pro Met Cys Tyr Asn Gly Val Tyr His Leu 35 40 45 Phe Tyr Gln Tyr Asn Pro Phe Gly Pro Leu Trp Asn Leu Arg Met Tyr 50 55 60 Trp Ala His Ser Val Ser His Asp Leu Ile Asn Trp Ile His Leu Asp 65 70 75 80 Leu Ala Phe Ala Pro Thr Glu Pro Phe Asp Ile Asn Gly Cys Leu Ser 85 90 95 Gly Ser Ala Thr Val Leu Pro Gly Asn Lys Pro Ile Met Leu Tyr Thr 100 105 110 Gly Ile Asp Thr Glu Asn Arg Gln Val Gln Asn Leu Ala Val Pro Lys 115 120 125 Asp Leu Ser Asp Pro Tyr Leu Arg Glu Trp Val Lys His Thr Gly Asn 130 135 140 Pro Ile Ile Ser Leu Pro Glu Glu Ile Gln Pro Asp Asp Phe Arg Asp 145 150 155 160 Pro Thr Thr Thr Trp Leu Glu Glu Asp Gly Thr Trp Arg Leu Leu Val 165 170 175 Gly Ser Gln Lys Asp Lys Thr Gly Ile Ala Phe Leu Tyr His Ser Gly 180 185 190 Asp Phe Val Asn Trp Thr Lys Ser Asp Ser Pro Leu His Lys Val Ser 195 200 205 Gly Thr Gly Met Trp Glu Cys Val Asp Phe Phe Pro Val Trp Val Asp 210 215 220 Ser Thr Asn Gly Val Asp Thr Ser Ile Ile Asn Pro Ser Asn Arg Val 225 230 235 240 Lys His Val Leu Lys Leu Gly Ile Gln Asp His Gly Lys Asp Cys Tyr 245 250 255 Leu Ile Gly Lys Tyr Ser Ala Asp Lys Glu Asn Tyr Val Pro Glu Asp 260 265 270 Glu Leu Thr Leu Ser Thr Leu Arg Leu Asp Tyr Gly Met Tyr Tyr Ala 275 280 285 Ser Lys Ser Phe Phe Asp Pro Val Lys Asn Arg Arg Ile Met Thr Ala 290 295 300 Trp Val Asn Glu Ser Asp Ser Glu Ala Asp Val Ile Ala Arg Gly Trp 305 310 315 320 Ser Gly Val Gln Ser Phe Pro Arg Ser Leu Trp Leu Asp Lys Asn Gln 325 330 335 Lys Gln Leu Leu Gln Trp Pro Ile Glu Glu Ile Glu Met Leu His Gln 340 345 350 Asn Glu Val Ser Phe His Asn Lys Lys Leu Asp Gly Gly Ser Ser Leu 355 360 365 Glu Val Leu Gly Ile Thr Ala Ser Gln Ala Asp Val Lys Ile Ser Phe 370 375 380 Lys Leu Ala Asn Leu Glu Glu Ala Glu Glu Leu Asp Pro Ser Trp Val 385 390 395 400 Asp Pro Gln Leu Ile Cys Ser Glu Asn Asp Ala Ser Lys Lys Gly Lys 405 410 415 Phe Gly Pro Phe Gly Leu Leu Ala Leu Ala Ser Ser Asp Leu Arg Glu 420 425 430 Gln Thr Ala Ile Phe Phe Arg Val Phe Arg Lys Asn Gly Arg Tyr Val 435 440 445 Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Met Lys Asn Gly Ile 450 455 460 Glu Lys Arg Thr Tyr Gly Ala Phe Val Asp Ile Asp Pro Gln Gln Asp 465 470 475 480 Glu Ile Ser Leu Arg Thr Leu Ile Asp His Ser Ile Val Glu Ser Phe 485 490 495 Gly Gly Arg Gly Lys Thr Cys Ile Thr Thr Arg Val Tyr Pro Thr Leu 500 505 510 Ala Ile Gly Glu Gln Ala Arg Leu Phe Ala Phe Asn His Gly Thr Glu 515 520 525 Ser Val Glu Ile Ser Glu Leu Ser Ala Trp Ser Met Lys Lys Ala Gln 530 535 540 Met Lys Val Glu Glu Pro 545 550 <210> 21 <211> 581 <212> PRT <213> Schizosaccharomyces pombe <400> 21 Met Phe Leu Lys Tyr Ile Leu Ala Ser Gly Ile Cys Leu Val Ser Leu 1 5 10 15 Leu Ser Ser Thr Asn Ala Ala Pro Arg His Leu Tyr Val Lys Arg Tyr 20 25 30 Pro Val Ile Tyr Asn Ala Ser Asn Ile Thr Glu Val Ser Asn Ser Thr 35 40 45 Thr Val Pro Pro Pro Pro Phe Val Asn Thr Thr Ala Pro Asn Gly Thr 50 55 60 Cys Leu Gly Asn Tyr Asn Glu Tyr Leu Pro Ser Gly Tyr Tyr Asn Ala 65 70 75 80 Thr Asp Arg Pro Lys Ile His Phe Thr Pro Ser Ser Gly Phe Met Asn 85 90 95 Asp Pro Asn Gly Leu Val Tyr Thr Gly Gly Val Tyr His Met Phe Phe 100 105 110 Gln Tyr Ser Pro Lys Thr Leu Thr Ala Gly Glu Val His Trp Gly His 115 120 125 Thr Val Ser Lys Asp Leu Ile His Trp Glu Asn Tyr Pro Ile Ala Ile 130 135 140 Tyr Pro Asp Glu His Glu Asn Gly Val Leu Ser Leu Pro Phe Ser Gly 145 150 155 160 Ser Ala Val Val Asp Val His Asn Ser Ser Gly Leu Phe Ser Asn Asp 165 170 175 Thr Ile Pro Glu Glu Arg Ile Val Leu Ile Tyr Thr Asp His Trp Thr 180 185 190 Gly Val Ala Glu Arg Gln Ala Ile Ala Tyr Thr Thr Asp Gly Gly Tyr 195 200 205 Thr Phe Lys Lys Tyr Ser Gly Asn Pro Val Leu Asp Ile Asn Ser Leu 210 215 220 Gln Phe Arg Asp Pro Lys Val Ile Trp Asp Phe Asp Ala Asn Arg Trp 225 230 235 240 Val Met Ile Val Ala Met Ser Gln Asn Tyr Gly Ile Ala Phe Tyr Ser 245 250 255 Ser Tyr Asp Leu Ile His Trp Thr Glu Leu Ser Val Phe Ser Thr Ser 260 265 270 Gly Tyr Leu Gly Leu Gln Tyr Glu Cys Pro Gly Met Ala Arg Val Pro 275 280 285 Val Glu Gly Thr Asp Glu Tyr Lys Trp Val Leu Phe Ile Ser Ile Asn 290 295 300 Pro Gly Ala Pro Leu Gly Gly Ser Val Val Gln Tyr Phe Val Gly Asp 305 310 315 320 Trp Asn Gly Thr Asn Phe Val Pro Asp Asp Gly Gln Thr Arg Phe Val 325 330 335 Asp Leu Gly Lys Asp Phe Tyr Ala Ser Ala Leu Tyr His Ser Ser Ser 340 345 350 Ala Asn Ala Asp Val Ile Gly Val Gly Trp Ala Ser Asn Trp Gln Tyr 355 360 365 Thr Asn Gln Ala Pro Thr Gln Val Phe Arg Ser Ala Met Thr Val Ala 370 375 380 Arg Lys Phe Thr Leu Arg Asp Val Pro Gln Asn Pro Met Thr Asn Leu 385 390 395 400 Thr Ser Leu Ile Gln Thr Pro Leu Asn Val Ser Leu Leu Arg Asp Glu 405 410 415 Thr Leu Phe Thr Ala Pro Val Ile Asn Ser Ser Ser Ser Leu Ser Gly 420 425 430 Ser Pro Ile Thr Leu Pro Ser Asn Thr Ala Phe Glu Phe Asn Val Thr 435 440 445 Leu Ser Ile Asn Tyr Thr Glu Gly Cys Thr Thr Gly Tyr Cys Leu Gly 450 455 460 Arg Ile Ile Ile Asp Ser Asp Asp Pro Tyr Arg Leu Gln Ser Ile Ser 465 470 475 480 Val Asp Val Asp Phe Ala Ala Ser Thr Leu Val Ile Asn Arg Ala Lys 485 490 495 Ala Gln Met Gly Trp Phe Asn Ser Leu Phe Thr Pro Ser Phe Ala Asn 500 505 510 Asp Ile Tyr Ile Tyr Gly Asn Val Thr Leu Tyr Gly Ile Val Asp Asn 515 520 525 Gly Leu Leu Glu Leu Tyr Val Asn Asn Gly Glu Lys Thr Tyr Thr Asn 530 535 540 Asp Phe Phe Phe Leu Gln Gly Ala Thr Pro Gly Gln Ile Ser Phe Ala 545 550 555 560 Ala Phe Gln Gly Val Ser Phe Asn Asn Val Thr Val Thr Pro Leu Lys 565 570 575 Thr Ile Trp Asn Cys 580 <210> 22 <211> 550 <212> PRT <213> Pichia anomala <400> 22 Met Ile Gln Leu Ser Pro Leu Leu Leu Leu Pro Leu Phe Ser Val Phe 1 5 10 15 Asn Ser Ile Ala Asp Ala Ser Thr Glu Tyr Leu Arg Pro Gln Ile His 20 25 30 Leu Thr Pro Asp Gln Gly Trp Met Asn Asp Pro Asn Gly Met Phe Tyr 35 40 45 Asp Arg Lys Asp Lys Leu Trp His Val Tyr Phe Gln His Asn Pro Asp 50 55 60 Lys Lys Ser Ile Trp Ala Thr Pro Val Thr Trp Gly His Ser Thr Ser 65 70 75 80 Lys Asp Leu Leu Thr Trp Asp Tyr His Gly Asn Ala Leu Glu Pro Glu 85 90 95 Asn Asp Asp Glu Gly Ile Phe Ser Gly Ser Val Val Val Asp Arg Asn 100 105 110 Asn Thr Ser Gly Phe Phe Asn Asp Ser Thr Asp Pro Glu Gln Arg Ile 115 120 125 Val Ala Ile Tyr Thr Asn Asn Ala Gln Leu Gln Thr Gln Glu Ile Ala 130 135 140 Tyr Ser Leu Asp Lys Gly Tyr Ser Phe Ile Lys Tyr Asp Gln Asn Pro 145 150 155 160 Val Ile Asn Val Asn Ser Ser Gln Gln Arg Asp Pro Lys Val Leu Trp 165 170 175 His Asp Glu Ser Asn Gln Trp Ile Met Val Val Ala Lys Thr Gln Glu 180 185 190 Phe Lys Val Gln Ile Tyr Gly Ser Pro Asp Leu Lys Lys Trp Asp Leu 195 200 205 Lys Ser Asn Phe Thr Ser Asn Gly Tyr Leu Gly Phe Gln Tyr Glu Cys 210 215 220 Pro Gly Leu Phe Lys Leu Pro Ile Glu Asn Pro Leu Asn Asp Thr Val 225 230 235 240 Thr Ser Lys Trp Val Leu Leu Leu Ala Ile Asn Pro Gly Ser Pro Leu 245 250 255 Gly Gly Ser Ile Asn Glu Tyr Phe Ile Gly Asp Phe Asp Gly Thr Thr 260 265 270 Phe His Pro Asp Asp Gly Ala Thr Arg Phe Met Asp Ile Gly Lys Asp 275 280 285 Phe Tyr Ala Phe Gln Ser Phe Asp Asn Thr Glu Pro Glu Asp Gly Ala 290 295 300 Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asn Thr Val Pro 305 310 315 320 Thr Glu Asn Trp Arg Ser Ser Met Ser Leu Val Arg Asn Tyr Thr Leu 325 330 335 Lys Tyr Val Asp Val Asn Pro Glu Asn Tyr Gly Leu Thr Leu Ile Gln 340 345 350 Lys Pro Val Tyr Asp Thr Lys Glu Thr Arg Leu Asn Glu Thr Leu Lys 355 360 365 Thr Leu Glu Thr Ile Asn Glu Tyr Glu Val Asn Asp Leu Lys Leu Asp 370 375 380 Lys Ser Ser Phe Val Ala Thr Asp Phe Asn Thr Glu Arg Asn Ala Thr 385 390 395 400 Gly Val Phe Glu Phe Asp Leu Lys Phe Thr Gln Thr Asp Leu Lys Met 405 410 415 Gly Tyr Ser Asn Met Thr Thr Gln Phe Gly Leu Tyr Ile His Ser Gln 420 425 430 Thr Val Lys Gly Ser Gln Glu Thr Leu Gln Leu Val Phe Asp Thr Leu 435 440 445 Ser Thr Thr Trp Tyr Ile Asp Arg Thr Thr Gln His Ser Phe Gln Arg 450 455 460 Asn Ser Pro Val Phe Thr Glu Arg Ile Ser Thr Tyr Val Glu Lys Ile 465 470 475 480 Asp Thr Thr Asp Gln Gly Asn Val Tyr Thr Leu Tyr Gly Val Val Asp 485 490 495 Arg Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Ser Ile Ala Met Thr 500 505 510 Asn Thr Phe Phe Phe Arg Glu Gly Lys Ile Pro Thr Ser Phe Glu Val 515 520 525 Val Cys Asp Ser Glu Lys Ser Phe Ile Thr Ile Asp Glu Leu Ser Val 530 535 540 Arg Glu Leu Ala Arg Lys 545 550 <210> 23 <211> 533 <212> PRT <213> Debaryomyces occidentalis <400> 23 Met Val Gln Val Leu Ser Val Leu Val Ile Pro Leu Leu Thr Leu Phe 1 5 10 15 Phe Gly Tyr Val Ala Ser Ser Ser Ile Asp Leu Ser Val Asp Thr Ser 20 25 30 Glu Tyr Asn Arg Pro Leu Ile His Phe Thr Pro Glu Lys Gly Trp Met 35 40 45 Asn Asp Pro Asn Gly Leu Phe Tyr Asp Lys Thr Ala Lys Leu Trp His 50 55 60 Leu Tyr Phe Gln Tyr Asn Pro Asn Ala Thr Ala Trp Gly Gln Pro Leu 65 70 75 80 Tyr Trp Gly His Ala Thr Ser Asn Asp Leu Val His Trp Asp Glu His 85 90 95 Glu Ile Ala Ile Gly Pro Glu His Asp Asn Glu Gly Ile Phe Ser Gly 100 105 110 Ser Ile Val Val Asp His Asn Asn Thr Ser Gly Phe Phe Asn Ser Ser 115 120 125 Ile Asp Pro Asn Gln Arg Ile Val Ala Ile Tyr Thr Asn Asn Ile Pro 130 135 140 Asp Leu Gln Thr Gln Asp Ile Ala Phe Ser Leu Asp Gly Gly Tyr Thr 145 150 155 160 Phe Thr Lys Tyr Glu Asn Asn Pro Val Ile Asp Val Ser Ser Asn Gln 165 170 175 Phe Arg Asp Pro Lys Val Phe Trp His Glu Arg Phe Lys Ser Met Asp 180 185 190 His Gly Cys Ser Glu Ile Ala Arg Val Lys Ile Gln Ile Phe Gly Ser 195 200 205 Ala Asn Leu Lys Asn Trp Val Leu Asn Ser Asn Phe Ser Ser Gly Tyr 210 215 220 Tyr Gly Asn Gln Tyr Gly Met Ser Arg Leu Ile Glu Val Pro Ile Glu 225 230 235 240 Asn Ser Asp Lys Ser Lys Trp Val Met Phe Leu Ala Ile Asn Pro Gly 245 250 255 Ser Pro Leu Gly Gly Ser Ile Asn Gln Tyr Phe Val Gly Asp Phe Asp 260 265 270 Gly Phe Gln Phe Val Pro Asp Asp Ser Gln Thr Arg Phe Val Asp Ile 275 280 285 Gly Lys Asp Phe Tyr Ala Phe Gln Thr Phe Ser Glu Val Glu His Gly 290 295 300 Val Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asp Gln Val 305 310 315 320 Pro Thr Asn Pro Trp Arg Ser Ser Thr Ser Leu Ala Arg Asn Tyr Thr 325 330 335 Leu Arg Tyr Val Ile Gln Met Leu Lys Leu Thr Ala Asn Ile Asp Lys 340 345 350 Ser Val Leu Pro Asp Ser Ile Asn Val Val Asp Lys Leu Lys Lys Lys 355 360 365 Asn Val Lys Leu Thr Asn Lys Lys Pro Ile Lys Thr Asn Phe Lys Gly 370 375 380 Ser Thr Gly Leu Phe Asp Phe Asn Ile Thr Phe Lys Val Leu Asn Leu 385 390 395 400 Asn Val Ser Pro Gly Lys Thr His Phe Asp Ile Leu Ile Asn Ser Gln 405 410 415 Glu Leu Asn Ser Ser Val Asp Ser Ile Lys Ile Gly Phe Asp Ser Ser 420 425 430 Gln Ser Leu Phe Tyr Ile Asp Arg His Ile Pro Asn Val Glu Phe Pro 435 440 445 Arg Lys Gln Phe Phe Thr Asp Lys Leu Ala Ala Tyr Leu Glu Pro Leu 450 455 460 Asp Tyr Asp Gln Asp Leu Arg Val Phe Ser Leu Tyr Gly Ile Val Asp 465 470 475 480 Lys Asn Ile Ile Glu Leu Tyr Phe Asn Asp Gly Thr Val Ala Met Thr 485 490 495 Asn Thr Phe Phe Met Gly Glu Gly Lys Tyr Pro His Asp Ile Gln Ile 500 505 510 Val Thr Asp Thr Glu Glu Pro Leu Phe Glu Leu Glu Ser Val Ile Ile 515 520 525 Arg Glu Leu Asn Lys 530 <210> 24 <211> 654 <212> PRT <213> Oryza sativa <400> 24 Met Ala Thr Ser Arg Leu Thr Pro Ala Tyr Asp Leu Lys Asn Ala Ala 1 5 10 15 Ala Ala Val Tyr Thr Pro Leu Pro Glu Gln Pro His Ser Ala Glu Val 20 25 30 Glu Ile Arg Asp Arg Lys Pro Phe Lys Ile Ile Ser Ala Ile Ile Leu 35 40 45 Ser Ser Leu Leu Leu Leu Ala Leu Ile Leu Val Ala Val Asn Tyr Gln 50 55 60 Ala Pro Pro Ser His Ser Ser Gly Asp Asn Ser Gln Pro Ala Ala Val 65 70 75 80 Met Pro Pro Ser Arg Gly Val Ser Gln Gly Val Ser Glu Lys Ala Phe 85 90 95 Arg Gly Ala Ser Gly Ala Gly Asn Gly Val Ser Phe Ala Trp Ser Asn 100 105 110 Leu Met Leu Ser Trp Gln Arg Thr Ser Tyr His Phe Gln Pro Val Lys 115 120 125 Asn Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr 130 135 140 His Leu Phe Tyr Gln Tyr Asn Pro Asp Ser Ala Val Trp Gly Asn Ile 145 150 155 160 Thr Trp Gly His Ala Val Ser Thr Asp Leu Ile Asn Trp Leu His Leu 165 170 175 Pro Phe Ala Met Val Pro Asp Gln Trp Tyr Asp Val Asn Gly Val Trp 180 185 190 Thr Gly Ser Ala Thr Ile Leu Pro Asp Gly Arg Ile Val Met Leu Tyr 195 200 205 Thr Gly Asp Thr Asp Asp Tyr Val Gln Asp Gln Asn Leu Ala Phe Pro 210 215 220 Ala Asn Leu Ser Asp Pro Leu Leu Val Asp Trp Val Lys Tyr Pro Asn 225 230 235 240 Asn Pro Val Ile Tyr Pro Pro Pro Gly Ile Gly Val Lys Asp Phe Arg 245 250 255 Asp Pro Thr Thr Ala Gly Thr Ala Gly Met Gln Asn Gly Gln Arg Leu 260 265 270 Val Thr Ile Gly Ser Lys Val Gly Lys Thr Gly Ile Ser Leu Val Tyr 275 280 285 Glu Thr Thr Asn Phe Thr Thr Phe Lys Leu Leu Tyr Gly Val Leu His 290 295 300 Ala Val Pro Gly Thr Gly Met Trp Glu Cys Val Asp Leu Tyr Pro Val 305 310 315 320 Ser Thr Thr Gly Glu Asn Gly Leu Asp Thr Ser Val Asn Gly Leu Gly 325 330 335 Val Lys His Val Leu Lys Thr Ser Leu Asp Asp Asp Lys His Asp Tyr 340 345 350 Tyr Ala Leu Gly Thr Tyr Asp Pro Val Lys Asn Lys Trp Thr Pro Asp 355 360 365 Asn Pro Asp Leu Asp Val Gly Ile Gly Leu Arg Leu Asp Tyr Gly Lys 370 375 380 Tyr Tyr Ala Ala Arg Thr Phe Tyr Asp Gln Asn Lys Gln Arg Arg Ile 385 390 395 400 Leu Trp Gly Trp Ile Gly Glu Thr Asp Leu Glu Ala Val Asp Leu Met 405 410 415 Lys Gly Trp Ala Ser Leu Gln Ala Ile Pro Arg Thr Ile Val Phe Asp 420 425 430 Lys Lys Thr Gly Thr Asn Val Leu Gln Arg Pro Glu Glu Glu Val Glu 435 440 445 Ser Trp Ser Ser Gly Asp Pro Ile Thr Gln Arg Arg Ile Phe Glu Pro 450 455 460 Gly Ser Val Val Pro Ile His Val Ser Gly Ala Thr Gln Leu Asp Ile 465 470 475 480 Thr Ala Ser Phe Glu Val Asp Glu Thr Leu Leu Glu Thr Thr Ser Glu 485 490 495 Ser His Asp Ala Gly Tyr Asp Cys Ser Asn Ser Gly Gly Ala Gly Thr 500 505 510 Arg Gly Ser Leu Gly Pro Phe Gly Leu Leu Val Val Ala Asp Glu Lys 515 520 525 Leu Ser Glu Leu Thr Pro Val Tyr Leu Tyr Val Ala Lys Gly Gly Asp 530 535 540 Gly Lys Ala Lys Ala His Leu Cys Ala Tyr Gln Thr Arg Ser Ser Met 545 550 555 560 Ala Ser Gly Val Glu Lys Glu Val Tyr Gly Ser Ala Val Pro Val Leu 565 570 575 Asp Gly Glu Asn Tyr Ser Ala Arg Ile Leu Ile Asp His Ser Ile Val 580 585 590 Glu Ser Phe Ala Gln Ala Gly Arg Thr Cys Val Arg Ser Arg Asp Tyr 595 600 605 Pro Thr Lys Asp Ile Tyr Gly Ala Ala Arg Cys Phe Phe Phe Asn Asn 610 615 620 Ala Thr Glu Ala Ser Val Arg Ala Ser Leu Lys Ala Trp Gln Met Lys 625 630 635 640 Ser Phe Ile Arg Pro Tyr Pro Phe Ile Pro Asp Gln Lys Ser 645 650 <210> 25 <211> 690 <212> PRT <213> Allium cepa <400> 25 Met Ser Ser Asp Asp Leu Glu Ser Pro Pro Ser Ser Tyr Leu Pro Ile 1 5 10 15 Pro Pro Ser Asp Glu Phe His Asp Gln Pro Pro Pro Leu Arg Ser Trp 20 25 30 Leu Arg Leu Leu Ser Ile Pro Leu Ala Leu Met Phe Leu Leu Phe Leu 35 40 45 Ala Thr Phe Leu Ser Asn Leu Glu Ser Pro Pro Ser Asp Ser Gly Leu 50 55 60 Val Ser Asp Pro Val Thr Phe Asp Val Asn Pro Ala Val Val Arg Arg 65 70 75 80 Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser Gly 85 90 95 Phe Val Leu Asp Pro Val Ala Val Asp Ala Asn Ser Val Val Val His 100 105 110 Arg Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser 115 120 125 Gly Leu Leu Lys Asp Ser Pro Leu Gly Pro Tyr Pro Trp Thr Asn Gln 130 135 140 Met Leu Ser Trp Gln Arg Thr Gly Phe His Phe Gln Pro Val Lys Asn 145 150 155 160 Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr His 165 170 175 Phe Phe Tyr Gln Tyr Asn Pro Glu Gly Ala Val Trp Gly Asn Ile Ala 180 185 190 Trp Gly His Ala Val Ser Arg Asp Leu Val His Trp Thr His Leu Pro 195 200 205 Leu Ala Met Val Pro Asp Gln Trp Tyr Asp Ile Asn Gly Val Trp Thr 210 215 220 Gly Ser Ala Thr Ile Leu Pro Asp Gly Gln Ile Val Met Leu Tyr Thr 225 230 235 240 Gly Ala Thr Asn Glu Ser Val Gln Val Gln Asn Leu Ala Val Pro Ala 245 250 255 Asp Gln Ser Asp Thr Leu Leu Leu Arg Trp Lys Lys Ser Glu Ala Asn 260 265 270 Pro Ile Leu Val Pro Pro Pro Gly Ile Gly Asp Lys Asp Phe Arg Asp 275 280 285 Pro Thr Thr Ala Trp Tyr Glu Pro Ser Asp Asp Thr Trp Arg Ile Val 290 295 300 Ile Gly Ser Lys Asp Ser Ser His Ser Gly Ile Ala Ile Val Tyr Ser 305 310 315 320 Thr Lys Asp Phe Ile Asn Tyr Lys Leu Ile Pro Gly Ile Leu His Ala 325 330 335 Val Glu Arg Val Gly Met Trp Glu Cys Val Asp Phe Tyr Pro Val Ala 340 345 350 Thr Ala Asp Ser Ser His Ala Asn His Gly Leu Asp Pro Ser Ala Arg 355 360 365 Pro Ser Pro Ala Val Lys His Val Leu Lys Ala Ser Met Asp Asp Asp 370 375 380 Arg His Asp Tyr Tyr Ala Ile Gly Thr Tyr Asp Pro Ala Gln Asn Thr 385 390 395 400 Trp Val Pro Asp Asp Ala Ser Val Asp Val Gly Ile Gly Leu Arg Tyr 405 410 415 Asp Trp Gly Lys Phe Tyr Ala Ser Lys Thr Phe Tyr Asp His Ala Lys 420 425 430 Lys Arg Arg Ile Leu Trp Ser Trp Ile Gly Glu Thr Asp Ser Glu Thr 435 440 445 Ala Asp Ile Ala Lys Gly Trp Ala Ser Leu Gln Gly Val Pro Arg Thr 450 455 460 Val Leu Leu Asp Val Lys Thr Gly Ser Asn Leu Ile Thr Trp Pro Val 465 470 475 480 Val Glu Ile Glu Ser Leu Arg Thr Arg Pro Arg Asp Phe Ser Gly Ile 485 490 495 Thr Val Asp Ala Gly Ser Thr Phe Lys Leu Asp Val Gly Gly Ala Ala 500 505 510 Gln Leu Asp Ile Glu Ala Glu Phe Lys Ile Ser Ser Glu Glu Leu Glu 515 520 525 Ala Val Lys Glu Ala Asp Val Ser Tyr Asn Cys Ser Ser Ser Gly Gly 530 535 540 Ala Ala Glu Arg Gly Val Leu Gly Pro Phe Gly Leu Leu Val Leu Ala 545 550 555 560 Asn Gln Asp Leu Thr Glu Gln Thr Ala Thr Tyr Phe Tyr Val Ser Arg 565 570 575 Gly Met Asp Gly Gly Leu Asn Thr His Phe Cys Gln Asp Glu Lys Arg 580 585 590 Ser Ser Lys Ala Ser Asp Ile Val Lys Arg Ile Val Gly His Ser Val 595 600 605 Pro Val Leu Asp Gly Glu Ser Phe Ala Leu Arg Ile Leu Val Asp His 610 615 620 Ser Ile Val Glu Ser Phe Ala Gln Gly Gly Arg Ala Ser Ala Thr Ser 625 630 635 640 Arg Val Tyr Pro Thr Glu Ala Ile Tyr Asn Asn Ala Arg Val Phe Val 645 650 655 Phe Asn Asn Ala Thr Gly Ala Lys Val Thr Ala Gln Ser Leu Lys Val 660 665 670 Trp His Met Ser Thr Ala Ile Asn Glu Ile Tyr Asp Pro Ala Thr Ser 675 680 685 Val Met 690 <210> 26 <211> 501 <212> PRT <213> Beta vulgaris <220> <221> misc_feature <222> (382)..(382) <223> Xaa can be any naturally occurring amino acid <400> 26 Leu Phe Tyr Gln Tyr Asn Pro Asn Gly Val Ile Trp Gly Pro Pro Val 1 5 10 15 Trp Gly His Ser Thr Ser Lys Asp Leu Val Asn Trp Val Pro Gln Pro 20 25 30 Leu Thr Met Glu Pro Glu Met Ala Ala Asn Ile Asn Gly Ser Trp Ser 35 40 45 Gly Ser Ala Thr Ile Leu Pro Gly Asn Lys Pro Ala Ile Leu Phe Thr 50 55 60 Gly Leu Asp Pro Lys Tyr Glu Gln Val Gln Val Leu Ala Tyr Pro Lys 65 70 75 80 Asp Thr Ser Asp Pro Asn Leu Lys Glu Trp Phe Leu Ala Pro Gln Asn 85 90 95 Pro Val Met Phe Pro Thr Pro Gln Asn Gln Ile Asn Ala Thr Ser Phe 100 105 110 Arg Asp Pro Thr Thr Ala Trp Arg Leu Pro Asp Gly Val Trp Arg Leu 115 120 125 Leu Ile Gly Ser Lys Arg Gly Gln Arg Gly Leu Ser Leu Leu Phe Arg 130 135 140 Ser Arg Asp Phe Val His Trp Val Gln Ala Lys His Pro Leu Tyr Ser 145 150 155 160 Asp Lys Leu Ser Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Tyr 165 170 175 Ala Asn Gly Asp Gln Met Gly Val Asp Thr Ser Ile Ile Gly Ser His 180 185 190 Val Lys His Val Leu Lys Asn Ser Leu Asp Ile Thr Lys His Asp Ile 195 200 205 Tyr Thr Ile Gly Asp Tyr Asn Ile Lys Lys Asp Ala Tyr Thr Pro Asp 210 215 220 Ile Gly Tyr Met Asn Asp Ser Ser Leu Arg Tyr Asp Tyr Gly Lys Tyr 225 230 235 240 Tyr Ala Ser Lys Thr Phe Phe Asp Asp Ala Lys Lys Glu Arg Ile Leu 245 250 255 Leu Gly Trp Ala Asn Glu Ser Ser Ser Val Glu Asp Asp Ile Lys Lys 260 265 270 Gly Trp Ser Gly Ile His Thr Ile Pro Arg Lys Ile Trp Leu Asp Lys 275 280 285 Leu Gly Lys Gln Leu Ile Gln Trp Pro Ile Ala Asn Ile Glu Lys Leu 290 295 300 Arg Gln Lys Pro Val Asn Ile Tyr Arg Lys Val Leu Lys Gly Gly Ser 305 310 315 320 Gln Ile Glu Val Ser Gly Ile Thr Ala Ala Gln Ala Asp Val Glu Ile 325 330 335 Ser Phe Lys Ile Lys Asp Leu Lys Asn Val Glu Lys Phe Asp Ala Ser 340 345 350 Trp Thr Ser Pro Gln Leu Leu Cys Ser Lys Lys Gly Ala Ser Val Lys 355 360 365 Gly Gly Leu Gly Pro Phe Gly Leu Leu Thr Leu Ala Ser Xaa Gly Leu 370 375 380 Glu Glu Tyr Thr Ala Val Phe Phe Arg Ile Phe Lys Ala Tyr Asp Asn 385 390 395 400 Lys Phe Val Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Leu Asn 405 410 415 Pro Thr Asn Asp Lys Thr Thr Tyr Gly Thr Phe Val Asp Val Asn Pro 420 425 430 Ile Arg Glu Gly Leu Ser Leu Arg Val Leu Ile Asp His Ser Val Val 435 440 445 Glu Ser Phe Gly Ala Lys Gly Lys Asn Val Ile Thr Ala Arg Val Tyr 450 455 460 Pro Thr Leu Ala Ile Asn Glu Lys Ala His Leu Tyr Val Phe Asn Arg 465 470 475 480 Gly Thr Ser Asn Val Glu Ile Thr Gly Leu Thr Ala Trp Ser Met Lys 485 490 495 Lys Ala Asn Ile Ala 500 <210> 27 <211> 518 <212> PRT <213> Bifidobacterium breve <400> 27 Met Thr Asp Phe Thr Pro Glu Thr Pro Val Leu Thr Pro Ile Arg Asp 1 5 10 15 His Ala Ala Glu Leu Ala Lys Ala Glu Ala Gly Val Ala Glu Met Ala 20 25 30 Ala Lys Arg Asn Asn Arg Trp Tyr Pro Lys Tyr His Ile Ala Ser Asn 35 40 45 Gly Gly Trp Ile Asn Asp Pro Asn Gly Leu Cys Phe Tyr Lys Gly Arg 50 55 60 Trp His Val Phe Tyr Gln Leu His Pro Tyr Gly Thr Gln Trp Gly Pro 65 70 75 80 Met His Trp Gly His Val Ser Ser Thr Asp Met Leu Asn Trp Lys Arg 85 90 95 Glu Pro Ile Met Phe Ala Pro Ser Leu Glu Gln Glu Lys Asp Gly Val 100 105 110 Phe Ser Gly Ser Ala Val Ile Asp Asp Asn Gly Asp Leu Arg Phe Tyr 115 120 125 Tyr Thr Gly His Arg Trp Ala Asn Gly His Asp Asn Thr Gly Gly Asp 130 135 140 Trp Gln Val Gln Met Thr Ala Leu Pro Asp Asn Asp Glu Leu Thr Ser 145 150 155 160 Ala Thr Lys Gln Gly Met Ile Ile Asp Cys Pro Thr Asp Lys Val Asp 165 170 175 His His Tyr Arg Asp Pro Lys Val Trp Lys Thr Gly Asp Thr Trp Tyr 180 185 190 Met Thr Phe Gly Val Ser Ser Glu Asp Lys Arg Gly Gln Met Trp Leu 195 200 205 Phe Ser Ser Lys Asp Met Val Arg Trp Glu Tyr Glu Arg Val Leu Phe 210 215 220 Gln His Pro Asp Pro Asp Val Phe Met Leu Glu Cys Pro Asp Phe Phe 225 230 235 240 Pro Ile Lys Asp Lys Asp Gly Asn Glu Lys Trp Val Ile Gly Phe Ser 245 250 255 Ala Met Gly Ser Lys Pro Ser Gly Phe Met Asn Arg Asn Val Asn Asn 260 265 270 Ala Gly Tyr Met Ile Gly Thr Trp Glu Pro Gly Gly Glu Phe Lys Pro 275 280 285 Glu Thr Glu Phe Arg Leu Trp Asp Cys Gly His Asn Tyr Tyr Ala Pro 290 295 300 Gln Ser Phe Asn Val Asp Gly Arg Gln Ile Val Tyr Gly Trp Met Ser 305 310 315 320 Pro Phe Val Gln Pro Ile Pro Met Glu Asp Asp Gly Trp Cys Gly Gln 325 330 335 Leu Thr Leu Pro Arg Glu Ile Thr Leu Asp Asp Asp Gly Asp Val Val 340 345 350 Thr Ala Pro Val Ala Glu Met Glu Gly Leu Arg Glu Asp Thr Leu Asp 355 360 365 His Gly Ser Ile Thr Leu Asp Met Asp Gly Glu Gln Val Ile Ala Asp 370 375 380 Asp Ala Glu Ala Val Glu Ile Glu Met Thr Ile Asp Leu Ala Ala Ser 385 390 395 400 Thr Ala Asp Arg Ala Gly Leu Lys Ile His Ala Thr Glu Asp Gly Ala 405 410 415 Tyr Thr Tyr Val Ala Tyr Asp Asp Gln Ile Gly Arg Val Val Val Asp 420 425 430 Arg Gln Ala Met Ala Asn Gly Asp His Gly Tyr Arg Ala Ala Pro Leu 435 440 445 Thr Asp Ala Glu Leu Ala Ser Gly Lys Leu Asp Leu Arg Val Phe Val 450 455 460 Asp Arg Gly Ser Val Glu Val Tyr Val Asn Gly Gly His Gln Val Leu 465 470 475 480 Ser Ser Tyr Ser Tyr Ala Ser Glu Gly Pro Arg Ala Ile Lys Leu Val 485 490 495 Ala Glu Phe Gly Asn Leu Lys Val Glu Ser Leu Lys Leu His His Met 500 505 510 Lys Ser Ile Gly Leu Glu 515 <210> 28 <211> 532 <212> PRT <213> Saccharomyces cerevisae <400> 28 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala Ser Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His 20 25 30 Phe Thr Pro Asn Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr 35 40 45 Asp Glu Lys Asp Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn 50 55 60 Asp Thr Val Trp Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp 65 70 75 80 Asp Leu Thr Asn Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg 85 90 95 Asn Asp Ser Gly Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn 100 105 110 Thr Ser Gly Phe Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val 115 120 125 Ala Ile Trp Thr Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser 130 135 140 Tyr Ser Leu Asp Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro 145 150 155 160 Val Leu Ala Ala Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp 165 170 175 Tyr Glu Pro Ser Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp 180 185 190 Tyr Lys Ile Glu Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu 195 200 205 Glu Ser Ala Phe Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys 210 215 220 Pro Gly Leu Ile Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr 225 230 235 240 Trp Val Met Phe Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser 245 250 255 Phe Asn Gln Tyr Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala 260 265 270 Phe Asp Asn Gln Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala 275 280 285 Leu Gln Thr Phe Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly 290 295 300 Ile Ala Trp Ala Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn 305 310 315 320 Pro Trp Arg Ser Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr 325 330 335 Glu Tyr Gln Ala Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu 340 345 350 Pro Ile Leu Asn Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr 355 360 365 Asn Thr Thr Leu Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn 370 375 380 Ser Thr Gly Thr Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr 385 390 395 400 Gln Thr Ile Ser Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys 405 410 415 Gly Leu Glu Asp Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser 420 425 430 Ala Ser Ser Phe Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val 435 440 445 Lys Glu Asn Pro Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro 450 455 460 Phe Lys Ser Glu Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu 465 470 475 480 Asp Gln Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser 485 490 495 Thr Asn Thr Tyr Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn 500 505 510 Met Thr Thr Gly Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val 515 520 525 Arg Glu Val Lys 530 <210> 29 <211> 512 <212> PRT <213> Zymomonas mobilis <400> 29 Met Glu Ser Pro Ser Tyr Lys Asn Leu Ile Lys Ala Glu Asp Ala Gln 1 5 10 15 Lys Lys Ala Gly Lys Arg Leu Leu Ser Ser Glu Trp Tyr Pro Gly Phe 20 25 30 His Val Thr Pro Leu Thr Gly Trp Met Asn Asp Pro Asn Gly Leu Ile 35 40 45 Phe Phe Lys Gly Glu Tyr His Leu Phe Tyr Gln Tyr Tyr Pro Phe Ala 50 55 60 Pro Val Trp Gly Pro Met His Trp Gly His Ala Lys Ser Arg Asp Leu 65 70 75 80 Val His Trp Glu Thr Leu Pro Val Ala Leu Ala Pro Gly Asp Leu Phe 85 90 95 Asp Arg Asp Gly Cys Phe Ser Gly Cys Ala Val Asp Asn Asn Gly Val 100 105 110 Leu Thr Leu Ile Tyr Thr Gly His Ile Val Leu Ser Asn Asp Ser Pro 115 120 125 Asp Ala Ile Arg Glu Val Gln Cys Met Ala Thr Ser Ile Asp Gly Ile 130 135 140 His Phe Gln Lys Glu Gly Ile Val Leu Glu Lys Ala Pro Met Pro Gln 145 150 155 160 Val Ala His Phe Arg Asp Pro Arg Val Trp Lys Glu Asn Asp His Trp 165 170 175 Phe Met Val Val Gly Tyr Arg Thr Asp Asp Glu Lys His Gln Gly Ile 180 185 190 Gly His Val Ala Leu Tyr Arg Ser Glu Asn Leu Lys Asp Trp Ile Phe 195 200 205 Val Lys Thr Leu Leu Gly Asp Asn Ser Gln Leu Pro Leu Gly Lys Arg 210 215 220 Ala Phe Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asn Arg Ser 225 230 235 240 Val Leu Met Phe Ser Pro Gln Gly Leu Lys Ala Ser Gly Tyr Lys Asn 245 250 255 Arg Asn Leu Phe Gln Asn Gly Tyr Ile Leu Gly Lys Trp Gln Ala Pro 260 265 270 Gln Phe Thr Pro Glu Thr Ser Phe Gln Glu Leu Asp Tyr Gly His Asp 275 280 285 Phe Tyr Ala Ala Gln Arg Phe Glu Ala Lys Asp Gly Arg Gln Ile Leu 290 295 300 Ile Ala Trp Phe Asp Met Trp Glu Asn Gln Lys Pro Ser Gln Arg Asp 305 310 315 320 Gly Trp Ala Gly Cys Met Thr Leu Pro Arg Lys Leu Asp Leu Ile Asp 325 330 335 Asn Lys Ile Val Met Thr Pro Val Arg Glu Met Glu Ile Leu Arg Gln 340 345 350 Ser Glu Lys Ile Glu Ser Val Val Thr Leu Ser Asp Ala Glu His Pro 355 360 365 Phe Thr Met Asp Ser Pro Leu Gln Glu Ile Glu Leu Ile Phe Asp Leu 370 375 380 Glu Lys Ser Ser Ala Tyr Gln Ala Gly Leu Ala Leu Arg Cys Asn Gly 385 390 395 400 Lys Gly Gln Glu Thr Leu Leu Tyr Ile Asp Arg Ser Gln Asn Arg Ile 405 410 415 Ile Leu Asp Arg Asn Arg Ser Gly Gln Asn Val Lys Gly Ile Arg Ser 420 425 430 Cys Pro Leu Pro Asn Thr Ser Lys Val Arg Leu His Ile Phe Leu Asp 435 440 445 Arg Ser Ser Ile Glu Ile Phe Val Gly Asp Asp Gln Thr Gln Gly Leu 450 455 460 Tyr Ser Ile Ser Ser Arg Ile Phe Pro Asp Lys Asp Ser Leu Lys Gly 465 470 475 480 Arg Leu Phe Ala Ile Glu Gly Tyr Ala Val Phe Asp Ser Phe Lys Arg 485 490 495 Trp Thr Leu Gln Asp Ala Asn Leu Ala Ala Phe Ser Ser Asp Ala Cys 500 505 510 <210> 30 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 30 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Pro Asp Trp Ser Met Leu Phe Ala Val Ile 35 40 45 Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp 50 55 60 Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu Asp Asp His Phe Gly Pro 65 70 75 80 His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val 85 90 95 Gly Pro Asp Arg Ser Thr Ser Ile Val Ala Val Met Asn His Leu Gln 100 105 110 Glu Ala Ala Leu Asn His Ala Lys Ser Val Gly Ile Leu Gly Asp Gly 115 120 125 Phe Gly Thr Thr Leu Glu Met Ser Lys Arg Asp Leu Ile Trp Val Val 130 135 140 Lys Arg Thr His Val Ala Val Glu Arg Tyr Pro Ala Trp Gly Asp Thr 145 150 155 160 Val Glu Val Glu Cys Trp Val Gly Ala Ser Gly Asn Asn Gly Arg Arg 165 170 175 His Asp Phe Leu Val Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg 180 185 190 Cys Thr Ser Leu Ser Val Met Met Asn Thr Arg Thr Arg Arg Leu Ser 195 200 205 Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp 210 215 220 Asn Val Ala Val Lys Asp Glu Glu Ile Lys Lys Pro Gln Lys Leu Asn 225 230 235 240 Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn 245 250 255 Asp Leu Asp Ile Asn Gln His Val Asn Asn Ile Lys Tyr Val Asp Trp 260 265 270 Ile Leu Glu Thr Val Pro Asp Ser Ile Phe Glu Ser His His Ile Ser 275 280 285 Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys Thr Met Asp Ser Val Leu 290 295 300 Gln Ser Leu Thr Thr Val Ser Gly Gly Ser Ser Glu Ala Gly Leu Val 305 310 315 320 Cys Glu His Leu Leu Gln Leu Glu Gly Gly Ser Glu Val Leu Arg Ala 325 330 335 Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser 340 345 350 Val Ile Pro Ala Glu Ser Ser Val 355 360 <210> 31 <211> 4653 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucelotide <400> 31 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 tccgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa ccccccccag 3300 ctgctggacg accacttcgg cccccacggc ctggtgttcc gccgcacctt cgccatccgc 3360 agctacgagg tgggccccga ccgctccacc agcatcgtgg ccgtgatgaa ccacctgcag 3420 gaggccgccc tgaaccacgc caagtccgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatctgg gtggtgaagc gcacccacgt ggccgtggag 3540 cgctaccccg cctggggcga caccgtggag gtggagtgct gggtgggcgc ctccggcaac 3600 aacggccgcc gccacgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgat gatgaacacc cgcacccgcc gcctgagcaa gatccccgag 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgaggag 3780 atcaagaagc cccagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga catcaaccag cacgtgaaca acatcaagta cgtggactgg 3900 atcctggaga ccgtgcccga cagcatcttc gagagccacc acatctcctc cttcaccatc 3960 gagtaccgcc gcgagtgcac catggacagc gtgctgcagt ccctgaccac cgtgagcggc 4020 ggctcctccg aggccggcct ggtgtgcgag cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg ccaagaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagtccag cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620 aagtagtggg atgggaacac aaatggaaag ctt 4653 <210> 32 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 32 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Gln Leu Pro Asp Trp Ser Arg Leu Leu Thr 35 40 45 Ala Ile Thr Thr Val Phe Val Lys Ser Lys Arg Pro Asp Met His Asp 50 55 60 Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Phe Gly Leu Glu 65 70 75 80 Ser Thr Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile Arg 85 90 95 Ser Tyr Glu Ile Gly Thr Asp Arg Thr Ala Ser Ile Glu Thr Leu Met 100 105 110 Asn His Leu Gln Glu Thr Ser Leu Asn His Cys Lys Ser Thr Gly Ile 115 120 125 Leu Leu Asp Gly Phe Gly Arg Thr Leu Glu Met Cys Lys Arg Asp Leu 130 135 140 Ile Trp Val Val Ile Lys Met Gln Ile Lys Val Asn Arg Tyr Pro Ala 145 150 155 160 Trp Gly Asp Thr Val Glu Ile Asn Thr Arg Phe Ser Arg Leu Gly Lys 165 170 175 Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu 180 185 190 Ile Leu Val Arg Ala Thr Ser Ala Tyr Ala Met Met Asn Gln Lys Thr 195 200 205 Arg Arg Leu Ser Lys Leu Pro Tyr Glu Val His Gln Glu Ile Val Pro 210 215 220 Leu Phe Val Asp Ser Pro Val Ile Glu Asp Ser Asp Leu Lys Val His 225 230 235 240 Lys Phe Lys Val Lys Thr Gly Asp Ser Ile Gln Lys Gly Leu Thr Pro 245 250 255 Gly Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys Tyr 260 265 270 Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu Thr Gln 275 280 285 Glu Leu Cys Ser Leu Ala Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp 290 295 300 Ser Val Leu Glu Ser Val Thr Ala Met Asp Pro Ser Lys Val Gly Val 305 310 315 320 Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Ala Ile 325 330 335 Val Asn Gly Ala Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly 340 345 350 Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Val Ser 355 360 365 <210> 33 <211> 4668 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 33 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240 gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300 ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360 ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420 aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480 ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540 atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600 cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660 atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720 aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780 gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840 ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900 atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960 ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020 atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080 ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140 gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200 gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260 gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320 ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380 tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440 ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500 tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560 gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620 atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 4668 <210> 34 <211> 360 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 34 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Pro Asp Trp Ser Met Leu Phe Ala Val Ile 35 40 45 Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp 50 55 60 Lys Pro Lys Pro Lys Leu Pro Gln Leu Leu Asp Asp His Phe Gly Leu 65 70 75 80 His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val 85 90 95 Gly Pro Asp Arg Ser Thr Ser Ile Leu Ala Val Met Asn His Met Gln 100 105 110 Glu Ala Thr Leu Asn His Ala Lys Ser Val Gly Ile Leu Gly Asp Gly 115 120 125 Phe Gly Thr Thr Leu Glu Met Ser Lys Arg Asp Leu Met Trp Val Val 130 135 140 Arg Arg Thr His Val Ala Val Glu Arg Tyr Pro Thr Trp Gly Asp Thr 145 150 155 160 Val Glu Val Glu Cys Trp Ile Gly Ala Ser Gly Asn Asn Gly Met Arg 165 170 175 Arg Asp Phe Leu Val Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg 180 185 190 Cys Thr Ser Leu Ser Val Leu Met Asn Thr Arg Thr Arg Arg Leu Ser 195 200 205 Thr Ile Pro Asp Glu Val Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp 210 215 220 Asn Val Ala Val Lys Asp Asp Glu Ile Lys Lys Leu Gln Lys Leu Asn 225 230 235 240 Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn 245 250 255 Asp Leu Asp Val Asn Gln His Val Asn Asn Leu Lys Tyr Val Ala Trp 260 265 270 Val Phe Glu Thr Val Pro Asp Ser Ile Phe Glu Ser His His Ile Ser 275 280 285 Ser Phe Thr Leu Glu Tyr Arg Arg Glu Cys Thr Arg Asp Ser Val Leu 290 295 300 Arg Ser Leu Thr Thr Val Ser Gly Gly Ser Ser Glu Ala Gly Leu Val 305 310 315 320 Cys Asp His Leu Leu Gln Leu Glu Gly Gly Ser Glu Val Leu Arg Ala 325 330 335 Arg Thr Glu Trp Arg Pro Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser 340 345 350 Val Ile Pro Ala Glu Pro Arg Val 355 360 <210> 35 <211> 4653 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 35 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300 ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360 tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420 gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540 cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600 aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780 atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900 gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960 gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020 ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620 aagtagtggg atgggaacac aaatggaaag ctt 4653 <210> 36 <211> 393 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 36 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Pro Ala Asn Gly Ser Ala Val Thr Leu Lys 35 40 45 Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Leu Ser Ser Ser Pro Pro 50 55 60 Pro Arg Ala Phe Phe Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Thr 65 70 75 80 Ala Ile Thr Thr Val Phe Val Ala Pro Glu Lys Arg Trp Thr Met Phe 85 90 95 Asp Arg Lys Ser Lys Arg Pro Asn Met Leu Met Asp Ser Phe Gly Leu 100 105 110 Glu Arg Val Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile 115 120 125 Arg Ser Tyr Glu Ile Cys Ala Asp Arg Thr Ala Ser Ile Glu Thr Val 130 135 140 Met Asn His Val Gln Glu Thr Ser Leu Asn Gln Cys Lys Ser Ile Gly 145 150 155 160 Leu Leu Asp Asp Gly Phe Gly Arg Ser Pro Glu Met Cys Lys Arg Asp 165 170 175 Leu Ile Trp Val Val Thr Arg Met Lys Ile Met Val Asn Arg Tyr Pro 180 185 190 Thr Trp Gly Asp Thr Ile Glu Val Ser Thr Trp Leu Ser Gln Ser Gly 195 200 205 Lys Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 210 215 220 Glu Ile Leu Val Arg Ala Thr Ser Val Tyr Ala Met Met Asn Gln Lys 225 230 235 240 Thr Arg Arg Phe Ser Lys Leu Pro His Glu Val Arg Gln Glu Phe Ala 245 250 255 Pro His Phe Leu Asp Ser Pro Pro Ala Ile Glu Asp Asn Asp Gly Lys 260 265 270 Leu Gln Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly Leu 275 280 285 Thr Pro Gly Trp Tyr Asp Leu Asp Val Asn Gln His Val Ser Asn Val 290 295 300 Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu 305 310 315 320 Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly 325 330 335 Arg Asp Ser Val Leu Glu Ser Val Thr Ser Met Asp Pro Ser Lys Val 340 345 350 Gly Asp Arg Phe Gln Tyr Arg His Leu Leu Arg Leu Glu Asp Gly Ala 355 360 365 Asp Ile Met Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Thr 370 375 380 Asn Gly Ala Ile Ser Thr Gly Lys Thr 385 390 <210> 37 <211> 4686 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 37 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120 cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180 gcgcttcgtg ggcgcgcccc cgcgaacggc agcgcggtga ccctgaagtc gggctccctg 3240 aacacccagg aggacacgct gagctcgtcc cccccccccc gcgcgttctt caaccagctg 3300 cccgactgga gcatgctgct gaccgcgatc accacggtct tcgtggcgcc cgagaagcgc 3360 tggaccatgt tcgaccgcaa gtcgaagcgc cccaacatgc tgatggactc cttcggcctg 3420 gagcgcgtgg tccaggacgg cctggtgttc cgccagagct tctcgatccg ctcctacgag 3480 atctgcgcgg accgcaccgc gagcatcgag acggtgatga accacgtcca ggagacctcg 3540 ctgaaccagt gcaagtccat cggcctgctg gacgacggct tcggccgcag ccccgagatg 3600 tgcaagcgcg acctgatctg ggtggtcacc cgcatgaaga tcatggtgaa ccgctacccc 3660 acgtggggcg acaccatcga ggtctcgacg tggctgtccc agagcggcaa gatcggcatg 3720 ggccgcgact ggctgatctc ggactgcaac accggcgaga tcctggtgcg cgcgacgtcc 3780 gtctacgcga tgatgaacca gaagacccgc cgcttcagca agctgcccca cgaggtgcgc 3840 caggagttcg cgccccactt cctggactcg ccccccgcga tcgaggacaa cgacggcaag 3900 ctgcagaagt tcgacgtcaa gacgggcgac tccatccgca agggcctgac ccccggctgg 3960 tacgacctgg acgtgaacca gcacgtgagc aacgtcaagt acatcggctg gatcctggag 4020 tcgatgccca ccgaggtcct ggagacgcag gagctgtgct ccctgaccct ggagtaccgc 4080 cgcgagtgcg gccgcgactc ggtgctggag agcgtcacca gcatggaccc ctcgaaggtg 4140 ggcgaccgct tccagtaccg ccacctgctg cgcctggagg acggcgcgga catcatgaag 4200 ggccgcaccg agtggcgccc caagaacgcg ggcacgaacg gcgcgatctc caccggcaag 4260 acgtgactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 4320 gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 4380 aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 4440 tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4500 aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4560 gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 4620 accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctt 4680 gagctc 4686 <210> 38 <211> 408 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 38 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Pro Ala Asn Gly Ser Ala Val Asn Leu Lys 35 40 45 Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro Pro Pro 50 55 60 Arg Ala Phe Leu Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Thr Ala 65 70 75 80 Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met Leu Asp 85 90 95 Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Val Gly Leu Lys 100 105 110 Ser Ile Val Arg Asp Gly Leu Val Ser Arg Gln Ser Phe Leu Ile Arg 115 120 125 Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met 130 135 140 Asn His Leu Gln Glu Thr Ser Ile Asn His Cys Lys Ser Leu Gly Leu 145 150 155 160 Leu Asn Asp Gly Phe Gly Arg Thr Pro Gly Met Cys Lys Asn Asp Leu 165 170 175 Ile Trp Val Leu Thr Lys Met Gln Ile Met Val Asn Arg Tyr Pro Thr 180 185 190 Trp Gly Asp Thr Val Glu Ile Asn Thr Trp Phe Ser Gln Ser Gly Lys 195 200 205 Ile Gly Met Ala Ser Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu 210 215 220 Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr 225 230 235 240 Arg Arg Phe Ser Arg Leu Pro Tyr Glu Val Arg Gln Glu Leu Thr Pro 245 250 255 His Phe Val Asp Ser Pro His Val Ile Glu Asp Asn Asp Gln Lys Leu 260 265 270 His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly Leu Thr 275 280 285 Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys 290 295 300 Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Ile Glu Val Leu Glu Thr 305 310 315 320 Gln Glu Leu Cys Ser Leu Thr Val Glu Tyr Arg Arg Glu Cys Gly Met 325 330 335 Asp Ser Val Leu Glu Ser Val Thr Ala Val Asp Pro Ser Glu Asn Gly 340 345 350 Gly Arg Ser Gln Tyr Lys His Leu Leu Arg Leu Glu Asp Gly Thr Asp 355 360 365 Ile Val Lys Ser Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Thr Asn 370 375 380 Gly Ala Ile Ser Thr Ser Thr Ala Lys Thr Ser Asn Gly Asn Ser Ala 385 390 395 400 Ser Asp Asp Asp Asp Lys Leu Gly 405 <210> 39 <211> 1239 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 39 actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60 acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120 cccgcgaacg gcagcgcggt gaacctgaag tcgggctccc tgaacaccca ggaggacacg 180 agctcgtccc cccccccccg cgcgttcctg aaccagctgc ccgactggag catgctgctg 240 accgcgatca ccaccgtctt cgtggcggcg gagaagcagt ggacgatgct ggaccgcaag 300 tcgaagcgcc ccgacatgct ggtggactcc gtcggcctga agagcatcgt gcgcgacggc 360 ctggtctcgc gccagtcctt cctgatccgc agctacgaga tcggcgcgga ccgcaccgcg 420 tcgatcgaga ccctgatgaa ccacctgcag gagacgtcca tcaaccactg caagagcctg 480 ggcctgctga acgacggctt cggccgcacc cccggcatgt gcaagaacga cctgatctgg 540 gtgctgacca agatgcagat catggtcaac cgctacccca cgtggggcga caccgtcgag 600 atcaacacgt ggttctcgca gtccggcaag atcggcatgg cgagcgactg gctgatctcg 660 gactgcaaca ccggcgagat cctgatccgc gcgacctccg tgtgggcgat gatgaaccag 720 aagacgcgcc gcttcagccg cctgccctac gaggtccgcc aggagctgac cccccacttc 780 gtggactcgc cccacgtcat cgaggacaac gaccagaagc tgcacaagtt cgacgtgaag 840 accggcgact ccatccgcaa gggcctgacg ccccgctgga acgacctgga cgtcaaccag 900 cacgtgtcga acgtgaagta catcggctgg atcctggagt ccatgcccat cgaggtcctg 960 gagacccagg agctgtgctc gctgaccgtg gagtaccgcc gcgagtgcgg catggactcc 1020 gtgctggagt cggtcacggc ggtggacccc agcgagaacg gcggccgcag ccagtacaag 1080 cacctgctgc gcctggagga cggcaccgac atcgtcaagt cgcgcaccga gtggcgcccc 1140 aagaacgcgg gcacgaacgg cgcgatctcc accagcaccg cgaagacgtc gaacggcaac 1200 tccgcgagcg atgacgatga caagctggga tgactcgag 1239 <210> 40 <211> 399 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 40 Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp 1 5 10 15 Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu 20 25 30 Pro Val Arg Gly Arg Ala Ala Gln Ala Ala Thr Arg Val Asn Gly Ser 35 40 45 Lys Val Gly Leu Lys Thr Asp Thr Asn Lys Leu Glu Asp Ala Pro Phe 50 55 60 Ile Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp Trp 65 70 75 80 Ser Val Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys 85 90 95 Gln Trp Thr Leu Ile Asp Trp Lys Arg Gly Gly Pro Asp Met Leu Ser 100 105 110 Asp Ala Phe Gly Leu Pro Lys Ile Ile Glu Asn Gly Leu Leu Tyr Arg 115 120 125 Gln Lys Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Gln Thr Ala 130 135 140 Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His 145 150 155 160 Val Lys Cys Ala Gly Leu Leu Gly Asn Gly Phe Gly Ser Thr Pro Glu 165 170 175 Met Ser Lys Met Asn Leu Ile Trp Val Val Thr Lys Met Gln Val Leu 180 185 190 Val Glu His Tyr Pro Ser Trp Gly Asp Val Ile Glu Val Asp Thr Trp 195 200 205 Ala Ala Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp His Val Arg 210 215 220 Asp Trp Gln Thr Gly Gln Thr Ile Met Arg Ala Ser Ser Asn Trp Val 225 230 235 240 Met Met Asn Gln Asn Thr Arg Arg Leu Ser Lys Phe Pro Glu Glu Val 245 250 255 Arg Ala Glu Ile Glu Pro Tyr Phe Met Glu Arg Ala Pro Val Ile Asp 260 265 270 Asp Asp Asn Arg Lys Leu Pro Lys Leu Asp Asp Asp Thr Ala Asp His 275 280 285 Val Arg Asn Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln 290 295 300 His Val Lys Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro 305 310 315 320 Ile Ser Ile Leu Glu Ser His Glu Leu Ala Ser Met Thr Leu Glu Tyr 325 330 335 Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ser Val 340 345 350 Ser Asn Asn Cys Thr Asp Gly Ser Glu Glu Leu Pro Ile Glu Cys Gln 355 360 365 His Leu Leu Arg Asn Glu Gly Gly Ser Glu Ile Val Lys Gly Arg Thr 370 375 380 Glu Trp Arg Pro Lys Lys Cys Gly Pro Phe Gly Ala Gly Arg Pro 385 390 395 <210> 41 <211> 1212 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 41 actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60 cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120 gcccaggcgg ccacccgcgt gaacggcagc aaggtgggcc tgaagaccga caccaacaag 180 ctggaggacg cgcccttcat cccctcgtcc gccccccgca ccttctacaa ccagctgccc 240 gactggagcg tcctgctggc ggccatcacc accatcttcc tggcggccga gaagcagtgg 300 accctgatcg actggaagcg cggcggcccc gacatgctgt cggacgcgtt cggcctgccc 360 aagatcatcg agaacggcct gctgtaccgc cagaagttct ccatccgcag ctacgagatc 420 ggcgccgacc agaccgcctc gatcgagacc ctgatgaacc acctgcagga gaccgcgctg 480 aaccacgtca agtgcgccgg cctgctgggc aacggcttcg gctccacccc cgagatgagc 540 aagatgaacc tgatctgggt ggtcaccaag atgcaggtgc tggtcgagca ctacccctcg 600 tggggcgacg tgatcgaggt ggacacctgg gcggccgcgt ccggcaagaa cggcatgcgc 660 cgcgactggc acgtccgcga ctggcagacc ggccagacca tcatgcgcgc cagctcgaac 720 tgggtgatga tgaaccagaa cacccgccgc ctgtccaagt tccccgagga ggtccgcgcc 780 gagatcgagc cctacttcat ggagcgcgcc cccgtgatcg acgacgacaa ccgcaagctg 840 cccaagctgg acgacgacac cgcggaccac gtgcgcaacg gcctgacccc ccgctggagc 900 gacctggacg tgaaccagca cgtcaagaac gtgaagtaca tcggctggat cctggagtcg 960 gcccccatct ccatcctgga gagccacgag ctggcctcga tgaccctgga gtaccgccgc 1020 gagtgcggcc gcgactccgt cctgcagagc ctgacctcgg tgtccaacaa ctgcaccgac 1080 ggcagcgagg agctgcccat cgagtgccag cacctgctgc gcaacgaggg cggctcggag 1140 atcgtcaagg gccgcaccga gtggcgcccc aagaagtgcg gccccttcgg cgccggccgc 1200 ccctgactcg ag 1212 <210> 42 <211> 415 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 42 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Ala Asn Ala His Thr Val Pro Lys Ile Asn 35 40 45 Gly Asn Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu 50 55 60 Asp Ile Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn 65 70 75 80 Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe 85 90 95 Leu Ala Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg 100 105 110 Pro Asp Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val 115 120 125 Gln Asp Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu 130 135 140 Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu 145 150 155 160 Gln Glu Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp 165 170 175 Gly Phe Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val 180 185 190 Val Thr Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp 195 200 205 Val Ile Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met 210 215 220 Lys Arg Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr 225 230 235 240 Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu 245 250 255 Ser Lys Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val 260 265 270 Glu His Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn 275 280 285 Asp Asn Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser 290 295 300 Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp 305 310 315 320 Ile Leu Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr 325 330 335 Gly Met Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu 340 345 350 Gln Ser Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu 355 360 365 Ala Gly Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu 370 375 380 Ile Met Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr 385 390 395 400 Thr Tyr Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala 405 410 415 <210> 43 <211> 1260 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 43 actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60 acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120 gccaacgccc acaccgtgcc caagatcaac ggcaacaagg ccggcctgct gacccccatg 180 gagagcacca aggacgagga catcgtcgcg gcccccaccg tggcgcccaa gcgcaccttc 240 atcaaccagc tgcccgactg gtcgatgctg ctggccgcga tcaccaccat cttcctggcg 300 gccgagaagc agtggaccaa cctggactgg aagccccgcc gccccgacat gctggtcgac 360 ttcgacccct tctccctggg ccgcttcgtg caggacggcc tgatcttccg ccagaacttc 420 agcatccgct cgtacgagat cggcgcggac cgcaccgcct ccatcgagac cctgatgaac 480 cacctgcagg agaccgcgct gaaccacgtc cgctgcatcg gcctgctgga cgacggcttc 540 ggcagcaccc ccgagatgac ccgccgcgac ctgatctggg tggtcacccg catgcaggtc 600 ctggtggacc gctacccctc gtggggcgac gtgatcgagg tcgactcctg ggtgaccccc 660 agcggcaaga acggcatgaa gcgcgagtgg ttcctgcgcg actgcaagac cggcgagatc 720 ctgacccgcg ccacctcggt ctgggtgatg atgaacaagc gcacccgccg cctgtccaag 780 atccccgagg aggtccgcgt ggagatcgag ccctacttcg tcgagcacgg cgtgctggac 840 gaggactcgc gcaagctgcc caagctgaac gacaacaccg ccaactacat ccgccgcggc 900 ctggcgcccc gctggtccga cctggacgtc aaccagcacg tgaacaacgt caagtacatc 960 ggctggatcc tggagagcgt gcccagcagc ctgctggagt cgcacgagct gtacggcatg 1020 accctggagt accgcaagga gtgcggcaag gacggcctgc tgcagtccct gaccgccgtc 1080 gccagcgact acggcggcgg ctcgctggag gccggcgtgg agtgcgacca cctgctgcgc 1140 ctggaggacg gctccgagat catgcgcggc aagaccgagt ggcgccccaa gcgcgccgcg 1200 aacaccacct acttcggcag cgtcgacgac atcccccccg ccaacaacgc gtgactcgag 1260 <210> 44 <211> 362 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 44 Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp 1 5 10 15 Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu 20 25 30 Pro Val Arg Gly Arg Ala Ser Met Leu Leu Ser Ala Val Thr Thr Val 35 40 45 Phe Gly Val Ala Glu Lys Gln Trp Pro Met Leu Asp Arg Lys Ser Lys 50 55 60 Arg Pro Asp Met Leu Val Glu Pro Leu Gly Val Asp Arg Ile Val Tyr 65 70 75 80 Asp Gly Val Ser Phe Arg Gln Ser Phe Ser Ile Arg Ser Tyr Glu Ile 85 90 95 Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn Met Phe Gln 100 105 110 Glu Thr Ser Leu Asn His Cys Lys Ile Ile Gly Leu Leu Asn Asp Gly 115 120 125 Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu Ile Trp Val Val 130 135 140 Thr Lys Met Gln Ile Glu Val Asn Arg Tyr Pro Thr Trp Gly Asp Thr 145 150 155 160 Ile Glu Val Asn Thr Trp Val Ser Ala Ser Gly Lys His Gly Met Gly 165 170 175 Arg Asp Trp Leu Ile Ser Asp Cys His Thr Gly Glu Ile Leu Ile Arg 180 185 190 Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr Arg Arg Leu Ser 195 200 205 Lys Ile Pro Tyr Glu Val Arg Gln Glu Ile Glu Pro Gln Phe Val Asp 210 215 220 Ser Ala Pro Val Ile Val Asp Asp Arg Lys Phe His Lys Leu Asp Leu 225 230 235 240 Lys Thr Gly Asp Ser Ile Cys Asn Gly Leu Thr Pro Arg Trp Thr Asp 245 250 255 Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile 260 265 270 Leu Gln Ser Val Pro Thr Glu Val Phe Glu Thr Gln Glu Leu Cys Gly 275 280 285 Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Glu 290 295 300 Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp Arg Ser Leu Tyr 305 310 315 320 Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile Val Lys Gly Arg 325 330 335 Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Lys Gly Ala Ile Leu Thr 340 345 350 Gly Lys Thr Ser Asn Gly Asn Ser Ile Ser 355 360 <210> 45 <211> 1101 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 45 actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60 cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120 agcatgctgc tgtcggcggt gaccacggtc ttcggcgtgg ccgagaagca gtggcccatg 180 ctggaccgca agtccaagcg ccccgacatg ctggtcgagc ccctgggcgt ggaccgcatc 240 gtctacgacg gcgtgagctt ccgccagtcg ttctccatcc gcagctacga gatcggcgcc 300 gaccgcaccg cctcgatcga gacgctgatg aacatgttcc aggagacctc cctgaaccac 360 tgcaagatca tcggcctgct gaacgacggc ttcggccgca cgcccgagat gtgcaagcgc 420 gacctgatct gggtcgtgac caagatgcag atcgaggtga accgctaccc cacgtggggc 480 gacaccatcg aggtcaacac gtgggtgagc gcctcgggca agcacggcat gggccgcgac 540 tggctgatct ccgactgcca caccggcgag atcctgatcc gcgcgacgag cgtctgggcg 600 atgatgaacc agaagacccg ccgcctgtcg aagatcccct acgaggtgcg ccaggagatc 660 gagccccagt tcgtcgactc cgcccccgtg atcgtggacg accgcaagtt ccacaagctg 720 gacctgaaga cgggcgacag catctgcaac ggcctgaccc cccgctggac ggacctggac 780 gtgaaccagc acgtcaacaa cgtgaagtac atcggctgga tcctgcagtc ggtccccacc 840 gaggtgttcg agacgcagga gctgtgcggc ctgaccctgg agtaccgccg cgagtgcggc 900 cgcgactccg tgctggagag cgtcacggcc atggacccct cgaaggaggg cgaccgctcc 960 ctgtaccagc acctgctgcg cctggaggac ggcgcggaca tcgtgaaggg ccgcaccgag 1020 tggcgcccca agaacgccgg cgccaagggc gccatcctga cgggcaagac cagcaacggc 1080 aactcgatct cctgactcga g 1101 <210> 46 <211> 369 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct <400> 46 Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp 1 5 10 15 Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu 20 25 30 Pro Val Arg Gly Arg Ala Gln Leu Pro Asp Trp Ser Met Leu Leu Ala 35 40 45 Ala Ile Thr Thr Leu Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu 50 55 60 Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu 65 70 75 80 Gly Arg Phe Val Gln Asp Gly Leu Val Phe Arg Asn Asn Phe Ser Ile 85 90 95 Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu 100 105 110 Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Val Gly 115 120 125 Leu Leu Glu Asp Gly Leu Gly Ser Thr Arg Glu Met Ser Leu Arg Asn 130 135 140 Leu Ile Trp Val Val Thr Lys Met Gln Val Ala Val Asp Arg Tyr Pro 145 150 155 160 Thr Trp Gly Asp Glu Val Gln Val Ser Ser Trp Ala Thr Ala Ile Gly 165 170 175 Lys Asn Gly Met Arg Arg Glu Trp Ile Val Thr Asp Phe Arg Thr Gly 180 185 190 Glu Thr Leu Leu Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Leu 195 200 205 Thr Arg Arg Ile Ser Lys Ile Pro Glu Glu Val Trp His Glu Ile Gly 210 215 220 Pro Ser Phe Ile Asp Ala Pro Pro Leu Pro Thr Val Glu Asp Asp Gly 225 230 235 240 Arg Lys Leu Thr Arg Phe Asp Glu Ser Ser Ala Asp Phe Ile Arg Lys 245 250 255 Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Ile Asn Gln His Val Asn 260 265 270 Asn Val Lys Tyr Ile Gly Trp Leu Leu Glu Ser Ala Pro Pro Glu Ile 275 280 285 His Glu Ser His Glu Ile Ala Ser Leu Thr Leu Glu Tyr Arg Arg Glu 290 295 300 Cys Gly Arg Asp Ser Val Leu Asn Ser Ala Thr Lys Val Ser Asp Ser 305 310 315 320 Ser Gln Leu Gly Lys Ser Ala Val Glu Cys Asn His Leu Val Arg Leu 325 330 335 Gln Asn Gly Gly Glu Ile Val Lys Gly Arg Thr Val Trp Arg Pro Lys 340 345 350 Arg Pro Leu Tyr Asn Asp Gly Ala Val Val Asp Val Pro Ala Lys Thr 355 360 365 Ser <210> 47 <211> 1122 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 47 actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60 cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120 cagctgcccg actggagcat gctgctggcc gcgatcacca ccctgttcct ggcggccgag 180 aagcagtgga tgatgctgga ctggaagccc aagcgccccg acatgctggt ggaccccttc 240 ggcctgggcc gcttcgtgca ggacggcctg gtgttccgca acaacttcag catccgcagc 300 tacgagatcg gcgcggaccg caccgccagc atcgagaccc tgatgaacca cctgcaggag 360 accgccctga accacgtgaa gagcgtgggc ctgctggagg acggcctggg cagcacccgc 420 gagatgagcc tgcgcaacct gatctgggtg gtgaccaaga tgcaggtggc ggtggaccgc 480 taccccacct ggggcgacga ggtgcaggtg agcagctggg cgaccgccat cggcaagaac 540 ggcatgcgcc gcgagtggat cgtgaccgac ttccgcaccg gcgagaccct gctgcgcgcc 600 accagcgtgt gggtgatgat gaacaagctg acccgccgca tcagcaagat ccccgaggag 660 gtgtggcacg agatcggccc cagcttcatc gacgcgcccc ccctgcccac cgtggaggac 720 gacggccgca agctgacccg cttcgacgag agcagcgccg acttcatccg caagggcctg 780 accccccgct ggagcgacct ggacatcaac cagcacgtga acaacgtgaa gtacatcggc 840 tggctgctgg agagcgcgcc ccccgagatc cacgagagcc acgagatcgc cagcctgacc 900 ctggagtacc gccgcgagtg cggccgcgac agcgtgctga acagcgccac caaggtgagc 960 gacagcagcc agctgggcaa gagcgccgtg gagtgcaacc acctggtgcg cctgcagaac 1020 ggcggcgaga tcgtgaaggg ccgcaccgtg tggcgcccca agcgccccct gtacaacgac 1080 ggcgccgtgg tggacgtgcc cgccaagacc agctgactcg ag 1122 <210> 48 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 48 actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60 acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120 <210> 49 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 49 actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60 cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120 <210> 50 <211> 6207 <212> DNA <213> Ulmus americana <400> 50 gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60 cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120 caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180 gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240 ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300 cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360 accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420 gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480 ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540 cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600 ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660 cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720 gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780 gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840 ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900 taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960 cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020 ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080 ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140 gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200 cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260 cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320 ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380 ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440 ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500 ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560 caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620 catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680 gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740 ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800 catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860 cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920 ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980 catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040 ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100 ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160 ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220 cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280 caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340 cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400 ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460 cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520 cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580 cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640 caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700 acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760 gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820 tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880 cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940 gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000 ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060 tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120 ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180 ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240 ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 3360 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 3420 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 3480 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 3540 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 3600 caacccgcaa acactagtat ggccaccgca tccactttct cggcgttcaa tgcccgctgc 3660 ggcgacctgc gtcgctcggc gggctccggg ccccggcgcc cagcgaggcc cctccccgtg 3720 cgcgggcgcg cccagctgcc cgactggagc atgctgctgg ccgcgatcac caccctgttc 3780 ctggcggccg agaagcagtg gatgatgctg gactggaagc ccaagcgccc cgacatgctg 3840 gtggacccct tcggcctggg ccgcttcgtg caggacggcc tggtgttccg caacaacttc 3900 agcatccgca gctacgagat cggcgcggac cgcaccgcca gcatcgagac cctgatgaac 3960 cacctgcagg agaccgccct gaaccacgtg aagagcgtgg gcctgctgga ggacggcctg 4020 ggcagcaccc gcgagatgag cctgcgcaac ctgatctggg tggtgaccaa gatgcaggtg 4080 gcggtggacc gctaccccac ctggggcgac gaggtgcagg tgagcagctg ggcgaccgcc 4140 atcggcaaga acggcatgcg ccgcgagtgg atcgtgaccg acttccgcac cggcgagacc 4200 ctgctgcgcg ccaccagcgt gtgggtgatg atgaacaagc tgacccgccg catcagcaag 4260 atccccgagg aggtgtggca cgagatcggc cccagcttca tcgacgcgcc ccccctgccc 4320 accgtggagg acgacggccg caagctgacc cgcttcgacg agagcagcgc cgacttcatc 4380 cgcaagggcc tgaccccccg ctggagcgac ctggacatca accagcacgt gaacaacgtg 4440 aagtacatcg gctggctgct ggagagcgcg ccccccgaga tccacgagag ccacgagatc 4500 gccagcctga ccctggagta ccgccgcgag tgcggccgcg acagcgtgct gaacagcgcc 4560 accaaggtga gcgacagcag ccagctgggc aagagcgccg tggagtgcaa ccacctggtg 4620 cgcctgcaga acggcggcga gatcgtgaag ggccgcaccg tgtggcgccc caagcgcccc 4680 ctgtacaacg acggcgccgt ggtggacgtg cccgccaaga ccagcgatga cgatgacaag 4740 ctgggatgac tcgagttaat taactcgagg cagcagcagc tcggatagta tcgacacact 4800 ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 4860 tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 4920 gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 4980 catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 5040 tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 5100 ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 5160 acacaaatgg aaagctgtag agctccttgt tttccagaag gagttgctcc ttgagccttt 5220 cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 5280 agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 5340 ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 5400 gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 5460 agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 5520 acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 5580 atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 5640 tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 5700 acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 5760 ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 5820 tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 5880 gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgttcgagct tgaagagcct 5940 ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 6000 tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 6060 gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 6120 ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 6180 ggcggtttgc gtattgggcg ctcttcc 6207 <210> 51 <211> 5576 <212> DNA <213> Cinnamomum camphora <400> 51 gaattcgccc tcccgtgatc acacaggtgc cttgcgagcg tgatcacact attttggggg 60 tcctacagta ctgaaatggt gagaagtcgt actgaaatca aggatgaaca atgaaaatgg 120 tgctgtggtg gcttctcaaa ggtcaagaat cagtcgctcg cgtcaggaaa tcgcggcgtc 180 aaccagcgtg ggcgcggtca gtggccccgc actggtcacc atagcctctc ctgccacagt 240 agcgatcccc tgggcgttca ctctcagcag cggctgtact gcctcccaga ttttcttctt 300 ctggacctgc gggcgtgaga ggatgagcag ggtgggccaa gggctcaatc ctgaacggcc 360 ctcattcggt ttccaatccc acaacacata cccacagcag gtcagaccac gcattccacc 420 atgcgcacca ataacgtgtc cttacctgat tgggtgtggc aggctccgtg gacaggagtg 480 cctcgtcccc cgcccagacc cgctcccccg tcacggcggc gtccgggacc cgcagcggct 540 ccaccgcggt gtgatccgcg ttggcggcgc agagcagcat cccagccgat ttgaccccgc 600 gcatgctccg aggcttgagg ttggccagca ccaccacccg ccggccgaca aggtcctcca 660 gggtcacgtg ccggaccagg ccactcacga tggtgcgagg gcccccctcc tcgccgaggt 720 cgatctgctc gacgtacaga ctgcgacatg cgtggcgagt ggtcatcaga aggaagcagg 780 tgtgcagaag gggcacgtgg ttggtattga gagtagccaa agctttgtgc caatcagaaa 840 gtcaacgcag ctgcctgcct ggctcgcgta caattccttt cttgcgctat gacacttcca 900 gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca ccgatgatgc 960 ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct ccagggcgag 1020 cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta ccaaagcata 1080 ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 1140 gctaaggggg cgcctcttcc cttcgtttca gtcacaaccc gcaaacggcg cgccatgctg 1200 ctgcaggcct tcctgttcct gctggccggc ttcgccgcca agatcagcgc ctccatgacg 1260 aacgagacgt ccgaccgccc cctggtgcac ttcaccccca acaagggctg gatgaacgac 1320 cccaacggcc tgtggtacga cgagaaggac gccaagtggc acctgtactt ccagtacaac 1380 ccgaacgaca ccgtctgggg gacgcccttg ttctggggcc acgccacgtc cgacgacctg 1440 accaactggg aggaccagcc catcgccatc gccccgaagc gcaacgactc cggcgccttc 1500 tccggctcca tggtggtgga ctacaacaac acctccggct tcttcaacga caccatcgac 1560 ccgcgccagc gctgcgtggc catctggacc tacaacaccc cggagtccga ggagcagtac 1620 atctcctaca gcctggacgg cggctacacc ttcaccgagt accagaagaa ccccgtgctg 1680 gccgccaact ccacccagtt ccgcgacccg aaggtcttct ggtacgagcc ctcccagaag 1740 tggatcatga ccgcggccaa gtcccaggac tacaagatcg agatctactc ctccgacgac 1800 ctgaagtcct ggaagctgga gtccgcgttc gccaacgagg gcttcctcgg ctaccagtac 1860 gagtgccccg gcctgatcga ggtccccacc gagcaggacc ccagcaagtc ctactgggtg 1920 atgttcatct ccatcaaccc cggcgccccg gccggcggct ccttcaacca gtacttcgtc 1980 ggcagcttca acggcaccca cttcgaggcc ttcgacaacc agtcccgcgt ggtggacttc 2040 ggcaaggact actacgccct gcagaccttc ttcaacaccg acccgaccta cgggagcgcc 2100 ctgggcatcg cgtgggcctc caactgggag tactccgcct tcgtgcccac caacccctgg 2160 cgctcctcca tgtccctcgt gcgcaagttc tccctcaaca ccgagtacca ggccaacccg 2220 gagacggagc tgatcaacct gaaggccgag ccgatcctga acatcagcaa cgccggcccc 2280 tggagccggt tcgccaccaa caccacgttg acgaaggcca acagctacaa cgtcgacctg 2340 tccaacagca ccggcaccct ggagttcgag ctggtgtacg ccgtcaacac cacccagacg 2400 atctccaagt ccgtgttcgc ggacctctcc ctctggttca agggcctgga ggaccccgag 2460 gagtacctcc gcatgggctt cgaggtgtcc gcgtcctcct tcttcctgga ccgcgggaac 2520 agcaaggtga agttcgtgaa ggagaacccc tacttcacca accgcatgag cgtgaacaac 2580 cagcccttca agagcgagaa cgacctgtcc tactacaagg tgtacggctt gctggaccag 2640 aacatcctgg agctgtactt caacgacggc gacgtcgtgt ccaccaacac ctacttcatg 2700 accaccggga acgccctggg ctccgtgaac atgacgacgg gggtggacaa cctgttctac 2760 atcgacaagt tccaggtgcg cgaggtcaag tgattaatta actcgaggca gcagcagctc 2820 ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 2880 tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 2940 gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3000 catcccctcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 3060 ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 3120 tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 3180 gaagtagtgg gatgggaaca caaatggaaa gcttgagctc ctttcttgcg ctatgacact 3240 tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg 3300 atgcttcgac cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg 3360 cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag 3420 ccatattcaa acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc 3480 actccgctaa gggggcgcct cttcctcttc gtttcagtca caacccgcaa acactagtat 3540 gacgttcggg gtcgccctcc cggccatggg ccgcggtgtc tcccttcccc ggcccagggt 3600 cgcggtgcgc gcccagtcgg cgagtcaggt tttggagagc gggcgcgccc ccgactggtc 3660 catgctgttc gccgtgatca ccaccatctt ctccgccgcc gagaagcagt ggaccaacct 3720 ggagtggaag cccaagccca acccccccca gctgctggac gaccacttcg gcccccacgg 3780 cctggtgttc cgccgcacct tcgccatccg cagctacgag gtgggccccg accgctccac 3840 cagcatcgtg gccgtgatga accacctgca ggaggccgcc ctgaaccacg ccaagtccgt 3900 gggcatcctg ggcgacggct tcggcaccac cctggagatg tccaagcgcg acctgatctg 3960 ggtggtgaag cgcacccacg tggccgtgga gcgctacccc gcctggggcg acaccgtgga 4020 ggtggagtgc tgggtgggcg cctccggcaa caacggccgc cgccacgact tcctggtgcg 4080 cgactgcaag accggcgaga tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac 4140 ccgcacccgc cgcctgagca agatccccga ggaggtgcgc ggcgagatcg gccccgcctt 4200 catcgacaac gtggccgtga aggacgagga gatcaagaag ccccagaagc tgaacgactc 4260 caccgccgac tacatccagg gcggcctgac cccccgctgg aacgacctgg acatcaacca 4320 gcacgtgaac aacatcaagt acgtggactg gatcctggag accgtgcccg acagcatctt 4380 cgagagccac cacatctcct ccttcaccat cgagtaccgc cgcgagtgca ccatggacag 4440 cgtgctgcag tccctgacca ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga 4500 gcacctgctg cagctggagg gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc 4560 caagctgacc gactccttcc gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga 4620 ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 4680 caagtgactc gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 4740 tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 4800 caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctcttg 4860 tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4920 aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4980 gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5040 accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5100 gtacccgtac ccatcagcat ccgggtgaat cttggcctcc aagatatggc caatcctcac 5160 atccagcttg gcaaaatcga ctagactgtc tgcaagtggg aatgtggagc acaaggttgc 5220 ttgtagcgat cgacagactg gtggggtaca ttgacaggtg ggcagcgccg catccatcgt 5280 gcctgacgcg agcgccgccg gttgctcgcc cgtgcctgcc gtcaaagagc ggcagagaaa 5340 tcgggaaccg aaaacgtcac attgcctgat gttgttacat gctggactag actttcttgg 5400 cgtgggtctg ctcctcgcca ggtgcgcgac gcctcggggc tgggtgcgag ggagccgtgc 5460 ggccacgcat ttgacaagac ccaaagctcg catctcagac ggtcaaccgt tcgtattata 5520 cattcaacat atggtacata cgcaaaaagc atgccaacga tgacataggc gaattc 5576 <210> 52 <211> 4674 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 52 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240 gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300 ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360 ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420 aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480 ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540 atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600 cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660 atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720 aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780 gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840 ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900 atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960 ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020 atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080 ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140 gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200 gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260 gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320 ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380 tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440 ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500 tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560 gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620 atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagcttga gctc 4674 <210> 53 <211> 4656 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 53 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300 ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360 tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420 gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540 cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600 aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780 atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900 gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960 gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020 ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgactcg aggcagcagc agctcggata 4260 gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320 tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380 tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440 ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500 ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560 cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620 tagtgggatg ggaacacaaa tggaaagctt gagctc 4656 <210> 54 <211> 4635 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 54 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc 3240 ctgttcctgg cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac 3300 atgctggtgg accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac 3360 aacttcagca tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg 3420 atgaaccacc tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac 3480 ggcctgggca gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg 3540 caggtggcgg tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg 3600 accgccatcg gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc 3660 gagaccctgc tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc 3720 agcaagatcc ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc 3780 ctgcccaccg tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac 3840 ttcatccgca agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac 3900 aacgtgaagt acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac 3960 gagatcgcca gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac 4020 agcgccacca aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac 4080 ctggtgcgcc tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag 4140 cgccccctgt acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag cgatgacgat 4200 gacaagctgg gatgactcga ggcagcagca gctcggatag tatcgacaca ctctggacgc 4260 tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc 4320 gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct 4380 agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc 4440 ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc 4500 ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc 4560 aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat 4620 ggaaagcttg agctc 4635 <210> 55 <211> 997 <212> DNA <213> Prototheca moriformis <400> 55 cctgtcgatc gaagagaagg agacatgtgt acattattgg tgtgagggcg ctgaatcggc 60 cattttttaa aatgatcacg ctcatgccaa tagacgcggc acataacgac gttcaaaccc 120 ccgccaaagc cgcggacaac cccatccctc cacacccccc acacaaagaa cccgccaccg 180 cttaccttgc ccacgaggta ggcctttcgt tgcgcaaaac cggcctcggt gatgaatgca 240 tgcccgttcc tgacgagcgc tgcccgggcc aacacgctct tttgctgcgt ctcctcaggc 300 ttgggggcct ccttgggctt gggtgccgcc atgatctgcg cgcatcagag aaacgttgct 360 ggtaaaaagg agcgcccggc tgcgcaatat atatataggc atgccaacac agcccaacct 420 cactcgggag cccgtcccac cacccccaag tcgcgtgcct tgacggcata ctgctgcaga 480 agcttcatga gaatgatgcc gaacaagagg ggcacgagga cccaatcccg gacatccttg 540 tcgataatga tctcgtgagt ccccatcgtc cgcccgacgc tccggggagc ccgccgatgc 600 tcaagacgag agggccctcg accaggaggg gctggcccgg gcgggcactg gcgtcgaagg 660 tgcgcccgtc gttcgcctgc agtcctatgc cacaaaacaa gtcttctgac ggggtgcgtt 720 tgctcccgtg cgggcaggca acagaggtat tcaccctggt catggggaga tcggcgatcg 780 agctgggata agagatactt ctggcaagca atgacaactt gtcaggaccg gaccgtgcca 840 tatatttctc acctagcgcc gcaaaaccta acaatttggg agtcactgtg ccactgagtt 900 cgactggtag ctgaatggag tcgctgctcc actaaacgaa ttgtcagcac cgccagccgg 960 ccgaggaccc gagtcatagc gagggtagta gcgcgcc 997 <210> 56 <211> 753 <212> DNA <213> Prototheca moriformis <400> 56 actaattgca atcgtgcagt aatcatcgat atggtcacaa gtagatcccc tactgacacc 60 ctctcgtaca tgtaggcaat gtcatcggcg ccgtcctgct gaccgatgcc gacgtagcag 120 agcagacccg ggccgatctg ggatacgagc cggccctcca cctgcgctcg aggtggaatc 180 aagtaaataa ccaatacact tttcgacacc acacagagtt gcacggacgg tggcgtacct 240 ctacgctcgc gctcttcacg cgctggacga ccgcacgcat gagcccgggt ggcttggtct 300 gggctgcaaa aatgcacaac aaacaagtat cagacgctca tggatgcaca cgcgctccca 360 agcacgctca gactaaatat tacagtagct cgtatctgat aagatatcga gacataccgc 420 tcaactcacc cgcaaactgc gccccgccag gtgatgcgca cagggcccca ccatgcgatc 480 catcgcatcg ctcctcgagg gcgctatcac gtggccggag agcgttcaca gcgtacgcca 540 ctgtatctgg gcggtatgcg gtccgtcaac atggagacag atacccgcac caccaccttg 600 caagctcttc catattggaa gtagaaaatt gtaattgtat catcgcacga ggggccaact 660 tgccgtcggc gagctgggcg acgaacacca cctggacgtt gtcgagactc gctcgtgccg 720 tgcgccgggc cgctgggtat ccagaccgtc gcc 753 <210> 57 <211> 1122 <212> DNA <213> Prototheca moriformis <400> 57 caacgacaac cagcaggcaa ctcggtcagc gacccaacac gcgagtcaaa ttgttgcgtg 60 ttcttgcctt gtctatttac tgtgatagca agactgtcgg tcagtcaata ccgcggtgcg 120 cacgtcgggg tgccaagcct agcagagcac gggacggctg gtgctgtgcg ccagctcagc 180 tcgcttcgcg accaattgta ggaccggcaa agtcaccaaa acatgccagc ggtgcgattc 240 aattggtcat gagctctaca aaattgtttt gtgcgtcgcg caggtatcca acggcgcggc 300 agagaaagtt tgacagctct cgatttcatc tcggaaaaat ggggagaatt tatgacacac 360 aagtgcgcag gcggcccagg cggccagcat attctggcgt gacctgggcc gcccacaaaa 420 tgcttggatg cactctaaaa taattatatt tgccatgaac aagggaagag ttaccgcacc 480 cagccctaga cttgggcgcc cgagcaaggt tacgtcaagc caccttcgcc catcgcccaa 540 ctccgtattc cccgacagcc gcacgtggcc ctcgccggaa tgaaccctga atcggcatca 600 cgccacgcgt tcgccaatcg ttccgctctc tggcttcatc ggcctgcgcc ttcacgtcgt 660 ggtcacgaca gtgcattcat acttccattt gcacctcggc acacactttt acgcatcgcc 720 tacccttgct gcggcagtct agggtcactt tgcagccatg ggacagtgct acaccaccgt 780 cggtgcgcaa agctatttca agtgaaccgt gggcggaaaa aaggaatgta cactgtctca 840 accgactcct acaattgttt accatgcaga tcagagctcg acggccatca tcgagcaggt 900 gtggggcctt ggtggcgcgg cgcggggccc cagggcgtcg caggcattga tggcactctg 960 agactttcgc acgcgcatga gggaccccat caagagaaga gtgtgtcttt atgtccccat 1020 tcatgatgat gtatcttgtg attgtcgcag tttggcaagt ttaaccggat cgccgctcca 1080 ggtgtggcgt ggcggatttt tctaggggtg cttgagcagt cg 1122 <210> 58 <211> 574 <212> DNA <213> Prototheca moriformis <400> 58 ggcccagggc cctgcggatg gcccacacca gatctagcct ctcttatgcc atgcccgcct 60 cgctgcccgt cgtatccccc cgccgatccg cgcgtagggg accgcggcct gacccacgcc 120 acgaaagagc tttgctcctc aatttctcgc caacagaacc gtatcaaacg ctcaacgcct 180 atcccgaaca atccgtattc acaccaaatc gagtataccg gactggtttg cctagtcttg 240 aaggaaatga tcccgtccat gctcggaagg gggagcgggc ggaggatcct actcatctct 300 gaaatgggat tggtccgaag atgggttggg caagcacgtg ccaaacccca gcgagttgct 360 gacgagcagg ctcatccaat cccccggcga atcctccctc acgccccgca tgcatacaag 420 tccctcccac acgccccctc ccatccattt tcgcctggtc cgaacgcgag cggcgtcgag 480 gcggaccact tgctccgcag cgccgtctgg gtctccaccc cacagcggct ttgctgccag 540 aggcaccccc cttgccccac ctcctcttgc agcc 574 <210> 59 <211> 1096 <212> DNA <213> Prototheca moriformis <400> 59 ccaggcaggc ggtagggttg ccgattgctt gagcgaattg gaagatataa ttttttgtgg 60 tgtccctgga cgctgtttgt ggcgctcctt tttggagaag attgcgtggg ggagctttcc 120 atgtaccacg cttccttctg aaaggattct ggccgagtcc tgatgagccc aaagaaaaca 180 cctgcctttc agtgctggca ctctgaaaac gtcaacagat gattatacat gtcacaaaag 240 gcagccgatt aggaacggga gctctggccg ttcgtttggc tgcctgggct gattgaagtg 300 atccaccctg ttcgaatgaa ggcggtcgag tcgaattatc gaccggagct gtcgggaagg 360 cgtccggggc agagtgaggt gctgcggcct ggttgtcgtt caaaaagacc ccggtagccc 420 aacaatcacg aacgaaagga atataattgc ttgcatacta tacattcagt ttctatgtgg 480 cgggtagaca agtctcatgg gcttctaaag gctgtccctt gaaggctact tataaaaact 540 tgctgcgcca tggcacggat cgcgcttgcg caggctgcaa ccctgcgcgc aaggtcaaat 600 acacagcaaa agatactaac agaatttcta aaaacattta aatatttgtt tcgaccagcc 660 aattgtggtc gtaggcacgc aaaagacttt gttttgcgcc caccgagcat ccacgctggc 720 agtcaagcca gtccgatgtg cattgcgtgg cagcatcgag gagcatcaaa aacctcgtgc 780 acgcttttct gtcaatcatc atcaaccact ccaccatgta tacccgatgc atcgcggtgc 840 gcagcgcgcc acgcgtccca gacccgccca aaaacccagc agcggcgaaa gcaaatcttc 900 acttgcccga aaccccgagc agcggcattc acacgtgggc gaaaacccca cttgccctaa 960 caggcgtatg tctgctgtca cgatgcctga caacggtatt atagatatac actgattaat 1020 gtttgagtgt gtgcgagtcg cgaatcagga atgaattgct agtaggcact ccgaccgggc 1080 gggggccgag ggacca 1096 <210> 60 <211> 1075 <212> DNA <213> Prototheca moriformis <400> 60 ggccgacagg acgcgcgtca aaggtgctgg gcgtgtatgc cctggtcggc aggtcgttgc 60 tgttgctgcg ctcgtggttc cgcaaccctg attttggcgt cttattctgg cgtggcaagc 120 gctgacgccc gcgagccggg ccggcggcga tgcggtgtct cacggctgcc gagctccaag 180 ggaggcaaga gcgcccggat cagctgaagg gctttacacg caaggtacag ccgctcctgc 240 aaggctgcgt ggtggacttg aacctgtagg tcctctgctg aagttcctcc actacctcac 300 caggcccagc agaccaaagc acaggctttt caggtccgtg tcatccactc taaaacactc 360 gactacgacc tactgatggc cctagattct tcatcaacaa tgcctgagac acttgctcag 420 aattgaaact ccctgaaggg accaccagag gccctgagtt gttccttccc cccgtggcga 480 gctgccagcc aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca 540 ggtcatggga ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc 600 taatcagcta tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt 660 gatccttcgt gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc 720 aactcgcgcg agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat 780 gcgcggcgcc tttcttgcga taatttatgc aatggactgc tctgcaaatt tctgggtctg 840 tcgccaaccc taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta 900 ccgactaccc taatatcagc ccggctgcct gacgccagcg tccacttttg cgtacacatt 960 ccattcgtgc ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt 1020 tcccgacctc cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1075 <210> 61 <211> 772 <212> DNA <213> Prototheca moriformis <400> 61 tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agagctcgac 60 tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 120 tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 180 gccagccagg ctgtacctgt gatcggggct ggcgggaaaa caggcttcgt gtgctcaggt 240 tatgggaggt gcaggacagc tcattaaacg ccaacaatcg cacaattcat ggcaagctaa 300 tcagttattt cccattaacg agctataatt gtcccaaaat tctggtctac cgggggtgat 360 ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc acatgcggtc gccgcgcaac 420 gcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 480 tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 540 ccaaccctag gatcagcggt gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 600 actgccctag tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 660 ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgatccc 720 caacctcctt attgttctgt cgacagagtg ggcccagagg ccggtcgcag cc 772 <210> 62 <211> 991 <212> DNA <213> Prototheca moriformis <400> 62 cgaaggggtc tgcatcgatt cgcgcggtct ggaggccagc gtgactgctc gcgaaaatgc 60 tctgccgtgt cgggctctgg ctggggcggc cagagatctc accgtgccac acgcaactgc 120 cgcactctgt gcccgccacc tggcgcgcac atgcgacctc ttccccgtca taccctctcc 180 tcatgtgatc tttccacacg agtgacgcag gtgcgcggag tggagggaat caggacgttt 240 tcaaggtacc tgctcgagcc gtaccaacag ctgccgcccg gcaaggaaga gatcgaggca 300 gagattgccc ggctggaggc ccggataacg gagctcaaga gcaagctgtc cgagtgagac 360 cgcccaggtg cacgtgtcga ctcgctatga catgtactcg acacaacatg aggaattcat 420 cgaatttgta ggaagcgggc attggtacgg gagtgggaaa gcgaaaaaac ctccctccgg 480 cagtgccatc tgccggagtc gaacgttgat agggttctcg tgacagggtg tgacctctca 540 gccttgcatc aattaaacgc tatagacatt atcagtaacc gtgaatcccg cattggatgc 600 cacccgcgcg accattgggg acctgcatta cagatctagg tgagatgaca gcgaggcaac 660 ttcggcccgc ggcccagctt gcggcgcacc aatattggtc acgggaagcc acacaccgac 720 cataaatgaa tacttgtaag ctatgtcaac cgatcaatgg cgtcgaaagt gtgccacgag 780 gatccatctg gcggggcggc gtggcgcaca agcgcagtcg caatttctcg gacccatctg 840 acctaggccc agcgccgcgg gagaaatccc cggcgggtcc tccacgcagt aaccctaatg 900 agtatcgagc gccgaccatt tacaccatcg cccccgaaat ccttccgaca ttattattat 960 cttttagatc ttggaacaga ctctgccaac c 991 <210> 63 <211> 1347 <212> DNA <213> Prototheca moriformis <400> 63 agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60 cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120 gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180 ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240 cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300 cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360 tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420 gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480 attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540 tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600 gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660 catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720 tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780 tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840 caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900 atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960 attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020 agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080 gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140 acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200 ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260 cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320 attttccagt cgtcagcgaa atcaagt 1347 <210> 64 <211> 1180 <212> DNA <213> Prototheca moriformis <400> 64 gatggtgggg tgtctgcctt gggctgggtg atggaggctg gtggtgcgcg ggtttcctga 60 tgcattctat ctacgcagtg tcatggtgtc cattccacac accagtacac ccttacacta 120 aggatccatc cctccttccc tcttcaggac tacatggacc ccacgagcta ccgaccgggc 180 tttctcaaaa acgtcaaggt catgtttgac atgcgggacg tggtggacga cgtgcaaggt 240 gcgtccggag tgcgcgcaaa tgagcaagtc gggcaatgtg tcggggtggg caccggggct 300 ggagatccgc gatccccgag aaaacgccgt accacccccc gcgctattcc ctcgattgcg 360 cgcagatgtg gtgaccgaca cgggggacaa cctggcggac atggggcgcc ggacctggaa 420 gcacgccaag tcgcacacgg ggaggctcgt gcagtccccc ccatcgtacc tcaagggtct 480 ctttggtcgc gatccaaagt acgctggtgg catggcatgc ccgaaatgaa catcatgtgt 540 gatctccgat tgccaatggc cacctccacg gaccaccttg caggcggaag cgcaatccag 600 ggcccgagcc tgacgaggac ggagactcct cgtccagcgc ggggtccccg acccgacgca 660 gcagccgacc cctgctaacc cggcaacgat cggaccagca accttgctgt agttccgatc 720 cgtgatgacg ggcattgccg ccgctcgatc cgctttgatg actgtctatt atttgcgcgg 780 agccccctcg gaaccctacc ccgctcttgc aagccccttg catcggagat cctcgtgcgc 840 ccgccatgac cccactggat tgcccaacat ccttctttat cgtgtaaaat gtgattcctc 900 ggctgcaatc gactggcctt cgcttctggc cccaagaggg ctcgaacgtg cggcagcgag 960 ggcgctgaca cacccaagcc ctagggcttt caacgtcggc tgccaggccg gataggggga 1020 tcgcctcctt tccaccaccc acctacgagg gattcgagtc ggcttccagc tcagctattc 1080 ggccgcgccc ccggccctgc agacgtcctc cagtttccga acaggtcgct ctcagaacac 1140 ctgccgcggc tgcgatacgg caggctctca aagcgtcgac 1180 <210> 65 <211> 1263 <212> DNA <213> Prototheca moriformis <400> 65 cgcgtggagc ggtgcgtgcg gatgccgcgc gcctgccaag gccttttgta tgcctggcct 60 gggaagtttc ctgactgaag catcttcaag atgctctctc acgaccagcg acaccaacac 120 cgtcactttt tgcccctcct gccgcaggtg ccactttcta ctttgacgtc ttctccaggc 180 ggtacattgc gggactgagc gccaattcgg ccaagaacag cgctgtcgac ttgaggaggc 240 aggggtccgt cgactctgcc gagtgacacg ccttcgaccc gactgtacta cggcctgctg 300 aagagtgggt ctcgccggcc ggcgtgaccg gccctgtgcc cacaatcgac catctattcg 360 ctccttgtca tctggcgccg tcaattgccc gcgacttgac ggcaactggc tcgatcgagt 420 cgtattgaaa aagcacgttt tgtcctacag ggccgcggtc cgttaccaac gtggttctcg 480 ttaggttttc gtcgggcggt ggtgcgcgaa ctgtccgatg ccatcccggc aaaccccagc 540 aaggtcgcca gtctggttct gacgcaatag agtgcgtttt gggccagtct aaaaattcgt 600 ctggcatgac gtggctccac atcgtacccg gagcctgcct tggtaatgtg aggcaccggt 660 gccaactcca ttatggcagg catcgagcgc gcaggtgagt acatgacctt ccgtgaattg 720 ggaaggcgag cttgtgtaac gcctgcgatc gtgccagtga ggcatcgtaa actcaaaata 780 ttttgtagaa agtgtctgat gcctggtgag gctgcgtagg gcaagggcaa gcccttggca 840 gatgggtaat gggtccggac ctcacaacag caaccccgcg tcccccttag ggcccctgag 900 gctcgatggc agggccagcg agcccgcggc caaagggcgc catcccacgg tcgcccaacg 960 actccacggg tcctatacct catcttgaat ggcactaaaa actatagaat atcgggcact 1020 ggtgggcgtc tggggtacag ctggccgagc gcagtggcaa accctaggtc ccgcctcaag 1080 ggcgattccc gggtcaatga cacgcaagca agatcacatg gcgcggtccg cctcgcggct 1140 ccacacccag gccctagttt cgcaacccat aaatatcgcc ccgataccat cataagccag 1200 caaataattt tttatcagag ttccaaacct cctcagctgt gggaaaccag cccactctga 1260 acg 1263 <210> 66 <211> 1400 <212> DNA <213> Prototheca moriformis <400> 66 ccgagcagtt catggccaag tacaaggact agagaccgga ggtcggtagg ctgaatggag 60 ctggcgtcgt cgtgcgcgac gtgcacgcga tgcgatacta cgaccccaca aacgcatgcc 120 tcccatcttg atgcctttcc ggccatttat actatttctc atttcgctgt aacatcttga 180 ataatagaat tgccctgtgt caagtggatt ccaagaaata ttctgtccca acaaaacaac 240 ccaacctgaa aacaacctca aataccacca gccctgccca cctgcccagt acacttttcc 300 aataccatct ccctaccttc acgcgcaagc ggcacccatg cgcgaccagg ctcgaaagga 360 tttcacgact caggacgagc gagtggcggc gcgaccgcct gcctgttcgt cacgtgccgt 420 acgtcggcga ccgctagagc tttgcctggc aacccccggc ttcgtcaacc cggccagcca 480 ggatctcgac cactctaccg cgaaatcgcc tcaagaagtc gccaaaagtg ccgtacacca 540 tgcttcgcag cgctgttcaa acttgatgcc aatcttgaca atcaggttgc tcgttggctg 600 cgtccacatc ggccgtgatt gcagcaggcg gggatcggac acggaggacg cggcgtcacg 660 ccgcgaacgc agcccgtaac tctacatcaa cgcgatatgt tgcgtaatcc cgcccggctg 720 cgcattgtga caacccattc gcgatggatg gtcggaaaat ggtgtgccaa ctgccctgag 780 ggactctctc gcgaaacggg cacgtccctg tatccgaaac tgtggcatgg ccttgtcgac 840 cacgcaagca cgtggaccct aacaccacga aaataagtaa aaaaggttga catcctctac 900 gagcgaattg tttgctcgac ccttcatcgc acactgtcat tataatgcat ctagctcggc 960 gacaagttta aaaaaggcag gctgcattat tccattttgc cgtggcggca tgggtgccca 1020 ttttatgagg tttgggctct tgggcagcga ccgagccagg ttgagtccct ctcgcccgtc 1080 gacaacgttc caaagcccat aagtggctaa taaacaactt gatggtacct gtacactgcc 1140 agttccttct tccccggccg aggtttacac gtgatggcca tggcttcgcg tttcaggctg 1200 acttcccatt ccgactttcc agagggtccg cggacgccgg gggttggctg cgtgaggccc 1260 accccttgtt ccccgcgtcc cgacaaacac aattgcgtta cataaggggg aagccgcccc 1320 ccgttcagag tgcaaacatc tttcattata tttttcagtc gtcagcgaaa tcaagtatgt 1380 cgctgacagg catgaaggcc 1400 <210> 67 <211> 6490 <212> DNA <213> Prototheca moriformis <400> 67 gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60 cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120 caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180 gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240 ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300 cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360 accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420 gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480 ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540 cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600 ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660 cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720 gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780 gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840 ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900 taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960 cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020 ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080 ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140 gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200 cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260 cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320 ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380 ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440 ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500 ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560 caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620 catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680 gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740 ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800 catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860 cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920 ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980 catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040 ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100 ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160 ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220 cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280 caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340 cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400 ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460 cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520 cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580 cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640 caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700 acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760 gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820 tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880 cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940 gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000 ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060 tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120 ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180 ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240 ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300 atcgaatttg taggaagcgg gcattggtac gggagtggga aagcgaaaaa acctccctcc 3360 ggcagtgcca tctgccggag tcgaacgttg atagggttct cgtgacaggg tgtgacctct 3420 cagccttgca tcaattaaac gctatagaca ttatcagtaa ccgtgaatcc cgcattggat 3480 gccacccgcg cgaccattgg ggacctgcat tacagatcta ggtgagatga cagcgaggca 3540 acttcggccc gcggcccagc ttgcggcgca ccaatattgg tcacgggaag ccacacaccg 3600 accataaatg aatacttgta agctatgtca accgatcaat ggcgtcgaaa gtgtgccacg 3660 aggatccatc tggcggggcg gcgtggcgca caagcgcagt cgcaatttct cggacccatc 3720 tgacctaggc ccagcgccgc gggagaaatc cccggcgggt cctccacgca gtaaccctaa 3780 tgagtatcga gcgccgacca tttacaccat cgccccccga aatccttccg acattattat 3840 tatcttttag atcttggaac agactctgcc aaccactagt atggccaccg catccacttt 3900 ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg gcgggctccg ggccccggcg 3960 cccagcgagg cccctccccg tgcgcgggcg cgcccccgac tggtccatgc tgttcgccgt 4020 gatcaccacc atcttctccg ccgccgagaa gcagtggacc aacctggagt ggaagcccaa 4080 gcccaacccc ccccagctgc tggacgacca cttcggcccc cacggcctgg tgttccgccg 4140 caccttcgcc atccgcagct acgaggtggg ccccgaccgc tccaccagca tcgtggccgt 4200 gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag tccgtgggca tcctgggcga 4260 cggcttcggc accaccctgg agatgtccaa gcgcgacctg atctgggtgg tgaagcgcac 4320 ccacgtggcc gtggagcgct accccgcctg gggcgacacc gtggaggtgg agtgctgggt 4380 gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg gtgcgcgact gcaagaccgg 4440 cgagatcctg acccgctgca cctccctgag cgtgatgatg aacacccgca cccgccgcct 4500 gagcaagatc cccgaggagg tgcgcggcga gatcggcccc gccttcatcg acaacgtggc 4560 cgtgaaggac gaggagatca agaagcccca gaagctgaac gactccaccg ccgactacat 4620 ccagggcggc ctgacccccc gctggaacga cctggacatc aaccagcacg tgaacaacat 4680 caagtacgtg gactggatcc tggagaccgt gcccgacagc atcttcgaga gccaccacat 4740 ctcctccttc accatcgagt accgccgcga gtgcaccatg gacagcgtgc tgcagtccct 4800 gaccaccgtg agcggcggct cctccgaggc cggcctggtg tgcgagcacc tgctgcagct 4860 ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg cgccccaagc tgaccgactc 4920 cttccgcggc atcagcgtga tccccgccga gtccagcgtg atggactaca aggaccacga 4980 cggcgactac aaggaccacg acatcgacta caaggacgac gacgacaagt gactcgagtt 5040 aattaactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 5100 gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 5160 aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 5220 tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 5280 aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 5340 gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5400 accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5460 tagagctcct tgttttccag aaggagttgc tccttgagcc tttcattctc agcctcgata 5520 acctccaaag ccgctctaat tgtggagggg gttcgaattt aaaagcttgg aatgttggtt 5580 cgtgcgtctg gaacaagccc agacttgttg ctcactggga aaaggaccat cagctccaaa 5640 aaacttgccg ctcaaaccgc gtacctctgc tttcgcgcaa tctgccctgt tgaaatcgcc 5700 accacattca tattgtgacg cttgagcagt ctgtaattgc ctcagaatgt ggaatcatct 5760 gccccctgtg cgagcccatg ccaggcatgt cgcgggcgag gacacccgcc actcgtacag 5820 cagaccatta tgctacctca caatagttca taacagtgac catatttctc gaagctcccc 5880 aacgagcacc tccatgctct gagtggccac cccccggccc tggtgcttgc ggagggcagg 5940 tcaaccggca tggggctacc gaaatccccg accggatccc accacccccg cgatgggaag 6000 aatctctccc cgggatgtgg gcccaccacc agcacaacct gctggcccag gcgagcgtca 6060 aaccatacca cacaaatatc cttggcatcg gccctgaatt ccttctgccg ctctgctacc 6120 cggtgcttct gtccgaagca ggggttgcta gggatcgctc cgagtccgca aacccttgtc 6180 gcgtggcggg gcttgttcga gcttgttcga gcttgaagag cctctagagt cgacctgcag 6240 gcatgcaagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 6300 cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 6360 agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 6420 gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 6480 gcgctcttcc 6490 <210> 68 <211> 20 <212> DNA <213> Cinnamomum camphora <400> 68 taccccgcct ggggcgacac 20 <210> 69 <211> 20 <212> DNA <213> Cinnamomum camphora <400> 69 cttgctcagg cggcgggtgc 20 <210> 70 <211> 20 <212> DNA <213> Prototheca moriformis <400> 70 ccggatctcg gccagggcta 20 <210> 71 <211> 20 <212> DNA <213> Prototheca moriformis <400> 71 tcgatgtcgt gcaccgtcgc 20 <210> 72 <211> 1092 <212> DNA <213> Prototheca moriformis <400> 72 gctcttcggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa gacgaacagg 60 cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat ccccgcgcac 120 tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat cgcggtcatg 180 tccctgctct acgtcgcgtc gacgtacatc gaccctgcgc cggtgcctac gtgggtcaag 240 tatggcgtca tgtggccgct ctactggttc ttccaggtgt gtgtgagggt tgtggttgcc 300 cgtatcgagg tcctggtggc gcgcatgggg gagaaggcgc ctgtcccgct gacccccccg 360 gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg tgcgcgcacg 420 agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg ggcctggtgt 480 tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccgc cgccaccact 540 ccaacacggg gtgcctggac aaggacgagg tgtttgtgcc gccgcaccgc gcagtggcgc 600 acgagggcct ggagtgggag gagtggctgc ccatccgcat gggcaaggtg ctggtcaccc 660 tgaccctggg ctggccgctg tacctcatgt tcaacgtcgc ctcgcggccg tacccgcgct 720 tcgccaacca ctttgacccg tggtcgccca tcttcagcaa gcgcgaggta ccctttcttg 780 cgctatgaca cttccagcaa aaggtagggc gggctgcgag acggcttccc ggcgctgcat 840 gcaacaccga tgatgcttcg accccccgaa gctccttcgg ggctgcatgg gcgctccgat 900 gccgctccag ggcgagcgct gtttaaatag ccaggccccc gattgcaaag acattatagc 960 gagctaccaa agccatattc aaacacctag atcactacca cttctacaca ggccactcga 1020 gcttgtgatc gcactccgct aagggggcgc ctcttcctct tcgtttcagt cacaacccgc 1080 aaacggcgcg cc 1092 <210> 73 <211> 1400 <212> DNA <213> Prototheca moriformis <400> 73 caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60 ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120 cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180 ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240 aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300 cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360 actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggagc atcgaggtgg 420 tcatctccga cctcgcgttg gtggcggtgc tcagcgggct cagcgtgctg ggccgcacca 480 tgggctgggc ctggctggtc aagacctacg tggtgcccta catgatcgtg aacatgtggc 540 tggtgctcat cacgctgctc cagcacacgc acccggccct gccgcactac ttcgagaagg 600 actgggactg gctacgcggc gccatggcca ccgtcgaccg ctccatgggc ccgcccttca 660 tggacagcat cctgcaccac atctccgaca cccacgtgct gcaccacctc ttcagcacca 720 tcccgcacta ccacgccgag gaggcctccg ccgccatccg gcccatcctg ggcaagtact 780 accaatccga cagccgctgg gtcggccgcg ccctgtggga ggactggcgc gactgccgct 840 acgtcgtccc cgacgcgccc gaggacgact ccgcgctctg gttccacaag tgagcgcgcc 900 tgcgcgagga cgcagaacaa cgctgccgcc gtgtcttttg cacgcgcgac tccggcgctt 960 cgctggtggc acccccataa agaaaccctc aattctgttt gtggaagaca cggtgtaccc 1020 ccacccaccc acctgcacct ctattattgg tattattgac gcgggagtgg gcgttgtacc 1080 ctacaacgta gcttctctag ttttcagctg gctcccacca ttgtaaagag cctctagagt 1140 cgacctgcag gcatgcaagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 1200 gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg 1260 gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 1320 cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 1380 tgcgtattgg gcgctcttcc 1400 <210> 74 <211> 4091 <212> DNA <213> Prototheca moriformis <400> 74 gctcttcggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa gacgaacagg 60 cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat ccccgcgcac 120 tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat cgcggtcatg 180 tccctgctct acgtcgcgtc gacgtacatc gaccctgcgc cggtgcctac gtgggtcaag 240 tatggcgtca tgtggccgct ctactggttc ttccaggtgt gtgtgagggt tgtggttgcc 300 cgtatcgagg tcctggtggc gcgcatgggg gagaaggcgc ctgtcccgct gacccccccg 360 gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg tgcgcgcacg 420 agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg ggcctggtgt 480 tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccgc cgccaccact 540 ccaacacggg gtgcctggac aaggacgagg tgtttgtgcc gccgcaccgc gcagtggcgc 600 acgagggcct ggagtgggag gagtggctgc ccatccgcat gggcaaggtg ctggtcaccc 660 tgaccctggg ctggccgctg tacctcatgt tcaacgtcgc ctcgcggccg tacccgcgct 720 tcgccaacca ctttgacccg tggtcgccca tcttcagcaa gcgcgaggta ccctttcttg 780 cgctatgaca cttccagcaa aaggtagggc gggctgcgag acggcttccc ggcgctgcat 840 gcaacaccga tgatgcttcg accccccgaa gctccttcgg ggctgcatgg gcgctccgat 900 gccgctccag ggcgagcgct gtttaaatag ccaggccccc gattgcaaag acattatagc 960 gagctaccaa agccatattc aaacacctag atcactacca cttctacaca ggccactcga 1020 gcttgtgatc gcactccgct aagggggcgc ctcttcctct tcgtttcagt cacaacccgc 1080 aaacggcgcg ccatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag 1140 atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac 1200 aagggctgga tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac 1260 ctgtacttcc agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac 1320 gccacgtccg acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc 1380 aacgactccg gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc 1440 ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg 1500 gagtccgagg agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac 1560 cagaagaacc ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg 1620 tacgagccct cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag 1680 atctactcct ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc 1740 ttcctcggct accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc 1800 agcaagtcct actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc 1860 ttcaaccagt acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag 1920 tcccgcgtgg tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac 1980 ccgacctacg ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc 2040 gtgcccacca acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc 2100 gagtaccagg ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac 2160 atcagcaacg ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac 2220 agctacaacg tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc 2280 gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag 2340 ggcctggagg accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc 2400 ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac 2460 cgcatgagcg tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg 2520 tacggcttgc tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc 2580 accaacacct acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg 2640 gtggacaacc tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca 2700 gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg 2760 ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt 2820 gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata 2880 ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct 2940 acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc 3000 ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg 3060 ctgatgcacg ggaagtagtg ggatgggaac acaaatggag catcgaggtg gtcatctccg 3120 acctcgcgtt ggtggcggtg ctcagcgggc tcagcgtgct gggccgcacc atgggctggg 3180 cctggctggt caagacctac gtggtgccct acatgatcgt gaacatgtgg ctggtgctca 3240 tcacgctgct ccagcacacg cacccggccc tgccgcacta cttcgagaag gactgggact 3300 ggctacgcgg cgccatggcc accgtcgacc gctccatggg cccgcccttc atggacagca 3360 tcctgcacca catctccgac acccacgtgc tgcaccacct cttcagcacc atcccgcact 3420 accacgccga ggaggcctcc gccgccatcc ggcccatcct gggcaagtac taccaatccg 3480 acagccgctg ggtcggccgc gccctgtggg aggactggcg cgactgccgc tacgtcgtcc 3540 ccgacgcgcc cgaggacgac tccgcgctct ggttccacaa gtgagcgcgc ctgcgcgagg 3600 acgcagaaca acgctgccgc cgtgtctttt gcacgcgcga ctccggcgct tcgctggtgg 3660 cacccccata aagaaaccct caattctgtt tgtggaagac acggtgtacc cccacccacc 3720 cacctgcacc tctattattg gtattattga cgcgggagtg ggcgttgtac cctacaacgt 3780 agcttctcta gttttcagct ggctcccacc attgtaaaga gcctctagag tcgacctgca 3840 ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 3900 tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 3960 gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 4020 tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4080 ggcgctcttc c 4091 <210> 75 <211> 510 <212> DNA <213> Prototheca moriformis <400> 75 gctcttccgc ctggagctgg tgcagagcat gggtcagttt gcggaggaga gggtgctccc 60 cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120 gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180 gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240 catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300 gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360 ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420 caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480 cttccaggag cgcgccacca agtaggtacc 510 <210> 76 <211> 1186 <212> DNA <213> Prototheca moriformis <400> 76 caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60 ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120 cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180 ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240 aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300 cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360 actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggaag gatcgtagag 420 ctccagccac ggcaacaccg cgcgcctggc ggccgagcac ggcgacaagg gcctgagcaa 480 gatctgcggg ctgatcgcca gcgacgaggg ccggcacgag atcgcctaca cgcgcatcgt 540 ggacgagttc ttccgcctcg accccgaggg cgccgtcgcc gcctacgcca acatgatgcg 600 caagcagatc accatgcccg cgcacctcat ggacgacatg ggccacggcg aggccaaccc 660 gggccgcaac ctcttcgccg acttctccgc cgtcgccgag aagatcgacg tctacgacgc 720 cgaggactac tgccgcatcc tggagcacct caacgcgcgc tggaaggtgg acgagcgcca 780 ggtcagcggc caggccgccg cggaccagga gtacgttctg ggcctgcccc agcgcttccg 840 gaaactcgcc gagaagaccg ccgccaagcg caagcgcgtc gcgcgcaggc ccgtcgcctt 900 ctcctggaga gaagagcctc tagagtcgac ctgcaggcat gcaagcttgg cgtaatcatg 960 gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 1020 cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 1080 gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 1140 cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttcc 1186 <210> 77 <211> 3615 <212> DNA <213> Prototheca moriformis <400> 77 gctcttccgc ctggagctgg tgcagagcat gggtcagttt gcggaggaga gggtgctccc 60 cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120 gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180 gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240 catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300 gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360 ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420 caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480 cttccaggag cgcgccacca agtaggtacc ctttcttgcg ctatgacact tccagcaaaa 540 ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac 600 cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt 660 ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa 720 acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa 780 gggggcgcct cttcctcttc gtttcagtca caacccgcaa acggcgcgcc atgctgctgc 840 aggccttcct gttcctgctg gccggcttcg ccgccaagat cagcgcctcc atgacgaacg 900 agacgtccga ccgccccctg gtgcacttca cccccaacaa gggctggatg aacgacccca 960 acggcctgtg gtacgacgag aaggacgcca agtggcacct gtacttccag tacaacccga 1020 acgacaccgt ctgggggacg cccttgttct ggggccacgc cacgtccgac gacctgacca 1080 actgggagga ccagcccatc gccatcgccc cgaagcgcaa cgactccggc gccttctccg 1140 gctccatggt ggtggactac aacaacacct ccggcttctt caacgacacc atcgacccgc 1200 gccagcgctg cgtggccatc tggacctaca acaccccgga gtccgaggag cagtacatct 1260 cctacagcct ggacggcggc tacaccttca ccgagtacca gaagaacccc gtgctggccg 1320 ccaactccac ccagttccgc gacccgaagg tcttctggta cgagccctcc cagaagtgga 1380 tcatgaccgc ggccaagtcc caggactaca agatcgagat ctactcctcc gacgacctga 1440 agtcctggaa gctggagtcc gcgttcgcca acgagggctt cctcggctac cagtacgagt 1500 gccccggcct gatcgaggtc cccaccgagc aggaccccag caagtcctac tgggtgatgt 1560 tcatctccat caaccccggc gccccggccg gcggctcctt caaccagtac ttcgtcggca 1620 gcttcaacgg cacccacttc gaggccttcg acaaccagtc ccgcgtggtg gacttcggca 1680 aggactacta cgccctgcag accttcttca acaccgaccc gacctacggg agcgccctgg 1740 gcatcgcgtg ggcctccaac tgggagtact ccgccttcgt gcccaccaac ccctggcgct 1800 cctccatgtc cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc aacccggaga 1860 cggagctgat caacctgaag gccgagccga tcctgaacat cagcaacgcc ggcccctgga 1920 gccggttcgc caccaacacc acgttgacga aggccaacag ctacaacgtc gacctgtcca 1980 acagcaccgg caccctggag ttcgagctgg tgtacgccgt caacaccacc cagacgatct 2040 ccaagtccgt gttcgcggac ctctccctct ggttcaaggg cctggaggac cccgaggagt 2100 acctccgcat gggcttcgag gtgtccgcgt cctccttctt cctggaccgc gggaacagca 2160 aggtgaagtt cgtgaaggag aacccctact tcaccaaccg catgagcgtg aacaaccagc 2220 ccttcaagag cgagaacgac ctgtcctact acaaggtgta cggcttgctg gaccagaaca 2280 tcctggagct gtacttcaac gacggcgacg tcgtgtccac caacacctac ttcatgacca 2340 ccgggaacgc cctgggctcc gtgaacatga cgacgggggt ggacaacctg ttctacatcg 2400 acaagttcca ggtgcgcgag gtcaagtgac aattggcagc agcagctcgg atagtatcga 2460 cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg ccttgacctg 2520 tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc 2580 ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca tccccttccc 2640 tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc tatccctcag 2700 cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct ccgcctgtat 2760 tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg aagtagtggg 2820 atgggaacac aaatggaagg atcgtagagc tccagccacg gcaacaccgc gcgcctggcg 2880 gccgagcacg gcgacaaggg cctgagcaag atctgcgggc tgatcgccag cgacgagggc 2940 cggcacgaga tcgcctacac gcgcatcgtg gacgagttct tccgcctcga ccccgagggc 3000 gccgtcgccg cctacgccaa catgatgcgc aagcagatca ccatgcccgc gcacctcatg 3060 gacgacatgg gccacggcga ggccaacccg ggccgcaacc tcttcgccga cttctccgcc 3120 gtcgccgaga agatcgacgt ctacgacgcc gaggactact gccgcatcct ggagcacctc 3180 aacgcgcgct ggaaggtgga cgagcgccag gtcagcggcc aggccgccgc ggaccaggag 3240 tacgttctgg gcctgcccca gcgcttccgg aaactcgccg agaagaccgc cgccaagcgc 3300 aagcgcgtcg cgcgcaggcc cgtcgccttc tcctggagag aagagcctct agagtcgacc 3360 tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 3420 ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 3480 taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 3540 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 3600 attgggcgct cttcc 3615 <210> 78 <211> 511 <212> DNA <213> Prototheca moriformis <400> 78 gctcttcccg cctggagctg gtgcagagca tggggcagtt tgcggaggag agggtgctcc 60 ccgtgctgca ccccgtggac aagctgtggc agccgcagga cttcctgccc gaccccgagt 120 cgcccgactt cgaggaccag gtggcggagc tgcgcgcgcg cgccaaggac ctgcccgacg 180 agtactttgt ggtgctggtg ggcgacatga tcacggagga ggcgctgccg acctacatgg 240 ccatgctcaa caccttggac ggtgtgcgcg acgacacggg cgcggctgac cacccgtggg 300 cgcgctggac gcggcagtgg gtggccgagg agaaccggca cggcgacctg ctgaacaagt 360 actgttggct gacggggcgc gtcaacatgc gggccgtgga ggtgaccatc aacaacctga 420 tcaagagcgg catgaacccg cagacggaca acaaccctta cttgggcttc gtctacacct 480 ccttccagga gcgcgccacc aagtaggtac c 511 <210> 79 <211> 761 <212> DNA <213> Prototheca moriformis <400> 79 cagccacggc aacaccgcgc gccttgcggc cgagcacggc gacaagaacc tgagcaagat 60 ctgcgggctg atcgccagcg acgagggccg gcacgagatc gcctacacgc gcatcgtgga 120 cgagttcttc cgcctcgacc ccgagggcgc cgtcgccgcc tacgccaaca tgatgcgcaa 180 gcagatcacc atgcccgcgc acctcatgga cgacatgggc cacggcgagg ccaacccggg 240 ccgcaacctc ttcgccgact tctccgcggt cgccgagaag atcgacgtct acgacgccga 300 ggactactgc cgcatcctgg agcacctcaa cgcgcgctgg aaggtggacg agcgccaggt 360 cagcggccag gccgccgcgg accaggagta cgtcctgggc ctgccccagc gcttccggaa 420 actcgccgag aagaccgccg ccaagcgcaa gcgcgtcgcg cgcaggcccg tcgccttctc 480 ctggagaaga gcctctagag tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat 540 agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 600 gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 660 gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 720 aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc c 761 <210> 80 <211> 3599 <212> DNA <213> Prototheca moriformis <400> 80 gctcttcccg cctggagctg gtgcagagca tggggcagtt tgcggaggag agggtgctcc 60 ccgtgctgca ccccgtggac aagctgtggc agccgcagga cttcctgccc gaccccgagt 120 cgcccgactt cgaggaccag gtggcggagc tgcgcgcgcg cgccaaggac ctgcccgacg 180 agtactttgt ggtgctggtg ggcgacatga tcacggagga ggcgctgccg acctacatgg 240 ccatgctcaa caccttggac ggtgtgcgcg acgacacggg cgcggctgac cacccgtggg 300 cgcgctggac gcggcagtgg gtggccgagg agaaccggca cggcgacctg ctgaacaagt 360 actgttggct gacggggcgc gtcaacatgc gggccgtgga ggtgaccatc aacaacctga 420 tcaagagcgg catgaacccg cagacggaca acaaccctta cttgggcttc gtctacacct 480 ccttccagga gcgcgccacc aagtaggtac cctttcttgc gctatgacac ttccagcaaa 540 aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat gatgcttcga 600 ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg gcgagcgctg 660 tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa gccatattca 720 aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg cactccgcta 780 agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacggcgcgc catgctgctg 840 caggccttcc tgttcctgct ggccggcttc gccgccaaga tcagcgcctc catgacgaac 900 gagacgtccg accgccccct ggtgcacttc acccccaaca agggctggat gaacgacccc 960 aacggcctgt ggtacgacga gaaggacgcc aagtggcacc tgtacttcca gtacaacccg 1020 aacgacaccg tctgggggac gcccttgttc tggggccacg ccacgtccga cgacctgacc 1080 aactgggagg accagcccat cgccatcgcc ccgaagcgca acgactccgg cgccttctcc 1140 ggctccatgg tggtggacta caacaacacc tccggcttct tcaacgacac catcgacccg 1200 cgccagcgct gcgtggccat ctggacctac aacaccccgg agtccgagga gcagtacatc 1260 tcctacagcc tggacggcgg ctacaccttc accgagtacc agaagaaccc cgtgctggcc 1320 gccaactcca cccagttccg cgacccgaag gtcttctggt acgagccctc ccagaagtgg 1380 atcatgaccg cggccaagtc ccaggactac aagatcgaga tctactcctc cgacgacctg 1440 aagtcctgga agctggagtc cgcgttcgcc aacgagggct tcctcggcta ccagtacgag 1500 tgccccggcc tgatcgaggt ccccaccgag caggacccca gcaagtccta ctgggtgatg 1560 ttcatctcca tcaaccccgg cgccccggcc ggcggctcct tcaaccagta cttcgtcggc 1620 agcttcaacg gcacccactt cgaggccttc gacaaccagt cccgcgtggt ggacttcggc 1680 aaggactact acgccctgca gaccttcttc aacaccgacc cgacctacgg gagcgccctg 1740 ggcatcgcgt gggcctccaa ctgggagtac tccgccttcg tgcccaccaa cccctggcgc 1800 tcctccatgt ccctcgtgcg caagttctcc ctcaacaccg agtaccaggc caacccggag 1860 acggagctga tcaacctgaa ggccgagccg atcctgaaca tcagcaacgc cggcccctgg 1920 agccggttcg ccaccaacac cacgttgacg aaggccaaca gctacaacgt cgacctgtcc 1980 aacagcaccg gcaccctgga gttcgagctg gtgtacgccg tcaacaccac ccagacgatc 2040 tccaagtccg tgttcgcgga cctctccctc tggttcaagg gcctggagga ccccgaggag 2100 tacctccgca tgggcttcga ggtgtccgcg tcctccttct tcctggaccg cgggaacagc 2160 aaggtgaagt tcgtgaagga gaacccctac ttcaccaacc gcatgagcgt gaacaaccag 2220 cccttcaaga gcgagaacga cctgtcctac tacaaggtgt acggcttgct ggaccagaac 2280 atcctggagc tgtacttcaa cgacggcgac gtcgtgtcca ccaacaccta cttcatgacc 2340 accgggaacg ccctgggctc cgtgaacatg acgacggggg tggacaacct gttctacatc 2400 gacaagttcc aggtgcgcga ggtcaagtga caattggcag cagcagctcg gatagtatcg 2460 acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 2520 gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 2580 cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 2640 ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 2700 gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 2760 ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 2820 gatgggaaca caaatggaca gccacggcaa caccgcgcgc cttgcggccg agcacggcga 2880 caagaacctg agcaagatct gcgggctgat cgccagcgac gagggccggc acgagatcgc 2940 ctacacgcgc atcgtggacg agttcttccg cctcgacccc gagggcgccg tcgccgccta 3000 cgccaacatg atgcgcaagc agatcaccat gcccgcgcac ctcatggacg acatgggcca 3060 cggcgaggcc aacccgggcc gcaacctctt cgccgacttc tccgcggtcg ccgagaagat 3120 cgacgtctac gacgccgagg actactgccg catcctggag cacctcaacg cgcgctggaa 3180 ggtggacgag cgccaggtca gcggccaggc cgccgcggac caggagtacg tcctgggcct 3240 gccccagcgc ttccggaaac tcgccgagaa gaccgccgcc aagcgcaagc gcgtcgcgcg 3300 caggcccgtc gccttctcct ggagaagagc ctctagagtc gacctgcagg catgcaagct 3360 tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 3420 acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 3480 tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 3540 tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttcc 3599 <210> 81 <211> 2933 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 81 agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60 cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120 gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180 ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240 cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300 cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360 tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420 gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480 attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540 tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600 gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660 catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720 tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780 tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840 caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900 atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960 attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020 agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080 gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140 acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200 ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260 cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320 attttccagt cgtcagcgaa atcaagtact agtatggcca ccgcatccac tttctcggcg 1380 ttcaatgccc gctgcggcga cctgcgtcgc tcggcgggct ccgggccccg gcgcccagcg 1440 aggcccctcc ccgtgcgcgg gcgcgccccc gactggtcca tgctgttcgc cgtgatcacc 1500 accatcttct ccgccgccga gaagcagtgg accaacctgg agtggaagcc caagcccaac 1560 cccccccagc tgctggacga ccacttcggc ccccacggcc tggtgttccg ccgcaccttc 1620 gccatccgca gctacgaggt gggccccgac cgctccacca gcatcgtggc cgtgatgaac 1680 cacctgcagg aggccgccct gaaccacgcc aagtccgtgg gcatcctggg cgacggcttc 1740 ggcaccaccc tggagatgtc caagcgcgac ctgatctggg tggtgaagcg cacccacgtg 1800 gccgtggagc gctaccccgc ctggggcgac accgtggagg tggagtgctg ggtgggcgcc 1860 tccggcaaca acggccgccg ccacgacttc ctggtgcgcg actgcaagac cggcgagatc 1920 ctgacccgct gcacctccct gagcgtgatg atgaacaccc gcacccgccg cctgagcaag 1980 atccccgagg aggtgcgcgg cgagatcggc cccgccttca tcgacaacgt ggccgtgaag 2040 gacgaggaga tcaagaagcc ccagaagctg aacgactcca ccgccgacta catccagggc 2100 ggcctgaccc cccgctggaa cgacctggac atcaaccagc acgtgaacaa catcaagtac 2160 gtggactgga tcctggagac cgtgcccgac agcatcttcg agagccacca catctcctcc 2220 ttcaccatcg agtaccgccg cgagtgcacc atggacagcg tgctgcagtc cctgaccacc 2280 gtgagcggcg gctcctccga ggccggcctg gtgtgcgagc acctgctgca gctggagggc 2340 ggcagcgagg tgctgcgcgc caagaccgag tggcgcccca agctgaccga ctccttccgc 2400 ggcatcagcg tgatccccgc cgagtccagc gtgatggact acaaggacca cgacggcgac 2460 tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgactcga gttaattaac 2520 tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 2580 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2640 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2700 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2760 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2820 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2880 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag ctt 2933 <210> 82 <211> 726 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 82 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacc 726 <210> 83 <211> 3635 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 83 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300 caacccgcaa actctagaat atcaatgatc gagcaggacg gcctccacgc cggctccccc 360 gccgcctggg tggagcgcct gttcggctac gactgggccc agcagaccat cggctgctcc 420 gacgccgccg tgttccgcct gtccgcccag ggccgccccg tgctgttcgt gaagaccgac 480 ctgtccggcg ccctgaacga gctgcaggac gaggccgccc gcctgtcctg gctggccacc 540 accggcgtgc cctgcgccgc cgtgctggac gtggtgaccg aggccggccg cgactggctg 600 ctgctgggcg aggtgcccgg ccaggacctg ctgtcctccc acctggcccc cgccgagaag 660 gtgtccatca tggccgacgc catgcgccgc ctgcacaccc tggaccccgc cacctgcccc 720 ttcgaccacc aggccaagca ccgcatcgag cgcgcccgca cccgcatgga ggccggcctg 780 gtggaccagg acgacctgga cgaggagcac cagggcctgg cccccgccga gctgttcgcc 840 cgcctgaagg cccgcatgcc cgacggcgag gacctggtgg tgacccacgg cgacgcctgc 900 ctgcccaaca tcatggtgga gaacggccgc ttctccggct tcatcgactg cggccgcctg 960 ggcgtggccg accgctacca ggacatcgcc ctggccaccc gcgacatcgc cgaggagctg 1020 ggcggcgagt gggccgaccg cttcctggtg ctgtacggca tcgccgcccc cgactcccag 1080 cgcatcgcct tctaccgcct gctggacgag ttcttctgac aattggcagc agcagctcgg 1140 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 1200 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 1260 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 1320 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 1380 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 1440 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 1500 aagtagtggg atgggaacac aaatggagga tcccgcgtct cgaacagagc gcgcagagga 1560 acgctgaagg tctcgcctct gtcgcacctc agcgcggcat acaccacaat aaccacctga 1620 cgaatgcgct tggttcttcg tccattagcg aagcgtccgg ttcacacacg tgccacgttg 1680 gcgaggtggc aggtgacaat gatcggtgga gctgatggtc gaaacgttca cagcctaggg 1740 atatcgaatt cctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga 1800 cggcttcccg gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg 1860 gctgcatggg cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg 1920 attgcaaaga cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac 1980 ttctacacag gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt 2040 cgtttcagtc acaacccgca aacactagta tggccaccgc atccactttc tcggcgttca 2100 atgcccgctg cggcgacctg cgtcgctcgg cgggctccgg gccccggcgc ccagcgaggc 2160 ccctccccgt gcgcgggcgc gcccccgact ggtccatgct gttcgccgtg atcaccacca 2220 tcttctccgc cgccgagaag cagtggacca acctggagtg gaagcccaag cccaaccccc 2280 cccagctgct ggacgaccac ttcggccccc acggcctggt gttccgccgc accttcgcca 2340 tccgcagcta cgaggtgggc cccgaccgct ccaccagcat cgtggccgtg atgaaccacc 2400 tgcaggaggc cgccctgaac cacgccaagt ccgtgggcat cctgggcgac ggcttcggca 2460 ccaccctgga gatgtccaag cgcgacctga tctgggtggt gaagcgcacc cacgtggccg 2520 tggagcgcta ccccgcctgg ggcgacaccg tggaggtgga gtgctgggtg ggcgcctccg 2580 gcaacaacgg ccgccgccac gacttcctgg tgcgcgactg caagaccggc gagatcctga 2640 cccgctgcac ctccctgagc gtgatgatga acacccgcac ccgccgcctg agcaagatcc 2700 ccgaggaggt gcgcggcgag atcggccccg ccttcatcga caacgtggcc gtgaaggacg 2760 aggagatcaa gaagccccag aagctgaacg actccaccgc cgactacatc cagggcggcc 2820 tgaccccccg ctggaacgac ctggacatca accagcacgt gaacaacatc aagtacgtgg 2880 actggatcct ggagaccgtg cccgacagca tcttcgagag ccaccacatc tcctccttca 2940 ccatcgagta ccgccgcgag tgcaccatgg acagcgtgct gcagtccctg accaccgtga 3000 gcggcggctc ctccgaggcc ggcctggtgt gcgagcacct gctgcagctg gagggcggca 3060 gcgaggtgct gcgcgccaag accgagtggc gccccaagct gaccgactcc ttccgcggca 3120 tcagcgtgat ccccgccgag tccagcgtga tggactacaa ggaccacgac ggcgactaca 3180 aggaccacga catcgactac aaggacgacg acgacaagtg actcgaggca gcagcagctc 3240 ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 3300 tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 3360 gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3420 catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 3480 gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 3540 ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 3600 ggaagtagtg ggatgggaac acaaatggaa agctt 3635 <210> 84 <211> 749 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 84 gagctccttg ttttccagaa ggagttgctc cttgagcctt tcattctcag cctcgataac 60 ctccaaagcc gctctaattg tggagggggt tcgaatttaa aagcttggaa tgttggttcg 120 tgcgtctgga acaagcccag acttgttgct cactgggaaa aggaccatca gctccaaaaa 180 acttgccgct caaaccgcgt acctctgctt tcgcgcaatc tgccctgttg aaatcgccac 240 cacattcata ttgtgacgct tgagcagtct gtaattgcct cagaatgtgg aatcatctgc 300 cccctgtgcg agcccatgcc aggcatgtcg cgggcgagga cacccgccac tcgtacagca 360 gaccattatg ctacctcaca atagttcata acagtgacca tatttctcga agctccccaa 420 cgagcacctc catgctctga gtggccaccc cccggccctg gtgcttgcgg agggcaggtc 480 aaccggcatg gggctaccga aatccccgac cggatcccac cacccccgcg atgggaagaa 540 tctctccccg ggatgtgggc ccaccaccag cacaacctgc tggcccaggc gagcgtcaaa 600 ccataccaca caaatatcct tggcatcggc cctgaattcc ttctgccgct ctgctacccg 660 gtgcttctgt ccgaagcagg ggttgctagg gatcgctccg agtccgcaaa cccttgtcgc 720 gtggcggggc ttgttcgagc ttgaagagc 749 <210> 85 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> synthesized primer <400> 85 ggaggaattc ggccgacagg acgcgcgtca 30 <210> 86 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> synthesized primer <400> 86 ggagactagt ggctgcgacc ggcctgtg 28 <210> 87 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> synthesized primer <400> 87 ggaggaattc tcaccagcgg acaaagcacc g 31 <210> 88 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthesized primer <400> 88 ggagactagt ggctgcgacc ggcctctgg 29 <210> 89 <211> 1065 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 89 ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 60 tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 120 ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 180 gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 240 aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 300 cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 360 tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 420 ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 480 aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 540 ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 600 tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 660 gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 720 agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 780 ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 840 taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 900 taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 960 ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 1020 cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1065 <210> 90 <211> 6981 <212> DNA <213> Cinnamomum camphora <400> 90 gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60 cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120 caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180 gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240 ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300 cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360 accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420 gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480 ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540 cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600 ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660 cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720 gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780 gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840 ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900 taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960 cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020 ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080 ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140 gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200 cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260 cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320 ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380 ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440 ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500 ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560 caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620 catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680 gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740 ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800 catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860 cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920 ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980 catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040 ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100 ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160 ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220 cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280 caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340 cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400 ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460 cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520 cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580 cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640 caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700 acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760 gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820 tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880 cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940 gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000 ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060 tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120 ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180 ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240 ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300 ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 3360 tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 3420 ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 3480 gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 3540 aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 3600 cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 3660 tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 3720 ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 3780 aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 3840 ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 3900 tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 3960 gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 4020 agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 4080 ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 4140 taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 4200 taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 4260 ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 4320 cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag tatggccacc 4380 gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4440 gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4500 ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4560 tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4620 gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4680 atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 4740 atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 4800 gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 4860 gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 4920 tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 4980 acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5040 gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5100 gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5160 gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5220 agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5280 ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5340 ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5400 ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5460 aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5520 tgactcgagt taattaactc gaggcagcag cagctcggat agtatcgaca cactctggac 5580 gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 5640 ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 5700 ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 5760 gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 5820 tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 5880 gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5940 atggaaagct gtagagctcc ttgttttcca gaaggagttg ctccttgagc ctttcattct 6000 cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 6060 gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 6120 tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 6180 ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 6240 tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 6300 cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 6360 cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 6420 cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 6480 gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 6540 ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 6600 gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 6660 aaacccttgt cgcgtggcgg ggcttgttcg agcttgttcg agcttgaaga gcctctagag 6720 tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 6780 tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 6840 ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 6900 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 6960 ttgcgtattg ggcgctcttc c 6981 <210> 91 <211> 1152 <212> DNA <213> Cinnamomum camphora <400> 91 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120 tggtccatgc tgttcgccgt gatcaccacc atcttctccg ccgccgagaa gcagtggacc 180 aacctggagt ggaagcccaa gcccaacccc ccccagctgc tggacgacca cttcggcccc 240 cacggcctgg tgttccgccg caccttcgcc atccgcagct acgaggtggg ccccgaccgc 300 tccaccagca tcgtggccgt gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag 360 tccgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420 atctgggtgg tgaagcgcac ccacgtggcc gtggagcgct accccgcctg gggcgacacc 480 gtggaggtgg agtgctgggt gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg 540 gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgatgatg 600 aacacccgca cccgccgcct gagcaagatc cccgaggagg tgcgcggcga gatcggcccc 660 gccttcatcg acaacgtggc cgtgaaggac gaggagatca agaagcccca gaagctgaac 720 gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacatc 780 aaccagcacg tgaacaacat caagtacgtg gactggatcc tggagaccgt gcccgacagc 840 atcttcgaga gccaccacat ctcctccttc accatcgagt accgccgcga gtgcaccatg 900 gacagcgtgc tgcagtccct gaccaccgtg agcggcggct cctccgaggc cggcctggtg 960 tgcgagcacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg 1020 cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gtccagcgtg 1080 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140 gacgacaagt ga 1152 <210> 92 <211> 1052 <212> DNA <213> Umbellularia californica <400> 92 ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc agcgccgccg 60 agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag ctgctggacg 120 accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc tcctacgagg 180 tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag gaggccaccc 240 tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc ctggagatgt 300 ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag cgctacccca 360 cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac aacggcatgc 420 gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc tgcacctccc 480 tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac gaggtgcgcg 540 gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag atcaagaagc 600 tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc ccccgctgga 660 acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg gtgttcgaga 720 ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg gagtaccgcc 780 gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc ggcagctccg 840 aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag gtgctgcgcg 900 cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc gtgatccccg 960 ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac cacgacatcg 1020 actacaagga cgacgacgac aagtgactcg ag 1052 <210> 93 <211> 1031 <212> DNA <213> Ulmus americana <400> 93 ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc ctgttcctgg 60 cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac atgctggtgg 120 accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac aacttcagca 180 tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg atgaaccacc 240 tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac ggcctgggca 300 gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg caggtggcgg 360 tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg accgccatcg 420 gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc gagaccctgc 480 tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc agcaagatcc 540 ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc ctgcccaccg 600 tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac ttcatccgca 660 agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac aacgtgaagt 720 acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac gagatcgcca 780 gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac agcgccacca 840 aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac ctggtgcgcc 900 tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag cgccccctgt 960 acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag cgatgacgat gacaagctgg 1020 gatgactcga g 1031 <210> 94 <211> 1182 <212> DNA <213> Cuphea hookeriana <400> 94 actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60 acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120 cagctgcccg actggagccg cctgctgacc gccatcacca ccgtgttcgt gaagtccaag 180 cgccccgaca tgcacgaccg caagtccaag cgccccgaca tgctggtgga cagcttcggc 240 ctggagtcca ccgtgcagga cggcctggtg ttccgccagt ccttctccat ccgctcctac 300 gagatcggca ccgaccgcac cgccagcatc gagaccctga tgaaccacct gcaggagacc 360 tccctgaacc actgcaagag caccggcatc ctgctggacg gcttcggccg caccctggag 420 atgtgcaagc gcgacctgat ctgggtggtg attaagatgc agatcaaggt gaaccgctac 480 cccgcctggg gcgacaccgt ggagatcaac acccgcttca gccgcctggg caagatcggc 540 atgggccgcg actggctgat ctccgactgc aacaccggcg agatcctggt gcgcgccacc 600 agcgcctacg ccatgatgaa ccagaagacc cgccgcctgt ccaagctgcc ctacgaggtg 660 caccaggaga tcgtgcccct gttcgtggac agccccgtga tcgaggactc cgacctgaag 720 gtgcacaagt tcaaggtgaa gaccggcgac agcatccaga agggcctgac ccccggctgg 780 aacgacctgg acgtgaacca gcacgtgtcc aacgtgaagt acatcggctg gatcctggag 840 agcatgccca ccgaggtgct ggagacccag gagctgtgct ccctggccct ggagtaccgc 900 cgcgagtgcg gccgcgactc cgtgctggag agcgtgaccg ccatggaccc cagcaaggtg 960 ggcgtgcgct cccagtacca gcacctgctg cgcctggagg acggcaccgc catcgtgaac 1020 ggcgccaccg agtggcgccc caagaacgcc ggcgccaacg gcgccatctc caccggcaag 1080 accagcaacg gcaactccgt gtccatggac tacaaggacc acgacggcga ctacaaggac 1140 cacgacatcg actacaagga cgacgacgac aagtgactcg ag 1182 <210> 95 <211> 20 <212> DNA <213> Umbellularia californica <400> 95 ctgggcgacg gcttcggcac 20 <210> 96 <211> 20 <212> DNA <213> Umbellularia californica <400> 96 aagtcgcggc gcatgccgtt 20 <210> 97 <211> 20 <212> DNA <213> Ulmus americana <400> 97 cccagctgct cacctgcacc 20 <210> 98 <211> 26 <212> DNA <213> Ulmus americana <400> 98 cacccaaggc caacggcagc gccgtg 26 <210> 99 <211> 20 <212> DNA <213> Cuphea hookeriana <400> 99 taccccgcct ggggcgacac 20 <210> 100 <211> 20 <212> DNA <213> Cuphea hookeriana <400> 100 agcttggaca ggcggcgggt 20 <210> 101 <211> 20 <212> DNA <213> Prototheca moriformis <400> 101 tcacttcatg ccggcggtcc 20 <210> 102 <211> 20 <212> DNA <213> Prototheca moriformis <400> 102 gcgctcctgc ttggctcgaa 20 <210> 103 <211> 733 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 103 gctcttcgag acgtggtctg aatcctccag gcgggtttcc ccgagaaaga aagggtgccg 60 atttcaaagc agagccatgt gccgggccct gtggcctgtg ttggcgccta tgtagtcacc 120 ccccctcacc caattgtcgc cagtttgcgc aatccataaa ctcaaaactg cagcttctga 180 gctgcgctgt tcaagaacac ctctggggtt tgctcacccg cgaggtcgac gcccagcatg 240 gctatcaaga cgaacaggca gcctgtggag aagcctccgt tcacgatcgg gacgctgcgc 300 aaggccatcc ccgcgcactg tttcgagcgc tcggcgcttc gtagcagcat gtacctggcc 360 tttgacatcg cggtcatgtc cctgctctac gtcgcgtcga cgtacatcga ccctgcgccg 420 gtgcctacgt gggtcaagta tggcgtcatg tggccgctct actggttctt ccaggtgtgt 480 gtgagggttg tggttgcccg tatcgaggtc ctggtggcgc gcatggggga gaaggcgcct 540 gtcccgctga cccccccggc taccctcccg gcaccttcca gggcgccttc ggcacgggtg 600 tctgggtgtg cgcgcacgag tgcggccacc aggccttttc ctccagccag gccatcaacg 660 acggcgtggg cctggtgttc cacagcctgc tgctggtgcc ctactactcc tggaagcact 720 cgcaccgggt acc 733 <210> 104 <211> 739 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 104 ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60 cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120 gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180 gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240 catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300 gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360 gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420 cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480 cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540 cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600 gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660 cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720 gtgagtgagt gagaagagc 739 <210> 105 <211> 2327 <212> DNA <213> Saccharomyces cerevisiae <400> 105 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300 caacccgcaa acggcgcgcc atgctgctgc aggccttcct gttcctgctg gccggcttcg 360 ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 420 cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 480 agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 540 ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 600 cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 660 ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 720 acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 780 ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 840 tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 900 agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 960 acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 1020 aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 1080 gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 1140 acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 1200 acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 1260 ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 1320 tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 1380 tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 1440 aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 1500 tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 1560 ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 1620 cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 1680 tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 1740 acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 1800 tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 1860 cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 1920 aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 1980 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2040 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2100 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2160 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2220 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2280 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatgga 2327 <210> 106 <211> 735 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 106 gctcttcgag gggctggtct gaatccttca ggcgggtgtt acccgagaaa gaaagggtgc 60 cgatttcaaa gcagacccat gtgccgggcc ctgtggcctg tgttggcgcc tatgtagtca 120 ccccccctca cccaattgtc gccagtttgc gcactccata aactcaaaac agcagcttct 180 gagctgcgct gttcaagaac acctctgggg tttgctcacc cgcgaggtcg acgcccagca 240 tggctatcaa gacgaacagg cagcctgtgg agaagcctcc gttcacgatc gggacgctgc 300 gcaaggccat ccccgcgcac tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg 360 cctttgacat cgcggtcatg tccctgctct acgtcgcgtc gacgtacatc gaccctgcac 420 cggtgcctac gtgggtcaag tacggcatca tgtggccgct ctactggttc ttccaggtgt 480 gtttgagggt tttggttgcc cgtattgagg tcctggtggc gcgcatggag gagaaggcgc 540 ctgtcccgct gacccccccg gctaccctcc cggcaccttc cagggcgcct tcggcacggg 600 tgtctgggtg tgcgcgcacg agtgcggcca ccaggccttt tcctccagcc aggccatcaa 660 cgacggcgtg ggcctggtgt tccacagcct gctgctggtg ccctactact cctggaagca 720 ctcgcaccgg gtacc 735 <210> 107 <211> 739 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 107 ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60 cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120 gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180 gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240 catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300 gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360 gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420 cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480 cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540 cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600 gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660 cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720 gtgagtgagt gagaagagc 739 <210> 108 <211> 471 <212> PRT <213> Saccharomyces carlbergensis <400> 108 Met Phe Ala Phe Tyr Phe Leu Thr Ala Cys Ile Ser Leu Lys Gly Val 1 5 10 15 Phe Gly Val Ser Pro Ser Tyr Asn Gly Leu Gly Leu Thr Pro Gln Met 20 25 30 Gly Trp Asp Asn Trp Asn Thr Phe Ala Cys Asp Val Ser Glu Gln Leu 35 40 45 Leu Leu Asp Thr Ala Asp Arg Ile Ser Asp Leu Gly Leu Lys Asp Met 50 55 60 Gly Tyr Lys Tyr Ile Ile Leu Asp Asp Cys Trp Ser Ser Gly Arg Asp 65 70 75 80 Ser Asp Gly Phe Leu Val Ala Asp Glu Gln Lys Phe Pro Asn Gly Met 85 90 95 Gly His Val Ala Asp His Leu His Asn Asn Ser Phe Leu Phe Gly Met 100 105 110 Tyr Ser Ser Ala Gly Glu Tyr Thr Cys Ala Gly Tyr Pro Gly Ser Leu 115 120 125 Gly Arg Glu Glu Glu Asp Ala Gln Phe Phe Ala Asn Asn Arg Val Asp 130 135 140 Tyr Leu Lys Tyr Asp Asn Cys Tyr Asn Lys Gly Gln Phe Gly Thr Pro 145 150 155 160 Glu Ile Ser Tyr His Arg Tyr Lys Ala Met Ser Asp Ala Leu Asn Lys 165 170 175 Thr Gly Arg Pro Ile Phe Tyr Ser Leu Cys Asn Trp Gly Gln Asp Leu 180 185 190 Thr Phe Tyr Trp Gly Ser Gly Ile Ala Asn Ser Trp Arg Met Ser Gly 195 200 205 Asp Val Thr Ala Glu Phe Thr Arg Pro Asp Ser Arg Cys Pro Cys Asp 210 215 220 Gly Asp Glu Tyr Asp Cys Lys Tyr Ala Gly Phe His Cys Ser Ile Met 225 230 235 240 Asn Ile Leu Asn Lys Ala Ala Pro Met Gly Gln Asn Ala Gly Val Gly 245 250 255 Gly Trp Asn Asp Leu Asp Asn Leu Glu Val Gly Val Gly Asn Leu Thr 260 265 270 Asp Asp Glu Glu Lys Ala His Phe Ser Met Trp Ala Met Val Lys Ser 275 280 285 Pro Leu Ile Ile Gly Ala Asn Val Asn Asn Leu Lys Ala Ser Ser Tyr 290 295 300 Ser Ile Tyr Ser Gln Ala Ser Val Ile Ala Ile Asn Gln Asp Ser Asn 305 310 315 320 Gly Ile Pro Ala Thr Arg Val Trp Arg Tyr Tyr Val Ser Asp Thr Asp 325 330 335 Glu Tyr Gly Gln Gly Glu Ile Gln Met Trp Ser Gly Pro Leu Asp Asn 340 345 350 Gly Asp Gln Val Val Ala Leu Leu Asn Gly Gly Ser Val Ser Arg Pro 355 360 365 Met Asn Thr Thr Leu Glu Glu Ile Phe Phe Asp Ser Asn Leu Gly Ser 370 375 380 Lys Lys Leu Thr Ser Thr Trp Asp Ile Tyr Asp Leu Trp Ala Asn Arg 385 390 395 400 Val Asp Asn Ser Thr Ala Ser Ala Ile Leu Gly Arg Asn Lys Thr Ala 405 410 415 Thr Gly Ile Leu Tyr Asn Ala Thr Glu Gln Ser Tyr Lys Asp Gly Leu 420 425 430 Ser Lys Asn Asp Thr Arg Leu Phe Gly Gln Lys Ile Gly Ser Leu Ser 435 440 445 Pro Asn Ala Ile Leu Asn Thr Thr Val Pro Ala His Gly Ile Ala Phe 450 455 460 Tyr Arg Leu Arg Pro Ser Ser 465 470 <210> 109 <211> 18 <212> PRT <213> Saccharomyces carlbergensis <400> 109 Met Phe Ala Phe Tyr Phe Leu Thr Ala Cys Ile Ser Leu Lys Gly Val 1 5 10 15 Phe Gly <210> 110 <211> 3183 <212> DNA <213> Saccharomyces carlbergensis <400> 110 gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60 tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120 gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180 gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240 ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300 ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360 ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420 gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480 gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540 gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600 ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660 ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720 ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780 gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840 tagtatgttc gcgttctact tcctgacggc ctgcatctcc ctgaagggcg tgttcggcgt 900 ctccccctcc tacaacggcc tgggcctgac gccccagatg ggctgggaca actggaacac 960 gttcgcctgc gacgtctccg agcagctgct gctggacacg gccgaccgca tctccgacct 1020 gggcctgaag gacatgggct acaagtacat catcctggac gactgctggt cctccggccg 1080 cgactccgac ggcttcctgg tcgccgacga gcagaagttc cccaacggca tgggccacgt 1140 cgccgaccac ctgcacaaca actccttcct gttcggcatg tactcctccg cgggcgagta 1200 cacgtgcgcc ggctaccccg gctccctggg ccgcgaggag gaggacgccc agttcttcgc 1260 gaacaaccgc gtggactacc tgaagtacga caactgctac aacaagggcc agttcggcac 1320 gcccgagatc tcctaccacc gctacaaggc catgtccgac gccctgaaca agacgggccg 1380 ccccatcttc tactccctgt gcaactgggg ccaggacctg accttctact ggggctccgg 1440 catcgcgaac tcctggcgca tgtccggcga cgtcacggcg gagttcacgc gccccgactc 1500 ccgctgcccc tgcgacggcg acgagtacga ctgcaagtac gccggcttcc actgctccat 1560 catgaacatc ctgaacaagg ccgcccccat gggccagaac gcgggcgtcg gcggctggaa 1620 cgacctggac aacctggagg tcggcgtcgg caacctgacg gacgacgagg agaaggcgca 1680 cttctccatg tgggccatgg tgaagtcccc cctgatcatc ggcgcgaacg tgaacaacct 1740 gaaggcctcc tcctactcca tctactccca ggcgtccgtc atcgccatca accaggactc 1800 caacggcatc cccgccacgc gcgtctggcg ctactacgtg tccgacacgg acgagtacgg 1860 ccagggcgag atccagatgt ggtccggccc cctggacaac ggcgaccagg tcgtggcgct 1920 gctgaacggc ggctccgtgt cccgccccat gaacacgacc ctggaggaga tcttcttcga 1980 ctccaacctg ggctccaaga agctgacctc cacctgggac atctacgacc tgtgggcgaa 2040 ccgcgtcgac aactccacgg cgtccgccat cctgggccgc aacaagaccg ccaccggcat 2100 cctgtacaac gccaccgagc agtcctacaa ggacggcctg tccaagaacg acacccgcct 2160 gttcggccag aagatcggct ccctgtcccc caacgcgatc ctgaacacga ccgtccccgc 2220 ccacggcatc gcgttctacc gcctgcgccc ctcctcctga caattgaagc agcagcagct 2280 cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2340 ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2400 tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2460 gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2520 tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2580 gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2640 gggaagtagt gggatgggaa cacaaatgga aagcttgagc tcagaatagt atcgggtgat 2700 gcgaagtcag aaccaggcag ggcctgtcgc ctgaggtggc aacgatggga agcaatcaat 2760 ctgggtacag tcgtccgcac gatcccgtga tctcccccac cgacacctat ccccgcccat 2820 cccggcccac cctttcagtc ccctcagcat gcattgtgca ccgcgacaaa gcatgtctgc 2880 tcgtgcactg gttcaggcca cggcgcaccg agtcctcgcc cttcgcagag tgatcaccct 2940 ccccggaacc agccacgctc gctgctgcgg gccgatcagc cgcgcgcact ccctgcaact 3000 agggacaact caggcaacca cgcgcctcac aagcatggcc gccgtggcat ccaacccgct 3060 cgtgacggtg ggtgcgcaag tgccaggggc ctcgtcgtca cggcgtgcat cctcgaggga 3120 tgcgatccgg caactatatg tcgtttatct ccccaccaat cacaggatga gcccctgtct 3180 aga 3183 <210> 111 <211> 1416 <212> DNA <213> Saccharomyces carlbergensis <400> 111 atgttcgcgt tctacttcct gacggcctgc atctccctga agggcgtgtt cggcgtctcc 60 ccctcctaca acggcctggg cctgacgccc cagatgggct gggacaactg gaacacgttc 120 gcctgcgacg tctccgagca gctgctgctg gacacggccg accgcatctc cgacctgggc 180 ctgaaggaca tgggctacaa gtacatcatc ctggacgact gctggtcctc cggccgcgac 240 tccgacggct tcctggtcgc cgacgagcag aagttcccca acggcatggg ccacgtcgcc 300 gaccacctgc acaacaactc cttcctgttc ggcatgtact cctccgcggg cgagtacacg 360 tgcgccggct accccggctc cctgggccgc gaggaggagg acgcccagtt cttcgcgaac 420 aaccgcgtgg actacctgaa gtacgacaac tgctacaaca agggccagtt cggcacgccc 480 gagatctcct accaccgcta caaggccatg tccgacgccc tgaacaagac gggccgcccc 540 atcttctact ccctgtgcaa ctggggccag gacctgacct tctactgggg ctccggcatc 600 gcgaactcct ggcgcatgtc cggcgacgtc acggcggagt tcacgcgccc cgactcccgc 660 tgcccctgcg acggcgacga gtacgactgc aagtacgccg gcttccactg ctccatcatg 720 aacatcctga acaaggccgc ccccatgggc cagaacgcgg gcgtcggcgg ctggaacgac 780 ctggacaacc tggaggtcgg cgtcggcaac ctgacggacg acgaggagaa ggcgcacttc 840 tccatgtggg ccatggtgaa gtcccccctg atcatcggcg cgaacgtgaa caacctgaag 900 gcctcctcct actccatcta ctcccaggcg tccgtcatcg ccatcaacca ggactccaac 960 ggcatccccg ccacgcgcgt ctggcgctac tacgtgtccg acacggacga gtacggccag 1020 ggcgagatcc agatgtggtc cggccccctg gacaacggcg accaggtcgt ggcgctgctg 1080 aacggcggct ccgtgtcccg ccccatgaac acgaccctgg aggagatctt cttcgactcc 1140 aacctgggct ccaagaagct gacctccacc tgggacatct acgacctgtg ggcgaaccgc 1200 gtcgacaact ccacggcgtc cgccatcctg ggccgcaaca agaccgccac cggcatcctg 1260 tacaacgcca ccgagcagtc ctacaaggac ggcctgtcca agaacgacac ccgcctgttc 1320 ggccagaaga tcggctccct gtcccccaac gcgatcctga acacgaccgt ccccgcccac 1380 ggcatcgcgt tctaccgcct gcgcccctcc tcctga 1416 <210> 112 <211> 526 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 112 gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60 tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120 gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180 gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240 ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300 ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360 ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420 gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480 gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattc 526 <210> 113 <211> 507 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 113 gagctcagaa tagtatcggg tgatgcgaag tcagaaccag gcagggcctg tcgcctgagg 60 tggcaacgat gggaagcaat caatctgggt acagtcgtcc gcacgatccc gtgatctccc 120 ccaccgacac ctatccccgc ccatcccggc ccaccctttc agtcccctca gcatgcattg 180 tgcaccgcga caaagcatgt ctgctcgtgc actggttcag gccacggcgc accgagtcct 240 cgcccttcgc agagtgatca ccctccccgg aaccagccac gctcgctgct gcgggccgat 300 cagccgcgcg cactccctgc aactagggac aactcaggca accacgcgcc tcacaagcat 360 ggccgccgtg gcatccaacc cgctcgtgac ggtgggtgcg caagtgccag gggcctcgtc 420 gtcacggcgt gcatcctcga gggatgcgat ccggcaacta tatgtcgttt atctccccac 480 caatcacagg atgagcccct gtctaga 507 <210> 114 <211> 312 <212> DNA <213> Chlamydomonas reinhardtii <400> 114 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300 caacccgcaa ac 312 <210> 115 <211> 408 <212> DNA <213> Chlorella vulgaris <400> 115 gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 60 ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 120 tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 180 ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 240 tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 300 gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 360 atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 408 <210> 116 <211> 747 <212> PRT <213> Aspergillus niger <400> 116 Met Ile Gly Ser Ser His Ala Val Val Ala Leu Gly Leu Phe Thr Leu 1 5 10 15 Tyr Gly His Ser Ala Ala Ala Pro Ala Ile Gly Ala Ser Asn Ser Gln 20 25 30 Thr Ile Val Thr Asn Gly Thr Ser Phe Ala Leu Asn Gly Asp Asn Val 35 40 45 Ser Tyr Arg Phe His Val Asn Ser Ser Thr Gly Asp Leu Ile Ser Asp 50 55 60 His Phe Gly Gly Val Val Ser Gly Thr Ile Pro Ser Pro Val Glu Pro 65 70 75 80 Ala Val Asn Gly Trp Val Gly Met Pro Gly Arg Ile Arg Arg Glu Phe 85 90 95 Pro Asp Gln Gly Arg Gly Asp Phe Arg Ile Pro Ala Val Arg Ile Arg 100 105 110 Glu Ser Ala Gly Tyr Thr Val Ser Asp Leu Gln Tyr Val Ser His Glu 115 120 125 Val Ile Glu Gly Lys Tyr Ala Leu Pro Gly Leu Pro Ala Thr Phe Gly 130 135 140 Asp Ala Gln Asp Ala Thr Thr Leu Val Val His Leu Tyr Asp Asn Tyr 145 150 155 160 Ser Ser Val Ala Ala Asp Leu Ser Tyr Ser Ile Phe Pro Lys Tyr Asp 165 170 175 Ala Ile Val Arg Ser Val Asn Val Thr Asn Gln Gly Pro Gly Asn Ile 180 185 190 Thr Ile Glu Ala Leu Ala Ser Ile Ser Ile Asp Phe Pro Tyr Glu Asp 195 200 205 Leu Asp Met Val Ser Leu Arg Gly Asp Trp Ala Arg Glu Ala Asn Val 210 215 220 Gln Arg Ser Lys Val Gln Tyr Gly Val Gln Gly Phe Gly Ser Ser Thr 225 230 235 240 Gly Tyr Ser Ser His Leu His Asn Pro Phe Leu Ala Ile Val Asp Pro 245 250 255 Ala Thr Thr Glu Ser Gln Gly Glu Ala Trp Gly Phe Asn Leu Val Tyr 260 265 270 Thr Gly Ser Phe Ser Ala Gln Val Glu Lys Gly Ser Gln Gly Phe Thr 275 280 285 Arg Ala Leu Leu Gly Phe Asn Pro Asp Gln Leu Ser Trp Asn Leu Gly 290 295 300 Pro Gly Glu Thr Leu Thr Ser Pro Glu Cys Val Ala Val Tyr Ser Asp 305 310 315 320 Lys Gly Leu Gly Ser Val Ser Arg Lys Phe His Arg Leu Tyr Arg Asn 325 330 335 His Leu Met Lys Ser Lys Phe Ala Thr Ser Asp Arg Pro Val Leu Leu 340 345 350 Asn Ser Trp Glu Gly Val Tyr Phe Asp Tyr Asn Gln Ser Ser Ile Glu 355 360 365 Thr Leu Ala Glu Glu Ser Ala Ala Leu Gly Val His Leu Phe Val Met 370 375 380 Asp Asp Gly Trp Phe Gly Asp Lys Tyr Pro Arg Val Ser Asp Asn Ala 385 390 395 400 Gly Leu Gly Asp Trp Met Pro Asn Pro Ala Arg Phe Pro Asp Gly Leu 405 410 415 Thr Pro Val Val Gln Asp Ile Thr Asn Leu Thr Val Asn Gly Thr Glu 420 425 430 Ser Thr Lys Leu Arg Phe Gly Ile Trp Val Glu Pro Glu Met Val Asn 435 440 445 Pro Asn Ser Thr Leu Tyr His Glu His Pro Glu Trp Ala Leu His Ala 450 455 460 Gly Pro Tyr Pro Arg Thr Glu Arg Arg Asn Gln Leu Val Leu Asn Leu 465 470 475 480 Ala Leu Pro Ala Val Gln Asp Phe Ile Ile Asp Phe Met Thr Asn Leu 485 490 495 Leu Gln Asp Thr Gly Ile Ser Tyr Val Lys Trp Asp Asn Asn Arg Gly 500 505 510 Ile His Glu Thr Pro Ser Pro Ser Thr Asp His Gln Tyr Met Leu Gly 515 520 525 Leu Tyr Arg Val Phe Asp Thr Leu Thr Thr Arg Phe Pro Asp Val Leu 530 535 540 Trp Glu Gly Cys Ala Ser Gly Gly Gly Arg Phe Asp Ala Gly Met Leu 545 550 555 560 Gln Tyr Val Pro Gln Ile Trp Thr Ser Asp Asn Thr Asp Ala Ile Asp 565 570 575 Arg Ile Thr Ile Gln Phe Gly Thr Ser Leu Ala Tyr Pro Pro Ser Ala 580 585 590 Met Gly Ala His Leu Ser Ala Val Pro Asn Ala Gln Thr Gly Arg Thr 595 600 605 Val Pro Phe Thr Phe Arg Ala His Val Ala Met Met Gly Gly Ser Phe 610 615 620 Gly Leu Glu Leu Asp Pro Ala Thr Val Glu Gly Asp Glu Ile Val Pro 625 630 635 640 Glu Leu Leu Ala Leu Ala Glu Lys Val Asn Pro Ile Ile Leu Asn Gly 645 650 655 Asp Leu Tyr Arg Leu Arg Leu Pro Gln Asp Ser Gln Trp Pro Ala Ala 660 665 670 Leu Phe Val Ser Gln Asp Gly Ala Gln Ala Val Leu Phe Tyr Phe Gln 675 680 685 Val Gln Pro Asn Val Asn His Ala Val Pro Trp Val Arg Leu Gln Gly 690 695 700 Leu Asp Pro Lys Ala Asp Tyr Thr Val Asp Gly Asp Gln Thr Tyr Ser 705 710 715 720 Gly Ala Thr Leu Met Asn Leu Gly Leu Gln Tyr Ser Phe Asp Thr Glu 725 730 735 Tyr Gly Ser Lys Val Val Phe Leu Glu Arg Gln 740 745 <210> 117 <211> 28 <212> PRT <213> Aspergillus niger <400> 117 Met Ile Gly Ser Ser His Ala Val Val Ala Leu Gly Leu Phe Thr Leu 1 5 10 15 Tyr Gly His Ser Ala Ala Ala Pro Ala Ile Gly Ala 20 25 <210> 118 <211> 2244 <212> DNA <213> Aspergillus niger <400> 118 atgatcggct cctcccacgc ggtcgtcgcc ctgggcctgt tcaccctgta cggccactcc 60 gccgccgcgc ccgccatcgg cgcctccaac tcccagacca tcgtcacgaa cggcacctcc 120 ttcgccctga acggcgacaa cgtgtcctac cgcttccacg tgaactcctc cacgggcgac 180 ctgatctccg accacttcgg cggcgtggtg tccggcacca tcccctcccc cgtggagccc 240 gcggtcaacg gctgggtggg catgcccggc cgcatccgcc gcgagttccc cgaccagggc 300 cgcggcgact tccgcatccc cgcggtgcgc atccgcgagt ccgccggcta caccgtctcc 360 gacctgcagt acgtgtccca cgaggtgatc gagggcaagt acgcgctgcc cggcctgccc 420 gccacgttcg gcgacgccca ggacgccacc accctggtgg tgcacctgta cgacaactac 480 tcctccgtcg cggccgacct gtcctactcc atcttcccca agtacgacgc gatcgtccgc 540 tccgtgaacg tgaccaacca gggccccggc aacatcacca tcgaggcgct ggcctccatc 600 tccatcgact tcccctacga ggacctggac atggtgtccc tgcgcggcga ctgggcccgc 660 gaggcgaacg tgcagcgctc caaggtccag tacggcgtgc agggcttcgg ctcctccacc 720 ggctactcct cccacctgca caaccccttc ctggcgatcg tcgaccccgc gaccaccgag 780 tcccagggcg aggcctgggg cttcaacctg gtctacaccg gctccttctc cgcccaggtc 840 gagaagggct cccagggctt cacgcgcgcc ctgctgggct tcaaccccga ccagctgtcc 900 tggaacctgg gccccggcga gacgctgacg tcccccgagt gcgtcgccgt ctactccgac 960 aagggcctgg gctccgtctc ccgcaagttc caccgcctgt accgcaacca cctgatgaag 1020 tccaagttcg ccacgtccga ccgccccgtg ctgctgaact cctgggaggg cgtctacttc 1080 gactacaacc agtcctccat cgagacgctg gcggaggagt ccgccgccct gggcgtgcac 1140 ctgttcgtca tggacgacgg ctggttcggc gacaagtacc cccgcgtgtc cgacaacgcc 1200 ggcctgggcg actggatgcc caaccccgcc cgcttccccg acggcctgac gcccgtcgtg 1260 caggacatca ccaacctgac cgtcaacggc accgagtcca ccaagctgcg cttcggcatc 1320 tgggtggagc ccgagatggt gaaccccaac tccaccctgt accacgagca ccccgagtgg 1380 gcgctgcacg cgggccccta cccccgcacc gagcgccgca accagctggt cctgaacctg 1440 gccctgcccg cggtccagga cttcatcatc gacttcatga ccaacctgct gcaggacacc 1500 ggcatctcct acgtcaagtg ggacaacaac cgcggcatcc acgagacgcc ctccccctcc 1560 acggaccacc agtacatgct gggcctgtac cgcgtgttcg acacgctgac cacgcgcttc 1620 cccgacgtcc tgtgggaggg ctgcgcgtcc ggcggcggcc ggttcgacgc cggcatgctg 1680 cagtacgtcc cccagatctg gacgtccgac aacacggacg cgatcgaccg catcaccatc 1740 cagttcggca cctccctggc ctaccccccc tccgccatgg gcgcccacct gtccgcggtg 1800 cccaacgccc agaccggccg cacggtgccc ttcaccttcc gcgcccacgt cgcgatgatg 1860 ggcggctcct tcggcctgga gctggacccc gccaccgtgg agggcgacga gatcgtgccc 1920 gagctgctgg cgctggccga gaaggtgaac cccatcatcc tgaacggcga cctgtaccgc 1980 ctgcgcctgc cccaggactc ccagtggccc gcggccctgt tcgtgtccca ggacggcgcc 2040 caggccgtcc tgttctactt ccaggtgcag cccaacgtca accacgccgt cccctgggtc 2100 cgcctgcagg gcctggaccc caaggccgac tacacggtgg acggcgacca gacgtactcc 2160 ggcgcgaccc tgatgaacct gggcctgcag tactccttcg acaccgagta cggctccaag 2220 gtggtgttcc tggagcgcca gtaa 2244 <210> 119 <211> 4011 <212> DNA <213> Aspergillus niger <400> 119 gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60 tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120 gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180 gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240 ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300 ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360 ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420 gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480 gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540 gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600 ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660 ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720 ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780 gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840 tagtatgatc ggctcctccc acgcggtcgt cgccctgggc ctgttcaccc tgtacggcca 900 ctccgccgcc gcgcccgcca tcggcgcctc caactcccag accatcgtca cgaacggcac 960 ctccttcgcc ctgaacggcg acaacgtgtc ctaccgcttc cacgtgaact cctccacggg 1020 cgacctgatc tccgaccact tcggcggcgt ggtgtccggc accatcccct cccccgtgga 1080 gcccgcggtc aacggctggg tgggcatgcc cggccgcatc cgccgcgagt tccccgacca 1140 gggccgcggc gacttccgca tccccgcggt gcgcatccgc gagtccgccg gctacaccgt 1200 ctccgacctg cagtacgtgt cccacgaggt gatcgagggc aagtacgcgc tgcccggcct 1260 gcccgccacg ttcggcgacg cccaggacgc caccaccctg gtggtgcacc tgtacgacaa 1320 ctactcctcc gtcgcggccg acctgtccta ctccatcttc cccaagtacg acgcgatcgt 1380 ccgctccgtg aacgtgacca accagggccc cggcaacatc accatcgagg cgctggcctc 1440 catctccatc gacttcccct acgaggacct ggacatggtg tccctgcgcg gcgactgggc 1500 ccgcgaggcg aacgtgcagc gctccaaggt ccagtacggc gtgcagggct tcggctcctc 1560 caccggctac tcctcccacc tgcacaaccc cttcctggcg atcgtcgacc ccgcgaccac 1620 cgagtcccag ggcgaggcct ggggcttcaa cctggtctac accggctcct tctccgccca 1680 ggtcgagaag ggctcccagg gcttcacgcg cgccctgctg ggcttcaacc ccgaccagct 1740 gtcctggaac ctgggccccg gcgagacgct gacgtccccc gagtgcgtcg ccgtctactc 1800 cgacaagggc ctgggctccg tctcccgcaa gttccaccgc ctgtaccgca accacctgat 1860 gaagtccaag ttcgccacgt ccgaccgccc cgtgctgctg aactcctggg agggcgtcta 1920 cttcgactac aaccagtcct ccatcgagac gctggcggag gagtccgccg ccctgggcgt 1980 gcacctgttc gtcatggacg acggctggtt cggcgacaag tacccccgcg tgtccgacaa 2040 cgccggcctg ggcgactgga tgcccaaccc cgcccgcttc cccgacggcc tgacgcccgt 2100 cgtgcaggac atcaccaacc tgaccgtcaa cggcaccgag tccaccaagc tgcgcttcgg 2160 catctgggtg gagcccgaga tggtgaaccc caactccacc ctgtaccacg agcaccccga 2220 gtgggcgctg cacgcgggcc cctacccccg caccgagcgc cgcaaccagc tggtcctgaa 2280 cctggccctg cccgcggtcc aggacttcat catcgacttc atgaccaacc tgctgcagga 2340 caccggcatc tcctacgtca agtgggacaa caaccgcggc atccacgaga cgccctcccc 2400 ctccacggac caccagtaca tgctgggcct gtaccgcgtg ttcgacacgc tgaccacgcg 2460 cttccccgac gtcctgtggg agggctgcgc gtccggcggc ggccggttcg acgccggcat 2520 gctgcagtac gtcccccaga tctggacgtc cgacaacacg gacgcgatcg accgcatcac 2580 catccagttc ggcacctccc tggcctaccc cccctccgcc atgggcgccc acctgtccgc 2640 ggtgcccaac gcccagaccg gccgcacggt gcccttcacc ttccgcgccc acgtcgcgat 2700 gatgggcggc tccttcggcc tggagctgga ccccgccacc gtggagggcg acgagatcgt 2760 gcccgagctg ctggcgctgg ccgagaaggt gaaccccatc atcctgaacg gcgacctgta 2820 ccgcctgcgc ctgccccagg actcccagtg gcccgcggcc ctgttcgtgt cccaggacgg 2880 cgcccaggcc gtcctgttct acttccaggt gcagcccaac gtcaaccacg ccgtcccctg 2940 ggtccgcctg cagggcctgg accccaaggc cgactacacg gtggacggcg accagacgta 3000 ctccggcgcg accctgatga acctgggcct gcagtactcc ttcgacaccg agtacggctc 3060 caaggtggtg ttcctggagc gccagtaaca attgaagcag cagcagctcg gatagtatcg 3120 acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 3180 gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 3240 cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 3300 ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 3360 gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 3420 ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 3480 gatgggaaca caaatggaaa gcttgagctc agaatagtat cgggtgatgc gaagtcagaa 3540 ccaggcaggg cctgtcgcct gaggtggcaa cgatgggaag caatcaatct gggtacagtc 3600 gtccgcacga tcccgtgatc tcccccaccg acacctatcc ccgcccatcc cggcccaccc 3660 tttcagtccc ctcagcatgc attgtgcacc gcgacaaagc atgtctgctc gtgcactggt 3720 tcaggccacg gcgcaccgag tcctcgccct tcgcagagtg atcaccctcc ccggaaccag 3780 ccacgctcgc tgctgcgggc cgatcagccg cgcgcactcc ctgcaactag ggacaactca 3840 ggcaaccacg cgcctcacaa gcatggccgc cgtggcatcc aacccgctcg tgacggtggg 3900 tgcgcaagtg ccaggggcct cgtcgtcacg gcgtgcatcc tcgagggatg cgatccggca 3960 actatatgtc gtttatctcc ccaccaatca caggatgagc ccctgtctag a 4011 <210> 120 <211> 411 <212> PRT <213> Cyamopsis tetragonoloba <400> 120 Met Ala Thr His Tyr Ser Ile Ile Gly Gly Met Ile Ile Val Val Leu 1 5 10 15 Leu Met Ile Ile Gly Ser Glu Gly Gly Arg Leu Leu Glu Lys Lys Asn 20 25 30 Arg Thr Ser Ala Glu Ala Glu His Tyr Asn Val Arg Arg Tyr Leu Ala 35 40 45 Glu Asn Gly Leu Gly Gln Thr Pro Pro Met Gly Trp Asn Ser Trp Asn 50 55 60 His Phe Gly Cys Asp Ile Asn Glu Asn Val Val Arg Glu Thr Ala Asp 65 70 75 80 Ala Met Val Ser Thr Gly Leu Ala Ala Leu Gly Tyr Gln Tyr Ile Asn 85 90 95 Leu Asp Asp Cys Trp Ala Glu Leu Asn Arg Asp Ser Glu Gly Asn Met 100 105 110 Val Pro Asn Ala Ala Ala Phe Pro Ser Gly Ile Lys Ala Leu Ala Asp 115 120 125 Tyr Val His Ser Lys Gly Leu Lys Leu Gly Val Tyr Ser Asp Ala Gly 130 135 140 Asn Gln Thr Cys Ser Lys Arg Met Pro Gly Ser Leu Gly His Glu Glu 145 150 155 160 Gln Asp Ala Lys Thr Phe Ala Ser Trp Gly Val Asp Tyr Leu Lys Tyr 165 170 175 Asp Asn Cys Glu Asn Leu Gly Ile Ser Val Lys Glu Arg Tyr Pro Pro 180 185 190 Met Gly Lys Ala Leu Leu Ser Ser Gly Arg Pro Ile Phe Phe Ser Met 195 200 205 Cys Glu Trp Gly Trp Glu Asp Pro Gln Ile Trp Ala Lys Ser Ile Gly 210 215 220 Asn Ser Trp Arg Thr Thr Gly Asp Ile Glu Asp Asn Trp Asn Ser Met 225 230 235 240 Thr Ser Ile Ala Asp Ser Asn Asp Lys Trp Ala Ser Tyr Ala Gly Pro 245 250 255 Gly Gly Trp Asn Asp Pro Asp Met Leu Glu Val Gly Asn Gly Gly Met 260 265 270 Thr Thr Glu Glu Tyr Arg Ser His Phe Ser Ile Trp Ala Leu Ala Lys 275 280 285 Ala Pro Leu Leu Val Gly Cys Asp Ile Arg Ala Met Asp Asp Thr Thr 290 295 300 His Glu Leu Ile Ser Asn Ala Glu Val Ile Ala Val Asn Gln Asp Lys 305 310 315 320 Leu Gly Val Gln Gly Lys Lys Val Lys Ser Thr Asn Asp Leu Glu Val 325 330 335 Trp Ala Gly Pro Leu Ser Asp Asn Lys Val Ala Val Ile Leu Trp Asn 340 345 350 Arg Ser Ser Ser Arg Ala Thr Val Thr Ala Ser Trp Ser Asp Ile Gly 355 360 365 Leu Gln Gln Gly Thr Thr Val Asp Ala Arg Asp Leu Trp Glu His Ser 370 375 380 Thr Gln Ser Leu Val Ser Gly Glu Ile Ser Ala Glu Ile Asp Ser His 385 390 395 400 Ala Cys Lys Met Tyr Val Leu Thr Pro Arg Ser 405 410 <210> 121 <211> 1236 <212> DNA <213> Cyamopsis tetragonoloba <400> 121 atggccaccc actactccat catcggcggc atgatcatcg tcgtcctgct gatgatcatc 60 ggctccgagg gcggccggct gctggagaag aagaaccgca cctccgccga ggcggagcac 120 tacaacgtgc gccgctacct ggccgagaac ggcctgggcc agaccccccc catgggctgg 180 aactcctgga accacttcgg ctgcgacatc aacgagaacg tcgtccgcga gacggcggac 240 gccatggtgt ccaccggcct ggccgccctg ggctaccagt acatcaacct ggacgactgc 300 tgggcggagc tgaaccgcga ctccgagggc aacatggtgc ccaacgccgc cgcgttcccc 360 tccggcatca aggcgctggc ggactacgtc cactccaagg gcctgaagct gggcgtctac 420 tccgacgcgg gcaaccagac ctgctccaag cgcatgcccg gctccctggg ccacgaggag 480 caggacgcga agacgttcgc ctcctggggc gtcgactacc tgaagtacga caactgcgag 540 aacctgggca tctccgtgaa ggagcgctac ccccccatgg gcaaggcgct gctgtcctcc 600 ggccgcccca tcttcttctc catgtgcgag tggggctggg aggaccccca gatctgggcc 660 aagtccatcg gcaactcctg gcgcaccacc ggcgacatcg aggacaactg gaactccatg 720 acctccatcg ccgactccaa cgacaagtgg gcctcctacg ccggccccgg cggctggaac 780 gaccccgaca tgctggaggt cggcaacggc ggcatgacga cggaggagta ccgctcccac 840 ttctccatct gggccctggc caaggcgccc ctgctggtgg gctgcgacat ccgcgcgatg 900 gacgacacga cgcacgagct gatctccaac gccgaggtga tcgcggtgaa ccaggacaag 960 ctgggcgtgc agggcaagaa ggtcaagtcc acgaacgacc tggaggtctg ggccggcccc 1020 ctgtccgaca acaaggtggc ggtgatcctg tggaaccgct cctcctcccg cgccaccgtc 1080 accgcgtcct ggtccgacat cggcctgcag cagggcacca ccgtcgacgc gcgcgacctg 1140 tgggagcact ccacgcagtc cctggtgtcc ggcgagatct ccgccgagat cgactcccac 1200 gcctgcaaga tgtacgtcct gacgccccgc tcctaa 1236 <210> 122 <211> 3003 <212> DNA <213> Cyamopsis tetragonoloba <400> 122 gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60 tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120 gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180 gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240 ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300 ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360 ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420 gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480 gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540 gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600 ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660 ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720 ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780 gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840 tagtatggcc acccactact ccatcatcgg cggcatgatc atcgtcgtcc tgctgatgat 900 catcggctcc gagggcggcc ggctgctgga gaagaagaac cgcacctccg ccgaggcgga 960 gcactacaac gtgcgccgct acctggccga gaacggcctg ggccagaccc cccccatggg 1020 ctggaactcc tggaaccact tcggctgcga catcaacgag aacgtcgtcc gcgagacggc 1080 ggacgccatg gtgtccaccg gcctggccgc cctgggctac cagtacatca acctggacga 1140 ctgctgggcg gagctgaacc gcgactccga gggcaacatg gtgcccaacg ccgccgcgtt 1200 cccctccggc atcaaggcgc tggcggacta cgtccactcc aagggcctga agctgggcgt 1260 ctactccgac gcgggcaacc agacctgctc caagcgcatg cccggctccc tgggccacga 1320 ggagcaggac gcgaagacgt tcgcctcctg gggcgtcgac tacctgaagt acgacaactg 1380 cgagaacctg ggcatctccg tgaaggagcg ctaccccccc atgggcaagg cgctgctgtc 1440 ctccggccgc cccatcttct tctccatgtg cgagtggggc tgggaggacc cccagatctg 1500 ggccaagtcc atcggcaact cctggcgcac caccggcgac atcgaggaca actggaactc 1560 catgacctcc atcgccgact ccaacgacaa gtgggcctcc tacgccggcc ccggcggctg 1620 gaacgacccc gacatgctgg aggtcggcaa cggcggcatg acgacggagg agtaccgctc 1680 ccacttctcc atctgggccc tggccaaggc gcccctgctg gtgggctgcg acatccgcgc 1740 gatggacgac acgacgcacg agctgatctc caacgccgag gtgatcgcgg tgaaccagga 1800 caagctgggc gtgcagggca agaaggtcaa gtccacgaac gacctggagg tctgggccgg 1860 ccccctgtcc gacaacaagg tggcggtgat cctgtggaac cgctcctcct cccgcgccac 1920 cgtcaccgcg tcctggtccg acatcggcct gcagcagggc accaccgtcg acgcgcgcga 1980 cctgtgggag cactccacgc agtccctggt gtccggcgag atctccgccg agatcgactc 2040 ccacgcctgc aagatgtacg tcctgacgcc ccgctcctaa caattgaagc agcagcagct 2100 cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2160 ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2220 tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2280 gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2340 tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2400 gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2460 gggaagtagt gggatgggaa cacaaatgga aagcttgagc tcagaatagt atcgggtgat 2520 gcgaagtcag aaccaggcag ggcctgtcgc ctgaggtggc aacgatggga agcaatcaat 2580 ctgggtacag tcgtccgcac gatcccgtga tctcccccac cgacacctat ccccgcccat 2640 cccggcccac cctttcagtc ccctcagcat gcattgtgca ccgcgacaaa gcatgtctgc 2700 tcgtgcactg gttcaggcca cggcgcaccg agtcctcgcc cttcgcagag tgatcaccct 2760 ccccggaacc agccacgctc gctgctgcgg gccgatcagc cgcgcgcact ccctgcaact 2820 agggacaact caggcaacca cgcgcctcac aagcatggcc gccgtggcat ccaacccgct 2880 cgtgacggtg ggtgcgcaag tgccaggggc ctcgtcgtca cggcgtgcat cctcgaggga 2940 tgcgatccgg caactatatg tcgtttatct ccccaccaat cacaggatga gcccctgtct 3000 aga 3003 <210> 123 <211> 22 <212> DNA <213> Chlorella vulgaris <400> 123 actgcaatgc tgatgcacgg ga 22 <210> 124 <211> 19 <212> DNA <213> Chlorella vulgaris <400> 124 tccaggtcct tttcgcact 19 <210> 125 <211> 632 <212> PRT <213> Unknown <220> <223> Coccomyxa species <400> 125 Met Thr Thr Asn Leu Ala Lys Leu Pro Leu Gly Gly Leu Ser Ser Arg 1 5 10 15 Ser Ser Ile Ala Gly Ala Pro Leu Arg Val Asn Ser His Ser Arg Glu 20 25 30 Arg His Leu Gly Ala Lys Thr Thr Ala Ile Ala Ala Pro Glu Arg Leu 35 40 45 Asp Tyr Leu Asp Asn Ala Glu Glu Ala Arg Leu Gln Gln Thr Asp Ala 50 55 60 Phe Ala Glu Leu Lys Ala Leu Ser Ser Arg Gln Ser Val Asn Arg Pro 65 70 75 80 Gln Lys Gly Glu Leu Ser Phe Arg Gln Ser Pro Thr Phe Gln Asp Cys 85 90 95 Phe Pro Gly Ser Glu Lys Cys Tyr Arg Glu Val Glu His Asp Gly Lys 100 105 110 Thr Leu Lys Val Pro Phe Arg Arg Val His Leu Gln Asp Asp Asn Gly 115 120 125 His Phe Asp Leu Tyr Asp Thr Ser Gly Pro Gln Gly Val Asn Pro Arg 130 135 140 Glu Gly Leu Pro Lys Ile Arg Ser Ser Trp Val Glu Pro Arg Glu Ala 145 150 155 160 Arg Gly Asp Lys Val Gln Thr Gln Gln Tyr Tyr Ala Lys Gln Gly Ile 165 170 175 Ile Thr Glu Glu Met Ala Phe Cys Ala Ala Arg Glu Arg Met Asp Pro 180 185 190 Glu Phe Ile Arg Ser Glu Val Ala Arg Gly Arg Ala Ile Ile Pro Ala 195 200 205 Asn Lys Arg His Leu Glu Leu Glu Pro Thr Val Val Gly Arg Asn Phe 210 215 220 Leu Val Lys Val Asn Ala Asn Ile Gly Asn Ser Ala Val Ser Ser Ser 225 230 235 240 Ile Glu Glu Glu Val Glu Lys Leu Gln Trp Ser Thr Ile Trp Gly Ala 245 250 255 Asp Thr Ala Met Asp Leu Ser Thr Gly Asn Asn Ile His Glu Thr Arg 260 265 270 Glu Trp Val Met Arg Asn Ser Pro Val Pro Val Gly Thr Val Pro Ile 275 280 285 Tyr Gln Cys Leu Glu Lys Ala Gly Gly Ile Val Glu Asn Ile Thr Trp 290 295 300 Glu Leu Phe Arg Glu Thr Leu Ile Glu Gln Ala Glu Gln Gly Val Asp 305 310 315 320 Tyr Phe Thr Ile His Ala Gly Val Leu Leu Arg Tyr Ile Pro Leu Thr 325 330 335 Ala Asn Arg Val Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala 340 345 350 Lys Leu Cys Leu Leu Asp His Thr Glu Asn Phe Ala Tyr Met His Trp 355 360 365 Asp Glu Ile Leu Asp Ile Cys Ala Gln Tyr Asp Ile Thr Leu Ser Ile 370 375 380 Gly Asp Gly Leu Arg Pro Gly Cys Ile Ala Asp Ala Asn Asp Ala Ala 385 390 395 400 Gln Phe Ala Glu Leu Lys Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp 405 410 415 Ala Lys Asp Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Leu 420 425 430 His Lys Ile Pro Glu Asn Met Glu Lys Gln Leu Asp Trp Cys Ser Glu 435 440 445 Ala Pro Phe Tyr Thr Leu Gly Pro Leu Ala Thr Asp Ile Ala Pro Ala 450 455 460 Tyr Asp His Ile Thr Ser Ala Ile Gly Ala Ala Thr Ile Gly Ala Leu 465 470 475 480 Gly Thr Ala Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu 485 490 495 Pro Asp Arg Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala 500 505 510 Ala His Ala Ala Asp Leu Ala Lys Gly His Pro Tyr Ala Gln Glu Trp 515 520 525 Asp Asn Ala Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Tyr Asp Gln 530 535 540 Phe His Leu Ser Leu Asp Pro Val Thr Ala Arg Leu Phe His Asp Ala 545 550 555 560 Thr Leu Pro Gln Glu Pro Ala Lys Thr Ala His Phe Cys Ser Met Cys 565 570 575 Gly Pro Lys Phe Cys Ser Met Gln Ile Thr Gln Asp Leu Arg Glu Tyr 580 585 590 Ala Lys Asn His Gln Met Glu Glu Asp Glu Ala Ile Gln Thr Gly Met 595 600 605 Ala Glu Met Ser Glu Gln Phe Lys Ser Ile Gly Ala Glu Val Tyr Leu 610 615 620 Asp Glu Ala Val Leu Glu His Ala 625 630 <210> 126 <211> 40 <212> PRT <213> Unknown <220> <223> Coccomyxa species <400> 126 Met Thr Thr Asn Leu Ala Lys Leu Pro Leu Gly Gly Leu Ser Ser Arg 1 5 10 15 Ser Ser Ile Ala Gly Ala Pro Leu Arg Val Asn Ser His Ser Arg Glu 20 25 30 Arg His Leu Gly Ala Lys Thr Thr 35 40 <210> 127 <211> 6649 <212> DNA <213> Unknown <220> <223> Coccomyxa species <400> 127 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080 gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140 acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200 acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260 tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320 tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380 acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440 cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500 ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560 cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620 actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680 tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740 ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800 cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860 ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920 tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980 agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040 tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100 agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160 tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220 agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280 ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340 ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400 cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460 cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520 gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580 acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640 agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700 atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760 aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820 gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880 accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940 cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000 ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060 gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120 cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180 gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240 atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta tgacacttcc 3300 agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac accgatgatg 3360 cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc tccagggcga 3420 gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct accaaagcca 3480 tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg tgatcgcact 3540 ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca ctagtatgac 3600 caccaacctg gctaagctgc ctctcggcgg cctctcttct cggtcgtcca tcgccggggc 3660 tcctctgcgc gtgaacagcc acagccgcga gcgccacctg ggcgccaaga ccaccgcgat 3720 cgccgctccc gagcggctgg actacctcga caacgcggag gaggcgcggc tgcagcagac 3780 ggacgccttc gccgagctga aggcgctgtc gagccgccag tccgtgaacc ggccccaaaa 3840 gggcgagctg tcgttccggc agtcgccgac ctttcaggac tgcttccctg gctcggagaa 3900 gtgctaccgc gaggtggagc acgatggcaa gacgctcaag gtgccttttc gccgggtgca 3960 cctgcaggac gacaacggcc atttcgacct gtacgacacc tctggccccc agggcgtgaa 4020 cccccgcgag ggtctgccca agatccgctc ctcctgggtg gagccgcgcg aggcgcgggg 4080 cgacaaggtg caaacgcagc agtactacgc caagcaaggc atcatcaccg aggagatggc 4140 cttctgcgct gcgcgcgagc gcatggaccc cgagttcatc cggtctgagg tggcccgggg 4200 tcgggccatc atccctgcga acaagcgcca tctggagctg gagccgaccg tcgtgggccg 4260 caactttctg gtcaaggtga acgccaacat cggcaactct gcggtcagct cgagcatcga 4320 ggaggaggtg gagaagctgc agtggagcac catctggggt gccgacacgg ccatggacct 4380 gagcaccggc aacaacatcc acgagacgcg cgagtgggtg atgcgcaaca gcccggtccc 4440 tgtgggtacg gtccctatct accagtgcct ggagaaggcg ggcggcatcg tggagaacat 4500 cacctgggag ctgttccggg agacgctgat cgagcaggcc gagcagggcg tcgactactt 4560 taccatccac gcgggggtcc tgctccgcta catccccctg acggcgaacc gcgtcaccgg 4620 catcgtcagc cgcggcggct ctatccatgc caagctctgc ctgctggacc acaccgagaa 4680 cttcgcctac atgcactggg acgagatcct ggacatctgc gcccagtacg acatcaccct 4740 gtcgatcggc gacggcctgc gccccggctg catcgcggac gccaacgacg ctgcccagtt 4800 tgctgagctg aagacccagg gcgagctgac ccgccgcgcc tgggcgaagg acgtgcaggt 4860 gatgaacgag ggtcccggcc atgtgccgct gcacaagatc cccgagaaca tggagaagca 4920 gctggactgg tgcagcgagg cgcccttcta cacgctcggc cccctggcga cggacatcgc 4980 gcctgcgtac gaccacatca cctccgcgat cggcgccgcc acgatcggcg cgctggggac 5040 cgcgctgctg tgttacgtga ccccgaagga gcacctgggc ctccccgatc gcgacgacgt 5100 gaaggccggg gtgatcgcct acaagatcgc ggcgcacgcg gctgacctgg cgaagggtca 5160 cccctacgct caggagtggg ataacgccct ctctaaggcg cgcttcgagt tccggtggta 5220 cgaccagttc cacctgtcgc tggaccccgt caccgcccgc ctgttccatg acgcgaccct 5280 gccgcaggag cccgccaaga ccgcccactt ctgctccatg tgcggcccca agttctgctc 5340 catgcagatc acccaggacc tccgcgagta cgccaagaac catcaaatgg aggaggacga 5400 ggcgatccaa accggcatgg ccgagatgtc cgagcagttc aagagcatcg gcgcggaggt 5460 ctacctcgac gaggcggtgc tggagcacgc gtaagcagca gcagctcgga tagtatcgac 5520 acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 5580 gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 5640 tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 5700 cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 5760 gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 5820 ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 5880 tgggaacaca aatggaaagc ttgagctctt gttttccaga aggagttgct ccttgagcct 5940 ttcattctca gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta 6000 aaagcttgga atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa 6060 aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat 6120 ctgccctgtt gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc 6180 tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg 6240 acacccgcca ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc 6300 atatttctcg aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct 6360 ggtgcttgcg gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca 6420 ccacccccgc gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg 6480 ctggcccagg cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc 6540 cttctgccgc tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc 6600 gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag ctgaagagc 6649 <210> 128 <211> 1899 <212> DNA <213> Unknown <220> <223> Coccomyxa species <400> 128 atgaccacca acctggctaa gctgcctctc ggcggcctct cttctcggtc gtccatcgcc 60 ggggctcctc tgcgcgtgaa cagccacagc cgcgagcgcc acctgggcgc caagaccacc 120 gcgatcgccg ctcccgagcg gctggactac ctcgacaacg cggaggaggc gcggctgcag 180 cagacggacg ccttcgccga gctgaaggcg ctgtcgagcc gccagtccgt gaaccggccc 240 caaaagggcg agctgtcgtt ccggcagtcg ccgacctttc aggactgctt ccctggctcg 300 gagaagtgct accgcgaggt ggagcacgat ggcaagacgc tcaaggtgcc ttttcgccgg 360 gtgcacctgc aggacgacaa cggccatttc gacctgtacg acacctctgg cccccagggc 420 gtgaaccccc gcgagggtct gcccaagatc cgctcctcct gggtggagcc gcgcgaggcg 480 cggggcgaca aggtgcaaac gcagcagtac tacgccaagc aaggcatcat caccgaggag 540 atggccttct gcgctgcgcg cgagcgcatg gaccccgagt tcatccggtc tgaggtggcc 600 cggggtcggg ccatcatccc tgcgaacaag cgccatctgg agctggagcc gaccgtcgtg 660 ggccgcaact ttctggtcaa ggtgaacgcc aacatcggca actctgcggt cagctcgagc 720 atcgaggagg aggtggagaa gctgcagtgg agcaccatct ggggtgccga cacggccatg 780 gacctgagca ccggcaacaa catccacgag acgcgcgagt gggtgatgcg caacagcccg 840 gtccctgtgg gtacggtccc tatctaccag tgcctggaga aggcgggcgg catcgtggag 900 aacatcacct gggagctgtt ccgggagacg ctgatcgagc aggccgagca gggcgtcgac 960 tactttacca tccacgcggg ggtcctgctc cgctacatcc ccctgacggc gaaccgcgtc 1020 accggcatcg tcagccgcgg cggctctatc catgccaagc tctgcctgct ggaccacacc 1080 gagaacttcg cctacatgca ctgggacgag atcctggaca tctgcgccca gtacgacatc 1140 accctgtcga tcggcgacgg cctgcgcccc ggctgcatcg cggacgccaa cgacgctgcc 1200 cagtttgctg agctgaagac ccagggcgag ctgacccgcc gcgcctgggc gaaggacgtg 1260 caggtgatga acgagggtcc cggccatgtg ccgctgcaca agatccccga gaacatggag 1320 aagcagctgg actggtgcag cgaggcgccc ttctacacgc tcggccccct ggcgacggac 1380 atcgcgcctg cgtacgacca catcacctcc gcgatcggcg ccgccacgat cggcgcgctg 1440 gggaccgcgc tgctgtgtta cgtgaccccg aaggagcacc tgggcctccc cgatcgcgac 1500 gacgtgaagg ccggggtgat cgcctacaag atcgcggcgc acgcggctga cctggcgaag 1560 ggtcacccct acgctcagga gtgggataac gccctctcta aggcgcgctt cgagttccgg 1620 tggtacgacc agttccacct gtcgctggac cccgtcaccg cccgcctgtt ccatgacgcg 1680 accctgccgc aggagcccgc caagaccgcc cacttctgct ccatgtgcgg ccccaagttc 1740 tgctccatgc agatcaccca ggacctccgc gagtacgcca agaaccatca aatggaggag 1800 gacgaggcga tccaaaccgg catggccgag atgtccgagc agttcaagag catcggcgcg 1860 gaggtctacc tcgacgaggc ggtgctggag cacgcgtaa 1899 <210> 129 <211> 1613 <212> DNA <213> Saccharomyces cerevisiae <400> 129 ggcgcgccat gctgctgcag gccttcctgt tcctgctggc cggcttcgcc gccaagatca 60 gcgcctccat gacgaacgag acgtccgacc gccccctggt gcacttcacc cccaacaagg 120 gctggatgaa cgaccccaac ggcctgtggt acgacgagaa ggacgccaag tggcacctgt 180 acttccagta caacccgaac gacaccgtct gggggacgcc cttgttctgg ggccacgcca 240 cgtccgacga cctgaccaac tgggaggacc agcccatcgc catcgccccg aagcgcaacg 300 actccggcgc cttctccggc tccatggtgg tggactacaa caacacctcc ggcttcttca 360 acgacaccat cgacccgcgc cagcgctgcg tggccatctg gacctacaac accccggagt 420 ccgaggagca gtacatctcc tacagcctgg acggcggcta caccttcacc gagtaccaga 480 agaaccccgt gctggccgcc aactccaccc agttccgcga cccgaaggtc ttctggtacg 540 agccctccca gaagtggatc atgaccgcgg ccaagtccca ggactacaag atcgagatct 600 actcctccga cgacctgaag tcctggaagc tggagtccgc gttcgccaac gagggcttcc 660 tcggctacca gtacgagtgc cccggcctga tcgaggtccc caccgagcag gaccccagca 720 agtcctactg ggtgatgttc atctccatca accccggcgc cccggccggc ggctccttca 780 accagtactt cgtcggcagc ttcaacggca cccacttcga ggccttcgac aaccagtccc 840 gcgtggtgga cttcggcaag gactactacg ccctgcagac cttcttcaac accgacccga 900 cctacgggag cgccctgggc atcgcgtggg cctccaactg ggagtactcc gccttcgtgc 960 ccaccaaccc ctggcgctcc tccatgtccc tcgtgcgcaa gttctccctc aacaccgagt 1020 accaggccaa cccggagacg gagctgatca acctgaaggc cgagccgatc ctgaacatca 1080 gcaacgccgg cccctggagc cggttcgcca ccaacaccac gttgacgaag gccaacagct 1140 acaacgtcga cctgtccaac agcaccggca ccctggagtt cgagctggtg tacgccgtca 1200 acaccaccca gacgatctcc aagtccgtgt tcgcggacct ctccctctgg ttcaagggcc 1260 tggaggaccc cgaggagtac ctccgcatgg gcttcgaggt gtccgcgtcc tccttcttcc 1320 tggaccgcgg gaacagcaag gtgaagttcg tgaaggagaa cccctacttc accaaccgca 1380 tgagcgtgaa caaccagccc ttcaagagcg agaacgacct gtcctactac aaggtgtacg 1440 gcttgctgga ccagaacatc ctggagctgt acttcaacga cggcgacgtc gtgtccacca 1500 acacctactt catgaccacc gggaacgccc tgggctccgt gaacatgacg acgggggtgg 1560 acaacctgtt ctacatcgac aagttccagg tgcgcgaggt caagtgacaa ttg 1613 <210> 130 <211> 3660 <212> DNA <213> Artificial Sequence <220> <223> synthetic nucleotide <400> 130 gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60 tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120 gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180 gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240 ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300 ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360 ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420 gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480 gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540 gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600 ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660 ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720 ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780 gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840 tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 900 ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccgc 960 gatcgccgct cccgagcggc tggactacct cgacaacgcg gaggaggcgc ggctgcagca 1020 gacggacgcc ttcgccgagc tgaaggcgct gtcgagccgc cagtccgtga accggcccca 1080 aaagggcgag ctgtcgttcc ggcagtcgcc gacctttcag gactgcttcc ctggctcgga 1140 gaagtgctac cgcgaggtgg agcacgatgg caagacgctc aaggtgcctt ttcgccgggt 1200 gcacctgcag gacgacaacg gccatttcga cctgtacgac acctctggcc cccagggcgt 1260 gaacccccgc gagggtctgc ccaagatccg ctcctcctgg gtggagccgc gcgaggcgcg 1320 gggcgacaag gtgcaaacgc agcagtacta cgccaagcaa ggcatcatca ccgaggagat 1380 ggccttctgc gctgcgcgcg agcgcatgga ccccgagttc atccggtctg aggtggcccg 1440 gggtcgggcc atcatccctg cgaacaagcg ccatctggag ctggagccga ccgtcgtggg 1500 ccgcaacttt ctggtcaagg tgaacgccaa catcggcaac tctgcggtca gctcgagcat 1560 cgaggaggag gtggagaagc tgcagtggag caccatctgg ggtgccgaca cggccatgga 1620 cctgagcacc ggcaacaaca tccacgagac gcgcgagtgg gtgatgcgca acagcccggt 1680 ccctgtgggt acggtcccta tctaccagtg cctggagaag gcgggcggca tcgtggagaa 1740 catcacctgg gagctgttcc gggagacgct gatcgagcag gccgagcagg gcgtcgacta 1800 ctttaccatc cacgcggggg tcctgctccg ctacatcccc ctgacggcga accgcgtcac 1860 cggcatcgtc agccgcggcg gctctatcca tgccaagctc tgcctgctgg accacaccga 1920 gaacttcgcc tacatgcact gggacgagat cctggacatc tgcgcccagt acgacatcac 1980 cctgtcgatc ggcgacggcc tgcgccccgg ctgcatcgcg gacgccaacg acgctgccca 2040 gtttgctgag ctgaagaccc agggcgagct gacccgccgc gcctgggcga aggacgtgca 2100 ggtgatgaac gagggtcccg gccatgtgcc gctgcacaag atccccgaga acatggagaa 2160 gcagctggac tggtgcagcg aggcgccctt ctacacgctc ggccccctgg cgacggacat 2220 cgcgcctgcg tacgaccaca tcacctccgc gatcggcgcc gccacgatcg gcgcgctggg 2280 gaccgcgctg ctgtgttacg tgaccccgaa ggagcacctg ggcctccccg atcgcgacga 2340 cgtgaaggcc ggggtgatcg cctacaagat cgcggcgcac gcggctgacc tggcgaaggg 2400 tcacccctac gctcaggagt gggataacgc cctctctaag gcgcgcttcg agttccggtg 2460 gtacgaccag ttccacctgt cgctggaccc cgtcaccgcc cgcctgttcc atgacgcgac 2520 cctgccgcag gagcccgcca agaccgccca cttctgctcc atgtgcggcc ccaagttctg 2580 ctccatgcag atcacccagg acctccgcga gtacgccaag aaccatcaaa tggaggagga 2640 cgaggcgatc caaaccggca tggccgagat gtccgagcag ttcaagagca tcggcgcgga 2700 ggtctacctc gacgaggcgg tgctggagca cgcgtaacaa ttgaagcagc agcagctcgg 2760 atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 2820 ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 2880 gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 2940 tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 3000 tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 3060 ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 3120 aagtagtggg atgggaacac aaatggaaag cttgagctca gaatagtatc gggtgatgcg 3180 aagtcagaac caggcagggc ctgtcgcctg aggtggcaac gatgggaagc aatcaatctg 3240 ggtacagtcg tccgcacgat cccgtgatct cccccaccga cacctatccc cgcccatccc 3300 ggcccaccct ttcagtcccc tcagcatgca ttgtgcaccg cgacaaagca tgtctgctcg 3360 tgcactggtt caggccacgg cgcaccgagt cctcgccctt cgcagagtga tcaccctccc 3420 cggaaccagc cacgctcgct gctgcgggcc gatcagccgc gcgcactccc tgcaactagg 3480 gacaactcag gcaaccacgc gcctcacaag catggccgcc gtggcatcca acccgctcgt 3540 gacggtgggt gcgcaagtgc caggggcctc gtcgtcacgg cgtgcatcct cgagggatgc 3600 gatccggcaa ctatatgtcg tttatctccc caccaatcac aggatgagcc cctgtctaga 3660 <210> 131 <211> 1905 <212> DNA <213> Artificial Sequence <220> <223> synthetic nucleotide <400> 131 actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60 cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120 gcgatcgccg ctcccgagcg gctggactac ctcgacaacg cggaggaggc gcggctgcag 180 cagacggacg ccttcgccga gctgaaggcg ctgtcgagcc gccagtccgt gaaccggccc 240 caaaagggcg agctgtcgtt ccggcagtcg ccgacctttc aggactgctt ccctggctcg 300 gagaagtgct accgcgaggt ggagcacgat ggcaagacgc tcaaggtgcc ttttcgccgg 360 gtgcacctgc aggacgacaa cggccatttc gacctgtacg acacctctgg cccccagggc 420 gtgaaccccc gcgagggtct gcccaagatc cgctcctcct gggtggagcc gcgcgaggcg 480 cggggcgaca aggtgcaaac gcagcagtac tacgccaagc aaggcatcat caccgaggag 540 atggccttct gcgctgcgcg cgagcgcatg gaccccgagt tcatccggtc tgaggtggcc 600 cggggtcggg ccatcatccc tgcgaacaag cgccatctgg agctggagcc gaccgtcgtg 660 ggccgcaact ttctggtcaa ggtgaacgcc aacatcggca actctgcggt cagctcgagc 720 atcgaggagg aggtggagaa gctgcagtgg agcaccatct ggggtgccga cacggccatg 780 gacctgagca ccggcaacaa catccacgag acgcgcgagt gggtgatgcg caacagcccg 840 gtccctgtgg gtacggtccc tatctaccag tgcctggaga aggcgggcgg catcgtggag 900 aacatcacct gggagctgtt ccgggagacg ctgatcgagc aggccgagca gggcgtcgac 960 tactttacca tccacgcggg ggtcctgctc cgctacatcc ccctgacggc gaaccgcgtc 1020 accggcatcg tcagccgcgg cggctctatc catgccaagc tctgcctgct ggaccacacc 1080 gagaacttcg cctacatgca ctgggacgag atcctggaca tctgcgccca gtacgacatc 1140 accctgtcga tcggcgacgg cctgcgcccc ggctgcatcg cggacgccaa cgacgctgcc 1200 cagtttgctg agctgaagac ccagggcgag ctgacccgcc gcgcctgggc gaaggacgtg 1260 caggtgatga acgagggtcc cggccatgtg ccgctgcaca agatccccga gaacatggag 1320 aagcagctgg actggtgcag cgaggcgccc ttctacacgc tcggccccct ggcgacggac 1380 atcgcgcctg cgtacgacca catcacctcc gcgatcggcg ccgccacgat cggcgcgctg 1440 gggaccgcgc tgctgtgtta cgtgaccccg aaggagcacc tgggcctccc cgatcgcgac 1500 gacgtgaagg ccggggtgat cgcctacaag atcgcggcgc acgcggctga cctggcgaag 1560 ggtcacccct acgctcagga gtgggataac gccctctcta aggcgcgctt cgagttccgg 1620 tggtacgacc agttccacct gtcgctggac cccgtcaccg cccgcctgtt ccatgacgcg 1680 accctgccgc aggagcccgc caagaccgcc cacttctgct ccatgtgcgg ccccaagttc 1740 tgctccatgc agatcaccca ggacctccgc gagtacgcca agaaccatca aatggaggag 1800 gacgaggcga tccaaaccgg catggccgag atgtccgagc agttcaagag catcggcgcg 1860 gaggtctacc tcgacgaggc ggtgctggag cacgcgtaac aattg 1905 <210> 132 <211> 1182 <212> DNA <213> Chlorella protothecoides <400> 132 actagagagt ttaggtccag cgtccgtggg gggggacggg ctgggagctt gggccgggaa 60 gggcaagacg atgcagtccc tctggggagt cacagccgac tgtgtgtgtt gcactgtgcg 120 gcccgcagca ctcacacgca aaatgcctgg ccgacaggca ggccctgtcc agtgcaacat 180 ccacggtccc tctcatcagg ctcaccttgc tcattgacat aacggaatgc gtaccgctct 240 ttcagatctg tccatccaga gaggggagca ggctccccac cgacgctgtc aaacttgctt 300 cctgcccaac cgaaaacatt attgtttgag gggggggggg ggggggcaga ttgcatggcg 360 ggatatctcg tgaggaacat cactgggaca ctgtggaaca cagtgagtgc agtatgcaga 420 gcatgtatgc taggggtcag cgcaggaagg gggcctttcc cagtctccca tgccactgca 480 ccgtatccac gactcaccag gaccagcttc ttgatcggct tccgctcccg tggacaccag 540 tgtgtagcct ctggactcca ggtatgcgtg caccgcaaag gccagccgat cgtgccgatt 600 cctggggtgg aggatatgag tcagccaact tggggctcag agtgcacact ggggcacgat 660 acgaaacaac atctacaccg tgtcctccat gctgacacac cacagcttcg ctccacctga 720 atgtgggcgc atgggcccga atcacagcca atgtcgctgc tgccataatg tgatccagac 780 cctctccgcc cagatgccga gcggatcgtg ggcgctgaat agattcctgt ttcgatcact 840 gtttgggtcc tttccttttc gtctcggatg cgcgtctcga aacaggctgc gtcgggcttt 900 cggatccctt ttgctccctc cgtcaccatc ctgcgcgcgg gcaagttgct tgaccctggg 960 ctggtaccag ggttggaggg tattaccgcg tcaggccatt cccagcccgg attcaattca 1020 aagtctgggc caccaccctc cgccgctctg tctgatcact ccacattcgt gcatacacta 1080 cgttcaagtc ctgatccagg cgtgtctcgg gacaaggtgt gcttgagttt gaatctcaag 1140 gacccactcc agcacagctg ctggttgacc ccgccctcgc aa 1182 <210> 133 <211> 161 <212> DNA <213> Chlorella protothecoides <400> 133 acggagcgtc gtgcgggagg gagtgtgccg agcggggagt cccggtctgt gcgaggcccg 60 gcagctgacg ctggcgagcc gtacgccccg agggtccccc tcccctgcac cctcttcccc 120 ttccctctga cggccgcgcc tgttcttgca tgttcagcga c 161 <210> 134 <211> 6306 <212> DNA <213> Arabidopsis thaliana <400> 134 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080 tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140 tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200 accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260 gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320 tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380 gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440 tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500 ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560 ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620 gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680 cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740 gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800 tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860 gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920 ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980 tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040 ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100 tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160 tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220 cacgggaagt agtgggatgg gaacacaaat ggaggatcca ctagagagtt taggtccagc 2280 gtccgtgggg ggggacgggc tgggagcttg ggccgggaag ggcaagacga tgcagtccct 2340 ctggggagtc acagccgact gtgtgtgttg cactgtgcgg cccgcagcac tcacacgcaa 2400 aatgcctggc cgacaggcag gccctgtcca gtgcaacatc cacggtccct ctcatcaggc 2460 tcaccttgct cattgacata acggaatgcg taccgctctt tcagatctgt ccatccagag 2520 aggggagcag gctccccacc gacgctgtca aacttgcttc ctgcccaacc gaaaacatta 2580 ttgtttgagg gggggggggg gggggcagat tgcatggcgg gatatctcgt gaggaacatc 2640 actgggacac tgtggaacac agtgagtgca gtatgcagag catgtatgct aggggtcagc 2700 gcaggaaggg ggcctttccc agtctcccat gccactgcac cgtatccacg actcaccagg 2760 accagcttct tgatcggctt ccgctcccgt ggacaccagt gtgtagcctc tggactccag 2820 gtatgcgtgc accgcaaagg ccagccgatc gtgccgattc ctggggtgga ggatatgagt 2880 cagccaactt ggggctcaga gtgcacactg gggcacgata cgaaacaaca tctacaccgt 2940 gtcctccatg ctgacacacc acagcttcgc tccacctgaa tgtgggcgca tgggcccgaa 3000 tcacagccaa tgtcgctgct gccataatgt gatccagacc ctctccgccc agatgccgag 3060 cggatcgtgg gcgctgaata gattcctgtt tcgatcactg tttgggtcct ttccttttcg 3120 tctcggatgc gcgtctcgaa acaggctgcg tcgggctttc ggatcccttt tgctccctcc 3180 gtcaccatcc tgcgcgcggg caagttgctt gaccctgggc tggtaccagg gttggagggt 3240 attaccgcgt caggccattc ccagcccgga ttcaattcaa agtctgggcc accaccctcc 3300 gccgctctgt ctgatcactc cacattcgtg catacactac gttcaagtcc tgatccaggc 3360 gtgtctcggg acaaggtgtg cttgagtttg aatctcaagg acccactcca gcacagctgc 3420 tggttgaccc cgccctcgca aactagtatg gccaccgcat ccactttctc ggcgttcaat 3480 gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc agcgaggccc 3540 ctccccgtgc gcgggcgcgc cgtccaggcc gcggccaccc gcttcaagaa ggagacgacg 3600 accacccgcg ccacgctgac gttcgacccc cccacgacca actccgagcg cgccaagcag 3660 cgcaagcaca ccatcgaccc ctcctccccc gacttccagc ccatcccctc cttcgaggag 3720 tgcttcccca agtccacgaa ggagcacaag gaggtggtgc acgaggagtc cggccacgtc 3780 ctgaaggtgc ccttccgccg cgtgcacctg tccggcggcg agcccgcctt cgacaactac 3840 gacacgtccg gcccccagaa cgtcaacgcc cacatcggcc tggcgaagct gcgcaaggag 3900 tggatcgacc gccgcgagaa gctgggcacg ccccgctaca cgcagatgta ctacgcgaag 3960 cagggcatca tcacggagga gatgctgtac tgcgcgacgc gcgagaagct ggaccccgag 4020 ttcgtccgct ccgaggtcgc gcggggccgc gccatcatcc cctccaacaa gaagcacctg 4080 gagctggagc ccatgatcgt gggccgcaag ttcctggtga aggtgaacgc gaacatcggc 4140 aactccgccg tggcctcctc catcgaggag gaggtctaca aggtgcagtg ggccaccatg 4200 tggggcgccg acaccatcat ggacctgtcc acgggccgcc acatccacga gacgcgcgag 4260 tggatcctgc gcaactccgc ggtccccgtg ggcaccgtcc ccatctacca ggcgctggag 4320 aaggtggacg gcatcgcgga gaacctgaac tgggaggtgt tccgcgagac gctgatcgag 4380 caggccgagc agggcgtgga ctacttcacg atccacgcgg gcgtgctgct gcgctacatc 4440 cccctgaccg ccaagcgcct gacgggcatc gtgtcccgcg gcggctccat ccacgcgaag 4500 tggtgcctgg cctaccacaa ggagaacttc gcctacgagc actgggacga catcctggac 4560 atctgcaacc agtacgacgt cgccctgtcc atcggcgacg gcctgcgccc cggctccatc 4620 tacgacgcca acgacacggc ccagttcgcc gagctgctga cccagggcga gctgacgcgc 4680 cgcgcgtggg agaaggacgt gcaggtgatg aacgagggcc ccggccacgt gcccatgcac 4740 aagatccccg agaacatgca gaagcagctg gagtggtgca acgaggcgcc cttctacacc 4800 ctgggccccc tgacgaccga catcgcgccc ggctacgacc acatcacctc cgccatcggc 4860 gcggccaaca tcggcgccct gggcaccgcc ctgctgtgct acgtgacgcc caaggagcac 4920 ctgggcctgc ccaaccgcga cgacgtgaag gcgggcgtca tcgcctacaa gatcgccgcc 4980 cacgcggccg acctggccaa gcagcacccc cacgcccagg cgtgggacga cgcgctgtcc 5040 aaggcgcgct tcgagttccg ctggatggac cagttcgcgc tgtccctgga ccccatgacg 5100 gcgatgtcct tccacgacga gacgctgccc gcggacggcg cgaaggtcgc ccacttctgc 5160 tccatgtgcg gccccaagtt ctgctccatg aagatcacgg aggacatccg caagtacgcc 5220 gaggagaacg gctacggctc cgccgaggag gccatccgcc agggcatgga cgccatgtcc 5280 gaggagttca acatcgccaa gaagacgatc tccggcgagc agcacggcga ggtcggcggc 5340 gagatctacc tgcccgagtc ctacgtcaag gccgcgcaga agtgatacgt actcgagacg 5400 gagcgtcgtg cgggagggag tgtgccgagc ggggagtccc ggtctgtgcg aggcccggca 5460 gctgacgctg gcgagccgta cgccccgagg gtccccctcc cctgcaccct cttccccttc 5520 cctctgacgg ccgcgcctgt tcttgcatgt tcagcgacga gctcttgttt tccagaagga 5580 gttgctcctt gagcctttca ttctcagcct cgataacctc caaagccgct ctaattgtgg 5640 agggggttcg aatttaaaag cttggaatgt tggttcgtgc gtctggaaca agcccagact 5700 tgttgctcac tgggaaaagg accatcagct ccaaaaaact tgccgctcaa accgcgtacc 5760 tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac attcatattg tgacgcttga 5820 gcagtctgta attgcctcag aatgtggaat catctgcccc ctgtgcgagc ccatgccagg 5880 catgtcgcgg gcgaggacac ccgccactcg tacagcagac cattatgcta cctcacaata 5940 gttcataaca gtgaccatat ttctcgaagc tccccaacga gcacctccat gctctgagtg 6000 gccacccccc ggccctggtg cttgcggagg gcaggtcaac cggcatgggg ctaccgaaat 6060 ccccgaccgg atcccaccac ccccgcgatg ggaagaatct ctccccggga tgtgggccca 6120 ccaccagcac aacctgctgg cccaggcgag cgtcaaacca taccacacaa atatccttgg 6180 catcggccct gaattccttc tgccgctctg ctacccggtg cttctgtccg aagcaggggt 6240 tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg gcggggcttg ttcgagcttg 6300 aagagc 6306 <210> 135 <211> 1938 <212> DNA <213> Artificial Sequence <220> <223> synthesized nucleotide <400> 135 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgtccag 120 gccgcggcca cccgcttcaa gaaggagacg acgaccaccc gcgccacgct gacgttcgac 180 ccccccacga ccaactccga gcgcgccaag cagcgcaagc acaccatcga cccctcctcc 240 cccgacttcc agcccatccc ctccttcgag gagtgcttcc ccaagtccac gaaggagcac 300 aaggaggtgg tgcacgagga gtccggccac gtcctgaagg tgcccttccg ccgcgtgcac 360 ctgtccggcg gcgagcccgc cttcgacaac tacgacacgt ccggccccca gaacgtcaac 420 gcccacatcg gcctggcgaa gctgcgcaag gagtggatcg accgccgcga gaagctgggc 480 acgccccgct acacgcagat gtactacgcg aagcagggca tcatcacgga ggagatgctg 540 tactgcgcga cgcgcgagaa gctggacccc gagttcgtcc gctccgaggt cgcgcggggc 600 cgcgccatca tcccctccaa caagaagcac ctggagctgg agcccatgat cgtgggccgc 660 aagttcctgg tgaaggtgaa cgcgaacatc ggcaactccg ccgtggcctc ctccatcgag 720 gaggaggtct acaaggtgca gtgggccacc atgtggggcg ccgacaccat catggacctg 780 tccacgggcc gccacatcca cgagacgcgc gagtggatcc tgcgcaactc cgcggtcccc 840 gtgggcaccg tccccatcta ccaggcgctg gagaaggtgg acggcatcgc ggagaacctg 900 aactgggagg tgttccgcga gacgctgatc gagcaggccg agcagggcgt ggactacttc 960 acgatccacg cgggcgtgct gctgcgctac atccccctga ccgccaagcg cctgacgggc 1020 atcgtgtccc gcggcggctc catccacgcg aagtggtgcc tggcctacca caaggagaac 1080 ttcgcctacg agcactggga cgacatcctg gacatctgca accagtacga cgtcgccctg 1140 tccatcggcg acggcctgcg ccccggctcc atctacgacg ccaacgacac ggcccagttc 1200 gccgagctgc tgacccaggg cgagctgacg cgccgcgcgt gggagaagga cgtgcaggtg 1260 atgaacgagg gccccggcca cgtgcccatg cacaagatcc ccgagaacat gcagaagcag 1320 ctggagtggt gcaacgaggc gcccttctac accctgggcc ccctgacgac cgacatcgcg 1380 cccggctacg accacatcac ctccgccatc ggcgcggcca acatcggcgc cctgggcacc 1440 gccctgctgt gctacgtgac gcccaaggag cacctgggcc tgcccaaccg cgacgacgtg 1500 aaggcgggcg tcatcgccta caagatcgcc gcccacgcgg ccgacctggc caagcagcac 1560 ccccacgccc aggcgtggga cgacgcgctg tccaaggcgc gcttcgagtt ccgctggatg 1620 gaccagttcg cgctgtccct ggaccccatg acggcgatgt ccttccacga cgagacgctg 1680 cccgcggacg gcgcgaaggt cgcccacttc tgctccatgt gcggccccaa gttctgctcc 1740 atgaagatca cggaggacat ccgcaagtac gccgaggaga acggctacgg ctccgccgag 1800 gaggccatcc gccagggcat ggacgccatg tccgaggagt tcaacatcgc caagaagacg 1860 atctccggcg agcagcacgg cgaggtcggc ggcgagatct acctgcccga gtcctacgtc 1920 aaggccgcgc agaagtga 1938 <210> 136 <211> 644 <212> PRT <213> Arabidopsis thaliana <400> 136 Met Ala Ala Ser Val His Cys Thr Leu Met Ser Val Val Cys Asn Asn 1 5 10 15 Lys Asn His Ser Ala Arg Pro Lys Leu Pro Asn Ser Ser Leu Leu Pro 20 25 30 Gly Phe Asp Val Val Val Gln Ala Ala Ala Thr Arg Phe Lys Lys Glu 35 40 45 Thr Thr Thr Thr Arg Ala Thr Leu Thr Phe Asp Pro Pro Thr Thr Asn 50 55 60 Ser Glu Arg Ala Lys Gln Arg Lys His Thr Ile Asp Pro Ser Ser Pro 65 70 75 80 Asp Phe Gln Pro Ile Pro Ser Phe Glu Glu Cys Phe Pro Lys Ser Thr 85 90 95 Lys Glu His Lys Glu Val Val His Glu Glu Ser Gly His Val Leu Lys 100 105 110 Val Pro Phe Arg Arg Val His Leu Ser Gly Gly Glu Pro Ala Phe Asp 115 120 125 Asn Tyr Asp Thr Ser Gly Pro Gln Asn Val Asn Ala His Ile Gly Leu 130 135 140 Ala Lys Leu Arg Lys Glu Trp Ile Asp Arg Arg Glu Lys Leu Gly Thr 145 150 155 160 Pro Arg Tyr Thr Gln Met Tyr Tyr Ala Lys Gln Gly Ile Ile Thr Glu 165 170 175 Glu Met Leu Tyr Cys Ala Thr Arg Glu Lys Leu Asp Pro Glu Phe Val 180 185 190 Arg Ser Glu Val Ala Arg Gly Arg Ala Ile Ile Pro Ser Asn Lys Lys 195 200 205 His Leu Glu Leu Glu Pro Met Ile Val Gly Arg Lys Phe Leu Val Lys 210 215 220 Val Asn Ala Asn Ile Gly Asn Ser Ala Val Ala Ser Ser Ile Glu Glu 225 230 235 240 Glu Val Tyr Lys Val Gln Trp Ala Thr Met Trp Gly Ala Asp Thr Ile 245 250 255 Met Asp Leu Ser Thr Gly Arg His Ile His Glu Thr Arg Glu Trp Ile 260 265 270 Leu Arg Asn Ser Ala Val Pro Val Gly Thr Val Pro Ile Tyr Gln Ala 275 280 285 Leu Glu Lys Val Asp Gly Ile Ala Glu Asn Leu Asn Trp Glu Val Phe 290 295 300 Arg Glu Thr Leu Ile Glu Gln Ala Glu Gln Gly Val Asp Tyr Phe Thr 305 310 315 320 Ile His Ala Gly Val Leu Leu Arg Tyr Ile Pro Leu Thr Ala Lys Arg 325 330 335 Leu Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala Lys Trp Cys 340 345 350 Leu Ala Tyr His Lys Glu Asn Phe Ala Tyr Glu His Trp Asp Asp Ile 355 360 365 Leu Asp Ile Cys Asn Gln Tyr Asp Val Ala Leu Ser Ile Gly Asp Gly 370 375 380 Leu Arg Pro Gly Ser Ile Tyr Asp Ala Asn Asp Thr Ala Gln Phe Ala 385 390 395 400 Glu Leu Leu Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp Glu Lys Asp 405 410 415 Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Met His Lys Ile 420 425 430 Pro Glu Asn Met Gln Lys Gln Leu Glu Trp Cys Asn Glu Ala Pro Phe 435 440 445 Tyr Thr Leu Gly Pro Leu Thr Thr Asp Ile Ala Pro Gly Tyr Asp His 450 455 460 Ile Thr Ser Ala Ile Gly Ala Ala Asn Ile Gly Ala Leu Gly Thr Ala 465 470 475 480 Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu Pro Asn Arg 485 490 495 Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala Ala His Ala 500 505 510 Ala Asp Leu Ala Lys Gln His Pro His Ala Gln Ala Trp Asp Asp Ala 515 520 525 Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Met Asp Gln Phe Ala Leu 530 535 540 Ser Leu Asp Pro Met Thr Ala Met Ser Phe His Asp Glu Thr Leu Pro 545 550 555 560 Ala Asp Gly Ala Lys Val Ala His Phe Cys Ser Met Cys Gly Pro Lys 565 570 575 Phe Cys Ser Met Lys Ile Thr Glu Asp Ile Arg Lys Tyr Ala Glu Glu 580 585 590 Asn Gly Tyr Gly Ser Ala Glu Glu Ala Ile Arg Gln Gly Met Asp Ala 595 600 605 Met Ser Glu Glu Phe Asn Ile Ala Lys Lys Thr Ile Ser Gly Glu Gln 610 615 620 His Gly Glu Val Gly Gly Glu Ile Tyr Leu Pro Glu Ser Tyr Val Lys 625 630 635 640 Ala Ala Gln Lys <210> 137 <211> 6130 <212> DNA <213> Unknown <220> <223> Synechocystis species <400> 137 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080 tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140 tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200 accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260 gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320 tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380 gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440 tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500 ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560 ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620 gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680 cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740 gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800 tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860 gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920 ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980 tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040 ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100 tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160 tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220 cacgggaagt agtgggatgg gaacacaaat ggaggatcca ctagagagtt taggtccagc 2280 gtccgtgggg ggggacgggc tgggagcttg ggccgggaag ggcaagacga tgcagtccct 2340 ctggggagtc acagccgact gtgtgtgttg cactgtgcgg cccgcagcac tcacacgcaa 2400 aatgcctggc cgacaggcag gccctgtcca gtgcaacatc cacggtccct ctcatcaggc 2460 tcaccttgct cattgacata acggaatgcg taccgctctt tcagatctgt ccatccagag 2520 aggggagcag gctccccacc gacgctgtca aacttgcttc ctgcccaacc gaaaacatta 2580 ttgtttgagg gggggggggg gggggcagat tgcatggcgg gatatctcgt gaggaacatc 2640 actgggacac tgtggaacac agtgagtgca gtatgcagag catgtatgct aggggtcagc 2700 gcaggaaggg ggcctttccc agtctcccat gccactgcac cgtatccacg actcaccagg 2760 accagcttct tgatcggctt ccgctcccgt ggacaccagt gtgtagcctc tggactccag 2820 gtatgcgtgc accgcaaagg ccagccgatc gtgccgattc ctggggtgga ggatatgagt 2880 cagccaactt ggggctcaga gtgcacactg gggcacgata cgaaacaaca tctacaccgt 2940 gtcctccatg ctgacacacc acagcttcgc tccacctgaa tgtgggcgca tgggcccgaa 3000 tcacagccaa tgtcgctgct gccataatgt gatccagacc ctctccgccc agatgccgag 3060 cggatcgtgg gcgctgaata gattcctgtt tcgatcactg tttgggtcct ttccttttcg 3120 tctcggatgc gcgtctcgaa acaggctgcg tcgggctttc ggatcccttt tgctccctcc 3180 gtcaccatcc tgcgcgcggg caagttgctt gaccctgggc tggtaccagg gttggagggt 3240 attaccgcgt caggccattc ccagcccgga ttcaattcaa agtctgggcc accaccctcc 3300 gccgctctgt ctgatcactc cacattcgtg catacactac gttcaagtcc tgatccaggc 3360 gtgtctcggg acaaggtgtg cttgagtttg aatctcaagg acccactcca gcacagctgc 3420 tggttgaccc cgccctcgca aactagtatg gccaccgcat ccactttctc ggcgttcaat 3480 gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc agcgaggccc 3540 ctccccgtgc gcgggcgcgc catgcgcacc gcgtgggtcg ccaagcgcca gggccagacg 3600 aacgtctccc agatgcacta cgcgcgcaag ggcgtgatca ccgaggagat ggactacgtg 3660 gcgaagcgcg agaacctgcc cgtggagctg atcaaggacg aggtggcgcg gggccgcatg 3720 atcatccccg ccaacatcaa ccacacgaac ctggagccca tggccatcgg catcgcctcc 3780 aagtgcaagg tcaacgcgaa catcggcgcg tcccccaact cctccaacat cgacgaggag 3840 gtggagaagc tgctgctgtc cgtgaagtac ggcgcggaca cggtgatgga cctgtccacc 3900 ggcggcggcg acctggacgt gatccgcacc gccatcatca acgcctcccc cgtgcccatc 3960 ggcacggtgc ccatctacca ggccctggag tccgtgcacg gctccatcga gaacctgacg 4020 cccgacgact tcctgcacat catcgagaag cacgcccagc agggcgtgga ctacatgacg 4080 atccacgcgg gcctgctgat cgagtacctg cccctggtga agtcccgcat cacgggcatc 4140 gtgtcccgcg gcggcggcat catcgccaag tggatgctgc accaccacaa gcagaacccc 4200 ctgtacacgc acttcgacga gatcatcgag atcttcaaga agtacgacgt gtccttctcc 4260 ctgggcgact ccctgcgccc cggctgcacc cacgacgcct ccgacgacgc ccagctgtcc 4320 gagctgaaga cgctgggcca gctgacgcgc cgcgcctggg agcacgacgt ccaggtcatg 4380 gtggagggcc ccggccacgt ccccatcgac cagatcgagt tcaacgtcaa gaagcagatg 4440 gaggagtgct ccgaggcccc cttctacgtg ctgggccccc tggtcaccga catcgcgccc 4500 ggctacgacc acatcacctc cgcgatcggc gccgccatcg cgggctggca cggcaccgcg 4560 atgctgtgct acgtgacgcc caaggagcac ctgggcctgc ccaacgcgga ggacgtgcgc 4620 aacggcctga tcgcctacaa gatcgccgcg cacgccgcgg acatcgcccg ccaccgcccc 4680 ggcgcgcgcg accgcgacga cgagctgtcc aaggcgcgct acaacttcga ctggaaccgc 4740 cagttcgagc tgtccctgga ccccgagcgc gcgaaggagt accacgacga gacgctgccc 4800 gcggacatct acaagaccgc ggagttctgc tccatgtgcg gccccaagtt ctgccccatg 4860 cagaccaagg tggacgccga gatgctggag gagctggagg tcttcctggc caaggacaag 4920 gagatggtgt cccagcgctg atacgtactc gagacggagc gtcgtgcggg agggagtgtg 4980 ccgagcgggg agtcccggtc tgtgcgaggc ccggcagctg acgctggcga gccgtacgcc 5040 ccgagggtcc ccctcccctg caccctcttc cccttccctc tgacggccgc gcctgttctt 5100 gcatgttcag cgacgagctc ttgttttcca gaaggagttg ctccttgagc ctttcattct 5160 cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 5220 gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 5280 tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 5340 ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 5400 tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 5460 cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 5520 cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 5580 cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 5640 gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 5700 ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 5760 gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 5820 aaacccttgt cgcgtggcgg ggcttgttcg agcttgaaga gcctctagag tcgacctgca 5880 ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 5940 tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 6000 gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 6060 tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 6120 ggcgctcttc 6130 <210> 138 <211> 1494 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 138 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccatgcgc 120 accgcgtggg tcgccaagcg ccagggccag acgaacgtct cccagatgca ctacgcgcgc 180 aagggcgtga tcaccgagga gatggactac gtggcgaagc gcgagaacct gcccgtggag 240 ctgatcaagg acgaggtggc gcggggccgc atgatcatcc ccgccaacat caaccacacg 300 aacctggagc ccatggccat cggcatcgcc tccaagtgca aggtcaacgc gaacatcggc 360 gcgtccccca actcctccaa catcgacgag gaggtggaga agctgctgct gtccgtgaag 420 tacggcgcgg acacggtgat ggacctgtcc accggcggcg gcgacctgga cgtgatccgc 480 accgccatca tcaacgcctc ccccgtgccc atcggcacgg tgcccatcta ccaggccctg 540 gagtccgtgc acggctccat cgagaacctg acgcccgacg acttcctgca catcatcgag 600 aagcacgccc agcagggcgt ggactacatg acgatccacg cgggcctgct gatcgagtac 660 ctgcccctgg tgaagtcccg catcacgggc atcgtgtccc gcggcggcgg catcatcgcc 720 aagtggatgc tgcaccacca caagcagaac cccctgtaca cgcacttcga cgagatcatc 780 gagatcttca agaagtacga cgtgtccttc tccctgggcg actccctgcg ccccggctgc 840 acccacgacg cctccgacga cgcccagctg tccgagctga agacgctggg ccagctgacg 900 cgccgcgcct gggagcacga cgtccaggtc atggtggagg gccccggcca cgtccccatc 960 gaccagatcg agttcaacgt caagaagcag atggaggagt gctccgaggc ccccttctac 1020 gtgctgggcc ccctggtcac cgacatcgcg cccggctacg accacatcac ctccgcgatc 1080 ggcgccgcca tcgcgggctg gcacggcacc gcgatgctgt gctacgtgac gcccaaggag 1140 cacctgggcc tgcccaacgc ggaggacgtg cgcaacggcc tgatcgccta caagatcgcc 1200 gcgcacgccg cggacatcgc ccgccaccgc cccggcgcgc gcgaccgcga cgacgagctg 1260 tccaaggcgc gctacaactt cgactggaac cgccagttcg agctgtccct ggaccccgag 1320 cgcgcgaagg agtaccacga cgagacgctg cccgcggaca tctacaagac cgcggagttc 1380 tgctccatgt gcggccccaa gttctgcccc atgcagacca aggtggacgc cgagatgctg 1440 gaggagctgg aggtcttcct ggccaaggac aaggagatgg tgtcccagcg ctga 1494 <210> 139 <211> 459 <212> PRT <213> Unknown <220> <223> Synechosystis species <400> 139 Met Arg Thr Ala Trp Val Ala Lys Arg Gln Gly Gln Thr Asn Val Ser 1 5 10 15 Gln Met His Tyr Ala Arg Lys Gly Val Ile Thr Glu Glu Met Asp Tyr 20 25 30 Val Ala Lys Arg Glu Asn Leu Pro Val Glu Leu Ile Lys Asp Glu Val 35 40 45 Ala Arg Gly Arg Met Ile Ile Pro Ala Asn Ile Asn His Thr Asn Leu 50 55 60 Glu Pro Met Ala Ile Gly Ile Ala Ser Lys Cys Lys Val Asn Ala Asn 65 70 75 80 Ile Gly Ala Ser Pro Asn Ser Ser Asn Ile Asp Glu Glu Val Glu Lys 85 90 95 Leu Leu Leu Ser Val Lys Tyr Gly Ala Asp Thr Val Met Asp Leu Ser 100 105 110 Thr Gly Gly Gly Asp Leu Asp Val Ile Arg Thr Ala Ile Ile Asn Ala 115 120 125 Ser Pro Val Pro Ile Gly Thr Val Pro Ile Tyr Gln Ala Leu Glu Ser 130 135 140 Val His Gly Ser Ile Glu Asn Leu Thr Pro Asp Asp Phe Leu His Ile 145 150 155 160 Ile Glu Lys His Ala Gln Gln Gly Val Asp Tyr Met Thr Ile His Ala 165 170 175 Gly Leu Leu Ile Glu Tyr Leu Pro Leu Val Lys Ser Arg Ile Thr Gly 180 185 190 Ile Val Ser Arg Gly Gly Gly Ile Ile Ala Lys Trp Met Leu His His 195 200 205 His Lys Gln Asn Pro Leu Tyr Thr His Phe Asp Glu Ile Ile Glu Ile 210 215 220 Phe Lys Lys Tyr Asp Val Ser Phe Ser Leu Gly Asp Ser Leu Arg Pro 225 230 235 240 Gly Cys Thr His Asp Ala Ser Asp Asp Ala Gln Leu Ser Glu Leu Lys 245 250 255 Thr Leu Gly Gln Leu Thr Arg Arg Ala Trp Glu His Asp Val Gln Val 260 265 270 Met Val Glu Gly Pro Gly His Val Pro Ile Asp Gln Ile Glu Phe Asn 275 280 285 Val Lys Lys Gln Met Glu Glu Cys Ser Glu Ala Pro Phe Tyr Val Leu 290 295 300 Gly Pro Leu Val Thr Asp Ile Ala Pro Gly Tyr Asp His Ile Thr Ser 305 310 315 320 Ala Ile Gly Ala Ala Ile Ala Gly Trp His Gly Thr Ala Met Leu Cys 325 330 335 Tyr Val Thr Pro Lys Glu His Leu Gly Leu Pro Asn Ala Glu Asp Val 340 345 350 Arg Asn Gly Leu Ile Ala Tyr Lys Ile Ala Ala His Ala Ala Asp Ile 355 360 365 Ala Arg His Arg Pro Gly Ala Arg Asp Arg Asp Asp Glu Leu Ser Lys 370 375 380 Ala Arg Tyr Asn Phe Asp Trp Asn Arg Gln Phe Glu Leu Ser Leu Asp 385 390 395 400 Pro Glu Arg Ala Lys Glu Tyr His Asp Glu Thr Leu Pro Ala Asp Ile 405 410 415 Tyr Lys Thr Ala Glu Phe Cys Ser Met Cys Gly Pro Lys Phe Cys Pro 420 425 430 Met Gln Thr Lys Val Asp Ala Glu Met Leu Glu Glu Leu Glu Val Phe 435 440 445 Leu Ala Lys Asp Lys Glu Met Val Ser Gln Arg 450 455 <210> 140 <211> 312 <212> DNA <213> Artificial Sequence <220> <223> synthesized nucleotide <400> 140 ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60 cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120 gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180 attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240 ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300 caacccgcaa ac 312 <210> 141 <211> 18 <212> DNA <213> Unknown <220> <223> Coccomyxa species <400> 141 gggtgatcgc ctacaaga 18 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthesized primer <400> 142 acgtcgcgac ccatgcttcc 20 <210> 143 <211> 18 <212> DNA <213> Arabidopsis thaliana <400> 143 gcgtcatcgc ctacaaga 18 <210> 144 <211> 18 <212> DNA <213> Unknown <220> <223> Synechosystis sp. <400> 144 cgatgctgtg ctacgtga 18 <210> 145 <211> 1197 <212> DNA <213> Cuphea calophylla <400> 145 atggcttccg cggcattcac catgtcggcg tgccccgcga tgactggcag ggcccctggg 60 gcacgtcgct ccggacggcc agtcgccacc cgcctgaggg ggcgcgcccc caaggccaac 120 ggctccgccg tgtccctgaa gtccggctcc ctggacaccc aggaggacac ctcctcctcc 180 tcctcccccc cccgcacctt catcaaccag ctgcccgact ggtccatgct gctgtccgcc 240 atcaccaccg tgttcgtggc cgccgagaag cagtggacca tgctggaccg caagtccaag 300 cgccccgaca ccctgatgga ccccttcggc gtggaccgcg tggtgcagga cggcgtggtg 360 ttccgccagt ccttctccat ccgctcctac gagatcggcg ccgaccgcac cgcctccatc 420 gagaccctga tgaacatctt ccaggagacc tccctgaacc actgcaagtc catcggcctg 480 ctgaacgacg gcttcggccg cacccccgag atgtgcaagc gcgacctgat ctgggtggtg 540 accaagatgc acatcgaggt gaaccgctac cccacctggg gcgacaccat cgaggtgaac 600 acctgggtgt ccgagtccgg caagaccggc atgggccgcg actggctgat ctccgactgc 660 cacaccggcg agatcctgat ccgcgccacc tccgtgtgcg ccatgatgaa ccagaccacc 720 cgccgcttct ccaagttccc ctacgaggtg cgccaggagc tggcccccca cttcgtggac 780 tccgcccccg tgatcgagga ctaccagaag ctgcacaagc tggacgtgaa gaccggcgac 840 tccatctgca acggcctgac cccccgctgg aacgacctgg acgtgaacca gcacgtgaac 900 aacgtgaagt acatcggctg gattctggag tccgtgccca aggaggtgtt cgagacccag 960 gagctgtgcg gcctgaccct ggagtaccgc cgcgagtgcg gccgcgactc cgtgctgaag 1020 tccgtgaccg ccatggaccc ctccaaggag ggcgaccgct ccctgtacca gcacctgctg 1080 cgcctggagg acggcaccga catcgccaag ggccgcacca agtggcgccc caagaacgcc 1140 ggcaccaacg gcgccatctc caccggcaag acctccaacg gcaactccat ctcctga 1197 <210> 146 <211> 398 <212> PRT <213> Cuphea calophylla <400> 146 Met Ala Ser Ala Ala Phe Thr Met Ser Ala Cys Pro Ala Met Thr Gly 1 5 10 15 Arg Ala Pro Gly Ala Arg Arg Ser Gly Arg Pro Val Ala Thr Arg Leu 20 25 30 Arg Gly Arg Ala Pro Lys Ala Asn Gly Ser Ala Val Ser Leu Lys Ser 35 40 45 Gly Ser Leu Asp Thr Gln Glu Asp Thr Ser Ser Ser Ser Ser Pro Pro 50 55 60 Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ser Ala 65 70 75 80 Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met Leu Asp 85 90 95 Arg Lys Ser Lys Arg Pro Asp Thr Leu Met Asp Pro Phe Gly Val Asp 100 105 110 Arg Val Val Gln Asp Gly Val Val Phe Arg Gln Ser Phe Ser Ile Arg 115 120 125 Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met 130 135 140 Asn Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser Ile Gly Leu 145 150 155 160 Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu 165 170 175 Ile Trp Val Val Thr Lys Met His Ile Glu Val Asn Arg Tyr Pro Thr 180 185 190 Trp Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu Ser Gly Lys 195 200 205 Thr Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys His Thr Gly Glu 210 215 220 Ile Leu Ile Arg Ala Thr Ser Val Cys Ala Met Met Asn Gln Thr Thr 225 230 235 240 Arg Arg Phe Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu Leu Ala Pro 245 250 255 His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Tyr Gln Lys Leu His 260 265 270 Lys Leu Asp Val Lys Thr Gly Asp Ser Ile Cys Asn Gly Leu Thr Pro 275 280 285 Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr 290 295 300 Ile Gly Trp Ile Leu Glu Ser Val Pro Lys Glu Val Phe Glu Thr Gln 305 310 315 320 Glu Leu Cys Gly Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp 325 330 335 Ser Val Leu Lys Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp 340 345 350 Arg Ser Leu Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Asp Ile 355 360 365 Ala Lys Gly Arg Thr Lys Trp Arg Pro Lys Asn Ala Gly Thr Asn Gly 370 375 380 Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Ile Ser 385 390 395 <210> 147 <211> 1275 <212> DNA <213> Ricinus communis <400> 147 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgcctcc 120 accctgaagt ccggctccaa ggaggtggag aacctgaaga agcccttcat gcccccccgc 180 gaggtgcacg tgcaggtgac ccactccatg cccccccaga agatcgagat cttcaagtcc 240 ctggacaact gggccgagga gaacatcctg gtgcacctga agcccgtgga gaagtgctgg 300 cagccccagg acttcctgcc cgaccccgcc tccgacggct tcgacgagca ggtgcgcgag 360 ctgcgcgagc gcgccaagga gatccccgac gactacttcg tggtgctggt gggcgacatg 420 atcaccgagg aggccctgcc cacctaccag accatgctga acaccctgga cggcgtgcgc 480 gacgagaccg gcgcctcccc cacctcctgg gccatctgga cccgcgcctg gaccgccgag 540 gagaaccgcc acggcgacct gctgaacaag tacctgtacc tgtccggccg cgtggacatg 600 cgccagatcg agaagaccat ccagtacctg atcggctccg gcatggaccc ccgcaccgag 660 aactccccct acctgggctt catctacacc tccttccagg agcgcgccac cttcatctcc 720 cacggcaaca ccgcccgcca ggccaaggag cacggcgaca tcaagctggc ccagatctgc 780 ggcaccatcg ccgccgacga gaagcgccac gagaccgcct acaccaagat cgtggagaag 840 ctgttcgaga tcgaccccga cggcaccgtg ctggccttcg ccgacatgat gcgcaagaag 900 atctccatgc ccgcccacct gatgtacgac ggccgcgacg acaacctgtt cgaccacttc 960 tccgccgtgg cccagcgcct gggcgtgtac accgccaagg actacgccga catcctggag 1020 ttcctggtgg gccgctggaa ggtggacaag ctgaccggcc tgtccgccga gggccagaag 1080 gcccaggact acgtgtgccg cctgcccccc cgcatccgcc gcctggagga gcgcgcccag 1140 ggccgcgcca aggaggcccc caccatgccc ttctcctgga tcttcgaccg ccaggtgaag 1200 ctgatggact acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac 1260 gacgacgaca agtga 1275 <210> 148 <211> 424 <212> PRT <213> Ricinus communis <400> 148 Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp 1 5 10 15 Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu 20 25 30 Pro Val Arg Gly Arg Ala Ala Ser Thr Leu Lys Ser Gly Ser Lys Glu 35 40 45 Val Glu Asn Leu Lys Lys Pro Phe Met Pro Pro Arg Glu Val His Val 50 55 60 Gln Val Thr His Ser Met Pro Pro Gln Lys Ile Glu Ile Phe Lys Ser 65 70 75 80 Leu Asp Asn Trp Ala Glu Glu Asn Ile Leu Val His Leu Lys Pro Val 85 90 95 Glu Lys Cys Trp Gln Pro Gln Asp Phe Leu Pro Asp Pro Ala Ser Asp 100 105 110 Gly Phe Asp Glu Gln Val Arg Glu Leu Arg Glu Arg Ala Lys Glu Ile 115 120 125 Pro Asp Asp Tyr Phe Val Val Leu Val Gly Asp Met Ile Thr Glu Glu 130 135 140 Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr Leu Asp Gly Val Arg 145 150 155 160 Asp Glu Thr Gly Ala Ser Pro Thr Ser Trp Ala Ile Trp Thr Arg Ala 165 170 175 Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Leu 180 185 190 Tyr Leu Ser Gly Arg Val Asp Met Arg Gln Ile Glu Lys Thr Ile Gln 195 200 205 Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr Glu Asn Ser Pro Tyr 210 215 220 Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser 225 230 235 240 His Gly Asn Thr Ala Arg Gln Ala Lys Glu His Gly Asp Ile Lys Leu 245 250 255 Ala Gln Ile Cys Gly Thr Ile Ala Ala Asp Glu Lys Arg His Glu Thr 260 265 270 Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe Glu Ile Asp Pro Asp Gly 275 280 285 Thr Val Leu Ala Phe Ala Asp Met Met Arg Lys Lys Ile Ser Met Pro 290 295 300 Ala His Leu Met Tyr Asp Gly Arg Asp Asp Asn Leu Phe Asp His Phe 305 310 315 320 Ser Ala Val Ala Gln Arg Leu Gly Val Tyr Thr Ala Lys Asp Tyr Ala 325 330 335 Asp Ile Leu Glu Phe Leu Val Gly Arg Trp Lys Val Asp Lys Leu Thr 340 345 350 Gly Leu Ser Ala Glu Gly Gln Lys Ala Gln Asp Tyr Val Cys Arg Leu 355 360 365 Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg Ala Gln Gly Arg Ala Lys 370 375 380 Glu Ala Pro Thr Met Pro Phe Ser Trp Ile Phe Asp Arg Gln Val Lys 385 390 395 400 Leu Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile 405 410 415 Asp Tyr Lys Asp Asp Asp Asp Lys 420 <210> 149 <211> 2678 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 149 gctcttcccg caccggctgg ctccacccca acttgaacct cgagaacccc gcgcctggcg 60 tcgaccccgt cgtgctcgtg gggccgcgga aggagcgcgc cgaagacctg gacgtcgtcc 120 tctccaactc ctttggcttt ggcgggcaca attcgtgcgt cggtaccctt tcttgcgcta 180 tgacacttcc agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac 240 accgatgatg cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc 300 tccagggcga gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct 360 accaaagcca tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg 420 tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaacg 480 gcgcgccatg ctgctgcagg ccttcctgtt cctgctggcc ggcttcgccg ccaagatcag 540 cgcctccatg acgaacgaga cgtccgaccg ccccctggtg cacttcaccc ccaacaaggg 600 ctggatgaac gaccccaacg gcctgtggta cgacgagaag gacgccaagt ggcacctgta 660 cttccagtac aacccgaacg acaccgtctg ggggacgccc ttgttctggg gccacgccac 720 gtccgacgac ctgaccaact gggaggacca gcccatcgcc atcgccccga agcgcaacga 780 ctccggcgcc ttctccggct ccatggtggt ggactacaac aacacctccg gcttcttcaa 840 cgacaccatc gacccgcgcc agcgctgcgt ggccatctgg acctacaaca ccccggagtc 900 cgaggagcag tacatctcct acagcctgga cggcggctac accttcaccg agtaccagaa 960 gaaccccgtg ctggccgcca actccaccca gttccgcgac ccgaaggtct tctggtacga 1020 gccctcccag aagtggatca tgaccgcggc caagtcccag gactacaaga tcgagatcta 1080 ctcctccgac gacctgaagt cctggaagct ggagtccgcg ttcgccaacg agggcttcct 1140 cggctaccag tacgagtgcc ccggcctgat cgaggtcccc accgagcagg accccagcaa 1200 gtcctactgg gtgatgttca tctccatcaa ccccggcgcc ccggccggcg gctccttcaa 1260 ccagtacttc gtcggcagct tcaacggcac ccacttcgag gccttcgaca accagtcccg 1320 cgtggtggac ttcggcaagg actactacgc cctgcagacc ttcttcaaca ccgacccgac 1380 ctacgggagc gccctgggca tcgcgtgggc ctccaactgg gagtactccg ccttcgtgcc 1440 caccaacccc tggcgctcct ccatgtccct cgtgcgcaag ttctccctca acaccgagta 1500 ccaggccaac ccggagacgg agctgatcaa cctgaaggcc gagccgatcc tgaacatcag 1560 caacgccggc ccctggagcc ggttcgccac caacaccacg ttgacgaagg ccaacagcta 1620 caacgtcgac ctgtccaaca gcaccggcac cctggagttc gagctggtgt acgccgtcaa 1680 caccacccag acgatctcca agtccgtgtt cgcggacctc tccctctggt tcaagggcct 1740 ggaggacccc gaggagtacc tccgcatggg cttcgaggtg tccgcgtcct ccttcttcct 1800 ggaccgcggg aacagcaagg tgaagttcgt gaaggagaac ccctacttca ccaaccgcat 1860 gagcgtgaac aaccagccct tcaagagcga gaacgacctg tcctactaca aggtgtacgg 1920 cttgctggac cagaacatcc tggagctgta cttcaacgac ggcgacgtcg tgtccaccaa 1980 cacctacttc atgaccaccg ggaacgccct gggctccgtg aacatgacga cgggggtgga 2040 caacctgttc tacatcgaca agttccaggt gcgcgaggtc aagtgacaat tggcagcagc 2100 agctcggata gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca 2160 cttgctgcct tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg 2220 atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc 2280 cccagcatcc ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct 2340 gtcctgctat ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt 2400 ttgggctccg cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat 2460 gcacgggaag tagtgggatg ggaacacaaa tggaggatcg tagagctcat cttccgaaag 2520 tacgacgagt gagcgagctg attctctttg agcggggtcg ggtggttcgg ggagagtgcg 2580 cggaaaggcg cagagacgtg cggccggccg tgtccctccg tcttcccctg gttggtgcta 2640 tagtaacctg cctgtgtcgc gtgcgcgtcg ggaagagc 2678 <210> 150 <211> 1113 <212> DNA <213> Botryococcus braunii <400> 150 aattggaaac cccgcgcaag accgggttgt ttggccgcct gaccggaaag ggggggcctg 60 tcccgaaggg ggtctatctc ttgggggatg tcgggcgcgg aaagtcgatg ttgatggacc 120 tcttcttcga ccatgtcggg gtcgaggcca agagccgcgt ccatttcgcc gagttcatga 180 tggaggtgaa tgaccgcatc gccaccgaac gcgccaagaa gcgggcgacc gatcgccccc 240 gtcgctgcag cccttgccga ggaagtccgg ctgctggcgt tcgacgagat gatggtgacg 300 aacagcccgg acgcgatgat cctgtcgcgg ctgttcaccg cgctgatcga ggcgggggtg 360 acgatcgtca ccacctccaa ccggccgccc agggatctct ataagaacgg gctcaaccgc 420 gagcatttcc tgcccttcat cgcgctgatc gaggcgcggc tggacgtgct ggcgctgaac 480 ggcccgaccg actatcggcg cgaccggctg gggcggctgg acacgtggtt ggtgcccaat 540 ggccccaagg cgacgattac cttgtcggcg gcgttcttcc gcctgaccga ctatccggtc 600 gaggatgccg cgcatgtgcc ctctgaggac ctgaaggtgg gcgggcgcgt gctgaatgtc 660 cccaaggcgc tgaagggcgt cgcggtcttc tcgttcaagc ggttgtgcgg cgaagcgcgg 720 ggggcggcgg actatctggc ggtcgcgcgg ggcttccaca ccgtcatcct ggtcggaatc 780 cccaagctgg gggcggagaa ccgcaacgag gcggggcgct tcgtccagct gatcgacgcg 840 ctctacgaac ataaggtcaa gctgctcgcc gcagccgatg ccagcccgcc gaactctatg 900 aaaccggcga cggccggttc gagtttgagc gcagatcagc cggttggaag agatgcgctc 960 cgaggattat ctggcccaag gccatggctc ggaggggcct tgatcaggcc ttaatgcact 1020 tcgcaaccat tatcgtttaa aatcttaaac tctgtggaat aacggttccc cgacgccgca 1080 atacacgtac gtccactacg gagtaggatt gga 1113 <210> 151 <211> 253 <212> DNA <213> Chlamydomonas reinhardtii <400> 151 cgcttagaag atttcgataa ggcgccagaa ggagcgcagc caaaccagga tgatgtttga 60 tggggtattt gagcacttgc aacccttatc cggaagcccc ctggcccaca aaggctaggc 120 gccaatgcaa gcagttcgca tgcagcccct ggagcggtgc cctcctgata aaccggccag 180 ggggcctatg ttctttactt ttttacaaga gaagtcactc aacatcttaa acggtcttaa 240 gaagtctatc cgg 253 <210> 152 <211> 2435 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 152 ggatccccgg gaattcggcg cgccgggccc aacatggtgg agcacgacac tctcgtctac 60 tccaagaata tcaaagatac agtctcagaa gaccaaaggg ctattgagac ttttcaacaa 120 agggtaatat cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcaaa 180 aggacagtag aaaaggaagg tggcacctac aaatgccatc attgcgataa aggaaaggct 240 atcgttcaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 300 atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgataac 360 atggtggagc acgacactct cgtctactcc aagaatatca aagatacagt ctcagaagac 420 caaagggcta ttgagacttt tcaacaaagg gtaatatcgg gaaacctcct cggattccat 480 tgcccagcta tctgtcactt catcaaaagg acagtagaaa aggaaggtgg cacctacaaa 540 tgccatcatt gcgataaagg aaaggctatc gttcaagatg cctctgccga cagtggtccc 600 aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 660 tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac 720 tatccttcgc aagaccttcc tctatataag gaagttcatt tcatttggag aggacacgct 780 gaaatcacca gtctctctct acaaatctat ctctctcgag ctttcgcaga tcccgggggg 840 caatgagata tgaaaaagcc tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa 900 aagttcgaca gcgtctccga cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc 960 agcttcgatg taggagggcg tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc 1020 tacaaagatc gttatgttta tcggcacttt gcatcggccg cgctcccgat tccggaagtg 1080 cttgacattg gggagtttag cgagagcctg acctattgca tctcccgccg tgcacagggt 1140 gtcacgttgc aagacctgcc tgaaaccgaa ctgcccgctg ttctacaacc ggtcgcggag 1200 gctatggatg cgatcgctgc ggccgatctt agccagacga gcgggttcgg cccattcgga 1260 ccgcaaggaa tcggtcaata cactacatgg cgtgatttca tatgcgcgat tgctgatccc 1320 catgtgtatc actggcaaac tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct 1380 ctcgatgagc tgatgctttg ggccgaggac tgccccgaag tccggcacct cgtgcacgcg 1440 gatttcggct ccaacaatgt cctgacggac aatggccgca taacagcggt cattgactgg 1500 agcgaggcga tgttcgggga ttcccaatac gaggtcgcca acatcttctt ctggaggccg 1560 tggttggctt gtatggagca gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca 1620 ggatcgccac gactccgggc gtatatgctc cgcattggtc ttgaccaact ctatcagagc 1680 ttggttgacg gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc 1740 cgatccggag ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg 1800 accgatggct gtgtagaagt actcgccgat agtggaaacc gacgccccag cactcgtccg 1860 agggcaaaga aatagagtag atgccgaccg gatctgtcga tcgacaagct cgagtttctc 1920 cataataatg tgtgagtagt tcccagataa gggaattagg gttcctatag ggtttcgctc 1980 atgtgttgag catataagaa acccttagta tgtatttgta tttgtaaaat acttctatca 2040 ataaaatttc taattcctaa aaccaaaatc cagtactaaa atccagatcc cccgaattaa 2100 ttcggcgtta attcagtaca ttaaaaacgt ccgcaatgtg ttattaagtt gtctaagcgt 2160 caatttgttt acaccacaat atatcctgcc accagccagc caacagctcc ccgaccggca 2220 gctcggcaca aaatcaccac tcgatacagg cagcccatca gtccgggacg gcgtcagcgg 2280 gagagccgtt gtaaggcggc agactttgct catgttaccg atgctattcg gaagaacggc 2340 aactaagctg ccgggtttga aacacggatg atctcgcgga gggtagcatg ttgattgtaa 2400 cgatgacaga gcgttgctgc ctgtgatcac cgcgg 2435 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthesized primer <400> 153 caaccacgtc ttcaaagcaa 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 154 agcaatcgcg catatgaaat 20 <210> 155 <211> 1412 <212> DNA <213> Chlorella protothecoides <400> 155 gaattcgagt ttaggtccag cgtccgtggg gggggacggg ctgggagctt gggccgggaa 60 gggcaagacg atgcagtccc tctggggagt cacagccgac tgtgtgtgtt gcactgtgcg 120 gcccgcagca ctcacacgca aaatgcctgg ccgacaggca ggccctgtcc agtgcaacat 180 ccacggtccc tctcatcagg ctcaccttgc tcattgacat aacggaatgc gtaccgctct 240 ttcagatctg tccatccaga gaggggagca ggctccccac cgacgctgtc aaacttgctt 300 cctgcccaac cgaaaacatt attgtttgag gggggggggg ggggggcaga ttgcatggcg 360 ggatatctcg tgaggaacat cactgggaca ctgtggaaca cagtgagtgc agtatgcaga 420 gcatgtatgc taggggtcag cgcaggaagg gggcctttcc cagtctccca tgccactgca 480 ccgtatccac gactcaccag gaccagcttc ttgatcggct tccgctcccg tggacaccag 540 tgtgtagcct ctggactcca ggtatgcgtg caccgcaaag gccagccgat cgtgccgatt 600 cctggggtgg aggatatgag tcagccaact tggggctcag agtgcacact ggggcacgat 660 acgaaacaac atctacaccg tgtcctccat gctgacacac cacagcttcg ctccacctga 720 atgtgggcgc atgggcccga atcacagcca atgtcgctgc tgccataatg tgatccagac 780 cctctccgcc cagatgccga gcggatcgtg ggcgctgaat agattcctgt ttcgatcact 840 gtttgggtcc tttccttttc gtctcggatg cgcgtctcga aacaggctgc gtcgggcttt 900 cggatccctt ttgctccctc cgtcaccatc ctgcgcgcgg gcaagttgct tgaccctggg 960 ctggtaccag ggttggaggg tattaccgcg tcaggccatt cccagcccgg attcaattca 1020 aagtctgggc caccaccctc cgccgctctg tctgatcact ccacattcgt gcatacacta 1080 cgttcaagtc ctgatccagg cgtgtctcgg gacaaggtgt gcttgagttt gaatctcaag 1140 gacccactcc agcacagctg ctggttgacc ccgccctcgc aactccctac catgtctgct 1200 ggtaggtcca gggatctttg ccatgcacac aggaccccgt ttgtgggggt ccccggtgca 1260 tgctgtcgct gtgcaggcgc cggtgtgggg cctgggcccc gcgggagctc aactcctccc 1320 catatgcctg ccgtccctcc cacccaccgc gacctggccc cctttgcaga ggaaggcgaa 1380 gtcagcgcca tcgtgtgcga taatggatcc gg 1412 <210> 156 <211> 1627 <212> DNA <213> Chlorella protothecoides <400> 156 gaattcgccc ttgagtttag gtccagcgtc cgtggggggg gcgtgagact cccccctgac 60 cttcgtatgg cagggactcc tacttgccaa gtaatcagtt gacaatgcca cttcaatgct 120 cgttgtggta cactgacgcg ggtctaacat actgggaagc atgaattgcc gacatggact 180 cagttggaga cagtaacagc tctttgtgtt ctatcttcag gaacacattt ggcagcgcac 240 ccatacagtg gcgcacacgc agctgtacct gatgtggctc tattcccaca tgtttcaact 300 tgatccaaaa gtcactcaga ctctcagcag ctagacttga tcgcatcttt ggccatgaag 360 atgcttgcgc aactctagga atgggacgag aaaagagcct gctctgatcg gatatttcca 420 ttctctggat gggactgaga tgattctgaa gaaatgctgc tcgacttatt tggaagaaca 480 gcacctgacg catgctttga ggctgctgtg gctgggatgt gctgtatttg tcagcattga 540 gcatctacgg gtagatggcc ataaccacgc gctgcctatc atgcggtggg ttgtgtggaa 600 aacgtacaat ggacagaaat caatcccatt gcgagcctag cgtgcagcca tgcgctccct 660 ctgtagcccc gctccaagac aaagccagcc aatgccagaa cccacataga gagggtatct 720 tcctaatgac ctcgcccatc atttcctcca aattaactat aatgccttga ttgtggagtt 780 ggctttggct tgcagctgct cgcgctggca cttttgtagg cagcacaggg tatgccagcg 840 ccgaactttg tgcccttgag caggccacaa gggcacaaga ctacaccatg cagctggtat 900 acttggaact gataccattc ttaccaagca aggcacagca cagcctgcac cgactcactt 960 tgcttgagcg gggcacagcg ccgcgactga tcctgcgagc tgtggggagt tccgactgtt 1020 ctggacctcg gtctctgaaa gatgtgtacg atgggatcaa gtcattcaag tatgctcttc 1080 acatgagcaa tcgggggaga cacggtggcc ctaaaggtgt tcatctgatt caagtgtagt 1140 gggggggtgc tgtttgtccc ggggcgcccc ccgctccccg accccggaga agggccccag 1200 aggactcggc cgcccacaga ggaataaccg ggcgtggctc ggccctgcgc ctccctcttt 1260 caatatttca cctggtgttc agtgcacgga cacgtaaaga actagataca atggccgagg 1320 gaaagacggt gagagcttgg cgttggtgga ccgggcagca tcagaaactc ctcttccccg 1380 cccgccttga aactcactgt aactccctcc tcttccccct cgcagcatct gtctatcgtt 1440 atcgtgagtg aaagggactg ccatgtgtcg ggtcgttgac cacggtcggc tcgggcgctg 1500 ctgcccgcgt cgcgaacgtt ccctgcaaac gccgcgcagc cgtccctttt tctgccgccg 1560 ccccaccccc tcgctccccc cttcaatcac accgcagtgc ggacatgtcg attccggcaa 1620 gtccacc 1627 <210> 157 <211> 570 <212> DNA <213> Chlorella protothecoides <400> 157 gaattccctg caggaagaag gccggcagca gctggtactt gtccttcacc tccttgatcg 60 gctgggtgag cttggccggg tcgcagtcgt cgatgccggc atcgcccagc acgctgtgcg 120 gggagccggc atcgacaacc ttggcactgc tcaccttggt caccggcatg gggtcatggc 180 gctgcagacc agcggcctgt cagcatgctg caggcatctg tgttttgtag tagatacttt 240 ctgatgcatc accacacgtt tggaaggtcc ccaagcccct tcaacagtct cgacatatga 300 cactcgcgcc ctcttcctcg tcccgtggcc tgatgagggt acgcaggtac cgcagctgcg 360 ccccgtcccg ccagttgccc tggccccgcc gggcccaatc tgttcattgc cgctccctgg 420 cagccgtgaa cttcacacta ccgctctctg tgaccttcag cacagcagga atcgccattt 480 caccggcggt cgttgctgcg gagcctcagc tgatctcgcc tgcgagaccc cacagtttga 540 atttgcggtc cccacacaac ctctgacgcc 570 <210> 158 <211> 568 <212> DNA <213> Chlorella protothecoides <220> <221> misc_feature <222> (133)..(133) <223> n is a, c, g, or t <400> 158 gaattccctc aggaagaagg ccggcagcag ctggtacttg tccttcacct ccttgatcgg 60 ctgggtgagc ttcgcaggat cgcagtcgtc gatgccggca tcgcccagca cgctgtgcgg 120 ggagccggca tcnacaacct tggcactgct ccccttggtc accggcatgg ggtcatggcg 180 ctgcagccca gcggcctgtc agcatgctgc aggcatctgt gtattgtagt aggtacttcc 240 tgatgcatca acacacgttt ggaagctccc caagcccctt caacagtctc gacgtatgac 300 actcgcgccc tcttcctcgc cccgtggcct gatgagggta cgcaggtacc acagctgcgc 360 cccgtcccgc cagttgccct ggcccggccg ggcccaatct gttcattgcc gctccctggt 420 agccgtgaac tcacattacc gctctctgtg accttcagca cagcaggaat cgccatttca 480 ccggcggtcg ttgctgcgga gcctcagctg atctcgcctg cgagacccca cagtttgaat 540 ttgcggtccc cacacaacct ctgacgcc 568 <210> 159 <211> 1292 <212> DNA <213> Chlorella protothecoides <400> 159 atcaaaggca tagattcaca tttgttggca ttgcagagca atcatcgcgc aggacgaaca 60 tcgctcacca agcacgtact gggcatccgg aggcctccgc aaattcctgc aacaggactc 120 gctgatcagt tcgcccaagg tctacgacgc tccctatcgg cgctagactt caacacatat 180 ttcactgtca cagcctcggc atgcatcagg cctcagtctc caccatgaag accatccagt 240 ctcggcacgc cggtcccatc ggacatgtgc agtcgggtcg ccgatcggcg gggcgcgcgg 300 gatcccgcat ggcgaccccc gtggccgcag ctaccgtcgc agcccctcgc tcggccctca 360 acctctcccc caccatcatt cgacaggagg tgctccactc cgccagcgcc cagcaactag 420 actgcgtggc ctccctggcg cccgtcttcg agtcccagat cctccccctc ctgacgcccg 480 tggacgagat gtggcagccc accgacttcc tccccgcctc gaactcggag gcattcttcg 540 accagatcgg cgacctgcgg gcgcgatcgg cggccatccc cgacgacctg ctggtctgcc 600 tggtggggga catgatcacg gaggaggccc tgcccaccta catggccatg ctgaacaccc 660 tggacgtcgt gcgcgatgag acagggcaca gccagcaccc ctacgccaag tggaccaggg 720 cttggatcgc ggaggagaac cgccatggcg acctgctgaa caagtacatg tggctgacgg 780 ggcgggtggg acatgctggc ggtggagcgc accatccagc catgctggcg gtggagcgca 840 ccatccagcg cctcatctca tcgggcatgg acccgggcac ggagaaccac ccctaccacg 900 cctttgtgtt caccagcttc caggagcgcg ccaccaagct gagccacggc tccaccgccc 960 gcctggcggt cgccgccggg gacgaggccc tggccaagat ctgcgggacc attgcgcggg 1020 acgagtcgcg ccacgaggcg gcgtacacgc ggaccatgga tgccatcttc cagcgcgacc 1080 ccagcggggc catggtggcg tttgcgcaca tgatgatgcg caagatcacc atgcccgccc 1140 acctcatgga cgacggccag cacggcgcgc gcaacggggg ggcgcaactt gttcgacgac 1200 tttgcggcag tggcggagcg ggcaggggtg tacaccgccg gcgactacat cggcatcctg 1260 cgccacctca tccggcgctg ggacgtggag gg 1292 <210> 160 <211> 364 <212> PRT <213> Chlorella protothecoides <400> 160 Met His Gln Ala Ser Val Ser Thr Met Lys Thr Ile Gln Ser Arg His 1 5 10 15 Ala Gly Pro Ile Gly His Val Gln Ser Gly Arg Arg Ser Ala Gly Arg 20 25 30 Ala Gly Ser Arg Met Ala Thr Pro Val Ala Ala Ala Thr Val Ala Ala 35 40 45 Pro Arg Ser Ala Leu Asn Leu Ser Pro Thr Ile Ile Arg Gln Glu Val 50 55 60 Leu His Ser Ala Ser Ala Gln Gln Leu Asp Cys Val Ala Ser Leu Ala 65 70 75 80 Pro Val Phe Glu Ser Gln Ile Leu Pro Leu Leu Thr Pro Val Asp Glu 85 90 95 Met Trp Gln Pro Thr Asp Phe Leu Pro Ala Ser Asn Ser Glu Ala Phe 100 105 110 Phe Asp Gln Ile Gly Asp Leu Arg Ala Arg Ser Ala Ala Ile Pro Asp 115 120 125 Asp Leu Leu Val Cys Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu 130 135 140 Pro Thr Tyr Met Ala Met Leu Asn Thr Leu Asp Val Val Arg Asp Glu 145 150 155 160 Thr Gly His Ser Gln His Pro Tyr Ala Lys Trp Thr Arg Ala Trp Ile 165 170 175 Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Met Trp Leu 180 185 190 Thr Gly Arg Val Gly His Ala Gly Gly Gly Ala His His Pro Ala Met 195 200 205 Leu Ala Val Glu Arg Thr Ile Gln Arg Leu Ile Ser Ser Gly Met Asp 210 215 220 Pro Gly Thr Glu Asn His Pro Tyr His Ala Phe Val Phe Thr Ser Phe 225 230 235 240 Gln Glu Arg Ala Thr Lys Leu Ser His Gly Ser Thr Ala Arg Leu Ala 245 250 255 Val Ala Ala Gly Asp Glu Ala Leu Ala Lys Ile Cys Gly Thr Ile Ala 260 265 270 Arg Asp Glu Ser Arg His Glu Ala Ala Tyr Thr Arg Thr Met Asp Ala 275 280 285 Ile Phe Gln Arg Asp Pro Ser Gly Ala Met Val Ala Phe Ala His Met 290 295 300 Met Met Arg Lys Ile Thr Met Pro Ala His Leu Met Asp Asp Gly Gln 305 310 315 320 His Gly Ala Arg Asn Gly Gly Ala Gln Leu Val Arg Arg Leu Cys Gly 325 330 335 Ser Gly Gly Ala Gly Arg Gly Val His Arg Arg Arg Leu His Arg His 340 345 350 Pro Ala Pro Pro His Pro Ala Leu Gly Arg Gly Gly 355 360 <210> 161 <211> 1395 <212> DNA <213> Chlorella protothecoides <400> 161 attatacatc ggcatcgtct caggtttcac gatctgcatg ctatctatgg gactgtgact 60 ccgccggcca ggttgtggtg cgcgagaatc ctccccgctc ctgccttctc atttccctga 120 cgggagtcgc cgctgagcac cgggcggatc atgggcgtcg gcacactcca aaccccatat 180 acatgtggtc gtgcattcac gcatagcgca cggtatgtcc cgcgacgcgc ggctcgaagc 240 cgtggccatc cgacgcgctg cacggccgag gtgagggcac gcccctccgc caatggcgcg 300 cagcccatga ccgccttcga cttccggcag tacatgcagc agcgcgccgc gctggtggac 360 gcagcgctgg acctggcagt gccgctgcag taccccgaga agatcaacga ggccatgcgg 420 tacagcctgc tggccggggg caagcgcgtg cgccccgcgc tctgcctcgc tgcctgcgag 480 ctcgtgggcg gccccctgga ggcggccatg cccgccgcct gcgccatgga gatgatccac 540 accatgagcc tcatccacga cgacctcccc gccatggaca acgacgactt ccggcgcggc 600 cagcccgcca accacaaggc ctatggcgag gagattgcga tcctggcggg cgacgcgctg 660 ctgtcgctga gctttgagca catcgcgcgc gagacgcgag gcgtggaccc ggtgcgcgtc 720 ctggccgcca tctcggagtg gcgcgcggtg ggcagccgcg ggctggtggc ggggcaggtg 780 gtggacctgg gtttcgaggg cggcggcgtg gggctggccc cgctgcgcta catccacgag 840 cacaaaaccg cggcgctgct ggaggcggcg gtggtgtccg gcgcgctgct gggcggcgcg 900 gaggaggcgg acctggagcg cctgcgcacc tacaaccgcg ccatcggcct cgctttccag 960 gtggtggggg acatcctgga catcccgggg accagcgagg agctgggcaa gaccgcgggc 1020 aaggacctga gctcccccaa aaccccctac ccgtccctgg tggggctggc caggtccaaa 1080 aaaattgcgg acgaactgat tgaggacgcg aaaacccaac tcacccagta cgagccggcc 1140 cgagcggcgc ccctcgtaac cctggccgaa aacatttgaa accggaagaa ctgactgggg 1200 gccccccctg cccccagata cggcggggct cctccatcca gttttgggat gggaggagcg 1260 acaaccgacc ccgtaaccct gtgacgcgtt tgccttgcat acgtacgcat gccttgaaac 1320 ccatccatga ccctcaacaa tacctggttg tgtgtagctt ggtcctgaaa aaaaaaaaaa 1380 aaaaaaaaaa aaaaa 1395 <210> 162 <211> 342 <212> PRT <213> Chlorella protothecoides <400> 162 Met Gly Val Gly Thr Leu Gln Thr Pro Tyr Thr Cys Gly Arg Ala Phe 1 5 10 15 Thr His Ser Ala Arg Tyr Val Pro Arg Arg Ala Ala Arg Ser Arg Gly 20 25 30 His Pro Thr Arg Cys Thr Ala Glu Val Arg Ala Arg Pro Ser Ala Asn 35 40 45 Gly Ala Gln Pro Met Thr Ala Phe Asp Phe Arg Gln Tyr Met Gln Gln 50 55 60 Arg Ala Ala Leu Val Asp Ala Ala Leu Asp Leu Ala Val Pro Leu Gln 65 70 75 80 Tyr Pro Glu Lys Ile Asn Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly 85 90 95 Gly Lys Arg Val Arg Pro Ala Leu Cys Leu Ala Ala Cys Glu Leu Val 100 105 110 Gly Gly Pro Leu Glu Ala Ala Met Pro Ala Ala Cys Ala Met Glu Met 115 120 125 Ile His Thr Met Ser Leu Ile His Asp Asp Leu Pro Ala Met Asp Asn 130 135 140 Asp Asp Phe Arg Arg Gly Gln Pro Ala Asn His Lys Ala Tyr Gly Glu 145 150 155 160 Glu Ile Ala Ile Leu Ala Gly Asp Ala Leu Leu Ser Leu Ser Phe Glu 165 170 175 His Ile Ala Arg Glu Thr Arg Gly Val Asp Pro Val Arg Val Leu Ala 180 185 190 Ala Ile Ser Glu Trp Arg Ala Val Gly Ser Arg Gly Leu Val Ala Gly 195 200 205 Gln Val Val Asp Leu Gly Phe Glu Gly Gly Gly Val Gly Leu Ala Pro 210 215 220 Leu Arg Tyr Ile His Glu His Lys Thr Ala Ala Leu Leu Glu Ala Ala 225 230 235 240 Val Val Ser Gly Ala Leu Leu Gly Gly Ala Glu Glu Ala Asp Leu Glu 245 250 255 Arg Leu Arg Thr Tyr Asn Arg Ala Ile Gly Leu Ala Phe Gln Val Val 260 265 270 Gly Asp Ile Leu Asp Ile Pro Gly Thr Ser Glu Glu Leu Gly Lys Thr 275 280 285 Ala Gly Lys Asp Leu Ser Ser Pro Lys Thr Pro Tyr Pro Ser Leu Val 290 295 300 Gly Leu Ala Arg Ser Lys Lys Ile Ala Asp Glu Leu Ile Glu Asp Ala 305 310 315 320 Lys Thr Gln Leu Thr Gln Tyr Glu Pro Ala Arg Ala Ala Pro Leu Val 325 330 335 Thr Leu Ala Glu Asn Ile 340 <210> 163 <211> 833 <212> DNA <213> Chlorella protothecoides <400> 163 cagatgccat gcgccctcgg gccgcgggcc tgagggtcca cgcagcgtcc tcggtggccc 60 agacgcacca ggccgccccc ccggcggaca ggaggttcga cgactaccag ccccgcaccg 120 ccatcctctt ccccggccag ggcgcgcaga gcgtgggcat ggcgggagag ctggcgaagg 180 ccgtccccgc cgccgcggcg ctgttcgacg ccgcctccga ccagctcggc tatgacctgc 240 tccgcgtgtg cgttgagggc cccaaggcgc gcctggacag caccgccgtc agccagcccg 300 ccatctacgt ggccagcctg gcggcggtgg agaagctgcg cgcggagggc ggggaggagg 360 cactggccgc catcgacgtc gctgccggtc tgtccttggg cgagtacacc gcgctggcct 420 ttgccggcgc cttctccttc gccgacgggc tgcgcctggt ggccctgcgc ggcgccagca 480 tgcaggccgc cgccgacgcc gcaccctcgg gcatggtctc cgtcatcggt ctgccctccg 540 acgcggtggc cgcgctgtgc gaggccgcca acgcgcaggt ggcccccgac caggccgtgc 600 gcatcgccaa ctacctctgc gacggcaact acgccgtcag cggtgggctg gagggctgcg 660 cggcggtgga gggcctggcc aaggcccaca aggcgcgcat gacggtgcgc ctggcggtgg 720 cgggcgcctt ccacaccccc ttcatgcagc cggcggtgga ggcgctgagc gcgggcgctg 780 gcggacacgc cgctggtcgc gccgcgcatc cccgtggtca gcaacgggac gcc 833 <210> 164 <211> 275 <212> PRT <213> Chlorella protothecoides <400> 164 Met Arg Pro Arg Ala Ala Gly Leu Arg Val His Ala Ala Ser Ser Val 1 5 10 15 Ala Gln Thr His Gln Ala Ala Pro Pro Ala Asp Arg Arg Phe Asp Asp 20 25 30 Tyr Gln Pro Arg Thr Ala Ile Leu Phe Pro Gly Gln Gly Ala Gln Ser 35 40 45 Val Gly Met Ala Gly Glu Leu Ala Lys Ala Val Pro Ala Ala Ala Ala 50 55 60 Leu Phe Asp Ala Ala Ser Asp Gln Leu Gly Tyr Asp Leu Leu Arg Val 65 70 75 80 Cys Val Glu Gly Pro Lys Ala Arg Leu Asp Ser Thr Ala Val Ser Gln 85 90 95 Pro Ala Ile Tyr Val Ala Ser Leu Ala Ala Val Glu Lys Leu Arg Ala 100 105 110 Glu Gly Gly Glu Glu Ala Leu Ala Ala Ile Asp Val Ala Ala Gly Leu 115 120 125 Ser Leu Gly Glu Tyr Thr Ala Leu Ala Phe Ala Gly Ala Phe Ser Phe 130 135 140 Ala Asp Gly Leu Arg Leu Val Ala Leu Arg Gly Ala Ser Met Gln Ala 145 150 155 160 Ala Ala Asp Ala Ala Pro Ser Gly Met Val Ser Val Ile Gly Leu Pro 165 170 175 Ser Asp Ala Val Ala Ala Leu Cys Glu Ala Ala Asn Ala Gln Val Ala 180 185 190 Pro Asp Gln Ala Val Arg Ile Ala Asn Tyr Leu Cys Asp Gly Asn Tyr 195 200 205 Ala Val Ser Gly Gly Leu Glu Gly Cys Ala Ala Val Glu Gly Leu Ala 210 215 220 Lys Ala His Lys Ala Arg Met Thr Val Arg Leu Ala Val Ala Gly Ala 225 230 235 240 Phe His Thr Pro Phe Met Gln Pro Ala Val Glu Ala Leu Ser Ala Gly 245 250 255 Ala Gly Gly His Ala Ala Gly Arg Ala Ala His Pro Arg Gly Gln Gln 260 265 270 Arg Asp Ala 275 <210> 165 <211> 787 <212> DNA <213> Chlorella protothecoides <400> 165 tgtccatctc cccccaccct ccatccaacc atcgtcgacg gcatgcaggc gctgtgttct 60 caccccgcgt ccctcacggc gcgtgcggta ccccatgggc gggccagccc agcacagcgg 120 gtgtccagcg ccggcccggc ctacaccggc ctgtcccggc acaccctggg ctgccccagc 180 acccccaccc tccagtcccg cgccgcggtc cagacccgcg gctcctcctc cggctccacc 240 acgcgcatga ccaccaccgc ccagcgcaag atcaaggtgg ccatcaacgg gttcggccgc 300 atcggccgcc agttcctgcg ctgcgtggag gggcgcgagg actcgctgct ggagatcgtg 360 gccgtgaacg actccggcgg cgtgaagcag gccagccacc tgctcaagta cgactccacc 420 atgggcacct tcaacgccga catcaagatc tcgggcgagg gcaccttctc cgtcaacggc 480 cgcgacatcc gcgtcgtctc ctcccgcgac cccctggccc tgccctgggg cgagctgggc 540 gtggacctgg tgatcgaggg gacgggagtg tttgtggacc gcaagggtgc cagcaagcac 600 ctgcaggcgg gggccaagaa ggtcatcatc accgcgccgg ccaagggctc cgacgtgccc 660 acctacgtca tgggcgtgaa cgcggaccag tactccaact ccgacgacat catctccaac 720 gcctcctgca ccaccaactg cctggcgccc tttgtcaagg tgctcaacga ccgcttcggc 780 atcgtga 787 <210> 166 <211> 248 <212> PRT <213> Chlorella protothecoides <400> 166 Met Gln Ala Leu Cys Ser His Pro Ala Ser Leu Thr Ala Arg Ala Val 1 5 10 15 Pro His Gly Arg Ala Ser Pro Ala Gln Arg Val Ser Ser Ala Gly Pro 20 25 30 Ala Tyr Thr Gly Leu Ser Arg His Thr Leu Gly Cys Pro Ser Thr Pro 35 40 45 Thr Leu Gln Ser Arg Ala Ala Val Gln Thr Arg Gly Ser Ser Ser Gly 50 55 60 Ser Thr Thr Arg Met Thr Thr Thr Ala Gln Arg Lys Ile Lys Val Ala 65 70 75 80 Ile Asn Gly Phe Gly Arg Ile Gly Arg Gln Phe Leu Arg Cys Val Glu 85 90 95 Gly Arg Glu Asp Ser Leu Leu Glu Ile Val Ala Val Asn Asp Ser Gly 100 105 110 Gly Val Lys Gln Ala Ser His Leu Leu Lys Tyr Asp Ser Thr Met Gly 115 120 125 Thr Phe Asn Ala Asp Ile Lys Ile Ser Gly Glu Gly Thr Phe Ser Val 130 135 140 Asn Gly Arg Asp Ile Arg Val Val Ser Ser Arg Asp Pro Leu Ala Leu 145 150 155 160 Pro Trp Gly Glu Leu Gly Val Asp Leu Val Ile Glu Gly Thr Gly Val 165 170 175 Phe Val Asp Arg Lys Gly Ala Ser Lys His Leu Gln Ala Gly Ala Lys 180 185 190 Lys Val Ile Ile Thr Ala Pro Ala Lys Gly Ser Asp Val Pro Thr Tyr 195 200 205 Val Met Gly Val Asn Ala Asp Gln Tyr Ser Asn Ser Asp Asp Ile Ile 210 215 220 Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Phe Val Lys Val 225 230 235 240 Leu Asn Asp Arg Phe Gly Ile Val 245 <210> 167 <211> 860 <212> DNA <213> Chlorella protothecoides <400> 167 gatgttgaga atagtagctt gctgccttgt cgccatgcag agcgtgtgcg cgcagtcggt 60 ttcatgcaag ggggccttca cccagtccct gcggaccccc cgatgcagca ggagccagct 120 cgtctgccgg gctgatggca aggccggagc cttcatcaag accgtaaaga gcggtgctgc 180 cgctctggct gcctccctcc tcctgtctgg gggtgcgggc gcactgacct ttgatgagct 240 gcagggcctg acctacctgc aggtgaaggg ctctggcatc gccaacacct gccccaccct 300 gtctggcggc tcctccaaca tcaaggacct gaagagcggg acctactccg tcaacaagat 360 gtgcctggag cccacgtcct tcaaggtcaa ggaggaggca cagttcaaga acggcgaggc 420 cgactttgtg cccaccaagc tcgtcacgcg tctgacctac accctggacg agatctctgg 480 ccagatgaag atcgacggca gcggcggcgt ggagttcaag gaggaggatg gcatcgacta 540 tgctgcagtc accgtgcagc ttccgggcgg ggagcgcgtg cccttcctct tcaccatcaa 600 ggagcttgac gccaagggga ctgccgacgg cttcaagggc gagttcaccg tgccctccta 660 ccgtgggtcc tccttcctgg accccaaggg ccgcggcgcc tccaccggct acgacaacgc 720 cgtggccctg cccgccgccg gcgattccga ggagttggag aaggagaaca acaagtccac 780 caaggctctg aagggggagg ccatcttctc catcgccaag gtggacgccg ggacagggga 840 ggtggcgggc atctttgagt 860 <210> 168 <211> 275 <212> PRT <213> Chlorella protothecoides <400> 168 Met Gln Ser Val Cys Ala Gln Ser Val Ser Cys Lys Gly Ala Phe Thr 1 5 10 15 Gln Ser Leu Arg Thr Pro Arg Cys Ser Arg Ser Gln Leu Val Cys Arg 20 25 30 Ala Asp Gly Lys Ala Gly Ala Phe Ile Lys Thr Val Lys Ser Gly Ala 35 40 45 Ala Ala Leu Ala Ala Ser Leu Leu Leu Ser Gly Gly Ala Gly Ala Leu 50 55 60 Thr Phe Asp Glu Leu Gln Gly Leu Thr Tyr Leu Gln Val Lys Gly Ser 65 70 75 80 Gly Ile Ala Asn Thr Cys Pro Thr Leu Ser Gly Gly Ser Ser Asn Ile 85 90 95 Lys Asp Leu Lys Ser Gly Thr Tyr Ser Val Asn Lys Met Cys Leu Glu 100 105 110 Pro Thr Ser Phe Lys Val Lys Glu Glu Ala Gln Phe Lys Asn Gly Glu 115 120 125 Ala Asp Phe Val Pro Thr Lys Leu Val Thr Arg Leu Thr Tyr Thr Leu 130 135 140 Asp Glu Ile Ser Gly Gln Met Lys Ile Asp Gly Ser Gly Gly Val Glu 145 150 155 160 Phe Lys Glu Glu Asp Gly Ile Asp Tyr Ala Ala Val Thr Val Gln Leu 165 170 175 Pro Gly Gly Glu Arg Val Pro Phe Leu Phe Thr Ile Lys Glu Leu Asp 180 185 190 Ala Lys Gly Thr Ala Asp Gly Phe Lys Gly Glu Phe Thr Val Pro Ser 195 200 205 Tyr Arg Gly Ser Ser Phe Leu Asp Pro Lys Gly Arg Gly Ala Ser Thr 210 215 220 Gly Tyr Asp Asn Ala Val Ala Leu Pro Ala Ala Gly Asp Ser Glu Glu 225 230 235 240 Leu Glu Lys Glu Asn Asn Lys Ser Thr Lys Ala Leu Lys Gly Glu Ala 245 250 255 Ile Phe Ser Ile Ala Lys Val Asp Ala Gly Thr Gly Glu Val Ala Gly 260 265 270 Ile Phe Glu 275 <210> 169 <211> 818 <212> DNA <213> Chlorella protothecoides <400> 169 ataatcggaa cccagctgca cgcaccatca gtgcggcagc atgcagaccg tcgcagccag 60 ctatggcgta ttggcgccct ccggctccag cgtgacccgg ggctcgacca gcagcaagca 120 gcacttcacc accctcactc ccttttccgg cttcaggcgc ctgaatcatg tggatcgggc 180 ggggcaggcg gggtctggga gcccccagac cctgcagcag gccgtgggca aggccgtgcg 240 ccggtcgcgg ggccgcacca ccagcgccgt gcgcgtgacc cgcatgatgt ttgagcggtt 300 caccgagaag gccatcaagg tggtcatgct cgcgcaggag gaggctcgcc gtctgggcca 360 caacttcgtg gggacggagc aaatcctgct ggggttgatt ggggagtcca caggcatcgc 420 cgccaaggtc ctcaagtcga tgggcgtcac gctgaaagat gcgcgtgtgg aggtcgagaa 480 gatcatcggc cgggggagcg gctttgtggc cgtggagatc cccttcaccc cccgcgccaa 540 gcgtgtgctg gagctgtccc tggaggaggc tcgccagctc ggccacaact acattggcac 600 ggagcacatc ctgctgggcc tgctgcgcga gggtgagggc gtggcctccc gcgtgctgga 660 gaccctgggc gccgaccccc agaagatccg cactcaggtg gtacgcatgg tgggtgagtc 720 gcaggagccc gtgggcacca cggtgggcgg agggtccacc ggctccaaca agatgcccac 780 cctggaggag tacggcacca acctgaccgc ccaggccg 818 <210> 170 <211> 259 <212> PRT <213> Chlorella protothecoides <400> 170 Met Gln Thr Val Ala Ala Ser Tyr Gly Val Leu Ala Pro Ser Gly Ser 1 5 10 15 Ser Val Thr Arg Gly Ser Thr Ser Ser Lys Gln His Phe Thr Thr Leu 20 25 30 Thr Pro Phe Ser Gly Phe Arg Arg Leu Asn His Val Asp Arg Ala Gly 35 40 45 Gln Ala Gly Ser Gly Ser Pro Gln Thr Leu Gln Gln Ala Val Gly Lys 50 55 60 Ala Val Arg Arg Ser Arg Gly Arg Thr Thr Ser Ala Val Arg Val Thr 65 70 75 80 Arg Met Met Phe Glu Arg Phe Thr Glu Lys Ala Ile Lys Val Val Met 85 90 95 Leu Ala Gln Glu Glu Ala Arg Arg Leu Gly His Asn Phe Val Gly Thr 100 105 110 Glu Gln Ile Leu Leu Gly Leu Ile Gly Glu Ser Thr Gly Ile Ala Ala 115 120 125 Lys Val Leu Lys Ser Met Gly Val Thr Leu Lys Asp Ala Arg Val Glu 130 135 140 Val Glu Lys Ile Ile Gly Arg Gly Ser Gly Phe Val Ala Val Glu Ile 145 150 155 160 Pro Phe Thr Pro Arg Ala Lys Arg Val Leu Glu Leu Ser Leu Glu Glu 165 170 175 Ala Arg Gln Leu Gly His Asn Tyr Ile Gly Thr Glu His Ile Leu Leu 180 185 190 Gly Leu Leu Arg Glu Gly Glu Gly Val Ala Ser Arg Val Leu Glu Thr 195 200 205 Leu Gly Ala Asp Pro Gln Lys Ile Arg Thr Gln Val Val Arg Met Val 210 215 220 Gly Glu Ser Gln Glu Pro Val Gly Thr Thr Val Gly Gly Gly Ser Thr 225 230 235 240 Gly Ser Asn Lys Met Pro Thr Leu Glu Glu Tyr Gly Thr Asn Leu Thr 245 250 255 Ala Gln Ala <210> 171 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 171 tccggtgtgt tgtaagtcca 20 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 172 ttgtcggaat gtcatatcaa 20 <210> 173 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 173 aacgcctttg tacaactgca 20 <210> 174 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 174 ctgacccgac ctatgggagc gctcttggc 29 <210> 175 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 175 cttgacttcc ctcacctgga atttgtcg 28 <210> 176 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 176 gtggccatat ggacttacaa 20 <210> 177 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 177 caagggctgg atgaatgacc ccaatggact gtggtacgac g 41 <210> 178 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> synthetic primer <400> 178 cacccgtcgt catgttcacg gagcccagtg cg 32 <210> 179 <211> 3681 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 179 gccctttgtc atcgttggca tgctttttgc gtatgtacca tatgttgaat gtataatacg 60 aacggttgac cgtctgagat gcgagctttg ggtcttgtca aatgcgtggc cgcacggctc 120 cctcgcaccc agccccgagg cgtcgcgcac ctggcgagga gcagacccac gccaagaaag 180 tctagtccag catgtaacaa catcaggcaa tgtgacgttt tcggttcccg atttctctgc 240 cgctctttga cggcaggcac gggcgagcaa ccggcggcgc tcgcgtcagg cacgatggat 300 gcggcgctgc ccacctgtca atgtacccca ccagtctgtc gatcgctaca agcaaccttg 360 tgctccacat tcccacttgc agacagtcta gtcgattttg ccaagctgga tgtgaggatt 420 ggccatatct tggaggccaa gattcacccg gatgctgatg ggtacgtacg cgagccaggc 480 aggcagctgc gttgactttc tgattggcac aaagctttgg ctactctcaa taccaaccac 540 gtgccccttc tgcacacctg cttccttctg atgaccactc gccacgcatg tcgcagtctg 600 tacgtcgagc agatcgacct cggcgaggag gggggccctc gcaccatcgt gagtggcctg 660 gtccggcacg tgaccctgga ggaccttgtc ggccggcggg tggtggtgct ggccaacctc 720 aagcctcgga gcatgcgcgg ggtcaaatcg gctgggatgc tgctctgcgc cgccaacgcg 780 gatcacaccg cggtggagcc gctgcgggtc ccggacgccg ccgtgacggg ggagcgggtc 840 tgggcggggg acgaggcact cctgtccacg gagcctgcca cacccaatca ggtaaggaca 900 cgttattggt gcgcatggtg cgaatgcgtg gtctgacctg ctgtgggtat gtgttgtggg 960 attggaaacc gaatgagggc cgttcaggat tgagcccttg gccccaccct gctcatcctc 1020 tcacgcccgc aggtccagaa gaagaaaatc tgggaggcag tacagccgct gctgagagtg 1080 aacgcccagg ggatcgctac tgtggcagga gaggctatgg tgaccagtgc ggggccactg 1140 accgcgccca cgctggttga cgccgcgatt tcctgacgcg agcgactgat tcttgacctt 1200 tgagaagcca ccacagcacc attttcattg ttcatccttg atttcagtac gacttctcac 1260 catttcagta ctgtaggacc cccaaaatag tgtgatcacg ctcgcaaggc acctgtgtga 1320 tcacggggaa gggcgaattc ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg 1380 gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac cccccgaagc 1440 tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc 1500 aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa acacctagat 1560 cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa gggggcgcct 1620 cttcctcttc gtttcagtca caacccgcaa acggcgcgcc atgctgctgc aggccttcct 1680 gttcctgctg gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga 1740 ccgccccctg gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg 1800 gtacgacgag aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt 1860 ctgggggacg cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga 1920 ccagcccatc gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt 1980 ggtggactac aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg 2040 cgtggccatc tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct 2100 ggacggcggc tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac 2160 ccagttccgc gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc 2220 ggccaagtcc caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa 2280 gctggagtcc gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct 2340 gatcgaggtc cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat 2400 caaccccggc gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg 2460 cacccacttc gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta 2520 cgccctgcag accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg 2580 ggcctccaac tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc 2640 cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat 2700 caacctgaag gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc 2760 caccaacacc acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg 2820 caccctggag ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt 2880 gttcgcggac ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat 2940 gggcttcgag gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt 3000 cgtgaaggag aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag 3060 cgagaacgac ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct 3120 gtacttcaac gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc 3180 cctgggctcc gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca 3240 ggtgcgcgag gtcaagtgat taattaactc gaggcagcag cagctcggat agtatcgaca 3300 cactctggac gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg 3360 aatatccctg ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt 3420 ttgcgagttg ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc 3480 gtttcatatc gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg 3540 ctgctcctgc tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc 3600 tcctggtact gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat 3660 gggaacacaa atggaaagct t 3681 <210> 180 <211> 3669 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 180 cccgtgatca cacaggtgcc ttgcgagcgt gatcacacta ttttgggggt cctacagtac 60 tgaaatggtg agaagtcgta ctgaaatcaa ggatgaacaa tgaaaatggt gctgtggtgg 120 cttctcaaag gtcaagaatc agtcgctcgc gtcaggaaat cgcggcgtca accagcgtgg 180 gcgcggtcag tggccccgca ctggtcacca tagcctctcc tgccacagta gcgatcccct 240 gggcgttcac tctcagcagc ggctgtactg cctcccagat tttcttcttc tggacctgcg 300 ggcgtgagag gatgagcagg gtggggccaa gggctcaatc ctgaacggcc ctcattcggt 360 ttccaatccc acaacacata cccacagcag gtcagaccac gcattcgcac catgcgcacc 420 aaataacgtg tccttacctg attgggtgtg gcaggctccg tggacaggag tgcctcgtcc 480 cccgcccaga cccgctcccc cgtcacggcg gcgtccggga cccgcagcgg ctccaccgcg 540 gtgtgatccg cgttggcggc gcagagcagc atcccagccg atttgacccc gcgcatgctc 600 cgaggcttga ggttggccag caccaccacc cgccggccga caaggtcctc cagggtcacg 660 tgccggacca ggccactcac gatggtgcga gggcccccct cctcgccgag gtcgatctgc 720 tcgacgtaca gactgcgaca tgcgtggcga gtggtcatca gaaggaagca ggtgtgcaga 780 aggggcacgt ggttggtatt gagagtagcc aaagctttgt gccaatcaga aagtcaacgc 840 agctgcctgc ctggctcgcg tacaattcct ttcttgcgct atgacacttc cagcaaaagg 900 tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat gcttcgaccc 960 cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg agcgctgttt 1020 aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc atattcaaac 1080 acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac tccgctaagg 1140 gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac ggcgcgccat gctgctgcag 1200 gccttcctgt tcctgctggc cggcttcgcc gccaagatca gcgcctccat gacgaacgag 1260 acgtccgacc gccccctggt gcacttcacc cccaacaagg gctggatgaa cgaccccaac 1320 ggcctgtggt acgacgagaa ggacgccaag tggcacctgt acttccagta caacccgaac 1380 gacaccgtct gggggacgcc cttgttctgg ggccacgcca cgtccgacga cctgaccaac 1440 tgggaggacc agcccatcgc catcgccccg aagcgcaacg actccggcgc cttctccggc 1500 tccatggtgg tggactacaa caacacctcc ggcttcttca acgacaccat cgacccgcgc 1560 cagcgctgcg tggccatctg gacctacaac accccggagt ccgaggagca gtacatctcc 1620 tacagcctgg acggcggcta caccttcacc gagtaccaga agaaccccgt gctggccgcc 1680 aactccaccc agttccgcga cccgaaggtc ttctggtacg agccctccca gaagtggatc 1740 atgaccgcgg ccaagtccca ggactacaag atcgagatct actcctccga cgacctgaag 1800 tcctggaagc tggagtccgc gttcgccaac gagggcttcc tcggctacca gtacgagtgc 1860 cccggcctga tcgaggtccc caccgagcag gaccccagca agtcctactg ggtgatgttc 1920 atctccatca accccggcgc cccggccggc ggctccttca accagtactt cgtcggcagc 1980 ttcaacggca cccacttcga ggccttcgac aaccagtccc gcgtggtgga cttcggcaag 2040 gactactacg ccctgcagac cttcttcaac accgacccga cctacgggag cgccctgggc 2100 atcgcgtggg cctccaactg ggagtactcc gccttcgtgc ccaccaaccc ctggcgctcc 2160 tccatgtccc tcgtgcgcaa gttctccctc aacaccgagt accaggccaa cccggagacg 2220 gagctgatca acctgaaggc cgagccgatc ctgaacatca gcaacgccgg cccctggagc 2280 cggttcgcca ccaacaccac gttgacgaag gccaacagct acaacgtcga cctgtccaac 2340 agcaccggca ccctggagtt cgagctggtg tacgccgtca acaccaccca gacgatctcc 2400 aagtccgtgt tcgcggacct ctccctctgg ttcaagggcc tggaggaccc cgaggagtac 2460 ctccgcatgg gcttcgaggt gtccgcgtcc tccttcttcc tggaccgcgg gaacagcaag 2520 gtgaagttcg tgaaggagaa cccctacttc accaaccgca tgagcgtgaa caaccagccc 2580 ttcaagagcg agaacgacct gtcctactac aaggtgtacg gcttgctgga ccagaacatc 2640 ctggagctgt acttcaacga cggcgacgtc gtgtccacca acacctactt catgaccacc 2700 gggaacgccc tgggctccgt gaacatgacg acgggggtgg acaacctgtt ctacatcgac 2760 aagttccagg tgcgcgaggt caagtgatta attaactcga ggcagcagca gctcggatag 2820 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 2880 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 2940 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 3000 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 3060 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 3120 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 3180 agtgggatgg gaacacaaat ggaaagcttg agctcggtac ccgtacccat cagcatccgg 3240 gtgaatcttg gcctccaaga tatggccaat cctcacatcc agcttggcaa aatcgactag 3300 actgtctgca agtgggaatg tggagcacaa ggttgcttgt agcgatcgac agactggtgg 3360 ggtacattga caggtgggca gcgccgcatc catcgtgcct gacgcgagcg ccgccggttg 3420 ctcgcccgtg cctgccgtca aagagcggca gagaaatcgg gaaccgaaaa cgtcacattg 3480 cctgatgttg ttacatgctg gactagactt tcttggcgtg ggtctgctcc tcgccaggtg 3540 cgcgacgcct cggggctggg tgcgagggag ccgtgcggcc acgcatttga caagacccaa 3600 agctcgcatc tcagacggtc aaccgttcgt attatacatt caacatatgg tacatacgca 3660 aaaagcatg 3669 <210> 181 <211> 3850 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 181 tttggccccg ctttccagct ccggatctgc tggcgtccgc cgcgagacgt gacatcgcac 60 gtcgccggga gcgccagctt gatcacttgg cagggggccg tgctctacaa ataccaggcc 120 ccgcggcggt cagttcgcac atccaatacc tgccgagcca tcttgcctac actttttatc 180 gactcctcta ctctgttcgc gagagcgctc ggtccaggct tggaattcgc cgaattcagc 240 tcgatcagtc gcttctgcaa ctgatctcgg ccgttcgcag actgcctttt ctcagcttgt 300 caggtagcga gttgttgttt tatatttatt cgatttcatc tgtgttgcat gtcttgttcg 360 tgctgtgcgt tctttctggg ccgcgctgtc gggtcgcatg ggctagctgt actcatgtta 420 gtcatgccgg tccgaccttg ttcgaggaag gccccacact gagcgtgccc tctttctaca 480 ccccttgtgc agaaattaga tagaaagcag aattcctttc ttgcgctatg acacttccag 540 caaaaggtag ggcgggctgc gagacggctt cccggcgctg catgcaacac cgatgatgct 600 tcgacccccc gaagctcctt cggggctgca tgggcgctcc gatgccgctc cagggcgagc 660 gctgtttaaa tagccaggcc cccgattgca aagacattat agcgagctac caaagccata 720 ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 780 gctaaggggg cgcctcttcc tcttcgtttc agtcacaacc cgcaaacggc gcgccatgct 840 gctgcaggcc ttcctgttcc tgctggccgg cttcgccgcc aagatcagcg cctccatgac 900 gaacgagacg tccgaccgcc ccctggtgca cttcaccccc aacaagggct ggatgaacga 960 ccccaacggc ctgtggtacg acgagaagga cgccaagtgg cacctgtact tccagtacaa 1020 cccgaacgac accgtctggg ggacgccctt gttctggggc cacgccacgt ccgacgacct 1080 gaccaactgg gaggaccagc ccatcgccat cgccccgaag cgcaacgact ccggcgcctt 1140 ctccggctcc atggtggtgg actacaacaa cacctccggc ttcttcaacg acaccatcga 1200 cccgcgccag cgctgcgtgg ccatctggac ctacaacacc ccggagtccg aggagcagta 1260 catctcctac agcctggacg gcggctacac cttcaccgag taccagaaga accccgtgct 1320 ggccgccaac tccacccagt tccgcgaccc gaaggtcttc tggtacgagc cctcccagaa 1380 gtggatcatg accgcggcca agtcccagga ctacaagatc gagatctact cctccgacga 1440 cctgaagtcc tggaagctgg agtccgcgtt cgccaacgag ggcttcctcg gctaccagta 1500 cgagtgcccc ggcctgatcg aggtccccac cgagcaggac cccagcaagt cctactgggt 1560 gatgttcatc tccatcaacc ccggcgcccc ggccggcggc tccttcaacc agtacttcgt 1620 cggcagcttc aacggcaccc acttcgaggc cttcgacaac cagtcccgcg tggtggactt 1680 cggcaaggac tactacgccc tgcagacctt cttcaacacc gacccgacct acgggagcgc 1740 cctgggcatc gcgtgggcct ccaactggga gtactccgcc ttcgtgccca ccaacccctg 1800 gcgctcctcc atgtccctcg tgcgcaagtt ctccctcaac accgagtacc aggccaaccc 1860 ggagacggag ctgatcaacc tgaaggccga gccgatcctg aacatcagca acgccggccc 1920 ctggagccgg ttcgccacca acaccacgtt gacgaaggcc aacagctaca acgtcgacct 1980 gtccaacagc accggcaccc tggagttcga gctggtgtac gccgtcaaca ccacccagac 2040 gatctccaag tccgtgttcg cggacctctc cctctggttc aagggcctgg aggaccccga 2100 ggagtacctc cgcatgggct tcgaggtgtc cgcgtcctcc ttcttcctgg accgcgggaa 2160 cagcaaggtg aagttcgtga aggagaaccc ctacttcacc aaccgcatga gcgtgaacaa 2220 ccagcccttc aagagcgaga acgacctgtc ctactacaag gtgtacggct tgctggacca 2280 gaacatcctg gagctgtact tcaacgacgg cgacgtcgtg tccaccaaca cctacttcat 2340 gaccaccggg aacgccctgg gctccgtgaa catgacgacg ggggtggaca acctgttcta 2400 catcgacaag ttccaggtgc gcgaggtcaa gtgattaatt aactcgaggc agcagcagct 2460 cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2520 ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2580 tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2640 gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2700 tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2760 gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2820 gggaagtagt gggatgggaa cacaaatgga ccgacacgcc cccggcccag gtccagttct 2880 cctgggtctt ccagaggccc gtcgccatgt aaagtggcag agattggcgc ctgattcgat 2940 ttggatccaa ggatctccaa tcggtgatgg ggactgagtg cccaactacc acccttgcac 3000 tatcgtcctc gcactattta ttcccacctt ctgctcgccc tgccgggcga ttgcgggcgt 3060 ttctgccctt gacgtatcaa tttcgcccct gctggcgcga ggattcttca ttctaataag 3120 aactcactcc cgccagctct gtacttttcc tgcggggccc ctgcatggct tgttcccaat 3180 gcttgctcga tcgacggcgc ccattgccca cggcgctgcc gcatccatgt gaagaaacac 3240 ggaagagtgc gaagactgga agtgaattaa gagtataaga agaggtacca agggattctc 3300 aggtgctctt aggaacggct tttccttcgc caagagaaac tgctactgct cgtgtcgcca 3360 cggtggtcaa gccgccccat ctgcgatcca ccaggcccat ccgcggactc gcgatcagcc 3420 tgctggatcc ggactgccga cctgaccgct cgcatccacc attacaaccc tccaattgga 3480 caccactccc acgtcctaaa gttcaccatg caagctgatc gatcgcattc gccgatgcac 3540 tcgcctgcca cagaggtgtg cgcttcggac tagcgtgcag gcgccccgag gccaccagca 3600 tgcaccgatg gaagcgggca cggccgctgc tccaggtcgc tggctcgctc agacccatag 3660 caacctccgc tgcgtcccta aatgtcacac agagcgtctt tgatgggtac ggatgggaga 3720 gaatctgatt gggcattgct ggtgcagtgc aggaagatgg caagtgcaca gtcagtcatg 3780 ctgtacaaac tggtgcctcg tagtattgac tcgtatagtg catagtatca tgcatggtcg 3840 ttacttgcaa 3850 <210> 182 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 182 tttggccccg ctttccagct ccggatctgc tggcgtccgc cgcgagacgt gacatcgcac 60 gtcgccggga gcgccagctt gatcacttgg cagggggccg tgctctacaa ataccaggcc 120 ccgcggcggt cagttcgcac atccaatacc tgccgagcca tcttgcctac actttttatc 180 gactcctcta ctctgttcgc gagagcgctc ggtccaggct tggaattcgc cgaattcagc 240 tcgatcagtc gcttctgcaa ctgatctcgg ccgttcgcag actgcctttt ctcagcttgt 300 caggtagcga gttgttgttt tatatttatt cgatttcatc tgtgttgcat gtcttgttcg 360 tgctgtgcgt tctttctggg ccgcgctgtc gggtcgcatg ggctagctgt actcatgtta 420 gtcatgccgg tccgaccttg ttcgaggaag gccccacact gagcgtgccc tctttctaca 480 ccccttgtgc agaaattaga tagaaagcaa tgctgctgca ggccttcctg ttcctgctgg 540 ccggcttcgc cgccaagatc agcgcctcca tgacgaacga gacgtccgac cgccccctgg 600 tgcacttcac ccccaacaag ggctggatga acgaccccaa cggcctgtgg tacgacgaga 660 aggacgccaa gtggcacctg tacttccagt acaacccgaa cgacaccgtc tgggggacgc 720 ccttgttctg gggccacgcc acgtccgacg acctgaccaa ctgggaggac cagcccatcg 780 ccatcgcccc gaagcgcaac gactccggcg ccttctccgg ctccatggtg gtggactaca 840 acaacacctc cggcttcttc aacgacacca tcgacccgcg ccagcgctgc gtggccatct 900 ggacctacaa caccccggag tccgaggagc agtacatctc ctacagcctg gacggcggct 960 acaccttcac cgagtaccag aagaaccccg tgctggccgc caactccacc cagttccgcg 1020 acccgaaggt cttctggtac gagccctccc agaagtggat catgaccgcg gccaagtccc 1080 aggactacaa gatcgagatc tactcctccg acgacctgaa gtcctggaag ctggagtccg 1140 cgttcgccaa cgagggcttc ctcggctacc agtacgagtg ccccggcctg atcgaggtcc 1200 ccaccgagca ggaccccagc aagtcctact gggtgatgtt catctccatc aaccccggcg 1260 ccccggccgg cggctccttc aaccagtact tcgtcggcag cttcaacggc acccacttcg 1320 aggccttcga caaccagtcc cgcgtggtgg acttcggcaa ggactactac gccctgcaga 1380 ccttcttcaa caccgacccg acctacggga gcgccctggg catcgcgtgg gcctccaact 1440 gggagtactc cgccttcgtg cccaccaacc cctggcgctc ctccatgtcc ctcgtgcgca 1500 agttctccct caacaccgag taccaggcca acccggagac ggagctgatc aacctgaagg 1560 ccgagccgat cctgaacatc agcaacgccg gcccctggag ccggttcgcc accaacacca 1620 cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa cagcaccggc accctggagt 1680 tcgagctggt gtacgccgtc aacaccaccc agacgatctc caagtccgtg ttcgcggacc 1740 tctccctctg gttcaagggc ctggaggacc ccgaggagta cctccgcatg ggcttcgagg 1800 tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa ggtgaagttc gtgaaggaga 1860 acccctactt caccaaccgc atgagcgtga acaaccagcc cttcaagagc gagaacgacc 1920 tgtcctacta caaggtgtac ggcttgctgg accagaacat cctggagctg tacttcaacg 1980 acggcgacgt cgtgtccacc aacacctact tcatgaccac cgggaacgcc ctgggctccg 2040 tgaacatgac gacgggggtg gacaacctgt tctacatcga caagttccag gtgcgcgagg 2100 tcaagtgacc gacacgcccc cggcccaggt ccagttctcc tgggtcttcc agaggcccgt 2160 cgccatgtaa agtggcagag attggcgcct gattcgattt ggatccaagg atctccaatc 2220 ggtgatgggg actgagtgcc caactaccac ccttgcacta tcgtcctcgc actatttatt 2280 cccaccttct gctcgccctg ccgggcgatt gcgggcgttt ctgcccttga cgtatcaatt 2340 tcgcccctgc tggcgcgagg attcttcatt ctaataagaa ctcactcccg ccagctctgt 2400 acttttcctg cggggcccct gcatggcttg ttcccaatgc ttgctcgatc gacggcgccc 2460 attgcccacg gcgctgccgc atccatgtga agaaacacgg aagagtgcga agactggaag 2520 tgaattaaga gtataagaag aggtaccaag ggattctcag gtgctcttag gaacggcttt 2580 tccttcgcca agagaaactg ctactgctcg tgtcgccacg gtggtcaagc cgccccatct 2640 gcgatccacc aggcccatcc gcggactcgc gatcagcctg ctggatccgg actgccgacc 2700 tgaccgctcg catccaccat tacaaccctc caattggaca ccactcccac gtcctaaagt 2760 tcaccatgca agctgatcga tcgcattcgc cgatgcactc gcctgccaca gaggtgtgcg 2820 cttcggacta gcgtgcaggc gccccgaggc caccagcatg caccgatgga agcgggcacg 2880 gccgctgctc caggtcgctg gctcgctcag acccatagca acctccgctg cgtccctaaa 2940 tgtcacacag agcgtctttg atgggtacgg atgggagaga atctgattgg gcattgctgg 3000 tgcagtgcag gaagatggca agtgcacagt cagtcatgct gtacaaactg gtgcctcgta 3060 gtattgactc gtatagtgca tagtatcatg catggtcgtt acttgcaa 3108 <210> 183 <211> 398 <212> PRT <213> Cuphea wrightii <400> 183 Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Ser Val Pro Thr Pro 1 5 10 15 Gly Thr Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu 20 25 30 Ser Val Pro Phe Lys Pro Asp Asn Gly Gly Phe His Val Lys Ala Asn 35 40 45 Ala Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Asn Leu Lys Ser 50 55 60 Gly Ser Leu Glu Thr Pro Pro Arg Ser Phe Ile Asn Gln Leu Pro Asp 65 70 75 80 Leu Ser Met Leu Leu Ser Lys Ile Thr Thr Val Phe Gly Ala Ala Glu 85 90 95 Lys Gln Trp Lys Arg Pro Gly Met Leu Val Glu Pro Phe Gly Val Asp 100 105 110 Arg Ile Phe Gln Asp Gly Val Phe Phe Arg Gln Ser Phe Ser Ile Arg 115 120 125 Ser Tyr Glu Ile Gly Val Asp Arg Thr Ala Ser Ile Glu Thr Leu Met 130 135 140 Asn Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser Ile Gly Leu 145 150 155 160 Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu 165 170 175 Ile Trp Val Val Thr Lys Ile Gln Val Glu Val Asn Arg Tyr Pro Thr 180 185 190 Trp Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu Ser Gly Lys 195 200 205 Asn Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Arg Thr Gly Glu 210 215 220 Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Asn Thr 225 230 235 240 Arg Arg Leu Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu Ile Ala Pro 245 250 255 His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Asp Arg Lys Leu His 260 265 270 Lys Leu Asp Val Lys Thr Gly Asp Ser Ile Arg Asp Gly Leu Thr Pro 275 280 285 Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr 290 295 300 Ile Gly Trp Ile Leu Lys Ser Val Pro Ile Glu Val Phe Glu Thr Gln 305 310 315 320 Glu Leu Cys Gly Val Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp 325 330 335 Ser Val Leu Glu Ser Val Thr Thr Met Asp Pro Ala Lys Glu Gly Asp 340 345 350 Arg Cys Val Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile 355 360 365 Thr Ile Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly 370 375 380 Ala Ile Ser Ser Gly Lys Thr Ser Asn Gly Asn Ser Val Ser 385 390 395 <210> 184 <211> 408 <212> PRT <213> Cuphea wrightii <400> 184 Met Val Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala 1 5 10 15 Pro Arg Pro Thr Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser 20 25 30 Leu Ser Gln Pro Phe Lys Pro Lys Ser Asn Pro Asn Gly Arg Phe Gln 35 40 45 Val Lys Ala Asn Val Ser Pro His Pro Lys Ala Asn Gly Ser Ala Val 50 55 60 Ser Leu Lys Ser Gly Ser Leu Asn Thr Leu Glu Asp Pro Pro Ser Ser 65 70 75 80 Pro Pro Pro Arg Thr Phe Leu Asn Gln Leu Pro Asp Trp Ser Arg Leu 85 90 95 Arg Thr Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Phe Thr 100 105 110 Arg Leu Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Trp Phe 115 120 125 Gly Ser Glu Thr Ile Val Gln Asp Gly Leu Val Phe Arg Glu Arg Phe 130 135 140 Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu 145 150 155 160 Thr Leu Met Asn His Leu Gln Asp Thr Ser Leu Asn His Cys Lys Ser 165 170 175 Val Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Thr 180 185 190 Arg Asp Leu Ile Trp Val Leu Thr Lys Met Gln Ile Val Val Asn Arg 195 200 205 Tyr Pro Thr Trp Gly Asp Thr Val Glu Ile Asn Ser Trp Phe Ser Gln 210 215 220 Ser Gly Lys Ile Gly Met Gly Arg Glu Trp Leu Ile Ser Asp Cys Asn 225 230 235 240 Thr Gly Glu Ile Leu Val Arg Ala Thr Ser Ala Trp Ala Met Met Asn 245 250 255 Gln Lys Thr Arg Arg Phe Ser Lys Leu Pro Cys Glu Val Arg Gln Glu 260 265 270 Ile Ala Pro His Phe Val Asp Ala Pro Pro Val Ile Glu Asp Asn Asp 275 280 285 Arg Lys Leu His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Cys Lys 290 295 300 Gly Leu Thr Pro Gly Trp Asn Asp Phe Asp Val Asn Gln His Val Ser 305 310 315 320 Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val 325 330 335 Leu Glu Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu 340 345 350 Cys Gly Arg Glu Ser Val Val Glu Ser Val Thr Ser Met Asn Pro Ser 355 360 365 Lys Val Gly Asp Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp 370 375 380 Gly Ala Asp Ile Met Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala 385 390 395 400 Gly Thr Asn Arg Ala Ile Ser Thr 405 <210> 185 <211> 540 <212> PRT <213> Cuphea wrightii <400> 185 Met Ala Ala Ala Ala Ser Met Val Ala Ser Pro Phe Cys Thr Trp Leu 1 5 10 15 Val Ala Ser Cys Met Ser Thr Ser Phe Asp Asn Asp Pro Arg Ser Pro 20 25 30 Ser Val Lys Arg Phe Pro Arg Arg Lys Arg Val Leu Ser Gln Arg Gly 35 40 45 Ser Thr Phe Gln Cys Leu Val Ala Ser Cys Ile Asp Pro Cys Asp Gln 50 55 60 Tyr Arg Ser Ser Ala Ser Leu Ser Phe Leu Gly Asp Asn Gly Phe Ala 65 70 75 80 Ser Leu Phe Gly Ser Lys Pro Phe Met Ser Asn Arg Gly His Arg Arg 85 90 95 Leu Arg Arg Ala Ser His Ser Gly Glu Ala Met Ala Val Ala Leu Gln 100 105 110 Pro Ala Gln Glu Ala Gly Thr Lys Lys Lys Pro Val Ile Lys Gln Arg 115 120 125 Arg Val Val Val Thr Gly Met Gly Val Val Thr Pro Leu Gly His Glu 130 135 140 Pro Asp Val Phe Tyr Asn Asn Leu Leu Asp Gly Val Ser Gly Ile Ser 145 150 155 160 Glu Ile Glu Thr Phe Asp Cys Thr Gln Phe Pro Thr Arg Ile Ala Gly 165 170 175 Glu Ile Lys Ser Phe Ser Thr Asp Gly Trp Val Ala Pro Lys Leu Ser 180 185 190 Lys Arg Met Asp Lys Phe Met Leu Tyr Leu Leu Thr Ala Gly Lys Lys 195 200 205 Ala Leu Ala Asp Gly Gly Ile Thr Asp Glu Val Met Lys Glu Leu Asp 210 215 220 Lys Arg Lys Cys Gly Val Leu Ile Gly Ser Gly Met Gly Gly Met Lys 225 230 235 240 Val Phe Asn Asp Ala Ile Glu Ala Leu Arg Val Ser Tyr Lys Lys Met 245 250 255 Asn Pro Phe Cys Val Pro Phe Ala Thr Thr Asn Met Gly Ser Ala Met 260 265 270 Leu Ala Met Asp Leu Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr 275 280 285 Ala Cys Ala Thr Ser Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile 290 295 300 Ile Arg Gly Glu Ala Asp Met Met Leu Cys Gly Gly Ser Asp Ala Val 305 310 315 320 Ile Ile Pro Ile Gly Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser 325 330 335 Gln Arg Asn Ser Asp Pro Thr Lys Ala Ser Arg Pro Trp Asp Ser Asn 340 345 350 Arg Asp Gly Phe Val Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu 355 360 365 Glu Leu Glu His Ala Lys Lys Arg Gly Ala Thr Ile Tyr Ala Glu Phe 370 375 380 Leu Gly Gly Ser Phe Thr Cys Asp Ala Tyr His Met Thr Glu Pro His 385 390 395 400 Pro Glu Gly Ala Gly Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln 405 410 415 Ala Gly Val Ser Lys Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr 420 425 430 Ser Thr Ser Ala Gly Asp Ile Lys Glu Tyr Gln Ala Leu Ala Arg Cys 435 440 445 Phe Gly Gln Asn Ser Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile 450 455 460 Gly His Leu Leu Gly Ala Ala Gly Gly Val Glu Ala Val Thr Val Val 465 470 475 480 Gln Ala Ile Arg Thr Gly Trp Ile His Pro Asn Leu Asn Leu Glu Asp 485 490 495 Pro Asp Lys Ala Val Asp Ala Lys Leu Leu Val Gly Pro Lys Lys Glu 500 505 510 Arg Leu Asn Val Lys Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly 515 520 525 His Asn Ser Ser Ile Leu Phe Ala Pro Cys Asn Val 530 535 540 <210> 186 <211> 534 <212> PRT <213> Cuphea hookeriana <400> 186 Met Ala Thr Ala Ser Cys Met Val Ala Ser Pro Phe Cys Thr Trp Leu 1 5 10 15 Val Ala Ala Cys Met Pro Thr Ser Ser Asp Asn Asp Pro Arg Ser Leu 20 25 30 Ser His Lys Arg Leu Arg Leu Ser Arg Arg Arg Arg Thr Leu Ser Ser 35 40 45 His Cys Ser Leu Arg Gly Ser Thr Phe Gln Cys Leu Asp Pro Cys Asn 50 55 60 Gln Gln Arg Phe Leu Gly Asp Asn Gly Phe Ala Ser Leu Phe Gly Ser 65 70 75 80 Lys Pro Leu Arg Ser Asn Arg Gly His Leu Arg Leu Gly Arg Thr Ser 85 90 95 His Ser Gly Glu Val Met Ala Val Ala Met Gln Pro Ala Gln Glu Val 100 105 110 Ser Thr Asn Lys Lys Pro Ala Thr Lys Gln Arg Arg Val Val Val Thr 115 120 125 Gly Met Gly Val Val Thr Pro Leu Gly His Asp Pro Asp Val Tyr Tyr 130 135 140 Asn Asn Leu Leu Asp Gly Ile Ser Gly Ile Ser Glu Ile Glu Asn Phe 145 150 155 160 Asp Cys Ser Gln Phe Pro Thr Arg Ile Ala Gly Glu Ile Lys Ser Phe 165 170 175 Ser Thr Asp Gly Trp Val Ala Pro Lys Phe Ser Glu Arg Met Asp Lys 180 185 190 Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys Ala Leu Ala Asp Gly 195 200 205 Gly Ile Thr Glu Asp Ala Met Lys Glu Leu Asn Lys Arg Lys Cys Gly 210 215 220 Val Leu Ile Gly Ser Gly Leu Gly Gly Met Lys Val Phe Ser Asp Ser 225 230 235 240 Ile Glu Ala Leu Arg Thr Ser Tyr Lys Lys Ile Ser Pro Phe Cys Val 245 250 255 Pro Phe Ser Thr Thr Asn Met Gly Ser Ala Ile Leu Ala Met Asp Leu 260 265 270 Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Ser 275 280 285 Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile Ile Lys Gly Glu Ala 290 295 300 Asp Met Met Leu Cys Gly Gly Ser Asp Ala Ala Val Leu Pro Val Gly 305 310 315 320 Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser Gln Arg Asn Asn Asp 325 330 335 Pro Thr Lys Ala Ser Arg Pro Trp Asp Ser Asn Arg Asp Gly Phe Val 340 345 350 Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu Glu Leu Glu His Ala 355 360 365 Lys Lys Arg Gly Ala Thr Ile Tyr Ala Glu Phe Leu Gly Gly Ser Phe 370 375 380 Thr Cys Asp Ala Tyr His Met Thr Glu Pro His Pro Glu Gly Ala Gly 385 390 395 400 Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln Ser Gly Val Ser Arg 405 410 415 Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr Ser Thr Pro Ala Gly 420 425 430 Asp Ile Lys Glu Tyr Gln Ala Leu Ala His Cys Phe Gly Gln Asn Ser 435 440 445 Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly 450 455 460 Gly Ala Gly Gly Val Glu Ala Val Ala Val Val Gln Ala Ile Arg Thr 465 470 475 480 Gly Trp Ile His Pro Asn Ile Asn Leu Glu Asp Pro Asp Glu Gly Val 485 490 495 Asp Ala Lys Leu Leu Val Gly Pro Lys Lys Glu Lys Leu Lys Val Lys 500 505 510 Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly His Asn Ser Ser Ile 515 520 525 Leu Phe Ala Pro Cys Asn 530 <210> 187 <211> 385 <212> PRT <213> Carthamus tinctorius <400> 187 Met Leu Ser Lys Gly Ala Pro Ala Ala Pro Ala Val Ala Ala Met Tyr 1 5 10 15 Asn Ala Ser Ala Lys Asp Thr Thr Phe Ala Leu Thr His Ser Arg Ser 20 25 30 Ile Gly Ser Val Ser Ile Arg Arg Arg Tyr Asn Val Phe Leu Cys Asn 35 40 45 Ser Ser Ser Ser Ser Arg Lys Val Ser Pro Leu Leu Ala Val Ala Thr 50 55 60 Gly Glu Gln Pro Ser Gly Val Ala Ser Leu Arg Glu Ala Asp Lys Glu 65 70 75 80 Lys Ser Leu Gly Asn Arg Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly 85 90 95 Leu Ser Tyr Lys Glu Lys Phe Val Ile Arg Cys Tyr Glu Val Gly Ile 100 105 110 Asn Lys Thr Ala Thr Ile Glu Thr Ile Ala Asn Leu Leu Gln Glu Val 115 120 125 Gly Gly Asn His Ala Gln Gly Val Gly Phe Ser Thr Asp Gly Phe Ala 130 135 140 Thr Thr Thr Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg 145 150 155 160 Met His Ile Glu Ile Tyr Arg Tyr Pro Ala Trp Ser Asp Val Ile Glu 165 170 175 Ile Glu Thr Trp Val Gln Gly Glu Gly Lys Val Gly Thr Arg Arg Asp 180 185 190 Trp Ile Leu Lys Asp Tyr Ala Asn Gly Glu Val Ile Gly Arg Ala Thr 195 200 205 Ser Lys Trp Val Met Met Asn Glu Asp Thr Arg Arg Leu Gln Lys Val 210 215 220 Ser Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg Thr Leu 225 230 235 240 Arg Leu Ala Phe Pro Glu Glu Asn Asn Asn Ser Met Lys Lys Ile Pro 245 250 255 Lys Leu Glu Asp Pro Ala Glu Tyr Ser Arg Leu Gly Leu Val Pro Arg 260 265 270 Arg Ser Asp Leu Asp Met Asn Lys His Val Asn Asn Val Thr Tyr Ile 275 280 285 Gly Trp Ala Leu Glu Ser Ile Pro Pro Glu Ile Ile Asp Thr His Glu 290 295 300 Leu Gln Ala Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Arg Asp Asp 305 310 315 320 Ile Val Asp Ser Leu Thr Ser Arg Glu Pro Leu Gly Asn Ala Ala Gly 325 330 335 Val Lys Phe Lys Glu Ile Asn Gly Ser Val Ser Pro Lys Lys Asp Glu 340 345 350 Gln Asp Leu Ser Arg Phe Met His Leu Leu Arg Ser Ala Gly Ser Gly 355 360 365 Leu Glu Ile Asn Arg Cys Arg Thr Glu Trp Arg Lys Lys Pro Ala Lys 370 375 380 Arg 385 <210> 188 <211> 584 <212> PRT <213> Arabidopsis thaliana <400> 188 Met Thr Lys Glu Val Cys Ser Asn Ile Gly Leu Trp Leu Leu Leu Thr 1 5 10 15 Leu Leu Ile Gly Asn Tyr Val Val Asn Leu Glu Ala Ser His His Val 20 25 30 Tyr Lys Arg Leu Thr Gln Ser Thr Asn Thr Lys Ser Pro Ser Val Asn 35 40 45 Gln Pro Tyr Arg Thr Gly Phe His Phe Gln Pro Pro Lys Asn Trp Met 50 55 60 Asn Asp Pro Asn Gly Pro Met Ile Tyr Lys Gly Ile Tyr His Leu Phe 65 70 75 80 Tyr Gln Trp Asn Pro Lys Gly Ala Val Trp Gly Asn Ile Val Trp Ala 85 90 95 His Ser Thr Ser Thr Asp Leu Ile Asn Trp Asp Pro His Pro Pro Ala 100 105 110 Ile Phe Pro Ser Ala Pro Phe Asp Ile Asn Gly Cys Trp Ser Gly Ser 115 120 125 Ala Thr Ile Leu Pro Asn Gly Lys Pro Val Ile Leu Tyr Thr Gly Ile 130 135 140 Asp Pro Lys Asn Gln Gln Val Gln Asn Ile Ala Glu Pro Lys Asn Leu 145 150 155 160 Ser Asp Pro Tyr Leu Arg Glu Trp Lys Lys Ser Pro Leu Asn Pro Leu 165 170 175 Met Ala Pro Asp Ala Val Asn Gly Ile Asn Ala Ser Ser Phe Arg Asp 180 185 190 Pro Thr Thr Ala Trp Leu Gly Gln Asp Lys Lys Trp Arg Val Ile Ile 195 200 205 Gly Ser Lys Ile His Arg Arg Gly Leu Ala Ile Thr Tyr Thr Ser Lys 210 215 220 Asp Phe Leu Lys Trp Glu Lys Ser Pro Glu Pro Leu His Tyr Asp Asp 225 230 235 240 Gly Ser Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Thr Arg Phe 245 250 255 Gly Ser Asn Gly Val Glu Thr Ser Ser Phe Gly Glu Pro Asn Glu Ile 260 265 270 Leu Lys His Val Leu Lys Ile Ser Leu Asp Asp Thr Lys His Asp Tyr 275 280 285 Tyr Thr Ile Gly Thr Tyr Asp Arg Val Lys Asp Lys Phe Val Pro Asp 290 295 300 Asn Gly Phe Lys Met Asp Gly Thr Ala Pro Arg Tyr Asp Tyr Gly Lys 305 310 315 320 Tyr Tyr Ala Ser Lys Thr Phe Phe Asp Ser Ala Lys Asn Arg Arg Ile 325 330 335 Leu Trp Gly Trp Thr Asn Glu Ser Ser Ser Val Glu Asp Asp Val Glu 340 345 350 Lys Gly Trp Ser Gly Ile Gln Thr Ile Pro Arg Lys Ile Trp Leu Asp 355 360 365 Arg Ser Gly Lys Gln Leu Ile Gln Trp Pro Val Arg Glu Val Glu Arg 370 375 380 Leu Arg Thr Lys Gln Val Lys Asn Leu Arg Asn Lys Val Leu Lys Ser 385 390 395 400 Gly Ser Arg Leu Glu Val Tyr Gly Val Thr Ala Ala Gln Ala Asp Val 405 410 415 Glu Val Leu Phe Lys Val Arg Asp Leu Glu Lys Ala Asp Val Ile Glu 420 425 430 Pro Ser Trp Thr Asp Pro Gln Leu Ile Cys Ser Lys Met Asn Val Ser 435 440 445 Val Lys Ser Gly Leu Gly Pro Phe Gly Leu Met Val Leu Ala Ser Lys 450 455 460 Asn Leu Glu Glu Tyr Thr Ser Val Tyr Phe Arg Ile Phe Lys Ala Arg 465 470 475 480 Gln Asn Ser Asn Lys Tyr Val Val Leu Met Cys Ser Asp Gln Ser Arg 485 490 495 Ser Ser Leu Lys Glu Asp Asn Asp Lys Thr Thr Tyr Gly Ala Phe Val 500 505 510 Asp Ile Asn Pro His Gln Pro Leu Ser Leu Arg Ala Leu Ile Asp His 515 520 525 Ser Val Val Glu Ser Phe Gly Gly Lys Gly Arg Ala Cys Ile Thr Ser 530 535 540 Arg Val Tyr Pro Lys Leu Ala Ile Gly Lys Ser Ser His Leu Phe Ala 545 550 555 560 Phe Asn Tyr Gly Tyr Gln Ser Val Asp Val Leu Asn Leu Asn Ala Trp 565 570 575 Ser Met Asn Ser Ala Gln Ile Ser 580 <210> 189 <211> 1274 <212> DNA <213> Cocosnucifer nucifera <400> 189 actagtatgg tggcctccgt ggccgcctcc tcctccttct tccccgtgcc ctcctcctcc 60 tcctccgcct ccgccaaggc ctcccgcggc atccccgacg gcctggacgt gcgcggcatc 120 gtggccaagc ccgcctcctc ctccggctgg atgcaggcca aggcctccgc ccgcgccatc 180 cccaagatcg acgacaccaa ggtgggcctg cgcaccgacg tggaggagga cgccgcctcc 240 accgcccgcc gcacctccta cgggcgcgcc aaccagctgc ccgactggtc catgctgctg 300 gccgccatcc gcaccatctt ctccgccgcc gagaagcagt ggaccctgct ggactccaag 360 aagcgcggcg ccgacgccgt ggccgacgcc tccggcgtgg gcaagatggt gaagaacggc 420 ctggtgtacc gccagaactt ctccatccgc tcctacgaga tcggcgtgga caagcgcgcc 480 tccgtggagg ccctgatgaa ccacttccag gagacctccc tgaaccactg caagtgcatc 540 ggcctgatgc acggcggctt cggctgcacc cccgagatga cccgccgcaa cctgatctgg 600 gtggtggcca agatgctggt gcacgtggag cgctacccct ggtggggcga cgtggtgcag 660 atcaacacct ggatctcctc ctccggcaag aacggcatgg gccgcgactg gcacgtgcac 720 gactgccaga ccggcctgcc catcatgcgc ggcacctccg tgtgggtgat gatggacaag 780 cacacccgcc gcctgtccaa gctgcccgag gaggtgcgcg ccgagatcac ccccttcttc 840 tccgagcgcg acgccgtgct ggacgacaac ggccgcaagc tgcccaagtt cgacgacgac 900 tccgccgccc acgtgcgccg cggcctgacc ccccgctggc acgacttcga cgtgaaccag 960 cacgtgaaca acgtgaagta cgtgggctgg attctggagt ccgtgcccgt gtggatgctg 1020 gacggctacg aggtggccac catgtccctg gagtaccgcc gcgagtgccg catggactcc 1080 gtggtgcagt ccctgaccgc cgtgtcctcc gaccacgccg acggctcccc catcgtgtgc 1140 cagcacctgc tgcgcctgga ggacggcacc gagatcgtgc gcggccagac cgagtggcgc 1200 cccaagcagc aggcccgcga cctgggcaac atgggcctgc accccaccga gtccaagtga 1260 ttaattaact cgag 1274 <210> 190 <211> 640 <212> PRT <213> Aspergillus awamorii <400> 190 Met Ser Phe Arg Ser Leu Leu Ala Leu Ser Gly Leu Val Cys Thr Gly 1 5 10 15 Leu Ala Asn Val Ile Ser Lys Arg Ala Thr Leu Asp Ser Trp Leu Ser 20 25 30 Asn Glu Ala Thr Val Ala Arg Thr Ala Ile Leu Asn Asn Ile Gly Ala 35 40 45 Asp Gly Ala Trp Val Ser Gly Ala Asp Ser Gly Ile Val Val Ala Ser 50 55 60 Pro Ser Thr Asp Asn Pro Asp Tyr Phe Tyr Thr Trp Thr Arg Asp Ser 65 70 75 80 Gly Leu Val Leu Lys Thr Leu Val Asp Leu Phe Arg Asn Gly Asp Thr 85 90 95 Ser Leu Leu Ser Thr Ile Glu Asn Tyr Ile Ser Ala Gln Ala Ile Val 100 105 110 Gln Gly Ile Ser Asn Pro Ser Gly Asp Leu Ser Ser Gly Ala Gly Leu 115 120 125 Gly Glu Pro Lys Phe Asn Val Asp Glu Thr Ala Tyr Thr Gly Ser Trp 130 135 140 Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala Thr Ala Met Ile 145 150 155 160 Gly Phe Gly Gln Trp Leu Leu Asp Asn Gly Tyr Thr Ser Thr Ala Thr 165 170 175 Asp Ile Val Trp Pro Leu Val Arg Asn Asp Leu Ser Tyr Val Ala Gln 180 185 190 Tyr Trp Asn Gln Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly Ser 195 200 205 Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala Leu Val Glu Gly Ser 210 215 220 Ala Phe Ala Thr Ala Val Gly Ser Ser Cys Ser Trp Cys Asp Ser Gln 225 230 235 240 Ala Pro Glu Ile Leu Cys Tyr Leu Gln Ser Phe Trp Thr Gly Ser Phe 245 250 255 Ile Leu Ala Asn Phe Asp Ser Ser Arg Ser Gly Lys Asp Ala Asn Thr 260 265 270 Leu Leu Gly Ser Ile His Thr Phe Asp Pro Glu Ala Ala Cys Asp Asp 275 280 285 Ser Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala Asn His Lys Glu 290 295 300 Val Val Asp Ser Phe Arg Ser Ile Tyr Thr Leu Asn Asp Gly Leu Ser 305 310 315 320 Asp Ser Glu Ala Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr 325 330 335 Asn Gly Asn Pro Trp Phe Leu Cys Thr Leu Ala Ala Ala Glu Gln Leu 340 345 350 Tyr Asp Ala Leu Tyr Gln Trp Asp Lys Gln Gly Ser Leu Glu Val Thr 355 360 365 Asp Val Ser Leu Asp Phe Phe Lys Ala Leu Tyr Ser Asp Ala Ala Thr 370 375 380 Gly Thr Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Ser Ile Val Asp Ala 385 390 395 400 Val Lys Thr Phe Ala Asp Gly Phe Val Ser Ile Val Glu Thr His Ala 405 410 415 Ala Ser Asn Gly Ser Met Ser Glu Gln Tyr Asp Lys Ser Asp Gly Glu 420 425 430 Gln Leu Ser Ala Arg Asp Leu Thr Trp Ser Tyr Ala Ala Leu Leu Thr 435 440 445 Ala Asn Asn Arg Arg Asn Ser Val Val Pro Ala Ser Trp Gly Glu Thr 450 455 460 Ser Ala Ser Ser Val Pro Gly Thr Cys Ala Ala Thr Ser Ala Ile Gly 465 470 475 480 Thr Tyr Ser Ser Val Thr Val Thr Ser Trp Pro Ser Ile Val Ala Thr 485 490 495 Gly Gly Thr Thr Thr Thr Ala Thr Pro Thr Gly Ser Gly Ser Val Thr 500 505 510 Ser Thr Ser Lys Thr Thr Ala Thr Ala Ser Lys Thr Ser Thr Ser Thr 515 520 525 Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp 530 535 540 Leu Thr Ala Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser 545 550 555 560 Ile Ser Gln Leu Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser 565 570 575 Ala Asp Lys Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr 580 585 590 Leu Pro Ala Gly Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser 595 600 605 Asp Asp Ser Val Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val 610 615 620 Pro Gln Ala Cys Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg 625 630 635 640 <210> 191 <211> 604 <212> PRT <213> Rhizopus oryzae <400> 191 Met Gln Leu Phe Asn Leu Pro Leu Lys Val Ser Phe Phe Leu Val Leu 1 5 10 15 Ser Tyr Phe Ser Leu Leu Val Ser Ala Ala Ser Ile Pro Ser Ser Ala 20 25 30 Ser Val Gln Leu Asp Ser Tyr Asn Tyr Asp Gly Ser Thr Phe Ser Gly 35 40 45 Lys Ile Tyr Val Lys Asn Ile Ala Tyr Ser Lys Lys Val Thr Val Ile 50 55 60 Tyr Ala Asp Gly Ser Asp Asn Trp Asn Asn Asn Gly Asn Thr Ile Ala 65 70 75 80 Ala Ser Tyr Ser Ala Pro Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr 85 90 95 Phe Ser Ala Ser Ile Asn Gly Ile Lys Glu Phe Tyr Ile Lys Tyr Glu 100 105 110 Val Ser Gly Lys Thr Tyr Tyr Asp Asn Asn Asn Ser Ala Asn Tyr Gln 115 120 125 Val Ser Thr Ser Lys Pro Thr Thr Thr Thr Ala Thr Ala Thr Thr Thr 130 135 140 Thr Ala Pro Ser Thr Ser Thr Thr Thr Pro Pro Ser Arg Ser Glu Pro 145 150 155 160 Ala Thr Phe Pro Thr Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys Lys 165 170 175 Gln Glu Gly Ile Ser Arg Phe Ala Met Leu Arg Asn Ile Asn Pro Pro 180 185 190 Gly Ser Ala Thr Gly Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly Pro 195 200 205 Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp Ala Ala Leu Thr Ser Asn Val 210 215 220 Ile Val Tyr Glu Tyr Asn Thr Thr Leu Ser Gly Asn Lys Thr Ile Leu 225 230 235 240 Asn Val Leu Lys Asp Tyr Val Thr Phe Ser Val Lys Thr Gln Ser Thr 245 250 255 Ser Thr Val Cys Asn Cys Leu Gly Glu Pro Lys Phe Asn Pro Asp Ala 260 265 270 Ser Gly Tyr Thr Gly Ala Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala 275 280 285 Glu Arg Ala Thr Thr Phe Ile Leu Phe Ala Asp Ser Tyr Leu Thr Gln 290 295 300 Thr Lys Asp Ala Ser Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile Phe 305 310 315 320 Lys Asp Leu Asp Tyr Val Val Asn Val Trp Ser Asn Gly Cys Phe Asp 325 330 335 Leu Trp Glu Glu Val Asn Gly Val His Phe Tyr Thr Leu Met Val Met 340 345 350 Arg Lys Gly Leu Leu Leu Gly Ala Asp Phe Ala Lys Arg Asn Gly Asp 355 360 365 Ser Thr Arg Ala Ser Thr Tyr Ser Ser Thr Ala Ser Thr Ile Ala Asn 370 375 380 Lys Ile Ser Ser Phe Trp Val Ser Ser Asn Asn Trp Ile Gln Val Ser 385 390 395 400 Gln Ser Val Thr Gly Gly Val Ser Lys Lys Gly Leu Asp Val Ser Thr 405 410 415 Leu Leu Ala Ala Asn Leu Gly Ser Val Asp Asp Gly Phe Phe Thr Pro 420 425 430 Gly Ser Glu Lys Ile Leu Ala Thr Ala Val Ala Val Glu Asp Ser Phe 435 440 445 Ala Ser Leu Tyr Pro Ile Asn Lys Asn Leu Pro Ser Tyr Leu Gly Asn 450 455 460 Ser Ile Gly Arg Tyr Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn Ser 465 470 475 480 Gln Gly Asn Ser Trp Phe Leu Ala Val Thr Gly Tyr Ala Glu Leu Tyr 485 490 495 Tyr Arg Ala Ile Lys Glu Trp Ile Gly Asn Gly Gly Val Thr Val Ser 500 505 510 Ser Ile Ser Leu Pro Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr Ser 515 520 525 Gly Lys Lys Tyr Thr Val Gly Thr Ser Asp Phe Asn Asn Leu Ala Gln 530 535 540 Asn Ile Ala Leu Ala Ala Asp Arg Phe Leu Ser Thr Val Gln Leu His 545 550 555 560 Ala His Asn Asn Gly Ser Leu Ala Glu Glu Phe Asp Arg Thr Thr Gly 565 570 575 Leu Ser Thr Gly Ala Arg Asp Leu Thr Trp Ser His Ala Ser Leu Ile 580 585 590 Thr Ala Ser Tyr Ala Lys Ala Gly Ala Pro Ala Ala 595 600 <210> 192 <211> 637 <212> PRT <213> Chlamydomonas reinhardtii <400> 192 Met Gln Leu Phe Ala Arg Ser Pro Ala Gly Val Arg Val Gln Gln His 1 5 10 15 Ala Gln Arg Lys Ser Ala Lys Val Ala Gly Arg Gly Arg Leu Asn Val 20 25 30 Arg Ala Glu Ala Ile Ala Met Pro Pro Ala Pro Ala Glu Gln Glu Lys 35 40 45 Glu Leu Gln Arg Leu Glu Lys Gly Asn Ala Phe Glu Glu Leu Lys Ala 50 55 60 Met Ala Thr Ser Pro Arg Gln Ser Val Asn Arg Pro Gln Lys Ala Glu 65 70 75 80 Asp Leu Thr Phe Arg Gln Ala Pro Thr Ile Ala Asp Cys Phe Pro Asp 85 90 95 Ser Glu Lys Met Tyr Lys Glu Val Lys Tyr Asp Asp Glu Ile Thr Leu 100 105 110 Arg Val Pro Phe Arg Arg Ile His Leu Thr Thr Gly Thr Asp Phe Asp 115 120 125 Val Tyr Asp Thr Ser Gly Pro Gln Asn Val Asp Pro Arg Val Gly Leu 130 135 140 Pro Lys Leu Arg Lys Pro Trp Val Glu Arg Arg Glu Ala Asn Gly Thr 145 150 155 160 His Ala Arg Ala Gly Val Thr Gln Met Ala Leu Ala Arg Ala Gly Ile 165 170 175 Ile Ser Glu Glu Met Arg Phe Ala Ala Glu Arg Glu Gly Leu Asp Pro 180 185 190 Glu Phe Val Arg Ser Glu Leu Ala Arg Gly Arg Ala Ile Ile Pro Ala 195 200 205 Asn Lys Cys His Leu Glu Leu Glu Pro Cys Val Ile Gly Arg Asn Phe 210 215 220 Met Thr Lys Val Asn Ser Asn Phe Gly Asn Ser Ala Val Thr Ser Ser 225 230 235 240 Ile Glu Glu Glu Val Glu Lys Leu Gln Trp Ser Thr Ile Trp Gly Ala 245 250 255 Asp Thr Val Met Asp Leu Ser Thr Gly His Asn Ile Phe Glu Thr Arg 260 265 270 Glu Trp Val Met Arg Asn Ser Pro Val Pro Val Gly Thr Val Pro Ile 275 280 285 Tyr Glu Ala Leu Glu Arg Ala Asp Gly Gln Val Glu Gly Ile Thr Trp 290 295 300 Glu Leu Phe Arg Gln Val Leu Leu Asp Gln Ala Glu Gln Gly Val Asp 305 310 315 320 Tyr Trp Thr Ile His Ala Gly Val Leu Leu Arg His Val Pro Leu Thr 325 330 335 Ala Asn Arg Ile Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala 340 345 350 Lys Leu Cys Leu Met Glu His Lys Glu Asn Phe Ala Tyr Glu His Trp 355 360 365 Asp Glu Ile Leu Asp Ile Cys Ala Lys Tyr Asp Ile Thr Leu Ser Ile 370 375 380 Gly Asp Gly Leu Arg Pro Gly Cys Ile Ala Asp Ala Asn Asp Ala Ala 385 390 395 400 Gln Phe Ala Glu Leu Lys Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp 405 410 415 Glu Lys Asn Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Leu 420 425 430 Asn Lys Ile Pro Glu Asn Met Ala Lys Gln Leu Glu Trp Cys Ser Glu 435 440 445 Ala Pro Phe Tyr Thr Leu Gly Pro Leu Thr Thr Asp Ile Ala Pro Gly 450 455 460 Tyr Asp His Ile Thr Ser Ala Ile Gly Ala Ala Thr Ile Gly Ala Leu 465 470 475 480 Gly Thr Ala Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu 485 490 495 Pro Asn Arg Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala 500 505 510 Ala His Ala Ala Asp Leu Ala Lys Gly His Pro Ala Ala Ala Ser Trp 515 520 525 Asp Leu Glu Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Arg Asp Gln 530 535 540 Phe Ala Leu Ser Leu Asp Pro Val Thr Ala Gln Ala Tyr His Asp Ala 545 550 555 560 Thr Leu Pro Gln Glu Pro Ala Lys Thr Ala His Phe Cys Ser Met Cys 565 570 575 Gly Pro Lys Phe Cys Ser Met Asn Ile Thr Gln Glu Leu Arg Gln Met 580 585 590 Val Gln Ala Glu Gln Ala Gln Glu Ala Ala Ala Ala Ala Ala Ala Ala 595 600 605 Asp Asp Ala Asp Leu Leu Ala Ala Ala Ala Glu Gly Met Lys Glu Met 610 615 620 Ser Glu Lys Phe Lys Gln Ser Gly Ala Gln Leu Tyr His 625 630 635 <210> 193 <211> 631 <212> PRT <213> Salmonella enterica <400> 193 Met Ser Thr Thr Thr Leu Thr Arg Arg Glu Gln Arg Ala Lys Ala Gln 1 5 10 15 His Phe Ile Asp Thr Leu Glu Gly Thr Ala Phe Pro Asn Ser Lys Arg 20 25 30 Ile Tyr Val Thr Gly Ser Gln His Asp Ile Arg Val Pro Met Arg Glu 35 40 45 Ile Gln Leu Ser Pro Thr Leu Ile Gly Gly Ser Lys Asp Asn Pro Gln 50 55 60 Phe Glu Glu Asn Glu Ala Val Pro Val Tyr Asp Thr Ser Gly Pro Tyr 65 70 75 80 Gly Asp Pro Glu Val Ala Ile Asn Val Gln Gln Gly Leu Ala Lys Leu 85 90 95 Arg Gln Pro Trp Ile Asp Ala Arg Asn Asp Ser Glu Glu Leu Asp Asp 100 105 110 Arg Ser Ser Ala Tyr Thr Arg Glu Arg Leu Ala Asp Asp Gly Leu Asp 115 120 125 Asp Leu Arg Phe Thr Gly Leu Leu Thr Pro Lys Arg Ala Lys Ala Gly 130 135 140 Lys Arg Val Thr Gln Leu His Tyr Ala Arg Lys Gly Ile Val Thr Pro 145 150 155 160 Glu Met Glu Phe Ile Ala Ile Arg Glu Asn Met Gly Arg Glu Arg Ile 165 170 175 Arg Ser Glu Val Leu Arg His Gln His Pro Gly Met Asn Phe Gly Ala 180 185 190 Arg Leu Pro Glu Asn Ile Thr Pro Glu Phe Val Arg Asp Glu Val Ala 195 200 205 Ala Gly Arg Ala Ile Ile Pro Ala Asn Ile Asn His Pro Glu Ser Glu 210 215 220 Pro Met Ile Ile Gly Arg Asn Phe Leu Val Lys Val Asn Ala Asn Ile 225 230 235 240 Gly Asn Ser Ala Val Thr Ser Ser Ile Glu Glu Glu Val Glu Lys Leu 245 250 255 Val Trp Ser Thr Arg Trp Gly Ala Asp Thr Val Met Asp Leu Ser Thr 260 265 270 Gly Arg Tyr Ile His Glu Thr Arg Glu Trp Ile Leu Arg Asn Ser Pro 275 280 285 Val Pro Ile Gly Thr Val Pro Ile Tyr Gln Ala Leu Glu Lys Val Asn 290 295 300 Gly Ile Ala Glu Asp Leu Thr Trp Glu Ala Phe Arg Asp Thr Leu Leu 305 310 315 320 Glu Gln Ala Glu Gln Gly Val Asp Tyr Phe Thr Ile His Ala Gly Val 325 330 335 Leu Leu Arg Tyr Val Pro Met Thr Ala Lys Arg Leu Thr Gly Ile Val 340 345 350 Ser Arg Gly Gly Ser Ile Met Ala Lys Trp Cys Leu Ser His His Lys 355 360 365 Glu Asn Phe Leu Phe Glu His Phe Arg Glu Ile Cys Glu Ile Cys Ala 370 375 380 Ala Tyr Asp Val Ser Leu Ser Leu Gly Asp Gly Leu Arg Pro Gly Ser 385 390 395 400 Ile Gln Asp Ala Asn Asp Glu Ala Gln Phe Ser Glu Leu His Thr Leu 405 410 415 Gly Glu Leu Thr Lys Ile Ala Trp Glu Tyr Asp Val Gln Val Met Ile 420 425 430 Glu Gly Pro Gly His Val Pro Met His Met Ile Gln Arg Asn Met Thr 435 440 445 Glu Glu Leu Glu Ser Cys His Glu Ala Pro Phe Tyr Thr Leu Gly Pro 450 455 460 Leu Thr Thr Asp Ile Ala Pro Gly Tyr Asp His Phe Thr Ser Gly Ile 465 470 475 480 Gly Ala Ala Met Ile Gly Trp Phe Gly Cys Ala Met Leu Cys Tyr Val 485 490 495 Thr Pro Lys Glu His Leu Gly Leu Pro Asn Lys Glu Asp Val Lys Gln 500 505 510 Gly Leu Ile Thr Tyr Lys Ile Ala Ala His Ala Ala Asp Leu Ala Lys 515 520 525 Gly His Pro Gly Ala Gln Ile Arg Asp Asn Ala Met Ser Lys Ala Arg 530 535 540 Phe Glu Phe Arg Trp Glu Asp Gln Phe Asn Leu Ala Leu Asp Pro Phe 545 550 555 560 Thr Ala Arg Ala Tyr His Asp Glu Thr Leu Pro Gln Glu Ser Gly Lys 565 570 575 Val Ala His Phe Cys Ser Met Cys Gly Pro Lys Phe Cys Ser Met Lys 580 585 590 Ile Ser Gln Glu Val Arg Asp Tyr Ala Ala Ala Gln Thr Ile Glu Ile 595 600 605 Gly Met Ala Asp Met Ser Glu Asp Phe Arg Ala Lys Gly Gly Glu Ile 610 615 620 Tyr Leu Lys Arg Glu Glu Ala 625 630 <210> 194 <211> 264 <212> PRT <213> Unknown <220> <223> source organism never identified, selectable marker <400> 194 Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val 1 5 10 15 Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser 20 25 30 Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe 35 40 45 Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala 50 55 60 Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val 65 70 75 80 Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu 85 90 95 Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys 100 105 110 Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro 115 120 125 Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala 130 135 140 Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu 145 150 155 160 Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala 165 170 175 Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys 180 185 190 Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp 195 200 205 Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala 210 215 220 Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe 225 230 235 240 Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe 245 250 255 Tyr Arg Leu Leu Asp Glu Phe Phe 260 <210> 195 <211> 366 <212> PRT <213> Brassica napus <400> 195 Met Leu Lys Leu Ser Cys Asn Val Thr Asn Asn Leu His Thr Phe Ser 1 5 10 15 Phe Phe Ser Asp Ser Ser Leu Phe Ile Pro Val Asn Arg Arg Thr Ile 20 25 30 Ala Val Ser Ser Ser Gln Leu Arg Lys Pro Ala Leu Asp Pro Leu Arg 35 40 45 Ala Val Ile Ser Ala Asp Gln Gly Ser Ile Ser Pro Val Asn Ser Cys 50 55 60 Thr Pro Ala Asp Arg Leu Arg Ala Gly Arg Leu Met Glu Asp Gly Tyr 65 70 75 80 Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val Gly Ile Asn 85 90 95 Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln Glu Val Ala 100 105 110 Cys Asn His Val Gln Lys Cys Gly Phe Ser Thr Asp Gly Phe Ala Thr 115 120 125 Thr Leu Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg Met 130 135 140 His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val Val Glu Ile 145 150 155 160 Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg Arg Asp Trp 165 170 175 Ile Leu Arg Asp Ser Ala Thr Asn Glu Val Ile Gly Arg Ala Thr Ser 180 185 190 Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Arg Val Thr 195 200 205 Asp Glu Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Arg Glu Pro Arg 210 215 220 Leu Ala Phe Pro Glu Glu Asn Asn Ser Ser Leu Lys Lys Ile Pro Lys 225 230 235 240 Leu Glu Asp Pro Ala Gln Tyr Ser Met Leu Glu Leu Lys Pro Arg Arg 245 250 255 Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr Ile Gly 260 265 270 Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Ile Asp Thr His Glu Leu 275 280 285 Gln Val Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp Ile 290 295 300 Val Asp Ser Leu Thr Thr Ser Glu Ile Pro Asp Asp Pro Ile Ser Lys 305 310 315 320 Phe Thr Gly Thr Asn Gly Ser Ala Met Ser Ser Ile Gln Gly His Asn 325 330 335 Glu Ser Gln Phe Leu His Met Leu Arg Leu Ser Glu Asn Gly Gln Glu 340 345 350 Ile Asn Arg Gly Arg Thr Gln Trp Arg Lys Lys Ser Ser Arg 355 360 365 <210> 196 <211> 406 <212> PRT <213> Garcinia mangostana <400> 196 Met Val Ala Thr Ala Ala Thr Ser Ser Phe Phe Pro Leu Thr Ser Pro 1 5 10 15 Ser Gly Asp Ala Lys Ser Gly Asn Pro Gly Lys Gly Ser Val Ser Phe 20 25 30 Gly Ser Met Lys Ser Lys Ser Ala Ala Ser Ser Arg Gly Leu Gln Val 35 40 45 Lys Ala Asn Ala Gln Ala Pro Thr Lys Ile Asn Gly Ser Thr Asp Asp 50 55 60 Ala Gln Leu Pro Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp 65 70 75 80 Ser Met Leu Leu Ala Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys 85 90 95 Gln Trp Met Met Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu Ile 100 105 110 Asp Thr Phe Gly Leu Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg 115 120 125 Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala 130 135 140 Ser Ile Glu Thr Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His 145 150 155 160 Val Lys Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu 165 170 175 Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Met Gln Val Glu 180 185 190 Val Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln Val Asp Thr Trp 195 200 205 Val Ser Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Leu Arg 210 215 220 Asp Gly Asn Thr Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val 225 230 235 240 Met Met Asn Lys Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val 245 250 255 Arg Glu Glu Ile Gly Ser Tyr Phe Val Asn Ser Asp Pro Val Val Glu 260 265 270 Glu Asp Gly Arg Lys Val Thr Lys Leu Asp Asp Asn Thr Ala Asp Phe 275 280 285 Val Arg Lys Gly Leu Thr Pro Lys Trp Asn Asp Leu Asp Ile Asn Gln 290 295 300 His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro 305 310 315 320 Gln Pro Ile Leu Glu Thr Arg Glu Leu Ser Ala Val Thr Leu Glu Tyr 325 330 335 Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Arg Ser Leu Thr Ala Val 340 345 350 Ser Gly Gly Gly Val Gly Asp Leu Gly His Ala Gly Asn Val Glu Cys 355 360 365 Gln His Val Leu Arg Leu Glu Asp Gly Ala Glu Ile Val Arg Gly Arg 370 375 380 Thr Glu Trp Arg Pro Lys Tyr Ile Asn Asn Phe Ser Ile Met Gly Gln 385 390 395 400 Ile Pro Thr Asp Ala Ser 405 <210> 197 <211> 415 <212> PRT <213> Cuphea hookeriana <400> 197 Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala Pro 1 5 10 15 Gly Ala Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu 20 25 30 Ser Pro Ser Phe Lys Pro Lys Ser Ile Pro Asn Gly Gly Phe Gln Val 35 40 45 Lys Ala Asn Asp Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Ser 50 55 60 Leu Lys Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro 65 70 75 80 Pro Pro Arg Thr Phe Leu His Gln Leu Pro Asp Trp Ser Arg Leu Leu 85 90 95 Thr Ala Ile Thr Thr Val Phe Val Lys Ser Lys Arg Pro Asp Met His 100 105 110 Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Phe Gly Leu 115 120 125 Glu Ser Thr Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Thr Asp Arg Thr Ala Ser Ile Glu Thr Leu 145 150 155 160 Met Asn His Leu Gln Glu Thr Ser Leu Asn His Cys Lys Ser Thr Gly 165 170 175 Ile Leu Leu Asp Gly Phe Gly Arg Thr Leu Glu Met Cys Lys Arg Asp 180 185 190 Leu Ile Trp Val Val Ile Lys Met Gln Ile Lys Val Asn Arg Tyr Pro 195 200 205 Ala Trp Gly Asp Thr Val Glu Ile Asn Thr Arg Phe Ser Arg Leu Gly 210 215 220 Lys Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 225 230 235 240 Glu Ile Leu Val Arg Ala Thr Ser Ala Tyr Ala Met Met Asn Gln Lys 245 250 255 Thr Arg Arg Leu Ser Lys Leu Pro Tyr Glu Val His Gln Glu Ile Val 260 265 270 Pro Leu Phe Val Asp Ser Pro Val Ile Glu Asp Ser Asp Leu Lys Val 275 280 285 His Lys Phe Lys Val Lys Thr Gly Asp Ser Ile Gln Lys Gly Leu Thr 290 295 300 Pro Gly Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys 305 310 315 320 Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu Thr 325 330 335 Gln Glu Leu Cys Ser Leu Ala Leu Glu Tyr Arg Arg Glu Cys Gly Arg 340 345 350 Asp Ser Val Leu Glu Ser Val Thr Ala Met Asp Pro Ser Lys Val Gly 355 360 365 Val Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Ala 370 375 380 Ile Val Asn Gly Ala Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn 385 390 395 400 Gly Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Val Ser 405 410 415 <210> 198 <211> 371 <212> PRT <213> Ricinus communis <400> 198 Met Leu Lys Val Pro Cys Cys Asn Ala Thr Asp Pro Ile Gln Ser Leu 1 5 10 15 Ser Ser Gln Cys Arg Phe Leu Thr His Phe Asn Asn Arg Pro Tyr Phe 20 25 30 Thr Arg Arg Pro Ser Ile Pro Thr Phe Phe Ser Ser Lys Asn Ser Ser 35 40 45 Ala Ser Leu Gln Ala Val Val Ser Asp Ile Ser Ser Val Glu Ser Ala 50 55 60 Ala Cys Asp Ser Leu Ala Asn Arg Leu Arg Leu Gly Lys Leu Thr Glu 65 70 75 80 Asp Gly Phe Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val 85 90 95 Gly Ile Asn Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln 100 105 110 Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly 115 120 125 Phe Ala Thr Thr Thr Ser Met Arg Lys Met His Leu Ile Trp Val Thr 130 135 140 Ala Arg Met His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val 145 150 155 160 Val Glu Val Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg 165 170 175 Arg Asp Trp Ile Leu Thr Asp Tyr Ala Thr Gly Gln Ile Ile Gly Arg 180 185 190 Ala Thr Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln 195 200 205 Lys Val Thr Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg 210 215 220 Glu Leu Arg Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Ser Lys Lys 225 230 235 240 Ile Ser Lys Leu Glu Asp Pro Ala Gln Tyr Ser Lys Leu Gly Leu Val 245 250 255 Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr 260 265 270 Tyr Ile Gly Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Ile Asp Thr 275 280 285 His Glu Leu Gln Thr Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln His 290 295 300 Asp Asp Ile Val Asp Ser Leu Thr Ser Val Glu Pro Ser Glu Asn Leu 305 310 315 320 Glu Ala Val Ser Glu Leu Arg Gly Thr Asn Gly Ser Ala Thr Thr Thr 325 330 335 Ala Gly Asp Glu Asp Cys Arg Asn Phe Leu His Leu Leu Arg Leu Ser 340 345 350 Gly Asp Gly Leu Glu Ile Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys 355 360 365 Ser Ala Arg 370 <210> 199 <211> 412 <212> PRT <213> Ricinus communis <400> 199 Phe Arg Gln Ile Thr Lys Asn Gln Lys Lys Lys Val Arg Lys Lys Thr 1 5 10 15 Met Ala Leu Lys Leu Asn Pro Phe Leu Ser Gln Thr Gln Lys Leu Pro 20 25 30 Ser Phe Ala Leu Pro Pro Met Ala Ser Thr Arg Ser Pro Lys Phe Tyr 35 40 45 Met Ala Ser Thr Leu Lys Ser Gly Ser Lys Glu Val Glu Asn Leu Lys 50 55 60 Lys Pro Phe Met Pro Pro Arg Glu Val His Val Gln Val Thr His Ser 65 70 75 80 Met Pro Pro Gln Lys Ile Glu Ile Phe Lys Ser Leu Asp Asn Trp Ala 85 90 95 Glu Glu Asn Ile Leu Val His Leu Lys Pro Val Glu Lys Cys Trp Gln 100 105 110 Pro Gln Asp Phe Leu Pro Asp Pro Ala Ser Asp Gly Phe Asp Glu Gln 115 120 125 Val Arg Glu Leu Arg Glu Arg Ala Lys Glu Ile Pro Asp Asp Tyr Phe 130 135 140 Val Val Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr 145 150 155 160 Gln Thr Met Leu Asn Thr Leu Asp Gly Val Arg Asp Glu Thr Gly Ala 165 170 175 Ser Pro Thr Ser Trp Ala Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu 180 185 190 Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg 195 200 205 Val Asp Met Arg Gln Ile Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser 210 215 220 Gly Met Asp Pro Arg Thr Glu Asn Ser Pro Tyr Leu Gly Phe Ile Tyr 225 230 235 240 Thr Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala 245 250 255 Arg Gln Ala Lys Glu His Gly Asp Ile Lys Leu Ala Gln Ile Cys Gly 260 265 270 Thr Ile Ala Ala Asp Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile 275 280 285 Val Glu Lys Leu Phe Glu Ile Asp Pro Asp Gly Thr Val Leu Ala Phe 290 295 300 Ala Asp Met Met Arg Lys Lys Ile Ser Met Pro Ala His Leu Met Tyr 305 310 315 320 Asp Gly Arg Asp Asp Asn Leu Phe Asp His Phe Ser Ala Val Ala Gln 325 330 335 Arg Leu Gly Val Tyr Thr Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe 340 345 350 Leu Val Gly Arg Trp Lys Val Asp Lys Leu Thr Gly Leu Ser Ala Glu 355 360 365 Gly Gln Lys Ala Gln Asp Tyr Val Cys Arg Leu Pro Pro Arg Ile Arg 370 375 380 Arg Leu Glu Glu Arg Ala Gln Gly Arg Ala Lys Glu Ala Pro Thr Met 385 390 395 400 Pro Phe Ser Trp Ile Phe Asp Arg Gln Val Lys Leu 405 410 <210> 200 <211> 390 <212> PRT <213> Olea europaea <400> 200 Met Ala Leu Lys Leu Cys Phe Pro Pro His Lys Met Pro Ser Phe Pro 1 5 10 15 Asp Ala Arg Ile Arg Ser His Arg Val Phe Met Ala Ser Thr Ile His 20 25 30 Ser Pro Ser Met Glu Val Gly Lys Val Lys Lys Pro Phe Thr Pro Pro 35 40 45 Arg Glu Val His Val Gln Val Thr His Ser Leu Ala Pro Glu Lys Arg 50 55 60 Glu Ile Phe Asn Ser Leu Asn Asn Trp Ala Gln Glu Asn Ile Leu Val 65 70 75 80 Leu Leu Lys Asp Val Asp Lys Cys Trp Gln Pro Ser Asp Phe Leu Pro 85 90 95 Asp Ser Ala Ser Glu Gly Phe Asp Glu Gln Val Met Glu Leu Arg Lys 100 105 110 Arg Cys Lys Glu Ile Pro Asp Asp Tyr Phe Ile Val Leu Val Gly Asp 115 120 125 Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr 130 135 140 Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser Leu Thr Pro Trp Ala 145 150 155 160 Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu 165 170 175 Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp Met Lys Gln Ile 180 185 190 Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr 195 200 205 Glu Asn Asn Pro Tyr Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg 210 215 220 Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg Leu Ala Lys Glu His 225 230 235 240 Gly Asp Leu Lys Leu Ala Gln Ile Cys Gly Ile Ile Ala Ala Asp Glu 245 250 255 Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe Glu 260 265 270 Ile Asp Pro Asp Gly Thr Val Leu Ala Leu Ala Asp Met Met Arg Lys 275 280 285 Lys Val Ser Met Pro Ala His Leu Met Tyr Asp Gly Gln Asp Asp Asn 290 295 300 Leu Phe Glu Asn Phe Ser Ser Val Ala Gln Arg Leu Gly Val Tyr Thr 305 310 315 320 Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu Val Gly Arg Trp Asp 325 330 335 Ile Glu Lys Leu Thr Gly Leu Ser Gly Glu Gly Arg Lys Ala Gln Asp 340 345 350 Tyr Val Cys Thr Leu Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg Ala 355 360 365 Gln Ser Arg Val Lys Lys Ala Ser Ala Thr Pro Phe Ser Trp Ile Phe 370 375 380 Gly Arg Glu Ile Asn Leu 385 390 <210> 201 <211> 415 <212> PRT <213> Cuphea hookeriana <400> 201 Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Leu Pro Ser Ala 1 5 10 15 Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Lys Pro Ser Ser Leu 20 25 30 Ser Pro Leu Lys Pro Lys Ser Thr Pro Asn Gly Gly Leu Gln Val Lys 35 40 45 Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Pro Val Gly Leu 50 55 60 Lys Ser Gly Gly Leu Lys Thr Gln Glu Asp Ala His Ser Ala Pro Pro 65 70 75 80 Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala 85 90 95 Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu 100 105 110 Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu 115 120 125 Gly Ser Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val 145 150 155 160 Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ile Ala Gly 165 170 175 Leu Ser Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Arg Asp 180 185 190 Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro 195 200 205 Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly 210 215 220 Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 225 230 235 240 Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys 245 250 255 Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg Asn Glu Ile Glu 260 265 270 Pro His Phe Val Asp Ser Pro Pro Val Ile Glu Asp Asp Asp Arg Lys 275 280 285 Leu Pro Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu 290 295 300 Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val 305 310 315 320 Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Pro Glu Val Leu Glu 325 330 335 Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly 340 345 350 Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Met Asp Pro Ser Gly Gly 355 360 365 Gly Tyr Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly 370 375 380 Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Gly Val Ile 385 390 395 400 Asn Gly Val Val Pro Thr Gly Glu Ser Ser Pro Gly Asp Tyr Ser 405 410 415 <210> 202 <211> 414 <212> PRT <213> Cuphea hookeriana <400> 202 Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Val Ser Ser Pro 1 5 10 15 Val Thr Ser Ser Arg Pro Gly Lys Pro Gly Asn Gly Ser Ser Ser Phe 20 25 30 Ser Pro Ile Lys Pro Lys Phe Val Ala Asn Gly Gly Leu Gln Val Lys 35 40 45 Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Ser Val Gly Leu 50 55 60 Lys Ser Cys Ser Leu Lys Thr Gln Glu Asp Thr Pro Ser Ala Pro Ala 65 70 75 80 Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala 85 90 95 Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu 100 105 110 Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu 115 120 125 Gly Ser Ile Val Gln His Gly Leu Val Phe Arg Gln Asn Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val 145 150 155 160 Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Ala Gly 165 170 175 Leu Met Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Lys Asp 180 185 190 Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro 195 200 205 Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly 210 215 220 Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 225 230 235 240 Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys 245 250 255 Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg His Glu Ile Glu 260 265 270 Pro His Phe Val Asp Ser Pro Pro Val Ile Glu Asp Asp Asp Arg Lys 275 280 285 Leu Pro Lys Leu Asp Asp Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu 290 295 300 Thr Pro Lys Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val 305 310 315 320 Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Gln Glu Val Leu Glu 325 330 335 Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly 340 345 350 Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Ala Asp Pro Ser Gly Lys 355 360 365 Gly Phe Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly 370 375 380 Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Thr Ala Gly Ile 385 390 395 400 Asn Gly Ala Ile Pro Ser Gly Glu Thr Ser Pro Gly Asp Ser 405 410 <210> 203 <211> 383 <212> PRT <213> Umbellularia californica <400> 203 Met Val Thr Thr Ser Leu Ala Ser Ala Phe Phe Ser Met Lys Ala Val 1 5 10 15 Met Leu Ala Pro Asp Gly Ser Gly Ile Lys Pro Arg Ser Ser Gly Leu 20 25 30 Gln Val Arg Ala Gly Lys Glu Gln Asn Ser Cys Lys Met Ile Asn Gly 35 40 45 Thr Lys Val Lys Asp Thr Glu Gly Leu Lys Gly Arg Ser Thr Leu His 50 55 60 Gly Trp Ser Met Pro Leu Glu Leu Ile Thr Thr Ile Phe Ser Ala Ala 65 70 75 80 Glu Lys Gln Trp Thr Asn Leu Val Ser Lys Pro Pro Gln Leu Leu Asp 85 90 95 Asp His Leu Gly Leu His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile 100 105 110 Arg Cys Ser Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Val Ala Val 115 120 125 Met Asn Tyr Leu Gln Glu Ala Ala Cys Asn His Ala Glu Ser Leu Gly 130 135 140 Leu Leu Gly Asp Gly Phe Gly Glu Thr Leu Glu Met Ser Arg Arg Asp 145 150 155 160 Leu Ile Trp Val Val Arg Arg Thr His Val Val Val Glu Arg Tyr Pro 165 170 175 Ala Trp Gly Asp Thr Val Glu Val Glu Ala Trp Ile Gly Ala Ala Gly 180 185 190 Asn Ile Gly Met Arg Arg His Phe Leu Val Arg Asp Cys Lys Thr Gly 195 200 205 His Ile Leu Ala Arg Cys Thr Ser Val Ser Val Met Met Asn Met Arg 210 215 220 Thr Arg Arg Leu Ser Lys Ile Pro Gln Glu Val Arg Gly Glu Ile Asp 225 230 235 240 Pro Leu Phe Ile Glu Lys Phe Ala Val Lys Glu Gly Glu Ile Lys Lys 245 250 255 Leu Gln Lys Phe Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Trp 260 265 270 Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Ile 275 280 285 Lys Tyr Val Gly Trp Ile Phe Lys Ser Val Pro Asp Ser Ile Tyr Glu 290 295 300 Asn His His Leu Ser Ser Ile Thr Leu Glu Tyr Arg Arg Glu Cys Thr 305 310 315 320 Arg Gly Arg Ala Leu Gln Ser Leu Thr Thr Val Cys Gly Gly Ser Ser 325 330 335 Glu Ala Gly Ile Ile Cys Glu His Leu Leu Gln Leu Glu Asp Gly Ser 340 345 350 Glu Val Leu Arg Gly Arg Thr Asp Trp Arg Pro Lys Arg Thr Asp Ser 355 360 365 Phe Glu Gly Ile Ser Glu Arg Phe Pro Gln Gln Glu Pro His Asn 370 375 380 <210> 204 <211> 417 <212> PRT <213> Elaeis guineensis <400> 204 Met Val Ala Ser Ile Ala Ala Ser Ala Phe Phe Pro Thr Pro Ser Phe 1 5 10 15 Ser Pro Thr Ala Ser Ala Lys Ala Ser Lys Thr Ile Gly Glu Gly Ser 20 25 30 Glu Asn Leu Asp Ala Arg Gly Ile Ile Ala Lys Pro Thr Ser Ser Ser 35 40 45 Ala Ala Met Gln Gly Lys Val Met Ala Gln Ala Val Ser Lys Ile Asn 50 55 60 Gly Ala Lys Val Gly Leu Lys Ala Glu Ser Gln Lys Ala Glu Glu Asp 65 70 75 80 Ala Ala Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp 85 90 95 Trp Ser Val Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu 100 105 110 Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu 115 120 125 Thr Asp Ala Phe Ser Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe 130 135 140 Lys Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr 145 150 155 160 Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn 165 170 175 His Val Arg Ser Ala Gly Leu Met Gly Asp Gly Phe Gly Ala Thr Pro 180 185 190 Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Val Arg Val 195 200 205 Leu Ile Glu His Tyr Pro Ser Trp Gly Asp Val Val Glu Val Asp Thr 210 215 220 Trp Val Gly Pro Ala Gly Lys Asn Gly Met Arg Arg Asp Trp His Val 225 230 235 240 Arg Asp His Arg Thr Gly Gln Thr Ile Leu Arg Ala Thr Arg Val Trp 245 250 255 Val Met Met Asn Lys Asn Thr Arg Lys Leu Ser Lys Val Pro Glu Glu 260 265 270 Val Arg Ala Glu Ile Gly Pro Tyr Phe Val Glu Arg Ala Ala Ile Val 275 280 285 Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asp Glu Asp Thr Thr Asp 290 295 300 Tyr Val Lys Lys Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn 305 310 315 320 Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala 325 330 335 Pro Ile Ser Ile Leu Glu Asn His Glu Leu Ala Ser Met Thr Leu Glu 340 345 350 Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala 355 360 365 Val Ala Asn Asp Cys Thr Gly Gly Leu Pro Glu Ala Ser Ile Glu Cys 370 375 380 Gln His Leu Leu Gln Leu Glu Cys Gly Ala Glu Ile Val Arg Gly Arg 385 390 395 400 Thr Gln Trp Arg Pro Arg Arg Ala Ser Gly Pro Thr Ser Ala Gly Ser 405 410 415 Ala <210> 205 <211> 417 <212> PRT <213> Elaeis guineensis <400> 205 Met Val Ala Ser Ile Val Ala Trp Ala Phe Phe Pro Thr Pro Ser Phe 1 5 10 15 Ser Pro Thr Ala Ser Ala Lys Ala Ser Lys Thr Ile Gly Glu Gly Ser 20 25 30 Glu Asn Leu Asn Val Arg Gly Ile Ile Ala Lys Pro Thr Ser Ser Ser 35 40 45 Ala Ala Lys Gln Gly Lys Val Met Ala Gln Ala Val Pro Lys Ile Asn 50 55 60 Gly Ala Lys Val Gly Leu Lys Ala Glu Ser Gln Lys Ala Glu Glu Asp 65 70 75 80 Ala Ala Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp 85 90 95 Trp Ser Val Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu 100 105 110 Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu 115 120 125 Thr Gly Ala Phe Ser Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe 130 135 140 Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr 145 150 155 160 Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn 165 170 175 His Val Arg Asn Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala Thr Pro 180 185 190 Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Met Gln Val 195 200 205 Leu Ile Glu His Tyr Pro Ser Trp Gly Asp Val Val Glu Val Asp Thr 210 215 220 Trp Val Gly Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp His Val 225 230 235 240 Arg Asp Tyr Arg Thr Gly Gln Thr Ile Leu Arg Ala Thr Ser Ile Trp 245 250 255 Val Met Met Asp Lys His Thr Arg Lys Leu Ser Lys Met Pro Glu Glu 260 265 270 Val Arg Ala Glu Ile Gly Pro Tyr Phe Met Glu His Ala Ala Ile Val 275 280 285 Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asp Asp Asp Thr Ala Asp 290 295 300 Tyr Ile Lys Trp Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn 305 310 315 320 Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala 325 330 335 Pro Ile Ser Ile Leu Glu Asn His Glu Leu Ala Ser Met Thr Leu Glu 340 345 350 Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala 355 360 365 Val Ala Asn Asp Cys Thr Gly Gly Leu Pro Glu Ala Ser Ile Glu Cys 370 375 380 Gln His Leu Leu Gln Leu Glu Cys Gly Ala Glu Ile Val Arg Gly Arg 385 390 395 400 Thr Gln Trp Arg Pro Arg Arg Ala Ser Gly Pro Thr Ser Ala Gly Ser 405 410 415 Ala <210> 206 <211> 333 <212> PRT <213> Elaeis guineensis <400> 206 Phe Tyr Asn Gln Leu Pro Asp Trp Ser Val Leu Leu Ala Ala Val Thr 1 5 10 15 Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Thr Leu Leu Asp Trp Lys 20 25 30 Pro Arg Arg Pro Asp Met Leu Ala Asp Ala Phe Gly Leu Gly Lys Ile 35 40 45 Val Gln Asp Gly Leu Val Phe Lys Gln Asn Phe Ser Ile Arg Ser Tyr 50 55 60 Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His 65 70 75 80 Leu Gln Glu Thr Ala Leu Asn His Val Arg Ser Ala Gly Leu Met Gly 85 90 95 Asp Gly Phe Gly Ala Thr Pro Glu Met Ser Lys Arg Asn Leu Ile Trp 100 105 110 Val Val Thr Lys Met Arg Val Leu Ile Lys His Tyr Pro Ser Trp Gly 115 120 125 Asp Val Val Glu Val Asp Thr Trp Val Gly Pro Thr Gly Lys Asn Gly 130 135 140 Met Arg Arg Asp Trp His Val Arg Asp His Arg Thr Gly Gln Thr Ile 145 150 155 160 Leu Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Asn Thr Arg Lys 165 170 175 Leu Ser Lys Val Pro Glu Glu Val Arg Ala Glu Leu Gly Pro Tyr Phe 180 185 190 Val Glu Arg Ala Ala Ile Val Asp Glu Asp Ser Arg Lys Leu Pro Lys 195 200 205 Leu Asp Glu Asp Thr Thr Asp Tyr Ile Lys Lys Gly Leu Thr Pro Arg 210 215 220 Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile 225 230 235 240 Gly Trp Ile Leu Glu Ser Ala Pro Ile Ser Phe Leu Glu Asn His Glu 245 250 255 Leu Ala Ser Met Ser Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser 260 265 270 Val Leu Gln Ser Leu Thr Ala Val Ser Asn Asp Leu Thr Asp Gly Leu 275 280 285 Pro Glu Ala Gly Ile Glu Cys Gln His Leu Leu Gln Leu Glu Cys Gly 290 295 300 Thr Glu Leu Val Lys Gly Arg Thr Glu Trp Arg Pro Lys His Ser Leu 305 310 315 320 Ala Leu Arg Asn Met Gly Pro Thr Pro Gly Gly Ser Ala 325 330 <210> 207 <211> 421 <212> PRT <213> Populus tomentosa <400> 207 Met Val Ala Thr Ala Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Pro 1 5 10 15 Pro Gly Asp Ala Lys Ser Ser Lys Val Gly Ser Gly Ser Ala Ser Leu 20 25 30 Gly Gly Ile Lys Ser Lys Ser Ala Ser Ser Gly Ala Leu Gln Val Lys 35 40 45 Ala Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Ser Pro Val Gly Leu 50 55 60 Thr Ala Ser Val Glu Thr Ala Lys Lys Glu Asp Val Val Ser Ser Pro 65 70 75 80 Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu 85 90 95 Ala Ala Ile Thr Thr Met Phe Leu Ala Ala Glu Lys Gln Trp Met Met 100 105 110 Leu Asp Trp Lys Pro Lys Arg Ala Asp Met Leu Ile Asp Pro Phe Gly 115 120 125 Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Ser Gln Asn Phe Ser 130 135 140 Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr 145 150 155 160 Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala 165 170 175 Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Ser Lys Arg 180 185 190 Asn Leu Ile Trp Val Val Thr Arg Met Gln Ile Leu Val Asp Arg Tyr 195 200 205 Pro Thr Trp Gly Asp Val Val His Val Asp Thr Trp Val Ser Ala Ser 210 215 220 Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Ala Lys Thr 225 230 235 240 Gly Glu Thr Leu Thr Arg Ala Ser Ser Leu Trp Val Met Met Asn Lys 245 250 255 Val Thr Arg Arg Leu Ser Lys Ile Pro Glu Asp Val Arg Gly Glu Ile 260 265 270 Glu Pro Tyr Phe Leu Asn Ser Asp Pro Val Val Asn Glu Asp Ser Thr 275 280 285 Lys Leu Pro Lys Leu Asp Asp Lys Thr Ala Asp Tyr Ile Arg Lys Gly 290 295 300 Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn 305 310 315 320 Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Pro Pro Ile Leu 325 330 335 Glu Ser His Glu Leu Ala Ala Ile Thr Leu Glu Tyr Arg Arg Glu Cys 340 345 350 Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Ser Gly Ala Gly 355 360 365 Ile Gly Asn Leu Gly Gly Pro Gly Lys Val Glu Cys Gln His Leu Leu 370 375 380 Arg His Glu Asp Gly Ala Glu Ile Val Arg Gly Arg Thr Glu Trp Arg 385 390 395 400 Pro Lys His Ala Asn Asn Phe Gly Met Met Gly Gly Gln Met Pro Ala 405 410 415 Asp Glu Ser Gly Ala 420 <210> 208 <211> 412 <212> PRT <213> Arabidopsis thaliana <400> 208 Met Val Ala Thr Ser Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Ser 1 5 10 15 Ser Leu Asp Pro Asn Gly Lys Gly Asn Lys Ile Gly Ser Thr Asn Leu 20 25 30 Ala Gly Leu Asn Ser Ala Pro Asn Ser Gly Arg Met Lys Val Lys Pro 35 40 45 Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Lys Val Gly Leu Pro 50 55 60 Gly Ser Val Asp Ile Val Arg Thr Asp Thr Glu Thr Ser Ser His Pro 65 70 75 80 Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu 85 90 95 Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met 100 105 110 Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Val Asp Pro Phe Gly 115 120 125 Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser 130 135 140 Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr 145 150 155 160 Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala 165 170 175 Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Phe Lys Lys 180 185 190 Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Lys Tyr 195 200 205 Pro Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Gln Ser 210 215 220 Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Cys Asn Thr 225 230 235 240 Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys 245 250 255 Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile 260 265 270 Glu Pro Tyr Phe Val Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Arg 275 280 285 Lys Leu Thr Lys Ile Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly 290 295 300 Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn 305 310 315 320 Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Ile Met 325 330 335 Glu Arg Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys 340 345 350 Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Thr Gly Cys Asp 355 360 365 Ile Gly Asn Leu Ala Thr Ala Gly Asp Val Glu Cys Gln His Leu Leu 370 375 380 Arg Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser 385 390 395 400 Ser Lys Thr Pro Thr Thr Thr Trp Gly Thr Ala Pro 405 410 <210> 209 <211> 412 <212> PRT <213> Arabidopsis thaliana <400> 209 Met Val Ala Thr Ser Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Ser 1 5 10 15 Ser Leu Asp Pro Asn Gly Lys Gly Asn Lys Ile Gly Ser Thr Asn Leu 20 25 30 Ala Gly Leu Asn Ser Ala Pro Asn Ser Gly Arg Met Lys Val Lys Pro 35 40 45 Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Arg Val Gly Leu Pro 50 55 60 Gly Ser Val Asp Ile Val Arg Thr Asp Thr Glu Thr Ser Ser His Pro 65 70 75 80 Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu 85 90 95 Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met 100 105 110 Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Val Asp Pro Phe Gly 115 120 125 Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser 130 135 140 Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr 145 150 155 160 Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala 165 170 175 Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Phe Lys Lys 180 185 190 Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Lys Tyr 195 200 205 Pro Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Gln Ser 210 215 220 Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Cys Asn Thr 225 230 235 240 Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys 245 250 255 Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile 260 265 270 Glu Pro Tyr Phe Val Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Arg 275 280 285 Lys Leu Thr Lys Ile Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly 290 295 300 Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn 305 310 315 320 Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Ile Met 325 330 335 Glu Arg Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys 340 345 350 Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Thr Gly Cys Asp 355 360 365 Ile Gly Asn Leu Ala Thr Ala Gly Asp Val Glu Cys Gln His Leu Leu 370 375 380 Arg Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser 385 390 395 400 Ser Lys Thr Pro Thr Thr Thr Trp Gly Thr Ala Pro 405 410 <210> 210 <211> 412 <212> PRT <213> Arabidopsis thaliana <400> 210 Met Val Ala Thr Ser Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Ser 1 5 10 15 Ser Leu Asp Pro Asn Gly Lys Gly Asn Lys Ile Gly Ser Thr Asn Leu 20 25 30 Ala Gly Leu Asn Ser Thr Pro Asn Ser Gly Arg Met Lys Val Lys Pro 35 40 45 Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Arg Val Gly Leu Pro 50 55 60 Gly Ser Val Asp Ile Val Arg Thr Asp Thr Glu Thr Ser Ser His Pro 65 70 75 80 Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu 85 90 95 Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met 100 105 110 Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Val Asp Pro Phe Gly 115 120 125 Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser 130 135 140 Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr 145 150 155 160 Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala 165 170 175 Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Phe Lys Lys 180 185 190 Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Lys Tyr 195 200 205 Pro Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Gln Ser 210 215 220 Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Cys Asn Thr 225 230 235 240 Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys 245 250 255 Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile 260 265 270 Glu Pro Tyr Phe Val Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Arg 275 280 285 Lys Leu Thr Lys Ile Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly 290 295 300 Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn 305 310 315 320 Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Ile Met 325 330 335 Glu Arg Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys 340 345 350 Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Thr Gly Cys Asp 355 360 365 Ile Gly Asn Leu Ala Thr Ala Gly Asp Val Glu Cys Gln His Leu Leu 370 375 380 Arg Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser 385 390 395 400 Ser Lys Thr Pro Thr Thr Thr Trp Gly Thr Ala Pro 405 410 <210> 211 <211> 413 <212> PRT <213> Gossypium hirsutum <400> 211 Met Val Ala Thr Ala Val Thr Ser Ala Phe Phe Pro Val Thr Ser Ser 1 5 10 15 Pro Asp Ser Ser Asp Ser Lys Asn Lys Lys Leu Gly Ser Ile Lys Ser 20 25 30 Lys Pro Ser Val Ser Ser Gly Ser Leu Gln Val Lys Ala Asn Ala Gln 35 40 45 Ala Pro Pro Lys Ile Asn Gly Thr Val Ala Ser Thr Thr Pro Val Glu 50 55 60 Gly Ser Lys Asn Asp Asp Gly Ala Ser Ser Pro Pro Pro Arg Thr Phe 65 70 75 80 Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr 85 90 95 Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro 100 105 110 Arg Arg Pro Asp Met Val Ile Asp Pro Phe Gly Ile Gly Lys Ile Val 115 120 125 Gln Asp Gly Leu Val Phe Ser Gln Asn Phe Ser Ile Arg Ser Tyr Glu 130 135 140 Ile Gly Ala Asp Gln Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu 145 150 155 160 Gln Glu Thr Ala Ile Asn His Cys Arg Ser Ala Gly Leu Leu Gly Glu 165 170 175 Gly Phe Gly Ala Thr Pro Glu Met Cys Lys Lys Asn Leu Ile Trp Val 180 185 190 Val Thr Arg Met Gln Val Val Val Asp Arg Tyr Pro Thr Trp Gly Asp 195 200 205 Val Val Gln Val Asp Thr Trp Val Ser Ala Ser Gly Lys Asn Gly Met 210 215 220 Arg Arg Asp Trp Leu Val Ser Asn Ser Glu Thr Gly Glu Ile Leu Thr 225 230 235 240 Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Leu Thr Arg Arg Leu 245 250 255 Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Glu Pro Phe Phe Met 260 265 270 Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Gln Lys Leu Val Lys Leu 275 280 285 Asp Asp Ser Thr Ala Glu His Val Cys Lys Gly Leu Thr Pro Lys Trp 290 295 300 Ser Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly 305 310 315 320 Trp Ile Leu Glu Ser Ala Pro Leu Pro Ile Leu Glu Ser His Glu Leu 325 330 335 Ser Ala Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val 340 345 350 Leu Gln Ser Leu Thr Thr Val Ser Asp Ser Asn Thr Glu Asn Ala Val 355 360 365 Asn Val Gly Glu Phe Asn Cys Gln His Leu Leu Arg Leu Asp Asp Gly 370 375 380 Ala Glu Ile Val Arg Gly Arg Thr Arg Trp Arg Pro Lys His Ala Lys 385 390 395 400 Ser Ser Ala Asn Met Asp Gln Ile Thr Ala Lys Arg Ala 405 410 <210> 212 <211> 414 <212> PRT <213> Cuphea lanceolata <400> 212 Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Leu Pro Ser Pro 1 5 10 15 Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Gly Ser Ser Ser Leu 20 25 30 Ser Pro Leu Lys Pro Lys Phe Val Ala Asn Ala Gly Leu Lys Val Lys 35 40 45 Ala Ser Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Ser Val Gly Leu 50 55 60 Lys Ser Gly Ser Leu Lys Thr Gln Glu Asp Thr Pro Ser Val Pro Pro 65 70 75 80 Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala 85 90 95 Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu 100 105 110 Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu 115 120 125 Gly Ser Ile Val Gln Gly Gly Leu Val Phe Arg Gln Asn Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val 145 150 155 160 Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Ala Gly 165 170 175 Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Phe Lys Arg Asp 180 185 190 Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro 195 200 205 Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly 210 215 220 Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 225 230 235 240 Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys 245 250 255 Thr Arg Lys Leu Ser Lys Ile Pro Asp Glu Val Arg His Glu Ile Glu 260 265 270 Pro His Phe Ile Asp Cys Ala Pro Val Ile Glu Asp Asp Asp Arg Lys 275 280 285 Leu Arg Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu 290 295 300 Thr Pro Lys Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val 305 310 315 320 Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Gln Glu Val Leu Glu 325 330 335 Thr Gln Glu Leu Ser Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly 340 345 350 Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Val Asp Ser Ser Gly Lys 355 360 365 Gly Phe Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly 370 375 380 Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Thr Ala Gly Val 385 390 395 400 Asn Gly Ala Ile Ala Ser Gly Glu Thr Ser His Gly Asp Ser 405 410 <210> 213 <211> 414 <212> PRT <213> Cuphea calophylla <400> 213 Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ser Pro 1 5 10 15 Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Gly Ser Ser Ser Leu 20 25 30 Ser Pro Leu Lys Pro Lys Leu Met Ala Asn Gly Gly Leu Gln Val Lys 35 40 45 Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Ser Val Gly Leu 50 55 60 Lys Ser Gly Ser Leu Lys Thr Gln Glu Asp Thr Pro Ser Ala Pro Pro 65 70 75 80 Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala 85 90 95 Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu 100 105 110 Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu 115 120 125 Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val 145 150 155 160 Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Ala Gly 165 170 175 Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Arg Asp 180 185 190 Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro 195 200 205 Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly 210 215 220 Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly 225 230 235 240 Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys 245 250 255 Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg His Glu Ile Glu 260 265 270 Pro His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Asp Asp Arg Lys 275 280 285 Leu Pro Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu 290 295 300 Thr Pro Lys Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val 305 310 315 320 Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Pro Glu Val Leu Glu 325 330 335 Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly 340 345 350 Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Val Asp Pro Ser Gly Lys 355 360 365 Gly Ser Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly 370 375 380 Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Thr Ala Gly Ile 385 390 395 400 Asn Gly Pro Ile Ala Ser Gly Glu Thr Ser Pro Gly Asp Ser 405 410 <210> 214 <211> 410 <212> PRT <213> Gossypium hirsutum <400> 214 Thr Ala Val Thr Ser Ala Phe Phe Pro Val Thr Ser Ser Pro Asp Ser 1 5 10 15 Ser Asp Ser Lys Asn Lys Lys Leu Gly Ser Ile Lys Ser Lys Pro Ser 20 25 30 Val Ser Ser Gly Ser Leu Gln Val Lys Ala Asn Ala Gln Ala Pro Pro 35 40 45 Lys Ile Asn Gly Thr Val Ala Ser Thr Thr Pro Val Glu Gly Ser Lys 50 55 60 Asn Asp Asp Gly Ala Ser Ser Pro Pro Pro Arg Thr Phe Ile Asn Gln 65 70 75 80 Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu 85 90 95 Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro Arg Arg Pro 100 105 110 Asp Met Val Ile Asp Pro Phe Gly Ile Gly Lys Ile Val Gln Asp Gly 115 120 125 Leu Val Phe Ser Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala 130 135 140 Asp Gln Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr 145 150 155 160 Ala Ile Asn His Cys Arg Ser Ala Gly Leu Leu Gly Glu Gly Phe Gly 165 170 175 Ala Thr Pro Glu Met Cys Lys Lys Asn Leu Ile Trp Val Val Thr Arg 180 185 190 Met Gln Val Val Val Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln 195 200 205 Val Asp Thr Trp Val Ser Ala Ser Gly Lys Asn Gly Met Arg Arg Asp 210 215 220 Trp Leu Val Ser Asn Ser Glu Thr Gly Glu Ile Leu Thr Arg Ala Thr 225 230 235 240 Ser Val Trp Val Met Met Asn Lys Leu Thr Arg Arg Leu Ser Lys Ile 245 250 255 Pro Glu Glu Val Arg Gly Glu Ile Glu Pro Phe Phe Met Asn Ser Asp 260 265 270 Pro Val Leu Ala Glu Asp Ser Gln Lys Leu Val Lys Leu Asp Asp Ser 275 280 285 Thr Ala Glu His Val Cys Lys Gly Leu Thr Pro Lys Trp Ser Asp Leu 290 295 300 Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu 305 310 315 320 Glu Ser Ala Pro Leu Pro Ile Leu Glu Ser His Glu Leu Ser Ala Leu 325 330 335 Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser 340 345 350 Leu Thr Thr Val Ser Asp Ser Asn Thr Glu Asn Ala Val Asn Val Gly 355 360 365 Glu Phe Asn Cys Gln His Leu Leu Arg Leu Asp Asp Gly Ala Glu Ile 370 375 380 Val Arg Gly Arg Thr Arg Trp Arg Pro Lys His Ala Lys Ser Ser Ala 385 390 395 400 Asn Met Asp Gln Ile Thr Ala Lys Arg Ala 405 410 <210> 215 <211> 400 <212> PRT <213> Vitis vinifera <220> <221> misc_feature <222> (30)..(30) <223> Xaa can be any naturally occurring amino acid <400> 215 Met Val Ala Thr Ala Ala Thr Ser Ala Phe Phe Ala Val Ala Ser Pro 1 5 10 15 Ser Ser Asp Pro Asp Ala Lys Pro Ser Thr Lys Pro Gly Xaa Gly Ser 20 25 30 Ala Ile Leu Arg Gly Ile Lys Ser Arg Asn Ala Pro Ser Gly Ser Leu 35 40 45 Gln Val Lys Ala Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Thr Thr 50 55 60 Val Gly Tyr Thr Ser Ser Ala Glu Gly Val Lys Ile Glu Asp Asp Met 65 70 75 80 Ser Ser Pro Pro Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser 85 90 95 Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln 100 105 110 Trp Met Met Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Ile Asp 115 120 125 Pro Phe Gly Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe Arg Gln 130 135 140 Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser 145 150 155 160 Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val 165 170 175 Arg Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met 180 185 190 Ser Ile Arg Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val 195 200 205 Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln Val Asp Thr Trp Val 210 215 220 Cys Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp Ile Ile Arg Asp 225 230 235 240 Cys Lys Thr Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met 245 250 255 Met Asn Lys Gln Thr Arg Arg Leu Ser Lys Ile Pro Asp Ala Val Arg 260 265 270 Ala Glu Ile Glu Pro Tyr Phe Met Asp Ser Ala Pro Ile Val Asp Glu 275 280 285 Asp Gly Arg Lys Leu Pro Lys Leu Asp Asp Ser Thr Ala Asp Tyr Ile 290 295 300 Arg Thr Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His 305 310 315 320 Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Leu 325 330 335 Pro Ile Leu Glu Ser His Glu Leu Ser Ser Met Thr Leu Glu Tyr Arg 340 345 350 Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Ser 355 360 365 Gly Thr Gly Val Gly Asn Leu Leu Asp Cys Gly Asn Val Glu Cys Gln 370 375 380 His Leu Leu Arg Leu Glu Glu Gly Ala Glu Ile Val Glu Gly Lys Asp 385 390 395 400 <210> 216 <211> 411 <212> PRT <213> Brassica juncea <220> <221> misc_feature <222> (22)..(22) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (171)..(171) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (192)..(192) <223> Xaa can be any naturally occurring amino acid <400> 216 Met Val Ala Thr Ser Ala Thr Ser Leu Phe Phe Pro Leu Pro Ser Ser 1 5 10 15 Ser Leu Asp Pro Asn Xaa Lys Thr Asn Asn Arg Val Thr Ser Thr Asn 20 25 30 Phe Ala Gly Leu Gly Pro Thr Pro Asn Ser Gly Gly Arg Met Lys Val 35 40 45 Lys Pro Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Lys Val Gly 50 55 60 Leu Pro Gly Ser Val Glu Ile Glu Thr Ser Gln Gln Gln Gln Pro Ala 65 70 75 80 Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala 85 90 95 Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu 100 105 110 Asp Trp Lys Pro Arg Arg Ser Asp Met Ile Met Glu Pro Phe Gly Leu 115 120 125 Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile 130 135 140 Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr Val 145 150 155 160 Met Asn His Leu Gln Glu Thr Ala Leu Asn Xaa Val Lys Thr Ala Gly 165 170 175 Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Val Lys Lys Xaa 180 185 190 Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Thr Tyr Pro 195 200 205 Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Lys Ser Gly 210 215 220 Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Gly Asn Thr Gly 225 230 235 240 Gln Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys Leu 245 250 255 Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Glu 260 265 270 Pro Tyr Phe Val Asp Phe Asp Pro Val Leu Ala Glu Asp Ser Arg Lys 275 280 285 Leu Thr Lys Leu Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly Leu 290 295 300 Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn Val 305 310 315 320 Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Met Met Glu 325 330 335 Ser Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys Gly 340 345 350 Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Ser Gly Cys Asp Ile 355 360 365 Gly Asn Leu Gly Thr Ala Gly Glu Val Glu Cys Gln His Leu Leu Arg 370 375 380 Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser Ser 385 390 395 400 Lys Thr Pro Thr Thr Thr Trp Asp Ile Thr Pro 405 410 <210> 217 <211> 333 <212> PRT <213> Madhuca longifolia <400> 217 Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr 1 5 10 15 Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro 20 25 30 Lys Arg Pro Asp Met Leu Ile Asp Pro Phe Gly Leu Gly Lys Ile Val 35 40 45 Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu 50 55 60 Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu 65 70 75 80 Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala Gly Leu Leu Gly Asp 85 90 95 Gly Phe Gly Val Thr Pro Glu Met Cys Lys Lys Asn Leu Ile Trp Val 100 105 110 Val Ala Lys Met Gln Val Leu Val Asp Arg Tyr Pro Thr Trp Gly Asp 115 120 125 Val Val Gln Val Asp Thr Trp Val Ala Ala Ser Gly Lys Asn Gly Met 130 135 140 Arg Arg Asp Trp Leu Val Arg Asp Phe Glu Thr Gly Asp Ile Leu Thr 145 150 155 160 Lys Ala Ser Ser Val Trp Val Met Met Asn Arg Glu Thr Arg Arg Leu 165 170 175 Ser Lys Ile Pro Asp Glu Val Arg Leu Glu Ile Gly Ser Tyr Phe Val 180 185 190 Asp Ser Pro Pro Val Leu Asp Glu Asp Gly Arg Lys Leu Pro Lys Leu 195 200 205 Asp Glu Ser Thr Ala Asp His Ile Arg Thr Gly Leu Thr Pro Arg Trp 210 215 220 Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly 225 230 235 240 Trp Ile Leu Glu Ser Ala Pro Gln Pro Ile Leu Glu Asn His Glu Leu 245 250 255 Ala Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys Gly Lys Asp Ser Val 260 265 270 Leu Gln Ser Leu Thr Gly Val Thr Ser Gly Gly Val Gly Gly Leu Ala 275 280 285 Asp Ser Gly His Val Glu Cys Gln His Leu Leu Arg Leu Glu Gly Gly 290 295 300 Ala Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Tyr Ala Asn 305 310 315 320 Arg Leu Gly Cys Leu Asp Gln Leu Pro Ala Gly Ser Thr 325 330 <210> 218 <211> 425 <212> PRT <213> Oryza sativa <400> 218 Met Ala Gly Ser Leu Ala Ala Ser Ala Phe Phe Pro Gly Pro Gly Ser 1 5 10 15 Ser Pro Ala Ala Ser Ala Arg Ser Ser Lys Ser Ala Ala Val Thr Gly 20 25 30 Glu Leu Pro Glu Asn Leu Ser Val Arg Gly Ile Val Ala Lys Pro Asn 35 40 45 Pro Pro Pro Ala Ala Met Gln Val Lys Ala Gln Ala Gln Thr Leu Pro 50 55 60 Lys Val Asn Gly Thr Lys Val Asn Leu Lys Thr Val Lys Pro Asp Met 65 70 75 80 Glu Glu Thr Val Pro Tyr Ser Ala Pro Lys Thr Phe Tyr Asn Gln Leu 85 90 95 Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala 100 105 110 Ala Glu Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Lys Lys Pro Asp 115 120 125 Met Leu Val Asp Thr Phe Gly Phe Gly Arg Ile Ile Gln Asp Gly Met 130 135 140 Val Phe Arg Gln Asn Phe Met Ile Arg Ser Tyr Glu Ile Gly Ala Asp 145 150 155 160 Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala 165 170 175 Leu Asn His Val Arg Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala 180 185 190 Thr Pro Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Ser Lys Ile 195 200 205 Gln Leu Leu Val Glu Gln Tyr Pro Ala Trp Gly Asp Thr Val Gln Val 210 215 220 Asp Thr Trp Val Ala Ala Ala Gly Lys Asn Gly Met Arg Arg Asp Trp 225 230 235 240 His Val Arg Asp Tyr Asn Ser Gly Arg Thr Ile Leu Arg Ala Thr Ser 245 250 255 Val Trp Val Met Met His Lys Lys Thr Arg Arg Leu Ser Lys Met Pro 260 265 270 Asp Glu Val Arg Ala Glu Ile Gly Pro Tyr Phe Asn Asp Arg Ser Ala 275 280 285 Ile Thr Glu Glu Gln Ser Glu Lys Leu Ala Lys Thr Gly Asn Lys Val 290 295 300 Gly Asp Asp Ala Thr Glu Gln Phe Ile Arg Lys Gly Leu Thr Pro Arg 305 310 315 320 Trp Gly Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile 325 330 335 Gly Trp Ile Leu Glu Ser Ala Pro Ile Ser Val Leu Glu Lys His Glu 340 345 350 Leu Ala Ser Met Thr Leu Asp Tyr Arg Lys Glu Cys Gly Arg Asp Ser 355 360 365 Val Leu Gln Ser Leu Thr Thr Val Ser Gly Glu Cys Thr Ser Ile Gly 370 375 380 Ala Asp Lys Gln Ala Ser Ala Ile Gln Cys Asp His Leu Leu Gln Leu 385 390 395 400 Glu Ser Gly Ala Asp Ile Val Lys Ala His Thr Glu Trp Arg Pro Lys 405 410 415 Arg Ser His Ala Ala Ala Glu Asn Ala 420 425 <210> 219 <211> 425 <212> PRT <213> Oryza sativa <400> 219 Met Ala Gly Ser Leu Ala Ala Ser Ala Phe Phe Pro Gly Pro Gly Ser 1 5 10 15 Ser Pro Ala Ala Ser Ala Arg Ser Ser Lys Asn Ala Ala Val Thr Gly 20 25 30 Glu Leu Pro Glu Asn Leu Ser Val Arg Gly Ile Val Ala Lys Pro Asn 35 40 45 Pro Pro Pro Ala Ala Met Gln Val Lys Ala Gln Ala Gln Thr Leu Pro 50 55 60 Lys Val Asn Gly Thr Lys Val Asn Leu Lys Thr Val Lys Pro Asp Met 65 70 75 80 Glu Glu Thr Val Pro Tyr Ser Ala Pro Lys Thr Phe Tyr Asn Gln Leu 85 90 95 Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala 100 105 110 Ala Glu Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Lys Lys Pro Asp 115 120 125 Met Leu Val Asp Thr Phe Gly Phe Gly Arg Ile Ile Gln Asp Gly Met 130 135 140 Val Phe Arg Gln Asn Phe Met Ile Arg Ser Tyr Glu Ile Gly Ala Asp 145 150 155 160 Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala 165 170 175 Leu Asn His Val Arg Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala 180 185 190 Thr Pro Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Ser Lys Ile 195 200 205 Gln Leu Leu Val Glu Gln Tyr Pro Ala Trp Gly Asp Thr Val Gln Val 210 215 220 Asp Thr Trp Val Ala Ala Ala Gly Lys Asn Gly Met Arg Arg Asp Trp 225 230 235 240 His Val Arg Asp Tyr Asn Ser Gly Arg Thr Ile Leu Arg Ala Thr Ser 245 250 255 Val Trp Val Met Met His Lys Lys Thr Arg Arg Leu Ser Lys Met Pro 260 265 270 Asp Glu Val Arg Ala Glu Ile Gly Pro Tyr Phe Asn Asp Arg Ser Ala 275 280 285 Ile Thr Glu Glu Gln Ser Glu Lys Leu Ala Lys Thr Gly Asn Lys Val 290 295 300 Gly Asp Asp Ala Thr Glu Gln Phe Ile Arg Lys Gly Leu Thr Pro Arg 305 310 315 320 Trp Gly Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile 325 330 335 Gly Trp Ile Leu Glu Ser Ala Pro Ile Ser Val Leu Glu Lys His Glu 340 345 350 Leu Ala Ser Met Thr Leu Asp Tyr Arg Lys Glu Cys Gly Arg Asp Ser 355 360 365 Val Leu Gln Ser Leu Thr Thr Val Ser Gly Glu Cys Thr Ser Ile Gly 370 375 380 Ala Asp Lys Gln Ala Ser Ala Ile Gln Cys Asp His Leu Leu Gln Leu 385 390 395 400 Glu Ser Gly Ala Asp Ile Val Lys Ala His Thr Glu Trp Arg Pro Lys 405 410 415 Arg Ser His Ala Ala Ala Glu Asn Ala 420 425 <210> 220 <211> 427 <212> PRT <213> Oryza sativa <400> 220 Met Ala Gly Ser Leu Ala Ala Ser Ala Phe Phe Pro Val Pro Gly Ser 1 5 10 15 Ser Pro Ala Ala Ser Ala Arg Ser Ser Lys Asn Thr Thr Gly Glu Leu 20 25 30 Pro Glu Asn Leu Ser Val Arg Gly Ile Val Ala Lys Pro Asn Pro Ser 35 40 45 Pro Gly Ala Met Gln Val Lys Ala Gln Ala Gln Ala Leu Pro Lys Val 50 55 60 Asn Gly Thr Lys Val Asn Leu Lys Thr Thr Ser Pro Asp Lys Glu Asp 65 70 75 80 Ile Ile Pro Tyr Thr Ala Pro Lys Thr Phe Tyr Asn Gln Leu Pro Asp 85 90 95 Trp Ser Met Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu 100 105 110 Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Lys Lys Pro Asp Met Leu 115 120 125 Ala Asp Thr Phe Gly Phe Gly Arg Ile Ile Gln Asp Gly Leu Val Phe 130 135 140 Arg Gln Asn Phe Leu Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr 145 150 155 160 Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn 165 170 175 His Val Lys Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala Thr Pro 180 185 190 Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Ser Lys Ile Gln Leu 195 200 205 Leu Val Glu Arg Tyr Pro Ser Trp Gly Asp Met Val Gln Val Asp Thr 210 215 220 Trp Val Ala Ala Ala Gly Lys Asn Gly Met Arg Arg Asp Trp His Val 225 230 235 240 Arg Asp Tyr Asn Ser Gly Gln Thr Ile Leu Arg Ala Thr Ser Val Trp 245 250 255 Val Met Met Asn Lys Asn Thr Arg Arg Leu Ser Lys Met Pro Asp Glu 260 265 270 Val Arg Ala Glu Ile Gly Pro Tyr Phe Asn Gly Arg Ser Ala Ile Ser 275 280 285 Glu Glu Gln Gly Glu Lys Leu Pro Lys Pro Gly Thr Thr Phe Asp Gly 290 295 300 Ala Ala Thr Lys Gln Phe Thr Arg Lys Gly Leu Thr Pro Lys Trp Ser 305 310 315 320 Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp 325 330 335 Ile Leu Glu Ser Ala Pro Ile Ser Ile Leu Glu Lys His Glu Leu Ala 340 345 350 Ser Met Thr Leu Asp Tyr Arg Lys Glu Cys Gly Arg Asp Ser Val Leu 355 360 365 Gln Ser Leu Thr Thr Val Ser Gly Glu Cys Asp Asp Gly Asn Thr Glu 370 375 380 Ser Ser Ile Gln Cys Asp His Leu Leu Gln Leu Glu Ser Gly Ala Asp 385 390 395 400 Ile Val Lys Ala His Thr Glu Trp Arg Pro Lys Arg Ala Gln Gly Glu 405 410 415 Gly Asn Met Gly Phe Phe Pro Ala Glu Ser Ala 420 425 <210> 221 <211> 419 <212> PRT <213> Cuphea lanceolata <400> 221 Met Val Ala Ala Ala Ala Thr Ser Ala Phe Phe Pro Val Pro Ala Pro 1 5 10 15 Gly Thr Ser Pro Lys Pro Gly Lys Ser Gly Asn Trp Pro Ser Ser Leu 20 25 30 Ser Pro Thr Phe Lys Pro Lys Ser Ile Pro Asn Ala Gly Phe Gln Val 35 40 45 Lys Ala Asn Ala Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Asn 50 55 60 Leu Lys Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro 65 70 75 80 Pro Pro Arg Ala Phe Leu Asn Gln Leu Pro Asp Trp Ser Met Leu Leu 85 90 95 Thr Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met 100 105 110 Leu Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Val Gly 115 120 125 Leu Lys Ser Ile Val Arg Asp Gly Leu Val Ser Arg Gln Ser Phe Leu 130 135 140 Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr 145 150 155 160 Leu Met Asn His Leu Gln Glu Thr Ser Ile Asn His Cys Lys Ser Leu 165 170 175 Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Gly Met Cys Lys Asn 180 185 190 Asp Leu Ile Trp Val Leu Thr Lys Met Gln Ile Met Val Asn Arg Tyr 195 200 205 Pro Thr Trp Gly Asp Thr Val Glu Ile Asn Thr Trp Phe Ser Gln Ser 210 215 220 Gly Lys Ile Gly Met Ala Ser Asp Trp Leu Ile Ser Asp Cys Asn Thr 225 230 235 240 Gly Glu Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln 245 250 255 Lys Thr Arg Arg Phe Ser Arg Leu Pro Tyr Glu Val Arg Gln Glu Leu 260 265 270 Thr Pro His Phe Val Asp Ser Pro His Val Ile Glu Asp Asn Asp Gln 275 280 285 Lys Leu His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly 290 295 300 Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn 305 310 315 320 Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Ile Glu Val Leu 325 330 335 Glu Thr Gln Glu Leu Cys Ser Leu Thr Val Glu Tyr Arg Arg Glu Cys 340 345 350 Gly Met Asp Ser Val Leu Glu Ser Val Thr Ala Val Asp Pro Ser Glu 355 360 365 Asn Gly Gly Arg Ser Gln Tyr Lys His Leu Leu Arg Leu Glu Asp Gly 370 375 380 Thr Asp Ile Val Lys Ser Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly 385 390 395 400 Thr Asn Gly Ala Ile Ser Thr Ser Thr Ala Lys Thr Ser Asn Gly Asn 405 410 415 Ser Ala Ser <210> 222 <211> 362 <212> PRT <213> Myristica fragrans <400> 222 Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala 1 5 10 15 Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg Pro Asp 20 25 30 Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val Gln Asp 35 40 45 Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly 50 55 60 Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu 65 70 75 80 Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp Gly Phe 85 90 95 Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val Val Thr 100 105 110 Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp Val Ile 115 120 125 Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met Lys Arg 130 135 140 Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Ala 145 150 155 160 Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu Ser Lys 165 170 175 Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val Glu His 180 185 190 Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn Asp Asn 195 200 205 Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser Asp Leu 210 215 220 Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu 225 230 235 240 Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr Gly Met 245 250 255 Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu Gln Ser 260 265 270 Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu Ala Gly 275 280 285 Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu Ile Met 290 295 300 Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr Thr Tyr 305 310 315 320 Phe Gly Ser Val Asp Asp Ile Pro Pro His Pro Ile Tyr Ile Tyr Ile 325 330 335 Tyr Ile Tyr Ile Tyr Ile Tyr Ile Tyr Trp Val Gly Ser Ser Cys Ser 340 345 350 Gly Ser Ser Thr Thr Met Ser Arg Thr Arg 355 360 <210> 223 <211> 382 <212> PRT <213> Cinnamomum camphora <400> 223 Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val 1 5 10 15 Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu 20 25 30 Gln Leu Arg Ala Gly Asn Ala Gln Thr Ser Leu Lys Met Ile Asn Gly 35 40 45 Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Lys Leu Pro Asp Trp Ser 50 55 60 Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln 65 70 75 80 Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu 85 90 95 Asp Asp His Phe Gly Pro His Gly Leu Val Phe Arg Arg Thr Phe Ala 100 105 110 Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Val Ala 115 120 125 Val Met Asn His Leu Gln Glu Ala Ala Leu Asn His Ala Lys Ser Val 130 135 140 Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu Met Ser Lys Arg 145 150 155 160 Asp Leu Ile Trp Val Val Lys Arg Thr His Val Ala Val Glu Arg Tyr 165 170 175 Pro Ala Trp Gly Asp Thr Val Glu Val Glu Cys Trp Val Gly Ala Ser 180 185 190 Gly Asn Asn Gly Arg Arg His Asp Phe Leu Val Arg Asp Cys Lys Thr 195 200 205 Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val Met Met Asn Thr 210 215 220 Arg Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile 225 230 235 240 Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp Glu Glu Ile Lys 245 250 255 Lys Pro Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly 260 265 270 Leu Thr Pro Arg Trp Asn Asp Leu Asp Ile Asn Gln His Val Asn Asn 275 280 285 Ile Lys Tyr Val Asp Trp Ile Leu Glu Thr Val Pro Asp Ser Ile Phe 290 295 300 Glu Ser His His Ile Ser Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys 305 310 315 320 Thr Met Asp Ser Val Leu Gln Ser Leu Thr Thr Val Ser Gly Gly Ser 325 330 335 Ser Glu Ala Gly Leu Val Cys Glu His Leu Leu Gln Leu Glu Gly Gly 340 345 350 Ser Glu Val Leu Arg Ala Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp 355 360 365 Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Ser Ser Val 370 375 380 <210> 224 <211> 429 <212> PRT <213> Myristica fragrans <400> 224 Met Val Ala Thr Ser Ala Ala Ser Ala Phe Phe Pro Val Ala Ser Pro 1 5 10 15 Ser Pro Val Lys Pro Ser Met Met Leu Gly Gly Gly Gly Gly Ser Asp 20 25 30 Asn Leu Asp Ala Arg Gly Ile Lys Ser Arg Pro Ala Ser Ser Gly Gly 35 40 45 Leu Gln Val Lys Ala Asn Ala His Thr Val Pro Lys Ile Asn Gly Asn 50 55 60 Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu Asp Ile 65 70 75 80 Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn Gln Leu 85 90 95 Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala 100 105 110 Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg Pro Asp 115 120 125 Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val Gln Asp 130 135 140 Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly 145 150 155 160 Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu 165 170 175 Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp Gly Phe 180 185 190 Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val Val Thr 195 200 205 Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp Val Ile 210 215 220 Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met Lys Arg 225 230 235 240 Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Ala 245 250 255 Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu Ser Lys 260 265 270 Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val Glu His 275 280 285 Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn Asp Asn 290 295 300 Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser Asp Leu 305 310 315 320 Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu 325 330 335 Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr Gly Met 340 345 350 Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu Gln Ser 355 360 365 Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu Ala Gly 370 375 380 Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu Ile Met 385 390 395 400 Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr Thr Tyr 405 410 415 Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala 420 425 <210> 225 <211> 8672 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 225 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940 tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000 cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060 accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120 acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180 tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240 tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300 acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360 acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420 tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480 agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540 acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600 acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660 tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720 tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780 tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840 ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900 ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960 cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020 cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080 tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140 cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200 aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260 acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320 accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380 agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440 tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500 acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920 agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980 tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040 tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100 ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160 cgaattcctt tcttgcgcta tgacacttcc agcaaaaggt agggcgggct gcgagacggc 5220 ttcccggcgc tgcatgcaac accgatgatg cttcgacccc ccgaagctcc ttcggggctg 5280 catgggcgct ccgatgccgc tccagggcga gcgctgttta aatagccagg cccccgattg 5340 caaagacatt atagcgagct accaaagcca tattcaaaca cctagatcac taccacttct 5400 acacaggcca ctcgagcttg tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt 5460 tcagtcacaa cccgcaaaca ctagtatggc caccgcatcc actttctcgg cgttcaatgc 5520 ccgctgcggc gacctgcgtc gctcggcggg ctccgggccc cggcgcccag cgaggcccct 5580 ccccgtgcgc gggcgcgcca cccaggagga cgcccactcc gccccccccc cccgcacctt 5640 catcaaccag ctgcccgact ggtccatgct gctggccgcc atcaccaccg tgttcctggc 5700 cgccgagaag cagtggatga tgctggactg gaagcccaag cgccccgaca tgctggtgga 5760 ccccttcggc ctgggctcca tcgtgcagga cggcctggtg ttccgccaga acttctccat 5820 ccgctcctac gagatcggcg ccgaccgcac cgcctccatc gagaccgtga tgaaccacct 5880 gcaggagacc gccctgaacc acgtgaagat cgccggcctg tccaacgacg gcttcggccg 5940 cacccccgag atgtacaagc gcgacctgat ctgggtggtg gccaagatgc aggtgatggt 6000 gaaccgctac cccacctggg gcgacaccgt ggaggtgaac acctgggtgg ccaagtccgg 6060 caagaacggc atgcgccgcg actggctgat ctccgactgc aacaccggcg agatcctgac 6120 ccgcgcctcc tccgtgtggg tgatgatgaa ccagaagacc cgccgcctgt ccaagatccc 6180 cgacgaggtg cgcaacgaga tcgagcccca cttcgtggac tccccccccg tgatcgagga 6240 cgacgaccgc aagctgccca agctggacga gaagaccgcc gactccatcc gcaagggcct 6300 gaccccccgc tggaacgacc tggacgtgaa ccagcacgtg aacaacgtga agtacatcgg 6360 ctggatcctg gagtccaccc cccccgaggt gctggagacc caggagctgt gctccctgac 6420 cctggagtac cgccgcgagt gcggccgcga gtccgtgctg gagtccctga ccgccatgga 6480 cccctccggc ggcggctacg gctcccagtt ccagcacctg ctgcgcctgg aggacggcgg 6540 cgagatcgtg aagggccgca ccgagtggcg ccccaagaac ggcgtgatca acggcgtggt 6600 gcccaccggc gagtcctccc ccggcgacta ctccatggac tacaaggacc acgacggcga 6660 ctacaaggac cacgacatcg actacaagga cgacgacgac aagtgaatcg atagatctct 6720 taaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt gtgatggact 6780 gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta tcaaacagcc 6840 tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct tgtgctattt 6900 gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa 6960 cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca ctgcccctcg 7020 cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac 7080 tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc ttaattaaga 7140 gctcttgttt tccagaagga gttgctcctt gagcctttca ttctcagcct cgataacctc 7200 caaagccgct ctaattgtgg agggggttcg aatttaaaag cttggaatgt tggttcgtgc 7260 gtctggaaca agcccagact tgttgctcac tgggaaaagg accatcagct ccaaaaaact 7320 tgccgctcaa accgcgtacc tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac 7380 attcatattg tgacgcttga gcagtctgta attgcctcag aatgtggaat catctgcccc 7440 ctgtgcgagc ccatgccagg catgtcgcgg gcgaggacac ccgccactcg tacagcagac 7500 cattatgcta cctcacaata gttcataaca gtgaccatat ttctcgaagc tccccaacga 7560 gcacctccat gctctgagtg gccacccccc ggccctggtg cttgcggagg gcaggtcaac 7620 cggcatgggg ctaccgaaat ccccgaccgg atcccaccac ccccgcgatg ggaagaatct 7680 ctccccggga tgtgggccca ccaccagcac aacctgctgg cccaggcgag cgtcaaacca 7740 taccacacaa atatccttgg catcggccct gaattccttc tgccgctctg ctacccggtg 7800 cttctgtccg aagcaggggt tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg 7860 gcggggcttg ttcgagcttg aagagcctct agagtcgacc tgcaggcatg caagcttggc 7920 gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 7980 catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 8040 attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 8100 ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 8160 ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 8220 aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 8280 aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 8340 gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 8400 gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 8460 tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 8520 ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 8580 ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 8640 tgagtccaac ccggtaagac acgacttatc gc 8672 <210> 226 <211> 9525 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 226 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940 gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000 cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060 caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120 gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180 caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240 cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300 gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360 ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420 cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480 gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540 gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600 gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660 gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720 cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780 caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840 gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900 ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960 gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020 gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080 caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140 ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200 gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260 caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320 gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380 catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440 caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500 cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920 ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980 ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040 cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100 gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160 ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220 tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280 acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340 agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400 gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460 cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagaa ctcgactacg 5520 acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580 actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640 gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700 ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760 ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820 cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880 gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940 accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000 ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060 ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120 tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180 ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggtg 6240 gccaccgccg cctcctccgc cttcttcccc ctgccctccg ccgacacctc ctcccgcccc 6300 ggcaagctgg gcaacaagcc ctcctccctg tcccccctga agcccaagtc cacccccaac 6360 ggcggcctgc aggtgaaggc caacgcctcc gcccccccca agatcaacgg ctcccccgtg 6420 ggcctgaagt ccggcggcct gaaggggcgc gccacccagg aggacgccca ctccgccccc 6480 cccccccgca ccttcatcaa ccagctgccc gactggtcca tgctgctggc cgccatcacc 6540 accgtgttcc tggccgccga gaagcagtgg atgatgctgg actggaagcc caagcgcccc 6600 gacatgctgg tggacccctt cggcctgggc tccatcgtgc aggacggcct ggtgttccgc 6660 cagaacttct ccatccgctc ctacgagatc ggcgccgacc gcaccgcctc catcgagacc 6720 gtgatgaacc acctgcagga gaccgccctg aaccacgtga agatcgccgg cctgtccaac 6780 gacggcttcg gccgcacccc cgagatgtac aagcgcgacc tgatctgggt ggtggccaag 6840 atgcaggtga tggtgaaccg ctaccccacc tggggcgaca ccgtggaggt gaacacctgg 6900 gtggccaagt ccggcaagaa cggcatgcgc cgcgactggc tgatctccga ctgcaacacc 6960 ggcgagatcc tgacccgcgc ctcctccgtg tgggtgatga tgaaccagaa gacccgccgc 7020 ctgtccaaga tccccgacga ggtgcgcaac gagatcgagc cccacttcgt ggactccccc 7080 cccgtgatcg aggacgacga ccgcaagctg cccaagctgg acgagaagac cgccgactcc 7140 atccgcaagg gcctgacccc ccgctggaac gacctggacg tgaaccagca cgtgaacaac 7200 gtgaagtaca tcggctggat cctggagtcc accccccccg aggtgctgga gacccaggag 7260 ctgtgctccc tgaccctgga gtaccgccgc gagtgcggcc gcgagtccgt gctggagtcc 7320 ctgaccgcca tggacccctc cggcggcggc tacggctccc agttccagca cctgctgcgc 7380 ctggaggacg gcggcgagat cgtgaagggc cgcaccgagt ggcgccccaa gaacggcgtg 7440 atcaacggcg tggtgcccac cggcgagtcc tcccccggcg actactccat ggactacaag 7500 gaccacgacg gcgactacaa ggaccacgac atcgactaca aggacgacga cgacaagtga 7560 atcgatagat ctcttaaggc agcagcagct cggatagtat cgacacactc tggacgctgg 7620 tcgtgtgatg gactgttgcc gccacacttg ctgccttgac ctgtgaatat ccctgccgct 7680 tttatcaaac agcctcagtg tgtttgatct tgtgtgtacg cgcttttgcg agttgctagc 7740 tgcttgtgct atttgcgaat accaccccca gcatcccctt ccctcgtttc atatcgcttg 7800 catcccaacc gcaacttatc tacgctgtcc tgctatccct cagcgctgct cctgctcctg 7860 ctcactgccc ctcgcacagc cttggtttgg gctccgcctg tattctcctg gtactgcaac 7920 ctgtaaacca gcactgcaat gctgatgcac gggaagtagt gggatgggaa cacaaatgga 7980 aagcttaatt aagagctctt gttttccaga aggagttgct ccttgagcct ttcattctca 8040 gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta aaagcttgga 8100 atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa aaggaccatc 8160 agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat ctgccctgtt 8220 gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc tcagaatgtg 8280 gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg acacccgcca 8340 ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc atatttctcg 8400 aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct ggtgcttgcg 8460 gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca ccacccccgc 8520 gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg ctggcccagg 8580 cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc cttctgccgc 8640 tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc gagtccgcaa 8700 acccttgtcg cgtggcgggg cttgttcgag cttgaagagc ctctagagtc gacctgcagg 8760 catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 8820 acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 8880 gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 8940 tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 9000 cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 9060 gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 9120 aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 9180 gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 9240 aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 9300 gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 9360 ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 9420 cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 9480 ggtaactatc gtcttgagtc caacccggta agacacgact tatcg 9525 <210> 227 <211> 9313 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 227 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940 gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000 cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060 caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120 gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180 caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240 cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300 gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360 ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420 cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480 gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540 gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600 gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660 gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720 cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780 caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840 gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900 ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960 gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020 gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080 caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140 ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200 gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260 caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320 gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380 catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440 caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500 cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920 ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980 ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040 cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100 gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160 ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220 tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280 acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340 agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400 gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460 cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520 acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580 actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640 gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700 ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760 ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820 cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880 gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940 accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000 ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060 ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120 tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180 ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggcc 6240 accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg ctcggcgggc 6300 tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccca gctgcccgac 6360 tggagcatgc tgctggccgc gatcaccacc ctgttcctgg cggccgagaa gcagtggatg 6420 atgctggact ggaagcccaa gcgccccgac atgctggtgg accccttcgg cctgggccgc 6480 ttcgtgcagg acggcctggt gttccgcaac aacttcagca tccgcagcta cgagatcggc 6540 gcggaccgca ccgccagcat cgagaccctg atgaaccacc tgcaggagac cgccctgaac 6600 cacgtgaaga gcgtgggcct gctggaggac ggcctgggca gcacccgcga gatgagcctg 6660 cgcaacctga tctgggtggt gaccaagatg caggtggcgg tggaccgcta ccccacctgg 6720 ggcgacgagg tgcaggtgag cagctgggcg accgccatcg gcaagaacgg catgcgccgc 6780 gagtggatcg tgaccgactt ccgcaccggc gagaccctgc tgcgcgccac cagcgtgtgg 6840 gtgatgatga acaagctgac ccgccgcatc agcaagatcc ccgaggaggt gtggcacgag 6900 atcggcccca gcttcatcga cgcgcccccc ctgcccaccg tggaggacga cggccgcaag 6960 ctgacccgct tcgacgagag cagcgccgac ttcatccgca agggcctgac cccccgctgg 7020 agcgacctgg acatcaacca gcacgtgaac aacgtgaagt acatcggctg gctgctggag 7080 agcgcgcccc ccgagatcca cgagagccac gagatcgcca gcctgaccct ggagtaccgc 7140 cgcgagtgcg gccgcgacag cgtgctgaac agcgccacca aggtgagcga cagcagccag 7200 ctgggcaaga gcgccgtgga gtgcaaccac ctggtgcgcc tgcagaacgg cggcgagatc 7260 gtgaagggcc gcaccgtgtg gcgccccaag cgccccctgt acaacgacgg cgccgtggtg 7320 gacgtgcccg ccaagaccag cgatgacgat gacaagctgg gatgactcga ggcagcagca 7380 gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 7440 ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 7500 tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 7560 ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 7620 tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 7680 tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 7740 cacgggaagt agtgggatgg gaacacaaat ggaaagcttg agctcttgtt ttccagaagg 7800 agttgctcct tgagcctttc attctcagcc tcgataacct ccaaagccgc tctaattgtg 7860 gagggggttc gaatttaaaa gcttggaatg ttggttcgtg cgtctggaac aagcccagac 7920 ttgttgctca ctgggaaaag gaccatcagc tccaaaaaac ttgccgctca aaccgcgtac 7980 ctctgctttc gcgcaatctg ccctgttgaa atcgccacca cattcatatt gtgacgcttg 8040 agcagtctgt aattgcctca gaatgtggaa tcatctgccc cctgtgcgag cccatgccag 8100 gcatgtcgcg ggcgaggaca cccgccactc gtacagcaga ccattatgct acctcacaat 8160 agttcataac agtgaccata tttctcgaag ctccccaacg agcacctcca tgctctgagt 8220 ggccaccccc cggccctggt gcttgcggag ggcaggtcaa ccggcatggg gctaccgaaa 8280 tccccgaccg gatcccacca cccccgcgat gggaagaatc tctccccggg atgtgggccc 8340 accaccagca caacctgctg gcccaggcga gcgtcaaacc ataccacaca aatatccttg 8400 gcatcggccc tgaattcctt ctgccgctct gctacccggt gcttctgtcc gaagcagggg 8460 ttgctaggga tcgctccgag tccgcaaacc cttgtcgcgt ggcggggctt gttcgagctt 8520 gaagagcctc tagagtcgac ctgcaggcat gcaagcttgg cgtaatcatg gtcatagctg 8580 tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 8640 aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 8700 ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 8760 gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 8820 cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 8880 tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 8940 aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 9000 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9060 caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9120 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 9180 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 9240 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 9300 cacgacttat cgc 9313 <210> 228 <211> 8522 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 228 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 180 caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 240 ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 300 cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 360 agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 420 cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg 480 caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540 gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600 taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tgcagctttt 660 gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 720 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 780 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 840 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 900 gaggcggtgc gtattgggcg ctcttccgct cccgtgatca cacaggtgcc ttgcgagcgt 960 gatcacacta ttttgggggt cctacagtac tgaaatggtg agaagtcgta ctgaaatcaa 1020 ggatgaacaa tgaaaatggt gctgtggtgg cttctcaaag gtcaagaatc agtcgctcgc 1080 gtcaggaaat cgcggcgtca accagcgtgg gcgcggtcag tggccccgca ctggtcacca 1140 tagcctctcc tgccacagta gcgatcccct gggcgttcac tctcagcagc ggctgtactg 1200 cctcccagat tttcttcttc tggacctgcg ggcgtgagag gatgagcagg gtggggccaa 1260 gggctcaatc ctgaacggcc ctcattcggt ttccaatccc acaacacata cccacagcag 1320 gtcagaccac gcattcgcac catgcgcacc aataacgtgt ccttacctga ttgggtgtgg 1380 caggctccgt ggacaggagt gcctcgtccc ccgcccagac ccgctccccc gtcacggcgg 1440 cgtccgggac ccgcagcggc tccaccgcgg tgtgatccgc gttggcggcg cagagcagca 1500 tcccagccga tttgaccccg cgcatgctcc gaggcttgag gttggccagc accaccaccc 1560 gccggccgac aaggtcctcc agggtcacgt gccggaccag gccactcacg atggtgcgag 1620 ggcccccctc ctcgccgagg tcgatctgct cgacgtacag actgcgacat gcgtggcgag 1680 tggtcatcag aaggaagcag gtgtgcagaa ggggcacgtg gttggtattg agagtagcca 1740 aagctttgtg ccaatcagaa agtcaacgca gctgcctgcc tggctcgcgt acggtaccct 1800 ttcttgcgct atgacacttc cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg 1860 ctgcatgcaa caccgatgat gcttcgaccc cccgaagctc cttcggggct gcatgggcgc 1920 tccgatgccg ctccagggcg agcgctgttt aaatagccag gcccccgatt gcaaagacat 1980 tatagcgagc taccaaagcc atattcaaac acctagatca ctaccacttc tacacaggcc 2040 actcgagctt gtgatcgcac tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca 2100 acccgcaaac tctagaatat caatgctgct gcaggccttc ctgttcctgc tggccggctt 2160 cgccgccaag atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt 2220 cacccccaac aagggctgga tgaacgaccc caacggcctg tggtacgacg agaaggacgc 2280 caagtggcac ctgtacttcc agtacaaccc gaacgacacc gtctggggga cgcccttgtt 2340 ctggggccac gccacgtccg acgacctgac caactgggag gaccagccca tcgccatcgc 2400 cccgaagcgc aacgactccg gcgccttctc cggctccatg gtggtggact acaacaacac 2460 ctccggcttc ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta 2520 caacaccccg gagtccgagg agcagtacat ctcctacagc ctggacggcg gctacacctt 2580 caccgagtac cagaagaacc ccgtgctggc cgccaactcc acccagttcc gcgacccgaa 2640 ggtcttctgg tacgagccct cccagaagtg gatcatgacc gcggccaagt cccaggacta 2700 caagatcgag atctactcct ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc 2760 caacgagggc ttcctcggct accagtacga gtgccccggc ctgatcgagg tccccaccga 2820 gcaggacccc agcaagtcct actgggtgat gttcatctcc atcaaccccg gcgccccggc 2880 cggcggctcc ttcaaccagt acttcgtcgg cagcttcaac ggcacccact tcgaggcctt 2940 cgacaaccag tcccgcgtgg tggacttcgg caaggactac tacgccctgc agaccttctt 3000 caacaccgac ccgacctacg ggagcgccct gggcatcgcg tgggcctcca actgggagta 3060 ctccgccttc gtgcccacca acccctggcg ctcctccatg tccctcgtgc gcaagttctc 3120 cctcaacacc gagtaccagg ccaacccgga gacggagctg atcaacctga aggccgagcc 3180 gatcctgaac atcagcaacg ccggcccctg gagccggttc gccaccaaca ccacgttgac 3240 gaaggccaac agctacaacg tcgacctgtc caacagcacc ggcaccctgg agttcgagct 3300 ggtgtacgcc gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg acctctccct 3360 ctggttcaag ggcctggagg accccgagga gtacctccgc atgggcttcg aggtgtccgc 3420 gtcctccttc ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg agaaccccta 3480 cttcaccaac cgcatgagcg tgaacaacca gcccttcaag agcgagaacg acctgtccta 3540 ctacaaggtg tacggcttgc tggaccagaa catcctggag ctgtacttca acgacggcga 3600 cgtcgtgtcc accaacacct acttcatgac caccgggaac gccctgggct ccgtgaacat 3660 gacgacgggg gtggacaacc tgttctacat cgacaagttc caggtgcgcg aggtcaagtg 3720 acaattggca gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg 3780 actgttgccg ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca 3840 gcctcagtgt gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta 3900 tttgcgaata ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg 3960 caacttatct acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc 4020 tcgcacagcc ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag 4080 cactgcaatg ctgatgcacg ggaagtagtg ggatgggaac acaaatggag gatcccgcgt 4140 ctcgaacaga gcgcgcagag gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc 4200 atacaccaca ataaccacct gacgaatgcg cttggttctt cgtccattag cgaagcgtcc 4260 ggttcacaca cgtgccacgt tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg 4320 tcgaaacgtt cacagcctag ggatatcgaa ttcctttctt gcgctatgac acttccagca 4380 aaaggtaggg cgggctgcga gacggcttcc cggcgctgca tgcaacaccg atgatgcttc 4440 gaccccccga agctccttcg gggctgcatg ggcgctccga tgccgctcca gggcgagcgc 4500 tgtttaaata gccaggcccc cgattgcaaa gacattatag cgagctacca aagccatatt 4560 caaacaccta gatcactacc acttctacac aggccactcg agcttgtgat cgcactccgc 4620 taagggggcg cctcttcctc ttcgtttcag tcacaacccg caaacactag tatggccacc 4680 gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4740 gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4800 ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4860 tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4920 gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4980 atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 5040 atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 5100 gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 5160 gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 5220 tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 5280 acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5340 gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5400 gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5460 gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5520 agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5580 ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5640 ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5700 ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5760 aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5820 tgactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg gtcgtgtgat 5880 ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc ttttatcaaa 5940 cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc 6000 tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt gcatcccaac 6060 cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct gctcactgcc 6120 cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa cctgtaaacc 6180 agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg aaagcttgag 6240 ctcgtaccca tcagcatccg ggtgaatctt ggcctccaag atatggccaa tcctcacatc 6300 cagcttggca aaatcgacta gactgtctgc aagtgggaat gtggagcaca aggttgcttg 6360 tagcgatcga cagactggtg gggtacattg acaggtgggc agcgccgcat ccatcgtgcc 6420 tgacgcgagc gccgccggtt gctcgcccgt gcctgccgtc aaagagcggc agagaaatcg 6480 ggaaccgaaa acgtcacatt gcctgatgtt gttacatgct ggactagact ttcttggcgt 6540 gggtctgctc ctcgccaggt gcgcgacgcc tcggggctgg gtgcgaggga gccgtgcggc 6600 cacgcatttg acaagaccca aagctcgcat ctcagacggt caaccgttcg tattatacat 6660 tcaacatatg gtacatacgc aaaaagcatg ccaacgatga cagctcttcg cccacatgtg 6720 agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 6780 taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 6840 cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 6900 tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 6960 gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 7020 gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 7080 tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 7140 gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 7200 cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 7260 aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 7320 tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 7380 ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 7440 attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 7500 ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 7560 tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 7620 aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 7680 acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 7740 aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 7800 agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 7860 ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 7920 agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 7980 tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 8040 tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 8100 attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 8160 taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 8220 aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 8280 caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 8340 gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 8400 cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 8460 tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 8520 ac 8522 <210> 229 <211> 9426 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 229 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940 gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000 cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060 caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120 gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180 caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240 cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300 gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360 ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420 cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480 gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540 gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600 gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660 gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720 cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780 caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840 gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900 ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960 gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020 gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080 caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140 ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200 gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260 caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320 gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380 catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440 caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500 cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920 ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980 ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040 cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100 gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160 ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220 tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280 acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340 agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400 gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460 cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520 acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580 actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640 gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700 ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760 ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820 cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880 gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940 accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000 ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060 ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120 tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180 ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggtg 6240 gtggccgccg ccgccagcag cgccttcttc cccgtgcccg ccccccgccc cacccccaag 6300 cccggcaagt tcggcaactg gcccagcagc ctgagccagc ccttcaagcc caagagcaac 6360 cccaacggcc gcttccaggt gaaggccaac gtgagccccc acgggcgcgc ccccaaggcc 6420 aacggcagcg ccgtgagcct gaagtccggc agcctgaaca ccctggagga cccccccagc 6480 agcccccccc cccgcacctt cctgaaccag ctgcccgact ggagccgcct gcgcaccgcc 6540 atcaccaccg tgttcgtggc cgccgagaag cagttcaccc gcctggaccg caagagcaag 6600 cgccccgaca tgctggtgga ctggttcggc agcgagacca tcgtgcagga cggcctggtg 6660 ttccgcgagc gcttcagcat ccgcagctac gagatcggcg ccgaccgcac cgccagcatc 6720 gagaccctga tgaaccacct gcaggacacc agcctgaacc actgcaagag cgtgggcctg 6780 ctgaacgacg gcttcggccg cacccccgag atgtgcaccc gcgacctgat ctgggtgctg 6840 accaagatgc agatcgtggt gaaccgctac cccacctggg gcgacaccgt ggagatcaac 6900 agctggttca gccagagcgg caagatcggc atgggccgcg agtggctgat cagcgactgc 6960 aacaccggcg agatcctggt gcgcgccacc agcgcctggg ccatgatgaa ccagaagacc 7020 cgccgcttca gcaagctgcc ctgcgaggtg cgccaggaga tcgcccccca cttcgtggac 7080 gccccccccg tgatcgagga caacgaccgc aagctgcaca agttcgacgt gaagaccggc 7140 gacagcatct gcaagggcct gacccccggc tggaacgact tcgacgtgaa ccagcacgtg 7200 agcaacgtga agtacatcgg ctggattctg gagagcatgc ccaccgaggt gctggagacc 7260 caggagctgt gcagcctgac cctggagtac cgccgcgagt gcggccgcga gagcgtggtg 7320 gagagcgtga ccagcatgaa ccccagcaag gtgggcgacc gcagccagta ccagcacctg 7380 ctgcgcctgg aggacggcgc cgacatcatg aagggccgca ccgagtggcg ccccaagaac 7440 gccggcacca accgcgccat cagcacctga ttaattaact cgaggcagca gcagctcgga 7500 tagtatcgac acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc 7560 cttgacctgt gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg 7620 tgtacgcgct tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat 7680 ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct 7740 atccctcagc gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc 7800 cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga 7860 agtagtggga tgggaacaca aatggaaagc ttgagctctt gttttccaga aggagttgct 7920 ccttgagcct ttcattctca gcctcgataa cctccaaagc cgctctaatt gtggaggggg 7980 ttcgaattta aaagcttgga atgttggttc gtgcgtctgg aacaagccca gacttgttgc 8040 tcactgggaa aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg tacctctgct 8100 ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat attgtgacgc ttgagcagtc 8160 tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc caggcatgtc 8220 gcgggcgagg acacccgcca ctcgtacagc agaccattat gctacctcac aatagttcat 8280 aacagtgacc atatttctcg aagctcccca acgagcacct ccatgctctg agtggccacc 8340 ccccggccct ggtgcttgcg gagggcaggt caaccggcat ggggctaccg aaatccccga 8400 ccggatccca ccacccccgc gatgggaaga atctctcccc gggatgtggg cccaccacca 8460 gcacaacctg ctggcccagg cgagcgtcaa accataccac acaaatatcc ttggcatcgg 8520 ccctgaattc cttctgccgc tctgctaccc ggtgcttctg tccgaagcag gggttgctag 8580 ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag cttgaagagc 8640 ctctagagtc gacctgcagg catgcaagct tggcgtaatc atggtcatag ctgtttcctg 8700 tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 8760 aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 8820 ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 8880 gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 8940 tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 9000 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 9060 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 9120 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 9180 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 9240 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 9300 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 9360 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 9420 tatcgc 9426 <210> 230 <211> 8964 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 230 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920 cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980 caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040 gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100 gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160 acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220 cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280 gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340 ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400 cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460 gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520 cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580 tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640 tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700 ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760 ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820 cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880 agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940 ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000 cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060 ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120 acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180 ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240 tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300 agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360 acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420 aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480 gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540 acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600 acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660 ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720 tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780 tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840 aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900 tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960 ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020 cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080 tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140 acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200 tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260 cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320 aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740 cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800 acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860 ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920 gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980 gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040 attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100 tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160 gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220 tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280 gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340 acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400 tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460 aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520 atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580 aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640 gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700 gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760 ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820 attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880 gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940 ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000 caggccggtc gcagccacta gtatggtggt ggccgccgcc gccagcagcg ccttcttccc 6060 cgtgcccgcc ccccgcccca cccccaagcc cggcaagttc ggcaactggc ccagcagcct 6120 gagccagccc ttcaagccca agagcaaccc caacggccgc ttccaggtga aggccaacgt 6180 gagcccccac gggcgcgccc ccaaggccaa cggcagcgcc gtgagcctga agtccggcag 6240 cctgaacacc ctggaggacc cccccagcag cccccccccc cgcaccttcc tgaaccagct 6300 gcccgactgg agccgcctgc gcaccgccat caccaccgtg ttcgtggccg ccgagaagca 6360 gttcacccgc ctggaccgca agagcaagcg ccccgacatg ctggtggact ggttcggcag 6420 cgagaccatc gtgcaggacg gcctggtgtt ccgcgagcgc ttcagcatcc gcagctacga 6480 gatcggcgcc gaccgcaccg ccagcatcga gaccctgatg aaccacctgc aggacaccag 6540 cctgaaccac tgcaagagcg tgggcctgct gaacgacggc ttcggccgca cccccgagat 6600 gtgcacccgc gacctgatct gggtgctgac caagatgcag atcgtggtga accgctaccc 6660 cacctggggc gacaccgtgg agatcaacag ctggttcagc cagagcggca agatcggcat 6720 gggccgcgag tggctgatca gcgactgcaa caccggcgag atcctggtgc gcgccaccag 6780 cgcctgggcc atgatgaacc agaagacccg ccgcttcagc aagctgccct gcgaggtgcg 6840 ccaggagatc gccccccact tcgtggacgc cccccccgtg atcgaggaca acgaccgcaa 6900 gctgcacaag ttcgacgtga agaccggcga cagcatctgc aagggcctga cccccggctg 6960 gaacgacttc gacgtgaacc agcacgtgag caacgtgaag tacatcggct ggattctgga 7020 gagcatgccc accgaggtgc tggagaccca ggagctgtgc agcctgaccc tggagtaccg 7080 ccgcgagtgc ggccgcgaga gcgtggtgga gagcgtgacc agcatgaacc ccagcaaggt 7140 gggcgaccgc agccagtacc agcacctgct gcgcctggag gacggcgccg acatcatgaa 7200 gggccgcacc gagtggcgcc ccaagaacgc cggcaccaac cgcgccatca gcacctgatt 7260 aattaactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 7320 gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 7380 aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 7440 tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 7500 aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 7560 gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 7620 accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctt 7680 gagctccagc cacggcaaca ccgcgcgcct tgcggccgag cacggcgaca agaacctgag 7740 caagatctgc gggctgatcg ccagcgacga gggccggcac gagatcgcct acacgcgcat 7800 cgtggacgag ttcttccgcc tcgaccccga gggcgccgtc gccgcctacg ccaacatgat 7860 gcgcaagcag atcaccatgc ccgcgcacct catggacgac atgggccacg gcgaggccaa 7920 cccgggccgc aacctcttcg ccgacttctc cgcggtcgcc gagaagatcg acgtctacga 7980 cgccgaggac tactgccgca tcctggagca cctcaacgcg cgctggaagg tggacgagcg 8040 ccaggtcagc ggccaggccg ccgcggacca ggagtacgtc ctgggcctgc cccagcgctt 8100 ccggaaactc gccgagaaga ccgccgccaa gcgcaagcgc gtcgcgcgca ggcccgtcgc 8160 cttctcctgg agaagagcct ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat 8220 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 8280 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 8340 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 8400 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 8460 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 8520 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 8580 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 8640 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 8700 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 8760 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 8820 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 8880 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 8940 acccggtaag acacgactta tcgc 8964 <210> 231 <211> 8901 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 231 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920 cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980 caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040 gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100 gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160 acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220 cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280 gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340 ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400 cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460 gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520 cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580 tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640 tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700 ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760 ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820 cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880 agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940 ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000 cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060 ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120 acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180 ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240 tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300 agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360 acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420 aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480 gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540 acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600 acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660 ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720 tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780 tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840 aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900 tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960 ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020 cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080 tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140 acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200 tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260 cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320 aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740 cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800 acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860 ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920 gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980 gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040 attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100 tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160 gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220 tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280 gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340 acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400 tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460 aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520 atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580 aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640 gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700 gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760 ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820 attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880 gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940 ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000 caggccggtc gcagccacta gtatggctat caagacgaac aggcagcctg tggagaagcc 6060 tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 6120 gcttcgtggg cgcgccccca aggccaacgg cagcgccgtg agcctgaagt ccggcagcct 6180 gaacaccctg gaggaccccc ccagcagccc ccccccccgc accttcctga accagctgcc 6240 cgactggagc cgcctgcgca ccgccatcac caccgtgttc gtggccgccg agaagcagtt 6300 cacccgcctg gaccgcaaga gcaagcgccc cgacatgctg gtggactggt tcggcagcga 6360 gaccatcgtg caggacggcc tggtgttccg cgagcgcttc agcatccgca gctacgagat 6420 cggcgccgac cgcaccgcca gcatcgagac cctgatgaac cacctgcagg acaccagcct 6480 gaaccactgc aagagcgtgg gcctgctgaa cgacggcttc ggccgcaccc ccgagatgtg 6540 cacccgcgac ctgatctggg tgctgaccaa gatgcagatc gtggtgaacc gctaccccac 6600 ctggggcgac accgtggaga tcaacagctg gttcagccag agcggcaaga tcggcatggg 6660 ccgcgagtgg ctgatcagcg actgcaacac cggcgagatc ctggtgcgcg ccaccagcgc 6720 ctgggccatg atgaaccaga agacccgccg cttcagcaag ctgccctgcg aggtgcgcca 6780 ggagatcgcc ccccacttcg tggacgcccc ccccgtgatc gaggacaacg accgcaagct 6840 gcacaagttc gacgtgaaga ccggcgacag catctgcaag ggcctgaccc ccggctggaa 6900 cgacttcgac gtgaaccagc acgtgagcaa cgtgaagtac atcggctgga ttctggagag 6960 catgcccacc gaggtgctgg agacccagga gctgtgcagc ctgaccctgg agtaccgccg 7020 cgagtgcggc cgcgagagcg tggtggagag cgtgaccagc atgaacccca gcaaggtggg 7080 cgaccgcagc cagtaccagc acctgctgcg cctggaggac ggcgccgaca tcatgaaggg 7140 ccgcaccgag tggcgcccca agaacgccgg caccaaccgc gccatcagca cctgattaat 7200 taactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg gtcgtgtgat 7260 ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc ttttatcaaa 7320 cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc 7380 tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt gcatcccaac 7440 cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct gctcactgcc 7500 cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa cctgtaaacc 7560 agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg aaagcttgag 7620 ctccagccac ggcaacaccg cgcgccttgc ggccgagcac ggcgacaaga acctgagcaa 7680 gatctgcggg ctgatcgcca gcgacgaggg ccggcacgag atcgcctaca cgcgcatcgt 7740 ggacgagttc ttccgcctcg accccgaggg cgccgtcgcc gcctacgcca acatgatgcg 7800 caagcagatc accatgcccg cgcacctcat ggacgacatg ggccacggcg aggccaaccc 7860 gggccgcaac ctcttcgccg acttctccgc ggtcgccgag aagatcgacg tctacgacgc 7920 cgaggactac tgccgcatcc tggagcacct caacgcgcgc tggaaggtgg acgagcgcca 7980 ggtcagcggc caggccgccg cggaccagga gtacgtcctg ggcctgcccc agcgcttccg 8040 gaaactcgcc gagaagaccg ccgccaagcg caagcgcgtc gcgcgcaggc ccgtcgcctt 8100 ctcctggaga agagcctcta gagtcgacct gcaggcatgc aagcttggcg taatcatggt 8160 catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 8220 gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 8280 tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 8340 gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 8400 actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 8460 tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 8520 aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 8580 ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 8640 aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 8700 cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 8760 cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 8820 aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 8880 cggtaagaca cgacttatcg c 8901 <210> 232 <211> 12406 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 232 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940 tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000 cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060 accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120 acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180 tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240 tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300 acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360 acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420 tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480 agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540 acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600 acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660 tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720 tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780 tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840 ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900 ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960 cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020 cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080 tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140 cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200 aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260 acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320 accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380 agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440 tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500 acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920 agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980 tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040 tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100 ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160 cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220 tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280 gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340 tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400 tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460 tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520 tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580 tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640 gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700 catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760 tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820 ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880 tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940 tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000 ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060 actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120 ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180 cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag cccatatggc 6240 ttccgcggca ttcaccatgt cggcgtgccc cgcgatgact ggcagggccc ctggggcacg 6300 tcgctccgga cggccagtcg ccacccgcct gaggtacgta ttccagtgcc tggtggccag 6360 ctgcatcgac ccctgcgacc agtaccgcag cagcgccagc ctgagcttcc tgggcgacaa 6420 cggcttcgcc agcctgttcg gcagcaagcc cttcatgagc aaccgcggcc accgccgcct 6480 gcgccgcgcc agccacagcg gcgaggccat ggccgtggcc ctgcagcccg cccaggaggc 6540 cggcaccaag aagaagcccg tgatcaagca gcgccgcgtg gtggtgaccg gcatgggcgt 6600 ggtgaccccc ctgggccacg agcccgacgt gttctacaac aacctgctgg acggcgtgag 6660 cggcatcagc gagatcgaga ccttcgactg cacccagttc cccacccgca tcgccggcga 6720 gatcaagagc ttcagcaccg acggctgggt ggcccccaag ctgagcaagc gcatggacaa 6780 gttcatgctg tacctgctga ccgccggcaa gaaggccctg gccgacggcg gcatcaccga 6840 cgaggtgatg aaggagctgg acaagcgcaa gtgcggcgtg ctgatcggca gcggcatggg 6900 cggcatgaag gtgttcaacg acgccatcga ggccctgcgc gtgagctaca agaagatgaa 6960 ccccttctgc gtgcccttcg ccaccaccaa catgggcagc gccatgctgg ccatggacct 7020 gggctggatg ggccccaact acagcatcag caccgcctgc gccaccagca acttctgcat 7080 cctgaacgcc gccaaccaca tcatccgcgg cgaggccgac atgatgctgt gcggcggcag 7140 cgacgccgtg atcatcccca tcggcctggg cggcttcgtg gcctgccgcg ccctgagcca 7200 gcgcaacagc gaccccacca aggccagccg cccctgggac agcaaccgcg acggcttcgt 7260 gatgggcgag ggcgccggcg tgctgctgct ggaggagctg gagcacgcca agaagcgcgg 7320 cgccaccatc tacgccgagt tcctgggcgg cagcttcacc tgcgacgcct accacatgac 7380 cgagccccac cccgagggcg ccggcgtgat cctgtgcatc gagaaggccc tggcccaggc 7440 cggcgtgagc aaggaggacg tgaactacat caacgcccac gccaccagca ccagcgccgg 7500 cgacatcaag gagtaccagg ccctggcccg ctgcttcggc cagaacagcg agctgcgcgt 7560 gaacagcacc aagagcatga tcggccacct gctgggcgcc gccggcggcg tggaggccgt 7620 gaccgtggtg caggccatcc gcaccggctg gattcacccc aacctgaacc tggaggaccc 7680 cgacaaggcc gtggacgcca agctgctggt gggccccaag aaggagcgcc tgaacgtgaa 7740 ggtgggcctg agcaacagct tcggcttcgg cggccacaac agcagcatcc tgttcgcccc 7800 ctgcaacgtg tgaatgcata cggagcgtcg tgcgggaggg agtgtgccga gcggggagtc 7860 ccggtctgtg cgaggcccgg cagctgacgc tggcgagccg tacgccccga gggtccccct 7920 cccctccccc ctcttcccct tccctctgac ggccgcgcct gtttttgcat gttcagcgac 7980 cttaaggatc taagtaagat tcgaagcgct cgaccgtgcc ggacggactg cagccccatg 8040 tcgtagtgac cgccaatgta agtgggctgg cgtttccctg tacgtgactc aacgtcactg 8100 cacgcgcacc accctctcga ccggcaggac caggcatcgc gagatacagc gcgagccaga 8160 cacggagtgc cgagctatgc gcacgctcca actagatatc gaattcggcc gacaggacgc 8220 gcgtcaaagg tgctggtcgt gtatgccctg gccggcaggt cgttgctgct gctggttagt 8280 gattccgcaa ccctgatttt ggcgtcttat tttggcgtgg caaacgctgg cgcccgcgag 8340 ccgggccggc ggcgatgcgg tgccccacgg ctgccggaat ccaagggagg caagagcgcc 8400 cgggtcagtt gaagggcttt acgcgcaagg tacagccgct cctgcaaggc tgcgtggtgg 8460 aattggacgt gcaggtcctg ctgaagttcc tccaccgcct caccagcgga caaagcaccg 8520 gtgtatcagg tccgtgtcat ccactctaaa gaactcgact acgacctact gatggcccta 8580 gattcttcat caaaaacgcc tgagacactt gcccaggatt gaaactccct gaagggacca 8640 ccaggggccc tgagttgttc cttccccccg tggcgagctg ccagccaggc tgtacctgtg 8700 atcgaggctg gcgggaaaat aggcttcgtg tgctcaggtc atgggaggtg caggacagct 8760 catgaaacgc caacaatcgc acaattcatg tcaagctaat cagctatttc ctcttcacga 8820 gctgtaattg tcccaaaatt ctggtctacc gggggtgatc cttcgtgtac gggcccttcc 8880 ctcaacccta ggtatgcgcg catgcggtcg ccgcgcaact cgcgcgaggg ccgagggttt 8940 gggacgggcc gtcccgaaat gcagttgcac ccggatgcgt ggcacctttt ttgcgataat 9000 ttatgcaatg gactgctctg caaaattctg gctctgtcgc caaccctagg atcagcggcg 9060 taggatttcg taatcattcg tcctgatggg gagctaccga ctaccctaat atcagcccga 9120 ctgcctgacg ccagcgtcca cttttgtgca cacattccat tcgtgcccaa gacatttcat 9180 tgtggtgcga agcgtcccca gttacgctca cctgtttccc gacctcctta ctgttctgtc 9240 gacagagcgg gcccacaggc cggtcgcagc cactagtatg gccaccgcat ccactttctc 9300 ggcgttcaat gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc 9360 agcgaggccc ctccccgtgc gcgggcgcgc ccccaaggcc aacggcagcg ccgtgagcct 9420 gaagtccggc agcctgaaca ccctggagga cccccccagc agcccccccc cccgcacctt 9480 cctgaaccag ctgcccgact ggagccgcct gcgcaccgcc atcaccaccg tgttcgtggc 9540 cgccgagaag cagttcaccc gcctggaccg caagagcaag cgccccgaca tgctggtgga 9600 ctggttcggc agcgagacca tcgtgcagga cggcctggtg ttccgcgagc gcttcagcat 9660 ccgcagctac gagatcggcg ccgaccgcac cgccagcatc gagaccctga tgaaccacct 9720 gcaggacacc agcctgaacc actgcaagag cgtgggcctg ctgaacgacg gcttcggccg 9780 cacccccgag atgtgcaccc gcgacctgat ctgggtgctg accaagatgc agatcgtggt 9840 gaaccgctac cccacctggg gcgacaccgt ggagatcaac agctggttca gccagagcgg 9900 caagatcggc atgggccgcg agtggctgat cagcgactgc aacaccggcg agatcctggt 9960 gcgcgccacc agcgcctggg ccatgatgaa ccagaagacc cgccgcttca gcaagctgcc 10020 ctgcgaggtg cgccaggaga tcgcccccca cttcgtggac gccccccccg tgatcgagga 10080 caacgaccgc aagctgcaca agttcgacgt gaagaccggc gacagcatct gcaagggcct 10140 gacccccggc tggaacgact tcgacgtgaa ccagcacgtg agcaacgtga agtacatcgg 10200 ctggattctg gagagcatgc ccaccgaggt gctggagacc caggagctgt gcagcctgac 10260 cctggagtac cgccgcgagt gcggccgcga gagcgtggtg gagagcgtga ccagcatgaa 10320 ccccagcaag gtgggcgacc gcagccagta ccagcacctg ctgcgcctgg aggacggcgc 10380 cgacatcatg aagggccgca ccgagtggcg ccccaagaac gccggcacca accgcgccat 10440 cagcacctga ttaattaact cgaggcagca gcagctcgga tagtatcgac acactctgga 10500 cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct 10560 gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt 10620 gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat 10680 cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg 10740 ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac 10800 tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca 10860 aatggaaagc ttgagctctt gttttccaga aggagttgct ccttgagcct ttcattctca 10920 gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta aaagcttgga 10980 atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa aaggaccatc 11040 agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat ctgccctgtt 11100 gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc tcagaatgtg 11160 gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg acacccgcca 11220 ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc atatttctcg 11280 aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct ggtgcttgcg 11340 gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca ccacccccgc 11400 gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg ctggcccagg 11460 cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc cttctgccgc 11520 tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc gagtccgcaa 11580 acccttgtcg cgtggcgggg cttgttcgag cttgaagagc ctctagagtc gacctgcagg 11640 catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 11700 acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 11760 gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 11820 tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 11880 cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 11940 gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 12000 aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 12060 gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 12120 aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 12180 gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 12240 ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 12300 cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 12360 ggtaactatc gtcttgagtc caacccggta agacacgact tatcgc 12406 <210> 233 <211> 9362 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 233 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgggctgg tctgaatcct tcaggcgggt 1920 gttacccgag aaagaaaggg tgccgatttc aaagcagacc catgtgccgg gccctgtggc 1980 ctgtgttggc gcctatgtag tcaccccccc tcacccaatt gtcgccagtt tgcgcactcc 2040 ataaactcaa aacagcagct tctgagctgc gctgttcaag aacacctctg gggtttgctc 2100 acccgcgagg tcgacgccca gcatggctat caagacgaac aggcagcctg tggagaagcc 2160 tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 2220 gcttcgtagc agcatgtacc tggcctttga catcgcggtc atgtccctgc tctacgtcgc 2280 gtcgacgtac atcgaccctg caccggtgcc tacgtgggtc aagtacggca tcatgtggcc 2340 gctctactgg ttcttccagg tgtgtttgag ggttttggtt gcccgtattg aggtcctggt 2400 ggcgcgcatg gaggagaagg cgcctgtccc gctgaccccc ccggctaccc tcccggcacc 2460 ttccagggcg ccttcggcac gggtgtctgg gtgtgcgcgc acgagtgcgg ccaccaggcc 2520 ttttcctcca gccaggccat caacgacggc gtgggcctgg tgttccacag cctgctgctg 2580 gtgccctact actcctggaa gcactcgcac cgggtaccct ttcttgcgct atgacacttc 2640 cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat 2700 gcttcgaccc cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg 2760 agcgctgttt aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc 2820 atattcaaac acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac 2880 tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac tctagaatat 2940 caatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct 3000 ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga 3060 tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc 3120 agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg 3180 acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg 3240 gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca 3300 ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg 3360 agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc 3420 ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct 3480 cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct 3540 ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct 3600 accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct 3660 actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt 3720 acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg 3780 tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg 3840 ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca 3900 acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg 3960 ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg 4020 ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg 4080 tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca 4140 cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg 4200 accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc 4260 gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg 4320 tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc 4380 tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct 4440 acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc 4500 tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc 4560 ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 4620 tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 4680 gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 4740 catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 4800 gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 4860 ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 4920 ggaagtagtg ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag 4980 gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct 5040 gacgaatgcg cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt 5100 tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag 5160 ggatatcgaa ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc 5220 ggcaggtcgt tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt 5280 ggcgtggcaa acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg 5340 ccggaatcca agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac 5400 agccgctcct gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc 5460 accgcctcac cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagaa 5520 ctcgactacg acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc 5580 caggattgaa actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg 5640 cgagctgcca gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc 5700 tcaggtcatg ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca 5760 agctaatcag ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg 5820 ggtgatcctt cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg 5880 cgcaactcgc gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg 5940 gatgcgtggc accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct 6000 ctgtcgccaa ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag 6060 ctaccgacta ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac 6120 attccattcg tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct 6180 gtttcccgac ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac 6240 tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 6300 ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccgc 6360 caccggcgag cagccctccg gcgtggcctc cctgcgcgag gccgacaagg agaagtccct 6420 gggcaaccgc ctgcgcctgg gctccctgac cgaggacggc ctgtcctaca aggagaagtt 6480 cgtgatccgc tgctacgagg tgggcatcaa caagaccgcc accatcgaga ccatcgccaa 6540 cctgctgcag gaggtgggcg gcaaccacgc ccagggcgtg ggcttctcca ccgacggctt 6600 cgccaccacc accaccatgc gcaagctgca cctgatctgg gtgaccgccc gcatgcacat 6660 cgagatctac cgctaccccg cctggtccga cgtgatcgag atcgagacct gggtgcaggg 6720 cgagggcaag gtgggcaccc gccgcgactg gatcctgaag gactacgcca acggcgaggt 6780 gatcggccgc gccacctcca agtgggtgat gatgaacgag gacacccgcc gcctgcagaa 6840 ggtgtccgac gacgtgcgcg aggagtacct ggtgttctgc ccccgcaccc tgcgcctggc 6900 cttccccgag gagaacaaca actccatgaa gaagatcccc aagctggagg accccgccga 6960 gtactcccgc ctgggcctgg tgccccgccg ctccgacctg gacatgaaca agcacgtgaa 7020 caacgtgacc tacatcggct gggccctgga gtccatcccc cccgagatca tcgacaccca 7080 cgagctgcag gccatcaccc tggactaccg ccgcgagtgc cagcgcgacg acatcgtgga 7140 ctccctgacc tcccgcgagc ccctgggcaa cgccgccggc gtgaagttca aggagatcaa 7200 cggctccgtg tcccccaaga aggacgagca ggacctgtcc cgcttcatgc acctgctgcg 7260 ctccgccggc tccggcctgg agatcaaccg ctgccgcacc gagtggcgca agaagcccgc 7320 caagcgcatg gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa 7380 ggacgacgac gacaagtgaa tcgatagatc tcttaaggca gcagcagctc ggatagtatc 7440 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 7500 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 7560 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 7620 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 7680 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 7740 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 7800 ggatgggaac acaaatggaa agcttaatta agagctcccg ccaccactcc aacacggggt 7860 gcctggacaa ggacgaggtg tttgtgccgc cgcaccgcgc agtggcgcac gagggcctgg 7920 agtgggagga gtggctgccc atccgcatgg gcaaggtgct ggtcaccctg accctgggct 7980 ggccgctgta cctcatgttc aacgtcgcct cgcggccgta cccgcgcttc gccaaccact 8040 ttgacccgtg gtcgcccatc ttcagcaagc gcgagcgcat cgaggtggtc atctccgacc 8100 tggcgctggt ggcggtgctc agcgggctca gcgtgctggg ccgcaccatg ggctgggcct 8160 ggctggtcaa gacctacgtg gtgccctacc tgatcgtgaa catgtggctc gtgctcatca 8220 cgctgctcca gcacacgcac ccggcgctgc cgcactactt cgagaaggac tgggactggc 8280 tgcgcggcgc catggccacc gtggaccgct ccatgggccc gcccttcatg gacaacatcc 8340 tgcaccacat ctccgacacc cacgtgctgc accacctctt cagcaccatc ccgcactacc 8400 acgccgagga ggcctccgcc gccatcaggc ccatcctggg caagtactac cagtccgaca 8460 gccgctgggt cggccgcgcc ctgtgggagg actggcgcga ctgccgctac gtcgtcccgg 8520 acgcgcccga ggacgactcc gcgctctggt tccacaagtg agtgagtgag aagagcctct 8580 agagtcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 8640 aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 8700 ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 8760 ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 8820 cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 8880 tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 8940 aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 9000 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 9060 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 9120 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 9180 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9240 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 9300 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 9360 gc 9362 <210> 234 <211> 8609 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 234 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgggctgg tctgaatcct tcaggcgggt 1920 gttacccgag aaagaaaggg tgccgatttc aaagcagacc catgtgccgg gccctgtggc 1980 ctgtgttggc gcctatgtag tcaccccccc tcacccaatt gtcgccagtt tgcgcactcc 2040 ataaactcaa aacagcagct tctgagctgc gctgttcaag aacacctctg gggtttgctc 2100 acccgcgagg tcgacgccca gcatggctat caagacgaac aggcagcctg tggagaagcc 2160 tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 2220 gcttcgtagc agcatgtacc tggcctttga catcgcggtc atgtccctgc tctacgtcgc 2280 gtcgacgtac atcgaccctg caccggtgcc tacgtgggtc aagtacggca tcatgtggcc 2340 gctctactgg ttcttccagg tgtgtttgag ggttttggtt gcccgtattg aggtcctggt 2400 ggcgcgcatg gaggagaagg cgcctgtccc gctgaccccc ccggctaccc tcccggcacc 2460 ttccagggcg ccttcggcac gggtgtctgg gtgtgcgcgc acgagtgcgg ccaccaggcc 2520 ttttcctcca gccaggccat caacgacggc gtgggcctgg tgttccacag cctgctgctg 2580 gtgccctact actcctggaa gcactcgcac cgggtaccct ttcttgcgct atgacacttc 2640 cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat 2700 gcttcgaccc cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg 2760 agcgctgttt aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc 2820 atattcaaac acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac 2880 tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac tctagaatat 2940 caatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct 3000 ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga 3060 tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc 3120 agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg 3180 acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg 3240 gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca 3300 ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg 3360 agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc 3420 ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct 3480 cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct 3540 ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct 3600 accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct 3660 actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt 3720 acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg 3780 tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg 3840 ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca 3900 acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg 3960 ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg 4020 ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg 4080 tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca 4140 cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg 4200 accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc 4260 gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg 4320 tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc 4380 tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct 4440 acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc 4500 tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc 4560 ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 4620 tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 4680 gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 4740 catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 4800 gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 4860 ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 4920 ggaagtagtg ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag 4980 gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct 5040 gacgaatgcg cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt 5100 tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag 5160 ggatatcgaa ttcctttctt gcgctatgac acttccagca aaaggtaggg cgggctgcga 5220 gacggcttcc cggcgctgca tgcaacaccg atgatgcttc gaccccccga agctccttcg 5280 gggctgcatg ggcgctccga tgccgctcca gggcgagcgc tgtttaaata gccaggcccc 5340 cgattgcaaa gacattatag cgagctacca aagccatatt caaacaccta gatcactacc 5400 acttctacac aggccactcg agcttgtgat cgcactccgc taagggggcg cctcttcctc 5460 ttcgtttcag tcacaacccg caaacactag tatggccacc gcatccactt tctcggcgtt 5520 caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc gggccccggc gcccagcgag 5580 gcccctcccc gtgcgcgggc gcgccgccac cggcgagcag ccctccggcg tggcctccct 5640 gcgcgaggcc gacaaggaga agtccctggg caaccgcctg cgcctgggct ccctgaccga 5700 ggacggcctg tcctacaagg agaagttcgt gatccgctgc tacgaggtgg gcatcaacaa 5760 gaccgccacc atcgagacca tcgccaacct gctgcaggag gtgggcggca accacgccca 5820 gggcgtgggc ttctccaccg acggcttcgc caccaccacc accatgcgca agctgcacct 5880 gatctgggtg accgcccgca tgcacatcga gatctaccgc taccccgcct ggtccgacgt 5940 gatcgagatc gagacctggg tgcagggcga gggcaaggtg ggcacccgcc gcgactggat 6000 cctgaaggac tacgccaacg gcgaggtgat cggccgcgcc acctccaagt gggtgatgat 6060 gaacgaggac acccgccgcc tgcagaaggt gtccgacgac gtgcgcgagg agtacctggt 6120 gttctgcccc cgcaccctgc gcctggcctt ccccgaggag aacaacaact ccatgaagaa 6180 gatccccaag ctggaggacc ccgccgagta ctcccgcctg ggcctggtgc cccgccgctc 6240 cgacctggac atgaacaagc acgtgaacaa cgtgacctac atcggctggg ccctggagtc 6300 catccccccc gagatcatcg acacccacga gctgcaggcc atcaccctgg actaccgccg 6360 cgagtgccag cgcgacgaca tcgtggactc cctgacctcc cgcgagcccc tgggcaacgc 6420 cgccggcgtg aagttcaagg agatcaacgg ctccgtgtcc cccaagaagg acgagcagga 6480 cctgtcccgc ttcatgcacc tgctgcgctc cgccggctcc ggcctggaga tcaaccgctg 6540 ccgcaccgag tggcgcaaga agcccgccaa gcgcatggac tacaaggacc acgacggcga 6600 ctacaaggac cacgacatcg actacaagga cgacgacgac aagtgaatcg atagatctct 6660 taaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt gtgatggact 6720 gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta tcaaacagcc 6780 tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct tgtgctattt 6840 gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa 6900 cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca ctgcccctcg 6960 cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac 7020 tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc ttaattaaga 7080 gctcccgcca ccactccaac acggggtgcc tggacaagga cgaggtgttt gtgccgccgc 7140 accgcgcagt ggcgcacgag ggcctggagt gggaggagtg gctgcccatc cgcatgggca 7200 aggtgctggt caccctgacc ctgggctggc cgctgtacct catgttcaac gtcgcctcgc 7260 ggccgtaccc gcgcttcgcc aaccactttg acccgtggtc gcccatcttc agcaagcgcg 7320 agcgcatcga ggtggtcatc tccgacctgg cgctggtggc ggtgctcagc gggctcagcg 7380 tgctgggccg caccatgggc tgggcctggc tggtcaagac ctacgtggtg ccctacctga 7440 tcgtgaacat gtggctcgtg ctcatcacgc tgctccagca cacgcacccg gcgctgccgc 7500 actacttcga gaaggactgg gactggctgc gcggcgccat ggccaccgtg gaccgctcca 7560 tgggcccgcc cttcatggac aacatcctgc accacatctc cgacacccac gtgctgcacc 7620 acctcttcag caccatcccg cactaccacg ccgaggaggc ctccgccgcc atcaggccca 7680 tcctgggcaa gtactaccag tccgacagcc gctgggtcgg ccgcgccctg tgggaggact 7740 ggcgcgactg ccgctacgtc gtcccggacg cgcccgagga cgactccgcg ctctggttcc 7800 acaagtgagt gagtgagaag agcctctaga gtcgacctgc aggcatgcaa gcttggcgta 7860 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 7920 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 7980 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8040 atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8100 gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8160 ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8220 aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8280 ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8340 aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 8400 gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 8460 tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 8520 tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 8580 gtccaacccg gtaagacacg acttatcgc 8609 <210> 235 <211> 9387 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 235 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940 gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000 cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060 caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120 gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180 caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240 cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300 gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360 ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420 cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480 gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540 gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600 gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660 gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720 cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780 caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840 gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900 ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960 gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020 gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080 caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140 ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200 gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260 caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320 gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380 catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440 caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500 cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920 ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980 ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040 cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100 gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160 ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220 tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280 acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340 agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400 gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460 cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520 acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580 actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640 gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700 ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760 ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820 cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880 gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940 accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000 ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060 ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120 tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180 ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggct 6240 tccgcggcat tcaccatgtc ggcgtgcccc gcgatgactg gcagggcccc tggggcacgt 6300 cgctccggac ggccagtcgc cacccgcctg agggggcgcg cccccaaggc caacggctcc 6360 gccgtgtccc tgaagtccgg ctccctggac acccaggagg acacctcctc ctcctcctcc 6420 cccccccgca ccttcatcaa ccagctgccc gactggtcca tgctgctgtc cgccatcacc 6480 accgtgttcg tggccgccga gaagcagtgg accatgctgg accgcaagtc caagcgcccc 6540 gacaccctga tggacccctt cggcgtggac cgcgtggtgc aggacggcgt ggtgttccgc 6600 cagtccttct ccatccgctc ctacgagatc ggcgccgacc gcaccgcctc catcgagacc 6660 ctgatgaaca tcttccagga gacctccctg aaccactgca agtccatcgg cctgctgaac 6720 gacggcttcg gccgcacccc cgagatgtgc aagcgcgacc tgatctgggt ggtgaccaag 6780 atgcacatcg aggtgaaccg ctaccccacc tggggcgaca ccatcgaggt gaacacctgg 6840 gtgtccgagt ccggcaagac cggcatgggc cgcgactggc tgatctccga ctgccacacc 6900 ggcgagatcc tgatccgcgc cacctccgtg tgcgccatga tgaaccagac cacccgccgc 6960 ttctccaagt tcccctacga ggtgcgccag gagctggccc cccacttcgt ggactccgcc 7020 cccgtgatcg aggactacca gaagctgcac aagctggacg tgaagaccgg cgactccatc 7080 tgcaacggcc tgaccccccg ctggaacgac ctggacgtga accagcacgt gaacaacgtg 7140 aagtacatcg gctggattct ggagtccgtg cccaaggagg tgttcgagac ccaggagctg 7200 tgcggcctga ccctggagta ccgccgcgag tgcggccgcg actccgtgct gaagtccgtg 7260 accgccatgg acccctccaa ggagggcgac cgctccctgt accagcacct gctgcgcctg 7320 gaggacggca ccgacatcgc caagggccgc accaagtggc gccccaagaa cgccggcacc 7380 aacggcgcca tctccaccgg caagacctcc aacggcaact ccatctcctg attaattaac 7440 tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 7500 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 7560 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 7620 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 7680 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 7740 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 7800 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag cttgagctct 7860 tgttttccag aaggagttgc tccttgagcc tttcattctc agcctcgata acctccaaag 7920 ccgctctaat tgtggagggg gttcgaattt aaaagcttgg aatgttggtt cgtgcgtctg 7980 gaacaagccc agacttgttg ctcactggga aaaggaccat cagctccaaa aaacttgccg 8040 ctcaaaccgc gtacctctgc tttcgcgcaa tctgccctgt tgaaatcgcc accacattca 8100 tattgtgacg cttgagcagt ctgtaattgc ctcagaatgt ggaatcatct gccccctgtg 8160 cgagcccatg ccaggcatgt cgcgggcgag gacacccgcc actcgtacag cagaccatta 8220 tgctacctca caatagttca taacagtgac catatttctc gaagctcccc aacgagcacc 8280 tccatgctct gagtggccac cccccggccc tggtgcttgc ggagggcagg tcaaccggca 8340 tggggctacc gaaatccccg accggatccc accacccccg cgatgggaag aatctctccc 8400 cgggatgtgg gcccaccacc agcacaacct gctggcccag gcgagcgtca aaccatacca 8460 cacaaatatc cttggcatcg gccctgaatt ccttctgccg ctctgctacc cggtgcttct 8520 gtccgaagca ggggttgcta gggatcgctc cgagtccgca aacccttgtc gcgtggcggg 8580 gcttgttcga gcttgaagag cctctagagt cgacctgcag gcatgcaagc ttggcgtaat 8640 catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 8700 gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 8760 ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 8820 gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8880 tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8940 cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 9000 gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 9060 gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 9120 gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 9180 ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 9240 atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 9300 tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 9360 ccaacccggt aagacacgac ttatcgc 9387 <210> 236 <211> 7781 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 236 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatga 2940 tcgagcagga cggcctccac gccggctccc ccgccgcctg ggtggagcgc ctgttcggct 3000 acgactgggc ccagcagacc atcggctgct ccgacgccgc cgtgttccgc ctgtccgccc 3060 agggccgccc cgtgctgttc gtgaagaccg acctgtccgg cgccctgaac gagctgcagg 3120 acgaggccgc ccgcctgtcc tggctggcca ccaccggcgt gccctgcgcc gccgtgctgg 3180 acgtggtgac cgaggccggc cgcgactggc tgctgctggg cgaggtgccc ggccaggacc 3240 tgctgtcctc ccacctggcc cccgccgaga aggtgtccat catggccgac gccatgcgcc 3300 gcctgcacac cctggacccc gccacctgcc ccttcgacca ccaggccaag caccgcatcg 3360 agcgcgcccg cacccgcatg gaggccggcc tggtggacca ggacgacctg gacgaggagc 3420 accagggcct ggcccccgcc gagctgttcg cccgcctgaa ggcccgcatg cccgacggcg 3480 aggacctggt ggtgacccac ggcgacgcct gcctgcccaa catcatggtg gagaacggcc 3540 gcttctccgg cttcatcgac tgcggccgcc tgggcgtggc cgaccgctac caggacatcg 3600 ccctggccac ccgcgacatc gccgaggagc tgggcggcga gtgggccgac cgcttcctgg 3660 tgctgtacgg catcgccgcc cccgactccc agcgcatcgc cttctaccgc ctgctggacg 3720 agttcttctg acaattggca gcagcagctc ggatagtatc gacacactct ggacgctggt 3780 cgtgtgatgg actgttgccg ccacacttgc tgccttgacc tgtgaatatc cctgccgctt 3840 ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc gcttttgcga gttgctagct 3900 gcttgtgcta tttgcgaata ccacccccag catccccttc cctcgtttca tatcgcttgc 3960 atcccaaccg caacttatct acgctgtcct gctatccctc agcgctgctc ctgctcctgc 4020 tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt attctcctgg tactgcaacc 4080 tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg ggatgggaac acaaatggag 4140 gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa ggtctcgcct ctgtcgcacc 4200 tcagcgcggc atacaccaca ataaccacct gacgaatgcg cttggttctt cgtccattag 4260 cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg gcaggtgaca atgatcggtg 4320 gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa ttcctttctt gcgctatgac 4380 acttccagca aaaggtaggg cgggctgcga gacggcttcc cggcgctgca tgcaacaccg 4440 atgatgcttc gaccccccga agctccttcg gggctgcatg ggcgctccga tgccgctcca 4500 gggcgagcgc tgtttaaata gccaggcccc cgattgcaaa gacattatag cgagctacca 4560 aagccatatt caaacaccta gatcactacc acttctacac aggccactcg agcttgtgat 4620 cgcactccgc taagggggcg cctcttcctc ttcgtttcag tcacaacccg caaacactag 4680 tatggccacc gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc 4740 ggcgggctcc gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga 4800 ctggtccatg ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac 4860 caacctggag tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc 4920 ccacggcctg gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg 4980 ctccaccagc atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa 5040 gtccgtgggc atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct 5100 gatctgggtg gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac 5160 cgtggaggtg gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct 5220 ggtgcgcgac tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat 5280 gaacacccgc acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc 5340 cgccttcatc gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa 5400 cgactccacc gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat 5460 caaccagcac gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag 5520 catcttcgag agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat 5580 ggacagcgtg ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt 5640 gtgcgagcac ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg 5700 gcgccccaag ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt 5760 gatggactac aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga 5820 cgacgacaag tgactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg 5880 gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc 5940 ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag 6000 ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt 6060 gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct 6120 gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa 6180 cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg 6240 aaagcttgag ctcttgtttt ccagaaggag ttgctccttg agcctttcat tctcagcctc 6300 gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc ttggaatgtt 6360 ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga ccatcagctc 6420 caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc ctgttgaaat 6480 cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga atgtggaatc 6540 atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc cgccactcgt 6600 acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt tctcgaagct 6660 ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc ttgcggaggg 6720 caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc cccgcgatgg 6780 gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc ccaggcgagc 6840 gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct gccgctctgc 6900 tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc cgcaaaccct 6960 tgtcgcgtgg cggggcttgt tcgagcttga agagcctcta gagtcgacct gcaggcatgc 7020 aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 7080 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 7140 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 7200 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 7260 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 7320 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 7380 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 7440 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 7500 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 7560 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 7620 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 7680 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 7740 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg c 7781 <210> 237 <211> 8831 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 237 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940 tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000 cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060 accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120 acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180 tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240 tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300 acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360 acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420 tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480 agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540 acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600 acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660 tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720 tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780 tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840 ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900 ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960 cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020 cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080 tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140 cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200 aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260 acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320 accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380 agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440 tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500 acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920 agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980 tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040 tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100 ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160 cgaattcctt tcttgcgcta tgacacttcc agcaaaaggt agggcgggct gcgagacggc 5220 ttcccggcgc tgcatgcaac accgatgatg cttcgacccc ccgaagctcc ttcggggctg 5280 catgggcgct ccgatgccgc tccagggcga gcgctgttta aatagccagg cccccgattg 5340 caaagacatt atagcgagct accaaagcca tattcaaaca cctagatcac taccacttct 5400 acacaggcca ctcgagcttg tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt 5460 tcagtcacaa cccgcaaaca ctagtatggc caccgcatcc actttctcgg cgttcaatgc 5520 ccgctgcggc gacctgcgtc gctcggcggg ctccgggccc cggcgcccag cgaggcccct 5580 ccccgtgcgc gggcgcgccg cctccgccaa ggcctccaag accatcggcg agggctccga 5640 gaacctgaac gtgcgcggca tcatcgccaa gcccacctcc tcctccgccg ccaagcaggg 5700 caaggtgatg gcccaggccg tgcccaagat caacggcgcc aaggtgggcc tgaaggccga 5760 gtcccagaag gccgaggagg acgccgcccc ctcctccgcc ccccgcacct tctacaacca 5820 gctgcccgac tggtccgtgc tgctggccgc cgtgaccacc atcttcctgg ccgccgagaa 5880 gcagtggacc ctgctggact ggaagccccg ccgccccgac atgctgaccg gcgccttctc 5940 cctgggcaag atcgtgcagg acggcctggt gttccgccag aacttctcca tccgctccta 6000 cgagatcggc gccgaccgca ccgcctccat cgagaccctg atgaaccacc tgcaggagac 6060 cgccctgaac cacgtgcgca acgccggcct gctgggcgac ggcttcggcg ccacccccga 6120 gatgtccaag cgcaacctga tctgggtggt gaccaagatg caggtgctga tcgagcacta 6180 cccctcctgg ggcgacgtgg tggaggtgga cacctgggtg ggcgcctccg gcaagaacgg 6240 catgcgccgc gactggcacg tgcgcgacta ccgcaccggc cagaccatcc tgcgcgccac 6300 ctccatctgg gtgatgatgg acaagcacac ccgcaagctg tccaagatgc ccgaggaggt 6360 gcgcgccgag atcggcccct acttcatgga gcacgccgcc atcgtggacg aggactcccg 6420 caagctgccc aagctggacg acgacaccgc cgactacatc aagtggggcc tgaccccccg 6480 ctggtccgac ctggacgtga accagcacgt gaacaacgtg aagtacatcg gctggatcct 6540 ggagtccgcc cccatctcca tcctggagaa ccacgagctg gcctccatga ccctggagta 6600 ccgccgcgag tgcggccgcg actccgtgct gcagtccctg accgccgtgg ccaacgactg 6660 caccggcggc ctgcccgagg cctccatcga gtgccagcac ctgctgcagc tggagtgcgg 6720 cgccgagatc gtgcgcggcc gcacccagtg gcgcccccgc cgcgcctccg gccccacctc 6780 cgccggctcc gccatggact acaaggacca cgacggcgac tacaaggacc acgacatcga 6840 ctacaaggac gacgacgaca agtgaatcga tagatctctt aaggcagcag cagctcggat 6900 agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac acttgctgcc 6960 ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt gatcttgtgt 7020 gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac ccccagcatc 7080 cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta 7140 tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg tttgggctcc 7200 gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga tgcacgggaa 7260 gtagtgggat gggaacacaa atggaaagct taattaagag ctcttgtttt ccagaaggag 7320 ttgctccttg agcctttcat tctcagcctc gataacctcc aaagccgctc taattgtgga 7380 gggggttcga atttaaaagc ttggaatgtt ggttcgtgcg tctggaacaa gcccagactt 7440 gttgctcact gggaaaagga ccatcagctc caaaaaactt gccgctcaaa ccgcgtacct 7500 ctgctttcgc gcaatctgcc ctgttgaaat cgccaccaca ttcatattgt gacgcttgag 7560 cagtctgtaa ttgcctcaga atgtggaatc atctgccccc tgtgcgagcc catgccaggc 7620 atgtcgcggg cgaggacacc cgccactcgt acagcagacc attatgctac ctcacaatag 7680 ttcataacag tgaccatatt tctcgaagct ccccaacgag cacctccatg ctctgagtgg 7740 ccaccccccg gccctggtgc ttgcggaggg caggtcaacc ggcatggggc taccgaaatc 7800 cccgaccgga tcccaccacc cccgcgatgg gaagaatctc tccccgggat gtgggcccac 7860 caccagcaca acctgctggc ccaggcgagc gtcaaaccat accacacaaa tatccttggc 7920 atcggccctg aattccttct gccgctctgc tacccggtgc ttctgtccga agcaggggtt 7980 gctagggatc gctccgagtc cgcaaaccct tgtcgcgtgg cggggcttgt tcgagcttga 8040 agagcctcta gagtcgacct gcaggcatgc aagcttggcg taatcatggt catagctgtt 8100 tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 8160 gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 8220 gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 8280 ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 8340 ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 8400 cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 8460 gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 8520 tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 8580 ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 8640 atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 8700 gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 8760 tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 8820 cgacttatcg c 8831 <210> 238 <211> 9380 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 238 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940 tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000 cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060 accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120 acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180 tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240 tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300 acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360 acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420 tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480 agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540 acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600 acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660 tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720 tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780 tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840 ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900 ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960 cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020 cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080 tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140 cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200 aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260 acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320 accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380 agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440 tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500 acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920 agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980 tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040 tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100 ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160 cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220 tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280 gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340 tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400 tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460 tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520 tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580 tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640 gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700 catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760 tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820 ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880 tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940 tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000 ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060 actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120 ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180 cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag ccactagtat 6240 ggccaccgca tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc 6300 gggctccggg ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg cctcccagct 6360 gcgcaagccc gccctggacc ccctgcgcgc cgtgatctcc gccgaccagg gctccatctc 6420 ccccgtgaac tcctgcaccc ccgccgaccg cctgcgcgcc ggccgcctga tggaggacgg 6480 ctactcctac aaggagaagt tcatcgtgcg ctcctacgag gtgggcatca acaagaccgc 6540 caccgtggag accatcgcca acctgctgca ggaggtggcc tgcaaccacg tgcagaagtg 6600 cggcttctcc accgacggct tcgccaccac cctgaccatg cgcaagctgc acctgatctg 6660 ggtgaccgcc cgcatgcaca tcgagatcta caagtacccc gcctggtccg acgtggtgga 6720 gatcgagacc tggtgccagt ccgagggccg catcggcacc cgccgcgact ggatcctgcg 6780 cgactccgcc accaacgagg tgatcggccg cgccacctcc aagtgggtga tgatgaacca 6840 ggacacccgc cgcctgcagc gcgtgaccga cgaggtgcgc gacgagtacc tggtgttctg 6900 cccccgcgag ccccgcctgg ccttccccga ggagaacaac tcctccctga agaagatccc 6960 caagctggag gaccccgccc agtactccat gctggagctg aagccccgcc gcgccgacct 7020 ggacatgaac cagcacgtga acaacgtgac ctacatcggc tgggtgctgg agtccatccc 7080 ccaggagatc atcgacaccc acgagctgca ggtgatcacc ctggactacc gccgcgagtg 7140 ccagcaggac gacatcgtgg actccctgac cacctccgag atccccgacg accccatctc 7200 caagttcacc ggcaccaacg gctccgccat gtcctccatc cagggccaca acgagtccca 7260 gttcctgcac atgctgcgcc tgtccgagaa cggccaggag atcaaccgcg gccgcaccca 7320 gtggcgcaag aagtcctccc gcatggacta caaggaccac gacggcgact acaaggacca 7380 cgacatcgac tacaaggacg acgacgacaa gtgaatcgat agatctctta aggcagcagc 7440 agctcggata gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca 7500 cttgctgcct tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg 7560 atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc 7620 cccagcatcc ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct 7680 gtcctgctat ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt 7740 ttgggctccg cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat 7800 gcacgggaag tagtgggatg ggaacacaaa tggaaagctt aattaagagc tcttgttttc 7860 cagaaggagt tgctccttga gcctttcatt ctcagcctcg ataacctcca aagccgctct 7920 aattgtggag ggggttcgaa tttaaaagct tggaatgttg gttcgtgcgt ctggaacaag 7980 cccagacttg ttgctcactg ggaaaaggac catcagctcc aaaaaacttg ccgctcaaac 8040 cgcgtacctc tgctttcgcg caatctgccc tgttgaaatc gccaccacat tcatattgtg 8100 acgcttgagc agtctgtaat tgcctcagaa tgtggaatca tctgccccct gtgcgagccc 8160 atgccaggca tgtcgcgggc gaggacaccc gccactcgta cagcagacca ttatgctacc 8220 tcacaatagt tcataacagt gaccatattt ctcgaagctc cccaacgagc acctccatgc 8280 tctgagtggc caccccccgg ccctggtgct tgcggagggc aggtcaaccg gcatggggct 8340 accgaaatcc ccgaccggat cccaccaccc ccgcgatggg aagaatctct ccccgggatg 8400 tgggcccacc accagcacaa cctgctggcc caggcgagcg tcaaaccata ccacacaaat 8460 atccttggca tcggccctga attccttctg ccgctctgct acccggtgct tctgtccgaa 8520 gcaggggttg ctagggatcg ctccgagtcc gcaaaccctt gtcgcgtggc ggggcttgtt 8580 cgagcttgaa gagcctctag agtcgacctg caggcatgca agcttggcgt aatcatggtc 8640 atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 8700 aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 8760 gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 8820 ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 8880 ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 8940 acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 9000 aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 9060 tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 9120 aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 9180 gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 9240 acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 9300 accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 9360 ggtaagacac gacttatcgc 9380 <210> 239 <211> 9359 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 239 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940 tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000 cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060 accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120 acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180 tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240 tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300 acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360 acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420 tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480 agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540 acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600 acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660 tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720 tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780 tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840 ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900 ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960 cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020 cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080 tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140 cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200 aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260 acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320 accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380 agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440 tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500 acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920 agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980 tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040 tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100 ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160 cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220 tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280 gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340 tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400 tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460 tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520 tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580 tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640 gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700 catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760 tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820 ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880 tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940 tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000 ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060 actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120 ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180 cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag ccactagtat 6240 ggccaccgca tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc 6300 gggctccggg ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg ccgccaccgg 6360 cgagcagccc tccggcgtgg cctccctgcg cgaggccgac aaggagaagt ccctgggcaa 6420 ccgcctgcgc ctgggctccc tgaccgagga cggcctgtcc tacaaggaga agttcgtgat 6480 ccgctgctac gaggtgggca tcaacaagac cgccaccatc gagaccatcg ccaacctgct 6540 gcaggaggtg ggcggcaacc acgcccaggg cgtgggcttc tccaccgacg gcttcgccac 6600 caccaccacc atgcgcaagc tgcacctgat ctgggtgacc gcccgcatgc acatcgagat 6660 ctaccgctac cccgcctggt ccgacgtgat cgagatcgag acctgggtgc agggcgaggg 6720 caaggtgggc acccgccgcg actggatcct gaaggactac gccaacggcg aggtgatcgg 6780 ccgcgccacc tccaagtggg tgatgatgaa cgaggacacc cgccgcctgc agaaggtgtc 6840 cgacgacgtg cgcgaggagt acctggtgtt ctgcccccgc accctgcgcc tggccttccc 6900 cgaggagaac aacaactcca tgaagaagat ccccaagctg gaggaccccg ccgagtactc 6960 ccgcctgggc ctggtgcccc gccgctccga cctggacatg aacaagcacg tgaacaacgt 7020 gacctacatc ggctgggccc tggagtccat cccccccgag atcatcgaca cccacgagct 7080 gcaggccatc accctggact accgccgcga gtgccagcgc gacgacatcg tggactccct 7140 gacctcccgc gagcccctgg gcaacgccgc cggcgtgaag ttcaaggaga tcaacggctc 7200 cgtgtccccc aagaaggacg agcaggacct gtcccgcttc atgcacctgc tgcgctccgc 7260 cggctccggc ctggagatca accgctgccg caccgagtgg cgcaagaagc ccgccaagcg 7320 catggactac aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga 7380 cgacgacaag tgaatcgata gatctcttaa ggcagcagca gctcggatag tatcgacaca 7440 ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa 7500 tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt 7560 gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt 7620 ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct 7680 gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc 7740 ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg 7800 gaacacaaat ggaaagctta attaagagct cttgttttcc agaaggagtt gctccttgag 7860 cctttcattc tcagcctcga taacctccaa agccgctcta attgtggagg gggttcgaat 7920 ttaaaagctt ggaatgttgg ttcgtgcgtc tggaacaagc ccagacttgt tgctcactgg 7980 gaaaaggacc atcagctcca aaaaacttgc cgctcaaacc gcgtacctct gctttcgcgc 8040 aatctgccct gttgaaatcg ccaccacatt catattgtga cgcttgagca gtctgtaatt 8100 gcctcagaat gtggaatcat ctgccccctg tgcgagccca tgccaggcat gtcgcgggcg 8160 aggacacccg ccactcgtac agcagaccat tatgctacct cacaatagtt cataacagtg 8220 accatatttc tcgaagctcc ccaacgagca cctccatgct ctgagtggcc accccccggc 8280 cctggtgctt gcggagggca ggtcaaccgg catggggcta ccgaaatccc cgaccggatc 8340 ccaccacccc cgcgatggga agaatctctc cccgggatgt gggcccacca ccagcacaac 8400 ctgctggccc aggcgagcgt caaaccatac cacacaaata tccttggcat cggccctgaa 8460 ttccttctgc cgctctgcta cccggtgctt ctgtccgaag caggggttgc tagggatcgc 8520 tccgagtccg caaacccttg tcgcgtggcg gggcttgttc gagcttgaag agcctctaga 8580 gtcgacctgc aggcatgcaa gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 8640 ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 8700 gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 8760 gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 8820 tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 8880 gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 8940 ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 9000 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 9060 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 9120 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 9180 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 9240 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 9300 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgc 9359 <210> 240 <211> 9461 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 240 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920 ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980 catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040 caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100 gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160 ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220 acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280 cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340 gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400 agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460 accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520 tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580 gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640 aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700 accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760 gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820 aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880 aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940 tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000 cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060 accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120 acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180 tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240 tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300 acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360 acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420 tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480 agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540 acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600 acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660 tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720 tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780 tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840 ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900 ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960 cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020 cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080 tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140 cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200 aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260 acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320 accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380 agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440 tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500 acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560 tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620 gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680 acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740 cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800 cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860 ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920 agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980 tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040 tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100 ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160 cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220 tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280 gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340 tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400 tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460 tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520 tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580 tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640 gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700 catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760 tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820 ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880 tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940 tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000 ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060 actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120 ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180 cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag ccactagtat 6240 ggccaccgca tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc 6300 gggctccggg ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg ccgccaacgc 6360 ccaggccccc accaagatca acggctccac cgacgacgcc cagctgcccg ccccccgcac 6420 cttcatcaac cagctgcccg actggtccat gctgctggcc gccatcacca ccgtgttcct 6480 ggccgccgag aagcagtgga tgatgctgga ctggaagccc cgccgccccg acatgctgat 6540 cgacaccttc ggcctgggcc gcatcgtgca ggacggcctg gtgttccgcc agaacttctc 6600 catccgctcc tacgagatcg gcgccgaccg caccgcctcc atcgagaccg tgatgaacca 6660 cctgcaggag accgccctga accacgtgaa gaccgccggc ctgctgggcg acggcttcgg 6720 ctccaccccc gagatgtcca agcgcaacct gatctgggtg gtgaccaaga tgcaggtgga 6780 ggtggaccgc taccccacct ggggcgacgt ggtgcaggtg gacacctggg tgtccgcctc 6840 cggcaagaac ggcatgcgcc gcgactggct gctgcgcgac ggcaacaccg gcgagaccct 6900 gacccgcgcc tcctccgtgt gggtgatgat gaacaagctg acccgccgcc tgtccaagat 6960 ccccgaggag gtgcgcgagg agatcggctc ctacttcgtg aactccgacc ccgtggtgga 7020 ggaggacggc cgcaaggtga ccaagctgga cgacaacacc gccgacttcg tgcgcaaggg 7080 cctgaccccc aagtggaacg acctggacat caaccagcac gtgaacaacg tgaagtacat 7140 cggctggatc ctggagtccg ccccccagcc catcctggag acccgcgagc tgtccgccgt 7200 gaccctggag taccgccgcg agtgcggccg cgactccgtg ctgcgctccc tgaccgccgt 7260 gtccggcggc ggcgtgggcg acctgggcca cgccggcaac gtggagtgcc agcacgtgct 7320 gcgcctggag gacggcgccg agatcgtgcg cggccgcacc gagtggcgcc ccaagtacat 7380 caacaacttc tccatcatgg gccagatccc caccgacgcc tccatggact acaaggacca 7440 cgacggcgac tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgaatcga 7500 tagatctctt aaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 7560 tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 7620 caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt 7680 gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc gcttgcatcc 7740 caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac 7800 tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact gcaacctgta 7860 aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa atggaaagct 7920 taattaagag ctcttgtttt ccagaaggag ttgctccttg agcctttcat tctcagcctc 7980 gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc ttggaatgtt 8040 ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga ccatcagctc 8100 caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc ctgttgaaat 8160 cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga atgtggaatc 8220 atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc cgccactcgt 8280 acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt tctcgaagct 8340 ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc ttgcggaggg 8400 caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc cccgcgatgg 8460 gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc ccaggcgagc 8520 gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct gccgctctgc 8580 tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc cgcaaaccct 8640 tgtcgcgtgg cggggcttgt tcgagcttga agagcctcta gagtcgacct gcaggcatgc 8700 aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 8760 tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 8820 ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 8880 ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 8940 ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 9000 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 9060 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 9120 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 9180 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 9240 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 9300 cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 9360 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 9420 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg c 9461 <210> 241 <211> 8872 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 241 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920 cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980 caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040 gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100 gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160 acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220 cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280 gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340 ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400 cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460 gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520 cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580 tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640 tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700 ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760 ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820 cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880 agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940 ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000 cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060 ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120 acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180 ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240 tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300 agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360 acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420 aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480 gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540 acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600 acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660 ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720 tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780 tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840 aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900 tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960 ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020 cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080 tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140 acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200 tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260 cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320 aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740 cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800 acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860 ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920 gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980 gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040 attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100 tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160 gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220 tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280 gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340 acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400 tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460 aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520 atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580 aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640 gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700 gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760 ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820 attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880 gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940 ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000 caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt tcaatgcccg 6060 ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga ggcccctccc 6120 cgtgcgcggg cgcgcccccg actggtccat gctgttcgcc gtgatcacca ccatcttcag 6180 cgccgccgag aagcagtgga ccaacctgga gtggaagccc aagcccaagc tgccccagct 6240 gctggacgac cacttcggcc tgcacggcct ggtgttccgc cgcaccttcg ccatccgctc 6300 ctacgaggtg ggccccgacc gcagcacctc catcctggcc gtgatgaacc acatgcagga 6360 ggccaccctg aaccacgcca agagcgtggg catcctgggc gacggcttcg gcaccaccct 6420 ggagatgtcc aagcgcgacc tgatgtgggt ggtgcgccgc acccacgtgg ccgtggagcg 6480 ctaccccacc tggggcgaca ccgtggaggt ggagtgctgg atcggcgcca gcggcaacaa 6540 cggcatgcgc cgcgacttcc tggtgcgcga ctgcaagacc ggcgagatcc tgacccgctg 6600 cacctccctg agcgtgctga tgaacacccg cacccgccgc ctgagcacca tccccgacga 6660 ggtgcgcggc gagatcggcc ccgccttcat cgacaacgtg gccgtgaagg acgacgagat 6720 caagaagctg cagaagctga acgactccac cgccgactac atccagggcg gcctgacccc 6780 ccgctggaac gacctggacg tgaaccagca cgtgaacaac ctgaagtacg tggcctgggt 6840 gttcgagacc gtgcccgaca gcatcttcga gtcccaccac atcagctcct tcaccctgga 6900 gtaccgccgc gagtgcaccc gcgactccgt gctgcgcagc ctgaccaccg tgagcggcgg 6960 cagctccgag gccggcctgg tgtgcgacca cctgctgcag ctggagggcg gcagcgaggt 7020 gctgcgcgcc cgcaccgagt ggcgccccaa gctgaccgac tccttccgcg gcatcagcgt 7080 gatccccgcc gagccccgcg tgatggacta caaggaccac gacggcgact acaaggacca 7140 cgacatcgac tacaaggacg acgacgacaa gtgactcgag gcagcagcag ctcggatagt 7200 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 7260 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 7320 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 7380 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 7440 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 7500 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 7560 gtgggatggg aacacaaatg gaaagcttga gctccagcca cggcaacacc gcgcgccttg 7620 cggccgagca cggcgacaag aacctgagca agatctgcgg gctgatcgcc agcgacgagg 7680 gccggcacga gatcgcctac acgcgcatcg tggacgagtt cttccgcctc gaccccgagg 7740 gcgccgtcgc cgcctacgcc aacatgatgc gcaagcagat caccatgccc gcgcacctca 7800 tggacgacat gggccacggc gaggccaacc cgggccgcaa cctcttcgcc gacttctccg 7860 cggtcgccga gaagatcgac gtctacgacg ccgaggacta ctgccgcatc ctggagcacc 7920 tcaacgcgcg ctggaaggtg gacgagcgcc aggtcagcgg ccaggccgcc gcggaccagg 7980 agtacgtcct gggcctgccc cagcgcttcc ggaaactcgc cgagaagacc gccgccaagc 8040 gcaagcgcgt cgcgcgcagg cccgtcgcct tctcctggag aagagcctct agagtcgacc 8100 tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 8160 ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 8220 taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 8280 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 8340 attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 8400 cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 8460 gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 8520 ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 8580 agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 8640 tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 8700 ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 8760 gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 8820 ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gc 8872 <210> 242 <211> 8830 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 242 cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60 agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360 attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420 accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480 ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540 gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600 agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660 ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720 ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780 gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840 ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900 tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960 tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020 cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080 tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140 gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200 tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260 ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320 attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380 cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440 taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500 gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560 ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620 ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680 cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740 actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800 gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860 aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920 cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980 caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040 gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100 gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160 acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220 cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280 gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340 ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400 cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460 gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520 cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580 tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640 tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700 ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760 ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820 cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880 agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940 ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000 cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060 ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120 acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180 ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240 tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300 agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360 acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420 aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480 gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540 acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600 acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660 ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720 tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780 tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840 aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900 tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960 ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020 cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080 tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140 acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200 tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260 cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320 aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380 tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440 ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500 tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560 acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620 gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680 ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740 cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800 acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860 ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920 gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980 gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040 attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100 tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160 gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220 tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280 gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340 acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400 tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460 aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520 atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580 aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640 gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700 gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760 ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820 attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880 gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940 ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000 caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt tcaatgcccg 6060 ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga ggcccctccc 6120 cgtgcgcggg cgcgcccagc tgcccgactg gagcatgctg ctggccgcga tcaccaccct 6180 gttcctggcg gccgagaagc agtggatgat gctggactgg aagcccaagc gccccgacat 6240 gctggtggac cccttcggcc tgggccgctt cgtgcaggac ggcctggtgt tccgcaacaa 6300 cttcagcatc cgcagctacg agatcggcgc ggaccgcacc gccagcatcg agaccctgat 6360 gaaccacctg caggagaccg ccctgaacca cgtgaagagt gtgggcctgc tggaggacgg 6420 cctgggcagc acccgcgaga tgagcctgcg caacctgatc tgggtggtga ccaagatgca 6480 ggtggcggtg gaccgctacc ccacctgggg cgacgaggtg caggtgagca gctgggcgac 6540 cgccatcggc aagaacggca tgcgccgcga gtggatcgtg accgacttcc gcaccggcga 6600 gaccctgctg cgcgccacca gcgtgtgggt gatgatgaac aagctgaccc gccgcatcag 6660 caagatcccc gaggaggtgt ggcacgagat cggccccagc ttcatcgacg cgccccccct 6720 gcccaccgtg gaggacgacg gccgcaagct gacccgcttc gacgagagca gcgccgactt 6780 catccgcaag ggcctgaccc cccgctggag cgacctggac atcaaccagc acgtgaacaa 6840 cgtgaagtac atcggctggc tgctggagag cgcgcccccc gagatccacg agagccacga 6900 gatcgccagc ctgaccctgg agtaccgccg cgagtgcggc cgcgacagcg tgctgaacag 6960 cgccaccaag gtgagcgaca gcagccagct gggcaagagc gccgtggagt gcaaccacct 7020 ggtgcgcctg cagaacggcg gcgagatcgt gaagggccgc accgtgtggc gccccaagcg 7080 ccccctgtac aacgacggcg ccgtggtgga cgtgcccgcc aagaccagct gactcgaggc 7140 agcagcagct cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc 7200 gccacacttg ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg 7260 tgtttgatct tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat 7320 accaccccca gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc 7380 tacgctgtcc tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc 7440 cttggtttgg gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat 7500 gctgatgcac gggaagtagt gggatgggaa cacaaatgga aagcttgagc tccagccacg 7560 gcaacaccgc gcgccttgcg gccgagcacg gcgacaagaa cctgagcaag atctgcgggc 7620 tgatcgccag cgacgagggc cggcacgaga tcgcctacac gcgcatcgtg gacgagttct 7680 tccgcctcga ccccgagggc gccgtcgccg cctacgccaa catgatgcgc aagcagatca 7740 ccatgcccgc gcacctcatg gacgacatgg gccacggcga ggccaacccg ggccgcaacc 7800 tcttcgccga cttctccgcg gtcgccgaga agatcgacgt ctacgacgcc gaggactact 7860 gccgcatcct ggagcacctc aacgcgcgct ggaaggtgga cgagcgccag gtcagcggcc 7920 aggccgccgc ggaccaggag tacgtcctgg gcctgcccca gcgcttccgg aaactcgccg 7980 agaagaccgc cgccaagcgc aagcgcgtcg cgcgcaggcc cgtcgccttc tcctggagaa 8040 gagcctctag agtcgacctg caggcatgca agcttggcgt aatcatggtc atagctgttt 8100 cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 8160 tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 8220 cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 8280 gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 8340 tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 8400 acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 8460 aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 8520 cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 8580 gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 8640 tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 8700 tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 8760 cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 8820 gacttatcgc 8830 <210> 243 <211> 4674 <212> DNA <213> Cuphea hookeriana <400> 243 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240 gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300 ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360 ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420 aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480 ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540 atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600 cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660 atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720 aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780 gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840 ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900 atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960 ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020 atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080 ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140 gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200 gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260 gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320 ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380 tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440 ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500 tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560 gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620 atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagcttga gctc 4674 <210> 244 <211> 1170 <212> DNA <213> Cuphea hookeriana <400> 244 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccagctg 120 cccgactgga gccgcctgct gaccgccatc accaccgtgt tcgtgaagtc caagcgcccc 180 gacatgcacg accgcaagtc caagcgcccc gacatgctgg tggacagctt cggcctggag 240 tccaccgtgc aggacggcct ggtgttccgc cagtccttct ccatccgctc ctacgagatc 300 ggcaccgacc gcaccgccag catcgagacc ctgatgaacc acctgcagga gacctccctg 360 aaccactgca agagcaccgg catcctgctg gacggcttcg gccgcaccct ggagatgtgc 420 aagcgcgacc tgatctgggt ggtgatcaag atgcagatca aggtgaaccg ctaccccgcc 480 tggggcgaca ccgtggagat caacacccgc ttcagccgcc tgggcaagat cggcatgggc 540 cgcgactggc tgatctccga ctgcaacacc ggcgagatcc tggtgcgcgc caccagcgcc 600 tacgccatga tgaaccagaa gacccgccgc ctgtccaagc tgccctacga ggtgcaccag 660 gagatcgtgc ccctgttcgt ggacagcccc gtgatcgagg actccgacct gaaggtgcac 720 aagttcaagg tgaagaccgg cgacagcatc cagaagggcc tgacccccgg ctggaacgac 780 ctggacgtga accagcacgt gtccaacgtg aagtacatcg gctggatcct ggagagcatg 840 cccaccgagg tgctggagac ccaggagctg tgctccctgg ccctggagta ccgccgcgag 900 tgcggccgcg actccgtgct ggagagcgtg accgccatgg accccagcaa ggtgggcgtg 960 cgctcccagt accagcacct gctgcgcctg gaggacggca ccgccatcgt gaacggcgcc 1020 accgagtggc gccccaagaa cgccggcgcc aacggcgcca tctccaccgg caagaccagc 1080 aacggcaact ccgtgtccat ggactacaag gaccacgacg gcgactacaa ggaccacgac 1140 atcgactaca aggacgacga cgacaagtga 1170 <210> 245 <211> 5123 <212> DNA <213> Cuphea hookeriana <400> 245 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agatctagaa tatcaatgat cgagcaggac ggcctccacg ccggctcccc 1380 cgccgcctgg gtggagcgcc tgttcggcta cgactgggcc cagcagacca tcggctgctc 1440 cgacgccgcc gtgttccgcc tgtccgccca gggccgcccc gtgctgttcg tgaagaccga 1500 cctgtccggc gccctgaacg agctgcagga cgaggccgcc cgcctgtcct ggctggccac 1560 caccggcgtg ccctgcgccg ccgtgctgga cgtggtgacc gaggccggcc gcgactggct 1620 gctgctgggc gaggtgcccg gccaggacct gctgtcctcc cacctggccc ccgccgagaa 1680 ggtgtccatc atggccgacg ccatgcgccg cctgcacacc ctggaccccg ccacctgccc 1740 cttcgaccac caggccaagc accgcatcga gcgcgcccgc acccgcatgg aggccggcct 1800 ggtggaccag gacgacctgg acgaggagca ccagggcctg gcccccgccg agctgttcgc 1860 ccgcctgaag gcccgcatgc ccgacggcga ggacctggtg gtgacccacg gcgacgcctg 1920 cctgcccaac atcatggtgg agaacggccg cttctccggc ttcatcgact gcggccgcct 1980 gggcgtggcc gaccgctacc aggacatcgc cctggccacc cgcgacatcg ccgaggagct 2040 gggcggcgag tgggccgacc gcttcctggt gctgtacggc atcgccgccc ccgactccca 2100 gcgcatcgcc ttctaccgcc tgctggacga gttcttctga caattggcag cagcagctcg 2160 gatagtatcg acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct 2220 gccttgacct gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg 2280 tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc 2340 atccccttcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 2400 ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 2460 tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 2520 gaagtagtgg gatgggaaca caaatggagg atcccgcgtc tcgaacagag cgcgcagagg 2580 aacgctgaag gtctcgcctc tgtcgcacct cagcgcggca tacaccacaa taaccacctg 2640 acgaatgcgc ttggttcttc gtccattagc gaagcgtccg gttcacacac gtgccacgtt 2700 ggcgaggtgg caggtgacaa tgatcggtgg agctgatggt cgaaacgttc acagcctagg 2760 gatatcgaat tcctttcttg cgctatgaca cttccagcaa aaggtagggc gggctgcgag 2820 acggcttccc ggcgctgcat gcaacaccga tgatgcttcg accccccgaa gctccttcgg 2880 ggctgcatgg gcgctccgat gccgctccag ggcgagcgct gtttaaatag ccaggccccc 2940 gattgcaaag acattatagc gagctaccaa agccatattc aaacacctag atcactacca 3000 cttctacaca ggccactcga gcttgtgatc gcactccgct aagggggcgc ctcttcctct 3060 tcgtttcagt cacaacccgc aaacactagt ggcgcgccat ggcgaccgcc agctgcatgg 3120 tggcgtcgcc cttctgcacc tggctggtcg ccgcgtgcat gcccacctcc agcgacaacg 3180 acccccgctc gctgtcccac aagcgcctgc gcctgagccg ccgccgccgc accctgagct 3240 cgcactgctc cctgcgcggc agcaccttcc agtgcctgga cccctgcaac cagcagcgct 3300 tcctgggcga caacggcttc gcgtcgctgt tcggctccaa gcccctgcgc agcaaccgcg 3360 gccacctgcg cctgggccgc acctcgcact ccggcgaggt gatggccgtc gcgatgcagc 3420 ccgcccagga ggtgagcacc aacaagaagc ccgcgaccaa gcagcgccgc gtggtcgtga 3480 ccggcatggg cgtcgtgacc cccctgggcc acgaccccga cgtgtattat aacaacctgc 3540 tggacggcat ctcgggcatc tccgagatcg agaacttcga ctgcagccag ttccccaccc 3600 gcatcgccgg cgagatcaag tcgttctcca ccgacggctg ggtcgcgccc aagttcagcg 3660 agcgcatgga caagttcatg ctgtatatgc tgaccgccgg caagaaggcg ctggccgacg 3720 gcggcatcac cgaggacgcg atgaaggagc tgaacaagcg caagtgcggc gtgctgatcg 3780 gctcgggcct gggcggcatg aaggtcttct ccgacagcat cgaggccctg cgcacctcgt 3840 ataagaagat ctcccccttc tgcgtgccct tcagcaccac caacatgggc tcggcgatcc 3900 tggcgatgga cctgggctgg atgggcccca actattccat cagcaccgcg tgcgccacct 3960 cgaacttctg catcctgaac gcggccaacc acatcatcaa gggcgaggcg gacatgatgc 4020 tgtgcggcgg ctccgacgcc gcggtgctgc ccgtcggcct gggcggcttc gtggcctgcc 4080 gcgcgctgag ccagcgcaac aacgacccca ccaaggcctc gcgcccctgg gactccaacc 4140 gcgacggctt cgtcatgggc gagggcgcgg gcgtgctgct gctggaggag ctggagcacg 4200 ccaagaagcg cggcgcgacc atctatgccg agttcctggg cggcagcttc acctgcgacg 4260 cgtatcacat gaccgagccc caccccgagg gcgccggcgt catcctgtgc atcgagaagg 4320 cgctggccca gtcgggcgtg tcccgcgagg acgtgaacta tatcaacgcg cacgccacca 4380 gcacccccgc gggcgacatc aaggagtatc aggccctggc gcactgcttc ggccagaact 4440 cggagctgcg cgtcaactcc accaagagca tgatcggcca cctgctgggc ggcgccggcg 4500 gcgtggaggc ggtcgccgtg gtccaggcga tccgcaccgg ctggatccac cccaacatca 4560 acctggagga ccccgacgag ggcgtggacg ccaagctgct ggtcggcccc aagaaggaga 4620 agctgaaggt gaaggtcggc ctgtcgaact ccttcggctt cggcggccac aacagctcga 4680 tcctgttcgc gccctgcaac tgactcgagg cagcagcagc tcggatagta tcgacacact 4740 ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 4800 tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 4860 gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 4920 catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 4980 tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 5040 ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 5100 acacaaatgg aaagcttgag ctc 5123 <210> 246 <211> 1605 <212> DNA <213> Cuphea hookeriana <400> 246 atggcgaccg ccagctgcat ggtggcgtcg cccttctgca cctggctggt cgccgcgtgc 60 atgcccacct ccagcgacaa cgacccccgc tcgctgtccc acaagcgcct gcgcctgagc 120 cgccgccgcc gcaccctgag ctcgcactgc tccctgcgcg gcagcacctt ccagtgcctg 180 gacccctgca accagcagcg cttcctgggc gacaacggct tcgcgtcgct gttcggctcc 240 aagcccctgc gcagcaaccg cggccacctg cgcctgggcc gcacctcgca ctccggcgag 300 gtgatggccg tcgcgatgca gcccgcccag gaggtgagca ccaacaagaa gcccgcgacc 360 aagcagcgcc gcgtggtcgt gaccggcatg ggcgtcgtga cccccctggg ccacgacccc 420 gacgtgtatt ataacaacct gctggacggc atctcgggca tctccgagat cgagaacttc 480 gactgcagcc agttccccac ccgcatcgcc ggcgagatca agtcgttctc caccgacggc 540 tgggtcgcgc ccaagttcag cgagcgcatg gacaagttca tgctgtatat gctgaccgcc 600 ggcaagaagg cgctggccga cggcggcatc accgaggacg cgatgaagga gctgaacaag 660 cgcaagtgcg gcgtgctgat cggctcgggc ctgggcggca tgaaggtctt ctccgacagc 720 atcgaggccc tgcgcacctc gtataagaag atctccccct tctgcgtgcc cttcagcacc 780 accaacatgg gctcggcgat cctggcgatg gacctgggct ggatgggccc caactattcc 840 atcagcaccg cgtgcgccac ctcgaacttc tgcatcctga acgcggccaa ccacatcatc 900 aagggcgagg cggacatgat gctgtgcggc ggctccgacg ccgcggtgct gcccgtcggc 960 ctgggcggct tcgtggcctg ccgcgcgctg agccagcgca acaacgaccc caccaaggcc 1020 tcgcgcccct gggactccaa ccgcgacggc ttcgtcatgg gcgagggcgc gggcgtgctg 1080 ctgctggagg agctggagca cgccaagaag cgcggcgcga ccatctatgc cgagttcctg 1140 ggcggcagct tcacctgcga cgcgtatcac atgaccgagc cccaccccga gggcgccggc 1200 gtcatcctgt gcatcgagaa ggcgctggcc cagtcgggcg tgtcccgcga ggacgtgaac 1260 tatatcaacg cgcacgccac cagcaccccc gcgggcgaca tcaaggagta tcaggccctg 1320 gcgcactgct tcggccagaa ctcggagctg cgcgtcaact ccaccaagag catgatcggc 1380 cacctgctgg gcggcgccgg cggcgtggag gcggtcgccg tggtccaggc gatccgcacc 1440 ggctggatcc accccaacat caacctggag gaccccgacg agggcgtgga cgccaagctg 1500 ctggtcggcc ccaagaagga gaagctgaag gtgaaggtcg gcctgtcgaa ctccttcggc 1560 ttcggcggcc acaacagctc gatcctgttc gcgccctgca actga 1605 <210> 247 <211> 534 <212> PRT <213> Cuphea hookeriana <400> 247 Met Ala Thr Ala Ser Cys Met Val Ala Ser Pro Phe Cys Thr Trp Leu 1 5 10 15 Val Ala Ala Cys Met Pro Thr Ser Ser Asp Asn Asp Pro Arg Ser Leu 20 25 30 Ser His Lys Arg Leu Arg Leu Ser Arg Arg Arg Arg Thr Leu Ser Ser 35 40 45 His Cys Ser Leu Arg Gly Ser Thr Phe Gln Cys Leu Asp Pro Cys Asn 50 55 60 Gln Gln Arg Phe Leu Gly Asp Asn Gly Phe Ala Ser Leu Phe Gly Ser 65 70 75 80 Lys Pro Leu Arg Ser Asn Arg Gly His Leu Arg Leu Gly Arg Thr Ser 85 90 95 His Ser Gly Glu Val Met Ala Val Ala Met Gln Pro Ala Gln Glu Val 100 105 110 Ser Thr Asn Lys Lys Pro Ala Thr Lys Gln Arg Arg Val Val Val Thr 115 120 125 Gly Met Gly Val Val Thr Pro Leu Gly His Asp Pro Asp Val Tyr Tyr 130 135 140 Asn Asn Leu Leu Asp Gly Ile Ser Gly Ile Ser Glu Ile Glu Asn Phe 145 150 155 160 Asp Cys Ser Gln Phe Pro Thr Arg Ile Ala Gly Glu Ile Lys Ser Phe 165 170 175 Ser Thr Asp Gly Trp Val Ala Pro Lys Phe Ser Glu Arg Met Asp Lys 180 185 190 Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys Ala Leu Ala Asp Gly 195 200 205 Gly Ile Thr Glu Asp Ala Met Lys Glu Leu Asn Lys Arg Lys Cys Gly 210 215 220 Val Leu Ile Gly Ser Gly Leu Gly Gly Met Lys Val Phe Ser Asp Ser 225 230 235 240 Ile Glu Ala Leu Arg Thr Ser Tyr Lys Lys Ile Ser Pro Phe Cys Val 245 250 255 Pro Phe Ser Thr Thr Asn Met Gly Ser Ala Ile Leu Ala Met Asp Leu 260 265 270 Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Ser 275 280 285 Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile Ile Lys Gly Glu Ala 290 295 300 Asp Met Met Leu Cys Gly Gly Ser Asp Ala Ala Val Leu Pro Val Gly 305 310 315 320 Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser Gln Arg Asn Asn Asp 325 330 335 Pro Thr Lys Ala Ser Arg Pro Trp Asp Ser Asn Arg Asp Gly Phe Val 340 345 350 Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu Glu Leu Glu His Ala 355 360 365 Lys Lys Arg Gly Ala Thr Ile Tyr Ala Glu Phe Leu Gly Gly Ser Phe 370 375 380 Thr Cys Asp Ala Tyr His Met Thr Glu Pro His Pro Glu Gly Ala Gly 385 390 395 400 Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln Ser Gly Val Ser Arg 405 410 415 Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr Ser Thr Pro Ala Gly 420 425 430 Asp Ile Lys Glu Tyr Gln Ala Leu Ala His Cys Phe Gly Gln Asn Ser 435 440 445 Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly 450 455 460 Gly Ala Gly Gly Val Glu Ala Val Ala Val Val Gln Ala Ile Arg Thr 465 470 475 480 Gly Trp Ile His Pro Asn Ile Asn Leu Glu Asp Pro Asp Glu Gly Val 485 490 495 Asp Ala Lys Leu Leu Val Gly Pro Lys Lys Glu Lys Leu Lys Val Lys 500 505 510 Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly His Asn Ser Ser Ile 515 520 525 Leu Phe Ala Pro Cys Asn 530 <210> 248 <211> 7843 <212> DNA <213> Cuphea hookeriana <400> 248 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agatctagaa tatcaatgat cgagcaggac ggcctccacg ccggctcccc 1380 cgccgcctgg gtggagcgcc tgttcggcta cgactgggcc cagcagacca tcggctgctc 1440 cgacgccgcc gtgttccgcc tgtccgccca gggccgcccc gtgctgttcg tgaagaccga 1500 cctgtccggc gccctgaacg agctgcagga cgaggccgcc cgcctgtcct ggctggccac 1560 caccggcgtg ccctgcgccg ccgtgctgga cgtggtgacc gaggccggcc gcgactggct 1620 gctgctgggc gaggtgcccg gccaggacct gctgtcctcc cacctggccc ccgccgagaa 1680 ggtgtccatc atggccgacg ccatgcgccg cctgcacacc ctggaccccg ccacctgccc 1740 cttcgaccac caggccaagc accgcatcga gcgcgcccgc acccgcatgg aggccggcct 1800 ggtggaccag gacgacctgg acgaggagca ccagggcctg gcccccgccg agctgttcgc 1860 ccgcctgaag gcccgcatgc ccgacggcga ggacctggtg gtgacccacg gcgacgcctg 1920 cctgcccaac atcatggtgg agaacggccg cttctccggc ttcatcgact gcggccgcct 1980 gggcgtggcc gaccgctacc aggacatcgc cctggccacc cgcgacatcg ccgaggagct 2040 gggcggcgag tgggccgacc gcttcctggt gctgtacggc atcgccgccc ccgactccca 2100 gcgcatcgcc ttctaccgcc tgctggacga gttcttctga caattggcag cagcagctcg 2160 gatagtatcg acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct 2220 gccttgacct gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg 2280 tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc 2340 atccccttcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 2400 ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 2460 tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 2520 gaagtagtgg gatgggaaca caaatggagg atcccgcgtc tcgaacagag cgcgcagagg 2580 aacgctgaag gtctcgcctc tgtcgcacct cagcgcggca tacaccacaa taaccacctg 2640 acgaatgcgc ttggttcttc gtccattagc gaagcgtccg gttcacacac gtgccacgtt 2700 ggcgaggtgg caggtgacaa tgatcggtgg agctgatggt cgaaacgttc acagcctagg 2760 gagtttaggt ccagcgtccg tgggggggga cgggctggga gcttgggccg ggaagggcaa 2820 gacgatgcag tccctctggg gagtcacagc cgactgtgtg tgttgcactg tgcggcccgc 2880 agcactcaca cgcaaaatgc ctggccgaca ggcaggccct gtccagtgca acatccacgg 2940 tccctctcat caggctcacc ttgctcattg acataacgga atgcgtaccg ctctttcaga 3000 tctgtccatc cagagagggg agcaggctcc ccaccgacgc tgtcaaactt gcttcctgcc 3060 caaccgaaaa cattattgtt tgaggggggg gggggggggg cagattgcat ggcgggatat 3120 ctcgtgagga acatcactgg gacactgtgg aacacagtga gtgcagtatg cagagcatgt 3180 atgctagggg tcagcgcagg aagggggcct ttcccagtct cccatgccac tgcaccgtat 3240 ccacgactca ccaggaccag cttcttgatc ggcttccgct cccgtggaca ccagtgtgta 3300 gcctctggac tccaggtatg cgtgcaccgc aaaggccagc cgatcgtgcc gattcctggg 3360 gtggaggata tgagtcagcc aacttggggc tcagagtgca cactggggca cgatacgaaa 3420 caacatctac accgtgtcct ccatgctgac acaccacagc ttcgctccac ctgaatgtgg 3480 gcgcatgggc ccgaatcaca gccaatgtcg ctgctgccat aatgtgatcc agaccctctc 3540 cgcccagatg ccgagcggat cgtgggcgct gaatagattc ctgtttcgat cactgtttgg 3600 gtcctttcct tttcgtctcg gatgcgcgtc tcgaaacagg ctgcgtcggg ctttcggatc 3660 ccttttgctc cctccgtcac catcctgcgc gcgggcaagt tgcttgaccc tgggctggta 3720 ccagggttgg agggtattac cgcgtcaggc cattcccagc ccggattcaa ttcaaagtct 3780 gggccaccac cctccgccgc tctgtctgat cactccacat tcgtgcatac actacgttca 3840 agtcctgatc caggcgtgtc tcgggacaag gtgtgcttga gtttgaatct caaggaccca 3900 ctccagcaca gctgctggtt gaccccgccc tcgcaacata tggcgaccgc cagctgcatg 3960 gtggcgtcgc ccttctgcac ctggctggtc gccgcgtgca tgcccacctc cagcgacaac 4020 gacccccgct cgctgtccca caagcgcctg cgcctgagcc gccgccgccg caccctgagc 4080 tcgcactgct ccctgcgcgg cagcaccttc cagtgcctgg acccctgcaa ccagcagcgc 4140 ttcctgggcg acaacggctt cgcgtcgctg ttcggctcca agcccctgcg cagcaaccgc 4200 ggccacctgc gcctgggccg cacctcgcac tccggcgagg tgatggccgt cgcgatgcag 4260 cccgcccagg aggtgagcac caacaagaag cccgcgacca agcagcgccg cgtggtcgtg 4320 accggcatgg gcgtcgtgac ccccctgggc cacgaccccg acgtgtatta taacaacctg 4380 ctggacggca tctcgggcat ctccgagatc gagaacttcg actgcagcca gttccccacc 4440 cgcatcgccg gcgagatcaa gtcgttctcc accgacggct gggtcgcgcc caagttcagc 4500 gagcgcatgg acaagttcat gctgtatatg ctgaccgccg gcaagaaggc gctggccgac 4560 ggcggcatca ccgaggacgc gatgaaggag ctgaacaagc gcaagtgcgg cgtgctgatc 4620 ggctcgggcc tgggcggcat gaaggtcttc tccgacagca tcgaggccct gcgcacctcg 4680 tataagaaga tctccccctt ctgcgtgccc ttcagcacca ccaacatggg ctcggcgatc 4740 ctggcgatgg acctgggctg gatgggcccc aactattcca tcagcaccgc gtgcgccacc 4800 tcgaacttct gcatcctgaa cgcggccaac cacatcatca agggcgaggc ggacatgatg 4860 ctgtgcggcg gctccgacgc cgcggtgctg cccgtcggcc tgggcggctt cgtggcctgc 4920 cgcgcgctga gccagcgcaa caacgacccc accaaggcct cgcgcccctg ggactccaac 4980 cgcgacggct tcgtcatggg cgagggcgcg ggcgtgctgc tgctggagga gctggagcac 5040 gccaagaagc gcggcgcgac catctatgcc gagttcctgg gcggcagctt cacctgcgac 5100 gcgtatcaca tgaccgagcc ccaccccgag ggcgccggcg tcatcctgtg catcgagaag 5160 gcgctggccc agtcgggcgt gtcccgcgag gacgtgaact atatcaacgc gcacgccacc 5220 agcacccccg cgggcgacat caaggagtat caggccctgg cgcactgctt cggccagaac 5280 tcggagctgc gcgtcaactc caccaagagc atgatcggcc acctgctggg cggcgccggc 5340 ggcgtggagg cggtcgccgt ggtccaggcg atccgcaccg gctggatcca ccccaacatc 5400 aacctggagg accccgacga gggcgtggac gccaagctgc tggtcggccc caagaaggag 5460 aagctgaagg tgaaggtcgg cctgtcgaac tccttcggct tcggcggcca caacagctcg 5520 atcctgttcg cgccctgcaa ctgatgcata cggagcgtcg tgcgggaggg agtgtgccga 5580 gcggggagtc ccggtctgtg cgaggcccgg cagctgacgc tggcgagccg tacgccccga 5640 gggtccccct cccctccccc ctcttcccct tccctctgac ggccgcgcct gtttttgcat 5700 gttcagcgac cttaaggcgc tcgaccgtgc cggacggact gcagccccat gtcgtagtga 5760 ccgccaatgt aagtgggctg gcgtttccct gtacgtgagc tcaacgtcac tgcacgcgca 5820 ccaccctctc gaccggcagg accaggcatc gcgagataca gcgcgagcca gacacggagt 5880 gccgagctat gcgcacgctc caactagata tcatgtggat gatgagcatg aattcctttc 5940 ttgcgctatg acacttccag caaaaggtag ggcgggctgc gagacggctt cccggcgctg 6000 catgcaacac cgatgatgct tcgacccccc gaagctcctt cggggctgca tgggcgctcc 6060 gatgccgctc cagggcgagc gctgtttaaa tagccaggcc cccgattgca aagacattat 6120 agcgagctac caaagccata ttcaaacacc tagatcacta ccacttctac acaggccact 6180 cgagcttgtg atcgcactcc gctaaggggg cgcctcttcc tcttcgtttc agtcacaacc 6240 cgcaaacact agtatggcta tcaagacgaa caggcagcct gtggagaagc ctccgttcac 6300 gatcgggacg ctgcgcaagg ccatccccgc gcactgtttc gagcgctcgg cgcttcgtgg 6360 gcgcgcccag ctgcccgact ggagccgcct gctgaccgcc atcaccaccg tgttcgtgaa 6420 gtccaagcgc cccgacatgc acgaccgcaa gtccaagcgc cccgacatgc tggtggacag 6480 cttcggcctg gagtccaccg tgcaggacgg cctggtgttc cgccagtcct tctccatccg 6540 ctcctacgag atcggcaccg accgcaccgc cagcatcgag accctgatga accacctgca 6600 ggagacctcc ctgaaccact gcaagagcac cggcatcctg ctggacggct tcggccgcac 6660 cctggagatg tgcaagcgcg acctgatctg ggtggtgatc aagatgcaga tcaaggtgaa 6720 ccgctacccc gcctggggcg acaccgtgga gatcaacacc cgcttcagcc gcctgggcaa 6780 gatcggcatg ggccgcgact ggctgatctc cgactgcaac accggcgaga tcctggtgcg 6840 cgccaccagc gcctacgcca tgatgaacca gaagacccgc cgcctgtcca agctgcccta 6900 cgaggtgcac caggagatcg tgcccctgtt cgtggacagc cccgtgatcg aggactccga 6960 cctgaaggtg cacaagttca aggtgaagac cggcgacagc atccagaagg gcctgacccc 7020 cggctggaac gacctggacg tgaaccagca cgtgtccaac gtgaagtaca tcggctggat 7080 cctggagagc atgcccaccg aggtgctgga gacccaggag ctgtgctccc tggccctgga 7140 gtaccgccgc gagtgcggcc gcgactccgt gctggagagc gtgaccgcca tggaccccag 7200 caaggtgggc gtgcgctccc agtaccagca cctgctgcgc ctggaggacg gcaccgccat 7260 cgtgaacggc gccaccgagt ggcgccccaa gaacgccggc gccaacggcg ccatctccac 7320 cggcaagacc agcaacggca actccgtgtc catggactac aaggaccacg acggcgacta 7380 caaggaccac gacatcgact acaaggacga cgacgacaag tgactcgagg cagcagcagc 7440 tcggatagta tcgacacact ctggacgctg gtcgtgtgat ggactgttgc cgccacactt 7500 gctgccttga cctgtgaata tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc 7560 ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc tatttgcgaa taccaccccc 7620 agcatcccct tccctcgttt catatcgctt gcatcccaac cgcaacttat ctacgctgtc 7680 ctgctatccc tcagcgctgc tcctgctcct gctcactgcc cctcgcacag ccttggtttg 7740 ggctccgcct gtattctcct ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca 7800 cgggaagtag tgggatggga acacaaatgg aaagcttgag ctc 7843 <210> 249 <211> 1239 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 249 actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60 acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120 cccgcgaacg gcagcgcggt gaacctgaag tcgggctccc tgaacaccca ggaggacacg 180 agctcgtccc cccccccccg cgcgttcctg aaccagctgc ccgactggag catgctgctg 240 accgcgatca ccaccgtctt cgtggcggcg gagaagcagt ggacgatgct ggaccgcaag 300 tcgaagcgcc ccgacatgct ggtggactcc gtcggcctga agagcatcgt gcgcgacggc 360 ctggtctcgc gccagtcctt cctgatccgc agctacgaga tcggcgcgga ccgcaccgcg 420 tcgatcgaga ccctgatgaa ccacctgcag gagacgtcca tcaaccactg caagagcctg 480 ggcctgctga acgacggctt cggccgcacc cccggcatgt gcaagaacga cctgatctgg 540 gtgctgacca agatgcagat catggtcaac cgctacccca cgtggggcga caccgtcgag 600 atcaacacgt ggttctcgca gtccggcaag atcggcatgg cgagcgactg gctgatctcg 660 gactgcaaca ccggcgagat cctgatccgc gcgacctccg tgtgggcgat gatgaaccag 720 aagacgcgcc gcttcagccg cctgccctac gaggtccgcc aggagctgac cccccacttc 780 gtggactcgc cccacgtcat cgaggacaac gaccagaagc tgcacaagtt cgacgtgaag 840 accggcgact ccatccgcaa gggcctgacg ccccgctgga acgacctgga cgtcaaccag 900 cacgtgtcga acgtgaagta catcggctgg atcctggagt ccatgcccat cgaggtcctg 960 gagacccagg agctgtgctc gctgaccgtg gagtaccgcc gcgagtgcgg catggactcc 1020 gtgctggagt cggtcacggc ggtggacccc agcgagaacg gcggccgcag ccagtacaag 1080 cacctgctgc gcctggagga cggcaccgac atcgtcaagt cgcgcaccga gtggcgcccc 1140 aagaacgcgg gcacgaacgg cgcgatctcc accagcaccg cgaagacgtc gaacggcaac 1200 tccgcgagcg atgacgatga caagctggga tgactcgag 1239 <210> 250 <211> 4656 <212> DNA <213> Umbellularia californica <400> 250 ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60 gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120 gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180 gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240 tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300 cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360 cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420 gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480 gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540 tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600 cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660 caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720 tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780 gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840 atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900 acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960 gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020 cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080 atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140 ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200 cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260 gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320 tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380 ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440 cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500 cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560 cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620 gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680 catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740 ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800 ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860 gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920 caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980 ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040 cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100 cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160 atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220 acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280 cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340 ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400 ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460 tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520 gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580 gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640 gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700 gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760 gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060 cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120 cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180 cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240 agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300 ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360 tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420 gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480 ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540 cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600 aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660 tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720 gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780 atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840 ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900 gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960 gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020 ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080 gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140 gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200 cacgacatcg actacaagga cgacgacgac aagtgactcg aggcagcagc agctcggata 4260 gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320 tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380 tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440 ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500 ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560 cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620 tagtgggatg ggaacacaaa tggaaagctt gagctc 4656 <210> 251 <211> 1152 <212> DNA <213> Umbellularia californica <400> 251 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120 tggtccatgc tgttcgccgt gatcaccacc atcttcagcg ccgccgagaa gcagtggacc 180 aacctggagt ggaagcccaa gcccaagctg ccccagctgc tggacgacca cttcggcctg 240 cacggcctgg tgttccgccg caccttcgcc atccgctcct acgaggtggg ccccgaccgc 300 agcacctcca tcctggccgt gatgaaccac atgcaggagg ccaccctgaa ccacgccaag 360 agcgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420 atgtgggtgg tgcgccgcac ccacgtggcc gtggagcgct accccacctg gggcgacacc 480 gtggaggtgg agtgctggat cggcgccagc ggcaacaacg gcatgcgccg cgacttcctg 540 gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgctgatg 600 aacacccgca cccgccgcct gagcaccatc cccgacgagg tgcgcggcga gatcggcccc 660 gccttcatcg acaacgtggc cgtgaaggac gacgagatca agaagctgca gaagctgaac 720 gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacgtg 780 aaccagcacg tgaacaacct gaagtacgtg gcctgggtgt tcgagaccgt gcccgacagc 840 atcttcgagt cccaccacat cagctccttc accctggagt accgccgcga gtgcacccgc 900 gactccgtgc tgcgcagcct gaccaccgtg agcggcggca gctccgaggc cggcctggtg 960 tgcgaccacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgcccg caccgagtgg 1020 cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gccccgcgtg 1080 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140 gacgacaagt ga 1152 <210> 252 <211> 6789 <212> DNA <213> Garcinia mangostana <400> 252 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240 gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300 aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360 cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420 ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480 cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540 gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600 tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660 ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720 ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780 ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840 aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900 aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960 ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020 gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080 caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140 tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200 tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260 tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320 agcgggccca caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt 4380 tcaatgcccg ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga 4440 ggcccctccc cgtgcgcggg cgcgccgcca acgcccaggc ccccaccaag atcaacggct 4500 ccaccgacga cgcccagctg cccgcccccc gcaccttcat caaccagctg cccgactggt 4560 ccatgctgct ggccgccatc accaccgtgt tcctggccgc cgagaagcag tggatgatgc 4620 tggactggaa gccccgccgc cccgacatgc tgatcgacac cttcggcctg ggccgcatcg 4680 tgcaggacgg cctggtgttc cgccagaact tctccatccg ctcctacgag atcggcgccg 4740 accgcaccgc ctccatcgag accgtgatga accacctgca ggagaccgcc ctgaaccacg 4800 tgaagaccgc cggcctgctg ggcgacggct tcggctccac ccccgagatg tccaagcgca 4860 acctgatctg ggtggtgacc aagatgcagg tggaggtgga ccgctacccc acctggggcg 4920 acgtggtgca ggtggacacc tgggtgtccg cctccggcaa gaacggcatg cgccgcgact 4980 ggctgctgcg cgacggcaac accggcgaga ccctgacccg cgcctcctcc gtgtgggtga 5040 tgatgaacaa gctgacccgc cgcctgtcca agatccccga ggaggtgcgc gaggagatcg 5100 gctcctactt cgtgaactcc gaccccgtgg tggaggagga cggccgcaag gtgaccaagc 5160 tggacgacaa caccgccgac ttcgtgcgca agggcctgac ccccaagtgg aacgacctgg 5220 acatcaacca gcacgtgaac aacgtgaagt acatcggctg gatcctggag tccgcccccc 5280 agcccatcct ggagacccgc gagctgtccg ccgtgaccct ggagtaccgc cgcgagtgcg 5340 gccgcgactc cgtgctgcgc tccctgaccg ccgtgtccgg cggcggcgtg ggcgacctgg 5400 gccacgccgg caacgtggag tgccagcacg tgctgcgcct ggaggacggc gccgagatcg 5460 tgcgcggccg caccgagtgg cgccccaagt acatcaacaa cttctccatc atgggccaga 5520 tccccaccga cgcctccatg gactacaagg accacgacgg cgactacaag gaccacgaca 5580 tcgactacaa ggacgacgac gacaagtgaa tcgatagatc tcttaaggca gcagcagctc 5640 ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 5700 tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 5760 gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 5820 catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 5880 gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 5940 ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 6000 ggaagtagtg ggatgggaac acaaatggaa agcttaatta agagctcttg ttttccagaa 6060 ggagttgctc cttgagcctt tcattctcag cctcgataac ctccaaagcc gctctaattg 6120 tggagggggt tcgaatttaa aagcttggaa tgttggttcg tgcgtctgga acaagcccag 6180 acttgttgct cactgggaaa aggaccatca gctccaaaaa acttgccgct caaaccgcgt 6240 acctctgctt tcgcgcaatc tgccctgttg aaatcgccac cacattcata ttgtgacgct 6300 tgagcagtct gtaattgcct cagaatgtgg aatcatctgc cccctgtgcg agcccatgcc 6360 aggcatgtcg cgggcgagga cacccgccac tcgtacagca gaccattatg ctacctcaca 6420 atagttcata acagtgacca tatttctcga agctccccaa cgagcacctc catgctctga 6480 gtggccaccc cccggccctg gtgcttgcgg agggcaggtc aaccggcatg gggctaccga 6540 aatccccgac cggatcccac cacccccgcg atgggaagaa tctctccccg ggatgtgggc 6600 ccaccaccag cacaacctgc tggcccaggc gagcgtcaaa ccataccaca caaatatcct 6660 tggcatcggc cctgaattcc ttctgccgct ctgctacccg gtgcttctgt ccgaagcagg 6720 ggttgctagg gatcgctccg agtccgcaaa cccttgtcgc gtggcggggc ttgttcgagc 6780 ttgaagagc 6789 <210> 253 <211> 1257 <212> DNA <213> Garcinia mangostana <400> 253 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgccaac 120 gcccaggccc ccaccaagat caacggctcc accgacgacg cccagctgcc cgccccccgc 180 accttcatca accagctgcc cgactggtcc atgctgctgg ccgccatcac caccgtgttc 240 ctggccgccg agaagcagtg gatgatgctg gactggaagc cccgccgccc cgacatgctg 300 atcgacacct tcggcctggg ccgcatcgtg caggacggcc tggtgttccg ccagaacttc 360 tccatccgct cctacgagat cggcgccgac cgcaccgcct ccatcgagac cgtgatgaac 420 cacctgcagg agaccgccct gaaccacgtg aagaccgccg gcctgctggg cgacggcttc 480 ggctccaccc ccgagatgtc caagcgcaac ctgatctggg tggtgaccaa gatgcaggtg 540 gaggtggacc gctaccccac ctggggcgac gtggtgcagg tggacacctg ggtgtccgcc 600 tccggcaaga acggcatgcg ccgcgactgg ctgctgcgcg acggcaacac cggcgagacc 660 ctgacccgcg cctcctccgt gtgggtgatg atgaacaagc tgacccgccg cctgtccaag 720 atccccgagg aggtgcgcga ggagatcggc tcctacttcg tgaactccga ccccgtggtg 780 gaggaggacg gccgcaaggt gaccaagctg gacgacaaca ccgccgactt cgtgcgcaag 840 ggcctgaccc ccaagtggaa cgacctggac atcaaccagc acgtgaacaa cgtgaagtac 900 atcggctgga tcctggagtc cgccccccag cccatcctgg agacccgcga gctgtccgcc 960 gtgaccctgg agtaccgccg cgagtgcggc cgcgactccg tgctgcgctc cctgaccgcc 1020 gtgtccggcg gcggcgtggg cgacctgggc cacgccggca acgtggagtg ccagcacgtg 1080 ctgcgcctgg aggacggcgc cgagatcgtg cgcggccgca ccgagtggcg ccccaagtac 1140 atcaacaact tctccatcat gggccagatc cccaccgacg cctccatgga ctacaaggac 1200 cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga caagtga 1257 <210> 254 <211> 6707 <212> DNA <213> Brassica napus <400> 254 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080 gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140 acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200 acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260 tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320 tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380 acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440 cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500 ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560 cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620 actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680 tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740 ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800 cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860 ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920 tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980 agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040 tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100 agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160 tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220 agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280 ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340 ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400 cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460 cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520 gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580 acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640 agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700 atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760 aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820 gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880 accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940 cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000 ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060 gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120 cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180 gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240 atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300 gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360 accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420 cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480 tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540 tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600 gtccgtgtca tccactctaa agaactcgac tacgacctac tgatggccct agattcttca 3660 tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720 ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780 ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840 ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900 gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960 aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020 cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080 ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140 gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200 gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260 aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320 ggcccacagg ccggtcgcag ccactagtat gctgaagctg tcctgcaacg tgaccaacaa 4380 cctgcacacc ttctccttct tctccgactc ctccctgttc atccccgtga accgccgcac 4440 catcgccgtg tcctccgggc gcgcctccca gctgcgcaag cccgccctgg accccctgcg 4500 cgccgtgatc tccgccgacc agggctccat ctcccccgtg aactcctgca cccccgccga 4560 ccgcctgcgc gccggccgcc tgatggagga cggctactcc tacaaggaga agttcatcgt 4620 gcgctcctac gaggtgggca tcaacaagac cgccaccgtg gagaccatcg ccaacctgct 4680 gcaggaggtg gcctgcaacc acgtgcagaa gtgcggcttc tccaccgacg gcttcgccac 4740 caccctgacc atgcgcaagc tgcacctgat ctgggtgacc gcccgcatgc acatcgagat 4800 ctacaagtac cccgcctggt ccgacgtggt ggagatcgag acctggtgcc agtccgaggg 4860 ccgcatcggc acccgccgcg actggatcct gcgcgactcc gccaccaacg aggtgatcgg 4920 ccgcgccacc tccaagtggg tgatgatgaa ccaggacacc cgccgcctgc agcgcgtgac 4980 cgacgaggtg cgcgacgagt acctggtgtt ctgcccccgc gagccccgcc tggccttccc 5040 cgaggagaac aactcctccc tgaagaagat ccccaagctg gaggaccccg cccagtactc 5100 catgctggag ctgaagcccc gccgcgccga cctggacatg aaccagcacg tgaacaacgt 5160 gacctacatc ggctgggtgc tggagtccat cccccaggag atcatcgaca cccacgagct 5220 gcaggtgatc accctggact accgccgcga gtgccagcag gacgacatcg tggactccct 5280 gaccacctcc gagatccccg acgaccccat ctccaagttc accggcacca acggctccgc 5340 catgtcctcc atccagggcc acaacgagtc ccagttcctg cacatgctgc gcctgtccga 5400 gaacggccag gagatcaacc gcggccgcac ccagtggcgc aagaagtcct cccgcatgga 5460 ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 5520 caagtgaatc gatagatctc ttaaggcagc agcagctcgg atagtatcga cacactctgg 5580 acgctggtcg tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc 5640 tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt 5700 tgctagctgc ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata 5760 tcgcttgcat cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct 5820 gctcctgctc actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta 5880 ctgcaacctg taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac 5940 aaatggaaag cttaattaag agctcttgtt ttccagaagg agttgctcct tgagcctttc 6000 attctcagcc tcgataacct ccaaagccgc tctaattgtg gagggggttc gaatttaaaa 6060 gcttggaatg ttggttcgtg cgtctggaac aagcccagac ttgttgctca ctgggaaaag 6120 gaccatcagc tccaaaaaac ttgccgctca aaccgcgtac ctctgctttc gcgcaatctg 6180 ccctgttgaa atcgccacca cattcatatt gtgacgcttg agcagtctgt aattgcctca 6240 gaatgtggaa tcatctgccc cctgtgcgag cccatgccag gcatgtcgcg ggcgaggaca 6300 cccgccactc gtacagcaga ccattatgct acctcacaat agttcataac agtgaccata 6360 tttctcgaag ctccccaacg agcacctcca tgctctgagt ggccaccccc cggccctggt 6420 gcttgcggag ggcaggtcaa ccggcatggg gctaccgaaa tccccgaccg gatcccacca 6480 cccccgcgat gggaagaatc tctccccggg atgtgggccc accaccagca caacctgctg 6540 gcccaggcga gcgtcaaacc ataccacaca aatatccttg gcatcggccc tgaattcctt 6600 ctgccgctct gctacccggt gcttctgtcc gaagcagggg ttgctaggga tcgctccgag 6660 tccgcaaacc cttgtcgcgt ggcggggctt gttcgagctt gaagagc 6707 <210> 255 <211> 1179 <212> DNA <213> Brassica napus <400> 255 atgctgaagc tgtcctgcaa cgtgaccaac aacctgcaca ccttctcctt cttctccgac 60 tcctccctgt tcatccccgt gaaccgccgc accatcgccg tgtcctccgg gcgcgcctcc 120 cagctgcgca agcccgccct ggaccccctg cgcgccgtga tctccgccga ccagggctcc 180 atctcccccg tgaactcctg cacccccgcc gaccgcctgc gcgccggccg cctgatggag 240 gacggctact cctacaagga gaagttcatc gtgcgctcct acgaggtggg catcaacaag 300 accgccaccg tggagaccat cgccaacctg ctgcaggagg tggcctgcaa ccacgtgcag 360 aagtgcggct tctccaccga cggcttcgcc accaccctga ccatgcgcaa gctgcacctg 420 atctgggtga ccgcccgcat gcacatcgag atctacaagt accccgcctg gtccgacgtg 480 gtggagatcg agacctggtg ccagtccgag ggccgcatcg gcacccgccg cgactggatc 540 ctgcgcgact ccgccaccaa cgaggtgatc ggccgcgcca cctccaagtg ggtgatgatg 600 aaccaggaca cccgccgcct gcagcgcgtg accgacgagg tgcgcgacga gtacctggtg 660 ttctgccccc gcgagccccg cctggccttc cccgaggaga acaactcctc cctgaagaag 720 atccccaagc tggaggaccc cgcccagtac tccatgctgg agctgaagcc ccgccgcgcc 780 gacctggaca tgaaccagca cgtgaacaac gtgacctaca tcggctgggt gctggagtcc 840 atcccccagg agatcatcga cacccacgag ctgcaggtga tcaccctgga ctaccgccgc 900 gagtgccagc aggacgacat cgtggactcc ctgaccacct ccgagatccc cgacgacccc 960 atctccaagt tcaccggcac caacggctcc gccatgtcct ccatccaggg ccacaacgag 1020 tcccagttcc tgcacatgct gcgcctgtcc gagaacggcc aggagatcaa ccgcggccgc 1080 acccagtggc gcaagaagtc ctcccgcatg gactacaagg accacgacgg cgactacaag 1140 gaccacgaca tcgactacaa ggacgacgac gacaagtga 1179 <210> 256 <211> 5988 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 256 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240 gctgatggtc gaaacgttca cagcctaggg atatcgaatt cctttcttgc gctatgacac 3300 ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat 3360 gatgcttcga ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg 3420 gcgagcgctg tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa 3480 gccatattca aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg 3540 cactccgcta agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacactagta 3600 tggccaccgc atccactttc tcggcgttca atgcccgctg cggcgacctg cgtcgctcgg 3660 cgggctccgg gccccggcgc ccagcgaggc ccctccccgt gcgcgggcgc gccgaggtgc 3720 acgtgcaggt gacccactcc ctggcccccg agaagcgcga gatcttcaac tccctgaaca 3780 actgggccca ggagaacatc ctggtgctgc tgaaggacgt ggacaagtgc tggcagccct 3840 ccgacttcct gcccgactcc gcctccgagg gcttcgacga gcaggtgatg gagctgcgca 3900 agcgctgcaa ggagatcccc gacgactact tcatcgtgct ggtgggcgac atgatcaccg 3960 aggaggccct gcccacctac cagaccatgc tgaacaccct ggacggcgtg cgcgacgaga 4020 ccggcgcctc cctgaccccc tgggccatct ggacccgcgc ctggaccgcc gaggagaacc 4080 gccacggcga cctgctgaac aagtacctgt acctgtccgg ccgcgtggac atgaagcaga 4140 tcgagaagac catccagtac ctgatcggct ccggcatgga cccccgcacc gagaacaacc 4200 cctacctggg cttcatctac acctccttcc aggagcgcgc caccttcatc tcccacggca 4260 acaccgcccg cctggccaag gagcacggcg acctgaagct ggcccagatc tgcggcatca 4320 tcgccgccga cgagaagcgc cacgagaccg cctacaccaa gatcgtggag aagctgttcg 4380 agatcgaccc cgacggcacc gtgctggccc tggccgacat gatgcgcaag aaggtgtcca 4440 tgcccgccca cctgatgtac gacggccagg acgacaacct gttcgagaac ttctcctccg 4500 tggcccagcg cctgggcgtg tacaccgcca aggactacgc cgacatcctg gagttcctgg 4560 tgggccgctg ggacatcgag aagctgaccg gcctgtccgg cgagggccgc aaggcccagg 4620 actacgtgtg caccctgccc ccccgcatcc gccgcctgga ggagcgcgcc cagtcccgcg 4680 tgaagaaggc ctccgccacc cccttctcct ggatcttcgg ccgcgagatc aacctgatgg 4740 actacaagga ccacgacggc gactacaagg accacgacat cgactacaag gacgacgacg 4800 acaagtgaat cgatagatct cttaaggcag cagcagctcg gatagtatcg acacactctg 4860 gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct gtgaatatcc 4920 ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag 4980 ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc ctcgtttcat 5040 atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca gcgctgctcc 5100 tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta ttctcctggt 5160 actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca 5220 caaatggaaa gcttaattaa gagctcttgt tttccagaag gagttgctcc ttgagccttt 5280 cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 5340 agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 5400 ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 5460 gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 5520 agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 5580 acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 5640 atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 5700 tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 5760 acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 5820 ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 5880 tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 5940 gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgaagagc 5988 <210> 257 <211> 1209 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 257 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgaggtg 120 cacgtgcagg tgacccactc cctggccccc gagaagcgcg agatcttcaa ctccctgaac 180 aactgggccc aggagaacat cctggtgctg ctgaaggacg tggacaagtg ctggcagccc 240 tccgacttcc tgcccgactc cgcctccgag ggcttcgacg agcaggtgat ggagctgcgc 300 aagcgctgca aggagatccc cgacgactac ttcatcgtgc tggtgggcga catgatcacc 360 gaggaggccc tgcccaccta ccagaccatg ctgaacaccc tggacggcgt gcgcgacgag 420 accggcgcct ccctgacccc ctgggccatc tggacccgcg cctggaccgc cgaggagaac 480 cgccacggcg acctgctgaa caagtacctg tacctgtccg gccgcgtgga catgaagcag 540 atcgagaaga ccatccagta cctgatcggc tccggcatgg acccccgcac cgagaacaac 600 ccctacctgg gcttcatcta cacctccttc caggagcgcg ccaccttcat ctcccacggc 660 aacaccgccc gcctggccaa ggagcacggc gacctgaagc tggcccagat ctgcggcatc 720 atcgccgccg acgagaagcg ccacgagacc gcctacacca agatcgtgga gaagctgttc 780 gagatcgacc ccgacggcac cgtgctggcc ctggccgaca tgatgcgcaa gaaggtgtcc 840 atgcccgccc acctgatgta cgacggccag gacgacaacc tgttcgagaa cttctcctcc 900 gtggcccagc gcctgggcgt gtacaccgcc aaggactacg ccgacatcct ggagttcctg 960 gtgggccgct gggacatcga gaagctgacc ggcctgtccg gcgagggccg caaggcccag 1020 gactacgtgt gcaccctgcc cccccgcatc cgccgcctgg aggagcgcgc ccagtcccgc 1080 gtgaagaagg cctccgccac ccccttctcc tggatcttcg gccgcgagat caacctgatg 1140 gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa ggacgacgac 1200 gacaagtga 1209 <210> 258 <211> 6753 <212> DNA <213> Cuphea hookeriana <400> 258 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240 gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300 aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360 cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420 ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480 cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540 gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600 tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660 ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720 ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780 ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840 aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900 aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960 ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020 gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080 caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140 tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200 tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260 tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320 agcgggccca caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt 4380 tcaatgcccg ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga 4440 ggcccctccc cgtgcgcggg cgcgccaccc aggaggacgc ccactccgcc cccccccccc 4500 gcaccttcat caaccagctg cccgactggt ccatgctgct ggccgccatc accaccgtgt 4560 tcctggccgc cgagaagcag tggatgatgc tggactggaa gcccaagcgc cccgacatgc 4620 tggtggaccc cttcggcctg ggctccatcg tgcaggacgg cctggtgttc cgccagaact 4680 tctccatccg ctcctacgag atcggcgccg accgcaccgc ctccatcgag accgtgatga 4740 accacctgca ggagaccgcc ctgaaccacg tgaagatcgc cggcctgtcc aacgacggct 4800 tcggccgcac ccccgagatg tacaagcgcg acctgatctg ggtggtggcc aagatgcagg 4860 tgatggtgaa ccgctacccc acctggggcg acaccgtgga ggtgaacacc tgggtggcca 4920 agtccggcaa gaacggcatg cgccgcgact ggctgatctc cgactgcaac accggcgaga 4980 tcctgacccg cgcctcctcc gtgtgggtga tgatgaacca gaagacccgc cgcctgtcca 5040 agatccccga cgaggtgcgc aacgagatcg agccccactt cgtggactcc ccccccgtga 5100 tcgaggacga cgaccgcaag ctgcccaagc tggacgagaa gaccgccgac tccatccgca 5160 agggcctgac cccccgctgg aacgacctgg acgtgaacca gcacgtgaac aacgtgaagt 5220 acatcggctg gatcctggag tccacccccc ccgaggtgct ggagacccag gagctgtgct 5280 ccctgaccct ggagtaccgc cgcgagtgcg gccgcgagtc cgtgctggag tccctgaccg 5340 ccatggaccc ctccggcggc ggctacggct cccagttcca gcacctgctg cgcctggagg 5400 acggcggcga gatcgtgaag ggccgcaccg agtggcgccc caagaacggc gtgatcaacg 5460 gcgtggtgcc caccggcgag tcctcccccg gcgactactc catggactac aaggaccacg 5520 acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag tgaatcgata 5580 gatctcttaa ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 5640 atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 5700 aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 5760 gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 5820 accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 5880 cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 5940 ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaaagctta 6000 attaagagct cttgttttcc agaaggagtt gctccttgag cctttcattc tcagcctcga 6060 taacctccaa agccgctcta attgtggagg gggttcgaat ttaaaagctt ggaatgttgg 6120 ttcgtgcgtc tggaacaagc ccagacttgt tgctcactgg gaaaaggacc atcagctcca 6180 aaaaacttgc cgctcaaacc gcgtacctct gctttcgcgc aatctgccct gttgaaatcg 6240 ccaccacatt catattgtga cgcttgagca gtctgtaatt gcctcagaat gtggaatcat 6300 ctgccccctg tgcgagccca tgccaggcat gtcgcgggcg aggacacccg ccactcgtac 6360 agcagaccat tatgctacct cacaatagtt cataacagtg accatatttc tcgaagctcc 6420 ccaacgagca cctccatgct ctgagtggcc accccccggc cctggtgctt gcggagggca 6480 ggtcaaccgg catggggcta ccgaaatccc cgaccggatc ccaccacccc cgcgatggga 6540 agaatctctc cccgggatgt gggcccacca ccagcacaac ctgctggccc aggcgagcgt 6600 caaaccatac cacacaaata tccttggcat cggccctgaa ttccttctgc cgctctgcta 6660 cccggtgctt ctgtccgaag caggggttgc tagggatcgc tccgagtccg caaacccttg 6720 tcgcgtggcg gggcttgttc gagcttgaag agc 6753 <210> 259 <211> 1221 <212> DNA <213> Cuphea hookeriana <400> 259 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccacccag 120 gaggacgccc actccgcccc ccccccccgc accttcatca accagctgcc cgactggtcc 180 atgctgctgg ccgccatcac caccgtgttc ctggccgccg agaagcagtg gatgatgctg 240 gactggaagc ccaagcgccc cgacatgctg gtggacccct tcggcctggg ctccatcgtg 300 caggacggcc tggtgttccg ccagaacttc tccatccgct cctacgagat cggcgccgac 360 cgcaccgcct ccatcgagac cgtgatgaac cacctgcagg agaccgccct gaaccacgtg 420 aagatcgccg gcctgtccaa cgacggcttc ggccgcaccc ccgagatgta caagcgcgac 480 ctgatctggg tggtggccaa gatgcaggtg atggtgaacc gctaccccac ctggggcgac 540 accgtggagg tgaacacctg ggtggccaag tccggcaaga acggcatgcg ccgcgactgg 600 ctgatctccg actgcaacac cggcgagatc ctgacccgcg cctcctccgt gtgggtgatg 660 atgaaccaga agacccgccg cctgtccaag atccccgacg aggtgcgcaa cgagatcgag 720 ccccacttcg tggactcccc ccccgtgatc gaggacgacg accgcaagct gcccaagctg 780 gacgagaaga ccgccgactc catccgcaag ggcctgaccc cccgctggaa cgacctggac 840 gtgaaccagc acgtgaacaa cgtgaagtac atcggctgga tcctggagtc cacccccccc 900 gaggtgctgg agacccagga gctgtgctcc ctgaccctgg agtaccgccg cgagtgcggc 960 cgcgagtccg tgctggagtc cctgaccgcc atggacccct ccggcggcgg ctacggctcc 1020 cagttccagc acctgctgcg cctggaggac ggcggcgaga tcgtgaaggg ccgcaccgag 1080 tggcgcccca agaacggcgt gatcaacggc gtggtgccca ccggcgagtc ctcccccggc 1140 gactactcca tggactacaa ggaccacgac ggcgactaca aggaccacga catcgactac 1200 aaggacgacg acgacaagtg a 1221 <210> 260 <211> 6860 <212> DNA <213> Elaeis guineensis <400> 260 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080 gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140 acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200 acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260 tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320 tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380 acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440 cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500 ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560 cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620 actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680 tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740 ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800 cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860 ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920 tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980 agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040 tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100 agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160 tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220 agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280 ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340 ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400 cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460 cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520 gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580 acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640 agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700 atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760 aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820 gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880 accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940 cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000 ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060 gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120 cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180 gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240 atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300 gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360 accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420 cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480 tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540 tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600 gtccgtgtca tccactctaa agaactcgac tacgacctac tgatggccct agattcttca 3660 tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720 ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780 ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840 ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900 gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960 aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020 cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080 ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140 gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200 gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260 aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320 ggcccacagg ccggtcgcag ccactagtat ggtggcctcc atcgccgcct ccgccttctt 4380 ccccaccccc tccttctccc ccaccgggcg cgccgcctcc gccaaggcct ccaagaccat 4440 cggcgagggc tccgagaacc tggacgcccg cggcatcatc gccaagccca cctcctcctc 4500 cgccgccatg cagggcaagg tgatggccca ggccgtgtcc aagatcaacg gcgccaaggt 4560 gggcctgaag gccgagtccc agaaggccga ggaggacgcc gccccctcct ccgccccccg 4620 caccttctac aaccagctgc ccgactggtc cgtgctgctg gccgccgtga ccaccatctt 4680 cctggccgcc gagaagcagt ggaccctgct ggactggaag ccccgccgcc ccgacatgct 4740 gaccgacgcc ttctccctgg gcaagatcgt gcaggacggc ctggtgttca agcagaactt 4800 ctccatccgc tcctacgaga tcggcgccga ccgcaccgcc tccatcgaga ccctgatgaa 4860 ccacctgcag gagaccgccc tgaaccacgt gcgctccgcc ggcctgatgg gcgacggctt 4920 cggcgccacc cccgagatgt ccaagcgcaa cctgatctgg gtggtgacca aggtgcgcgt 4980 gctgatcgag cactacccct cctggggcga cgtggtggag gtggacacct gggtgggccc 5040 cgccggcaag aacggcatgc gccgcgactg gcacgtgcgc gaccaccgca ccggccagac 5100 catcctgcgc gccacccgcg tgtgggtgat gatgaacaag aacacccgca agctgtccaa 5160 ggtgcccgag gaggtgcgcg ccgagatcgg cccctacttc gtggagcgcg ccgccatcgt 5220 ggacgaggac tcccgcaagc tgcccaagct ggacgaggac accaccgact acgtgaagaa 5280 gggcctgacc ccccgctggt ccgacctgga cgtgaaccag cacgtgaaca acgtgaagta 5340 catcggctgg atcctggagt ccgcccccat ctccatcctg gagaaccacg agctggcctc 5400 catgaccctg gagtaccgcc gcgagtgcgg ccgcgactcc gtgctgcagt ccctgaccgc 5460 cgtggccaac gactgcaccg gcggcctgcc cgaggcctcc atcgagtgcc agcacctgct 5520 gcagctggag tgcggcgccg agatcgtgcg cggccgcacc cagtggcgcc cccgccgcgc 5580 ctccggcccc acctccgccg gctccgccat ggactacaag gaccacgacg gcgactacaa 5640 ggaccacgac atcgactaca aggacgacga cgacaagtga atcgatagat ctcttaaggc 5700 agcagcagct cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc 5760 gccacacttg ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg 5820 tgtttgatct tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat 5880 accaccccca gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc 5940 tacgctgtcc tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc 6000 cttggtttgg gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat 6060 gctgatgcac gggaagtagt gggatgggaa cacaaatgga aagcttaatt aagagctctt 6120 gttttccaga aggagttgct ccttgagcct ttcattctca gcctcgataa cctccaaagc 6180 cgctctaatt gtggaggggg ttcgaattta aaagcttgga atgttggttc gtgcgtctgg 6240 aacaagccca gacttgttgc tcactgggaa aaggaccatc agctccaaaa aacttgccgc 6300 tcaaaccgcg tacctctgct ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat 6360 attgtgacgc ttgagcagtc tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc 6420 gagcccatgc caggcatgtc gcgggcgagg acacccgcca ctcgtacagc agaccattat 6480 gctacctcac aatagttcat aacagtgacc atatttctcg aagctcccca acgagcacct 6540 ccatgctctg agtggccacc ccccggccct ggtgcttgcg gagggcaggt caaccggcat 6600 ggggctaccg aaatccccga ccggatccca ccacccccgc gatgggaaga atctctcccc 6660 gggatgtggg cccaccacca gcacaacctg ctggcccagg cgagcgtcaa accataccac 6720 acaaatatcc ttggcatcgg ccctgaattc cttctgccgc tctgctaccc ggtgcttctg 6780 tccgaagcag gggttgctag ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg 6840 cttgttcgag cttgaagagc 6860 <210> 261 <211> 1332 <212> DNA <213> Elaeis guineensis <400> 261 atggtggcct ccatcgccgc ctccgccttc ttccccaccc cctccttctc ccccaccggg 60 cgcgccgcct ccgccaaggc ctccaagacc atcggcgagg gctccgagaa cctggacgcc 120 cgcggcatca tcgccaagcc cacctcctcc tccgccgcca tgcagggcaa ggtgatggcc 180 caggccgtgt ccaagatcaa cggcgccaag gtgggcctga aggccgagtc ccagaaggcc 240 gaggaggacg ccgccccctc ctccgccccc cgcaccttct acaaccagct gcccgactgg 300 tccgtgctgc tggccgccgt gaccaccatc ttcctggccg ccgagaagca gtggaccctg 360 ctggactgga agccccgccg ccccgacatg ctgaccgacg ccttctccct gggcaagatc 420 gtgcaggacg gcctggtgtt caagcagaac ttctccatcc gctcctacga gatcggcgcc 480 gaccgcaccg cctccatcga gaccctgatg aaccacctgc aggagaccgc cctgaaccac 540 gtgcgctccg ccggcctgat gggcgacggc ttcggcgcca cccccgagat gtccaagcgc 600 aacctgatct gggtggtgac caaggtgcgc gtgctgatcg agcactaccc ctcctggggc 660 gacgtggtgg aggtggacac ctgggtgggc cccgccggca agaacggcat gcgccgcgac 720 tggcacgtgc gcgaccaccg caccggccag accatcctgc gcgccacccg cgtgtgggtg 780 atgatgaaca agaacacccg caagctgtcc aaggtgcccg aggaggtgcg cgccgagatc 840 ggcccctact tcgtggagcg cgccgccatc gtggacgagg actcccgcaa gctgcccaag 900 ctggacgagg acaccaccga ctacgtgaag aagggcctga ccccccgctg gtccgacctg 960 gacgtgaacc agcacgtgaa caacgtgaag tacatcggct ggatcctgga gtccgccccc 1020 atctccatcc tggagaacca cgagctggcc tccatgaccc tggagtaccg ccgcgagtgc 1080 ggccgcgact ccgtgctgca gtccctgacc gccgtggcca acgactgcac cggcggcctg 1140 cccgaggcct ccatcgagtg ccagcacctg ctgcagctgg agtgcggcgc cgagatcgtg 1200 cgcggccgca cccagtggcg cccccgccgc gcctccggcc ccacctccgc cggctccgcc 1260 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1320 gacgacaagt ga 1332 <210> 262 <211> 5937 <212> DNA <213> artificial sequence <220> <223> synthetic polynucleotide <400> 262 gctcttcggg ctggtctgaa tccttcaggc gggtgttacc cgagaaagaa agggtgccga 60 tttcaaagca gacccatgtg ccgggccctg tggcctgtgt tggcgcctat gtagtcaccc 120 cccctcaccc aattgtcgcc agtttgcgca ctccataaac tcaaaacagc agcttctgag 180 ctgcgctgtt caagaacacc tctggggttt gctcacccgc gaggtcgacg cccagcatgg 240 ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg acgctgcgca 300 aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tagcagcatg tacctggcct 360 ttgacatcgc ggtcatgtcc ctgctctacg tcgcgtcgac gtacatcgac cctgcaccgg 420 tgcctacgtg ggtcaagtac ggcatcatgt ggccgctcta ctggttcttc caggtgtgtt 480 tgagggtttt ggttgcccgt attgaggtcc tggtggcgcg catggaggag aaggcgcctg 540 tcccgctgac ccccccggct accctcccgg caccttccag ggcgccttcg gcacgggtgt 600 ctgggtgtgc gcgcacgagt gcggccacca ggccttttcc tccagccagg ccatcaacga 660 cggcgtgggc ctggtgttcc acagcctgct gctggtgccc tactactcct ggaagcactc 720 gcaccgggta ccctttcttg cgctatgaca cttccagcaa aaggtagggc gggctgcgag 780 acggcttccc ggcgctgcat gcaacaccga tgatgcttcg accccccgaa gctccttcgg 840 ggctgcatgg gcgctccgat gccgctccag ggcgagcgct gtttaaatag ccaggccccc 900 gattgcaaag acattatagc gagctaccaa agccatattc aaacacctag atcactacca 960 cttctacaca ggccactcga gcttgtgatc gcactccgct aagggggcgc ctcttcctct 1020 tcgtttcagt cacaacccgc aaactctaga atatcaatgc tgctgcaggc cttcctgttc 1080 ctgctggccg gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc 1140 cccctggtgc acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac 1200 gacgagaagg acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg 1260 gggacgccct tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag 1320 cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg 1380 gactacaaca acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg 1440 gccatctgga cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac 1500 ggcggctaca ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag 1560 ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc 1620 aagtcccagg actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg 1680 gagtccgcgt tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc 1740 gaggtcccca ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac 1800 cccggcgccc cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc 1860 cacttcgagg ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc 1920 ctgcagacct tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc 1980 tccaactggg agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc 2040 gtgcgcaagt tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac 2100 ctgaaggccg agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc 2160 aacaccacgt tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc 2220 ctggagttcg agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc 2280 gcggacctct ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc 2340 ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg 2400 aaggagaacc cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag 2460 aacgacctgt cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac 2520 ttcaacgacg gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg 2580 ggctccgtga acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg 2640 cgcgaggtca agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc 2700 tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc 2760 gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct 2820 agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc 2880 ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc 2940 ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc 3000 aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat 3060 ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg 3120 cacctcagcg cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca 3180 ttagcgaagc gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc 3240 ggtggagctg atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta 3300 tgacacttcc agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac 3360 accgatgatg cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc 3420 tccagggcga gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct 3480 accaaagcca tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg 3540 tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca 3600 ctagtatggc caccgcatcc actttctcgg cgttcaatgc ccgctgcggc gacctgcgtc 3660 gctcggcggg ctccgggccc cggcgcccag cgaggcccct ccccgtgcgc gggcgcgccg 3720 ccaccggcga gcagccctcc ggcgtggcct ccctgcgcga ggccgacaag gagaagtccc 3780 tgggcaaccg cctgcgcctg ggctccctga ccgaggacgg cctgtcctac aaggagaagt 3840 tcgtgatccg ctgctacgag gtgggcatca acaagaccgc caccatcgag accatcgcca 3900 acctgctgca ggaggtgggc ggcaaccacg cccagggcgt gggcttctcc accgacggct 3960 tcgccaccac caccaccatg cgcaagctgc acctgatctg ggtgaccgcc cgcatgcaca 4020 tcgagatcta ccgctacccc gcctggtccg acgtgatcga gatcgagacc tgggtgcagg 4080 gcgagggcaa ggtgggcacc cgccgcgact ggatcctgaa ggactacgcc aacggcgagg 4140 tgatcggccg cgccacctcc aagtgggtga tgatgaacga ggacacccgc cgcctgcaga 4200 aggtgtccga cgacgtgcgc gaggagtacc tggtgttctg cccccgcacc ctgcgcctgg 4260 ccttccccga ggagaacaac aactccatga agaagatccc caagctggag gaccccgccg 4320 agtactcccg cctgggcctg gtgccccgcc gctccgacct ggacatgaac aagcacgtga 4380 acaacgtgac ctacatcggc tgggccctgg agtccatccc ccccgagatc atcgacaccc 4440 acgagctgca ggccatcacc ctggactacc gccgcgagtg ccagcgcgac gacatcgtgg 4500 actccctgac ctcccgcgag cccctgggca acgccgccgg cgtgaagttc aaggagatca 4560 acggctccgt gtcccccaag aaggacgagc aggacctgtc ccgcttcatg cacctgctgc 4620 gctccgccgg ctccggcctg gagatcaacc gctgccgcac cgagtggcgc aagaagcccg 4680 ccaagcgcat ggactacaag gaccacgacg gcgactacaa ggaccacgac atcgactaca 4740 aggacgacga cgacaagtga atcgatagat ctcttaaggc agcagcagct cggatagtat 4800 cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg ctgccttgac 4860 ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct tgtgtgtacg 4920 cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca gcatcccctt 4980 ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc tgctatccct 5040 cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg gctccgcctg 5100 tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac gggaagtagt 5160 gggatgggaa cacaaatgga aagcttaatt aagagctccc gccaccactc caacacgggg 5220 tgcctggaca aggacgaggt gtttgtgccg ccgcaccgcg cagtggcgca cgagggcctg 5280 gagtgggagg agtggctgcc catccgcatg ggcaaggtgc tggtcaccct gaccctgggc 5340 tggccgctgt acctcatgtt caacgtcgcc tcgcggccgt acccgcgctt cgccaaccac 5400 tttgacccgt ggtcgcccat cttcagcaag cgcgagcgca tcgaggtggt catctccgac 5460 ctggcgctgg tggcggtgct cagcgggctc agcgtgctgg gccgcaccat gggctgggcc 5520 tggctggtca agacctacgt ggtgccctac ctgatcgtga acatgtggct cgtgctcatc 5580 acgctgctcc agcacacgca cccggcgctg ccgcactact tcgagaagga ctgggactgg 5640 ctgcgcggcg ccatggccac cgtggaccgc tccatgggcc cgcccttcat ggacaacatc 5700 ctgcaccaca tctccgacac ccacgtgctg caccacctct tcagcaccat cccgcactac 5760 cacgccgagg aggcctccgc cgccatcagg cccatcctgg gcaagtacta ccagtccgac 5820 agccgctggg tcggccgcgc cctgtgggag gactggcgcg actgccgcta cgtcgtcccg 5880 gacgcgcccg aggacgactc cgcgctctgg ttccacaagt gagtgagtga gaagagc 5937 <210> 263 <211> 1155 <212> DNA <213> Carthamus tinctorius <400> 263 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgccacc 120 ggcgagcagc cctccggcgt ggcctccctg cgcgaggccg acaaggagaa gtccctgggc 180 aaccgcctgc gcctgggctc cctgaccgag gacggcctgt cctacaagga gaagttcgtg 240 atccgctgct acgaggtggg catcaacaag accgccacca tcgagaccat cgccaacctg 300 ctgcaggagg tgggcggcaa ccacgcccag ggcgtgggct tctccaccga cggcttcgcc 360 accaccacca ccatgcgcaa gctgcacctg atctgggtga ccgcccgcat gcacatcgag 420 atctaccgct accccgcctg gtccgacgtg atcgagatcg agacctgggt gcagggcgag 480 ggcaaggtgg gcacccgccg cgactggatc ctgaaggact acgccaacgg cgaggtgatc 540 ggccgcgcca cctccaagtg ggtgatgatg aacgaggaca cccgccgcct gcagaaggtg 600 tccgacgacg tgcgcgagga gtacctggtg ttctgccccc gcaccctgcg cctggccttc 660 cccgaggaga acaacaactc catgaagaag atccccaagc tggaggaccc cgccgagtac 720 tcccgcctgg gcctggtgcc ccgccgctcc gacctggaca tgaacaagca cgtgaacaac 780 gtgacctaca tcggctgggc cctggagtcc atcccccccg agatcatcga cacccacgag 840 ctgcaggcca tcaccctgga ctaccgccgc gagtgccagc gcgacgacat cgtggactcc 900 ctgacctccc gcgagcccct gggcaacgcc gccggcgtga agttcaagga gatcaacggc 960 tccgtgtccc ccaagaagga cgagcaggac ctgtcccgct tcatgcacct gctgcgctcc 1020 gccggctccg gcctggagat caaccgctgc cgcaccgagt ggcgcaagaa gcccgccaag 1080 cgcatggact acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac 1140 gacgacgaca agtga 1155 <210> 264 <211> 6758 <212> DNA <213> Myristica fragrans <400> 264 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080 gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140 acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200 acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260 tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320 tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380 acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440 cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500 ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560 cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620 actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680 tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740 ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800 cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860 ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920 tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980 agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040 tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100 agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160 tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220 agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280 ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340 ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400 cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460 cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520 gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580 acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640 agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700 atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760 aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820 gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880 accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940 cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000 ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060 gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120 cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180 gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240 atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300 gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360 accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420 cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480 tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540 tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600 gtccgtgtca tccactctaa agaactcgac tacgacctac tgatggccct agattcttca 3660 tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720 ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780 ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840 ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900 gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960 aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020 cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080 ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140 gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200 gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260 aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320 ggcccacagg ccggtcgcag ccactagtat ggctatcaag acgaacaggc agcctgtgga 4380 gaagcctccg ttcacgatcg ggacgctgcg caaggccatc cccgcgcact gtttcgagcg 4440 ctcggcgctt cgtgggcgcg ccgccaacgc ccacaccgtg cccaagatca acggcaacaa 4500 ggccggcctg ctgaccccca tggagagcac caaggacgag gacatcgtcg cggcccccac 4560 cgtggcgccc aagcgcacct tcatcaacca gctgcccgac tggtcgatgc tgctggccgc 4620 gatcaccacc atcttcctgg cggccgagaa gcagtggacc aacctggact ggaagccccg 4680 ccgccccgac atgctggtcg acttcgaccc cttctccctg ggccgcttcg tgcaggacgg 4740 cctgatcttc cgccagaact tcagcatccg ctcgtacgag atcggcgcgg accgcaccgc 4800 ctccatcgag accctgatga accacctgca ggagaccgcg ctgaaccacg tccgctgcat 4860 cggcctgctg gacgacggct tcggcagcac ccccgagatg acccgccgcg acctgatctg 4920 ggtggtcacc cgcatgcagg tcctggtgga ccgctacccc tcgtggggcg acgtgatcga 4980 ggtcgactcc tgggtgaccc ccagcggcaa gaacggcatg aagcgcgagt ggttcctgcg 5040 cgactgcaag accggcgaga tcctgacccg cgccacctcg gtctgggtga tgatgaacaa 5100 gcgcacccgc cgcctgtcca agatccccga ggaggtccgc gtggagatcg agccctactt 5160 cgtcgagcac ggcgtgctgg acgaggactc gcgcaagctg cccaagctga acgacaacac 5220 cgccaactac atccgccgcg gcctggcgcc ccgctggtcc gacctggacg tcaaccagca 5280 cgtgaacaac gtcaagtaca tcggctggat cctggagagc gtgcccagca gcctgctgga 5340 gtcgcacgag ctgtacggca tgaccctgga gtaccgcaag gagtgcggca aggacggcct 5400 gctgcagtcc ctgaccgccg tcgccagcga ctacggcggc ggctcgctgg aggccggcgt 5460 ggagtgcgac cacctgctgc gcctggagga cggctccgag atcatgcgcg gcaagaccga 5520 gtggcgcccc aagcgcgccg cgaacaccac ctacttcggc agcgtcgacg acatcccccc 5580 cgccaacaac gcgtgactcg aggcagcagc agctcggata gtatcgacac actctggacg 5640 ctggtcgtgt gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc 5700 cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc 5760 tagctgcttg tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg 5820 cttgcatccc aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct 5880 cctgctcact gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg 5940 caacctgtaa accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa 6000 tggaaagctt gagctcttgt tttccagaag gagttgctcc ttgagccttt cattctcagc 6060 ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa agcttggaat 6120 gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa ggaccatcag 6180 ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct gccctgttga 6240 aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc agaatgtgga 6300 atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac acccgccact 6360 cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat atttctcgaa 6420 gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg tgcttgcgga 6480 gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc acccccgcga 6540 tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct ggcccaggcg 6600 agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct tctgccgctc 6660 tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga gtccgcaaac 6720 ccttgtcgcg tggcggggct tgttcgagct tgaagagc 6758 <210> 265 <211> 1248 <212> DNA <213> Myristica fragrans <400> 265 atggctatca agacgaacag gcagcctgtg gagaagcctc cgttcacgat cgggacgctg 60 cgcaaggcca tccccgcgca ctgtttcgag cgctcggcgc ttcgtgggcg cgccgccaac 120 gcccacaccg tgcccaagat caacggcaac aaggccggcc tgctgacccc catggagagc 180 accaaggacg aggacatcgt cgcggccccc accgtggcgc ccaagcgcac cttcatcaac 240 cagctgcccg actggtcgat gctgctggcc gcgatcacca ccatcttcct ggcggccgag 300 aagcagtgga ccaacctgga ctggaagccc cgccgccccg acatgctggt cgacttcgac 360 cccttctccc tgggccgctt cgtgcaggac ggcctgatct tccgccagaa cttcagcatc 420 cgctcgtacg agatcggcgc ggaccgcacc gcctccatcg agaccctgat gaaccacctg 480 caggagaccg cgctgaacca cgtccgctgc atcggcctgc tggacgacgg cttcggcagc 540 acccccgaga tgacccgccg cgacctgatc tgggtggtca cccgcatgca ggtcctggtg 600 gaccgctacc cctcgtgggg cgacgtgatc gaggtcgact cctgggtgac ccccagcggc 660 aagaacggca tgaagcgcga gtggttcctg cgcgactgca agaccggcga gatcctgacc 720 cgcgccacct cggtctgggt gatgatgaac aagcgcaccc gccgcctgtc caagatcccc 780 gaggaggtcc gcgtggagat cgagccctac ttcgtcgagc acggcgtgct ggacgaggac 840 tcgcgcaagc tgcccaagct gaacgacaac accgccaact acatccgccg cggcctggcg 900 ccccgctggt ccgacctgga cgtcaaccag cacgtgaaca acgtcaagta catcggctgg 960 atcctggaga gcgtgcccag cagcctgctg gagtcgcacg agctgtacgg catgaccctg 1020 gagtaccgca aggagtgcgg caaggacggc ctgctgcagt ccctgaccgc cgtcgccagc 1080 gactacggcg gcggctcgct ggaggccggc gtggagtgcg accacctgct gcgcctggag 1140 gacggctccg agatcatgcg cggcaagacc gagtggcgcc ccaagcgcgc cgcgaacacc 1200 acctacttcg gcagcgtcga cgacatcccc cccgccaaca acgcgtga 1248 <210> 266 <211> 1260 <212> DNA <213> Myristica fragrans <400> 266 actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60 acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120 gccaacgccc acaccgtgcc caagatcaac ggcaacaagg ccggcctgct gacccccatg 180 gagagcacca aggacgagga catcgtcgcg gcccccaccg tggcgcccaa gcgcaccttc 240 atcaaccagc tgcccgactg gtcgatgctg ctggccgcga tcaccaccat cttcctggcg 300 gccgagaagc agtggaccaa cctggactgg aagccccgcc gccccgacat gctggtcgac 360 ttcgacccct tctccctggg ccgcttcgtg caggacggcc tgatcttccg ccagaacttc 420 agcatccgct cgtacgagat cggcgcggac cgcaccgcct ccatcgagac cctgatgaac 480 cacctgcagg agaccgcgct gaaccacgtc cgctgcatcg gcctgctgga cgacggcttc 540 ggcagcaccc ccgagatgac ccgccgcgac ctgatctggg tggtcacccg catgcaggtc 600 ctggtggacc gctacccctc gtggggcgac gtgatcgagg tcgactcctg ggtgaccccc 660 agcggcaaga acggcatgaa gcgcgagtgg ttcctgcgcg actgcaagac cggcgagatc 720 ctgacccgcg ccacctcggt ctgggtgatg atgaacaagc gcacccgccg cctgtccaag 780 atccccgagg aggtccgcgt ggagatcgag ccctacttcg tcgagcacgg cgtgctggac 840 gaggactcgc gcaagctgcc caagctgaac gacaacaccg ccaactacat ccgccgcggc 900 ctggcgcccc gctggtccga cctggacgtc aaccagcacg tgaacaacgt caagtacatc 960 ggctggatcc tggagagcgt gcccagcagc ctgctggagt cgcacgagct gtacggcatg 1020 accctggagt accgcaagga gtgcggcaag gacggcctgc tgcagtccct gaccgccgtc 1080 gccagcgact acggcggcgg ctcgctggag gccggcgtgg agtgcgacca cctgctgcgc 1140 ctggaggacg gctccgagat catgcgcggc aagaccgagt ggcgccccaa gcgcgccgcg 1200 aacaccacct acttcggcag cgtcgacgac atcccccccg ccaacaacgc gtgactcgag 1260 <210> 267 <211> 415 <212> PRT <213> Artificial Sequence <220> <223> synthesized construct <400> 267 Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr 1 5 10 15 Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser 20 25 30 Ala Leu Arg Gly Arg Ala Ala Asn Ala His Thr Val Pro Lys Ile Asn 35 40 45 Gly Asn Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu 50 55 60 Asp Ile Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn 65 70 75 80 Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe 85 90 95 Leu Ala Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg 100 105 110 Pro Asp Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val 115 120 125 Gln Asp Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu 130 135 140 Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu 145 150 155 160 Gln Glu Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp 165 170 175 Gly Phe Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val 180 185 190 Val Thr Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp 195 200 205 Val Ile Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met 210 215 220 Lys Arg Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr 225 230 235 240 Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu 245 250 255 Ser Lys Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val 260 265 270 Glu His Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn 275 280 285 Asp Asn Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser 290 295 300 Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp 305 310 315 320 Ile Leu Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr 325 330 335 Gly Met Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu 340 345 350 Gln Ser Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu 355 360 365 Ala Gly Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu 370 375 380 Ile Met Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr 385 390 395 400 Thr Tyr Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala 405 410 415 <210> 268 <211> 5805 <212> DNA <213> Ricinus communis <400> 268 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240 gctgatggtc gaaacgttca cagcctaggg atatcgaatt cctttcttgc gctatgacac 3300 ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat 3360 gatgcttcga ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg 3420 gcgagcgctg tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa 3480 gccatattca aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg 3540 cactccgcta agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacactagta 3600 tggccaccgc atccactttc tcggcgttca atgcccgctg cggcgacctg cgtcgctcgg 3660 cgggctccgg gccccggcgc ccagcgaggc ccctccccgt gcgcgggcgc gcccgctcct 3720 acgaggtggg catcaacaag accgccaccg tggagaccat cgccaacctg ctgcaggagg 3780 tgggctgcaa ccacgcccag tccgtgggct tctccaccga cggcttcgcc accaccacct 3840 ccatgcgcaa gatgcacctg atctgggtga ccgcccgcat gcacatcgag atctacaagt 3900 accccgcctg gtccgacgtg gtggaggtgg agacctggtg ccagtccgag ggccgcatcg 3960 gcacccgccg cgactggatc ctgaccgact acgccaccgg ccagatcatc ggccgcgcca 4020 cctccaagtg ggtgatgatg aaccaggaca cccgccgcct gcagaaggtg accgacgacg 4080 tgcgcgagga gtacctggtg ttctgccccc gcgagctgcg cctggccttc cccgaggaga 4140 acaaccgctc ctccaagaag atctccaagc tggaggaccc cgcccagtac tccaagctgg 4200 gcctggtgcc ccgccgcgcc gacctggaca tgaaccagca cgtgaacaac gtgacctaca 4260 tcggctgggt gctggagtcc atcccccagg agatcatcga cacccacgag ctgcagacca 4320 tcaccctgga ctaccgccgc gagtgccagc acgacgacat cgtggactcc ctgacctccg 4380 tggagccctc cgagaacctg gaggccgtgt ccgagctgcg cggcaccaac ggctccgcca 4440 ccaccaccgc cggcgacgag gactgccgca acttcctgca cctgctgcgc ctgtccggcg 4500 acggcctgga gatcaaccgc ggccgcaccg agtggcgcaa gaagtccgcc cgcatggact 4560 acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac gacgacgaca 4620 agtgaatcga tagatctctt aaggcagcag cagctcggat agtatcgaca cactctggac 4680 gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 4740 ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 4800 ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 4860 gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 4920 tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 4980 gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5040 atggaaagct taattaagag ctcttgtttt ccagaaggag ttgctccttg agcctttcat 5100 tctcagcctc gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc 5160 ttggaatgtt ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga 5220 ccatcagctc caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc 5280 ctgttgaaat cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga 5340 atgtggaatc atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc 5400 cgccactcgt acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt 5460 tctcgaagct ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc 5520 ttgcggaggg caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc 5580 cccgcgatgg gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc 5640 ccaggcgagc gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct 5700 gccgctctgc tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc 5760 cgcaaaccct tgtcgcgtgg cggggcttgt tcgagcttga agagc 5805 <210> 269 <211> 1026 <212> DNA <213> Ricinus communis <400> 269 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccgctcc 120 tacgaggtgg gcatcaacaa gaccgccacc gtggagacca tcgccaacct gctgcaggag 180 gtgggctgca accacgccca gtccgtgggc ttctccaccg acggcttcgc caccaccacc 240 tccatgcgca agatgcacct gatctgggtg accgcccgca tgcacatcga gatctacaag 300 taccccgcct ggtccgacgt ggtggaggtg gagacctggt gccagtccga gggccgcatc 360 ggcacccgcc gcgactggat cctgaccgac tacgccaccg gccagatcat cggccgcgcc 420 acctccaagt gggtgatgat gaaccaggac acccgccgcc tgcagaaggt gaccgacgac 480 gtgcgcgagg agtacctggt gttctgcccc cgcgagctgc gcctggcctt ccccgaggag 540 aacaaccgct cctccaagaa gatctccaag ctggaggacc ccgcccagta ctccaagctg 600 ggcctggtgc cccgccgcgc cgacctggac atgaaccagc acgtgaacaa cgtgacctac 660 atcggctggg tgctggagtc catcccccag gagatcatcg acacccacga gctgcagacc 720 atcaccctgg actaccgccg cgagtgccag cacgacgaca tcgtggactc cctgacctcc 780 gtggagccct ccgagaacct ggaggccgtg tccgagctgc gcggcaccaa cggctccgcc 840 accaccaccg ccggcgacga ggactgccgc aacttcctgc acctgctgcg cctgtccggc 900 gacggcctgg agatcaaccg cggccgcacc gagtggcgca agaagtccgc ccgcatggac 960 tacaaggacc acgacggcga ctacaaggac cacgacatcg actacaagga cgacgacgac 1020 aagtga 1026 <210> 270 <211> 5110 <212> DNA <213> Cinnamomum camphora <400> 270 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960 cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020 cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080 tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140 tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200 accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260 gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320 tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380 gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440 tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500 ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560 ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620 gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680 cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740 gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800 tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860 gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920 ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980 tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040 ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100 tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160 tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220 cacgggaagt agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc 2280 agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc 2340 acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc 2400 acgttggcga ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc 2460 ctagggatat cgaattcctt tcttgcgcta tgacacttcc agcaaaaggt agggcgggct 2520 gcgagacggc ttcccggcgc tgcatgcaac accgatgatg cttcgacccc ccgaagctcc 2580 ttcggggctg catgggcgct ccgatgccgc tccagggcga gcgctgttta aatagccagg 2640 cccccgattg caaagacatt atagcgagct accaaagcca tattcaaaca cctagatcac 2700 taccacttct acacaggcca ctcgagcttg tgatcgcact ccgctaaggg ggcgcctctt 2760 cctcttcgtt tcagtcacaa cccgcaaaca ctagtatggc caccgcatcc actttctcgg 2820 cgttcaatgc ccgctgcggc gacctgcgtc gctcggcggg ctccgggccc cggcgcccag 2880 cgaggcccct ccccgtgcgc gggcgcgccc ccgactggtc catgctgttc gccgtgatca 2940 ccaccatctt ctccgccgcc gagaagcagt ggaccaacct ggagtggaag cccaagccca 3000 acccccccca gctgctggac gaccacttcg gcccccacgg cctggtgttc cgccgcacct 3060 tcgccatccg cagctacgag gtgggccccg accgctccac cagcatcgtg gccgtgatga 3120 accacctgca ggaggccgcc ctgaaccacg ccaagtccgt gggcatcctg ggcgacggct 3180 tcggcaccac cctggagatg tccaagcgcg acctgatctg ggtggtgaag cgcacccacg 3240 tggccgtgga gcgctacccc gcctggggcg acaccgtgga ggtggagtgc tgggtgggcg 3300 cctccggcaa caacggccgc cgccacgact tcctggtgcg cgactgcaag accggcgaga 3360 tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac ccgcacccgc cgcctgagca 3420 agatccccga ggaggtgcgc ggcgagatcg gccccgcctt catcgacaac gtggccgtga 3480 aggacgagga gatcaagaag ccccagaagc tgaacgactc caccgccgac tacatccagg 3540 gcggcctgac cccccgctgg aacgacctgg acatcaacca gcacgtgaac aacatcaagt 3600 acgtggactg gatcctggag accgtgcccg acagcatctt cgagagccac cacatctcct 3660 ccttcaccat cgagtaccgc cgcgagtgca ccatggacag cgtgctgcag tccctgacca 3720 ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga gcacctgctg cagctggagg 3780 gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc caagctgacc gactccttcc 3840 gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga ctacaaggac cacgacggcg 3900 actacaagga ccacgacatc gactacaagg acgacgacga caagtgactc gaggcagcag 3960 cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac 4020 acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt 4080 gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac 4140 ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc 4200 tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg 4260 tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga 4320 tgcacgggaa gtagtgggat gggaacacaa atggaaagct tgagctcctt gttttccaga 4380 aggagttgct ccttgagcct ttcattctca gcctcgataa cctccaaagc cgctctaatt 4440 gtggaggggg ttcgaattta aaagcttgga atgttggttc gtgcgtctgg aacaagccca 4500 gacttgttgc tcactgggaa aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg 4560 tacctctgct ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat attgtgacgc 4620 ttgagcagtc tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc 4680 caggcatgtc gcgggcgagg acacccgcca ctcgtacagc agaccattat gctacctcac 4740 aatagttcat aacagtgacc atatttctcg aagctcccca acgagcacct ccatgctctg 4800 agtggccacc ccccggccct ggtgcttgcg gagggcaggt caaccggcat ggggctaccg 4860 aaatccccga ccggatccca ccacccccgc gatgggaaga atctctcccc gggatgtggg 4920 cccaccacca gcacaacctg ctggcccagg cgagcgtcaa accataccac acaaatatcc 4980 ttggcatcgg ccctgaattc cttctgccgc tctgctaccc ggtgcttctg tccgaagcag 5040 gggttgctag ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag 5100 cttgaagagc 5110 <210> 271 <211> 1152 <212> DNA <213> Cinnamomum camphora <400> 271 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120 tggtccatgc tgttcgccgt gatcaccacc atcttctccg ccgccgagaa gcagtggacc 180 aacctggagt ggaagcccaa gcccaacccc ccccagctgc tggacgacca cttcggcccc 240 cacggcctgg tgttccgccg caccttcgcc atccgcagct acgaggtggg ccccgaccgc 300 tccaccagca tcgtggccgt gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag 360 tccgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420 atctgggtgg tgaagcgcac ccacgtggcc gtggagcgct accccgcctg gggcgacacc 480 gtggaggtgg agtgctgggt gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg 540 gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgatgatg 600 aacacccgca cccgccgcct gagcaagatc cccgaggagg tgcgcggcga gatcggcccc 660 gccttcatcg acaacgtggc cgtgaaggac gaggagatca agaagcccca gaagctgaac 720 gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacatc 780 aaccagcacg tgaacaacat caagtacgtg gactggatcc tggagaccgt gcccgacagc 840 atcttcgaga gccaccacat ctcctccttc accatcgagt accgccgcga gtgcaccatg 900 gacagcgtgc tgcagtccct gaccaccgtg agcggcggct cctccgaggc cggcctggtg 960 tgcgagcacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg 1020 cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gtccagcgtg 1080 atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140 gacgacaagt ga 1152 <210> 272 <211> 5576 <212> DNA <213> Cinnamomum camphora <400> 272 gaattcgccc tcccgtgatc acacaggtgc cttgcgagcg tgatcacact attttggggg 60 tcctacagta ctgaaatggt gagaagtcgt actgaaatca aggatgaaca atgaaaatgg 120 tgctgtggtg gcttctcaaa ggtcaagaat cagtcgctcg cgtcaggaaa tcgcggcgtc 180 aaccagcgtg ggcgcggtca gtggccccgc actggtcacc atagcctctc ctgccacagt 240 agcgatcccc tgggcgttca ctctcagcag cggctgtact gcctcccaga ttttcttctt 300 ctggacctgc gggcgtgaga ggatgagcag ggtgggccaa gggctcaatc ctgaacggcc 360 ctcattcggt ttccaatccc acaacacata cccacagcag gtcagaccac gcattccacc 420 atgcgcacca ataacgtgtc cttacctgat tgggtgtggc aggctccgtg gacaggagtg 480 cctcgtcccc cgcccagacc cgctcccccg tcacggcggc gtccgggacc cgcagcggct 540 ccaccgcggt gtgatccgcg ttggcggcgc agagcagcat cccagccgat ttgaccccgc 600 gcatgctccg aggcttgagg ttggccagca ccaccacccg ccggccgaca aggtcctcca 660 gggtcacgtg ccggaccagg ccactcacga tggtgcgagg gcccccctcc tcgccgaggt 720 cgatctgctc gacgtacaga ctgcgacatg cgtggcgagt ggtcatcaga aggaagcagg 780 tgtgcagaag gggcacgtgg ttggtattga gagtagccaa agctttgtgc caatcagaaa 840 gtcaacgcag ctgcctgcct ggctcgcgta caattccttt cttgcgctat gacacttcca 900 gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca ccgatgatgc 960 ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct ccagggcgag 1020 cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta ccaaagcata 1080 ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 1140 gctaaggggg cgcctcttcc cttcgtttca gtcacaaccc gcaaacggcg cgccatgctg 1200 ctgcaggcct tcctgttcct gctggccggc ttcgccgcca agatcagcgc ctccatgacg 1260 aacgagacgt ccgaccgccc cctggtgcac ttcaccccca acaagggctg gatgaacgac 1320 cccaacggcc tgtggtacga cgagaaggac gccaagtggc acctgtactt ccagtacaac 1380 ccgaacgaca ccgtctgggg gacgcccttg ttctggggcc acgccacgtc cgacgacctg 1440 accaactggg aggaccagcc catcgccatc gccccgaagc gcaacgactc cggcgccttc 1500 tccggctcca tggtggtgga ctacaacaac acctccggct tcttcaacga caccatcgac 1560 ccgcgccagc gctgcgtggc catctggacc tacaacaccc cggagtccga ggagcagtac 1620 atctcctaca gcctggacgg cggctacacc ttcaccgagt accagaagaa ccccgtgctg 1680 gccgccaact ccacccagtt ccgcgacccg aaggtcttct ggtacgagcc ctcccagaag 1740 tggatcatga ccgcggccaa gtcccaggac tacaagatcg agatctactc ctccgacgac 1800 ctgaagtcct ggaagctgga gtccgcgttc gccaacgagg gcttcctcgg ctaccagtac 1860 gagtgccccg gcctgatcga ggtccccacc gagcaggacc ccagcaagtc ctactgggtg 1920 atgttcatct ccatcaaccc cggcgccccg gccggcggct ccttcaacca gtacttcgtc 1980 ggcagcttca acggcaccca cttcgaggcc ttcgacaacc agtcccgcgt ggtggacttc 2040 ggcaaggact actacgccct gcagaccttc ttcaacaccg acccgaccta cgggagcgcc 2100 ctgggcatcg cgtgggcctc caactgggag tactccgcct tcgtgcccac caacccctgg 2160 cgctcctcca tgtccctcgt gcgcaagttc tccctcaaca ccgagtacca ggccaacccg 2220 gagacggagc tgatcaacct gaaggccgag ccgatcctga acatcagcaa cgccggcccc 2280 tggagccggt tcgccaccaa caccacgttg acgaaggcca acagctacaa cgtcgacctg 2340 tccaacagca ccggcaccct ggagttcgag ctggtgtacg ccgtcaacac cacccagacg 2400 atctccaagt ccgtgttcgc ggacctctcc ctctggttca agggcctgga ggaccccgag 2460 gagtacctcc gcatgggctt cgaggtgtcc gcgtcctcct tcttcctgga ccgcgggaac 2520 agcaaggtga agttcgtgaa ggagaacccc tacttcacca accgcatgag cgtgaacaac 2580 cagcccttca agagcgagaa cgacctgtcc tactacaagg tgtacggctt gctggaccag 2640 aacatcctgg agctgtactt caacgacggc gacgtcgtgt ccaccaacac ctacttcatg 2700 accaccggga acgccctggg ctccgtgaac atgacgacgg gggtggacaa cctgttctac 2760 atcgacaagt tccaggtgcg cgaggtcaag tgattaatta actcgaggca gcagcagctc 2820 ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 2880 tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 2940 gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3000 catcccctcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 3060 ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 3120 tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 3180 gaagtagtgg gatgggaaca caaatggaaa gcttgagctc ctttcttgcg ctatgacact 3240 tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg 3300 atgcttcgac cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg 3360 cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag 3420 ccatattcaa acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc 3480 actccgctaa gggggcgcct cttcctcttc gtttcagtca caacccgcaa acactagtat 3540 gacgttcggg gtcgccctcc cggccatggg ccgcggtgtc tcccttcccc ggcccagggt 3600 cgcggtgcgc gcccagtcgg cgagtcaggt tttggagagc gggcgcgccc ccgactggtc 3660 catgctgttc gccgtgatca ccaccatctt ctccgccgcc gagaagcagt ggaccaacct 3720 ggagtggaag cccaagccca acccccccca gctgctggac gaccacttcg gcccccacgg 3780 cctggtgttc cgccgcacct tcgccatccg cagctacgag gtgggccccg accgctccac 3840 cagcatcgtg gccgtgatga accacctgca ggaggccgcc ctgaaccacg ccaagtccgt 3900 gggcatcctg ggcgacggct tcggcaccac cctggagatg tccaagcgcg acctgatctg 3960 ggtggtgaag cgcacccacg tggccgtgga gcgctacccc gcctggggcg acaccgtgga 4020 ggtggagtgc tgggtgggcg cctccggcaa caacggccgc cgccacgact tcctggtgcg 4080 cgactgcaag accggcgaga tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac 4140 ccgcacccgc cgcctgagca agatccccga ggaggtgcgc ggcgagatcg gccccgcctt 4200 catcgacaac gtggccgtga aggacgagga gatcaagaag ccccagaagc tgaacgactc 4260 caccgccgac tacatccagg gcggcctgac cccccgctgg aacgacctgg acatcaacca 4320 gcacgtgaac aacatcaagt acgtggactg gatcctggag accgtgcccg acagcatctt 4380 cgagagccac cacatctcct ccttcaccat cgagtaccgc cgcgagtgca ccatggacag 4440 cgtgctgcag tccctgacca ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga 4500 gcacctgctg cagctggagg gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc 4560 caagctgacc gactccttcc gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga 4620 ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 4680 caagtgactc gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 4740 tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 4800 caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctcttg 4860 tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4920 aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4980 gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5040 accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5100 gtacccgtac ccatcagcat ccgggtgaat cttggcctcc aagatatggc caatcctcac 5160 atccagcttg gcaaaatcga ctagactgtc tgcaagtggg aatgtggagc acaaggttgc 5220 ttgtagcgat cgacagactg gtggggtaca ttgacaggtg ggcagcgccg catccatcgt 5280 gcctgacgcg agcgccgccg gttgctcgcc cgtgcctgcc gtcaaagagc ggcagagaaa 5340 tcgggaaccg aaaacgtcac attgcctgat gttgttacat gctggactag actttcttgg 5400 cgtgggtctg ctcctcgcca ggtgcgcgac gcctcggggc tgggtgcgag ggagccgtgc 5460 ggccacgcat ttgacaagac ccaaagctcg catctcagac ggtcaaccgt tcgtattata 5520 cattcaacat atggtacata cgcaaaaagc atgccaacga tgacataggc gaattc 5576 <210> 273 <211> 6981 <212> DNA <213> Cinnamomum camphora <400> 273 gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60 cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120 caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180 gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240 ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300 cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360 accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420 gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480 ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540 cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600 ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660 cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720 gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780 gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840 ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900 taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960 cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020 ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080 ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140 gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200 cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260 cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320 ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380 ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440 ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500 ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560 caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620 catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680 gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740 ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800 catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860 cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920 ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980 catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040 ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100 ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160 ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220 cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280 caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340 cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400 ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460 cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520 cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580 cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640 caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700 acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760 gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820 tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880 cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940 gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000 ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060 tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120 ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180 ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240 ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300 ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 3360 tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 3420 ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 3480 gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 3540 aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 3600 cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 3660 tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 3720 ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 3780 aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 3840 ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 3900 tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 3960 gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 4020 agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 4080 ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 4140 taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 4200 taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 4260 ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 4320 cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag tatggccacc 4380 gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4440 gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4500 ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4560 tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4620 gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4680 atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 4740 atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 4800 gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 4860 gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 4920 tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 4980 acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5040 gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5100 gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5160 gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5220 agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5280 ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5340 ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5400 ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5460 aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5520 tgactcgagt taattaactc gaggcagcag cagctcggat agtatcgaca cactctggac 5580 gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 5640 ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 5700 ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 5760 gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 5820 tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 5880 gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5940 atggaaagct gtagagctcc ttgttttcca gaaggagttg ctccttgagc ctttcattct 6000 cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 6060 gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 6120 tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 6180 ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 6240 tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 6300 cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 6360 cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 6420 cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 6480 gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 6540 ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 6600 gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 6660 aaacccttgt cgcgtggcgg ggcttgttcg agcttgttcg agcttgaaga gcctctagag 6720 tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 6780 tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 6840 ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 6900 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 6960 ttgcgtattg ggcgctcttc c 6981 <210> 274 <211> 5923 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 274 gctcttccgc ctggagctgg tgcagagcat ggggcagttt gcggaggaga gggtgctccc 60 cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120 gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180 gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240 catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300 gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360 ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420 caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480 cttccaggag cgcgccacca agtaggtacc ctttcttgcg ctatgacact tccagcaaaa 540 ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac 600 cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt 660 ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa 720 acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa 780 gggggcgcct cttcctcttc gtttcagtca caacccgcaa actctagaat atcaatatca 840 atgctgctgc aggccttcct gttcctgctg gccggcttcg ccgccaagat cagcgcctcc 900 atgacgaacg agacgtccga ccgccccctg gtgcacttca cccccaacaa gggctggatg 960 aacgacccca acggcctgtg gtacgacgag aaggacgcca agtggcacct gtacttccag 1020 tacaacccga acgacaccgt ctgggggacg cccttgttct ggggccacgc cacgtccgac 1080 gacctgacca actgggagga ccagcccatc gccatcgccc cgaagcgcaa cgactccggc 1140 gccttctccg gctccatggt ggtggactac aacaacacct ccggcttctt caacgacacc 1200 atcgacccgc gccagcgctg cgtggccatc tggacctaca acaccccgga gtccgaggag 1260 cagtacatct cctacagcct ggacggcggc tacaccttca ccgagtacca gaagaacccc 1320 gtgctggccg ccaactccac ccagttccgc gacccgaagg tcttctggta cgagccctcc 1380 cagaagtgga tcatgaccgc ggccaagtcc caggactaca agatcgagat ctactcctcc 1440 gacgacctga agtcctggaa gctggagtcc gcgttcgcca acgagggctt cctcggctac 1500 cagtacgagt gccccggcct gatcgaggtc cccaccgagc aggaccccag caagtcctac 1560 tgggtgatgt tcatctccat caaccccggc gccccggccg gcggctcctt caaccagtac 1620 ttcgtcggca gcttcaacgg cacccacttc gaggccttcg acaaccagtc ccgcgtggtg 1680 gacttcggca aggactacta cgccctgcag accttcttca acaccgaccc gacctacggg 1740 agcgccctgg gcatcgcgtg ggcctccaac tgggagtact ccgccttcgt gcccaccaac 1800 ccctggcgct cctccatgtc cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc 1860 aacccggaga cggagctgat caacctgaag gccgagccga tcctgaacat cagcaacgcc 1920 ggcccctgga gccggttcgc caccaacacc acgttgacga aggccaacag ctacaacgtc 1980 gacctgtcca acagcaccgg caccctggag ttcgagctgg tgtacgccgt caacaccacc 2040 cagacgatct ccaagtccgt gttcgcggac ctctccctct ggttcaaggg cctggaggac 2100 cccgaggagt acctccgcat gggcttcgag gtgtccgcgt cctccttctt cctggaccgc 2160 gggaacagca aggtgaagtt cgtgaaggag aacccctact tcaccaaccg catgagcgtg 2220 aacaaccagc ccttcaagag cgagaacgac ctgtcctact acaaggtgta cggcttgctg 2280 gaccagaaca tcctggagct gtacttcaac gacggcgacg tcgtgtccac caacacctac 2340 ttcatgacca ccgggaacgc cctgggctcc gtgaacatga cgacgggggt ggacaacctg 2400 ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac aattgacgga gcgtcgtgcg 2460 ggagggagtg tgccgagcgg ggagtcccgg tctgtgcgag gcccggcagc tgacgctggc 2520 gagccgtacg ccccgagggt ccccctcccc tgcaccctct tccccttccc tctgacggcc 2580 gcgcctgttc ttgcatgttc agcgacggat cccgcgtctc gaacagagcg cgcagaggaa 2640 cgctgaaggt ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac 2700 gaatgcgctt ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg 2760 cgaggtggca ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga 2820 tatcgaattc ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc 2880 aggtcgttgc tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc 2940 gtggcaaacg ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg 3000 gaatccaagg gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc 3060 cgctcctgca aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc 3120 gcctcaccag cggacaaagc accggtgtat caggtccgtg tcatccactc taaagaactc 3180 gactacgacc tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag 3240 gattgaaact ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga 3300 gctgccagcc aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca 3360 ggtcatggga ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc 3420 taatcagcta tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt 3480 gatccttcgt gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc 3540 aactcgcgcg agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat 3600 gcgtggcacc ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg 3660 tcgccaaccc taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta 3720 ccgactaccc taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt 3780 ccattcgtgc ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt 3840 tcccgacctc cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag 3900 tatggccacc gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc 3960 ggcgggctcc gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccagct 4020 gcccgactgg agcatgctgc tggccgcgat caccaccctg ttcctggcgg ccgagaagca 4080 gtggatgatg ctggactgga agcccaagcg ccccgacatg ctggtggacc ccttcggcct 4140 gggccgcttc gtgcaggacg gcctggtgtt ccgcaacaac ttcagcatcc gcagctacga 4200 gatcggcgcg gaccgcaccg ccagcatcga gaccctgatg aaccacctgc aggagaccgc 4260 cctgaaccac gtgaagagtg tgggcctgct ggaggacggc ctgggcagca cccgcgagat 4320 gagcctgcgc aacctgatct gggtggtgac caagatgcag gtggcggtgg accgctaccc 4380 cacctggggc gacgaggtgc aggtgagcag ctgggcgacc gccatcggca agaacggcat 4440 gcgccgcgag tggatcgtga ccgacttccg caccggcgag accctgctgc gcgccaccag 4500 cgtgtgggtg atgatgaaca agctgacccg ccgcatcagc aagatccccg aggaggtgtg 4560 gcacgagatc ggccccagct tcatcgacgc gccccccctg cccaccgtgg aggacgacgg 4620 ccgcaagctg acccgcttcg acgagagcag cgccgacttc atccgcaagg gcctgacccc 4680 ccgctggagc gacctggaca tcaaccagca cgtgaacaac gtgaagtaca tcggctggct 4740 gctggagagc gcgccccccg agatccacga gagccacgag atcgccagcc tgaccctgga 4800 gtaccgccgc gagtgcggcc gcgacagcgt gctgaacagc gccaccaagg tgagcgacag 4860 cagccagctg ggcaagagcg ccgtggagtg caaccacctg gtgcgcctgc agaacggcgg 4920 cgagatcgtg aagggccgca ccgtgtggcg ccccaagcgc cccctgtaca acgacggcgc 4980 cgtggtggac gtgcccgcca agaccagctg actcgaggca gcagcagctc ggatagtatc 5040 gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 5100 tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 5160 gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 5220 cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 5280 agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 5340 attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 5400 ggatgggaac acaaatggaa agcttgagct ccagccacgg caacaccgcg cgccttgcgg 5460 ccgagcacgg cgacaagaac ctgagcaaga tctgcgggct gatcgccagc gacgagggcc 5520 ggcacgagat cgcctacacg cgcatcgtgg acgagttctt ccgcctcgac cccgagggcg 5580 ccgtcgccgc ctacgccaac atgatgcgca agcagatcac catgcccgcg cacctcatgg 5640 acgacatggg ccacggcgag gccaacccgg gccgcaacct cttcgccgac ttctccgcgg 5700 tcgccgagaa gatcgacgtc tacgacgccg aggactactg ccgcatcctg gagcacctca 5760 acgcgcgctg gaaggtggac gagcgccagg tcagcggcca ggccgccgcg gaccaggagt 5820 acgtcctggg cctgccccag cgcttccgga aactcgccga gaagaccgcc gccaagcgca 5880 agcgcgtcgc gcgcaggccc gtcgccttct cctggagaag agc 5923 <210> 275 <211> 1110 <212> DNA <213> Ulmus americana <400> 275 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccagctg 120 cccgactgga gcatgctgct ggccgcgatc accaccctgt tcctggcggc cgagaagcag 180 tggatgatgc tggactggaa gcccaagcgc cccgacatgc tggtggaccc cttcggcctg 240 ggccgcttcg tgcaggacgg cctggtgttc cgcaacaact tcagcatccg cagctacgag 300 atcggcgcgg accgcaccgc cagcatcgag accctgatga accacctgca ggagaccgcc 360 ctgaaccacg tgaagagtgt gggcctgctg gaggacggcc tgggcagcac ccgcgagatg 420 agcctgcgca acctgatctg ggtggtgacc aagatgcagg tggcggtgga ccgctacccc 480 acctggggcg acgaggtgca ggtgagcagc tgggcgaccg ccatcggcaa gaacggcatg 540 cgccgcgagt ggatcgtgac cgacttccgc accggcgaga ccctgctgcg cgccaccagc 600 gtgtgggtga tgatgaacaa gctgacccgc cgcatcagca agatccccga ggaggtgtgg 660 cacgagatcg gccccagctt catcgacgcg ccccccctgc ccaccgtgga ggacgacggc 720 cgcaagctga cccgcttcga cgagagcagc gccgacttca tccgcaaggg cctgaccccc 780 cgctggagcg acctggacat caaccagcac gtgaacaacg tgaagtacat cggctggctg 840 ctggagagcg cgccccccga gatccacgag agccacgaga tcgccagcct gaccctggag 900 taccgccgcg agtgcggccg cgacagcgtg ctgaacagcg ccaccaaggt gagcgacagc 960 agccagctgg gcaagagcgc cgtggagtgc aaccacctgg tgcgcctgca gaacggcggc 1020 gagatcgtga agggccgcac cgtgtggcgc cccaagcgcc ccctgtacaa cgacggcgcc 1080 gtggtggacg tgcccgccaa gaccagctga 1110 <210> 276 <211> 10326 <212> DNA <213> Artificial Sequence <220> <223> synthesized polynucleotide <400> 276 gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60 ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120 tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180 ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240 gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300 ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360 atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420 cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480 gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540 cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600 ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660 cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720 ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780 tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840 atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900 aaagacatta tagcgagcta ccaaagcata ttcaaacacc tagatcacta ccacttctac 960 acaggccact cgagcttgtg atcgcactcc gctaaggggg cgcctcttcc cttcgtttca 1020 gtcacaaccc gcaaacggcg cgccatatca atgctgctgc aggccttcct gttcctgctg 1080 gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140 gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200 aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260 cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320 gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380 aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440 tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500 tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560 gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620 caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680 gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740 cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800 gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860 gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920 accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980 tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040 aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100 gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160 acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220 ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280 ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340 gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400 aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460 ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520 gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580 gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640 gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700 tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760 atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820 ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880 cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940 actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000 taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060 tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120 agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180 aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240 gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggcgctatg acacttccag 3300 caaaaggtag ggcgggctgc gagacggctt cccggcgctg catgcaacac cgatgatgct 3360 tcgacccccc gaagctcctt cggggctgca tgggcgctcc gatgccgctc cagggcgagc 3420 gctgtttaaa tagccaggcc cccgattgca aagacattat agcgagctac caaagccata 3480 ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 3540 gctaaggggg cgcctcttcc tcttcgtttc agtcggccga caggacgcgc gtcaaaggtg 3600 ctggtcgtgt atgccctggc cggcaggtcg ttgctgctgc tggttagtga ttccgcaacc 3660 ctgattttgg cgtcttattt tggcgtggca aacgctggcg cccgcgagcc gggccggcgg 3720 cgatgcggtg ccccacggct gccggaatcc aagggaggca agagcgcccg ggtcagttga 3780 agggctttac gcgcaaggta cagccgctcc tgcaaggctg cgtggtggaa ttggacgtgc 3840 aggtcctgct gaagttcctc caccgcctca ccagcggaca aagcaccggt gtatcaggtc 3900 cgtgtcatcc actctaaaga gctcgactac gacctactga tggccctaga ttcttcatca 3960 aaaacgcctg agacacttgc ccaggattga aactccctga agggaccacc aggggccctg 4020 agttgttcct tccccccgtg gcgagctgcc agccaggctg tacctgtgat cgaggctggc 4080 gggaaaatag gcttcgtgtg ctcaggtcat gggaggtgca ggacagctca tgaaacgcca 4140 acaatcgcac aattcatgtc aagctaatca gctatttcct cttcacgagc tgtaattgtc 4200 ccaaaattct ggtctaccgg gggtgatcct tcgtgtacgg gcccttccct caaccctagg 4260 tatgcgcgca tgcggtcgcc gcgcaactcg cgcgagggcc gagggtttgg gacgggccgt 4320 cccgaaatgc agttgcaccc ggatgcgtgg cacctttttt gcgataattt atgcaatgga 4380 ctgctctgca aaattctggc tctgtcgcca accctaggat cagcggcgta ggatttcgta 4440 atcattcgtc ctgatgggga gctaccgact accctaatat cagcccgact gcctgacgcc 4500 agcgtccact tttgtgcaca cattccattc gtgcccaaga catttcattg tggtgcgaag 4560 cgtccccagt tacgctcacc tgtttcccga cctccttact gttctgtcga cagagcgggc 4620 ccacaggccg gtcgcagccc atatggccac cgcatccact ttctcggcgt tcaatgcccg 4680 ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga ggcccctccc 4740 cgtgcgctac gtattccagt gcctggtggc cagctgcatc gacccctgcg accagtaccg 4800 cagcagcgcc agcctgagct tcctgggcga caacggcttc gccagcctgt tcggcagcaa 4860 gcccttcatg agcaaccgcg gccaccgccg cctgcgccgc gccagccaca gcggcgaggc 4920 catggccgtg gccctgcagc ccgcccagga ggccggcacc aagaagaagc ccgtgatcaa 4980 gcagcgccgc gtggtggtga ccggcatggg cgtggtgacc cccctgggcc acgagcccga 5040 cgtgttctac aacaacctgc tggacggcgt gagcggcatc agcgagatcg agaccttcga 5100 ctgcacccag ttccccaccc gcatcgccgg cgagatcaag agcttcagca ccgacggctg 5160 ggtggccccc aagctgagca agcgcatgga caagttcatg ctgtacctgc tgaccgccgg 5220 caagaaggcc ctggccgacg gcggcatcac cgacgaggtg atgaaggagc tggacaagcg 5280 caagtgcggc gtgctgatcg gcagcggcat gggcggcatg aaggtgttca acgacgccat 5340 cgaggccctg cgcgtgagct acaagaagat gaaccccttc tgcgtgccct tcgccaccac 5400 caacatgggc agcgccatgc tggccatgga cctgggctgg atgggcccca actacagcat 5460 cagcaccgcc tgcgccacca gcaacttctg catcctgaac gccgccaacc acatcatccg 5520 cggcgaggcc gacatgatgc tgtgcggcgg cagcgacgcc gtgatcatcc ccatcggcct 5580 gggcggcttc gtggcctgcc gcgccctgag ccagcgcaac agcgacccca ccaaggccag 5640 ccgcccctgg gacagcaacc gcgacggctt cgtgatgggc gagggcgccg gcgtgctgct 5700 gctggaggag ctggagcacg ccaagaagcg cggcgccacc atctacgccg agttcctggg 5760 cggcagcttc acctgcgacg cctaccacat gaccgagccc caccccgagg gcgccggcgt 5820 gatcctgtgc atcgagaagg ccctggccca ggccggcgtg agcaaggagg acgtgaacta 5880 catcaacgcc cacgccacca gcaccagcgc cggcgacatc aaggagtacc aggccctggc 5940 ccgctgcttc ggccagaaca gcgagctgcg cgtgaacagc accaagagca tgatcggcca 6000 cctgctgggc gccgccggcg gcgtggaggc cgtgaccgtg gtgcaggcca tccgcaccgg 6060 ctggattcac cccaacctga acctggagga ccccgacaag gccgtggacg ccaagctgct 6120 ggtgggcccc aagaaggagc gcctgaacgt gaaggtgggc ctgagcaaca gcttcggctt 6180 cggcggccac aacagcagca tcctgttcgc cccctgcaac gtgtgaatgc atacggagcg 6240 tcgtgcggga gggagtgtgc cgagcgggga gtcccggtct gtgcgaggcc cggcagctga 6300 cgctggcgag ccgtacgccc cgagggtccc cctcccctcc cccctcttcc ccttccctct 6360 gacggccgcg cctgtttttg catgttcagc gaccttaagg atctaagtaa gattcgaagc 6420 gctcgaccgt gccggacgga ctgcagcccc atgtcgtagt gaccgccaat gtaagtgggc 6480 tggcgtttcc ctgtacgtga ctcaacgtca ctgcacgcgc accaccctct cgaccggcag 6540 gaccaggcat cgcgagatac agcgcgagcc agacacggag tgccgagcta tgcgcacgct 6600 ccaactagat atcgaattcg gcgctatgac acttccagca aaaggtaggg cgggctgcga 6660 gacggcttcc cggcgctgca tgcaacaccg atgatgcttc gaccccccga agctccttcg 6720 gggctgcatg ggcgctccga tgccgctcca gggcgagcgc tgtttaaata gccaggcccc 6780 cgattgcaaa gacattatag cgagctacca aagccatatt caaacaccta gatcactacc 6840 acttctacac aggccactcg agcttgtgat cgcactccgc taagggggcg cctcttcctc 6900 ttcgtttcag tcggccgaca ggacgcgcgt caaaggtgct ggtcgtgtat gccctggccg 6960 gcaggtcgtt gctgctgctg gttagtgatt ccgcaaccct gattttggcg tcttattttg 7020 gcgtggcaaa cgctggcgcc cgcgagccgg gccggcggcg atgcggtgcc ccacggctgc 7080 cggaatccaa gggaggcaag agcgcccggg tcagttgaag ggctttacgc gcaaggtaca 7140 gccgctcctg caaggctgcg tggtggaatt ggacgtgcag gtcctgctga agttcctcca 7200 ccgcctcacc agcggacaaa gcaccggtgt atcaggtccg tgtcatccac tctaaagagc 7260 tcgactacga cctactgatg gccctagatt cttcatcaaa aacgcctgag acacttgccc 7320 aggattgaaa ctccctgaag ggaccaccag gggccctgag ttgttccttc cccccgtggc 7380 gagctgccag ccaggctgta cctgtgatcg aggctggcgg gaaaataggc ttcgtgtgct 7440 caggtcatgg gaggtgcagg acagctcatg aaacgccaac aatcgcacaa ttcatgtcaa 7500 gctaatcagc tatttcctct tcacgagctg taattgtccc aaaattctgg tctaccgggg 7560 gtgatccttc gtgtacgggc ccttccctca accctaggta tgcgcgcatg cggtcgccgc 7620 gcaactcgcg cgagggccga gggtttggga cgggccgtcc cgaaatgcag ttgcacccgg 7680 atgcgtggca ccttttttgc gataatttat gcaatggact gctctgcaaa attctggctc 7740 tgtcgccaac cctaggatca gcggcgtagg atttcgtaat cattcgtcct gatggggagc 7800 taccgactac cctaatatca gcccgactgc ctgacgccag cgtccacttt tgtgcacaca 7860 ttccattcgt gcccaagaca tttcattgtg gtgcgaagcg tccccagtta cgctcacctg 7920 tttcccgacc tccttactgt tctgtcgaca gagcgggccc acaggccggt cgcagccact 7980 agtatggcca ccgcatccac tttctcggcg ttcaatgccc gctgcggcga cctgcgtcgc 8040 tcggcgggct ccgggccccg gcgcccagcg aggcccctcc ccgtgcgcgg gcgcgccccc 8100 aaggccaacg gcagcgccgt gagcctgaag tccggcagcc tgaacaccct ggaggacccc 8160 cccagcagcc cccccccccg caccttcctg aaccagctgc ccgactggag ccgcctgcgc 8220 accgccatca ccaccgtgtt cgtggccgcc gagaagcagt tcacccgcct ggaccgcaag 8280 agcaagcgcc ccgacatgct ggtggactgg ttcggcagcg agaccatcgt gcaggacggc 8340 ctggtgttcc gcgagcgctt cagcatccgc agctacgaga tcggcgccga ccgcaccgcc 8400 agcatcgaga ccctgatgaa ccacctgcag gacaccagcc tgaaccactg caagagcgtg 8460 ggcctgctga acgacggctt cggccgcacc cccgagatgt gcacccgcga cctgatctgg 8520 gtgctgacca agatgcagat cgtggtgaac cgctacccca cctggggcga caccgtggag 8580 atcaacagct ggttcagcca gagcggcaag atcggcatgg gccgcgagtg gctgatcagc 8640 gactgcaaca ccggcgagat cctggtgcgc gccaccagcg cctgggccat gatgaaccag 8700 aagacccgcc gcttcagcaa gctgccctgc gaggtgcgcc aggagatcgc cccccacttc 8760 gtggacgccc cccccgtgat cgaggacaac gaccgcaagc tgcacaagtt cgacgtgaag 8820 accggcgaca gcatctgcaa gggcctgacc cccggctgga acgacttcga cgtgaaccag 8880 cacgtgagca acgtgaagta catcggctgg attctggaga gcatgcccac cgaggtgctg 8940 gagacccagg agctgtgcag cctgaccctg gagtaccgcc gcgagtgcgg ccgcgagagc 9000 gtggtggaga gcgtgaccag catgaacccc agcaaggtgg gcgaccgcag ccagtaccag 9060 cacctgctgc gcctggagga cggcgccgac atcatgaagg gccgcaccga gtggcgcccc 9120 aagaacgccg gcaccaaccg cgccatcagc acctgattaa ttaactcgag gcagcagcag 9180 ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact 9240 tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat 9300 cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc 9360 cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt 9420 cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt 9480 gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc 9540 acgggaagta gtgggatggg aacacaaatg gaaagcttga gctcttgttt tccagaagga 9600 gttgctcctt gagcctttca ttctcagcct cgataacctc caaagccgct ctaattgtgg 9660 agggggttcg aatttaaaag cttggaatgt tggttcgtgc gtctggaaca agcccagact 9720 tgttgctcac tgggaaaagg accatcagct ccaaaaaact tgccgctcaa accgcgtacc 9780 tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac attcatattg tgacgcttga 9840 gcagtctgta attgcctcag aatgtggaat catctgcccc ctgtgcgagc ccatgccagg 9900 catgtcgcgg gcgaggacac ccgccactcg tacagcagac cattatgcta cctcacaata 9960 gttcataaca gtgaccatat ttctcgaagc tccccaacga gcacctccat gctctgagtg 10020 gccacccccc ggccctggtg cttgcggagg gcaggtcaac cggcatgggg ctaccgaaat 10080 ccccgaccgg atcccaccac ccccgcgatg ggaagaatct ctccccggga tgtgggccca 10140 ccaccagcac aacctgctgg cccaggcgag cgtcaaacca taccacacaa atatccttgg 10200 catcggccct gaattccttc tgccgctctg ctacccggtg cttctgtccg aagcaggggt 10260 tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg gcggggcttg ttcgagcttg 10320 aagagc 10326 <210> 277 <211> 1584 <212> DNA <213> Cuphea wrightii <400> 277 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgctacgt attccagtgc 120 ctggtggcca gctgcatcga cccctgcgac cagtaccgca gcagcgccag cctgagcttc 180 ctgggcgaca acggcttcgc cagcctgttc ggcagcaagc ccttcatgag caaccgcggc 240 caccgccgcc tgcgccgcgc cagccacagc ggcgaggcca tggccgtggc cctgcagccc 300 gcccaggagg ccggcaccaa gaagaagccc gtgatcaagc agcgccgcgt ggtggtgacc 360 ggcatgggcg tggtgacccc cctgggccac gagcccgacg tgttctacaa caacctgctg 420 gacggcgtga gcggcatcag cgagatcgag accttcgact gcacccagtt ccccacccgc 480 atcgccggcg agatcaagag cttcagcacc gacggctggg tggcccccaa gctgagcaag 540 cgcatggaca agttcatgct gtacctgctg accgccggca agaaggccct ggccgacggc 600 ggcatcaccg acgaggtgat gaaggagctg gacaagcgca agtgcggcgt gctgatcggc 660 agcggcatgg gcggcatgaa ggtgttcaac gacgccatcg aggccctgcg cgtgagctac 720 aagaagatga accccttctg cgtgcccttc gccaccacca acatgggcag cgccatgctg 780 gccatggacc tgggctggat gggccccaac tacagcatca gcaccgcctg cgccaccagc 840 aacttctgca tcctgaacgc cgccaaccac atcatccgcg gcgaggccga catgatgctg 900 tgcggcggca gcgacgccgt gatcatcccc atcggcctgg gcggcttcgt ggcctgccgc 960 gccctgagcc agcgcaacag cgaccccacc aaggccagcc gcccctggga cagcaaccgc 1020 gacggcttcg tgatgggcga gggcgccggc gtgctgctgc tggaggagct ggagcacgcc 1080 aagaagcgcg gcgccaccat ctacgccgag ttcctgggcg gcagcttcac ctgcgacgcc 1140 taccacatga ccgagcccca ccccgagggc gccggcgtga tcctgtgcat cgagaaggcc 1200 ctggcccagg ccggcgtgag caaggaggac gtgaactaca tcaacgccca cgccaccagc 1260 accagcgccg gcgacatcaa ggagtaccag gccctggccc gctgcttcgg ccagaacagc 1320 gagctgcgcg tgaacagcac caagagcatg atcggccacc tgctgggcgc cgccggcggc 1380 gtggaggccg tgaccgtggt gcaggccatc cgcaccggct ggattcaccc caacctgaac 1440 ctggaggacc ccgacaaggc cgtggacgcc aagctgctgg tgggccccaa gaaggagcgc 1500 ctgaacgtga aggtgggcct gagcaacagc ttcggcttcg gcggccacaa cagcagcatc 1560 ctgttcgccc cctgcaacgt gtga 1584 <210> 278 <211> 1173 <212> DNA <213> Cuphea wrightii <400> 278 atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60 gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccaag 120 gccaacggca gcgccgtgag cctgaagtcc ggcagcctga acaccctgga ggaccccccc 180 agcagccccc ccccccgcac cttcctgaac cagctgcccg actggagccg cctgcgcacc 240 gccatcacca ccgtgttcgt ggccgccgag aagcagttca cccgcctgga ccgcaagagc 300 aagcgccccg acatgctggt ggactggttc ggcagcgaga ccatcgtgca ggacggcctg 360 gtgttccgcg agcgcttcag catccgcagc tacgagatcg gcgccgaccg caccgccagc 420 atcgagaccc tgatgaacca cctgcaggac accagcctga accactgcaa gagcgtgggc 480 ctgctgaacg acggcttcgg ccgcaccccc gagatgtgca cccgcgacct gatctgggtg 540 ctgaccaaga tgcagatcgt ggtgaaccgc taccccacct ggggcgacac cgtggagatc 600 aacagctggt tcagccagag cggcaagatc ggcatgggcc gcgagtggct gatcagcgac 660 tgcaacaccg gcgagatcct ggtgcgcgcc accagcgcct gggccatgat gaaccagaag 720 acccgccgct tcagcaagct gccctgcgag gtgcgccagg agatcgcccc ccacttcgtg 780 gacgcccccc ccgtgatcga ggacaacgac cgcaagctgc acaagttcga cgtgaagacc 840 ggcgacagca tctgcaaggg cctgaccccc ggctggaacg acttcgacgt gaaccagcac 900 gtgagcaacg tgaagtacat cggctggatt ctggagagca tgcccaccga ggtgctggag 960 acccaggagc tgtgcagcct gaccctggag taccgccgcg agtgcggccg cgagagcgtg 1020 gtggagagcg tgaccagcat gaaccccagc aaggtgggcg accgcagcca gtaccagcac 1080 ctgctgcgcc tggaggacgg cgccgacatc atgaagggcc gcaccgagtg gcgccccaag 1140 aacgccggca ccaaccgcgc catcagcacc tga 1173 <210> 279 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> synthesized nucleotide <400> 279 atgcagaccg cgcaccagcg gcccccgacc gaggggcact gcttcggtgc gaggctgccc 60 acggcgtcga ggcgggcggt gcgccgggca tggtcccgca tcgcgcgcgc ggcggccgcg 120 gccgacgcaa accccgcccg ccctgagcgc cgcgtggtca tcacgggcca gggcgtggtg 180 accagcctgg gccagacgat cgagcagttt tacagcagcc tgctggaggg cgtgagcggc 240 atctcgcaga tacagaagtt cgacaccacg ggctacacga cgacgatcgc gggcgagatc 300 aagtcgctgc agctggaccc gtacgtgccc aagcgctggg cgaagcgcgt ggacgacgtg 360 ataaagtacg tctacatcgc gggcaagcag gcgctggaga gcgccggcct gccgatcgag 420 gcggcggggc tggcgggcgc ggggctggac ccggcgctgt gcggcgtgct catcggcacc 480 gccatggcgg gcatgacgtc tttcgcggcg ggcgtggagg cgctgacgcg cggcggcgtg 540 cgcaagatga accccttttg catccccttc tccatctcca acatgggcgg cgcgatgctg 600 gcgatggaca tcggcttcat gggccccaac tactccatct ccacggcctg cgcgacgggc 660 aactactgca tcctgggcgc ggcggaccac atccggcgcg gcgacgcaaa cgtgatgctg 720 gccggcggcg cggacgcggc catcatcccc tcgggcatcg gcggcttcat cgcgtgcaag 780 gcgctgagca agcgcaacga cgagcccgag cgcgcgagcc ggccctggga cgccgaccgc 840 gacggcttcg tcatgggcga gggcgccggc gtgctggtgc tggaggagct ggagcacgcc 900 aagcgccgcg gcgcgaccat tttggctgaa ttagttggcg gcgcggccac ctcggacgcg 960 caccacatga ccgagcccga cccgcagggc cgcggcgtgc gcctctgcct cgagcgcgcg 1020 ctcgagcgcg cgcgcctcgc gcccgagcgc gtcggctacg tcaacgcgca cggcaccagc 1080 acgcccgcgg gcgacgtggc cgagtaccgc gccatccgcg ccgtcatccc gcaggactca 1140 ctacgcatca actccacaaa gtccatgatc gggcacctgc tcggcggcgc cggcgcggtc 1200 gaggccgtgg ccgccatcca ggccctgcgc accggctggc tccaccccaa cttgaacctc 1260 gagaaccccg cgcctggcgt cgaccccgtc gtgctcgtgg ggccgcggaa ggagcgcgcc 1320 gaagacctgg acgtcgtcct ctccaactcc tttggctttg gcgggcacaa ttcgtgcgtc 1380 atcttccgaa agtacgacga gtga 1404 <210> 280 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> synthesized nucleotide <400> 280 atgcagaccg cgcaccagcg gcccccgacc gaggggcact gcttcggtgc gaggctgccc 60 acggcgtcga ggcgggcggt gcgccgggcg tggtcccgca tcgcgcgcgc ggcggccgcg 120 gccgacgcga cccccgcccg ccctccgcgc cgcgtggtcg tgacgggcca gggcgtggtg 180 accagcctgg gccagacgat cgagcagttt tacagcagcc tgctggaggg cgtgagcggc 240 atctcgcaga tccaaaagtt tgacaccacg ggctacacga cgacgatcgc gggcgagatc 300 aagtcgctgc agctggaccc gtacgtgccc aagcgctggg ccaagcgcgt ggacgacgtc 360 atcaagtacg tctacatcgc gggcaagcag gcgctggaga acgcggggct gccgatcgag 420 gcggcggggc tggcgggcgc ggggctggac cccgcgctgt gcggcgtgct catcggcacc 480 gccatggcgg gcatgacgtc cttcgcggcg ggcgtggagg cgctgacgcg cggcggcgtg 540 cgcaagatga accccttttg catccccttc tccatctcca acatgggcgg cgcgatgctg 600 gcgatggaca tcggcttcat gggccccaac tactccatct ccacggcctg cgcgacgggc 660 aactactgca tcctgggcgc ggcggaccac atccggcgcg gcgacgcgga cgtgatgctg 720 gccggcggcg cggacgcggc catcatcccc tcgggcatcg gcggcttcat cgcgtgcaag 780 gcgctgagca agcgcaacga cgagcccgag cgcgcgagcc ggccctggga cgccgaccgc 840 gacggcttcg tcatgggcga gggcgccggc gtgctggtgc tggaggagct ggagcacgcc 900 aagcgccgcg gcgcgaccat cctggccgaa ttcgtcggcg gcgcggccac ctcggacgcg 960 caccacatga ccgagccgga cccgcagggc cgcggcgtgc gcctctgcct cgaacgcgcg 1020 ctcgagcgcg cgcgcctcgc gcccgagcgc gtcggctacg tcaacgcgca cggcaccagc 1080 acgcccgcgg gcgacgtggc cgagtaccgc gccatccgcg ccgtcatccc gcaggactcg 1140 ctgcgcatca actccaccaa gtccatgatc gggcacctgc tcggcggcgc cggcgcggtc 1200 gaggccgtgg ccgccatcca ggccctgcgc accggctggc tccaccccaa cctcaacctc 1260 gagaaccccg cacccggggt cgaccccgtc gtgctcgtgg ggccgcgcaa ggagcgcgcc 1320 gaagacctcg acgtcgtcct ctccaactcc tttggcttcg gcgggcacaa ctcgtgcgtc 1380 atcttccaaa agtacgacga gtga 1404 <210> 281 <211> 467 <212> PRT <213> Artificial Sequence <220> <223> synthesized construct <400> 281 Met Gln Thr Ala His Gln Arg Pro Pro Thr Glu Gly His Cys Phe Gly 1 5 10 15 Ala Arg Leu Pro Thr Ala Ser Arg Arg Ala Val Arg Arg Ala Trp Ser 20 25 30 Arg Ile Ala Arg Ala Ala Ala Ala Ala Asp Ala Asn Pro Ala Arg Pro 35 40 45 Glu Arg Arg Val Val Ile Thr Gly Gln Gly Val Val Thr Ser Leu Gly 50 55 60 Gln Thr Ile Glu Gln Phe Tyr Ser Ser Leu Leu Glu Gly Val Ser Gly 65 70 75 80 Ile Ser Gln Ile Gln Lys Phe Asp Thr Thr Gly Tyr Thr Thr Thr Ile 85 90 95 Ala Gly Glu Ile Lys Ser Leu Gln Leu Asp Pro Tyr Val Pro Lys Arg 100 105 110 Trp Ala Lys Arg Val Asp Asp Val Ile Lys Tyr Val Tyr Ile Ala Gly 115 120 125 Lys Gln Ala Leu Glu Ser Ala Gly Leu Pro Ile Glu Ala Ala Gly Leu 130 135 140 Ala Gly Ala Gly Leu Asp Pro Ala Leu Cys Gly Val Leu Ile Gly Thr 145 150 155 160 Ala Met Ala Gly Met Thr Ser Phe Ala Ala Gly Val Glu Ala Leu Thr 165 170 175 Arg Gly Gly Val Arg Lys Met Asn Pro Phe Cys Ile Pro Phe Ser Ile 180 185 190 Ser Asn Met Gly Gly Ala Met Leu Ala Met Asp Ile Gly Phe Met Gly 195 200 205 Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Gly Asn Tyr Cys Ile 210 215 220 Leu Gly Ala Ala Asp His Ile Arg Arg Gly Asp Ala Asn Val Met Leu 225 230 235 240 Ala Gly Gly Ala Asp Ala Ala Ile Ile Pro Ser Gly Ile Gly Gly Phe 245 250 255 Ile Ala Cys Lys Ala Leu Ser Lys Arg Asn Asp Glu Pro Glu Arg Ala 260 265 270 Ser Arg Pro Trp Asp Ala Asp Arg Asp Gly Phe Val Met Gly Glu Gly 275 280 285 Ala Gly Val Leu Val Leu Glu Glu Leu Glu His Ala Lys Arg Arg Gly 290 295 300 Ala Thr Ile Leu Ala Glu Leu Val Gly Gly Ala Ala Thr Ser Asp Ala 305 310 315 320 His His Met Thr Glu Pro Asp Pro Gln Gly Arg Gly Val Arg Leu Cys 325 330 335 Leu Glu Arg Ala Leu Glu Arg Ala Arg Leu Ala Pro Glu Arg Val Gly 340 345 350 Tyr Val Asn Ala His Gly Thr Ser Thr Pro Ala Gly Asp Val Ala Glu 355 360 365 Tyr Arg Ala Ile Arg Ala Val Ile Pro Gln Asp Ser Leu Arg Ile Asn 370 375 380 Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Gly Ala Gly Ala Val 385 390 395 400 Glu Ala Val Ala Ala Ile Gln Ala Leu Arg Thr Gly Trp Leu His Pro 405 410 415 Asn Leu Asn Leu Glu Asn Pro Ala Pro Gly Val Asp Pro Val Val Leu 420 425 430 Val Gly Pro Arg Lys Glu Arg Ala Glu Asp Leu Asp Val Val Leu Ser 435 440 445 Asn Ser Phe Gly Phe Gly Gly His Asn Ser Cys Val Ile Phe Arg Lys 450 455 460 Tyr Asp Glu 465 <210> 282 <211> 467 <212> PRT <213> Artificial Sequence <220> <223> synthesized construct <400> 282 Met Gln Thr Ala His Gln Arg Pro Pro Thr Glu Gly His Cys Phe Gly 1 5 10 15 Ala Arg Leu Pro Thr Ala Ser Arg Arg Ala Val Arg Arg Ala Trp Ser 20 25 30 Arg Ile Ala Arg Ala Ala Ala Ala Ala Asp Ala Thr Pro Ala Arg Pro 35 40 45 Pro Arg Arg Val Val Val Thr Gly Gln Gly Val Val Thr Ser Leu Gly 50 55 60 Gln Thr Ile Glu Gln Phe Tyr Ser Ser Leu Leu Glu Gly Val Ser Gly 65 70 75 80 Ile Ser Gln Ile Gln Lys Phe Asp Thr Thr Gly Tyr Thr Thr Thr Ile 85 90 95 Ala Gly Glu Ile Lys Ser Leu Gln Leu Asp Pro Tyr Val Pro Lys Arg 100 105 110 Trp Ala Lys Arg Val Asp Asp Val Ile Lys Tyr Val Tyr Ile Ala Gly 115 120 125 Lys Gln Ala Leu Glu Asn Ala Gly Leu Pro Ile Glu Ala Ala Gly Leu 130 135 140 Ala Gly Ala Gly Leu Asp Pro Ala Leu Cys Gly Val Leu Ile Gly Thr 145 150 155 160 Ala Met Ala Gly Met Thr Ser Phe Ala Ala Gly Val Glu Ala Leu Thr 165 170 175 Arg Gly Gly Val Arg Lys Met Asn Pro Phe Cys Ile Pro Phe Ser Ile 180 185 190 Ser Asn Met Gly Gly Ala Met Leu Ala Met Asp Ile Gly Phe Met Gly 195 200 205 Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Gly Asn Tyr Cys Ile 210 215 220 Leu Gly Ala Ala Asp His Ile Arg Arg Gly Asp Ala Asp Val Met Leu 225 230 235 240 Ala Gly Gly Ala Asp Ala Ala Ile Ile Pro Ser Gly Ile Gly Gly Phe 245 250 255 Ile Ala Cys Lys Ala Leu Ser Lys Arg Asn Asp Glu Pro Glu Arg Ala 260 265 270 Ser Arg Pro Trp Asp Ala Asp Arg Asp Gly Phe Val Met Gly Glu Gly 275 280 285 Ala Gly Val Leu Val Leu Glu Glu Leu Glu His Ala Lys Arg Arg Gly 290 295 300 Ala Thr Ile Leu Ala Glu Phe Val Gly Gly Ala Ala Thr Ser Asp Ala 305 310 315 320 His His Met Thr Glu Pro Asp Pro Gln Gly Arg Gly Val Arg Leu Cys 325 330 335 Leu Glu Arg Ala Leu Glu Arg Ala Arg Leu Ala Pro Glu Arg Val Gly 340 345 350 Tyr Val Asn Ala His Gly Thr Ser Thr Pro Ala Gly Asp Val Ala Glu 355 360 365 Tyr Arg Ala Ile Arg Ala Val Ile Pro Gln Asp Ser Leu Arg Ile Asn 370 375 380 Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Gly Ala Gly Ala Val 385 390 395 400 Glu Ala Val Ala Ala Ile Gln Ala Leu Arg Thr Gly Trp Leu His Pro 405 410 415 Asn Leu Asn Leu Glu Asn Pro Ala Pro Gly Val Asp Pro Val Val Leu 420 425 430 Val Gly Pro Arg Lys Glu Arg Ala Glu Asp Leu Asp Val Val Leu Ser 435 440 445 Asn Ser Phe Gly Phe Gly Gly His Asn Ser Cys Val Ile Phe Gln Lys 450 455 460 Tyr Asp Glu 465 <210> 283 <211> 2678 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct <400> 283 gctcttcccg caccggctgg ctccacccca acttgaacct cgagaacccc gcgcctggcg 60 tcgaccccgt cgtgctcgtg gggccgcgga aggagcgcgc cgaagacctg gacgtcgtcc 120 tctccaactc ctttggcttt ggcgggcaca attcgtgcgt cggtaccctt tcttgcgcta 180 tgacacttcc agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac 240 accgatgatg cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc 300 tccagggcga gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct 360 accaaagcca tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg 420 tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaacg 480 gcgcgccatg ctgctgcagg ccttcctgtt cctgctggcc ggcttcgccg ccaagatcag 540 cgcctccatg acgaacgaga cgtccgaccg ccccctggtg cacttcaccc ccaacaaggg 600 ctggatgaac gaccccaacg gcctgtggta cgacgagaag gacgccaagt ggcacctgta 660 cttccagtac aacccgaacg acaccgtctg ggggacgccc ttgttctggg gccacgccac 720 gtccgacgac ctgaccaact gggaggacca gcccatcgcc atcgccccga agcgcaacga 780 ctccggcgcc ttctccggct ccatggtggt ggactacaac aacacctccg gcttcttcaa 840 cgacaccatc gacccgcgcc agcgctgcgt ggccatctgg acctacaaca ccccggagtc 900 cgaggagcag tacatctcct acagcctgga cggcggctac accttcaccg agtaccagaa 960 gaaccccgtg ctggccgcca actccaccca gttccgcgac ccgaaggtct tctggtacga 1020 gccctcccag aagtggatca tgaccgcggc caagtcccag gactacaaga tcgagatcta 1080 ctcctccgac gacctgaagt cctggaagct ggagtccgcg ttcgccaacg agggcttcct 1140 cggctaccag tacgagtgcc ccggcctgat cgaggtcccc accgagcagg accccagcaa 1200 gtcctactgg gtgatgttca tctccatcaa ccccggcgcc ccggccggcg gctccttcaa 1260 ccagtacttc gtcggcagct tcaacggcac ccacttcgag gccttcgaca accagtcccg 1320 cgtggtggac ttcggcaagg actactacgc cctgcagacc ttcttcaaca ccgacccgac 1380 ctacgggagc gccctgggca tcgcgtgggc ctccaactgg gagtactccg ccttcgtgcc 1440 caccaacccc tggcgctcct ccatgtccct cgtgcgcaag ttctccctca acaccgagta 1500 ccaggccaac ccggagacgg agctgatcaa cctgaaggcc gagccgatcc tgaacatcag 1560 caacgccggc ccctggagcc ggttcgccac caacaccacg ttgacgaagg ccaacagcta 1620 caacgtcgac ctgtccaaca gcaccggcac cctggagttc gagctggtgt acgccgtcaa 1680 caccacccag acgatctcca agtccgtgtt cgcggacctc tccctctggt tcaagggcct 1740 ggaggacccc gaggagtacc tccgcatggg cttcgaggtg tccgcgtcct ccttcttcct 1800 ggaccgcggg aacagcaagg tgaagttcgt gaaggagaac ccctacttca ccaaccgcat 1860 gagcgtgaac aaccagccct tcaagagcga gaacgacctg tcctactaca aggtgtacgg 1920 cttgctggac cagaacatcc tggagctgta cttcaacgac ggcgacgtcg tgtccaccaa 1980 cacctacttc atgaccaccg ggaacgccct gggctccgtg aacatgacga cgggggtgga 2040 caacctgttc tacatcgaca agttccaggt gcgcgaggtc aagtgacaat tggcagcagc 2100 agctcggata gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca 2160 cttgctgcct tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg 2220 atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc 2280 cccagcatcc ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct 2340 gtcctgctat ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt 2400 ttgggctccg cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat 2460 gcacgggaag tagtgggatg ggaacacaaa tggaggatcg tagagctcat cttccgaaag 2520 tacgacgagt gagcgagctg attctctttg agcggggtcg ggtggttcgg ggagagtgcg 2580 cggaaaggcg cagagacgtg cggccggccg tgtccctccg tcttcccctg gttggtgcta 2640 tagtaacctg cctgtgtcgc gtgcgcgtcg ggaagagc 2678 <210> 284 <211> 717 <212> DNA <213> Ganoderma tsugae <400> 284 ctccaccaca agaagcacca ccagacctac gtgaacgcgc tcaacgccgc agagcaggcc 60 tacgccaagg ccaccacccc caaggagcgc atcgccctcc agtccgccct caagttcaac 120 ggcggtggtg agtgaatttc gcgaatgtcg gctcaccgcg acgcgattac gaatccgcta 180 actctaacac tttgctgcgg gggatgtgca ggtcacatca accactccct cttctggaag 240 aacctcgccc cagccaagtc tgagggcaag ggaaacggcg gcgccatcaa ggacggcccc 300 ctcaagtcgg cgatcgagca gaactttggt tccgtcgacg tcttcatcaa ggagttcaac 360 gcgaccaccg cgtccatcca gggctccggc tggggctggc tcgtgagtct tctcttctgc 420 gatcggaagg cgcatccggt gttatggtcg cgcgctgcac gcgtgtctcg cttcggctcc 480 gccgtcgaag cgctgatacc gagaccgatc tgctgcaaat catttgcgct gcgatagagc 540 tccgggggct ttaacccttc gttccatgtg ataagaccgc gtctgaccgg gtggtgtttt 600 ctatcgcagg gtctcaaccc ggcgaccaag cgcctcgaga tcacgacgac ggccaaccag 660 gaccctctcc tcacgcacgt ccccatcatc ggcgtcgaca tctgggagca cgcgttc 717 <210> 285 <211> 1561 <212> DNA <213> Umbellularia californica <400> 285 agagagagag agagagagag agctaaatta aaaaaaaaac ccagaagtgg gaaatcttcc 60 ccatgaaata acggatcctc ttgctactgc tactactact actacaaact gtagccattt 120 atataattct atataatttt caacatggcc accacctctt tagcttccgc tttctgctcg 180 atgaaagctg taatgttggc tcgtgatggc cggggcatga aacccaggag cagtgatttg 240 cagctgaggg cgggaaatgc gccaacctct ttgaagatga tcaatgggac caagttcagt 300 tacacggaga gcttgaaaag gttgcctgac tggagcatgc tctttgcagt gatcacaacc 360 atcttttcgg ctgctgagaa gcagtggacc aatctagagt ggaagccgaa gccgaagcta 420 ccccagttgc ttgatgacca ttttggactg catgggttag ttttcaggcg cacctttgcc 480 atcagatctt atgaggtggg acctgaccgc tccacatcta tactggctgt tatgaatcac 540 atgcaggagg ctacacttaa tcatgcgaag agtgtgggaa ttctaggaga tggattcggg 600 acgacgctag agatgagtaa gagagatctg atgtgggttg tgagacgcac gcatgttgct 660 gtggaacggt accctacttg gggtgatact gtagaagtag agtgctggat tggtgcatct 720 ggaaataatg gcatgcgacg tgatttcctt gtccgggact gcaaaacagg cgaaattctt 780 acaagatgta ccagcctttc ggtgctgatg aatacaagga caaggaggtt gtccacaatc 840 cctgacgaag ttagagggga gatagggcct gcattcattg ataatgtggc tgtcaaggac 900 gatgaaatta agaaactaca gaagctcaat gacagcactg cagattacat ccaaggaggt 960 ttgactcctc gatggaatga tttggatgtc aatcagcatg tgaacaacct caaatacgtt 1020 gcctgggttt ttgagaccgt cccagactcc atctttgaga gtcatcatat ttccagcttc 1080 actcttgaat acaggagaga gtgcacgagg gatagcgtgc tgcggtccct gaccactgtc 1140 tctggtggct cgtcggaggc tgggttagtg tgcgatcact tgctccagct tgaaggtggg 1200 tctgaggtat tgagggcaag aacagagtgg aggcctaagc ttaccgatag tttcagaggg 1260 attagtgtga tacccgcaga accgagggtg taactaatga aagaagcatc tgttgaagtt 1320 tctcccatgc tgttcgtgag gatacttttt agaagctgca gtttgcattg cttgtgcaga 1380 atcatggtct gtggttttag atgtatataa aaaatagtcc tgtagtcatg aaacttaata 1440 tcagaaaaat aactcaatgg gtcaaggtta tcgaagtagt catttaagct ttgaaatatg 1500 ttttgtattc ctcggcttaa tctgtaagct ctttctcttg caataaagtt cgcctttcaa 1560 t 1561 <210> 286 <211> 417 <212> PRT <213> Cuphea calophylla <400> 286 Met Val Ala Ala Glu Ala Ser Ser Ala Leu Phe Ser Val Arg Thr Pro 1 5 10 15 Gly Thr Ser Pro Lys Pro Gly Lys Phe Arg Asn Trp Pro Ser Ser Leu 20 25 30 Ser Val Pro Phe Lys Ser Lys Ser Asn His Asn Gly Gly Phe Gln Val 35 40 45 Lys Ala Asn Ala Ser Ala Arg Pro Lys Ala Asn Gly Ser Ala Val Ser 50 55 60 Leu Lys Ser Gly Ser Leu Asp Thr Gln Glu Asp Thr Ser Ser Ser Ser 65 70 75 80 Ser Pro Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu 85 90 95 Leu Ser Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr 100 105 110 Met Leu Asp Arg Lys Ser Lys Arg Pro Asp Thr Leu Met Asp Pro Phe 115 120 125 Gly Val Asp Arg Val Val Gln Asp Gly Val Val Phe Arg Gln Ser Phe 130 135 140 Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu 145 150 155 160 Thr Leu Met Asn Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser 165 170 175 Ile Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys 180 185 190 Arg Asp Leu Ile Trp Val Val Thr Lys Met His Ile Glu Val Asn Arg 195 200 205 Tyr Pro Thr Trp Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu 210 215 220 Ser Gly Lys Thr Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys His 225 230 235 240 Thr Gly Glu Ile Leu Ile Arg Ala Thr Ser Val Cys Ala Met Met Asn 245 250 255 Gln Thr Thr Arg Arg Phe Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu 260 265 270 Leu Ala Pro His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Tyr Gln 275 280 285 Lys Leu His Lys Leu Asp Val Lys Thr Gly Asp Ser Ile Cys Asn Gly 290 295 300 Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn 305 310 315 320 Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Val Pro Lys Glu Val Phe 325 330 335 Glu Thr Gln Glu Leu Cys Gly Leu Thr Leu Glu Tyr Arg Arg Glu Cys 340 345 350 Gly Arg Asp Ser Val Leu Lys Ser Val Thr Ala Met Asp Pro Ser Lys 355 360 365 Glu Gly Asp Arg Ser Leu Tyr Gln His Leu Leu Arg Leu Glu Asp Gly 370 375 380 Thr Asp Ile Ala Lys Gly Arg Thr Lys Trp Arg Pro Lys Asn Ala Gly 385 390 395 400 Thr Asn Gly Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Ile 405 410 415 Ser <210> 287 <211> 378 <212> PRT <213> Ulmus americana <220> <221> misc_feature <222> (265)..(265) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (374)..(374) <223> Xaa can be any naturally occurring amino acid <400> 287 Gly Ser Gly Ala Leu Gln Val Lys Ala Ser Ser Gln Ala Pro Pro Lys 1 5 10 15 Leu Asn Gly Ser Asn Val Gly Leu Val Lys Ser Ser Gln Ile Val Lys 20 25 30 Lys Gly Asp Asp Thr Thr Ser Pro Pro Ala Arg Thr Phe Ile Asn Gln 35 40 45 Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Leu Phe Leu 50 55 60 Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro Lys Arg Pro 65 70 75 80 Asp Met Leu Val Asp Pro Phe Gly Leu Gly Arg Phe Val Gln Asp Gly 85 90 95 Leu Val Phe Arg Asn Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala 100 105 110 Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr 115 120 125 Ala Leu Asn His Val Lys Ser Val Gly Leu Leu Glu Asp Gly Leu Gly 130 135 140 Ser Thr Arg Glu Met Ser Leu Arg Asn Leu Ile Trp Val Val Thr Lys 145 150 155 160 Met Gln Val Ala Val Asp Arg Tyr Pro Thr Trp Gly Asp Glu Val Gln 165 170 175 Val Ser Ser Trp Ala Thr Ala Ile Gly Lys Asn Gly Met Arg Arg Glu 180 185 190 Trp Ile Val Thr Asp Phe Arg Thr Gly Glu Thr Leu Leu Arg Ala Thr 195 200 205 Ser Val Trp Val Met Met Asn Lys Leu Thr Arg Arg Ile Ser Lys Ile 210 215 220 Pro Glu Glu Val Trp His Glu Ile Gly Pro Ser Phe Ile Asp Ala Pro 225 230 235 240 Pro Leu Pro Thr Val Glu Asp Asp Gly Arg Lys Leu Thr Arg Phe Asp 245 250 255 Glu Ser Ser Ala Asp Phe Ile Arg Xaa Gly Leu Thr Pro Arg Trp Ser 260 265 270 Asp Leu Asp Ile Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp 275 280 285 Leu Leu Glu Ser Ala Pro Pro Glu Ile His Glu Ser His Glu Ile Ala 290 295 300 Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu 305 310 315 320 Asn Ser Ala Thr Lys Val Ser Asp Ser Ser Gln Leu Gly Lys Ser Ala 325 330 335 Val Glu Cys Asn His Leu Val Arg Leu Gln Asn Gly Gly Glu Ile Val 340 345 350 Lys Gly Arg Thr Val Trp Arg Pro Lys Arg Pro Leu Tyr Asn Asp Gly 355 360 365 Ala Val Val Asp Val Xaa Ala Lys Thr Ser 370 375

Claims (69)

  1. 프로토테카(Prototheca) 속의 재조합 미세조류로부터 수득된 미세조류 트라이글라이세라이드 오일 조성물로서, 여기서 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0을 가지는 적어도 40% 포화된 지방산을 포함하고, 상기 오일은 상기 재조합 미세조류의 스테롤을 추가로 포함하며, 상기 재조합 미세조류는 조작되지 않은 미세조류에 비해 낮은 수준 또는 높은 수준에서 적어도 하나의 지질 경로 효소를 발현하도록 유전적으로 조작되고, 상기 지질 경로 효소는 불포화효소, 케토아실 신타제 및 아실-ACP 티오에스터라제로 이루어진 군으로부터 선택되고, 상기 오일의 지방산 프로파일은 적어도 4% C10:0, 적어도 10% C12:0, 또는 적어도 10% C14:0을 포함하고,
    상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 낮은 수준에서 발현되는 내인성 지질 경로 효소이거나, 또는
    상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 높은 수준에서 발현되는 외인성 지질 경로 효소인, 미세조류 트라이글라이세라이드 오일 조성물.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 불포화효소는 스테아로일-ACP 불포화효소 또는 지방 아실 불포화효소인, 미세조류 트라이글라이세라이드 오일 조성물.
  5. 제1항에 있어서, 상기 오일의 지방산 프로파일은 적어도 70% 포화된 지방산을 포함하는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
  6. 제1항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii), 쿠페아 칼로필라(Cuphea callophylla), 및 미국 느릅나무(Ulmus americana)로 이루어진 군으로부터 선택된 종 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0의 전체 조합량을 적어도 50% 포함하는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
  7. 제1항에 있어서, 상기 재조합 미세조류가 캘리포니아 월계수(Umbellularia californica) 및 녹나무(Cinnamomum camphora) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함하거나; 또는 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 유래의 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자 및 케토 아실-ACP 신타제를 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 적어도 5:1의 C12:0 : C14:0 지방산의 비를 가지는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
  8. 제1항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 또는 쿠페아 칼로필라(Cuphea callophylla) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 50% 이상의 C12:0-C14:0 수준을 가지는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
  9. 제1항, 및 제4항 내지 제8항 중 어느 한 항에 있어서, 상기 미세조류 오일은 프로토테카 모리포미스(Prototheca moriformis) 오일인, 미세조류 트라이글라이세라이드 오일 조성물.
  10. 제1항, 및 제4항 내지 제8항 중 어느 한 항의 오일 조성물을 생성하는 재조합 미세조류 세포.
  11. a) 프로토테카(Prototheca) 속의 재조합 미세조류를 배양하는 단계로서, 여기서 상기 재조합 미세조류는 조작되지 않은 미세조류에 비해 낮은 수준 또는 높은 수준에서 적어도 하나의 지질 경로 효소를 발현하도록 유전적으로 조작되고, 상기 지질 경로 효소는 불포화효소, 케토아실 신타제 및 아실-ACP 티오에스터라제로 이루어진 군으로부터 선택되는 것인 단계; 및
    b) 트라이글라이세라이드 오일 조성물을 분리하는 단계를 포함하고,
    여기서 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0을 가지는 적어도 40% 포화된 지방산을 포함하고, 상기 오일은 상기 재조합 미세조류의 스테롤을 추가로 포함하고,
    상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 낮은 수준에서 발현되는 내인성 지질 경로 효소이거나, 또는
    상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 높은 수준에서 발현되는 외인성 지질 경로 효소인, 트라이글라이세라이드 오일 조성물의 생성방법.
  12. 삭제
  13. 삭제
  14. 제11항에 있어서, 상기 불포화효소는 스테아로일-ACP 불포화효소 또는 지방 아실 불포화효소인, 오일 조성물의 생성방법.
  15. 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 70% 포화된 지방산을 포함하는 것인, 오일 조성물의 생성방법.
  16. 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 4% C10:0을 포함하는 것인, 오일 조성물의 생성방법.
  17. 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 10% C12:0을 포함하는 것인, 오일 조성물의 생성방법.
  18. 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 10% C14:0을 포함하는 것인, 오일 조성물의 생성방법.
  19. 제11항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii), 쿠페아 칼로필라(Cuphea callophylla), 및 미국 느릅나무(Ulmus americana)로 이루어진 군으로부터 선택된 종 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0의 전체 조합량을 적어도 50% 포함하는 것인, 오일 조성물의 생성방법.
  20. 제11항에 있어서, 상기 재조합 미세조류가 캘리포니아 월계수(Umbellularia californica) 및 녹나무(Cinnamomum camphora) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함하거나; 또는 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 유래의 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자 및 케토 아실-ACP 신타제를 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 적어도 5:1의 C12:0 : C14:0 지방산의 비를 가지는 것인, 오일 조성물의 생성방법.
  21. 제11항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 또는 쿠페아 칼로필라(Cuphea callophylla) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 50% 이상의 C12:0-C14:0 수준을 가지는 것인, 오일 조성물의 생성방법.
  22. 제11항, 및 제14항 내지 제21항 중 어느 한 항에 있어서, 상기 미세조류 오일은 프로토테카 모리포미스 오일인, 오일 조성물의 생성방법.
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
KR1020187031842A 2010-05-28 2011-05-27 종속영양 미생물유기체로부터 생성된 맞춤 오일 KR102148462B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US34977410P 2010-05-28 2010-05-28
US61/349,774 2010-05-28
US37499210P 2010-08-18 2010-08-18
US61/374,992 2010-08-18
US41439310P 2010-11-16 2010-11-16
US61/414,393 2010-11-16
US201061428192P 2010-12-29 2010-12-29
US61/428,192 2010-12-29
PCT/US2011/038463 WO2011150410A2 (en) 2010-05-28 2011-05-27 Tailored oils produced from recombinant heterotrophic microorganisms

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020127034232A Division KR101916421B1 (ko) 2010-05-28 2011-05-27 종속영양 미생물유기체로부터 생성된 맞춤 오일

Publications (2)

Publication Number Publication Date
KR20180122486A KR20180122486A (ko) 2018-11-12
KR102148462B1 true KR102148462B1 (ko) 2020-08-26

Family

ID=45004441

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020127034232A KR101916421B1 (ko) 2010-05-28 2011-05-27 종속영양 미생물유기체로부터 생성된 맞춤 오일
KR1020187031842A KR102148462B1 (ko) 2010-05-28 2011-05-27 종속영양 미생물유기체로부터 생성된 맞춤 오일
KR1020127034225A KR101899938B1 (ko) 2010-05-28 2011-05-27 맞춤 오일을 포함하는 식품 조성물

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020127034232A KR101916421B1 (ko) 2010-05-28 2011-05-27 종속영양 미생물유기체로부터 생성된 맞춤 오일

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020127034225A KR101899938B1 (ko) 2010-05-28 2011-05-27 맞춤 오일을 포함하는 식품 조성물

Country Status (13)

Country Link
US (10) US8592188B2 (ko)
EP (2) EP2576800B1 (ko)
JP (6) JP5868962B2 (ko)
KR (3) KR101916421B1 (ko)
CN (4) CN103097540A (ko)
AU (4) AU2011257982B2 (ko)
BR (2) BR112012030329A2 (ko)
CA (3) CA2801024A1 (ko)
ES (2) ES2718489T3 (ko)
MX (3) MX339639B (ko)
SG (4) SG10201504197SA (ko)
WO (2) WO2011150410A2 (ko)
ZA (2) ZA201209186B (ko)

Families Citing this family (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040077604A1 (en) 2001-12-19 2004-04-22 Lenard Lichtenberger Method and compositions employing formulations of lecithin oils and nsaids for protecting the gastrointestinal tract and providingenhanced therapeutic activity
AU2008259834B2 (en) 2007-06-01 2013-08-01 Corbion Biotech, Inc. Production of oil in microorganisms
US20100303990A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. High Protein and High Fiber Algal Food Materials
US20100303961A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. Methods of Inducing Satiety
US20100297296A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Healthier Baked Goods Containing Microalgae
US20100297323A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Gluten-free Foods Containing Microalgae
US20100297295A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Microalgae-Based Beverages
US20100303957A1 (en) * 2008-10-14 2010-12-02 Solazyme, Inc. Edible Oil and Processes for Its Production from Microalgae
US20100297331A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Reduced Fat Foods Containing High-Lipid Microalgae with Improved Sensory Properties
US20100297325A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Egg Products Containing Microalgae
US20100297292A1 (en) * 2008-10-14 2010-11-25 Solazyme, Inc. Reduced Pigmentation Microalgae Strains and Products Therefrom
ES2583639T3 (es) 2008-11-28 2016-09-21 Terravia Holdings, Inc. Producción de aceites específicos en microorganismos heterótrofos
JP5868962B2 (ja) 2010-05-28 2016-02-24 ソラザイム, インコーポレイテッドSolazyme Inc 組み換え従属栄養性微生物から産生された用途に応じた油
US8637689B2 (en) 2010-08-31 2014-01-28 Biosynthetic Technologies, Llc Catalytic processes for preparing estolide base oils
US9382489B2 (en) 2010-10-29 2016-07-05 Inaeris Technologies, Llc Renewable heating fuel oil
US9447350B2 (en) 2010-10-29 2016-09-20 Inaeris Technologies, Llc Production of renewable bio-distillate
EP3521408B1 (en) 2010-11-03 2021-12-22 Corbion Biotech, Inc. Genetically-engineered chlorella or prototheca microbe and oil produced therefrom
US20140290127A1 (en) * 2010-12-30 2014-10-02 BP Corporate North America Inc. Derivation and conversion of natural oilswith chemical compositions for hydroprocessing to transport fuels
ES2386474B1 (es) 2011-01-21 2013-07-09 Norel, Sa Aditivos para alimentación animal.
KR101964965B1 (ko) 2011-02-02 2019-04-03 테라비아 홀딩스 인코포레이티드 재조합 유지성 미생물로부터 생산된 맞춤 오일
US9315739B2 (en) * 2011-08-18 2016-04-19 Kior, Llc Process for upgrading biomass derived products
BR112013023613A2 (pt) 2011-03-17 2017-09-19 Solazyme Inc método de gaseificação, método de conversão da biomassa de um micróbio oleaginoso, composição torrificada combustível, e, combustível combinado
GB201104761D0 (en) * 2011-03-21 2011-05-04 Univ United Arab Emirates Biodiesel production
MX339607B (es) 2011-05-06 2016-05-31 Solazyme Inc Microorganismos geneticamente modificados que metabolizan xilosa.
MY191912A (en) 2011-06-17 2022-07-18 Biosynthetic Technologies Llc Estolide compositions exhibiting high oxidative stability
WO2012173674A1 (en) * 2011-06-17 2012-12-20 Lubrigreen Biosynthetics, Llc Dielectric fluids comprising estolide compounds and methods of making and using the same
EP2702124A1 (en) 2011-06-17 2014-03-05 Biosynthetic Technologies, LLC Compositions comprising estolide compounds and methods of making and using the same
US8951762B2 (en) 2011-07-27 2015-02-10 Iowa State University Research Foundation, Inc. Materials and methods for using an acyl—acyl carrier protein thioesterase and mutants and chimeras thereof in fatty acid synthesis
US9399768B2 (en) 2011-07-27 2016-07-26 Iowa State University Research Foundation, Inc. Materials and methods for using an acyl-acyl carrier protein thioesterase and mutants and chimeras thereof in fatty acid synthesis
US10427069B2 (en) 2011-08-18 2019-10-01 Inaeris Technologies, Llc Process for upgrading biomass derived products using liquid-liquid extraction
BR112014012917A2 (pt) 2011-11-28 2017-06-13 Solazyme Inc ácido nucleico recombinante, cassete de expressão, célula, método para obter óleo microbiano, e, óleo microbiano
US9011733B2 (en) * 2011-12-21 2015-04-21 Joan Lynch Dielectric fluids compositions and methods
SG11201403419SA (en) 2011-12-23 2014-07-30 Solazyme Inc Algal thermoplastics, thermosets, paper, adsorbants and absorbants
US9163267B2 (en) * 2012-04-11 2015-10-20 REG Life Sciences, LLC Metathesis transformations of microbially-produced fatty acids and fatty acid derivatives
US9719114B2 (en) 2012-04-18 2017-08-01 Terravia Holdings, Inc. Tailored oils
BR112014025719A8 (pt) 2012-04-18 2017-10-03 Solazyme Inc Óleos customizados
US8686198B2 (en) 2012-05-18 2014-04-01 Uop Llc Integrated hydrolysis/hydroprocessing process for converting feedstocks containing renewable glycerides to paraffins and polyols
KR102107261B1 (ko) 2012-06-18 2020-05-06 바이오신세틱 테크놀로지스 엘엘씨 술포네이트 잔기를 제거하는 것을 포함하는 에스톨라이드 화합물의 제조 방법
US9382491B2 (en) 2012-07-03 2016-07-05 Sartec Corporation Hydrocarbon synthesis methods, apparatus, and systems
US9388345B2 (en) 2012-07-03 2016-07-12 Sartec Corporation Hydrocarbon synthesis methods, apparatus, and systems
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
WO2014074772A1 (en) 2012-11-09 2014-05-15 Heliae Development, Llc Mixotrophic, phototrophic, and heterotrophic combination methods and systems
WO2014074770A2 (en) 2012-11-09 2014-05-15 Heliae Development, Llc Balanced mixotrophy methods
US8580119B1 (en) * 2012-11-27 2013-11-12 Menlo Energy Management, LLC Transesterification of biodiesel feedstock with solid heterogeneous catalyst
US8540881B1 (en) * 2012-11-27 2013-09-24 Menlo Energy Management, LLC Pretreatment, esterification, and transesterification of biodiesel feedstock
US8545703B1 (en) * 2012-11-27 2013-10-01 Menlo Energy Management, LLC Production of glycerin from feedstock
WO2014089514A1 (en) 2012-12-07 2014-06-12 Solazyme, Inc. Genetically engineered microbial strains including chlorella protothecoides lipid pathway genes
AU2013367325B2 (en) 2012-12-27 2019-12-19 Kao Corporation Acyl-ACP thioesterase
KR101575208B1 (ko) 2013-01-09 2015-12-07 한국생명공학연구원 북극 해양에서 분리한 전분 및 지질 고생산 미세조류 클로렐라 세포주 및 이의 용도
US10098371B2 (en) 2013-01-28 2018-10-16 Solazyme Roquette Nutritionals, LLC Microalgal flour
US9816079B2 (en) 2013-01-29 2017-11-14 Terravia Holdings, Inc. Variant thioesterases and methods of use
US9567615B2 (en) 2013-01-29 2017-02-14 Terravia Holdings, Inc. Variant thioesterases and methods of use
CA2903494A1 (en) * 2013-03-08 2014-09-12 Solazyme, Inc. Oleaginous microbial lubricants
US9783836B2 (en) * 2013-03-15 2017-10-10 Terravia Holdings, Inc. Thioesterases and cells for production of tailored oils
US9290749B2 (en) 2013-03-15 2016-03-22 Solazyme, Inc. Thioesterases and cells for production of tailored oils
US9493640B2 (en) 2013-03-15 2016-11-15 Terravia Holdings, Inc. Wood plastic and thermoplastic composites
CA2904395A1 (en) 2013-03-15 2014-09-25 Solazyme, Inc. Thioesterases and cells for production of tailored oils
EP2777400A1 (en) * 2013-03-15 2014-09-17 Roquette Freres Microalgal flour granules and process for preparation thereof
EP2993993A2 (en) 2013-04-26 2016-03-16 Solazyme, Inc. Low polyunsaturated fatty acid oils and uses thereof
US9079814B2 (en) 2013-06-10 2015-07-14 Uop Llc Linear alkylbenzenes from natural oils and methods of producing
US9080134B2 (en) 2013-06-10 2015-07-14 Uop Llc Linear alkylbenzenes from natural oils and methods of producing
US9079811B2 (en) 2013-06-10 2015-07-14 Uop Llc Linear alkylbenzenes from natural oils and methods of producing
FR3007625B1 (fr) * 2013-06-26 2015-07-17 Roquette Freres Procede de production de biomasse de microalgues de qualite sensorielle optimisee
BR112016000553A2 (pt) 2013-07-12 2018-05-29 Kao Corporation acil-acp tioesterase
FR3008581B1 (fr) 2013-07-19 2016-11-04 Roquette Freres Farine de microalgues riches en lipides et procede de preparation
FR3009619B1 (fr) 2013-08-07 2017-12-29 Roquette Freres Compositions de biomasse de microalgues riches en proteines de qualite sensorielle optimisee
MX368472B (es) * 2013-08-23 2019-10-03 Corbion Biotech Inc Método para la producción industrial de harina de biomasa de microalgas ricas en lípidos sin mal sabor al controlar la disponibilidad del oxígeno.
MX369685B (es) 2013-10-04 2019-11-19 Terravia Holdings Inc Aceites adaptables.
DK3082459T3 (en) 2013-11-29 2019-04-23 Corbion Biotech Inc GRANULATES OF MICROALGE BIOMASS MULTIPLE PROTEIN AND METHOD OF PRODUCING THEREOF
US20160326551A1 (en) * 2013-12-31 2016-11-10 Butamax Advanced Biofuels Llc Isobutanol tolerance in yeast with an altered lipid profile
US9752165B2 (en) * 2014-02-10 2017-09-05 Cellulosic Ethanol Technologies, Llc Processes and systems for recovering oil from fermentation products
US9394550B2 (en) 2014-03-28 2016-07-19 Terravia Holdings, Inc. Lauric ester compositions
WO2015164550A1 (en) 2014-04-23 2015-10-29 Solazyme, Inc. Food-related uses of high-stability oil
WO2015171472A1 (en) * 2014-05-06 2015-11-12 Monsanto Technology Llc Utilization of transgenic high oleic soybean oil in industrial applications
US20150320086A1 (en) 2014-05-07 2015-11-12 Solazyme, Inc. Microalgae Meal
KR101447976B1 (ko) * 2014-05-10 2014-10-14 박승민 오일을 포함한 앨지매스와 천연오일 및 그 오일슬러지를 포함하는 고체연료 및 이의 제조방법
KR101445253B1 (ko) * 2014-05-10 2014-10-01 알펫 주식회사 오일을 함유한 앨지매스를 미분화한 고체연료
KR101445254B1 (ko) * 2014-05-10 2014-10-02 알펫 주식회사 오일을 포함한 앨지매스와 연료첨가제를 포함하는 고체연료 및 이의 제조 방법
RU2558448C1 (ru) * 2014-06-03 2015-08-10 Федеральное Государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный университет инженерных технологий" ("ВГУИТ") Способ получения растительного масла и белкового продукта из смеси семян подсолнечника, льна и расторопши
WO2015191449A2 (en) 2014-06-08 2015-12-17 Solazyme, Inc. Personal care products containing microalgae or extracts thereof
CN106604990B (zh) 2014-06-16 2022-04-05 基因组股份公司 具有改进的特性的ω-羟化酶相关的融合多肽
US10550412B2 (en) 2014-06-20 2020-02-04 Kao Corporation Method of producing lipid
WO2015196134A1 (en) 2014-06-20 2015-12-23 Solazyme, Inc. Wood composites
JP6332855B2 (ja) * 2014-06-23 2018-05-30 花王株式会社 アシル−acpチオエステラーゼを用いた脂質の製造方法
US20160002521A1 (en) 2014-07-03 2016-01-07 Solazyme, Inc. Lubricants and wellbore fluids
US9969990B2 (en) 2014-07-10 2018-05-15 Corbion Biotech, Inc. Ketoacyl ACP synthase genes and uses thereof
US10676763B2 (en) 2014-07-18 2020-06-09 Genomatica, Inc. Microbial production of fatty diols
CN107087416A (zh) 2014-07-24 2017-08-22 泰拉瑞亚控股公司 变体硫酯酶及使用方法
BR112017005370A2 (pt) 2014-09-18 2017-12-12 Terravia Holdings Inc acil-acp tioesterases e mutantes das mesmas
US20160176800A1 (en) * 2014-12-17 2016-06-23 Solazyme, Inc. Microalgal Derived Cleaners and Surfactants
EP4047049A1 (en) 2014-12-23 2022-08-24 Bridgestone Americas Tire Operations, LLC Oil-containing rubber compositions and related methods
JP2018509516A (ja) 2015-03-24 2018-04-05 テラヴィア ホールディングス, インコーポレイテッド 微細藻類組成物およびその使用
EP3277793A1 (en) 2015-03-31 2018-02-07 TerraVia Holdings, Inc. Microalgae adapted for heterotrophic culture conditions
JP2018512851A (ja) 2015-04-06 2018-05-24 テラヴィア ホールディングス, インコーポレイテッド Lpaatアブレーションを有する油産生微細藻類
WO2017101987A1 (en) 2015-12-15 2017-06-22 REG Life Sciences, LLC Omega-hydroxylase-related fusion polypeptide variants with improved properties
CN105671106B (zh) * 2016-02-16 2021-06-11 珀莱雅化妆品股份有限公司 一种采用橄榄油发酵法制备鞘糖脂的方法
US10377792B2 (en) * 2016-03-16 2019-08-13 The Texas A&M University System Moisture displacement and simultaneous migration of surface-functionalized algae from water to an extraction solvent using ionic polyelectrolytes
US20180066288A1 (en) 2016-08-05 2018-03-08 Kuehnle Agrosystems, Inc. Producing and altering microbial fermentation products using non-commonly used lignocellulosic hydrolysates
CN109809840B (zh) * 2016-08-28 2021-08-20 刘明 一种城市垃圾处理方法
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
US20180142218A1 (en) 2016-10-05 2018-05-24 Terravia Holdings, Inc. Novel acyltransferases, variant thioesterases, and uses thereof
US10239812B2 (en) 2017-04-27 2019-03-26 Sartec Corporation Systems and methods for synthesis of phenolics and ketones
US10704066B2 (en) 2017-05-05 2020-07-07 Purissima, Inc. Neurotransmitters and methods of making the same
US11306300B2 (en) * 2017-05-11 2022-04-19 Kansai Chemical Engineering Co., Ltd. Microorganism capable of displaying α-galactosidase on surface layer thereof, and use thereof
FR3077299B1 (fr) * 2018-02-01 2020-10-30 Tropical Essence Sdn Bhd Additif pour huile a base de triglycerides
US10696923B2 (en) 2018-02-07 2020-06-30 Sartec Corporation Methods and apparatus for producing alkyl esters from lipid feed stocks, alcohol feedstocks, and acids
US10544381B2 (en) 2018-02-07 2020-01-28 Sartec Corporation Methods and apparatus for producing alkyl esters from a reaction mixture containing acidified soap stock, alcohol feedstock, and acid
CN111971379A (zh) * 2018-02-28 2020-11-20 嘉吉公司 葡糖淀粉酶工程化酵母和发酵方法
CA3103083A1 (en) * 2018-06-08 2019-12-12 Mizkan Holdings Co., Ltd. Fat/oil composition containing fine particle composite and method for producing same
JP7053401B2 (ja) * 2018-08-06 2022-04-12 株式会社デンソー 新規環化物及び新規環化物の製造方法
US11618890B2 (en) 2018-08-22 2023-04-04 Corbion Biotech, Inc. Beta-ketoacyl-ACP synthase II variants
CN112955563A (zh) 2018-08-30 2021-06-11 格纹蛱蝶公司 加氢甲酰基化甘油三酯及其用途
CN109456905B (zh) * 2018-12-07 2020-11-06 扬州大学 一株促进微藻利用蔗糖的隐球酵母及其应用
CA3121547A1 (en) * 2019-01-11 2020-07-16 Societe Des Produits Nestle S.A. Process for an instant oil fried noodle
WO2020167745A1 (en) 2019-02-11 2020-08-20 Checkerspot, Inc. Triglyceride oil compositions
CN113614238A (zh) 2019-03-28 2021-11-05 公益财团法人实验动物中央研究所 免疫缺陷小鼠
WO2020207843A1 (en) * 2019-04-12 2020-10-15 Unilever N.V. Oil-in-water emulsified food composition with high oleic oil
US11149290B2 (en) * 2019-05-16 2021-10-19 Purdue Research Foundation Virus-assisted algal cell disruption for cost-effective biofuel production
CN112553182B (zh) * 2019-09-25 2022-01-25 东莞泛亚太生物科技有限公司 具提升活性的α-半乳糖苷酶
CN110643582B (zh) * 2019-09-29 2021-07-27 浙江工业大学 一种从沙棘鲜果中提取sod的方法
BR112022009803A2 (pt) 2019-11-20 2022-08-16 Corbion Biotech Inc Variantes de sacarose invertase
WO2021127181A1 (en) 2019-12-18 2021-06-24 Checkerspot, Inc. Uses of microbially derived materials in polymer applications
WO2021146520A1 (en) 2020-01-16 2021-07-22 Corbion Biotech, Inc. β-KETOACYL-ACP SYNTHASE IV VARIANTS
KR20230004502A (ko) * 2020-03-20 2023-01-06 옥시 로우 카본 벤쳐스, 엘엘씨 이산화탄소를 이용한 에틸렌 제조방법
CN111718968B (zh) * 2020-08-04 2023-04-07 山东理工大学 一种提高卷枝毛霉wj11中链脂肪酸产量的方法
CN112387250B (zh) * 2020-10-21 2022-05-20 广西大学 一种类印迹mof吸附剂及其制备方法与应用
US20220154229A1 (en) * 2020-11-05 2022-05-19 Phycoil Biotechnology International, Inc. Production of lipids and terpenoids in auxenochlorella protothecoides
WO2022178302A1 (en) * 2021-02-18 2022-08-25 Zero Acre Farms Inc. Systems and methods of making oil from microorganisms
WO2023043945A2 (en) 2021-09-17 2023-03-23 Checkerspot, Inc. High oleic oil compositions and uses thereof
CN113717919B (zh) * 2021-09-18 2023-04-11 四川大学 一种促进微藻积累β-葡聚糖的方法
WO2023096858A1 (en) 2021-11-23 2023-06-01 Senda Biosciences, Inc. A bacteria-derived lipid composition and use thereof
WO2023102069A1 (en) 2021-12-01 2023-06-08 Checkerspot, Inc. Polyols, polyurethane dispersions, and uses thereof
WO2023133417A2 (en) * 2022-01-05 2023-07-13 Change Foods, Inc. Dairy-like compositions
KR20230115735A (ko) * 2022-01-27 2023-08-03 씨제이제일제당 (주) 냉각 공정을 이용한 오일 회수율이 향상된 바이오오일 추출 방법
SE2250075A1 (en) * 2022-01-28 2023-07-29 Mycorena Ab Fungi-based fat tissue
WO2024020359A1 (en) * 2022-07-22 2024-01-25 Pioneer Hi-Bred International, Inc. Brassica plants with mutant fata2-14 alleles yielding oils with a low total saturated fatty acid content
WO2024064684A1 (en) * 2022-09-19 2024-03-28 Zero Acre Farms Inc. Food compositions for consumption

Family Cites Families (398)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2235056A (en) 1938-03-04 1941-03-18 Ici Ltd Process for the recovery of glycerol from still residues from fermentation processes
US2383602A (en) 1943-03-04 1945-08-28 Colgate Palmolive Peet Co Process for treatment of fatty glycerides
US2967700A (en) 1955-03-01 1961-01-10 Morris B Kallison Whipping and aerating apparatus
US2874171A (en) 1957-02-20 1959-02-17 Upjohn Co Recovery of ergosterol
US3142135A (en) 1962-02-13 1964-07-28 Grain Processing Corp Production of carotenoids by the cultivation of algae
US3280502A (en) 1962-11-07 1966-10-25 Hoffmann La Roche Process for the preparation of lutein
US3320693A (en) 1964-09-11 1967-05-23 Kk Method of industral cultivation of unicellular green algae such as chlorella
US3475274A (en) 1967-08-07 1969-10-28 Commercial Solvents Corp Production of riboflavin
US3962466A (en) 1972-11-10 1976-06-08 Dai-Nippon Sugar Manufacturing Co., Ltd. Method for treatment of microorganisms
US4049724A (en) 1973-11-20 1977-09-20 Atlantic Richfield Company Osmium catalyzed organic hydroperoxide hydroxylation of olefinic compounds
JPS5328989B2 (ko) 1974-05-27 1978-08-17
US4005062A (en) 1974-08-16 1977-01-25 Standard Oil Company (Indiana) Process of preparing water-soluble whippable extract from microorganism protein material
US3957578A (en) 1975-01-03 1976-05-18 Hokkaido Sugar Co., Ltd. Method for manufacture of α-galactosidase by microorganism
US4103039A (en) 1976-08-18 1978-07-25 Fuji Oil Company, Limited Method for producing improved shea fat
FR2375319A1 (fr) 1976-12-23 1978-07-21 British Petroleum Co Procede de traitement d'extraits lipidiques
US4182777A (en) 1977-03-01 1980-01-08 Standard Oil Company (Indiana) Co-dried yeast whey food product and process
US4140805A (en) 1977-03-11 1979-02-20 Edwards George W Process of producing useful materials from plants
US4288378A (en) 1979-05-23 1981-09-08 The Procter & Gamble Company Method of preparing an enriched peanut oil peanut butter stabilizer
IL57712A (en) 1979-07-03 1984-02-29 Yissum Res Dev Co Cultivation of halophilic algae of the dunaliella species for the production of fuel-like product
US4273790A (en) * 1979-11-19 1981-06-16 Standard Brands Incorporated Low-fat liquid spread and process
US4335156A (en) 1980-09-19 1982-06-15 Nabisco Brands, Inc. Edible fat product
US4373434A (en) 1980-11-24 1983-02-15 Simon-Rosedowns Limited Apparatus for the expansion of oil bearing seeds
JPS57150379A (en) 1981-03-14 1982-09-17 Kikujiro Ishiwatari Crushing of cell membrane of chlorella
US4390561A (en) 1981-11-04 1983-06-28 The Procter & Gamble Company Margarine oil product
US4584139A (en) 1983-01-31 1986-04-22 Olin Corporation Hydrogenation of long chain olefinic oils with Raney catalyst
JPS606799A (ja) 1983-06-07 1985-01-14 北畠 三之丞 汚れ落しに効果を発揮する米糠を原料とする洗剤の製法
DK402583D0 (da) 1983-09-05 1983-09-05 Novo Industri As Fremgangsmade til fremstilling af et immobiliseret lipasepraeparat og anvendelse deraf
US4519845A (en) 1984-02-09 1985-05-28 Uop Inc. Separation of sucrose from molasses
US4940845A (en) 1984-05-30 1990-07-10 Kao Corporation Esterification process of fats and oils and enzymatic preparation to use therein
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US4627192B1 (en) 1984-11-16 1995-10-17 Sigco Res Inc Sunflower products and methods for their production
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4755467A (en) 1985-06-03 1988-07-05 Unisearch Limited Method for the production of sorbitol and gluconate
US5900370A (en) 1985-07-01 1999-05-04 Bio-Technical Resources Process for the production of ascorbic acid with prototheca
US5792631A (en) 1985-07-01 1998-08-11 Dcv, Inc. Microbial process for the production of ascorbic acid using Chlorella protothecoides
US5001059A (en) 1985-07-01 1991-03-19 Bio-Technical Resources, Inc. L-ascorbic acid production in microorganisms
US4603188A (en) 1985-07-10 1986-07-29 Itoh Seiyu Kabushiki Kaisha Curable urethane composition
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US4673490A (en) 1985-08-23 1987-06-16 Fluor Corporation Process for separating crude oil components
JPH0775557B2 (ja) 1986-04-25 1995-08-16 富士レビオ株式会社 脂質結合性シアル酸の測定法
US5091116A (en) 1986-11-26 1992-02-25 Kraft General Foods, Inc. Methods for treatment of edible oils
JPH077557Y2 (ja) 1987-04-29 1995-02-22 スズキ株式会社 発動発電機の周波数切換装置
US5360730A (en) 1987-06-05 1994-11-01 Universal Foods Corporation Zeaxanthin producing strains of Neospongiococcum Excentricum
DK399387D0 (da) 1987-07-31 1987-07-31 Novo Industri As Immobiliseret lipase og dennes anvendelse
JP2641935B2 (ja) 1987-09-28 1997-08-20 ノボ‐ノルディスク アクティーゼルスカブ リパーゼの固定化方法
FR2626584B1 (fr) 1988-01-28 1990-07-13 Agronomique Inst Nat Rech Sequence ars efficace chez yarrowia lipolytica et procede pour sa preparation
US4992605A (en) 1988-02-16 1991-02-12 Craig Wayne K Production of hydrocarbons with a relatively high cetane rating
US4901635A (en) 1988-04-08 1990-02-20 Anderson International Corp. Apparatus and method for the continuous extrusion and partial deliquefaction of oleaginous materials
US5080848A (en) 1988-12-22 1992-01-14 The Proctor & Gamble Company Process for making concentrated surfactant granules
JPH078217Y2 (ja) 1988-07-07 1995-03-01 日立電線株式会社 発光ダイオードヘッド
US5130242A (en) 1988-09-07 1992-07-14 Phycotech, Inc. Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids
US5340742A (en) 1988-09-07 1994-08-23 Omegatech Inc. Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids
US20060094089A1 (en) 1988-09-07 2006-05-04 Martek Biosciences Corporation Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids
US5693507A (en) 1988-09-26 1997-12-02 Auburn University Genetic engineering of plant chloroplasts
US6680426B2 (en) 1991-01-07 2004-01-20 Auburn University Genetic engineering of plant chloroplasts
DE3836447C2 (de) 1988-10-26 1994-02-03 Stockhausen Chem Fab Gmbh Verfahren zur Gewinnung hochsulfatierter Fettsäuren, Hydroxifettsäuren oder oxalkylierter Hydroxifettsäuren
DK638688D0 (da) 1988-11-16 1988-11-16 Novo Industri As Partikelformet immobiliseret lipase-praeparat, fremgangsmaade til fremstilling deraf og anvendelse deraf
EP0474663B1 (en) 1989-05-10 1994-03-02 DAVY McKEE (LONDON) LIMITED Multi-step hydrodesulphurisation process
US5434278A (en) 1989-09-20 1995-07-18 Nabisco, Inc. Synthesis of acetoglyceride fats
US5258197A (en) 1989-09-20 1993-11-02 Nabisco, Inc. Reduced calorie triglyceride mixtures
US5391383A (en) 1989-09-20 1995-02-21 Nabisco, Inc. Edible spray oil
WO1991009924A1 (en) 1989-12-29 1991-07-11 The Procter & Gamble Company Ultra mild surfactant with good lather
US4992189A (en) 1990-02-07 1991-02-12 Mobil Oil Corporation Lubricants and lube additives from hydroxylation and esterification of lower alkene oligomers
US5407957A (en) 1990-02-13 1995-04-18 Martek Corporation Production of docosahexaenoic acid by dinoflagellates
DE4004800C2 (de) 1990-02-13 2000-12-21 Aventis Cropscience Gmbh Im Habitus und Ertrag veränderte transgene Pflanzen
US7053267B2 (en) * 1990-03-16 2006-05-30 Calgene Llc Plant seed oils
US5298421A (en) 1990-04-26 1994-03-29 Calgene, Inc. Plant medium-chain-preferring acyl-ACP thioesterases and related methods
US5164308A (en) 1990-05-21 1992-11-17 Martek Corporation Preparation of labelled triglyceride oils by cultivation of microorganisms
US6483008B1 (en) 1990-08-15 2002-11-19 Calgene Llc Methods for producing plants with elevated oleic acid content
US6022577A (en) 1990-12-07 2000-02-08 Nabisco Technology Company High stearic acid soybean oil blends
US5945585A (en) 1990-12-20 1999-08-31 E. I. Du Pont De Nemours And Company Specific for palmitoyl, stearoyl and oleoyl-alp thioesters nucleic acid fragments encoding acyl-acp thiosesterase enzymes and the use of these fragments in altering plant oil composition
WO1992011373A1 (en) 1990-12-20 1992-07-09 E.I. Du Pont De Nemours And Company Nucleotide sequences of soybean acyl-acp thioesterase genes
JPH0699337B2 (ja) 1990-12-27 1994-12-07 花王株式会社 アルコールの製造方法
MY107920A (en) 1990-12-27 1996-06-29 Kao Corp Process for producing alcohol
US5380894A (en) 1991-03-01 1995-01-10 The United States Of America As Represented By The Secretary Of Agriculture Production of hydroxy fatty acids and estolide intermediates
US5346724A (en) 1991-04-12 1994-09-13 Nippon Oil Company, Ltd. Oil and fat composition for lubricating food processing machines and use thereof
CU22292A1 (es) 1991-05-07 1995-01-31 Cigb Procedimiento para la obtencion a escala industrial de licores de fructosa-glucosa a partir de sacarosa e instalacion para el mismo
US5455167A (en) 1991-05-21 1995-10-03 Calgene Inc. Medium-chain thioesterases in plants
US5270175A (en) 1991-07-12 1993-12-14 Dna Plant Technology Corporation Methods and compositions for producing metabolic products for algae
US5268192A (en) 1991-07-16 1993-12-07 Nabisco, Inc. Low calorie nut products and process of making
JP3143636B2 (ja) 1991-09-11 2001-03-07 株式会社サン・クロレラ 細胞破裂によるクロレラ細胞壁の破砕方法
DE4130986A1 (de) 1991-09-18 1993-03-25 Bayer Ag Pinosylvinsynthase-gene
PH31293A (en) 1991-10-10 1998-07-06 Rhone Poulenc Agrochimie Production of y-linolenic acid by a delta6-desaturage.
US6355861B1 (en) 1991-10-10 2002-03-12 Rhone-Poulenc Agrochimie Production of gamma linolenic acid by a Δ6-desaturase
FR2686619B1 (fr) 1992-01-28 1995-07-13 Commissariat Energie Atomique Procede de production selective de lipides poly-insatures a partir d'une culture de micro-algues du type porphyridium et cuve utilisee dans ce procede.
US5395455A (en) 1992-03-10 1995-03-07 Energy, Mines And Resources - Canada Process for the production of anhydrosugars from lignin and cellulose containing biomass by pyrolysis
DE4209779C1 (ko) 1992-03-26 1993-07-15 Oelmuehle Leer Connemann Gmbh & Co., 2950 Leer, De
ES2141767T3 (es) 1992-06-19 2000-04-01 Arthur M Nonomura Procedimientos y composiciones que estimulan la fijacion del carbono en las plantas.
TW211523B (en) 1992-06-29 1993-08-21 Amerchol Corp Hydroxylated milk glycerides
US6410281B1 (en) 1992-07-10 2002-06-25 Omegatech, Inc. Reducing corrosion in a fermentor by providing sodium with a non-chloride sodium salt
US5298637A (en) 1992-10-22 1994-03-29 Arco Chemical Technology, L.P. Process for producing a reduced calorie lipid composition
JP3090810B2 (ja) 1993-03-09 2000-09-25 日本碍子株式会社 パルミトオレイン酸の製造方法
GB2277052A (en) 1993-04-14 1994-10-19 Du Pont Canada Polyurethane foam laminates
JPH078215A (ja) 1993-04-30 1995-01-13 Kawasaki Steel Corp ドコサヘキサエン酸含有海洋性微細藻類食品素材およびその製造方法
JPH078217A (ja) 1993-06-29 1995-01-13 Kawasaki Steel Corp ドコサヘキサエン酸含有健康食品およびその製造方法
JP3506740B2 (ja) 1993-09-09 2004-03-15 日清オイリオ株式会社 ドコサヘキサエン酸含有藻類の培養方法
CA2118071C (en) 1993-10-28 2004-09-14 Rodney B. Croteau Dna encoding limonene synthase from mentha spicata
CA2176137A1 (en) 1993-11-10 1995-05-18 Alois Toni Voelker Plant acyl acp thioesterase sequences
US5427704A (en) 1994-01-28 1995-06-27 The Lubrizol Corporation Triglyceride oils thickened with estolides of hydroxy-containing triglycerides
US5451332A (en) 1994-01-28 1995-09-19 The Lubrizol Corporation Estolides of hydroxy-containing triglycerides that contain a performance additive
US5458795A (en) 1994-01-28 1995-10-17 The Lubrizol Corporation Oils thickened with estolides of hydroxy-containing triglycerides
EP0746608B1 (en) 1994-02-21 2003-08-20 Novozymes A/S Method for production of an immobilized enzyme preparation and use of the immobilized enzyme preparation
US5910630A (en) 1994-04-06 1999-06-08 Davies; Huw Maelor Plant lysophosphatidic acid acyltransferases
US5563058A (en) 1994-04-06 1996-10-08 Calgene, Inc. Plant lysophosphatidic acid acyltransferases
US5506201A (en) 1994-04-29 1996-04-09 International Flavors & Fragrances Inc. Formulation of a fat surfactant vehicle containing a fragrance
JP3375726B2 (ja) 1994-05-18 2003-02-10 雪印乳業株式会社 食用油脂および油脂混合物
ATE368118T1 (de) 1994-05-18 2007-08-15 Bayer Bioscience Gmbh Für enzyme, die die fähigkeit besitzen lineare alpha 1,4-glucane in pflanzen, pilzen und mikroorganismen zu synthesieren, kodierende dna sequenzen
US6113971A (en) 1994-07-25 2000-09-05 Elmaleh; David R. Olive oil butter
ATE181745T1 (de) 1994-08-16 1999-07-15 Frische Gmbh Verfahren zur gewinnung von nicht wasserlöslichen, nativen produkten aus nativen stoffgemengen mit hilfe der zentrifugalkraft
US5756135A (en) 1994-09-15 1998-05-26 Robert D. Seeley Trust Water insoluble yeast solids product and process of making same
EP0805673A1 (en) 1994-10-20 1997-11-12 The Procter & Gamble Company Personal treatment compositions and/or cosmetic compositions containing enduring perfume
US5475160A (en) 1994-11-07 1995-12-12 Shell Oil Company Process for the direct hydrogenation of triglycerides
US5680812A (en) 1995-01-23 1997-10-28 Linsgeseder; Helmut Apparatus and method for the extraction of vegetable oils
DE19503062A1 (de) 1995-02-01 1996-08-08 Henkel Kgaa Verwendung von Alkoxylierungsprodukten epoxydierter Fettstoffe als Entschäumer
US5942479A (en) 1995-05-27 1999-08-24 The Proctor & Gamble Company Aqueous personal cleansing composition with a dispersed oil phase comprising two specifically defined oil components
ATE290580T1 (de) 1995-06-06 2005-03-15 Agro Man Group Inc Biologisch abbaubare schmierflüssigkeiten auf pflanzlicher basis
US5685218A (en) 1995-07-14 1997-11-11 The French Oil Mill Machinery Co. Method for treating oil-bearing material
EP0874802A1 (de) 1995-10-27 1998-11-04 Basf Aktiengesellschaft Fettsäurederivate und ihre verwendung als tenside in wasch- und reinigungsmitteln
FI100248B (fi) 1996-02-05 1997-10-31 Fortum Oil Oy Keskitisleen valmistus
US6086903A (en) 1996-02-26 2000-07-11 The Proctor & Gamble Company Personal treatment compositions and/or cosmetic compositions containing enduring perfume
US6255505B1 (en) 1996-03-28 2001-07-03 Gist-Brocades, B.V. Microbial polyunsaturated fatty acid containing oil from pasteurised biomass
WO1997039106A1 (en) 1996-04-12 1997-10-23 Martek Biosciences Corporation Methods and tools for transformation of eukaryotic algae
WO1997038571A1 (en) 1996-04-15 1997-10-23 Washington State University Research Foundation Compositions and methods for taxol biosynthesis
AR006830A1 (es) 1996-04-26 1999-09-29 Du Pont Aceite de soja con alta estabilidad oxidativa
US5595965A (en) * 1996-05-08 1997-01-21 The Lubrizol Corporation Biodegradable vegetable oil grease
US6312623B1 (en) 1996-06-18 2001-11-06 Abb Power T&D Company Inc. High oleic acid oil compositions and methods of making and electrical insulation fluids and devices comprising the same
BR9711019A (pt) 1996-08-02 1999-08-17 Plum Kemi Prod EmulsÆo de Äleo-em- gua para uso em pela humana para limpeza preserva-Æo ou aperfei-oamento da condi-Æo da pele
CZ36499A3 (cs) 1996-08-08 1999-07-14 The Procter & Gamble Company Syntéza polyolových polyesterů
US5885440A (en) 1996-10-01 1999-03-23 Uop Llc Hydrocracking process with integrated effluent hydrotreating zone
US7109392B1 (en) 1996-10-09 2006-09-19 Cargill, Incorporated Methods for increasing oleic acid content in seeds from transgenic plants containing a mutant delta 12 desaturase
US6200788B1 (en) * 1997-01-24 2001-03-13 Kirin Beer Kabushiki Kaisha β-ketoacyl-ACP synthetase II enzymes and genes coding for same
US6465642B1 (en) 1997-02-07 2002-10-15 The Procter & Gamble Company Lower alkyl ester recycling in polyol fatty acid polyester synthesis
DE19710152C2 (de) 1997-03-12 1999-04-22 Henkel Kgaa Verfahren zur Herstellung von Aniontensidgranulaten
US6395965B1 (en) 1997-03-21 2002-05-28 Restoragen, Inc. Plant containing a gene construct comprising a chlorella virus promoter and a lac operator
US6243725B1 (en) 1997-05-21 2001-06-05 Premier International, Ltd. List building system
US6083731A (en) 1997-06-24 2000-07-04 Washington State University Research Foundation Recombinant materials and methods for the production of limonene hydroxylases
US6429014B1 (en) 1997-07-11 2002-08-06 Washington State University Research Foundation Monoterpene synthases from grand fir (Abies grandis)
US6372460B1 (en) 1997-08-01 2002-04-16 Martek Biosciences DHA-containing nutritional compositions and methods for their production
US5891697A (en) 1997-09-25 1999-04-06 Washington State University Research Foundation Monoterpene synthases from common sage (Salvia officinalis)
EP1016708B1 (en) 1997-09-29 2006-11-29 Japan Tobacco Inc. Yeast extract composition, yeast for obtaining the same, and process for producing yeast extract composition
NZ505943A (en) 1998-01-21 2002-12-20 Univ Maryland Biotech Inst Methods for increasing the ratio of docosahexaenoic acid to eicosapentaenoic acid in the live prey of larval fish
US6265639B1 (en) 1998-01-22 2001-07-24 Washington State University Foundation Gymnosperm nucleic acid molecules encoding sesquiterpene synthases and methods of use
US6407044B2 (en) 1998-01-28 2002-06-18 The Proctor & Gamble Company Aerosol personal cleansing emulsion compositions which contain low vapor pressure propellants
AU2490399A (en) 1998-02-02 1999-08-16 Regents Of The University Of California, The Germacrene c synthase gene of (lycopersicon esculentum)
US6139897A (en) 1998-03-24 2000-10-31 Kao Corporation Oil or fat composition containing phytosterol
US6468955B1 (en) 1998-05-01 2002-10-22 The Proctor & Gamble Company Laundry detergent and/or fabric care compositions comprising a modified enzyme
US20020012979A1 (en) 1998-06-08 2002-01-31 Alan Berry Vitamin c production in microorganisms and plants
US6051539A (en) 1998-07-02 2000-04-18 Cargill, Inc. Process for modifying unsaturated triacylglycerol oils resulting products and uses thereof
EP2305825B1 (en) 1998-07-06 2015-01-14 DCV Inc. doing business as Bio-Technical Resourses Method of vitamin production
ATE537265T1 (de) 1998-07-06 2011-12-15 Dcv Inc Verfahren zur vitaminherstellung
US7511190B2 (en) 1999-11-17 2009-03-31 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
JP2000136199A (ja) 1998-10-29 2000-05-16 Asahi Glass Co Ltd シゾサッカロミセス・ポンベで使用可能なシグナルペプチド、分泌型発現ベクター、およびそれらを用いたタンパク質生産方法
US6043072A (en) 1998-11-05 2000-03-28 Washington State University Research Foundation Nucleic acids encoding Taxus geranylgeranyl diphosphate synthase, and methods of use
US6762345B1 (en) 1998-12-03 2004-07-13 E. I. Du Pont De Nemours And Company Plant stearoyl desaturases
JP2000175696A (ja) 1998-12-14 2000-06-27 Yoshio Tanaka ドナリエラ藻体の抽出方法
US6166231A (en) 1998-12-15 2000-12-26 Martek Biosciences Corporation Two phase extraction of oil from biomass
US6020509A (en) 1998-12-22 2000-02-01 Condea Vista Company Method for producing surfactant compositions
US6630066B2 (en) 1999-01-08 2003-10-07 Chevron U.S.A. Inc. Hydrocracking and hydrotreating separate refinery streams
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7211418B2 (en) 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US6278006B1 (en) 1999-01-19 2001-08-21 Cargill, Incorporated Transesterified oils
WO2000061740A1 (en) 1999-04-10 2000-10-19 Maxygen, Inc. Modified lipid production
BR0010597A (pt) 1999-04-12 2002-02-13 Monsanto Technology Llc Plantas transgênicas contendo nìveis alterados de compostos esterol e tocoferóis
HU228892B1 (en) 1999-06-04 2013-06-28 Consejo Superior Investigacion High oleic high stearic plants, seeds and oils
DE19926456A1 (de) 1999-06-10 2000-12-14 Norddeutsche Pflanzenzucht Han Verfahren zur Erhöhung des Fettsäuregehalts in Pflanzensamen
US6320101B1 (en) 1999-06-14 2001-11-20 Yissum Research Development Company Of The Hebrew University Of Jerusalem Enhancing inorganic carbon fixation by photosynthetic organisms
WO2001001949A1 (en) 1999-07-01 2001-01-11 Johnson And Johnson Consumer Companies, Inc. Cleansing compositions
US6217746B1 (en) 1999-08-16 2001-04-17 Uop Llc Two stage hydrocracking process
DE10000978A1 (de) 2000-01-12 2001-07-26 Gvs Ges Fuer Erwerb Und Verwer Verfahren zur Erhöhung des Gehalts an Fettsäuren in Pflanzen und Mikroorganismen
US6391815B1 (en) 2000-01-18 2002-05-21 Süd-Chemie Inc. Combination sulphur adsorbent and hydrogenation catalyst for edible oils
AU780619B2 (en) 2000-01-19 2005-04-07 Dsm Ip Assets B.V. Solventless extraction process
US6338866B1 (en) 2000-02-15 2002-01-15 Applied Food Biotechnology, Inc. Pet foods using algal or fungal waste containing fatty acids
GB0007651D0 (en) 2000-03-29 2000-05-17 Ascorbex Ltd Gene sequence
ES2291312T3 (es) * 2000-04-21 2008-03-01 Martek Biosciences Corporation Conversion trofica de algas fototroficas estrictas mediante ingenieria metabolica.
US6268517B1 (en) 2000-05-09 2001-07-31 Condea Vista Company Method for producing surfactant compositions
AU2001263062A1 (en) 2000-05-11 2001-11-20 The Procter And Gamble Company Highly concentrated fabric softener compositions and articles containing such compositions
US20020178467A1 (en) 2000-05-12 2002-11-28 Katayoon Dehesh Plastid transit peptide sequences for efficient plastid targeting
MY122480A (en) 2000-05-29 2006-04-29 Premium Vegetable Oils Sdn Bhd Trans free hard structural fat for margarine blend and spreads
DE10035213A1 (de) 2000-07-20 2002-01-31 Beiersdorf Ag Geformtes Seifenprodukt, enthaltend Talkum, eine oder mehrere Fettsäuren in Form ihrer Alkaliseifen und eine oder mehrere rückfettend wirkende Substanzen bei gleichzeitiger Abwesenheit von Alkyl-(oligo)-glycosiden
WO2002008403A2 (en) * 2000-07-25 2002-01-31 Calgene Llc Nucleic acid sequences encoding beta-ketoacyl-acp synthase and uses thereof
EP1178118A1 (en) 2000-08-02 2002-02-06 Dsm N.V. Isolation of microbial oils
FR2814064B1 (fr) 2000-09-20 2005-06-17 Oreal Composition de lavage comprenant des particules d'oxyde d'aluminium, au moins un agent conditionneur et au moins un tensioactif detergent
US6596155B1 (en) 2000-09-26 2003-07-22 Uop Llc Hydrocracking process
JP2002125601A (ja) 2000-10-25 2002-05-08 Kurorera Kogyo Kk 動物性プランクトン用餌料とその製造方法及び動物性プランクトンの培養方法
AU2002224445A1 (en) 2000-10-26 2002-05-06 Joe E. Guyer Method of generating and recovering gas from subsurface formations of coal, carbonaceous shale and organic-rich shales
US6538169B1 (en) 2000-11-13 2003-03-25 Uop Llc FCC process with improved yield of light olefins
SK11162003A3 (sk) 2000-11-21 2004-02-03 Unilever Nv Jedlá emulzná nátierka voda v oleji (W/O) a spôsob jej výroby
US7081567B2 (en) 2000-12-03 2006-07-25 Lexun Xue Transgenic dunaliella salina as a bioreactor
ATE542520T1 (de) 2000-12-21 2012-02-15 Aarhuskarlshamn Denmark As Verfahren zur herstellung von pflanzenölfraktionen, die reich an nichttocolhaltigem, hochschmelzendem, unverseifbarem material sind
US20020144455A1 (en) 2001-01-06 2002-10-10 Bertrand Jerome C. Non sooting candle composition
JP4226906B2 (ja) 2001-03-26 2009-02-18 ダウ グローバル テクノロジーズ インコーポレイティド 低級オレフィンによる不飽和脂肪酸エステルまたは不飽和脂肪酸の複分解
JP4823430B2 (ja) 2001-03-28 2011-11-24 花王株式会社 界面活性剤組成物
US20040235123A1 (en) 2001-04-20 2004-11-25 Liao Hans H Production of alpha-lipoic acid
US6620427B2 (en) * 2001-04-24 2003-09-16 Abbott Laboratories Method for improving bone mineralization
FR2824266B1 (fr) 2001-05-04 2005-11-18 Oreal Composition cosmetique de soin ou de maquillage des matieres keratiniques comprenant un ester a groupement aromatique et un agent photoprotecteur et utilisations
US6503285B1 (en) 2001-05-11 2003-01-07 Cargill, Inc. Triacylglycerol based candle wax
US6596768B2 (en) 2001-05-22 2003-07-22 Church & Dwight Co., Inc. Unsaturated lipid-enriched feedstock for ruminants
US6398707B1 (en) 2001-05-31 2002-06-04 Wen-Teng Wu Method of preparing lower alkyl fatty acids esters and in particular biodiesel
WO2003002719A2 (en) 2001-06-29 2003-01-09 Brookhaven Science Associates, Llc Isoform of castor oleate hydroxylase
US20030082595A1 (en) 2001-08-03 2003-05-01 Bo Jiang Nucleic acids of aspergillus fumigatus encoding industrial enzymes and methods of use
US6706659B2 (en) 2001-08-29 2004-03-16 Uop Llc High-activity isomerization catalyst and process
WO2003037884A2 (en) 2001-09-19 2003-05-08 Archer-Daniels-Midland Company Process for separation of tocopherols
JP3816774B2 (ja) 2001-10-01 2006-08-30 独立行政法人科学技術振興機構 炭化水素資化微細藻類およびそれを用いたバイオレメディエーション方法
DE60231331D1 (de) 2002-01-03 2009-04-09 Archer Daniels Midland Co Mehrfach ungesättige fettsäuren als teil von reaktiven strukturen für latexanstriche, verdickungsmittel, tenside und dispergiermittel
US7622284B2 (en) 2002-01-23 2009-11-24 Royal Nedalco B.V. Transformed eukaryotic cells that directly convert xylose to xylulose
US7314974B2 (en) 2002-02-21 2008-01-01 Monsanto Technology, Llc Expression of microbial proteins in plants for production of plants with improved properties
JP4095392B2 (ja) 2002-03-11 2008-06-04 水澤化学工業株式会社 バイオ燃料の製造方法
US6590113B1 (en) 2002-03-26 2003-07-08 Ronald T. Sleeter Process for treating oils containing antioxidant compounds
US20030229237A1 (en) 2002-04-02 2003-12-11 Haas Michael J. In situ production of fatty acid alkyl esters
ES2391381T3 (es) 2002-05-03 2012-11-23 Martek Biosciences Corporation Lípidos de alta calidad y métodos para su producción mediante liberación enzimática a partir de biomasa
US20030211594A1 (en) 2002-05-07 2003-11-13 Rosebrook Donald Ian Microalgae for remediation of waste and method of culturing the same
WO2003097763A1 (en) 2002-05-14 2003-11-27 Chemical Specialities, Inc. Water repellent compositions for wood preservatives
US6818589B1 (en) 2002-06-18 2004-11-16 Uop Llc Isomerization catalyst and processes
US20050262588A1 (en) 2002-06-21 2005-11-24 Katayoon Dehesh Thioesterase-related nucleic acid sequences and methods of use for the production of plants with modified fatty acid composition
DE60336902D1 (de) 2002-07-19 2011-06-09 Cytos Biotechnology Ag Impfstoffzusammensetzungen enthaltende amyloid beta 1-6 antigenarrays
US7232935B2 (en) 2002-09-06 2007-06-19 Fortum Oyj Process for producing a hydrocarbon component of biological origin
US7041866B1 (en) 2002-10-08 2006-05-09 Uop Llc Solid-acid isomerization catalyst and process
US20040074760A1 (en) 2002-10-17 2004-04-22 Carnegie Mellon University Production of biofuels
FI116627B (fi) 2002-11-01 2006-01-13 Danisco Menetelmä triglyseridien rasvahappoketjukoostumuksen säätelemiseksi sekä niiden käyttö
US7135290B2 (en) 2003-04-12 2006-11-14 Solazyme, Inc. Methods and compositions for evolving hydrogenase genes
WO2004046336A2 (en) 2002-11-18 2004-06-03 Monsanto Technology, Llc Production of increased oil and protein in plants by the disruption of the phenylpropanoid pathway
DE602004009538T2 (de) 2003-01-08 2008-07-31 Texas Tech University, Lubbock Elastomere zusammensetzungen auf basis von rizinusöl/epoxidiertem sojabohnenöl
CA2513289A1 (en) 2003-01-20 2004-08-05 Sungene Gmbh & Co. Kgaa Expression cassette with promotors of starch synthesis 3 for the expression of nucleic acids in plant tissue containing starch
US20060206949A1 (en) 2003-01-28 2006-09-14 Sylvain Arnould Custom-made meganuclease and use thereof
US20060156436A1 (en) 2003-03-03 2006-07-13 Meiji Seika Kaisha, Ltd. Transgenic plant having fructooligosaccharide accumulated therein and process for constructing
US7125672B2 (en) 2003-05-07 2006-10-24 E. I. Du Pont De Nemours And Company Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts
US7238482B2 (en) 2003-05-07 2007-07-03 E. I. Du Pont De Nemours And Company Production of polyunsaturated fatty acids in oleaginous yeasts
US7032664B2 (en) 2004-06-02 2006-04-25 Halliburton Energy Services, Inc. Nanocomposite particulates and methods of using nanocomposite particulates
US7259255B2 (en) 2003-06-25 2007-08-21 E. I. Du Pont De Nemours And Company Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast
WO2005005586A1 (ja) 2003-07-09 2005-01-20 The Nisshin Oillio, Ltd 対称型トリグリセリドの製造方法
DE10332151A1 (de) * 2003-07-15 2005-02-03 Cognis Deutschland Gmbh & Co. Kg Verfahren zur Herstellung von Carbonsäure-Metallseifen
CN1871351B (zh) 2003-08-25 2010-06-23 富诺齐梅生物技术股份有限公司 一种新的真菌蛋白及其编码核酸
PE20050398A1 (es) 2003-09-22 2005-06-03 Rosales Jose Antonio Socla Proceso y purificacion de las xantofilas de marigold
US20060048240A1 (en) 2004-04-01 2006-03-02 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
EP1670880A4 (en) 2003-10-02 2007-04-04 Univ Mississippi METHOD FOR PRODUCING BIODIESEL AND OTHER VALUABLE CHEMICALS FROM SLUDGE FROM WASTEWATER TREATMENT PLANTS
US7504259B2 (en) 2003-11-12 2009-03-17 E. I. Du Pont De Nemours And Company Δ12 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous yeast
ES2314467T3 (es) 2003-11-13 2009-03-16 Neste Oil Oyj Proceso para la hidrogenacion de olefinas.
DE602004031895D1 (de) 2003-11-20 2011-04-28 Solvay Verfahren zur Herstellung von Dichlorpropanol
CN1898389A (zh) 2003-12-23 2007-01-17 巴斯福植物科学有限公司 植物中的糖及脂质代谢调节剂vi
CN1238469C (zh) 2004-01-16 2006-01-25 清华大学 有机介质反应体系中脂肪酶转化油脂生产生物柴油新工艺
US7063957B2 (en) 2004-03-26 2006-06-20 The University Of Hong Kong Methods for production of astaxanthin from the green microalgae Chlorella in dark-heterotrophic cultures
US7364883B2 (en) 2004-05-07 2008-04-29 Yeastern Biotech Co., Ltd. Process for producing poly-unsaturated fatty acids by oleaginous yeasts
WO2005108586A1 (en) 2004-05-07 2005-11-17 Universität Regensburg A method for increasing the ratio of homologous to non-homologous recombination
WO2005113784A1 (en) 2004-05-12 2005-12-01 Luca Technologies, Llc Generation of hydrogen from hydrocarbon-bearing materials
US7214297B2 (en) 2004-06-28 2007-05-08 Applied Materials, Inc. Substrate support element for an electrochemical plating cell
US20060075522A1 (en) 2004-07-31 2006-04-06 Jaclyn Cleveland Genes and uses for plant improvement
US7279617B2 (en) 2004-09-22 2007-10-09 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
ES2689290T3 (es) 2004-09-28 2018-11-13 Neste Oyj Proceso para eterificar iso-olefinas
GB0421937D0 (en) 2004-10-02 2004-11-03 Univ York Acyl CoA synthetases
US7678931B2 (en) 2004-10-22 2010-03-16 Martek Biosciences Corporation Process for preparing materials for extraction
US7189559B2 (en) 2004-11-04 2007-03-13 E. I. Du Pont De Nemours And Company Mortierella alpina lysophosphatidic acid acyltransferase homolog for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
US7550286B2 (en) 2004-11-04 2009-06-23 E. I. Du Pont De Nemours And Company Docosahexaenoic acid producing strains of Yarrowia lipolytica
US8685679B2 (en) 2004-11-04 2014-04-01 E I Du Pont De Nemours And Company Acyltransferase regulation to increase the percent of polyunsaturated fatty acids in total lipids and oils of oleaginous organisms
US7879591B2 (en) 2004-11-04 2011-02-01 E.I. Du Pont De Nemours And Company High eicosapentaenoic acid producing strains of Yarrowia lipolytica
US7238277B2 (en) 2004-12-16 2007-07-03 Chevron U.S.A. Inc. High conversion hydroprocessing
US20060225341A1 (en) 2004-12-20 2006-10-12 Rodolfo Rohr Production of biodiesel
MX2007007914A (es) 2004-12-30 2007-08-14 Sun Drilling Products Corp Particulas nanocompuestas termoendurecibles, procesamiento para su produccion, y su uso en aplicaciones de perforacion de petroleo y gas natural.
ATE490298T1 (de) 2005-01-14 2010-12-15 Neste Oil Oyj Verfahren zur herstellung von kohlenwasserstoffen
DE102005003624A1 (de) 2005-01-26 2006-07-27 Nutrinova Nutrition Specialties & Food Ingredients Gmbh Herstellung und Anwendung eines antioxidativ wirksamen Extraktes aus Crypthecodinium sp.
US7692049B2 (en) 2005-01-31 2010-04-06 Exxonmobil Chemical Patents Inc. Hydrocarbon compositions useful for producing fuels and methods of producing the same
EP1871883A1 (en) 2005-03-02 2008-01-02 Metanomics GmbH Process for the production of fine chemicals
US7851199B2 (en) 2005-03-18 2010-12-14 Microbia, Inc. Production of carotenoids in oleaginous yeast and fungi
US20060223153A1 (en) 2005-04-05 2006-10-05 Luca Technologies, Llc Generation of materials with enhanced hydrogen content from anaerobic microbial consortia
US7426960B2 (en) 2005-05-03 2008-09-23 Luca Technologies, Inc. Biogenic fuel gas generation in geologic hydrocarbon deposits
CN101227900A (zh) 2005-05-11 2008-07-23 高级生物营养公司 稳定形式的鱼油
CA2624616A1 (en) 2005-05-12 2006-11-23 Martek Biosciences Corporation Biomass hydrolysate and uses and production thereof
US7288685B2 (en) 2005-05-19 2007-10-30 Uop Llc Production of olefins from biorenewable feedstocks
EP2990462A1 (en) 2005-07-04 2016-03-02 Neste Oil Oyj Process for the manufacture of diesel range hydrocarbons
PL1741768T5 (pl) 2005-07-04 2024-02-05 Neste Oyj Sposób wytwarzania węglowodorów w zakresie oleju napędowego
MX2008002633A (es) 2005-08-25 2008-09-26 A2Be Carbon Capture Llc Metodo, aparato y sistema para produccion de biodiesel a partir de algas.
WO2007027669A1 (en) 2005-08-29 2007-03-08 Cps Biofuels, Inc. Improved biodiesel fuel, additives, and lubbricants
FR2890961B1 (fr) 2005-09-21 2007-11-23 Inst Francais Du Petrole Procede perfectionne de fabrication d'esters ethyliques a partir de corps gras d'origine naturelle
WO2007038566A2 (en) 2005-09-27 2007-04-05 Cornell University Invertase and inhibitors from coffee
CN100408656C (zh) 2005-09-28 2008-08-06 中国科学院大连化学物理研究所 一种生物柴油的制备方法
US8163675B2 (en) 2005-10-20 2012-04-24 Akzo Nobel N.V. Emulsifier based on polyamines and fatty acid/maleic anhydride
ES2491871T3 (es) 2005-12-12 2014-09-08 Neste Oil Oyj Proceso para la elaboración de hidrocarburos
US20070167396A1 (en) 2006-01-19 2007-07-19 Solazyme, Inc. Methods and compositions for cholesterol reduction in mammals
US20090274736A1 (en) 2006-01-19 2009-11-05 Solazyme Inc. Nutraceutical Compositions From Microalgae And Related Methods of Production And Administration
US20070166266A1 (en) * 2006-01-19 2007-07-19 Solazyme, Inc. Methods and compositions for improving the health and appearance of skin
US9109170B2 (en) 2006-02-02 2015-08-18 Reg Biofuels, Llc Biodiesel cold filtration process
US20070218183A1 (en) 2006-03-14 2007-09-20 Bunge Oils, Inc. Oil composition of conjugated linoleic acid
WO2007106904A2 (en) 2006-03-15 2007-09-20 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
CN100590186C (zh) 2006-03-17 2010-02-17 中国科学院大连化学物理研究所 一种生产生物油脂和生物柴油的方法
WO2007117511A2 (en) 2006-04-03 2007-10-18 Advanced Bionutrition Corporation Feed formulations containing docosahexaenoic acid
US20100248322A1 (en) 2006-04-05 2010-09-30 Luca Technologies, Inc. Chemical amendments for the stimulation of biogenic gas generation in deposits of carbonaceous material
BRPI0709946A2 (pt) 2006-04-13 2011-08-02 Ambrozea Inc composições e métodos para produzir produtos e resìduos de fermentação
US7309602B2 (en) 2006-04-13 2007-12-18 Ambrozea, Inc. Compositions and methods for producing fermentation products and residuals
CN101460609A (zh) 2006-05-12 2009-06-17 亚利桑那州立大学董事会,代表亚利桑那州立大学法人团体利益 新的小球藻属(chlorella)物种及其应用
WO2007141257A1 (en) 2006-06-06 2007-12-13 Total Raffinage Marketing Lysophosphatidic acid acyltransferase genes and uses thereof
US20070286908A1 (en) 2006-06-08 2007-12-13 Kent Clampitt Salt and soap compositions
US8029579B2 (en) 2006-06-28 2011-10-04 COH Inc. Fatty acid blends and uses therefor
CN101108997B (zh) 2006-07-19 2010-07-21 中国科学院大连化学物理研究所 一种微生物油脂的制备方法
KR20090040476A (ko) 2006-08-16 2009-04-24 바이오이콘 인터내셔널 홀딩 엔.브이. 감압 경유와 트리글리세라이드의 혼합물을 수소화처리함으로써 직쇄형 알칸의 제조 방법
WO2008034109A1 (en) * 2006-09-14 2008-03-20 Biofuelbox Corporation Methods of robust and efficient conversion of cellular lipids to biofuels
MX2009002835A (es) 2006-09-18 2009-08-07 Univ Arizona Ácidos grasos e hidrocarburos de longitud de cadena media de algas.
JP2008081559A (ja) 2006-09-26 2008-04-10 Nippon Shokubai Co Ltd バイオディーゼル燃料組成物およびその製造方法
US8367395B2 (en) 2006-09-28 2013-02-05 Dsm Ip Assets B.V. Production of sterols in oleaginous yeast and fungi
WO2008046106A2 (en) 2006-10-13 2008-04-17 Elevance Renewable Sciences, Inc. Synthesis of terminal alkenes from internal alkenes via olefin metathesis
US9101161B2 (en) 2006-11-02 2015-08-11 The Coca-Cola Company High-potency sweetener composition with phytoestrogen and compositions sweetened therewith
US8088614B2 (en) 2006-11-13 2012-01-03 Aurora Algae, Inc. Methods and compositions for production and purification of biofuel from plants and microalgae
ITMI20062193A1 (it) 2006-11-15 2008-05-16 Eni Spa Processo per produrre frazioni idrocarburiche da miscele di origine biologica
JP4820277B2 (ja) 2006-12-20 2011-11-24 花王株式会社 ケトン体及び/又は2級アルコールの製造法
US9637714B2 (en) * 2006-12-28 2017-05-02 Colorado State University Research Foundation Diffuse light extended surface area water-supported photobioreactor
JP2008178871A (ja) 2006-12-28 2008-08-07 Tohoku Techno Arch Co Ltd 強塩基性陰イオン交換樹脂の再生方法
US7977076B2 (en) 2006-12-29 2011-07-12 Genifuel Corporation Integrated processes and systems for production of biofuels using algae
WO2008083352A1 (en) 2006-12-29 2008-07-10 Genifuel Corporation Production of biofuels using algae
CN101652477A (zh) 2007-02-02 2010-02-17 麒麟控股株式会社 编码木糖醇脱氢酶的dna
US8129512B2 (en) 2007-04-12 2012-03-06 Pioneer Hi-Bred International, Inc. Methods of identifying and creating rubisco large subunit variants with improved rubisco activity, compositions and methods of use thereof
MX2009007356A (es) 2007-05-02 2009-10-08 Ouro Fino Participacoes E Empr Proceso para producir biodiesel y/o aceite combustible.
JP5628024B2 (ja) 2007-05-15 2014-11-19 ダウ グローバル テクノロジーズ エルエルシー 高弾性発泡体
US8801975B2 (en) 2007-05-17 2014-08-12 Cooper Industries, Llc Vegetable oil dielectric fluid composition
ATE540112T1 (de) * 2007-06-01 2012-01-15 Sapphire Energy Inc Verwendung gentechnisch veränderter organismen zur erzeugung biomasse abbauender enzyme
AU2008259834B2 (en) 2007-06-01 2013-08-01 Corbion Biotech, Inc. Production of oil in microorganisms
US7914832B2 (en) 2007-06-01 2011-03-29 Kyoto Eiyo Co., Ltd. Method for producing chlorella fermented food
WO2008156651A1 (en) 2007-06-12 2008-12-24 Cps Biofuels, Inc. Production of gasoline from fermentable feedstocks
US20090018300A1 (en) 2007-07-11 2009-01-15 Archer-Daniels-Midland Company Monomers and polymers from bioderived carbon
CN101092353B (zh) * 2007-07-12 2010-12-01 上海交通大学 动植物油脂转化脂肪酸单酯的制备方法
CN101130513A (zh) 2007-08-24 2008-02-27 北京科技大学 一种从小球藻藻粉中提取纯化叶黄素的方法
KR101650680B1 (ko) 2007-08-31 2016-08-23 디에스엠 아이피 어셋츠 비.브이. 다중불포화된 지방산 함유 고체 지방 조성물 및 그의 용도 및 생산
US20090197312A1 (en) 2007-09-07 2009-08-06 Helsinki University Of Technology Production of fat from alcohol
WO2009035551A1 (en) 2007-09-12 2009-03-19 Martek Biosciences Corporation Biological oils and production and uses thereof
WO2009036385A2 (en) 2007-09-12 2009-03-19 Kuehnle Agrosystems, Inc. Expression of nucleic acid sequences for production of biofuels and other products in algae and cyanobacteria
US8323935B2 (en) * 2007-10-03 2012-12-04 E I Du Pont De Nemours And Company Optimized strains of Yarrowia lipolytica for high eicosapentaenoic acid production
CA2704371A1 (en) 2007-11-01 2009-05-07 Wake Forest University School Of Medicine Compositions and methods for prevention and treatment of mammalian diseases
FR2924126B1 (fr) 2007-11-28 2011-04-15 Roquette Freres Nouveau procede de culture d'une microalgue heterotrophe
US20090145392A1 (en) 2007-11-30 2009-06-11 Clark Richard Hugh Fuel formulations
US8815567B2 (en) 2007-11-30 2014-08-26 E I Du Pont De Nemours And Company Coenzyme Q10 production in a recombinant oleaginous yeast
EP2231864B1 (en) * 2007-12-11 2017-05-24 Synthetic Genomics, Inc. Secretion of fatty acids by photosynthetic microorganisms
GB0724720D0 (en) 2007-12-19 2008-01-30 Ici Plc Triglyceride macromonomers
WO2009105620A1 (en) 2008-02-20 2009-08-27 Cco Technology, Ltd. Selective short chain monounsaturated oils
CN101230364A (zh) 2008-02-25 2008-07-30 清华大学 一种利用异养小球藻高密度发酵生产生物柴油的方法
US8048654B2 (en) 2010-06-09 2011-11-01 Joule Unlimited Technologies, Inc. Methods and compositions for the recombinant biosynthesis of fatty acids and esters
US8598378B2 (en) * 2008-03-14 2013-12-03 University Of Hawaii Methods and compositions for extraction and transesterification of biomass components
US8043496B1 (en) 2008-03-18 2011-10-25 Peter Allen Schuh System for extracting oil from algae
AU2009231810A1 (en) 2008-03-31 2009-10-08 Kuehnle Agrosystems, Inc. Nuclear based expression of genes for production of biofuels and process co-products in algae
MX2010011065A (es) 2008-04-09 2010-12-06 Solazyme Inc Modificacion química directa de biomasa microbiana y aceites microbianos.
US20100170144A1 (en) 2008-04-09 2010-07-08 Solazyme, Inc. Hydroprocessing Microalgal Oils
WO2009140354A1 (en) 2008-05-13 2009-11-19 Cargill, Incorporated Polyol made from partially hydrogenated, fully epoxidized natural oils
CN101280328B (zh) 2008-05-27 2011-06-29 清华大学 一种从自养到异养两步培养小球藻生产生物柴油的方法
US8435790B2 (en) 2008-07-25 2013-05-07 The Regents Of The University Of California Methods of modulating lipid concentrations in eukaryotic cells
US8273694B2 (en) 2008-07-28 2012-09-25 Jeffrey A Brown Synthetic compositions obtained from algae
BRPI0916598A2 (pt) 2008-07-28 2017-05-30 Qteros Inc métodos e composições para aumentar a produção de produtos em micro-organismos
US20100035309A1 (en) 2008-08-06 2010-02-11 Luca Technologies, Inc. Analysis and enhancement of metabolic pathways for methanogenesis
US8927475B2 (en) 2008-08-08 2015-01-06 The Dial Corporation Consumer products comprising algae derived ingredients
WO2010019813A2 (en) 2008-08-13 2010-02-18 Sapphire Energy, Inc. Production of fatty actds by genetically modified photosynthetic organisms
AU2009299075B2 (en) 2008-10-03 2017-01-19 Agrisoma Bioscience Inc. Production of modified fatty acids in plants
JP2012504963A (ja) 2008-10-07 2012-03-01 エルエス9・インコーポレイテッド 脂肪アルデヒドを生産するための方法および組成物
WO2010045268A2 (en) * 2008-10-13 2010-04-22 Learning Curve Brands, Inc. Electronic interactive toy
US20120128851A1 (en) 2008-10-14 2012-05-24 Solazyme, Inc Novel microalgal food compositions
US20100303990A1 (en) 2008-10-14 2010-12-02 Solazyme, Inc. High Protein and High Fiber Algal Food Materials
US20100297323A1 (en) 2008-10-14 2010-11-25 Solazyme, Inc. Gluten-free Foods Containing Microalgae
US20100303989A1 (en) 2008-10-14 2010-12-02 Solazyme, Inc. Microalgal Flour
US20100297295A1 (en) 2008-10-14 2010-11-25 Solazyme, Inc. Microalgae-Based Beverages
US20100303957A1 (en) 2008-10-14 2010-12-02 Solazyme, Inc. Edible Oil and Processes for Its Production from Microalgae
US20130122180A1 (en) 2008-10-14 2013-05-16 Solazyme, Inc. Microalgal Food Compositions
CN104770424A (zh) 2008-10-14 2015-07-15 索拉兹米公司 微藻生物质的食品组合物
US20100297292A1 (en) 2008-10-14 2010-11-25 Solazyme, Inc. Reduced Pigmentation Microalgae Strains and Products Therefrom
US20100297325A1 (en) 2008-10-14 2010-11-25 Solazyme, Inc. Egg Products Containing Microalgae
US20100297331A1 (en) 2008-10-14 2010-11-25 Solazyme, Inc. Reduced Fat Foods Containing High-Lipid Microalgae with Improved Sensory Properties
US20100297296A1 (en) 2008-10-14 2010-11-25 Solazyme, Inc. Healthier Baked Goods Containing Microalgae
US20100303961A1 (en) 2008-10-14 2010-12-02 Solazyme, Inc. Methods of Inducing Satiety
ES2583639T3 (es) 2008-11-28 2016-09-21 Terravia Holdings, Inc. Producción de aceites específicos en microorganismos heterótrofos
MX2011006081A (es) 2008-12-11 2011-06-24 Bio Architecture Lab Inc Biosintesis de productos quimicos de uso generalizado.
CA2747516C (en) 2008-12-23 2019-11-05 Ls9, Inc. Methods and compositions related to thioesterase enzymes
US8389625B2 (en) 2008-12-23 2013-03-05 Exxonmobil Research And Engineering Company Production of synthetic hydrocarbon fluids, plasticizers and synthetic lubricant base stocks from renewable feedstocks
US20100196575A1 (en) * 2009-01-30 2010-08-05 Solae, Llc Melting Vegetable Protein Based Substitute Cheese
CN101824440A (zh) 2009-03-04 2010-09-08 中国科学院大连化学物理研究所 一种微生物油脂的分离方法
AU2010229686B2 (en) 2009-03-27 2015-09-03 Corteva Agriscience Llc Dielectric heat-transfer fluid
AU2010236412B2 (en) 2009-04-14 2015-10-01 Corbion Biotech, Inc. Methods of microbial oil extraction and separation
CN102946738B (zh) 2009-04-14 2015-04-01 索拉兹米公司 新颖的微藻食物组合物
WO2010130725A1 (en) 2009-05-13 2010-11-18 Basf Plant Science Company Gmbh Acyltransferases and uses thereof in fatty acid production
WO2011026008A1 (en) 2009-08-28 2011-03-03 Phycal Llc Biofuel from recombinant oleginous algae using sugar carbon sources
US20110162259A1 (en) 2009-09-25 2011-07-07 Ls9, Inc. Production of fatty acid derivatives
EP2327776A1 (en) 2009-11-30 2011-06-01 Institut National De La Recherche Agronomique Method for the production of Very Long Chain Fatty Acids (VLCFA) by fermentation with a recombinant Yarrowia sp
SG181114A1 (en) 2009-12-18 2012-07-30 Cargill Inc Brassica plants yielding oils with a low total saturated fatty acid content
EP2519642B1 (en) 2009-12-28 2017-10-25 DSM IP Assets B.V. Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof
WO2011082253A2 (en) 2009-12-30 2011-07-07 Board Of Trustees Of Michigan State University A method to produce acetyldiacylglycerols (ac-tags) by expression ofan acetyltransferase gene isolated from euonymus alatus (burning bush)
EP2558565A4 (en) 2010-04-14 2014-01-29 Solazyme Inc FUEL AND CHEMICAL PRODUCTION OF OIL-HOLDING YEAST
US20110256268A1 (en) 2010-04-14 2011-10-20 Solazyme, Inc. Oleaginous Yeast Food Compositions
JP5865894B2 (ja) 2010-04-14 2016-02-17 ソラザイム ロケット ニュートリショナルズ, エルエルシー 高脂質微細藻類粉末食品組成物
AT509777B1 (de) 2010-04-30 2012-03-15 Orphanidis Pharma Res Gmbh Adhesive retardformulierungen zur lokalen verabreichung von curcumin
JP5868962B2 (ja) 2010-05-28 2016-02-24 ソラザイム, インコーポレイテッドSolazyme Inc 組み換え従属栄養性微生物から産生された用途に応じた油
EP3521408B1 (en) 2010-11-03 2021-12-22 Corbion Biotech, Inc. Genetically-engineered chlorella or prototheca microbe and oil produced therefrom
US8530207B2 (en) 2010-12-23 2013-09-10 Exxonmobil Research And Engineering Company Photosynthetic microorganisms comprising exogenous prokaryotic acyl-ACP thioesterases and methods for producing fatty acids
KR101964965B1 (ko) 2011-02-02 2019-04-03 테라비아 홀딩스 인코포레이티드 재조합 유지성 미생물로부터 생산된 맞춤 오일
MX339607B (es) 2011-05-06 2016-05-31 Solazyme Inc Microorganismos geneticamente modificados que metabolizan xilosa.
BR112014012917A2 (pt) 2011-11-28 2017-06-13 Solazyme Inc ácido nucleico recombinante, cassete de expressão, célula, método para obter óleo microbiano, e, óleo microbiano
SG11201403419SA (en) 2011-12-23 2014-07-30 Solazyme Inc Algal thermoplastics, thermosets, paper, adsorbants and absorbants
BR112014025719A8 (pt) 2012-04-18 2017-10-03 Solazyme Inc Óleos customizados
US9719114B2 (en) 2012-04-18 2017-08-01 Terravia Holdings, Inc. Tailored oils
CA2903494A1 (en) 2013-03-08 2014-09-12 Solazyme, Inc. Oleaginous microbial lubricants
EP2993993A2 (en) 2013-04-26 2016-03-16 Solazyme, Inc. Low polyunsaturated fatty acid oils and uses thereof
MX369685B (es) 2013-10-04 2019-11-19 Terravia Holdings Inc Aceites adaptables.
US9394550B2 (en) 2014-03-28 2016-07-19 Terravia Holdings, Inc. Lauric ester compositions
US9969990B2 (en) 2014-07-10 2018-05-15 Corbion Biotech, Inc. Ketoacyl ACP synthase genes and uses thereof
CN107087416A (zh) 2014-07-24 2017-08-22 泰拉瑞亚控股公司 变体硫酯酶及使用方法
JP2018512851A (ja) 2015-04-06 2018-05-24 テラヴィア ホールディングス, インコーポレイテッド Lpaatアブレーションを有する油産生微細藻類
US20180216144A1 (en) 2015-09-28 2018-08-02 Corbion Biotech, Inc. Triglyceride oils having asymmetric triglyceride molecules

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Eukaryotic Cell, Vol. 9, No. 6, Pages 486-501(공개일: 2010. 4.)*
Plant Journal, Vol. 54, Pages 621-639(공개일: 2008.)*

Also Published As

Publication number Publication date
JP2013528383A (ja) 2013-07-11
US20120324784A1 (en) 2012-12-27
ZA201209186B (en) 2014-02-26
CN107058116A (zh) 2017-08-18
SG10201504187YA (en) 2015-06-29
JP2019062919A (ja) 2019-04-25
SG10201504197SA (en) 2015-06-29
AU2018203211A1 (en) 2018-05-31
WO2011150410A3 (en) 2012-04-19
JP2016005484A (ja) 2016-01-14
KR20180122486A (ko) 2018-11-12
CN103124499B (zh) 2016-09-28
KR20130085374A (ko) 2013-07-29
US9657299B2 (en) 2017-05-23
EP2576800A2 (en) 2013-04-10
EP2576800B1 (en) 2019-01-30
CN106135460B (zh) 2020-07-24
US9109239B2 (en) 2015-08-18
AU2016202905B2 (en) 2018-02-15
JP6150911B2 (ja) 2017-06-21
EP2575486A1 (en) 2013-04-10
US20130004646A1 (en) 2013-01-03
AU2011257983B2 (en) 2016-02-11
US10006034B2 (en) 2018-06-26
US20130102039A1 (en) 2013-04-25
JP6542283B2 (ja) 2019-07-10
ES2718489T3 (es) 2019-07-02
JP5868962B2 (ja) 2016-02-24
US9279136B2 (en) 2016-03-08
JP5996527B2 (ja) 2016-09-21
MX352746B (es) 2017-12-06
JP2016104024A (ja) 2016-06-09
WO2011150410A2 (en) 2011-12-01
US20160186191A1 (en) 2016-06-30
EP2575486B1 (en) 2021-09-01
AU2016202905A1 (en) 2016-05-26
KR101899938B1 (ko) 2018-09-19
CA3039432A1 (en) 2011-12-01
KR101916421B1 (ko) 2018-11-08
AU2011257982A1 (en) 2013-01-10
US20110294174A1 (en) 2011-12-01
US20140315267A1 (en) 2014-10-23
JP2013533735A (ja) 2013-08-29
MX339639B (es) 2016-06-02
US20130096211A1 (en) 2013-04-18
CA2801057C (en) 2019-06-18
CN103097540A (zh) 2013-05-08
EP2575486A4 (en) 2016-03-23
CA2801057A1 (en) 2011-12-01
US8765424B2 (en) 2014-07-01
ES2898678T3 (es) 2022-03-08
SG185780A1 (en) 2013-01-30
US9255282B2 (en) 2016-02-09
AU2011257982B2 (en) 2017-05-25
BR112012030333A2 (pt) 2018-03-13
CN103124499A (zh) 2013-05-29
KR20130087410A (ko) 2013-08-06
AU2011257983A1 (en) 2013-01-10
MX356949B (es) 2018-06-20
SG185781A1 (en) 2013-01-30
JP2017104132A (ja) 2017-06-15
WO2011150411A1 (en) 2011-12-01
ZA201209185B (en) 2014-02-26
EP2576800A4 (en) 2016-07-13
CA2801024A1 (en) 2011-12-01
BR112012030329A2 (pt) 2017-12-12
US8592188B2 (en) 2013-11-26
CN106135460A (zh) 2016-11-23
MX2012013777A (es) 2013-03-25
US20110293785A1 (en) 2011-12-01
MX2012013756A (es) 2013-02-26
US20160024538A1 (en) 2016-01-28
US20180327758A1 (en) 2018-11-15

Similar Documents

Publication Publication Date Title
KR102148462B1 (ko) 종속영양 미생물유기체로부터 생성된 맞춤 오일
AU2016247159B2 (en) Tailored oils produced from recombinant oleaginous microorganisms
KR102001129B1 (ko) 재조합 종속영양성 미생물에서 맞춤 오일의 제조
KR102065526B1 (ko) 유동점이 낮은 미생물 오일, 이 오일로 제조된 유전성 유체 및 관련 방법
KR101504618B1 (ko) 미생물에서 오일의 생성
KR20140033378A (ko) 자일로오스를 대사시키는 유전자 조작된 미생물
KR20150001830A (ko) 맞춤 오일

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant