KR102148462B1 - 종속영양 미생물유기체로부터 생성된 맞춤 오일 - Google Patents
종속영양 미생물유기체로부터 생성된 맞춤 오일 Download PDFInfo
- Publication number
- KR102148462B1 KR102148462B1 KR1020187031842A KR20187031842A KR102148462B1 KR 102148462 B1 KR102148462 B1 KR 102148462B1 KR 1020187031842 A KR1020187031842 A KR 1020187031842A KR 20187031842 A KR20187031842 A KR 20187031842A KR 102148462 B1 KR102148462 B1 KR 102148462B1
- Authority
- KR
- South Korea
- Prior art keywords
- delete delete
- acyl
- oil
- microalgae
- gene
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23D—EDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
- A23D7/00—Edible oil or fat compositions containing an aqueous phase, e.g. margarines
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23D—EDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
- A23D9/00—Other edible oils or fats, e.g. shortenings, cooking oils
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23K—FODDER
- A23K20/00—Accessory food factors for animal feeding-stuffs
- A23K20/10—Organic substances
- A23K20/158—Fatty acids; Fats; Products containing oils or fats
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11B—PRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
- C11B1/00—Production of fats or fatty oils from raw materials
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11C—FATTY ACIDS FROM FATS, OILS OR WAXES; CANDLES; FATS, OILS OR FATTY ACIDS BY CHEMICAL MODIFICATION OF FATS, OILS, OR FATTY ACIDS OBTAINED THEREFROM
- C11C3/00—Fats, oils, or fatty acids by chemical modification of fats, oils, or fatty acids obtained therefrom
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2431—Beta-fructofuranosidase (3.2.1.26), i.e. invertase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2465—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on alpha-galactose-glycoside bonds, e.g. alpha-galactosidase (3.2.1.22)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P1/00—Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/19—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with oxidation of a pair of donors resulting in the reduction of molecular oxygen to two molecules of water (1.14.19)
- C12Y114/19001—Stearoyl-CoA 9-desaturase (1.14.19.1), i.e. DELTA9-desaturase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02014—Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01022—Alpha-galactosidase (3.2.1.22)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01026—Beta-fructofuranosidase (3.2.1.26), i.e. invertase
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P30/00—Technologies relating to oil refining and petrochemical industry
- Y02P30/20—Technologies relating to oil refining and petrochemical industry using bio-feedstock
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T50/00—Aeronautics or air transport
- Y02T50/60—Efficient propulsion technologies, e.g. for aircraft
- Y02T50/678—Aviation using fuels of non-fossil origin
Abstract
오일-함유 미생물 유기체 및 이러한 미생물 유기체의 저비용 배양방법을 포함하는, 오일, 연료, 함유화학물질, 및 재조합 미생물 유기체 내 다른 화합물의 생성을 위한 방법 및 조성물이 제공된다. 예를 들어 리파제, 수크로스 수송체, 수크로스 인버타제, 프럭토키나제, 다당류-분해 효소, 케토 아실-ACP 신타제 효소, 지방 아실-ACP 티오에스터라제, 지방 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 알데하이드 데카보닐라제를 함유하는 미세조류 세포, 및/또는 아실 운반체 단백질은 재생 디젤, 바이오디젤, 및 재생 제트 연료와 같은 운송 연료의 제조뿐만 아니라 기능성 유체, 계면활성제, 비누 및 윤활제의 제조에 유용하다.
Description
관련출원과의 상호참조
본 출원은 미국 특허법(35 U.S.C. 119(e)) 하에서 2010년 5월 28일 출원된 미국 가특허출원 제61/349,774호, 2010년 8월 18일 출원된 미국 가특허출원 제61/374,992호, 2010년 11월 16일 출원된 미국 가특허출원 제61/414,393호, 및 2010년 12월 29일 출원된 미국 가특허출원 제61/428,192호의 우선권을 주장한다. 각각의 이들 출원은 그것의 전문이 모든 목적을 위하여 본 명세서에 참조로 포함된다.
서열목록에 대한 참조
본 출원은 본 명세서에 첨부된 1 내지 195 페이지에 나타낸 것과 같은 서열목록을 포함한다.
본 발명의 기술분야
본 발명은 미생물 유기체로부터 만들어진 오일, 연료, 및 함유화학물질(oleochemical)의 생산에 관한 것이다. 특히, 본 명세서는 오일-함유 미세조류(microalgae), 지질, 지방산 에스터, 지방산, 알데하이드, 알코올, 및 알칸을 포함하는 유용한 화합물의 생산을 위해 그것들을 배양하는 방법, 및 그것들을 유전적으로 변경하여 생산 효율을 개선하고 그것들에 의해 생성된 오일의 유형 및 조성을 변경시키는 방법 및 시약에 관한 것이다.
화석연료는 유기물질의 매장된 가연성 퇴적물에 대한 일반적 용어이며, 부패한 식물 및 동물이 수억년에 걸쳐 지각 내 열 및 압력에 노출됨으로써 원유, 석탄, 천연가스 또는 중유로 변환되어 형성된다. 화석연료는 한정된 비-재생 자원이다. 세계 경제에 의해 증가된 에너지 수요는 또한 탄화수소 비용 증가의 압력에 놓여있다. 에너지 이외에, 플라스틱 및 화학물질 제조자를 포함하는 다수의 산업은 그들의 공정을 위한 공급원료로서 탄화수소의 유용성에 크게 의존한다. 현존하는 공급원에 대해 비용-효과적인 대체물은 증가하는 에너지 및 이들 원료 비용상의 압력을 완화시킬 수 있었다.
국제특허 공개 제2008/151149호는 오일생성을 위한 미세조류 배양 방법 및 재료를 기재하며, 특히 미세조류 클로렐라 프로토테코이데스(Chlorella protothecoides)에 의해 생성된 오일로부터 디젤 연료의 생성을 예시한다. 미세조류 내 오일 생성을 위한 개선된 방법, 특히 더 짧은 쇄 길이 및 더 높은 포화도를 가지며, 색소가 없는 오일을 더 큰 수율과 효율로 생성하는 방법에 대한 필요가 남아있다. 본 방법은 이런 필요를 충족시킨다.
본 발명은 별개의 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공하며, 지방-아실 ACP 티오에스터라제와 같은 단백질을 암호화하는 외인성 유전자를 발현시키는 재조합 세포를 포함한다. 본 발명은 또한 이러한 세포로부터 바이오디젤, 재생 디젤 및 제트 연료를 포함하는 지질 및 오일-기재 제품(oil-based product)을 만드는 방법을 제공한다.
제1 양태에서, 본 발명은 적어도 1% 또는 적어도 5%, 바람직하게는 적어도 3%의 C8:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 10% 또는 적어도 15%, 바람직하게는 적어도 12%, C8:0이다. 일부 실시형태에서, 세포는 재조합 세포이다. 일부 경우에, 재조합 세포는 쇄 길이 C8의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 외인성 유전자는 쿠페아 팔루스트리스(Cuphea palustris) 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 세포는 프로토테카(prototheca) 세포이다. 일부 경우에, 세포는 표 1에서 확인되는 미세조류로부터 선택되는 미세조류 속 또는 종을 가진다.
제2 양태에서, 본 발명은 적어도 4%의 C10:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 20%, 적어도 25% 또는 적어도 30%, 바람직하게는 적어도 24%, C10:0이다. 일부 경우에, C10:0 대 C12:0의 비는 적어도 6:1이다. 일부 실시형태에서, 세포는 재조합 세포이다. 일부 경우에, 재조합 세포는 쇄 길이 C10의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 외인성 유전자는 쿠페아 후커리아나(Cuphea hookeriana) 및 미국 느릅나무(Ulmus americana)로 이루어진 군으로부터 선택된 종으로부터의 아실-ACP 티오에스터라제 단백질을 암호화한다. 일부 경우에, 세포는 프로노테카 세포이다. 일부 실시형태에서, 세포는 표 1에서 확인되는 미세조류로부터 선택된 미세조류속 또는 종을 가진다.
제3 양태에서, 본 발명은 적어도 10% 또는 적어도 15%, 바람직하게는 적어도 13%, C12:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 30%, 적어도 35% 또는 적어도 40%, 바람직하게는 적어도 34%, C12:0이다. 일부 경우에, C12 대 C14의 비는 적어도 5:1이다. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C12의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 경우에, 재조합 세포는 쇄 길이 C12의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 캘리포니아 월계수(Umbellularia californica) 및 녹나무(Cinnamomum camphora)로부터의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함한다. 일부 실시형태에서, 세포는 프로토테카 세포이다.
제4양태에서, 본 발명은 적어도 5% 또는 적어도 15%, 바람직하게는 적어도 10%, C14:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 40%, 적어도 45%, 또는 적어도 50%, 바람직하게는 적어도 43%, C14:0이다. 일부 경우에, C14:0 대 C12:0의 비는 적어도 7:1이다. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 장쇄 C14의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 아실-ACP 티오에스터라제 단백질은 녹나무 및 미국 느릅나무로 이루어진 군으로부터 선택된 종으로부터 유래된다. 일부 경우에, 세포는 프로토테카 세포이다. 일부 실시형태에서, 세포는 표 1에서 확인되는 미세조류로부터 선택된 미세조류 속 또는 종을 가진다.
제5 양태에서, 본 발명은 적어도 10% 또는 적어도 20%, 바람직하게는 적어도 15%, C16:0인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 지질 프로파일은 적어도 30%, 적어도 35% 또는 적어도 40%, 바람직하게는 적어도 37%, C16:0. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C16의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C16의 지방 아실-ACP 기질에 대한 가수분해 활성을 가지는 캘리포니아 월계수 및 녹나무로부터의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함한다. 일부 경우에, 세포는 프로토테카 세포이다.
제6 양태에서, 본 발명은 적어도 55% 또는 적어도 65%, 바람직하게는 적어도 60%, 포화 지방산인 지질 프로파일을 가지는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공한다. 일부 경우에, 세포는 적어도 80%, 적어도 85%, 또는 적어도 90%, 바람직하게는 적어도 86%, 포화된 지방산인 지질 프로파일을 가진다. 일부 경우에, 세포는 재조합 세포이다. 일부 실시형태에서, 재조합 세포는 쇄 길이 C10-C16의 지방 아실-ACP 기질에 대해 가수분해 활성을 가지는 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 실시형태에서, 세포는 케토아실 신타제 단백질을 암호화하는 외인성 유전자를 포함한다. 일부 경우에, 세포는 프로토테카 세포이다.
제7 양태에서, 본 발명은 돌연변이된 내인성 불포화효소 유전자를 포함하는, 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공하되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다. 일부 경우에, 세포는 적어도 40% 또는 적어도 50%, 바람직하게는 적어도 45%, 포화된 지방산인 지질 프로파일을 가진다. 일부 경우에, 세포는 적어도 15%, 적어도 20% 또는 적어도 25%, 바람직하게는 적어도 19%, C18:0인 지질 프로파일을 가진다. 일부 실시형태에서, 세포는 야생형 세포와 비교하여 C18:0 지방산에서 적어도 2배 증가를 초래하는 돌연변이된 내인성 불포화효소를 포함한다. 일부 경우에, 미세조류 세포는 1% 이하 또는 5% 이하, 바람직하게는 2% 이하, C18:2인 지질 프로파일이다. 일부 실시형태에서, 미세조류 세포는 5% 이하, 또는 10% 이하, 바람직하게는 7%, 18:1인 지질 프로파일을 가진다.
본 명세서에 논의되는 재조합 세포의 일부 실시형태에서, 해당 세포는 돌연변이된 내인성 불포화효소 유전자를 포함하되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다.
제8 양태에서, 본 발명은 지질 제조 방법을 제공한다. 한 실시형태에서, 본 발명은 (a) 상기 세포가 건조중량으로 적어도 15% 또는 적어도 25%, 바람직하게는 적어도 20%의 지질일 때까지 상기 논의한 세포를 배양하는 단계, 및 (b) 수용성 바이오매스 성분으로부터 지질을 분리하는 단계를 포함한다.
제9 양태에서, 본 발명은 다른 지질 제조방법을 제공한다. 한 실시형태에서, 본 방법은 (a) 두 개의 별개의 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자를 함유하는 유지성 미생물, 바람직하게는 미세조류 세포를 배양하는 단계(해당 세포의 지질 프로파일은 (i) 외인성 유전자가 없는 세포의 프로파일, 및 (ii) 외인성 유전자 중 단지 하나를 가지는 세포의 프로파일과 다름), (b) 수용성 바이오매스 성분으로부터 지질을 분리하는 단계를 포함한다. 일부 경우에, 외인성 유전자 중 적어도 하나는 표 4에서 확인된 티오에스터라제로 이루어진 군으로부터 선택된 지방 아실-ACP 티오에스터라제를 암호화한다.
제10 양태에서, 본 발명은 오일-기재 제품을 만드는 방법을 제공한다. 한 실시형태에서, 해당 방법은 (a) 세포가 건조중량으로 적어도 5% 또는 적어도 15%, 바람직하게는 적어도 10%의 지질이 될 때까지 상기 논의한 바와 같은 세포를 배양하는 단계, (b) 수용성 바이오매스 성분으로부터 지질을 분리하는 단계, 및 (c) 지질에 비누화, 복분해; 산 가수분해; 알칼리 가수분해; 효소적 가수분해; 촉매적 가수분해; 열간 압수(hot-compressed water) 가수분해; 촉매적 가수분해 반응(해당 지질은 글라이세롤 및 지방산으로 분할된다); 지방 질소 화합물을 생성하기 위한 아미노화 반응; 1염기성 및 2염기성-산을 생성하기 위한 오존분해 반응; 효소적 분열 및 압력 분열로 이루어진 군으로부터 선택된 트라이글라이세라이드 분열 반응; 가수분해 반응 다음의 축합 반응; 수소화 처리 반응; 수소화처리 반응 및 탈산소 반응 또는 수소화처리 전 또는 동시에 축합 반응; 기체 제거 반응; 수소화개열반응(hydrogenolysis reaction), 수소화, 연속적 수소화-수소화개열 반응, 연속적 수소화개열반응-수소화 반응, 및 조합된 수소화-수소화개열 반응으로 이루어진 군으로부터 선택된 탈산소 반응; 탈산소 반응 후 축합 반응; 에스터화 반응; 에스터교환 반응(interesterification); 에스터결합전이(transesterification) 반응; 하이드록실화 반응; 및 하이드록실화 반응 후 축합 반응으로 이루어진 군으로부터 선택된 적어도 하나의 화학 반응을 실시하는 단계를 포함하며, 이에 의해 오일-기재 제품이 생성된다.
일부 경우에, 오일-기재 제품은 비누 또는 연료 제품으로부터 선택된다. 일부 실시형태에서, 오일-기재 제품은 바이오디젤, 재생 디젤, 및 제트 연료로 이루어진 군으로부터 선택된 연료 제품이다. 일부 경우에, 연료 제품은 다음의 속성 중 하나 이상을 갖는 바이오디젤이다: (i) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05-0.244mcg/g, 전체 카로테노이드; (ii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 라이코펜; (iii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 베타 카로텐; (iv) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045-0.268mcg/g, 엽록소 A; (v) 1-500mcg/g, 35-175mcg/g, 바람직하게는 38.3-164mcg/g, 감마 토코페롤; (vi) 1% 미만, 0.5% 미만, 바람직하게는 0.25% 미만, 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6-325.3mcg/g, 전체 토코트라이엔올; (viii) 0.001-0.1mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003-0.039mcg/g, 루테인; 또는 (ix) 10-500mcg/g, 50-300mcg/g, 바람직하게는 60.8-261.7mcg/g, 토코페롤. 일부 경우에, 연료 제품은 적어도 20℃, 40℃ 또는 60℃의 T10-T90을 가지는 재생 디젤이다. 일부 경우에, 연료 제품은 HRJ-5 및/또는 ASTM 세부항목 D1655를 충족시키는 제트 연료이다.
제11 양태에서, 본 발명은 (a) 적어도 3% C8:0, 적어도 4% C10:0, 적어도 13% C12:0, 적어도 10% C14:0, 및/또는 적어도 60% 포화된 지방산의 지질 프로파일, 및 (b) 다음의 속성 중 하나 이상: (i) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05-0.244mcg/g, 전체 카로테노이드; (ii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 라이코펜; (iii) 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 mcg/g 미만, 베타 카로텐; (iv) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045-0.268mcg/g, 엽록소 A; (v) 1-300mcg/g, 35-175mcg/g, 바람직하게는 38.3-164mcg/g, 감마 토코페롤; (vi) 1% 미만, 0.5% 미만, 바람직하게는 0.25% 미만, 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6-325.3mcg/g, 전체 토코트라이엔올; (viii) 0.001-0.1mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003-0.039mcg/g, 루테인; 또는 (ix) 10-500mcg/g, 50-300mcg/g, 바람직하게는 60.8-261.7mcg/g, 토코페롤을 포함하는 트라이글라이세라이드 오일을 제공한다.
제12 양태에서, 본 발명은 적어도 5:1의 C8:C10 지방산 비를 가지는 미세조류로부터 분리된 오일을 제공한다. 관련된 양태에서, 본 발명은 적어도 50% 내지 75%, 바람직하게는 적어도 60%, 포화된 지방산을 갖는 미세조류로부터 분리된 오일을 제공한다. 다른 관련 양태에서, 본 발명은 약 2:1의 C16:14 지방산 비를 가지는 미세조류로부터 분리된 오일을 제공한다. 또 다른 관련된 양태에서, 본 발명은 적어도 5:1의 C12:C14 지방산 비를 가지는 미세조류로부터 분리된 오일을 제공한다. 일부 실시형태에서, 미세조류는 적어도 하나의 외인성 유전자를 함유한다. 일부 경우에, 미세조류는 프로토테카 속이다.
제13 양태에서, 본 발명은 (a) 5% 미만 또는 2% 미만, 바람직하게는 1% 미만의 지질 프로파일, <C12; 1%-10%, 바람직하게는 2%-7%, C14:0; 20%-35%, 바람직하게는 23%-30%, C16:0; 5%-20%, 바람직하게는 7%-15%, C18:0; 35-60%, 바람직하게는 40-55%, C18:1; 및 1%-20%, 바람직하게는 2-15%, C18:2 지방산; 및 (b) 다음 속성 중 하나 이상: (i) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05-0.244mcg/g, 총 카르테노이드; (ii) 0.01 mcg/g 미만, 0.005mcg/g, 바람직하게는 0.003 mcg/g 미만, 라이코펜; (iii) 0.01 mcg/g 미만, 바람직하게는 0.005 mcg/g 미만, 0.003 mcg/g 미만, 베타 카로텐; (iv) 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045-0.268mcg/g, 엽록소 A; (v) 1-300mcg/g, 35-175mcg/g, 바람직하게는 38.3-164mcg/g, 감마 토코페롤; (vi) 1% 미만, 0.5%, 바람직하게는 0.25% 미만, 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6-325.3mcg/g, 전체 토코트라이엔올; (viii) 0.001-0.1mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003-0.039mcg/g, 루테인; 또는 (ix) 10-500mcg/g, 50-300, 바람직하게는 60.8-261.7mcg/g, 토코페롤을 포함하는 트라이글라이세라이드 오일을 제공한다.
일부 경우에, 트라이글라이세라이드 오일은 하나 이상의 외인성 유전자를 포함하는 미생물로부터 분리된다. 일부 실시형태에서, 하나 이상의 외인성 유전자는 지방 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 쇄 길이 C14의 지방 아실-ACP 티오에스터라제는 지방 아실-ACP 기질에 대해 가수분해 활성을 가진다. 일부 실시형태에서, 미생물은 돌연변이된 내인성 불포화효소 유전자를 추가로 포함하되, 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다.
제14 양태에서, 본 발명은 5% 미만, 또는 2% 미만, 바람직하게는 1% 미만의 지질 프로파일, <C12; 1%-10%, 바람직하게는 2%-7%, C14:0; 20%-35%, 바람직하게는 23%-30%, C16:0; 5%-20%, 바람직하게는 7%-15%, C18:0; 35%-60%, 바람직하게는 40-55%, C18:1; 및 1%-20%, 바람직하게는 2-15%, C18:2 지방산을 포함하는 트라이글라이세라이드 오일의 생성 방법을 제공하되, 트라이글라이세라이드 오일은 하나 이상의 외인성 유전자를 포함하는 미생물로부터 분리된다. 일부 경우에, 트라이글라이세라이드 오일은 1%-10%, 바람직하게는 3-5%, C14:0; 20%-30%, 바람직하게는 25-27%, C16:0; 5%-20%, 바람직하게는 10-15%, C18:0; 및 35%-50%, 바람직하게는 40-45%, C18:1의 지질 프로파일을 포함한다. 일부 실시형태에서, 하나 이상의 외인성 유전자는 지방 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 지방 아실-ACP 티오에스터라제는 쇄 길이 C14의 지방 아실-ACP 기질에 대한 가수분해 활성을 가진다. 일부 경우에, 미생물은 돌연변이된 내인성 불포화효소 유전자를 추가로 포함하되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다. 일부 경우에, 하나 이상의 외인성 유전자는 수크로스 인버타제이다. 일부 실시형태에서, 돌연변이된 내인성 불포화효소 유전자는 스테아로일-아실 운반체 단백질 불포화효소(stearyl-acyl carrier protein desaturase, SAD)(예를 들어, 서열번호 199 내지 200)이다. 일부 실시형태에서, 돌연변이된 내인성 불포화효소 유전자는 지방산 불포화효소(fatty desaturase, FAD)이다.
제15 양태에서, 본 발명은 트라이글라이세라이드 오일을 포함하는 유지성 미생물 세포, 바람직하게는 미세조류 세포를 제공하되, 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 1% C8:0, 적어도 약 1% C10:0, 적어도 약 1% C12:0, 적어도 약 2% C14:0, 적어도 약 30% C16:0, 적어도 약 5% C18:0, 적어도 약 60% C18:1, 약 7% 미만의 C18:2, 및 적어도 약 35% 포화된 지방산으로 이루어진 군으로부터 선택된다. 일부 경우에, 유지성 미생물 세포는 외인성 유전자를 포함하며, 선택적으로 유지성 미생물 세포의 내인성 불포화효소는 더 적은 효소적 활성을 가지도록 불활성화되거나 또는 돌연변이될 수 있었다.
일부 경우에, 트라이글라이세라이드 오일의 지방산 프로파일은 자연적으로 발생하는 오일의 지방산 프로파일과 유사하다. 일부 경우에, 자연적으로 발생하는 오일은 코코아 버터, 코코넛 오일, 팜 오일, 팜커넬 오일, 쉬어 버터, 탤로 및 라드로 이루어진 군으로부터 선택된다. 일부 경우에, 트라이글라이세라이드 오일의 지방산 프로파일은 C8:0 및 C10:0의 전체 조합량이 적어도 약 10%이고, C10:0, C12:0, 및 C14:0의 전체 조합량이 적어도 약 50%이며, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%이고, C18:0, C18:1 및 C18:2의 전체 조합량은 적어도 약 60%이며, C14:0, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%이고, C18:1 및 C18:2의 전체 조합량은 약 30% 미만인 것으로 이루어진 군으로부터 선택된 프로파일을 포함한다. 일부 경우에, 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 5 대 1의 C8:0 대 C10:0 비, 적어도 약 6 대 1의 C10:0 대 C12:0, 적어도 약 5 대 1의 C12:0 대 C14:0 비, 적어도 약 7:1의 C14:0 대 C12:0, 및 적어도 약 1 내지 2의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 지방산의 비를 포함한다.
일부 경우에, 내인성 불포화효소는 스테아릴 ACP 불포화효소 및 델타 12 지방산 불포화효소로 이루어진 군으로부터 선택된다. 일부 경우에, 외인성 유전자는 아실-ACP 티오에스터라제를 암호화하는 유전자로 이루어진 군으로부터 선택된다. 일부 경우에, 외인성 유전자는 표 4에서 확인되는 것으로 이루어진 군으로부터 선택된 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 유지성 미생물 세포는 수크로스 인버타제를 암호화하는 유전자를 추가로 포함한다.
다양한 실시형태에서, 유지성 미생물 세포는 아크난데스 오리엔탈리스(Achnanthes orientalis), 아그메넬룸(Agmenellum), 암피프로라 하이알린(Amphiprora hyaline), 암포라 코페이포미스(Amphora coffeiformis), 암포라 코페이포미스 리네아(Amphora coffeiformis linea), 암포라 코페이포미스 펑타타(Amphora coffeiformis punctata), 암포라 코페이포미스 테일로리(Amphora coffeiformis taylori), 암포라 코페이포미스 테누스(Amphora coffeiformis tenuis), 암포라 델리카티시마(Amphora delicatissima), 암포라 델리카티시마 카피타타(Amphora delicatissima capitata), 암포라 속(Amphora sp .), 아나배나(Anabaena), 안키스트로데스무스(Ankistrodesmus), 안키스트로데스무스 팔카투스(Ankistrodesmus falcatus), 보에켈로비아 후글란디(Boekelovia hooglandii), 보로디넬라 속(Borodinella sp .), 보트라이오코커스 브라우니(Botryococcus braunii), 보트라이오코커스 스데티쿠스(Botryococcus sudeticus), 카르테리아(Carteria), 캐토세로스 그라실리스(Chaetoceros gracilis), 캐토세로스 무엘러리(Chaetoceros muelleri), 캐토세로스 무엘러리 서브살숨(Chaetoceros muelleri subsalsum), 캐토세로스 속(Chaetoceros sp .), 클로렐라 아니트라타(Chlorella anitrata), 클로렐라 안탁티카(Chlorella Antarctica), 클로렐라 오레오비리디스(Chlorella aureoviridis), 클로렐라 칸디다(Chlorella candida), 클로렐라 캡슐레이트(Chlorella capsulate), 클로렐라 데시케이트(Chlorella desiccate), 클로렐라 엘립소이데아(Chlorella ellipsoidea), 클로렐라 에머소니(Chlorella emersonii), 클로렐라 푸스카(Chlorella fusca), 클로렐라 푸스카 변종 바큐오라타(Chlorella fusca var. vacuolata), 클로렐라 글루코트로파(Chlorella glucotropha), 클로렐라 인퓨지오눔(Chlorella infusionum), 클로렐라 인퓨지오눔 변종 악토필라(Chlorella infusionum var. actophila), 클로렐라 인퓨지오눔 변종 악세노필라(Chlorella infusionum var. auxenophila), 클로렐라 케슬러리(Chlorella kessleri), 클로렐라 로보포라(Chlorella lobophora)(균주 SAG 37.88), 클로렐라 루테오비리디스(Chlorella luteoviridis), 클로렐라 루테오비리디스 변종 아우레오비리디스(Chlorella luteoviridis var. aureoviridis), 클로렐라 루테오비리디스 변종 루테센스(Chlorella luteoviridis var. lutescens), 클로렐라 미니아타(Chlorella miniata), 클로렐라 미누티시마(Chlorella minutissima), 클로렐라 무타빌리스(Chlorella mutabilis), 클로렐라 녹투나(Chlorella nocturna), 클로렐라 파바(Chlorella parva), 클로렐라 포토필라(Chlorella photophila), 클로렐라 프링세이미(Chlorella pringsheimii), 클로렐라 프로토테코이데스(임의의 UTEX 균주 1806, 411, 264, 256, 255, 250, 249, 31, 29, 25, 및 CCAP 균주 211/17 및 211/8d를 포함), 클로렐라 프로토테코이데스 변종 아시디콜라(Chlorella protothecoides var. acidicola), 클로렐라 레글라리스(Chlorella regularis), 클로렐라 레글라리스 변종 미니마(Chlorella regularis var. minima), 클로렐라 레글라리스 변종 엄브리카타(Chlorella regularis var. umbricata), 클로렐라 레이시글라이(Chlorella reisiglii), 클로렐라 사카로필라(Chlorella saccharophila), 클로렐라 사카로필라 변종 엘립소이데아(Chlorella saccharophila var. ellipsoidea), 클로렐라 살리나(Chlorella salina), 클로렐라 심플렉스(Chlorella simplex), 클로렐라 소로키니아나(Chlorella sorokiniana), 클로렐라 속(Chlorella sp .), 클로렐라 스패리카(Chlorella sphaerica), 클로렐라 스티그마토포라(Chlorella stigmatophora), 클로렐라 반니엘리(Chlorella vanniellii), 클로렐라 불가리스(Chlorella vulgaris), 클로렐라 불가리스(Chlorella vulgaris), 클로렐라 불가리스 품종 테르티아(Chlorella vulgaris f. tertia), 클로렐라 불가리스 변종 오토트로피카(Chlorella vulgaris var. autotrophica), 클로렐라 불가리스 변종 비리디스(Chlorella vulgaris var. viridis), 클로렐라 불가리스 변종 불가리스(Chlorella vulgaris var. vulgaris), 클로렐라 불가리스 변종 불가리스 품종 테르티아(Chlorella vulgaris var. vulgaris f. tertia), 클로렐라 불가리스 변종 불가리스 품종 비리디스(Chlorella vulgaris var. vulgaris f. viridis), 클로렐라 잔텔라(Chlorella xanthella), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클로렐라 트레복시오이데스(Chlorella trebouxioides), 클로렐라 불가리스(Chlorella vulgaris), 클로로코컴 인퓨시오눔(Chlorococcum infusionum), 클로로코컴 속(Chlorococcum sp .), 클로로고늄(Chlorogonium), 크루모나스 속(Chroomonas sp .), 크립소스패라 속(Chrysosphaera sp .), 크리코스패라 속(Cricosphaera sp .), 크립토모나스 속(Cryptomonas sp .), 사이클로텔라 크립티카(Cyclotella cryptica), 사이클로텔라 메네기니아나(Cyclotella meneghiniana), 사이클로텔라 속(Cyclotella sp .), 두날리엘라 속(Dunaliella sp .), 두날리엘라 바다윌(Dunaliella bardawil), 두날리엘라 바이오쿨라타(Dunaliella bioculata), 두날리엘라 그라눌레이트(Dunaliella granulate), 두날리엘라 마리티메(Dunaliella maritime), 두날리엘라 미누타(Dunaliella minuta), 두날리엘라 파바(Dunaliella parva), 두날리엘라 페이세이(Dunaliella peircei), 두날리엘라 프리몰렉타(Dunaliella primolecta), 두날리엘라 살리나(Dunaliella salina), 두날리엘라 테리콜라(Dunaliella terricola), 두날리엘라 테티올렉타(Dunaliella tertiolecta), 두날리엘라 비리디스(Dunaliella viridis), 두날리엘라 테르티올렉타(Dunaliella tertiolecta), 에레모스패라 비리디스(Eremosphaera viridis), 에레모스패라 속(Eremosphaera sp .), 엘립소이돈 속(Ellipsoidon sp .), 유글레나(Euglena), 프란세이아 속(Franceia sp .), 프라질라리아 크로토넨시스(Fragilaria crotonensis), 프라질라리아 속(Fragilaria sp .), 글레오캡사 속(Gleocapsa sp .), 글로에오타미니온 속(Gloeothamnion sp .), 하이메노모나스 속(Hymenomonas sp .), 아이소크리시스 아피니스 갈바나(Isochrysis aff . galbana), 아이소크리시스 갈바나(Isochrysis galbana), 레포신클리스(Lepocinclis), 마이크락티늄(Micractinium), 마이크락티늄(Micractinium)(UTEX LB 2614), 모노라피듐 미누툼(MonoraphidiumMinutum), 모노라피둠 속(Monoraphidium sp .), 나노클로리스 속(Nannochloris sp .), 난노클로롭시스 살리나(Nannochloropsis salina), 난노클로롭시스 속(Nannochloropsis sp .), 나비쿨라 아셉타타(Navicula acceptata), 나비쿨라 비스칸테래(Navicula biskanterae), 나비쿨라 슈도테넬로이데스(Navicula pseudotenelloides), 나비쿨라 펠리쿨로사(Navicula pelliculosa), 나비쿨라 사프로파일라(Navicula saprophila), 나비쿨라 속(Navicula sp .), 네프로클로리스 속(Nephrochloris sp.), 네프로셀미스 속(Nephroselmis sp .), 니츠키아 코뮤니스(Nitschia communis), 니츠키아 알렉산드리나(Nitzschia alexandrina), 니츠키아 코뮤니스(Nitzschia communis), 니츠키아 디시파타(Nitzschia dissipata), 니츠키아 프러츨럼(Nitzschia frustulum), 니츠키아 한츠키아나(Nitzschia hantzschiana), 니츠키아 인컨스피쿠아(Nitzschia inconspicua), 니츠키아 인터메디아(Nitzschia intermedia), 니츠키아 마이크로세팔라(Nitzschia microcephala), 니츠키아 푸실라(Nitzschia pusilla), 니츠키아 퍼실라 엘립티카(Nitzschia pusilla elliptica), 니츠키아 퍼실라 모노엔시스(Nitzschia pusilla monoensis), 니츠키아 쿼드란글라(Nitzschia quadrangular), 니츠키아 속(Nitzschia sp .), 오크로모나스 속(Ochromonas sp .), 오시스티스 파바(Oocystis parva), 오시스티스 퍼실라(Oocystis pusilla), 오시스티스 속(Oocystis sp .), 오실라토리아 림네티카(Oscillatoria limnetic), 오실락토리아 속(Oscillatoria sp .), 오실라토리아 서브브레비스(Oscillatoria subbrevis), 파셰리아 아시도필라(Pascheria acidophila), 파블로바 속(Pavlova sp .), 파구스(Phagus), 포르미디움(Phormidium), 플라티모나스 속(Platymonas sp .), 플레우로크리시스 카르테래(Pleurochrysis carterae), 플레우로크리시스 덴테이트(Pleurochrysis dentate), 플레우로크리시스 속(Pleurochrysis sp .), 프로토테카 윅케르하미(Prototheca wickerhamii), 프로토테카 스타그노라(Prototheca stagnora), 프로토테카 포르토리센시스(Prototheca portoricensis), 프로토테카 모리포미스(Prototheca moriformis), 프로토테카 좁피(Prototheca zopfii), 파이라미모나스 속(Pyramimonas sp .), 피로보트라이스(Pyrobotrys), 사르시노이드 크리소파이트(Sarcinoid chrysophyte), 센데스무스 아르마투스(Scenedesmus armatus), 스피로지라(Spirogyra), 스피룰리나 플라텐시스(Spirulina platensis), 스티코코커스 속(Stichococcus sp .), 시네코코커스 속(Synechococcus sp .), 테트래드론(Tetraedron), 테트라셀미스 속(Tetraselmis sp .), 테트라셀미스 수에시카(Tetraselmis suecica), 탈라시오시라 웨이스프로기(Thalassiosira weissflogii), 및 비리디엘라 프리데리시아나(Viridiella fridericiana)로부터 선택된 미세조류 속 또는 종의 세포이다.
일부 경우에, 유지성 미생물 세포는 프로토테카 속의 세포이다. 일부 경우에, 유지성 미생물 세포는 프로토테카 모리포미스 속의 세포이다.
일부 경우에, 유지성 미생물 세포는 유지성 효모 세포이다. 일부 경우에, 유지성 미생물 세포는 유지성 박테리아 세포이다.
일부 경우에, 자연적으로 발생하는 오일은 코코아 버터이며 외인성 유전자는 카르타무스 틴토리우스(Carthamus tinctorius) 티오에스터라제 유전자를 포함한다. 일부 경우에, 자연적으로 발생하는 오일은 코코넛 오일이다. 일부 경우에, 자연적으로 발생하는 오일은 팜 오일이며 외인성 유전자는 인도네시아 기름야자(Elaeis guineensis) 티오에스터라제 유전자, 쿠페아 후커리아나 티오에스터라제 유전자, 쿠페아 후커리아나 KAS IV 유전자 및 쿠페아 라이티(Cuphea wrightii) FATB2 유전자, 또는 내인성 KAS II 유전자를 파괴하도록 설계된 구성체를 포함한다. 일부 경우에, 자연적으로 발생하는 오일은 팜커넬 오일이며, 외인성 유전자는 쿠페아 라이티 FATB2 유전자 및 내인성 SAD2B 유전자를 파괴하도록 설계된 구성체의 조합을 포함한다. 일부 경우에, 자연적으로 발생하는 오일은 쉬어 버터이다. 일부 경우에, 자연적으로 발생하는 오일은 탤로이다. 일부 경우에, 자연적으로 발생하는 오일은 라드이며, 외인성 유전자는 캘리포니아 월계수 티오에스터라제 유전자와 외인성 SAD2B 유전자를 파괴하도록 설계된 구성체의 조합, 가르시니아 망고스타나(Garcinia mangostana) 티오에스터라제 유전자와 외인성 SAD2B 유전자를 파괴하도록 설계된 구성체의 조합, 브라시카 나푸스 티오에스터라제 유전자, 또는 쿠페아 후커리아나 티오에스터라제 유전자를 포함한다.
제16 양태에서, 본 발명은 유지성 미생물 트라이글라이세라이드 오일 조성물을 제공하되, 해당 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 1% C8:0, 적어도 약 1% C10:0, 적어도 약 1% C12:0, 적어도 약 2% C14:0, 적어도 약 30% C16:0, 적어도 약 5% C18:0, 적어도 약 60% C18:1, 약 7% C18:2 미만, 및 적어도 약 35% 포화된 지방산으로 이루어진 군으로부터 선택된다. 다양한 실시형태에서, 트라이글라이세라이드 오일 조성물은 배양 배지 내에서 유지성 미생물 세포 또는 재조합 유지성 미생물 세포의 집단을 배양하는 것에 의해 생성되되, 해당 유지성 미생물 세포는 상기 기재한 것, 특히 본 발명의 제15 양태와 관련하여 상기 기재한 것이다.
일부 경우에, 유지성 미생물 트라이글라이세라이드 오일 조성물은 하기로 이루어진 군으로부터 선택된 속성을 추가로 포함한다: (i) 0.3 mcg/g 미만 총 카르테노이드; (ii) 0.005 mcg/g 미만 라이코펜; (iii) 0.005 mcg/g 미만 베타 카로텐; (iv) 0.3 mcg/g 미만 엽록소 A; (v) 175 mcg/g 미만 감마 토코페롤; (vi) 0.25% 미만 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 350 mcg/g 미만 전체 토코트라이엔올; (viii) 0.05 mcg/g 미만 루테인; 또는 (ix) 275 mcg/g 미만 토코페롤.
제17 양태에서, 본 발명은 적어도 약 1% C8:0, 적어도 약 1% C10:0, 적어도 약 1% C12:0, 적어도 약 2% C14:0, 적어도 약 30% C16:0, 적어도 약 5% C18:0, 적어도 약 60% C18:1, 7% 미만 C18:2, 및 적어도 약 35% 포화된 지방산으로 이루어진 군으로부터 선택된 지방산 프로파일을 가지는 유지성 미생물 트라이글라이세라이드 오일 조성물을 생성하는 방법을 제공하되, 해당 방법은 (a) 적어도 10%의 건조 세포 중량의 유지성 미생물 세포가 트라이글라이세라이드 오일이 될 때까지 배양 배지 내에서 유지성 미생물 세포 집단을 배양하는 단계; 및 (b) 유지성 미생물 세포로부터 트라이글라이세라이드 오일 조성물을 분리하는 단계를 포함한다. 다양한 실시형태에서, 트라이글라이세라이드 오일 조성물은 유지성 미생물 세포 또는 상기 기재한 것, 특히 본 발명의 제5 양태와 관련하여 상기 기재한 것과 같은 재조합 유지성 미생물 세포 집단의 배양을 통해 생성된다.
제18 양태에서, 본 발명은 오일-기재 제품의 제조 방법을 제공하되, 해당 방법은 (a) 본 발명의 제16 양태와 관련하여 상기 기재한 것과 같은 유지성 미생물 트라이글라이세라이드 오일 조성물에 비누화, 복분해; 산 가수분해; 알칼리 가수분해; 효소적 가수분해; 촉매적 가수분해; 열간 압수 가수분해; 촉매적 가수분해 반응(해당 지질은 글라이세롤 및 지방산으로 분할된다); 지방 질소 화합물을 생성하기 위한 아미노화 반응; 1염기성 및 2염기성-산을 생성하기 위한 오존분해 반응; 효소적 분열 및 압력 분열로 이루어진 군으로부터 선택된 트라이글라이세라이드 분열 반응; 가수분해 반응 다음의 축합 반응; 수소화 처리 반응; 수소화처리 반응 및 탈산소 반응 또는 수소화처리 전 또는 동시에 축합 반응; 기체 제거 반응; 수소화개열반응, 수소화, 연속적 수소화-수소화개열 반응, 연속적 수소화개열반응-수소화 반응, 및 조합된 수소화-수소화개열 반응으로 이루어진 군으로부터 선택된 탈산소 반응; 탈산소 반응 후 축합 반응; 에스터화 반응; 에스터교환 반응; 에스터결합 전이반응; 하이드록실화 반응; 및 하이드록실화 반응 후 축합 반응으로 이루어진 군으로부터 선택된 적어도 하나의 화학 반응을 실시하는 단계; 및 (b) 다른 성분으로부터 반응 생성물을 분리하는 단계를 포함한다.
일부 경우에, 오일-기재 제품은 비누, 연료, 절연용제, 유압액, 가소제, 윤활제, 열전달유체, 및 금속 작업 유체로 이루어진 군으로부터 선택된다. 일부 경우에, 오일-기재 제품은 (a) 바이오디젤; (b) 재생 디젤; 및 (c) 제트 연료로 이루어진 군으로부터 선택된 연료 제품이다.
일부 경우에, 연료 제품은 다음의 속성 중 하나 이상을 갖는 바이오디젤이다: (i) 0.3 mcg/g 미만 전체 카로테노이드; (ii) 0.005 mcg/g 미만 라이코펜; (iii) 0.005 mcg/g 미만 베타 카로텐; (iv) 0.3 mcg/g 미만 엽록소 A; (v) 175 mcg/g 미만 감마 토코페롤; (vi) 0.25% 미만 브라시카스테롤, 캄페스테롤, 스티그나스테롤, 또는 베타-시토스테롤; (vii) 350 mcg/g 미만 전체 토코트라이엔올; (viii) 0.05 mcg/g 미만 루테인; 또는 (ix) 275 mcg/g 미만 토코페롤.
일부 경우에, 연료 제품은 적어도 20℃, 40℃ 또는 60℃의 T10-T90을 갖는 재생 디젤이다.
일부 경우에, 연료 제품은 HRJ-5 및/또는 ASTM 세부항목 D1655를 충족시키는 제트 연료이다.
본 발명의 이들 및 다른 양태 및 실시형태는 수반하는 도면, 바로 다음의 간단한 설명, 이하의 본 발명의 상세한 설명에 기재되며, 이하의 실시예에서 예시된다. 상기 및 본 명세서를 통해 논의한 임의의 또는 모든 특징은 본 발명의 다양한 실시형태에서 조합될 수 있다.
도 1은 프로토테카 트라이글라이세라이드 오일로부터 생성된 재생 디젤의 크로마토그램.
본 발명은 프로토테카 및 특정 관련 미생물 유기체가 경제적으로 및 다량으로 오일, 연료 및 다른 탄화수소 또는 지질 조성물을 생산하기 위한 예상치 못한 유리한 특성을 가진다는 발견뿐만 아니라 이들 특성을 개선시키는 이들 미생물 유기체를 유전적으로 변경시키기 위한 방법 및 시약의 발견으로부터 발생한다. 이들 미생물 유기체에 의해 생성된 오일은 특히 운송 연료, 함유화학물질 및/또는 식품 및 화장품 산업에 사용될 수 있다. 지질의 에스터결합 전이반응으로 바이오디젤로 유용한 장쇄 지방산 에스터를 수득한다. 다른 효소적 및 화학적 공정은 지방산, 알데하이드, 알코올, 알칸, 및 알켄을 수득하도록 맞춰질 수 있다. 일부 적용에서, 재생 디젤, 제트 연료, 또는 다른 탄화수소 화합물이 생성된다. 본 발명은 또한 증가된 생산성 및 증가된 지질 수율을 위해 및/또는 본 명세서에 설명된 조성물의 더 비용 효과적인 생산을 위해 미세조류를 배양하는 방법을 제공한다.
본 발명의 이런 상세한 설명은 제공의 편리함을 위해 부분이 나누어진다. 부문 I은 본 명세서에 사용된 용어의 정의를 제공한다. 부분 II는 본 명세서의 방법에 유용한 배양 조건의 설명을 제공한다. 부문 III은 유전자 조작 방법 및 재료의 설명을 제공한다. 부문 IV는 수크로스 이용을 가능하게 하는 미생물 유기체(예를 들어, 프로토테카)의 유전자 조작의 설명을 제공한다. 부문 V는 지질 생합성을 변형하기 위한 미생물 유기체(예를 들어 프로토테카)의 유전자 조작의 설명을 제공한다. 부문 VI은 연료 및 화학물질의 제조방법을 기재한다. 부문 VII은 본 발명의 실시예 및 실시형태를 개시한다. 본 발명의 상세한 설명 다음에는 본 발명의 다양한 양태 및 실시형태를 설명하는 실시예가 제공된다.
I. 정의
달리 정의되지 않는 경우, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 본 발명의 속하는 분야의 당업자가 통상적으로 이해하는 의미를 가진다. 하기의 참조문헌은 본 발명에 사용되는 많은 용어의 일반적인 정의를 당업자에게 제공한다: 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology(2nd ed. 1994); The Cambridge Dictionary of Science and Technology(Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 및 Hale & Marham, The Harper Collins Dictionary of Biology(1991)]. 본 명세서에 사용된 바와 같이, 하기의 용어는 달리 특정되지 않는 경우 이들 본래의 의미를 가진다.
"미세조류에서 활성"은 미세조류에서 기능성인 핵산을 지칭한다. 예를 들어, 유전자 이식 미세조류에 항생제 내성을 부여하는 항생제 내성 유전자를 구동하기 위해 사용된 프로모터는 미세조류에서 활성이다.
"아실 운반 단백질" 또는 "ACP"는 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스터로서 지방산 합성 동안에 성장하는 아실 쇄와 결합하며 지방산 신타제 복합체의 성분을 포함하는 단백질이다.
"아실-CoA 분자" 또는 "아실-CoA"는 조효소 A의 4'-포스포판테테인 모이어티의 말단 티올에서 티올 에스터 연결을 통해 조효소 A에 공유적으로 부착된 아실 모이어티를 포함하는 분자이다.
"면적%"는 FAME GC/FID 검출 방법을 사용하여 관찰된 피크 면적을 말하는데, 여기서, 샘플내 모든 지방산은 검출 전에 지방산 메틸 에스터(fatty acid methyl ester, FAME)로 전환된다. 예를 들어, 분리 피크는 C14:1과 같은 임의의 다른 지방산과 비교하여 불포화성을 갖지 않는 14개 탄소 공급원자의 지방산(C14:0)에 대해서 관찰된다. 각각의 부류의 FAME에 대한 면적%는 혼합물 내 이의 조성물%과 직접적으로 비례하고 샘플 내 존재하는 모든 피크의 합계를 기준으로 계산된다(즉, [특정 피크하의 면적/모든 측정된 피크의 총 면적] X 100). 본 발명의 오일 및 세포의 지질 프로파일을 언급하는 경우, "적어도 4%의 C8-C14"는 세포 내 또는 추출된 글라이세로지질 조성물 내 총 지방산의 적어도 4%가 8, 10, 12 또는 14개의 탄소 공급원자를 포함하는 쇄 길이를 가진다는 것을 의미한다.
"무균성"은 다른 살아있는 유기체에 의해 오염되지 않은 유기체 배양물이다.
"바이오디젤"은 디젤 엔진에서 연료로서 사용하기에 적합한 생물학적으로 생산된 지방산 알킬 에스터이다.
"바이오매스"는 세포의 성장 및/또는 번식에 의해 생성된 물질이다. 바이오매스는 세포 및/또는 세포 내 내용물을 함유할 뿐만 아니라, 이에 제한되는 것은 아니지만 세포에 의해 분비되는 화합물을 포함한다.
"생물반응기"는 선택적으로 현탁액 중에서 세포가 배양되는 인클로저(enclosure) 또는 부분적 인클로저이다.
"촉매"는 생성물의 일부가 되지 않고 반응물에서 생성물로의 화학적 반응을 용이하게 하거나 촉진할 수 있는 분자 또는 거대분자 복합체와 같은 작용제(agent)이다. 촉매는 반응 속도를 증가시키고 이후 촉매는 다른 반응물에 작용하여 생성물을 형성할 수 있다. 촉매는 일반적으로 반응에 필요한 전체 활성화 에너지를 낮추어서 반응이 더 빨리 또는 더 저온에서 진행되도록 한다. 따라서, 반응 평형은 더 빠르게 달성될 수 있다. 촉매의 예는 생물학적 촉매인 효소; 비생물학적 촉매인 열; 및 화석 오일 정련 공정에 사용되는 금속을 포함한다.
"셀룰로스 물질"은 글루코스 및 자일로스, 및 선택적으로 이당류, 올리고당, 리그닌, 푸르푸랄 및 기타 화합물과 같은 추가적인 화합물을 포함하는, 셀룰로스의 분해 생성물이다. 셀룰로스 물질의 공급원의 비 제한적인 예는 사탕수수 바가스, 사탕무 펄프, 옥수수 스토버, 목재 칩, 톱밥 및 지팽이풀을 포함한다.
"공동-배양", 및 이의 변형어구인 "공동-배양하다" 및 "공동-발효"는 동일한 생물반응기에 2개 이상의 세포 유형이 존재함을 언급한다. 2개 이상의 세포 유형은 미세조류와 같은 미생물 유기체일 수 있거나 상이한 세포 유형과 함께 배양되는 미세조류 세포일 수 있다. 상기 배양 조건은 2개 이상의 세포 유형의 성장 및/또는 번식을 조성하는 것 또는 2개 이상의 세포 중 하나 또는 서브세트의 성장 및/또는 번식을 촉진시키는 한편, 나머지에 대한 세포 성장을 유지하는 것일 수 있다.
"조인자"는 이의 효소 활성을 수행하는 효소에 필요한 기질 이외의 임의의 분자이다.
"상보적 DNA" 또는 "cDNA"는 전령 RNA(mRNA)의 역전사 또는 증폭(예를 들어, 중합효소 연쇄 반응(polymerase chain reaction, "PCR")을 통한)에 의해 보통 얻어지는 mRNA의 DNA 복제물이다.
"배양된" 및 이것의 변형어, 예를 들어 "배양된" 및 "발효된"은 선택되고/되거나 제어된 조건을 사용함에 의한 하나 이상의 세포의 성장(세포 크기, 세포 함량 및/또는 세포 활성의 증가) 및/또는 번식(유사 분열을 통한 세포 수의 증가)의 의도적인 조성을 말한다. 성장 및 번식 둘 다의 조합은 증식으로 칭해질 수 있다. 선택되고/되거나 제어된 조건의 예는 한정된 배지(pH, 이온 강도 및 탄소 공급원과 같은 공지된 특성과 함께), 특정 온도, 산소압, 이산화탄소 수준 및 생물반응기에서 성장의 사용을 포함한다. 배양은 천연적인 또 다르게는 사람 간섭이 없는 미생물 유기체의 성장 또는 번식을 말하지 않으며; 예를 들어, 궁극적으로 지질학적 원유를 생성하도록 화석화된 유기체의 자연적 성장은 배양이 아니다.
"세포용해"는 저장성 환경에서의 세포의 용해이다. 세포 용해는 세포 내부에 대한 과도한 삼투압, 또는 물의 이동(과수화)에 의해 유발된다. 해당 세포는 내부 물의 삼투압을 견뎌낼 수 없어서 터진다.
"탈지질화된 음식물" 및 "탈지질화된 미생물 바이오매스"는 오일(지질을 포함)이 기계적 추출(즉, 익스펠러 프레스에 의해 수행됨) 또는 용매 추출 또는 이 둘 다를 통해 이로부터 추출되거나 분리된 후의 미생물 바이오매스이다. 탈지질화된 음식물은 미생물 바이오매스로부터 오일/지질의 추출 또는 분리 전과 비교하여 감소된 양의 오일/지질을 갖지만 일부 잔류하는 오일/지질을 함유한다.
"발현 벡터" 또는 "발현 구성체" 또는 "플라스미드" 또는 "재조합 DNA 구성체"는 숙주 세포에서 특정 핵산을 전사 및/번역하도록 하는 일련의 구체화된 핵산 요소에 의한 재조합 수단 또는 직접적인 화학적 합성에 의하는 것을 포함하는, 인간 개입을 통해 만들어진 핵산을 말한다. 발현 벡터는 플라스미드, 바이러스 또는 핵산 단편의 부분일 수 있다. 전형적으로, 상기 발현 벡터는 프로모터에 작동가능하게 연결되어 전사된 핵산을 포함한다.
"외인성 유전자"는 세포에 도입된("형질전환된") RNA 및/또는 단백질의 발현을 위해 암호화하는 핵산이다. 형질전환된 세포는 추가의 외인성 유전자(들)가 도입될 수 있는 재조합 세포로서 언급될 수 있다. 상기 외인성 유전자는 형질전환된 세포에 대해 상이한 종(및 따라서 이종성) 또는 동일한 종(및 따라서 동종성)으로부터 유래될 수 있다. 따라서, 외인성 유전자는 유전자의 내인성 복제물에 비해 세포의 게놈 내에서 상이한 위치를 차지하거나 상이한 제어 하에 있는 동종성 유전자를 포함한다. 외인성 유전자는 세포 내에서 하나 이상의 복제물로 존재할 수 있다. 외인성 유전자는 게놈 내로 삽입물로서 또는 에피좀 분자로서 세포 내에서 유지될 수 있다.
"외인성으로 제공된"은 세포 배양의 배양 배지에 공급된 분자를 말한다.
"익스펠러 프레싱"은 대두 및 평지씨와 같은 원료로부터 오일을 추출하는 기계적 방법이다. 익스펠러 프레스는 스크류형의 기계이고 케이지 배럴-유사 구멍을 통해 재료를 압착시킨다. 원료는 프레스의 한 측면으로 들어가고, 소모된 케이크는 다른 측면에서 빠져나오는 한편, 오일은 케이지 내 막대 사이에서 스며나오고 수집된다. 상기 기계는 원료를 움직이고 압착시키는 스크류 구동체로부터의 마찰 및 연속적인 압력을 사용한다. 상기 오일은 고체가 통과하지 못하도록 하는 작은 구멍을 통해 스며나온다. 원료가 압착됨에 따라, 마찰은 전형적으로 이를 가열시킨다.
"지방 아실-ACP 티오에스터라제"는 지질 합성 동안 아실 운반 단백질(ACP)로부터 지방산의 절단을 촉매하는 효소이다.
"지방 아실-CoA/알데하이드 환원효소"는 아실-CoA 분자의 1차 알코올로 환원을 촉매하는 효소이다.
"지방 아실-CoA 환원효소"는 아실-CoA 분자의 알데하이드로의 환원을 촉매하는 효소이다.
"지방 알데하이드 데카보닐라제"는 지방 알데하이드의 알칸으로의 전환을 촉매하는 효소이다.
"지방 알데하이드 환원효소"는 알데하이드의 1차 알코올로 환원을 촉매하는 효소이다.
"고정된 탄소 공급원"은 배양되는 미생물에 의해 이용될 수 있는 배양 배지 내에서 고체 또는 액체 형태로 주변 온도 및 압력에서 존재하는 탄소, 전형적으로 유기 분자를 함유하는 분자(들)이다.
"호모제네이트"는 생리적으로 파괴된 바이오매스이다.
"탄화수소"는 (a) 수소 및 탄소 원자만을 함유하는 분자이고, 여기서, 탄소 공급원자는 공유 결합되어 선형, 분지형, 고리형 또는 부분적으로 고리형인, 수소 원자가 부착된 백본을 형성한다. 탄화수소 화합물의 분자 구조는 천연 가스 구성 성분인 가장 단순한 메탄(CH4) 형태로부터 매우 무겁고 복잡한, 예를 들어, 원유, 석유 및 역청에서 발견되는 아스팔텐과 같은 일부 분자까지 다양하다. 탄화수소는 가스, 액체 또는 고체 형태, 또는 이들 형태의 임의의 조합일 수 있고, 골격 내 인접한 탄소 공급원자 사이에 하나 이상의 이중 결합 또는 삼중 결합을 가질 수 있다. 따라서, 해당 용어는 선형, 분지형, 고리형 또는 부분적으로 고리형인 알칸, 알켄, 지질 및 파라핀을 포함한다. 이의 예는 프로판, 뷰탄, 펜탄, 헥산, 옥탄, 및 스쿠알렌을 포함한다.
"수소:탄소 비"는 원자 대 원자를 기준으로 분자 내 탄소 원자에 대한 수소 원자의 비이다. 해당 비율은 탄화수소 분자 내 탄소 및 수소 원자의 수를 언급하기 위해 사용될 수 있다. 예를 들어, 가장 높은 비의 탄화수소는 메탄 CH4(4:1)이다.
"소수성 분획"은 수성 상과 비교하여 소수성 상에서 더 가용성인 물질의 일부 또는 분획이다. 소수성 분획은 실질적으로 물에 불용성이고 보통 비극성이다.
"지질 수율을 증가시킨다"는, 예를 들어 배양물의 리터당 세포의 건조 중량을 증가시키거나, 지질을 구성하는 세포의 %를 증가시키거나, 단위 시간당 배양물 부피의 리터당 지질의 전체 양을 증가시키는 것에 의한 미생물 배양물의 생산성 증가를 말한다.
"유도성 프로모터"는 특정 자극에 응하여 작동가능하게 연결된 유전자의 전사를 매개하는 프로모터이다. 이러한 프로모터의 예는 pH 또는 질소 수준을 변화시키는 조건에서 유발된 프로모터 서열일 수 있다.
"작동가능한 연결에서"는 2개의 핵산 서열 간, 예를 들어, 제어 서열(전형적으로 프로모터)과 연결된 서열(전형적으로 단백질을 암호화하는 서열, 또한 소위 암호화 서열)간의 기능적 연결이다. 프로모터는 이것이 유전자의 전사를 매개할 수 있다면 외인성 유전자와 작동가능하게 연결되어 있다.
"인시츄"는 "제자리" 또는 "그것의 본래의 위치"를 의미한다.
"영양분의 제한 농도"는 배양된 유기체의 번식을 제한하는 배양물 내 화합물의 농도이다. "영양분의 비제한 농도"는 주어진 배양기간 동안 최대 번식을 지원하는 농도이다. 따라서, 소정의 배양기간 동안 생성되는 세포의 수는 영양분이 비제한적일 때보다 영양분의 제한 농도의 존재에서 더 낮다. 영양분은 영양분이 최대 번식을 지지하는 것보다 큰 농도로 존재하는 경우 배양물에서 과량인 것으로 언급된다.
"리파제"는 수불용성 지질 기질에서 에스터 결합의 가수분해를 촉매하는 수용성 효소이다. 리파제는 지질의 글라이세롤 및 지방산으로의 가수분해를 촉매한다.
"지질 변형 효소"는 지질의 공유 구조를 변경하는 효소를 말한다. 지질 변형 효소의 예는 리파제, 지방 아실-ACP 티오에스터라제, 지방 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 스테아릴 아실 운반 단백질 불포화효소(SAD) 및 지방 아실 불포화효소(FAD)를 포함하는 불포화효소 및 지방 알데하이드 데카보닐라제를 포함한다.
"지질 경로 효소"는 지질 대사, 즉 지질 합성, 변형 또는 분해에 역할을 하는 임의의 효소 및 지질을 화학적으로 변형시키는 임의의 단백질뿐만 아니라 운반 단백질이다.
"지질"은 비극성 용매(예를 들어, 에테르 및 클로로포름)에 가용성이고 물에 상대적으로 또는 완전히 불용성인 부류의 분자이다. 지질 분자는 이들이 주로 자연에서 소수성인 대다수의 긴 탄화수소 꼬리로 이루어지기 때문에 상기 성질을 가진다. 지질의 예는 지방산(포화 및 불포화); 글라이세라이드 또는 글라이세로지질(예를 들어, 모노글라이세라이드, 다이글라이세라이드, 트라이글라이세라이드 또는 중성 지방 및 포스포글라이세라이드 또는 글라이세로인지질); 비글라이세라이드(nonglyceride)(스핑고지질, 콜레스테롤 및 스테로이드 호르몬을 포함하는 스테롤 지질, 터페노이드를 포함하는 프레놀 지질, 지방 알코올, 왁스 및 폴리케타이드); 및 복합 지질 유도체(당-연결 지질 또는 당지질 및 단백질 연결된 지질)를 포함한다. "지방"은 소위 "트라이글라이세라이드"인 지질의 하위그룹이다.
"용해물"은 용해된 세포의 내용물을 함유하는 용액이다.
"용해"는 종종 유기체의 완전함을 손상시키는 기계적, 바이러스 또는 삼투압 메커니즘에 의한, 적어도 일부의 세포 내 내용물을 방출하기에 충분한 생물학적 유기체의 원형질막 및 선택적으로 세포벽의 파괴이다.
"용해하는"은 적어도 일부 세포 내 내용물을 방출하기에 충분한 생물학적 유기체 또는 세포의 세포막 및 선택적으로 세포벽을 파괴하는 것이다.
"미세조류"는 엽록체 또는 플라스티드를 함유하고, 선택적으로 광합성을 수행할 수 있는 진핵 미생물 유기체, 또는 광합성을 수행할 수 있는 원핵 미생물 유기체이다. 미세조류는 에너지로서 고정된 탄소 공급원을 대사시킬 수 없는 절대 광합성독립영양생물뿐만 아니라 고정된 탄소 공급원으로부터 유일하게 생존할 수 있는 종속영양생물을 포함한다. 미세조류는 세포 분열 후 단시간에 자매세포로부터 분리되는 단일 세포 유기체, 예를 들어, 클라미도모나스(Chlamydomonas)뿐만 아니라 2개의 별개의 세포 유형의 단순한 다중세포 광합성 미생물인, 예를 들어, 볼복스(Volvox)와 같은 미생물을 포함한다. 미세조류는 클로렐라, 두날리엘라, 및 프로토테카와 같은 세포를 포함한다. 미세조류는 또한 아그메넬룸(Agmenellum), 아나바에나(Anabaena), 및 피로보트라이스(Pyrobotrys)와 같은 세포-세포 접착을 나타내는 다른 미생물 광합성 유기체를 포함한다. 미세조류는 또한 특정 디노플라겔레이트 조류 종 및 프로토테카 속의 종과 같은 광합성을 수행하는 능력을 상실한 절대 종속영양 미생물 유기체를 포함한다.
"미생물 유기체" 및 "미생물(microbe)"은 현미경적 단일 세포 유기체이다.
2개의 단백질 또는 유전자와 관련하여 "자연적으로 공동 발현된"은 단백질 또는 이들의 유전자가 이들이 유래된 조직 또는 유기체에서 자연적으로 공동 발현됨을 의미하는데, 이는 예를 들어 2개의 단백질을 암호화하는 유전자가 공통된 조절 서열의 제어 하에 있거나 또는 이들이 동일한 자극에 응하여 발현되기 때문이다.
"삽투압 쇼크"는 삼투압의 급작스런 감소 후 용액 내 세포의 붕괴이다. 삽투압 쇼크는 때때로 상기 세포의 세포 성분을 용액 내로 방출하도록 유도된다.
"다당류-분해 효소"는 임의의 다당류의 가수분해 또는 당화를 촉매할 수 있는 임의의 효소이다. 예를 들어 셀룰라제는 셀룰로스의 가수분해를 촉매한다.
"다당류" 또는 "글라이칸"은 글라이코사이드 결합에 의해 서로 함께 연결된 단당류로 구성된 탄수화물이다. 셀룰로스는 특정 식물 세포 벽을 구성하는 다당류이다. 셀룰로스는 자일로스 및 글루코스와 같은 단당류뿐만 아니라 더 큰 이당류 및 올리고당을 수득하기 위하여 효소에 의해 탈중합될 수 있다.
"프로모터"는 핵산의 전사를 지시하는 핵산 제어 서열이다. 본 명세서에 사용된 바와 같이, 프로모터는 전사 개시 부위 근처에 필수 핵산 서열, 예를 들어, 폴리머라제 II형 프로모터의 경우 TATA 요소를 포함한다. 프로모터는 또한 선택적으로 전사 개시 부위로부터 수천 염기쌍 정도로 멀리 위치할 수 있는 말단 인핸서 또는 리프레서 요소를 포함한다.
"재조합체"는 외인성 핵산의 도입 또는 본래 핵산의 변경으로 인해 변형된 세포, 핵산, 단백질 또는 벡터이다. 따라서, 예를 들어, 재조합 세포는 본래(비-재조합) 형태의 세포 내에서 발견되지 않는 유전자를 발현하거나 비-재조합 세포에 의해 발현되는 유전자와는 상이하게 본래 유전자를 발현한다. "재조합 핵산"은 예를 들어, 폴리머라제 및 엔도뉴클레아제를 사용하는 핵산의 조작에 의해 일반적으로 시험관 내 형성된 본래의 핵산이거나 통상적으로 천연에서 존재하지 않는 형태로 존재한다. 예를 들어 작동가능한 연결에서 2개 이상의 핵산을 위치시키기 위해 재조합 핵산이 생성될 수 있다. 따라서, 통상적으로 천연에서 연결되어 있지 않은 DNA 분자를 결찰하는 것에 의해 시험관 내 형성된 분리된 핵산 또는 발현 벡터는 둘 다 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 일단 재조합 핵산이 제조되고 숙주 세포 또는 유기체로 도입되면, 이것은 숙주 세포의 생체 내 세포 기구를 사용하여 복제할 수 있지만; 일단 재조합적으로 생성되면, 이러한 핵산은 후속적으로 세포 내에서 복제된다 하더라도 여전히 본 발명의 목적을 위한 재조합체인 것으로 고려된다. 유사하게, "재조합 단백질"은, 즉, 재조합 핵산의 발현을 통해 재조합 기술을 사용하여 제조된 단백질이다.
"재생 디젤"은 지질의 수소화 및 탈산소화를 통해 생성된 알칸(예를 들어, C10:0, C12:0, C14:0, C16:0 및 C18:0)의 혼합물이다.
"당화"는 바이오매스, 통상적으로 셀룰로스 또는 리그노셀룰로스 바이오매스를 글루코스 및 자일로스와 같은 단량체성 당으로 전환시키는 공정이다. "당화된" 또는 "탈중합된" 셀룰로스 물질 또는 바이오매스는 당화를 통해 단량체 당으로 전환되는 셀룰로스 물질 또는 바이오매스를 말한다.
용어 "유사한"은 자연적으로 발생하는 오일과 비교하는 내용에서 사용될 때, 추가 정량화 없이, 자연적으로 발생하는 오일과 비교되는 오일이 자연적으로 발생하는 오일의 최고 2가지 트라이글라이세라이드의 약 +/- 15%, 또는 +/- 10%를 함유하는 것을 의미한다. 예를 들어 쉬어버터(부티로스퍼멈 파키(B. Parkii)의 오일)는 2가지의 가장 흔한 트라이글라이세라이드 성분으로서 41.2-56.8% C18:0 및 34.0-46.9% C18:1을 함유한다(표 5를 참조). +/- 10% 내의 "유사한" 오일은 2가지 가장 흔한 트라이글라이세라이드로서 약 37% 내지 약 62% C18:0 및 31% 내지 약 52% C18:1을 함유한다. 이 내용에서 사용될 때, 용어 "유사한"은 +/- 9%, +/- 8%, +/- 7%, +/- 6%, +/- 5%, +/- 4%, +/- 3%, +/- 2%, 또는 +/- 1%를 포함하며, 자연적으로 발생하는 오일의 최고 3가지 또는 최고 4가지의 트라이글라이세라이드, 또는 최고 3가지 트라이글라이세라이드 이외의 2가지, 또는 최고 4가지 트라이글라이세라이드 이외의 3가지와 비교를 추가로 표시할 수 있다.
"초음파 처리"는 초음파 에너지를 사용하여 세포와 같은 생물학적 물질을 파괴시키는 공정이다.
"푸르푸랄 종"은 동일한 염기성 구조 특성을 보유한 2-푸란카복스알데하이드 또는 유도체이다.
"스토버"는 낟알이 채취된 후 남아있는 작물의 무수 줄기 및 잎이다.
"수크로스 이용 유전자"는 발현되는 경우 에너지원으로서 수크로스를 이용하는 세포의 능력을 도와주는 유전자이다. 수크로스 이용 유전자에 의해 암호화된 단백질은 본 명세서에서 "수크로스 이용 효소"로 언급되고 수크로스 수송체, 수크로스 인버타제, 및 글루코키나제 및 프럭토키나제와 같은 헥소키나제를 포함한다.
II. 배양
본 발명은 지질의 생성을 위해 일반적으로 미생물 유기체(예를 들어, 미세조류, 유지성 효모, 진균 및 박테리아), 특히 재조합 프로토테카 균주를 포함하는 미세조류 균주를 배양하는 것에 관한 것이다. 독자의 편이를 위해, 본 부분은 여러 하위부문으로 세분된다. 하위부문 1은 프로토테카 종 및 균주를 기재하고 게놈 DNA 비교에 의해 새로운 프로토테카 종 및 균주 및 관련 미세조류뿐만 아니라 다른 미생물 유기체를 확인하는 방법을 기재한다. 하위부문 2는 배양에 유용한 생물반응기를 기재한다. 하위부문 3은 배양을 위한 배지를 기재한다. 하위부문 4는 본 발명의 예시적인 배양 방법에 따른 오일 생성을 기재한다. 이들 기재는 또한 다른 미생물 유기체에 대해 더 일반적으로 적용가능하다.
1.
프로토테카 종 및 균주 및 다른 미생물 유기체
프로토테카는 고수준의 지질, 특히, 연료 생산을 위해 적합한 지질을 생산할 수 있기 때문에 지질의 생산에 사용하기 위해 주목할만한 미생물이다. 프로토테카에 의해 생산된 지질은 다른 미세조류에 의해 생산되는 것보다 단쇄 길이 및 고도의 포화를 갖는 탄화수소 쇄를 가진다. 더욱이, 프로토테카 지질은 일반적으로 색소 부재(엽록소 및 특정 카로테노이드의 낮거나 검출가능하지 않은 수준)이고 임의의 경우에 다른 미세조류 유래의 지질 보다 색소를 훨씬 적게 포함한다. 더욱이 본 발명에 의해 제공된 재조합 프로토테카 세포는 다른 미생물로부터 지질을 생산하는 것과 비교하여 보다 큰 수율 및 효율로 저렴하게 지질을 생산하기 위해 사용될 수 있다. 본 발명의 방법에 사용하기 위한 예시적인 프로토테카 균주가 포함된다. 추가로, 상기 미세조류는 종속영양적으로 성장하고 프로토테카 프로토테카 윅케르하미, 프로토테카 스타그노라(UTEX 327을 포함), 프로토테카 포르토리센시스, 프로토테카 모리포미스(UTEX 균주 1441, 1435를 포함), 및 프로토테카 좁피로서 유전자 조작될 수 있다. 프로토테카 속의 종은 절대 종속영양생물이다.
본 발명에 사용하기 위한 프로토테카 종은 게놈의 특정 표적 영역의 증폭으로 확인될 수 있다. 예를 들어, 특정 프로토테카 종 또는 균주의 확인은 프라이머 및 게놈의 임의의 영역을 사용하는 방법, 예를 들어, 문헌[Wu et al., Bot. Bull. Acad. Sin. (2001) 42: 115-121 Identification of Chlorella spp . isolates using ribosomal DNA sequences]에 기재된 방법을 사용하여 핵 및/또는 엽록체 DNA의 증폭 및 서열분석을 통해 달성할 수 있다. 리보솜 내부 전사된 스페이서(ITS1 및 ITS2 rDNA), 23S rRNA, 18S rRNA, 및 기타 보존된 게놈 영역의 증폭 및 서열분석과 같은 계통발생적 분석에 대해 널리 확립된 방법은 당업자에 의해 사용되어 프로토테카의 종뿐만 아니라 유사한 지질 프로파일 및 생산 능력을 갖는 다른 탄화수소 및 지질 생산 미생물 종을 확인할 수 있다. 조류의 확인 및 분류 방법에 대한 예는 또한 문헌[Genetics, 2005 Aug;170(4): 1601-10 및 RNA, 2005 Apr;11(4):361-4]을 참조한다.
따라서, 게놈 DNA 비교를 사용하여 본 발명에 사용되는 미세조류의 적합한 종을 확인할 수 있다. 이에 제한되지 않는 23S rRNA를 암호화하는 DNA와 같은 보존된 게놈 DNA의 영역은 미세조류 종으로부터 증폭시키고 컨센서스 서열과 비교하여 본 발명에 사용되는 바람직한 미세조류와 분류학적으로 관련된 미세조류 종을 스크리닝할 수 있다. 프로토테카 속 내의 종에 대한 상기 DNA 서열 비교의 예는 하기에 나타낸다. 게놈 DNA 비교는 또한 균주 수거에서 잘못 확인된 미생물 종을 확인하는데 유용할 수 있다. 흔히 균주 수거는 표현형 및 형태적 특성을 기본으로 미세조류 종을 확인한다. 이들 특성의 사용은 미세조류의 종 또는 속의 잘못된 분류를 유도할 수 있다. 게놈 DNA 비교를 사용하는 것이 이들의 계통발생 관계를 기준으로 미세조류 종을 분류하는데 더 우수한 방법일 수 있다.
본 발명에 사용하기 위한 미세조류는 전형적으로 서열번호 11 내지 19에 열거된 서열 중 하나 이상과 적어도 99%, 적어도 95%, 적어도 90%, 또는 적어도 85%의 뉴클레오타이드 동일성을 갖는 23S rRNA를 암호화하는 게놈 DNA 서열을 가진다.
뉴클레오타이드 또는 아미노산 동일성%을 결정하기 위한 서열 비교를 위해, 전형적으로 하나의 서열이 기준 서열로 작용하고 이것과 시험 서열을 비교한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열을 컴퓨터에 입력하고 경우에 따라 세부서열의 좌표를 지정하며 서열 알고리즘 프로그램 파라미터를 지정한다. 이어서 서열 비교 알고리즘을 사용하여 지정된 프로그램 파라미터를 기준으로 표준 서열에 대한 시험 서열의 서열 동일성%를 계산한다.
비교용 서열의 최적의 정렬은 예를 들어, 문헌[Smith & Waterman, Adv . Appl. Math. 2:482 (1981)]의 국소 상동성 알고리즘, 문헌[Needleman & Wunsch, J. Mol. Biol . 48:443 (1970)]의 상동성 정렬 알고리즘, 문헌[Pearson & Lipman, Proc. Nat'l . Acad . Sci . USA 85:2444 (1988)]의 유사성 검색 방법, (Wisconsin Genetics 소프트웨어 패키지의 GAP, BESTFIT, FASTA, 및 TFASTA, 위스콘신주 매디슨시 사이언스 드라이브 575에 소재한 Genetics Computer Group)]의 당해 알고리즘의 컴퓨터에 의한 수행, 또는 육안 검사(일반적으로 문헌[Ausubel et al., 상기 참조])에 의해 수행될 수 있다.
서열 동일성 및 서열 유사성 %를 결정하기 위해 적합한 또 다른 예시적 알고리즘은 문헌[Altschul et al., J. Mol . Biol . 215:403-410 (1990)]에 기재된 BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국가생물공학센터(National Center for Biotechnology Information)(웹 주소: www.ncbi.nlm.nih.gov)를 통해 입수할 수 있다. 상기 알고리즘은 먼저 탐색 서열에서 길이에 대한 단축어 W를 확인하는 것으로 높은 점수의 서열 쌍(high scoring sequence pair, HSP)을 확인하는 것을 포함하고 이는 데이타베이스 서열 중에 동일한 길이의 단어와 정렬되는 경우 몇몇 양성 값의 역치 점수 T와 일치하거나 이를 충족시킨다. T는 이웃 단어 점수 역치로서 언급된다(Altschul et al., 상기 참조). 이들 초기 이웃 단어 히트는 이들을 함유하는 보다 긴 HSP를 발견하기 위한 검색을 개시하기 위한 근거로서 작용한다. 단어 히트를 이어서 누적 정렬 점수가 증가될 수 있는 한 각각의 서열을 따라 양방향으로 확장시킨다. 누적 점수는 뉴클레오타이드 서열에 대해 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수: 항상 > 0임) 및 N(불일치 잔기에 대한 페널티 점수: 항상 < 0)을 사용하여 계산한다. 아미노산 서열에 대해, 스코어링 매트릭스를 사용하여 누적 점수를 계산한다. 각각의 방향에서의 단어 히트의 확장은 다음의 경우에 중지한다: 누적 정렬 점수가 이의 최대 달성 값으로부터 X 양으로 이탈하는 경우; 누적 점수가 하나 이상의 음성 스코어링 잔기 정렬의 누적으로 인해 0 이하로 되는 경우; 또는 서열의 말단에 도달하는 경우. 핵산 또는 폴리펩타이드가 본 발명의 범위 내에 있는지의 여부를 확인하기 위해, BLAST 프로그램의 디폴트(default) 파라미터가 적합하다. BLASTN 프로그램(뉴클레오타이드 서열용)은 11의 단어 길이(W), 10의 예상치(E), M=5, N=-4, 및 양쪽 서열가닥의 비교를 디폴트로서 사용한다. 아미노산 서열을 위해, BLASTP 프로그램은 3의 단어 길이(W), 10의 예상치(E) 및 BLOSUM62 스코어링 매트릭스를 디폴트로서 사용한다. TBLATN 프로그램(뉴클레오타이드 서열용 단백질 서열을 사용하는)은 3의 단어 길이(W), 10의 예상값(E) 및 BLOSUM 62 스코어링 매트릭스를 디폴트로서 사용한다(문헌[Henikoff & Henikoff, Proc . Natl . Acad . Sci . USA 89:10915 (1989)] 참조).
서열 동일성%를 계산하는 것뿐만 아니라, BLAST 알고리즘은 또한 2개의 서열 간의 유사성에 대한 통계학적 분석을 수행한다(예를 들어, 문헌[Karlin & Altschul, Proc . Nat'l . Acad . Sci . USA 90:5873-5787(1993)] 참조). BLAST 알고리즘에 의해 제공된 한가지의 유사성 측정은 최소 합계 가능성(P(N))이고 이는 2개의 뉴클레오타이드 또는 아미노산 서열 간의 일치가 우연히 발생할 가능성을 지적한다. 예를 들어, 표준 핵산에 대한 시험 핵산의 비교에 있어서 최소의 합계 가능성이 약 0.1 미만, 더 바람직하게는 약 0.01 미만 및 가장 바람직하게는 약 0.001 미만인 경우 핵산은 기준 서열과 유사한 것으로 간주된다.
본 발명에 사용하기 위한 미생물의 선택에 영향을 주는 다른 고려사항은 오일, 연료 및 함유화학물질의 생산을 위해 적합한 지질 또는 탄화수소의 생성 뿐만 아니라 다음을 포함한다: (1) 세포 중량%로서 고지질 함량; (2) 성장의 용이함; (3) 유전자 가공의 용이함; 및 (4) 바이오매스 가공처리의 용이함. 특정 양태에서, 야생형 또는 유전자 조작된 미생물은 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 또는 적어도 70%의 지질인 세포가 생성되도록 한다. 바람직한 유기체는 (빛의 부재 하에 당에서) 종속영양적으로 성장한다.
본 발명의 실행에 사용될 수 있는 조류의 예는, 이에 제한되는 것은 아니지만, 표 1에 열거된 다음의 조류를 포함한다.
본 발명의 실행에 사용될 수 있는 유지성 효모의 예는, 이에 제한되는 것은 아니지만, 표 26에서 열거되는 다음의 유지성 효모를 포함한다.
본 발명의 실행에 사용될 수 있는 다른 진균의 예는, 이에 제한되는 것은 아니지만, 표 27에 열거된 다음의 진균을 포함한다.
본 발명의 일부 실시형태에서, 미생물 유기체는 박테리아이다. 대장균(E. coli)와 같은 박테리아의 외인성 유전자의 발현 예는 잘 공지되어 있다; 예를 들어 문헌[Molecular Cloning: A Laboratory Manual, Sambrook et al. (3d edition, 2001, Cold Spring Harbor Press)]을 참조한다.
2.
생물반응기
미생물은 유전적 유전자 조작을 수행하고 탄화수소(예를 들어, 지질, 지방산, 알데하이드, 알코올 및 알칸)를 생성할 2가지 목적을 위해 배양한다. 전자 유형의 배양은 소규모 및 처음에는 적어도 출발 미생물이 성장할 수 있는 조건 하에서 수행한다. 탄화수소를 생산하기 위한 배양은 생물반응기에서 통상적으로 대규모(예를 들어, 10,000ℓ, 40,000ℓ, 100,000ℓ 또는 더 대형의 생물반응기)로 수행한다. 프로토테카 종을 포함하는 미세조류는 전형적으로 생물반응기 내 액체 배지 중에서 본 발명의 방법으로 배양한다. 전형적으로, 생물반응기는 빛이 입사되지 않도록 한다.
생물반응기 또는 발효기를 사용하여 다양한 단계의 생리적 주기를 통해 유지성 미생물 세포, 바람직하게는 미세조류 세포를 배양한다. 생물반응기는 종속영양 성장 및 번식 방법에 사용하기 위해 많은 이점을 제공한다. 식품에 사용하기 위한 바이오매스를 생산하기 위해 미세조류를 예로서 현탁액 배양물과 같은 액체 중에서 다량으로 바람직하게 발효시킨다. 강철 발효기와 같은 생물반응기는 매우 큰 배양 부피(40,000 리터 이상의 용량을 갖는 생물반응기가 본 발명의 다양한 양태에서 사용된다)을 수용할 수 있다. 생물반응기는 또한 전형적으로 온도, pH, 산소압 및 이산화탄소 수준과 같은 배양 조건의 제어를 허용한다. 예를 들어, 생물반응기는 전형적으로 예를 들어, 튜빙에 부착된 포트를 사용하여 산소 또는 질소와 같은 가스 성분이 액체 배양물을 통해 기포 주입될 수 있도록 하는 형태를 취할 수 있다. 배양 배지의 pH, 미량 요소의 종류 및 농도 및 기타 배지 성분과 같은 다른 배양 파라미터가 또한 생물반응기를 사용하여 더 용이하게 조작될 수 있다.
생물반응기는 미세조류가 증식하고 수적으로 증가하는 전반적인 시간에 걸쳐 생물반응기를 통해 배양 배지가 유입되도록 하는 형태를 취할 수 있다. 일부 경우에, 예를 들어, 배지는 접종 후 세포가 목적하는 밀도에 도달하기 전에 생물반응기로 주입될 수 있다. 다른 경우에, 생물반응기에는 배양 초기에 배양 배지가 충전되고 배양물이 접종된 후에는 더 이상의 배양 배지가 주입되지 않는다. 다른 말로, 미세조류 바이오매스는 미세조류가 증식하고 수적으로 증가하는 기간 동안 수성 배지에서 배양되지만 수성 배양 배지의 양이 그 기간에 걸쳐 생물반응기를 통해 유입되지 않는다. 따라서, 일부 경우에, 수성 배양 배지는 접종 후 생물반응기를 통해 유입되지 않는다.
회전 블레이드 및 임펠러, 잠금 기구, 교반 막대, 가압 가스 주입용 수단과 같은 장치가 장착된 생물반응기를 사용하여 미세조류 배양물이 혼합되도록 할 수 있다. 혼합은 연속적이거나 간헐적일 수 있다. 예를 들어, 일부 경우에, 가스 주입 및 배지 주입의 난기류가 목적하는 수로 미세조류가 증가할 때까지는 미세조류의 증식 동안 유지되지 않는다.
생물반응기 포트를 사용하여 가스, 고체, 반고체 및 액체를, 미세조류를 함유하는 생물반응기 챔버에 도입하거나 추출할 수 있다. 많은 생물반응기는 하나 이상의 포트(예를 들어, 배지 주입을 위한 하나 및 샘플링을 위한 또 다른 하나)를 갖고 단지 하나의 물질이 포트를 출입할 필요는 없다. 예를 들어, 포트를 사용하여 배양 배지가 생물반응기로 유입될 수 있도록 하고 이후에 샘플링, 가스 주입, 가스 배출 또는 기타 목적을 위해 사용될 수 있다. 바람직하게는, 샘플링 포트는 배양의 무균 특성을 손상시키지 않고 반복적으로 사용될 수 있다. 샘플링 포트는 샘플의 흐름이 중지되고 개시되거나 연속 샘플링의 수단을 제공하도록 하는 밸브 또는 기타 장치로 구성될 수 있다. 생물반응기는 전형적으로 배양의 접종을 허용하는 하나 이상의 포트를 갖고 상기 포트는 또한 배지 또는 가스 주입과 같은 다른 목적을 위해 사용될 수 있다.
생물반응기 포트는 미세조류의 배양의 가스 함량이 조작되도록 할 수 있다. 설명하자면 생물반응기 부피의 일부는 액체보다는 가스일 수 있고 생물반응기의 가스 주입구는 가스를 생물반응기로 펌핑될 수 있도록 한다. 생물반응기 내로 유리하게 펌핑될 수 있는 가스는 공기, 공기/CO2 혼합물, 비활성기체(예를 들어, 아르곤) 및 기타 가스를 포함한다. 생물반응기는 전형적으로 사용자가 생물반응기로의 가스 주입 속도를 조절할 수 있도록 구성된다. 상기된 바와 같이, 생물반응기로의 가스 주입 증가를 사용하여 배양물의 혼합을 증가시킬 수 있다.
증가된 가스 유입은 또한 배양물의 탁도에 영향을 미친다. 난기류는 수성 배양 배지의 수위 하부에 가스 주입 포트를 위치시켜 생물반응기로 주입되는 가스가 배양 표면으로 기포 주입되도록 함에 의해 달성할 수 있다. 하나 이상의 가스 배출 포트는 가스가 배출되도록 하여 생물반응기 내 압력 증강을 차단한다. 바람직하게, 가스 배출 포트는 생물반응기로 오염 미생물이 들어가는 것을 차단하는 '원-웨이' 밸브를 유도한다.
3.
배지
미생물 배양 배지는 전형적으로 고정 질소 공급원, 고정 탄소 공급원, 미량 요소, 임의로 pH 유지를 위한 완충제 및 포스페이트(전형적으로 포스페이트 염으로서 제공됨)과 같은 성분들을 함유한다. 기타 성분은 특히 해양 미세조류를 위해 염화나트륨과 같은 염을 함유할 수 있다. 질소 공급원은 예를 들어, 제한 없이 분자 질소, 나이트레이트, 나이트레이트 염, 암모니아(순수 형태 또는 염 형태, 예를 들어, (NH4)2SO4 및 NH4OH), 단백질, 대두 음식물, 옥수수 침지액, 및 효모 추출물을 포함하는 유기 및 무기 질소 공급원을 함유한다. 미량 요소의 예는 아연, 붕소, 코발트, 구리, 망간, 및 몰리브덴을 포함하고 예를 들어, 이의 각각의 형태는 ZnCl2, H3BO3, CoCl2ㆍ6H2O, CuCl2ㆍ2H2O, MnCl2ㆍ4H2O 및 (NH4)6Mo7O24ㆍ4H2O이다.
본 발명의 방법에 따라 유용한 미생물은 전세계적으로 다양한 장소 및 환경에서 발견된다. 다른 종 및 이들의 궁극적인 분화 분기점으로부터의 분리 결과로서, 최적의 성장 및 지질 및/또는 탄화수소 구성성분들의 최적의 생산을 위한 특정 성장 배지는 예측하기 어려울 수 있다. 일부 경우에, 특정 미생물 균주는 몇몇 억제 성분의 존재 또는 특정 미생물 균주에 의해 요구되는 임의의 필수 영양 요구성 물질의 부재 때문에 특정 성장 배지 상에서 성장할 수 없다.
고체 및 액체 성장 배지는 일반적으로 다양한 공급원으로부터 시판되고 광범위한 미생물 균주를 위해 적합한 특정 배지를 제조하기 위한 지침은, 예를 들어 조류의 배양물 수집을 위해 미국 텍사스주 78712-0183 오스틴시 유니버시티 스테이션 A6700 1에 소재한 오스틴 텍사스 유니버시티(UTEX)에서 운영하는 온라인 사이트(http://www.utex.org/)에서 찾을 수 있다. 예를 들어, 다양한 담수 및 염수 배지는 본 명세서에 참조로서 포함된 국제특허출원 공개번호 2008/151149에 기재된 것들을 포함한다.
특정 예에서, 프로테오스 배지(Proteose Medium)는 무균 조건에 적합하고 배지의 1ℓ 부피의 배지(pH ~ 6.8)는 1리터의 Bristol 배지에 1g의 프로테오스 펩톤을 첨가하여 제조할 수 있다. Bristol 배지는 수용액 중에 2.94 mm NaNO3, 0.17 mm CaCl2ㆍ2H2O, 0.3 mmMgSO4ㆍ7H2O, 0.43 mM, 1.29 mm KH2PO4, 및 1.43 mm NaCl를 포함한다. 1.5% 한천 배지에 대해, 15g의 한천을 1ℓ의 용액에 첨가할 수 있다. 상기 용액을 덮고 오토클레이빙하고 이어서 사용 전에 냉장 온도에 저장한다. 또 다른 예는 10g/ℓ의 수소칼륨 프탈레이트(postassium hydrogen phthalate, KHP), 0.9g/ℓ의 수산화나트륨, 0.1g/ℓ의 황산마그네슘, 0.2g/ℓ의 인산수소칼륨, 0.3g/ℓ의 염화암모늄, 10g/ℓ의 글루코스, 0.001g/ℓ의 티아민 하이드로클로라이드, 20g/ℓ 한천, 0.25g/ℓ의 5-플루오로사이토신을 포함하고 pH 범위가 5.0 내지 5.2인 프로토테카 분리 배지(Prototheca isolation medium, PIM)이다(Pore, 1973, App. Microbiology, 26: 648-649). 본 발명의 방법에 사용하기에 적합한 다른 배지는 상기된 URL에 문의하거나 미생물 배양물을 유지하는 다른 기관(예를 들어, SAG, CCAP, 또는 CCALA)에 문의하여 용이하게 확인할 수 있다. SAG는 괴팅겐 유니버시티(University of Gottingen)(독일 괴팅겐에 소재)에서의 조류 배양 수거물을 언급하고, CCAP는 스코틀랜드 해양연구기관(Scottish Association for Marine Science)(영국 스코틀랜드에 소재)에 의해 관리되는 조류 및 원생동물의 배양 수거물을 언급하고, CCALA는 식물학 연구소(Institute of Botany)(체코 공화국 트레본에 소재)의 조류 연구소의 배양 수거물을 언급한다. 추가로, 미국 특허 제5,900,370호는 프로토테카 종의 종속영양 발효에 적합한 배지 제형 및 조건을 기재하고 있다.
오일 생산을 위해, 고정 탄소 공급원의 선택이 중요한데 그 이유는 고정 탄소 공급원의 비용이 경제적인 오일 생산을 위해 충분히 낮아야 하기 때문이다. 따라서, 적합한 탄소 공급원은 예를 들어, 아세테이트, 플로리도사이드, 프럭토스, 갈락토스, 글루쿠론산, 글루코스, 글라이세롤, 락토스, 만노스, N-아세틸글루코사민, 람노스, 수크로스, 및/또는 자일로스를 포함하고 상기 화합물을 함유하는 공급원료의 선택이 본 발명의 방법의 중요한 측면이다. 본 발명의 방법에 따라 유용한 적합한 공급원료는 예를 들어, 블랙 음료, 옥수수 전분, 탈중합된 셀룰로스 물질, 유청, 당밀, 감자, 수수, 수크로스, 사탕수수, 사탕무, 쌀 및 밀을 포함한다. 탄소 공급원은 또한 수크로스와 탈중합된 사탕무 펄프의 혼합물과 같은 혼합물로서 제공될 수 있다. 하나 이상의 탄소 공급원(들)은 하나 이상의 외인성으로 제공된 고정 탄소 공급원(들)의 적어도 약 50μM, 적어도 약 100μM, 적어도 약 500μM, 적어도 약 5 mM, 적어도 약 50 mM, 및 적어도 약 500 mM의 농도로 제공될 수 있다. 본 발명의 목적을 위해 특히 유리한 탄소 공급원은 셀룰로스(탈중합된 형태), 글라이세롤, 수크로스 및 수수를 포함하고, 이들 각각은 이하에서 더욱 상세하게 논의된다
본 발명에 따라, 미생물은 공급원료로서 탈중합된 셀룰로스 바이오매스를 사용하여 배양할 수 있다. 셀룰로스 바이오매스(예를 들어, 스토버)는 저렴하고 용이하게 입수할 수 있지만, 효모용 공급원료서 상기 물질을 사용하기 위한 시도는 실패했었다. 특히, 상기 공급원료는 효모 성장에 억제 작용을 하는 것으로 밝혀졌고 효모는 셀룰로스 물질로부터 생성된 5탄당(예를 들어, 헤미-셀룰로스 유래의 자일로스)을 사용할 수 없다. 대조적으로, 미세조류는 가공된 셀룰로스 물질상에서 성장할 수 있다. 셀룰로스 물질은 일반적으로 약 40-60%의 셀룰로스; 약 20-40%의 헤미셀룰로스 및 10-30%의 리그닌을 포함한다.
적합한 셀룰로스 물질은 농작물, 즉, 식물 일부, 1차 식품 또는 섬유 생성물과 함께 야생에서 제거되지 않는 주로 줄기 및 잎뿐만 아니라 초본성 및 목재 에너지 작물로부터의 잔사를 포함한다. 이의 예는 농업 폐기물, 예를 들어, 사탕 수수 바가스, 쌀겨, 옥수수 섬유(줄기, 잎, 껍질 및 코브), 밀짚, 쌀짚, 사탕무 펄프, 감귤 펄프, 감귤 과피; 산림 폐기물, 예를 들어, 경목재 및 연목재 간벌, 및 수목 작업으로부터의 경목재 및 연목재 잔사; 목재 폐기물, 예를 들어, 톱 가루 폐기물(목재 칩, 톱밥) 및 펄프 가루 폐기물; 도시 폐기물, 예를 들어, 시의 고형 폐기물의 종이 분획물, 도시 목재 폐기물 및 도시 녹색 폐기물, 예를 들어, 시의 유리 클립핑; 및 목재 건축 폐기물을 포함한다. 추가의 셀룰로스는 스위치그래스, 하이브리드 포플라 목재 및 미스칸투스, 섬유질 케인(cane) 및 섬유질 수수와 같은 전용 셀룰로스 작물을 포함한다. 상기 물질로부터 생성된 5탄당은 자일로스를 포함한다.
셀룰로스 물질은 상기 물질내 함유된 당(들)을 미생물이 이용할 수 있도록 효율이 증가되도록 처리된다. 본 발명은 산 분해 후 셀룰로스 물질을 처리하여 물질이 미생물(예를 들어, 미세조류 및 유성 효모)의 종속영양성 배양에 사용하기에 적합하도록 하는 신규 방법을 제공한다. 상기 논의된 바와 같이, 리그노셀룰로스 바이오매스는 셀룰로스, 베타 1,4 연결된 글루코스(6탄당)의 결정성 중합체, 헤미셀룰로스, 자일로스(5탄당)로 주로 구성된 더 느슨하게 연합된 중합체 및 더 드문 정도의 만노스, 갈락토스, 아라비노스, 리그닌, 시나필 알코올 및 이의 유도체로 구성된 복합 방향족 중합체, 및 알파 1,4-연결된 폴리갈락투론산의 직쇄인 펙틴을 포함하는, 다양한 분획물로 구성된다. 셀룰로스 및 헤미셀룰로스의 중합체 구조때문에 이들내 당(예를 들어, 단량체 글루코스 및 자일로스)은 많은 미생물에 의해 효율적으로 사용될 수 있는(대사되는) 형태로 존재하지 않는다. 상기 미생물을 위해 중합체를 구성하는 단량체 당을 생성하도록 셀룰로스 바이오매스를 추가로 가공하면 셀룰로스 물질이 공급원료(탄소 공급원)로서 효율적으로 확실히 사용되는데 매우 도움이 될 수 있다.
셀룰로스 또는 셀룰로스 바이오매스는, 바이오매스가 승온 및 승압에서 희석 황산(또는 다른 산)으로 처리되는 "폭발(explosion)"로 칭해지는 공정에 적용된다. 상기 공정 조건은 셀룰로스 및 헤미셀룰로스 분획물의 글루코스 및 자일로스 단량체로 효소적 가수분해에 바이오매스가 효율적으로 적용될 수 있도록 한다. 수득한 단량체 당은 셀룰로스 당으로 호칭된다. 셀룰로스 당은 이어서 미생물에 의해 이용되어 다양한 대사물(예를 들어, 지질)이 생성될 수 있도록 한다. 산 분해 단계는 헤미셀룰로스 분획물이 구성 모노사카라이드로 부분 가수분해 되도록 한다. 이들 당은 추가의 처리로 바이오매스로부터 완전히 유리될 수 있다. 일부 경우에, 추가의 처리는 열수 처리이고 이는 분해된 물질을 고온수로 세척하여 염과 같은 오염물을 제거하도록 함을 포함한다. 상기 단계는 상기 공정에 사용되는 더 희석된 당 농도로 인해 셀룰로스 에탄올 발효를 위해 필요하지 않다. 다른 양태에서, 추가의 처리는 추가의 산 처리이다. 여전히 다른 양태에서, 추가의 처리는 분해된 물질의 효소적 가수분해이다. 이들 처리는 또한 임의의 조합으로 사용될 수 있다. 처리 유형은 유리되는 당(예를 들어, 5탄당 대 6탄당), 및 이들이 당해 공정에서 유리되는 단계의 유형에 영향을 미칠 수 있다. 결과로서, 이들이 5탄당 또는 6탄당이든 상관없이 상이한 당 스트림이 생성될 수 있다. 이들 집적된 5탄당 또는 6탄당 스트림은 따라서 상이한 탄소 이용 능력을 갖는 특이적 미생물에 지시될 수 있다.
본 발명의 방법은 전형적으로 에탄올 발효에서 달성되는 것보다 높은 세포 밀도로 발효시키는 단계를 포함한다. 종속 영양성 셀룰로스 오일 생산을 위한 배양물의 보다 높은 밀도 때문에, 고정 탄소 공급원(예를 들어, 셀룰로스 유래된 당 스트림(들))은 바람직하게 농축된 형태로 존재한다. 탈중합된 셀룰로스 물질의 글루코스 수준은 바람직하게 배양 단계 전에 바람직하게는 적어도 300g/리터, 적어도 400g/리터, 적어도 500g/리터 또는 적어도 600g/리터이고, 상기 배양 단계는 임의로 유가식 배양이며, 여기서 상기 물질은 세포가 성장하고 지질을 축적시킴으로써 시간 경과에 따라 세포에 공급된다. 셀룰로스 당 스트림은 셀룰로스 에탄올 생산에서 상기 농도 범위에서 또는 이의 근처에서 사용되지 않는다. 따라서, 리그노셀룰로스 오일의 생성 동안에 매우 높은 세포 밀도를 생성하고 유지하기 위해서는 탄소 공급원료(들)가 고농축된 형태로 종속영양 배양물로 전달되어야만 한다. 그러나, 이에 대한 기질이 아니고 유성 미생물에 의해 대사되지 않는 공급 스트림에서 임의의 성분은 생물반응기에 축적되고 이것은 성분이 목적하는 최종 생성물의 생산에 독성이거나 억제성인 경우 문제를 유발할 수 있다. 분해 공정 및 후속적인 중화 공정 둘 다에서 셀룰로스 물질의 생성으로부터 유래된 푸르푸랄 및 하이드록시메틸 푸르푸랄 및 염과 같은 리그닌 및 리그닌 유래 부산물, 탄수화물 유래된 부산물 및 심지어 비대사된 펜토스/헥소스 당은 에탄올 발효에서 문제점을 제공할 수 있고 이들 효과는 초기 공급원료에서 이들의 농도가 높은 공정에서 상당히 증폭된다. 본 발명에 기재된 리그노셀룰로스 오일의 대규모 생산에 사용될 수 있는 6탄당에 대한 300g/ℓ 범위 (또는 이보다 높은)의 당 농도를 달성하기 위해, 이들 독성 물질의 농도는 셀룰로스 바이오매스의 에탄올 발효에 전형적으로 존재하는 농도 보다 20배 높을 수 있다.
셀룰로스 물질의 폭발 공정 처리는 상당한 양의 황산, 열 및 압력을 사용함으로써, 탄수화물의 부산물, 즉 푸르푸랄 및 하이드록시메틸 푸르푸랄을 유리시킨다. 푸르푸랄 및 하이드록시메틸 푸르푸랄은 크실로스의 푸르푸랄 및 물로의 탈수를 통한 헤미셀룰로스의 가수분해 동안 생성된다. 본 발명의 일부 경우에, 이들 부산물(예를 들어, 푸르푸랄 및 하이드록시메틸 푸르푸랄)은 생물반응기로 도입하기 전에 당화된 리그노셀룰로스 물질로부터 제거된다. 본 발명의 특정 양태에서, 탄수화물의 부산물의 제거 공정은 분해된 셀룰로스 물질의 열수 처리이다. 또한, 본 발명은 푸르푸랄 또는 하이드록시메틸 푸르푸랄과 같은 화합물에 내성일 수 있는 균주가 리그노셀룰로스 오일 생산에 사용되는 방법을 제공한다. 또 다른 양태에서, 본 발명은 또한 발효 배지에서 푸르푸랄에 내성일 수 있는 것뿐만 아니라 실제로 리그노셀룰로스 오일의 생산 동안에 당해 부산물을 대사시킬 수 있는 미생물 및 방법을 제공한다.
상기 분해 공정은 또한 상당한 수준의 염을 생성한다. 예를 들어, 분해를 위한 전형적인 조건은 분해된 셀룰로스 바이오매스가 10:1의 물:고체(건조 중량)로 재현탁되는 경우 5 mS/㎝ 초과의 전도성을 유도할 수 있다. 본 발명의 특정 양태에서, 희석된 분해된 바이오매스는 효소 당화에 적용되고 수득한 현탁액은 생물반응기에 사용하기 위해 25배까지 농축된다. 농축된 당 스트림(들)에서 염 수준(전도성에 의해 측정된 바와 같이)은 허용가능하지 않게 높을 수 있다(1.5M까지의 Na+ 당량). 추가의 염은 또한 후속적인 효소 당화 공정을 위해 분해된 물질의 중화 즉시 생성된다. 본 발명은 이들 염을 제거하기 위한 방법을 제공하여 수득한 농축된 셀룰로스 당 스트림(들)은 리그노셀룰로스 오일을 생산하기 위한 종속영양 공정에 사용될 수 있도록 한다. 일부 경우에, 상기 염을 제거하는 방법은 예를 들어, 이에 제한되지 않지만 DOWEX Marathon MR3과 같은 수지를 사용한 탈이온화이다. 특정 양태에서, 수지 단계를 사용하는 탈이온화는 당화 전에, 당 농축 또는 pH 조정 전 및 바이오매스의 열수 처리 전 또는 이들의 임의의 조합 전에 수행한다; 다른 양태에서, 상기 단계는 이들 공정 중 하나 이상 후에 수행한다. 다른 양태에서, 분해 공정 자체는 허용가능하지 않게 고수준으로 염의 생성을 피하도록 변화시킨다. 예를 들어, 셀룰로스 바이오매스의 황산(또는 다른 산) 분해에 대한 적합한 대용법은 기계적 펄핑으로 셀룰로스 바이오매스가 효소적 가수분해(당화)에 민감해지도록 하는 것이다. 여전히 다른 양태에서, 고수준의 염에 내성인 미생물의 본래의 균주 또는 고수준의 염에 내성을 갖는 유전자 조작된 균주가 사용된다.
유성 미생물을 사용하는 종속영양 오일 생산에 사용하기 위한 분해된 셀룰로스 바이오매스를 제조하는 방법. 제1 단계는 재현탁된 분해된 셀룰로스 바이오매스를 5.0 내지 5.3의 범위로 pH를 조정하고 이어서 셀룰로스 바이오매스를 3회 세척함을 포함한다. 상기 세척 단계는 탈염 및 이온 교환 수지, 역삼투압, 열수 처리(상기 기재) 또는 단지 반복적인 재현탁 및 탈이온수중에서 원심분리의 사용을 포함하는 다양한 수단에 의해 달성될 수 있다. 상기 세척 단계는 전도성이 100-300 μS/cm인 셀룰로스 스트림을 유도하고 상당한 양의 푸르푸랄 및 하이드록시메틸 푸르푸랄을 제거시킨다. 상기 세척 단계로부터 이동은 헤미셀룰로스 분획물로부터 유리된 5탄당을 농축시키는 단계를 배제할 수 있다. 제2 단계는 세척된 셀룰로스 바이오매스의 효소적 당화를 포함한다. 바람직한 양태에서, 아셀레라제(Genencor)를 사용한다. 제3 단계는 상기 당화된 바이오매스의 원심분리 또는 이동시키기 및 세정을 통한 당의 회수를 포함한다. 수득한 바이오매스(고체)는 연료로서 사용될 수 있거나 폐기물로 보내질 수 있는 에너지 집적된 리그닌 풍부 성분이다. 원심분리/이동시키기 및 세정 공정에서 회수된 당 스트림을 수거한다. 제4 단계는 투과물의 회수와 함께 오염 고체를 제거하기 위한 마이크로여과를 포함한다. 제5 단계는 진공 증발기를 사용하여 달성될 수 있는 농축 단계를 포함한다. 상기 단계는 수득한 당 공급원료의 단백질 함량으로 인해 때때로 필요한 P'2000(Sigma/Fluka)과 같은 소포제의 첨가를 임의로 포함할 수 있다.
본 발명의 방법의 또 다른 양태에서, 탄소 공급원은 바이오디젤 에스터결합 전이반응으로부터 산성화되고 비-산성화된 글라이세롤 부산물을 포함하는 글라이세롤이다. 하나의 양태에서, 탄소 공급원은 글라이세롤 및 하나 이상의 다른 탄소 공급원을 포함한다. 일부 경우에, 글라이세롤 및 하나 이상의 다른 고정 탄소 공급원 모두는 발효 초기에 미생물에 제공된다. 일부 경우에, 글라이세롤 및 하나 이상의 다른 고정 탄소 공급원이 사전 결정된 비율로 동시에 미생물에 제공된다. 일부 경우에, 글라이세롤 및 하나 이상의 다른 고정 탄소 공급원은 발효 과정 동안에 소정의 속도로 미생물에 공급된다.
몇몇 미세조류는 글루코스의 존재에서보다 글라이세롤의 존재 하에서 보다 빠르게 세포 분열을 진행한다(국제특허출원 공개번호 제2008/151149호 참조). 이들 경우에, 처음에 세포에게 글라이세롤을 공급하여 세포 밀도를 신속하게 증가시킴에 이어서 글루코스를 공급하여 지질을 축적시키는 2단계 성장 공정은 지질이 생산되는 효율을 개선시킬 수 있다. 에스터결합 전이반응 공정의 글라이세롤 부산물의 사용은 생산 공정으로 도입되는 경우 상당한 경제적인 이점을 제공한다. 글라이세롤 및 글루코스의 혼합물과 같은 다른 공급 방법이 제공된다. 상기 혼합물의 공급은 또한 동일한 경제적 이득을 취득한다. 또한, 본 발명은 글라이세롤과 다양하게 배합된 수크로스와 같은 대안적인 당을 미생물에 공급하는 방법을 제공한다.
본 발명의 다른 실시형태에서, 탄소 공급원은 전화당이다. 전화당은 수크로스를 그것의 단당류 성분인 프럭토스 및 글루코스로 분할하는 것으로 생성된다. 전화당의 생성은 당업계에 공지된 몇몇 방법을 통해 달성될 수 있다. 하나의 이러한 방법은 수크로스 수용액을 가열하는 것이다. 종종, 촉매는 수크로스를 전화당으로 전환하는 것을 가속화하기 위하여 사용된다. 이들 촉매는 예를 들어 인버타제와 같은 생물학적 효소일 수 있고, 수크라제는 수크로스에 첨가되어 전화당을 생성하는 가수분해 반응을 가속화할 수 있다. 산은 비생물학적 촉매의 예이며, 가열과 짝지어질 때 가수분해 반응을 가속화할 수 있다. 일단 전화당이 만들어지면, 수크로스와 비교하여 결정화되는 경향이 더 적으며, 따라서 미세조류를 포함하는 미생물의 종속 영양 배양의 경우에, 농축된 탄소 공급원에 대한 필요가 있다. 한 실시형태에서, 탄소 공급원은 전화당으로서, 바람직하게는 농축된 형태이며, 배양 단계 전 바람직하게는 적어도 800g/리터, 적어도 900g/리터, 적어도 1000g/리터 또는 적어도 1100g/리터인데, 이는 선택적으로 유가배양물이다. 바람직하게는 농축된 형태인 전화당은 세포가 성장하고 지질을 축적함에 따라 시간에 걸쳐 세포에 공급된다.
본 발명의 방법의 또 다른 양태에서, 탄소 공급원은 수크로스이고 사탕무 가공으로부터의 진한 사탕무 액즙과 같이 수크로스를 함유하는 복합 공급원료를 포함한다. 종속 영양 오일 생성을 위한 배양물의 더 높은 밀도 때문에, 고정된 탄소 공급원(예를 들어, 수크로스, 글루코스 등)은 바람직하게는 농축된 형태이며, 배양 단계 전 바람직하게는 적어도 500g/리터, 적어도 600g/리터, 적어도 700g/리터 또는 적어도 800g/리터의 고정된 탄소 공급원인데, 이는 선택적으로 유가배양물이며, 이때 해당 물질은 세포가 성장하고 지질을 축적함에 따라 시간에 걸쳐 세포에 공급된다. 일부 경우에, 탄소 공급원은 배양 단계 전 사탕무 액즙의 형태, 바람직하게는 농축된 형태로, 바람직하게는 적어도 60% 고체 또는 약 770g/리터 당, 적어도 70% 고체 또는 약 925g/리터 당, 또는 적어도 80% 고체 또는 약 1125g/리터 당이며, 이는 선택적으로 유가배양물이다. 농축된 사탕무 액즙은 세포가 성장하고 지질을 축적함에 따라 시간에 걸쳐 세포에 공급된다.
하나의 양태에서, 배양 배지는 추가로 하나 이상의 수크로스 이용효소를 추가로 포함한다. 일부 경우에, 배양 배지는 수크로스 인버타제를 포함한다. 하나의 양태에서, 수크로스 인버타제 효소는 미생물 집단에 의해 발현되는 외인성 수크로스 인버타제 유전자에 의해 암호화된 분비가능한 수크로스 인버타제 효소이다. 따라서, 일부 경우에 하기 부문 IV에 더 상세하게 기재되는 바와 같이, 미세조류는 수크로스 수송체, 수크로스 인버타제, 헥소키나제, 글루코키나제 또는 프럭토키나제와 같은 수크로스 이용 효소를 발현하도록 유전적으로 유전자 조작하였다.
수크로스를 함유하는 복합 공급원료는 사탕무 가공 유래의 폐기 당밀을 포함한다: 사탕무 가공의 낮은 가치의 폐기물의 사용은 탄화수소 및 기타 오일의 제조에 상당한 비용 절감을 제공할 수 있다. 본 발명의 방법에 유용한 또 다른 복합 공급원료는 수수 시럽 및 순수한 수수를 포함하는 수수이다. 수수 시럽은 단맛의 사탕수수의 액즙로부터 생산된다. 이의 당 프로파일은 주로 글루코스(덱스트로스), 프럭토스 및 수크로스로 이루어진다.
4.
오일 생성
본 발명의 방법에 따른 오일 생성을 위해, 예를 들어, 빛이 배양물에 입사되지 않도록 하는 매우 대용량(40,000 리터 이상)의 발효기를 사용하는 경우에서와 같이 암실에서 세포를 배양하는 것이 바람직할 수 있다. 프로토테카 종은 고정 탄소 공급원을 함유하는 배지에서 빛의 부재 하에 오일 생성을 위해 성장시키고 번식시킨다; 상기 성장은 종속영양 성장으로서 공지되어 있다.
예로서, 지질-생성 유지성 미생물 세포, 바람직하게는 미세조류 세포의 접종물을 배지에 도입하고 세포가 번식을 시작하기 전에 지체(lag) 기간(지체 단계)이 있다. 지체 기간 후, 번식률은 일정하게 증가하고 로그 또는 대수증식기로 진입한다. 대수증식기에 이어서 질소와 같은 영양물의 감소 및 독성 물질의 증가 및 정족수 감지 메커니즘으로 번식이 느려진다. 상기와 같이 느려진 후, 번식은 멈추고 세포는 정체기 또는 일정한 성장 상태로 진입하고 이는 세포에 제공된 특정 환경에 의존한다. 지질 풍부 바이오매스를 수득하기 위해, 상기 배양물은 전형적으로 질소 또는 또 다른 주요 영양물(탄소 이외의 다른 영양물)이 고갈됨으로써 조기에 종결되어 세포가 과량으로 존재하는 탄소 공급원을 지질로 전환하도록 강요되는 대수증식기 말기 후에 수거한다. 배양 조건 파라미터는 총 오일 생산, 생산된 지질 종의 배합 및/또는 특정 오일의 생성을 최적화하도록 조작될 수 있다.
상기 논의한 바와 같이, 생물반응기 또는 발효기는 세포가 이들의 성장 주기의 다양한 단계를 진행하도록 사용된다. 하나의 예로서, 지질 생산 세포의 접종물은 배지에 도입될 수 있고 이어서 세포가 성장을 시작하기 전에 지체 기간(지체 기)이 도래한다. 상기 지체 기간 후, 성장 속도는 일정하게 증가하고 로그기 또는 대수증식기로 진입한다. 대수증식기에 이어서 영양물의 감소 및/또는 독성 물질의 증가로 인해 성장이 느려진다. 이런 느려지는 단계 후, 성장은 멈추고 당해 세포는 정체기 또는 일정 상태로 진입하고 이는 세포에 제공되는 특정 환경에 의존한다. 본 명세서에 기재된 세포에 의한 지질 생산은 영양물이 공급되거나 세포 분열의 부재 하에 계속적인 지질 생산을 허용하기에 여전히 가용한 정체기를 포함하는, 로그기 또는 이후 기간 동안에 일어날 수 있다.
바람직하게, 본 명세서에 기재되고 당업계에 공지된 조건을 사용하여 성장한 미생물은 적어도 약 20중량%의 지질, 바람직하게는 적어도 약 40중량%의 지질, 더 바람직하게는 적어도 약 50중량%의 지질 및 가장 바람직하게는 약 60중량% 지질을 포함한다. 가공 조건은 특정 용도를 위해 적합한 지질의 수율을 증가시키도록 및/또는 생산 비용을 절감시키도록 조정될 수 있다. 예를 들어, 특정 양태에서, 미세조류는 예를 들어, 질소, 인 또는 황과 같은 하나 이상의 영양물의 제한 농도의 존재 하에 배양하고 글루코스와 같은 과량의 고정 탄소 에너지를 제공한다. 질소 제한은 질소가 과량으로 공급된 배양물에서의 미생물 지질 수율 이상으로 미생물 지질 수율을 증가시키는 경향이 있다. 특정 양태에서, 지질 수율의 증가는 적어도 약 10%, 50%, 100%, 200%, 또는 500%이다. 상기 미생물은 전체 배양 기간중 일부 동안 또는 전체 기간 동안 제한된 양의 영양물의 존재 하에 배양할 수 있다. 특정 양태에서, 총 배양 기간 동안 2회 이상 영양물 농도는 제한 농도와 비제한 농도 사이에서 순환한다. 세포의 지질 함량은 과량의 탄소를 제공하지만 질소를 제한하거나 제공하지 않으면서 증가된 기간 동안 배양을 계속하여 증가시킬 수 있다.
또 다른 양태에서, 지질 수율은 지질 경로 효소(예를 들어, 지방산 합성 효소)를 위한 하나 이상의 조인자(들)의 존재 하에 지질 생산 미생물(예를 들어, 미세조류)를 배양함에 의해 증가된다. 일반적으로, 조인자(들)의 농도는 조인자(들)의 부재 하에 미생물 지질 수율 보다 미생물 지질(예를 들어, 지방산) 수율을 증가시키기에 충분하다. 특정 양태에서, 상기 조인자(들)는 배양물에 조인자(들)를 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세조류)을 포함시킴으로써 배양물에 제공된다. 또는, 조인자(들)는 조인자의 합성에 관여하는 단백질을 암호화하는 외인성 유전자를 함유하는 미생물(예를 들어, 미세조류)을 포함시킴으로써 배양물에 제공할 수 있다. 특정 양태에서, 적합한 조인자는 예를 들어, 바이오틴 또는 판토테네이트와 같은 지질 경로 효소에 의해 요구되는 임의의 비타민을 포함한다. 본 발명에 사용하기에 적합한 조인자를 암호화하거나 상기 조인자의 합성에 관여하는 유전자는 널리 공지되어 있고 상기된 것들과 같은 기법 및 전략을 사용하여 미생물(예를 들어, 미세조류)에 도입될 수 있다.
본 명세서에 기재된 생물반응기, 배양 조건 및 종속영양 성장 및 번식 방법의 특정 예는 임의의 적합한 방식으로 조합하여 미생물 성장 및 지질 및/또는 단백질 생산의 효율을 개선시킬 수 있다.
건조 중량으로 높은 %의 오일/지질 축적과 함께 미세조류 바이오매스는 당업계에 공지된 상이한 배양 방법을 사용하여 생산되었다(국제특허출원 공개번호 제2008/151149호 참조). 본 명세서에 기재되고 본 발명에 따라 유용한 배양 방법에 의해 생성된 미세조류 바이오매스는 건조 중량으로 적어도 10%의 미세조류 오일을 포함한다. 일부 경우에, 미생물 바이오매스는 건조 중량으로 적어도 25%, 적어도 50%, 적어도 55%, 또는 적어도 60%의 미세조류 오일을 포함한다. 일부 경우에, 미세조류 바이오매스는 건조 중량으로 10-90%의 미세조류 오일, 25-75%의 미세조류 오일, 40-75%의 미세조류 오일 또는 50-70%의 미세조류 오일을 함유한다.
본 명세서에 기재된 바이오매스의 미세조류 오일 또는 본 발명의 방법 및 조성물에 사용하기 위해 바이오매스로부터 추출된 오일은 하나 이상의 독특한 지방산 에스터 측쇄를 갖는 글라이세로지질을 포함할 수 있다. 글라이세로지질은 다양한 길이 및 다양한 정도의 포화를 가질 수 있는 1개, 2개 또는 3개의 지방산 분자에 에스터화된 글라이세롤 분자로 구성된다. 지방산 분자(및 미세조류 오일)의 길이 및 포화 특성은 하기 부문 IV에서 보다 상세하게 기재된 바와 같은 배양 조건을 통해 또는 지질 경로 가공을 통해 본 발명의 미세조류 오일 내에서 지방산 분자의 성질 또는 비율을 변형시키기 위해 유전자 조작될 수 있다. 따라서, 조류 오일의 특이적 블렌드는 2개 이상의 미세조류 종으로부터 바이오매스 또는 조류 오일을 함께 혼합함에 의해 또는 대두, 평지씨, 카놀라, 팜, 팜커넬, 코코넛, 옥수수, 폐기 식물, 차이니즈 탈로우, 올리브, 해바라기, 면화씨, 치킨 지방, 소 탈로우, 돼지 탈로우, 미세조류, 거대조류, 미생물, 쿠페아, 아마, 피넛, 쵸이스 백색 그리스, 라드, 카멜리나 사티바, 머스타드 씨, 캐슈 너트, 귀리, 루핀, 케나프, 금잔화, 헴프, 커피, 아마인(아마), 헤이즐넛, 유포비아, 호박씨, 코리안더, 카멜리아, 참깨, 홍화, 쌀, 유동, 코코아, 코프라, 양귀비, 아주까리, 피칸, 호호바, 마카다미아, 브라질 너트, 아보카도, 석유 또는 상기 오일 중 임의의 증류 분획물과 같은 다른 공급원 유래의 오일과 본 발명의 조류 오일을 배합함으로써 조류의 단일 종 내에서 생성할 수 있다.
오일 조성물, 즉, 글라이세로지질의 지방산 성분의 성질 및 비율은 또한 2개 이상의 독특한 종의 미세조류 유래의 바이오매스 또는 오일을 배함하여 조작할 수 있다. 일부 경우에, 독특한 종의 미세조류 중 2개 이상은 상이한 글라이세로지질 프로파일을 가진다. 미세조류의 독특한 종은 바람직하게 종속영양 조건하에 본 명세서에 기재된 바와 같이 함께 배양하거나 별도로 배양하여 각각의 오일을 생성할 수 있다. 상이한 종의 미세조류는 세포의 글라이세로지질 내 상이한 백분율의 독특한 지방산 성분을 함유할 수 있다.
일반적으로, 프로토테카 균주는 쇄 길이가 C8-C14인 지방산을 거의 갖지 않는다. 예를 들어, 프로토테타 모리포미스(UTEX 1435), 프로토테카 크루가니(Prototheca krugani)(UTEX 329), 프로토테카 스타그노라(UTEX 1442) 및 프로토테카 좁피(UTEX 1438)는 C8 지방산을 함유하지 않고(검출가능하지 않은 양) C10 지방산이 0 내지 0.01%이고 C12 지방산은 0.03 내지 2.1%이고 C14 지방산은 1.0 내지 1.7%이다.
일부 경우에, 쇄 길이가 C8 또는 C8-10의 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 1.5%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 12%, 또는 적어도 15% 또는 그 이상의 쇄 길이 C8인 지방산을 가진다. 다른 예에서, 쇄 길이 C10의 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 24%, 또는 적어도 25% 또는 그 이상의 쇄 길이 C10인 지방산을 가진다. 다른 경우에, 쇄 길이가 C12인 지방 아실-ACP 기질에 대해 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 34%, 적어도 35% 또는 적어도 40% 또는 그 이상의 쇄 길이 C12인 지방산을 가진다. 다른 경우에, 쇄 길이가 C14인 지방 아실-ACP 기질에 대한 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 6%, 적어도 7%, 적어도 10%, 적어도 15%, 적어도 30%, 적어도 43%, 또는 적어도 45% 또는 그 이상의 쇄 길이가 C14인 지방산을 가진다.
비제한적인 예에서, 쇄 길이 C8의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-25%, 또는 1%-15%, 바람직하게는 1.8-12.29%의 쇄 길이 C8의 지방산을 가진다. 다른 비제한적 예에서, 쇄 길이 C10의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-50%, 또는 1%-25%, 바람직하게는 1.91-23.97%의 쇄 길이 C10의 지방산을 가진다. 다른 비제한적 예에서, 쇄 길이 C12의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 5%-50%, 또는 10%-40, 바람직하게는 13.55-34.01%의 쇄 길이 C12의 지방산을 가진다. 다른 비제한적 예에서, 쇄 길이 C14의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-60%, 또는 2%-45%, 바람직하게는 2.59-43.27 %, 쇄 길이 C14의 지방산을 가진다. 다른 비제한적 예에서, 다양한 쇄 길이의 지방 아실-ACP 기질에 대해 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 30%까지, 35%까지, 또는 바람직하게는 39.45%까지의 쇄 길이 C16의 지방산을 가진다. 일부 경우에, C8 내지 C14쇄 길이의 지방 아실-ACP 기질에 대해 활성을 가지는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 1%-75%, 또는 2%-60%, 바람직하게는 2.69-57.98%의 중간 쇄(C8-C14) 지방산을 가진다. 일부 경우에, C12 내지 C14쇄 길이의 지방 아실-ACP 기질에 대해 활성을 가지는 지방 아실-ACP 티오에스터라제를 암호화하는 이식유전자를 함유하는 프로토테카 균주는 적어도 30%, 적어도 40%, 또는 적어도 49% C12-C14 지방산을 가진다. 일부 예에서, 외인성 유전자를 보유하기 위하여 일정하고 높은 선택적 압력하에 유전자이식 프로토테카 균주를 유지하는 것은 특정 쇄 길이의 원하는 지방산의 증가 때문에 유리하다. 높은 수준의 외인성 유전자 보유는 또한 본 명세서에 개시된 상동성 재조합 벡터 및 방법을 사용하여 세포의 핵 염색체 내로 외인성 유전자를 삽입함으로써 달성될 수 있다. 핵 염색체 내로 통합된 외인성 유전자를 함유하는 재조합 세포가 본 발명의 목적이다.
미세조류 오일은 또한 미세조류에 의해 생성되고, 또는 배양 배지로부터 유래된 미세조류 오일에 포함된 다른 구성성분을 포함할 수 있다. 이들 구성성분은 미세조류, 미세조류의 종을 배양하기 위하여 사용된 배양 조건, 미세조류 오일 조성에 영향을 미칠 수 있는 바이오매스 또는 다른 인자로부터 미세조류 오일을 회수하는데 사용되는 추출방법에 따라서 다양한 양으로 제시될 수 있다. 이러한 구성성분의 비제한적 예는 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.05 내지 0.244 미생물 유기체/그램의 오일로 존재하는 카로테노이드; 0.01-0.5mcg/g, 0.025-0.3mcg/g, 바람직하게는 0.045 내지 0.268 미생물 유기체/그램의 오일로 존재하는 엽록소 A; 0.1 mcg/g 미만, 0.05 mcg/g 미만, 바람직하게는 0.025 미만 미생물 유기체/그램의 오일의 전체 엽록소; 1-300mcg/g, 35-175mcg/g, 바람직하게는 38.3-164 미생물 유기체/그램의 오일로 존재하는 감마 토코페롤; 10-500mcg/g, 50-300mcg/g, 바람직하게는 60.8 내지 261.7 마이크로그램/그램의 오일로 존재하는 전체 토코페롤; 1% 미만, 0.5% 미만, 바람직하게는 0.25% 미만의 브라시카스테롤, 캄페스테롤, 스티그마스테롤 또는 베타시토스테롤; 400 mcg/g 미만, 바람직하게는 300 미생물 유기체/그램 미만의 오일인 전체 토코트라이엔올; 또는 100-500mcg/g, 225-350mcg/g, 바람직하게는 249.6 내지 325.3 미생물 유기체/그램의 오일로 제공되는 전체 토코트라이엔올을 포함한다.
다른 구성성분은, 제한 없이, 인지질, 토코페롤, 토코트라이에놀, 카로테노이드(예를 들어, 알파-카로틴, 베타-카로틴, 라이코펜 등), 크산토필(예를 들어, 루테인, 제악산틴, 알파-크립토산틴 및 베타-크립토산틴), 및 다양한 유기 또는 무기 화합물을 함유할 수 있다. 일부 경우에, 프로토테카 종으로부터 추출된 오일은 0.001-0.01mcg/g, 0.0025-0.05mcg/g, 바람직하게는 0.003 내지 0.039 마이크로그램 루테인/그램의 오일, 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 마이크로그램 미만 라이코펜/그램의 오일; 및 0.01 mcg/g 미만, 0.005 mcg/g 미만, 바람직하게는 0.003 마이크로그램 미만 베타 카로텐/그램의 오일을 포함한다.
일부 실시형태에서, 본 발명은 트라이글라이세라이드 오일을 포함하는 유지성 미생물 세포를 제공하되, 해당 트라이글라이세라이드 오일의 지방산은 적어도 약 1%, 적어도 약 2%, 적어도 약 5%, 적어도 약 7%, 적어도 약 10%, 또는 적어도 약 15%, C8:0에서; 적어도 약 1%, 적어도 약 5%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 또는 적어도 약 30%에서, C10:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 또는 적어도 약 80%에서, C12:0; 적어도 약 2%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C14:0; 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C16:0; 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C18:0; 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C18:1; 약 7% 미만, 약 5% 미만, 약 3% 미만, 약 1% 미만, 또는 약 0%에서, C18:2; 및 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, 포화된 지방산으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 유지성 미생물 세포는 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C8:0 및 C10:0의 전체 조합량; 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C10:0, C12:0, 및 C14:0의 전체 조합량; 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C16:0, C18:0 및 C18:1의 전체 조합량; 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C18:0, C18:1 및 C18:2의 전체 조합량; 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에서의 C14:0, C16:0, C18:0 및 C18:1의 전체 조합량; 및 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 또는 약 0%의 C18:1 및 C18:2의 전체 조합량으로 이루어진 군으로부터 선택된 지방산 프로파일을 포함하는 트라이글라이세라이드 오일을 포함한다.
일부 실시형태에서, 유지성 미생물 세포는 적어도 약 5 대 1, 적어도 6 대 1, 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C8:0 대 C10:0 비; 적어도 약 6 대 1, 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C10:0 대 C12:0 비; 적어도 약 5 대 1, 적어도 6 대 1, 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C12:0 대 C14:0 비; 적어도 7 대 1, 적어도 8 대 1, 적어도 9 대 1, 또는 적어도 10 대 1에서의 C14:0 대 C12:0 비; 및 적어도 1 대 2, 적어도 1 대 3, 적어도 1 대 4, 적어도 1 대 5, 적어도 1 대 6, 적어도 1 대 7, 적어도 1 대 8, 적어도 1 대 9, 또는 적어도 1 대 10의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 지방산 비를 포함하는 지방산 프로파일을 가지는 트라이글라이세라이드 오일을 포함한다.
일부 실시형태에서, 본 발명은 유지성 미생물 트라이글라이세라이드 오일 조성물을 제공하되, 해당 트라이글라이세라이드 오일의 지방산 프로파일은 적어도 약 1%, 적어도 약 2%, 적어도 약 5%, 적어도 약 7%, 적어도 약 10%, 또는 적어도 약 15%에서, C8:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 또는 적어도 약 30%에서 C10:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 또는 적어도 약 80%에서, C12:0; 적어도 약 2%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C14:0; 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C16:0; 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C18:0; 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C18:1; 약 7% 미만, 약 5% 미만, 약 3% 미만, 약 1% 미만, 또는 약 0%에서, C18:2; 및 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서 포화된 지방산으로 이루어진 군으로부터 선택된다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물은 지방산 프로파일을 포함하는 트라이글라이세라이드 오일을 포함하며, 이때 C10:0, C12:0 및 C14:0의 전체 조합량은 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있으며; C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C18:0, C18:1 및 C18:2의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있으며; C14:0, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C8:0 및 C10:0의 전체 조합량은 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 또는 약 0%이다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물은 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C8:0 대 C10:0 비; 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C10:0 대 C12:0 비; 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C12:0 대 C14:0 비; 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C14:0 대 C12:0 비; 적어도 약 1 내지 2, 적어도 약 1 대 3, 적어도 약 1 대 4, 적어도 약 1 대 5, 적어도 약 1 대 6, 적어도 약 1 대 7, 적어도 약 1 대 8, 적어도 약 1 대 9, 또는 적어도 약 1 대 10의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 지방산의 비를 포함하는 지방산 프로파일을 가지는 트라이글라이세라이드 오일을 포함한다.
일부 실시형태에서, 본 발명은 적어도 약 1%, 적어도 약 2%, 적어도 약 5%, 적어도 약 7%, 적어도 약 10%, 또는 적어도 약 15%에서, C8:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 또는 적어도 약 30%에서, C10:0; 적어도 약 1%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 또는 적어도 약 80%에서, C12:0; 적어도 약 2%, 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서, C14:0; 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C16:0; 적어도 약 5%, 적어도 약 10%, 적어도 약 15%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 또는 적어도 약 50%에서 C18:0; 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%에서, C18:1; 약 7% 미만, 약 5% 미만, 약 3% 미만, 약 1% 미만, 또는 약 0%, C18:2; 및 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 또는 적어도 약 90%, 포화된 지방산으로 이루어진 군으로부터 선택된 지방산을 가지는 유지성 미생물 트라이글라이세라이드 오일 조성물의 생산 방법을 제공하되, 해당 방법은 (a) 유지성 미생물 세포의 건조 세포 중량의 적어도 10%가 트라이글라이세라이드 오일이 될 때까지 배양 배지 내 유지성 미생물 세포의 집단을 배양하는 단계; 및 (b) 유지성 미생물 세포로부터 유래된 트라이글라이세라이드 오일을 분리하는 단계를 포함한다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물의 제조방법은 지방산 프로파일을 포함하는 트라이글라이세라이드 오일을 수득하며, 이때: C10:0, C12:0 및 C14:0의 전체 조합량은 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C18:0, C18:1 및 C18:2의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있으며; C14:0, C16:0, C18:0 및 C18:1의 전체 조합량은 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 또는 약 100%에 있고; C8:0 및 C10:0의 전체 조합량은 약 50% 미만, 약 45% 미만, 약 40% 미만, 약 35% 미만, 약 30% 미만, 약 25% 미만, 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 또는 약 0%이다.
일부 실시형태에서, 유지성 미생물 트라이글라이세라이드 오일 조성물의 제조방법은 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C8:0 대 C10:0 비; 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C10:0 대 C12:0 비; 적어도 약 5 대 1, 적어도 약 6 대 1, 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C12:0 대 C14:0 비; 적어도 약 7 대 1, 적어도 약 8 대 1, 적어도 약 9 대 1, 또는 적어도 약 10 대 1에서의 C14:0 대 C12:0 비; 및 적어도 약 1 대 2, 적어도 약 1 대 3, 적어도 약 1 대 4, 적어도 약 1 대 5, 적어도 약 1 대 6, 적어도 약 1 대 7, 적어도 약 1 대 8, 적어도 약 1 대 9, 또는 적어도 약 1 대 10에서의 C14:0 대 C16:0 비로 이루어진 군으로부터 선택된 트라이글라이세라이드 오일의 비를 포함하는 지방산 프로파일을 가지는 트라이글라이세라이드 오일을 수득한다.
III. 유전자 조작 방법 및 재료
본 발명은 프로토테카 세포를 유전자 변형시키기 위한 방법 및 재료 및 본 발명의 방법에 유용한 재조합 숙주 세포를 제공하고, 당해 숙주 세포는 재조합 프로토테카 모리포미스, 프로토테카 좁피, 프로토테카 크루가니 및 프로토테카 스타그노라 숙주 세포를 포함하지만 이에 제한되지 않는다. 이들 방법 및 재료의 기재는 독자의 편의를 위해 하위부문으로 나눈다. 하위부문 1에서, 형질전환 방법이 기재된다. 하위부문 2에서 상동성 재조합을 사용한 유전적 유전자 조작 방법이 기재된다. 하위부문 3에서 발현 벡터 및 성분이 기재된다.
본 발명의 특정 실시형태에서, 지질 생성을 향상시키고, 미생물 유기체에 의해 만들어진 성분의 특성 또는 비율을 변형시키거나, 또는 다양한 공급원료 재료 상의 데노보(de novo) 성장 특징을 개선하거나 제공하기 위해 미생물 유기체를 유전자적으로 변형시키는 것이 바람직하다. 다른 클로렐라 종뿐만 아니라 다른 다양한 미생물 유기체가 사용될 수 있지만, 클로렐라 프로토테코이데스, 클로렐라 미누티시마, 클로렐라 소로키니아나, 클로렐라 엘립소이데아, 클로렐라 속, 및 클로렐라 에머소니는 본 명세서에 기재된 유전적 유전자조작 방법에서 사용을 위해 선호되는 미생물 유기체이다.
프로모터, cDNA, 및 3'UTR뿐만 아니라 다른 벡터 구성요소는 천연 공급원으로부터 분리된 단편을 사용하는 클로닝 기법을 통해 만들어질 수 있다(예를 들어 문헌[Molecular Cloning: A Laboratory Manual, Sambrook et al. 3d edition, 2001, Cold Spring Harbor Press]; 및 미국특허 제4,683,202호 참조). 대안으로, 구성요소는 공지된 방법을 사용하여 합성적으로 만들어질 수 있다(예를 들어 문헌[Gene. 1995 Oct 16;164(1):49-53] 참조).
1.
유전자 조작 방법 - 형질전환
예를 들어 유전자주입, 전기천공(문헌[Maruyama et al. (2004), Biotechnology Techniques 8:821-826] 참조), 유리 비드 형질전환 및 탄화규소 휘스커 형질전환을 포함하는 임의의 적합한 기술에 의해 세포를 형질전환할 수 있다. 사용될 수 있는 또 다른 방법은 원형질 세포를 형성하고 CaCl2 및 폴리에틸렌 글라이콜(polyethylene glycol, PEG)을 사용하여 재조합 DNA를 미세조류 세포에 도입하는 것이다(문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73]을 참조하며, 이 문헌은 클로렐라 엘리프소이데아의 형질전환을 위해 상기 방법의 사용을 보고한다). 미세조류의 동시 형질전환을 사용하여 2개의 독특한 벡터 분자를 세포에 동시에 도입할 수 있다(예를 들어 문헌[Protist 2004 Dec;155(4):381-93] 참조).
또한 유전자 주입 방법(예를 들어, 문헌[Sanford, Trends In Biotech. (1988) 6:299 302], 미국특허 제4,945,050호 참조); 전기천공(문헌[Fromm et al., Proc. Nat'l. Acad. Sci. (USA)(1985) 82:5824 5828] 참조); 레이져 빔, 미세주입 또는 DNA를 미세조류로 도입할 수 있는 임의의 다른 방법의 사용으로 프로토테카 세포를 형질전환시킬 수 있다.
클로렐라와 같은 미생물 유기체 내로 이식유전자를 도입하는 임의의 편리한 기법은 본 발명에서 사용될 수 있다. 문헌[Dawson et al. (1997)(상기 참조)]은 NR-결핍 클로렐라 소로키니아나 돌연변이체 내에 클로렐라 불가리스로부터 유래된 나이트레이트 환원효소(nitrate reductase, NR) 유전자를 도입하여, 안정 형질전환체를 초래하는 입자총 방법(micro-projectile bombardment)의 사용을 기재한다. 간략하게, 0.4 마이크론 텅스텐 비드를 플라스미드로 코팅하였고; 3 X 107개의 클로렐라 소로키니아나 세포를 비선택적 한천 플레이트의 삼등분의 중앙에서 도말하였고, PDS-1000/He Biolistic Particle Delivery(등록상표) 시스템(Bio-Rad)으로 충격을 주었다.
클로렐라와 같은 미생물 유기체 내에 이식유전자를 도입하는 바람직한 방법은 문헌[Kim et al. (2002), Mar. Biotechnol . 4:63-73]에 의해 기재된 방법이다. K김(Kim)은 CaCl2 및 폴리에틸렌 글라이콜(PEG)을 사용하여 클로렐라 엘립소이데아 원형질체의 형질전환을 보고한다. 특히, 원형질체는 1-2 X 108/㎖의 밀도에서 클로렐라 엘립소이데아 세포를 성장시킴으로써 제조하였다. 세포를 회수하였고, 1600 g에서 5분 동안 원심분리로 세척하였으며, 0.6 M 소르비톨, 0.6 M 만니톨, 4%(중량/부피) 셀룰로스(Calbiochem), 2%(중량/부피) 마세라제(Calbiochem), 및 50 유닛 펙티나제(Sigma)를 함유하는 5 Ml의 인산염 완충제(Ph 6.0) 중에서 재현탁하였다. 세포 현탁액을 암실에서 25℃로 16시간 동안 부드럽게 진탕하면서 인큐베이션하였다. 결과물 원형질체를 400 g에서 원심분리로 5분 동안 회수하였다. 펠렛을 0.6 M 소르비톨 및 0.6 M 만니톨을 함유하는 5 Ml의 f/2 배지 내에서 부드럽게 재현탁하였고, 400 g에서 5분 동안 원심분리하였다. 이 펠렛을 50 mMCaCl2를 함유하는 1 Ml의 0.6M 소르비톨/만니톨 용액 내에서 재현탁하였다. 그 다음에 5㎎의 이식유전자 DNA를 25㎍ 송아지 흉선 DNA(Sigma)와 함께 0.4 Ml 내 107-108 원형질체에 첨가하였다. 실온에서 15분 후, 200㎕의 PNC(40% 폴리에틸렌 글라이콜 4000, 0.8 M NaCl, 50 mm CaCl2)를 첨가하였고, 실온에서 30분 동안 부드럽게 혼합하였다. 이후에, 0.6 M 소르비톨/만니톨 용액, 1% 효모 추출물 및 1% 글루코스로 보충한 0.6 Ml의 f/2 배지를 첨가하였고, 형질전환된 세포를 암실에서 25℃로 12시간 동안 세포벽 재생을 위해 인큐베이션하였다. 클로렐라 속 DT 내에 수은 환원효소를 도입하기 위하여 유사한 방법을 문헌[Huang et al. (2007)(상기 참조)]에서 사용하였다.
클로렐라와 같은 미생물을 형질전환하기 위하여 전기천공을 사용하였다. 문헌[Maruyama et al. (2004), Biotechnology Techniques 8:821-826(본 명세서에 그것의 전문이 참조로 포함됨)]에서 보고되는 바와 같이, 이 기법은 고정상 내 세포로부터 제조된 클로렐라 사카로필라 c-211-1a의 원형질체 내로 이식유전자를 도입하기 위하여 사용되었다. 도입된 플라스미드의 일시적 발현을 600 내지 900 V/㎝의 전계 강도(field strength), 및 약 400 ms의 펄스 지속시간 하에 관찰하였으며, 여기서 70-kDa FITC-덱스트란에 대해 높은 막 침투성이 확인되었다.
클로렐라와 같은 미생물 내 이식유전자 발현의 예를 문헌에서 발견할 수 있다(예를 들어 [Current Microbiology Vol. 35 (1997), pp. 356-362; Sheng Wu Gong Cheng Xue Bao. 2000 Jul;16(4):443-6; Current Microbiology Vol. 38 (1999), pp. 335-341; Appl Microbiol Biotechnol (2006) 72: 197-205; Marine Biotechnology 4, 63-73, 2002; Current Genetics 39:5, 365-370 (2001); Plant Cell Reports 18:9, 778-780, (1999); Biologia Plantarium 42(2): 209-216, (1999); Plant Pathol. J 21(1): 13-20, (2005)] 참조). 또한 본 명세서의 실시예를 참조한다.
유지성 효모(예를 들어, 야로이야 리폴리티카) 내 이식유전자 발현의 예를 문헌에서 발견할 수 있다(예를 들어, 문헌[Bordes et al., J Microbiol Methods, Jun 27 (2007)] 참조). 진균(예를 들어, 모르티에렐라 알핀, 무코르 시르시넬로이데스, acl 아스페르길루스 오크라세우스) 내 이식유전자 발현의 예는 문헌에서 발견할 수 있다(예를 들어 문헌[Microbiology, Jul; 153(Pt. 7):2013-25 (2007); Mol Genet Genomics, Jun; 271(5):595-602 (2004); Curr Genet, Mar;21(3):215-23 (1992); Current Microbiology, 30(2):83-86 (1995); Sakuradani, NISR Research Grant, "Studies of Metabolic Engineering of Useful Lipid-producing Microorganisms" (2004); 및 PCT/JP2004/012021] 참조). 대장균과 같은 박테리아 내 외인성 유전자 발현의 예는 잘 공지되어 있으며; 예를 들어 문헌[Molecular Cloning: A Laboratory Manual, Sambrook et al.(3d edition, 2001, Cold Spring Harbor Press]을 참조한다.
본 발명에 따르는 미생물 유기체의 형질전환을 위한 벡터는 당업자에게 친숙한 공지된 기법으로 제조될 수 있다. 다양한 클로렐라 종의 형질전환을 위해 사용단 구성체의 뉴클레오타이드 서열은 서열번호 8에 대응한다. 한 실시형태에서, 미세조류와 같은 미생물 유기체 내 리파제 유전자의 발현을 위한 예시적인 벡터 설계는 미세조류 내 프로모터 활성을 갖는 작동가능한 연결에서 리파제를 암호화하는 유전자를 함유한다. 대안으로 벡터가 관심의 유전자를 갖는 작동가능한 연결에서 프로모터를 함유하지 않는다면, 유전자는 벡터 통합 지점에서 내인성 프로모터에 작동가능하게 연결되도록 세포로 형질전환될 수 있다. 프로모터가 없는 형질전환 방법은 미세조류 내에서 작동하는 경향이 있다(예를 들어, 문헌[Plant Journal 14:4, (1998), pp.441-447] 참조). 해당 벡터는 또한 예를 들어 항생제 또는 제초제에 내성을 부여하는 단백질, 즉 선택가능한 마커를 암호화하는 제2 유전자를 함유할 수 있다. 선택적으로, 하나 또는 둘 다의 유전자(들)는 그 뒤에 폴리아데닐화 신호를 함유하는 3' 미번역 서열이 있다. 두 유전자를 암호화하는 발현 카세트는 벡터 내 또는 별개의 벡터 상에 물리적으로 연결될 수 있다. 미세조류의 공동 형질전환이 또한 사용될 수 있으며, 이때 별개의 벡터 분자는 동시에 사용되어 세포를 형질전환한다(예를 들어 문헌[Protist 2004 Dec;155(4):381-93] 참조). 형질전환된 세포는 내성 카세트가 없는 세포가 성장하지 않는 조건 하에서 항생제 또는 다른 선택가능한 마커의 존재에서 성장하는 능력을 기반으로 선택적으로 선택될 수 있다.
2.
유전자 조작 방법 - 상동성 재조합
상동성 재조합은 상동성 영역을 정렬하고 교환하는 상보적 DNA 서열의 능력이다. 표적화된 게놈 서열("주형")과 상동성인 서열을 함유하는 유전자전이 DNA ("공여체")를 유기체에 도입함에 이어서 대응하는 게놈 상동성 서열 부위에서 게놈으로 재조합을 진행한다. 많은 경우에 상기 공정의 기계론적 단위는 다음을 포함한다: (1) 상동성 DNA 절편의 쌍형성; (2) 이중가닥 브레이크의 공여체 DNA 분자로의 도입; (3) 유리된 공여체 DNA 말단에 의한 주형 DNA 분자의 공격에 이어서 DNA의 합성; 및 (4) 이중가닥 파손 복구 반응으로 최종 재조합 생성물 생성.
숙주 유기체에서 상동성 재조합을 수행하기 위한 능력은 분자 유전학적 수준에서 수행될 수 있는 것에 대한 많은 실제 연관성을 갖고 맞춤 오일을 생성할 수 있는 유성 미생물의 생성에 유용한 많은 실제 연관성을 갖는다. 이의 본래의 상동성 재조합은 정확한 유전자 표적화 반응이고 따라서 동일한 표적화 서열로 생성된 대부분의 유전자 전이 계열은 근본적으로 표현형과 관련해서 동일하고 극소수의 형질전환 반응의 스크리닝을 필요로 한다. 상동성 재조합은 또한 숙주 염색체로의 유전자 삽입 반응을 표적화하여 유전자 선택 부재 하에서도 우수한 유전학적 안정성을 수득한다. 상이한 염색체 유전자 좌위는 심지어 이종성 프로모터/UTR로부터 유전자 발현에 영향을 줄 가능성이 있기 때문에 상동성 재조합은 유사하지 않은 게놈 환경내에서 유전자 좌위를 탐색하고 유전자 발현에 대한 이들 환경의 영향을 평가하는 방법일 수 있다.
상동성 재조합을 사용하는 특히 유용한 유전자 조작 응용은 고도로 특이적인 방식으로 이종성 유전자 발현을 구동시키는 프로모터/UTR과 같은 특이적 숙주 조절 요소를 끌어들이는 것이다. 예를 들어, 선택적 마커를 암호화하는 이종성 유전자를 갖는 불포화효소 유전자들/유전자 패밀리의 절제 또는 녹아웃은 숙주 세포에서 생성된 포화된 지방산의 전체 백분율을 증가시키는 것으로 기대될 수 있다. 실시예 11은 프로토테카 모리포르미스에서 생성된 이러한 불포화효소 유전자 절제 또는 녹아웃의 상동성 재조합 표적 구성체 및 작업예를 기재한다.
상동성 재조합은 정확한 유전자 표적화 반응이기 때문에, 충분한 옆에 있는 영역이 확인된다면, 원하는 유전자 또는 영역내 임의의 뉴클레오타이드(들)를 정확히 변형시키는데 사용될 수 있다. 따라서, 상동성 재조합은 RNA 및/또는 단백질의 유전자 발현에 영향을 주는 조절 서열을 변형시키기 위한 수단으로서 사용될 수 있다. 이것은 또한 기질 특이성, 친화성 및 Km과 같은 효소 활성을 변형시킴에 따라서 숙주 세포 대사의 목적하는 변화에 영향을 주고자 단백질 암호화 영역을 변형시키는데 사용될 수 있다. 상동성 재조합은 유전자 표적화, 유전자 전환, 유전자 결실, 유전자 복제, 유전자 역위를 유도하고 프로모터, 인핸서 및 3'UTR과 같은 유전자 발현 조절요소를 교환하여 고스트(gost) 게놈을 조작하기 위한 강력한 수단을 제공한다.
상동성 재조합은 내인성 숙주 세포 게놈내에 목적하는 유전자 또는 영역을 "표적화"하기 위한 내인성 서열 조각을 함유하는 표적화 구성체을 사용하여 달성될 수 있다. 이러한 표적화 서열은 관심의 유전자 또는 영역의 5'에 위치하거나, 관심의 유전자/영역의 3'에 위치하거나, 심지어 관심의 유전자/영역 옆에도 위치할 수 있다. 상기 표적화 구성체은 추가의 벡터 골격과 함께 슈퍼코일된 플라스미드 DNA로서, 벡터 골격을 갖지 않는 PCR 생성물로서 또는 선형화된 분자로서 숙주 세포를 형질전환시킬 수 있다. 일부 경우에, 이것은 제한 효소에 유전자 전이 DNA(공여체 DNA) 내의 상동성 서열을 우선 노출시키는 것이 유리할 수 있다. 상기 단계는 재조합 효율을 증가시킬 수 있고 목적하지 않은 반응의 발생을 감소시킬 수 있다. 재조합 효율을 증가시키는 다른 방법은 PCR을 사용하여 표적화된 게놈 서열에 상동성인 선형 말단을 함유하는 형질전환 유전자전이 DNA를 생성하는 것을 포함한다.
비제한적 예시의 목적을 위해, 상동성 재조합에 유용한 공여체 DNA 서열의 영역은 프로토테카 모리포미스 내 DNA의 KE858 영역을 포함한다. KE858은 1.3 kb이며, 단백질의 전달 RNA(tRNA) 패밀리와 상동성을 공유하는 단백질을 위한 암호화 영역의 부분을 포함하는 게놈 단편이다. 사우던 블롯은 KE858 서열이 프로토테카 모리포미스(UTEX 1435) 게놈 내 단일 복제물로 존재한다는 것을 나타내었다. 이 영역 및 상동성 재조합 표적화를 위해 이 영역을 사용하는 예는 국제특허출원 PCT/US2009/66142호에 기재되어 있다. 유용한 공여체 DNA의 다른 영역은 6S rRNA 게놈 서열의 일부이다. 프로토테카 모리포미스 내 상동성 재조합 내 이 서열의 사용은 이하의 실시예에서 기재한다.
3.
벡터 및 벡터 성분
본 발명에 따르는 미생물 유기체의 형질전환을 위한 벡터는 본 명세서에 기재된 바를 토대로 당업자에게 유사한 공지된 기술에 의해 제조할 수 있다. 벡터는 전형적으로 하나 이상의 유전자를 함유하고 여기서 각각의 유전자는 목적하는 생성물(유전자 생성물)의 발현을 암호화하고 유전자 발현을 조절하거나 유전자 생성물을 재조합 세포 내 특정 위치에 표적화하는 하나 이상의 제어 서열에 작동가능하게 연결되어 있다. 독자를 도와주기 위해 본 하위부문은 여러 하위부문으로 나누어진다. 하위부문 A는 본 발명에 의해 제공된 신규 제어 서열뿐만 아니라 전형적으로 벡터상에 함유된 제어 서열을 기재한다. 하위부문 B는 신규 최적화 방법 및 본 발명에 의해 제공된 것들을 사용하여 제조된 유전자뿐만 아니라 벡터 내에 전형적으로 함유된 유전자를 기재한다.
A. 제어 서열
제어 서열은 암호화 서열의 발현을 조절하거나 유전자 생성물을 세포 내부 또는 외부의 특정 위치로 지시하는 핵산이다. 발현을 조절하는 제어 서열은 예를 들어, 암호화 서열의 전사를 조절하는 프로모터 및 암호화 서열의 전사를 종결시키는 종결자를 포함한다. 또 다른 제어 서열은 폴리아데닐화 신호를 암호화하는 암호화 서열의 말단에 위치한 3' 비해독 서열이다. 유전자 생성물을 특정 위치로 지시하는 제어 서열은 단백질이 세포 내부 또는 외부의 특정 위치에 부착되는 위치로 지시하는 신호 펩타이드를 암호화하는 것들을 포함한다.
따라서, 미세조류내 외인성 유전자의 발현을 위한 예시적인 벡터 설계는 미세조류내에서 활성인 프로모터에 작동적으로 연결된 목적하는 유전자 생성물(예를 들어, 선택가능한 마커, 지질 경로 변형 효소 또는 수크로스 이용 효소)에 대한 암호화 서열을 함유한다. 또한, 벡터가 목적하는 암호화 서열과 작동가능하게 연결된 프로모터를 함유하지 않는 경우, 상기 암호화 서열은 이것이 벡터 통합 부위에서 내인성 프로모터와 작동가능하게 연결되도록 세포를 형질전환시킬 수 있다. 형질전환의 프로모터 부재 방법은 미세조류에서 작동하는 것으로 입증되었다(예를 들어[문헌 Plant Journal 14:4, (1998), pp.441-447] 참조).
많은 프로모터는 미세조류 내에서 활성이고 형질전환된 조류에 내인성이 아닌 프로모터(즉, 다른 조류 유래의 프로모터, 고등 식물 유래의 프로모터 및 식물 바이러스 또는 조류 바이러스 유래의 프로모터)뿐만 아니라 형질전환된 조류에 내인성인 프로모터를 포함한다. 미세조류내에서 활성인 예시적인 외인성 및/또는 내인성 프로모터(또한 미세조류에서 기능하는 항생제 내성 유전자)는 국제특허출원 공개 번호 제2008/151149호 및 본 명세서에 인용된 문헌에 기재되어 있다.
외인성 유전자를 발현시키기 위해 사용되는 프로모터는 천연적으로 상기 유전자 또는 이종성 유전자에 연결된 프로모터일 수 있다. 몇몇 프로모터는 하나 이상의 미세조류 종에서 활성이다. 다른 프로모터는 종 특이적이다. 예시적인 프로모터는 하기 실시예에 사용된 클라미도모나스 레인하르드티(Chlamydomas reinhardtii) 유래의 β-튜불린과 같은 프로모터 및 다수의 미세조류 종에서 활성인 것으로 밝혀진 콜리플라워 모자이크 바이러스(cauliflower mosaic virus, CMV) 및 클로렐라 바이러스와 같은 바이러스 프로모터를 포함한다(예를 들어, 문헌[Plant Cell Rep. 2005 Mar;23(10-11):727-35; J Microbiol. 2005 Aug;43(4):361-5; Mar Biotechnol (NY). 2002 Jan;4(1):63-73] 참조). 프로토테카에서 외인성 유전자의 발현에 사용하기에 적합할 수 있는 또 다른 프로모터는 클로렐라 소로키니아나 글루타메이트 탈수소효소 프로모터/5 'UTR이다. 선택적으로, 프로모터를 함유하는 상기 서열 중 적어도 10, 20, 30, 40, 50, 또는 60개의 뉴클레오타이드가 사용되다. 프로토테카 외인성 유전자의 발현에 유용한 프로모터는 본 명세서의 서열 목록에 열거되어 있고 예를 들어 클로렐라 HUP1 유전자(서열번호 1)의 프로모터 및 클로렐라 엘립소이데아 나이트레이트 환원효소 프로모터(서열번호 2)가 있다. 클로렐라 바이러스 프로모터는 또한 프로토테카에서 미국 특허 제6,395,965호의 서열번호 1 내지 7과 같은 유전자를 발현시키는데 사용될 수 있다. 프로토테카에서 활성인 추가의 프로모터는 예를 들어 문헌[Biochem Biophys Res Commun. 1994 Oct 14;204(1): 187-94; Plant Mol Biol. 1994 Oct;26(1):85-93; Virology. 2004 Aug 15;326(1): 150-9; 및 Virology. 2004 Jan 5;318(1):214-23]에서 찾을 수 있다.
프로모터는 일반적으로 항상성이거나 유도성인 것으로서 특성화될 수 있다. 항상성 프로모터는 일반적으로 동일한 수준에서 항상(또는 세포 생활 주기에서 특정 시점에서) 활성이거나 기능성이다. 역으로, 유도성 프로모터는 활성(또는 불활성)이거나 단지 자극에 응답하여 상당히 상향 조절되거나 하향 조절된다. 상기 프로모터 유형 둘 다는 본 명세서의 방법에 적용된다. 본 발명에서 유용한 유도성 프로모터는 외인성으로 제공된 소분자(예를 들어, 서열번호 1에서와 같이 글루코스), 온도(가열 또는 냉각), 배양 배지 내 질소 부재 등과 같은 자극에 응답하여 작동적으로 연결된 유전자의 전사를 매개하는 것들을 포함한다. 적합한 프로모터는 근본적으로 사일런트 유전자의 전사를 활성화하거나 바람직하게는 실질적으로 낮은 수준으로 전사된 작동가능하게 연결된 유전자의 전사를 상향 조절할 수 있다. 이하의 실시예는 프로토테카 세포에 유용한 추가적인 유도성 프로모터를 기재한다.
종결 영역 제어 서열의 내포는 선택적이고 사용되는 경우 상기 선택은 상기 종결 영역이 비교적 상호호환가능하므로 주로 편의를 위한 것이다. 상기 종결 영역은 전사 개시 영역(프로모터)에 특정된 것일 수 있거나 목적하는 DNA 서열에 특정된 것일 수 있거나 또 다른 공급원으로부터 수득할 수 있다(문헌[예를 들어, Chen and Orozco, Nucleic Acids Res. (1988) 16:8411] 참조).
본 발명은 또한 제어 서열 및 재조합 유전자, 및 목적하는 유전자의 구분된 발현을 제공하는 것들을 함유하는 벡터를 제공한다. 표적화를 위한 기관은 엽록체, 플라스티드, 미토콘드리아, 및 소포체이다. 또한, 본 발명은 제어 서열 및 재조합 유전자, 및 세포 외부로의 단백질의 분비를 제공하는 것들을 함유하는 벡터를 제공한다.
프로토테카 핵 게놈에서 발현되는 단백질은 플라스티드 표적화 신호를 사용하여 플라스티드로 표적화될 수 있다. 클로렐라에 내인성인 플라스티드 표적화 서열은 공지되어 있고 예를 들어, 플라스티드로 표적화되는 단백질을 암호화하는 클로렐라 핵 게놈내 유전자들이 있고(예를 들어, GenBank 등록 번호 AY646197 및 AF499684를 참조), 하나의 양태에서, 상기 제어 서열은 단백질의 발현을 프로토테카 플라스티드로 표적화하는 본 발명의 벡터 내에 사용된다.
이하의 실시예는 숙주 세포 내 올바른 구획으로 이종성 단백질을 표적화하는 조류 플라스티드 표적화 서열의 용도를 기재한다. cDNA 라이브러리는 프로토테카 모리포르미스 및 클로렐라 프로토테코디에스 세포를 사용하여 제조되며 국제특허출원 PCT/US2009/066142에 기재되어 있다.
본 발명의 또 다른 양태에서, 프로토테카 내에서 폴리펩타이드의 발현은 소포체로 표적화된다. 발현 벡터 내 적절한 보유 또는 분류 신호의 내포는 단백질이 소포체(endoplasmic reticulum, ER)에 보유되고 골지체로 다운스트림되지 않도록 하는 것을 보장한다. 예를 들어, Wageningen UR- Plant Research International제의 IMPACT VECTOR 1.3 벡터는 널리 공지된 KDEL 보유 또는 분류 신호를 포함한다. 상기 벡터와 함께, ER 보유는 이것이 발현 수준을 5배 이상으로 개선한다는 것이 보고되었다는 점에서 실제 이점을 갖는다. 이에 대한 주요 이유는 ER이 세포질 내 존재하는 것보다 발현된 단백질의 해독 후 분해에 관여하는 프로테아제가 보다 낮은 농도이고/이거나 상이하다는 점에 있는 것으로 나타난다. 녹색 미세조류에서 기능하는 ER 보유 신호는 예를 들어, 문헌[Proc Natl Acad Sci USA. 2005 Apr 26;102(17):6225-30]에 공지되어 있다.
본 발명의 또 다른 양태에서, 폴리펩타이드는 배양 배지 내로 세포 외부로의 분비를 위해 표적화된다. 프로토테카에서 본 발명에 방법에 따라 사용될 수 있는 클로렐라중에서 활성인 분비 신호에 대한 예는 문헌[Hawkins et al., Current Microbiology Vol. 38 (1999), pp. 335-341]을 참조한다.
다수의 프로모터는 형질전환된 조류에 내인성인 프로모터뿐만 아니라 형질전환된 조류에 내인성이 아닌 프로모터(즉, 다른 조류로부터의 프로모터, 더 높은 식물로부터의 프로모터, 및 식물 바이러스 또는 조류 바이러스로부터의 프로모터)를 포함하는 미세조류에서 활성이다. 미세조류에 활성인 외인성 및/또는 내인성 프로모터, 및 미세조류에 작용성인 항생제 내성 유전자는, 예를 들어 문헌[Curr Microbiol. 1997 Dec;35(6):356-62(클로렐라 불가리스); Mar Biotechnol(NY). 2002 Jan;4(1):63-73(클로렐라 엘립소이데아); Mol Gen Genet. 1996 Oct 16;252(5):572-9(파이오덱틸룸 트라이코뉴툼(Phaeodactylum tricornutum)); Plant Mol Biol. 1996 Apr;31(1):1-12(볼복스 카르테리(Volvox carteri)); Proc Natl Acad Sci U S A. 1994 Nov 22;91(24):11562-6(볼복스 카르테리); Falciatore A, Casotti R, Leblanc C, Abrescia C, Bowler C, PMID: 10383998, 1999 May;1(3):239-251(이탈리아 나폴리 아이-80121 빌라 코무날레 스타지오네 주로지카에 소재한 Laboratory of Molecular Plant Biology)(파이오덱틸룸 트라이코뉴툼 및 탈라시오시라 웨이스프로기); Plant Physiol. 2002 May;129(1):7-12.(포르피리디움 속); Proc Natl Acad Sci U S A. 2003 Jan 21;100(2):438-42.(클라미도모나스 레인하르드티); Proc Natl Acad Sci U S A. 1990 Feb;87(3):1228-32.(클라미도모나스 레인하르드티); Nucleic Acids Res. 1992 Jun 25;20(12):2959-65; Mar Biotechnol(NY). 2002 Jan;4(1):63-73(클로렐라); BiochemMol Biol Int. 1995 Aug;36(5):1025-35(클라미도모나스 레인하르드티); J Microbiol. 2005 Aug;43(4):361-5(두날리엘라); Yi Chuan Xue Bao. 2005 Apr;32(4):424-33(두날리엘라); Mar Biotechnol (NY). 1999 May;1(3):239-251.(탈라시오시라 및 패닥틸룸(Phaedactylum)); Koksharova, Appl Microbiol Biotechnol 2002 Feb;58(2):123-37(다양한 종); Mol Genet Genomics. 2004 Feb;271(1):50-9(서모시네코코커스 연장체); J. Bacteriol. (2000), 182, 211-215; FEMS Microbiol Lett. 2003 Apr 25;221(2):155-9; Plant Physiol. 1994 Jun;105(2):635-41; Plant Mol Biol. 1995 Dec;29(5):897-907(시네코코커스 PCC 7942); Mar Pollut Bull. 2002;45(1-12):163-7(아나배나 PCC 7120); Proc Natl Acad Sci U S A. 1984 Mar;81(5):1561-5(아나배나(다양한 균주)); Proc Natl Acad Sci U S A. 2001 Mar 27;98(7):4243-8(시네코사이스티스); Wirth, Mol Gen Genet 1989 Mar;216(1):175-7(다양한 종); Mol Microbiol, 2002 Jun;44(6):1517-31 and Plasmid, 1993 Sep;30(2):90-105(프레미엘라 디플로시폰(Fremyella diplosiphon)); Hall et al. (1993) Gene 124: 75-81(클라미도모나스 레인하르드티); Gruber et al. (1991). Current Micro. 22: 15-20; Jarvis et al. (1991) Current Genet. 19: 317-322(클로렐라)]에 기재되며; 추가적인 프로모터에 대해 또한 미국특허 제6,027,900호의 표 1을 참조한다.
외인성 유전자를 발현하기 위해 사용되는 프로모터는 유전자에 자연적으로 연결된 프로모터일 수 있고 또는 이종성 유전자일 수 있다. 일부 프로모터는 한 종 이상의 미세조류에서 활성이다. 다른 프로모터는 종 특이적이다. 바람직한 프로모터는 클라미도모나스 레인하르드티로부터 유래된 RBCS2와 같은 프로모터 및 카울리플라워 모자이크 바이러스(CMV) 및 바이러스 프로모터와 같은 바이러스 프로모터를 포함하는데, 이들은 다양한 종의 미세조류에서 활성인 것으로 나타났다(예를 들어, 문헌[Plant Cell Rep. 2005 Mar;23(10-11):727-35; J Microbiol. 2005 Aug;43(4):361-5; Mar Biotechnol (NY). 2002 Jan;4(1):63-73] 참조). 다른 실시형태에서, 보트라이오코커스 말레이트(Botryococcus malate) 탈수소효소 프로모터, 서열번호 150의 임의의 부분을 포함하는 핵산, 또는 클라미도모나스 레인하르티 RBCS2 프로모터(서열번호 151)이 사용될 수 있다. 선택적으로, 적어도 10, 20, 30, 40, 50, 또는 60개의 뉴클레오타이드 또는 프로모터를 함유하는 더 많은 이들 서열이 사용된다. 클로렐라 속의 종에 내인성인 바람직한 프로모터는 서열번호 1 및 서열번호 2이다.
클로렐라 내 외인성 유전자의 발현에 유용한 바람직한 프로모터는 클로렐라 HUP1 유전자(서열번호 1)의 프로모터 및 클로렐라 엘립소이데아 나이트레이트 환원효소 프로모터(서열번호 2)와 같은 본 출원의 서열목록에 열거된다. 클로렐라 바이러스 프로모터는 또한 미국특허 제6,395,965호의 서열번호 1 내지 7과 같은 클로렐라 내 유전자를 발현시키기 위해 사용될 수 있다. 클로렐라 내 활성인 추가적인 프로모터는, 예를 들어 문헌[Biochem Biophys Res Commun. 1994 Oct 14;204(1):187-94; Plant Mol Biol. 1994 Oct;26(1):85-93; Virology. 2004 Aug 15;326(1):150-9; 및 Virology. 2004 Jan 5;318(1):214-23]에서 발견될 수 있다.
B. 유전자 및 코돈 최적화
전형적으로, 유전자는 프로모터, 암호화 서열 및 종결 제어 서열을 포함한다. 재조합 DNA 기술에 의해 조립될 때, 유전자는 발현 카세트로 칭해질 수 있고 재조합 유전자를 숙주 세포로 도입하는데 사용되는 벡터로의 편리한 삽입을 위한 제한 부위 옆에 있을 수 있다. 상기 발현 카세트는 상동성 재조합에 의한 발현 카세트의 게놈으로의 안정적인 통합을 촉진하는, 게놈 또는 다른 핵산 표적 유래의 DNA 서열 옆에 있을 수 있다. 또는, 상기 벡터 및 이의 발현 카세트는 통합되지 않은 상태로 유지될 수 있고, 이 경우에, 상기 벡터는 전형적으로, 이종성 벡터 DNA의 복제를 제공할 수 있는 복제원점을 포함한다.
벡터 상에 존재하는 통상의 유전자는 단백질을 암호화하는 유전자이고 이의 발현은 상기 단백질을 함유하는 재조합 세포가 상기 단백질을 발현하지 않는 세포로부터 구분될 수 있도록 한다. 상기 유전자 및 이의 대응하는 유전자 생성물은 선택가능한 마커로 칭한다. 임의의 광범위한 선택가능한 마커는 프로토테카를 형질전환시키기 위해 유용한 이식유전자 구성체에 사용될 수 있다. 적합한 선택가능한 마커의 예는 G418 내성 유전자, 나이트레이트 환원효소 유전자(문헌[Dawson et al. (1997), Current Microbiology 35:356-362] 참조), 하이그로마이신 포스포트랜스퍼라제 유전자(hygromycin phosphotransferase gene, HPT; 문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73] 참조), 네오마이신 포스포트랜스퍼라제 유전자, 및 플레오마이신(문헌[Huang et al. (2007), Appl. Microbiol. Biotechnol. 72:197-205] 참조)에 대해 내성을 부여하는 ble 유전자, 및 카나마이신에 내성을 부여하는 아미노글라이코사이드-3'-O-포스포트랜스퍼라제(서열번호 194)를 포함한다. 항생제에 대한 미세조류의 민감성을 측정하는 방법은 널리 공지되어 있다(예를 들어, 문헌[Mol Gen Genet. 1996 Oct 16;252(5):572-9] 참조).
항생제 기반이 아닌 다른 선택가능한 마커는 또한 일반적으로 프로토테카 종을 포함하는 미세조류를 형질전환하는데 유용한 이식유전자 구성체에 사용될 수 있다. 미세조류에 의해 이전에 이용될 수 없었던 특정 탄소 공급원을 이용하는 능력을 부여하는 유전자가 또한 선택가능한 마커로서 사용될 수 있다. 예로서, 프로토테카 모리포미스 균주는 전형적으로 수크로스 상에서 성장한다고 하더라고, 불량하게 성장한다. 수크로스 인버타제 유전자를 함유하는 구성체를 사용하는 것은 탄소 기질로서 수크로스를 성장시키는 포지티브 형질전환체의 능력을 부여할 수 있다. 다른 선택가능한 마커와 함께 선택가능한 마커로서 수크로스 이용에 대한 추가적인 상세한 설명은 이하의 하위부문 IV에서 논의한다.
발명의 목적을 위해, 본 발명의 재조합 숙주 세포를 제조하기 위해 사용되는 발현 벡터는 상기 유전자들 중 하나가 선택가능한 마커인 경우, 2개 이상 및 흔히 3개의 유전자를 포함한다. 예를 들어, 본 발명의 유전자 조작된 프로토테카는 선택가능한 마커뿐만 아니라 하나 이상의 외인성 유전자, 예를 들어, 수크로스 인버타제 유전자 또는 아실 ACP-티오에스터라제 유전자를 포함하는 본 발명의 벡터로 형질전환시킬 수 있다. 하나 또는 2개의 유전자는 지질 수율 및 지방산 에스터로의 전환을 증진시키기 위해 상기 유전자들의 발현과 관련된 타이밍을 허용하는 유도성 프로모터를 사용하여 발현될 수 있다. 2개 이상의 외인성 유전자의 발현은 동일한 유도성 프로모터의 제어 하에 또는 상이한 유도성(또는 항상성) 프로모터의 제어 하에 있을 수 있다. 후자 상황에서, 제1 외인성 유전자의 발현은 제1 기간 동안 유도될 수 있고(이 동안 제2 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있다) 제2 외인성 유전자의 발현은 제2 기간 동안 유도될 수 있다(이 동안 제1 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있다).
다른 양태에서, 2개 이상의 외인성 유전자(임의의 선택가능한 마커에 추가로)는 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA/알데하이드 환원효소이고, 상기 수율의 조합 작용은 알코올 생성물을 생성시킨다. 추가로 제한 없이 알데하이드를 생성하기 위한 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA 환원효소를 포함하는 외인성 유전자의 다른 조합이 제공된다. 하나의 양태에서, 벡터는 알칸을 생성하기 위해 지방 아실-ACP 티오에스터라제, 지방 아실-CoA 환원효소 및 지방 알데하이드 데카보닐라제의 조합을 제공한다. 이들 각각의 양태에서, 외인성 유전자중 하나 이상은 유도성 프로모터를 사용하여 발현될 수 있다.
2개 이상의 외인성 유전자를 발현하는 본 발명의 다른 예시적인 벡터는 수크로스 수송체 및 수크로스 인버타제 효소 둘 다를 암호화하는 것들 및 선택가능한 마커 및 분비된 수크로스 인버타제 둘 다를 암호화하는 것들을 포함한다. 벡터 중 어느 하나의 유형으로 형질전환된 재조합 프로토테카는 탄소 공급원으로서 사탕무(및 사탕무 유래 당)를 사용하기 위한 유전자 조작된 능력 때문에 더 낮은 제조 비용으로 지질을 생산한다. 상기된 2개의 외인성 유전자의 삽입은, 보다 큰 탄소 유입이 지질 생산과 맞물리도록 지시되고/되거나 무작위 돌연변이 유발을 통해 다당류 생합성의 파괴와 조합될 수 있다. 개별적으로 및 조합적으로, 영양성 전환, 지질 생산을 변화시키기 위한 조작 및 외인성 효소를 사용한 처리는 미생물에 의해 생산되는 지질 조성물을 변형시킨다. 상기 변형은 미생물 내에서 생산되는 지질의 양의 변화, 다른 지질과 비교하여 생산되는 하나 이상의 탄화수소 종의 양 및/또는 생산되는 지질 종의 유형의 변화일 수 있다. 예를 들어, 미세조류는 더 높은 양 및/또는 %의 TAG를 생산하도록 유전자 조작될 수 있다.
재조합 단백질의 최적의 발현을 위해, 형질전환된 숙주 세포에 의해 우선적으로 사용되는 코돈으로 mRNA를 생산하는 암호화 서열을 사용하는 것이 유리하다. 따라서, 전이유전자의 적당한 발현은 전이유전자의 코돈 용법이 전이유전자가 발현되는 유기체의 특이적 코돈 편력에 부합되도록 하는 것이 요구될 수 있다. 상기 효과가 근거하는 정확한 메커니즘은 많지만, 상기 필요성이 충족되는 경우 전이유전자 전령 RNA(mRNA)의 보다 효율적인 해독과 커플링되는, 세포 내에서 합성되는 단백질과 가용하게 아미노아실화된 tRNA 풀의 적당한 균형을 포함한다. 이식 유전자 내 코돈 용법이 최적화되지 않은 경우, 가용한 tRNA 풀은 이종성 mRNA의 효율적인 해독을 허용하기에 충분하지 않고 리보솜 멈춤(stalling) 및 종결 및 유전자이식mRNA의 가능한 불안정성을 유도한다.
본 발명은 프로토테카 내에서 재조합 단백질의 성공적인 발현을 위해 유용한 코돈 최적화된 핵산을 제공한다. 프로토테카 종에서 코돈 용법은 프로토테카 모리포르미스로부터 분리된 cDNA 서열을 연구함에 의해 분석된다. 이 분석은 24,000개 코돈에 대한 탐색이고 이의 결과는 이하의 표 2에 나타낸다.
다른 양태에서, 재조합 벡터내 유전자는 프로토테카 균주 이외의 다른 미세조류 균주를 참조하여 코돈 최적화되었다. 예를 들어, 미세조류내 발현용 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다. 암호화 최적화를 위한 추가의 정보는 예를 들어, GenBank의 코돈 용법 데이타베이스에서 입수할 수 있다.
클로렐라 피레노이도사, 두나리엘라살리나, 및 클로렐라 프로토테코이데스 내 코돈 사용 빈도(codon usage)의 다른 비제한적 예는 표 28, 표 29 및 표 30에서 각각 나타낸다.
C. 유도성 발현
본 발명은 또한 관심의 유전자를 발현하기 위한 유도성 프로모터의 사용을 제공한다. 특히, 리파제 유전자의 유도성 프로모터 사용은 필요하다면 조건이 조절된 때, 예를 들어 세포의 파괴, 반응 혼합물의 물 함량 감소 후, 및/또는 TAG를 지방산 에스터로 전환을 구동시키는 충분한 알코올의 첨가 후 미생물 유기체의 성장 후 리파제를 생성시킨다.
본 발명에 유용한 유도성 프로모터는 자극에 반응하는 작동가능하게 연결된 유전자의 전사를 매개하는 것, 예컨대 외인성으로 제공된 소분자(예를 들어 서열번호 1에서와 같은 글루코스), 온도(가열 또는 냉각), 빛 등을 포함한다. 적합한 프로모터는 본질적으로 침묵 유전자의 전사를 활성화할 수 있고, 바람직하게는 실질적으로 낮은 수준에서 전사된 작동가능하게 연결된 유전자의 전사를 상향조절할 수 있다. 후자의 경우에, 리파제의 전사 수준은 바람직하게는 그것이 발현된 미생물 유기체의 성장을 상당히 방해하지 않는다.
클로렐라 내 이식유전자의 발현은 클로렐라 헥소스 수송체 유전자(서열번호 1)을 구동시키는 프로모터와 같은 프로모터를 통해 유도가능하게 수행될 수 있다. 이 프로모터는 배양 배지 내 글루코스의 존재에 의해 강하게 활성화된다.
D. 2 이상의 외인성 유전자의 발현
추가로, 미세조류와 같은 유전자적으로 조작된 미생물 유기체는 예를 들어 리파제와 같은 2 이상의 외인성 유전자 및 예를 들어 다당류 분해 효소를 암호화하는 용균성 유전자를 포함하고 발현할 수 있다. 하나 또는 유전자 둘 다는 지질 수율 및 지방산 에스터로 전환을 향상시키도록 제어되는 이들 유전자를 상대적 발현 시간을 허용하는 유도성 프로모터를 사용하여 발현될 수 있다. 2 이상의 외인성 유전자 발현은 동일한 유도성 프로모터의 제어 하에 또는 상이한 유도성 프로모터의 제어 하에 있을 수 있다. 후자의 상황에서, 제1 외인성 유전자 발현은 제1 시간 기간 동안(이 동안 제2 외인성 유전자의 발현이 유도되거나 유도되지 않을 수 있음) 유도될 수 있고, 제2 외인성 유전자의 발현은 제2 시간 기간 동안 유도될 수 있다( 이 동안 제1 외인성 유전자의 발현은 유도되거나 유도되지 않을 수 있음). 수크로스를 대사 작용하기 위한 지질-생성 미생물을 유전자 조작하기 위한 벡터 및 방법이 본 명세서에서 제공되는데, 이는 사탕수수 공급원료를 지질로 전환하기 위한 세포를 유전자조작하기 때문에 유리한 특성이다.
2 이상의 외인성 유전자, 예를 들어 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA/알데하이드 환원효소를 발현시키는 미생물(예를 들어, 미세조류, 유지성 효모, 박테리아 또는 진균)의 유전자 조작된 균주가 본 명세서에 제공되며, 이것의 조합된 작용으로 알코올 생성물을 수득한다. 알데하이드를 만들어내기 위해 제한 없이, 지방 아실-ACP 티오에스터라제 및 지방 아실-CoA 환원효소를 포함하는 외인성 유전자의 다른 조합이 추가로 제공된다. 추가로, 이 출원은 알칸을 만들어내기 위해 지방 아실-ACP 티오에스터라제, 지방 아실-CoA 환원효소, 및 지방 알데하이드 데카보닐라제의 조합을 제공한다. 하나 이상의 외인성 유전자는 유도성 프로모터를 사용하여 발현될 수 있다.
본 발명의 사용에 적합한 추가 변형의 예는, 하나는 고정된 탄소 공급원(예컨대 수크로스)의 수송체를 암호화하고, 두 번째는 수크로스 인버타제 효소를 암호화하는, 2 이상의 외인성 유전자를 발현시키기 위해 미세조류의 유전자 조작된 균주를 포함한다. 얻어진 발효가능한 유기체는 이전에 알려진 방법의 생물학적 탄화수소 생성으로 얻을 수 있는 것보다 더 낮은 제조 비용으로 탄화수소를 생성한다. 상기 기재한 2개의 외인성 유전자 삽입은 탄화수소 생성으로 훨씬 더 큰 탄소 유입을 조종하는 직접 및/또는 무작위 돌연변이를 통해 다당류 생합성의 파괴와 조합될 수 있다. 개개로 및 조합으로, 외인성 효소에 의한 탄화수소 생성 및 처리를 변경하는 유전자 조작인 영양 전환은 미생물 유기체에 의해 생성된 탄화수소 조성물을 변경한다. 해당 변경은 생성된 탄화수소의 양, 다른 탄화수소에 대해 생성된 하나 이상의 탄화수소 종의 양 및/또는 미생물 유기체에 대해 생성된 하나 이상의 탄화수소 종의 양을 변화시킬 수 있다. 예를 들어, 미세조류는 더 많은 양 및/또는 백분율의 TAG를 생성하도록 유전자조작될 수 있다.
E. 구분된 발현
본 발명은 또한 관심 유전자의 구분된 발현을 제공한다. 특히, 특정 실시형태에서, 에스터결합전이 반응의 개시까지 대부분의 세포 지질로부터 격리되는 하나 이상의 세포 구획에 대해 리파제의 발현을 표적화시키는 것이 유리할 수 있다. 표적화를 위한 바람직한 세포 기관은 엽록체, 미토콘드리아, 및 소포체이다.
(1) 엽록체 내 발현
본 발명의 한 실시형태에서, 미생물 유기체 내 폴리펩타이드의 발현은 엽록체에 표적화된다. 엽록체에 대해 이종성인 유전자의 발현을 표적화하는 방법은 공지되어 있으며 본 발명에서 사용될 수 있다. 엽록체 내로 외래 유전자 생성물을 표적화하는 방법은 문헌[Shrier et al., EMBO J. (1985) 4:25 32]에 기재되어 있다. 또한 핵 유전자를 엽록체에 전위시키는 수송 펩타이드의 사용에 대해 문헌[Tomai et al. Gen. Biol. Chem. (1988) 263:15104 15109] 및 미국특허 제4,940,835호를 참조한다. 엽록체에 단백질의 수송을 지시하는 방법은 또한 문헌[Kenauf TIBTECH (1987) 5:40 47]에서 검토된다. 클로렐라에 내인성인 서열을 표적화하는 엽록체는, 예컨대 엽록체에 표적화된 단백질을 암호화하는 클로렐라 핵 게놈 내 유전자가 공지되어 있으며; 예를 들어 GenBank 등록번호 AY646197 및 AF499684를 참조한다.
와게닝겐 UR- 식물 연구 국제기구(Wageningen UR- Plant Research International)는 이중 막 시스템을 가로질러 왕복하는 엽록체 스트로마(세포질) 환경 내로 이종성 단백질을 전달하기 위한 크립산테뭄 모리폴리움 소단위체 단백질의 분비 신호를 사용하는 IMPACTVECTOR1.4 벡터를 판매한다. 해당 단백질은 신호 펩타이드의 적절한 처리를 위하여 성숙 루비스코 단백질의 처음 11개 아미노산에 융합된다(Wong et al., Plant Molecular Biology 20: 81-93 (1992)). 신호 펩타이드는 RbcS 유전자로부터 본래의 인트론을 함유한다.
다른 접근에서, 엽록체 게놈은 이종성 단백질을 발현하도록 유전자 조작된다. 외래 DNA로 코팅된 고속 텅스텐 입자총에 의한 수용 세포의 충격을 사용하는 클라미도모나스 레인하르티(녹조류) 엽록체의 안정한 형질전환이 기재되었다. 예를 들어, 문헌[Boynton et al., Science (1988) 240: 1534 1538; Blowers et al. Plant Cell (1989) 1:123 132 및 Debuchy et al., EMBO J. (1989) 8: 2803 2809]을 참조한다. 텅스텐 입자총을 사용하는 형질전환 기법은 문헌[Klein et al., Nature (London)(1987) 7:70 73]에 의해 기재된다. 식물과 미세조류 둘 다에 대한 엽록체 형질전환의 다른 방법은 공지되어 있다. 예를 들어 미국특허 제5,693,507호; 제6,680,426호; 및 문헌[Plant Physiol. 2002 May;129(1):7-12; 및 Plant Biotechnol J. 2007 May;5(3):402-12]을 참조한다.
미국특허 제6,320,101호(Kaplan 등에 대해 2001년 11월 20일 발행됨; 본 명세서에 참조로 포함됨)에서 기재된 바와 같이, 세포는 약 하나의 세포마다 엽록체 수를 감소시키기 위하여 화학적으로 처리될 수 있다. 그 다음에, 이종성 핵산은 엽록체 내에 적어도 하나의 이종성 핵산 분자를 도입하는 목적으로 입자 충격을 통해 세포 내에 도입될 수 있다. 이종성 핵산은 엽록체에 내재된 효소에 의해 용이하게 달성되는 상동성 재조합을 통해 엽록체의 게놈 내로 통합가능하도록 선택된다. 이것의 마지막에, 이종성 핵산은 관심의 유전자에 더하여, 엽록체 게놈으로부터 유래된 적어도 하나의 핵산 서열을 포함한다. 추가로, 이종성 핵산은 전형적으로 선택가능한 마커를 포함한다. 이 기법에 대한 추가적인 상세한 설명은 본 명세서에 참조로 포함된 미국특허 제4,945,050호 및 제5,693,507호에서 발견된다. 따라서 폴리펩타이드는 엽록체의 단백질 발현 시스템에 의해 생성될 수 있다.
미국특허 제7,135,620호(Daniell에 대해 2006년 11월 14일 발행됨; 본 명세서에 참조로 포함됨)는 엽록체 발현 벡터 및 관련 방법을 기재한다. 발현 카세트는 엽록체 내 암호화 서열의 적절한 발현을 제공하기 위한 암호화 서열 및 적합한 제어 서열을 포함하는 DNA 구성체이다. 전형적인 발현 카세트는 다음의 성분을 포함한다: 엽록체 내 관심의 폴리펩타이드를 암호화하는 DNA 서열의 전사 및 번역을 제공하는 psbA와 같은 미생물 유기체 유전자 또는 엽록체로부터 유래된 5' 미번역 영역; 관심의 폴리펩타이드를 암호화하는 DNA 서열; 및 도입된 유전자의 RNA를 안정화하고, 이에 의해 외래 유전자 발현을 향상시킬 수 있는 엽록체 유전자의 3' 전화 반복 영역과 같은 번역 및 전사 종결 영역. 카세트는 선택적으로 항생제 내성 유전자를 포함할 수 있다.
전형적으로 발현 카세트는 적절한 게놈 내로 삽입을 위해 편리한 제한 부위 옆에 있다. 발현 카세트는 엽록체 DNA로부터 DNA 서열 옆에 위치하여 특히 상동성 재조합에 의해 엽록체 게놈 내로 발현 카세트의 안정한 통합을 용이하게 할 수 있다. 대안적으로, 발현 카세트는 통합되지 않고 남아있을 수도 있는데, 이 경우에 해당 발현 카세트는 엽록체 내에서 이종성인 복제를 제공할 수 있는 엽록체 복제원점을 전형적으로 포함한다.
발현 카세트는 일반적으로 엽록체 내에서 발현시킬 수 있는 유전자로부터 유래된 프로모터 영역을 포함한다. 프로모터 영역은 엽록체 유전자, 예컨대 시금치 또는 완두콩으로부터의 psbA 유전자로부터 얻을 수 있는 프로모터, 또는 메이즈 및 Rrna 프로모터로부터의 rbcL 및 atpB 프로모터 영역을 포함할 수 있다. 프로모터의 예는 문헌[Hanley-Bowdoin and Chua, TIBS (1987) 12:67 70; Mullet et al., Plant Molec Biol. (1985) 4: 39 54; Hanley-Bowdoin (1986) PhD. Dissertation, the Rockefeller University; Krebbers et al., Nucleic Acids Res. (1982) 10: 4985 5002; Zurawaki et al., Nucleic Acids Res. (1981) 9:3251 3270; 및 Zurawski et al., Proc. Nat'l Acad Sci. U.S.A. (1982) 79: 7699 7703]에 기재되어 있다. 다른 프로모터가 확인될 수 있고, 이렇게 확인된 프로모터의 상대적 강도는 관심의 5'프로모터를 프로모터가 없는 마커 유전자에 위치시키고, 예를 들어 psbA 유전자로부터의 프로모터, 상대적으로 강한 엽록체 프로모터로부터 얻은 전사에 대해 그것의 유효성을 관찰함으로써 평가될 수 있다. 이종성 유전자 발현의 효율은 임의의 다양한 기법에 의해 향상될 수 있다. 이들은 이종성 유전자, 예를 들어 이중 psbA 프로모터에 나란히 5'에서 삽입된 다양한 프로모터 사용, 인핸서 서열 등의 추가를 포함한다.
클로렐라 엽록체에서 활성인 수많은 프로모터는 클로렐라 엽록체 내 외인성 유전자, 예컨대 GenBank 등록번호 NC_001865(클로렐라 불가리스 엽록체, 완전 게놈)에서 발견되는 것의 발현을 위해 사용될 수 있다.
이종성 유전자의 유도성 발현을 제공하도록 설계된 경우, 전사 및/또는 번ㅇ겨(3'말단에서) 수준의 조절을 제공하는 서열을 함유하는 유도성 프로모터 및/또는 5'미번역 영역은 발현 카세트 내에 포함될 수 있다. 예를 들어, 5'미번역 영역은 발현이 빛에 의해 조절가능한 유전자로부터 유래될 수 있다. 유사하게, 3' 역반복 말단은 이종성 유전자의 RNA를 안정화하기 위하여 사용될 수 있었다. 유도성 유전자는 관심의 특정 자극에 반응하는 발현이 향상되는 것과 자극의 부재에서 발현이 낮거나 없는 것으로 확인될 수 있다. 예를 들어, 빛-유도성 유전자는 향상된 발현이 빛에 의한 조사 동안 생기는 경우를 확인할 수 있는 한편, 빛이 낮거나 없을 때 발현은 실질적으로 감소되거나 발현이 일어나지 않는다. 녹색 미세조류로부터 유래된 빛 조절 프로모터는 공지되어 있다(예를 들어 문헌[Mol Genet Genomics. 2005 Dec;274(6):625-36] 참조).
사용되는 종결 영역은 주로 편리함을 위한 것인데, 종결 영역은 엽록체 및 박테리아 중에서 상대적으로 상호호관가능한 것으로 나타났기 때문이다. 종결 영역은 전사 개시 영역에 본래 있을 수도 있고, 관심의 DNA 서열에 본래 있을 수도 있으며, 또는 다른 공급원으로부터 얻을 수도 있다. 예를 들어 문헌[Chen and Orozco, Nucleic Acids Res. (1988) 16:8411]을 참조한다.
발현 카세트는 임의의 다수의 방법에 의해 관심의 식물 세포로 형질전환될 수 있다. 이들 방법은, 예를 들어 바이오리스틱(biolistic) 방법을 포함한다(예를 들어, 문헌[Sanford, Trends In Biotech. (1988) 6:299 302], 미국특허 제4,945,050호); 전기천공(Fromm et al., Proc. Nat'l. Acad. Sci. (USA)(1985) 82:5824 5828); 레이저 빔, 미소주입 또는 엽록체에 DNA를 도입할 수 있는 임의의 다른 방법을 포함한다.
미세조류와 같은 미생물 유기체에서 사용에 적합한 엽록체 발현 벡터의 추가적인 기재는 미국특허 제7,081,567호 (Xue에 대해 2006년 7월 25일 발행); 제6,680,426호(Daniell 등에 대해 2004년 1월 20일 발행); 및 5,693,507(Daniell 등에 대해 1997년 12월 2일 발행)에서 발견된다.
클로렐라의 핵 게놈에서 발현된 단백질은 엽록체 표적화 신호를 사용하여 엽록체에 표적화될 수 있다. 클로렐라에 내인성인 엽록체 표적화 서열은 예컨대 엽록체에 표적화된 단백질을 암호화하는 클로렐라 핵 게놈 내 유전자가 공지되어 있으며; 예를 들어 GenBank 등록번호 AY646197 및 AF499684를 참조한다. 단백질은 또한 엽록체 게놈 내에 직접적으로 유전자의 삽입에 의해 클로렐라 엽록체 내에서 발현될 수 있다. 엽록체 형질전환은 전형적으로 상동성 재조합을 통해 일어나며, 엽록체 게놈이 표적화 벡터의 생성에 대해 알려져 있다면, 엽록체 형질전환이 수행될 수 있다(예를 들어 클로렐라 엽록체의 완전한 게놈 서열; Genbank 등록번호 NC_001865를 참조). 엽록체 형질전환의 상세한 설명에 대해 본 명세서의 앞의 부문을 참조한다.
(2) 미토콘드리아 내 발현
본 발명의 다른 실시형태에서, 미생물 유기체 내 폴리펩타이드의 발현은 미토콘드리아로 표적화된다. 녹색 미세조류를 포함하는 미토콘드리아에 외래 유전자 생성물을 표적화하기 위한 방법(Boutry et al. Nature (London)(1987) 328:340 342)은 기재되었다(예를 들어, 문헌[Mol Gen Genet. 1993 Jan;236(2-3):235-44] 참조).
예를 들어, 적합한 분비 신호를 암호화하는 발현 벡터는 미토콘드리아에 이종성인 단백질을 표적화할 수 있다. 와게닝겐 UR- 식물 연구 국제기구제의 MPACTVECTOR1.5 벡터는 미토콘드리아 매트릭스 내에서 단백질을 전달하는 것으로 나타난 효모 CoxIV 분비 신호를 사용한다. 단백질은 신호 펩타이드를 적절하게 처리하기 위하여 효모 CoxIV 단백질의 처음 4개 아미노산에 융합된다(Kohler et al. Plant J 11: 613-621 (1997)). 녹색 미세조류에서 기능적인 것을 포함하는 다른 미토콘드리아 표적화 서열은 공지되어 있다. 예를 들어 문헌[FEBS Lett. 1990 Jan 29;260(2):165-8; 및 J Biol Chem. 2002 Feb 22;277(8):6051-8]을 참조한다.
클로렐라의 핵 게놈에서 발현된 단백질은 미토콘드리아 표적화 신호를 사용하여 미토콘드리아에 표적화될 수 있다. 미토콘드리아 단백질 표적화 및 형질전환의 상세한 설명에 대해 본 명세서의 이전의 부문을 참조한다.
(3) 소포체 내 발현
본 발명의 다른 실시형태에서, 미생물 유기체 내 폴리펩타이드의 발현은 소포체로 표적화된다. 발현 벡터 내 적절한 보유 또는 분류 신호의 포함은 단백질이 소포체(ER) 내에 유지되고, 골지체 내로 하류로 가지 않는다는 것을 보장한다. 예를 들어, 와게닝겐 UR- 식물 연구 국제기구제의 IMPACTVECTOR1.3 벡터는 잘 공지된 KDEL 보유 또는 정렬 신호를 포함한다. 이 벡터에 의해, ER 보유는 현실적 이점을 가지며, 즉, 발현 수준을 5배 또는 그 이상으로 개선시키는 것으로 보고되었다. 이에 대한 주된 이유는 ER이 세포질에 존재하는 발현된 단백질의 번역 후 분해를 초래하는 더 낮은 농도 및/또는 상이한 프로테아제를 함유한다는 것을 나타낸다. 녹색 미세조류에서 기능적인 ER 보유 신호는 공지되어 있다. 예를 들어, 문헌[Proc Natl Acad Sci U S A. 2005 Apr 26;102(17):6225-30]을 참조한다.
본 발명의 방법 및 재료가 미생물 유기체 내애 임의의 외인성 유전자를 도입시키는 반면, 수크로스 이용 및 지질 경로 변형에 대한 유전자는 다음의 부문에서 논의되는 것과 같은 특정 관심을 가진다.
IV. 선택가능한 마커
1.
수크로스 이용
하나의 양태에서, 본 발명의 재조합 프로토테카 세포는 하나 이상의 외인성 수크로스 이용 유전자를 함유한다. 다양한 양태에서, 하나 이상의 유전자는 프럭토키나제, 글루코키나제, 헥소키나제, 수크로스 인버타제 및 수크로스 수송체로 이루어진 그룹으로부터 선택된 하나 이상의 단백질을 암호화한다. 예를 들어, 수크로스 수송체 및 수크로스 인버타제의 발현은 프로토테카가 수크로스를 배양 배지로부터 세포에 수송하여 수크로스를 가수분해시켜 글루코스 및 프럭토스를 생성하도록 한다. 임의로, 내인성 헥소키나제 활성이 프럭토스의 최대 인산화를 위해 불충분한 경우에도 프럭토키나제는 발현될 수 있다. 적합한 수크로스 수송체의 예는 Genbank 등록번호 제CAD91334호, 제CAB92307호, 및 제CAA53390호이다. 적합한 프럭토키나제의 예는 Genbank 등록번호 제P26984호, 제P26420호 및 제CAA43322호이다.
하나의 양태에서, 본 발명은 수크로스 인버타제를 분비하는 프로토테카 숙주 세포를 제공한다. 수크로스 인버타제의 분비는 수크로스를 세포 내로 수송할 수 있는 수송체를 발현할 필요성을 제거한다. 이것은 분비된 인버타제가 수크로스 분자의 글루코스 및 프럭토스 분자로의 전환을 촉매하기 때문이고, 이들 분자 둘 다는 본 발명에 의해 제공된 미생물에 의해 수송되고 이용될 수 있다. 예를 들어, 분비 신호 (예를 들어, 서열번호 4의 신호(효모 유래), 예를 들어, 서열번호 5의 신호(고등 식물 유래), 서열번호 6의 신호(진핵 컨센서스 분비 신호) 및 서열번호 7의 신호(고등 식물 및 진핵 컨센서스 유래의 신호 서열의 조합체))와 함께 수크로스 인버타제(예를 들어, 서열번호 3)의 발현은 세포 외부에서 인버타제 활성을 생성시킨다. 본 명세서에 기재된 유전자 조작 방법에 가능한 상기 단백질의 발현은 이미 에너지원으로서 세포외 글루코스를 이용할 수 있는 세포가 세포외 에너지원으로 수크로스를 이용할 수 있게 해준다.
수크로스 함유 배지에서 인버타제를 발현하는 프로토테카 종은 오일 생산을 위해 바람직한 미세조류 종이다. 이런 완전히 활성인 단백질의 발현 및 세포외 표적화는 수득한 숙주 세포가 수크로스 상에서 성장하도록 하는 반면, 이들의 비형질전환된 대응 숙주 세포는 성장할 수 없다. 따라서, 본 발명은 효모 인버타제 유전자를 포함하지만 이에 제한되지 않는 코돈 최적화된 인버타제 유전자를 갖는 프로토테카 재조합 세포를 제공하고, 이때 상기 효모 인버타제 유전자는 게놈에 통합되어 있어 상기 인버타제 유전자는 인버타제 활성 및 수크로스 가수분해에 의해 평가되는 바와 같이 발현된다. 본 발명은 또한 세포가 수크로스상에 성장할 수 있는 반면 이들의 비형질전환된 대응 세포는 발현할 수 없으므로 프로토테카 재조합 세포에서 선택가능한 마커로서 유용한 인버타제 유전자; 및 조류 분자 유전자에 대한 강력한 선택가능한 마커로서 인버타제를 사용하여 재조합 숙주 세포를 선택하기 위한 방법을 제공한다.
프로토테카에서 수크로스 인버타제의 성공적인 발현은 또한 이것이, 이종성(재조합) 단백질이 완전한 활성 및 기능적 형태로서 세포 외부로 및 배양 배지 내로 성공적으로 분비됨을 입증한다는 점에서 본 발명의 또 다른 측면을 설명한다. 따라서, 본 발명은 미세조류 내 광범위한 이종성 단백질을 발현하고 이들을 숙주 세포 외부로 분비시키기 위한 방법 및 시약을 제공한다. 상기 단백질은 예를 들어, 산업용 효소, 예를 들어, 리파제, 프로테아제, 셀룰라제, 펙티나제, 아밀라제(예를 들어, 서열번호 190 내지 191), 에스터라제, 옥시도환원효소, 트랜스퍼라제, 락타제, 아이소머라제 및 인버타제, 및 치료학적 단백질, 예를 들어, 성장 인자, 사이토킨, 2개의 경쇄 및 2개의 중쇄를 포함하는 전장 항체, Fab, scFv(단일쇄 가변 단편), 카멜리드형 항체, 항체 단편, 항체-단편 융합체, 항체-수용체 융합체, 인슐린, 인터페론 및 인슐린형 성장 인자를 포함한다.
프로토테카내 수크로스 인버타제의 성공적인 발현은 또한 이것이 프로토테카내 단백질의 분비를 지시하기 위한 조류 내 진균류 수송 펩타이드의 사용을 위한 방법 및 시약을 제공하고 펩타이드가 기능할 수 있는지의 여부 및 이것이 프로토테카 세포에서 수송 펩타이드로서 기능하는 능력을 결정하기 위한 방법 및 시약을 제공한다는 점에서 본 발명의 또 다른 측면을 설명한다. 본 발명의 방법 및 시약은 단백질을 세포 외로 성공적으로 수송할 수 있는 다른 수송 펩타이드를 확인하기 위한 도구 및 플랫폼으로서 사용될 수 있고, 이때 효모 인버타제가 이들 방법에서 우수한 용도를 갖는다. 본 실시예에서 입증된 바와 같이, 내인성 효모 인버타제 수송 펩타이드의 제거 및 숙주 조류에 내인성이거나 다른 공급원(진핵, 원핵 및 바이러스)으로부터 유래하는 다른 수송 펩타이드로 이의 대체가 목적하는 임의의 펩타이드가 세포로부터 단백질의 방출을 유도하는 수송 펩타이드로서 기능할 수 있는지의 여부를 확인할 수 있다.
적합한 수크로스 인버타제의 예는 Genbank 등록번호 제CAB95010호, 제NP_012104호 및 제CAA06839호에 의해 확인된 것들을 포함한다. 적합한 인버타제의 비제한적인 예는 하기 표 3에 열거되어 있다. 각각의 열거된 인버타제에 대한 아미노산 서열은 하기의 서열 목록에 포함된다. 일부 경우에, 본 발명의 방법 및 벡터에 사용하기에 적합한 외인성 수크로스 이용 유전자는 표 3로으부터 선택되는 수크로스 인버타제와 40, 50, 60, 75, 또는 90% 이상의 아미노산 동일성을 갖는 수크로스 인버타제를 암호화한다.
프로토테카에 의한 배양 배지로의 인버타제의 분비는 세포가 이들이 순수 시약 등급의 글루코스 상에 성장하는 바와 같이 사탕무 가공으로부터 비롯된 폐기 당밀상에서 성장할 수 있도록 해주고 사탕무 가공의 상기 낮은 가치의 폐기물의 사용은 지질 및 다른 오일의 제조에서 상당한 비용 절감을 제공할 수 있다. 따라서, 본 발명은 (i) 수크로스 및 (ii) 수크로스 인버타제 효소를 포함하는 배양 배지 및 프로토테카 미생물 집단을 함유하는 미생물 배양물을 제공한다. 다양한 양태에서 배양물내 수크로스는 수수, 사탕무, 사탕 수수, 당밀 또는 탈중합된 셀룰로스 물질(이것은 임의로 리그닌을 함유할 수 있다)로부터 유래한다. 또 다른 측면에서, 본 발명의 방법 및 시약은 재조합 프로토테카에 의해 사용될 수 있는 공급원료의 수 및 유형을 상당히 증가시킨다. 본 명세서에 예시된 미생물은 이들이 수크로스를 이용할 수 있도록 변형되고 본 발명의 방법 및 시약이 적용되어 셀룰로스와 같은 공급원료가 셀룰라제, 펙티나제, 아이소머라제 등을 분비하는 능력을 갖는 본 발명의 유전자조작된 숙주 미생물에 의해 이용될 수 있도록 하고 효소 반응의 분해 생성물은 더 이상 단순히 내성이 아니고 숙주에 의해 탄소 공급원으로 이용된다. 이것의 예는 이하에서 및 농업폐기물 스트림에서 발견되는 2가지의 올리고당인 라피노스 및 스타키오스에 함유된 것과 같은 올리고당 내 α-갈락토실 결합을 가수분해하는 능력을 부여하는 선택가능한 α-갈락토시다제로 유전자 조작된 미생물의 예에서 기재된다.
2.
알파-갈락토시다제 발현
상기 기재한 바와 같은 수크로스 인버타제의 발현이 탄소 공급원과 같은 수크로스를 더 효율적으로 이용하기 위하여 프로토테카 세포에 대해 능력을 부여하는 한편(이당류 수크로스 내 프럭토스와 글루코스 분자 사이의 α-연결을 가수분해하는 효소를 통해), 올리고당 내 다른 유형의 α-연결을 가수분해하는 다른 효소의 발현은 다른 탄소 공급원을 이용하기 위하여 프로토테카 세포에 대한 능력을 부여할 수 있다. 이들 효소의 발현(및 프로토테카 및 다른 미세조류 세포가 보통 사용될 수 없는 탄소 공급원을 이용하는 결과 능력)은 이들 탄소 공급원을 성장시킬 수 있는 포지티브 클론을 선택하도록 하여 이들 유전자 이식 프로토테카 세포에 대한 선택가능한 마커로 사용될 수 있다.
실시형태에서, 본 발명의 재조합 프로토테카 세포는 다당류 분해 효소를 암호화하는 하나 이상의 외인성 유전자를 추가로 함유한다. 다양한 실시형태에서, 다당류 분해 효소를 암호화하는 하나 이상의 유전자는 분비된 α-갈락토시다제를 암호화하는 유전자이다. 프로토테카 세포 내 외인성의 분비된 α-갈락토시다제의 발현은 갈락토스와 글루코스 단당류 단위 사이의 α-연결과 같은 D-갈락토실 연결을 함유하는 당(탄소 공급원)에서 성장하는 이러한 형질전환된 균주의 능력을 부여한다. 외인성의 분비된 α-갈락토시다제를 발현하는 프로토테카 균주는 멜리비오스(α-D-갈락토스-글루코스로 구성된 이당류)와 같은 이당류를 이용할 수 있다.
라피노스(α-연결된 갈락토스-글루코스-프럭토스를 포함하는 삼당류) 및 스타키오스(2개의 α-연결 D-갈락토스 단위 다음에 α-연결된 글루코스 및 프럭토스로 구성되는 삼당류)와 같은 당은 사탕 무박(라피노스) 및 대두 음식물(스타키오스)와 같은 농업폐기물 스트림에서 상당한 비율로 존재한다. 이러한 농업 잔여물은 그것을 이용할 수 있는 미생물(프로토테카를 포함)에 의해 오일로 전환을 위하여 상당한 이용되지 않은 탄소 공급원을 표시한다.
프로토테카 균주는 임의의 상당한 양으로 또는 전혀 라피노스 및 스타키오스와 같은 올리고당을 이용할 수 없었다. 라피노스 및 스타키오스의 경우에, 수크로스 인버타제를 발현하는 유전자이식 균주(상기 기재함)가 수크로스의 α-갈락토실 유도체 내 프럭토스와 글루코스 사이의 α-연결을 가수분해하는 능력을 가지지만, 수크로스 인버타제가 이러한 당 내 남아있는 α-연결을 절단하지 않고, 결과 이당류가 이용가능하지 않기 때문에 올리고당의 나머지는 이용되지 않고 남아있다. 다른 실시형태에서, 본 발명의 재조합 프로토테카 세포는 수크로스 인버타제를 암호화하는 외인성 유전자와 α-갈락토시다제를 암호화하는 외인성를 둘 다 포함한다. 따라서 수크로스 인버타제와 α-갈락토시다제를 둘 다 발현하는 균주는 성분 모노머를 소모시키는 라피노스 및 스타키오스와 같은 올리고당을 완전히 가수분해할 것이다. 추가로, α-갈락토시다제 암호화 유전자는 형질전환을 위한 선택가능한 마커로 사용될 수 있다. 외인성 α-갈락토시다제 유전자를 함유하는 클론은 멜리비오스 상에서 성장하는 능력을 가질 것이다. 프로토테카 균주 내 사용을 위한 적합한 α-갈락토시다제의 예는 사카로마이세스 카를베겐시스(Saccharomyces carlbergensis)로부터 유래된 MEL1 유전자, 아스퍼질러스 니거(Aspergilus niger)로부터 유래된 AglC 유전자를 포함한다. 흥미롭게도, α-갈락토시다제 유전자는 해당 유전자가 프로토테카 균주 내 선호되는 코돈 사용빈도에 따라서 최적화될 때조차, 프로토테카 종에서 반드시 기능적인 것은 아니다. 이하의 예는 사카로마이세스 카를베겐시스의 코돈 최적화된 MEL1 유전자와 아스퍼질러스 니거로부터의 AglC 유전자에 의해 형질전환될 때 멜리비오스 상에서 성장하는 유전자이식 프로토테카 세포의 능력을 증명하지만, 더 고차의 식물, 시아몹시스 테트라고노볼라(Cyamopsis tetragonobola)(구아콩)로부터 유래된 α-갈락토시다제 암호화 유전자는 그렇지 않다.
3.
티아민 영양요구성 상보성
프로토테카 모리포미스를 포함하는 프로토테카 균주는 티아민 영양요구성인 것으로 공지되어 있는데(예를 들어 문헌[Ciferri, O. (1956) Nature, v.178, pp. 1475-1476] 참조), 이는 이들 균주가 성장을 위한 영양 배지에서 티아민을 필요로 한다는 것을 의미한다. 티아민 영양요구성은 티아민 생합성 경로에서 돌연변이 또는 효소 발현의 결여의 결과일 수 있다. 티아민 생합성 경로에서 없어진 효소(들)를 발현하는 상보적 유전자이식 균주는 그 다음에 첨가되는 티아민 없이 성장될 수 있으며, 따라서 영양 배지 비용을 감소시킬 뿐만 아니라 동물 영양 관점으로부터 더 바람직한 결과의 미세조류 바이오매스를 제공한다.티아민 생합성 경로 효소와 상보성은 또한 유전자이식 유전자가 티아민을 함유하지 않는 플레이트/배지 상에서 성장하는 능력을 부여함에 따라 선택가능한 마커로 사용될 수 있다.
실시형태에서, 본 발명의 재조합 프로토테카 세포는 티아민 생합성 경로 효소를 암호화하는 하나 이상의 외인성 유전자를 추가로 함유한다. 다른 실시형태에서, 본 발명의 재조합 프로토테카 세포는 조류, 식물 또는 시아노박테리아 공급원으로부터의 하이드록시메틸피리미딘 포스페이트 신타제를 암호화하는 외인성 유전자(예를 들어 서열번호 192)를 포함한다. 또 다른 실시형태에서, 하이드록시메틸피리미딘 포스페이트 신타제는 THIC 유전자에 의해 암호화된다. 또 다른 실시형태에서, THIC 유전자는 콕코믹사(Coccomyxa) C-169 THIC, 아라비돕시스 탈리아나(Arabidopsis thaliana) THIC, 시네코시스티스 속(Synechocystis sp .) PCC 6803 THIC, 또는 살모넬라 엔테리카 아종 엔테리카 혈청형 티피무리움 THIC(Salmonella enterica subsp . enterica serovar Typhimurium str . THIC)(서열번호 193)이다. 이하의 예는 회복된 티아민 영양원에 의한 프로토테카 모리포미스 UTEX 1435의 유전자 조작을 상술한다.
4.
다른 선택가능한 마커
임의의 매우 다양한 선택가능한 마커는 클로렐라와 같은 미생물 유기체를 형질전환하는데 유용한 이식유전자 구성체 내에서 사용될 수 있다. 적합한 선택가능한 마커의 예는 나이트레이트 환원효소 유전자, 하이그로마이신 포스포트랜스퍼라제 유전자(HPT), 네오마이신 포스포트랜스퍼라제 유전자, 및 플레오마이신에 내성을 부여하는 ble 유전자를 포함한다. 항생제에 대한 미세조류의 민감성을 결정하는 방법은 잘 공지되어 있다. 예를 들어 문헌[Mol Gen Genet. 1996 Oct 16;252(5):572-9]을 참조한다.
더 구체적으로, 문헌[Dawson et al. (1997), Current Microbiology 35:356-362(그것의 전문이 본 명세서에 참조로 포함됨)]은 NR-결여 클로렐라 소로키니아나 돌연변이체에 대한 선택가능한 마커로서 클로렐라 불가리스로부터의 나이트레이트 환원효소(NR)의 사용을 기재한다. 문헌[Kim et al. (2002), Mar. Biotechnol. 4:63-73(그것의 전문이 본 명세서에 참조로 포함됨)]은 클로렐라 엘립소이데아를 형질전환하기 위한 선택가능한 마커로서 HPT 유전자의 사용을 개시한다. 문헌[Huang et al. (2007), Appl. Microbiol. Biotechnol. 72:197-205(그것의 전문이 본 명세서에 참조로 포함됨)]은 클로렐라 속 DT에 대한 선택가능한 마커로서 Sh ble의 사용에 보고되었다.
V. 지질 경로 유전자조작
수크로스-함유 공급원료와 같은 공급원료를 사용하는 프로토테카와 같은 미생물 유기체(예를 들어, 미세조류, 유지성 효모, 진균 또는 박테리아)의 능력을 변형시키는 것에 추가로, 본 발명은 또한 생산된 지질의 성질 및/또는 비율이 변화하도록 변형된 재조합 미생물 유기체(예를 들어, 프로토테카)를 제공한다. 상기 경로는 추가로 또는 대안적으로 지방산 경로에서 지질 및 중간체의 효소적 가공을 통해 생성된 다양한 지질 분자의 성질 및/또는 비율이 변화되도록 변형될 수 있다. 다양한 양태에서, 본 발명의 재조합 미생물 유기체(예를 들어, 프로토테카 세포)는 이들의 비형질전환된 대응 세포에 비해 단위 부피당 및/또는 단위 시간당 최적화된 지질 수율, 탄소 쇄 길이(예를 들어, 재생가능한 디젤 생산 또는 지질 공급원료를 요구하는 산업적 화학 제품), 감소된 수의 이중 결합 또는 삼중 결합, 임의로 0개를 갖고 지질 또는 독특한 지질 집단의 수소:탄소 비율을 증가시킨다. 추가로, 바람직한 탄화수소를 생성하는 미생물 유기체는 더 높은 양으로, 또는 더 큰 특이성을 가지는 이러한 성분을 생성하도록 유전자조작될 수 있다.
미세조류의 경우에, 일부 야생형 세포는 이미 양호한 성장 특징을 가지지만, 원하는 유형 또는 양의 지질을 생성하지 않는다. 예는, 제한 없이, 피로보트라이스, 포르미디움, 아그메넬룸, 카테리아, 레포신클리스, 피로보트라이스, 니츠키아, 레포신클리스, 아나배나, 유글레나, 스피로지라, 클로로코쿰, 테트래드론, 오실라토리아, 파구스 및 클로로고늄을 포함하며, 이들은 도시하수 또는 폐수에서 성장하는 바람직한 성장 특징을 가진다. 이들 세포뿐만 아니라 클로렐라, 프로토테카 및 다른 미생물 종은 개선된 지질 생성 특징을 가지도록 유전자조작될 수 있다. 원하는 특징은 단위 부피 당 및/또는 단위 시간 당 지질 수율, 탄소 쇄 길이(예를 들어 바이오디젤 생성을 위해 또는 탄화수소 공급원료를 필요로 하는 산업적 용도를 위해)를 최적화하는 것, 이중 또는 삼중 결합 수를 선택적으로 0으로 감소하는 것, 고리 및 고리형 구조를 제거하거나 없애는 것, 및 특정 지질 종의 또는 별개의 지질 집단의 수소:탄소 비를 증가시키는 것을 포함한다. 추가로, 적합한 탄화수소를 생성하는 미세조류는 또한 심지어 더 바람직한 탄화수소 결과를 가지도록 유전자조작될 수 있다. 이러한 미세조류의 예는 클로렐라속 및 프로토테카 속의 종을 포함한다.
특정 실시형태에서, 지방산 합성에 대한 대사에서 분지 지점을 제어하는 하나 이상의 중요한 효소는 지질 생성을 개선하도록 상향조절 또는 하향조절되었다. 상향 조절은, 예를 들어 관심의 효소를 암호화하는 유전자가 발현되는 발현 구성체를 가지는 세포를 형질전환하는 것에 의해, 예를 들어 전사를 증가시키는 강한 프로모터 및/또는 인핸서 구성요소를 사용하여 달성될 수 있다. 이러한 구성체는 형질전환체가 선택될 수 있도록 하기 위한 선택가능한 마커를 포함하는데, 이는 구성체의 증폭 및 암호화된 효소 발현 수준의 증가를 초래할 수 있다. 본 발명의 방법에 따르는 상향 조절에 적합한 효소의 예는 파이루베이트를 아세틸-CoA로 전환하는 역할을 하는 파이루베이트 탈수소효소를 포함한다(예를 들어, 미세조류의 일부는 Genbank 등록번호 NP_415392; AAA53047; Q1XDM1; 및 CAF05587을 포함한다). 파이루베이트 탈수소효소의 상향조절은 아세틸-CoA의 생산을 증가시키고, 이에 의해 지방산 합성을 증가시킬 수 있다. 아세틸-CoA 카복실라제는 지방산 합성 내 초기 단계를 촉매한다. 따라서, 이 효소는 지방산의 생성을 증가시키도록 상향조절될 수 있다(예를 들어 미세조류의 일부는 Genbank 등록번호 BAA94752; AAA75528; AAA81471; YP_537052; YP_536879; NP_045833; 및 BAA57908을 포함한다). 지방산 생성은 또한 지방산 합성 동안 성장하는 아실 쇄를 운반하는 아실 운반체 단백질(acyl carrier protein, ACP)의 상향 조절에 의해 증가될 수 있다(예를 들어, 미세조류의 일부는 Genbank 등록번호 A0T0F8; P51280; NP_849041; YP_874433를 포함한다). 글라이세롤-3-포스페이트 아실트랜스퍼라제는 지방산 합성의 속도-제한 단계를 촉매한다. 이 효소의 상향 조절은 지방상 생성을 증가시킬 수 있다(예를 들어 일부 미세조류는 Genbank 등록번호 AAA74319; AAA33122; AAA37647; P44857; 및 ABO94442를 포함한다).
유전자의 상향- 및/또는 하향-조절은 지방산 생합성 경로의 유전자 발현을 제어하는 전체적 조절자에 적용될 수 있다. 따라서, 지방산 합성의 하나 이상의 전체 조절자는 적절하게 상향- 또는 하향-조절되어 다수의 지방산 합성 유전자 발현을 각각 억제하거나 향상시키고, 궁극적으로 지질 생성을 증가시킬 수 있다. 예는 스테롤 조절 요소 결합 단백질(sterol regulatory element binding protein, SREBP), 예컨대 SREBP-1a 및 SREBP-1c(예를 들어 Genbank 등록번호 NP_035610 및 Q9WTN3 참조)을 포함한다.
본 발명은 또한, 예를 들어, 지방 아실-ACP 티오에스터라제(예를 들어, 카파리스 칼로필라(C. callophylla)(서열번호 145 및 서열번호 146; 또한 표 4를 참조), 지방 아실-CoA/알데하이드 환원효소(표 6 참조), 지방 아실-CoA 환원효소(표 7 참조), 지방 알데하이드 데카보닐라제(표 8 참조), 지방 알데하이드 환원효소, 불포화효소(예컨대 스테아릴-ACP 불포화효소(예를 들어, 코돈 최적화된 리시누스 코뮤니스(R. communis) SAD, 서열번호 147 및 서열번호 148) 및 지방 아실 불포화효소 및 스쿠알렌 신타제(GenBank 등록번호 AF205791)와 같은 지질 변형 효소를 암호화하는 하나 이상의 외인성 유전자를 함유하도록 변형된 재조합 미생물 유기체(예를 들어, 프로토테카 세포)를 제공한다. 일부 실시형태에서, 지방 아실-ACP 티오에스터라제 및 자연적으로 공동발현된 아실 운반체 단백질을 암호화하는 유전자는 프로토테카 세포로, 선택적으로 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께 형질전환된다. 다른 실시형태에서, ACP 및 지방 아실-ACP 티오에스터라제는 서로에 대한 친화성을 가질 수 있는데, 이는 이들이 특정 조직 또는 유기체 중에서 자연적으로 동시 발현되든 발현되지 않든 2개가 함께 본 발명의 미생물 및 방법에 사용될 때 이점을 부여한다. 따라서, 본 발명은 ACP로부터 길이 특이적 탄소 쇄의 절단을 촉진시키기 위해 서로 간에 상호작용하는 친화성을 공유하는 것뿐만 아니라 이들 효소의 동시 발현된 쌍 둘 다를 고려한다.
또 다른 실시형태에서, 불포화효소를 암호화하는 외인성 유전자는 지질 포화와 관련하여 변형을 제공하기 위해 다른 지질 변형 효소를 암호화하는 하나 이상의 유전자와 함께 미생물 유기체(예를 들어, 프로토테카 세포)로 형질전환된다. 다른 실시형태에서, 내인성 불포화효소는 미생물 유기체(예를 들어 프로토테카 세포)에서 과발현된다(예를 들어 해당 유전자의 추가적인 복제물이 없는 도입을 통해) 과발현된다. 스테아로일-ACP 불포화효소(예를 들어, 문헌[GenBank 등록번호 제AAF15308호; 제ABM45911호; 및 제AAY86086호])는, 예를 들어 스테아로일-ACP의 올레오일-ACP로의 전환을 촉매한다. 상기 유전자의 상향 조절은 세포에 의해 생산된 단일불포화 지방산의 비율을 증가시킬 수 있는 반면; 하향 조절은 단일불포화 비율을 감소시킬 수 있다. 예시적 목적을 위해, 스테아릴-ACP 불포화효소(SAD)는 C18:0 전구체로부터 C18:1 지방산의 합성을 초래한다. 불포화효소의 다른 패밀리는 델타 12 지방산 불포화효소(Δ12 FAD)를 포함하는 지방 아실 불포화효소(FAD)이다. 이들 불포화효소는 또한 지질 포화에 대해 변형을 제공한다. 예시적 목적을 위해, 델타 12 지방산 불포화효소는 C18:1 전구체로부터 C18:2 지방산의 합성을 초래한다. 유사하게, ω-6 지방산 불포화효소, ω-3 지방산 불포화효소, 또는 ω-6-올레이트 불포화효소와 같은 하나 이상의 글라이세로지질 불포화효소의 발현은 포화 지방산에 대한 불포화 지방산의 비율을 변화시키기 위해 제어될 수 있다. 일부 실시형태에서, 불포화효소는 불포화효소가 특정 탄소-길이 기질 또는 특정 범위 내 탄소-길이를 갖는 기질 내에서 위치 특이적 변형을 만들 수 있도록 목적하는 탄소 쇄 길이와 관련하여 선택될 수 있다. 다른 실시형태에서, 원하는 지방산 프로파일이 단일불포화물(예컨대 C16:1 및/또는 C18:1)에서 증가된다면, SAD의 과발현 또는 이종성 SAD의 발현은 지방 아실 불포화효소(FAD)의 침묵 또는 불활성화(예를 들어, 돌연변이, RNAi, 내인성 불포화효소 유전자의 녹아웃 등을 통해)와 결합될 수 있다.
다른 실시형태에서, 미생물 유기체(예를 들어 프로토테카 세포)는 돌연변이된 불포화효소 유전자를 가지도록 변형되되, 해당 돌연변이는 유전자 또는 불포화효소 불활성을 제공한다. 일부 경우에, 해당 돌연변이 내인성 불포화효소 유전자는 지방산 불포화효소(FAD)이다. 다른 경우에, 돌연변이된 내인성 불포화효소 유전자는 스테라일 아실 운반체 단백질 불포화효소(SAD)이다. 이하의 실시예 11은 스테아릴-ACP 불포화효소 및 델타 12 지방산 불포화효소의 표적화된 절제 또는 녹아웃을 기재한다.
일부 경우에, 원하는 지질 프로파일을 생성하는 유전자이식 세포를 달성하기 위한 하나 이상의 유전자 조작 기법과 쌍을 이루기에 유리할 수 있다. 한 실시형태에서, 미생물 유기체(예를 들어, 프로토테카 세포)는 돌연변이된 내인성 불포화효소 유전자 및 하나 이상의 외인성 유전자를 포함한다. 비제한적 예에서, 돌연변이된 내인성 불포화효소 유전자를 갖는 프로토테카 세포는 또한 외인성 지방 아실-ACP 티오에스터라제 유전자 및/또는 수크로스 인버타제 유전자를 발현할 수 있다. 이하의 실시예 11은 내인성 SAD의 표적화된 절제 또는 녹아웃을 함유하며 유전자이식 프로토테카 세포를 기재하는데, 이는 티오에스터라제 및 수크로스 인버타제를 선호하는 녹나무 C14를 발현한다. 이 경우에, 유전자이식 프로토테카 세포는 탤로에서 발견되는 지질 프로파일에 거의 근접하는 지질 프로파일을 생성한다. 탤로는 제공된 소고기 또는 양고기 지방으로부터 전형적으로 유래되며, 실온에서 고체이고, 음식, 화장품, 및 화학물질 산업에서 다양한 용도로 이용된다. 탤로의 지방산 프로파일은 4% C14:0; 26% C16:0; 3% C16:1; 14% C18:0; 41% C18:1; 3% C18:2; 및 1% C18:3이다. 이하의 실시예 11에서 나타내는 바와 같이, 내인성 SAD의 표적화된 절제 또는 녹아웃을 갖는 유전자이식 프로토테카 세포의 클론 및 녹나무 C14-선호 티오에스터라제의 발현은 다음의 지질 프로파일을 가진다: 1% C12 미만 및 더 짧은 탄소 쇄 길이 지방산; 2.74% 내지 6.13% C14:0; 23.07% 내지 25.69% C16:0; 7.02% 내지 11.08% C18:0; 42.03% 내지 51.21% C18:1; 및 9.37% 내지 13.45% C18:2(면적%로 표현). 일부 경우에, 유전자이식 프로토테카 세포는 다음의 지질 프로파일을 가진다: 3-5% C14:0; 25-27% C16:0; 10-15% C18:0; 및 40-45% C18:1.
따라서, 특정 실시형태에서, 본 발명의 미생물은 아실-ACP 티오에스터라제, 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 알데하이드 데카보닐라제, 또는 자연적으로 공동 발현된 아실 운반체 단백질로부터 선택된 하나 이상의 외인성 유전자를 발현하도록 유전자 조작된다. 적합한 발현 방법은 특히 유도성 발현 및 구분된 발현을 포함하는 리파제 유전자의 발현에 대해 상기 기재되었다. 지방 아실-ACP 티오에스터라제는 지질 합성 동안 아실 운반체 단백질(ACP)로부터 지방산을 절단한다. 추가적 효소 처리를 통해, 그 다음에 절단된 지방산은 조효소와 조합되어 아실-CoA 분자를 수득한다. 이런 알데하이드를 수득하기 위한 아실-CoA는 지방 아실-CoA 환원효소의 효소 활성을 위한 기질뿐만 아니라 알코올을 수득하기 위한 지방 아실-CoA/알데하이드 환원효소이다. 상기 확인한 지방 아실-CoA 환원효소의 작용에 의해 생성된 알데하이드는 알코올을 수득하기 위한 지방 알데하이드 환원효소, 또는 알칸 또는 알켄을 수득하기 위한 지방 알데하이드 데카보닐라제 중 하나에 의한 추가 효소 활성을 위한 기질이다.
일부 실시형태에서, 본 명세서에 기재된 방법에 의해 만들어지는 지방산, 글라이세로지질, 또는 대응하는 1차 알코올, 알데하이드, 알칸 또는 알켄은 8, 10, 12, 또는 14개의 탄소 원자를 함유한다. 디젤, 바이오디젤, 재생 디젤, 또는 제트 연료의 생산을 위한 바람직한 지방산, 또는 산업적 용도를 위한 대응하는 1차 알코올, 알데하이드, 알칸 및 알켄은 8 내지 14개의 탄소 원자를 함유한다. 특정 실시형태에서, 상기 지방산뿐만 아니라 다른 대응하는 탄화수소 분자는 포화되고(탄소-탄소 이중 또는 삼중 결합이 없다); 단일불포화되며(하나의 이중 결합); 다중불포화되고(2 이상의 이중 결합); 선형(고리형이 아님) 또는 분지형이다. 연료 생산을 위해, 더 큰 포화도가 바람직하다.
상기 직접 기재된 효소는 특정 수의 탄소 원자를 함유하는 기질의 가수분해에 대해 우선적인 특이성을 갖는다. 예를 들어, 지방 아실-ACP 티오에스터라제는 ACP로부터 12개의 탄소 원자를 갖는 지방산을 절단하는 것을 선호할 수 있다. 일부 경우에, ACP 및 쇄 특이적 티오에스터라제는 이들이 조합체로서 특히 유용하게 하는 서로에 대해 친화성을 가질 수 있다(예를 들어, 외인성 ACP 및 티오에스터라제 유전자는 이들이 유래하는 특정 조직 또는 유기체에서 자연적으로 동시 발현될 수 있다). 따라서, 다양한 양태에서, 본 발명의 재조합 프로토테카 세포는 기질내 함유된 탄소 원자수와 관련하여 효소적 활성을 촉매하기 위한 특이성(예를 들어, ACP로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알코올로 환원, 또는 알데하이드의 알칸으로 전환)을 갖는 단백질을 암호화하는 외인성 유전자를 함유할 수 있다. 다양한 양태에서 효소적 특이성은 8 내지 34개의 탄소 원자, 바람직하게는 8 내지 18개의 탄소 원자 및 더 바람직하게는 8 내지 14개의 탄소 원자를 갖는 기질에 대한 것일 수 있다. 바람직한 특이성은 즉 18개 탄소 원자보다 적은, 즉, 12개를 갖는 기질에 대한 것이다.
본 발명의 미생물 및 방법과 함께 사용하기에 적합한 다른 지방 아실-ACP 티오에스터라제는 표 4에 열거된 것을 제한 없이 포함한다
지방 아실-ACP 티오에스터라제 및 GenBank 등록번호 |
캘리포니아 월계수 지방 아실-ACP 티오에스터라제(GenBank #AAC49001)(서열번호 203) 녹나무 지방 아실-ACP 티오에스터라제(GenBank #Q39473) 캘리포니아 월계수 지방 아실-ACP 티오에스터라제(GenBank #Q41635) 육두구나무(Myristica fragrans) 지방 아실-ACP 티오에스터라제(GenBank #AAB71729)(서열번호 224) 육두구나무 지방 아실-ACP 티오에스터라제(GenBank #AAB71730)(서열번호 222) 인도네시아 기름야자 지방 아실-ACP 티오에스터라제(GenBank #ABD83939)(서열번호 204) 인도네시아 기름야자 지방 아실-ACP 티오에스터라제(GenBank #AAD42220) 팝퓰러스 토멘토사(Populus tomentosa) 지방 아실-ACP 티오에스터라제(GenBank #ABC47311)(서열번호 207) 아라비돕시스 탈리아나 지방 아실-ACP 티오에스터라제(GenBank #NP_172327)(서열번호 208) 아라비돕시스 탈리아나 지방 아실-ACP 티오에스터라제(GenBank #CAA85387)(서열번호 209) 아라비돕시스 탈리아나 지방 아실-ACP 티오에스터라제(GenBank #CAA85388)(서열번호 210) 멕시코목화(Gossypium hirsutum) 지방 아실-ACP 티오에스터라제(GenBank #Q9SQI3)(서열번호 211) 쿠페아 란세올라타(Cuphea lanceolata) 지방 아실-ACP 티오에스터라제(GenBank #CAA54060)(서열번호 212) 쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #AAC72882)(서열번호 202) 쿠페아 칼로필라 아종 메조스테몬(Cuphea calophylla subsp. mesostemon) 지방 아실-ACP 티오에스터라제(GenBank #ABB71581)(서열번호 213) 쿠페아 란세올라타 지방 아실-ACP 티오에스터라제(GenBank #CAC19933) 인도네시아 기름야자 지방 아실-ACP 티오에스터라제(GenBank #AAL15645)(서열번호 206) 쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #Q39513) 멕시코 목화 지방 아실-ACP 티오에스터라제(GenBank #AAD01982)(서열번호 214) 비티스 비니훼라(Vitis vinifera) 지방 아실-ACP 티오에스터라제(GenBank #CAN81819)(서열번호 215) 가르시니아 망고스타나 지방 아실-ACP 티오에스터라제(GenBank #AAB51525) 브라씨카 준세아(Brassica juncea) 지방 아실-ACP 티오에스터라제(GenBank #ABI18986)(서열번호 216) 마드후카 롱기폴리아(Madhuca longifolia) 지방 아실-ACP 티오에스터라제(GenBank #AAX51637)(서열번호 217) 브라씨카 나푸스(Brassica napus) 지방 아실-ACP 티오에스터라제(GenBank #ABH11710) 오리자 사티바(Oryza sativa)(인디카(indica) 품종 그룹) 지방 아실-ACP 티오에스터라제(GenBank #EAY86877)(서열번호 218) 오리자 사티바(자포니카(japonica) 품종 그룹) 지방 아실-ACP 티오에스터라제(GenBank #NP_001068400)(서열번호 219) 오리자 사티바(인디카 품종 그룹) 지방 아실-ACP 티오에스터라제(GenBank #EAY99617)(서열번호 220) 쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #AAC49269) 미국 느릅나무 지방 아실-ACP 티오에스터라제(GenBank #AAB71731) 쿠페아 란세올라타 지방 아실-ACP 티오에스터라제(GenBank #CAB60830)(서열번호 221) 쿠페아 팔루스트리스 지방 아실-ACP 티오에스터라제(GenBank #AAC49180) 아이리스 게르마니카 지방 아실-ACP 티오에스터라제(GenBank #AAG43858) 아이리스 게르마니카 지방 아실-ACP 티오에스터라제(GenBank #AAG43858.1) 쿠페아 팔루스트리스 지방 아실-ACP 티오에스터라제(GenBank #AAC49179) 육두구나무 지방 아실-ACP 티오에스터라제(GenBank# AAB71729) 육두구나무 지방 아실-ACP 티오에스터라제(GenBank# AAB717291.1) 쿠페아 후커리아나 지방 아실-ACP 티오에스터라제(GenBank #U39834)(서열번호 197) 캘리포니아 월계수 지방 아실-ACP 티오에스터라제(GenBank # M94159)(서열번호 285) 녹나무 지방 아실-ACP 티오에스터라제(GenBank #U31813)(서열번호 223) 쿠페아 라이티 지방 아실-ACOP 티오에스터라제(GenBank #U56103)(서열번호 183) 피마자(Ricinus communis) 지방 아실-ACP 티오에스터라제(GenBank #ABS30422)(서열번호 198) |
하기 실시예는 프로토테카 종 중에서 쿠페아 후커리아나, 캘리포니아 월계수, 녹나무, 쿠페아 팔루스트리스, 쿠페아 란세올라타, 아이리스 게르마니카, 미리스티카 프라그란스 및 미국 느릅나무 유래의 이종성 지방 아실-ACP 티오에스터라제의 성공적인 표적화 및 발현을 기재한다. 추가로, 지방산 프로파일 중의 변형은 숙주 세포 발현에서 이들 이종성 지방 아실-ACP 티오에스터라제 내에서 확인되었다. 이들 결과는 일반적으로 조류와 고등 식물 티오에스터라제 간에 서열 상동성의 부재 및 프로토테카 모리포르미스 지방 아실-ACP 티오에스터라제와 상기 열거된 이종성 지방-아실-ACP 티오에스터라제 간의 서열 상동성의 부재를 고려할 때 전혀 예상치 못한 것이었다.
예에서 나타내는 바와 같이 프로토테카 중에서 이들 이종성 티오에스터라제의 발현은 상업적 종자 작물로부터 현재 입수가능하지 않은 정말 독특한 지방산 프로파일을 갖는 오일/지질, 몇몇 종자 작물 오일의 배합도 생성할 수 있는 이식유전자 미세조류를 만들어낸다. 표 5는 보통의 상업적 종자 오일의 지방산 프로파일을 나타낸다. 이하의 모든 상업적 종자 오일 데이터는 문헌[US Pharmacopeias Food and Chemicals Codes, 7th Ed. 2010-2011]으로부터 편집된다. 탤로 데이터는 문헌[National 부터 얻는다.
예로서, 이들 보통의 종자 오일 중 어떤 것 고량의 C8 또는 C10 지방산을 함유하지 않으며, 코코넛 오일 및 팜커넬 오일은 가장 큰 공급원이 되지만 둘의 비는 1:1(C8:C10 지방산)이다. 예에서 나타내는 바와 같이, 쿠페아 팔루스트리스 C8 선호 티오에스터라제로 형질전환된 프로토테카는 12% 이상의 C8 지방산 수준을 달성할 수 있을 뿐만 아니라 C8:C10 지방산의 비는 약 5:1이 되었다. 지방산 수준의 변화는 다양한 상업적 용도를 위한 맞춤 지방산 프로파일을 함유하는 오일을 생성하는데 유용하다. 추가적으로, 상이한 지방산 쇄 길이 사이 비의 변화는 더 저렴한 화학 공정(예컨대 에스터화, 증류, 부분 분리, 및 재에스터화)을 통하지 않은 오일 중에서 상업적으로 입수가능하지 않은 어떤 것에 있다. 다른 예에서, 팜 오일은 가장 높은 C16:0 지방산(32-47%) 함유 오일이지만, 팜 오일은 C14:0 지방산이 거의 없다. 미국 느릅나무 티오에스터라제를 함유하는 프로토테카는 약 33-38% C16:0 지방산 및 10-16% C14:0 지방산(약 2:1 C16:0 대 C14:0 비)을 달성하였다. 16:0 지방산이 높은 종자 오일은 보통 많은 14:0 지방산을 함유하지 않기 때문에 상업적 수준에서 존재하는 오일의 배합을 통해서 이런 지방산 프로파일은 달성가능하지 않다.
이하의 예는 또한 처음으로 하나의 클론에서 적어도 2개의 지방 아실-ACP 티오에스터라제의 성공적인 표적화 및 발현을 기재한다. 지방산 프로파일의 변형은 이들 클론에서 확인되었고, 2개의 티오에스터라제가 하나의 클론 내에서 공동 발현된 것에 의존하여, 지방산 프로파일은 상이한 방법으로 영향을 미쳤다. 예로서, 상기 표 5로부터, 코코넛 오일 및 팜커넬 오일은 거의 3:1의 C12:C14 비를 가진다. 이하의 예에서 기재하는 바와 같이, 2개의 이종성 티오에스터라제 유전자를 함유하는 프로토테카 형질전환체는 거의 5:1의 C12:C14 지방산 수준을 생성할 수 있었다. C12:C14 지방산 비의 이런 종류는, 지금까지 상업적 수준에서 달성가능하지 않았다(즉, 종자 오일의 배합을 통함).
유전자이식 미세조류에 의해 생성된 오일의 다른 신규한 양태는 지방산의 포화정도이다. 팜 오일은 52% 내지 48의 포화 내지 불포화를 갖는 현재 포화 오일의 가장 큰 공급원이다. 이하의 예에서 나타내는 바와 같이, 미국 느릅나무 및 녹나무로부터 유래된 이종성 티오에스터라제를 갖는 프로토테카는 그것이 생성된 오일 중에서 60% 이상의 전체 포화 수준을 달성하였다. 또한 이하의 예에서, 미국 느릅나무로부터 유래된 이종성 티오에스터라제를 갖는 프로토테카는 그것이 생성된 오일 중에서 86% 이상의 전체 포화 수준을 달성하였다는 것을 나타내었다.
본 발명의 미생물 및 방법에 의한 사용에 적합한 지방 아실-CoA/알데하이드 환원효소는, 제한 없이, 표 6에서 열거된 것을 포함한다.
본 발명의 미생물 및 방법과 함께 사용에 적합한 지방 아실-CoA 환원효소는 표 7에서 열거된 것을 포함한다.
본 발명의 미생물 및 방법과 함께 사용에 적합한 지방 알데하이드 데카보닐라제는, 제한 없이, 표 8에서 열거되는 것을 포함한다.
자연적으로 공동발현된 지방 아실-ACP 티오에스터라제 및 아실-ACP 티오에스터라제 및 아실 운반체 단백질의 조합은 본 발명의 미생물 및 방법과 함께 사용에 적합하다.
탄화수소 또는 지질 변형 효소의 추가의 예는 미국 특허 제6,610,527호; 제6,451,576호; 제6,429,014호; 제6,342,380호; 제6,265,639호; 제6,194,185호; 제6,114,160호; 제6,083,731호; 제6,043,072호; 제5,994,114호; 제5,891,697호; 제5,871,988호; 제6,265,639호 중 어느 하나에 포함되거나 참조되거나, 함유되거나 참조된 핵산 서열에 의해 암호화된 아미노산 서열을 포함하고 추가로 GenBank 등록 번호 AAO18435; ZP_00513891; Q38710; AAK60613; AAK60610; AAK60611; NP_113747; CAB75874; AAK60612; AAF20201; BAA11024; AF205791; 및 CAA03710에 기재되어 있다.
지질 생합성 경로 내 다른 효소는 또한 본 발명의 미생물 및 방법과 함께 사용에 적합하다. 예를 들어, 케토 아실-ACP 신타제(keto acyl-ACP synthase, Kas) 효소는 지질 생합성 경로 내에서 상기 열거된 효소의 일부와 함께 작동한다. 상이한 부류의 Kas 효소가 있으며: Kas I은 계속 늘어나는 아실 ACP 쇄 및 말로닐-ACP 사이의 계속적인 축합 단계에 참여한다. Kas II는 전형적으로 말로닐-ACP를 포함하는 C16:0-ACP 내지 C18:0-ACP를 유발하는 최종 축합 단계에 참여한다. 이와 같이, 고차의 식물 및 일부 미세조류 종/균주에서 이는 C16-C18:0 지방산(및 그것의 불포화 유도체)을 우선적으로 합성하며, Kas II 효소는 FatA 유전자의 생성물(아실-ACP 티오에스터라제)과 상호작용한다.
아실-ACP 티오에스터라제는 더 고차 식물(및 일부 미세조류 종) 지방산 생합성의 종결자이며, 대부분의 식물 종에서, 이는 FatA 유전자 패밀리의 구성원에 의해 수행되고, 전체 역할은 C16:0 대 C18:0 단계에서 연장을 종결하는 것이다. 더 짧은 지방산을 합성하는 종에서(예컨대 쿠페아, 엘래이스, 미리스티카, 또는 엄벨루라리아), FatB 유전자에 의해 암호화되는 아실-ACP 티오에스터라제의 상이한 군은 이 종결 단계를 수행한다(예를 들어 코코스 누시페라 FatB3-B의 코돈 최적화된 암호 영역, 서열번호 189). Kas II 효소와 아실-Acp 티오에스터라제 사이의 상호작용은 지방산 쇄 연장의 정확한 종결을 위해 중요하다. 결과로서, 더 짧은 쇄 지질 생합성이 가능한 FatB 유전자가 발달된 고차 식물 종(및 미세조류 종)에서 Kas IV 유전자로 칭해지는 Kas 유전자의 추가적인 부류의 대응하는 공진화(co-evolution)가 있었다. Kas IV 유전자는 길이로 4-14개 탄소인 특정 크기 범위의 지방산의 쇄 길이 연장을 초래한다.
본 발명의 미생물 및 방법과 사용하기에 적합한 다른 효소는 표 4, 6 내지 8에 열거된 단백질 중 하나와 적어도 70%의 아미노산 동일성을 갖고 대응하는 목적하는 효소 활성(예를 들어, 아실 운반 단백질로부터 지방산의 절단, 아실-CoA의 알데하이드 또는 알코올로의 환원 또는 알데하이드의 알칸으로의 전환)을 나타내는 것들을 포함한다. 추가의 양태에서, 효소적 활성은 상기된 서열 중 하나와 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 99%의 동일성을 갖는 서열 중에 존재하고 이 모두는 완전하게 제시된 것처럼 본 명세서에 참조로서 인용된다.
발현되는 외인성 유전자의 목적하는 조합을 선택함에 의해, 수성 바이오매스로부터 추출될 수 있는 미생물에 의해 생산되는 생성물을 절단 개조할 수 있다. 예를 들어, 상기 미생물은 다음을 함유할 수 있다: (i) 지방 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자; 및, 임의로, (ii) 천연적으로 동시 발현된 아실 운반 단백질 또는 지방 아실-ACP 티오에스터라제(또는 역으로)에 대해 친화성을 또한 갖는 아실 운반 단백질; 및, 임의로, (iii) 지방 아실-CoA/알데하이드 환원효소 또는 지방 아실-CoA 환원효소를 암호화하는 외인성 유전자; 및, 임의로, (iv) 지방 알데하이드 환원효소 또는 지방 알데하이드 데카보닐라제를 암호화하는 외인성 유전자. 본 명세서에 기재된 배양 조건하의 미생물은 ACP에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스터라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 효소적 가공을 통해 지방 아실-CoA 분자를 생산한다. 존재하는 경우, 지방 아실-CoA/알데하이드 환원효소는 아실-CoA의 알코올로의 환원을 촉매한다. 유사하게, 존재하는 경우 지방 아실-CoA 환원효소는 아실-CoA의 알데하이드로의 환원을 촉매한다. 지방 아실-CoA 환원효소를 암호화하는 외인성 유전자가 존재하고 알데하이드 생성물을 생산하기 위해 발현되는 상기 양태에서, 제3 외인성 유전자에 의해 암호화된 지방 알데하이드 환원효소는 알데하이드의 알코올로의 환원을 촉매한다. 유사하게, 지방 알데하이드 데카보닐라제는 존재하는 경우 알데하이드의 알칸 또는 알켄으로의 전환을 촉매한다.
다른 실시형태에서, 미생물은 (i) 지방 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자; (ii) 선택적으로, 자연적으로 공동 발현된 아실 운반체 단백질 또는 지방산 아실-ACP 티오에스터라제에 대한 친화도를 가지는 아실 운반체 단백질; (iii) 돌연변이된 내인성 불포화효소 유전자(돌연변이는 불포화효소 녹아웃과 같은 불포화효소 유전자 또는 불포화효소 단백질 불활성을 제공한다); (iv) 내인성 스테아릴 아실 운반체 단백질 불포화효소의 과발현 또는 이종성 SAD의 발현; 및 (v) 앞서 언급한 것의 임의의 조합을 함유할 수 있다.
아실 ACP 티오에스터라제와 같은 이러한 효소를 암호화하는 유전자는 클로렐라 프로토테코이데스와 같이 상당한 지질생산을 나타내는 것으로 이미 공지된 세포로부터 수득될 수 있다. 지질 생산에 역할을 하는 것으로 이미 공지된유전자, 예를 들어, 이중 결합을 포화시키는 효소를 암호화하는 유전자를 개별적으로 수용 세포에 형질전환시킬 수 있다. 그러나, 본 발명을 실시하기 위해 어느 유전자가 요구되는지에 관해 우선적으로 추측할 필요는 없다. 미세조류 내 지질 생산을 변형(개선)시킬 수 있는 유전자를 동정하는 방법은 국제특허출원 공개 번호 제2008/151149호에 기재되어 있다.
따라서, 본 발명은 동일 종의 야생형 세포에 비해 변화된 수준에서 지질 경로 효소를 발현하도록 유전자 조작된 미생물 유기체(예를 들어, 프로토테카 세포)를 제공한다. 일부 경우에, 상기 세포는 세포가 둘 다 동일한 조건하에서 성장하는 경우 야생형 세포에 비해 더 많은 세포를 생산한다. 일부 경우에, 상기 세포는 야생형 세포보다 높은 수준에서 지질 경로 효소를 발현하도록 유전자 조작되고/되거나 선택되었다. 일부 경우에, 지질 경로 효소는 파이루베이트 탈수소효소, 아세틸-CoA 카복실라제, 아실 운반 단백질 및 글라이세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 그룹으로부터 선택된다. 일부 경우에, 상기 세포는 야생형 세포 보다 낮은 수준에서 지질 경로 효소를 발현하도록 유전자 조작되고/되거나 선택된다. 세포가 보다 낮은 수준에서 지질 경로 효소를 발현하는 하나 이상의 실시형태에서, 지질 경로 효소는 시트레이트 신타제를 포함한다.
일부 실시형태에서, 상기 세포는 야생형 세포와 비교하여 변화된 수준에서 지방산 합성의 범용 조절제를 발현하도록 유전자 조작되고/되거나 선택됨으로써 다수의 지방산 합성 유전자의 발현 수준은 야생형 세포와 비교하여 변화된다. 일부 경우에, 지질 경로 효소는 지방산을 변형시키는 효소를 포함한다. 일부 경우에, 지질 경로 효소는 스테아로일-ACP 불포화효소 및 글라이세로지질 불포화효소로부터 선택된다. 일부 경우에, 해당 세포는 유전자 조작되고/되거나 선택되어 더 낮은 지질 경로 효소 수준을 발현하거나, 특정 지질 경로를 전혀 발현하지 않는다(즉, 여기서 지질 경로 효소는 녹아웃이었거나, 외인성 유전자로 대체되었다).
일부 미세조류는 예를 들어 다당류와 같은 비지질 대사산물의 상당한 양을 생성한다. 다당류 생합성이 세포에 대해 이용가능한 전체 대사 에너지의 상당 부분을 사용할 수 있기 때문에, 지질-생성 세포의 돌연변이유발 다음에 감소된 또는 제거된 다당류 생성을 위한 스크리닝은 더 높은 지질 수율을 생성할 수 있는 신규한 균주를 만들어낸다.
다른 실시형태에서, 본 발명은 하나 이상의 외인성 유전자를 함유하는 오일 생산 미생물에 관한 것이고 여기서, 외인성 유전자는 지방 아실-ACP 티오에스터라제, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 아실-CoA/알데하이드 환원효소, 지방 알데하이드 데카보닐라제, 불포화효소 및 아실 운반 단백질로 이루어진 그룹으로부터 선택된 단백질(들)을 암호화한다. 다른 실시형태에서, 외인성 불포화효소 유전자는 상기 외인성 유전자 중 하나 이상을 함유하는 미생물 내에서 과발현된다. 한 실시형태에서, 외인성 유전자는 자극에 응하여 유도성이거나 억제성인 프로모터에 작동가능하게 연결되어 있다. 일부 경우에, 상기 자극은 외부적으로 제공되는 소분자, 가열, 냉각 및 배양 배지에서 제한되거나 부재인 질소로 이루어진 군로부터 선택된다. 일부 경우에, 외인성 유전자는 세포 구획에서 발현된다. 일부 경우에, 세포 구획은 엽록체, 플라스티드 및 미토콘드리아로 이루어진 그룹으로부터 선택된다. 일부 경우에 미생물은 프로토테카 모리포미스, 프로토테카 크루가니, 프로토테카 스타그노라 또는 프로토테카 좁피이다.
한 실시형태에서, 외인성 유전자는 지방산 아실-ACP 티오에스터라제를 암호화한다. 일부 경우에, 외인성 유전자에 의해 암호화된 티오에스터라제는 아실 운반 단백질(ACP)로부터 8 내지 18개의 탄소 지방산의 절단을 촉매한다. 일부 경우에, 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 10 내지 14개 탄소 지방산의 절단을 촉매한다. 하나의 양태에서, 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 12-탄소 지방산의 절단을 촉매한다.
한 실시형태에서, 외인성 유전자는 지방 아실-CoA/알데하이드 환원효소를 암호화한다. 일부 경우에, 외인성 유전자에 의해 암호화되는 환원효소는 8 내지 18-탄소 지방 아실-CoA를 대응하는 1차 알코올로 환원을 촉매한다. 일부 경우에, 외인성 유전자에 의해 암호화되는 환원효소는 10 내지 14-탄소 지방 아실-CoA를 대응하는 1차 알코올로 환원을 촉매한다. 한 실시형태에서, 외인성 유전자에 의해 암호화되는 환원효소는 12-탄소 지방 아실-CoA를 도데칸올로 환원을 촉매한다.
본 발명은 또한 2개의 외인성 유전자를 함유하는 재조합 프로토테카 세포를 제공하고 여기서, 제1 외인성 유전자는 지방 아실-ACP 티오에스터라제를 암호화하고 제2 외인성 유전자는 지방 아실-CoA 환원효소, 지방 아실-CoA/알데하이드 환원효소, 및 아실 운반 단백질로 이루어진 그룹으로부터 선택되는 단백질을 암호화한다. 일부 경우에, 2개의 외인성 유전자는 각각 자극에 응하여 유도성인 프로모터와 작동가능하게 연결되어 있다. 일부 경우에, 각각의 프로모터는 배양 배지 내 제한된 질소 또는 질소 부재와 같은 동일한 자극에 응답하여 유도성이다. 배양 배지에서 질소의 제한 또는 완전한 부재는 프로토테카 종과 같은 몇몇 미생물에서 오일 생산을 자극하고 높은 수준으로 오일 생산을 유도하기 위한 유발제로서 사용될 수 있다. 본 명세서에 기재된 유전자 조작 방법과 조합하여 사용되는 경우, 건조 세포 중량%로서 지질은 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70% 및 적어도 75%와 같은 높은 수준으로 상승될 수 있고; 본 명세서에 기재된 방법은 상기 수준의 지질을 갖는 세포에 대해 제공하고, 여기서 지질은 적어도 1%-5%, 바람직하게는 적어도 4%의 C8-C14, 적어도 0.25%-1%, 바람직하게는 적어도 0.3%의 C8, 적어도 1%-5%, 바람직하게는 적어도 2%의 C10, 적어도 1%-5%, 바람직하게는 적어도 2%의 C12, 및 적어도 1%-5%, 바람직하게는 적어도 2%의 C14이다. 일부 실시형태에서, 상기 세포는 건조 세포 중량으로 25% 초과의 지질이고 10% 이상, 15% 이상, 20% 또는 25% 이상의 지질이며, 적어도 5%, 적어도 10% 또는 적어도 15%인 C8-C14, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25% 또는 적어도 30%인 C8-C14, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 40%인 C8-C14, 5%-40%, 바람직하게는 10-30%, C8-C14 및 10%-40%, 바람직하게는 20-30%인 C8-C14인 지질을 함유한다.
본 명세서에 기재된 신규 오일은 중간쇄 지방산(예를 들어, 팜 오일, 팜커넬 오일 및 코코넛 오일)의 함량이 높은 다른 자연적으로 존재하는 오일과는 구분된다. 예를 들어, 카로테노이드와 같은 오염물 수준은 본 발명의 오일에서보다 팜 오일 및 팜커넬 오일에서보다 높다. 특히 팜 오일 및 팜커넬 오일은 본 발명의 오일에서보다 더 높은 양으로 알파 및 베타 카로틴 및 라이코펜을 함유한다. 추가로, 20개 초과의 상이한 카로테노이드가 팜 오일 및 팜커넬 오일에서 발견된 반면 실시예는 본 발명의 오일이 매우 소수의 카로테노이드 종을 매우 낮은 수준으로 함유한다는 것을 입증한다. 추가로, 토코트라이에놀과 같은 비타민 E 화합물의 수준은 본 발명의 오일에서 보다 팜 오일, 팜커넬 및 코코넛 오일에서 훨씬 높다.
하나의 양태에서, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 8 내지 18-탄소 지방산의 절단을 촉매한다. 일부 경우에, 제2 외인성 유전자는 8 내지 18-탄소 지방 아실-CoA의 대응하는 1차 알코올로의 환원을 촉매하는 지방 아실-CoA/알데하이드 환원효소를 암호화한다. 몇몇 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 10 내지 14-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 환원효소는 10 내지 14-탄소 지방 아실-CoA의 대응하는 1차 알코올로의 환원을 촉매하고 여기서, 티오에스터라제 및 환원효소는 동일한 탄소 쇄 길이상에 작용한다. 하나의 양태에서, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 12-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 환원효소는 12-탄소 지방 아실-CoA의 도데칸올로의 환원을 촉매한다. 일부 경우에, 제2 외인성 유전자는 8 내지 18-탄소 지방 아실-CoA의 대응하는 알데하이드로의 환원을 촉매하는 지방 아실-CoA 환원효소를 암호화한다. 일부 경우에, 제2 외인성 유전자는 천연적으로 지방 아실-ACP 티오에스터라제와 함께 동시 발현되는 아실 운반 단백질을 암호화한다.
일부 실시형태에서, 제2 외인성 유전자는 지방 아실-CoA 환원효소를 암호화하고 상기 미생물은 추가로 지방 알데하이드 데카보닐라제를 암호화하는 제3 외인성 유전자를 함유한다. 일부 경우에, 제1 외인성 유전자에 의해 암호화된 티오에스터라제는 ACP로부터 8 내지 18-탄소 지방산의 절단을 촉매하고 제2 외인성 유전자에 의해 암호화된 환원효소는 8 내지 18-탄소 지방 아실-CoA의 대응하는 지방 알데하이드로의 환원을 촉매하고 제3 외인성 유전자에 의해 암호화된 데카보닐라제는 8 내지 18-탄소 지방 아실-CoA의 대응하는 지방 알데하이드의 대응하는 알칸으로의 전환을 촉매하고, 여기서, 티오에스터라제, 환원효소 및 데카보닐라제는 동일한 탄소 쇄 길이에 대해서 작용한다.
일부 실시형태에서, 제2 외인성 유전자는 아실 운반 단백질을 암호화하고 상기 미생물은 지방 아실-CoA 환원효소 및 지방 아실-CoA/알데하이드 환원효소로 이루어진 그룹으로부터 선택된 단백질을 암호화하는 제3 외인성 유전자를 함유한다. 몇몇 경우에 제3 외인성 유전자는 지방 아실-CoA 환원효소를 암호화하고 상기 미생물은 지방 알데하이드 데카보닐라제를 암호화하는 제4 외인성 유전자를 추가로 함유한다.
본 발명은 또한 배양 배지에서 재조합 미생물 유기체(예를 들어, 프로토테카 세포)의 집단을 배양 단계를 포함하는 알코올의 생성 방법을 제공하고, 여기서, 상기 세포는 (i) 지방 아실-ACP 티오에스터라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA/알데하이드 환원효소를 암호화하는 제2 외인성 유전자를 함유하고 상기 세포는 아실 운반 단백질(ACP)에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스터라제는 ACP로부터 지방산의 절단을 촉매하여 추가의 가공을 통해 지방 아실-CoA를 생성하고 지방 아실-CoA/알데하이드 환원효소는 아실-CoA의 알코올로의 환원을 촉매한다.
본 발명은 또한 프로토테카 세포에서 지질 분자를 생산하는 방법을 제공한다. 하나의 양태에서, 상기 방법은 배양 배지에서 미생물 유기체(예를 들어, 프로토테카 세포) 집단을 배양하는 단계를 포함하고, 상기 세포는 (i) 지방 아실-ACP 티오에스터라제를 암호화하는 제1 외인성 유전자, 및 (ii) 지방 아실-CoA 환원효소를 암호화하는 제2 외인성 유전자를 함유하고 상기 미생물은 아실 운반 단백질(ACP)에 연결된 지방산을 합성하고 지방 아실-ACP 티오에스터라제는 ACP로부터 지방산의 절단을 촉매하여 추가 처리를 통해 지방 아실-CoA를 생성하고 지방 아실-CoA 환원효소는 아실-CoA의 알데하이드로의 환원을 촉매한다.
본 발명은 또한 프로토테카 세포에서 특정된 탄소 쇄 길이를 갖는 지방산 분자를 생성 방법을 제공한다. 하나의 양태에서, 상기 방법은 배양 배지에서 지질 생성 미생물 유기체(예를 들어, 프로토테카 세포) 집단을 배양하는 단계를 포함하고 여기서 상기 미생물은 8, 10, 12 또는 14개 탄소 원자와 같은 특정 탄소 쇄 길이에 특이적이거나 우선적인 활성을 갖는 지방 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자를 함유하고, 상기 미생물은 아실 운반 단백질(ACP)에 연결된 지방 산을 합성하고 상기 티오에스터라제는 지방산이 특정 탄소 쇄 길이로 합성되는 경우 ACP로부터 지방산의 절단을 촉매한다.
상기된 다양한 양태에서, 상기 미생물 유기체(예를 들어, 프로토테카 세포)는 지질 경로 효소를 암호화하는 하나 이상의 외인성 유전자를 함유할 수 있다. 몇몇 경우에, 지질 경로 효소는 스테아로일-ACP 불포화효소, 글라이세로지질 불포화효소, 파이루베이트 탈수소효소, 아세틸-CoA 카복실라제, 아실 운반 단백질 및 글라이세롤-3 포스페이트 아실트랜스퍼라제로 이루어진 그룹으로부터 선택된다. 다른 경우에, 프로토테카 세포는 지방 아실-ACP 티오에스터라제, 지방 아실-CoA/알데하이드 환원효소, 지방 아실-CoA 환원효소, 지방 알데하이드 환원효소, 지방 알데하이드 데카보닐라제 및/또는 아실 운반 단백질로 이루어진 그룹으로부터 선택되는 지질 변형 효소를 함유한다.
다양한 지질 경로 효소 및 지질 변형 효소를 발현하는데 사용되는 다수의 예시적 형질전환 카세트 또는 구성체는 실시예에서 제공된다. 다른 유용한 구성체는, 제한 없이, 이하의 표 37에 열거한다.
예시적 형질전환 구성체, 코돈 최적화된 암호화 영역, 및 효소 | |
형질전환 구성체/암호화 영역/효소 | 서열번호 |
쿠페아 후커리아나 C10:0 특이적 티오에스터라제 구성체 | 243 |
쿠페아 후커리아나 C10:0 특이적 티오에스터라제에 대한 암호화 영역(코돈 최적화됨) | 244 |
쿠페아 후커리아나 KAS IV효소 구성체 | 245 |
쿠페아 후커리아나 KAS IV 효소에 대한 암호화 영역(코돈 최적화됨) | 246 |
쿠페아 후커리아나 KAS IV 효소 | 247 |
쿠페아 후커리아나 C10:0 특이적 티오에스터라제 + 쿠페아 후커리아나 KAS IV 효소 구성체 | 248 |
UTEX 1435 D12 지방산 불포화효소와 함께 쿠페아 란세올라타 C10:0 특이적 티오에스터라제에 대한 암호화 영역 | 249 |
캘리포니아 월계수 C12:0 특이적 티오에스터라제 구성체 | 250 |
캘리포니아 월계수 C12:0 특이적 티오에스터라제에 대한 암호화 영역(코돈 최적화됨) | 251 |
가르시니아 망고스타나 C16:0 티오에스터라제 구성체 | 252 |
가르시니아 망고스타나 C16:0 티오에스터라제에 대한 암호화 영역(코돈 최적화됨) | 253 |
브라씨카 나푸스 C18:0 티오에스터라제 구성체 | 254 |
브라씨카 나푸스 C18:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) | 255 |
올리아 유로페아 스테아로일-ACP 불포화효소 구성체 | 256 |
올리아 유로페아 스테아로일-ACP 불포화효소에 대한 암호화 영역(코돈-최적화됨) | 257 |
쿠페아 후커리아나 C16:0 티오에스터라제 구성체 | 258 |
쿠페아 후커리아나 C16:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) | 259 |
인도네시아 기름야자 C16:0 티오에스터라제 구성체 | 260 |
인도네시아 기름야자 C16:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) | 261 |
Δ12 지방산 불포화효소 좌위 구성체에서 카르타무스 틴토리우스 ACP-티오에스터라제 | 262 |
카르타무스 틴토리우스 ACP-티오에스터라제에 대한 암호화 영역 (코돈-최적화됨) | 263 |
육두구나무 C14:0-C18:0 넓은 특이성의 티오에스터라제 구성체 | 264 |
육두구나무 C14:0-C18:0 넓은 특이성 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) | 265 |
육두구나무 C:14:0 특이적 티오에스터라제에 대한 암호화 영역 | 266 |
D12 FAD 수송 펩타이드와 함께 육두구나무 C14:0 특이적 티오에스터라제 | 267 |
피마자 ACP-티오에스터라제 구성체 | 268 |
피마자 ACP-티오에스터라제에 대한 암호화 영역(코돈-최적화됨) | 269 |
녹나무 C14:0 티오에스터라제 구성체 | 270 |
녹나무 C14:0 티오에스터라제에 대한 암호화 영역(코돈-최적화됨) | 271 |
녹나무 C14:0 특이적 티오에스터라제 구성체 | 272 |
녹나무 C14:0 특이적 티오에스터라제 구성체 | 273 |
SAD 좌위에서 미국 느릅나무 C10:0-C16:0 특이적 티오에스터라제 | 274 |
미국 느릅나무 C10:0-C16:0 특이적 티오에스터라제에 대한 암호화 영역(코돈-최적화) | 275 |
쿠페아 라이티 KASA1 + 쿠페아 라이티 FatB2 티오에스터라제 + suc2 구성체 | 276 |
쿠페아 라이티 KASA1에 대한 암호화 영역(코돈-최적화) | 277 |
쿠페아 라이티 FatB2 티오에스터라제에 대한 암호화 영역(코돈-최적화) | 278 |
VI. 연료 및 화학물질 생성
본 발명의 방법에 따른 연료의 생산을 위해, 본 발명의 세포에 의해 생산된 지질을 수거하거나 다르게는 임의의 편리한 수단에 의해 채취한다. 지질은 전체 세포 추출에 의해 분리될 수 있다. 상기 세포를 우선 파쇄시키고 이어서 세포 내 및 세포막/세포벽 연합 지질 및 세포외 탄화수소를, 예를 들어 상기된 바와 같은 원심분리를 사용하여 세포 덩어리로부터 분리할 수 있다. 미생물 내에서 생성된 세포 내 지질은 몇몇 양태에서 미생물의 세포를 용해시킨 후 추출된다. 일단 추출된 후 지질을 추가로 정련하여 오일, 연료 또는 유성화학물질을 생성한다.
배양을 완료 한 후, 미생물을 발효 브로스로부터 분리할 수 있다. 선택적으로, 상기 분리는 원심분리로 수행하여 농축된 페이스트를 생성한다. 원심분리는 미생물로부터 상당한 양의 세포 내 물을 제거하지 못하고 건조 단계가 아니다. 이어서 상기 바이오매스는 임의로 세척액(예를 들어, 탈이온수)으로 세척하여 발효 브로스 및 잔해를 제거할 수 있다. 임의로 세척된 미생물 바이오매스는 또한 세포 분쇄 전에 건조(오븐 건조, 동결 건조 등)시킬 수 있다. 또한, 세포는 발효가 완료된 경우 발효 브로스의 일부 또는 전부로부터 분리 없이 용해시킬 수 있다. 예를 들어, 상기 세포는 세포가 용해된 경우 세포 외 액체에 대한 세포의 비율이 1:1(v:v) 미만일 수 있다.
액체를 함유하는 미생물은 용해시켜 용해물을 생성시킬 수 있다. 본 명세서에 상세하게 기재된 바와 같이 미생물 용해시키는 단계(또한 세포 용해로서 언급됨)는 열-유도된 용해, 염기의 첨가, 산의 첨가, 프로테아제와 같은 효소 및 아밀라제와 같은 다당류 분해 효소의 사용, 초음파, 기계적 용해의 사용, 삼투압 쇼크의 사용, 용해성 바이러스에 의한 감염 및/또는 하나 이상의 용해성 유전자의 발현을 포함하는 임의의 간편한 수단에 의해 달성될 수 있다. 용해를 수행하여 미생물에 의해 생성된 세포 내 분자를 방출시킨다. 미생물을 용해시키기 위한 이들 방법 각각은 단일 방법으로 또는 동시에 또는 연속적으로 조합하여 사용할 수 있다. 세포 파괴 정도는 현미경 분석에 의해 관찰할 수 있다. 본 명세서에 기재된 방법 중 하나 이상을 사용하여, 전형적으로 70% 초과의 세포 파괴가 관찰된다. 바람직하게, 세포 파괴는 80% 초과, 더 바람직하게는 90% 초과 및 가장 바람직하게는 약 100%이다.
특정 실시형태에서, 미생물은 예를 들어, 추출 또는 추가의 가공을 위해 세포 지질 및/또는 탄화수소의 노출을 증가시키기 위해 성장 후 용해시킨다. 리파제 발현 및 세포 용해 시간(예를 들어, 유도성 프로모터를 통한)은 지질 및/또는 탄화수소의 수율을 최적화하기 위해 조정될 수 있다. 다수의 용해 기술은 이하에 기재한다. 이들 기술은 개별적으로 또는 조합하여 사용할 수 있다.
본 발명의 한 실시형태에서, 미생물을 용해시키는 단계는 미생물을 함유하는 세포 현탁액의 가열을 포함한다. 이러한 양태에서, 미생물을 함유하는 발효 브로스(또는 발효 브로스로부터 분리된 미생물 현탁액)는 미생물, 즉 미생물의 세포벽 및 막이 분해하거나 파괴될 때까지 가열한다. 전형적으로, 적용되는 온도는 적어도 50℃이다. 더 효율적인 세포 용해를 위해, 더 고온, 예를 들어, 적어도 30℃, 적어도 60℃, 적어도 70℃, 적어도 80℃, 적어도 90℃, 적어도 100℃, 적어도 110℃, 적어도 120℃, 적어도 130℃ 또는 그 이상을 사용한다. 가열 처리에 의한 세포 용해는 미생물을 비등시킴에 의해 수행할 수 있다. 또는, 열 처리(비등 없이)는 오토클레이브에서 수행할 수 있다. 열 처리된 용해물은 추가의 처리를 위해 냉각시킬 수 있다. 세포 파쇄는 또한 증기 처리, 즉 가압된 증기의 부가를 통해 수행할 수 있다. 세포 파쇄를 위한 미세조류의 증기 처리는, 예를 들어, 미국 특허 제6,750,048호에 기재되어 있다. 몇몇 양태에서, 증기 처리는 발효기로 증기를 살포하고 브로스를 약 90분 미만, 바람직하게는 약 60분 미만 및 더 바람직하게는 약 30분 미만 동안 원하는 온도에 유지하는 것에 의해 달성될 수 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 염기를, 미생물을 함유하는 세포 현탁액에 첨가함을 포함한다. 상기 염기는 사용되는 미생물의 단백질성 화합물의 적어도 일부를 가수분해하기에 충분히 강해야만 한다. 단백질을 가용화시키기 위해 유용한 염기는 화학 기술 분야에 공지되어 있다. 본 발명의 방법에 유용한 예시적인 염기는 리튬, 나트륨, 칼륨, 칼슘의 수산화물, 카보네이트 및 바이카보네이트 및 이들의 혼합물을 포함하지만, 이에 제한되지 않는다. 바람직한 염기는 KOH이다. 세포 파쇄를 위한 미세조류의 염기 처리는 예를 들어, 미국 특허 제6,750,048호에 기재되어 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 산을, 미생물을 함유하는 세포 현탁액에 첨가함을 포함한다. 산 용해는 10-500 mN 또는 바람직하게 40-160 nM의 농도로 산을 사용하여 수행할 수 있다. 산 용해는 바람직하게 실온 이상(예를 들어, 40 내지 160℃, 및 바람직하게 50 내지 130℃)에서 수행한다. 적당한 온도(예를 들어, 실온 내지 100℃ 및 특히 실온 내지 65℃)에 대해서, 산 처리는 통상적으로 초음파 처리 또는 다른 세포 파괴 방법과 조합할 수 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 효소를 사용함에 의해 미생물을 용해시키는 것을 포함한다. 미생물을 용해시키기 위해 바람직한 효소는 프로테아제 및 다당류-분해 효소, 예를 들어, 헤미셀룰라제(예를 들어, 아스퍼질러스 니거; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #H2125), 펙티나제(예를 들어, 리조푸스 종 유래의 펙티나제; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #P2401), 만나웨이(Mannaway) 4.0ℓ(노보자임(Novozymes)), 셀룰라제(예를 들어, 트라이코더마 비리드 유래의 셀룰라제; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #C9422), 및 드리셀라제(예를 들어, 바시디오마이세테스 종 유래의 드리셀라제; 미주리주 세인트 루이스에 소재한 Sigma Aldrich; #D9515)이다.
본 발명의 또 다른 실시형태에서, 용해는 예를 들어, 임의로 클로렐라 또는 클로렐라 바이러스 유래의 다당류 분해 효소와 같은 셀룰라제 또는 스트렙토마이세스 그리세우스(Streptomyces griseus) 프로테아제, 키모트립신, 프로테이나제 K, 문헌[Degradation of Polylactide by Commercial Proteases, Oda Yet al., Journal of Polymers 및 the Environment, Volume 8, Number 1, January 2000 , pp. 29-32(4)]에 열거된된 프로테아제, 알칼라제 2.4 FG(노보자임), 및 플라보우르짐 100ℓ(노보자임)과 같은 프로테아제와 같은 효소를 사용하여 달성한다. 프로테아제 및 다당류-분해 효소의 임의의 조합은 또한 이전의 프로테아제 및 다당류 분해 효소의 임의의 조합을 포함하여 사용할 수 있다.
또 다른 양태에서, 용해는 익스펠러 프레스를 사용하여 수행할 수 있다. 상기 공정에서, 바이오매스는 고압에서 스크류형 장치를 통해 강제 주입하고 세포를 용해시키고 세포 내 지질이 방출되고 세포 내 단백질 및 섬유(및 기타 성분)로부터 분리되도록 한다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 초음파, 즉, 초음파 처리를 사용하여 수행한다. 따라서, 세포는 또한 고주파 음파로 용해시킬 수 있다. 상기 음파는 전기적으로 생성될 수 있고 금속 팁을 통해 적당히 농축된 세포 현탁액으로 운반된다. 상기 음파 처리(또는 초음파 처리)는 세포 현탁액 내 공극의 형성을 기준으로 세포 통합성을 붕괴시킨다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 기계적 용해에 의해 수행한다. 세포는 기계적으로 용해시키고 균질화하여 탄화수소(예를 들어, 지질) 수집을 용이하게할 수 있다. 예를 들어, 압력 분쇄기를 사용하여 세포 함유 슬러리를 제한된 오리피스 밸브를 통과하도록 펌핑시킬 수 있다. 고압(1500 바 이하)을 적용함에 이어서 출구 노출을 통해 즉시 확장시킨다. 세포 분쇄는 3개의 상기한 메커니즘에 의해 달성한다: 밸브 상에 충돌, 오리피스내 액체 고전단, 및 방출시 급작스런 압력 강하로 세포 분해의 유도. 상기 방법은 세포 내 분자를 방출시킨다. 또는, 볼 밀을 사용할 수 있다. 볼 밀에서, 세포는 비드와 같은 작은 연마 입자와 함께 현탁 상태로 진탕시킨다. 전단력 때문에 세포는 분해되고 비드 사이에서 분쇄되며 비드와 충돌한다. 상기 비드는 세포를 파쇄하여 세포 내용물을 방출시킨다. 세포는 예를 들어, 블렌딩의 사용과 함께(예를 들어, 고속 또는 와링 블렌더(Waring blender)), 프레치 프레스 또는 심지어 약한 세포 벽의 경우에 세포 파쇄를 위한 원심분리의 사용과 같은 전단력에 의해 파쇄될 수 있다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 삼투압 쇼크를 적용함으로써 수행한다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 용해성 바이러스로 미생물을 감염시키는 것을 포함한다.
광범위한 바이러스는 본 발명에 사용하기 위해 적합한 미생물을 용해시키는 것으로 공지되어 있고 특정 미생물에 대한 특정 용해성 바이러스의 선택 및 용도는 당업계의 기술 범위 내에 있다. 예를 들어, 파라메시움 부르사리아 클로렐라 바이러스(Paramecium bursaria chlorella virus, PBCV-1)는 특정 단일 세포 진핵 클로렐라형 녹색 조류 내에서 복제하고 이를 용해시키는 대형의 20면체 플라크 형성 이중가닥의 DNA 바이러스의 원형이다(필코드나비리대(Phycodnaviridae) 계열, 클로로바이러스(Chlorovirus) 속). 따라서, 임의의 민감성 미세조류는 적합한 클로렐라 바이러스로 배양물을 감염시킴에 의해 용해시킬 수 있다. 클로렐라 바이러스로 클로렐라 종을 감염시키는 방법은 공지되어 있다. 예를 들어, 문헌[Adv. Virus Res. 2006;66:293-336; Virology, 1999 Apr 25;257(1): 15-23; Virology, 2004 Jan 5;318(1):214-23; Nucleic Acids Symp. Ser. 2000;(44): 161-2; J. Virol. 2006 Mar;80(5):2437-44; 및 Annu. Rev. Microbiol. 1999;53:447-94]을 참조한다.
본 발명의 또 다른 양태에서, 미생물을 용해시키는 단계는 자가용해를 포함한다. 상기 양태에서, 본 발명에 따른 미생물은 미생물을 용해시키는 용해성 단백질을 생성하도록 유전자 조작한다. 상기 용해성 유전자는 유도성 프로모터를 사용하여 발현시켜 세포가 처음에 발효기내에서 목적하는 밀도로 성장한 후 프로모터를 유도하여 용해성 유전자를 발현시키는 것에 의해 세포를 용해시킬 수 있다. 하나의 양태에서, 상기 용해성 유전자는 다당류-분해 효소를 암호화한다. 특정 다른 양태에서, 상기 용해성 유전자는 용해성 바이러스 유래의 유전자이다. 따라서, 예를 들어, 클로렐라 바이러스 유래의 용해성 유전자는 조류 세포에서 발현시킬 수 있고 문헌[Virology 260, 308-315 (1999); FEMS Microbiology Letters 180 (1999) 45-53; Virology 263, 376-387(1999); 및 Virology 230, 361-368 (1997)]을 참조한다. 용해성 유전자의 발현은 바람직하게 유도성 프로모터, 예를 들어, 소분자, 광, 열과 같은 자극 및 다른 자극의 존재 하에 유도되는 미세조류에서 활성인 프로모터를 사용하여 수행한다.
상기 방법에 의해 생성된 세포 용해물로부터 지질을 분리하기 위한 다양한 방법이 이용가능하다. 예를 들어, 지방 알데하이드, 지방 알코올 및 탄화수소(예를 들어, 알칸)와 같은 지질 및 지질 유도체는 헥산과 같은 소수성 용매로 추출할 수 있다(문헌[Frenz et al. 1989, Enzyme Microb. Technol., 11:717] 참조). 지질 및 지질 유도체는 또한 액화(문헌[Sawayama et al. 1999, Biomass and Bioenergy 17:33-39 및 Inoue et al. 1993, Biomass Bioenergy 6(4):269-274] 참조); 오일 액화(예를 들어, 문헌[Minowa et al. 1995, Fuel 74(12): 1735-1738] 참조); 및 초임계 CO2 추출(예를 들어, 문헌[Mendes et al. 2003, Inorganica Chimica Acta 356:328-334] 참조)을 사용하여 추출할 수 있다. 미아오(Miao) 및 우(Wu)는 클로렐라 프로토테오코이데스의 배양으로부터 미세조류 지질 회수의 프로토콜을 기재하고 있고, 여기서 상기 세포는 원심분리에 의해 수거되고 증류수로 세척되며 동결 건조에 의해 건조시킨다. 수득한 세포 분말을 모르타르에서 분쇄하고 이어서 n-헥산으로 추출한다. 문헌[Miao and Wu, Biosource Technology (2006) 97:841-846].
따라서, 본 발명의 미생물에 의해 생성된 지질, 지질 유도체 및 탄화수소는 유기 용매로 추출하여 회수할 수 있다. 몇몇 경우에, 바람직한 유기 용매는 헥산이다. 전형적으로, 유기 용매는 용해 성분의 사전 분리 없이 용해물에 직접 첨가한다. 하나의 양태에서, 상기된 하나 이상의 방법에 의해 생성된 용해물은 지질 및/또는 탄화수소 성분이 유기 용매와 용액을 형성하도록 하기에 충분한 시간 동안 유기 용매와 접촉시킨다. 몇몇 경우에, 상기 용액을 이어서 추가로 정련하여 특정 목적하는 지질 또는 탄화수소 성분을 회수한다. 헥산 추출 방법은 당업계에 널리 공지되어 있다.
본 명세서에 기재된 세포에 의해 생성된 지질 및 지질 유도체, 예컨대 지방 알데하이드, 지방 알코올, 및 탄화수소 알칸은 상기된 바와 같은 리파제를 포함하는 하나 이상의 효소의 사용에 의해 변형될 수 있다. 탄화수소가 세포의 세포 외 환경에 존재하는 경우, 하나 이상의 효소는, 효소가 탄화수소를 변형시키거나 탄화수소 전구체로부터 이의 합성을 완성하도록 하는 조건하에서 상기 환경에 첨가할 수 있다. 또는, 상기 탄화수소는 효소와 같은 하나 이상의 촉매의 첨가 전에 세포 물질로부터 부분적으로 또는 완전하게 분리될 수 있다. 상기 촉매는 외인성으로 첨가되고 이들의 활성은 세포 외부에서 또는 시험관 내에서 발생한다.
따라서, 본 명세서에 기재된 바와 같이 생체내 세포에 의해 생성되거나 시험관내에서 효소적으로 변형된 지질 및 탄화수소는 임의로 통상적인 수단에 의해 추가로 가공될 수 있다. 상기 가공은 탄화수소의 크기를 감소시키고 이어서 이의 수소화 비율을 증가시키기 위한 "크랙킹(cracking)"을 포함할 수 있다. 촉매 및 열 크랙킹 방법은 통상적으로 탄화수소 및 트라이글라이세라이드 오일 가공에 사용한다. 촉매 방법은 고체 산 촉매와 같은 촉매의 사용을 포함한다. 상기 촉매는 실리카-알루미나 또는 제올라이트일 수 있고 이로써 탄소-탄소 결합을 이종용해 또는 비대칭 분해시켜 카보양이온(carbocation) 및 수소화물 음이온을 수득할 수 있다. 이들 반응성 중간체를 이어서 또 다른 탄화수소와 함께 재정렬하거나 수소화 전달을 진행시킨다. 상기 반응은 따라서 중간체를 재생성시켜 자가-증폭 쇄 메커니즘을 유도할 수 있다. 또한 탄화수소는 여기서 탄소-탄소 이중 또는 삼중 결합의 수가 선택적으로 0까지 감소하도록 처리될 수 있다. 또한 탄화수소를 가공하여 여기서 고리 또는 사이클릭 구조를 제거할 수 있다. 탄화수소를 또한 처리하여 수소화 비율을 증가시킬 수 있다. 이것은 수소의 첨가("수소화") 및/또는 탄화수소의 보다 작은 탄화수소로 "크랙킹"을 포함할 수 있다.
열 방법은 탄화수소 크기를 감소시키기 위한 상승된 온도 및 압력의 용도를 포함한다. 약 800℃의 승온 및 약 700kPa의 압력을 사용할 수 있다. 이들 조건은 때때로 수소 풍부 탄화수소 분자(양성자 플럭스와는 구분되는 바와 같이)를 언급하는데 사용되는 용어 '가벼운 탄화수소 분자'를 생성하고 또한 축합에 의해 상대적으로 수소가 고갈된 보다 무거운 탄화수소 분자를 생성한다. 상기 방법은 등방성 또는 대칭적 절단을 제공하고 상기된 바와 같이 임의로 효소적으로 포화될 수 있는 알켄을 생성한다.
촉매 및 열 방법은 탄화수소 가공 및 오일 정련을 위한 식물에서의 표준 방법이다. 따라서, 본 명세서에 기재된 바와 같은 세포에 의해 생성된 탄화수소가 수거될 수 있고 통상적인 수단에 의해 가공되거나 수집될 수 있다. 미세조류 생산 탄화수소의 수소 크랙킹에 대한 보고에 대해 문헌[Hillen et al. (Biotechnology and Bioengineering, Vol. XXIV: 193-205 (1982))]을 참조한다. 또 다른 양태에서, 상기 분획물은 또 다른 촉매, 예를 들어, 유기 화합물, 열 및/또는 무기 화합물로 처리한다. 지질의 바이오디젤로의 가공을 위해, 에스터결합전이 공정은 이 부분의 이하에 기재되는 바와 같이 사용된다.
본 발명의 방법을 통해 생성되는 탄화수소는 다양한 산업 응용 분야에서 유용하다. 예를 들어, 거의 모든 유형의 세제 및 세정제에서 사용되는 음이온 게면활성제인 직쇄 알킬벤젠 설포네이트(LAS)의 생산은 일반적으로 10 내지 14개의 탄소 공급원자 쇄를 포함하는 탄화수소를 사용한다. 예를 들어, 미국 특허 번호: 제6,946,430호; 제5,506,201호; 제6,692,730호; 제6,268,517호; 제6,020,509호; 제6,140,302호; 제5,080,848호; 및 제5,567,359호를 참조한다. LAS와 같은 계면활성제는 퍼스널 케어 조성물 및 세제, 예컨대, 미국 특허 제5,942,479호; 제6,086,903호; 제5,833,999호; 제6,468,955호; 및 제6,407,044호에 기재된 것의 제조에 사용할 수 있다.
관심이 고조되고 있는 것은 화석 연료로부터 유래된 출발 물질을 대체할 수 있는 재생가능한 생물학적 출발 물질이 가용하고 이의 사용이 바람직할 수 있기 때문에 바이오디젤, 재생가능한 디젤 및 제트 연료와 같은 연료에서의 생물학적 기원의 탄화수소 성분의 용도에 대한 것이다. 생물학적 물질로부터 탄화수소 성분을 생산하기 위한 방법이 시급히 요구되고 있다. 본 발명은 바이오디젤, 재생가능한 디젤 및 제트 연료를 제조하기 위해 본 명세서에 기재된 방법에 의해 생성된, 생물학적 재료로서의 지질을 사용하여, 바이오디젤, 재생가능한 디젤 및 제트 연료의 생산 방법을 제공하여 상기 필요성을 충족시킨다.
통상적인 디젤 연료는 파라핀 탄화수소가 풍부한 석유 증류물이다. 이들은 370° 내지 780℉ 정도로 넓은 비등 범위를 갖고 이는 디젤 엔진 승용차와 같은 압착 점화 엔진에서 연소용으로서 적합하다. 미국재료시험협회(The American Society of Testing and Materials, ASTM)은 세탄수, 혼탁점, 플래쉬 포인트, 점도, 아닐린 포인트, 황 함량, 물 함량, 재 함량, 구리 스트립 부식 및 탄소 잔기와 같은 허용 가능한 범위의 다른 연료 성질과 함께 비등 범위에 따라 디젤 등급을 확립한다. 기술적으로, 적당한 ASTM 세부항목을 충족하는 바이오매스 또는 기타로부터 유래된 임의의 탄화수소 증류 재료는 디젤 연료(ASTM D975), 제트 연료(ASTM D1655), 또는 이것이 지방산 메틸 에스터인 경우 바이오디젤(ASTM D6751)로 정의될 수 있다.
추출 후, 본 명세서에 기재된 미생물 바이오매스로부터 회수된 지질 및/또는 탄화수소 성분은 디젤 승용차 및 제트 엔진에 사용하기 위한 연료를 제조하기 위해 화학적 처리에 적용될 수 있다.
바이오디젤은 금색에서 암갈색으로 생산 공급원료에 따라 색상이 다양한 액체이다. 이것은 실제로 수불혼화성이고 고융점 및 저증기압을 갖는다. 바이오디젤은 디젤-엔진 승용차에 사용하기 위한 디젤-등가의 가공된 연료를 언급한다. 바이오디젤은 생분해성이고 비독성이다. 통상적인 디젤 연료에 비해 바이오디젤의 추가의 이득은 보다 낮은 엔진 마모이다. 전형적으로, 바이오디젤은 C14-C18 알킬 에스터를 포함한다. 다양한 가공은 본 명세서에 기재된 바와 같이 생성되고 분리된 바이오매스 또는 지질을 디젤 연료로 전환시킨다. 바이오디젤을 생산하기 위한 바람직한 방법은 본 명세서에 기재된 바와 같이 지질의 에스터결합전이에 의한 것이다. 바이오디젤로서 사용하기 위한 바람직한 알킬 에스터는 메틸 에스터 또는 에틸 에스터이다.
본 명세서에 기재된 방법에 의해 생성된 바이오디젤은 대부분의 모뎀 디젤-엔진 승용차에서 임의의 농도로 단독으로 사용하거나 통상적인 디젤 연료와 배합하여 사용될 수 있다. 통상적인 디젤 연료(석유 디젤)와 배합되는 경우, 바이오디젤은 약 0.1% 내지 약 99.9%로 존재할 수 있다. 많은 국가에서는 임의의 연료 혼합물에서 바이오디젤의 양을 지칭하기 위해 "B" 인자로서 공지된 시스템을 사용한다. 예를 들어, 20% 바이오디젤을 함유하는 연료는 B20으로 표시된다. 순수한 바이오디젤은 B100으로 언급된다.
바이오디젤은 또한 가정용 및 상업용 보일러에서 가열 연료로서 사용될 수 있다. 기존의 오일 보일러는 고무 구성품을 함유할 수 있고 바이오디젤상에서의 운행을 위해서는 전환을 필요로 할 수 있다. 전환 과정은 일반적으로 비교적 단순하고 바이오디젤이 강한 용매임으로 고무 구성품의 합성 구성품으로의 교환을 포함한다. 이의 강한 용해력 때문에, 바이오디젤의 연소는 보일러의 효율을 증가시킨다. 바이오디젤은 수순한 울트라-로우 황디젤(ULSD) 연료의 윤활성을 증가시키기 위해 디젤 제형 중에 첨가제로서 사용될 수 있고, 이는 이것이 실제로 황을 내포하지 않기 때문에 유리하다. 바이오디젤은 석유 디젤 보다 양호한 용매이고 이전에 석유 디젤 상에서 운행된 자동차 연료 라인 중에 잔류 침전물을 분해시키는데 사용될 수 있다.
바이오디젤은 오일 풍부 바이오매스중에 함유된 트라이글라이세라이드의 에스터결합전이에 의해 생성될 수 있다.
따라서, 본 발명의 또 다른 측면에서, 바이오디젤을 생산하기 위한 방법이 제공된다. 바람직한 양태에서, 바이오디젤을 생산하는 방법은 (a) 본 명세서에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성하는 단계, (c) 용해된 미생물로부터 지질을 분리하는 단계 및 (d) 지질 조성물을 에스터결합전이에 의해 바이오디젤을 생성하는 단계를 포함한다. 미생물의 성장 방법, 미생물을 용해시켜 용해물을 생성하는 방법, 유기 용매를 포함하는 배지에서 용해물을 처리하여 이종성 혼합물을 형성시키는 방법 및 처리된 용해물을 지질 조성물로 분리하는 방법은 상기 기재되었고 또한 바이오디젤을 생산하는 방법에 사용될 수 있다.
바이오디젤의 지질 프로파일은 일반적으로 공급원료 오일의 지질 프로파일과 고도로 유사하다. 본 발명의 방법 및 조성물에 의해 제공된 다른 오일은 에스터결합전이에 의해 바이오디젤을 생산할 수 있고 이때 지질 프로파일은 (a) 적어도 1%-5%, 바람직하게는 적어도 4%의 C8-C14; (b) 적어도 0.25%-1%, 바람직하게는 적어도 0.3%의 C8; (c) 적어도 1%-5%, 바람직하게는 적어도 2%의 C10; (d) 적어도 1%-5%, 바람직하게는 적어도 2%의 C12; 및 (3) 적어도 20%-40%, 바람직하게는 적어도 30%의 C8-C14를 포함한다.
지질 조성물은 에스터결합전이로 바이오디젤로서 유용한 장쇄의 지방산 에스터를 생산할 수 있다. 바람직한 에스터결합전이는 이하에 약술되고 염기 촉매된 에스터결합전이 및 재조합 리파제를 사용하는 에스터결합전이 반응을 포함한다. 염기 촉매된 에스터결합전이 공정에서, 트라이아실글라이세라이드는 알칼린 촉매인, 전형적으로 수산화칼륨의 존재 하에 메탄올 또는 에탄올과 같은 알코올과 반응시킨다. 상기 반응은 부산물로서 메틸 또는 에틸 에스터 및 글라이세린(글라이세롤)을 형성한다.
동물 및 식물 오일은 전형적으로 트라이하이드릭 알코올인 글라이세롤과 유리된 지방산의 에스터인 트라이글라이세라이드로 구성된다. 에스터결합전이에서, 트라이리세라이드(TAG) 중의 글라이세롤은 메탄올 또는 에탄올과 같은 단쇄 알코올로 대체한다. 전형적인 반응 계획은 다음과 같다:
상기 반응에서, 상기 알코올은 염기로 탈양성자화되어 보다 강한 친핵성이 된다. 통상적으로, 에탄올 또는 메탄올은 매우 과량(50배 까지)으로 사용된다. 정상적으로 상기 반응은 상당히 느리게 진행하거나 전혀 진행하지 않는다. 산 또는 염기뿐만 아니라 열을 사용하여 반응의 보다 신속한 진행을 도와줄 수 있다. 산 또는 염기는 에스터결합전이 반응에 의해 소비되지 않고 따라서 이들은 반응물이 아니고 촉매이다. 거의 모든 바이오디젤은 이것이 단지 저온 및 저압을 요구하고 98% 이상의 전환 수율을 나타내므로(단, 출발 오일은 수분 및 유리된 지방산이 낮아야 한다) 염기 촉매 기술을 사용하여 생산될 수 있다.
에스터결합전이는 또한 염기 대신 리파제와 같은 효소를 사용하여 수행하였다. 리파제-촉매된 에스터결합전이는 예를 들어, 실온 내지 80℃의 온도 및 1:1 초과, 바람직하게는 약 3:1인 TAG 대 저급 알코올의 몰비에서 수행할 수 있다. 에스터결합전이에 사용하기에 적합한 리파제는 표 9에 기재된 것들을 포함하지만 이에 제한되지 않는다. 에스터결합전이를 위해 유용한 리파제의 다른 예는 예를 들어, 미국 특허 제4,798,793호; 제4,940,845호; 제5,156,963호; 제5,342,768호; 제5,776,741호 및 WO89/01032에서 찾을 수 있다. 상기 리파제는 리조푸스 (Rhizopus), 아스퍼질러스(Aspergillus), 칸디다(Candida), 뮤코(Mucor), 슈도모나스(Pseudomonas), 리조뮤코(Rhizomucor), 칸디다 및 휴미콜라(Humicola)에 의해 생성된 리파제 및 췌장 리파제를 포함하지만 이에 제한되지 않는다.
에스터결합전이에서 사용에 적합한 리파제 |
아스퍼질러스 니거 리파제 ABG73614, 칸디다 안탁티카(Candida antarctica) 리파제 B(노보자임-435) CAA83122, 칸디다 실린드라새(Candida cylindracea) 리파제 AAR24090, 칸디다 리폴리티카(Candida lipolytica) 리파제(리파제 L; Amano Pharmaceutical Co., Ltd.), 칸디다 루고사(Candida rugosa) 리파제(예를 들어, Meito Sangyo Co., Ltd.의 리파제), 뮤코 미에헤이(Mucor miehei) 리파제(리포자임 IM 20), 슈도모나스 플루오레센스(Pseudomonas fluorescens) 리파제 AAA25882, 리조푸스 자포니카스(Rhizopus japonicas) 리파제(릴리파스 A-10FG) Q7M4U7_1, 리조뮤코 미에헤이 (Rhizomucor miehei) 리파제 B34959, 리조푸스 오리재(Rhizopus oryzae) 리파제(리파제 F) AAF32408, 세라티아 마르세센스(Serratia marcescens) 리파제(SM 효소) ABI13521, 써모마이세스 라누기노사(Thermomyces lanuginosa) 리파제 CAB58509, 리파제 P(Nagase ChemteX Corporation), 및 리파제 QLM (일본 나고야에 소재한 Meito Sangyo Co., Ltd.) |
바이오디젤 용으로 적합한 지방산 에스터의 제조를 위해 리파제를 사용하는 문제는 리파제 가격이 강염기 공정에 의해 사용되는 수산화나트륨(NaOH)의 가격보다 훨씬 고가라는 것이다. 상기 문제점은 재활용될 수 있는 고정화된 리파제를 사용함으로써 해결되었다. 그러나, 고정화된 리파제의 활성은 리파제-기본 공정이 생산 단가의 측면에서 강염기 공정과 경쟁을 위해서는 최소의 주기동안 재사용된 후 유지되어야만 한다. 고정화된 리파제는 에스터결합전이에 전형적으로 사용되는 저급 알코올에 의해 독성이 된다. 미국 특허 제6,398,707호(우 등에게 2002년 6월 4일자로 발행됨)는 고정화된 리파제의 활성을 증진시키는 방법 및 감소된 활성을 갖는 고정화된 리파제를 재생시키는 방법을 기재하고 있다. 몇몇 적합한 방법은 일정 기간의 시간, 바람직하게는 0.5 내지 48시간 및 보다 바람직하게는 0.5 내지 1.5시간 동안 3개 이상의 탄소 원자수를 갖는 알코올 중에 고정화된 리파제를 침지시키는 것을 포함한다. 몇몇 적합한 방법은 또한 3개 이상의 탄소 원자 수를 갖는 알코올과 불활성화된 고정화된 리파제를 세척함에 이어서 식물성 오일 중에 0.5 내지 48시간 동안 불활성화된 고정화된 리파제를 침지시키는 것을 포함한다.
특정 양태에서, 재조합 리파제는 리파제가 작용하는 지질을 생산하는 동일한 미생물 내에서 발현된다. 적합한 재조합 리파제는 표 9에 상기 열거되고/되거나 표 9에 상기 열거된 GenBank 등록번호를 갖는 것들, 또는 표 9에 상기 열거된 리파제중 하나와 적어도 70%의 아미노산 동일성을 갖고 리파제 활성을 나타내는 폴리펩타이드를 포함한다. 추가의 양태에서, 효소 활성은 상기된 서열중 하나와 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 또는 적어도 약 99% 동일성을 갖는 서열 중에 존재하고 상기 서열 모두는 완전히 제시된 바와 같이 참조로서 인용된다. 리파제 및 선택가능한 마커를 암호화하는 DNA는 바람직하게 코돈 최적화된 cDNA이다. 미세조류 중에서 발현하기 위해 유전자를 재암호화하는 방법은 미국 특허 제7,135,290호에 기재되어 있다.
바이오디젤에 대한 통상의 국제 표준은 EN 14214이다. ASTM D6751은 미국 및 캐나다에서 참조되는 가장 공통된 바이오디젤 표준이다. 독일은 DIN EN 14214를 사용하고 UK는 BS EN 14214를 준수할 것으로 요구한다. 생성물이 이들 표준에 부합하는지의 여부를 결정하기 위한 기본 산업적 시험은 전형적으로 가스 크로마토그래피, HPLC 등을 포함한다. 품질 표준을 충족하는 바이오디젤은 매우 비독성이고 독성 등급(LD50)은 50 ㎖/㎏을 초과한다.
ASTM 표준을 충족하는 바이오디젤이 비독성이어야 하지만 결정화하고/하거나 침전하고 용액으로부터 침강하는 경향이 있는 오염물이 있을 수 있다. 침강물 형성은 특히 바이오디젤이 보다 저온에서 사용되는 경우 문제이다. 침강 또는 침전은 연료 흐름을 감소시키고, 연료 라인을 막히게 하고 여과기를 막히게 하는 것과 같은 문제를 유발할 수 있다. 고품질의 생성물을 제조하기 위해 바이오디젤에서 상기 오염물 및 침강물을 제거하는 것과 관련된 공정들은 당업계에 널리 공지되어 있다. 상기 공정들의 예는 인지질 및 유리 지방산과 같은 오염물을 제거하기 위한 오일의 전처리(예를 들어, 정련, 부식성 정련 및 실리카 흡착 여과) 및 냉각 여과를 포함하지만 이에 제한되지 않는다. 냉각 여과는 생성 후 바이오디젤에 존재하는 임의의 미립자 및 침강물을 제거하기 위해 특별히 개발된 공정이다. 상기 공정은 바이오디젤을 냉각시키고 연료가 보다 저온에서 사용되는 경우 형성될 수 있는 임의의 침강물 또는 침전물을 여과 제거한다. 상기 공정은 당업계에 널리 공지되어 있고 미국 특허원 공개번호 제2007-0175091호에 기재되어 있다. 적합한 방법은 바이오디젤을 약 38℃ 미만의 온도로 냉각시켜 불순물 및 오염물이 바이오디젤 액체 중에서 미립자로서 침전하는 단계를 포함할 수 있다. 이어서 규조토 또는 다른 여과 재료를 냉각된 바이오디젤에 첨가하여 슬러리를 형성시킬 수 있고 이것은 이어서 압력 리프(pressure leaf) 또는 다른 유형의 여과기를 통해 여과하여 미립자를 제거할 수 있다. 이어서 여과된 바이오디젤은 가연성 여과기에 통과시켜 임의의 잔류 침강물 및 규조토를 제거하여 최종 바이오디젤 생성물을 생성할 수 있다.
실시예 13는 프로토테카 모리포르미스로부터 트라이글라이세라이드를 사용하는 바이오디젤의 제조법을 기재하였다. 실시예 13에서 제조된 바이오디젤의 ASTM D6751 A1 방법에 의한 냉각 담금 여과능(Cold Soak Filterability)은 300㎖의 부피에 대해 120초이었다. 상기 시험은 16시간 동안 40℉로 냉각시키고 실온으로 가온되도록 방치하고 스테인레스 강철 지지체를 가진 0.7 마이크론 유리 섬유 필터를 사용하여 진공 여과하는, 300㎖의 B100의 여과를 포함한다. 본 발명의 오일은 120초 미만, 100초 미만 및 90초 미만의 냉각 담금 시간과 함께 에스터교환되어 바이오디젤을 생성할 수 있다.
후속 공정은 또한 바이오디젤이 특히 냉온에서 사용되는 경우 사용될 수 있다. 상기 공정은 동결방지처리(winterization) 및 부분 분리를 포함한다. 2개 공정은 혼탁점(바이오디젤이 결정화하기 시작하는 온도)을 저하시킴에 의해 연료의 냉각 흐름 및 동결방지 수행능을 개선시키도록 설계된다. 바이오디젤의 동결방지처리에는 다수의 방법이 있다. 한 가지 방법은 바이오디젤을 석유 디젤과 배합하는 것이다. 또 다른 방법은 바이오디젤의 혼탁점을 저하시킬 수 있는 첨가제를 사용하는 것이다. 또 다른 방법은 첨가제 중에 혼합하고 포화물이 결정화하도록 방치하고 이어서 결정을 여과 제거함에 의해 무분별하게 포화된 메틸 에스터를 제거하는 것이다. 부분 분리는 선택적으로 메틸 에스터를 개별 성분 또는 분획으로 분리하여 특정 메틸 에스터가 제거 또는 포함되도록 할 수 있다. 부분 분리 방법은 우레아 부분 분리, 용매 부분 분리 및 열 증류를 포함한다.
본 발명의 방법에 의해 제공될 수 있는 또 다른 가치있는 연료는 C10:0, C12:0, C14:0, C16:0 및 C18:0과 같은 알칸을 포함하여 바이오디젤과는 구분될 수 있는 재생가능한 디젤이다. 고품질의 재생가능한 디젤은 ASTM D975 표준에 부합한다. 본 발명의 방법에 의해 생성된 지질은 공급원료로서 작용하여 재생가능한 디젤을 생성할 수 있다. 따라서 본 발명의 또 다른 측면에서,재생가능한 디젤을 생성하는 방법이 제공된다. 재생가능한 디젤은 3개 이상의 공정에 의해 생성될 수 있다: 열수 가공(수소 처리); 수소화처리; 및 간접적인 액화. 이들 공정으로 비-에스터 증류물을 수득한다. 이들 공정 동안에, 본 명세서에 기재된 바와 같이 생성되고 분리된 트라이아실글라이세라이드는 알칸으로 전환된다.
한 실시형태에서, 재생가능한 디젤을 생성하는 방법은 (a) 본 명세서에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 미생물을 용해시켜 용해물을 생성하는 단계, (c) 용해된 미생물로부터 지질을 분리하는 단계, (d) 지질을 탈산화하고 수소화처리하여 알칸을 생성함으로써 재생가능한 디젤이 생성되도록 하는 단계를 포함한다. 재생가능한 디젤을 제조하기에 적합한 지질은 헥산과 같은 유기 용매를 사용하거나 미국 특허 제5,928,696호에 기재된 것들과 같은 다른 방법을 통해 미생물 바이오매스로부터 추출을 통해 수득할 수 있다. 몇몇 적합한 방법은 기계적 프레싱 및 원심분리를 포함할 수 있다.
일부 방법에서, 미생물 지질은 먼저 수소화처리와 연계하여 크랙킹하여 각각 탄소쇄 길이를 감소시키고 이중 결합을 포화시킨다. 상기 물질을 또한 이어서 수소화처리와 연계하여 이성질체화한다. 이어서 나프타 분획을 증류를 통해 제거함에 이어서 추가 증류하여 디젤 연료에 요구되는 성분을 증발시키고 증류시킴으로써 ASTM D975에 충족하도록 하고 D975 표준을 충족시키기 위해 요구되는 것 보다 무거운 성분을 잔류시킨다. 트라이글라이세라이드 오일을 포함하는 화학적으로 변형된 오일의 수소 처리, 수소 크랙킹, 탈산소화 및 이성질체화 방법은 당업계에 널리 공지되어 있다. 예를 들어, 유럽 특허 출원 EP1741768(A1); EP1741767(A1); EP1682466(A1); EP1640437(A1); EP1681337(A1); EP1795576(A1); 및 미국 특허 제7,238,277호; 제6,630,066호; 제6,596,155호; 제6,977,322호; 제7,041,866호; 제6,217,746호; 제5,885,440호; 제6,881,873호를 참조한다.
재생가능한 디젤을 생성하기 위한 방법의 하나의 양태에서, 알칸을 생성하기 위한 지질의 처리는 지질 조성물의 수소 처리에 의해 수행한다. 열수 가공에서, 전형적으로 바이오매스는 승온 및 승압에서 물 중에서 반응시켜 오일 및 잔류 고체를 형성시킨다. 전환 온도는 전형적으로 300℉ 내지 660℉이고, 이때 압력은 주로 액체로서 물을 유지하게 충분한 100 내지 170 표준 대기압(atm)이다. 반응 시간은 15 내지 30분 정도이다. 반응을 종결한 후 유기물을 물로부터 분리한다. 이에 의해 디젤에 적합한 증류물이 생성된다.
재생가능한 디젤을 제조하는 일부 방법에서, 트라이글라이세라이드를 처리하는 제1 단계는 이중 결합을 포화시키기 위한 수소 처리에 이어서 수소 및 촉매의 존재 하에 승온에서 탈산소화시키는 것이다. 몇몇 방법에서, 수소화 및 탈산소화는 동일한 반응에서 발생한다. 다른 방법에서 탈산소화는 수소화 전에 수행한다. 이어서 이성질체화는 임의로 또한 수소 및 촉매의 존재 하에서 수행한다. 나프타 성분은 바람직하게 증류를 통해 제거한다. 예를 들어, 미국 특허 제5,475,160호(트라이글라이세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 기체 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성질체화)를 참조한다.
트라이글라이세라이드의 수소화를 위한 하나의 적합한 방법은 구리, 아연, 마그네슘 및 란탄염의 수용액 및 알칼리금속 또는 바람직하게 탄산암모늄의 또 다른 용액을 제조하는 것을 포함한다. 상기 2가지의 용액을 약 20℃ 내지 약 85℃의 온도로 가열하고 침전 용기 내 pH가 5.5 내지 7.5로 유지되어 촉매를 형성하도록 하는 비율로 침전 용기 내로 함께 계량하여 부가할 수 있다. 추가의 물은 초기에 침전 용기 내에 사용할 수 있거나 염 용액 및 침전 용액과 동시에 첨가할 수 있다. 이어서 수득한 침전물을 약 300℃에서 세척하고 건조시키고 하소시키고 약 100℃ 내지 약 400℃의 온도 범위에서 수소중에서 활성화시킬 수 있다. 이어서 하나 이상의 트라이글라이세라이드는 반응기 내 상기된 촉매의 존재 하에 수소와 접촉시키고 반응시킬 수 있다. 상기 반응기는 트라이클 상 반응기, 고정 상 가스-고체 반응기, 팩킹된 기포 칼럼 반응기, 연속 교반 탱크 반응기, 슬러리 상 반응기 또는 당업계에 공지된 임의의 다른 적합한 반응기 유형일 수 있다. 상기 방법은 배치식으로 또는 연속식으로 수행할 수 있다. 반응 온도는 전형적으로 약 170℃ 내지 약 250℃의 범위이고 반응 압력은 전형적으로 약 300 psig 내지 약 2000 psig 범위이다. 더욱이, 본 발명의 방법에서 수소 대 트라이글라이세라이드의 몰 비는 전형적으로 약 20:1 내지 약 700:1의 범위이다. 상기 방법은 전형적으로 중량 시간 공간 속도(WHSV)에서 수행하고 이의 범위는 약 0.1시간-1 내지 약 5시간-1이다. 당업자는 반응을 위해 요구되는 시간은 사용되는 온도, 수소 대 트라이글라이세라이드의 몰비 및 수소 분압에 따라 다양함을 인지할 것이다. 상기 수소화 공정에 의해 생성되는 생성물은 지방 알코올, 글라이세롤, 미량의 파라핀 및 미반응 트라이글라이세라이드를 포함한다. 이들 생성물은 전형적으로 예를 들어, 증류, 추출, 여과, 결정화 등과 같은 통상적인 수단에 의해 분리한다.
석유 정련업자는 수소화처리를 사용하여 공급물을 수소로 처리하는 것에 의해 불순물을 제거한다. 수소화처리 전환 온도는 전형적으로 300℉ 내지 700℉이다. 상기 압력은 전형적으로 40 내지 100atm이다. 상기 반응 시간은 전형적으로 10 내지 60분 정도이다. 고체 촉매를 사용하여 특정 반응 속도를 증가시키고, 특정 생성물에 대한 선택성을 개선시키며 수소 소모를 최적화한다.
오일의 탈산소화를 위해 적합한 방법은 오일을 약 350℉ 내지 약 550℉ 범위의 온도로 가열하고 연속적으로 가열된 오일을 약 5분 이상 동안 적어도 약 대기압 이상의 압력하에서 수소와 접촉시키는 단계를 포함한다.
이성질체화를 위해 적합한 방법은 알칼리 이성질체화 및 당업계에 공지된 다른 오일 이성질체화를 사용하는 단계를 포함한다.
수소 처리 및 수소 가공은 궁극적으로 트라이글라이세라이드 공급물의 중량 감소를 유도한다. 상기 트라이글라이세라이드 분자는 수소 가공 조건하에 4개의 탄화수소 분자, 즉 프로판 분자 및 전형적으로 C8 내지 C18 범위의 3개의 더 무거운 탄화수소 분자로 감소한다.
따라서, 하나의 양태에서, 본 발명의 지질 조성물 상에서 수행되는 하나 이상의 화학 반응(들)의 생성물은 ASTM D975 재생가능한 디젤을 포함하는 알칸 혼합물이다. 미생물에 의한 탄화수소의 생성은 문헌[Metzger et al. Appl Microbiol Biotechnol (2005) 66: 486-496 and A Look Back at the U.S. Department of Energy's Aquatic Species Program: Biodiesel from Algae, NREL/TP-580-24190, John Sheehan, Terri Dunahay, John Benemann and Paul Roessler (1998)]에 의해 검토되었다.
디젤 연료의 증류 성질은 T10-T90 (각각 10% 및 90%의 부피가 증류되는 온도)의 관점에서 기재한다. 재생가능한 디젤은 프로토테카 모리포미스 트라이글라이세라이드로부터 생성되고 실시예 13에 기재된다. 실시예 13에 생성된 물질의 T10-T90은 57.9℃였다. 본 명세서에 기재된 오일의 수소 처리, 이성질체화 및 본 명세서에 기재된 다른 공유 변형 방법 및 증류 및 본 명세서에 기재된 부분 분리(예를 들어, 냉각 여과) 방법을 사용하면서, 본 명세서에 기재된 방법에 따라 생성된 트라이글라이세라이드를 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T10-T90 범위는 20, 25, 30, 35, 40, 45, 50, 60 및 65℃이다.
실시예 13에서 생성된 물질의 T10은 242.1℃이다. 본 명세서에 개시된 오일의 수소 처리, 이성질체화 및 다른 공유 변형 방법 및 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T10 값은 예를 들어, 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 적어도 290의 T10이다.
실시예 13에서 생성된 물질의 T90은 300℃이다. 본 명세서에 기재된 오일의 수소 처리, 이성질체화 및 다른 공유 변형 방법 및 본 명세서에 기재된 증류 및 부분 분리(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 T90 값은 예를 들어, 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 및 적어도 290의 T90이다.
실시예 13에서 생성된 물질의 FBP는 300℃이다. 본 명세서에 기재된 오일의 수소 처리, 이성질체화 및 다른 공유 변형 방법 및 본 명세서에 기재된 증류 및 부분 분리(냉각 여과와 같은) 방법을 사용하여 재생가능한 디젤 조성물을 생성할 수 있고 이때 다른 FBP 값은 예를 들어, 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 및 적어도 300의 FBP이다.
본 발명의 방법 및 조성물에 의해 제공된 기타 오일은 수소화처리, 이성질체화 및 다른 공유 변형의 조합에 적용될 수 있고 (a) 적어도 1%-5%, 바람직하게는 적어도 4%의 C8-C14; (b) 적어도 0.25%-1%, 바람직하게는 적어도 0.3%의 C8; (c) 적어도 1%-5%의 바람직하게는 적어도 2%의 C10; (d) 적어도 1%-5%, 바람직하게는 적어도 2%의 C12; 및 (3) 적어도 20%-40%, 바람직하게는 적어도 30% C8-C14를 포함하는 지질 프로파일을 갖는 오일을 포함한다.
전통적인 초-저 황 디젤은 2단계 공정에 의해 임의의 형태의 바이오매스로부터 생성될 수 있다. 먼저, 바이오매스를 수소 및 일산화탄소가 풍부한 가스 혼합물인 합성가스로 전환한다. 이어서, 합성가스를 촉매적으로 액체로 전환한다. 전형적으로, 액체의 생성은 피셔-트로프쉬(Fischer-Tropsch, FT) 합성을 사용하여 달성한다. 상기 기술은 석탄, 천연 가스 및 중유에 적용한다. 따라서, 재생가능한 디젤을 생성하기 위한 방법의 여전히 또 다른 바람직한 양태에서, 알칸을 생성하기 위한 액체 조성물의 처리는 액체 조성물의 간접적인 액화에 의해 수행된다.
본 발명은 또한 제트 연료를 제조하는 방법을 제공한다. 제트 연료는 스트로 색상으로 투명하다. 가장 일반적인 연료는 국제 표준 세트의 세부 항목으로 제조되는 항공기 A-1로서 분류되는 무연/석유 오일계 연료이다. 제트 연료는 다수의 상이한, 가능하게는 수천 개 이상의 많은 상이한 탄화수소의 혼합물이다. 이들의 크기 범위(분자량 또는 탄소수)는 생성물에 대한 요건, 예를 들어, 동결점 또는 발연점에 의해 제한된다. 케로손형(Kerosone-type) 항공기 연료(제트 A 및 제트 A-1을 포함함)는 약 8 내지 16개 탄소 수의 탄소 수 분포를 갖는다. 와이드-컷 또는 나프타형 항공기 연료(제트 B를 포함)는 전형적으로 약 5 내지 15개 탄소의 탄소 수 분포를 갖는다.
항공기(제트 A 및 제트 B)는 둘 다 다수의 부가제를 함유할 수 있다. 유용한 부가제는 항산화제, 대전방지제, 부식 억제제, 및 연료 시스템 아이싱 억제제(FSII)를 포함하지만 이에 제한되지 않는다. 항산화제는 검화(gumming)를 방지하고 일반적으로 알킬화된 페놀, 예를 들어, AO-30, AO-31, 또는 AO-37을 기초로 한다. 대전방지제는 정전기를 소멸시켜 스파킹을 차단한다. 활성 성분으로서 다이노닐나프틸설폰산(dinonylnaphthylsulfonic acid, DINNSA)을 갖는 Stadis 450이 하나의 예이다. 부식 억제제, 예를 들어, DCI-4A는 대중 및 군사 연료용으로 사용되고 DCI-6A는 군사 연료용으로 사용된다. FSII 제제는 예를 들어, Di-EGME를 포함한다.
본 발명의 하나의 양태에서, 제트 연료는 기존의 제트 연료와 조류 연료를 배합하는 것에 의해 제조된다. 본 발명의 방법에 의해 생성된 지질은 공급원료서 작용하여 제트 연료를 생성할 수 있다. 따라서, 본 발명의 또 다른 측면에서, 제트 연료를 제조하는 방법이 제공된다. 이와 함께 본 발명의 방법에 의해 생성된 지질로부터 제트 연료를 제조하는 2가지 방법으로서 유동 촉매 크랙킹(fluid catalytic cracking, FCC); 및 수소탈산소화(hydrodeoxygenation, HDO)가 제공된다.
유동 촉매 크랙킹(FCC)은 중질 분획물 기원의 올레핀, 특히 프로필렌을 제조하기 위해 사용되는 하나의 방법이다. 본 발명의 방법에 의해 생성된 지질은 올레핀으로 전환할 수 있다. 상기 방법은 FCC 영역을 통해 생성된 지질을 유동시키고 제트 연료로서 유용한 올레핀으로 구성된 생성물 스트림을 수거함을 포함한다. 생성된 지질은 크랙킹 조건에서 크랙킹 촉매와 접촉시켜 제트 연료로서 유용한 올레핀 및 탄화수소를 포함하는 생성물 스트림을 제공한다.
한 실시형태에서, 제트 연료를 제조하는 방법은 (a) 본 명세서에 기재된 방법을 사용하여 지질 함유 미생물을 배양하는 단계, (b) 지질 함유 미생물을 용해시켜 용해물을 생성하고, (c) 용해물로부터 지질을 분리하는 단계, (d) 지질 조성물을 처리함으로써 제트 연료를 생성하는 단계를 포함한다. 제트 연료를 제조하는 방법의 한 실시형태에서, 상기 지질조성물은 유체 촉매 크랙킹 영역을 통류할 수 있고 이는 하나의 양태에서 지질 조성물을 크랙킹 조건에서 크랙킹 촉매와 접촉시켜 C2-C5 올레핀을 포함하는 생성물을 제공하는 단계를 포함할 수 있다.
상기 방법의 특정 양태에서, 지질 조성물에 존재할 수 있는 임의의 오염물을 제거하는 것이 바람직할 수 있다. 따라서, 유체 촉매 크랙킹 영역을 통해 지질 조성물을 유동시키기 전에, 지질 조성물을 전처리한다. 전처리는 지질 조성물을 이온 교환 수지와 접촉시키는 것을 포함할 수 있다. 이온 교환 수지는 산성 이온 교환 수지, 예를 들어 Amberlyst(상표명)-15이고 지질 조성물이 통류(상향 통류 또는 하향 통류)하는 반응기 내 상으로서 사용될 수 있다. 다른 전처리는 액체 조성물을 산, 예를 들어, 황산, 아세트산, 질산 또는 염산과 접촉시킴에 의한 약산 세척을 포함할 수 있다. 접촉은 일반적으로 주위 온도 및 대기압에서 희석 산 용액과 수행된다.
임의로 전처리된 지질 조성물은 탄화수소 성분이 올레핀으로 크랙킹되는 FCC 영역으로 유동한다. 촉매 크랙킹은 반응 영역중의 지질 조성물을 미분된 미립자 물질로 구성된 촉매와 접촉시킴에 의해 달성한다. 상기 반응은 수소 크랙킹과는 반대로 촉매 크랙킹이고 부가되는 수소의 부재 또는 수소의 소비에서 수행한다. 크랙킹 반응이 진행함으로써 상당한 양의 코크가 촉매상에 침착된다. 상기 촉매는 재생 영역에서 촉매 기원의 코크를 연소시킴에 의해 고온에서 재생된다. 본 명세서에서, "코크 촉매"로서 언급되는 코크 함유 촉매는 반응 영역으로부터 재생될 재생 영역으로 연속으로 수송되고 재생 영역 기원의 필수적 코크 부재의 재생된 촉매에 의해 대체된다. 다양한 가스 스트림에 의한 촉매 입자의 유동화는 반응 영역과 재생 영역간에 촉매의 수송을 허용한다. 촉매의 유동화 스트림에서 본 명세서에 기재된 지질 조성물의 탄화수소와 같은 탄화수소를 크랙킹하고, 반응 영역 및 재생 영역간에 촉매를 수송하고 재생기내 코크를 연소시키는 방법은 FCC 방법 기술 분야의 당업자에게 널리 공지되어 있다. C2-C5 올레핀을 제조하기 위해 지질 조성물을 크랙킹하는데 유용한 예시적인 FCC 적용 및 촉매는 전문이 본 명세서에 참조로서 포함된 미국 특허 제6,538,169호 및 제7,288,685호에 기재되어 있다.
적합한 FCC 촉매는 일반적으로 동일한 매트릭스에 존재하거나 존재하지 않을 수 있는 2개 이상의 성분을 포함한다. 몇몇 양태에서, 2개의 성분 둘 다는 전체 반응 용기를 거쳐 순환할 수 있다. 제1 성분은 일반적으로 유동화된 촉매 크랙킹의 분야에 사용되는 임의의 널리 공지된 촉매를 포함하고, 예를 들어, 활성 무정형 점토형 촉매 및/또는 고활성의 결정 분자체가 있다. 분자체 촉매는 목적하는 생성물에 대한 이의 매우 개선된 선택성 때문에 무정형 촉매 보다 바람직할 수 있다. 몇몇 바람직한 양태에서, 제올라이트는 FCC 공정에서 분자체로서 사용할 수 있다. 바람직하게, 제1 촉매 성분은 실리카 또는 알루미나 및 카올린과 같은 불활성 충전제를 포함하는, 대형 공극 제올라이트, 예를 들어, Y형 제올라이트, 활성 알루미나 물질, 결합제 물질을 포함한다.
하나의 양태에서, 본 발명의 지질 조성물의 크랙킹은 FCC 영역의 상위 부문 또는 리프트 부문에서 발생한다. 상기 지질 조성물은 노즐에 의해 상부로 도입되어 지질 조성물의 신속한 증발을 유도한다. 촉매와 접촉시키기 전에, 상기 지질 조성물은 통상적으로 약 149℃ 내지 약 316℃(300℉ 내지 600℉)의 온도를 갖는다. 상기 촉매는 배합 용기로부터 상부로 유동하며, 여기서 이것은 약 2초 이하의 시간 동안 지질 조성물과 접촉한다.
배합된 촉매 및 반응된 지질 조성물 증기는 이어서 출구를 통해 상부로부터 배출되고 올레핀, 및 상당한 양의 코크로 덮여지고 일반적으로 "코크된 촉매"로 언급되는 촉매 입자의 수거물을 포함하는 크랙킹된 생성물 증기로 분리된다. 목적하는 생성물이 바람직하지 못한 다른 생성물로 추가로 전환되는 것을 촉진시킬 수 있는, 지질 조성물과 촉매의 접촉시간을 최소화하기 위한 일환으로 스월 암 정렬 장치(swirl arm arrangement)와 같은 임의의 정렬된 분리기를 사용하여 생성물 스트림으로부터 신속하게 코크된 촉매를 제거할 수 있다. 분리기, 예를 들어, 스월 암 분리기는 챔버의 하한부에 위치한 스트립핑 영역(stripping zone)과 함께 챔버의 챔버의 상한부에 위치한다. 스월 암 정렬 장치에 의해 분리된 촉매는 스트립핑 영역으로 적가된다. 가벼운 올레핀 및 몇몇 촉매를 포함하는 크랙킹된 탄화수소를 포함하는 크랙킹된 생성물 증기는 사이클론과 소통하는 도관을 통해 챔버로부터 배출된다. 상기 사이클론은 생성물 증기로부터 잔류 촉매 입자를 제거하여 입자 농도를 매우 낮은 수준으로 감소시킨다. 이어서 상기 생성물 증기는 분리 용기의 상부를 상부로부터 배출된다. 사이클론에 의해 분리된 촉매는 분리 용기에 이어서 스트립팅 영역으로 복귀한다. 스트립핑 영역은 증기와의 역류 접촉에 의해 촉매 표면으로터 흡착된 탄화수소를 제거한다.
낮은 탄화수소 분압은 가벼운 올레핀이 우선적으로 생성되도록 작용한다. 따라서, 상부압은 약 172 내지 241 kPa(25 내지 35 psia)로 설정되고 탄화수소 분압은 약 35 내지 172 kPa(5 내지 25 psia)이고 바람직한 탄화 수소 분압은 약 69 내지 138 kPa(10 내지 20 psia)이다. 탄화수소에 대한 상대적 낮은 분압은 희석제가 지질 조성물의 10중량% 내지 55중량% 및 바람직하게는 지질 조성물의 약 15중량% 정도인 희석제로서 증기를 사용함에 의해 달성된다. 다른 희석제, 예를 들어, 무수 가스를 사용하여 등가의 탄화수소 분압에 도달할 수 있도록 할 수 있다.
상부 출구에서 크랙킹된 증기의 온도는 약 510℃ 내지 621℃ (950℉ 내지 1150℉)이다. 그러나, 566℃(1050℉) 초과의 상부 출구 온도는 보다 무수의 가스 및 더 많은 올레핀을 생성시킨다. 반면에, 566℃(1050℉) 미만의 상부 출구 온도는 에틸렌 및 프로필렌을 적게 생성시킨다. 따라서, 약 566℃ 내지 약 630℃의 바람직한 온도, 약 138 kPa 내지 약 240 kPa (20 내지 35 psia)의 바람직한 압력에서 FCC 공정을 수행하는 것이 바람직하다. 상기 공정의 또 다른 조건은 약 5 내지 약 20 및 바람직하게는 약 10 내지 약 15로 다양할 수 있는 지질 조성물에 대한 촉매 비이다.
제트 연료를 생성하는 방법의 하나의 양태에서, 상기 지절 조성물은 FCC 반응기의 리프트 부문으로 도입된다. 리프트 부문에서 온도는 매우 고온이고 약 700℃(1292℉) 내지 약 760℃ (1400℉)의 범위이고 지질 조성물에 대한 촉매의 비율은 약 100 내지 약 150이다. 이것은 지질 조성물의 리프트 부문으로의 도입이 상당한 양의 프로필렌 및 에틸렌을 생성할 것으로 예상된다.
본 명세서에 기재된 바와 같이 생성된 지질 조성물 또는 지질을 사용하여 제트 연료를 생성시키는 방법의 또 다른 양태에서, 지질 조성물 또는 지질의 구조는 수소탈산소화(HDO)로 언급되는 공정에 의해 파괴된다. HDO는 수소에 의한 산소의 제거를 의미하는데, 즉 산소는 물질의 구조를 파괴시키면서 제거된다. 올레핀 이중 결합을 수소화시키고 임의의 황 및 질소 화합물을 제거한다. 황 제거는 소위 수소탈황화(hydrodesulphurization, HDS)로 불린다. 원료(지질 조성물 또는 지질)의 전처리 및 순도는 촉매의 작용 수명에 기여한다.
일반적으로, HDO/HDS 단계에서, 수소는 공급 스톡(지질 조성물 또는 지질)과 혼합하고 이어서 상기 혼합물을 단일상 또는 2개 상 공급 스톡으로서 동시 유류물로서 촉매상에 통과시킨다. HDO/HDS 단계 후, 생성물 분획을 분리하고 별도의 이성질체화 반응기에 통과시킨다. 생물학적 출발 물질용 이성질체화 반응기는 동시 유류 반응기로서 문헌(FI 100 248)에 기재되어 있다.
탄화수소 공급물, 예를 들어, 본 명세서에서의 지질 조성물 또는 지질을 수소화시키는 단계에 의한 연료의 제조 방법은 또한 지질 조성물 또는 지질을 동시 유류물로서 제1 수소화 영역을 통해 수소 가스와 함께 통과시킴으로써 수행될 수 있고 이후 탄화수소 유출물은, 수소 가스를 탄화수소 유출물과는 반대로 역류 유동물로서 제2 수소화 영역에 통과시킴으로써 제2 수소화 영역에서 추가로 수소화시킨다. 지질 조성물을 크랙킹하여 C2-C5 올레핀을 제조하는데 유용한 예시적인 HDO 적용 및 용매는 전문이 본 명세서에 참조로서 인용되는 미국 특허 제7,232,935호에 기재되어 있다.
전형적으로, 수소탈산소화 단계에서, 본 명세서에서의 지질 조성물 또는 지질과 같은 생물학적 성분의 구조는 산소, 질소, 인 및 황 화합물로 분해되고 가스로서의 가벼운 탄화수소가 제거되며 올레핀 결합은 수소화된다. 상기 방법의 제2 단계에서, 즉 소위 이성질체화와 단계에서, 이성질체화는 낮은 온도에서 탄화수소 쇄를 측쇄화하고 파라핀의 수행능을 개선시키는 단계에 의해 수행된다.
제1 단계, 즉 크랙킹 공정의 HDO 단계에서 수소 가스, 및 수소화되어야만 하는 본 명세서의 지질 조성물 또는 지질은 HDO 촉매상 시스템에 동시 유류물로서 또는 역류물로서 통과시키고 상기 촉매상 시스템은 하나 이상의 촉매상, 바람직하게 1 내지 3개의 촉매상을 포함한다. HDO 단계는 전형적으로 동시 유류 방식으로 작동한다. 2개 이상의 촉매상을 포함하는 HDO 촉매상 시스템의 경우에, 상기 상 중 하나 이상은 역류물 원칙을 사용하여 작동할 수 있다. HDO 단계에서, 압력은 20 내지 150 bar, 바람직하게는 50 내지 100 bar로 다양하고 온도는 200 내지 500℃, 바람직하게는 300 내지 400℃로 다양하다. HDO 단계에서, 원소 주기율표의 VII 족 및/또는 VIB족 금속을 함유하는 공지된 수소화 촉매가 사용될 수 있다. 바람직하게, 수소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고, 상기 지지체는 알루미나 및/또는 실리카이다. 전형적으로, NiMo/Al2O3 및 CoMo/Al2O3 촉매가 사용된다.
HDO 단계 전에, 본 명세서에서 지질 조성물 또는 지질은 임의로 보다 온화한 조건하에서 예비수소화로 처리하여 이중결합의 부반응을 회피할 수 있다. 상기 예비수소화는 50 내지 400℃의 온도 및 1 내지 200 바의 수소 압력, 바람직하게는 150 내지 250℃의 온도 및 10 내지 100 바의 수소 압력에서 수행한다. 상기 촉매는 원소주기율표의 VIII족 및/또는 VIB족 기원의 금속을 함유할 수 있다. 바람직하게, 예비소화 촉매는 지지된 Pd, Pt, Ni, NiMo 또는 CoMo 촉매이고 상기 지지체는 알루미나 및/또는 실리카이다.
수소를 함유하는 HDO 단계 기원의 가스 기류를 냉각시킴에 이어서 일산화탄소, 이산화탄소, 질소, 인 및 황 화합물, 가벼운 가스 탄화수소 및 다른 불순물을 이로부터 제거한다. 압착시킨 후 정제된 수소 또는 재활용된 수소를 제1 촉매상으로 및/또는 촉매상 사이로 복귀시켜 인출된 기류를 구성하도록 한다. 물은 축합 액체로부터 제거한다. 상기 액체는 제1 촉매상 또는 촉매상 사이로 통과시킨다.
HDO 단계 후, 생성물은 이성질체화 단계에 적용한다. 이것은 탄화수소를 이성질체화 촉매와 접촉시키기전에 불순물을 가능한 완전히 제거하는 공정을 위해 필요하다. 상기 이성질체화 단계는 임의의 교반 단계를 포함하고, 이때, HDO 단계 기원의 반응 생성물은 수증기 또는 가벼운 탄화수소, 질소 또는 수소와 같은 적합한 가스 증기를 스트립핑함으로써 정제될 수 있다. 임의의 스트립핑 단계는 이성질체화 촉매의 상부 유닛에서 역류 방식(여기서, 여기서, 가스 및 액체는 서로 접촉한다)으로 수행되거나 역류 원칙을 사용하는 별도의 스트립핑 유닛 역류 원리에서 실제 이성질체화 반응기 전에 수행한다.
스트립핑 단계 후, 수소 가스 및 본 명세서에서의 수소화된 지질 조성물 또는 지질 및 n-파라핀 혼합물을 하나 이상의 촉매상(들)을 포함하는 반응성 이성질체화 유닛에 통과시킨다. 이성질체화 단계의 촉매상은 동시 유류 또는 역류 방식으로 작동할 수 있다.
역류 원리가 이성질체화 단계에 적용되는 것은 상기 공정을 위해 중요하다. 이성화체 단계에서, 이것은 임의의 스트립핑 단계 또는 이성질체화 반응 단계 중 하나 또는 둘 다를 역류 방식으로 진행하는 것으로 수행한다. 이성질체화 단계에서, 압력은 20 내지 150 bar, 바람직하게는 20 내지 100 bar로 다양하고, 온도는 200 내지 500℃, 바람직하게는 300 내지 400℃이다. 이성질체화 단계에서, 당업계에 공지된 이성질체화 촉매가 사용될 수 있다. 적합한 이성질체화 촉매는 분자체 및/또는 VII족 금속 및/또는 운반체를 함유한다. 바람직하게, 이성질체화 촉매는 SAPO-11 또는 SAPO41 또는 ZSM-22 또는 ZSM-23 또는 페리어라이트(ferrierite) 및 Pt, Pd 또는 Ni 및 Al2O3 또는 SiO2를 함유한다. 전형적인 이성질체화 촉매는 예를 들어, Pt/S APO-11/Al2O3, Pt/ZSM-22/Al2O3, Pt/ZSM-23/Al2O3 및 Pt/SAPO-11/SiO2이다. 이성질체화 단계 및 HDO 단계는 동일한 압력 용기 또는 별도의 압력 용기에서 수행할 수 있다. 임의의 예비수소화는 별도의 압력 용기 또는 HDO 및 이성질체화 단계와 동일한 압력 용기에서 수행할 수 있다.
따라서, 한 실시형태에서, 하나 이상의 화학 반응의 생성물은 HRJ-5를 포함하는 알칸 혼합물이다. 다른 실시형태에서, 하나 이상의 화학적 반응 생성물은 ASTM D1655 제트 연료를 포함하는 알칸 혼합물이다. 일부 실시형태에서, ASTM 1655 제트 연료의 세부 항목을 준수하는 조성물은 10 ppm 미만의 황 함량을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 205℃ 미만의 증기 곡선의 T10값을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 300℃ 미만의 최종 비점(FBP)을 갖는다. 또 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 38℃ 이상의 인화점을 갖는다. 또 다른 실시형태에서, ASTM 1655 제트 염료의 세부항목을 준수하는 조성물은 775K/M3 내지 840K/M3의 밀도를 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 -47℃ 미만의 빙점을 갖는다. 다른 양태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 42.8 MJ/K 이상의 총 연소열을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 13.4 질량% 이상의 수소 함량을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 Hg의 3㎜ 미만인, 260℃에서의 정량적 정량적 중량 JFTOT에 의한 시험시 열 안정성을 갖는다. 다른 실시형태에서, ASTM 1655 제트 연료의 세부항목을 준수하는 조성물은 7㎎/㎗ 미만인 실제 검을 갖는다.
따라서, 본 발명은 미세조류 지질의 화학적 변형으로 다양한 산업적 및 다른 적용 분야에 유용한 생성물을 수득하는 다양한 방법을 기재하고 있다. 본 명세서에 기재된 방법에 의해 생성된 오일을 변형시키는 방법의 예는 오일 가수분해, 오일의 수소화처리 및 오일의 에스터화를 포함하지만 이에 제한되지 않는다. 미세조류 지질의 다른 화학적 변헝은, 이에 제한되는 것은 아니지만, 에폭시화, 산화, 가수분해, 황산화, 술폰산화, 에톡실화, 프로폭실화, 아미드화 및 비누화를 포함한다. 미세조류 오일의 변형은 기본 함유화학물질을 생성하고 이는 추가로 목적하는 기능을 위해 선택된 유도체 함유화학물질로 변형시킬 수 있다. 연료 생성 공정과 관련하여 상기된 것과 유사한 방식으로, 이들 화학적 변형은 또한 본 명세서에 기재된 미생물 배양으로부터 생성된 오일상에서 수행할 수 있다. 기본 함유화학물질의 예는 비누, 지방산, 지방 에스터, 지방 알코올, 지방 질소 화합물, 지방산 메틸 에스터 및 글라이세롤을 포함하지만 이에 제한되지 않는다. 유도체 함유화학물질의 예는 지방 니트릴, 에스터, 이량체 산, 쿠아트(quat), 계면활성제, 지방 알칸올아마이드, 지방 알코올 설페이트, 수지, 유화제, 지방 알코올, 올레핀, 굴착 이수, 폴리올, 폴리우레탄, 폴리아크릴레이트, 고무, 양초, 화장품, 금속성 비누, 비누, 알파-설폰화된 메틸 에스터, 지방 알코올 설페이트, 지방 알코올 에톡실레이트, 지방 알코올 에터 설페이트,이미다졸린, 계면활성제, 세정제, 에스터, 쿠아트, 오존분해 생성물, 지방 아민, 지방 알칸올아마이드, 에톡시설페이트, 모노글라이세라이드, 다이글라이세라이드, 트라이글라이세라이드(중간쇄 트라이글라이세라이드를 포함), 윤활제, 작동유, 그리스, 유전성 유체, 이형제, 금속가공유제, 열전달유체, 기타 기능성 유체, 산업적 화학물질(예를 들어 세정제, 텍스타일 가공 보조제, 가소제, 안정제, 첨가제), 표면 코팅, 페인트 및 라커, 전기 배선 절연 및 고급 알칸을 포함하지만 이에 제한되지 않는다.
본 발명의 방법에 의해 생성된 글라이세로지질 기원의 지방산 성분의 가수분해는 다른 유용한 화학물질을 생성하도록 유도체화될 수 있는 유리된 지방산을 생성시킨다. 가수분해는 산 또는 염기일 수 있는 물 및 촉매의 존재 하에 수행한다. 유리된 지방산을 유도체화하여 다음에 보고되는 바와 같은 다양한 생성물을 수득할 수 있다: 미국특허 제5,304,664호(고도로 황화된 지방산); 제7,262,158호(세정 조성물); 제7,115,173호(직물 연화 조성물); 제6,342,208호(피부 처리용 에멀젼); 제7,264,886호(방수 조성물); 제6,924,333호(페인트 첨가제); 제6,596,768호 (지질 풍부 반추동물 공급원료); 및 제6,380,410호(세제 및 세정제용 계면활성제).
본 발명의 하나의 양태에서 가수분해와 관련하여 트라이글라이세라이드 오일은 임의로 먼저 물 또는 수산화나트륨과 같은 액체 매질 중에서 가수분해하여 글라이세롤 및 비누를 수득한다. 다양한 적합한 트라이글라이세라이드 가수분해 방법이 있고 여기에는 비누화, 산 가수분해, 알칼린 가수분해, 효소 가수분해(본 명세서에서 분할으로서 언급됨), 및 고온 압착수를 사용한 가수분해가 포함되지만 이에 제한되지 않는다. 당업자는 트라이글라이세라이드 오일이 함유화학물질을 생성하기 위해 가수분해될 필요가 없고 차라리 상기 오일이 다른 공지된 방법에 의해 목적하는 함유화학물질로 직접 전환될 수 있다. 예를 들어, 트라이글라이세라이드 오일은 에스터화를 통해 메틸 에스터 지방산으로 직접 전환될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 방법에 의해 생성된 오일의 촉매 가수분해는 오일을 글라이세롤 및 지방산으로 분리시킴으로써 발생한다. 상기 논의된 바와 같이, 지방산은 이어서 여러 다른 변형을 통해 수득된 유도체 함유화학물질로 추가로 가공될 수 있다. 예를 들어 한 실시형태에서, 지방산은 아민화 반응하도록 진행시켜 지방 질소 화합물을 생성할 수 있다. 다른 실시형태에서, 지방산은 일염기성 및 이염기성 산을 생성하도록 오존용해에 적용될 수 있다.
다른 양태에서, 가수분해는 오일 분리를 통해 발생하여 함유화학물질을 생성할 수 있다. 본 발명의 몇몇 바람직한 양태에서, 트라이글라이세라이드 오일은 다른 공정을 수행하기 전에 분리될 수 있다. 당업자는 많은 적합한 트라이글라이세라이드 분리 방법이 존재한다는 것을 인지할 수 있고 상기 방법은 효소 분리 및 압력 분리를 포함하지만 이에 제한되지 않는다.
일반적으로, 효소적 오일 분리 방법은 물/오일 혼합물에 대해 작용하는 생촉매로서 효소인 리파제를 사용한다. 효소적 분리는 그 다음에 오일 또는 지방을 글라이세롤 및 유리된 지방산으로 분리한다. 상기 글라이세롤은 수층으로 이동하는 반면 상기 유기층에는 유리된 지방산이 풍부해진다.
효소 분할 반응은 일반적으로 유기 및 수성 상간의 경계상에서 일어나고 여기서 효소는 단지 경계상에 존재한다. 이어서 경계상과 만나는 트라이글라이세라이드는 분리 반응에 기여하거나 이에 관여한다. 반응이 진행됨에 따라, 유리된 지방산과는 대조적으로 여전히 글라이세라이드로 화학적으로 결합되어 있는 지방산의 작업 밀도 또는 농도는 경계상에서 감소하여 반응은 느려진다. 특정 양태에서, 효소 분할은 실온에서 일어날 수 있다. 당업자는 오일을 원하는 지방산으로 분리시키는데 적합한 조건에 정통하고 있다.
예로서, 반응 속도는 상호 경계 표면을 증가시키는 것으로 가속화될 수 있다. 일단 반응이 완료되면, 유리된 지방산을 이어서 효소로부터 유리된 유기상으로부터 분리하고 글라이세라이드로 여전히 화학적으로 결합되어 있는 지방산을 함유하는 잔사는 역 공급되거나 재활용되고 새로운 오일 또는 지방과 혼합되어 분리방법에 적용시킨다. 이어서 상기 방식으로 재활용된 글라이세라이드는 추가의 효소적 분할 방법에 적용된다. 몇몇 양태에서, 유리된 지방산은 상기 방식으로 부분적으로 분리된 오일 또는 지방으로부터 추출된다. 상기 방식으로, 화학적으로 결합된 지방산(트라이글라이세라이드)이 분리 공정으로 복귀하거나 역 공급되는 경우 효소 소비는 급격히 감소할 수 있다.
분할 정도는 측정된 산 값을, 소정의 오일 또는 지방에 대해 계산될 수 있는 이론적으로 가능한 산 값으로 나눈 비율로서 결정한다. 바람직하게, 산 값은 표준 일반 방법에 따른 적정을 사용하여 측정한다. 또한, 수성 글라이세롤 상의 밀도는 분리 정도에 대한 척도로서 취할 수 있다.
한 실시형태에서, 본 명세서에 기재된 바와 같은 분리 방법은 또한 생성된 오일의 알칼리 정련 공정 기원의 소위 비누-스톡에 함유된 모노-, 다이- 및 트라이글라이세라이드에 적합하다. 상기 방식으로, 비누 스톡은 사전 비누화 없이 천연 오일의 지방산으로 정량적으로 전환될 수 있다. 상기 목적을 위해, 비누에 화학적으로 결합된 지방산을 바람직하게는 분리 전에 산의 부가를 통해 방출시킨다. 특정 양태에서, 완충제은 분할 공정을 위한 물 및 효소에 추가로 사용된다.
한 실시형태에서, 본 발명의 방법에 따라 생성된 오일은 또한 가수분해 방법으로서 비누화에 적용될 수 있다. 동물성 및 식물성 오일은 트라이하이드릭 알코올인 글라이세롤과 지방산의 에스터인 트라이아실글라이세롤(TAG)로 이루어진다. 알칼린 가수분해 반응에서, TAG내 글라이세롤이 제거되어 3개의 카복실산 음이온이 생성되고 이는 나트륨 또는 칼륨과 같은 알칼리 금속 양이온과 연합하여 지방산 염을 생성할 수 있다. 상기 기획에서, 카복실산 성분들은 글라이세롤 잔기로부터 절단되고 하이드록실 그룹으로 대체된다. 상기 반응에 사용되는 염기(예를 들어, KOH)의 양은 목적하는 비누화 정도에 의해 측정된다. 예를 들어, 상기 목적이 본래 TAG 조성물중에 존재하는 오일의 일부를 포함하는 생성물을 제조하기 위한 것인 경우, 모든 TAG를 지방산 염으로 전환시키기에 불충한 양의 염기가 반응 혼합물로 도입된다. 통상적으로, 상기 반응은 수용액중에 수행하여 서서히 진행시키지만 가열에 의해 촉진될 수 있다. 지방산 염의 침전은 수용성 알칼리 금속 할라이드(예를 들어, NaCl 또는 KCl)와 같은 염을 반응 혼합물에 부가하여 촉진될 수 있다. 바람직하게, 상기 염기는 알칼리 금속 수산화물(예를 들어, NaOH 또는 KOH)이다. 대안으로, 예를 들어 트라이에탄올아민 및 아미노메틸프로판올을 포함하는 알칸올아민과 같은 다른 염기가 상기 반응 계획에 사용될 수 있다. 일부 경우에, 이들 대안은 투명한 비누 생성물을 제조하는데 바람직할 수 있다. 한 실시형태에서 비누화되는 지질 조성물은 본 명세서에 기재된 바와 같이 생성된 탤로 모방체(즉, 탤로와 유사한 지질 조성물), 또는 탤로 모방체와 다른 트라이글라이세라이드 오일의 배합물이다.
몇몇 방법에서, 화학적 변형의 제1 단계는 수소 및 촉매의 존재 하에 승온에서 이중 결합을 포화시키기 위한 수소화처리 후에 탈산소화하는 것이다. 다른 방법에서, 수소화 및 탈산소화는 동일한 반응중에서 일어날 수 있다. 여전히 다른 방법에서, 탈산소화는 수소화 전에 발생한다. 이어서 이성질체화는 또한 수소 및 촉매의 존재 하에서 임의로 수행할 수 있다. 최종적으로, 가스 및 나프타 성분은 경우에 따라 제거할 수 있다. 예를 들어, 미국 특허 5,475,160호(트라이글라이세라이드의 수소화); 제5,091,116호(탈산소화, 수소화 및 가스 제거); 제6,391,815호(수소화); 및 제5,888,947호(이성질체화)를 참조한다.
본 발명의 일부 실시형태에서, 트라이글라이세라이드 오일은 부분적으로 또는 완전히 탈산소화된다. 탈산소화 반응은 지방산, 지방 알코올, 폴리올, 케톤 및 알데하이드를 포함하지만, 이에 제한되지 않는, 원하는 생성물을 생성시킨다. 일반적으로, 임의의 특정 이온에 구애되지 않고 탈산소화 반응은, 지방산 또는 지방산 에스터로부터 산소를 적어도 부분적으로 제거하여 추가의 공정에 의해 목적하는 화학물질로 용이하게 전환될 수 있는 지방 알코올과 같은 반응 생성물을 생성시키는 반응으로서, 제한 없이 수소용해, 수소생성, 연속 수소화-수소용해, 연속 수소용해-수소화 및 조합된 수소화-수소용해 반응을 포함하는 다양하고 상이한 반응 경로의 조합을 포함한다. 예를 들어, 하나의 양태에서, 지방 알코올은 FCC 반응을 통해 올레핀으로 또는 축합 반응을 통해 고급 알칸으로 전환될 수 있다.
하나의 상기 화학적 변형은 글라이세로지질 또는 유리 지방산의 지방산 성분에서 이중 결합으로 수소를 첨가하는 수소화이다. 수소화 반응으로 액체 오일은 특정 응용을 위해 보다 적합할 수 있는 반고체 또는 고체 지질로 전환될 수 있다.
본 명세서에 기재된 방법에 의해 생성된 오일의 수소화는 하기에 보고된 바와 같이 본 명세서에 제공된 방법 및/또는 재료 중 하나 이상과 연계하여 수행할 수 있다: 미국 특허 제7,288,278호 (식품 첨가제 또는 의약); 제5,346,724호(윤활 생성물); 제5,475,160호(지방 알코올); 제5,091,116호(식용 오일); 제6,808,737호(마가린 및 스프레드용 구조적 지방); 제5,298,637호(감소된 칼로리 지방 대용물); 제6,391,815호(수소화 촉매 및 황 흡착제); 제5,233,099호 및 제5,233,100호(지방 알코올); 제4,584,139호(수소화 촉매); 제6,057,375호(소포제); 및 제7,118,773호(식용 에멀젼 스프레드).
당업자는 탄수화물을 수소화시키기 위해 다양한 방법이 사용될 수 있음을 인지할 것이다. 하나의 적합한 방법은 수소화 반응기에서 수소화된 생성물을 형성하기 위해 충분한 조건하에서 적합한 가스 및 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시키는 단계를 포함한다. 수소화 촉매는 일반적으로 단독으로, 또는 W, Mo, Au, Ag, Cr, Zn, Mn, Sn, B, P, Bi, 및 합금 또는 이의 조합체와 같은 촉진제와 함께 Cu, Re, Ni, Fe, Co, Ru, Pd, Rh, Pt, Os, Ir, 및 합금 또는 이의 조합체를 포함할 수 있다. 다른 효과적인 수소화 촉매 물질은 지지된 니켈 또는 레늄으로 변형된 루테늄을 포함한다. 하나의 양태에서, 수소화 촉매는 또한 촉매의 목적하는 기능성에 따라, 지지체 중 임의의 하나를 포함한다. 수소화 촉매는 당업자에게 공지된 방법에 의해 제조할 수 있다.
일부 실시형태에서, 수소화 촉매는 지지된 VIII족 금속 촉매 및 금속 스폰지 물질(예를 들어, 스폰지 니켈 촉매)을 포함한다. 라니 니켈은 본 발명에 사용하기에 적합한 활성화된 스폰지 니켈 촉매의 예를 제공한다. 다른 양태에서, 본 발명의 수소화 반응은 니켈-레늄 촉매 또는 텅스텐-변형된 니켈 촉매를 포함하는 촉매를 사용하여 수행한다. 본 발명의 수소화 반응을 위해 적합한 촉매의 예는 탄소 지지된 니켈-레늄 촉매이다.
하나의 양태에서, 적합한 라니 니켈 촉매는 예를 들어, 약 25중량%의 수산화나트륨을 함유하는 알칼리 수용액으로 대략 균등 중량의 니켈 및 알루미늄의 합금을 처리함에 의해 제조할 수 있다. 상기 알루미늄은 선택적으로 알칼리 수용액에 의해 용해되어 알루미늄이 최소량인 대부분 니켈을 포함하는 스폰지형 물질을 수득한다. 초기 합금은 약 1 내지 2중량%가 형성된 스폰지 니켈 촉매중에 잔류하도록 하는 양으로 촉진제 금속(즉, 몰리브덴 또는 크로뮴)을 포함한다. 또 다른 양태에서, 수소화 촉매는 물중에서 루테늄(III) 니트로실니트레이트, 루테늄(III) 클로라이드의 용액을 사용하여 적합한 지지체 물질을 침지시키기 위해 제조한다. 이어서 상기 용액을 건조시켜 수분 함량이 약 1중량% 미만인 고체를 형성한다. 상기 고체는 이어서 4시간 동안 회전볼 로내 300℃(하소되지 않음) 또는 400℃(하소됨)에서 수소 스트림 중에 대기압으로 감소시킬 수 있다. 촉매를 냉각시키고 질소로 촉매가 불활성이도록 한 후, 질소 중에 5 부피%의 산소를 2시간 동안 촉매 상에 통과시킨다.
특정 양태에서, 본 명세서에 기재된 촉매는 촉매 지지체를 포함한다. 상기 촉매 지지체는 촉매를 안정화시키고 지지한다. 사용되는 촉매 지지체의 유형은 선택된 촉매 및 반응 조건에 따라 다양하다. 본 발명에 적합한 지지체는 탄소, 실리카, 실리카-알루미나, 지르코니아, 티타니아, 세리아, 바나디아, 질화물, 질화붕소, 헤테로폴리산, 하이드록시애퍼타이트, 산화아연, 크로미아, 제올라이트, 탄소 나노튜브, 탄소 플러렌 및 이들의 임의의 조합체를 포함하지만 이에 제한되지 않는다.
본 발명에 사용되는 촉매는 당업자에게 공지된 통상적인 방법을 사용하여 제조할 수 있다. 적합한 방법은 초기 습윤화, 증발 침지, 화학적 증착, 세척-피복, 마그네트론 스퍼터링 기술 등을 포함할 수 있지만 이에 제한되지 않는다.
수소화 반응을 수행하기 위한 조건은 출발 물질 및 원하는 생성물의 유형에 따라 다양하다. 당업자는 본 명세서의 이점과 함께 적당한 반응 조건을 인식할 것이다. 일반적으로, 수소화 반응은 80℃ 내지 250℃ 및 바람직하게는 90℃ 내지 200℃, 및 가장 바람직하게는 100℃ 내지 150℃의 온도에서 수행한다. 일부 실시형태에서, 수소화 반응은 500 KPa 내지 14000 KPa에서 수행한다.
본 발명의 수소용해 반응에 사용되는 수소는 외부 소수, 재활용된 수소, 동일계 생성 수소 및 이의 임의의 조합을 포함할 수 있다. 본 명세서에 사용된 바와 같이, 용어 "외부 수소"는 바이오매스 반응 자체 기원이 아니고 또 다른 공급원으로부터 시스템에 첨가되는 수소를 언급한다.
본 발명의 몇몇 양태에서, 출발 탄수화물을, 목적하는 고급 탄화수소로 보다 용이하게 전환될 수 있는 소분자로 전환시키는 것이 바람직할 수 있다. 상기 전환을 위해 적합한 하나의 방법은 수소용해 반응을 통한 것이다. 다양한 방법이 탄수화물의 수소용해를 수행하기 위해 공지되어 있다. 하나의 적합한 방법은 소분자 또는 폴리올을 포함하는 반응 생성물을 형성하기에 충분한 조건하에서 수소용해 반응기내에서 적합한 가스 및 수소용해 촉매와 혼합된 수소, 또는 수소와 탄수화물을 접촉시키는 단계를 포함한다. 본 명세서에 사용된 바와 같이, 용어 "소분자 또는 폴리올"은 출발 탄수화물보다 소수의 탄소 공급원자 또는 산소 원자를 포함할 수 있는, 소분자량을 갖는 임의의 분자를 포함한다. 하나의 양태에서, 반응 생성물은 폴리올 및 알코올을 포함하는 더 작은 분자를 포함한다. 당업자는 수소용해 반응을 수행하기 위한 적당한 방법을 선택할 수 있다
일부 실시형태에서, 5 및/또는 6개 탄소 당 또는 당 알코올은 수소용해 촉매를 사용하여 프로필렌 글라이콜, 에틸렌 글라이콜 및 글라이세롤로 전환될 수 있다. 수소용해 촉매는 단독으로 또는 Au, Ag, Cr, Zn, Mn, Sn, Bi, B, O, 및 이의 합금 또는 이의 조합체와 같은 촉진제와 함께 Cr, Mo, W, Re, Mn, Cu, Cd, Fe, Co, Ni, Pt, Pd, Rh, Ru, Ir, Os, 및 이의 합금 또는 조합체를 포함할 수 있다. 수소용해 촉매는 또한 전이 금속(예를 들어, 크로뮴, 몰리브덴, 텅스텐, 레늄, 망간, 구리, 카드뮴) 또는 VIII족 금속(예를 들어, 철, 코발트, 니켈, 백금, 팔라듐, 로듐, 루테늄, 이리듐 및 오스뮴)을 함유하는 탄소성 파이로중합체를 포함할 수 있다. 특정 양태에서, 수소용해 촉매는 알칼린 토금속 산화물과 배합되거나 촉매적 활성 지지체에 부착된 임의의 상기 금속을 포함할 수 있다. 특정 양태에서, 수소용해 반응에 기재된 촉매는 수소화 반응을 위해 상기된 바와 같은 촉매 지지체를 포함할 수 있다.
수소용해 반응을 수행하기 위한 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 당업자는 본 명세서의 이득과 함께 반응을 수행하기 위해 사용하는 적당한 조건을 인지할 것이다. 일반적으로, 이들 수소용해 반응은 110℃ 내지 300℃ 및 바람직하게는 170℃ 내지 220℃, 및 가장 바람직하게는 200℃ 내지 225℃의 온도에서 수행한다. 일부 실시형태에서, 수소용해 반응은 염기성 조건, 바람직하게는 pH 8 내지 13, 및 보다 더 바람직하게는 pH 10 내지 12에서 수행한다. 일부 실시형태에서, 수소용해 반응은 60 KPa 내지 16500 KPa, 및 바람직하게는 1700KPa 내지 14000 KPa의 범위, 및 더 바람직하게는 4800 KPa 내지 11000 KPa의 압력에서 수행한다.
본 발명의 수소용해 반응에 사용되는 수소는 외부 수소, 재활용된 수소, 인시츄 생성 수소 및 이의 임의의 조합체를 포함할 수 있다.
몇몇 양태에서, 상기 논의된 반응 생성물은 축합 반응기에서 축합 반응을 통해 고급 탄화수소로 전환할 수 있다. 상기 양태에서, 반응 생성물의 축합은 고급 탄화수소를 형성할 수 있는 촉매의 존재 하에 수행한다. 본 이론에 의해 구속되지 않고, 고급 탄화수소의 생산은 탄소-탄소 또는 탄소-산소 결합의 형성을 포함하는 단계적 부가 반응을 통해 진행하는 것으로 믿어진다. 수득한 반응 생성물은 하기에 더 상세하게 기재되는 상기 잔기를 함유하는 임의의 수의 화합물을 포함한다.
특정 양태에서, 적합한 축합 촉매는 산 촉매, 염기 촉매 또는 산/염기 촉매를 포함한다. 본 명세서에 사용된 바와 같이, 용어 "산/염기 촉매"는 산 및 염기 기능 둘 다를 갖는 촉매를 언급한다. 몇몇 양태에서, 상기 축합 촉매는 제한 없이, 제올라이트, 카바이드, 질화물, 지르코니아, 알루미나, 실리카, 알루미노실리케이트, 포스페이트, 산화티탄, 산화아연, 산화바나듐, 산화란탄, 산화이트륨, 산화스칸듐, 산화마그네슘, 산화세륨, 산화바륨, 산화칼슘, 수산화물, 헤테로폴리산, 무기산, 산 변형된 수지, 염기 변형된 수지 및 이들의 임의의 조합체를 포함할 수 있다. 몇몇 양태에서, 축합 촉매는 또한 변형제를 포함할 수 있다. 적합한 변형제는 La, Y, Sc, P, B, Bi, Li, Na, K, Rb, Cs, Mg, Ca, Sr, Ba, 및 이들의 임의의 조합체를 포함한다. 몇몇 양태에서, 상기 축합 촉매는 또한 금속을 포함할 수 있다. 적합한 금속은 Cu, Ag, Au, Pt, Ni, Fe, Co, Ru, Zn, Cd, Ga, In, Rh, Pd, Ir, Re, Mn, Cr, Mo, W, Sn, Os, 합금 및 이들의 임의의 조합체를 포함한다.
특정 양태에서, 축합 반응에 기재된 촉매는 수소화 반응을 위해 상기된 바와 같은 촉매 지지체를 포함할 수 있다. 특정 양태에서, 축합 촉매는 자가 지지형이다. 본 명세서에 사용된 바와 같이, 상기 용어 "자가 지지형"은 촉매가 지지체로서 작용하기 위해 또 다른 물질을 필요로 하지 않는 것을 의미한다. 특정 양태에서, 상기 축합 촉매는 촉매를 현탁하기에 적합한 별도의 지지체와 함께 사용된다. 하나의 양태에서, 축합 촉매 지지체는 실리카이다.
응축 반응을 수행하는 조건은 출발 물질 및 목적하는 생성물의 유형에 따라 다양하다. 당업자는 본 명세서의 이점과 함께 반응을 수행하는 적당한 조건을 인지할 것이다. 몇몇 양태에서, 응축 반응은 제안된 반응에 대한 열역학이 선호될 수 있는 온도에서 수행한다. 응축 반응을 위한 온도는 특정 출발 폴리올 또는 알코올에 따라 다양하다. 일부 실시형태에서, 응축 반응을 위한 온도는 80℃ 내지 500℃ 및 바람직하게는 125℃ 내지 450℃ 및 가장 바람직하게는 125℃ 내지 250℃의 범위이다. 일부 실시형태에서, 응축 반응은 0 Kpa 내지 9000 KPa 범위, 및 바람직하게는 0 KPa 내지 7000 KPa 범위, 및 더욱더 바람직하게는 0 KPa 내지 5000 KPa 범위의 압력에서 수행한다.
본 발명에 의해 형성되는 고급 알칸은 4 내지 30개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알칸, 4 내지 30개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알켄, 5 내지 30개의 탄소 공급원자를 갖는 사이클로알칸, 5 내지 30개의 탄소 공급원자를 갖는 사이클로알켄, 아릴, 융합된 아릴, 알코올 및 케톤을 포함하지만 이에 제한되지 않는다. 적합한 알칸은 뷰탄, 펜탄, 펜텐, 2-메틸뷰탄, 헥산, 헥센, 2-메틸펜탄, 3-메틸펜탄, 2,2-디메틸뷰탄, 2,3-디메틸뷰탄, 헵탄, 헵텐, 옥탄, 옥텐, 2,2,4-트라이메틸펜탄, 2,3-디메틸헥산, 2,3,4-트라이메틸펜탄, 2,3-디메틸펜탄, 노난, 노넨, 데칸, 데센, 운데칸, 운데센, 도데칸, 도데센, 트라이데칸, 트라이데센, 테트라데칸, 테트라데센, 펜타데칸, 펜타데센, 노닐데칸, 노닐데센, 에이코산, 에이코센, 운데이코산, 운데이코센, 도에이코산, 도에이코센, 트라이에이코산, 트라이에이코센, 테트라에이코산, 테트라에이코센 및 이들의 이성질체를 포함하지만 이에 제한되지 않는다. 이들 생성물 중 일부는 연료용으로 적합할 수 있다.
일부 실시형태에서, 사이클로알칸 및 사이클로알켄은 비치환된다. 다른 양태에서, 사이클로알칸 및 사이클로알켄은 1치환 된다. 여전히 또 다른 양태에서, 사이클로알칸 및 사이클로알켄은 다치환된다. 치환된 사이클로알칸 및 사이클로알켄을 포함하는 양태에서, 치환된 그룹은 제한 없이, 1 내지 12개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알킬, 1 내지 12개의 탄소 공급원자를 갖는 측쇄 또는 직쇄 알킬렌, 페닐 및 이의 조합체를 포함한다. 적합한 사이클로알칸 및 사이클로알켄은 사이클로펜탄, 사이클로펜텐, 사이클로헥산, 사이클로헥센, 메틸-사이클로펜탄, 메틸-사이클로펜텐, 에틸-사이클로펜탄, 에틸-사이클로펜텐, 에틸-사이클로헥산, 에틸-사이클로헥센, 이들의 이성질체 및 임의의 조합체를 포함하지만, 이에 제한되지 않는다.
일부 실시형태에서, 형성된 아릴은 비치환된다. 또 다른 양태에서, 형성된 아릴은 1치환된다. 치환된 아릴을 포함하는 양태에서, 치환된 그룹은 제한없이 1 내지 12개의 탄소 공급원자를 갖는 직쇄 또는 측쇄 알킬, 1 내지 12개의 탄소 공급원자를 갖는 측쇄 또는 직쇄의 알킬렌, 페닐, 및 이들의 임의의 조합체를 포함한다. 본 발명을 위해 적합한 아릴은 벤젠, 톨루엔, 크실렌, 에틸 벤젠, 파라실렌, 메타실렌 및 이들의 조합체를 포함한다.
본 발명에서 생성된 알코올은 4 내지 30개의 탄소 공급원자를 갖는다. 몇몇 양태에서, 알코올은 사이클릭이다. 다른 양태에서, 알코올은 측쇄이다. 또 다른 양태에서, 알코올은 직쇄이다. 본 발명의 적합한 알코올은 뷰탄올, 펜탄올, 헥산올, 헵탄올, 옥탄올, 노난올, 데칸올, 운데칸올, 도데칸올, 트라이데칸올, 테트라데칸올, 펜타데칸올, 헥사데칸올, 헵틸데칸올, 옥틸데칸올, 노닐데칸올, 에이코산올, 우네이코산올, 도에이코산올, 트라이에이코산올, 테트라에이코산올 및 이들의 이성질체를 포함하지만, 이에 제한되지 않는다.
본 발명에서 생성된 케톤은 4 내지 30개의 탄소 원자를 갖는다. 하나의 양태에서, 케톤은 사이클릭이다. 또 다른 양태에서, 상기 케톤은 측쇄이다. 또 다른 양태에서, 케톤은 직쇄이다. 본 발명을 위해 적합한 케톤은 뷰타논, 펜타논, 헥사논, 헵타논, 옥타논, 노나논, 데카논, 운데카논, 도데카논, 트라이데카논, 테트라데카논, 펜타데카논, 헥사데카논, 헵틸데카논, 옥틸데카논, 노닐데카논, 에이코사논, 우네이코사논, 도에이코사논, 트라이에이코사논, 테트라에이코사논, 및 이들의 이성질체를 포함하지만, 이에 제한되지 않는다.
또 다른 상기 화학적 변형은 상호에스터화가다. 천연적으로 생성된 글라이세로지질은 지방산 성분의 균일한 분포를 갖지 않는다. 오일과 관련하여, 상호에스터화는 상이한 글라이세로지질의 2개의 에스터간의 아실 라디칼의 교환을 언급한다. 상호 에스터화 공정은 글라이세로지질의 혼합물의 지방산 성분이 재정렬되어 분포 패턴을 변형시킬 수 있는 메커니즘을 제공한다. 상호 에스터화는 널리 공지된 화학적 공정이고 일반적으로 알칼리 금속 또는 알칼리 금속 알킬레이트(예를 들어, 나트륨 메톡시드)와 같은 촉매의 존재 하에 일정 시간(예를 들어, 30분) 동안 오일의 혼합물을 가열(약 200℃로)하는 단계를 포함한다. 이러한 공정을 사용하여 오일 혼합물의 지방산 성분의 분포 패턴을 무작위화 할 수 있거나 원하는 분포 패턴을 생성하도록 할 수 있다. 지질의 화학적 변형에 대한 상기 방법은, 지질로서 건조 세포 중량%가 적어도 20%인 미생물 바이오매스와 같은 본 명세서에 제공된 물질에 대해 수행할 수 있다.
지방산의 특정 분포 패턴이 요구되는 직접적인 상호 에스터화는 존재할 수 있는 몇몇 TAG의 융점 미만의 온도에서 오일을 유지시킴에 의해 수행할 수 있다. 이것은 이들 TAG를 선택적으로 결정화하고 이는 이들의 결정화에 의해 반응 혼합물로부터 이들을 효과적으로 제거한다. 상기 방법은 예를 들어, 오일 중 대부분의 지방산이 침전할 때까지 계속할 수 있다. 지시된 상호 에스터화 방법은 예를 들어 장쇄 지방산의 단쇄 대응물로 치환을 통해 더 낮은 칼로리 함량을 갖는 생성물을 제조하기 위해 사용될 수 있다. 직접적인 상호 에스터화는 또한 원치않는 트랜스 이성질체를 생성시킬 수 있는 수소화에 의지하는 것 없이 식품 부가물 또는 제품(예를 들어, 마가린)에서 요구되는 목적하는 융점 특성 및 구조적 특징을 제공할 수 있는 지방 혼합물을 갖는 생성물을 제조하기 위해 사용될 수 있다.
본 명세서에 기재된 방법에 의해 생성된 오일의 상호에스터화는 하기에 보고된 바와 같이 방법 및/또는 물질 중 하나 이상과 연계하여 또는 생성물을 생성하기 위해 수행할 수 있다: 미국 특허 제6,080,853호(비분해성 지방 대용물); 제4,288,378호(피넛 버터 안정제); 제5,391,383호(식용 스프레이 오일); 제6,022,577호(식품 생성물에 대한 식용 지방); 제5,434,278호(식품 생성물에 대한 식용 지방);제 5,268,192호(저칼로리 너트 생성물); 제5,258,197호(감소된 칼로리의 식용 조성물); 제4,335,156호(식용 지방 생성물); 제7,288,278호(식품 부가물 또는 의약); 제7,115,760호(분획 방법); 제6,808,737호(구조적 지방); 제5,888,947호(엔진 윤활제); 제5,686,131호(식용 오일 혼합물); 및 제4,603,188호(경화성 우레탄 조성물).
본 발명에 따른 하나의 양태에서, 이어서 상기된 바와 같은 오일의 에스터결합전이는 미국 특허 제6,465,642호에 보고된 바와 같이 에스터결합전이된 생성물을 폴리올과 반응시켜 폴리올 지방산 폴리에스터를 생성시킨다. 상기 에스터화 및 포화 공정은 하기와 같은 단계를 포함할 수 있다: 저급 알킬 에스테를 비누의 존재 하에 폴리올과 반응시키는 단계; 생성물 혼합물로부터 잔여 비누를 제거하는 단계; 생성물 혼합물을 물 세척 및 건조시켜 불순물을 제거하는 단계; 정련을 위해 생성물 혼합물을 표백시키는 단계; 생성물 혼합물중에 폴리올 지방산 폴리에스터로부터 미반응된 저급 알킬 에스터의 적어도 일부를 분리하는 단계; 및 분리된 미반응된 저급 알킬 에스터를 재사용하는 단계.
에스터결합전이는 또한 미국 특허 제6,278,006호에 보고된 바와 같은 단쇄 지방산 에스테를 갖는 미생물 바이오매스상에서 수행할 수 있다. 일반적으로, 에스터결합전이는 단쇄 지방산 에스터를 적합한 촉매의 존재 하에 오일에 부가하고 혼합물을 가열시킴에 의해 수행할 수 있다. 몇몇 양태에서, 상기 오일은 약 5중량% 내지 약 90중량%의 반응 혼합물을 포함한다. 몇몇 양태에서, 단쇄 지방산 에스터는 반응 혼합물의 약 10중량% 내지 약 50중량%일 수 있다. 촉매의 비제한적인 예는 염기 촉매, 나트륨 메톡사이드, 황산 및 산성화된 점토와 같은 무기산, 메탄 설폰산, 벤젠설폰산 및 톨루엔설폰산과 같은 유기산 및 Amberlyst 15와 같은 산성 수지를 포함하는 산 촉매를 포함한다. 나트륨 및 마그네슘과 같은 금속 및 금속 수소화물은 또한 유용한 촉매이다.
또 다른 당해 화학적 변형은 하이드록실화이고 이는 물을 이중 결합으로 부가하여 하이드록실 잔기의 포화 및 혼입을 유도한다. 상기 하이드록실화 공정은 글라이세로지질의 하나 이상의 지방산을 하이드록시 지방산으로 전환하기 위한 메커니즘을 제공한다. 하이드록실화는, 예를 들어 미국 특허 제5,576,027호에 보고된 바와 같은 방법을 통해 수행할 수 있다. 피마자 오일을 포함하는 하이드록실화된 지방산 및 이의 유도체는 식품 첨가제, 계면활성제, 안료 습윤제, 소포제, 방수 첨가제, 가소화제, 화장품 유화제 및/또는 탈취제를 포함하는 다수의 산업 응용 분야 및 전자, 약제, 페인트, 잉크, 접착제 및 윤활제에서 성분으로서 유용하다. 글라이세라이드의 하이드록실화가 수행되는 방법의 한 가지 예는 다음과 같다: 지방이 헵탄과 함께 바람직하게는 약 30 내지 50℃로 가열되고, 30분 이상 동안 그 온도에서 유지하며; 그 다음에 아세트산을 혼합물에 첨가한 후 황산 수용액, 과산화수소 수용액을 점진적 증가량으로 1시간 이상 동안 혼합물에 첨가하고; 수성 과산화수소 후에 온도를 이어서 약 60℃ 이상으로 증가시키고 6시간 이상 동안 교반하며; 교반 후 상기 혼합물이 침강하도록 두고, 반응에 의해 형성된 저급 수성 층을 제거하면서 반응에 의해 형성된 상부 헵탄층을 약 60℃의 온도를 갖는 고온수로 세척할 수 있고; 세척된 헵탄 층을 이어서 수산화칼륨 수용액을 사용하여 pH 약 5 내지 7로 중화시키고 이어서 진공 증류에 의해 제거할 수 있고; 반응 생성물을 이어서 100℃에서 진공 건조시킬 수 있고 건조된 생성물을 진공 조건하에 증기 탈취시키고 규조토를 사용하여 약 50℃ 내지 60℃에서 여과한다.
본원에 기재된 방법에 의해 생성된 미생물 오일의 하이드록실화는 하기에 보고된 바와 같이 상기 방법 및/또는 물질의 하나 이상과 연계하여 또는 생성물을 생성하기 위해 수행할 수 있다: 미국 특허 제6,590,113호(오일계 피복 및 잉크); 제4,049,724호(하이드록실화 반응); 제6,113,971호(올리브유 버터); 제4,992,189호 (윤활제 및 루브 첨가제); 제5,576,027호(하이드록실화된 우유); 및 제6,869,597호 (화장품).
하이드록실화된 글라이세로지질은 에스톨라이드로 전환시킬 수 있다. 에스톨라이드는 글라이세로지질로 이루어지고 여기서, 하이드록실화된 지방산 성분은 또 다른 지방산 분자에 에스터화시켰다. 하이드록실화된 글라이세로리피드의 에스톨라이드의 전환은 글라이세로지질 및 지방산의 혼합물을 가온하고 상기 혼합물을 문헌[Isbell et al., JAOCS 71(2): 169-174 (1994)]에 기재된 바와 같이 무기산과 접촉하는 것으로 수행할 수 있다. 에스톨라이드는, 제한없이 하기에 보고된 것들을 포함하는, 다양한 응용 분야에서 유용하다: 미국 특허 제7,196,124호(탄성 물질 및 바닥덮개); 제5,458,795호(고온 응용을 위한 증점 오일); 제5,451,332호(산업적 응용을 위한 유체); 제5,427,704호(연료 첨가제); 및 제5,380,894호(윤활제, 그리스, 기가소제 및 인쇄 잉크).
다른 이러한 화학적 변형은 올레핀 복분해이다. 올레핀 복분해에서, 촉매는 알켄(올레핀) 내 알킬리덴 탄소를 자르며, 상이한 알킬리덴 탄소와 그것들 각각을 짝지음으로써 새로운 알켄을 형성한다. 올레핀 복분해 반응은 에텐올분해(ethenolysis)에 의해 알켄에서 불포화 지방산 알킬쇄를 절단하는 단계, 자기-복분해에 의한 알켈 연결을 통해 지방산을 가교하는 단계, 유도체화된 알켄에 의한 교차-복분해로 지방산 상에 새로운 작용기를 포함하는 단계와 같은 공정을 위한 메커니즘을 제공한다.
에스터결합전이 및 수소화와 같은 다른 반응과 함께, 올레핀 복분해는 불포화 글라이세로지질을 다양한 최종 생성물로 전환할 수 있다. 이들 생성물은 왁스를 위한 글라이세로지질 올리고머; 윤활제를 위한 단쇄 글라이세로지질; 화학물질 및 폴리머를 위한 호모- 및 헤테로-2작용성 알킬쇄; 생물연료를 위한 단쇄 에스터; 및 제트 연료를 위한 단쇄 탄화수소를 포함한다. 올레핀 복분해는, 예를 들어 미국특허 제7,119,216호, 미국특허 공개번호 제2010/0160506호, 및 미국특허 공개번호 제2010/0145086호에 보고된 촉매 및 방법을 사용하여 트라이아실글라이세롤 및 지방산 유도체 상에서 수행될 수 있다.
바이오-오일의 올레핀 복분해는 일반적으로 다른 알켄의 존재(교차-복분해) 또는 부재(자기-복분해)에서 불포화 지방산 에스터에 대해 비활성인 조건 하에 약 10 내지 250 ppm의 부하에서 Ru 촉매 용액을 첨가하는 단계를 포함한다. 반응은 전형적으로 몇 시간 내지 며칠에 진행시키며, 궁극적으로 알켄 생성물의 분포를 얻는다. 올레핀 복분해가 지방산 유도체 상에서 수행될 수 있는 방법의 한 가지 예는 다음과 같다: 222 ppm의 촉매 부하에서 톨루엔 내 제1 세대 그럽스 촉매(Grubbs Catalyst)(다이클로로[(1-메틸에톡시-α-O)페닐]메틸렌-α-C](트라이사이클로헥실-포스핀) 용액이 탈기되고 건조된 메틸 올레이트를 함유하는 용기에 첨가될 수 있다. 그 다음에 용기는 약 60 psig의 에틸렌 기체와 함께 가압될 수 있고 약 30℃에서 또는 미만에서 3시간 동안 유지되며, 이에 의해 대략 50% 수율의 메틸 9-데세노에이트가 생성될 수 있다.
본 명세서에 기재된 방법으로 생성된 오일의 올레핀 복분해는 한 가지 이상의 방법 및/또는 재료와 함께, 또는 생성물을 생성하기 위해 다음에 보고되는 바와 같이 수행될 수 있다: 국제특허출원 PCT/US07/081427(α-올레핀 지방산) 및 미국특허 출원 제12/281,938호(페트로륨 크림), 12/281,931(페인트볼 건 캡슐), 12/653,742(가소제 및 윤활제), 12/422,096(2작용성 유기 화합물), 및 11/795,052(양초 왁스).
미생물 오일상에서 수행될 수 있는 다른 화학적 반응은 미국 특허 제6,051,539호에 보고된 바와 같이 트라이아실글라이세롤과 사이클로프로판화제와 반응시켜 유동성 및/또는 산화성 안정을 향상시키는 것; 미국 특허 제6,770,104호에 보고된 바와 같이 트라이아실글라이세롤로부터 왁스를 제조하는 것; 및 문헌["The effect of fatty acid composition on the acrylation kinetics of epoxidized triacylglycerols", Journal of the American Oil Chemists' Society, 79:1, 59-63, (2001) 및 Free Radical Biology and Medicine, 37:1, 104-114 (2004)]에 보고된 바와 같이 트라이아실글라이세롤을 에폭시화시키는 것을 포함한다.
상기된 바와 같이 연료 및 화학적 생성물에 대한 오일 함유 마생물 바이오매스의 생성은 탈지된 바이오매스 음식물을 생성시킨다. 탈지된 음식물은 조류 오일을 제조하는데 있어서의 부산물이고 농장 동물, 예를 들어, 반추동물, 가금류, 돼지 및 양식물고기에 대한 동물 사료로서 유용하다. 수득한 밀은 오일 함량이 감소하였지만 여전히 단백질, 탄수화물, 섬유, 재, 잔류 오일 및 동물 사료에 적당한 다른 영양물 함량이 높다. 세포는 주로 오일 분리공정에 의해 용해되기 때문에 탈지된 음식물은 상기 동물에 의해 쉽게 소화될 수 있다. 탈지된 음식물은 임의로 동물 사료에서 곡물과 같은 다른 성분과 배합될 수 있다. 탈지된 음식물은 분말성 점도를 갖기 때문에, 이것은 압출기 또는 확장기 또는 상업적으로 입수가능한 다른 유형의 기계를 사용하여 펠렛으로 압착될 수 있다.
상기에서 상세하게 기재된 본 발명은 하기의 실시예에 예시되지만 이는 청구된 발명을 설명하기 위해 제공되지만, 이에 제한되지 않는다.
VII. 실시예
실시예 1: 프로토테카의 배양 방법
프로토테카 균주는 건조 세포 중량을 기준으로 높은 %의 오일을 달성하기 위해 배양하였다. 동결보존된 세포를 실온에서 해동시키고 500㎕의 세포를 4.5㎖의 배지(4.2g/ℓ K2HPO4, 3.1g/ℓ NaH2PO4, 0.24g/ℓ MgSO4·7H2O, 0.25g/ℓ 시트르산 1수화물, 0.025g/ℓ CaCl2 2H2O, 2g/ℓ 효모 추출물) + 2% 글루코스에 첨가하고 6웰 플레이트에서 진탕(200rpm)과 함께 7일 동안 28℃에서 배양하였다. 건조 세포 중량은 1㎖의 배양물을 사전 칭량한 에펜도르프 튜브에서 5분 동안 14,000 rpm에서 원심분리하여 결정하였다. 배양 상청액을 버리고 수득한 세포 펠렛을 1㎖의 탈이온수로 세척하였다. 배양물을 다시 원심분리하고 상청액을 버리고 세포 펠렛을 동결될 때까지 -80℃에 두었다. 이어서 샘플을 24시간 동안 동결건조시키고 건조 세포 중량을 계산하였다. 배양물 중 총 지질을 결정하기 위해, 3㎖의 배양물을 제거하고 제조업자의 프로토콜에 따라 Ankom 시스템(뉴욕주 메이스던에 소재한 Ankom Inc.)을 사용하여 분석하였다. 샘플은 제조업자의 프로토콜에 따라 Amkom XT10 추출기로 용매 추출에 적용하였다. 총 지질은 산 가수분해된 건조 샘플 및 용매 용매 추출된 건조 샘플 간의 샘플 차이로서 결정하였다. 오일 건조 세포 중량 % 측정은 표 10에 나타낸다.
건조세포 중량으로 오일% | ||
종 | 균주 | 오일% |
프로토테카 스타그노라 | UTEX 327 | 13.14 |
프로토테카 모리포미스 | UTEX 1441 | 18.02 |
프로토테카 모리포미스 | UTEX 1435 | 27.17 |
프로토테카 속 유래의 다양한 균주로부터의 미세조류 샘플을 유전자형으로 분류하였다. 게놈 DNA를 다음과 같이 조류 바이오매스로부터 분리하였다. 세포(대략 200㎎)를 14,000 x g에서 5분 동안 배양물로부터 원심분리하였다. 세포를 이어서 멸균 증류수에 재현탁시키고 14,000 x g에서 5분 동안 원심분리하고 상청액을 버렸다. 직경이 약 2㎜인 단일 유리 비드를 바이오매스에 첨가하고 튜브를 15분 이상 동안 -80℃에 위치시켰다. 샘플을 제거하고 150㎕의 분쇄 완충제(1% 사르코실(Sarkosyl), 0.25 M 수크로스, 50 mM NaCl, 20 mM EDTA, 100 mM Tris-HCl, pH 8.0, RNase A 0.5㎍/㎕)를 첨가하였다. 펠렛을 간단히 교반하여 재현탁시키고 이어서 40㎕의 5M NaCl를 첨가하였다. 샘플을 간단하게 교반하고 이어서 66㎕의 5% CTAB(세틸 트라이메틸암모늄 브로마이드)를 첨가하고 최종적으로 간단하게 교반하였다. 다음에 샘플을 10분 동안 65℃에서 배양하고 이후 이들을 10분 동안 14,000 x g에서 원심분리하였다. 상기 상청액을 새로운 튜브로 옮기고 300㎕의 페놀:클로로포름:아이소아밀알코올 12:12:1로 1회 추출함에 이어서 14,000 x g에서 5분 동안 원심분리하였다. 수득한 수성 상을 0.7 용적의 아이소프로판올(약 190㎕)을 함유하는 새로운 튜브로 옮기고 뒤집어서 혼합하고 30분 동안 실온에서 또는 밤새 4℃에서 인큐베이션하였다. DNA를 10분 동안 14,000 x g에서 원심분리를 통해 회수하였다. 이어서 수득한 펠렛을 70% 에탄올로 2회 세척함에 이어서 100% 에탄올로 최종 세척하였다. 펠렛을 실온에서 20분 내지 30분 동안 공기 건조시킨 후 50㎕의 1OmM TrisCl, 1mM EDTA (pH 8.0)중에 현탁시켰다.
상기된 바와 같이 제조된 5㎕의 총 조류 DNA를 10mM Tris(pH 8.0)중에서 1:50으로 희석시켰다. 최종 용적 20㎕의 PCR 반응물을 다음과 같이 셋-업하였다. 10㎕의 2 x iProof HF 마스터 믹스(BIO-RAD)를 0.4㎕의 프라이머 SZ02613(10mM 스톡 농도에서 5'-TGTTGAAGAATGAGCCGGCGAC-3'(서열번호9))에 첨가하였다. 상기 프라이머 서열은 GenBank 등록번호 L43357에서 567번 내지 588번이고 고등 식물 및 조류 플라스티드 게놈에서 고도로 보존되어 있다. 이어서 0.4㎕의 프라이머 SZ02615(10mM 스톡 농도에서 (5'-CAGTGAGCTATTACGCACTC-3'(서열번호10))를 첨가하였다. 상기 프라이머 서열은 GenBank 등록번호 L43357에서 1112번 내지 1093번 위치에 상보적이고 고등 식물 및 조류 플라스티드 게놈에서 고도로 보존되어 있다. 다음에, 5㎕의 희석된 총 DNA 및 3.2㎕의 dH2O를 첨가하였다. PCR 반응을 다음과 같이 수행하였다: 35주기 동안 98℃, 45"; 98℃, 8"; 53℃, 12"; 72℃, 20" 에 이어서 1분 동안 72℃에서 수행하고 25℃에 유지시킨다. PCR 생성물의 정제를 위해, 20㎕의 10 mM Tris(pH 8.0)를 각각의 반응물에 첨가하고 이어서 40㎕의 페놀:클로로포름:아이소아밀 알코올 12:12:1로 추출하고, 교반하고 5분 동안 14,000 x g에서 원심분리한다. PCR 반응을 S-400 칼럼(GE Healthcare)에 적용하고 3,000 x g에서 2분 동안 원심분리하였다. 정제된 PCR 생성물을 이어서 PCR8/GW/TOPO으로 TOPO 클로닝하고 포지티브 클론을 LB/Spec 플레이트를 위해 선택하였다. 정제된 플라스미드 DNA를 M13 전방 및 역방향 프라이머를 사용하여 양 방향으로 서열 분석하였다. 전체적으로, 12개의 프로토테카 균주는 서열분석된 이들의 23S rRNA DNA를 갖도록 선택하고 상기 서열을 서열 목록중에 열거한다. 균주 및 서열 번호에 대한 요약은 하기에 포함된다. 상기 서열은 UTEX 1435(서열번호 15) 서열로부터 총 분기점에 대해 분석하였다. 2개의 쌍(UTEX 329/UTEX 1533 및 UTEX 329/UTEX 1440)이 가장 분기된 것으로서 나타났다. 양 경우에, 쌍 형성 정렬은 75.0% 쌍 형성 서열 동일성을 나타내었다. UTEX 1435에 대한 서열 동일성%는 또한 하기에 포함된다.
상기된 균주의 서브셋트 기원의 지질 샘플은 HPLC를 사용하여 지질 프로파일에 대해 분석하였다. 결과는 하기 표 11에 나타낸다.
프로토테카 종에서 지질 쇄의 다양성 | |||||||||
균주 | C14:0 | C16:0 | C16:1 | C18:0 | C18:1 | C18:2 | C18:3 | C20:0 | C20:1 |
UTEX 327 | 0 | 12.01 | 0 | 0 | 50.33 | 17.14 | 0 | 0 | 0 |
UTEX 1441 | 1.41 | 29.44 | 0.70 | 3.05 | 57.72 | 12.37 | 0.97 | 0.33 | 0 |
UTEX 1435 | 1.09 | 25.77 | 0 | 2.75 | 54.01 | 11.90 | 2.44 | 0 | 0 |
프로토테카 모리포미스 UTEX 1435로부터 추출된 오일(용매 추출을 통해 또는 익스펠러 프레스를 사용하여)을 카르테노이드, 엽록소, 토코페롤, 기타 스테롤 및 토코트라이엔올에 대해 분석하였다. 결과를 이하의 표 12에 요약한다.
프로토테카 모리포미스(UTEX 1435)로부터 추출된 오일 내 카로테노이드, 엽록소, 토코페롤/스테롤 및 토코트라이엔올 | ||
압축 오일 (mcg/㎖) |
용매 추출 오일(mcg/㎖) | |
시스-루테인 | 0.041 | 0.042 |
트랜스-루테인 | 0.140 | 0.112 |
트랜스-제아잔틴 | 0.045 | 0.039 |
시스-제아잔틴 | 0.007 | 0.013 |
t-알파-크립토잔틴 | 0.007 | 0.010 |
t-베타-크립토잔틴 | 0.009 | 0.010 |
t-알파-카로텐 | 0.003 | 0.001 |
c-알파-카로텐 | 검출되지 않음 | 검출되지 않음 |
t-베타-카로텐 | 0.010 | 0.009 |
9-시스-베타-카로텐 | 0.004 | 0.002 |
라이코펜 | 검출되지 않음 | 검출되지 않음 |
전체 카로테노이드 | 0.267 | 0.238 |
엽록소 | <0.01 ㎎/㎏ | <0.01 ㎎/㎏ |
토코페롤 및 스테롤 | ||
압축 오일 (㎎/100g) | 용매 추출 오일 (㎎/100g) | |
감마 토코페롤 | 0.49 | 0.49 |
캄페스테롤 | 6.09 | 6.05 |
스티그마스테롤 | 47.6 | 47.8 |
베타-시토스테롤 | 11.6 | 11.5 |
기타 스테롤 | 445 | 446 |
토코트라이엔올 | ||
압축 오일 (㎎/g) | 용매 추출 오일 (㎎/g) | |
알파 토코트라이엔올 | 0.26 | 0.26 |
베타 토코트라이엔올 | <0.01 | <0.01 |
감마 토코트라이엔올 | 0.10 | 0.10 |
델타 토코트라이엔올 | <0.01 | <0.01 |
전체 토코트라이엔올 | 0.36 | 0.36 |
4개의 별개의 로트로부터 프로토테카 모르포미스로부터 추출한 오일을 정제하고 표쥰 식물 오일 처리 방법을 사용하여 표백하였다. 간략하게, 프로토테카 모르포미스로부터 추출한 미정제 오일을 수평 디캔터 내에서 정제하며, 고체를 오일로부터 분리하였다. 그 다음에 정제한 오일을 시트르산 및 물과 함께 탱크에 옮겼고, 대략 24시간 동안 방치하였다. 24시간 후, 탱크 내 혼합물은 2개의 별개의 층을 형성하였다. 바닥층은 물 및 검을 포함하였고, 그 다음에 디캔테이션으로 제거한 후, 탈검화된 오일을 표백 탱크에 옮겼다. 그 다음에 다른 용량의 시트르산과 함께 가열하였다. 그 다음에 표백토를 표백 탱크에 첨가하였고, 혼합물을 진공 하에 추가로 가열하여 존재하는 어떤 물을 증발시켰다. 그 다음에 표백토를 제거하기 위하여 혼합물을 잎 여과기를 통해 펌핑하였다. 이어서 여과한 오일을 최종 5㎛ 폴리슁 필터를 통과시킨 다음, 사용까지 저장을 위해 수집하였다. 그 다음에 정제하고 표백한(refined and bleached, RB) 오일을 카로테노이드, 엽록소, 스테롤, 토코트라이엔올 및 토코페롤에 대해 분석하였다. 이들 분석의 결과를 이하의 표 13에 요약한다. "Nd"는 검출되지 않음을 의미하며 검출의 민감도는 이하에 열거한다:
검출의 민감도
카로테노이드(mcg/g) nd = <0.003 mcg/g
엽록소(mcg/g) nd = <0.03 mcg/g
스테롤(%) nd = 0.25%
토코페롤(mcg/g); nd = 3 mcg/g
정제 및 표백한 프로토테카 모리포미스 오일로부터 유래된 카로테노이드 , 엽록소, 스테롤, 토코트라이엔 및 토코페롤 분석 | ||||
로트 A | 로트 B | 로트 C | 로트 D | |
카로테노이드 ( mcg /g) | ||||
루테인 | 0.025 | 0.003 | nd | 0.039 |
제아잔틴 | nd | nd | nd | nd |
시스-루테인/제아잔틴 | nd | nd | nd | nd |
트랜스-알파-크립토잔틴 | nd | nd | nd | nd |
트랜스-베타-크립토잔틴 | nd | nd | nd | nd |
트랜스-알파-카로텐 | nd | nd | nd | nd |
시스-알파-카로텐 | nd | nd | nd | nd |
트랜스-베타-카로텐 | nd | nd | nd | nd |
시스-베타-카로텐 | nd | nd | nd | nd |
라이코펜 | nd | nd | nd | nd |
미확인 | 0.219 | 0.066 | 0.050 | 0.026 |
전체 카로테노이드 | 0.244 | 0.069 | 0.050 | 0.065 |
엽록소 ( mcg /g) | ||||
엽록소 A | 0.268 | 0.136 | 0.045 | 0.166 |
엽록소 B | nd | nd | nd | nd |
전체 엽록소 | 0.268 | 0.136 | 0.045 | 0.166 |
스테롤 ( % ) | ||||
브라시카스테롤 | nd | nd | nd | nd |
캄페스테롤 | nd | nd | nd | nd |
스티그마스테롤 | nd | nd | nd | nd |
베타-시토스테롤 | nd | nd | nd | nd |
전체 스테롤 | nd | nd | nd | nd |
토코페롤 ( mcg /g) | ||||
알파-토코페롤 | 23.9 | 22.8 | 12.5 | 8.2 |
베타-토코페롤 | 3.72 | nd | nd | nd |
감마-토코페롤 | 164 | 85.3 | 43.1 | 38.3 |
델타-토코페롤 | 70.1 | 31.1 | 18.1 | 14.3 |
전체 토코페롤 | 262 | 139.2 | 73.7 | 60.8 |
토코트라이엔올 ( mcg /g) | ||||
알파-토코트라이엔올 | 190 | 225 | 253 | 239 |
베타-토코트라이엔올 | nd | nd | nd | nd |
감마-토코트라이엔올 | 47.3 | 60.4 | 54.8 | 60.9 |
델타-토코트라이엔올 | 12.3 | 16.1 | 17.5 | 15.2 |
전체 토코트라이엔올 | 250 | 302 | 325 | 315 |
프로토테카 포리포미스의 동일한 4가지 로트를 또한 미량원소에 대해 분석하였고, 결과를 이하의 표 14에 요약한다.
정제 및 표백한 프로토테카 모리포미스 오일의 원소 분석 | ||||
로트 A | 로트 B | 로트 C | 로트 D | |
원소 분석(ppm) | ||||
칼슘 | 0.08 | 0.07 | < 0.04 | 0.07 |
인 | < 0.2 | 0.38 | < 0.2 | 0.33 |
나트륨 | < 0.5 | 0.55 | < 0.5 | < 0.5 |
칼륨 | 1.02 | 1.68 | < 0.5 | 0.94 |
마그네슘 | < 0.04 | < 0.04 | < 0.04 | 0.07 |
망간 | < 0.05 | < 0.05 | < 0.05 | < 0.05 |
철 | < 0.02 | < 0.02 | < 0.02 | < 0.02 |
아연 | < 0.02 | < 0.02 | < 0.02 | < 0.02 |
구리 | < 0.05 | < 0.05 | < 0.05 | < 0.05 |
황 | 2.55 | 4.45 | 2.36 | 4.55 |
납 | < 0.2 | < 0.2 | < 0.2 | < 0.2 |
규소 | 0.37 | 0.41 | 0.26 | 0.26 |
니켈 | < 0.2 | < 0.2 | < 0.2 | < 0.2 |
유기 염화물 | < 1.0 | < 1.0 | < 1.0 | 2.2 |
무기 염화물 | < 1.0 | < 1.0 | < 1.0 | < 1.0 |
질소 | 4.4 | 7.8 | 4.2 | 6.9 |
리튬 | < 0.02 | < 0.02 | < 0.02 | < 0.02 |
붕소 | 0.07 | 0.36 | 0.09 | 0.38 |
알루미늄 | -- | < 0.2 | < 0.2 | < 0.2 |
바나듐 | < 0.05 | < 0.05 | <0.05 | < 0.05 |
로비본드 색도( °L ) | ||||
적색 | 5.0 | 4.3 | 3.2 | 5.0 |
황색 | 70.0 | 70.0 | 50.0 | 70.0 |
HPLC에 의한 모노 및 다이글라이세라이드 ( % ) | ||||
다이글라이세라이드 | 1.68 | 2.23 | 1.25 | 1.61 |
모노글라이세라이드 | 0.03 | 0.04 | 0.02 | 0.03 |
유리 지방산(Free fatty acid, FFA) | 1.02 | 1.72 | 0.86 | 0.83 |
비누 | 0 | 0 | 0 | |
산화 및 폴리머화된 트라이글라이세라이드 | ||||
산화된 트라이글라이세라이드(%) | 3.41 | 2.41 | 4.11 | 1.00 |
폴리머화된 트라이글라이세라이드(%) | 1.19 | 0.45 | 0.66 | 0.31 |
과산화물값(meg/kg) | 0.75 | 0.80 | 0.60 | 1.20 |
p-아니시딘값(무차원) |
5.03 | 9.03 | 5.44 | 20.1 |
물 및 기타 불순물( % ) | ||||
카를 피셔 수분 | 0.8 | 0.12 | 0.07 | 0.18 |
전체 극성 화합물 | 5.02 | 6.28 | 4.54 | 5.23 |
불검화물 | 0.92 | 1.07 | 0.72 | 1.04 |
불용성 불순물 | <0.01 | <0.01 | 0.01 | < 0.01 |
전체 오일( % ) | ||||
중성오일 | 98.8 | 98.2 | 99.0 | 98.9 |
실시예
2:
프로토테카의
바이오리스틱
형질전환을 위한 일반적 방법
Seashell Gold Microcarriers 550 나노미터를 제조업자의 프로토콜에 따라 제조하였다. 플라스미드(20㎍)를 50㎕의 결합 완충제와 60㎕(30 mg)의 S550d 골드 캐리어와 혼합하고 얼음 상에서 1분 동안 인큐베이션하였다. 침전 완충제(100㎕)를 첨가하고 상기 혼합물을 또 다른 1분 동안 얼음에서 인큐베이션하였다. 교반한 후, DNA-코팅된 입자를 10초 동안 에펜도르프 5415C 소형 원심분리기 내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500㎕의 차가운 100% 에탄올로 1회 세척하고, 소형 원심분리기에서 간단히 회전시켜 펠렛화하고 50㎕의 빙냉 에탄올과 함께 재현탁하였다. 간략한 (1 내지 2초) 초음파 처리 후, 10㎕의 DNA-코팅된 입자를 즉시 캐리어 막에 이동시켰다.
프로토테카 균주를 이의 세포 밀도가 2 x 106 세포/㎖가 될 때까지 회전 진탕기 상에서 2% 글루코스와 함께 프로테오스 배지(2g/ℓ 효모 추출물, 2.94mM NaNO3, 0.17mM CaCl2ㆍ2H2O, 0.3mmMgSO4ㆍ7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 중에서 성장시켰다. 상기 세포를 채취하고 멸균 증류수로 1회 세척하고 50㎕의 배지에 재현탁시켰다. 1 x 107 세포를 비선택적 프로테오스 배지 플레이트의 삼등분의 가운데 지점에 도말하였다. 상기 세포를 PDS-1000/He 유전자 주입 입자 전달 시스템(Biolistic Particle Delivery system)(Bio-Rad)으로 충격을 가했다. 파열 디스크(1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 조립체 6㎝ 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회수 시 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100㎕의 배지와 혼합하고 적당한 선택 항생제를 함유하는 플레이트상에 도말하였다. 배양 7 내지 10일 후에 25℃에서, 플레이트 상에 형질전환 세포를 나타내는 콜로니가 확인되었다. 콜로니를 집어내고 두 번째 선택용 선택(항생제 또는 탄소 공급원 중 하나) 한천 플레이트상에 스팟팅하였다.
실시예
3: 클로렐라의 형질전환
벡터 구성
CMV 프로모터, 하이드로마이신 내성 cDNA, 및 CMV 3'UTR(서열번호 152, pCAMBIA1380 벡터의 하위 서열, 호주 캔버라 캄비아)을 함유하는 BamHI-SacII 단편을 pBluescript의 BamHI 및 SacII 부위에 클로닝하였고, 본 명세서에서 pHyg로 언급한다.
클로렐라의
바이오리스틱
형질전환
Seashell Technology제의 S550d 골드 캐리어를 제조업자의 프로토콜에 따라서 제조하였다. 선형화된 pHyg 플라스미드(20㎍)를 50㎕의 결합 완충제와 60㎕(30 mg)의 S550d 골드 캐리어와 혼합하고 얼음 상에서 1분 동안 인큐베이션하였다. 침전 완충제(100㎕)를 첨가하고 상기 혼합물을 또 다른 1분 동안 얼음에서 인큐베이션하였다. 교반한 후, DNA-코팅된 입자를 10초 동안 에펜도르프 5415C 소형 원심분리기 내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500㎕의 차가운 100% 에탄올로 1회 세척하고, 소형 원심분리기에서 간단히 회전시켜 펠렛화하고 50㎕의 빙냉 에탄올과 함께 재현탁하였다. 간략한 (1 내지 2초) 초음파 처리 후, 10㎕의 DNA-코팅된 입자를 즉시 캐리어 막에 이동시켰다.
클로렐라 프로토테카 배양물(Univeristy of Texas Culture Collection 250)을 이의 세포 밀도가 2 x 106 세포/㎖가 될 때까지, 75㎛ol 광자 m-2 sec-1의 연속적 빛 하에 선회 진탕기 상에서 프로테오스 배지(2g/ℓ 효모 추출물, 2.94mM NaNO3, 0.17mM CaC12ㆍ2H2O, 0.3mmMgSO4ㆍ7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 중에서 성장시켰다. 상기 세포를 채취하고 멸균 증류수로 1회 세척하고 50㎕의 배지에 재현탁시켰다. 1 x 107 세포를 비선택적 프로테오스 배지 플레이트의 삼등분의 가운데 지점에 도말하였다. 상기 세포를 PDS-1000/He 유전자 주입 입자 전달 시스템(Biolistic Particle Delivery system)(Bio-Rad)으로 충격을 가했다. 파열 디스크(1100 및 1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 조립체 9 및 12㎝ 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회수 시 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100㎕의 배지와 혼합하고 하이그로마이신 함유 플레이트 상에 도말하였다(200㎍/㎖). 25℃에서 배양 7 내지 10일 후에, 1100 및 1350 psi 파열 디스크로부터 및 9 및 12㎝ 거리로부터 플레이트상에 형질전환 세포를 나타내는 콜로니가 확인되었다. 콜로니를 집어내고 두 번째 선택용 선택 한천 플레이트 상에 스팟팅하였다.
전기천공에 의한 클로렐라의 형질전환
클로렐라 프로토테코이데스 배양물을 세포 밀도가 2 x 106 세포/㎖가 될 때까지 75㎛ol 광자 m-2 sec-1의 연속적 빛 하에 선회 진탕기 상에서 프로테오스 배지 중에서 성장시켰다. 상기 세포를 채취하고 멸균 증류수로 1회 세척하고 50mM 수크로스를 함유하는 트리스-인산염 완충제(20mM Tris-HCl, pH 7.0; 1 mM 인산칼륨) 중에서 4 x 108세포/㎖ 밀도로 재현탁하였다. 약 250㎕ 세포 현탁액(1x108 세포)를 4㎜ 갭의 일회용 전기천공 큐벳에 넣었다. 세포 현탁액에, 5㎍의 선형화된 pHyg 플라스미드 DNA 및 200㎍의 운반 DNA(절단한 연어 정자 DNA)를 첨가하였다. 그 다음에 전기천공 큐벳을 16℃ 수욕 내에서 10분 동안 인큐베이션하였다. 그 다음에 Gene Pulser II(캘리포니아주 허큘리스에 소재한 Bio-Rad Labs) 전기천공 장치를 사용하여 전기적 펄스(1100 V/cm)를 25 μF(전기천공에 사용되는 분류기는 없다)의 정전 용량에서 큐벳에 적용하였다. 그 다음에 큐벳을 실온에서 5분 동안 인큐베이션한 후, 세포 현탁액을 50㎖의 프로테아제 배지에 옮겼으며, 2일 동안 선회 진탕기 상에서 진탕하였다. 회수 후, 세포를 저속에서 원심분리로 채취하였고, 프로테오스 배지 내에서 재현탁하였으며, 200㎍/㎖ 하이그로마이신으로 보충한 플레이트 상에서 저밀도로 플레이팅하였다. 플레이트를 75㎛ol 광자 m-2 sec-1에서 연속적 빛 하에 인큐베이션하였다. 형질전환체는 1 내지 2주 내 콜로니로 나타났다. 콜로니를 집어내고 두 번째 선택용 선택 한천 플레이트상에 스팟팅하였다.
지노타이핑
2차 선택에서 살아남은 콜로니의 서브세트를 작은 부피로 배양하였고 채취하였다. 대략 5 내지 10㎕ 부피를 50㎕의 10mM NaEDTA 중에서 재현탁한 다음, 100℃에서 10분 동안 인큐베이션하였다. 그 다음에 튜브를 간단히 교반하였고 10초 동안 음파처리한 다음, 12,000 x g에서 1분 동안 원심분리하였다. 주형으로서 2㎕의 상청액을 50㎕ PCR 반응 중에서 사용하였다. 지노타이핑을 위해 사용한 프라이머는 서열번호 153 및 서열번호 154이었다. PCR 조건은 다음과 같다: 95℃ 5 분 x 1 주기; 95℃ 30 초 - 58℃ 30 초 - 72℃ 1 분 30초 x 35 주기; 72℃ 10 분 x 1 주기. 예상한 992 bp 단편을 바이오리스틱 방법으로부터 및 단일 전기천공 콜로니로부터 10개 중 6개 콜로니에서 발견하였다. 더 작은 크기의 비특이적 밴드가 모든 레인에 존재하였다. 증폭된 992bp 단편의 동일성을 확인하기 위하여, 2개의 바이오리스틱 밴드 및 전기천공 밴드를 겔로부터 절단하였고, 개별적으로 시퀀싱하였다. 모든 3개의 밴드 서열은 예상한 992 bp 단편에 대응한다(DNA 래더: Bionexus(등록상표) All Purpose Hi-Lo(등록상표) DNA 래더 카탈로그 # BN2050).
실시예
4: 미세조류에서 사용을 위한 조류-유래 프로모터 및 유전자
A. 클로렐라 프로토테코이데스 유래의 5'UTR 및 프로모터 서열
cDNA 라이브러리를 표준 기술을 사용하여 혼합영양(mixotrophically)으로 성장한 클로렐라 프로토테코이데스(UTEX 250)로부터 생성하였다. cDNA 서열을 기준으로, 씨진의 DNA 워킹 키트(Seegene's DNA Walking kit)(매릴랜드주 락빌에 소재)를 사용하여 암호화 영역의 상류를 "워크(walk)"하기 위해 특정 공지된 하우스키핑(housekeeping) 유전자에서 설계하였다. 분리된 서열은 액틴(서열번호 155) 및 연장 인자-1a(EF1a)(서열번호 156) 프로모터/UTR를 포함하고 이 둘 다는 인트론(하한부에 나타낸 바와 같이) 및 엑손(이탤릭체의 대문자) 및 예측된 개시 부위(볼드체) 및 2개의 베타-튜불린 프로모터/UTR 요소, 아이소폼 A(서열번호 157) 및 아이소폼 B(서열번호 158)를 함유한다.
B.
클로렐라
프로토테코이데스
유래의 지질 생합성 효소 및
플라스티드
표적화
서열
상기된 cDNA 라이브러리로부터, 클로렐라 프로토테코이데스(UTEX 250)에서 지질 대사에서 작용성인 단백질을 암호화하는 3개의 cDNA를 상기된 바와 동일한 방법을 사용하여 클로닝하였다. 아실 ACP 불포화효소(서열번호 159 및 160) 및 2개의 게라닐 게라닐 디포스페이트 신타제(서열번호 161 내지 164)에 대한 뉴클레오타이드 및 아미노산 서열은 하기 서열목록에 포함된다. 추가로, 플라스티드에 표적화하는 추정 신호 서열을 갖는 3개의 cDNA를 또한 클로닝하였다. 글라이세르알데하이드-3-포스페이트 탈수소효소(서열번호 165 및 166)에 대한 뉴클레오타이드 및 아미노산 서열, 산소 방출 복합 단백질 OEE33(서열번호 167 및 168) 및 CIp 프로테아제(서열번호 169 및 170)은 하기 서열목록에 포함된다. 추정 플라스티드 표적화 서열은 뉴클레오타이드 및 아미노산 서열 둘 다에 밑줄쳐 있다. 상기 플라스티드 표적화 서열은 지질 변형 효소와 같은 전이유전자 생성물을 미생물의 플라스티드에 표적화하는데 사용될 수 있다.
실시예
5: 외인성
수크로스
인버타제를
발현하기 위한 클로렐라
프로토테코이데스의
유전자조작
균주 및 배지: 클로렐라 프로토테코이데스(UTEX 250)를 텍사스 유니버시티의 조류 배양물 수집 기관(미국 텍사스주 오스틴에 소재한 Culture Collection of Alga at the University of Texas)으로부터 얻었다. 변형 프로테오스 배지 상에서 보존 배양을 유지하였다. 변형 프로테오스 배지는 0.25 g NaNO3, 0.09 g K2HPO4, 0.175 g KH2PO4 0.025 g, 0.025 g CaCl2·2H2O, 0.075 g MgSO4·7H2O, 및 리터 당 2 g의 효모 추출물(g/ℓ)로 이루어진다.
플라스미드 구성: 클로렐라 프로토테코이데스 내 인버타제의 분비 형태를 표현하기 위하여, 사카로마이세스 세레비시애 SUC2 유전자를 3개의 상이한 프로모터 대조군 하에 두었다: 카울리플라워 모자이크 바이러스 35S 프로모터(CMV), 클로렐라 바이러스 프로모터(NC-1A), 및 클로렐라 HUP1 프로모터. 클로렐라 프로토테코이데스에 대해 최적화된 코돈 사용빈도를 수용하기 위해 효모 SUC2 유전자를 합성하였고, 인버타제의 세포외 분비를 지시하는데 필요한 단일 서열을 포함한다. pBluescript KS+, 및 EcoRI/AscI, AscI/XhoI, 및 XhoI/BamHI 부위에 구성된 각 구성체는 특정 프라이머를 사용하는 PCR 증폭에 의해 각 프로모터, 인버타제 유전자, 및 CMV 3'UTR에 각각 도입되었다. 정제된 PCR 생성물을 순차적으로 클로닝하였다.
클로렐라 프로테코이데스의 형질전환: 클로렐라 프로테코이데스 배양물을 세포 밀도가 6 x 106 세포/㎖가 될 때까지 75㎛ol 광자 m-2 sec-1의 연속적 빛 하에 선회 진탕기 상에서 프로테오스 배지 중에서 성장시켰다.
바이오리스틱 형질전환을 위하여, Seashell Technology제의 S550d 골드 캐리어를 제조업자의 프로토콜에 따라서 제조하였다. 간략하게, BsaI로 선형화된 구성체(20㎍)를 50㎕의 결합 완충제와 60㎕(3 ㎎)의 S550d 골드 캐리어와 혼합하고 얼음 상에서 1분 동안 인큐베이션하였다. 침전 완충제(100㎕)를 첨가하고 상기 혼합물을 또 다른 1분 동안 얼음에서 인큐베이션하였다. 약하게 교반한 후, DNA-코팅된 입자를 10초 동안 에펜도르프 원심분리기 내에서 10,000rpm으로 회전시켜 펠렛화하였다. 상기 골드 펠렛을 500㎕의 차가운 100% 에탄올로 1회 세척하고, 소형 원심분리기에서 간단히 회전시켜 펠렛화하고 50㎕의 빙냉 에탄올과 함께 재현탁하였다. 간략한 (1 내지 2초) 초음파 처리 후, 10㎕의 DNA-코팅된 입자를 즉시 캐리어 막에 이동시켰다. 세포를 채취하였고, 멸균증류수로 1회 세척하였으며, 50㎕의 배지(1 x 107 세포) 중에서 재현탁하였으며, 비선택적 프로테오스 플레이트의 삼등분의 가운데 지점에 도말하였다. 상기 세포를 PDS-1000/He 유전자 주입 입자 전달 시스템(Bio-Rad)으로 충격을 가했다. 파열 디스크(1100 및 1350 psi)를 사용하고 플레이트를 스크린/마크로캐리어 조립체 9 및 12㎝ 아래에 위치시킨다. 상기 세포가 12 내지 24시간 동안 25℃에서 회복하도록 방치하였다. 회수 시, 상기 세포를 고무 스패튤라를 사용하여 플레이트로부터 긁어내어 100㎕의 배지와 혼합하고 적당한 1% 수크로스가 있는 변형 프로테오스 플레이트 상에 도말하였다. 암실 내 25℃에서 배양 7 내지 10일 후에, 형질전환 세포를 나타내는 콜로니가 플레이트 상에 보였다.
전기천공에 의한 형질전환을 위하여, 세포를 채취하였고, 멸균 증류수로 1회 세척하고 50mM 수크로스를 함유하는 트리스-인산염 완충제(20mM Tris-HCl, pH 7.0; 1 mM 인산칼륨) 중에서 4 x 108세포/㎖ 밀도로 재현탁하였다. 약 250㎕ 세포 현탁액(1x108 세포)을 4㎜ 갭의 일회용 전기천공 큐벳에 넣었다. 세포 현탁액에, 5㎍의 선형화된 플라스미드 DNA 및 200㎍의 운반 DNA(절단한 연어 정자 DNA)를 첨가하였다. 그 다음에 전기천공 큐벳을 16℃ 수욕 내에서 10분 동안 인큐베이션하였다. 그 다음에 Gene Pulser II(캘리포니아주 허큘리스에 소재한 Bio-Rad Labs) 전기천공 장치를 사용하여 전기적 펄스(1100 V/cm)를 25 μF(전기천공에 사용되는 분류기는 없다)의 정전 용량에서 큐벳에 적용하였다. 그 다음에 큐벳을 실온에서 5분 동안 인큐베이션한 후, 세포 현탁액을 50㎖의 프로테아제 배지에 옮겼으며, 2일 동안 선회 진탕기 상에서 진탕하였다. 회수 후, 세포를 저속에서(4000 rpm) 원심분리로 채취하였고, 프로테오스 배지 내에서 재현탁하였으며, 1% 수크로스와 함께 변형 프로테오스 플레이트 상에서 저밀도로 플레이팅하였다. 암실 내 25℃에서 인큐베이션의 7 내지 10일 후, 형질전환 세포를 나타내는 콜로니가 플레이트 상에 보였다.
스크리닝 형질전환체 및 지노타이핑: 콜로니를 1% 수크로스가 있는 암실 성장-변형 프로테오스 플레이트로부터 선택하였고, 대략 동일한 양의 세포를 1% 수크로스와 함께 1㎖의 변형 프로테오스 액체 배지를 함유하는 24 웰-플레이트에 옮겼다. 배양물을 암실에서 유지하였고, Labnet(영국 버크셔 소재)제의 오비탈 진탕기로 430 rpm에서 5일 동안 교반하였다.
클로렐라 형질전환체에 도입된 인버타제 유전자의 존재를 증명하기 위하여, 각 형질전환체의 DNA를 분리하였고, 한 세트의 유전자 특이적 프라이머(CMV 구성체: 전방 프라이머 (CAACCACGTCTTCAAAGCAA)(서열번호 153)/역방향 프라이머(TCCGGTGTGTTGTAAGTCCA)(서열번호 171), CV 구성체: 전방 프라이머(TTGTCGGAATGTCATATCAA)(서열번호 172)/역방향 프라이머(TCCGGTGTGTTGTAAGTCCA)(서열번호 171), 및 HUP1 구성체: 전방 프라이머(AACGCCTTTGTACAACTGCA)(서열번호 173)/역방향 프라이머(TCCGGTGTGTTGTAAGTCCA)(서열번호 171))로 증폭하였다. 빠른 DNA 분리를 위해, 세포 부피(크기로 대략 5-10㎕)를 50㎕의 10 mM Na-EDTA 중에서 재현탁하였다. 세포 현탁액을 100℃에서 10분 동안 인큐베이션하였고 10초 동안 음파처리하였다. 12000g에서 1분 동안 원심분리 후, 3㎕의 상청액을 PCR 반응을 위해 사용하였다. PCR 증폭을 DNA 열 사이클러(Perkin-Elmer GeneAmp 9600) 내에서 수행하였다. 반응 혼합물(50㎕)은 제조업자의 설명서에 따라서 3㎕ 추출 DNA, 상기 설명한 각 프라이머 각각의 100 pmol, 200 uM dNTP, 0.5 유닛의 태그 DNA 폴리머라제(NEB), 및 태그 DNA 폴리머라제 완충제를 함유하였다. 제1 주기를 위해 95℃에서 5분 동안 DNA 변성을 수행한 다음, 30초 동안 수행하였다. 프라이머 어닐링 및 확장 반응을 58℃에서 30초 동안 및 72℃에서 1분 동안 각각 수행하였다. 그 다음에 PCR 생성물을 브롬화 에티듐으로 염색한 1% 아가로스 겔 상에서 시각화하였다.
액체 배양물 내 성장: 암실에서 5일 성장 후, 유전자형-포지티브 형질전환체는 암실에서 최소 액체 프로테오스 배지 + 1% 수크로스 상에서 성장을 나타낸 반면, 야생형 세포는 암실 내 동일 배지 중에서 성장을 나타내지 않았다.
실시예
6:
사카로마이세스
세레비시애로부터
유래된
분비된
인버타제에
의한 조류 균주의 형질전환
분비된 인버타제: 각각 EcoR I/Asc I 및 Xho/Sac I 카세트로서 카울리플라워 모자이크 바이러스 35s 프로모터 및 3' UTR을 소유하는 pUC19 유도체 내로 후속하여 서브클로닝된 1599 bp Asc I-Xho 단편으로서 분비된 수크로스 인버타제를 암호화하는 유전자(사카로마이세스 세레비시애로부터 유래된 Gen Bank 등록번호 NP_012104)를 데노보 합성하였다.
조류 세포의 성장: 이들 실험에 사용한 배지는 액체 기본 배지(2g/ℓ 효모 추출물, 2.94mM NaNO3, 0.17mm CaCl2·2H2O, 0.3mmMgSO4·7H2O, 0.4mM K2HPO4, 1.28mM KH2PO4, 0.43mM NaCl) 및 1%의 최종 농도에서 수크로스 또는 글루코스(지정됨) 형태로 고정된 탄소를 함유하는 고체 기본 배지(+ 1.5% 아가로스)이었다. 이 실험에 사용한 균주는 추가적인 고정 탄소 공급원의 부재에서 암실 내 기본 배지 상에서 성장하지 않았다. 종들을 플레이트 상에서 퇴출시켰고, 암실 내 28℃에서 성장시켰다. 단일 콜로니를 선택하였고, 1 % 글루코스를 함유하는 500㎖의 액체 기본 배지를 접종하기 위하여 사용하였으며, 중기 로그기까지 암실 내에서 성장시키고, 각 날짜에 세포수를 측정하였다. 각각의 다음 균주를 암실 내 단독 탄소 공급원으로서 수크로스 상의 성장에 대해 이전에 시험하였으며, 이는 성장을 나타내지 않았고, 따라서 분비된 인버타제로 형질전환을 위해 선택하였다: (1) 클로렐라 프로토테코이데스(UTEX 31); (2) 클로렐라 미누티시마(UTEX 2341); 및 (3) 클로렐라 에머소니(CCAP 211/15).
유전자총을 통한 조류의 형질전환: 충분한 배양물을 원심분리하여 대략 1-5 x 108개의 전체 세포를 제공하였다. 결과 펠렛을 고정 탄소 공급원을 첨가하지 않은 기본 배지로 세척하였다. 세포를 다시 원심분리하였고, 펠렛을 5 x 107 내지 2 x 108 세포/㎖를 제공하기에 충분한 기본 배지 부피 중에서 재현탁하였다. 그 다음에 250-1000㎕의 세포를 1% 수크로스로 보충한 고체 기본 배지 상에 플레이팅하고, 멸균 후드 내 플레이트 상에서 건조시켰다. 플라스미드 DNA를 제조업자의 설명서(캘리포니아주 라호야에 소재한 Seashell Technology)에 따라서 금 입자에 침전시켰다. 파열판 홀더로부터 9㎝에 설정된 거대운반체 조립체가 있는 1350 psi 파열판을 사용하는 BioRad PDS He-1000 입자 전달 시스템을 사용하여 형질전환을 수행하였다. 형질전환 후, 플레이트를 28℃에서 암실 내에서 인큐베이션하였다. 모든 균주는 다양한 형질전환체 콜로니를 만들어냈다. 대조군 플레이트는 인버타제 삽입물로 형질전환되지 않았지만, 다르게는 콜로니를 함유하지 않는 동일한 방식으로 제조하였다.
클로렐라 프로토테코이데스 형질전환체의 분석: 게놈 DNA를 클로렐라 프로토테코이데스 야생형 세포 및 다음과 같은 형질전환체 콜로니로부터 추출하였다: 세포를 100 ㎕ 추출 완충제(87.5 mm Tris Cl, pH 8.0, 50 mm NaCl, 5 mm EDTA, pH 8.0, 0.25% SDS) 중에서 재현탁하였고, 30분 동안 전화를 통해 가끔식 혼합하면서 60℃에서 인큐베이션하였다. PCR을 위해, 샘플을 20 mM Tris Cl, pH 8.0 내 1:100으로 희석하였다.
WT, 형질전환체 및 플라스미드 DNA로부터 추출한 게놈 DNA 상에서 지노타이핑을 행하였다. 샘플을 마커 유전자에 대해 지노타이핑하였다. 프라이머 2383(5' CTGACCCGACCTATGGGAGCGCTCTTGGC 3')(서열번호 174) 및 2279(5' CTTGACTTCCCTCACCTGGAATTTGTCG 3')(서열번호 175)을 이런 지노타이핑 PCR에서 사용하였다. 사용한 PCR 프로파일은 다음과 같다: 5분 동안 94℃ 변성; 35주기의 94℃-30초, 60℃-30초 72℃-3분 72℃-5분. 동일 크기의 밴드를 양성 대조군(플라스미드) 및 클로렐라 프로토테코이데스(UTEX 31)의 2개 형질전환체로부터 증폭하였다.
클로렐라 미누티시마 및 클로렐라 에머소니 형질전환체의 분석: 게놈 DNA를 클로렐라 WT로부터 추출하였고, 형질전환체는 다음과 같다: 세포를 100㎕ 추출 완충제(87.5 mM Tris Cl, pH 8.0, 50 mM NaCl, 5 mM EDTA, pH 8.0, 0.25% SDS) 중에서 재현탁하였고, 30분 동안 전화를 통해 가끔식 혼합하면서 60℃에서 인큐베이션하였다. PCR을 위해, 샘플을 20 mM Tris Cl, pH 8.0 내 1:100으로 희석하였다. WT, 형질전환체 및 플라스미드 DNA로부터 추출한 게놈 DNA 상에서 지노타이핑을 행하였다. 샘플을 마커 유전자에 대해 지노타이핑하였다. 프라이머 2336(5' GTGGCCATATGGACTTACAA 3')(서열번호 176) 및 2279(5' CTTGACTTCCCTCACCTGGAATTTGTCG 3')(서열번호 175)는 프라이머 세트 2(1215 bp의 예상된 생성물)를 지정한 반면, 프라이머 2465(5' CAAGGGCTGGATGAATGACCCCAATGGACTGTGGTACGACG 3')(서열번호 177) 및 2470(5' CACCCGTCGTCATGTTCACGGAGCCCAGTGCG 3')(서열번호 178)은 프라이머 세트 4(1442 bp의 예상된 생성물)을 지정하였다. 사용한 PCR 프로파일은 다음과 같다: 2분 동안 94℃ 변성; 29주기의 94℃-30초, 60℃-30초 72℃-1분 30초; 72℃-5분. 분비 인버타제를 함유하는 플라스미드 대조군을 PCR 대조군으로 사용하였다.
인버타제 구성체의 서열은 서열번호 8에 대응한다.
실시예 7: 프로토테카 종 내 상동성 재조합
이식유전자의 상동성 재조합은 몇몇 이점을 가진다. 첫째로, 세포에 도입되는 플라스미드 복제물 수 이상의 대조군이 없기 때문에 상동성 재조합이 없는 이식유전자의 도입은 예측가능하지 않다. 또한 상동성 재조합이 없는 이식유전자의 도입은 안정하지 않은데, 플라스미드가 에피솜으로 남아있을 수 있고, 후속하는 세포 분할을 거쳐서 상실되기 때문이다. 상동성 재조합의 다른 이점은 "녹-아웃"유전자 표적에 대한 능력이며, 이는 에피토프 태그, 내인성 유전자의 스위치 프로모터를 도입하고, 다르게는 유전자 표적을 변경한다(예를 들어 점 돌연변이의 도입).
두 벡터를 프로토테카 모리포미스(UTEX 1435) 게놈의 특정 영역을 사용하여 구성하였고, KE858을 지정하였다. KE858은 1.3 kb이며, 단백질의 전달 RNA(tRNA)와 상동성을 공유하는 단백질에 대해 암호 영역 부분을 포함하는 게놈 단편이다. 사우던 블롯은 KE858 서열이 프로토테카 모리포미스(UTEX 1435) 게놈에서 단일 복사체 중에 존재한다는 것을 나타냈다. 구성된 제1 유형의 벡터는 SZ725(서열번호 179)를 지정하며, 최적화된 효모 인버타제(suc2) 유전자를 또한 함유하는 pUC19 벡터 백본 내로 클로닝된 전체 1.3 kb KE858 단편으로 이루어진다. KE858 단편은 표적 구성체 내 다른 어느 곳에도 생기지 않는 독특한 SnaB1 부위를 함유한다. 구성된 제2 유형의 벡터는 SZ726(서열번호 180)를 지정하며, KE858 게놈 서열 내 SnaB1 부위에서 효모 인버타제 유전자(suc2)의 전화에 의해 파쇄된 KE858 서열로 이루어진다. 효모 인버타제 유전자 옆에 있는 KE858 서열을 함유하는 전체 DNA 단편은 EcoRI에 의한 소화에 의해 벡터 백본으로부터 절단될 수 있는데, 이는 KE858 영역 말단 중 하나에서 절단된다.
두 벡터는 모두 프로토테카 모리포미스(UTEX 1435) 게놈의 대응하는 KE858 영역 내로 효모 인버타제 유전자(suc2)의 직접적인 상동성 재조합을 사용하였다. 상동성 재조합을 위해 표적화된 게놈 영역과 상동성인 선형 DNA 말단은 SnaB1이 있는 벡터 구성체 SZ725 및 EcoRI가 있는 벡터 구성체 SZ726를 분해하는 것으로 노출되었다. 그 다음에 분해된 벡터 구성체는 상기 기재한 방법을 사용하여 프로토테카 모리포미스 배양물 내로 도입하였다. 그 다음에 각 벡터 구성체로부터 유래된 형질전환체를 수크로스 플레이트를 사용하여 선택하였다. 각 벡터 형질전환으로부터 10개의 독립적인, 클론적으로 순수한 형질전환체를 원하는 게놈 위치(사우던 블롯을 사용) 내로 효모 인버타제 유전자의 성공적인 조합을 위해 및 이식유전자 안정성을 위해 분석하였다.
SZ725 형질전환체의 사우던 블롯 분석은 분석을 위해 선택한 10개의 형질전환체 중 4개가 예측된 재조합 밴드를 함유한다는 것을 나타내었고, 이는 하나의 크로스오버 사건이 벡터 상의 KE858 서열과 게놈 내 KE858 서열 사이에 일어났다는 것을 나타낸다. 대조적으로, 모두 10개의 SZ726 형질전환체는 예측된 재조합체 밴드를 나타내었고, 이는 이중 크로스오버 사건이 효모 인버타제 이식유전자 옆에 있는 KE858 서열을 운반하는 pSZ726의 EcoRI 단편과 게놈의 대응하는 KE858 영역 사이에 일어났다는 것을 나타낸다.
선택의 부재에서 15 세대에 거쳐서 형질전환체를 성장시킴으로써 수크로스 인버타제 발현 및 이식유전자 안정성을 평가하였다. 사우던 블롯에 의해 이식유전자에 양성인 4개의 SZ725 형질전환체 및 10개의 SZ276 형질전환체를 선택하였고, 형질전환체 각각으로부터 48개의 단일 콜로니를, 우선 글루쿠스 함유 배지에서 선택 없이, 그 다음에 단일 탄소 공급원으로서 수크로스를 함유하는 배지 내 선택과 함께 단계적으로 성장시켰다. 모든 10개의 SZ276 형질전환체(100%)는 15세대 후 수크로스 상에서 성장하는 능력을 보유한 한편, SZ725 형질전환체의 약 97%는 15세대 후 수크로스 상에서 성장하는 능력을 보유하였다. 이중 크로스오버 사건에 의해 도입된 이식유전자(SZ726 벡터)는 세대 배가를 거쳐서 극도로 높은 안정성을 가진다. 대조적으로, 단일 크로스오버 사건에 의해 도입된 이식유전자(SZ725 벡터)는 세대배가를 거쳐서 일부 불안정성을 초래할 수 있는데, 이는 이식유전자의 탠덤 복제물이 도입되고, 이식유전자 옆의 반복된 상동성 영역은 그것들 사이에 위치된 유전자이식 DNA를 재조합하고 절단할 수 있기 때문이다.
이들 실험은 유기체의 핵 염색체 내로 안정하게 도입되는 이종성 수크로스 인버타제를 함유하는 프로토테카 형질전환체를 만들기 위한 상동성 재조합의 성공적인 사용을 증명한다. 상동성 재조합의 성공은 유전자 결실, 점 돌연변이 및 원하는 유전자 생성물을 태그하는 에피토프를 포함하여, 프로토테카 내 다른 게놈 변경을 가능하게 한다. 이들 실험은 또한 진핵 미세조류의 핵 게놈 내 상동성 재조합을 위한 제1 기록 시스템을 증명한다.
내인성 포로토테카 모리포미스 유전자을 녹- 아웃하기 위한 상동성 재조합의 사용: 프로토테카 모리포미스 cDNA/게놈 스크리닝에서, 실시예 4에 기재한 것과 같이, 내인성 스테아릴 ACP 불포화효소(SAPD) cDNA를 확인하였다. 스테아릴 ACP 불포화효소는 지질 합성 경로의 부분이며 그것은 지방 아실 쇄 내로 이중결합을 도입하는 작용을 한다. 일부 경우에, 지방산 프로파일을 변경시키기 위하여 지질 경로 효소의 발현을 녹-아웃하거나 감소시키는 것이 유리하다. 내인성 스테아릴 ACP 불포화효소의 발현이 감소될 수 있는지(또는 녹아웃될 수 있는지) 여부 및 불포화된 지방산 내 대응하는 감소가 숙주 세포의 지질 프로파일에서 관찰될 수 있는지 여부를 평가하기 위하여 상동성 재조합 구성체를 만들었다. 프로토테카 모리포미스(UTEX 1435)의 스테아릴 ACP 불포화효소 유전자의 대략 1.5kb 암호화 서열을 확인하였고 클로닝하였다(서열번호 181). 5'말단(5'표적 부위)에서 0.5kb의 SAPD 암호화 서열을 사용한 다음, 클로렐라 불가리스 3'UTR이 있는 코돈-최적화된 효소 수크로스 인버타제 suc2 유전자를 구동하는 클라미도모나스 레인하르티 β-튜불린 프로모터를 사용하여 상동성 재조합 구성체를 구성하였다. 그 다음에 나머지(~1kb) 프로토테카 모리포미스 SAPD 암호화 서열 클로렐라 불가리스 3'UTR 다음에 삽입하여 3'표적 부위를 구성하였다. 이 상동성 재조합 카세트에 대한 서열은 서열번호 182에 열거한다. 상기 나타낸 바와 같이, 핵 게놈 내 상동성 재조합 카세트의 도입을 위한 성공률은 미세조류를 형질전환하기 전 카세트를 선형화하고, 노출된 말단을 남김으로써 증가될 수 있다. 프로토테카 모리포미스 내 내인성 SAPD 효소를 표적화하는 상동성 재조합 카세트는 선형화한 다음 숙주 세포(프로토테카 모리포미스, UTEX 1435) 내로 형질전환한다. 성공적인 통합은 이중 상호 재조합 사건을 통해 숙주 게놈으로부터 내인성 SAPD 효소 암호화 영역을 제거하는 한편, 새로 삽입된 suc2 유전자의 발현은 클라미도모나스 레인하르드티 β-튜불린 프로모터에 의해 조절될 것이다. 결과 클론은 유일한 탄소 공급원으로서 수크로스를 함유하는 플레이트/배지를 사용하여 스크리닝할 수 있다. 상동성 재조합 카세트의 성공적인 도입을 함유하는 클론은 유일한 탄소 공급원으로서 수크로스 상에서 성장하는 능력을 가질 것이며, 지질 프로파일 내 지방산의 전반적인 포화도 변화는 부차적인 확인 인자로 작용할 것이다. 추가적으로 효모 수크로스 인버타제 suc2 유전자 및 RT-PCR에 특이적인 프로브를 사용하는 사우던 블롯팅 분석은 또한 포지티브 클론 내 인버타제 유전자의 존재 및 발현을 확인할 수 있다. 대안으로서, β-튜불린 프로모터가 없는 동일 구성체를 내인성 SAPD 효소 암호화 영역을 절단하기 위하여 사용할 수 있다. 이 경우에, 새로 삽입된 효모 수크로스 인버타제 suc2 유전자는 내인성 SAPD 프로모터/5'UTR에 의해 조절될 것이다.
실시예 8: 프로토테카 내 다양한 티오에스터라제의 발현
프로토테카 종 내 이종성 티오에스터라제 유전자를 발현하는 방법 및 효과는 본 명세서에 참조로 포함되는 국제특허출원 PCT/US2009/66142에 앞서 기재되었다. 고등 식물 종으로부터 다른 티오에스터라제 유전자/유전자 생성물의 효과를 추가로 조사하였다. 이들 티오에스터라제는 다음의 고등 식물로부터 유래된 티오에스터라제를 포함한다:
모든 경우에, 각각의 상기 티오에스터라제 구성체는 바이오리스틱 유전자총을 사용하여 프로토테카 모리포미스(UTEX 1435) 내로 형질전환하였다. 국제특허 출원 PCT/US2009/66142에 개시된 상동성 재조합을 포함하는 다른 형질전환 방법은 또한 관심의 이종성 유전자 발현에 적합하다. 각각의 상기 티오에스터라제 구성체에 의한 프로토테카 모리포미스(UTEX 1435)의 형질전환은 실시예 2에 기재한 방법을 사용하여 수행하였다. 각각의 구성체는 NeoR 유전자를 함유하였고 100㎍/㎖ G418을 사용하여 포지티브 클론에 대한 선택을 수행하였다. 모든 암호화 영역은 프로토테카 모리포미스 UTEX 1435(표 2) 핵 유전자 내 고유한 코돈 바이어스를 반영하도록 최적화되었다. 구성체에 대한 아미노산 서열과 cDNA 서열은 둘 다 서열 동일성 목록에서 열거한다. 각각의 고등 식물 티오에스터라제에 대한 수송 펩타이드를 프로토테카 모리포미스 델타 12 지방산 불포화효소(서열번호 48)로부터의 또는 클로렐라 프로토코이데스 스테아릴 ACP 불포화효소(서열번호 49)로부터의 조류 코돈 최적화된 수송 펩타이드로 대체하였다. 모든 티오에스터라제 구성체는 클라미도모나스 레인하르티 베타-튜불린 프로모터/5'UTR에 의해 구동되었다. 선택한 포지티브 클론의 성장 및 지질 생성을 야생형(형질전환되지 않음) 프로토테카 모리포미스(UTEX 1435)와 비교하였다. 야생형 및 선택한 포지티브 클론을 2% 글루코스 G418 플레이트에서 성장시켰다. 각 구성체에 대해 선택한 포지티브 클론 상의 지질 프로파일 분석을 이하의 표 15에서 요약한다(면적%로 표현).
다양한 이종성 티오에스터라제를 발현시키는 프로토테카 모리포미스의 지질 프로파일 | ||||||||||
지방산 |
UTEX
1435
wt |
티오에스터라제 | ||||||||
캘리포니아 월계수 | 녹나무 | 아이리스 게르마니카 | 미리스티카 프라그란스 | 쿠페아 팔루스트리스 C8:0 | 쿠페아 후커리아나 | 쿠페아 란세올라타 | 쿠페아 팔루스트리스 C14:0 | 미국 느릅나무 | ||
C8:0 | 0 | 0 | 0 | 0 | 3.1 | 1.8 | 0 | 0 | .09 | |
C10:0 | 0.02 | .07 | .02 | .01 | .09 | .56 | 6.85 | 1.91 | .01 | 2.85 |
C12:0 | 0.05 | 14 | 1.82 | .09 | .05 | .25 | .2 | .29 | .06 | .74 |
C14:0 | 1.65 | 3 | 17.3 | 2.59 | 5.31 | 1.45 | 1.8 | 1.83 | 2.87 | 10.45 |
C16:0 | 28.0 | 21.4 | 24.3 | 26.52 | 31.08 | 22.84 | 23.9 | 25.55 | 27.23 | 33.3 |
C18:0 | 2.9 | 2.9 | 2.7 | 3.11 | 2.71 | 3.24 | 2.8 | 3.26 | 3.62 | 3.47 |
C18:1 | 53.8 | 45.2 | 41.3 | 49.96 | 39.77 | 56.62 | 49.8 | 55.43 | 51.04 | 38.71 |
C18:2 | 10.95 | 10 | 9.7 | 11.86 | 14.17 | 8.24 | 9.7 | 8.17 | 10.81 | 7.38 |
C18:3 α | 0.8 | .86 | .8 | .40 | .64 | .61 | .9 | .58 | .97 | .52 |
전체 포화도
( 면적% ) |
32.62 | 44.97 | 46.14 | 32.32 | 39.24 | 31.44 | 37.35 | 32.84 | 33.79 | 50.9 |
결과는 모든 티오에스터라제가 일정 수준으로 영향받은 프로파일을 발현한다는 것을 나타낸다. "전체 포화도" 열을 보면, 포화도는 캘리포니아 월계수, 녹나무 및 가장 현저하게는 미국 느릅나무로부터 유래된 것을 포함하는 몇몇 티오에스터라제의 발현에 의해 크게 영향받는다. 전체 포화도%의 이런 변화는 고등 식물로부터의 티오에스터라제의 이종성 발현이 단지 지질 쇄 길이보다 더 명확하게 영향을 미칠 수 있다는 것을 예상치 못했는데; 이는 또한 미세조류에 의해 생성된 지질 프로파일의 다른 속성, 즉 지방산의 포화도에 영향을 미칠 수 있다.
쿠페아 팔루스트리스 C8 티오에스터라제, 쿠페아 후커리아나 티오에스터라제, 캘리포니아 월계수 및 녹나무 티오에스터라제에 의해 형질전환된 선택 클론을 다양한 양의 G418(25㎎/ℓ 내지 50㎎/ℓ) 및 다양한 온도(22℃ 내지 25℃)에서 추가로 성장시켰으며, 이들 클론에 대해 지질 프로파일을 결정하였다. 표 16은 각각의 티오에스터라제를 함유하는 대표적인 클론의 지질 프로파일(면적%)을 요약한다. 미국 느릅나무 티오에스터라제를 함유하는 제2 구성체를 구성하였고 상기 기재한 바이오리스틱 방법을 사용하여 프로토테카 모리포미스(UTEX 1435) 내로 형질전환하였다. 이런 제2 구성체를 상동성 재조합을 통해 세포 내로 도입하였다. 프로토테카 종 내 상동성 재조합 방법은 국제특허출원 PCT/US2009/66142에서 앞서 기재되었다. 사용한 상동성 DNA는 프로토테카 모리포미스 UTEX 1435로부터의 6S rRNA의 게놈 DNA 서열로부터 유래되었다. 선택 작용제는 클라미도모나스 레인하르티 베타-튜불린 프로모터에 의해 구동된 사카로마이세스 세레비시애로부터 유래된 코돈 최적화 suc2 유전자를 사용하여 수크로스 상에서 성장하는 능력이 있다. 본래의 미국 느릅나무 수송 펩타이드를 클로렐라 프로토테코이데스(UTEX 250) 스테아릴 ACP 불포화효소 수송 펩타이드로 대체하였다. 이 구성체의 cDNA를 서열번호 50으로서 서열목록에 열거한다. 포지티브 클론의 선택을 2% 수크로스 플레이트 상에서 수행하였고, 지질 프로파일 결정을 위한 결과 배양물을 또한 2% 수크로스 함유 배지 상에서 성장시켰다. 상동적으로 재조합된 이종성 미국 느릅나무 티오에스터라제를 함유하는 이런 프로토테카 모리포미스 균주에 대한 대표적인 지질 프로파일을 표 16에 요약한다.
이종성 티오에스터라제 유전자를 함유하는 프로토테카 모리포미스 균주의 지질 프로파일 | ||||
쿠페아 팔루스트리스 C8 | 쿠페아 후커리아나 | 녹나무 | 미국 느릅나무 2 | |
C8:0 | 12.28 | 2.37 | 0 | 0 |
C10:0 | 2.17 | 12.09 | 0.02 | 4.69 |
C12:0 | 0.34 | 0.33 | 3.81 | 1.02 |
C14:0 | 1.59 | 2.08 | 32.73 | 16.21 |
C16:0 | 15.91 | 20.07 | 24.03 | 38.39 |
C18:0 | 1.59 | 1.57 | 1.21 | 2.83 |
C18:1 | 50.64 | 41.80 | 18.64 | 27.22 |
C18:2 | 13.02 | 16.37 | 16.57 | 7.65 |
C18:3 α | 1.52 | 1.75 | 1.66 | 0.74 |
전체 포화도 | 33.88 | 38.51 | 61.80 | 63.14 |
상기 기재한 클론과 같이, 이종성 티오에스터라제 유전자를 함유하는 모든 형질전환체는 일정한 수준으로 영향받은 지방상 프로파일을 나타내었고, 야생형(형질전환되지 않음) 프로토테카 모리포미스와 비교하여 포화된 지방산의 전체%는 또한 변하였다. 상동성 재조합으로 도입된 미국 느릅나무 티오에스터라제를 함유하는 프로토테카 모리포미스는 전체 포화도의 가장 큰 증가를 가졌다.
추가적으로 외인성 쿠페아 후커리아나, 녹나무, 캘리포니아 월계수 또는 미국 느릅나무 티오에스터라제를 함유하는 유전자이식 클론을 신규한 지질 프로파일에 대해 평가하였다. 쿠페아 후커리아나 티오에스터라제 함유 클론은 22℃에서 2% 글루코스, 25㎎/㎖ G418에서 성장할 때 다음의 지질 프로파일을 달성하였다: 5.10% C8:0; 18.28% C10:0; 0.41% C12:0; 1.76% C14:0; 16.31% C16:0; 1.40% C18:0; 40.49% C18:1; 및 13.16% C18:2. 녹나무 티오에스터라제-함유 클론(또한 외인성 수크로스 인버타제를 함유)는 25℃에서 2% 수크로스 중에서 성장시킬 때 다음의 지질 프로파일을 달성하였다: 0.04% C10:0; 6.01% C12:0; 35.98% C14:0; 19.42 C16:0; 1.48% C18:0; 25.44% C18:1; 및 9.34% C18:2. 캘리포니아 월계수 티오에스터라제 함유 클론은 22℃에서 2% 글루코스, 25-100 ㎎/㎖ G418 중에서 성장시킬 때 다음의 지질 프로파일을 달성하였다: 0% C8:0; 0.11% C10:0; 34.01% C12:0; 5.75% C14:0; 14.02% C16:0; 1.10% C18:0; 28.93% C18:1; 및 13.01% C18:2. 미국 느릅나무 티오에스터라제 함유 클론은 28℃에서 2% 글루코스 중에서 성장시킬 때 다음의 지질 프로파일을 달성하였다: 1.54% C10:0; 0.43% C12:0; 7.56% C14:0; 39.45% C16:0; 2.49% C18:0; 38.49% C18:1; 및 7.88% C18:2.
실시예
9: 다수의 외인성
이종성
티오에스터라제
유전자를 갖는
프로토테카의
형질전환
미세조류 균주 프로토테카 모리포미스(UTEX 1435)를 상기 개시한 방법을 사용하여 형질변환하여 단일 클론 중에서 다수의 티오에스터라제를 발현시켰다. 단일 클론 내 다양한 티오에스터라제의 발현은 임의의 단일 티오에스터라제가 단독으로 발현될 때 미세조류가 상술한 것과 완전히 상이한 지방산 프로파일을 갖는 오일을 생성하도록 한다(상기 예에서 증명). 상동성 재조합을 사용하여 사카로마이세스 세레비시애(선택은 수크로스 상에서 성장하는 능력임)로부터의 suc2인 수크로스 인버타제 유전자와 함께 프로토테카 모리포미스(UTEX 1435)를 녹나무 티오에스터라제(C14 선호 티오에스터라제)로 우선 형질전환하였다. 이 상동성 재조합 구성체에 사용된 DNA는 상기 부문 III에 기재한 것과 같은 프로토테카 모리포미스 게놈 DNA의 KE858 영역으로부터 유래된다. 이 구성체의 상대적 부분은 서열번호 51로 서열목록에 열거한다. 포지티브 클론을 수크로스-함유 플레이트 상에서 스크리닝하였다. 그 다음에 수크로스-함유 플레이트 상에서 스크리닝하였다. 그 다음에 3개 중 하나의 카세트로 재형질전환하였고, 이들 각각은 항생제 G418뿐만 아니라 추가적인 티오에스터라제에 대한 내성을 암호화한다: (1) 쿠페아 후커리아나의 티오에스터라제 유전자(C8-10 선호), 서열번호 52; (2) 캘리포니아 월계수의 티오에스터라제 유전자(C12 선호), 서열번호 53; 또는 미국 느릅나무의 티오에스터라(넓음; C10-C16 선호), 서열번호 54. 서열목록은 각 구성체의 적절한 서열 부분을 포함한다. 티오에스터라제 유전자를 발현시키는 클론을 50㎍/㎖ G418을 갖는 배지를 함유하는 수크로스 상에 스크리닝하였다. 포지티브 클론을 선택하였고, 성장 및 지질 프로파일을 분석하였다. 표 17은 대표적인 포지티브 클론의 지질 프로파일(면적%로 표현)을 요약한다.
다양한 티오에스터라제로 형질전환된 프로토테카 모리포미스의
지질 프로파일 |
|||||
지방산 | UTEX 1435 |
UTEX 1435 +
녹나무 TE |
UTEX 1435 + 녹나무 TE 유전적 배경 | ||
+
쿠페아 후커리아나 TE |
+
캘리포니아 월계수 TE |
+
미국 느릅나무 TE |
|||
C8:0 | 0 | 0 | 0.19 | 0 | 0.06 |
C10:0 | 0.02 | 0.02 | 2.16 | 0.07 | 1.87 |
C12:0 | 0.05 | 0.66 | 0.53 | 13.55 | 1.61 |
C14:0 | 1.65 | 10.52 | 7.64 | 8.0 | 14.58 |
C16:0 | 28.0 | 22.56 | 22.31 | 19.98 | 29.53 |
C18:0 | 2.9 | 6.67 | 3.23 | 2.24 | 2.93 |
C18:1 | 53.8 | 47.78 | 48.54 | 42.55 | 37.3 |
C18:2 | 10.95 | 12.3 | 11.76 | 10.13 | 8.9 |
C18:3 α | 0.8 | 0.93 | 0.91 | 0.91 | 0.76 |
전체 포화도
(면적 %) |
32.62 | 40.43 | 36.06 | 43.84 | 50.58 |
추가적으로 녹나무와 캘리포니아 월계수 티오에스터라제를 갖는 이중 티오에스터라제를 22℃에서 50㎎/ℓ G418을 갖는 배지를 함유하는 2% 수크로스 내에서 성장시켰다. 성장 조건 하에 이 균주로부터 얻은 지방산 프로파일은 C8:0(0); C10:0(0.10); C12:0(31.03); C14:0(7.47); C16:0(15.20); C18:0(0.90); C18:1(30.60); C18:2(12.44); 및 C18:3α(1.38)이며, 54.7의 전체 포화도를 가진다.
녹나무 티오에스터라제를 함유하는 2개의 이종성 재조합 구성체(하나는 6S 영역을 표적화하며, 나머지는 KE858 영역을 표적화함)를 갖는 이중 티오에스터라제 클론를 생성하였다. 대표적인 포지티브 클론은 0% C8:0; 0.06% C10:0; 5.91% C12:0; 43.27% C14:0; 19.63% C16:0; 0.87% C18:0; 13.96% C18:1; 및 13.78% C18:2의 지방산 프로파일을 가지며, 69.74%의 전체 포화도를 가진다. 이 클론은 49% 이상으로 C12-C14 수준을 가지는데, 이는 야생형 세포에서 C12-C14 수준의 37배 이상이다.
상기 데이터는 다양한 티오에스터라제가 미세조류 내에서 성공적으로 공동발현될 수 있다는 것을 나타낸다. 다양한 티오에스터라제의 공동발현은 야생형 균주뿐만 아니라 임의의 개개의 티오에스터라제의 발현에 의해 얻어지는 지방산 프로파일과 상당히 다른 변경된 지방산 프로파일을 초래한다. 중복 쇄 길이 특이성을 갖는 다양한 티오에스터라제의 발현은 특정 지방산에서 누적적인 증가를 초래할 수 있다.
프로토테카 모리포미스에서 이종성 티오에스터라제의 발현(단독으로 또는 조합으로)은 숙주 균주에서 지방산/지질 프로파일을 변경시킬 뿐만 아니라, 다양한 종자 식물로부터 현재 이용가능한 오일과 비교할 때(표 5), 이들 프로파일은 다른 현재 이용가능한 시스템에서 발견되는 정말 독특한 오일을 가진다. 유전자이식 균주는 미번역 야생형 균주와 상당한 차이를 나타낼 뿐만 아니라, 표 5에서 나타내는 임의의 상업적 오일과 현저하게 상이한 프로파일을 가진다. 예로서, 코코넛 오일과 팜커넬 오일은 둘 다 5.5-17% 범위의 C8-C10 지방산 수준을 가진다. 쿠페아 팔루스트리스 C8-선호 티오에스터라제 또는 쿠페아 후커리아나 C10-선호 티오에스터라제를 발현하는 유전자이식 균주는 각각 3.66 내지 8.65% 어디에서나 축적된다. 이들 C8-C10 지방산 수준은 코코넛 오일 및 팜커넬과 유사하지만, 유전자이식 조류 균주는 상대적으로 더 높은 C12:0 지방산이 없으며, 그것들은 극도로 높은 C16:0 (각각 유전자이식에서 23% 대 코코넛 오일 또는 팜커넬 오일에서 11-16%) 및/또는 18:1(각각 유전자이식에서 50-57% 대 코코넛 또는 팜커넬 오일에서 8-19%).
실시예 10: 내인성 질소-의존적 프로토테카 프로모터의 확인
A. 내인성 질소-의존적 프로코터의 확인 및 특징화
cDNA 라이브러리는 표준 기술을 사용하여 프로토테카 모리포르미스(UTEX 1435)로부터 만들었다. 상기 프로토테카 모리포르미스를 질소 풍부 조건하에서 48시간 동안 성장시켰다. 이어서 5%의 접종물(v/v)을 낮은 질소로 이동시키고 상기 세포를 7일 동안 24시간 마다 채취하였다. 배양 약 24시간 후, 배지 내 질소 공급은 완전히 고갈되었다. 수거된 샘플은 무수 얼음 상 및 아이소프로판올을 사용하여 즉시 동결시켰다. 후속적으로 전체 RNA는 냉동 세포 펠렛 샘플로부터 분리하고 각각의 샘플의 일부는 RT-PCR 연구를 위해 보존하였다. 상기 샘플로부터 수거된 총 RNA의 나머지는 폴리A 선택에 적용하였다. 이어서 각각의 조건으로부터 동몰량의 폴리A 선택된 RNA를 모으고 이를 사용하여 벡터 pcDNA 3.0(Invirogen) 중에서 cDNA 라이브러리를 만들었다. 대략적으로 1200개 클론을 무작위로 수득한 모아진 cDNA 라이브러리로부터 집어내고 양쪽 가닥 상의 서열분석에 적용하였다. 대략적으로 68개의 상이한 cDNA는 이들 1200개의 서열로부터 선택하고 이를 사용하여 실시간 RT-PCR 연구에 사용하기 위한 cDNA 특이적 프라이머를 설계하였다.
보존된 세포 펠렛 샘플로부터 분리된 RNA를 상기 생성된 cDNA 특이적 프라이머를 사용한 실시간 RT-PCR 연구에서 기질로서 사용하였다. 상기 보존된 RNA를 cDNA로 전환시키고 68개 유전자 특이적인 프라이머 세트 각각에 대한 RT-PCR의 기질로서 사용하였다. 역치 사이클 또는 CT 수를 사용하여 시간 전반에 걸쳐 수거된 각각의 RNA 샘플 내에서 68개 cDNA 각각에 대한 상대적인 전사체 풍부함을 나타내었다. 질소 풍부와 질소 고갈된 조건간의 상당한 증가(3배 초과)를 나타내는 cDNA는 잠재적인 유전자로서 플래그하고 이의 발현은 질소 고갈에 의해 상향조절된다. 명세서에서 논의된 바와 같이, 질소 고갈/제한은 유지성 미생물에서 지질 합성의 공지된 유도인자이다.
질소 고갈/제한 동안에 발현이 상향조절되는 cDNA 기원의 추정 프로모터/5'UTR 서열을 동정하기 위해, 총 DNA를 질소 풍부 조건하에서 성장한 프로토테카 모리포르미스(UTEX 1435)로부터 분리하고 이어서 454 서열분석 기술(Roche)을 사용하는 서열분석에 적용하였다. 상기 RT-PCR 결과에 의해 상향 조절된 바와 같은 플래그된 cDNA는 454 게놈 서열분석 판독으로부터 비롯된 조립된 콘티그에 대한 BLAST를 사용하여 비교하였다. cDNA의 5' 말단은 특이적 콘티그로 맵핑하고 가능한 경우 500bp 초과의 5' 옆에 있는 DNA를 사용하여 추정적으로 프로모터/UTR을 동정하였다. 이어서 프로모터/5'UTR의 존재는 게놈 DNA의 PCR 증폭을 사용하여 확인하고 클로닝하였다. 개별 cDNA 5' 말단을 사용하여 3' 프라이머를 설계하고 454 콘티그 조립체의 5' 말단을 사용하여 5' 유전자 특이적 프라이머를 설계하였다.
제1 스크리닝으로서, 추정 프로모터중 하나인 Aat2(암모늄 수송체, 서열번호 63)로부터 분리된 5'UTR/프로모터를 클로렐라 프로토테코이데스 스테아로일 ACP 불포화효소 수송 펩타이드와 함께 녹나무 C14 티오에스테라제 구성체에 클로닝하여 클로렐라 소로키니아나 글루타메이트 탈수소효소 프로모터를 대체한다. 상기 구성체을 서열번호 81로서 나타낸다. 추정 프로모터를 시험하기 위해, 티오에스테라제 구성체를 프로토테카 모리포르미스 세포로 형질전환시켜 상기된 방법을 사용하여 낮은/무 질소 조건하에서 C14/C12 지방산 증가에 대해 스크리닝하여 실제 프로모터 활성을 확인하였다. cDNA/게놈 스크리닝으로부터 분리된 추정 질소 조정된 프로모터의 유사한 실험은 동일한 방법을 사용하여 수행할 수 있다.
cDNA/게놈 스크리닝으로부터 분리된 또 다른 추정 질소-조절된 프로모터/5' UTR은 다음과 같다:
배수 증가는 낮은 질소 배지 내 배양의 24시간 후 cDNA 존재도의 몇 배 증가를 말한다.
이들 추청 프로모터/5'UTR의 잠재적 조절에 대해 추가로 파악하기 위하여, 8개의 서열을 추가 시험을 위해 선택하였다: (1) FatB/A; (2) SulfRed 설파이트 환원효소; (3) SugT 당 수송체; (4) Amt02-암모늄 수송체 02; (5) Aat01-아미노산 수송체 01; (6) Aat03-아미노산 수송체 03; (7) Aat04-아미노산 수송체 04; 및 (8) Aat05-아미노산 수송체 05. Illumina 서열 판독을 이용하는 고해상도 전사체를 다양한 시점에 프로토테카 모리포미스 세포로부터 분리한 RNA 상에서 수송하였다: 종자로부터 접종 후 T0(종자); 20 시간; 32 시간; 48 시간; 62 시간; 및 114 시간. T0(종자) 배지는 질소가 풍부한 반면, 20시간 이상의 시점에서, 배지는 질소를 거의 함유하지 않았다. 그 다음에 각 시점에 분리한 RNA로부터 만들어진 조립체화된 전사 콘티그를 앞서 확인한 각각 8개의 전사물과 함께 독립적으로 BLAST 분석을 하였다. 결과를 이하의 표 18에 요약한다.
8개의 추정 프로모터/ 5'UTR에 대한 전사체 발현 프로파일 | |||||||
cDNA | TS | T20 | T32 | T48 | T62 | T114 | |
aa 트랜스_01 | 절대 | 98 | 96 | 321 | 745 | 927 | 1300 |
상대 | 1 | 0.98 | 3.28 | 7.61 | 9.47 | 13.28 | |
aa 트랜스_03 | 절대 | 7 | 21 | 51 | 137 | 102 | 109 |
상대 | 1 | 2.95 | 7.2 | 19.42 | 14.47 | 15.45 | |
aa 트랜스_04 | 절대 | 1 | 6 | 25 | 90 | 131 | 160 |
상대 | 1 | 5.16 | 21.29 | 74.97 | 109.35 | 133.31 | |
aa 트랜스_05 | 절대 | 109 | 88 | 123 | 210 | 214 | 273 |
상대 | 1 | 0.81 | 1.13 | 1.93 | 1.97 | 2.51 | |
ammon 트랜스_02 | 절대 | 683 | 173 | 402 | 991 | 1413 | 1397 |
상대 | 1 | 0.25 | 0.59 | 1.45 | 2.07 | 2.04 | |
fatA/B-1_cDNA | 절대 | 13 | 36 | 654 | 617 | 544 | 749 |
상대 | 1 | 2.8 | 51.57 | 48.65 | 42.9 | 59.1 | |
sug 트랜스_01 | 절대 | 25 | 25 | 106 | 261 | 266 | 251 |
상대 | 1 | 1 | 4.22 | 10.4 | 10.63 | 10 | |
설파이트 환원효소_01 | 절대 | 634 | 238 | 138 | 145 | 163 | 155 |
상대 | 1 | 0.38 | 0.22 | 0.22 | 0.26 | 0.24 |
상기 요약한 결과로부터, 흥미롭게도 설페이트 환원효소 mRNA가 시간에 걸쳐 mRNA 축적의 분명한 감소를 나타내지만, 몇몇 전사는 시간에 걸쳐 증가된 축적을 나타내었다.
이들 8개의 추정 프로모터/5'UTR 영역은 본래의 수송 펩타이드가 빠지거나 클로렐라 프로토테코이데스(UTEX 250) 스테아릴 ACP 불포화효소로부터의 수송 펩타이드로 치환된 녹나무 티오에스터라제 암호화 영역의 상류를 클로닝하였다. 각각의 추정 프로모터/5'UTR 영역 구성체를 6S rRNA의 게놈 서열로부터 DNA를 사용하는 상동성 재조합을 통해 프로토테카 모리포미스 UTEX 1435 내로 도입하였다. 또한 배지/플레이트를 함유하는 수크로스 상에서 포지티브 클론의 선택을 위해 구성체 내에 사카로마이세스 세레비시애로부터 유래된 suc2 수크로스 인버타제 유전자를 함유한다. Aat01에 대한 구성체의 상대적 부분에 대한 cDNA 서열은 서열번호 67로 서열목록에서 열거한다. 다른 구성체에 대해, 동일한 백본을 사용하였고, 유일한 변수는 추정 프로모터/5'UTR 서열이었다. 추가적인 대조군 유전자이식 균주를 만들었으며, 이때 클라미도모나스 레인하르드티 베타 튜불린 프로모터를 녹나무 티오에스터라제 유정자의 발현을 구동하기 위하여 사용하였다. 이 프로모터는 관심의 유전자의 구성적 발현을 구동하는 것으로 나타났고, 따라서 시험한 다양한 추정적 N-조절 프로모터/5'UTR에 의해 구동될 때 동일한 티오에스터라제의 발현을 측정하기에 유용한 대조군을 제공한다.
일단 유전자이식 클론이 만들어지면, 3가지 별개의 실험을 수행하였다. 첫 번째 2가지 실험은 RT-PCR을 통해 고정적 상태의 티오에스터라제 mRNA 수준, 배양 상청액 내 지방산 프로파일 및 암모니아 수준을 측정함으로써 모두 8개의 추정적 프로모터의 잠재적 질소 조절능력을 평가한다. 클론을 초기에 질소가 풍부한 배지(1g/ℓ 질산암모늄-암모니아로서 15mM 질소, 4g/ℓ 효소 추출물) 내에서 28℃에서 교반(200rpm)과 함께 24시간 내지 48시간 동안 성장시켰으며, 이 시점에 20 OD 유닛(A750)은 50㎖의 저질소 배지(0.2g/ℓ 황산암모늄-암모니아로서 3mM 질소, 0.2g/ℓ 효소 추출물)를 접종하기 위하여 사용하였다. 6일 동안 24시간마다 세포를 샘플링하였고, 또한 샘플을 정확하게 수집한 후 저 질소 조건으로 전환하였다. 그 다음에 전체 RNA 추출을 위해 트라이졸 시약을 사용하여 각 샘플로부터 세포 일부를 사용하였다(제조업자의 제시 방법에 따라). 암모니아 분석은 저 질소 배지 내에서 24시간 후 상청액 내 암모니아 수준이 검출 한계(~ 100㎛) 이하로 떨어졌음을 나타내었다.
실시간 RT-PCR을 위해, 모든 RNA 수준을 각 시점에 프로토테카 모리포미스(UTEX 1435) 내에서 발현된 내부 대조군 RNA 수준으로 정상화하였다. cd189로 칭해지는 내부 대조군 RNA는 N-아세틸 오르니틴 아미노트랜스퍼라제를 암호화하는 ARG9 유전자의 생성물이다. 이 실험에서 실시간 RT-PCR을 위해 사용한 프라이머 세트는 하기와 같다:
특이적인 유전자 프라이머 서열 5'-3' 서열번호
녹나무 TE 전방 TACCCCGCCTGGGGCGACAC 서열번호 68
녹나무 TE 역방향 CTTGCTCAGGCGGCGGGTGC 서열번호 69
cd189 전방 CCGGATCTCGGCCAGGGCTA 서열번호 70
cd189 역방향 TCGATGTCGTGCACCGTCGC 서열번호 71
각 시점에 각각의 형질전환체로부터 지질 프로파일을 또한 만들었고 RT-PCR 결과와 비교하였다. 암모니아 수준, RT-PCR 결과 및 C12-C14 지방산 수준의 변화를 기준으로, 아미노산 수송체 01(Aat-01), 아미노산 수송체 04(Aat-04), 및 암모늄 수송체 02(Amt-02) 서열은 기능적 질소-조절가능 프로모터/5'UTR를 함유하는 것으로 결론을 내렸다.
RT-PCR 결과로부터, Aat-01은 대조군(클라미도모나스 레인하르드티 베타 튜불린 프로모터)보다 4배까지 더 큰 정상상태 녹나무 티오에스터라제 mRNA를 구동하는 능력을 증명하였다. 또한 mRNA 수준은 질소 제한 및 C12-C14 지방산 수준의 표시 증가와 관련되었다. 이들 결과는 Aat-01 프로모터와 관련된 5'UTR이 대조군 클라미도모나스 레인하르드티 프로모터보다 지질 생합성 하에서 단백질 합성 구종에 더 효율적일 수 있다는 것을 증명한다. Aat-01 프로모터와 같이, Aat-04 프로모터는 클라미도모나스 레인하르드티 대조군 프로모터보다 5배까지 더 큰 mRNA 축적을 구동할 수 있었다. 그러나, Aat-04 프로모터 구성체는 단지 C12-C14 지방산 수준에 영향을 미치는 보통의 능력을 생성하였다. 이들 데이터는 Aat-04 프로모터가 질소 고갈에 의해 조절가능하지만, UTR은 번역 인핸서로서 불량하게 작용할 수 있다는 것을 증명하였다. 최종적으로, Amt-02 프로모터는 Aat-01 프로모터와 유사하며, 즉, 대조군 프로모터보다 3배까지 더 큰 mRNA 축적을 구동할 수 있었다. mRNA 수준은 질소 제한 및 C12-C14 지방산 수준의 표시된 증가와 관련되었다. 모두 합쳐서, 모두 3가지의 이들 프로모터는 질소-조절되는 것임을 증명하였다.
B.
암모늄
수송체
3(
amt03
) 프로모터의 추가적인 특징 및 다양한
티오에스터라제의
발현
.
상기 기재한 바와 같이, 암모늄 수송체 02 및 03(amt02 및 amt03)으로 칭해지는 부분적 cDNA를 확인하였다. 이들 2개의 부분적 cDNA와 함께, 수송체 01(amt01)로 칭해지는 제3의 부분적 cDNA를 확인하였다. 부분적 cDNA 및 추정적 번역 아미노산 서열의 정렬을 비교하였다. 결과는 amt01이 3개의 서열과 더 멀리 관련된 한편, amt02 및 amt03은 단지 하나의 아미노산이 다르다는 것을 나타낸다.
프로모터/5'UTR은 상기 기재한 바와 같이 Roche 454 게놈 DNA 조립체 및 Illumina 전사체 조립체에 대한 부분적 cDNA 서열을 블라스팅함으로써 처음에 인실리코로 만들었다. amt01, amt02, 및 amt03을 암호화하는 cDNA와 동일성을 나타내는 전사 코팅을 확인하였지만, 전사 코팅 서열은 3개 모두에 의해 공유되는 콘티그 함유 서열로서 3개의 mRNA 사이에 구별될 수 없었다. Roche 454 게놈 DNA 조립체는 amt02 및 amt03 cDNA 서열에 타격을 주며, N-말단 단백질 서열을 함유하였다. PCR은 5'옆에 있는 영역의 클로닝을 수행하였다. amt02 및 amt03 프로모터/UTR을 입증하기 위하여 사용한 PCR 프라이머는 하기와 같다:
Amt03 전방: 5'-GGAGGAATTCGGCCGACAGGACGCGCGTCA-3'(서열번호 85)
Amt03 역방향:5'-GGAGACTAGTGGCTGCGACCGGCCTGTG-3'(서열번호 86)
Amt02 전방: 5'-GGAGGAATTCTCACCAGCGGACAAAGCACCG-3'(서열번호 87)
Amt02 역방향: 5'-GGAGACTAGTGGCTGCGACCGGCCTCTGG-3'(서열번호 88)
두 경우에, 5' 및 3'프라이머는 이들 프로모터/5'UTR 영역의 기능성을 입증하기 위하여 발현 벡터 내에 참여된 클로닝을 위한 유용한 제한 부위를 함유하였다.
이 조합된 인실리코 및 PCR-기반 방법을 통해 클로닝한 DNA와 amt02(서열번호 61) 및 amt03(서열번호 60)를 암호화하는 본래의 cDNA 사이의 쌍 정렬(Pair wise alignment)을 수행하였다. 이들 정렬 결과는 본래의 cDNA와 클로닝된 게놈 서열 사이의 상당한 차이를 보여주었으며, 이는 암모늄 수송체가 다양한 유전자 패밀리를 표시한다는 것을 나타낸다. 추가적으로, amt03에 대한 조합 방법을 기반으로 한 프로모터/5'UTR 클론은 본래의 amt03 서열과 상이한 반면, amt02 서열은 동일하였다. amt03 프로모터/UTR 서열(서열번호 89)을 특징화하는 추가 실험을 수행하였고 이하에 기재한다
상기 확인한 amt03 프로모터/UTR 서열(서열번호 89)을 이런 추정 프로모터/UTR 서열을 클로닝하여 4개의 상이한 티오에스터라제 발현을 구동함으로써 시험하였다. 발현 카세트는 게놈의 6S 좌위에 상류 및 하류의 상동성 재조합 서열을 함유하였다(각각 서열번호 82 및 84). 카세트는 또한 수크로스 함유 배지 상에서 포지티브 클론에 대한 선택을 가능하게 하는 사카로마이세스 세레비시애 SUC2 수크로스 인버타제 cDNA를 함유한다. 수크로스 인버타제 발현은 클라미도모나스 레인하르드티 베타 튜불린 프로모터에 의해 구동되었고, 또한 클로렐라 불가리스 나이트레이트 환원효소 3'UTR을 함유하였다. 그 다음에 amt03 프로모터/UTR 서열은 수크로스 인버타제 카세트의 하류 다음에 4개의 티오에스터라제 유전자: (1) 녹나무의 C14 티오에스터라제; (2) 캘리포니아 월계수의 C12 티오에스터라제; (3) 미국 느릅나무의 C10-C16 티오에스터라제; 또는 (4) 쿠페아 후커리아나의 C10 티오에스터라제 중 하나의 뼈대가 완성된 티오에스터라제 cDNA 서열을 클로닝하였고, 클로렐라 불가리스 나이트레이트 환원효소 3'UTR을 함유하였다. C14 녹나무 티오에스터라제, C12 캘리포니아 월계수 티오에스터라제, 및 C10-C16 미국 느릅나무 모두는 클로렐라 프로토테코이데스 스테아릴 ACP 불포화효소로부터의 수송 펩타이드를 함유하였다. C10 쿠페아 후커리아나 티오에스터라제는 프로토테카 모리포미스 델타 12 지방산 불포화효소(FAD)의 수송 펩타이드를 함유하였다. 모든 경우에, 서열은 프로토테카 모리포미스에서 발현에 대해 코돈 최적화되었다. 앞서 언급한 티오에스터라제 구성체에 대한 서열을 하기 서열목록에 기재한다:
amt03 프로모터/UTR::녹나무 티오에스터라제 구성체 서열번호 90
녹나무 티오에스터라제 구성체 서열번호 91
캘리포니아 월계수 티오에스터라제 구성체 서열번호 92
미국 느릅나무 티오에스터라제 구성체 서열번호 93
쿠페아 후커리아나 티오에스터라제 구성체 서열번호 94
실시예 2에서 상기 기재한 바이오리스틱 형질전환 방법을 통해 유전자이식 계통을 야생형 프로토테카 모리포미스 세포로 만들었고, 수크로스 함유 플레이트/배지 상에서 선택을 수행하였다. 그 다음에 지방산 프로파일이 변경되는 정도에 대해 포지티브 계통을 스크리닝하였다. 그 다음에 각각 4개의 상기 기재한 구성체에 의한 형질전환으로부터 초래된 것인 4개의 계통에 추가적인 분석을 실시하였다. 계통 76은 녹나무 C14 티오에스터라제를 발현하였고, 계통 37은 캘리포니아 월계수 C12 티오에스터라제를 발현하였으며, 계통 60은 미국 느릅나무 C10-C16 티오에스터라제를 발현하였고, 계통 56은 쿠페아 후커리아나 C10 티오에스터라제를 발현하였다. 각 계통을 유일한 탄소 공급원으로서 수크로스를 함유하는 배지 내에서 48시간 동안 성장시켰고, 지방산 메틸 에스터로 직접적인 에스터결합전이 및 후속하는 GC-FID(상기 기재)에 의한 분석을 통한 지방산 프로파일의 결정을 위해 및 전체 RNA의 분리를 위해 세포의 샘플을 14, 24, 36 및 48 시간(종자 배양물)에 제거하였다. 48시간의 마지막에, pH 5.0(완충된 시트레이트, 0.05M 최종 농도) 또는 pH 7.0(완충된 HEPES, 0.1M 최종 농도)에서 유지한 질소 수준이 없거나 낮은 배양물을 접종하기 위하여 이들 세포를 사용하였다. 배양물 샘플을 지방산 프로파일링 및 전체 RNA의 분리를 위해 12, 24, 72 및 108 시간(지질 생성)에 제거하였다. 이들 배양물의 암모니아 분석은 암모니아 수준이 저 질소 배지 내에서 24시간 후 검출 한계(약 100㎛) 미만으로 떨어진 것을 나타내었다.
티오에스터라제 mRNA 수준 상의 실시간 RT-PCR을 상기 수집한 각각의 시점으로부터의 전체 RNA에서 수행하였고, 모든 mRNA 수준을 내부 대조군 RNA(cd189)의 수준으로 정상화하였다. 실시간 PCR에서 사용한 프라이머를 이하의 표 19에 나타낸다:
프라이머는 실시간 PCR을 설정한다 | ||
특이적 유전자 | 프라이머 서열 5'-3' | 서열번호 |
녹나무 TE 전방 | TACCCCGCCTGGGGCGACAC | 서열번호 68 |
녹나무 TE 역방향 | CTTGCTCAGGCGGCGGGTGC | 서열번호 69 |
캘리포니아 월계수 TE 전방 | CTGGGCGACGGCTTCGGCAC | 서열번호 95 |
캘리포니아 월계수 TE 역방향 | AAGTCGCGGCGCATGCCGTT | 서열번호 96 |
미국 느릅나무 TE 전방 | CCCAGCTGCTCACCTGCACC | 서열번호 97 |
미국 느릅나무 TE 역방향 | CACCCAAGGCCAACGGCAGCGCCGTG | 서열번호 98 |
쿠페아 후커리아나 TE 전방 | TACCCCGCCTGGGGCGACAC | 서열번호 99 |
쿠페아 후커리아나 TE 역방향 | AGCTTGGACAGGCGGCGGGT | 서열번호 100 |
cd189 역방향 | TCGATGTCGTGCACCGTCGC | 서열번호 71 |
cd189 전방 | CCGGATCTCGGCCAGGGCTA | 서열번호 70 |
종자 배양물 층에서 각 시점에 지방산 프로파일로부터의 결과는 티오에스터라제로부터의 영향이 매우 적다는 것을 나타내었다. 지질 생성층의 시작으로, 지방산 프로파일은 상당히 영향을 받았으며, 배양물에 대해 훨씬 더 극적인 증가는 pH 5.0에서 배양물과 비교하여 pH 7.0에서 유지되었다. pH 7.0과 5.0 사이의 차이의 중대성이 시험한 각 티오에스터라제와 다른 지방산 축적을 표적화하는 반면, 전반적인 효과는 동일하였다: pH 5.0에서 성장한 세포는 상당히 더 낮은 축적된 표적 지방산을 나타내었지만, 대조군 야생형 세포와 비교할 때 더 높았다.
이들 동일한 샘플로부터 분리된 RNA 분석은 지방산 프로파일 데이터와 매우 상관관계가 있을 것이며, 즉 각각의 티오에스터라제의 정상상태 mRNA 수준 상에서 배양물 pH의 분명한 영향이 있었다. 지방산 축적 데이터와 mRNA 데이터는 함께, amt03 프로모터/UTR에 의해 구동되는 티오에스터라제 유전자 발현의 pH 조절을 전사 수준, mRNA 안정성에서 또는 둘 다에서 분명히 매개하였다. 추가적으로, 캘리포니아 월계수 mRNA의 정상상태 수준은 쿠페아 후커리아나 mRNA의 정상상태 수준과 비교하여 4 로그 더 낮다는 것을 관찰하였다. 이 관찰은 개개의 mRNA 서열이 발연을 제어하는 역할을 할 수 있다는 가설과 일치한다. 이들 데이터는 수송체의 amt03 패밀리에 의한 프로토테카 모리포미스의 암모늄 흡수가 pH에 직접적으로 결합된다는 것을 암시한다.
미국 느릅나무 C10-C16 티오에스터라제의 발현을 구동하는 구성체 amt03 프로모터/UTR에 의한 프로토테카 모리포미스 세포의 형질전환으로부터 만들어진 12개의 계통상에서 추가적인 지방산 프로파일 분석을 수행하였다. 상기 기재한 계통 60은 다음의 분석의 부분이다. 이하의 표 20은 야생형 대조군과 함께 분석한 12개의 계통 중 3개의 지질 프로파일을 나타낸다.
amt03 프로모터/UTR에 의해 구동되는 미국 느릅나무 TE를 함유하는 형질전환체의 지방산 프로파일 |
|||||||||
면적% | C8:0 | C10:0 | C12:0 | C14:0 | C16:0 | C18:0 | C18:1 | C18:2 | 전체 포화도 |
야생형 | 0.00 | 0.01 | 0.04 | 1.27 | 27.20 | 3.85 | 58.70 | 7.18 | 32.36 |
계통 40 | 2.38 | 20.61 | 3.41 | 28.41 | 29.92 | 1.91 | 8.57 | 3.74 | 86.64 |
계통 44 | 1.50 | 20.16 | 4.44 | 31.88 | 26.66 | 1.88 | 6.95 | 5.42 | 86.50 |
계통 60 | 0.98 | 14.56 | 3.15 | 27.49 | 31.76 | 2.14 | 12.23 | 6.36 | 80.06 |
상기 표에서 나타내는 바와 같이, 전체 포화도 수준은 야생형과 비교하여 계통 40의 경우에 야생형의 2.6배 이상으로 극적으로 상승되었다(12 계통으로부터 전체 포화도를 약 63% 내지 86% 범위로 분석하였다). 추가적으로, 이 수준에서 발현될 때, 미국 느릅나무 티오에스터라제는 불포화도 수준, 특히 C18:1 및 C18:2(계통 40 및 44)를 극적으로 감소시켰으며, 계통 44에서, C18:1 수준은 야생형과 비교하여 8배 이상으로 감소되었다. 또한, 미국 느릅나무 티오에스터라제(amt03 프로모터에 의해 구동됨)는 중간쇄 지방산의 수준을 크게 증가시켰다. 계통 44는 야생형 균주에서 보이는 수준보다 더 큰 56% 초과, 대략 42배 더 큰 C10:0-C14:0 수준 및 및 57% 초과의 C8:0-C14:0 수준을 나타낸다. 미국 느릅나무 티오에스터라제의 발현을 구동하는 Amt03 프로모터의 구성체로 형질전환된 추가적인 균주는 0.23% C8:0; 9.64% C10:0; 2.62% C12:0; 31.52% C14:0; 37.63% C16:0; 5.34% C18:0; 7.05% C18:1; 및 5.03% C18:2의 대표적인 지질 프로파일을 가지며, 전체 포화도%는 86.98%이다.
추가적인 지질 프로파일을 쿠페아 후커리아나 C10 티오에스터라제(서열번호 94)의 발현을 구동하는 구성체 amt03 프로모터/UTR(서열번호 89)에 의한 프로토테카 모리포미스 세포의 형질전환으로부터 만들었다. 이 구성체를 발현하는 포지티브 클론을 선택하였고 pH 7.0 조건에서 성장시켰다. 포지티브 클론으로부터의 대표적인 지질 프로파일은 9.87% C8:0; 23.97% C10:0; 0.46% C12:0; 1.24% C14:0; 10.24% C16:0; 2.45% C18:0; 42.81% C18:1; 및 7.32% C18:2이다. 이 클론은 33.84%의 C8-C10을 가진다.
모두 합쳐서, 데이트는 amt03 프로모터/UTR, 및 그것과 유사한 다른 프로모터가 잠재적으로 독성인 화합물의 발현에 특히 유용하고 유전자 발현의 엄격한 시행이 필요한 완전히 조절된 프로모터로서 사용될 수 있다는 것을 시사한다. 넓은 범위의(적어도 pH 5.0 내지 7.0) pH 섭생 하에 성장하기 위한 프로토테카 모리포미스의 능력은 이 유기체를 amt03 프로모터/UTR과 같은 조절 요소와 조합하여 특히 유용하게 한다. 추가적으로, 상기 지질 프로파일 데이터는 유전자 발현을 구동하기 위한 amt03 프로모터/UTR의 인상적인 능력을 증명한다.
실시예 11: 미세조류 프로토테카 모리포미스 내 포화된 지방산의 수준 변경
cDNA에 기반한 생물정보학 기반 접근을 사용하는 게놈 스크리닝의 부분으로서, 프로토테카 모리포미스로(UTEX 1435부터 유래된 게놈 DNA의 Illumia 전사체 및 Roche 454 시퀀싱, 지방산 불포화에 수반된 유전자의 2개의 특정 군을 확인하였다: 스테아릴 ACP 불포화효소(SAD) 및 델타 12 지방산 불포화효소(Δ12 FAD). 스테아릴 ACP 불포화효소 효소는 지질 합성 경로의 부분이며, 그것들은 지방 아실 쇄에 이중 결합을 도입하는, 예를 들어 C18:0 지방산으로부터 C18:1 지방산의 합성하는 작용을 한다. 델타 12 지방산 불포화효소는 또한 지질 합성 경로의 부분이며, 그것들은 이미 불포화된 지방산 내로 이중 결합을 도입하는, 예를 들어 C18:1 지방산으로부터 C18:2 지방산의 합성하는 작용을 한다. 생물정보학적 노력 동안 확인한 2 부류의 지방산 불포화효소 유전자에 기반한 프로브를 사용하는 사우던 블롯 분석은 각 부류의 불포화효소 유전자가 다수의 패밀리 구성원을 포함할 가능성이 있다는 것을 나타내었다. 추가적으로 스테아릴 ACP 불포화효소를 암호화하는 유전자는 2개의 별개의 패밀리로 나뉜다. 이들 결과를 기반으로, 불포화효소의 각 패밀리 내에 더 고도로 보존된 암호화 영역을 표적화함으로써 다수의 유전자 패밀리 구성원을 파괴하도록 3개의 유전자 파쇄 구성체를 설계하였다.
3개의 상동성 재조합 표적 구성체를 다음을 사용하여 설계하였다: (1) 델타 12 지방산 불포화효소(d12FAD) 패밀리 구성원의 암호화 서열의 고도로 보존된 일부 및 (2) 각각의 2개의 별개의 SAD 패밀리를 표적화하는 2개의 구성체(각각은 각 패밀리로부터 암호화 서열 영역을 보존하였다). 이 전략은 고전적 유전자 대체 전략보다 이런 고도로 보존된 암호화 영역(다수의 패밀리 구성원을 표적화)에 선택가능한 마커 유전자(수크로스를 가수분해하는 능력을 전달하는 사카로마이세스 세레비시애로부터 유래된 suc2 수크로스 인버타제 카세트)를 포매하되, 해당 상동성 재조합은 표적화된 유전자의 옆에 있는 영역을 표적화하였다.
상기 기재한 방법을 사용하여 모든 구성체를 바이오리스틱 형질전환에 의해 세포 내에 도입하였고, 구성체를 선형화한 후 세포 내로 쏘았다. 형질전환체를 플레이트/배지를 함유하는 수크로스 상에서 선택하였고, 지질 프로파일 상의 변화를 상기-기재한 방법을 사용하여 분석하였다. 각각 3개의 표적화 구성체로부터의 상대적 서열을 이하에 열거한다.
설명 서열번호
표적화 구성체로부터의 d12FAD 암호화영역의 5'서열 서열번호 72
표적화 구성체로부터의 d12FAD 암호화영역의 3'서열 서열번호 73
구성체 cDNA 서열을 표적화하는 d12FAD 서열번호 74
SAD2A의 암호화 영역의 5' 서열 서열번호 75
SAD2A의 암호화 영역의 3'서열 서열번호 76
구성체 cDNA 서열을 표적화하는 SAD2A 서열번호 77
SAD2B의 암호화 영역의 5'서열 서열번호 78
SAD2B의 암호화 영역의 3'서열 서열번호 79
구성체 cDNA 서열을 표적화하는 SAD2B 서열번호 80
각각의 구성체에 의한 형질전환의 대표적인 포지티브 클론을 선택하였고, 이들 클론에 대한 지질 프로파일을 결정하였으며(면적%로 표현), 이하의 표 21에서 요약한다.
불포화효소 녹아웃을 위한 지질 프로파일 | ||||
지방산 | d12FAD KO | SAD2A KO | SAD2B KO | wt UTEX 1435 |
C8:0 | 0 | 0 | 0 | 0 |
C10:0 | 0.01 | 0.01 | 0.01 | 0.01 |
C12:0 | 0.03 | 0.03 | 0.03 | 0.03 |
C14:0 | 1.08 | 0.985 | 0.795 | 1.46 |
C16:0 | 24.42 | 25.335 | 23.66 | 29.87 |
C18:0 | 6.85 | 12.89 | 19.555 | 3.345 |
C18:1 | 58.35 | 47.865 | 43.115 | 54.09 |
C18:2 | 7.33 | 10.27 | 9.83 | 9.1 |
C18:3 알파 | 0.83 | 0.86 | 1 | 0.89 |
C20:0 | 0.48 | 0.86 | 1.175 | 0.325 |
각각의 구성체는 원하는 부류의 지방산에서 측정가능한 영향을 가지며, 모두 3가지 경우에 C18:0 수준은, 특히 2번의 SAD 녹아웃에 의해 현저하게 증가하였다. 양한 클론과 SAD 녹아웃의 추가적인 비교는 SAD2B 녹아웃 계통이 SAD2A 계통과 함께 관찰한 C18:1 지방산 수준보다 C18:1 지방산에서 상당히 더 큰 감소를 가진다는 것을 나타낸다.
추가적인 Δ12 지방산 불포화효소(FAD) 녹아웃을 상기 기재한 방법을 사용하여 프로토테카 모리포미스 배경에서 만들었다. Δ12FAD의 잠재적 상동성을 확인하기 위하여, 다음의 프라이머를 사용하여 추정 FAD를 암호화하는 게놈 영역을 증폭하였다:
프라이머 1 5'-TCACTTCATGCCGGCGGTCC-3' 서열번호 101
프라이머 2 5'- GCGCTCCTGCTTGGCTCGAA-3' 서열번호 102
상기 프라이머를 사용하는 프로토테카 모리포미스 게놈 DNA의 게놈 증폭으로부터 초래된 서열은 매우 유사하였지만, Δ12FAD의 다양한 유전자 또는 대립유전자가 프로토테카에 존재한다는 것을 나타내었다.
이 결과를 기준으로, 2개의 유전자 파쇄 구성체를 하나 이상의 Δ12FAD 유전자를 불활성화하는 것을 추구하도록 설계하였다. 전략은 수크로스 인버타제(사카로마이세스 세레비시애 유래의 (suc2) 카세트를 포매하는 것이며, 따라서 이는 고전적 유전자 대체 전략의 사용보다 고도로 보존된 암호화 영역 내에 선택가능한 마커로서 수크로스를 가수분해하는 능력을 부여한다. pSZ1124로 칭해지는 제1 구성체는 사카로마이세스 세레비시애 suc2 유전자와 클로렐라 불가리스 나이트레이트 3'UTR(사카로마이세스 세레비시애 suc2 카세트)의 발현을 구동하는 클라미도모나스 레인하르드티 β-튜불린 프로모터 옆에 있는 5' 및 3'게놈 표적화 서열을 함유하였다. pSZ1125로 칭해지는 제2 구성체는 사카로마이세스 세레비시애 suc2 유전자 및 클로렐라 불가리스 나이트레이트 환원효소 3'UTR의 발현을 구동하는 클라미도모나스 레인하르드티 β-튜불린 프로모터 옆에 있는 5' 및 3'게놈 표적화 서열을 함유하였다. 구성체의 상대적 서열은 서열 목록에서 열거한다:
pSZ1124 (FAD2B) 5' 게놈 표적화 서열 서열번호 103
pSZ1124 (FAD2B) 3' 게놈 표적화 서열 서열번호 104
사카로마이세스 세레비시애 suc2 카세트 서열번호 105
pSZ1125 (FAD2C) 5' 게놈 표적화 서열 서열번호 106
pSZ1125 (FAD2C) 3' 게놈 표적화 서열 서열번호 107
pSZ1124 및 pSZ1125를 각각 프로토테카 모리포미스 배경에 도입하였고, 수크로스를 가수분해하는 능력을 기반으로 포지티브 클론을 선택하였다. 표 22는 pSZ1124 및 pSZ1125 표적화 벡터를 이용한 2개의 유전자이식 계통에서 얻은 지질 프로파일을 요약한다(면적%, 상기 기재한 방법을 사용하여 만든다).
Δ12 FAD 녹아웃의 지질 프로파일 | |||||||||
C10:0 | C12:0 | C14:0 | C16:0 | C16:1 | C18:0 | C18:1 | C18:2 | C18:3α | |
모체 | 0.01 | 0.03 | 1.15 | 26.13 | 1.32 | 4.39 | 57.20 | 8.13 | 0.61 |
FAD2B | 0.02 | 0.03 | 0.80 | 12.84 | 1.92 | 0.86 | 74.74 | 7.08 | 0.33 |
FAD2C | 0.02 | 0.04 | 1.42 | 25.85 | 1.65 | 2.44 | 66.11 | 1.39 | 0.22 |
FAD2B(pSZ1124) 구성체를 함유하는 유전자이식은 지질 프로파일에서 매우 흥미로우며 예상치 못한 결과를 제공하였고, 즉 감소할 것으로 예상되는 C18:2 수준은 단지 하나의 면적%에 대해서만 감소되었다. 그러나, C18:1 지방산 수준은 상당히 감소된 C16:0 수준을 훼손시키면서 거의 배타적으로 상당히 증가하였다. FAD2C(pSZ1125) 구성체를 함유하는 유전자이식은 또한 지질 프로파일의 변화를 제공하였다: C18:2 수준은 C18:1 수준의 대응하는 증가와 함께 상당히 감소되었다.
우지
모방체
상기 기재한 바와 같은 상기 SAD2B 녹아웃으로부터 만든 하나의 포지티브 클론을 C14-선호 지방 아실-ACP 티오에스터라제 유전자의 추가 도입을 위해 배경으로 사용하도록 선택하였다. 녹나무 C14-선호 티오에스터라제를 도입하는 구성체는 6S rRNA 게놈 영역에 대한 표적화 서열(상동성 재조합을 통해 DNA를 형질전환하는 표적화된 도입을 허용)을 함유하였고, 발현 구성체는 클로렐라 불가리스 나이트레이트 환원효소 3'UTR로 neoR 유전자의 발현을 구동하는 클라미도모나스 레인하르드티 β-튜불린 프로모터, 다음에 제2 클로렐라 불가리스 나이트레이트 환원효소 3'UTR로 클로렐라 프로토테코이데스 스테아릴 ACP 불포화효소 수송 펩타이드에 의한 코돈-최적화된 녹나무 티오에스터라제의 발현을 구동하는 제2 클라미도모나스 레인하르드티 β-튜불린 프로모터를 함유하였다. 5' 6S rRNA 게놈 공여체 서열을 서열번호 82에 열거하며; 3' 6S rRNA 게놈 공여체 서열을 서열번호 84에 열거하고; 녹나무 티오에스터라제에 대한 적절한 발현 구성체를 서열번호 83에 열거한다.
상기 기재한 바와 같은 바이오리스틱 방법을 사용하여 형질전환을 수행하였고, 세포를 2% 수크로스를 함유하는 플레이트 상에서 24 시간 동안 회수하였다. 이 시간 후, 세포를 재현탁하였고, 선택을 위해 2% 수크로스 및 50㎍/㎖ G418를 함유하는 플레이트 상에 재플레이팅하였다. 만든 포지티브 클론 중 9개의 클론을 지질 생성 및 지질 프로파일을 위해 선택하였다. 9개의 유전자이식 클론(SAD2B KO 및 발현 녹나무 C14-선호 티오에스터라제를 지님)을 상기 기재한 바와 같이 배양하였고, 지질 프로파일에 대해 분석하였다. 결과를 이하의 표 23에 요약한다. 탤로에 대한 지질 프로파일을 또한 이하의 표 23에 포함한다(National Research Council 1976: Fat Content and Composition of Animal Product).
티오에스터라제 형질전환된 클론의 지질 프로파일 | ||||||||||
C10:0 | C12:0 | C14:0 | C16:0 | C16:1 | C18:0 | C18:1 | C18:2 | C18:3 | C20 | |
SAD2BKO 녹나무 TE 클론 1 |
0.01 | 0.33 | 6.13 | 24.24 | 0.19 | 11.08 | 42.03 | 13.45 | 0.98 | 0.73 |
SAD2BKO 녹나무 TE 클론 2 |
0.01 | 0.16 | 3.42 | 23.80 | 0.40 | 9.40 | 50.62 | 10.2 | 0.62 | 0.70 |
SAD2BKO 녹나무 TE 클론 3 |
0.01 | 0.20 | 4.21 | 25.69 | 0.40 | 7.79 | 50.51 | 9.37 | 0.66 | 0.63 |
SAD2BKO 녹나무 TE 클론 4 |
0.01 | 0.21 | 4.29 | 23.57 | 0.31 | 9.44 | 50.07 | 10.07 | 0.70 | 0.70 |
SAD2BKO 녹나무 TE 클론 5 |
0.01 | 0.18 | 3.87 | 24.42 | 0.32 | 9.24 | 49.75 | 10.17 | 0.71 | 0.71 |
SAD2BKO 녹나무 TE 클론 6 |
0.01 | 0.28 | 5.34 | 23.78 | 0.33 | 9.12 | 49.12 | 10.00 | 0.68 | 0.70 |
SAD2BKO 녹나무 TE 클론 7 |
0.01 | 0.15 | 3.09 | 23.07 | 0.32 | 10.08 | 51.21 | 10.00 | 0.66 | 0.74 |
SAD2BKO 녹나무 TE 클론 8 |
0.01 | 0.29 | 5.33 | 24.62 | 0.37 | 7.02 | 49.67 | 10.74 | 0.69 | 0.70 |
SAD2BKO 녹나무 TE 클론 9 |
0.01 | 0.12 | 2.74 | 25.13 | 0.30 | 10.17 | 50.18 | 9.42 | 0.71 | 0.71 |
wt UTEX 1435 | 0.01 | 0.02 | 0.96 | 23.06 | 0.79 | 3.14 | 61.82 | 9.06 | 0.46 | 0.27 |
SAD2BKO | 0.01 | 0.03 | 0.80 | 23.66 | 0.13 | 19.56 | 43.12 | 9.83 | 1.00 | 1.18 |
탤로 | 0.00 | 0.00 | 4.00 | 26.00 | 3.00 | 14.00 | 41.00 | 3.00 | 1.00 | 0.00 |
표 23에서 나타내는 바와 같이, 유전자이식 계통의 지질 프로파일은 탤로의 질 프로파일과 상당히 유사하다. 종합적으로, 해당 데이터는 이 경우에, 즉 C14-선호 티오에스터라제(녹나무 유래)에 의한 SAD2B 녹아웃에서 탤로의 지질 프로파일과 유사한 오일을 생성하는 유전자이식 조류 균주를 만드는 특정 유전자이식 배경을 조합하는 효용을 증명한다.
표적화된
녹-아웃 접근에 의한 β-
케토아실
신타제
II(
KASII
)의 발현을 하향조절하기 위하여 사용된 구성체
표적화된 녹-아웃 접근에 의한 벡터 하향조절 KASII 유전자 발현을 UTEX 1435, S1331의 고전적으로 돌연변이유발된 유도체 내에 도입하였다. 사카로마이세스 세레비시애 인버타지 유전자를 선택가능한 마커로서 이용하여, 수크로스상에서 성장 능력을 부여하였다. 클라미도모나스 레인하르드티 B-튜불린 프로모터의 제어 하에 인버타제 발현 카세트를 315bp의 긴 KASII 게놈 영역의 중간에 삽입하여 표적화된 통합을 허용하였다(pSZ1503).
pSZ1503 내 적절한 제한 부위를 소문자, 볼드체 및 밑줄로 나타내었고, 이는 각각 5'-3' BspQ 1, Kpn I, AscI, Xho I, Sac I, BspQ I이었다. BspQI 부위는 DNA를 형질전환하는 5' 및 3'말단의 범위를 정한다. 볼드체, 소문자 서열은 상동성 재조합을 통해 KASII 좌위에서 표적화된 통합을 허용하는 S1331으로부터의 게놈 DNA를 나타낸다. 5'에서 3'방향으로 진행하면, 효모 수크로스 인버타제 유전자의 발현을 구동하는 클라미도모나스 레인하르드티 B-튜불린 프로모터(수크로스를 대사하는 S1331의 능력을 부여)는 박스로 표시된다. 인버타제에 대한 개시자 ATG 및 종결자 TGA를 대문자, 볼드 이탤릭체로 표시하는 한편, 암호화 영역을 소문자 이탤릭체로 표시하였다. 클로렐라 불가리스 나이트레이트 환원효소 3' UTR을 소문자 밑줄로 표시한다.
pSZ1503_[KASII_btub-y.inv-nr_KASII]에 함유된 DNA를 형질전환하는 뉴클레오타이드 서열:
KAS II 대립유전자 1 및 대립유전자 2의 cDNA를 각각 서열번호 279 및 280에서 확인하였다. 대립유전자 1 및 2의 아미노산 서열을 서열번호 281 및 282에서 각각 확인하였다.
지질 조성물에서 KASII 불활성화의 영향을 결정하기 위하여, pSZ1503 벡터 DNA를 S1331로 형질전환하여 표적화된 KASII 녹-아웃 표현형을 만들어냈다. 처음에 하나의 클론을 분리하였고, pH5.0에서 표준 지질 생성 조건 하에 성장시켰다. 가장 대표적인 클론 및 야생형 세포의 결과 프로파일을 이하의 표 31에 나타낸다.
실시예 12: 대안의 선택가능한 마커에 의한 프로토테카 유전자조작
A.
프로토테카 모리포미스 내 분비성 α-갈락토시다제의 발현
프로토테카 종 내 이종성 수크로스 인버타제 유전자의 발현 방법 및 효과는 본 명세서에 참조로 포함되는 국제특허출원 PCT/US2009/66142에서 앞서 기재되었다. 다른 이종성 다당류 분해 효소의 발현은 이 실시예에서 시험하였다. α-갈락토시다제를 암호화하는 다음의 외인성 유전자 외의 프로토테카 모리포미스 UTEX 1435에 의한 멜리비오스(α-D-gal-glu)를 성장시키는 능력을 시험하였다: 사카로마이세스 카를베젠시스(Saccharomyces carlbergensis) 유래의 MEL1 유전자(NCBI 등록번호 P04824에 대응하는 아미노산 서열(서열번호 108)), 아스퍼질러스 니거로부터 유래된 AglC 유전자(NCBI 접수번호 Q9UUZ4에 대응하는 아미노산 서열(서열번호 116)), 및 고등 식물로부터의 α-갈락토시다제(구아콩)(NCBI 접수번호 P14749에 대응하는 아미노산 서열(서열번호 120). 상기 접수 번호 및 대응하는 아미노산 서열을 본 명세서에 참조로 포함한다. 모든 경우에, 프로토테카 모리포미스에서 선호되는 코돈 사용빈도에 따라서 유전자를 최적화하였다. 발현 카세트의 적절한 일부를 서열목록 번호와 함께 이하에 열거한다. 모든 발현 카세트는 안정한 게놈 통합을 위한 5'및 3'Clp 상동성 재조합 표적화 서열, 클라미도모나스 레인하르티 TUB2 프로모터/5'UTR, 및 클로렐라 불가리스 나이트레이트 환원효소 3'UTR을 사용하였다.
프로토테카 모리포미스 세포를 상기 실시예 2에 기재한 바이오리스티기 형질전환 방법을 사용하여 사카로마이세스 카를베젠시스 MEL1, 아스퍼질러스 니거 AlgC, 또는 시아몹시스 테트라고노볼라 α-갈락토시다제 유전자를 함유하는 각각 3개의 발현 카세트로 형질전환하였다. 포지티브 클론을 유일한 탄소 공급원으로서 2% 멜리비오스를 함유하는 플레이트를 사용하여 스크리닝하였다. 콜로니는 시아몹시스 테트라고노볼라 발현 카세트 형질전환체에 대한 플레이트 상에 나타나지 않았다. 포지티브 클론을 사카로마이세스 카를베젠시스 MEL1 형질전환체 및 아스퍼질러스 니거 AlgC 형질전환체를 함유하는 플레이트로부터 취했다. 표적화하는 프라이머에 의해 PCR을 사용하여 형질전환 DNA의 통합을 클로렐라 불가리스 3'UTR 및 3' Clp 상동성 재조합 표적 서열의 일부를 확인하였다.
5' 프라이머 클로렐라 불가리스 3'UTR:하류 Clp 서열(서열번호 123)
ACTGCAATGCTGATGCACGGGA
3'프라이머 클로렐라 불가리스 3'UTR:하류 Clp 서열(서열번호 124)
TCCAGGTCCTTTTCGCACT
음성 대조군으로서, 미번역 프로토테카 모리포미스 세포로부터의 게놈 DNA를 또한 프라이머 세트를 증폭하였다. 생성물은 야생형 세포로부터의 게놈 DNA로부터 증폭되지 않았다.
각각의 사카로마이세스 카를베젠시스 MEL1 형질전환체 및 아스퍼질러스 니거 AlgC 형질전환체으로부터의 몇몇 포지티브 클론(PCR로 확인)을 액체 배지 내 유일한 탄소 공급원으로서 멜리비오스를 성장시키는 능력에 대해 시험하였다. 이 분비 클론을 유일한 탄소 공급원으로서 멜리비오스와 함께 상기 실시예 1에 기재한 조건 및 기본 배지 중에서 3일 동안 성장시켰다. α-갈락토시다제-암호화 유전자 중 하나를 함유하는 모든 클론이 이 시간 동안 강하게 성장하는 한편, 형질전환되지 않은 사카로마이세스 세레비시애 SUC2 수크로스를 발현시키는 야생형 균주와 프로토테카 모리포르미스는 둘 다 멜리비오스 배지 상에서 불량하게 성장한다. 이들 결과는 α-갈락토시다제 암호화 유전자가 형질전환을 위한 선택가능한 마커로서 사용될 수 있다는 것을 시사한다. 또한, 이들 데이터는 사카로마이세스 카를베젠시스 MEL1(서열번호 109) 또는 아스퍼질러스 니거 AlgC(서열번호 117)에 존재하는 본래의 신호 펩타이드가 프로토테카 모리포미스 세포 내 주변세포질에 단백질을 표적화하는데 유용하다는 것을 나타낸다.
B.
THIC 유전자는 프로토테카 내에서 티아민 영양요구성을 보완한다
프로토테카 모리포미스 세포 내 티아민 원영양성(prototrophy)을 외인성 THIC 유전자의 발현을 사용하여 시험하였다. 식물 및 조류 내 티아민 생합성은 전형적으로 플라스티드 내에서 수행되며, 따라서 그것의 생성에 수반되는 대부분의 핵 암호화된 단백질이 플라스티트로 효율적으로 표적화될 필요가 있을 것이다. 프로토테카 모리포미스의 DNA 시퀀싱 및 전사체 시퀀싱은 티아민 생합성 효소를 암호화하는 모든 유전자가 THIC의 발현과 함께 게놈 내에 존재하는 것을 나타내었다. 생화학 수준에서 티아민 영양요구성을 초래하는 손상을 나누기 위하여, 5개의 상이한 섭생 하에: (1) 2㎛ 티아민 하이드로클로라이드의 존재 하에; (2) 티아민 없이; (3) 티아민은 없지만, 2㎛ 하이드록시에틸 티아졸(hydroxyethyl thiazole, THZ)과 함께; (4) 티아민은 없지만, 2㎛ 2-메틸-4-아미노-5-(아미노메틸)피리미딘(2-methyl-4-amino-5-(aminomethyl)pyrimidine, PYR); 및 티아민은 없지만, 2㎛ THZ 및 2㎛ PYR과 함께 프로토테카 모리포미스 세포의 성장을 시험하였다. 5개의 상이한 조건 하에서 성장 실험으로부터의 결과는 프로토테카 모리포미스 세포는 드노보 합성을 할 수 있지만, PYR 전구체가 제공된다면 단지 티아민 파이로포스페이트(TPP)를 생성할 수 있는 것으로 나타났다. 이는 프로토테카 모리포미스의 티아민 영양요구성이 THIC 효소에 의해 전환을 촉매하는 아미노이미다졸 리보뉴클레오타이드로부터 하이드록시메틸피리미딘 포스페이트(hydroxymethylpyrimidine phosphate, HMP-P)를 합성할 수 없음에 기인한다는 것과 일치한다.
프로토테카 모리포미스 세포를 실시예 2에서 상기 지재한 바이오리스틱 형질전환 방법을 사용하여 형질전환하였으며, 이는 콕코믹사 C-169 THIC(JGI 단백질 ID 30481에 대응하는 아미노산 서열, 본 명세서에 참조로 포함됨) 및 선택적 마커로서 사카로마이세스 세레비시애 SUC2 수크로스 인버타제를 발현한다. 이 발현 구성체는 콕코믹사 C-169 THIC의 본래의 수송 펩타이드 서열, 게놈 DNA의 6S 영역에 대한 상류 및 하류의 상동성 재조합 표적 서열, 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR 영역(서열번호 104), 및 클로렐라 불가리스 나이트레이트 환원효소 3'UTR(서열번호 115)을 함유하였다. 사카로마이세스 세레비시애 SUC2 발현은 또한 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR 영역(서열번호 114)에 의해 구동되었고 클로렐라 불가리스 나이트레이트 환원효소 3'UTR(서열번호 115)을 함유하였다. 유전자는 프로토테카 모리포미스에서 바람직한 코톤 사용빈도에 따라서 최적화되었다. 적절한 발현 카세트 서열을 서열목록에서 열거하며, 이하에서 상술한다:
콕코믹사 C-169 THIC 아미노산 서열 서열번호 125
콕코믹사 C-169 THIC 아미노산 서열 본래의 수송 펩타이드 서열번호 126
콕코믹사 C-169 THIC 형질전환 카세트 서열번호 127
콕코믹사 C-169 THIC 서열(코돈 최적화) 서열번호 128
사카로마이세스 세레비시애 SUC2 서열(코돈 최적화) 서열번호 129
5'6S 상동성 재조합 표적 서열 서열번호 82
3'6S 상동성 재조합 표적 서열 서열번호 84
포지티브 클론의 선택을 티아민 없이 플레이트 상에서 수행하였고 유일한 탄소 공급원으로서 수크로스를 함유하였다. 콕코믹사 C-169 THIC 유전자 내에서 결합하는 5'프라이머 및 6S 좌위 내 형질전환 DNA의 하류를 어닐링하는 3' 프라이머에 의한 PCR을 사용하여 포지티브 클론을 확인하였다. 또한 사우던 블롯 분석을 사용하여 PCR 확인 포지티브 클론을 확인하였다.
야생형 프로토테카 모리포미스 세포의 티아민 영양요구성을 관찰하기 위하여, 내부 티아민을 보유하는 제1 고갈 세포가 필요하다. 티아민이 없는 배지 내에서 성장을 시험하기 위하여, 2㎛ 티아민을 함유하는 배지 내 고정상에 대해 세포를 우선 성장시킨 다음 해당 세포를 티아민이 없는 배지 내 750㎚에서 대략 0.05의 광학 밀도(OD750)로 희석하였다. 그 다음에 희석한 세포를 티아민이 없는 배지 내 고정상에 대해 한번 더 성장시켰다(약 2-3일). 이들 티아민-고갈 세포를 티아민이 없는 배지 내에서 성장 연구를 위한 배양물을 접종하기 위하여 사용하였다. 야생형 세포를 탄소 공급원으고서 글루코스와 함께 매지 내에서 성장시켰고(티아민과 함께 또는 티아민 없이), 본래의 수송 펩타이드 콕코믹사 C-169 THIC 구성체가 있는 포지티브 클론을 유일한 탄소 공급원으로서 수크로스와 함께 배지 내에서 성장시켰다. 750㎚에서 흡광도를 모니터링함으로써 성장을 측정하였다. 성장 실험의 결과는 무티아민 배지 내 야생형 세포와 비교하여 이식유전자를 발현시키는 균주의 무티아민 배지 내 실질적으로 더 큰 성장을 나타내었다. 그러나, 형질전환체는 티아민-함유 배지 내 야생형 세포의 성장속도 및 세포밀도를 달성하지 못하였다. 또한 무티아민 배지 내 형질전환체 클론의 성장량과 통합된 콕코믹사 효소의 복제물 수 사이에는 강한 상관관계가 있었다(즉, 이식유전자의 더 많은 복제물 수, 무티아민 배지 내 더 많은 세포 성장).
추가적인 형질전환체를 콕코믹사 THIC를 함유하는 발현 구성체, 아라비돕시스 탈리아나(애기장대) THIC 유전자, 및 시네코시스티스 속 PCC 6803 thiC 유전자를 사용하여 만들었다. 콕코믹사 및 아라비돕시스 탈리아나 THIC 유전자의 경우에, 본래의 수송 펩타이드 서열을 클로렐라 프로토테코이데스 스테아릴-ACP 불포화효소(SAD) 유전자로부터의 수송 펩타이드 서열로 대체하였다. 시네코시스티스 속은 시아노박테리아이며, thiC 단백질은 본래의 수송 펩타이드 서열을 함유하지 않는다. 시네코시스티스 속 thiC 구성체에서, 클로렐라 프로토테코이데스 SAD 유전자로부터의 수송 펩타이드 서열을 시테코시스티스 속 thiC의 N-말단에 융합하였다. 모든 경우에, 프로토테카 모리포미스의 발현을 위해 서열을 코돈 최적화하였다. 앞서 언급한 구성체 3가지 모두는 게놈의 6S에 대한 상류 및 하류의 상동성 재조합 표적 서열(서열번호 82 및 84), 클로렐라 프로토테코이데스 액틴 프로모터/5' UTR, 및 클로렐라 프로토테코이데스 EF1A 유전자 3'UTR을 함유하였다. 3가지 구성체 모두는 클라미도모나스 레인하르드티 TUB2 프로모터/5'UTR(서열번호 114)에 의해 구동되는 neoR 유전자를 함유하였고, 클로렐라 불가리스 3'UTR(서열번호 115)을 함유하였으며, G418에 의한 선택을 부여하였다. 아라비돕시스 탈리아나 THIC의 아미노산 서열은 NCBI 접수 번호 NP_180524에 대응하며 및 시네코시스티스 속 thiC 의 아미노산 서열은 NCBI 접수 번호 NP_442586에 대응하며, 둘 다 본 명세서에 참조로 포함된다. 적절한 발현 카세트 서열은 서열 목록에서 열거하며, 이하에 상세하게 설명한다:
G418을 함유하는 플레이트 상에서 포지티브 클론을 스크리닝 하였고, 각 형질전환으로부터 몇몇 클론을 PCR로 확인을 위해 선택하였다. 콕코믹사 C-169(클로렐라 프로토테코이데스 수송 펩타이드를 가짐), 아라비돕시스 탈리아나 및 시네코시스티스 속 PCC 6803 THIC 유전자를 각각 함유하는 형질전환 DNA 구성체의 게놈의 6S 좌위에 통합을 다음의 프라이머에 의한 PCR 분석을 사용하여 확인하였다:
5' THIC 콕코믹사 확인 프라이머 서열(서열번호 141)
ACGTCGCGACCCATGCTTCC
3' THIC 확인 프라이머 서열(서열번호 142)
GGGTGATCGCCTACAAGA
5' THIC 아라비돕시스 탈리아나 확인 프라이머 서열(서열번호 143)
GCGTCATCGCCTACAAGA
5' thiC 시네코시스티스 속. 확인 프라이머 서열(서열번호 144)
CGATGCTGTGCTACGTGA
G418을 함유하는 배지 내 각각의 상이한 구성체의 형질전환체로부터 선택 확인한 포지티브 클론을 사용하여 티아민 고갈 세포 상의 성장 실험(상기 기재)을 수행하였다. 모든 형질전환체를 (다양한 정도의 견고성으로) 무티아민 배지 내에서 성장시킬 수 있었다. 무티아민 배지 내 형질전환체의 성장과 티아민 함유 배지 상에서 야생형 세포의 성장의 비교는 무티아민 배지 내 성장을 지원하는 능력에 대한 다음의 순위를 나타내었다: (1) 아라비돕시스 탈리아나 형질전환체; (2) 콕코믹사 C-169(클로렐라 프로토테코이데스 수송 펩타이드를 가짐) 형질전환체; 및 (3) 시네코시스티스 속 형질전환체. 이들 결과는 아라비돕시스 탈리아나 THIC의 단일 복제물이 프로토테카 모리포미스 세포, 다양한 콕코믹사 C-169 복제물(본래의 수송 펩타이드 서열 또는 클로렐라 프로토테코이데스로부터의 수송 펩타이드 서열 중 하나를 가짐) 및 시네코시스티스 속에서 티아민 영양요구성을 보완할 수 있다는 것을 시사한다. 티아민의 부재에서 THIC는 빠른 성장을 가능하게 할 것을 필요로 한다. 상이한 공급원으로부터 상이한 THIC 결과의 변동성이 주어지면, 프로토테카 종에 존재하는 손상을 완전히 보완하기 위한 임의의 특정 THIC 유전자 능력은 예측가능하지 않다.
3개의 THIC 아미노산 서열의 정렬을 수행하였다. 콕코믹사 및 아라비돕시스 탈리아나의 THIC와 비교하여 시네코시스티스 속의 thiC 사이에 상당한 서열 보존이 존재하지만(아미노산 수준에서 41% 동일성), 시아노박테리아 단백질은 조류 및 식물 단백질에 잘 보존된 N-말단에서 도메인을 상실한다. 상실 도메인(및 추정적으로 구조적 차이를 초래)에도 불구하고, 시테코시스티스 속 thiC를 발현시키는 구성체는 프로토테카 모리포미스 세포 내 티아민 원영양성을 적어도 부분적으로 회복할 수 있었다.
실시예 13: 연료 생산
A.
익스펠러
프레스 및 프레스 보조기를 사용한 미세조류로부터 오일의 추출
DCW를 기준으로 38%의 오일을 함유하는 미세조류 바이오매스는 드럼 건조기로 건조시켜 5 내지 5.5%의 수분함량을 초래하였다. 상기 바이오매스는 프렌치 L250 프레스에 공급하였다. 30.4 kg (67 lbs.)의 바이오매스를 프레스를 통해 공급하고 오일을 회수하였다. 프레스 보조기로서 다양한 %의 스위치그래스와 조합된 동일한 건조된 미세조류 바이오매스를 프레스를 통해 공급하였다. 건조된 미생물 바이오매스와 20% w/w의 스위치그래스의 조합으로 최고 오일을 회수%를 수득하였다. 프레스된 케이크를 이어서 헥산 추출에 적용하고 20% 스위치그래스 조건에 대한 최종 수율은 총 61.6%의 가용 오일(중량으로 계산하여)이었다. 상기 50% 오일 건조 세포 중량을 갖는 바이오매스는 오일을 유리시키기 위해 스위치그래스와 같은 프레싱 보조기의 사용을 요구하지 않는다. 익스펠러 프레스를 사용하여 미세조류로부터 오일을 추출하는 다른 방법은 국제특허출원 PCT/US2010/031108에 기재되며, 본 명세서에 참조로 포함된다.
B.
프로토테카 오일로부너 바이오디젤의 생성
상기 기재한 방법에 따라서 생성된 프로토테카 모리포미스 UTEX 1435의 탈검 오일에 에스터결합전이를 실시하여 지방산 메틸 에스터를 생성하였다. 결과를 이하의 표 24에 나타낸다.
오일의 지질 프로파일은 하기와 같다:
C10:0 0.02
C12:0 0.06
C14:0 1.81
C14.1 0.07
C16:0 24.53
C16:1 1.22
C18:0 2.34
C18:1 59.21
C18:2 8.91
C18:3 0.28
C20:0 0.23
C20:1 0.10
C20:1 0.08
C21:0 0.02
C22:0 0.06
C24:0 0.10
프로토테카 모리포미스 트라이글라이세라이드 오일로부터의 바이오디젤 프로파일 | ||||
방법 | 시험 | 결과 | 단위 | |
ASTM D6751 A1 | 바이오디젤 배합 연료의 콜드 소킹 여과성 | 여과시간 | 120 | 초 |
여과된 부피 | 300 | ㎖ | ||
ASTM D93 | 펜스키 마텐스(Pensky-Martens) 밀폐컵 인화점 | 사용한 절차 | A | |
보정한 인화점 | 165.0 | ℃ | ||
ASTM D2709 | 중질유 연료 내 물 및 침전물 (원심분리 방법) |
침전물 및 물 | 0.000 | Vol % |
EN 14538 | ICP OES에 의한 Ca 및 Mg 함량의 결정 | (Ca 및 Mg)의 합 | <1 | ㎎/㎏ |
EN 14538 | ICP OES에 의한 Ca 및 Mg 함량의 결정 | (Na 및 K)의 합 | <1 | ㎎/㎏ |
ASTM D445 | 동적/역학적 점성도 | 104 ℉/40 ℃에서 동적 점성도 | 4.873 | ㎟/s |
ASTM D874 | 윤활오일 및 첨자제로부터의 황산회분 | 황산회분 | < 0.005 | Wt % |
ASTM D5453 | 자외선 형광에 의한 경질탄화수소, 불꽃점화 엔진 연료, 디젤 엔진 연료, 및 엔진 오일의 전체 황 결정 | 황, ㎎/㎏ | 1.7 | mg/kg |
ASTM D130 | 부식- 구리 스트립 | 바이오디질-Cu 부식 50℃(122℉)/3시간 | 1a | |
ASTM D2500 | 혼탁점 | 혼탁점 | 6 | ℃ |
ASTM D4530 | 미세 탄소 잔류물 | 평균 미분화 방법 탄소 잔류물 | < 0.10 | Wt % |
ASTM D664 | 전위차 적정에 의한 석유제품의 산가 | 사용한 절차 | A | |
산가 | 0.20 | mg KOH/g | ||
ASTM D6584 | 기체 크로마토그래피에 의한 B-100 바이오디젤 내 유리 글라이세린 및 전체 글라이세린의 결정 | 유리 글라이세린 | <0.005 | Wt % |
전체 글라이세린 | 0.123 | Wt % | ||
ASTM D4951 | ICP-AES에 의한 윤활 오일 내 추가적인 요소 | 인 | 0.000200 | Wt % |
ASTM D1160 | 감압에서 석유 제품의 증류 | IBP | 248 | ℃ |
% 회수에서 AET | 336 | ℃ | ||
10% 회수에서 AET | 338 | ℃ | ||
20% 회수에서 AET | 339 | ℃ | ||
30% 회수에서 AET | 340 | ℃ | ||
40% 회수에서 AET | 342 | ℃ | ||
50% 회수에서 AET | 344 | ℃ | ||
60% 회수에서 AET | 345 | ℃ | ||
70% 회수에서 AET | 347 | ℃ | ||
80% 회수에서 AET | 349 | ℃ | ||
90% 회수에서 AET | 351 | ℃ | ||
95% 회수에서 AET | 353 | ℃ | ||
FBP | 362 | ℃ | ||
회수% | 98.5 | % | ||
손실% | 1.5 | % | ||
잔류% | 0.0 | % | ||
콜드 트랩 부피 | 0.0 | ㎖ | ||
IBP |
248 | ℃ | ||
EN 14112 | 산화 안정성의 결저(가속화된 산화 시험) | 산화 안정성 | > 12 | 시간 |
작동 온도(보통 110℃) | 110 | ℃ | ||
ASTM D4052 | 디지털 밀도계에 의한 액체 밀도 | 60℉에서 API 비중 | 29.5 | °API |
ASTM D 6890 | 점화지연(Ignition Delay, ID) 및 유도 세탄가(Derived Cetane Number, DCN)의 결정 | 유도 세탄가(DCN) | > 61.0 |
바이오디젤의 지질 프로파일은 공급원료 오일의 지질 프로파일과 매우 유사하였다. 본 발명의 방법 및 조성물에 의해 제공되는 다른 오일은 에스터결합전이로 (a) 적어도 4% C8-C14; (b) 적어도 0.3% C8; (c) 적어도 2% C10; (d) 적어도 2% C12; 및 (3) 적어도 30% C8-C14를 포함하는 지질 프로파일을 가지는 바이오디젤을 얻을 수 있다.
생성된 바이오디젤의 ASTM D6751 A1 방법에 의한 콜드소킹 여과성은 300㎖의 부피에 대해 120초 이었다. 이 시험은 300㎖의 B100의 여과를 수반하며, 16시간 동안 40℉로 냉각시켰고, 실온으로 가온하며, 스테인레스 스틸 지지체를 가지는 0.7 마이크론 유리 섬유 필터를 사용하여 진공하에 여과하였다. 본 발명의 오일은 에스터결합전이에 의해 120초 미만, 100초 미만, 및 90초 미만의 콜드 소킹 시간으로 바이오디젤을 만들수 있다.
C.
재생 디젤의 생성
상기 기재한 방법에 따라서 생산되고 본 실시예에서 바이오디젤을 만들기 위하여 사용한 오일과 동일한 지질 프로파일을 가지는 프로토테카 모리포미스 UTEX 1435의 탈검 오일에 에스터결합전이를 실시하여 재생 디젤을 생성하였다.
오일을 우선 수소처리하여 산소 및 글라이세롤 백본을 제거하였고, n-파라핀을 수득하였다. 그 다음에 n-파라핀에 크래킹 및 이성질체화를 실시하였다. 물질의 크로마토그램을 도 1에 나타낸다. 그 다음에 물질에 냉각 여과를 실시하여, C18 물질의 약 5%를 제거하였다. 냉각 여과 후, 전체 부피 물질은 인화점이 바뀌었고, 인화점, ASTM D-86 증류 분포, 혼탁도 및 점성도를 평가하였다. 인화점은 63℃이었고; 점성도는 2.86 cSt(센티스톡, centistokes)이었으며; 혼탁도는 4℃이었다. ASTM D86 증류값을 표 25에 나타낸다:
ASTM D86 증류 값 | |
℃로 판독 | |
부피 | 온도 |
IBP | 173 |
5 | 217.4 |
10 | 242.1 |
15 | 255.8 |
20 | 265.6 |
30 | 277.3 |
40 | 283.5 |
50 | 286.6 |
60 | 289.4 |
70 | 290.9 |
80 | 294.3 |
90 | 300 |
95 | 307.7 |
IBP | 331.5 |
생성된 물질의 T10-T90는 57.9℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 본 명세서에 개시된 방법에 따라서 생성된 트라이글라이세라이드 오일을 사용하여 다른 T10-T90 범위, 예컨대 20, 25, 30, 35, 40, 45, 50, 60 및 65℃를 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
생성된 물질의 T10은 242.1℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 다른 T10값, 예컨대 180 내지 295, 190 내지 270, 210 내지 250, 225 내지 245, 및 적어도 290의 T10을 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
생성된 물질의 T90은 300℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 다른 T90값, 예컨대 280 내지 380, 290 내지 360, 300 내지 350, 310 내지 340, 적어도 290의 T90을 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
생성된 물질의 FBP는 300℃이었다. 수소처리, 이성질체화, 및 본 명세서에 개시된 다른 공유적 변형 방법뿐만 아니라 본 명세서에 개시된 증류 및 부분분리(예컨대 냉각 여과)는 다른 FBP값, 예컨대 290 내지 400, 300 내지 385, 310 내지 370, 315 내지 360, 적어도 300의 FBP를 가지는 재생 디젤 조성물을 만드는데 사용될 수 있다.
본 발명의 방법 및 조성물에 의해 제공된 다른 오일은 수소처리, 이성질체화, 및 다른 공유적 변형의 조합이 실시되며, (a) 적어도 4% C8-C14; (b) 적어도 0.3% C8; (c) 적어도 2% C10; (d) 적어도 2% C12; 및 (3) 적어도 30% C8-C14를 포함하는 지질 프로파일을 갖는 오일을 포함한다.
실시예 14: 맞춤 오일의 생성
본 명세서에 개시된 방법 및 물질을 사용하여, 다양한 맞춤 오일을 생성하였다. 표 32는 균주, 유전자 및 표현형을 부여하는 유전자의 genbank 등록 번호 및 표시된 균주에 의해 생성된 다양한 지방산 프로파일을 나타낸다. 균주 A 및 B는 둘 다 프로토테카 모리포미스(UTEX 1435) 균주이며, 이들 둘 다 오일 수율을 개선하기 위하여 행위별수가 연구에 의해 고전적으로 돌연변이유발된다. 그 다음에 균주 A 및 B는 원하는 유전자를 발현시키기 위하여 적절한 DNA 구성체와 함께 본 명세서에 기재된 바와 같이 유전자 조작한다. 또한 균주를 표시한 바와 같은 내인성 불포화효소를 불활성화하기 위하여 유전자조작하였다. 티오에스터라제의 뉴클레오타이드 서열을 프로토테카에서 발현 및 사용을 위해 코돈 최적화하였다.
유전자 조작하지 않은 프로토테카의 야생형 지방산 프로파일을 표 32의 첫 번째 라인에 나타낸다. 알 수 있는 바와 같이, 지방산 프로파일은 상이한 균주에서 상이한 방법으로 극적으로 변경되었다. 예를 들어 비유전적으로 유전자조작된 프로토테카 모리포미스 세포에 의해 생성된 C8:0의 백분율은 0%이다. 그러나, 쿠페아 후커리아나 티오에스터라제를 발현시키기 위하여 유전자 조작된 프로토테카 모리포미스 세포는 전체 트라이글라이세라이드의 0% 내지 13.2%로 C8:0 생성을 증가시켰다. 다른 예에서, 유전자 조작된 균주의 C8:0 및 C10:0의 전체 합한 양은 전체 지방산의 약 39%이었다. 대조적으로, 야생형 세포 내 C8:0 및 C10:0의 전체 합한 양은 0.01%이다. 다른 예에서, 포화된 지방산의 전체 양은 내인성 SAD2b의 발현이 파쇄되는 세포 내 미국 느릅나무 티오에스터라제의 발현에 의해 약 32% 내지 약 90%로 증가하였다. 이는 거의 300%의 증가이다.
이하에 개시된 다양한 지방산 프로파일은 트라이글라이세라이드 오일을 수반하는 무수히 많은 용도에서 유용하다. 예를 들어, 트라이글라이세라이드를 포함하는 더 낮은 탄소 쇄 길이 포화된 지방산(C12:0, C14:0, C16:0)의 높은 수준은 재생 제트 연료 생성에서 특히 유용하다. 바이오디젤 생성을 위해, 고량의 C18:1이 바람직하다. 바형(bar) 비누 생성을 위해, 포화 수준과 더 짧은 쇄의 지방선 사이의 적절한 균형을 제어하고 달성하는 것은 바람직하다. 예로서, 고량의 C12:0는 비누거품 특성에 바람직한 반면, 더 긴 쇄 길이는 더 구조적이며, 한편으로 트라이글라이세라이드를 함유하는 리놀레산 및 리놀렌산은 그것들이 산화적 불안정성에 기여하기 때문에 덜 바람직하다. 액체 비누에 대해, 고량의 C12:0 및 C14:0이 바람직하다. 추가적으로, 바형 비누와 액체 비누 제품 둘 다에 대해, C6:0, C8:0 및 C10:0의 낮은 양이 바람직한데, 이들 더 낮은 쇄 트라이글라이세라이드는 피부 자극물이기 때문이다.
팜커넬
오일
본 발명자들은 팜커넬 오일(PKO)과 유사한 미생물 팜커넬 오일 모방체를 생산하였다. 팜커넬 오일 모방체에, 플라스미드를 구성하였고, 사용하여 균주 A를 형질전환하였고, 오일 생성을 수행하였다. 구성체, pSZ1413(서열번호 231)은 코돈 최적화 쿠페아 라이티 FATB2 유전자(서열번호 284)(Gen bank 등록번호 U56106) 및 SAD2B (스테아릴 ACP 불포화효소) 유전자 파쇄를 포함하였다.
이하의 표 33에서 나타내는 바와 같이, 팜 커넬 오일 모방체는 팜커넬 오일과 유사하였다. PKO 모방체의 3가지의 가장 흔한 지방산(C12:0, C14:0 및 C18:1)의 백분율은 팜 커넬 오일의 10%와 동일하거나 그 이내이다.
팜커넬 오일 모방체의 트라이글라이세라이드 프로파일 | ||||||||
C8:0 | C10:0 | C12:0 | C14:0 | C16:0 | C18:0 | C18:1 | C18:2 | |
인도네시아 기름야자
(팜 커넬) |
3.0-5.0 | 2.5-6.0 | 40-52 | 14.0-18.0 | 7.0-10.0 | 1.0-3.0 | 11.0- 19.0 |
0.5-4.0 |
pSZ1413 | 8.33 | 37.45 | 18.22 | 13.52 | 1.25 | 15.29 | 4.95 |
팜커넬
본 발명자들은 팜커넬 오일과 유사한 미생물 팜커넬 오일을 생성하였다. 몇몇 상이한 플라스미드를 구성하였고, 개별적으로 균주 A로 형질전환되었으며, 오일 생성을 수행하였다. 구성체, pSZ1503(서열번호 283)을 내인성 KASII 유전자를 파쇄하기 위하여 설계하였다. 구성체, pSZ1439(서열번호 237)는 코돈 최적화 인도네시아 기름야자 TE 유전자(서열번호 205)(Gen bank 등록번호 AAD42220.2)를 포함하였다. 구성체, pSZ1420(서열번호 225)은 코돈 최적화 쿠페아 후커리아나 TE 유전자(서열번호 201)(Gen Bank 등록번호 Q39513)를 포함하였다. 구성체, pSZ1119(서열번호 227)는 코돈 최적화 쿠페아 후커리아나 KAS IV 유전자(서열번호 186)(Gen Bank 등록번호 AF060519)뿐만 아니라 쿠페아 라이티 FATB2 유전자(서열번호 184)(Gen Bank 등록번호 U56104)를 포함하였다.
이하의 표 34에서 나타내는 바와 같이, 팜 커넬 오일 모방체는 팜 오일과 유사하였다. 팜 오일 모방체의 3가지 가장 흔한 지방산(C16:0, C18:1 및 C18:2)의 백분율은 팜 오일의 10%와 동일하거나 그 이내이었다.
팜 오일 모방체의 트라이글라이세라이드 프로파일 | |||||||
C10:0 | C12:0 | C14:0 | C16:0 | C18:0 | C18:1 | C18:2 | |
인도네시아 기름야자
(팜) |
0 | 0 | 0.5-5.9 | 32.0-47.0 | 2.0-8.0 | 34-44 | 7.2-12.0 |
pSZ1503 | 0.01 | 0.01 | 0.83 | 38.36 | 2.21 | 48.31 | 7.60 |
pSZ1439 | 0.01 | 0.04 | 1.88 | 43.50 | 3.32 | 39.95 | 9.16 |
pSZ1420 | 0.02 | 0.04 | 2.44 | 48.04 | 2.76 | 35.62 | 8.91 |
pSZ1119 | 1.77 | 0.40 | 7.85 | 35.45 | 2.47 | 42.85 | 8.15 |
코코아 버터
본 발명자들은 코코아 버터와 유사한 미생물 코코아 버터 모방체를 생성하였다. 구성체, pSZ1451를 구성하였고, 균주 A로 형질전환하였으며, 오일 생성을 수행하였다. 구성체, pSZ1451(서열번호 239)은 코돈 최적화 카타무스 틴토리우스(Carthamus tinctorus) TE 유전자(서열번호 187)(Gen Bank 등록번호 AAA33019.1)를 포함하였다.
이하의 표 35에서 나타내는 바와 같이, 코코아 버터 오일 모방체는 코코아 버터와 유사하였다. 코코아 버터 모방체의 3가지(C16:0, C18:0 및 C18:1) 가장 흔한 지방산의 백분율은 코코아 버터와 동일하거나 10% 이내이었다.
코코아 버터 모방체의 트라이글라이세라이드 프로파일 | ||||||||
C8:0 | C10:0 | C12:0 | C14:0 | C16:0 | C18:0 | C18:1 | C18:2 | |
코코아 버터 | 0 | 0-1 | 0-1 | 0-4 | 22-38 | 24-37 | 29-38 | 0-3 |
pSZ1451 | 0.05 | 0.14 | 0.99 | 28.34 | 27.39 | 29.40 | 10.26 |
본 발명자들은 라드와 유사한 미생물 라드 모방체를 생성하였다. 몇몇 상이한 플라스미드를 구성하였고, 개별적으로 균주 A로 형질전환하였으며, 오일 생성을 수행하였다. 구성체, pSZ1493(서열번호 241)을 내인성 SAD 2B 유전자를 파괴하고 코돈 최적화 캘리포니아 월계수 TE 유전자(서열번호 285)(Gen Bank 등록번호 M94159)를 동시에 발현하도록 설계하였다. 구성체, pSZ1452(서열번호 240)를 내인성 SAD 2B 유전자를 파괴하고 코돈 최적화 가르시니아 망고스타나 TE 유전자(서열번호 196)(Gen Bank 등록번호 AAB51525.1)를 발현하도록 설계하였다. 구성체, pSZ1449(서열번호 238)를 브라씨카 나푸스 TE 유전자(서열번호 195)(Gen Bank 등록번호 CAA52070.1)를 발현하도록 설계하였다. 구성체 pSZ1458의 폴리뉴클레오타이드 서열은 쿠페아 후커리아나 티오에스터라제(Gen Bank 등록번호 U39834)를 암호화하는 코돈 최적화 폴리뉴클레오타이드를 브라씨카 나푸스 TE 유전자를 암호화하는 폴리뉴클레오타이드 서열(서열번호 195)(Gen Bank 등록번호 CAA52070.1)로 대신하는 것을 제외하고 pSZ1449와 동일하였다.
이하의 표 36에서 나타낸 바와 같이, 라드 모방체는 라드와 유사하였다. 라드 모방체의 3가지 가장 흔한 지방산(C16:0, C18:0 및 C18:1)은 라드의 10%와 동일하거나 그 이내에 있다.
라드 모방체의 트라이글라이세드 프로파일 | |||||
C14:0 | C16:0 | C18:0 | C18:1 | C18:2 | |
라드 | 3-4 | 22-26 | 13-18 | 39-45 | 8-15 |
pSZ1493 | 1.32 | 24.79 | 17.49 | 41.87 | 10.01 |
pSZ1452 | 1.16 | 24.49 | 17.94 | 45.49 | 8.05 |
pSZ1449 | 1.16 | 23.98 | 15.79 | 47.88 | 8.29 |
본 발명은 그것의 특정 실시형태와 함께 기재되지만, 추가 변형이 가능한 것으로 이해될 것이다. 일반적으로 본 발명의 원칙에 따르는 본 출원은 본 발명의 변형, 사용, 또는 적용 중 어떤 것을 다루며, 본 발명이 속하는 당업계에서 공지되고 관례적인 실행 내에서 실현되며, 본 명세서에서 설명하는 필수 특징으로 적용될 수 있는 본 발명으로부터의 일탈을 포함한다.
특허, 특허 출원, 및 간행물을 포함하며, Genbank 등록번호를 포함하는 본 명세서에서 인용되는 모든 참조문헌은 이전에 구체적으로 포함되었든 그렇지 않든 그것의 전문이 참조로 본 명세서에 포함된다. 본 명세서에 언급된 간행물은 본 발명과 함께 사용될 수 있는 시약, 방법 및 개념을 기개하고 개시하는 목적을 위해 인용된다. 이들 참조문헌은 본 명세서에 기재된 본 발명에 관하여 선행기술이라는 용인으로서 해석되어서는 안 된다. 특히, 다음의 특허 출원은 모든 목적을 위하여 본 명세서에 참조로 포함된다: 2008년 6월 2일 출원된 국제특허출원 PCT/US2008/065563(발명의 명칭:"Production of Oil in Microorganisms"), 2010년 4월 14일 출원된 국제특허출원 PCT/US2010/31108(발명의 명칭 "Methods of Microbial Oil Extraction and Separation") 및 2009년 11월 30일 출원된 국제특허출원 PCT/US2009/066142(발명의 명칭: "Production of Tailored Oils in Heterotrophic Microorganisms").
SEQUENCE LISTING
<110> SOLAZYME, INC.
<120> Tailored Oils Produced from Recombinant Heterotrophic Microorganisms
<130> 057518-406220
<140> PCT/US11/038463
<141> 2011-05-27
<150> US 61/349,774
<151> 2010-05-28
<150> US 61/374,992
<151> 2010-08-18
<150> US 61/414,393
<151> 2010-11-16
<150> US 61/428,192
<151> 2010-12-29
<160> 287
<170> PatentIn version 3.5
<210> 1
<211> 1187
<212> DNA
<213> Unknown
<220>
<223> Chlorella species
<400> 1
gatcagacgg gcctgacctg cgagataatc aagtgctcgt aggcaaccaa ctcagcagct 60
gcttggtgtt gggtctgcag gatagtgttg cagggcccca aggacagcag gggaacttac 120
accttgtccc cgacccagtt ttatggagtg cattgcctca agagcctagc cggagcgcta 180
ggctacatac ttgccgcacc ggtatgaggg gatatagtac tcgcactgcg ctgtctagtg 240
agatgggcag tgctgcccat aaacaactgg ctgctcagcc atttgttggc ggaccattct 300
gggggggcca gcaatgcctg actttcgggt agggtgaaaa ctgaacaaag actaccaaaa 360
cagaatttct tcctccttgg aggtaagcgc aggccggccc gcctgcgccc acatggcgct 420
ccgaacacct ccatagctgt aagggcgcaa acatggccgg actgttgtca gcactctttc 480
atggccatac aaggtcatgt cgagattagt gctgagtaag acactatcac cccatgttcg 540
attgaagccg tgacttcatg ccaacctgcc cctgggcgta gcagacgtat gccatcatga 600
ccactagccg acatgcgctg tcttttgcca ccaaaacaac tggtacaccg ctcgaagtcg 660
tgccgcacac ctccgggagt gagtccggcg actcctcccc ggcgggccgc ggccctacct 720
gggtagggtc gccatacgcc cacgaccaaa cgacgcagga ggggattggg gtagggaatc 780
ccaaccagcc taaccaagac ggcacctata ataataggtg gggggactaa cagccctata 840
tcgcaagctt tgggtgccta tcttgagaag cacgagttgg agtggctgtg tacggtcgac 900
cctaaggtgg gtgtgccgca gcctgaaaca aagcgtctag cagctgcttc tataatgtgt 960
cagccgttgt gtttcagtta tattgtatgc tattgtttgt tcgtgctagg gtggcgcagg 1020
cccacctact gtggcgggcc attggttggt gcttgaattg cctcaccatc taaggtctga 1080
acgctcactc aaacgccttt gtacaactgc agaactttcc ttggcgctgc aactacagtg 1140
tgcaaaccag cacatagcac tcccttacat cacccagcag tacaaca 1187
<210> 2
<211> 1414
<212> DNA
<213> Chlorella ellipsoidea
<400> 2
cgctgcgcac cagggccgcc agctcgctga tgtcgctcca aatgcggtcc cccgattttt 60
tgttcttcat cttctccacc ttggtggcct tcttggccag ggccttcagc tgcatgcgca 120
cagaccgttg agctcctgat cagcatcctc aggaggccct ttgacaagca agcccctgtg 180
caagcccatt cacggggtac cagtggtgct gaggtagatg ggtttgaaaa ggattgctcg 240
gtcgattgct gctcatggaa ttggcatgtg catgcatgtt cacaatatgc caccaggctt 300
tggagcaaga gagcatgaat gccttcaggc aggttgaaag ttcctggggg tgaagaggca 360
gggccgagga ttggaggagg aaagcatcaa gtcgtcgctc atgctcatgt tttcagtcag 420
agtttgccaa gctcacagga gcagagacaa gactggctgc tcaggtgttg catcgtgtgt 480
gtggtggggg ggggggggtt aatacggtac gaaatgcact tggaattccc acctcatgcc 540
agcggaccca catgcttgaa ttcgaggcct gtggggtgag aaatgctcac tctgccctcg 600
ttgctgaggt acttcaggcc gctgagctca aagtcgatgc cctgctcgtc tatcagggcc 660
tgcacctctg ggctgaccgg ctcagcctcc ttcgcgggca tggagtaggc gccggcagcg 720
ttcatgtccg ggcccagggc agcggtggtg ccataaatgt cggtgatggt ggggaggggg 780
gccgtcgcca caccattgcc gttgctggct gacgcatgca catgtggcct ggctggcacc 840
ggcagcactg gtctccagcc agccagcaag tggctgttca ggaaagcggc catgttgttg 900
gtccctgcgc atgtaattcc ccagatcaaa ggagggaaca gcttggattt gatgtagtgc 960
ccaaccggac tgaatgtgcg atggcaggtc cctttgagtc tcccgaatta ctagcagggc 1020
actgtgacct aacgcagcat gccaaccgca aaaaaatgat tgacagaaaa tgaagcggtg 1080
tgtcaatatt tgctgtattt attcgtttta atcagcaacc aagttcgaaa cgcaactatc 1140
gtggtgatca agtgaacctc atcagactta cctcgttcgg caaggaaacg gaggcaccaa 1200
attccaattt gatattatcg cttgccaagc tagagctgat ctttgggaaa ccaactgcca 1260
gacagtggac tgtgatggag tgccccgagt ggtggagcct cttcgattcg gttagtcatt 1320
actaacgtga accctcagtg aagggaccat cagaccagaa agaccagatc tcctcctcga 1380
caccgagaga gtgttgcggc agtaggacga caag 1414
<210> 3
<211> 512
<212> PRT
<213> Unknown
<220>
<223> Yeast sequence
<400> 3
Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His Phe Thr Pro Asn
1 5 10 15
Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr Asp Glu Lys Asp
20 25 30
Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn Asp Thr Val Trp
35 40 45
Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp Asp Leu Thr Asn
50 55 60
Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg Asn Asp Ser Gly
65 70 75 80
Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn Thr Ser Gly Phe
85 90 95
Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val Ala Ile Trp Thr
100 105 110
Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser Tyr Ser Leu Asp
115 120 125
Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro Val Leu Ala Ala
130 135 140
Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp Tyr Glu Pro Ser
145 150 155 160
Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp Tyr Lys Ile Glu
165 170 175
Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu Glu Ser Ala Phe
180 185 190
Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys Pro Gly Leu Ile
195 200 205
Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr Trp Val Met Phe
210 215 220
Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser Phe Asn Gln Tyr
225 230 235 240
Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala Phe Asp Asn Gln
245 250 255
Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala Leu Gln Thr Phe
260 265 270
Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly Ile Ala Trp Ala
275 280 285
Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn Pro Trp Arg Ser
290 295 300
Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr Glu Tyr Gln Ala
305 310 315 320
Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu Pro Ile Leu Asn
325 330 335
Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr Asn Thr Thr Leu
340 345 350
Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn Ser Thr Gly Thr
355 360 365
Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr Gln Thr Ile Ser
370 375 380
Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys Gly Leu Glu Asp
385 390 395 400
Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser Ala Ser Ser Phe
405 410 415
Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val Lys Glu Asn Pro
420 425 430
Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro Phe Lys Ser Glu
435 440 445
Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu Asp Gln Asn Ile
450 455 460
Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser Thr Asn Thr Tyr
465 470 475 480
Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn Met Thr Thr Gly
485 490 495
Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val Arg Glu Val Lys
500 505 510
<210> 4
<211> 20
<212> PRT
<213> Unknown
<220>
<223> Yeast sequence
<400> 4
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala Ser
20
<210> 5
<211> 18
<212> PRT
<213> Unknown
<220>
<223> source organism never identified, higher plants secretion signal
<400> 5
Met Ala Asn Lys Ser Leu Leu Leu Leu Leu Leu Leu Gly Ser Leu Ala
1 5 10 15
Ser Gly
<210> 6
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> source organism never identified
<400> 6
Met Ala Arg Leu Pro Leu Ala Ala Leu Gly
1 5 10
<210> 7
<211> 20
<212> PRT
<213> Unknown
<220>
<223> source organism never identified
<400> 7
Met Ala Asn Lys Leu Leu Leu Leu Leu Leu Leu Leu Leu Leu Pro Leu
1 5 10 15
Ala Ala Ser Gly
20
<210> 8
<211> 2615
<212> DNA
<213> Saccharomyces cerevisiae
<400> 8
gaattcccca acatggtgga gcacgacact ctcgtctact ccaagaatat caaagataca 60
gtctcagaag accaaagggc tattgagact tttcaacaaa gggtaatatc gggaaacctc 120
ctcggattcc attgcccagc tatctgtcac ttcatcaaaa ggacagtaga aaaggaaggt 180
ggcacctaca aatgccatca ttgcgataaa ggaaaggcta tcgttcaaga tgcctctgcc 240
gacagtggtc ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt 300
ccaaccacgt cttcaaagca agtggattga tgtgaacatg gtggagcacg acactctcgt 360
ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg agacttttca 420
acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct gtcacttcat 480
caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg ataaaggaaa 540
ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 600
gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 660
tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc 720
tatataagga agttcatttc atttggagag gacacgctga aatcaccagt ctctctctac 780
aaatctatct ctggcgcgcc atatcaatgc ttcttcaggc ctttcttttt cttcttgctg 840
gttttgctgc caagatcagc gcctctatga cgaacgaaac ctcggataga ccacttgtgc 900
actttacacc aaacaagggc tggatgaatg accccaatgg actgtggtac gacgaaaaag 960
atgccaagtg gcatctgtac tttcaataca acccgaacga tactgtctgg gggacgccat 1020
tgttttgggg ccacgccacg tccgacgacc tgaccaattg ggaggaccaa ccaatagcta 1080
tcgctccgaa gaggaacgac tccggagcat tctcgggttc catggtggtt gactacaaca 1140
atacttccgg ctttttcaac gataccattg acccgagaca acgctgcgtg gccatatgga 1200
cttacaacac accggagtcc gaggagcagt acatctcgta tagcctggac ggtggataca 1260
cttttacaga gtatcagaag aaccctgtgc ttgctgcaaa ttcgactcag ttccgagatc 1320
cgaaggtctt ttggtacgag ccctcgcaga agtggatcat gacagcggca aagtcacagg 1380
actacaagat cgaaatttac tcgtctgacg accttaaatc ctggaagctc gaatccgcgt 1440
tcgcaaacga gggctttctc ggctaccaat acgaatgccc aggcctgata gaggtcccaa 1500
cagagcaaga tcccagcaag tcctactggg tgatgtttat ttccattaat ccaggagcac 1560
cggcaggagg ttcttttaat cagtacttcg tcggaagctt taacggaact catttcgagg 1620
catttgataa ccaatcaaga gtagttgatt ttggaaagga ctactatgcc ctgcagactt 1680
tcttcaatac tgacccgacc tatgggagcg ctcttggcat tgcgtgggct tctaactggg 1740
agtattccgc attcgttcct acaaaccctt ggaggtcctc catgtcgctc gtgaggaaat 1800
tctctctcaa cactgagtac caggccaacc cggaaaccga actcataaac ctgaaagccg 1860
aaccgatcct gaacattagc aacgctggcc cctggagccg gtttgcaacc aacaccacgt 1920
tgacgaaagc caacagctac aacgtcgatc tttcgaatag caccggtaca cttgaatttg 1980
aactggtgta tgccgtcaat accacccaaa cgatctcgaa gtcggtgttc gcggacctct 2040
ccctctggtt taaaggcctg gaagaccccg aggagtacct cagaatgggt ttcgaggttt 2100
ctgcgtcctc cttcttcctt gatcgcggga acagcaaagt aaaatttgtt aaggagaacc 2160
catattttac caacaggatg agcgttaaca accaaccatt caagagcgaa aacgacctgt 2220
cgtactacaa agtgtatggt ttgcttgatc aaaatatcct ggaactctac ttcaacgatg 2280
gtgatgtcgt gtccaccaac acatacttca tgacaaccgg gaacgcactg ggctccgtga 2340
acatgacgac gggtgtggat aacctgttct acatcgacaa attccaggtg agggaagtca 2400
agtgagatct gtcgatcgac aagctcgagt ttctccataa taatgtgtga gtagttccca 2460
gataagggaa ttagggttcc tatagggttt cgctcatgtg ttgagcatat aagaaaccct 2520
tagtatgtat ttgtatttgt aaaatacttc tatcaataaa atttctaatt cctaaaacca 2580
aaatccagta ctaaaatcca gatcccccga attaa 2615
<210> 9
<211> 22
<212> DNA
<213> Prototheca moriformis
<400> 9
tgttgaagaa tgagccggcg ac 22
<210> 10
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 10
cagtgagcta ttacgcactc 20
<210> 11
<211> 541
<212> DNA
<213> Prototheca kruegani
<400> 11
tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa tactctggag 60
ccatagcgaa agcaagttta gtaagcttag gtcattcttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttagta aaataacatg gaggcccgaa ccgactaatg 180
ttgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcag tacaaataga ggggtaaagc 300
actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 12
<211> 573
<212> DNA
<213> Prototheca wickerhamii
<400> 12
tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagattt aataactcga 60
aacctaagcg aaagcaagtc ttaatagggc gtcaatttaa caaaacttta aataaattat 120
aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180
gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240
tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300
gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360
ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420
gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480
ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540
gccatccttt aaagagtgcg taatagctca ctg 573
<210> 13
<211> 541
<212> DNA
<213> Prototheca stagnora
<400> 13
tgttgaagaa tgagccggcg agttaaaaaa aatggcatgg ttaaagatat ttctctgaag 60
ccatagcgaa agcaagtttt acaagctata gtcatttttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggtc aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggacgt gagtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 14
<211> 541
<212> DNA
<213> Prototheca moriformis
<400> 14
tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagataa ttctctggag 60
ccatagcgaa agcaagttta acaagctaaa gtcacccttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt ttgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gggtatgtta 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 15
<211> 573
<212> DNA
<213> Prototheca moriformis
<400> 15
tgttgaagaa tgagccggcg acttaaaata aatggcaggc taagagaatt aataactcga 60
aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120
aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180
gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240
tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300
gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360
ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420
gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480
ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540
gccatccttt aaagagtgcg taatagctca ctg 573
<210> 16
<211> 573
<212> DNA
<213> Prototheca wickerhamii
<400> 16
tgttgaagaa tgagccgtcg acttaaaata aatggcaggc taagagaatt aataactcga 60
aacctaagcg aaagcaagtc ttaatagggc gctaatttaa caaaacatta aataaaatct 120
aaagtcattt attttagacc cgaacctgag tgatctaacc atggtcagga tgaaacttgg 180
gtgacaccaa gtggaagtcc gaaccgaccg atgttgaaaa atcggcggat gaactgtggt 240
tagtggtgaa ataccagtcg aactcagagc tagctggttc tccccgaaat gcgttgaggc 300
gcagcaatat atctcgtcta tctaggggta aagcactgtt tcggtgcggg ctatgaaaat 360
ggtaccaaat cgtggcaaac tctgaatact agaaatgacg atatattagt gagactatgg 420
gggataagct ccatagtcga gagggaaaca gcccagacca ccagttaagg ccccaaaatg 480
ataatgaagt ggtaaaggag gtgaaaatgc aaatacaacc aggaggttgg cttagaagca 540
gccatccttt aaagagtgcg taatagctca ctg 573
<210> 17
<211> 541
<212> DNA
<213> Prototheca moriformis
<400> 17
tgttgaagaa tgagccggcg agttaaaaag agtggcgtgg ttaaagaaaa ttctctggaa 60
ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt ttgtgggctc cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcgaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 18
<211> 541
<212> DNA
<213> Prototheca zopfii
<400> 18
tgttgaagaa tgagccggcg agttaaaaag agtggcatgg ttaaagaaaa ttctctggag 60
ccatagcgaa agcaagttta acaagcttaa gtcacttttt ttagacccga aaccgagtga 120
tctacccatg atcagggtga agtgttggta aaataacatg gaggcccgaa ccgactaatg 180
gtgaaaaatt agcggatgaa ttgtgggtag gggcgaaaaa ccaatcgaac tcggagttag 240
ctggttctcc ccgaaatgcg tttaggcgca gcagtagcaa cacaaataga ggggtaaagc 300
actgtttctt tcgtgggctt cgaaagttgt acctcaaagt ggcaaactct gaatactcta 360
tttagatatc tactagtgag accttggggg ataagctcct tggtcaaaag ggaaacagcc 420
cagatcacca gttaaggccc caaaatgaaa atgatagtga ctaaggatgt gagtatgtca 480
aaacctccag caggttagct tagaagcagc aatcctttca agagtgcgta atagctcact 540
g 541
<210> 19
<211> 565
<212> DNA
<213> Prototheca moriformis
<400> 19
tgttgaagaa tgagccggcg acttagaaaa ggtggcatgg ttaaggaaat attccgaagc 60
cgtagcaaaa gcgagtctga atagggcgat aaaatatatt aatatttaga atctagtcat 120
tttttctaga cccgaacccg ggtgatctaa ccatgaccag gatgaagctt gggtgatacc 180
aagtgaaggt ccgaaccgac cgatgttgaa aaatcggcgg atgagttgtg gttagcggtg 240
aaataccagt cgaacccgga gctagctggt tctccccgaa atgcgttgag gcgcagcagt 300
acatctagtc tatctagggg taaagcactg tttcggtgcg ggctgtgaga acggtaccaa 360
atcgtggcaa actctgaata ctagaaatga cgatgtagta gtgagactgt gggggataag 420
ctccattgtc aagagggaaa cagcccagac caccagctaa ggccccaaaa tggtaatgta 480
gtgacaaagg aggtgaaaat gcaaatacaa ccaggaggtt ggcttagaag cagccatcct 540
ttaaagagtg cgtaatagct cactg 565
<210> 20
<211> 550
<212> PRT
<213> Chicorium intybus
<400> 20
Met Ser Asn Ser Ser Asn Ala Ser Glu Ser Leu Phe Pro Ala Thr Ser
1 5 10 15
Glu Gln Pro Tyr Arg Thr Ala Phe His Phe Gln Pro Pro Gln Asn Trp
20 25 30
Met Asn Asp Pro Asn Gly Pro Met Cys Tyr Asn Gly Val Tyr His Leu
35 40 45
Phe Tyr Gln Tyr Asn Pro Phe Gly Pro Leu Trp Asn Leu Arg Met Tyr
50 55 60
Trp Ala His Ser Val Ser His Asp Leu Ile Asn Trp Ile His Leu Asp
65 70 75 80
Leu Ala Phe Ala Pro Thr Glu Pro Phe Asp Ile Asn Gly Cys Leu Ser
85 90 95
Gly Ser Ala Thr Val Leu Pro Gly Asn Lys Pro Ile Met Leu Tyr Thr
100 105 110
Gly Ile Asp Thr Glu Asn Arg Gln Val Gln Asn Leu Ala Val Pro Lys
115 120 125
Asp Leu Ser Asp Pro Tyr Leu Arg Glu Trp Val Lys His Thr Gly Asn
130 135 140
Pro Ile Ile Ser Leu Pro Glu Glu Ile Gln Pro Asp Asp Phe Arg Asp
145 150 155 160
Pro Thr Thr Thr Trp Leu Glu Glu Asp Gly Thr Trp Arg Leu Leu Val
165 170 175
Gly Ser Gln Lys Asp Lys Thr Gly Ile Ala Phe Leu Tyr His Ser Gly
180 185 190
Asp Phe Val Asn Trp Thr Lys Ser Asp Ser Pro Leu His Lys Val Ser
195 200 205
Gly Thr Gly Met Trp Glu Cys Val Asp Phe Phe Pro Val Trp Val Asp
210 215 220
Ser Thr Asn Gly Val Asp Thr Ser Ile Ile Asn Pro Ser Asn Arg Val
225 230 235 240
Lys His Val Leu Lys Leu Gly Ile Gln Asp His Gly Lys Asp Cys Tyr
245 250 255
Leu Ile Gly Lys Tyr Ser Ala Asp Lys Glu Asn Tyr Val Pro Glu Asp
260 265 270
Glu Leu Thr Leu Ser Thr Leu Arg Leu Asp Tyr Gly Met Tyr Tyr Ala
275 280 285
Ser Lys Ser Phe Phe Asp Pro Val Lys Asn Arg Arg Ile Met Thr Ala
290 295 300
Trp Val Asn Glu Ser Asp Ser Glu Ala Asp Val Ile Ala Arg Gly Trp
305 310 315 320
Ser Gly Val Gln Ser Phe Pro Arg Ser Leu Trp Leu Asp Lys Asn Gln
325 330 335
Lys Gln Leu Leu Gln Trp Pro Ile Glu Glu Ile Glu Met Leu His Gln
340 345 350
Asn Glu Val Ser Phe His Asn Lys Lys Leu Asp Gly Gly Ser Ser Leu
355 360 365
Glu Val Leu Gly Ile Thr Ala Ser Gln Ala Asp Val Lys Ile Ser Phe
370 375 380
Lys Leu Ala Asn Leu Glu Glu Ala Glu Glu Leu Asp Pro Ser Trp Val
385 390 395 400
Asp Pro Gln Leu Ile Cys Ser Glu Asn Asp Ala Ser Lys Lys Gly Lys
405 410 415
Phe Gly Pro Phe Gly Leu Leu Ala Leu Ala Ser Ser Asp Leu Arg Glu
420 425 430
Gln Thr Ala Ile Phe Phe Arg Val Phe Arg Lys Asn Gly Arg Tyr Val
435 440 445
Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Met Lys Asn Gly Ile
450 455 460
Glu Lys Arg Thr Tyr Gly Ala Phe Val Asp Ile Asp Pro Gln Gln Asp
465 470 475 480
Glu Ile Ser Leu Arg Thr Leu Ile Asp His Ser Ile Val Glu Ser Phe
485 490 495
Gly Gly Arg Gly Lys Thr Cys Ile Thr Thr Arg Val Tyr Pro Thr Leu
500 505 510
Ala Ile Gly Glu Gln Ala Arg Leu Phe Ala Phe Asn His Gly Thr Glu
515 520 525
Ser Val Glu Ile Ser Glu Leu Ser Ala Trp Ser Met Lys Lys Ala Gln
530 535 540
Met Lys Val Glu Glu Pro
545 550
<210> 21
<211> 581
<212> PRT
<213> Schizosaccharomyces pombe
<400> 21
Met Phe Leu Lys Tyr Ile Leu Ala Ser Gly Ile Cys Leu Val Ser Leu
1 5 10 15
Leu Ser Ser Thr Asn Ala Ala Pro Arg His Leu Tyr Val Lys Arg Tyr
20 25 30
Pro Val Ile Tyr Asn Ala Ser Asn Ile Thr Glu Val Ser Asn Ser Thr
35 40 45
Thr Val Pro Pro Pro Pro Phe Val Asn Thr Thr Ala Pro Asn Gly Thr
50 55 60
Cys Leu Gly Asn Tyr Asn Glu Tyr Leu Pro Ser Gly Tyr Tyr Asn Ala
65 70 75 80
Thr Asp Arg Pro Lys Ile His Phe Thr Pro Ser Ser Gly Phe Met Asn
85 90 95
Asp Pro Asn Gly Leu Val Tyr Thr Gly Gly Val Tyr His Met Phe Phe
100 105 110
Gln Tyr Ser Pro Lys Thr Leu Thr Ala Gly Glu Val His Trp Gly His
115 120 125
Thr Val Ser Lys Asp Leu Ile His Trp Glu Asn Tyr Pro Ile Ala Ile
130 135 140
Tyr Pro Asp Glu His Glu Asn Gly Val Leu Ser Leu Pro Phe Ser Gly
145 150 155 160
Ser Ala Val Val Asp Val His Asn Ser Ser Gly Leu Phe Ser Asn Asp
165 170 175
Thr Ile Pro Glu Glu Arg Ile Val Leu Ile Tyr Thr Asp His Trp Thr
180 185 190
Gly Val Ala Glu Arg Gln Ala Ile Ala Tyr Thr Thr Asp Gly Gly Tyr
195 200 205
Thr Phe Lys Lys Tyr Ser Gly Asn Pro Val Leu Asp Ile Asn Ser Leu
210 215 220
Gln Phe Arg Asp Pro Lys Val Ile Trp Asp Phe Asp Ala Asn Arg Trp
225 230 235 240
Val Met Ile Val Ala Met Ser Gln Asn Tyr Gly Ile Ala Phe Tyr Ser
245 250 255
Ser Tyr Asp Leu Ile His Trp Thr Glu Leu Ser Val Phe Ser Thr Ser
260 265 270
Gly Tyr Leu Gly Leu Gln Tyr Glu Cys Pro Gly Met Ala Arg Val Pro
275 280 285
Val Glu Gly Thr Asp Glu Tyr Lys Trp Val Leu Phe Ile Ser Ile Asn
290 295 300
Pro Gly Ala Pro Leu Gly Gly Ser Val Val Gln Tyr Phe Val Gly Asp
305 310 315 320
Trp Asn Gly Thr Asn Phe Val Pro Asp Asp Gly Gln Thr Arg Phe Val
325 330 335
Asp Leu Gly Lys Asp Phe Tyr Ala Ser Ala Leu Tyr His Ser Ser Ser
340 345 350
Ala Asn Ala Asp Val Ile Gly Val Gly Trp Ala Ser Asn Trp Gln Tyr
355 360 365
Thr Asn Gln Ala Pro Thr Gln Val Phe Arg Ser Ala Met Thr Val Ala
370 375 380
Arg Lys Phe Thr Leu Arg Asp Val Pro Gln Asn Pro Met Thr Asn Leu
385 390 395 400
Thr Ser Leu Ile Gln Thr Pro Leu Asn Val Ser Leu Leu Arg Asp Glu
405 410 415
Thr Leu Phe Thr Ala Pro Val Ile Asn Ser Ser Ser Ser Leu Ser Gly
420 425 430
Ser Pro Ile Thr Leu Pro Ser Asn Thr Ala Phe Glu Phe Asn Val Thr
435 440 445
Leu Ser Ile Asn Tyr Thr Glu Gly Cys Thr Thr Gly Tyr Cys Leu Gly
450 455 460
Arg Ile Ile Ile Asp Ser Asp Asp Pro Tyr Arg Leu Gln Ser Ile Ser
465 470 475 480
Val Asp Val Asp Phe Ala Ala Ser Thr Leu Val Ile Asn Arg Ala Lys
485 490 495
Ala Gln Met Gly Trp Phe Asn Ser Leu Phe Thr Pro Ser Phe Ala Asn
500 505 510
Asp Ile Tyr Ile Tyr Gly Asn Val Thr Leu Tyr Gly Ile Val Asp Asn
515 520 525
Gly Leu Leu Glu Leu Tyr Val Asn Asn Gly Glu Lys Thr Tyr Thr Asn
530 535 540
Asp Phe Phe Phe Leu Gln Gly Ala Thr Pro Gly Gln Ile Ser Phe Ala
545 550 555 560
Ala Phe Gln Gly Val Ser Phe Asn Asn Val Thr Val Thr Pro Leu Lys
565 570 575
Thr Ile Trp Asn Cys
580
<210> 22
<211> 550
<212> PRT
<213> Pichia anomala
<400> 22
Met Ile Gln Leu Ser Pro Leu Leu Leu Leu Pro Leu Phe Ser Val Phe
1 5 10 15
Asn Ser Ile Ala Asp Ala Ser Thr Glu Tyr Leu Arg Pro Gln Ile His
20 25 30
Leu Thr Pro Asp Gln Gly Trp Met Asn Asp Pro Asn Gly Met Phe Tyr
35 40 45
Asp Arg Lys Asp Lys Leu Trp His Val Tyr Phe Gln His Asn Pro Asp
50 55 60
Lys Lys Ser Ile Trp Ala Thr Pro Val Thr Trp Gly His Ser Thr Ser
65 70 75 80
Lys Asp Leu Leu Thr Trp Asp Tyr His Gly Asn Ala Leu Glu Pro Glu
85 90 95
Asn Asp Asp Glu Gly Ile Phe Ser Gly Ser Val Val Val Asp Arg Asn
100 105 110
Asn Thr Ser Gly Phe Phe Asn Asp Ser Thr Asp Pro Glu Gln Arg Ile
115 120 125
Val Ala Ile Tyr Thr Asn Asn Ala Gln Leu Gln Thr Gln Glu Ile Ala
130 135 140
Tyr Ser Leu Asp Lys Gly Tyr Ser Phe Ile Lys Tyr Asp Gln Asn Pro
145 150 155 160
Val Ile Asn Val Asn Ser Ser Gln Gln Arg Asp Pro Lys Val Leu Trp
165 170 175
His Asp Glu Ser Asn Gln Trp Ile Met Val Val Ala Lys Thr Gln Glu
180 185 190
Phe Lys Val Gln Ile Tyr Gly Ser Pro Asp Leu Lys Lys Trp Asp Leu
195 200 205
Lys Ser Asn Phe Thr Ser Asn Gly Tyr Leu Gly Phe Gln Tyr Glu Cys
210 215 220
Pro Gly Leu Phe Lys Leu Pro Ile Glu Asn Pro Leu Asn Asp Thr Val
225 230 235 240
Thr Ser Lys Trp Val Leu Leu Leu Ala Ile Asn Pro Gly Ser Pro Leu
245 250 255
Gly Gly Ser Ile Asn Glu Tyr Phe Ile Gly Asp Phe Asp Gly Thr Thr
260 265 270
Phe His Pro Asp Asp Gly Ala Thr Arg Phe Met Asp Ile Gly Lys Asp
275 280 285
Phe Tyr Ala Phe Gln Ser Phe Asp Asn Thr Glu Pro Glu Asp Gly Ala
290 295 300
Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asn Thr Val Pro
305 310 315 320
Thr Glu Asn Trp Arg Ser Ser Met Ser Leu Val Arg Asn Tyr Thr Leu
325 330 335
Lys Tyr Val Asp Val Asn Pro Glu Asn Tyr Gly Leu Thr Leu Ile Gln
340 345 350
Lys Pro Val Tyr Asp Thr Lys Glu Thr Arg Leu Asn Glu Thr Leu Lys
355 360 365
Thr Leu Glu Thr Ile Asn Glu Tyr Glu Val Asn Asp Leu Lys Leu Asp
370 375 380
Lys Ser Ser Phe Val Ala Thr Asp Phe Asn Thr Glu Arg Asn Ala Thr
385 390 395 400
Gly Val Phe Glu Phe Asp Leu Lys Phe Thr Gln Thr Asp Leu Lys Met
405 410 415
Gly Tyr Ser Asn Met Thr Thr Gln Phe Gly Leu Tyr Ile His Ser Gln
420 425 430
Thr Val Lys Gly Ser Gln Glu Thr Leu Gln Leu Val Phe Asp Thr Leu
435 440 445
Ser Thr Thr Trp Tyr Ile Asp Arg Thr Thr Gln His Ser Phe Gln Arg
450 455 460
Asn Ser Pro Val Phe Thr Glu Arg Ile Ser Thr Tyr Val Glu Lys Ile
465 470 475 480
Asp Thr Thr Asp Gln Gly Asn Val Tyr Thr Leu Tyr Gly Val Val Asp
485 490 495
Arg Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Ser Ile Ala Met Thr
500 505 510
Asn Thr Phe Phe Phe Arg Glu Gly Lys Ile Pro Thr Ser Phe Glu Val
515 520 525
Val Cys Asp Ser Glu Lys Ser Phe Ile Thr Ile Asp Glu Leu Ser Val
530 535 540
Arg Glu Leu Ala Arg Lys
545 550
<210> 23
<211> 533
<212> PRT
<213> Debaryomyces occidentalis
<400> 23
Met Val Gln Val Leu Ser Val Leu Val Ile Pro Leu Leu Thr Leu Phe
1 5 10 15
Phe Gly Tyr Val Ala Ser Ser Ser Ile Asp Leu Ser Val Asp Thr Ser
20 25 30
Glu Tyr Asn Arg Pro Leu Ile His Phe Thr Pro Glu Lys Gly Trp Met
35 40 45
Asn Asp Pro Asn Gly Leu Phe Tyr Asp Lys Thr Ala Lys Leu Trp His
50 55 60
Leu Tyr Phe Gln Tyr Asn Pro Asn Ala Thr Ala Trp Gly Gln Pro Leu
65 70 75 80
Tyr Trp Gly His Ala Thr Ser Asn Asp Leu Val His Trp Asp Glu His
85 90 95
Glu Ile Ala Ile Gly Pro Glu His Asp Asn Glu Gly Ile Phe Ser Gly
100 105 110
Ser Ile Val Val Asp His Asn Asn Thr Ser Gly Phe Phe Asn Ser Ser
115 120 125
Ile Asp Pro Asn Gln Arg Ile Val Ala Ile Tyr Thr Asn Asn Ile Pro
130 135 140
Asp Leu Gln Thr Gln Asp Ile Ala Phe Ser Leu Asp Gly Gly Tyr Thr
145 150 155 160
Phe Thr Lys Tyr Glu Asn Asn Pro Val Ile Asp Val Ser Ser Asn Gln
165 170 175
Phe Arg Asp Pro Lys Val Phe Trp His Glu Arg Phe Lys Ser Met Asp
180 185 190
His Gly Cys Ser Glu Ile Ala Arg Val Lys Ile Gln Ile Phe Gly Ser
195 200 205
Ala Asn Leu Lys Asn Trp Val Leu Asn Ser Asn Phe Ser Ser Gly Tyr
210 215 220
Tyr Gly Asn Gln Tyr Gly Met Ser Arg Leu Ile Glu Val Pro Ile Glu
225 230 235 240
Asn Ser Asp Lys Ser Lys Trp Val Met Phe Leu Ala Ile Asn Pro Gly
245 250 255
Ser Pro Leu Gly Gly Ser Ile Asn Gln Tyr Phe Val Gly Asp Phe Asp
260 265 270
Gly Phe Gln Phe Val Pro Asp Asp Ser Gln Thr Arg Phe Val Asp Ile
275 280 285
Gly Lys Asp Phe Tyr Ala Phe Gln Thr Phe Ser Glu Val Glu His Gly
290 295 300
Val Leu Gly Leu Ala Trp Ala Ser Asn Trp Gln Tyr Ala Asp Gln Val
305 310 315 320
Pro Thr Asn Pro Trp Arg Ser Ser Thr Ser Leu Ala Arg Asn Tyr Thr
325 330 335
Leu Arg Tyr Val Ile Gln Met Leu Lys Leu Thr Ala Asn Ile Asp Lys
340 345 350
Ser Val Leu Pro Asp Ser Ile Asn Val Val Asp Lys Leu Lys Lys Lys
355 360 365
Asn Val Lys Leu Thr Asn Lys Lys Pro Ile Lys Thr Asn Phe Lys Gly
370 375 380
Ser Thr Gly Leu Phe Asp Phe Asn Ile Thr Phe Lys Val Leu Asn Leu
385 390 395 400
Asn Val Ser Pro Gly Lys Thr His Phe Asp Ile Leu Ile Asn Ser Gln
405 410 415
Glu Leu Asn Ser Ser Val Asp Ser Ile Lys Ile Gly Phe Asp Ser Ser
420 425 430
Gln Ser Leu Phe Tyr Ile Asp Arg His Ile Pro Asn Val Glu Phe Pro
435 440 445
Arg Lys Gln Phe Phe Thr Asp Lys Leu Ala Ala Tyr Leu Glu Pro Leu
450 455 460
Asp Tyr Asp Gln Asp Leu Arg Val Phe Ser Leu Tyr Gly Ile Val Asp
465 470 475 480
Lys Asn Ile Ile Glu Leu Tyr Phe Asn Asp Gly Thr Val Ala Met Thr
485 490 495
Asn Thr Phe Phe Met Gly Glu Gly Lys Tyr Pro His Asp Ile Gln Ile
500 505 510
Val Thr Asp Thr Glu Glu Pro Leu Phe Glu Leu Glu Ser Val Ile Ile
515 520 525
Arg Glu Leu Asn Lys
530
<210> 24
<211> 654
<212> PRT
<213> Oryza sativa
<400> 24
Met Ala Thr Ser Arg Leu Thr Pro Ala Tyr Asp Leu Lys Asn Ala Ala
1 5 10 15
Ala Ala Val Tyr Thr Pro Leu Pro Glu Gln Pro His Ser Ala Glu Val
20 25 30
Glu Ile Arg Asp Arg Lys Pro Phe Lys Ile Ile Ser Ala Ile Ile Leu
35 40 45
Ser Ser Leu Leu Leu Leu Ala Leu Ile Leu Val Ala Val Asn Tyr Gln
50 55 60
Ala Pro Pro Ser His Ser Ser Gly Asp Asn Ser Gln Pro Ala Ala Val
65 70 75 80
Met Pro Pro Ser Arg Gly Val Ser Gln Gly Val Ser Glu Lys Ala Phe
85 90 95
Arg Gly Ala Ser Gly Ala Gly Asn Gly Val Ser Phe Ala Trp Ser Asn
100 105 110
Leu Met Leu Ser Trp Gln Arg Thr Ser Tyr His Phe Gln Pro Val Lys
115 120 125
Asn Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr
130 135 140
His Leu Phe Tyr Gln Tyr Asn Pro Asp Ser Ala Val Trp Gly Asn Ile
145 150 155 160
Thr Trp Gly His Ala Val Ser Thr Asp Leu Ile Asn Trp Leu His Leu
165 170 175
Pro Phe Ala Met Val Pro Asp Gln Trp Tyr Asp Val Asn Gly Val Trp
180 185 190
Thr Gly Ser Ala Thr Ile Leu Pro Asp Gly Arg Ile Val Met Leu Tyr
195 200 205
Thr Gly Asp Thr Asp Asp Tyr Val Gln Asp Gln Asn Leu Ala Phe Pro
210 215 220
Ala Asn Leu Ser Asp Pro Leu Leu Val Asp Trp Val Lys Tyr Pro Asn
225 230 235 240
Asn Pro Val Ile Tyr Pro Pro Pro Gly Ile Gly Val Lys Asp Phe Arg
245 250 255
Asp Pro Thr Thr Ala Gly Thr Ala Gly Met Gln Asn Gly Gln Arg Leu
260 265 270
Val Thr Ile Gly Ser Lys Val Gly Lys Thr Gly Ile Ser Leu Val Tyr
275 280 285
Glu Thr Thr Asn Phe Thr Thr Phe Lys Leu Leu Tyr Gly Val Leu His
290 295 300
Ala Val Pro Gly Thr Gly Met Trp Glu Cys Val Asp Leu Tyr Pro Val
305 310 315 320
Ser Thr Thr Gly Glu Asn Gly Leu Asp Thr Ser Val Asn Gly Leu Gly
325 330 335
Val Lys His Val Leu Lys Thr Ser Leu Asp Asp Asp Lys His Asp Tyr
340 345 350
Tyr Ala Leu Gly Thr Tyr Asp Pro Val Lys Asn Lys Trp Thr Pro Asp
355 360 365
Asn Pro Asp Leu Asp Val Gly Ile Gly Leu Arg Leu Asp Tyr Gly Lys
370 375 380
Tyr Tyr Ala Ala Arg Thr Phe Tyr Asp Gln Asn Lys Gln Arg Arg Ile
385 390 395 400
Leu Trp Gly Trp Ile Gly Glu Thr Asp Leu Glu Ala Val Asp Leu Met
405 410 415
Lys Gly Trp Ala Ser Leu Gln Ala Ile Pro Arg Thr Ile Val Phe Asp
420 425 430
Lys Lys Thr Gly Thr Asn Val Leu Gln Arg Pro Glu Glu Glu Val Glu
435 440 445
Ser Trp Ser Ser Gly Asp Pro Ile Thr Gln Arg Arg Ile Phe Glu Pro
450 455 460
Gly Ser Val Val Pro Ile His Val Ser Gly Ala Thr Gln Leu Asp Ile
465 470 475 480
Thr Ala Ser Phe Glu Val Asp Glu Thr Leu Leu Glu Thr Thr Ser Glu
485 490 495
Ser His Asp Ala Gly Tyr Asp Cys Ser Asn Ser Gly Gly Ala Gly Thr
500 505 510
Arg Gly Ser Leu Gly Pro Phe Gly Leu Leu Val Val Ala Asp Glu Lys
515 520 525
Leu Ser Glu Leu Thr Pro Val Tyr Leu Tyr Val Ala Lys Gly Gly Asp
530 535 540
Gly Lys Ala Lys Ala His Leu Cys Ala Tyr Gln Thr Arg Ser Ser Met
545 550 555 560
Ala Ser Gly Val Glu Lys Glu Val Tyr Gly Ser Ala Val Pro Val Leu
565 570 575
Asp Gly Glu Asn Tyr Ser Ala Arg Ile Leu Ile Asp His Ser Ile Val
580 585 590
Glu Ser Phe Ala Gln Ala Gly Arg Thr Cys Val Arg Ser Arg Asp Tyr
595 600 605
Pro Thr Lys Asp Ile Tyr Gly Ala Ala Arg Cys Phe Phe Phe Asn Asn
610 615 620
Ala Thr Glu Ala Ser Val Arg Ala Ser Leu Lys Ala Trp Gln Met Lys
625 630 635 640
Ser Phe Ile Arg Pro Tyr Pro Phe Ile Pro Asp Gln Lys Ser
645 650
<210> 25
<211> 690
<212> PRT
<213> Allium cepa
<400> 25
Met Ser Ser Asp Asp Leu Glu Ser Pro Pro Ser Ser Tyr Leu Pro Ile
1 5 10 15
Pro Pro Ser Asp Glu Phe His Asp Gln Pro Pro Pro Leu Arg Ser Trp
20 25 30
Leu Arg Leu Leu Ser Ile Pro Leu Ala Leu Met Phe Leu Leu Phe Leu
35 40 45
Ala Thr Phe Leu Ser Asn Leu Glu Ser Pro Pro Ser Asp Ser Gly Leu
50 55 60
Val Ser Asp Pro Val Thr Phe Asp Val Asn Pro Ala Val Val Arg Arg
65 70 75 80
Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser Gly
85 90 95
Phe Val Leu Asp Pro Val Ala Val Asp Ala Asn Ser Val Val Val His
100 105 110
Arg Gly Lys Asp Ala Gly Val Ser Asp Lys Thr Ser Gly Val Asp Ser
115 120 125
Gly Leu Leu Lys Asp Ser Pro Leu Gly Pro Tyr Pro Trp Thr Asn Gln
130 135 140
Met Leu Ser Trp Gln Arg Thr Gly Phe His Phe Gln Pro Val Lys Asn
145 150 155 160
Trp Met Asn Asp Pro Asn Gly Pro Leu Tyr Tyr Lys Gly Trp Tyr His
165 170 175
Phe Phe Tyr Gln Tyr Asn Pro Glu Gly Ala Val Trp Gly Asn Ile Ala
180 185 190
Trp Gly His Ala Val Ser Arg Asp Leu Val His Trp Thr His Leu Pro
195 200 205
Leu Ala Met Val Pro Asp Gln Trp Tyr Asp Ile Asn Gly Val Trp Thr
210 215 220
Gly Ser Ala Thr Ile Leu Pro Asp Gly Gln Ile Val Met Leu Tyr Thr
225 230 235 240
Gly Ala Thr Asn Glu Ser Val Gln Val Gln Asn Leu Ala Val Pro Ala
245 250 255
Asp Gln Ser Asp Thr Leu Leu Leu Arg Trp Lys Lys Ser Glu Ala Asn
260 265 270
Pro Ile Leu Val Pro Pro Pro Gly Ile Gly Asp Lys Asp Phe Arg Asp
275 280 285
Pro Thr Thr Ala Trp Tyr Glu Pro Ser Asp Asp Thr Trp Arg Ile Val
290 295 300
Ile Gly Ser Lys Asp Ser Ser His Ser Gly Ile Ala Ile Val Tyr Ser
305 310 315 320
Thr Lys Asp Phe Ile Asn Tyr Lys Leu Ile Pro Gly Ile Leu His Ala
325 330 335
Val Glu Arg Val Gly Met Trp Glu Cys Val Asp Phe Tyr Pro Val Ala
340 345 350
Thr Ala Asp Ser Ser His Ala Asn His Gly Leu Asp Pro Ser Ala Arg
355 360 365
Pro Ser Pro Ala Val Lys His Val Leu Lys Ala Ser Met Asp Asp Asp
370 375 380
Arg His Asp Tyr Tyr Ala Ile Gly Thr Tyr Asp Pro Ala Gln Asn Thr
385 390 395 400
Trp Val Pro Asp Asp Ala Ser Val Asp Val Gly Ile Gly Leu Arg Tyr
405 410 415
Asp Trp Gly Lys Phe Tyr Ala Ser Lys Thr Phe Tyr Asp His Ala Lys
420 425 430
Lys Arg Arg Ile Leu Trp Ser Trp Ile Gly Glu Thr Asp Ser Glu Thr
435 440 445
Ala Asp Ile Ala Lys Gly Trp Ala Ser Leu Gln Gly Val Pro Arg Thr
450 455 460
Val Leu Leu Asp Val Lys Thr Gly Ser Asn Leu Ile Thr Trp Pro Val
465 470 475 480
Val Glu Ile Glu Ser Leu Arg Thr Arg Pro Arg Asp Phe Ser Gly Ile
485 490 495
Thr Val Asp Ala Gly Ser Thr Phe Lys Leu Asp Val Gly Gly Ala Ala
500 505 510
Gln Leu Asp Ile Glu Ala Glu Phe Lys Ile Ser Ser Glu Glu Leu Glu
515 520 525
Ala Val Lys Glu Ala Asp Val Ser Tyr Asn Cys Ser Ser Ser Gly Gly
530 535 540
Ala Ala Glu Arg Gly Val Leu Gly Pro Phe Gly Leu Leu Val Leu Ala
545 550 555 560
Asn Gln Asp Leu Thr Glu Gln Thr Ala Thr Tyr Phe Tyr Val Ser Arg
565 570 575
Gly Met Asp Gly Gly Leu Asn Thr His Phe Cys Gln Asp Glu Lys Arg
580 585 590
Ser Ser Lys Ala Ser Asp Ile Val Lys Arg Ile Val Gly His Ser Val
595 600 605
Pro Val Leu Asp Gly Glu Ser Phe Ala Leu Arg Ile Leu Val Asp His
610 615 620
Ser Ile Val Glu Ser Phe Ala Gln Gly Gly Arg Ala Ser Ala Thr Ser
625 630 635 640
Arg Val Tyr Pro Thr Glu Ala Ile Tyr Asn Asn Ala Arg Val Phe Val
645 650 655
Phe Asn Asn Ala Thr Gly Ala Lys Val Thr Ala Gln Ser Leu Lys Val
660 665 670
Trp His Met Ser Thr Ala Ile Asn Glu Ile Tyr Asp Pro Ala Thr Ser
675 680 685
Val Met
690
<210> 26
<211> 501
<212> PRT
<213> Beta vulgaris
<220>
<221> misc_feature
<222> (382)..(382)
<223> Xaa can be any naturally occurring amino acid
<400> 26
Leu Phe Tyr Gln Tyr Asn Pro Asn Gly Val Ile Trp Gly Pro Pro Val
1 5 10 15
Trp Gly His Ser Thr Ser Lys Asp Leu Val Asn Trp Val Pro Gln Pro
20 25 30
Leu Thr Met Glu Pro Glu Met Ala Ala Asn Ile Asn Gly Ser Trp Ser
35 40 45
Gly Ser Ala Thr Ile Leu Pro Gly Asn Lys Pro Ala Ile Leu Phe Thr
50 55 60
Gly Leu Asp Pro Lys Tyr Glu Gln Val Gln Val Leu Ala Tyr Pro Lys
65 70 75 80
Asp Thr Ser Asp Pro Asn Leu Lys Glu Trp Phe Leu Ala Pro Gln Asn
85 90 95
Pro Val Met Phe Pro Thr Pro Gln Asn Gln Ile Asn Ala Thr Ser Phe
100 105 110
Arg Asp Pro Thr Thr Ala Trp Arg Leu Pro Asp Gly Val Trp Arg Leu
115 120 125
Leu Ile Gly Ser Lys Arg Gly Gln Arg Gly Leu Ser Leu Leu Phe Arg
130 135 140
Ser Arg Asp Phe Val His Trp Val Gln Ala Lys His Pro Leu Tyr Ser
145 150 155 160
Asp Lys Leu Ser Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Tyr
165 170 175
Ala Asn Gly Asp Gln Met Gly Val Asp Thr Ser Ile Ile Gly Ser His
180 185 190
Val Lys His Val Leu Lys Asn Ser Leu Asp Ile Thr Lys His Asp Ile
195 200 205
Tyr Thr Ile Gly Asp Tyr Asn Ile Lys Lys Asp Ala Tyr Thr Pro Asp
210 215 220
Ile Gly Tyr Met Asn Asp Ser Ser Leu Arg Tyr Asp Tyr Gly Lys Tyr
225 230 235 240
Tyr Ala Ser Lys Thr Phe Phe Asp Asp Ala Lys Lys Glu Arg Ile Leu
245 250 255
Leu Gly Trp Ala Asn Glu Ser Ser Ser Val Glu Asp Asp Ile Lys Lys
260 265 270
Gly Trp Ser Gly Ile His Thr Ile Pro Arg Lys Ile Trp Leu Asp Lys
275 280 285
Leu Gly Lys Gln Leu Ile Gln Trp Pro Ile Ala Asn Ile Glu Lys Leu
290 295 300
Arg Gln Lys Pro Val Asn Ile Tyr Arg Lys Val Leu Lys Gly Gly Ser
305 310 315 320
Gln Ile Glu Val Ser Gly Ile Thr Ala Ala Gln Ala Asp Val Glu Ile
325 330 335
Ser Phe Lys Ile Lys Asp Leu Lys Asn Val Glu Lys Phe Asp Ala Ser
340 345 350
Trp Thr Ser Pro Gln Leu Leu Cys Ser Lys Lys Gly Ala Ser Val Lys
355 360 365
Gly Gly Leu Gly Pro Phe Gly Leu Leu Thr Leu Ala Ser Xaa Gly Leu
370 375 380
Glu Glu Tyr Thr Ala Val Phe Phe Arg Ile Phe Lys Ala Tyr Asp Asn
385 390 395 400
Lys Phe Val Val Leu Met Cys Ser Asp Gln Ser Arg Ser Ser Leu Asn
405 410 415
Pro Thr Asn Asp Lys Thr Thr Tyr Gly Thr Phe Val Asp Val Asn Pro
420 425 430
Ile Arg Glu Gly Leu Ser Leu Arg Val Leu Ile Asp His Ser Val Val
435 440 445
Glu Ser Phe Gly Ala Lys Gly Lys Asn Val Ile Thr Ala Arg Val Tyr
450 455 460
Pro Thr Leu Ala Ile Asn Glu Lys Ala His Leu Tyr Val Phe Asn Arg
465 470 475 480
Gly Thr Ser Asn Val Glu Ile Thr Gly Leu Thr Ala Trp Ser Met Lys
485 490 495
Lys Ala Asn Ile Ala
500
<210> 27
<211> 518
<212> PRT
<213> Bifidobacterium breve
<400> 27
Met Thr Asp Phe Thr Pro Glu Thr Pro Val Leu Thr Pro Ile Arg Asp
1 5 10 15
His Ala Ala Glu Leu Ala Lys Ala Glu Ala Gly Val Ala Glu Met Ala
20 25 30
Ala Lys Arg Asn Asn Arg Trp Tyr Pro Lys Tyr His Ile Ala Ser Asn
35 40 45
Gly Gly Trp Ile Asn Asp Pro Asn Gly Leu Cys Phe Tyr Lys Gly Arg
50 55 60
Trp His Val Phe Tyr Gln Leu His Pro Tyr Gly Thr Gln Trp Gly Pro
65 70 75 80
Met His Trp Gly His Val Ser Ser Thr Asp Met Leu Asn Trp Lys Arg
85 90 95
Glu Pro Ile Met Phe Ala Pro Ser Leu Glu Gln Glu Lys Asp Gly Val
100 105 110
Phe Ser Gly Ser Ala Val Ile Asp Asp Asn Gly Asp Leu Arg Phe Tyr
115 120 125
Tyr Thr Gly His Arg Trp Ala Asn Gly His Asp Asn Thr Gly Gly Asp
130 135 140
Trp Gln Val Gln Met Thr Ala Leu Pro Asp Asn Asp Glu Leu Thr Ser
145 150 155 160
Ala Thr Lys Gln Gly Met Ile Ile Asp Cys Pro Thr Asp Lys Val Asp
165 170 175
His His Tyr Arg Asp Pro Lys Val Trp Lys Thr Gly Asp Thr Trp Tyr
180 185 190
Met Thr Phe Gly Val Ser Ser Glu Asp Lys Arg Gly Gln Met Trp Leu
195 200 205
Phe Ser Ser Lys Asp Met Val Arg Trp Glu Tyr Glu Arg Val Leu Phe
210 215 220
Gln His Pro Asp Pro Asp Val Phe Met Leu Glu Cys Pro Asp Phe Phe
225 230 235 240
Pro Ile Lys Asp Lys Asp Gly Asn Glu Lys Trp Val Ile Gly Phe Ser
245 250 255
Ala Met Gly Ser Lys Pro Ser Gly Phe Met Asn Arg Asn Val Asn Asn
260 265 270
Ala Gly Tyr Met Ile Gly Thr Trp Glu Pro Gly Gly Glu Phe Lys Pro
275 280 285
Glu Thr Glu Phe Arg Leu Trp Asp Cys Gly His Asn Tyr Tyr Ala Pro
290 295 300
Gln Ser Phe Asn Val Asp Gly Arg Gln Ile Val Tyr Gly Trp Met Ser
305 310 315 320
Pro Phe Val Gln Pro Ile Pro Met Glu Asp Asp Gly Trp Cys Gly Gln
325 330 335
Leu Thr Leu Pro Arg Glu Ile Thr Leu Asp Asp Asp Gly Asp Val Val
340 345 350
Thr Ala Pro Val Ala Glu Met Glu Gly Leu Arg Glu Asp Thr Leu Asp
355 360 365
His Gly Ser Ile Thr Leu Asp Met Asp Gly Glu Gln Val Ile Ala Asp
370 375 380
Asp Ala Glu Ala Val Glu Ile Glu Met Thr Ile Asp Leu Ala Ala Ser
385 390 395 400
Thr Ala Asp Arg Ala Gly Leu Lys Ile His Ala Thr Glu Asp Gly Ala
405 410 415
Tyr Thr Tyr Val Ala Tyr Asp Asp Gln Ile Gly Arg Val Val Val Asp
420 425 430
Arg Gln Ala Met Ala Asn Gly Asp His Gly Tyr Arg Ala Ala Pro Leu
435 440 445
Thr Asp Ala Glu Leu Ala Ser Gly Lys Leu Asp Leu Arg Val Phe Val
450 455 460
Asp Arg Gly Ser Val Glu Val Tyr Val Asn Gly Gly His Gln Val Leu
465 470 475 480
Ser Ser Tyr Ser Tyr Ala Ser Glu Gly Pro Arg Ala Ile Lys Leu Val
485 490 495
Ala Glu Phe Gly Asn Leu Lys Val Glu Ser Leu Lys Leu His His Met
500 505 510
Lys Ser Ile Gly Leu Glu
515
<210> 28
<211> 532
<212> PRT
<213> Saccharomyces cerevisae
<400> 28
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala Ser Met Thr Asn Glu Thr Ser Asp Arg Pro Leu Val His
20 25 30
Phe Thr Pro Asn Lys Gly Trp Met Asn Asp Pro Asn Gly Leu Trp Tyr
35 40 45
Asp Glu Lys Asp Ala Lys Trp His Leu Tyr Phe Gln Tyr Asn Pro Asn
50 55 60
Asp Thr Val Trp Gly Thr Pro Leu Phe Trp Gly His Ala Thr Ser Asp
65 70 75 80
Asp Leu Thr Asn Trp Glu Asp Gln Pro Ile Ala Ile Ala Pro Lys Arg
85 90 95
Asn Asp Ser Gly Ala Phe Ser Gly Ser Met Val Val Asp Tyr Asn Asn
100 105 110
Thr Ser Gly Phe Phe Asn Asp Thr Ile Asp Pro Arg Gln Arg Cys Val
115 120 125
Ala Ile Trp Thr Tyr Asn Thr Pro Glu Ser Glu Glu Gln Tyr Ile Ser
130 135 140
Tyr Ser Leu Asp Gly Gly Tyr Thr Phe Thr Glu Tyr Gln Lys Asn Pro
145 150 155 160
Val Leu Ala Ala Asn Ser Thr Gln Phe Arg Asp Pro Lys Val Phe Trp
165 170 175
Tyr Glu Pro Ser Gln Lys Trp Ile Met Thr Ala Ala Lys Ser Gln Asp
180 185 190
Tyr Lys Ile Glu Ile Tyr Ser Ser Asp Asp Leu Lys Ser Trp Lys Leu
195 200 205
Glu Ser Ala Phe Ala Asn Glu Gly Phe Leu Gly Tyr Gln Tyr Glu Cys
210 215 220
Pro Gly Leu Ile Glu Val Pro Thr Glu Gln Asp Pro Ser Lys Ser Tyr
225 230 235 240
Trp Val Met Phe Ile Ser Ile Asn Pro Gly Ala Pro Ala Gly Gly Ser
245 250 255
Phe Asn Gln Tyr Phe Val Gly Ser Phe Asn Gly Thr His Phe Glu Ala
260 265 270
Phe Asp Asn Gln Ser Arg Val Val Asp Phe Gly Lys Asp Tyr Tyr Ala
275 280 285
Leu Gln Thr Phe Phe Asn Thr Asp Pro Thr Tyr Gly Ser Ala Leu Gly
290 295 300
Ile Ala Trp Ala Ser Asn Trp Glu Tyr Ser Ala Phe Val Pro Thr Asn
305 310 315 320
Pro Trp Arg Ser Ser Met Ser Leu Val Arg Lys Phe Ser Leu Asn Thr
325 330 335
Glu Tyr Gln Ala Asn Pro Glu Thr Glu Leu Ile Asn Leu Lys Ala Glu
340 345 350
Pro Ile Leu Asn Ile Ser Asn Ala Gly Pro Trp Ser Arg Phe Ala Thr
355 360 365
Asn Thr Thr Leu Thr Lys Ala Asn Ser Tyr Asn Val Asp Leu Ser Asn
370 375 380
Ser Thr Gly Thr Leu Glu Phe Glu Leu Val Tyr Ala Val Asn Thr Thr
385 390 395 400
Gln Thr Ile Ser Lys Ser Val Phe Ala Asp Leu Ser Leu Trp Phe Lys
405 410 415
Gly Leu Glu Asp Pro Glu Glu Tyr Leu Arg Met Gly Phe Glu Val Ser
420 425 430
Ala Ser Ser Phe Phe Leu Asp Arg Gly Asn Ser Lys Val Lys Phe Val
435 440 445
Lys Glu Asn Pro Tyr Phe Thr Asn Arg Met Ser Val Asn Asn Gln Pro
450 455 460
Phe Lys Ser Glu Asn Asp Leu Ser Tyr Tyr Lys Val Tyr Gly Leu Leu
465 470 475 480
Asp Gln Asn Ile Leu Glu Leu Tyr Phe Asn Asp Gly Asp Val Val Ser
485 490 495
Thr Asn Thr Tyr Phe Met Thr Thr Gly Asn Ala Leu Gly Ser Val Asn
500 505 510
Met Thr Thr Gly Val Asp Asn Leu Phe Tyr Ile Asp Lys Phe Gln Val
515 520 525
Arg Glu Val Lys
530
<210> 29
<211> 512
<212> PRT
<213> Zymomonas mobilis
<400> 29
Met Glu Ser Pro Ser Tyr Lys Asn Leu Ile Lys Ala Glu Asp Ala Gln
1 5 10 15
Lys Lys Ala Gly Lys Arg Leu Leu Ser Ser Glu Trp Tyr Pro Gly Phe
20 25 30
His Val Thr Pro Leu Thr Gly Trp Met Asn Asp Pro Asn Gly Leu Ile
35 40 45
Phe Phe Lys Gly Glu Tyr His Leu Phe Tyr Gln Tyr Tyr Pro Phe Ala
50 55 60
Pro Val Trp Gly Pro Met His Trp Gly His Ala Lys Ser Arg Asp Leu
65 70 75 80
Val His Trp Glu Thr Leu Pro Val Ala Leu Ala Pro Gly Asp Leu Phe
85 90 95
Asp Arg Asp Gly Cys Phe Ser Gly Cys Ala Val Asp Asn Asn Gly Val
100 105 110
Leu Thr Leu Ile Tyr Thr Gly His Ile Val Leu Ser Asn Asp Ser Pro
115 120 125
Asp Ala Ile Arg Glu Val Gln Cys Met Ala Thr Ser Ile Asp Gly Ile
130 135 140
His Phe Gln Lys Glu Gly Ile Val Leu Glu Lys Ala Pro Met Pro Gln
145 150 155 160
Val Ala His Phe Arg Asp Pro Arg Val Trp Lys Glu Asn Asp His Trp
165 170 175
Phe Met Val Val Gly Tyr Arg Thr Asp Asp Glu Lys His Gln Gly Ile
180 185 190
Gly His Val Ala Leu Tyr Arg Ser Glu Asn Leu Lys Asp Trp Ile Phe
195 200 205
Val Lys Thr Leu Leu Gly Asp Asn Ser Gln Leu Pro Leu Gly Lys Arg
210 215 220
Ala Phe Met Trp Glu Cys Pro Asp Phe Phe Ser Leu Gly Asn Arg Ser
225 230 235 240
Val Leu Met Phe Ser Pro Gln Gly Leu Lys Ala Ser Gly Tyr Lys Asn
245 250 255
Arg Asn Leu Phe Gln Asn Gly Tyr Ile Leu Gly Lys Trp Gln Ala Pro
260 265 270
Gln Phe Thr Pro Glu Thr Ser Phe Gln Glu Leu Asp Tyr Gly His Asp
275 280 285
Phe Tyr Ala Ala Gln Arg Phe Glu Ala Lys Asp Gly Arg Gln Ile Leu
290 295 300
Ile Ala Trp Phe Asp Met Trp Glu Asn Gln Lys Pro Ser Gln Arg Asp
305 310 315 320
Gly Trp Ala Gly Cys Met Thr Leu Pro Arg Lys Leu Asp Leu Ile Asp
325 330 335
Asn Lys Ile Val Met Thr Pro Val Arg Glu Met Glu Ile Leu Arg Gln
340 345 350
Ser Glu Lys Ile Glu Ser Val Val Thr Leu Ser Asp Ala Glu His Pro
355 360 365
Phe Thr Met Asp Ser Pro Leu Gln Glu Ile Glu Leu Ile Phe Asp Leu
370 375 380
Glu Lys Ser Ser Ala Tyr Gln Ala Gly Leu Ala Leu Arg Cys Asn Gly
385 390 395 400
Lys Gly Gln Glu Thr Leu Leu Tyr Ile Asp Arg Ser Gln Asn Arg Ile
405 410 415
Ile Leu Asp Arg Asn Arg Ser Gly Gln Asn Val Lys Gly Ile Arg Ser
420 425 430
Cys Pro Leu Pro Asn Thr Ser Lys Val Arg Leu His Ile Phe Leu Asp
435 440 445
Arg Ser Ser Ile Glu Ile Phe Val Gly Asp Asp Gln Thr Gln Gly Leu
450 455 460
Tyr Ser Ile Ser Ser Arg Ile Phe Pro Asp Lys Asp Ser Leu Lys Gly
465 470 475 480
Arg Leu Phe Ala Ile Glu Gly Tyr Ala Val Phe Asp Ser Phe Lys Arg
485 490 495
Trp Thr Leu Gln Asp Ala Asn Leu Ala Ala Phe Ser Ser Asp Ala Cys
500 505 510
<210> 30
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 30
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Asp Trp Ser Met Leu Phe Ala Val Ile
35 40 45
Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp
50 55 60
Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu Asp Asp His Phe Gly Pro
65 70 75 80
His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val
85 90 95
Gly Pro Asp Arg Ser Thr Ser Ile Val Ala Val Met Asn His Leu Gln
100 105 110
Glu Ala Ala Leu Asn His Ala Lys Ser Val Gly Ile Leu Gly Asp Gly
115 120 125
Phe Gly Thr Thr Leu Glu Met Ser Lys Arg Asp Leu Ile Trp Val Val
130 135 140
Lys Arg Thr His Val Ala Val Glu Arg Tyr Pro Ala Trp Gly Asp Thr
145 150 155 160
Val Glu Val Glu Cys Trp Val Gly Ala Ser Gly Asn Asn Gly Arg Arg
165 170 175
His Asp Phe Leu Val Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg
180 185 190
Cys Thr Ser Leu Ser Val Met Met Asn Thr Arg Thr Arg Arg Leu Ser
195 200 205
Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp
210 215 220
Asn Val Ala Val Lys Asp Glu Glu Ile Lys Lys Pro Gln Lys Leu Asn
225 230 235 240
Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn
245 250 255
Asp Leu Asp Ile Asn Gln His Val Asn Asn Ile Lys Tyr Val Asp Trp
260 265 270
Ile Leu Glu Thr Val Pro Asp Ser Ile Phe Glu Ser His His Ile Ser
275 280 285
Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys Thr Met Asp Ser Val Leu
290 295 300
Gln Ser Leu Thr Thr Val Ser Gly Gly Ser Ser Glu Ala Gly Leu Val
305 310 315 320
Cys Glu His Leu Leu Gln Leu Glu Gly Gly Ser Glu Val Leu Arg Ala
325 330 335
Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser
340 345 350
Val Ile Pro Ala Glu Ser Ser Val
355 360
<210> 31
<211> 4653
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucelotide
<400> 31
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
tccgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa ccccccccag 3300
ctgctggacg accacttcgg cccccacggc ctggtgttcc gccgcacctt cgccatccgc 3360
agctacgagg tgggccccga ccgctccacc agcatcgtgg ccgtgatgaa ccacctgcag 3420
gaggccgccc tgaaccacgc caagtccgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatctgg gtggtgaagc gcacccacgt ggccgtggag 3540
cgctaccccg cctggggcga caccgtggag gtggagtgct gggtgggcgc ctccggcaac 3600
aacggccgcc gccacgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgat gatgaacacc cgcacccgcc gcctgagcaa gatccccgag 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgaggag 3780
atcaagaagc cccagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga catcaaccag cacgtgaaca acatcaagta cgtggactgg 3900
atcctggaga ccgtgcccga cagcatcttc gagagccacc acatctcctc cttcaccatc 3960
gagtaccgcc gcgagtgcac catggacagc gtgctgcagt ccctgaccac cgtgagcggc 4020
ggctcctccg aggccggcct ggtgtgcgag cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg ccaagaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagtccag cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620
aagtagtggg atgggaacac aaatggaaag ctt 4653
<210> 32
<211> 366
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 32
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Gln Leu Pro Asp Trp Ser Arg Leu Leu Thr
35 40 45
Ala Ile Thr Thr Val Phe Val Lys Ser Lys Arg Pro Asp Met His Asp
50 55 60
Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Phe Gly Leu Glu
65 70 75 80
Ser Thr Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile Arg
85 90 95
Ser Tyr Glu Ile Gly Thr Asp Arg Thr Ala Ser Ile Glu Thr Leu Met
100 105 110
Asn His Leu Gln Glu Thr Ser Leu Asn His Cys Lys Ser Thr Gly Ile
115 120 125
Leu Leu Asp Gly Phe Gly Arg Thr Leu Glu Met Cys Lys Arg Asp Leu
130 135 140
Ile Trp Val Val Ile Lys Met Gln Ile Lys Val Asn Arg Tyr Pro Ala
145 150 155 160
Trp Gly Asp Thr Val Glu Ile Asn Thr Arg Phe Ser Arg Leu Gly Lys
165 170 175
Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu
180 185 190
Ile Leu Val Arg Ala Thr Ser Ala Tyr Ala Met Met Asn Gln Lys Thr
195 200 205
Arg Arg Leu Ser Lys Leu Pro Tyr Glu Val His Gln Glu Ile Val Pro
210 215 220
Leu Phe Val Asp Ser Pro Val Ile Glu Asp Ser Asp Leu Lys Val His
225 230 235 240
Lys Phe Lys Val Lys Thr Gly Asp Ser Ile Gln Lys Gly Leu Thr Pro
245 250 255
Gly Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys Tyr
260 265 270
Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu Thr Gln
275 280 285
Glu Leu Cys Ser Leu Ala Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp
290 295 300
Ser Val Leu Glu Ser Val Thr Ala Met Asp Pro Ser Lys Val Gly Val
305 310 315 320
Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Ala Ile
325 330 335
Val Asn Gly Ala Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly
340 345 350
Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Val Ser
355 360 365
<210> 33
<211> 4668
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 33
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240
gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300
ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360
ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420
aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480
ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540
atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600
cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660
atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720
aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780
gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840
ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900
atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960
ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020
atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080
ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140
gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200
gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 4668
<210> 34
<211> 360
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 34
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Asp Trp Ser Met Leu Phe Ala Val Ile
35 40 45
Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln Trp Thr Asn Leu Glu Trp
50 55 60
Lys Pro Lys Pro Lys Leu Pro Gln Leu Leu Asp Asp His Phe Gly Leu
65 70 75 80
His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile Arg Ser Tyr Glu Val
85 90 95
Gly Pro Asp Arg Ser Thr Ser Ile Leu Ala Val Met Asn His Met Gln
100 105 110
Glu Ala Thr Leu Asn His Ala Lys Ser Val Gly Ile Leu Gly Asp Gly
115 120 125
Phe Gly Thr Thr Leu Glu Met Ser Lys Arg Asp Leu Met Trp Val Val
130 135 140
Arg Arg Thr His Val Ala Val Glu Arg Tyr Pro Thr Trp Gly Asp Thr
145 150 155 160
Val Glu Val Glu Cys Trp Ile Gly Ala Ser Gly Asn Asn Gly Met Arg
165 170 175
Arg Asp Phe Leu Val Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg
180 185 190
Cys Thr Ser Leu Ser Val Leu Met Asn Thr Arg Thr Arg Arg Leu Ser
195 200 205
Thr Ile Pro Asp Glu Val Arg Gly Glu Ile Gly Pro Ala Phe Ile Asp
210 215 220
Asn Val Ala Val Lys Asp Asp Glu Ile Lys Lys Leu Gln Lys Leu Asn
225 230 235 240
Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Leu Thr Pro Arg Trp Asn
245 250 255
Asp Leu Asp Val Asn Gln His Val Asn Asn Leu Lys Tyr Val Ala Trp
260 265 270
Val Phe Glu Thr Val Pro Asp Ser Ile Phe Glu Ser His His Ile Ser
275 280 285
Ser Phe Thr Leu Glu Tyr Arg Arg Glu Cys Thr Arg Asp Ser Val Leu
290 295 300
Arg Ser Leu Thr Thr Val Ser Gly Gly Ser Ser Glu Ala Gly Leu Val
305 310 315 320
Cys Asp His Leu Leu Gln Leu Glu Gly Gly Ser Glu Val Leu Arg Ala
325 330 335
Arg Thr Glu Trp Arg Pro Lys Leu Thr Asp Ser Phe Arg Gly Ile Ser
340 345 350
Val Ile Pro Ala Glu Pro Arg Val
355 360
<210> 35
<211> 4653
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 35
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300
ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360
tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420
gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540
cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600
aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780
atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900
gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960
gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020
ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgatgac tcgaggcagc agcagctcgg 4260
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 4320
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 4380
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 4440
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 4500
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 4560
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 4620
aagtagtggg atgggaacac aaatggaaag ctt 4653
<210> 36
<211> 393
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 36
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Ala Asn Gly Ser Ala Val Thr Leu Lys
35 40 45
Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Leu Ser Ser Ser Pro Pro
50 55 60
Pro Arg Ala Phe Phe Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Thr
65 70 75 80
Ala Ile Thr Thr Val Phe Val Ala Pro Glu Lys Arg Trp Thr Met Phe
85 90 95
Asp Arg Lys Ser Lys Arg Pro Asn Met Leu Met Asp Ser Phe Gly Leu
100 105 110
Glu Arg Val Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile
115 120 125
Arg Ser Tyr Glu Ile Cys Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
130 135 140
Met Asn His Val Gln Glu Thr Ser Leu Asn Gln Cys Lys Ser Ile Gly
145 150 155 160
Leu Leu Asp Asp Gly Phe Gly Arg Ser Pro Glu Met Cys Lys Arg Asp
165 170 175
Leu Ile Trp Val Val Thr Arg Met Lys Ile Met Val Asn Arg Tyr Pro
180 185 190
Thr Trp Gly Asp Thr Ile Glu Val Ser Thr Trp Leu Ser Gln Ser Gly
195 200 205
Lys Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
210 215 220
Glu Ile Leu Val Arg Ala Thr Ser Val Tyr Ala Met Met Asn Gln Lys
225 230 235 240
Thr Arg Arg Phe Ser Lys Leu Pro His Glu Val Arg Gln Glu Phe Ala
245 250 255
Pro His Phe Leu Asp Ser Pro Pro Ala Ile Glu Asp Asn Asp Gly Lys
260 265 270
Leu Gln Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly Leu
275 280 285
Thr Pro Gly Trp Tyr Asp Leu Asp Val Asn Gln His Val Ser Asn Val
290 295 300
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu
305 310 315 320
Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
325 330 335
Arg Asp Ser Val Leu Glu Ser Val Thr Ser Met Asp Pro Ser Lys Val
340 345 350
Gly Asp Arg Phe Gln Tyr Arg His Leu Leu Arg Leu Glu Asp Gly Ala
355 360 365
Asp Ile Met Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Thr
370 375 380
Asn Gly Ala Ile Ser Thr Gly Lys Thr
385 390
<210> 37
<211> 4686
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 37
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggct atcaagacga acaggcagcc tgtggagaag 3120
cctccgttca cgatcgggac gctgcgcaag gccatccccg cgcactgttt cgagcgctcg 3180
gcgcttcgtg ggcgcgcccc cgcgaacggc agcgcggtga ccctgaagtc gggctccctg 3240
aacacccagg aggacacgct gagctcgtcc cccccccccc gcgcgttctt caaccagctg 3300
cccgactgga gcatgctgct gaccgcgatc accacggtct tcgtggcgcc cgagaagcgc 3360
tggaccatgt tcgaccgcaa gtcgaagcgc cccaacatgc tgatggactc cttcggcctg 3420
gagcgcgtgg tccaggacgg cctggtgttc cgccagagct tctcgatccg ctcctacgag 3480
atctgcgcgg accgcaccgc gagcatcgag acggtgatga accacgtcca ggagacctcg 3540
ctgaaccagt gcaagtccat cggcctgctg gacgacggct tcggccgcag ccccgagatg 3600
tgcaagcgcg acctgatctg ggtggtcacc cgcatgaaga tcatggtgaa ccgctacccc 3660
acgtggggcg acaccatcga ggtctcgacg tggctgtccc agagcggcaa gatcggcatg 3720
ggccgcgact ggctgatctc ggactgcaac accggcgaga tcctggtgcg cgcgacgtcc 3780
gtctacgcga tgatgaacca gaagacccgc cgcttcagca agctgcccca cgaggtgcgc 3840
caggagttcg cgccccactt cctggactcg ccccccgcga tcgaggacaa cgacggcaag 3900
ctgcagaagt tcgacgtcaa gacgggcgac tccatccgca agggcctgac ccccggctgg 3960
tacgacctgg acgtgaacca gcacgtgagc aacgtcaagt acatcggctg gatcctggag 4020
tcgatgccca ccgaggtcct ggagacgcag gagctgtgct ccctgaccct ggagtaccgc 4080
cgcgagtgcg gccgcgactc ggtgctggag agcgtcacca gcatggaccc ctcgaaggtg 4140
ggcgaccgct tccagtaccg ccacctgctg cgcctggagg acggcgcgga catcatgaag 4200
ggccgcaccg agtggcgccc caagaacgcg ggcacgaacg gcgcgatctc caccggcaag 4260
acgtgactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 4320
gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 4380
aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 4440
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4500
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4560
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 4620
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctt 4680
gagctc 4686
<210> 38
<211> 408
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 38
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Pro Ala Asn Gly Ser Ala Val Asn Leu Lys
35 40 45
Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro Pro Pro
50 55 60
Arg Ala Phe Leu Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Thr Ala
65 70 75 80
Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met Leu Asp
85 90 95
Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Val Gly Leu Lys
100 105 110
Ser Ile Val Arg Asp Gly Leu Val Ser Arg Gln Ser Phe Leu Ile Arg
115 120 125
Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met
130 135 140
Asn His Leu Gln Glu Thr Ser Ile Asn His Cys Lys Ser Leu Gly Leu
145 150 155 160
Leu Asn Asp Gly Phe Gly Arg Thr Pro Gly Met Cys Lys Asn Asp Leu
165 170 175
Ile Trp Val Leu Thr Lys Met Gln Ile Met Val Asn Arg Tyr Pro Thr
180 185 190
Trp Gly Asp Thr Val Glu Ile Asn Thr Trp Phe Ser Gln Ser Gly Lys
195 200 205
Ile Gly Met Ala Ser Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly Glu
210 215 220
Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr
225 230 235 240
Arg Arg Phe Ser Arg Leu Pro Tyr Glu Val Arg Gln Glu Leu Thr Pro
245 250 255
His Phe Val Asp Ser Pro His Val Ile Glu Asp Asn Asp Gln Lys Leu
260 265 270
His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly Leu Thr
275 280 285
Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys
290 295 300
Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Ile Glu Val Leu Glu Thr
305 310 315 320
Gln Glu Leu Cys Ser Leu Thr Val Glu Tyr Arg Arg Glu Cys Gly Met
325 330 335
Asp Ser Val Leu Glu Ser Val Thr Ala Val Asp Pro Ser Glu Asn Gly
340 345 350
Gly Arg Ser Gln Tyr Lys His Leu Leu Arg Leu Glu Asp Gly Thr Asp
355 360 365
Ile Val Lys Ser Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Thr Asn
370 375 380
Gly Ala Ile Ser Thr Ser Thr Ala Lys Thr Ser Asn Gly Asn Ser Ala
385 390 395 400
Ser Asp Asp Asp Asp Lys Leu Gly
405
<210> 39
<211> 1239
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 39
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
cccgcgaacg gcagcgcggt gaacctgaag tcgggctccc tgaacaccca ggaggacacg 180
agctcgtccc cccccccccg cgcgttcctg aaccagctgc ccgactggag catgctgctg 240
accgcgatca ccaccgtctt cgtggcggcg gagaagcagt ggacgatgct ggaccgcaag 300
tcgaagcgcc ccgacatgct ggtggactcc gtcggcctga agagcatcgt gcgcgacggc 360
ctggtctcgc gccagtcctt cctgatccgc agctacgaga tcggcgcgga ccgcaccgcg 420
tcgatcgaga ccctgatgaa ccacctgcag gagacgtcca tcaaccactg caagagcctg 480
ggcctgctga acgacggctt cggccgcacc cccggcatgt gcaagaacga cctgatctgg 540
gtgctgacca agatgcagat catggtcaac cgctacccca cgtggggcga caccgtcgag 600
atcaacacgt ggttctcgca gtccggcaag atcggcatgg cgagcgactg gctgatctcg 660
gactgcaaca ccggcgagat cctgatccgc gcgacctccg tgtgggcgat gatgaaccag 720
aagacgcgcc gcttcagccg cctgccctac gaggtccgcc aggagctgac cccccacttc 780
gtggactcgc cccacgtcat cgaggacaac gaccagaagc tgcacaagtt cgacgtgaag 840
accggcgact ccatccgcaa gggcctgacg ccccgctgga acgacctgga cgtcaaccag 900
cacgtgtcga acgtgaagta catcggctgg atcctggagt ccatgcccat cgaggtcctg 960
gagacccagg agctgtgctc gctgaccgtg gagtaccgcc gcgagtgcgg catggactcc 1020
gtgctggagt cggtcacggc ggtggacccc agcgagaacg gcggccgcag ccagtacaag 1080
cacctgctgc gcctggagga cggcaccgac atcgtcaagt cgcgcaccga gtggcgcccc 1140
aagaacgcgg gcacgaacgg cgcgatctcc accagcaccg cgaagacgtc gaacggcaac 1200
tccgcgagcg atgacgatga caagctggga tgactcgag 1239
<210> 40
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 40
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ala Gln Ala Ala Thr Arg Val Asn Gly Ser
35 40 45
Lys Val Gly Leu Lys Thr Asp Thr Asn Lys Leu Glu Asp Ala Pro Phe
50 55 60
Ile Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp Trp
65 70 75 80
Ser Val Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys
85 90 95
Gln Trp Thr Leu Ile Asp Trp Lys Arg Gly Gly Pro Asp Met Leu Ser
100 105 110
Asp Ala Phe Gly Leu Pro Lys Ile Ile Glu Asn Gly Leu Leu Tyr Arg
115 120 125
Gln Lys Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Gln Thr Ala
130 135 140
Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His
145 150 155 160
Val Lys Cys Ala Gly Leu Leu Gly Asn Gly Phe Gly Ser Thr Pro Glu
165 170 175
Met Ser Lys Met Asn Leu Ile Trp Val Val Thr Lys Met Gln Val Leu
180 185 190
Val Glu His Tyr Pro Ser Trp Gly Asp Val Ile Glu Val Asp Thr Trp
195 200 205
Ala Ala Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp His Val Arg
210 215 220
Asp Trp Gln Thr Gly Gln Thr Ile Met Arg Ala Ser Ser Asn Trp Val
225 230 235 240
Met Met Asn Gln Asn Thr Arg Arg Leu Ser Lys Phe Pro Glu Glu Val
245 250 255
Arg Ala Glu Ile Glu Pro Tyr Phe Met Glu Arg Ala Pro Val Ile Asp
260 265 270
Asp Asp Asn Arg Lys Leu Pro Lys Leu Asp Asp Asp Thr Ala Asp His
275 280 285
Val Arg Asn Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln
290 295 300
His Val Lys Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro
305 310 315 320
Ile Ser Ile Leu Glu Ser His Glu Leu Ala Ser Met Thr Leu Glu Tyr
325 330 335
Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ser Val
340 345 350
Ser Asn Asn Cys Thr Asp Gly Ser Glu Glu Leu Pro Ile Glu Cys Gln
355 360 365
His Leu Leu Arg Asn Glu Gly Gly Ser Glu Ile Val Lys Gly Arg Thr
370 375 380
Glu Trp Arg Pro Lys Lys Cys Gly Pro Phe Gly Ala Gly Arg Pro
385 390 395
<210> 41
<211> 1212
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 41
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
gcccaggcgg ccacccgcgt gaacggcagc aaggtgggcc tgaagaccga caccaacaag 180
ctggaggacg cgcccttcat cccctcgtcc gccccccgca ccttctacaa ccagctgccc 240
gactggagcg tcctgctggc ggccatcacc accatcttcc tggcggccga gaagcagtgg 300
accctgatcg actggaagcg cggcggcccc gacatgctgt cggacgcgtt cggcctgccc 360
aagatcatcg agaacggcct gctgtaccgc cagaagttct ccatccgcag ctacgagatc 420
ggcgccgacc agaccgcctc gatcgagacc ctgatgaacc acctgcagga gaccgcgctg 480
aaccacgtca agtgcgccgg cctgctgggc aacggcttcg gctccacccc cgagatgagc 540
aagatgaacc tgatctgggt ggtcaccaag atgcaggtgc tggtcgagca ctacccctcg 600
tggggcgacg tgatcgaggt ggacacctgg gcggccgcgt ccggcaagaa cggcatgcgc 660
cgcgactggc acgtccgcga ctggcagacc ggccagacca tcatgcgcgc cagctcgaac 720
tgggtgatga tgaaccagaa cacccgccgc ctgtccaagt tccccgagga ggtccgcgcc 780
gagatcgagc cctacttcat ggagcgcgcc cccgtgatcg acgacgacaa ccgcaagctg 840
cccaagctgg acgacgacac cgcggaccac gtgcgcaacg gcctgacccc ccgctggagc 900
gacctggacg tgaaccagca cgtcaagaac gtgaagtaca tcggctggat cctggagtcg 960
gcccccatct ccatcctgga gagccacgag ctggcctcga tgaccctgga gtaccgccgc 1020
gagtgcggcc gcgactccgt cctgcagagc ctgacctcgg tgtccaacaa ctgcaccgac 1080
ggcagcgagg agctgcccat cgagtgccag cacctgctgc gcaacgaggg cggctcggag 1140
atcgtcaagg gccgcaccga gtggcgcccc aagaagtgcg gccccttcgg cgccggccgc 1200
ccctgactcg ag 1212
<210> 42
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 42
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Ala Asn Ala His Thr Val Pro Lys Ile Asn
35 40 45
Gly Asn Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu
50 55 60
Asp Ile Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn
65 70 75 80
Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe
85 90 95
Leu Ala Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg
100 105 110
Pro Asp Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val
115 120 125
Gln Asp Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu
130 135 140
Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu
145 150 155 160
Gln Glu Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp
165 170 175
Gly Phe Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val
180 185 190
Val Thr Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp
195 200 205
Val Ile Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met
210 215 220
Lys Arg Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr
225 230 235 240
Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu
245 250 255
Ser Lys Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val
260 265 270
Glu His Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn
275 280 285
Asp Asn Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser
290 295 300
Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
305 310 315 320
Ile Leu Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr
325 330 335
Gly Met Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu
340 345 350
Gln Ser Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu
355 360 365
Ala Gly Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu
370 375 380
Ile Met Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr
385 390 395 400
Thr Tyr Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala
405 410 415
<210> 43
<211> 1260
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 43
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
gccaacgccc acaccgtgcc caagatcaac ggcaacaagg ccggcctgct gacccccatg 180
gagagcacca aggacgagga catcgtcgcg gcccccaccg tggcgcccaa gcgcaccttc 240
atcaaccagc tgcccgactg gtcgatgctg ctggccgcga tcaccaccat cttcctggcg 300
gccgagaagc agtggaccaa cctggactgg aagccccgcc gccccgacat gctggtcgac 360
ttcgacccct tctccctggg ccgcttcgtg caggacggcc tgatcttccg ccagaacttc 420
agcatccgct cgtacgagat cggcgcggac cgcaccgcct ccatcgagac cctgatgaac 480
cacctgcagg agaccgcgct gaaccacgtc cgctgcatcg gcctgctgga cgacggcttc 540
ggcagcaccc ccgagatgac ccgccgcgac ctgatctggg tggtcacccg catgcaggtc 600
ctggtggacc gctacccctc gtggggcgac gtgatcgagg tcgactcctg ggtgaccccc 660
agcggcaaga acggcatgaa gcgcgagtgg ttcctgcgcg actgcaagac cggcgagatc 720
ctgacccgcg ccacctcggt ctgggtgatg atgaacaagc gcacccgccg cctgtccaag 780
atccccgagg aggtccgcgt ggagatcgag ccctacttcg tcgagcacgg cgtgctggac 840
gaggactcgc gcaagctgcc caagctgaac gacaacaccg ccaactacat ccgccgcggc 900
ctggcgcccc gctggtccga cctggacgtc aaccagcacg tgaacaacgt caagtacatc 960
ggctggatcc tggagagcgt gcccagcagc ctgctggagt cgcacgagct gtacggcatg 1020
accctggagt accgcaagga gtgcggcaag gacggcctgc tgcagtccct gaccgccgtc 1080
gccagcgact acggcggcgg ctcgctggag gccggcgtgg agtgcgacca cctgctgcgc 1140
ctggaggacg gctccgagat catgcgcggc aagaccgagt ggcgccccaa gcgcgccgcg 1200
aacaccacct acttcggcag cgtcgacgac atcccccccg ccaacaacgc gtgactcgag 1260
<210> 44
<211> 362
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 44
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ser Met Leu Leu Ser Ala Val Thr Thr Val
35 40 45
Phe Gly Val Ala Glu Lys Gln Trp Pro Met Leu Asp Arg Lys Ser Lys
50 55 60
Arg Pro Asp Met Leu Val Glu Pro Leu Gly Val Asp Arg Ile Val Tyr
65 70 75 80
Asp Gly Val Ser Phe Arg Gln Ser Phe Ser Ile Arg Ser Tyr Glu Ile
85 90 95
Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn Met Phe Gln
100 105 110
Glu Thr Ser Leu Asn His Cys Lys Ile Ile Gly Leu Leu Asn Asp Gly
115 120 125
Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu Ile Trp Val Val
130 135 140
Thr Lys Met Gln Ile Glu Val Asn Arg Tyr Pro Thr Trp Gly Asp Thr
145 150 155 160
Ile Glu Val Asn Thr Trp Val Ser Ala Ser Gly Lys His Gly Met Gly
165 170 175
Arg Asp Trp Leu Ile Ser Asp Cys His Thr Gly Glu Ile Leu Ile Arg
180 185 190
Ala Thr Ser Val Trp Ala Met Met Asn Gln Lys Thr Arg Arg Leu Ser
195 200 205
Lys Ile Pro Tyr Glu Val Arg Gln Glu Ile Glu Pro Gln Phe Val Asp
210 215 220
Ser Ala Pro Val Ile Val Asp Asp Arg Lys Phe His Lys Leu Asp Leu
225 230 235 240
Lys Thr Gly Asp Ser Ile Cys Asn Gly Leu Thr Pro Arg Trp Thr Asp
245 250 255
Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile
260 265 270
Leu Gln Ser Val Pro Thr Glu Val Phe Glu Thr Gln Glu Leu Cys Gly
275 280 285
Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Glu
290 295 300
Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp Arg Ser Leu Tyr
305 310 315 320
Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile Val Lys Gly Arg
325 330 335
Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Lys Gly Ala Ile Leu Thr
340 345 350
Gly Lys Thr Ser Asn Gly Asn Ser Ile Ser
355 360
<210> 45
<211> 1101
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 45
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
agcatgctgc tgtcggcggt gaccacggtc ttcggcgtgg ccgagaagca gtggcccatg 180
ctggaccgca agtccaagcg ccccgacatg ctggtcgagc ccctgggcgt ggaccgcatc 240
gtctacgacg gcgtgagctt ccgccagtcg ttctccatcc gcagctacga gatcggcgcc 300
gaccgcaccg cctcgatcga gacgctgatg aacatgttcc aggagacctc cctgaaccac 360
tgcaagatca tcggcctgct gaacgacggc ttcggccgca cgcccgagat gtgcaagcgc 420
gacctgatct gggtcgtgac caagatgcag atcgaggtga accgctaccc cacgtggggc 480
gacaccatcg aggtcaacac gtgggtgagc gcctcgggca agcacggcat gggccgcgac 540
tggctgatct ccgactgcca caccggcgag atcctgatcc gcgcgacgag cgtctgggcg 600
atgatgaacc agaagacccg ccgcctgtcg aagatcccct acgaggtgcg ccaggagatc 660
gagccccagt tcgtcgactc cgcccccgtg atcgtggacg accgcaagtt ccacaagctg 720
gacctgaaga cgggcgacag catctgcaac ggcctgaccc cccgctggac ggacctggac 780
gtgaaccagc acgtcaacaa cgtgaagtac atcggctgga tcctgcagtc ggtccccacc 840
gaggtgttcg agacgcagga gctgtgcggc ctgaccctgg agtaccgccg cgagtgcggc 900
cgcgactccg tgctggagag cgtcacggcc atggacccct cgaaggaggg cgaccgctcc 960
ctgtaccagc acctgctgcg cctggaggac ggcgcggaca tcgtgaaggg ccgcaccgag 1020
tggcgcccca agaacgccgg cgccaagggc gccatcctga cgggcaagac cagcaacggc 1080
aactcgatct cctgactcga g 1101
<210> 46
<211> 369
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 46
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
35 40 45
Ala Ile Thr Thr Leu Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
50 55 60
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
65 70 75 80
Gly Arg Phe Val Gln Asp Gly Leu Val Phe Arg Asn Asn Phe Ser Ile
85 90 95
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu
100 105 110
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Val Gly
115 120 125
Leu Leu Glu Asp Gly Leu Gly Ser Thr Arg Glu Met Ser Leu Arg Asn
130 135 140
Leu Ile Trp Val Val Thr Lys Met Gln Val Ala Val Asp Arg Tyr Pro
145 150 155 160
Thr Trp Gly Asp Glu Val Gln Val Ser Ser Trp Ala Thr Ala Ile Gly
165 170 175
Lys Asn Gly Met Arg Arg Glu Trp Ile Val Thr Asp Phe Arg Thr Gly
180 185 190
Glu Thr Leu Leu Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Leu
195 200 205
Thr Arg Arg Ile Ser Lys Ile Pro Glu Glu Val Trp His Glu Ile Gly
210 215 220
Pro Ser Phe Ile Asp Ala Pro Pro Leu Pro Thr Val Glu Asp Asp Gly
225 230 235 240
Arg Lys Leu Thr Arg Phe Asp Glu Ser Ser Ala Asp Phe Ile Arg Lys
245 250 255
Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Ile Asn Gln His Val Asn
260 265 270
Asn Val Lys Tyr Ile Gly Trp Leu Leu Glu Ser Ala Pro Pro Glu Ile
275 280 285
His Glu Ser His Glu Ile Ala Ser Leu Thr Leu Glu Tyr Arg Arg Glu
290 295 300
Cys Gly Arg Asp Ser Val Leu Asn Ser Ala Thr Lys Val Ser Asp Ser
305 310 315 320
Ser Gln Leu Gly Lys Ser Ala Val Glu Cys Asn His Leu Val Arg Leu
325 330 335
Gln Asn Gly Gly Glu Ile Val Lys Gly Arg Thr Val Trp Arg Pro Lys
340 345 350
Arg Pro Leu Tyr Asn Asp Gly Ala Val Val Asp Val Pro Ala Lys Thr
355 360 365
Ser
<210> 47
<211> 1122
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 47
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
cagctgcccg actggagcat gctgctggcc gcgatcacca ccctgttcct ggcggccgag 180
aagcagtgga tgatgctgga ctggaagccc aagcgccccg acatgctggt ggaccccttc 240
ggcctgggcc gcttcgtgca ggacggcctg gtgttccgca acaacttcag catccgcagc 300
tacgagatcg gcgcggaccg caccgccagc atcgagaccc tgatgaacca cctgcaggag 360
accgccctga accacgtgaa gagcgtgggc ctgctggagg acggcctggg cagcacccgc 420
gagatgagcc tgcgcaacct gatctgggtg gtgaccaaga tgcaggtggc ggtggaccgc 480
taccccacct ggggcgacga ggtgcaggtg agcagctggg cgaccgccat cggcaagaac 540
ggcatgcgcc gcgagtggat cgtgaccgac ttccgcaccg gcgagaccct gctgcgcgcc 600
accagcgtgt gggtgatgat gaacaagctg acccgccgca tcagcaagat ccccgaggag 660
gtgtggcacg agatcggccc cagcttcatc gacgcgcccc ccctgcccac cgtggaggac 720
gacggccgca agctgacccg cttcgacgag agcagcgccg acttcatccg caagggcctg 780
accccccgct ggagcgacct ggacatcaac cagcacgtga acaacgtgaa gtacatcggc 840
tggctgctgg agagcgcgcc ccccgagatc cacgagagcc acgagatcgc cagcctgacc 900
ctggagtacc gccgcgagtg cggccgcgac agcgtgctga acagcgccac caaggtgagc 960
gacagcagcc agctgggcaa gagcgccgtg gagtgcaacc acctggtgcg cctgcagaac 1020
ggcggcgaga tcgtgaaggg ccgcaccgtg tggcgcccca agcgccccct gtacaacgac 1080
ggcgccgtgg tggacgtgcc cgccaagacc agctgactcg ag 1122
<210> 48
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 48
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
<210> 49
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 49
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
<210> 50
<211> 6207
<212> DNA
<213> Ulmus americana
<400> 50
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 3360
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 3420
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 3480
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 3540
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 3600
caacccgcaa acactagtat ggccaccgca tccactttct cggcgttcaa tgcccgctgc 3660
ggcgacctgc gtcgctcggc gggctccggg ccccggcgcc cagcgaggcc cctccccgtg 3720
cgcgggcgcg cccagctgcc cgactggagc atgctgctgg ccgcgatcac caccctgttc 3780
ctggcggccg agaagcagtg gatgatgctg gactggaagc ccaagcgccc cgacatgctg 3840
gtggacccct tcggcctggg ccgcttcgtg caggacggcc tggtgttccg caacaacttc 3900
agcatccgca gctacgagat cggcgcggac cgcaccgcca gcatcgagac cctgatgaac 3960
cacctgcagg agaccgccct gaaccacgtg aagagcgtgg gcctgctgga ggacggcctg 4020
ggcagcaccc gcgagatgag cctgcgcaac ctgatctggg tggtgaccaa gatgcaggtg 4080
gcggtggacc gctaccccac ctggggcgac gaggtgcagg tgagcagctg ggcgaccgcc 4140
atcggcaaga acggcatgcg ccgcgagtgg atcgtgaccg acttccgcac cggcgagacc 4200
ctgctgcgcg ccaccagcgt gtgggtgatg atgaacaagc tgacccgccg catcagcaag 4260
atccccgagg aggtgtggca cgagatcggc cccagcttca tcgacgcgcc ccccctgccc 4320
accgtggagg acgacggccg caagctgacc cgcttcgacg agagcagcgc cgacttcatc 4380
cgcaagggcc tgaccccccg ctggagcgac ctggacatca accagcacgt gaacaacgtg 4440
aagtacatcg gctggctgct ggagagcgcg ccccccgaga tccacgagag ccacgagatc 4500
gccagcctga ccctggagta ccgccgcgag tgcggccgcg acagcgtgct gaacagcgcc 4560
accaaggtga gcgacagcag ccagctgggc aagagcgccg tggagtgcaa ccacctggtg 4620
cgcctgcaga acggcggcga gatcgtgaag ggccgcaccg tgtggcgccc caagcgcccc 4680
ctgtacaacg acggcgccgt ggtggacgtg cccgccaaga ccagcgatga cgatgacaag 4740
ctgggatgac tcgagttaat taactcgagg cagcagcagc tcggatagta tcgacacact 4800
ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 4860
tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 4920
gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 4980
catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 5040
tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 5100
ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 5160
acacaaatgg aaagctgtag agctccttgt tttccagaag gagttgctcc ttgagccttt 5220
cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 5280
agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 5340
ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 5400
gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 5460
agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 5520
acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 5580
atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 5640
tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 5700
acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 5760
ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 5820
tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 5880
gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgttcgagct tgaagagcct 5940
ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct gtttcctgtg 6000
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 6060
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 6120
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 6180
ggcggtttgc gtattgggcg ctcttcc 6207
<210> 51
<211> 5576
<212> DNA
<213> Cinnamomum camphora
<400> 51
gaattcgccc tcccgtgatc acacaggtgc cttgcgagcg tgatcacact attttggggg 60
tcctacagta ctgaaatggt gagaagtcgt actgaaatca aggatgaaca atgaaaatgg 120
tgctgtggtg gcttctcaaa ggtcaagaat cagtcgctcg cgtcaggaaa tcgcggcgtc 180
aaccagcgtg ggcgcggtca gtggccccgc actggtcacc atagcctctc ctgccacagt 240
agcgatcccc tgggcgttca ctctcagcag cggctgtact gcctcccaga ttttcttctt 300
ctggacctgc gggcgtgaga ggatgagcag ggtgggccaa gggctcaatc ctgaacggcc 360
ctcattcggt ttccaatccc acaacacata cccacagcag gtcagaccac gcattccacc 420
atgcgcacca ataacgtgtc cttacctgat tgggtgtggc aggctccgtg gacaggagtg 480
cctcgtcccc cgcccagacc cgctcccccg tcacggcggc gtccgggacc cgcagcggct 540
ccaccgcggt gtgatccgcg ttggcggcgc agagcagcat cccagccgat ttgaccccgc 600
gcatgctccg aggcttgagg ttggccagca ccaccacccg ccggccgaca aggtcctcca 660
gggtcacgtg ccggaccagg ccactcacga tggtgcgagg gcccccctcc tcgccgaggt 720
cgatctgctc gacgtacaga ctgcgacatg cgtggcgagt ggtcatcaga aggaagcagg 780
tgtgcagaag gggcacgtgg ttggtattga gagtagccaa agctttgtgc caatcagaaa 840
gtcaacgcag ctgcctgcct ggctcgcgta caattccttt cttgcgctat gacacttcca 900
gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca ccgatgatgc 960
ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct ccagggcgag 1020
cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta ccaaagcata 1080
ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 1140
gctaaggggg cgcctcttcc cttcgtttca gtcacaaccc gcaaacggcg cgccatgctg 1200
ctgcaggcct tcctgttcct gctggccggc ttcgccgcca agatcagcgc ctccatgacg 1260
aacgagacgt ccgaccgccc cctggtgcac ttcaccccca acaagggctg gatgaacgac 1320
cccaacggcc tgtggtacga cgagaaggac gccaagtggc acctgtactt ccagtacaac 1380
ccgaacgaca ccgtctgggg gacgcccttg ttctggggcc acgccacgtc cgacgacctg 1440
accaactggg aggaccagcc catcgccatc gccccgaagc gcaacgactc cggcgccttc 1500
tccggctcca tggtggtgga ctacaacaac acctccggct tcttcaacga caccatcgac 1560
ccgcgccagc gctgcgtggc catctggacc tacaacaccc cggagtccga ggagcagtac 1620
atctcctaca gcctggacgg cggctacacc ttcaccgagt accagaagaa ccccgtgctg 1680
gccgccaact ccacccagtt ccgcgacccg aaggtcttct ggtacgagcc ctcccagaag 1740
tggatcatga ccgcggccaa gtcccaggac tacaagatcg agatctactc ctccgacgac 1800
ctgaagtcct ggaagctgga gtccgcgttc gccaacgagg gcttcctcgg ctaccagtac 1860
gagtgccccg gcctgatcga ggtccccacc gagcaggacc ccagcaagtc ctactgggtg 1920
atgttcatct ccatcaaccc cggcgccccg gccggcggct ccttcaacca gtacttcgtc 1980
ggcagcttca acggcaccca cttcgaggcc ttcgacaacc agtcccgcgt ggtggacttc 2040
ggcaaggact actacgccct gcagaccttc ttcaacaccg acccgaccta cgggagcgcc 2100
ctgggcatcg cgtgggcctc caactgggag tactccgcct tcgtgcccac caacccctgg 2160
cgctcctcca tgtccctcgt gcgcaagttc tccctcaaca ccgagtacca ggccaacccg 2220
gagacggagc tgatcaacct gaaggccgag ccgatcctga acatcagcaa cgccggcccc 2280
tggagccggt tcgccaccaa caccacgttg acgaaggcca acagctacaa cgtcgacctg 2340
tccaacagca ccggcaccct ggagttcgag ctggtgtacg ccgtcaacac cacccagacg 2400
atctccaagt ccgtgttcgc ggacctctcc ctctggttca agggcctgga ggaccccgag 2460
gagtacctcc gcatgggctt cgaggtgtcc gcgtcctcct tcttcctgga ccgcgggaac 2520
agcaaggtga agttcgtgaa ggagaacccc tacttcacca accgcatgag cgtgaacaac 2580
cagcccttca agagcgagaa cgacctgtcc tactacaagg tgtacggctt gctggaccag 2640
aacatcctgg agctgtactt caacgacggc gacgtcgtgt ccaccaacac ctacttcatg 2700
accaccggga acgccctggg ctccgtgaac atgacgacgg gggtggacaa cctgttctac 2760
atcgacaagt tccaggtgcg cgaggtcaag tgattaatta actcgaggca gcagcagctc 2820
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 2880
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 2940
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3000
catcccctcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 3060
ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 3120
tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 3180
gaagtagtgg gatgggaaca caaatggaaa gcttgagctc ctttcttgcg ctatgacact 3240
tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg 3300
atgcttcgac cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg 3360
cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag 3420
ccatattcaa acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc 3480
actccgctaa gggggcgcct cttcctcttc gtttcagtca caacccgcaa acactagtat 3540
gacgttcggg gtcgccctcc cggccatggg ccgcggtgtc tcccttcccc ggcccagggt 3600
cgcggtgcgc gcccagtcgg cgagtcaggt tttggagagc gggcgcgccc ccgactggtc 3660
catgctgttc gccgtgatca ccaccatctt ctccgccgcc gagaagcagt ggaccaacct 3720
ggagtggaag cccaagccca acccccccca gctgctggac gaccacttcg gcccccacgg 3780
cctggtgttc cgccgcacct tcgccatccg cagctacgag gtgggccccg accgctccac 3840
cagcatcgtg gccgtgatga accacctgca ggaggccgcc ctgaaccacg ccaagtccgt 3900
gggcatcctg ggcgacggct tcggcaccac cctggagatg tccaagcgcg acctgatctg 3960
ggtggtgaag cgcacccacg tggccgtgga gcgctacccc gcctggggcg acaccgtgga 4020
ggtggagtgc tgggtgggcg cctccggcaa caacggccgc cgccacgact tcctggtgcg 4080
cgactgcaag accggcgaga tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac 4140
ccgcacccgc cgcctgagca agatccccga ggaggtgcgc ggcgagatcg gccccgcctt 4200
catcgacaac gtggccgtga aggacgagga gatcaagaag ccccagaagc tgaacgactc 4260
caccgccgac tacatccagg gcggcctgac cccccgctgg aacgacctgg acatcaacca 4320
gcacgtgaac aacatcaagt acgtggactg gatcctggag accgtgcccg acagcatctt 4380
cgagagccac cacatctcct ccttcaccat cgagtaccgc cgcgagtgca ccatggacag 4440
cgtgctgcag tccctgacca ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga 4500
gcacctgctg cagctggagg gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc 4560
caagctgacc gactccttcc gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga 4620
ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 4680
caagtgactc gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 4740
tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 4800
caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctcttg 4860
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4920
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4980
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5040
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5100
gtacccgtac ccatcagcat ccgggtgaat cttggcctcc aagatatggc caatcctcac 5160
atccagcttg gcaaaatcga ctagactgtc tgcaagtggg aatgtggagc acaaggttgc 5220
ttgtagcgat cgacagactg gtggggtaca ttgacaggtg ggcagcgccg catccatcgt 5280
gcctgacgcg agcgccgccg gttgctcgcc cgtgcctgcc gtcaaagagc ggcagagaaa 5340
tcgggaaccg aaaacgtcac attgcctgat gttgttacat gctggactag actttcttgg 5400
cgtgggtctg ctcctcgcca ggtgcgcgac gcctcggggc tgggtgcgag ggagccgtgc 5460
ggccacgcat ttgacaagac ccaaagctcg catctcagac ggtcaaccgt tcgtattata 5520
cattcaacat atggtacata cgcaaaaagc atgccaacga tgacataggc gaattc 5576
<210> 52
<211> 4674
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 52
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240
gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300
ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360
ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420
aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480
ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540
atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600
cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660
atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720
aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780
gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840
ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900
atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960
ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020
atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080
ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140
gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200
gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagcttga gctc 4674
<210> 53
<211> 4656
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 53
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300
ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360
tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420
gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540
cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600
aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780
atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900
gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960
gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020
ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgactcg aggcagcagc agctcggata 4260
gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320
tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380
tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440
ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500
ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560
cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620
tagtgggatg ggaacacaaa tggaaagctt gagctc 4656
<210> 54
<211> 4635
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 54
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc 3240
ctgttcctgg cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac 3300
atgctggtgg accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac 3360
aacttcagca tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg 3420
atgaaccacc tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac 3480
ggcctgggca gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg 3540
caggtggcgg tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg 3600
accgccatcg gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc 3660
gagaccctgc tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc 3720
agcaagatcc ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc 3780
ctgcccaccg tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac 3840
ttcatccgca agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac 3900
aacgtgaagt acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac 3960
gagatcgcca gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac 4020
agcgccacca aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac 4080
ctggtgcgcc tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag 4140
cgccccctgt acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag cgatgacgat 4200
gacaagctgg gatgactcga ggcagcagca gctcggatag tatcgacaca ctctggacgc 4260
tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc 4320
gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct 4380
agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc 4440
ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc 4500
ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc 4560
aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat 4620
ggaaagcttg agctc 4635
<210> 55
<211> 997
<212> DNA
<213> Prototheca moriformis
<400> 55
cctgtcgatc gaagagaagg agacatgtgt acattattgg tgtgagggcg ctgaatcggc 60
cattttttaa aatgatcacg ctcatgccaa tagacgcggc acataacgac gttcaaaccc 120
ccgccaaagc cgcggacaac cccatccctc cacacccccc acacaaagaa cccgccaccg 180
cttaccttgc ccacgaggta ggcctttcgt tgcgcaaaac cggcctcggt gatgaatgca 240
tgcccgttcc tgacgagcgc tgcccgggcc aacacgctct tttgctgcgt ctcctcaggc 300
ttgggggcct ccttgggctt gggtgccgcc atgatctgcg cgcatcagag aaacgttgct 360
ggtaaaaagg agcgcccggc tgcgcaatat atatataggc atgccaacac agcccaacct 420
cactcgggag cccgtcccac cacccccaag tcgcgtgcct tgacggcata ctgctgcaga 480
agcttcatga gaatgatgcc gaacaagagg ggcacgagga cccaatcccg gacatccttg 540
tcgataatga tctcgtgagt ccccatcgtc cgcccgacgc tccggggagc ccgccgatgc 600
tcaagacgag agggccctcg accaggaggg gctggcccgg gcgggcactg gcgtcgaagg 660
tgcgcccgtc gttcgcctgc agtcctatgc cacaaaacaa gtcttctgac ggggtgcgtt 720
tgctcccgtg cgggcaggca acagaggtat tcaccctggt catggggaga tcggcgatcg 780
agctgggata agagatactt ctggcaagca atgacaactt gtcaggaccg gaccgtgcca 840
tatatttctc acctagcgcc gcaaaaccta acaatttggg agtcactgtg ccactgagtt 900
cgactggtag ctgaatggag tcgctgctcc actaaacgaa ttgtcagcac cgccagccgg 960
ccgaggaccc gagtcatagc gagggtagta gcgcgcc 997
<210> 56
<211> 753
<212> DNA
<213> Prototheca moriformis
<400> 56
actaattgca atcgtgcagt aatcatcgat atggtcacaa gtagatcccc tactgacacc 60
ctctcgtaca tgtaggcaat gtcatcggcg ccgtcctgct gaccgatgcc gacgtagcag 120
agcagacccg ggccgatctg ggatacgagc cggccctcca cctgcgctcg aggtggaatc 180
aagtaaataa ccaatacact tttcgacacc acacagagtt gcacggacgg tggcgtacct 240
ctacgctcgc gctcttcacg cgctggacga ccgcacgcat gagcccgggt ggcttggtct 300
gggctgcaaa aatgcacaac aaacaagtat cagacgctca tggatgcaca cgcgctccca 360
agcacgctca gactaaatat tacagtagct cgtatctgat aagatatcga gacataccgc 420
tcaactcacc cgcaaactgc gccccgccag gtgatgcgca cagggcccca ccatgcgatc 480
catcgcatcg ctcctcgagg gcgctatcac gtggccggag agcgttcaca gcgtacgcca 540
ctgtatctgg gcggtatgcg gtccgtcaac atggagacag atacccgcac caccaccttg 600
caagctcttc catattggaa gtagaaaatt gtaattgtat catcgcacga ggggccaact 660
tgccgtcggc gagctgggcg acgaacacca cctggacgtt gtcgagactc gctcgtgccg 720
tgcgccgggc cgctgggtat ccagaccgtc gcc 753
<210> 57
<211> 1122
<212> DNA
<213> Prototheca moriformis
<400> 57
caacgacaac cagcaggcaa ctcggtcagc gacccaacac gcgagtcaaa ttgttgcgtg 60
ttcttgcctt gtctatttac tgtgatagca agactgtcgg tcagtcaata ccgcggtgcg 120
cacgtcgggg tgccaagcct agcagagcac gggacggctg gtgctgtgcg ccagctcagc 180
tcgcttcgcg accaattgta ggaccggcaa agtcaccaaa acatgccagc ggtgcgattc 240
aattggtcat gagctctaca aaattgtttt gtgcgtcgcg caggtatcca acggcgcggc 300
agagaaagtt tgacagctct cgatttcatc tcggaaaaat ggggagaatt tatgacacac 360
aagtgcgcag gcggcccagg cggccagcat attctggcgt gacctgggcc gcccacaaaa 420
tgcttggatg cactctaaaa taattatatt tgccatgaac aagggaagag ttaccgcacc 480
cagccctaga cttgggcgcc cgagcaaggt tacgtcaagc caccttcgcc catcgcccaa 540
ctccgtattc cccgacagcc gcacgtggcc ctcgccggaa tgaaccctga atcggcatca 600
cgccacgcgt tcgccaatcg ttccgctctc tggcttcatc ggcctgcgcc ttcacgtcgt 660
ggtcacgaca gtgcattcat acttccattt gcacctcggc acacactttt acgcatcgcc 720
tacccttgct gcggcagtct agggtcactt tgcagccatg ggacagtgct acaccaccgt 780
cggtgcgcaa agctatttca agtgaaccgt gggcggaaaa aaggaatgta cactgtctca 840
accgactcct acaattgttt accatgcaga tcagagctcg acggccatca tcgagcaggt 900
gtggggcctt ggtggcgcgg cgcggggccc cagggcgtcg caggcattga tggcactctg 960
agactttcgc acgcgcatga gggaccccat caagagaaga gtgtgtcttt atgtccccat 1020
tcatgatgat gtatcttgtg attgtcgcag tttggcaagt ttaaccggat cgccgctcca 1080
ggtgtggcgt ggcggatttt tctaggggtg cttgagcagt cg 1122
<210> 58
<211> 574
<212> DNA
<213> Prototheca moriformis
<400> 58
ggcccagggc cctgcggatg gcccacacca gatctagcct ctcttatgcc atgcccgcct 60
cgctgcccgt cgtatccccc cgccgatccg cgcgtagggg accgcggcct gacccacgcc 120
acgaaagagc tttgctcctc aatttctcgc caacagaacc gtatcaaacg ctcaacgcct 180
atcccgaaca atccgtattc acaccaaatc gagtataccg gactggtttg cctagtcttg 240
aaggaaatga tcccgtccat gctcggaagg gggagcgggc ggaggatcct actcatctct 300
gaaatgggat tggtccgaag atgggttggg caagcacgtg ccaaacccca gcgagttgct 360
gacgagcagg ctcatccaat cccccggcga atcctccctc acgccccgca tgcatacaag 420
tccctcccac acgccccctc ccatccattt tcgcctggtc cgaacgcgag cggcgtcgag 480
gcggaccact tgctccgcag cgccgtctgg gtctccaccc cacagcggct ttgctgccag 540
aggcaccccc cttgccccac ctcctcttgc agcc 574
<210> 59
<211> 1096
<212> DNA
<213> Prototheca moriformis
<400> 59
ccaggcaggc ggtagggttg ccgattgctt gagcgaattg gaagatataa ttttttgtgg 60
tgtccctgga cgctgtttgt ggcgctcctt tttggagaag attgcgtggg ggagctttcc 120
atgtaccacg cttccttctg aaaggattct ggccgagtcc tgatgagccc aaagaaaaca 180
cctgcctttc agtgctggca ctctgaaaac gtcaacagat gattatacat gtcacaaaag 240
gcagccgatt aggaacggga gctctggccg ttcgtttggc tgcctgggct gattgaagtg 300
atccaccctg ttcgaatgaa ggcggtcgag tcgaattatc gaccggagct gtcgggaagg 360
cgtccggggc agagtgaggt gctgcggcct ggttgtcgtt caaaaagacc ccggtagccc 420
aacaatcacg aacgaaagga atataattgc ttgcatacta tacattcagt ttctatgtgg 480
cgggtagaca agtctcatgg gcttctaaag gctgtccctt gaaggctact tataaaaact 540
tgctgcgcca tggcacggat cgcgcttgcg caggctgcaa ccctgcgcgc aaggtcaaat 600
acacagcaaa agatactaac agaatttcta aaaacattta aatatttgtt tcgaccagcc 660
aattgtggtc gtaggcacgc aaaagacttt gttttgcgcc caccgagcat ccacgctggc 720
agtcaagcca gtccgatgtg cattgcgtgg cagcatcgag gagcatcaaa aacctcgtgc 780
acgcttttct gtcaatcatc atcaaccact ccaccatgta tacccgatgc atcgcggtgc 840
gcagcgcgcc acgcgtccca gacccgccca aaaacccagc agcggcgaaa gcaaatcttc 900
acttgcccga aaccccgagc agcggcattc acacgtgggc gaaaacccca cttgccctaa 960
caggcgtatg tctgctgtca cgatgcctga caacggtatt atagatatac actgattaat 1020
gtttgagtgt gtgcgagtcg cgaatcagga atgaattgct agtaggcact ccgaccgggc 1080
gggggccgag ggacca 1096
<210> 60
<211> 1075
<212> DNA
<213> Prototheca moriformis
<400> 60
ggccgacagg acgcgcgtca aaggtgctgg gcgtgtatgc cctggtcggc aggtcgttgc 60
tgttgctgcg ctcgtggttc cgcaaccctg attttggcgt cttattctgg cgtggcaagc 120
gctgacgccc gcgagccggg ccggcggcga tgcggtgtct cacggctgcc gagctccaag 180
ggaggcaaga gcgcccggat cagctgaagg gctttacacg caaggtacag ccgctcctgc 240
aaggctgcgt ggtggacttg aacctgtagg tcctctgctg aagttcctcc actacctcac 300
caggcccagc agaccaaagc acaggctttt caggtccgtg tcatccactc taaaacactc 360
gactacgacc tactgatggc cctagattct tcatcaacaa tgcctgagac acttgctcag 420
aattgaaact ccctgaaggg accaccagag gccctgagtt gttccttccc cccgtggcga 480
gctgccagcc aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca 540
ggtcatggga ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc 600
taatcagcta tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt 660
gatccttcgt gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc 720
aactcgcgcg agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat 780
gcgcggcgcc tttcttgcga taatttatgc aatggactgc tctgcaaatt tctgggtctg 840
tcgccaaccc taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta 900
ccgactaccc taatatcagc ccggctgcct gacgccagcg tccacttttg cgtacacatt 960
ccattcgtgc ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt 1020
tcccgacctc cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1075
<210> 61
<211> 772
<212> DNA
<213> Prototheca moriformis
<400> 61
tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agagctcgac 60
tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 120
tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 180
gccagccagg ctgtacctgt gatcggggct ggcgggaaaa caggcttcgt gtgctcaggt 240
tatgggaggt gcaggacagc tcattaaacg ccaacaatcg cacaattcat ggcaagctaa 300
tcagttattt cccattaacg agctataatt gtcccaaaat tctggtctac cgggggtgat 360
ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc acatgcggtc gccgcgcaac 420
gcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 480
tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 540
ccaaccctag gatcagcggt gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 600
actgccctag tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 660
ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgatccc 720
caacctcctt attgttctgt cgacagagtg ggcccagagg ccggtcgcag cc 772
<210> 62
<211> 991
<212> DNA
<213> Prototheca moriformis
<400> 62
cgaaggggtc tgcatcgatt cgcgcggtct ggaggccagc gtgactgctc gcgaaaatgc 60
tctgccgtgt cgggctctgg ctggggcggc cagagatctc accgtgccac acgcaactgc 120
cgcactctgt gcccgccacc tggcgcgcac atgcgacctc ttccccgtca taccctctcc 180
tcatgtgatc tttccacacg agtgacgcag gtgcgcggag tggagggaat caggacgttt 240
tcaaggtacc tgctcgagcc gtaccaacag ctgccgcccg gcaaggaaga gatcgaggca 300
gagattgccc ggctggaggc ccggataacg gagctcaaga gcaagctgtc cgagtgagac 360
cgcccaggtg cacgtgtcga ctcgctatga catgtactcg acacaacatg aggaattcat 420
cgaatttgta ggaagcgggc attggtacgg gagtgggaaa gcgaaaaaac ctccctccgg 480
cagtgccatc tgccggagtc gaacgttgat agggttctcg tgacagggtg tgacctctca 540
gccttgcatc aattaaacgc tatagacatt atcagtaacc gtgaatcccg cattggatgc 600
cacccgcgcg accattgggg acctgcatta cagatctagg tgagatgaca gcgaggcaac 660
ttcggcccgc ggcccagctt gcggcgcacc aatattggtc acgggaagcc acacaccgac 720
cataaatgaa tacttgtaag ctatgtcaac cgatcaatgg cgtcgaaagt gtgccacgag 780
gatccatctg gcggggcggc gtggcgcaca agcgcagtcg caatttctcg gacccatctg 840
acctaggccc agcgccgcgg gagaaatccc cggcgggtcc tccacgcagt aaccctaatg 900
agtatcgagc gccgaccatt tacaccatcg cccccgaaat ccttccgaca ttattattat 960
cttttagatc ttggaacaga ctctgccaac c 991
<210> 63
<211> 1347
<212> DNA
<213> Prototheca moriformis
<400> 63
agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60
cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120
gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180
ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240
cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300
cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360
tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420
gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480
attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540
tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600
gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660
catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720
tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780
tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840
caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900
atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960
attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020
agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080
gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140
acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200
ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260
cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320
attttccagt cgtcagcgaa atcaagt 1347
<210> 64
<211> 1180
<212> DNA
<213> Prototheca moriformis
<400> 64
gatggtgggg tgtctgcctt gggctgggtg atggaggctg gtggtgcgcg ggtttcctga 60
tgcattctat ctacgcagtg tcatggtgtc cattccacac accagtacac ccttacacta 120
aggatccatc cctccttccc tcttcaggac tacatggacc ccacgagcta ccgaccgggc 180
tttctcaaaa acgtcaaggt catgtttgac atgcgggacg tggtggacga cgtgcaaggt 240
gcgtccggag tgcgcgcaaa tgagcaagtc gggcaatgtg tcggggtggg caccggggct 300
ggagatccgc gatccccgag aaaacgccgt accacccccc gcgctattcc ctcgattgcg 360
cgcagatgtg gtgaccgaca cgggggacaa cctggcggac atggggcgcc ggacctggaa 420
gcacgccaag tcgcacacgg ggaggctcgt gcagtccccc ccatcgtacc tcaagggtct 480
ctttggtcgc gatccaaagt acgctggtgg catggcatgc ccgaaatgaa catcatgtgt 540
gatctccgat tgccaatggc cacctccacg gaccaccttg caggcggaag cgcaatccag 600
ggcccgagcc tgacgaggac ggagactcct cgtccagcgc ggggtccccg acccgacgca 660
gcagccgacc cctgctaacc cggcaacgat cggaccagca accttgctgt agttccgatc 720
cgtgatgacg ggcattgccg ccgctcgatc cgctttgatg actgtctatt atttgcgcgg 780
agccccctcg gaaccctacc ccgctcttgc aagccccttg catcggagat cctcgtgcgc 840
ccgccatgac cccactggat tgcccaacat ccttctttat cgtgtaaaat gtgattcctc 900
ggctgcaatc gactggcctt cgcttctggc cccaagaggg ctcgaacgtg cggcagcgag 960
ggcgctgaca cacccaagcc ctagggcttt caacgtcggc tgccaggccg gataggggga 1020
tcgcctcctt tccaccaccc acctacgagg gattcgagtc ggcttccagc tcagctattc 1080
ggccgcgccc ccggccctgc agacgtcctc cagtttccga acaggtcgct ctcagaacac 1140
ctgccgcggc tgcgatacgg caggctctca aagcgtcgac 1180
<210> 65
<211> 1263
<212> DNA
<213> Prototheca moriformis
<400> 65
cgcgtggagc ggtgcgtgcg gatgccgcgc gcctgccaag gccttttgta tgcctggcct 60
gggaagtttc ctgactgaag catcttcaag atgctctctc acgaccagcg acaccaacac 120
cgtcactttt tgcccctcct gccgcaggtg ccactttcta ctttgacgtc ttctccaggc 180
ggtacattgc gggactgagc gccaattcgg ccaagaacag cgctgtcgac ttgaggaggc 240
aggggtccgt cgactctgcc gagtgacacg ccttcgaccc gactgtacta cggcctgctg 300
aagagtgggt ctcgccggcc ggcgtgaccg gccctgtgcc cacaatcgac catctattcg 360
ctccttgtca tctggcgccg tcaattgccc gcgacttgac ggcaactggc tcgatcgagt 420
cgtattgaaa aagcacgttt tgtcctacag ggccgcggtc cgttaccaac gtggttctcg 480
ttaggttttc gtcgggcggt ggtgcgcgaa ctgtccgatg ccatcccggc aaaccccagc 540
aaggtcgcca gtctggttct gacgcaatag agtgcgtttt gggccagtct aaaaattcgt 600
ctggcatgac gtggctccac atcgtacccg gagcctgcct tggtaatgtg aggcaccggt 660
gccaactcca ttatggcagg catcgagcgc gcaggtgagt acatgacctt ccgtgaattg 720
ggaaggcgag cttgtgtaac gcctgcgatc gtgccagtga ggcatcgtaa actcaaaata 780
ttttgtagaa agtgtctgat gcctggtgag gctgcgtagg gcaagggcaa gcccttggca 840
gatgggtaat gggtccggac ctcacaacag caaccccgcg tcccccttag ggcccctgag 900
gctcgatggc agggccagcg agcccgcggc caaagggcgc catcccacgg tcgcccaacg 960
actccacggg tcctatacct catcttgaat ggcactaaaa actatagaat atcgggcact 1020
ggtgggcgtc tggggtacag ctggccgagc gcagtggcaa accctaggtc ccgcctcaag 1080
ggcgattccc gggtcaatga cacgcaagca agatcacatg gcgcggtccg cctcgcggct 1140
ccacacccag gccctagttt cgcaacccat aaatatcgcc ccgataccat cataagccag 1200
caaataattt tttatcagag ttccaaacct cctcagctgt gggaaaccag cccactctga 1260
acg 1263
<210> 66
<211> 1400
<212> DNA
<213> Prototheca moriformis
<400> 66
ccgagcagtt catggccaag tacaaggact agagaccgga ggtcggtagg ctgaatggag 60
ctggcgtcgt cgtgcgcgac gtgcacgcga tgcgatacta cgaccccaca aacgcatgcc 120
tcccatcttg atgcctttcc ggccatttat actatttctc atttcgctgt aacatcttga 180
ataatagaat tgccctgtgt caagtggatt ccaagaaata ttctgtccca acaaaacaac 240
ccaacctgaa aacaacctca aataccacca gccctgccca cctgcccagt acacttttcc 300
aataccatct ccctaccttc acgcgcaagc ggcacccatg cgcgaccagg ctcgaaagga 360
tttcacgact caggacgagc gagtggcggc gcgaccgcct gcctgttcgt cacgtgccgt 420
acgtcggcga ccgctagagc tttgcctggc aacccccggc ttcgtcaacc cggccagcca 480
ggatctcgac cactctaccg cgaaatcgcc tcaagaagtc gccaaaagtg ccgtacacca 540
tgcttcgcag cgctgttcaa acttgatgcc aatcttgaca atcaggttgc tcgttggctg 600
cgtccacatc ggccgtgatt gcagcaggcg gggatcggac acggaggacg cggcgtcacg 660
ccgcgaacgc agcccgtaac tctacatcaa cgcgatatgt tgcgtaatcc cgcccggctg 720
cgcattgtga caacccattc gcgatggatg gtcggaaaat ggtgtgccaa ctgccctgag 780
ggactctctc gcgaaacggg cacgtccctg tatccgaaac tgtggcatgg ccttgtcgac 840
cacgcaagca cgtggaccct aacaccacga aaataagtaa aaaaggttga catcctctac 900
gagcgaattg tttgctcgac ccttcatcgc acactgtcat tataatgcat ctagctcggc 960
gacaagttta aaaaaggcag gctgcattat tccattttgc cgtggcggca tgggtgccca 1020
ttttatgagg tttgggctct tgggcagcga ccgagccagg ttgagtccct ctcgcccgtc 1080
gacaacgttc caaagcccat aagtggctaa taaacaactt gatggtacct gtacactgcc 1140
agttccttct tccccggccg aggtttacac gtgatggcca tggcttcgcg tttcaggctg 1200
acttcccatt ccgactttcc agagggtccg cggacgccgg gggttggctg cgtgaggccc 1260
accccttgtt ccccgcgtcc cgacaaacac aattgcgtta cataaggggg aagccgcccc 1320
ccgttcagag tgcaaacatc tttcattata tttttcagtc gtcagcgaaa tcaagtatgt 1380
cgctgacagg catgaaggcc 1400
<210> 67
<211> 6490
<212> DNA
<213> Prototheca moriformis
<400> 67
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
atcgaatttg taggaagcgg gcattggtac gggagtggga aagcgaaaaa acctccctcc 3360
ggcagtgcca tctgccggag tcgaacgttg atagggttct cgtgacaggg tgtgacctct 3420
cagccttgca tcaattaaac gctatagaca ttatcagtaa ccgtgaatcc cgcattggat 3480
gccacccgcg cgaccattgg ggacctgcat tacagatcta ggtgagatga cagcgaggca 3540
acttcggccc gcggcccagc ttgcggcgca ccaatattgg tcacgggaag ccacacaccg 3600
accataaatg aatacttgta agctatgtca accgatcaat ggcgtcgaaa gtgtgccacg 3660
aggatccatc tggcggggcg gcgtggcgca caagcgcagt cgcaatttct cggacccatc 3720
tgacctaggc ccagcgccgc gggagaaatc cccggcgggt cctccacgca gtaaccctaa 3780
tgagtatcga gcgccgacca tttacaccat cgccccccga aatccttccg acattattat 3840
tatcttttag atcttggaac agactctgcc aaccactagt atggccaccg catccacttt 3900
ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg gcgggctccg ggccccggcg 3960
cccagcgagg cccctccccg tgcgcgggcg cgcccccgac tggtccatgc tgttcgccgt 4020
gatcaccacc atcttctccg ccgccgagaa gcagtggacc aacctggagt ggaagcccaa 4080
gcccaacccc ccccagctgc tggacgacca cttcggcccc cacggcctgg tgttccgccg 4140
caccttcgcc atccgcagct acgaggtggg ccccgaccgc tccaccagca tcgtggccgt 4200
gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag tccgtgggca tcctgggcga 4260
cggcttcggc accaccctgg agatgtccaa gcgcgacctg atctgggtgg tgaagcgcac 4320
ccacgtggcc gtggagcgct accccgcctg gggcgacacc gtggaggtgg agtgctgggt 4380
gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg gtgcgcgact gcaagaccgg 4440
cgagatcctg acccgctgca cctccctgag cgtgatgatg aacacccgca cccgccgcct 4500
gagcaagatc cccgaggagg tgcgcggcga gatcggcccc gccttcatcg acaacgtggc 4560
cgtgaaggac gaggagatca agaagcccca gaagctgaac gactccaccg ccgactacat 4620
ccagggcggc ctgacccccc gctggaacga cctggacatc aaccagcacg tgaacaacat 4680
caagtacgtg gactggatcc tggagaccgt gcccgacagc atcttcgaga gccaccacat 4740
ctcctccttc accatcgagt accgccgcga gtgcaccatg gacagcgtgc tgcagtccct 4800
gaccaccgtg agcggcggct cctccgaggc cggcctggtg tgcgagcacc tgctgcagct 4860
ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg cgccccaagc tgaccgactc 4920
cttccgcggc atcagcgtga tccccgccga gtccagcgtg atggactaca aggaccacga 4980
cggcgactac aaggaccacg acatcgacta caaggacgac gacgacaagt gactcgagtt 5040
aattaactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 5100
gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 5160
aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 5220
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 5280
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 5340
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5400
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5460
tagagctcct tgttttccag aaggagttgc tccttgagcc tttcattctc agcctcgata 5520
acctccaaag ccgctctaat tgtggagggg gttcgaattt aaaagcttgg aatgttggtt 5580
cgtgcgtctg gaacaagccc agacttgttg ctcactggga aaaggaccat cagctccaaa 5640
aaacttgccg ctcaaaccgc gtacctctgc tttcgcgcaa tctgccctgt tgaaatcgcc 5700
accacattca tattgtgacg cttgagcagt ctgtaattgc ctcagaatgt ggaatcatct 5760
gccccctgtg cgagcccatg ccaggcatgt cgcgggcgag gacacccgcc actcgtacag 5820
cagaccatta tgctacctca caatagttca taacagtgac catatttctc gaagctcccc 5880
aacgagcacc tccatgctct gagtggccac cccccggccc tggtgcttgc ggagggcagg 5940
tcaaccggca tggggctacc gaaatccccg accggatccc accacccccg cgatgggaag 6000
aatctctccc cgggatgtgg gcccaccacc agcacaacct gctggcccag gcgagcgtca 6060
aaccatacca cacaaatatc cttggcatcg gccctgaatt ccttctgccg ctctgctacc 6120
cggtgcttct gtccgaagca ggggttgcta gggatcgctc cgagtccgca aacccttgtc 6180
gcgtggcggg gcttgttcga gcttgttcga gcttgaagag cctctagagt cgacctgcag 6240
gcatgcaagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct 6300
cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg 6360
agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct 6420
gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 6480
gcgctcttcc 6490
<210> 68
<211> 20
<212> DNA
<213> Cinnamomum camphora
<400> 68
taccccgcct ggggcgacac 20
<210> 69
<211> 20
<212> DNA
<213> Cinnamomum camphora
<400> 69
cttgctcagg cggcgggtgc 20
<210> 70
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 70
ccggatctcg gccagggcta 20
<210> 71
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 71
tcgatgtcgt gcaccgtcgc 20
<210> 72
<211> 1092
<212> DNA
<213> Prototheca moriformis
<400> 72
gctcttcggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa gacgaacagg 60
cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat ccccgcgcac 120
tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat cgcggtcatg 180
tccctgctct acgtcgcgtc gacgtacatc gaccctgcgc cggtgcctac gtgggtcaag 240
tatggcgtca tgtggccgct ctactggttc ttccaggtgt gtgtgagggt tgtggttgcc 300
cgtatcgagg tcctggtggc gcgcatgggg gagaaggcgc ctgtcccgct gacccccccg 360
gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg tgcgcgcacg 420
agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg ggcctggtgt 480
tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccgc cgccaccact 540
ccaacacggg gtgcctggac aaggacgagg tgtttgtgcc gccgcaccgc gcagtggcgc 600
acgagggcct ggagtgggag gagtggctgc ccatccgcat gggcaaggtg ctggtcaccc 660
tgaccctggg ctggccgctg tacctcatgt tcaacgtcgc ctcgcggccg tacccgcgct 720
tcgccaacca ctttgacccg tggtcgccca tcttcagcaa gcgcgaggta ccctttcttg 780
cgctatgaca cttccagcaa aaggtagggc gggctgcgag acggcttccc ggcgctgcat 840
gcaacaccga tgatgcttcg accccccgaa gctccttcgg ggctgcatgg gcgctccgat 900
gccgctccag ggcgagcgct gtttaaatag ccaggccccc gattgcaaag acattatagc 960
gagctaccaa agccatattc aaacacctag atcactacca cttctacaca ggccactcga 1020
gcttgtgatc gcactccgct aagggggcgc ctcttcctct tcgtttcagt cacaacccgc 1080
aaacggcgcg cc 1092
<210> 73
<211> 1400
<212> DNA
<213> Prototheca moriformis
<400> 73
caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60
ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120
cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180
ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240
aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300
cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360
actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggagc atcgaggtgg 420
tcatctccga cctcgcgttg gtggcggtgc tcagcgggct cagcgtgctg ggccgcacca 480
tgggctgggc ctggctggtc aagacctacg tggtgcccta catgatcgtg aacatgtggc 540
tggtgctcat cacgctgctc cagcacacgc acccggccct gccgcactac ttcgagaagg 600
actgggactg gctacgcggc gccatggcca ccgtcgaccg ctccatgggc ccgcccttca 660
tggacagcat cctgcaccac atctccgaca cccacgtgct gcaccacctc ttcagcacca 720
tcccgcacta ccacgccgag gaggcctccg ccgccatccg gcccatcctg ggcaagtact 780
accaatccga cagccgctgg gtcggccgcg ccctgtggga ggactggcgc gactgccgct 840
acgtcgtccc cgacgcgccc gaggacgact ccgcgctctg gttccacaag tgagcgcgcc 900
tgcgcgagga cgcagaacaa cgctgccgcc gtgtcttttg cacgcgcgac tccggcgctt 960
cgctggtggc acccccataa agaaaccctc aattctgttt gtggaagaca cggtgtaccc 1020
ccacccaccc acctgcacct ctattattgg tattattgac gcgggagtgg gcgttgtacc 1080
ctacaacgta gcttctctag ttttcagctg gctcccacca ttgtaaagag cctctagagt 1140
cgacctgcag gcatgcaagc ttggcgtaat catggtcata gctgtttcct gtgtgaaatt 1200
gttatccgct cacaattcca cacaacatac gagccggaag cataaagtgt aaagcctggg 1260
gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg ctcactgccc gctttccagt 1320
cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 1380
tgcgtattgg gcgctcttcc 1400
<210> 74
<211> 4091
<212> DNA
<213> Prototheca moriformis
<400> 74
gctcttcggg tttgctcacc cgcgaggtcg acgcccagca tggctatcaa gacgaacagg 60
cagcctgtgg agaagcctcc gttcacgatc gggacgctgc gcaaggccat ccccgcgcac 120
tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg cctttgacat cgcggtcatg 180
tccctgctct acgtcgcgtc gacgtacatc gaccctgcgc cggtgcctac gtgggtcaag 240
tatggcgtca tgtggccgct ctactggttc ttccaggtgt gtgtgagggt tgtggttgcc 300
cgtatcgagg tcctggtggc gcgcatgggg gagaaggcgc ctgtcccgct gacccccccg 360
gctaccctcc cggcaccttc cagggcgcct tcggcacggg tgtctgggtg tgcgcgcacg 420
agtgcggcca ccaggccttt tcctccagcc aggccatcaa cgacggcgtg ggcctggtgt 480
tccacagcct gctgctggtg ccctactact cctggaagca ctcgcaccgc cgccaccact 540
ccaacacggg gtgcctggac aaggacgagg tgtttgtgcc gccgcaccgc gcagtggcgc 600
acgagggcct ggagtgggag gagtggctgc ccatccgcat gggcaaggtg ctggtcaccc 660
tgaccctggg ctggccgctg tacctcatgt tcaacgtcgc ctcgcggccg tacccgcgct 720
tcgccaacca ctttgacccg tggtcgccca tcttcagcaa gcgcgaggta ccctttcttg 780
cgctatgaca cttccagcaa aaggtagggc gggctgcgag acggcttccc ggcgctgcat 840
gcaacaccga tgatgcttcg accccccgaa gctccttcgg ggctgcatgg gcgctccgat 900
gccgctccag ggcgagcgct gtttaaatag ccaggccccc gattgcaaag acattatagc 960
gagctaccaa agccatattc aaacacctag atcactacca cttctacaca ggccactcga 1020
gcttgtgatc gcactccgct aagggggcgc ctcttcctct tcgtttcagt cacaacccgc 1080
aaacggcgcg ccatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag 1140
atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac 1200
aagggctgga tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac 1260
ctgtacttcc agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac 1320
gccacgtccg acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc 1380
aacgactccg gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc 1440
ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg 1500
gagtccgagg agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac 1560
cagaagaacc ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg 1620
tacgagccct cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag 1680
atctactcct ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc 1740
ttcctcggct accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc 1800
agcaagtcct actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc 1860
ttcaaccagt acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag 1920
tcccgcgtgg tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac 1980
ccgacctacg ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc 2040
gtgcccacca acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc 2100
gagtaccagg ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac 2160
atcagcaacg ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac 2220
agctacaacg tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc 2280
gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag 2340
ggcctggagg accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc 2400
ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac 2460
cgcatgagcg tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg 2520
tacggcttgc tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc 2580
accaacacct acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg 2640
gtggacaacc tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca 2700
gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg 2760
ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt 2820
gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata 2880
ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct 2940
acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc 3000
ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg 3060
ctgatgcacg ggaagtagtg ggatgggaac acaaatggag catcgaggtg gtcatctccg 3120
acctcgcgtt ggtggcggtg ctcagcgggc tcagcgtgct gggccgcacc atgggctggg 3180
cctggctggt caagacctac gtggtgccct acatgatcgt gaacatgtgg ctggtgctca 3240
tcacgctgct ccagcacacg cacccggccc tgccgcacta cttcgagaag gactgggact 3300
ggctacgcgg cgccatggcc accgtcgacc gctccatggg cccgcccttc atggacagca 3360
tcctgcacca catctccgac acccacgtgc tgcaccacct cttcagcacc atcccgcact 3420
accacgccga ggaggcctcc gccgccatcc ggcccatcct gggcaagtac taccaatccg 3480
acagccgctg ggtcggccgc gccctgtggg aggactggcg cgactgccgc tacgtcgtcc 3540
ccgacgcgcc cgaggacgac tccgcgctct ggttccacaa gtgagcgcgc ctgcgcgagg 3600
acgcagaaca acgctgccgc cgtgtctttt gcacgcgcga ctccggcgct tcgctggtgg 3660
cacccccata aagaaaccct caattctgtt tgtggaagac acggtgtacc cccacccacc 3720
cacctgcacc tctattattg gtattattga cgcgggagtg ggcgttgtac cctacaacgt 3780
agcttctcta gttttcagct ggctcccacc attgtaaaga gcctctagag tcgacctgca 3840
ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 3900
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 3960
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 4020
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 4080
ggcgctcttc c 4091
<210> 75
<211> 510
<212> DNA
<213> Prototheca moriformis
<400> 75
gctcttccgc ctggagctgg tgcagagcat gggtcagttt gcggaggaga gggtgctccc 60
cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120
gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180
gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240
catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300
gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360
ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420
caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480
cttccaggag cgcgccacca agtaggtacc 510
<210> 76
<211> 1186
<212> DNA
<213> Prototheca moriformis
<400> 76
caattggcag cagcagctcg gatagtatcg acacactctg gacgctggtc gtgtgatgga 60
ctgttgccgc cacacttgct gccttgacct gtgaatatcc ctgccgcttt tatcaaacag 120
cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat 180
ttgcgaatac cacccccagc atccccttcc ctcgtttcat atcgcttgca tcccaaccgc 240
aacttatcta cgctgtcctg ctatccctca gcgctgctcc tgctcctgct cactgcccct 300
cgcacagcct tggtttgggc tccgcctgta ttctcctggt actgcaacct gtaaaccagc 360
actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca caaatggaag gatcgtagag 420
ctccagccac ggcaacaccg cgcgcctggc ggccgagcac ggcgacaagg gcctgagcaa 480
gatctgcggg ctgatcgcca gcgacgaggg ccggcacgag atcgcctaca cgcgcatcgt 540
ggacgagttc ttccgcctcg accccgaggg cgccgtcgcc gcctacgcca acatgatgcg 600
caagcagatc accatgcccg cgcacctcat ggacgacatg ggccacggcg aggccaaccc 660
gggccgcaac ctcttcgccg acttctccgc cgtcgccgag aagatcgacg tctacgacgc 720
cgaggactac tgccgcatcc tggagcacct caacgcgcgc tggaaggtgg acgagcgcca 780
ggtcagcggc caggccgccg cggaccagga gtacgttctg ggcctgcccc agcgcttccg 840
gaaactcgcc gagaagaccg ccgccaagcg caagcgcgtc gcgcgcaggc ccgtcgcctt 900
ctcctggaga gaagagcctc tagagtcgac ctgcaggcat gcaagcttgg cgtaatcatg 960
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 1020
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 1080
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 1140
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttcc 1186
<210> 77
<211> 3615
<212> DNA
<213> Prototheca moriformis
<400> 77
gctcttccgc ctggagctgg tgcagagcat gggtcagttt gcggaggaga gggtgctccc 60
cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120
gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180
gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240
catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300
gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360
ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420
caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480
cttccaggag cgcgccacca agtaggtacc ctttcttgcg ctatgacact tccagcaaaa 540
ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac 600
cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt 660
ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa 720
acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa 780
gggggcgcct cttcctcttc gtttcagtca caacccgcaa acggcgcgcc atgctgctgc 840
aggccttcct gttcctgctg gccggcttcg ccgccaagat cagcgcctcc atgacgaacg 900
agacgtccga ccgccccctg gtgcacttca cccccaacaa gggctggatg aacgacccca 960
acggcctgtg gtacgacgag aaggacgcca agtggcacct gtacttccag tacaacccga 1020
acgacaccgt ctgggggacg cccttgttct ggggccacgc cacgtccgac gacctgacca 1080
actgggagga ccagcccatc gccatcgccc cgaagcgcaa cgactccggc gccttctccg 1140
gctccatggt ggtggactac aacaacacct ccggcttctt caacgacacc atcgacccgc 1200
gccagcgctg cgtggccatc tggacctaca acaccccgga gtccgaggag cagtacatct 1260
cctacagcct ggacggcggc tacaccttca ccgagtacca gaagaacccc gtgctggccg 1320
ccaactccac ccagttccgc gacccgaagg tcttctggta cgagccctcc cagaagtgga 1380
tcatgaccgc ggccaagtcc caggactaca agatcgagat ctactcctcc gacgacctga 1440
agtcctggaa gctggagtcc gcgttcgcca acgagggctt cctcggctac cagtacgagt 1500
gccccggcct gatcgaggtc cccaccgagc aggaccccag caagtcctac tgggtgatgt 1560
tcatctccat caaccccggc gccccggccg gcggctcctt caaccagtac ttcgtcggca 1620
gcttcaacgg cacccacttc gaggccttcg acaaccagtc ccgcgtggtg gacttcggca 1680
aggactacta cgccctgcag accttcttca acaccgaccc gacctacggg agcgccctgg 1740
gcatcgcgtg ggcctccaac tgggagtact ccgccttcgt gcccaccaac ccctggcgct 1800
cctccatgtc cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc aacccggaga 1860
cggagctgat caacctgaag gccgagccga tcctgaacat cagcaacgcc ggcccctgga 1920
gccggttcgc caccaacacc acgttgacga aggccaacag ctacaacgtc gacctgtcca 1980
acagcaccgg caccctggag ttcgagctgg tgtacgccgt caacaccacc cagacgatct 2040
ccaagtccgt gttcgcggac ctctccctct ggttcaaggg cctggaggac cccgaggagt 2100
acctccgcat gggcttcgag gtgtccgcgt cctccttctt cctggaccgc gggaacagca 2160
aggtgaagtt cgtgaaggag aacccctact tcaccaaccg catgagcgtg aacaaccagc 2220
ccttcaagag cgagaacgac ctgtcctact acaaggtgta cggcttgctg gaccagaaca 2280
tcctggagct gtacttcaac gacggcgacg tcgtgtccac caacacctac ttcatgacca 2340
ccgggaacgc cctgggctcc gtgaacatga cgacgggggt ggacaacctg ttctacatcg 2400
acaagttcca ggtgcgcgag gtcaagtgac aattggcagc agcagctcgg atagtatcga 2460
cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg ccttgacctg 2520
tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc 2580
ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca tccccttccc 2640
tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc tatccctcag 2700
cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct ccgcctgtat 2760
tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg aagtagtggg 2820
atgggaacac aaatggaagg atcgtagagc tccagccacg gcaacaccgc gcgcctggcg 2880
gccgagcacg gcgacaaggg cctgagcaag atctgcgggc tgatcgccag cgacgagggc 2940
cggcacgaga tcgcctacac gcgcatcgtg gacgagttct tccgcctcga ccccgagggc 3000
gccgtcgccg cctacgccaa catgatgcgc aagcagatca ccatgcccgc gcacctcatg 3060
gacgacatgg gccacggcga ggccaacccg ggccgcaacc tcttcgccga cttctccgcc 3120
gtcgccgaga agatcgacgt ctacgacgcc gaggactact gccgcatcct ggagcacctc 3180
aacgcgcgct ggaaggtgga cgagcgccag gtcagcggcc aggccgccgc ggaccaggag 3240
tacgttctgg gcctgcccca gcgcttccgg aaactcgccg agaagaccgc cgccaagcgc 3300
aagcgcgtcg cgcgcaggcc cgtcgccttc tcctggagag aagagcctct agagtcgacc 3360
tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 3420
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 3480
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 3540
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 3600
attgggcgct cttcc 3615
<210> 78
<211> 511
<212> DNA
<213> Prototheca moriformis
<400> 78
gctcttcccg cctggagctg gtgcagagca tggggcagtt tgcggaggag agggtgctcc 60
ccgtgctgca ccccgtggac aagctgtggc agccgcagga cttcctgccc gaccccgagt 120
cgcccgactt cgaggaccag gtggcggagc tgcgcgcgcg cgccaaggac ctgcccgacg 180
agtactttgt ggtgctggtg ggcgacatga tcacggagga ggcgctgccg acctacatgg 240
ccatgctcaa caccttggac ggtgtgcgcg acgacacggg cgcggctgac cacccgtggg 300
cgcgctggac gcggcagtgg gtggccgagg agaaccggca cggcgacctg ctgaacaagt 360
actgttggct gacggggcgc gtcaacatgc gggccgtgga ggtgaccatc aacaacctga 420
tcaagagcgg catgaacccg cagacggaca acaaccctta cttgggcttc gtctacacct 480
ccttccagga gcgcgccacc aagtaggtac c 511
<210> 79
<211> 761
<212> DNA
<213> Prototheca moriformis
<400> 79
cagccacggc aacaccgcgc gccttgcggc cgagcacggc gacaagaacc tgagcaagat 60
ctgcgggctg atcgccagcg acgagggccg gcacgagatc gcctacacgc gcatcgtgga 120
cgagttcttc cgcctcgacc ccgagggcgc cgtcgccgcc tacgccaaca tgatgcgcaa 180
gcagatcacc atgcccgcgc acctcatgga cgacatgggc cacggcgagg ccaacccggg 240
ccgcaacctc ttcgccgact tctccgcggt cgccgagaag atcgacgtct acgacgccga 300
ggactactgc cgcatcctgg agcacctcaa cgcgcgctgg aaggtggacg agcgccaggt 360
cagcggccag gccgccgcgg accaggagta cgtcctgggc ctgccccagc gcttccggaa 420
actcgccgag aagaccgccg ccaagcgcaa gcgcgtcgcg cgcaggcccg tcgccttctc 480
ctggagaaga gcctctagag tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat 540
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 600
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 660
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 720
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc c 761
<210> 80
<211> 3599
<212> DNA
<213> Prototheca moriformis
<400> 80
gctcttcccg cctggagctg gtgcagagca tggggcagtt tgcggaggag agggtgctcc 60
ccgtgctgca ccccgtggac aagctgtggc agccgcagga cttcctgccc gaccccgagt 120
cgcccgactt cgaggaccag gtggcggagc tgcgcgcgcg cgccaaggac ctgcccgacg 180
agtactttgt ggtgctggtg ggcgacatga tcacggagga ggcgctgccg acctacatgg 240
ccatgctcaa caccttggac ggtgtgcgcg acgacacggg cgcggctgac cacccgtggg 300
cgcgctggac gcggcagtgg gtggccgagg agaaccggca cggcgacctg ctgaacaagt 360
actgttggct gacggggcgc gtcaacatgc gggccgtgga ggtgaccatc aacaacctga 420
tcaagagcgg catgaacccg cagacggaca acaaccctta cttgggcttc gtctacacct 480
ccttccagga gcgcgccacc aagtaggtac cctttcttgc gctatgacac ttccagcaaa 540
aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat gatgcttcga 600
ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg gcgagcgctg 660
tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa gccatattca 720
aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg cactccgcta 780
agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacggcgcgc catgctgctg 840
caggccttcc tgttcctgct ggccggcttc gccgccaaga tcagcgcctc catgacgaac 900
gagacgtccg accgccccct ggtgcacttc acccccaaca agggctggat gaacgacccc 960
aacggcctgt ggtacgacga gaaggacgcc aagtggcacc tgtacttcca gtacaacccg 1020
aacgacaccg tctgggggac gcccttgttc tggggccacg ccacgtccga cgacctgacc 1080
aactgggagg accagcccat cgccatcgcc ccgaagcgca acgactccgg cgccttctcc 1140
ggctccatgg tggtggacta caacaacacc tccggcttct tcaacgacac catcgacccg 1200
cgccagcgct gcgtggccat ctggacctac aacaccccgg agtccgagga gcagtacatc 1260
tcctacagcc tggacggcgg ctacaccttc accgagtacc agaagaaccc cgtgctggcc 1320
gccaactcca cccagttccg cgacccgaag gtcttctggt acgagccctc ccagaagtgg 1380
atcatgaccg cggccaagtc ccaggactac aagatcgaga tctactcctc cgacgacctg 1440
aagtcctgga agctggagtc cgcgttcgcc aacgagggct tcctcggcta ccagtacgag 1500
tgccccggcc tgatcgaggt ccccaccgag caggacccca gcaagtccta ctgggtgatg 1560
ttcatctcca tcaaccccgg cgccccggcc ggcggctcct tcaaccagta cttcgtcggc 1620
agcttcaacg gcacccactt cgaggccttc gacaaccagt cccgcgtggt ggacttcggc 1680
aaggactact acgccctgca gaccttcttc aacaccgacc cgacctacgg gagcgccctg 1740
ggcatcgcgt gggcctccaa ctgggagtac tccgccttcg tgcccaccaa cccctggcgc 1800
tcctccatgt ccctcgtgcg caagttctcc ctcaacaccg agtaccaggc caacccggag 1860
acggagctga tcaacctgaa ggccgagccg atcctgaaca tcagcaacgc cggcccctgg 1920
agccggttcg ccaccaacac cacgttgacg aaggccaaca gctacaacgt cgacctgtcc 1980
aacagcaccg gcaccctgga gttcgagctg gtgtacgccg tcaacaccac ccagacgatc 2040
tccaagtccg tgttcgcgga cctctccctc tggttcaagg gcctggagga ccccgaggag 2100
tacctccgca tgggcttcga ggtgtccgcg tcctccttct tcctggaccg cgggaacagc 2160
aaggtgaagt tcgtgaagga gaacccctac ttcaccaacc gcatgagcgt gaacaaccag 2220
cccttcaaga gcgagaacga cctgtcctac tacaaggtgt acggcttgct ggaccagaac 2280
atcctggagc tgtacttcaa cgacggcgac gtcgtgtcca ccaacaccta cttcatgacc 2340
accgggaacg ccctgggctc cgtgaacatg acgacggggg tggacaacct gttctacatc 2400
gacaagttcc aggtgcgcga ggtcaagtga caattggcag cagcagctcg gatagtatcg 2460
acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 2520
gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 2580
cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 2640
ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 2700
gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 2760
ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 2820
gatgggaaca caaatggaca gccacggcaa caccgcgcgc cttgcggccg agcacggcga 2880
caagaacctg agcaagatct gcgggctgat cgccagcgac gagggccggc acgagatcgc 2940
ctacacgcgc atcgtggacg agttcttccg cctcgacccc gagggcgccg tcgccgccta 3000
cgccaacatg atgcgcaagc agatcaccat gcccgcgcac ctcatggacg acatgggcca 3060
cggcgaggcc aacccgggcc gcaacctctt cgccgacttc tccgcggtcg ccgagaagat 3120
cgacgtctac gacgccgagg actactgccg catcctggag cacctcaacg cgcgctggaa 3180
ggtggacgag cgccaggtca gcggccaggc cgccgcggac caggagtacg tcctgggcct 3240
gccccagcgc ttccggaaac tcgccgagaa gaccgccgcc aagcgcaagc gcgtcgcgcg 3300
caggcccgtc gccttctcct ggagaagagc ctctagagtc gacctgcagg catgcaagct 3360
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 3420
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 3480
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 3540
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttcc 3599
<210> 81
<211> 2933
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 81
agagagcgga ggtggggttg tgaggtgggg ttgctgacca ggagctcgcg tcgccgagcg 60
cgactcgcac acggtccagt tacccccccc tccgcccaaa cgcaagcctc ccatcttgat 120
gcctttccgg ccacctatac tatttcttag ttcgctgtaa catccagacc gtcctgaata 180
ataacaatgc cctgtgtcaa gtgcattcct aaaaaaattc tgtcccaacc aacaatccca 240
cctgaaatac caccagccct gcccagtaca ctcttccaat accatctccc tacctccacg 300
cgcaagcgac ccccatgcgc gaccaggctc gaaagtgatt tatgacttga gacgagcgag 360
tggcggcgcg gtcgactgcc ttttcatcac gtgccgtacg tcggcgaccg ctagggcttt 420
gcacggcaac gcacggcttc gccaacccga ccagccagga cctcgactac tctaccgcga 480
attcgcctca agaagtcgcc aaatgtgcca tacaccattc cttacagcac tgttcaaact 540
tgatgccaat tttgacattc gggttgctcg ttggctgcgc ccacatcggc cgtgagtgca 600
gcaggcggga tcggacacgg aggacgcggc gtcacgcccc gaacgcagcc cgtaactcta 660
catcaacacg acgtgttgcg taatcccgcc cggctgcgca tcgtgccaac ccattcgcga 720
tggatggtcg gaaaatggtg tgccaactgc cctgagggag gctctcgcga aacgggcacg 780
tccctgaaac cgaaactgtg gccttgtcgt cggccacgca agcacgtgga ccctaaacac 840
caagaaaatc agtaaacaag gttgacatcc tctacgggcg aattgtttgc ccaacccttc 900
atcgcacact gccattataa tgcatctagc tcggcgacaa gtttagaaaa ggcaggctgc 960
attgttccat ttcgccgtgg cggcgtgggt gcccatttta cgaggtttgg gctcccgggc 1020
agcgaccgag ccaggtcgag tccctctcgc ccgtcgacaa tgttgcgaac cccacaagcg 1080
gctaacaaca acttgatggt acctgtacac tgccaattcc ttcttccccg gccgaggttt 1140
acacgtgatg gccatggctt cgcattcagg ccgacttccc attccgactt tccagagggt 1200
ccgcggacgc tgggggttgg ctgcctgagg cccacccttt gttccccgcg tcccgacaaa 1260
cacaattgcg ttacataagg gggagccgcc cccgttcaga gtgcagaaat ctttcactat 1320
attttccagt cgtcagcgaa atcaagtact agtatggcca ccgcatccac tttctcggcg 1380
ttcaatgccc gctgcggcga cctgcgtcgc tcggcgggct ccgggccccg gcgcccagcg 1440
aggcccctcc ccgtgcgcgg gcgcgccccc gactggtcca tgctgttcgc cgtgatcacc 1500
accatcttct ccgccgccga gaagcagtgg accaacctgg agtggaagcc caagcccaac 1560
cccccccagc tgctggacga ccacttcggc ccccacggcc tggtgttccg ccgcaccttc 1620
gccatccgca gctacgaggt gggccccgac cgctccacca gcatcgtggc cgtgatgaac 1680
cacctgcagg aggccgccct gaaccacgcc aagtccgtgg gcatcctggg cgacggcttc 1740
ggcaccaccc tggagatgtc caagcgcgac ctgatctggg tggtgaagcg cacccacgtg 1800
gccgtggagc gctaccccgc ctggggcgac accgtggagg tggagtgctg ggtgggcgcc 1860
tccggcaaca acggccgccg ccacgacttc ctggtgcgcg actgcaagac cggcgagatc 1920
ctgacccgct gcacctccct gagcgtgatg atgaacaccc gcacccgccg cctgagcaag 1980
atccccgagg aggtgcgcgg cgagatcggc cccgccttca tcgacaacgt ggccgtgaag 2040
gacgaggaga tcaagaagcc ccagaagctg aacgactcca ccgccgacta catccagggc 2100
ggcctgaccc cccgctggaa cgacctggac atcaaccagc acgtgaacaa catcaagtac 2160
gtggactgga tcctggagac cgtgcccgac agcatcttcg agagccacca catctcctcc 2220
ttcaccatcg agtaccgccg cgagtgcacc atggacagcg tgctgcagtc cctgaccacc 2280
gtgagcggcg gctcctccga ggccggcctg gtgtgcgagc acctgctgca gctggagggc 2340
ggcagcgagg tgctgcgcgc caagaccgag tggcgcccca agctgaccga ctccttccgc 2400
ggcatcagcg tgatccccgc cgagtccagc gtgatggact acaaggacca cgacggcgac 2460
tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgactcga gttaattaac 2520
tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 2580
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2640
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2700
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2760
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2820
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2880
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag ctt 2933
<210> 82
<211> 726
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 82
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacc 726
<210> 83
<211> 3635
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 83
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa actctagaat atcaatgatc gagcaggacg gcctccacgc cggctccccc 360
gccgcctggg tggagcgcct gttcggctac gactgggccc agcagaccat cggctgctcc 420
gacgccgccg tgttccgcct gtccgcccag ggccgccccg tgctgttcgt gaagaccgac 480
ctgtccggcg ccctgaacga gctgcaggac gaggccgccc gcctgtcctg gctggccacc 540
accggcgtgc cctgcgccgc cgtgctggac gtggtgaccg aggccggccg cgactggctg 600
ctgctgggcg aggtgcccgg ccaggacctg ctgtcctccc acctggcccc cgccgagaag 660
gtgtccatca tggccgacgc catgcgccgc ctgcacaccc tggaccccgc cacctgcccc 720
ttcgaccacc aggccaagca ccgcatcgag cgcgcccgca cccgcatgga ggccggcctg 780
gtggaccagg acgacctgga cgaggagcac cagggcctgg cccccgccga gctgttcgcc 840
cgcctgaagg cccgcatgcc cgacggcgag gacctggtgg tgacccacgg cgacgcctgc 900
ctgcccaaca tcatggtgga gaacggccgc ttctccggct tcatcgactg cggccgcctg 960
ggcgtggccg accgctacca ggacatcgcc ctggccaccc gcgacatcgc cgaggagctg 1020
ggcggcgagt gggccgaccg cttcctggtg ctgtacggca tcgccgcccc cgactcccag 1080
cgcatcgcct tctaccgcct gctggacgag ttcttctgac aattggcagc agcagctcgg 1140
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 1200
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 1260
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 1320
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 1380
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 1440
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 1500
aagtagtggg atgggaacac aaatggagga tcccgcgtct cgaacagagc gcgcagagga 1560
acgctgaagg tctcgcctct gtcgcacctc agcgcggcat acaccacaat aaccacctga 1620
cgaatgcgct tggttcttcg tccattagcg aagcgtccgg ttcacacacg tgccacgttg 1680
gcgaggtggc aggtgacaat gatcggtgga gctgatggtc gaaacgttca cagcctaggg 1740
atatcgaatt cctttcttgc gctatgacac ttccagcaaa aggtagggcg ggctgcgaga 1800
cggcttcccg gcgctgcatg caacaccgat gatgcttcga ccccccgaag ctccttcggg 1860
gctgcatggg cgctccgatg ccgctccagg gcgagcgctg tttaaatagc caggcccccg 1920
attgcaaaga cattatagcg agctaccaaa gccatattca aacacctaga tcactaccac 1980
ttctacacag gccactcgag cttgtgatcg cactccgcta agggggcgcc tcttcctctt 2040
cgtttcagtc acaacccgca aacactagta tggccaccgc atccactttc tcggcgttca 2100
atgcccgctg cggcgacctg cgtcgctcgg cgggctccgg gccccggcgc ccagcgaggc 2160
ccctccccgt gcgcgggcgc gcccccgact ggtccatgct gttcgccgtg atcaccacca 2220
tcttctccgc cgccgagaag cagtggacca acctggagtg gaagcccaag cccaaccccc 2280
cccagctgct ggacgaccac ttcggccccc acggcctggt gttccgccgc accttcgcca 2340
tccgcagcta cgaggtgggc cccgaccgct ccaccagcat cgtggccgtg atgaaccacc 2400
tgcaggaggc cgccctgaac cacgccaagt ccgtgggcat cctgggcgac ggcttcggca 2460
ccaccctgga gatgtccaag cgcgacctga tctgggtggt gaagcgcacc cacgtggccg 2520
tggagcgcta ccccgcctgg ggcgacaccg tggaggtgga gtgctgggtg ggcgcctccg 2580
gcaacaacgg ccgccgccac gacttcctgg tgcgcgactg caagaccggc gagatcctga 2640
cccgctgcac ctccctgagc gtgatgatga acacccgcac ccgccgcctg agcaagatcc 2700
ccgaggaggt gcgcggcgag atcggccccg ccttcatcga caacgtggcc gtgaaggacg 2760
aggagatcaa gaagccccag aagctgaacg actccaccgc cgactacatc cagggcggcc 2820
tgaccccccg ctggaacgac ctggacatca accagcacgt gaacaacatc aagtacgtgg 2880
actggatcct ggagaccgtg cccgacagca tcttcgagag ccaccacatc tcctccttca 2940
ccatcgagta ccgccgcgag tgcaccatgg acagcgtgct gcagtccctg accaccgtga 3000
gcggcggctc ctccgaggcc ggcctggtgt gcgagcacct gctgcagctg gagggcggca 3060
gcgaggtgct gcgcgccaag accgagtggc gccccaagct gaccgactcc ttccgcggca 3120
tcagcgtgat ccccgccgag tccagcgtga tggactacaa ggaccacgac ggcgactaca 3180
aggaccacga catcgactac aaggacgacg acgacaagtg actcgaggca gcagcagctc 3240
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 3300
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 3360
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3420
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 3480
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 3540
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 3600
ggaagtagtg ggatgggaac acaaatggaa agctt 3635
<210> 84
<211> 749
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 84
gagctccttg ttttccagaa ggagttgctc cttgagcctt tcattctcag cctcgataac 60
ctccaaagcc gctctaattg tggagggggt tcgaatttaa aagcttggaa tgttggttcg 120
tgcgtctgga acaagcccag acttgttgct cactgggaaa aggaccatca gctccaaaaa 180
acttgccgct caaaccgcgt acctctgctt tcgcgcaatc tgccctgttg aaatcgccac 240
cacattcata ttgtgacgct tgagcagtct gtaattgcct cagaatgtgg aatcatctgc 300
cccctgtgcg agcccatgcc aggcatgtcg cgggcgagga cacccgccac tcgtacagca 360
gaccattatg ctacctcaca atagttcata acagtgacca tatttctcga agctccccaa 420
cgagcacctc catgctctga gtggccaccc cccggccctg gtgcttgcgg agggcaggtc 480
aaccggcatg gggctaccga aatccccgac cggatcccac cacccccgcg atgggaagaa 540
tctctccccg ggatgtgggc ccaccaccag cacaacctgc tggcccaggc gagcgtcaaa 600
ccataccaca caaatatcct tggcatcggc cctgaattcc ttctgccgct ctgctacccg 660
gtgcttctgt ccgaagcagg ggttgctagg gatcgctccg agtccgcaaa cccttgtcgc 720
gtggcggggc ttgttcgagc ttgaagagc 749
<210> 85
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 85
ggaggaattc ggccgacagg acgcgcgtca 30
<210> 86
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 86
ggagactagt ggctgcgacc ggcctgtg 28
<210> 87
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 87
ggaggaattc tcaccagcgg acaaagcacc g 31
<210> 88
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 88
ggagactagt ggctgcgacc ggcctctgg 29
<210> 89
<211> 1065
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 89
ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 60
tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 120
ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 180
gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 240
aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 300
cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 360
tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 420
ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 480
aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 540
ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 600
tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 660
gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 720
agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 780
ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 840
taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 900
taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 960
ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 1020
cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagcc 1065
<210> 90
<211> 6981
<212> DNA
<213> Cinnamomum camphora
<400> 90
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 3360
tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 3420
ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 3480
gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 3540
aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 3600
cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 3660
tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 3720
ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 3780
aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 3840
ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 3900
tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 3960
gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 4020
agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 4080
ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 4140
taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 4200
taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 4260
ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 4320
cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag tatggccacc 4380
gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4440
gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4500
ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4560
tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4620
gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4680
atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 4740
atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 4800
gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 4860
gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 4920
tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 4980
acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5040
gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5100
gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5160
gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5220
agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5280
ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5340
ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5400
ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5460
aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5520
tgactcgagt taattaactc gaggcagcag cagctcggat agtatcgaca cactctggac 5580
gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 5640
ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 5700
ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 5760
gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 5820
tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 5880
gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5940
atggaaagct gtagagctcc ttgttttcca gaaggagttg ctccttgagc ctttcattct 6000
cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 6060
gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 6120
tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 6180
ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 6240
tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 6300
cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 6360
cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 6420
cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 6480
gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 6540
ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 6600
gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 6660
aaacccttgt cgcgtggcgg ggcttgttcg agcttgttcg agcttgaaga gcctctagag 6720
tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 6780
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 6840
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 6900
tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 6960
ttgcgtattg ggcgctcttc c 6981
<210> 91
<211> 1152
<212> DNA
<213> Cinnamomum camphora
<400> 91
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120
tggtccatgc tgttcgccgt gatcaccacc atcttctccg ccgccgagaa gcagtggacc 180
aacctggagt ggaagcccaa gcccaacccc ccccagctgc tggacgacca cttcggcccc 240
cacggcctgg tgttccgccg caccttcgcc atccgcagct acgaggtggg ccccgaccgc 300
tccaccagca tcgtggccgt gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag 360
tccgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420
atctgggtgg tgaagcgcac ccacgtggcc gtggagcgct accccgcctg gggcgacacc 480
gtggaggtgg agtgctgggt gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg 540
gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgatgatg 600
aacacccgca cccgccgcct gagcaagatc cccgaggagg tgcgcggcga gatcggcccc 660
gccttcatcg acaacgtggc cgtgaaggac gaggagatca agaagcccca gaagctgaac 720
gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacatc 780
aaccagcacg tgaacaacat caagtacgtg gactggatcc tggagaccgt gcccgacagc 840
atcttcgaga gccaccacat ctcctccttc accatcgagt accgccgcga gtgcaccatg 900
gacagcgtgc tgcagtccct gaccaccgtg agcggcggct cctccgaggc cggcctggtg 960
tgcgagcacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg 1020
cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gtccagcgtg 1080
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140
gacgacaagt ga 1152
<210> 92
<211> 1052
<212> DNA
<213> Umbellularia californica
<400> 92
ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc agcgccgccg 60
agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag ctgctggacg 120
accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc tcctacgagg 180
tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag gaggccaccc 240
tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc ctggagatgt 300
ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag cgctacccca 360
cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac aacggcatgc 420
gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc tgcacctccc 480
tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac gaggtgcgcg 540
gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag atcaagaagc 600
tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc ccccgctgga 660
acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg gtgttcgaga 720
ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg gagtaccgcc 780
gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc ggcagctccg 840
aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag gtgctgcgcg 900
cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc gtgatccccg 960
ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac cacgacatcg 1020
actacaagga cgacgacgac aagtgactcg ag 1052
<210> 93
<211> 1031
<212> DNA
<213> Ulmus americana
<400> 93
ggcgcgccca gctgcccgac tggagcatgc tgctggccgc gatcaccacc ctgttcctgg 60
cggccgagaa gcagtggatg atgctggact ggaagcccaa gcgccccgac atgctggtgg 120
accccttcgg cctgggccgc ttcgtgcagg acggcctggt gttccgcaac aacttcagca 180
tccgcagcta cgagatcggc gcggaccgca ccgccagcat cgagaccctg atgaaccacc 240
tgcaggagac cgccctgaac cacgtgaaga gcgtgggcct gctggaggac ggcctgggca 300
gcacccgcga gatgagcctg cgcaacctga tctgggtggt gaccaagatg caggtggcgg 360
tggaccgcta ccccacctgg ggcgacgagg tgcaggtgag cagctgggcg accgccatcg 420
gcaagaacgg catgcgccgc gagtggatcg tgaccgactt ccgcaccggc gagaccctgc 480
tgcgcgccac cagcgtgtgg gtgatgatga acaagctgac ccgccgcatc agcaagatcc 540
ccgaggaggt gtggcacgag atcggcccca gcttcatcga cgcgcccccc ctgcccaccg 600
tggaggacga cggccgcaag ctgacccgct tcgacgagag cagcgccgac ttcatccgca 660
agggcctgac cccccgctgg agcgacctgg acatcaacca gcacgtgaac aacgtgaagt 720
acatcggctg gctgctggag agcgcgcccc ccgagatcca cgagagccac gagatcgcca 780
gcctgaccct ggagtaccgc cgcgagtgcg gccgcgacag cgtgctgaac agcgccacca 840
aggtgagcga cagcagccag ctgggcaaga gcgccgtgga gtgcaaccac ctggtgcgcc 900
tgcagaacgg cggcgagatc gtgaagggcc gcaccgtgtg gcgccccaag cgccccctgt 960
acaacgacgg cgccgtggtg gacgtgcccg ccaagaccag cgatgacgat gacaagctgg 1020
gatgactcga g 1031
<210> 94
<211> 1182
<212> DNA
<213> Cuphea hookeriana
<400> 94
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
cagctgcccg actggagccg cctgctgacc gccatcacca ccgtgttcgt gaagtccaag 180
cgccccgaca tgcacgaccg caagtccaag cgccccgaca tgctggtgga cagcttcggc 240
ctggagtcca ccgtgcagga cggcctggtg ttccgccagt ccttctccat ccgctcctac 300
gagatcggca ccgaccgcac cgccagcatc gagaccctga tgaaccacct gcaggagacc 360
tccctgaacc actgcaagag caccggcatc ctgctggacg gcttcggccg caccctggag 420
atgtgcaagc gcgacctgat ctgggtggtg attaagatgc agatcaaggt gaaccgctac 480
cccgcctggg gcgacaccgt ggagatcaac acccgcttca gccgcctggg caagatcggc 540
atgggccgcg actggctgat ctccgactgc aacaccggcg agatcctggt gcgcgccacc 600
agcgcctacg ccatgatgaa ccagaagacc cgccgcctgt ccaagctgcc ctacgaggtg 660
caccaggaga tcgtgcccct gttcgtggac agccccgtga tcgaggactc cgacctgaag 720
gtgcacaagt tcaaggtgaa gaccggcgac agcatccaga agggcctgac ccccggctgg 780
aacgacctgg acgtgaacca gcacgtgtcc aacgtgaagt acatcggctg gatcctggag 840
agcatgccca ccgaggtgct ggagacccag gagctgtgct ccctggccct ggagtaccgc 900
cgcgagtgcg gccgcgactc cgtgctggag agcgtgaccg ccatggaccc cagcaaggtg 960
ggcgtgcgct cccagtacca gcacctgctg cgcctggagg acggcaccgc catcgtgaac 1020
ggcgccaccg agtggcgccc caagaacgcc ggcgccaacg gcgccatctc caccggcaag 1080
accagcaacg gcaactccgt gtccatggac tacaaggacc acgacggcga ctacaaggac 1140
cacgacatcg actacaagga cgacgacgac aagtgactcg ag 1182
<210> 95
<211> 20
<212> DNA
<213> Umbellularia californica
<400> 95
ctgggcgacg gcttcggcac 20
<210> 96
<211> 20
<212> DNA
<213> Umbellularia californica
<400> 96
aagtcgcggc gcatgccgtt 20
<210> 97
<211> 20
<212> DNA
<213> Ulmus americana
<400> 97
cccagctgct cacctgcacc 20
<210> 98
<211> 26
<212> DNA
<213> Ulmus americana
<400> 98
cacccaaggc caacggcagc gccgtg 26
<210> 99
<211> 20
<212> DNA
<213> Cuphea hookeriana
<400> 99
taccccgcct ggggcgacac 20
<210> 100
<211> 20
<212> DNA
<213> Cuphea hookeriana
<400> 100
agcttggaca ggcggcgggt 20
<210> 101
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 101
tcacttcatg ccggcggtcc 20
<210> 102
<211> 20
<212> DNA
<213> Prototheca moriformis
<400> 102
gcgctcctgc ttggctcgaa 20
<210> 103
<211> 733
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 103
gctcttcgag acgtggtctg aatcctccag gcgggtttcc ccgagaaaga aagggtgccg 60
atttcaaagc agagccatgt gccgggccct gtggcctgtg ttggcgccta tgtagtcacc 120
ccccctcacc caattgtcgc cagtttgcgc aatccataaa ctcaaaactg cagcttctga 180
gctgcgctgt tcaagaacac ctctggggtt tgctcacccg cgaggtcgac gcccagcatg 240
gctatcaaga cgaacaggca gcctgtggag aagcctccgt tcacgatcgg gacgctgcgc 300
aaggccatcc ccgcgcactg tttcgagcgc tcggcgcttc gtagcagcat gtacctggcc 360
tttgacatcg cggtcatgtc cctgctctac gtcgcgtcga cgtacatcga ccctgcgccg 420
gtgcctacgt gggtcaagta tggcgtcatg tggccgctct actggttctt ccaggtgtgt 480
gtgagggttg tggttgcccg tatcgaggtc ctggtggcgc gcatggggga gaaggcgcct 540
gtcccgctga cccccccggc taccctcccg gcaccttcca gggcgccttc ggcacgggtg 600
tctgggtgtg cgcgcacgag tgcggccacc aggccttttc ctccagccag gccatcaacg 660
acggcgtggg cctggtgttc cacagcctgc tgctggtgcc ctactactcc tggaagcact 720
cgcaccgggt acc 733
<210> 104
<211> 739
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 104
ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60
cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120
gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180
gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240
catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300
gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360
gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420
cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480
cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540
cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600
gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660
cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720
gtgagtgagt gagaagagc 739
<210> 105
<211> 2327
<212> DNA
<213> Saccharomyces cerevisiae
<400> 105
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa acggcgcgcc atgctgctgc aggccttcct gttcctgctg gccggcttcg 360
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 420
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 480
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 540
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 600
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 660
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 720
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 780
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 840
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 900
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 960
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 1020
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 1080
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 1140
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 1200
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 1260
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 1320
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 1380
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 1440
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 1500
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 1560
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 1620
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 1680
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 1740
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 1800
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 1860
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 1920
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 1980
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 2040
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 2100
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 2160
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 2220
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 2280
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatgga 2327
<210> 106
<211> 735
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 106
gctcttcgag gggctggtct gaatccttca ggcgggtgtt acccgagaaa gaaagggtgc 60
cgatttcaaa gcagacccat gtgccgggcc ctgtggcctg tgttggcgcc tatgtagtca 120
ccccccctca cccaattgtc gccagtttgc gcactccata aactcaaaac agcagcttct 180
gagctgcgct gttcaagaac acctctgggg tttgctcacc cgcgaggtcg acgcccagca 240
tggctatcaa gacgaacagg cagcctgtgg agaagcctcc gttcacgatc gggacgctgc 300
gcaaggccat ccccgcgcac tgtttcgagc gctcggcgct tcgtagcagc atgtacctgg 360
cctttgacat cgcggtcatg tccctgctct acgtcgcgtc gacgtacatc gaccctgcac 420
cggtgcctac gtgggtcaag tacggcatca tgtggccgct ctactggttc ttccaggtgt 480
gtttgagggt tttggttgcc cgtattgagg tcctggtggc gcgcatggag gagaaggcgc 540
ctgtcccgct gacccccccg gctaccctcc cggcaccttc cagggcgcct tcggcacggg 600
tgtctgggtg tgcgcgcacg agtgcggcca ccaggccttt tcctccagcc aggccatcaa 660
cgacggcgtg ggcctggtgt tccacagcct gctgctggtg ccctactact cctggaagca 720
ctcgcaccgg gtacc 735
<210> 107
<211> 739
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 107
ccgccaccac tccaacacgg ggtgcctgga caaggacgag gtgtttgtgc cgccgcaccg 60
cgcagtggcg cacgagggcc tggagtggga ggagtggctg cccatccgca tgggcaaggt 120
gctggtcacc ctgaccctgg gctggccgct gtacctcatg ttcaacgtcg cctcgcggcc 180
gtacccgcgc ttcgccaacc actttgaccc gtggtcgccc atcttcagca agcgcgagcg 240
catcgaggtg gtcatctccg acctggcgct ggtggcggtg ctcagcgggc tcagcgtgct 300
gggccgcacc atgggctggg cctggctggt caagacctac gtggtgccct acctgatcgt 360
gaacatgtgg ctcgtgctca tcacgctgct ccagcacacg cacccggcgc tgccgcacta 420
cttcgagaag gactgggact ggctgcgcgg cgccatggcc accgtggacc gctccatggg 480
cccgcccttc atggacaaca tcctgcacca catctccgac acccacgtgc tgcaccacct 540
cttcagcacc atcccgcact accacgccga ggaggcctcc gccgccatca ggcccatcct 600
gggcaagtac taccagtccg acagccgctg ggtcggccgc gccctgtggg aggactggcg 660
cgactgccgc tacgtcgtcc cggacgcgcc cgaggacgac tccgcgctct ggttccacaa 720
gtgagtgagt gagaagagc 739
<210> 108
<211> 471
<212> PRT
<213> Saccharomyces carlbergensis
<400> 108
Met Phe Ala Phe Tyr Phe Leu Thr Ala Cys Ile Ser Leu Lys Gly Val
1 5 10 15
Phe Gly Val Ser Pro Ser Tyr Asn Gly Leu Gly Leu Thr Pro Gln Met
20 25 30
Gly Trp Asp Asn Trp Asn Thr Phe Ala Cys Asp Val Ser Glu Gln Leu
35 40 45
Leu Leu Asp Thr Ala Asp Arg Ile Ser Asp Leu Gly Leu Lys Asp Met
50 55 60
Gly Tyr Lys Tyr Ile Ile Leu Asp Asp Cys Trp Ser Ser Gly Arg Asp
65 70 75 80
Ser Asp Gly Phe Leu Val Ala Asp Glu Gln Lys Phe Pro Asn Gly Met
85 90 95
Gly His Val Ala Asp His Leu His Asn Asn Ser Phe Leu Phe Gly Met
100 105 110
Tyr Ser Ser Ala Gly Glu Tyr Thr Cys Ala Gly Tyr Pro Gly Ser Leu
115 120 125
Gly Arg Glu Glu Glu Asp Ala Gln Phe Phe Ala Asn Asn Arg Val Asp
130 135 140
Tyr Leu Lys Tyr Asp Asn Cys Tyr Asn Lys Gly Gln Phe Gly Thr Pro
145 150 155 160
Glu Ile Ser Tyr His Arg Tyr Lys Ala Met Ser Asp Ala Leu Asn Lys
165 170 175
Thr Gly Arg Pro Ile Phe Tyr Ser Leu Cys Asn Trp Gly Gln Asp Leu
180 185 190
Thr Phe Tyr Trp Gly Ser Gly Ile Ala Asn Ser Trp Arg Met Ser Gly
195 200 205
Asp Val Thr Ala Glu Phe Thr Arg Pro Asp Ser Arg Cys Pro Cys Asp
210 215 220
Gly Asp Glu Tyr Asp Cys Lys Tyr Ala Gly Phe His Cys Ser Ile Met
225 230 235 240
Asn Ile Leu Asn Lys Ala Ala Pro Met Gly Gln Asn Ala Gly Val Gly
245 250 255
Gly Trp Asn Asp Leu Asp Asn Leu Glu Val Gly Val Gly Asn Leu Thr
260 265 270
Asp Asp Glu Glu Lys Ala His Phe Ser Met Trp Ala Met Val Lys Ser
275 280 285
Pro Leu Ile Ile Gly Ala Asn Val Asn Asn Leu Lys Ala Ser Ser Tyr
290 295 300
Ser Ile Tyr Ser Gln Ala Ser Val Ile Ala Ile Asn Gln Asp Ser Asn
305 310 315 320
Gly Ile Pro Ala Thr Arg Val Trp Arg Tyr Tyr Val Ser Asp Thr Asp
325 330 335
Glu Tyr Gly Gln Gly Glu Ile Gln Met Trp Ser Gly Pro Leu Asp Asn
340 345 350
Gly Asp Gln Val Val Ala Leu Leu Asn Gly Gly Ser Val Ser Arg Pro
355 360 365
Met Asn Thr Thr Leu Glu Glu Ile Phe Phe Asp Ser Asn Leu Gly Ser
370 375 380
Lys Lys Leu Thr Ser Thr Trp Asp Ile Tyr Asp Leu Trp Ala Asn Arg
385 390 395 400
Val Asp Asn Ser Thr Ala Ser Ala Ile Leu Gly Arg Asn Lys Thr Ala
405 410 415
Thr Gly Ile Leu Tyr Asn Ala Thr Glu Gln Ser Tyr Lys Asp Gly Leu
420 425 430
Ser Lys Asn Asp Thr Arg Leu Phe Gly Gln Lys Ile Gly Ser Leu Ser
435 440 445
Pro Asn Ala Ile Leu Asn Thr Thr Val Pro Ala His Gly Ile Ala Phe
450 455 460
Tyr Arg Leu Arg Pro Ser Ser
465 470
<210> 109
<211> 18
<212> PRT
<213> Saccharomyces carlbergensis
<400> 109
Met Phe Ala Phe Tyr Phe Leu Thr Ala Cys Ile Ser Leu Lys Gly Val
1 5 10 15
Phe Gly
<210> 110
<211> 3183
<212> DNA
<213> Saccharomyces carlbergensis
<400> 110
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatgttc gcgttctact tcctgacggc ctgcatctcc ctgaagggcg tgttcggcgt 900
ctccccctcc tacaacggcc tgggcctgac gccccagatg ggctgggaca actggaacac 960
gttcgcctgc gacgtctccg agcagctgct gctggacacg gccgaccgca tctccgacct 1020
gggcctgaag gacatgggct acaagtacat catcctggac gactgctggt cctccggccg 1080
cgactccgac ggcttcctgg tcgccgacga gcagaagttc cccaacggca tgggccacgt 1140
cgccgaccac ctgcacaaca actccttcct gttcggcatg tactcctccg cgggcgagta 1200
cacgtgcgcc ggctaccccg gctccctggg ccgcgaggag gaggacgccc agttcttcgc 1260
gaacaaccgc gtggactacc tgaagtacga caactgctac aacaagggcc agttcggcac 1320
gcccgagatc tcctaccacc gctacaaggc catgtccgac gccctgaaca agacgggccg 1380
ccccatcttc tactccctgt gcaactgggg ccaggacctg accttctact ggggctccgg 1440
catcgcgaac tcctggcgca tgtccggcga cgtcacggcg gagttcacgc gccccgactc 1500
ccgctgcccc tgcgacggcg acgagtacga ctgcaagtac gccggcttcc actgctccat 1560
catgaacatc ctgaacaagg ccgcccccat gggccagaac gcgggcgtcg gcggctggaa 1620
cgacctggac aacctggagg tcggcgtcgg caacctgacg gacgacgagg agaaggcgca 1680
cttctccatg tgggccatgg tgaagtcccc cctgatcatc ggcgcgaacg tgaacaacct 1740
gaaggcctcc tcctactcca tctactccca ggcgtccgtc atcgccatca accaggactc 1800
caacggcatc cccgccacgc gcgtctggcg ctactacgtg tccgacacgg acgagtacgg 1860
ccagggcgag atccagatgt ggtccggccc cctggacaac ggcgaccagg tcgtggcgct 1920
gctgaacggc ggctccgtgt cccgccccat gaacacgacc ctggaggaga tcttcttcga 1980
ctccaacctg ggctccaaga agctgacctc cacctgggac atctacgacc tgtgggcgaa 2040
ccgcgtcgac aactccacgg cgtccgccat cctgggccgc aacaagaccg ccaccggcat 2100
cctgtacaac gccaccgagc agtcctacaa ggacggcctg tccaagaacg acacccgcct 2160
gttcggccag aagatcggct ccctgtcccc caacgcgatc ctgaacacga ccgtccccgc 2220
ccacggcatc gcgttctacc gcctgcgccc ctcctcctga caattgaagc agcagcagct 2280
cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2340
ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2400
tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2460
gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2520
tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2580
gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2640
gggaagtagt gggatgggaa cacaaatgga aagcttgagc tcagaatagt atcgggtgat 2700
gcgaagtcag aaccaggcag ggcctgtcgc ctgaggtggc aacgatggga agcaatcaat 2760
ctgggtacag tcgtccgcac gatcccgtga tctcccccac cgacacctat ccccgcccat 2820
cccggcccac cctttcagtc ccctcagcat gcattgtgca ccgcgacaaa gcatgtctgc 2880
tcgtgcactg gttcaggcca cggcgcaccg agtcctcgcc cttcgcagag tgatcaccct 2940
ccccggaacc agccacgctc gctgctgcgg gccgatcagc cgcgcgcact ccctgcaact 3000
agggacaact caggcaacca cgcgcctcac aagcatggcc gccgtggcat ccaacccgct 3060
cgtgacggtg ggtgcgcaag tgccaggggc ctcgtcgtca cggcgtgcat cctcgaggga 3120
tgcgatccgg caactatatg tcgtttatct ccccaccaat cacaggatga gcccctgtct 3180
aga 3183
<210> 111
<211> 1416
<212> DNA
<213> Saccharomyces carlbergensis
<400> 111
atgttcgcgt tctacttcct gacggcctgc atctccctga agggcgtgtt cggcgtctcc 60
ccctcctaca acggcctggg cctgacgccc cagatgggct gggacaactg gaacacgttc 120
gcctgcgacg tctccgagca gctgctgctg gacacggccg accgcatctc cgacctgggc 180
ctgaaggaca tgggctacaa gtacatcatc ctggacgact gctggtcctc cggccgcgac 240
tccgacggct tcctggtcgc cgacgagcag aagttcccca acggcatggg ccacgtcgcc 300
gaccacctgc acaacaactc cttcctgttc ggcatgtact cctccgcggg cgagtacacg 360
tgcgccggct accccggctc cctgggccgc gaggaggagg acgcccagtt cttcgcgaac 420
aaccgcgtgg actacctgaa gtacgacaac tgctacaaca agggccagtt cggcacgccc 480
gagatctcct accaccgcta caaggccatg tccgacgccc tgaacaagac gggccgcccc 540
atcttctact ccctgtgcaa ctggggccag gacctgacct tctactgggg ctccggcatc 600
gcgaactcct ggcgcatgtc cggcgacgtc acggcggagt tcacgcgccc cgactcccgc 660
tgcccctgcg acggcgacga gtacgactgc aagtacgccg gcttccactg ctccatcatg 720
aacatcctga acaaggccgc ccccatgggc cagaacgcgg gcgtcggcgg ctggaacgac 780
ctggacaacc tggaggtcgg cgtcggcaac ctgacggacg acgaggagaa ggcgcacttc 840
tccatgtggg ccatggtgaa gtcccccctg atcatcggcg cgaacgtgaa caacctgaag 900
gcctcctcct actccatcta ctcccaggcg tccgtcatcg ccatcaacca ggactccaac 960
ggcatccccg ccacgcgcgt ctggcgctac tacgtgtccg acacggacga gtacggccag 1020
ggcgagatcc agatgtggtc cggccccctg gacaacggcg accaggtcgt ggcgctgctg 1080
aacggcggct ccgtgtcccg ccccatgaac acgaccctgg aggagatctt cttcgactcc 1140
aacctgggct ccaagaagct gacctccacc tgggacatct acgacctgtg ggcgaaccgc 1200
gtcgacaact ccacggcgtc cgccatcctg ggccgcaaca agaccgccac cggcatcctg 1260
tacaacgcca ccgagcagtc ctacaaggac ggcctgtcca agaacgacac ccgcctgttc 1320
ggccagaaga tcggctccct gtcccccaac gcgatcctga acacgaccgt ccccgcccac 1380
ggcatcgcgt tctaccgcct gcgcccctcc tcctga 1416
<210> 112
<211> 526
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 112
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattc 526
<210> 113
<211> 507
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 113
gagctcagaa tagtatcggg tgatgcgaag tcagaaccag gcagggcctg tcgcctgagg 60
tggcaacgat gggaagcaat caatctgggt acagtcgtcc gcacgatccc gtgatctccc 120
ccaccgacac ctatccccgc ccatcccggc ccaccctttc agtcccctca gcatgcattg 180
tgcaccgcga caaagcatgt ctgctcgtgc actggttcag gccacggcgc accgagtcct 240
cgcccttcgc agagtgatca ccctccccgg aaccagccac gctcgctgct gcgggccgat 300
cagccgcgcg cactccctgc aactagggac aactcaggca accacgcgcc tcacaagcat 360
ggccgccgtg gcatccaacc cgctcgtgac ggtgggtgcg caagtgccag gggcctcgtc 420
gtcacggcgt gcatcctcga gggatgcgat ccggcaacta tatgtcgttt atctccccac 480
caatcacagg atgagcccct gtctaga 507
<210> 114
<211> 312
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 114
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa ac 312
<210> 115
<211> 408
<212> DNA
<213> Chlorella vulgaris
<400> 115
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 60
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 120
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 180
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 240
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 300
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 360
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagctt 408
<210> 116
<211> 747
<212> PRT
<213> Aspergillus niger
<400> 116
Met Ile Gly Ser Ser His Ala Val Val Ala Leu Gly Leu Phe Thr Leu
1 5 10 15
Tyr Gly His Ser Ala Ala Ala Pro Ala Ile Gly Ala Ser Asn Ser Gln
20 25 30
Thr Ile Val Thr Asn Gly Thr Ser Phe Ala Leu Asn Gly Asp Asn Val
35 40 45
Ser Tyr Arg Phe His Val Asn Ser Ser Thr Gly Asp Leu Ile Ser Asp
50 55 60
His Phe Gly Gly Val Val Ser Gly Thr Ile Pro Ser Pro Val Glu Pro
65 70 75 80
Ala Val Asn Gly Trp Val Gly Met Pro Gly Arg Ile Arg Arg Glu Phe
85 90 95
Pro Asp Gln Gly Arg Gly Asp Phe Arg Ile Pro Ala Val Arg Ile Arg
100 105 110
Glu Ser Ala Gly Tyr Thr Val Ser Asp Leu Gln Tyr Val Ser His Glu
115 120 125
Val Ile Glu Gly Lys Tyr Ala Leu Pro Gly Leu Pro Ala Thr Phe Gly
130 135 140
Asp Ala Gln Asp Ala Thr Thr Leu Val Val His Leu Tyr Asp Asn Tyr
145 150 155 160
Ser Ser Val Ala Ala Asp Leu Ser Tyr Ser Ile Phe Pro Lys Tyr Asp
165 170 175
Ala Ile Val Arg Ser Val Asn Val Thr Asn Gln Gly Pro Gly Asn Ile
180 185 190
Thr Ile Glu Ala Leu Ala Ser Ile Ser Ile Asp Phe Pro Tyr Glu Asp
195 200 205
Leu Asp Met Val Ser Leu Arg Gly Asp Trp Ala Arg Glu Ala Asn Val
210 215 220
Gln Arg Ser Lys Val Gln Tyr Gly Val Gln Gly Phe Gly Ser Ser Thr
225 230 235 240
Gly Tyr Ser Ser His Leu His Asn Pro Phe Leu Ala Ile Val Asp Pro
245 250 255
Ala Thr Thr Glu Ser Gln Gly Glu Ala Trp Gly Phe Asn Leu Val Tyr
260 265 270
Thr Gly Ser Phe Ser Ala Gln Val Glu Lys Gly Ser Gln Gly Phe Thr
275 280 285
Arg Ala Leu Leu Gly Phe Asn Pro Asp Gln Leu Ser Trp Asn Leu Gly
290 295 300
Pro Gly Glu Thr Leu Thr Ser Pro Glu Cys Val Ala Val Tyr Ser Asp
305 310 315 320
Lys Gly Leu Gly Ser Val Ser Arg Lys Phe His Arg Leu Tyr Arg Asn
325 330 335
His Leu Met Lys Ser Lys Phe Ala Thr Ser Asp Arg Pro Val Leu Leu
340 345 350
Asn Ser Trp Glu Gly Val Tyr Phe Asp Tyr Asn Gln Ser Ser Ile Glu
355 360 365
Thr Leu Ala Glu Glu Ser Ala Ala Leu Gly Val His Leu Phe Val Met
370 375 380
Asp Asp Gly Trp Phe Gly Asp Lys Tyr Pro Arg Val Ser Asp Asn Ala
385 390 395 400
Gly Leu Gly Asp Trp Met Pro Asn Pro Ala Arg Phe Pro Asp Gly Leu
405 410 415
Thr Pro Val Val Gln Asp Ile Thr Asn Leu Thr Val Asn Gly Thr Glu
420 425 430
Ser Thr Lys Leu Arg Phe Gly Ile Trp Val Glu Pro Glu Met Val Asn
435 440 445
Pro Asn Ser Thr Leu Tyr His Glu His Pro Glu Trp Ala Leu His Ala
450 455 460
Gly Pro Tyr Pro Arg Thr Glu Arg Arg Asn Gln Leu Val Leu Asn Leu
465 470 475 480
Ala Leu Pro Ala Val Gln Asp Phe Ile Ile Asp Phe Met Thr Asn Leu
485 490 495
Leu Gln Asp Thr Gly Ile Ser Tyr Val Lys Trp Asp Asn Asn Arg Gly
500 505 510
Ile His Glu Thr Pro Ser Pro Ser Thr Asp His Gln Tyr Met Leu Gly
515 520 525
Leu Tyr Arg Val Phe Asp Thr Leu Thr Thr Arg Phe Pro Asp Val Leu
530 535 540
Trp Glu Gly Cys Ala Ser Gly Gly Gly Arg Phe Asp Ala Gly Met Leu
545 550 555 560
Gln Tyr Val Pro Gln Ile Trp Thr Ser Asp Asn Thr Asp Ala Ile Asp
565 570 575
Arg Ile Thr Ile Gln Phe Gly Thr Ser Leu Ala Tyr Pro Pro Ser Ala
580 585 590
Met Gly Ala His Leu Ser Ala Val Pro Asn Ala Gln Thr Gly Arg Thr
595 600 605
Val Pro Phe Thr Phe Arg Ala His Val Ala Met Met Gly Gly Ser Phe
610 615 620
Gly Leu Glu Leu Asp Pro Ala Thr Val Glu Gly Asp Glu Ile Val Pro
625 630 635 640
Glu Leu Leu Ala Leu Ala Glu Lys Val Asn Pro Ile Ile Leu Asn Gly
645 650 655
Asp Leu Tyr Arg Leu Arg Leu Pro Gln Asp Ser Gln Trp Pro Ala Ala
660 665 670
Leu Phe Val Ser Gln Asp Gly Ala Gln Ala Val Leu Phe Tyr Phe Gln
675 680 685
Val Gln Pro Asn Val Asn His Ala Val Pro Trp Val Arg Leu Gln Gly
690 695 700
Leu Asp Pro Lys Ala Asp Tyr Thr Val Asp Gly Asp Gln Thr Tyr Ser
705 710 715 720
Gly Ala Thr Leu Met Asn Leu Gly Leu Gln Tyr Ser Phe Asp Thr Glu
725 730 735
Tyr Gly Ser Lys Val Val Phe Leu Glu Arg Gln
740 745
<210> 117
<211> 28
<212> PRT
<213> Aspergillus niger
<400> 117
Met Ile Gly Ser Ser His Ala Val Val Ala Leu Gly Leu Phe Thr Leu
1 5 10 15
Tyr Gly His Ser Ala Ala Ala Pro Ala Ile Gly Ala
20 25
<210> 118
<211> 2244
<212> DNA
<213> Aspergillus niger
<400> 118
atgatcggct cctcccacgc ggtcgtcgcc ctgggcctgt tcaccctgta cggccactcc 60
gccgccgcgc ccgccatcgg cgcctccaac tcccagacca tcgtcacgaa cggcacctcc 120
ttcgccctga acggcgacaa cgtgtcctac cgcttccacg tgaactcctc cacgggcgac 180
ctgatctccg accacttcgg cggcgtggtg tccggcacca tcccctcccc cgtggagccc 240
gcggtcaacg gctgggtggg catgcccggc cgcatccgcc gcgagttccc cgaccagggc 300
cgcggcgact tccgcatccc cgcggtgcgc atccgcgagt ccgccggcta caccgtctcc 360
gacctgcagt acgtgtccca cgaggtgatc gagggcaagt acgcgctgcc cggcctgccc 420
gccacgttcg gcgacgccca ggacgccacc accctggtgg tgcacctgta cgacaactac 480
tcctccgtcg cggccgacct gtcctactcc atcttcccca agtacgacgc gatcgtccgc 540
tccgtgaacg tgaccaacca gggccccggc aacatcacca tcgaggcgct ggcctccatc 600
tccatcgact tcccctacga ggacctggac atggtgtccc tgcgcggcga ctgggcccgc 660
gaggcgaacg tgcagcgctc caaggtccag tacggcgtgc agggcttcgg ctcctccacc 720
ggctactcct cccacctgca caaccccttc ctggcgatcg tcgaccccgc gaccaccgag 780
tcccagggcg aggcctgggg cttcaacctg gtctacaccg gctccttctc cgcccaggtc 840
gagaagggct cccagggctt cacgcgcgcc ctgctgggct tcaaccccga ccagctgtcc 900
tggaacctgg gccccggcga gacgctgacg tcccccgagt gcgtcgccgt ctactccgac 960
aagggcctgg gctccgtctc ccgcaagttc caccgcctgt accgcaacca cctgatgaag 1020
tccaagttcg ccacgtccga ccgccccgtg ctgctgaact cctgggaggg cgtctacttc 1080
gactacaacc agtcctccat cgagacgctg gcggaggagt ccgccgccct gggcgtgcac 1140
ctgttcgtca tggacgacgg ctggttcggc gacaagtacc cccgcgtgtc cgacaacgcc 1200
ggcctgggcg actggatgcc caaccccgcc cgcttccccg acggcctgac gcccgtcgtg 1260
caggacatca ccaacctgac cgtcaacggc accgagtcca ccaagctgcg cttcggcatc 1320
tgggtggagc ccgagatggt gaaccccaac tccaccctgt accacgagca ccccgagtgg 1380
gcgctgcacg cgggccccta cccccgcacc gagcgccgca accagctggt cctgaacctg 1440
gccctgcccg cggtccagga cttcatcatc gacttcatga ccaacctgct gcaggacacc 1500
ggcatctcct acgtcaagtg ggacaacaac cgcggcatcc acgagacgcc ctccccctcc 1560
acggaccacc agtacatgct gggcctgtac cgcgtgttcg acacgctgac cacgcgcttc 1620
cccgacgtcc tgtgggaggg ctgcgcgtcc ggcggcggcc ggttcgacgc cggcatgctg 1680
cagtacgtcc cccagatctg gacgtccgac aacacggacg cgatcgaccg catcaccatc 1740
cagttcggca cctccctggc ctaccccccc tccgccatgg gcgcccacct gtccgcggtg 1800
cccaacgccc agaccggccg cacggtgccc ttcaccttcc gcgcccacgt cgcgatgatg 1860
ggcggctcct tcggcctgga gctggacccc gccaccgtgg agggcgacga gatcgtgccc 1920
gagctgctgg cgctggccga gaaggtgaac cccatcatcc tgaacggcga cctgtaccgc 1980
ctgcgcctgc cccaggactc ccagtggccc gcggccctgt tcgtgtccca ggacggcgcc 2040
caggccgtcc tgttctactt ccaggtgcag cccaacgtca accacgccgt cccctgggtc 2100
cgcctgcagg gcctggaccc caaggccgac tacacggtgg acggcgacca gacgtactcc 2160
ggcgcgaccc tgatgaacct gggcctgcag tactccttcg acaccgagta cggctccaag 2220
gtggtgttcc tggagcgcca gtaa 2244
<210> 119
<211> 4011
<212> DNA
<213> Aspergillus niger
<400> 119
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatgatc ggctcctccc acgcggtcgt cgccctgggc ctgttcaccc tgtacggcca 900
ctccgccgcc gcgcccgcca tcggcgcctc caactcccag accatcgtca cgaacggcac 960
ctccttcgcc ctgaacggcg acaacgtgtc ctaccgcttc cacgtgaact cctccacggg 1020
cgacctgatc tccgaccact tcggcggcgt ggtgtccggc accatcccct cccccgtgga 1080
gcccgcggtc aacggctggg tgggcatgcc cggccgcatc cgccgcgagt tccccgacca 1140
gggccgcggc gacttccgca tccccgcggt gcgcatccgc gagtccgccg gctacaccgt 1200
ctccgacctg cagtacgtgt cccacgaggt gatcgagggc aagtacgcgc tgcccggcct 1260
gcccgccacg ttcggcgacg cccaggacgc caccaccctg gtggtgcacc tgtacgacaa 1320
ctactcctcc gtcgcggccg acctgtccta ctccatcttc cccaagtacg acgcgatcgt 1380
ccgctccgtg aacgtgacca accagggccc cggcaacatc accatcgagg cgctggcctc 1440
catctccatc gacttcccct acgaggacct ggacatggtg tccctgcgcg gcgactgggc 1500
ccgcgaggcg aacgtgcagc gctccaaggt ccagtacggc gtgcagggct tcggctcctc 1560
caccggctac tcctcccacc tgcacaaccc cttcctggcg atcgtcgacc ccgcgaccac 1620
cgagtcccag ggcgaggcct ggggcttcaa cctggtctac accggctcct tctccgccca 1680
ggtcgagaag ggctcccagg gcttcacgcg cgccctgctg ggcttcaacc ccgaccagct 1740
gtcctggaac ctgggccccg gcgagacgct gacgtccccc gagtgcgtcg ccgtctactc 1800
cgacaagggc ctgggctccg tctcccgcaa gttccaccgc ctgtaccgca accacctgat 1860
gaagtccaag ttcgccacgt ccgaccgccc cgtgctgctg aactcctggg agggcgtcta 1920
cttcgactac aaccagtcct ccatcgagac gctggcggag gagtccgccg ccctgggcgt 1980
gcacctgttc gtcatggacg acggctggtt cggcgacaag tacccccgcg tgtccgacaa 2040
cgccggcctg ggcgactgga tgcccaaccc cgcccgcttc cccgacggcc tgacgcccgt 2100
cgtgcaggac atcaccaacc tgaccgtcaa cggcaccgag tccaccaagc tgcgcttcgg 2160
catctgggtg gagcccgaga tggtgaaccc caactccacc ctgtaccacg agcaccccga 2220
gtgggcgctg cacgcgggcc cctacccccg caccgagcgc cgcaaccagc tggtcctgaa 2280
cctggccctg cccgcggtcc aggacttcat catcgacttc atgaccaacc tgctgcagga 2340
caccggcatc tcctacgtca agtgggacaa caaccgcggc atccacgaga cgccctcccc 2400
ctccacggac caccagtaca tgctgggcct gtaccgcgtg ttcgacacgc tgaccacgcg 2460
cttccccgac gtcctgtggg agggctgcgc gtccggcggc ggccggttcg acgccggcat 2520
gctgcagtac gtcccccaga tctggacgtc cgacaacacg gacgcgatcg accgcatcac 2580
catccagttc ggcacctccc tggcctaccc cccctccgcc atgggcgccc acctgtccgc 2640
ggtgcccaac gcccagaccg gccgcacggt gcccttcacc ttccgcgccc acgtcgcgat 2700
gatgggcggc tccttcggcc tggagctgga ccccgccacc gtggagggcg acgagatcgt 2760
gcccgagctg ctggcgctgg ccgagaaggt gaaccccatc atcctgaacg gcgacctgta 2820
ccgcctgcgc ctgccccagg actcccagtg gcccgcggcc ctgttcgtgt cccaggacgg 2880
cgcccaggcc gtcctgttct acttccaggt gcagcccaac gtcaaccacg ccgtcccctg 2940
ggtccgcctg cagggcctgg accccaaggc cgactacacg gtggacggcg accagacgta 3000
ctccggcgcg accctgatga acctgggcct gcagtactcc ttcgacaccg agtacggctc 3060
caaggtggtg ttcctggagc gccagtaaca attgaagcag cagcagctcg gatagtatcg 3120
acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct 3180
gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg 3240
cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc 3300
ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca 3360
gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta 3420
ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg 3480
gatgggaaca caaatggaaa gcttgagctc agaatagtat cgggtgatgc gaagtcagaa 3540
ccaggcaggg cctgtcgcct gaggtggcaa cgatgggaag caatcaatct gggtacagtc 3600
gtccgcacga tcccgtgatc tcccccaccg acacctatcc ccgcccatcc cggcccaccc 3660
tttcagtccc ctcagcatgc attgtgcacc gcgacaaagc atgtctgctc gtgcactggt 3720
tcaggccacg gcgcaccgag tcctcgccct tcgcagagtg atcaccctcc ccggaaccag 3780
ccacgctcgc tgctgcgggc cgatcagccg cgcgcactcc ctgcaactag ggacaactca 3840
ggcaaccacg cgcctcacaa gcatggccgc cgtggcatcc aacccgctcg tgacggtggg 3900
tgcgcaagtg ccaggggcct cgtcgtcacg gcgtgcatcc tcgagggatg cgatccggca 3960
actatatgtc gtttatctcc ccaccaatca caggatgagc ccctgtctag a 4011
<210> 120
<211> 411
<212> PRT
<213> Cyamopsis tetragonoloba
<400> 120
Met Ala Thr His Tyr Ser Ile Ile Gly Gly Met Ile Ile Val Val Leu
1 5 10 15
Leu Met Ile Ile Gly Ser Glu Gly Gly Arg Leu Leu Glu Lys Lys Asn
20 25 30
Arg Thr Ser Ala Glu Ala Glu His Tyr Asn Val Arg Arg Tyr Leu Ala
35 40 45
Glu Asn Gly Leu Gly Gln Thr Pro Pro Met Gly Trp Asn Ser Trp Asn
50 55 60
His Phe Gly Cys Asp Ile Asn Glu Asn Val Val Arg Glu Thr Ala Asp
65 70 75 80
Ala Met Val Ser Thr Gly Leu Ala Ala Leu Gly Tyr Gln Tyr Ile Asn
85 90 95
Leu Asp Asp Cys Trp Ala Glu Leu Asn Arg Asp Ser Glu Gly Asn Met
100 105 110
Val Pro Asn Ala Ala Ala Phe Pro Ser Gly Ile Lys Ala Leu Ala Asp
115 120 125
Tyr Val His Ser Lys Gly Leu Lys Leu Gly Val Tyr Ser Asp Ala Gly
130 135 140
Asn Gln Thr Cys Ser Lys Arg Met Pro Gly Ser Leu Gly His Glu Glu
145 150 155 160
Gln Asp Ala Lys Thr Phe Ala Ser Trp Gly Val Asp Tyr Leu Lys Tyr
165 170 175
Asp Asn Cys Glu Asn Leu Gly Ile Ser Val Lys Glu Arg Tyr Pro Pro
180 185 190
Met Gly Lys Ala Leu Leu Ser Ser Gly Arg Pro Ile Phe Phe Ser Met
195 200 205
Cys Glu Trp Gly Trp Glu Asp Pro Gln Ile Trp Ala Lys Ser Ile Gly
210 215 220
Asn Ser Trp Arg Thr Thr Gly Asp Ile Glu Asp Asn Trp Asn Ser Met
225 230 235 240
Thr Ser Ile Ala Asp Ser Asn Asp Lys Trp Ala Ser Tyr Ala Gly Pro
245 250 255
Gly Gly Trp Asn Asp Pro Asp Met Leu Glu Val Gly Asn Gly Gly Met
260 265 270
Thr Thr Glu Glu Tyr Arg Ser His Phe Ser Ile Trp Ala Leu Ala Lys
275 280 285
Ala Pro Leu Leu Val Gly Cys Asp Ile Arg Ala Met Asp Asp Thr Thr
290 295 300
His Glu Leu Ile Ser Asn Ala Glu Val Ile Ala Val Asn Gln Asp Lys
305 310 315 320
Leu Gly Val Gln Gly Lys Lys Val Lys Ser Thr Asn Asp Leu Glu Val
325 330 335
Trp Ala Gly Pro Leu Ser Asp Asn Lys Val Ala Val Ile Leu Trp Asn
340 345 350
Arg Ser Ser Ser Arg Ala Thr Val Thr Ala Ser Trp Ser Asp Ile Gly
355 360 365
Leu Gln Gln Gly Thr Thr Val Asp Ala Arg Asp Leu Trp Glu His Ser
370 375 380
Thr Gln Ser Leu Val Ser Gly Glu Ile Ser Ala Glu Ile Asp Ser His
385 390 395 400
Ala Cys Lys Met Tyr Val Leu Thr Pro Arg Ser
405 410
<210> 121
<211> 1236
<212> DNA
<213> Cyamopsis tetragonoloba
<400> 121
atggccaccc actactccat catcggcggc atgatcatcg tcgtcctgct gatgatcatc 60
ggctccgagg gcggccggct gctggagaag aagaaccgca cctccgccga ggcggagcac 120
tacaacgtgc gccgctacct ggccgagaac ggcctgggcc agaccccccc catgggctgg 180
aactcctgga accacttcgg ctgcgacatc aacgagaacg tcgtccgcga gacggcggac 240
gccatggtgt ccaccggcct ggccgccctg ggctaccagt acatcaacct ggacgactgc 300
tgggcggagc tgaaccgcga ctccgagggc aacatggtgc ccaacgccgc cgcgttcccc 360
tccggcatca aggcgctggc ggactacgtc cactccaagg gcctgaagct gggcgtctac 420
tccgacgcgg gcaaccagac ctgctccaag cgcatgcccg gctccctggg ccacgaggag 480
caggacgcga agacgttcgc ctcctggggc gtcgactacc tgaagtacga caactgcgag 540
aacctgggca tctccgtgaa ggagcgctac ccccccatgg gcaaggcgct gctgtcctcc 600
ggccgcccca tcttcttctc catgtgcgag tggggctggg aggaccccca gatctgggcc 660
aagtccatcg gcaactcctg gcgcaccacc ggcgacatcg aggacaactg gaactccatg 720
acctccatcg ccgactccaa cgacaagtgg gcctcctacg ccggccccgg cggctggaac 780
gaccccgaca tgctggaggt cggcaacggc ggcatgacga cggaggagta ccgctcccac 840
ttctccatct gggccctggc caaggcgccc ctgctggtgg gctgcgacat ccgcgcgatg 900
gacgacacga cgcacgagct gatctccaac gccgaggtga tcgcggtgaa ccaggacaag 960
ctgggcgtgc agggcaagaa ggtcaagtcc acgaacgacc tggaggtctg ggccggcccc 1020
ctgtccgaca acaaggtggc ggtgatcctg tggaaccgct cctcctcccg cgccaccgtc 1080
accgcgtcct ggtccgacat cggcctgcag cagggcacca ccgtcgacgc gcgcgacctg 1140
tgggagcact ccacgcagtc cctggtgtcc ggcgagatct ccgccgagat cgactcccac 1200
gcctgcaaga tgtacgtcct gacgccccgc tcctaa 1236
<210> 122
<211> 3003
<212> DNA
<213> Cyamopsis tetragonoloba
<400> 122
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatggcc acccactact ccatcatcgg cggcatgatc atcgtcgtcc tgctgatgat 900
catcggctcc gagggcggcc ggctgctgga gaagaagaac cgcacctccg ccgaggcgga 960
gcactacaac gtgcgccgct acctggccga gaacggcctg ggccagaccc cccccatggg 1020
ctggaactcc tggaaccact tcggctgcga catcaacgag aacgtcgtcc gcgagacggc 1080
ggacgccatg gtgtccaccg gcctggccgc cctgggctac cagtacatca acctggacga 1140
ctgctgggcg gagctgaacc gcgactccga gggcaacatg gtgcccaacg ccgccgcgtt 1200
cccctccggc atcaaggcgc tggcggacta cgtccactcc aagggcctga agctgggcgt 1260
ctactccgac gcgggcaacc agacctgctc caagcgcatg cccggctccc tgggccacga 1320
ggagcaggac gcgaagacgt tcgcctcctg gggcgtcgac tacctgaagt acgacaactg 1380
cgagaacctg ggcatctccg tgaaggagcg ctaccccccc atgggcaagg cgctgctgtc 1440
ctccggccgc cccatcttct tctccatgtg cgagtggggc tgggaggacc cccagatctg 1500
ggccaagtcc atcggcaact cctggcgcac caccggcgac atcgaggaca actggaactc 1560
catgacctcc atcgccgact ccaacgacaa gtgggcctcc tacgccggcc ccggcggctg 1620
gaacgacccc gacatgctgg aggtcggcaa cggcggcatg acgacggagg agtaccgctc 1680
ccacttctcc atctgggccc tggccaaggc gcccctgctg gtgggctgcg acatccgcgc 1740
gatggacgac acgacgcacg agctgatctc caacgccgag gtgatcgcgg tgaaccagga 1800
caagctgggc gtgcagggca agaaggtcaa gtccacgaac gacctggagg tctgggccgg 1860
ccccctgtcc gacaacaagg tggcggtgat cctgtggaac cgctcctcct cccgcgccac 1920
cgtcaccgcg tcctggtccg acatcggcct gcagcagggc accaccgtcg acgcgcgcga 1980
cctgtgggag cactccacgc agtccctggt gtccggcgag atctccgccg agatcgactc 2040
ccacgcctgc aagatgtacg tcctgacgcc ccgctcctaa caattgaagc agcagcagct 2100
cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2160
ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2220
tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2280
gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2340
tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2400
gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2460
gggaagtagt gggatgggaa cacaaatgga aagcttgagc tcagaatagt atcgggtgat 2520
gcgaagtcag aaccaggcag ggcctgtcgc ctgaggtggc aacgatggga agcaatcaat 2580
ctgggtacag tcgtccgcac gatcccgtga tctcccccac cgacacctat ccccgcccat 2640
cccggcccac cctttcagtc ccctcagcat gcattgtgca ccgcgacaaa gcatgtctgc 2700
tcgtgcactg gttcaggcca cggcgcaccg agtcctcgcc cttcgcagag tgatcaccct 2760
ccccggaacc agccacgctc gctgctgcgg gccgatcagc cgcgcgcact ccctgcaact 2820
agggacaact caggcaacca cgcgcctcac aagcatggcc gccgtggcat ccaacccgct 2880
cgtgacggtg ggtgcgcaag tgccaggggc ctcgtcgtca cggcgtgcat cctcgaggga 2940
tgcgatccgg caactatatg tcgtttatct ccccaccaat cacaggatga gcccctgtct 3000
aga 3003
<210> 123
<211> 22
<212> DNA
<213> Chlorella vulgaris
<400> 123
actgcaatgc tgatgcacgg ga 22
<210> 124
<211> 19
<212> DNA
<213> Chlorella vulgaris
<400> 124
tccaggtcct tttcgcact 19
<210> 125
<211> 632
<212> PRT
<213> Unknown
<220>
<223> Coccomyxa species
<400> 125
Met Thr Thr Asn Leu Ala Lys Leu Pro Leu Gly Gly Leu Ser Ser Arg
1 5 10 15
Ser Ser Ile Ala Gly Ala Pro Leu Arg Val Asn Ser His Ser Arg Glu
20 25 30
Arg His Leu Gly Ala Lys Thr Thr Ala Ile Ala Ala Pro Glu Arg Leu
35 40 45
Asp Tyr Leu Asp Asn Ala Glu Glu Ala Arg Leu Gln Gln Thr Asp Ala
50 55 60
Phe Ala Glu Leu Lys Ala Leu Ser Ser Arg Gln Ser Val Asn Arg Pro
65 70 75 80
Gln Lys Gly Glu Leu Ser Phe Arg Gln Ser Pro Thr Phe Gln Asp Cys
85 90 95
Phe Pro Gly Ser Glu Lys Cys Tyr Arg Glu Val Glu His Asp Gly Lys
100 105 110
Thr Leu Lys Val Pro Phe Arg Arg Val His Leu Gln Asp Asp Asn Gly
115 120 125
His Phe Asp Leu Tyr Asp Thr Ser Gly Pro Gln Gly Val Asn Pro Arg
130 135 140
Glu Gly Leu Pro Lys Ile Arg Ser Ser Trp Val Glu Pro Arg Glu Ala
145 150 155 160
Arg Gly Asp Lys Val Gln Thr Gln Gln Tyr Tyr Ala Lys Gln Gly Ile
165 170 175
Ile Thr Glu Glu Met Ala Phe Cys Ala Ala Arg Glu Arg Met Asp Pro
180 185 190
Glu Phe Ile Arg Ser Glu Val Ala Arg Gly Arg Ala Ile Ile Pro Ala
195 200 205
Asn Lys Arg His Leu Glu Leu Glu Pro Thr Val Val Gly Arg Asn Phe
210 215 220
Leu Val Lys Val Asn Ala Asn Ile Gly Asn Ser Ala Val Ser Ser Ser
225 230 235 240
Ile Glu Glu Glu Val Glu Lys Leu Gln Trp Ser Thr Ile Trp Gly Ala
245 250 255
Asp Thr Ala Met Asp Leu Ser Thr Gly Asn Asn Ile His Glu Thr Arg
260 265 270
Glu Trp Val Met Arg Asn Ser Pro Val Pro Val Gly Thr Val Pro Ile
275 280 285
Tyr Gln Cys Leu Glu Lys Ala Gly Gly Ile Val Glu Asn Ile Thr Trp
290 295 300
Glu Leu Phe Arg Glu Thr Leu Ile Glu Gln Ala Glu Gln Gly Val Asp
305 310 315 320
Tyr Phe Thr Ile His Ala Gly Val Leu Leu Arg Tyr Ile Pro Leu Thr
325 330 335
Ala Asn Arg Val Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala
340 345 350
Lys Leu Cys Leu Leu Asp His Thr Glu Asn Phe Ala Tyr Met His Trp
355 360 365
Asp Glu Ile Leu Asp Ile Cys Ala Gln Tyr Asp Ile Thr Leu Ser Ile
370 375 380
Gly Asp Gly Leu Arg Pro Gly Cys Ile Ala Asp Ala Asn Asp Ala Ala
385 390 395 400
Gln Phe Ala Glu Leu Lys Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp
405 410 415
Ala Lys Asp Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Leu
420 425 430
His Lys Ile Pro Glu Asn Met Glu Lys Gln Leu Asp Trp Cys Ser Glu
435 440 445
Ala Pro Phe Tyr Thr Leu Gly Pro Leu Ala Thr Asp Ile Ala Pro Ala
450 455 460
Tyr Asp His Ile Thr Ser Ala Ile Gly Ala Ala Thr Ile Gly Ala Leu
465 470 475 480
Gly Thr Ala Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu
485 490 495
Pro Asp Arg Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala
500 505 510
Ala His Ala Ala Asp Leu Ala Lys Gly His Pro Tyr Ala Gln Glu Trp
515 520 525
Asp Asn Ala Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Tyr Asp Gln
530 535 540
Phe His Leu Ser Leu Asp Pro Val Thr Ala Arg Leu Phe His Asp Ala
545 550 555 560
Thr Leu Pro Gln Glu Pro Ala Lys Thr Ala His Phe Cys Ser Met Cys
565 570 575
Gly Pro Lys Phe Cys Ser Met Gln Ile Thr Gln Asp Leu Arg Glu Tyr
580 585 590
Ala Lys Asn His Gln Met Glu Glu Asp Glu Ala Ile Gln Thr Gly Met
595 600 605
Ala Glu Met Ser Glu Gln Phe Lys Ser Ile Gly Ala Glu Val Tyr Leu
610 615 620
Asp Glu Ala Val Leu Glu His Ala
625 630
<210> 126
<211> 40
<212> PRT
<213> Unknown
<220>
<223> Coccomyxa species
<400> 126
Met Thr Thr Asn Leu Ala Lys Leu Pro Leu Gly Gly Leu Ser Ser Arg
1 5 10 15
Ser Ser Ile Ala Gly Ala Pro Leu Arg Val Asn Ser His Ser Arg Glu
20 25 30
Arg His Leu Gly Ala Lys Thr Thr
35 40
<210> 127
<211> 6649
<212> DNA
<213> Unknown
<220>
<223> Coccomyxa species
<400> 127
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta tgacacttcc 3300
agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac accgatgatg 3360
cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc tccagggcga 3420
gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct accaaagcca 3480
tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg tgatcgcact 3540
ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca ctagtatgac 3600
caccaacctg gctaagctgc ctctcggcgg cctctcttct cggtcgtcca tcgccggggc 3660
tcctctgcgc gtgaacagcc acagccgcga gcgccacctg ggcgccaaga ccaccgcgat 3720
cgccgctccc gagcggctgg actacctcga caacgcggag gaggcgcggc tgcagcagac 3780
ggacgccttc gccgagctga aggcgctgtc gagccgccag tccgtgaacc ggccccaaaa 3840
gggcgagctg tcgttccggc agtcgccgac ctttcaggac tgcttccctg gctcggagaa 3900
gtgctaccgc gaggtggagc acgatggcaa gacgctcaag gtgccttttc gccgggtgca 3960
cctgcaggac gacaacggcc atttcgacct gtacgacacc tctggccccc agggcgtgaa 4020
cccccgcgag ggtctgccca agatccgctc ctcctgggtg gagccgcgcg aggcgcgggg 4080
cgacaaggtg caaacgcagc agtactacgc caagcaaggc atcatcaccg aggagatggc 4140
cttctgcgct gcgcgcgagc gcatggaccc cgagttcatc cggtctgagg tggcccgggg 4200
tcgggccatc atccctgcga acaagcgcca tctggagctg gagccgaccg tcgtgggccg 4260
caactttctg gtcaaggtga acgccaacat cggcaactct gcggtcagct cgagcatcga 4320
ggaggaggtg gagaagctgc agtggagcac catctggggt gccgacacgg ccatggacct 4380
gagcaccggc aacaacatcc acgagacgcg cgagtgggtg atgcgcaaca gcccggtccc 4440
tgtgggtacg gtccctatct accagtgcct ggagaaggcg ggcggcatcg tggagaacat 4500
cacctgggag ctgttccggg agacgctgat cgagcaggcc gagcagggcg tcgactactt 4560
taccatccac gcgggggtcc tgctccgcta catccccctg acggcgaacc gcgtcaccgg 4620
catcgtcagc cgcggcggct ctatccatgc caagctctgc ctgctggacc acaccgagaa 4680
cttcgcctac atgcactggg acgagatcct ggacatctgc gcccagtacg acatcaccct 4740
gtcgatcggc gacggcctgc gccccggctg catcgcggac gccaacgacg ctgcccagtt 4800
tgctgagctg aagacccagg gcgagctgac ccgccgcgcc tgggcgaagg acgtgcaggt 4860
gatgaacgag ggtcccggcc atgtgccgct gcacaagatc cccgagaaca tggagaagca 4920
gctggactgg tgcagcgagg cgcccttcta cacgctcggc cccctggcga cggacatcgc 4980
gcctgcgtac gaccacatca cctccgcgat cggcgccgcc acgatcggcg cgctggggac 5040
cgcgctgctg tgttacgtga ccccgaagga gcacctgggc ctccccgatc gcgacgacgt 5100
gaaggccggg gtgatcgcct acaagatcgc ggcgcacgcg gctgacctgg cgaagggtca 5160
cccctacgct caggagtggg ataacgccct ctctaaggcg cgcttcgagt tccggtggta 5220
cgaccagttc cacctgtcgc tggaccccgt caccgcccgc ctgttccatg acgcgaccct 5280
gccgcaggag cccgccaaga ccgcccactt ctgctccatg tgcggcccca agttctgctc 5340
catgcagatc acccaggacc tccgcgagta cgccaagaac catcaaatgg aggaggacga 5400
ggcgatccaa accggcatgg ccgagatgtc cgagcagttc aagagcatcg gcgcggaggt 5460
ctacctcgac gaggcggtgc tggagcacgc gtaagcagca gcagctcgga tagtatcgac 5520
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 5580
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 5640
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 5700
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 5760
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 5820
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 5880
tgggaacaca aatggaaagc ttgagctctt gttttccaga aggagttgct ccttgagcct 5940
ttcattctca gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta 6000
aaagcttgga atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa 6060
aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat 6120
ctgccctgtt gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc 6180
tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg 6240
acacccgcca ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc 6300
atatttctcg aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct 6360
ggtgcttgcg gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca 6420
ccacccccgc gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg 6480
ctggcccagg cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc 6540
cttctgccgc tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc 6600
gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag ctgaagagc 6649
<210> 128
<211> 1899
<212> DNA
<213> Unknown
<220>
<223> Coccomyxa species
<400> 128
atgaccacca acctggctaa gctgcctctc ggcggcctct cttctcggtc gtccatcgcc 60
ggggctcctc tgcgcgtgaa cagccacagc cgcgagcgcc acctgggcgc caagaccacc 120
gcgatcgccg ctcccgagcg gctggactac ctcgacaacg cggaggaggc gcggctgcag 180
cagacggacg ccttcgccga gctgaaggcg ctgtcgagcc gccagtccgt gaaccggccc 240
caaaagggcg agctgtcgtt ccggcagtcg ccgacctttc aggactgctt ccctggctcg 300
gagaagtgct accgcgaggt ggagcacgat ggcaagacgc tcaaggtgcc ttttcgccgg 360
gtgcacctgc aggacgacaa cggccatttc gacctgtacg acacctctgg cccccagggc 420
gtgaaccccc gcgagggtct gcccaagatc cgctcctcct gggtggagcc gcgcgaggcg 480
cggggcgaca aggtgcaaac gcagcagtac tacgccaagc aaggcatcat caccgaggag 540
atggccttct gcgctgcgcg cgagcgcatg gaccccgagt tcatccggtc tgaggtggcc 600
cggggtcggg ccatcatccc tgcgaacaag cgccatctgg agctggagcc gaccgtcgtg 660
ggccgcaact ttctggtcaa ggtgaacgcc aacatcggca actctgcggt cagctcgagc 720
atcgaggagg aggtggagaa gctgcagtgg agcaccatct ggggtgccga cacggccatg 780
gacctgagca ccggcaacaa catccacgag acgcgcgagt gggtgatgcg caacagcccg 840
gtccctgtgg gtacggtccc tatctaccag tgcctggaga aggcgggcgg catcgtggag 900
aacatcacct gggagctgtt ccgggagacg ctgatcgagc aggccgagca gggcgtcgac 960
tactttacca tccacgcggg ggtcctgctc cgctacatcc ccctgacggc gaaccgcgtc 1020
accggcatcg tcagccgcgg cggctctatc catgccaagc tctgcctgct ggaccacacc 1080
gagaacttcg cctacatgca ctgggacgag atcctggaca tctgcgccca gtacgacatc 1140
accctgtcga tcggcgacgg cctgcgcccc ggctgcatcg cggacgccaa cgacgctgcc 1200
cagtttgctg agctgaagac ccagggcgag ctgacccgcc gcgcctgggc gaaggacgtg 1260
caggtgatga acgagggtcc cggccatgtg ccgctgcaca agatccccga gaacatggag 1320
aagcagctgg actggtgcag cgaggcgccc ttctacacgc tcggccccct ggcgacggac 1380
atcgcgcctg cgtacgacca catcacctcc gcgatcggcg ccgccacgat cggcgcgctg 1440
gggaccgcgc tgctgtgtta cgtgaccccg aaggagcacc tgggcctccc cgatcgcgac 1500
gacgtgaagg ccggggtgat cgcctacaag atcgcggcgc acgcggctga cctggcgaag 1560
ggtcacccct acgctcagga gtgggataac gccctctcta aggcgcgctt cgagttccgg 1620
tggtacgacc agttccacct gtcgctggac cccgtcaccg cccgcctgtt ccatgacgcg 1680
accctgccgc aggagcccgc caagaccgcc cacttctgct ccatgtgcgg ccccaagttc 1740
tgctccatgc agatcaccca ggacctccgc gagtacgcca agaaccatca aatggaggag 1800
gacgaggcga tccaaaccgg catggccgag atgtccgagc agttcaagag catcggcgcg 1860
gaggtctacc tcgacgaggc ggtgctggag cacgcgtaa 1899
<210> 129
<211> 1613
<212> DNA
<213> Saccharomyces cerevisiae
<400> 129
ggcgcgccat gctgctgcag gccttcctgt tcctgctggc cggcttcgcc gccaagatca 60
gcgcctccat gacgaacgag acgtccgacc gccccctggt gcacttcacc cccaacaagg 120
gctggatgaa cgaccccaac ggcctgtggt acgacgagaa ggacgccaag tggcacctgt 180
acttccagta caacccgaac gacaccgtct gggggacgcc cttgttctgg ggccacgcca 240
cgtccgacga cctgaccaac tgggaggacc agcccatcgc catcgccccg aagcgcaacg 300
actccggcgc cttctccggc tccatggtgg tggactacaa caacacctcc ggcttcttca 360
acgacaccat cgacccgcgc cagcgctgcg tggccatctg gacctacaac accccggagt 420
ccgaggagca gtacatctcc tacagcctgg acggcggcta caccttcacc gagtaccaga 480
agaaccccgt gctggccgcc aactccaccc agttccgcga cccgaaggtc ttctggtacg 540
agccctccca gaagtggatc atgaccgcgg ccaagtccca ggactacaag atcgagatct 600
actcctccga cgacctgaag tcctggaagc tggagtccgc gttcgccaac gagggcttcc 660
tcggctacca gtacgagtgc cccggcctga tcgaggtccc caccgagcag gaccccagca 720
agtcctactg ggtgatgttc atctccatca accccggcgc cccggccggc ggctccttca 780
accagtactt cgtcggcagc ttcaacggca cccacttcga ggccttcgac aaccagtccc 840
gcgtggtgga cttcggcaag gactactacg ccctgcagac cttcttcaac accgacccga 900
cctacgggag cgccctgggc atcgcgtggg cctccaactg ggagtactcc gccttcgtgc 960
ccaccaaccc ctggcgctcc tccatgtccc tcgtgcgcaa gttctccctc aacaccgagt 1020
accaggccaa cccggagacg gagctgatca acctgaaggc cgagccgatc ctgaacatca 1080
gcaacgccgg cccctggagc cggttcgcca ccaacaccac gttgacgaag gccaacagct 1140
acaacgtcga cctgtccaac agcaccggca ccctggagtt cgagctggtg tacgccgtca 1200
acaccaccca gacgatctcc aagtccgtgt tcgcggacct ctccctctgg ttcaagggcc 1260
tggaggaccc cgaggagtac ctccgcatgg gcttcgaggt gtccgcgtcc tccttcttcc 1320
tggaccgcgg gaacagcaag gtgaagttcg tgaaggagaa cccctacttc accaaccgca 1380
tgagcgtgaa caaccagccc ttcaagagcg agaacgacct gtcctactac aaggtgtacg 1440
gcttgctgga ccagaacatc ctggagctgt acttcaacga cggcgacgtc gtgtccacca 1500
acacctactt catgaccacc gggaacgccc tgggctccgt gaacatgacg acgggggtgg 1560
acaacctgtt ctacatcgac aagttccagg tgcgcgaggt caagtgacaa ttg 1613
<210> 130
<211> 3660
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic nucleotide
<400> 130
gcggccgcgt ggacgagggc tacaaccccg cctacggcgc gcgcccgctg cgccgcgcca 60
tcatgcgcct gctggaggac gcgctggccg agcgcatgct cgccggcgac gtcaaggagg 120
gcgactcggt catcatggac gtcgatggcg atggcgccat cagcgtcctc aacggagacc 180
gcacccacac caccaccatc gactcctccc cggcgggcat ctcgtagacg cgagagggag 240
ggagggagga ttttcagagg gagatgagac gaggactggg ccgggggcct tggggcgctg 300
ctggagcgtg gtgagagcgc ggcggacgtg ccttttcttc ttccgtgcgc gcgctcttgg 360
ccattgatcc ccgattcgcg cccgcatccc cccactgccc ccatcatctt gcctgttgtc 420
gtggcactga cataaacccc ctgcgctgcg ctgctccgct actattgata taggtctcac 480
gcgccaatct tttttgctcc gggtaaccgt ctggacgcca gaattccttt cttgcgctat 540
gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca 600
ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct 660
ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta 720
ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac tcgagcttgt 780
gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac ccgcaaacac 840
tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 900
ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccgc 960
gatcgccgct cccgagcggc tggactacct cgacaacgcg gaggaggcgc ggctgcagca 1020
gacggacgcc ttcgccgagc tgaaggcgct gtcgagccgc cagtccgtga accggcccca 1080
aaagggcgag ctgtcgttcc ggcagtcgcc gacctttcag gactgcttcc ctggctcgga 1140
gaagtgctac cgcgaggtgg agcacgatgg caagacgctc aaggtgcctt ttcgccgggt 1200
gcacctgcag gacgacaacg gccatttcga cctgtacgac acctctggcc cccagggcgt 1260
gaacccccgc gagggtctgc ccaagatccg ctcctcctgg gtggagccgc gcgaggcgcg 1320
gggcgacaag gtgcaaacgc agcagtacta cgccaagcaa ggcatcatca ccgaggagat 1380
ggccttctgc gctgcgcgcg agcgcatgga ccccgagttc atccggtctg aggtggcccg 1440
gggtcgggcc atcatccctg cgaacaagcg ccatctggag ctggagccga ccgtcgtggg 1500
ccgcaacttt ctggtcaagg tgaacgccaa catcggcaac tctgcggtca gctcgagcat 1560
cgaggaggag gtggagaagc tgcagtggag caccatctgg ggtgccgaca cggccatgga 1620
cctgagcacc ggcaacaaca tccacgagac gcgcgagtgg gtgatgcgca acagcccggt 1680
ccctgtgggt acggtcccta tctaccagtg cctggagaag gcgggcggca tcgtggagaa 1740
catcacctgg gagctgttcc gggagacgct gatcgagcag gccgagcagg gcgtcgacta 1800
ctttaccatc cacgcggggg tcctgctccg ctacatcccc ctgacggcga accgcgtcac 1860
cggcatcgtc agccgcggcg gctctatcca tgccaagctc tgcctgctgg accacaccga 1920
gaacttcgcc tacatgcact gggacgagat cctggacatc tgcgcccagt acgacatcac 1980
cctgtcgatc ggcgacggcc tgcgccccgg ctgcatcgcg gacgccaacg acgctgccca 2040
gtttgctgag ctgaagaccc agggcgagct gacccgccgc gcctgggcga aggacgtgca 2100
ggtgatgaac gagggtcccg gccatgtgcc gctgcacaag atccccgaga acatggagaa 2160
gcagctggac tggtgcagcg aggcgccctt ctacacgctc ggccccctgg cgacggacat 2220
cgcgcctgcg tacgaccaca tcacctccgc gatcggcgcc gccacgatcg gcgcgctggg 2280
gaccgcgctg ctgtgttacg tgaccccgaa ggagcacctg ggcctccccg atcgcgacga 2340
cgtgaaggcc ggggtgatcg cctacaagat cgcggcgcac gcggctgacc tggcgaaggg 2400
tcacccctac gctcaggagt gggataacgc cctctctaag gcgcgcttcg agttccggtg 2460
gtacgaccag ttccacctgt cgctggaccc cgtcaccgcc cgcctgttcc atgacgcgac 2520
cctgccgcag gagcccgcca agaccgccca cttctgctcc atgtgcggcc ccaagttctg 2580
ctccatgcag atcacccagg acctccgcga gtacgccaag aaccatcaaa tggaggagga 2640
cgaggcgatc caaaccggca tggccgagat gtccgagcag ttcaagagca tcggcgcgga 2700
ggtctacctc gacgaggcgg tgctggagca cgcgtaacaa ttgaagcagc agcagctcgg 2760
atagtatcga cacactctgg acgctggtcg tgtgatggac tgttgccgcc acacttgctg 2820
ccttgacctg tgaatatccc tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt 2880
gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt tgcgaatacc acccccagca 2940
tccccttccc tcgtttcata tcgcttgcat cccaaccgca acttatctac gctgtcctgc 3000
tatccctcag cgctgctcct gctcctgctc actgcccctc gcacagcctt ggtttgggct 3060
ccgcctgtat tctcctggta ctgcaacctg taaaccagca ctgcaatgct gatgcacggg 3120
aagtagtggg atgggaacac aaatggaaag cttgagctca gaatagtatc gggtgatgcg 3180
aagtcagaac caggcagggc ctgtcgcctg aggtggcaac gatgggaagc aatcaatctg 3240
ggtacagtcg tccgcacgat cccgtgatct cccccaccga cacctatccc cgcccatccc 3300
ggcccaccct ttcagtcccc tcagcatgca ttgtgcaccg cgacaaagca tgtctgctcg 3360
tgcactggtt caggccacgg cgcaccgagt cctcgccctt cgcagagtga tcaccctccc 3420
cggaaccagc cacgctcgct gctgcgggcc gatcagccgc gcgcactccc tgcaactagg 3480
gacaactcag gcaaccacgc gcctcacaag catggccgcc gtggcatcca acccgctcgt 3540
gacggtgggt gcgcaagtgc caggggcctc gtcgtcacgg cgtgcatcct cgagggatgc 3600
gatccggcaa ctatatgtcg tttatctccc caccaatcac aggatgagcc cctgtctaga 3660
<210> 131
<211> 1905
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic nucleotide
<400> 131
actagtatgg ccaccgcatc cactttctcg gcgttcaatg cccgctgcgg cgacctgcgt 60
cgctcggcgg gctccgggcc ccggcgccca gcgaggcccc tccccgtgcg cgggcgcgcc 120
gcgatcgccg ctcccgagcg gctggactac ctcgacaacg cggaggaggc gcggctgcag 180
cagacggacg ccttcgccga gctgaaggcg ctgtcgagcc gccagtccgt gaaccggccc 240
caaaagggcg agctgtcgtt ccggcagtcg ccgacctttc aggactgctt ccctggctcg 300
gagaagtgct accgcgaggt ggagcacgat ggcaagacgc tcaaggtgcc ttttcgccgg 360
gtgcacctgc aggacgacaa cggccatttc gacctgtacg acacctctgg cccccagggc 420
gtgaaccccc gcgagggtct gcccaagatc cgctcctcct gggtggagcc gcgcgaggcg 480
cggggcgaca aggtgcaaac gcagcagtac tacgccaagc aaggcatcat caccgaggag 540
atggccttct gcgctgcgcg cgagcgcatg gaccccgagt tcatccggtc tgaggtggcc 600
cggggtcggg ccatcatccc tgcgaacaag cgccatctgg agctggagcc gaccgtcgtg 660
ggccgcaact ttctggtcaa ggtgaacgcc aacatcggca actctgcggt cagctcgagc 720
atcgaggagg aggtggagaa gctgcagtgg agcaccatct ggggtgccga cacggccatg 780
gacctgagca ccggcaacaa catccacgag acgcgcgagt gggtgatgcg caacagcccg 840
gtccctgtgg gtacggtccc tatctaccag tgcctggaga aggcgggcgg catcgtggag 900
aacatcacct gggagctgtt ccgggagacg ctgatcgagc aggccgagca gggcgtcgac 960
tactttacca tccacgcggg ggtcctgctc cgctacatcc ccctgacggc gaaccgcgtc 1020
accggcatcg tcagccgcgg cggctctatc catgccaagc tctgcctgct ggaccacacc 1080
gagaacttcg cctacatgca ctgggacgag atcctggaca tctgcgccca gtacgacatc 1140
accctgtcga tcggcgacgg cctgcgcccc ggctgcatcg cggacgccaa cgacgctgcc 1200
cagtttgctg agctgaagac ccagggcgag ctgacccgcc gcgcctgggc gaaggacgtg 1260
caggtgatga acgagggtcc cggccatgtg ccgctgcaca agatccccga gaacatggag 1320
aagcagctgg actggtgcag cgaggcgccc ttctacacgc tcggccccct ggcgacggac 1380
atcgcgcctg cgtacgacca catcacctcc gcgatcggcg ccgccacgat cggcgcgctg 1440
gggaccgcgc tgctgtgtta cgtgaccccg aaggagcacc tgggcctccc cgatcgcgac 1500
gacgtgaagg ccggggtgat cgcctacaag atcgcggcgc acgcggctga cctggcgaag 1560
ggtcacccct acgctcagga gtgggataac gccctctcta aggcgcgctt cgagttccgg 1620
tggtacgacc agttccacct gtcgctggac cccgtcaccg cccgcctgtt ccatgacgcg 1680
accctgccgc aggagcccgc caagaccgcc cacttctgct ccatgtgcgg ccccaagttc 1740
tgctccatgc agatcaccca ggacctccgc gagtacgcca agaaccatca aatggaggag 1800
gacgaggcga tccaaaccgg catggccgag atgtccgagc agttcaagag catcggcgcg 1860
gaggtctacc tcgacgaggc ggtgctggag cacgcgtaac aattg 1905
<210> 132
<211> 1182
<212> DNA
<213> Chlorella protothecoides
<400> 132
actagagagt ttaggtccag cgtccgtggg gggggacggg ctgggagctt gggccgggaa 60
gggcaagacg atgcagtccc tctggggagt cacagccgac tgtgtgtgtt gcactgtgcg 120
gcccgcagca ctcacacgca aaatgcctgg ccgacaggca ggccctgtcc agtgcaacat 180
ccacggtccc tctcatcagg ctcaccttgc tcattgacat aacggaatgc gtaccgctct 240
ttcagatctg tccatccaga gaggggagca ggctccccac cgacgctgtc aaacttgctt 300
cctgcccaac cgaaaacatt attgtttgag gggggggggg ggggggcaga ttgcatggcg 360
ggatatctcg tgaggaacat cactgggaca ctgtggaaca cagtgagtgc agtatgcaga 420
gcatgtatgc taggggtcag cgcaggaagg gggcctttcc cagtctccca tgccactgca 480
ccgtatccac gactcaccag gaccagcttc ttgatcggct tccgctcccg tggacaccag 540
tgtgtagcct ctggactcca ggtatgcgtg caccgcaaag gccagccgat cgtgccgatt 600
cctggggtgg aggatatgag tcagccaact tggggctcag agtgcacact ggggcacgat 660
acgaaacaac atctacaccg tgtcctccat gctgacacac cacagcttcg ctccacctga 720
atgtgggcgc atgggcccga atcacagcca atgtcgctgc tgccataatg tgatccagac 780
cctctccgcc cagatgccga gcggatcgtg ggcgctgaat agattcctgt ttcgatcact 840
gtttgggtcc tttccttttc gtctcggatg cgcgtctcga aacaggctgc gtcgggcttt 900
cggatccctt ttgctccctc cgtcaccatc ctgcgcgcgg gcaagttgct tgaccctggg 960
ctggtaccag ggttggaggg tattaccgcg tcaggccatt cccagcccgg attcaattca 1020
aagtctgggc caccaccctc cgccgctctg tctgatcact ccacattcgt gcatacacta 1080
cgttcaagtc ctgatccagg cgtgtctcgg gacaaggtgt gcttgagttt gaatctcaag 1140
gacccactcc agcacagctg ctggttgacc ccgccctcgc aa 1182
<210> 133
<211> 161
<212> DNA
<213> Chlorella protothecoides
<400> 133
acggagcgtc gtgcgggagg gagtgtgccg agcggggagt cccggtctgt gcgaggcccg 60
gcagctgacg ctggcgagcc gtacgccccg agggtccccc tcccctgcac cctcttcccc 120
ttccctctga cggccgcgcc tgttcttgca tgttcagcga c 161
<210> 134
<211> 6306
<212> DNA
<213> Arabidopsis thaliana
<400> 134
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080
tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140
tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200
accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260
gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320
tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380
gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440
tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500
ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560
ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620
gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680
cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740
gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800
tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860
gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920
ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980
tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040
ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100
tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160
tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220
cacgggaagt agtgggatgg gaacacaaat ggaggatcca ctagagagtt taggtccagc 2280
gtccgtgggg ggggacgggc tgggagcttg ggccgggaag ggcaagacga tgcagtccct 2340
ctggggagtc acagccgact gtgtgtgttg cactgtgcgg cccgcagcac tcacacgcaa 2400
aatgcctggc cgacaggcag gccctgtcca gtgcaacatc cacggtccct ctcatcaggc 2460
tcaccttgct cattgacata acggaatgcg taccgctctt tcagatctgt ccatccagag 2520
aggggagcag gctccccacc gacgctgtca aacttgcttc ctgcccaacc gaaaacatta 2580
ttgtttgagg gggggggggg gggggcagat tgcatggcgg gatatctcgt gaggaacatc 2640
actgggacac tgtggaacac agtgagtgca gtatgcagag catgtatgct aggggtcagc 2700
gcaggaaggg ggcctttccc agtctcccat gccactgcac cgtatccacg actcaccagg 2760
accagcttct tgatcggctt ccgctcccgt ggacaccagt gtgtagcctc tggactccag 2820
gtatgcgtgc accgcaaagg ccagccgatc gtgccgattc ctggggtgga ggatatgagt 2880
cagccaactt ggggctcaga gtgcacactg gggcacgata cgaaacaaca tctacaccgt 2940
gtcctccatg ctgacacacc acagcttcgc tccacctgaa tgtgggcgca tgggcccgaa 3000
tcacagccaa tgtcgctgct gccataatgt gatccagacc ctctccgccc agatgccgag 3060
cggatcgtgg gcgctgaata gattcctgtt tcgatcactg tttgggtcct ttccttttcg 3120
tctcggatgc gcgtctcgaa acaggctgcg tcgggctttc ggatcccttt tgctccctcc 3180
gtcaccatcc tgcgcgcggg caagttgctt gaccctgggc tggtaccagg gttggagggt 3240
attaccgcgt caggccattc ccagcccgga ttcaattcaa agtctgggcc accaccctcc 3300
gccgctctgt ctgatcactc cacattcgtg catacactac gttcaagtcc tgatccaggc 3360
gtgtctcggg acaaggtgtg cttgagtttg aatctcaagg acccactcca gcacagctgc 3420
tggttgaccc cgccctcgca aactagtatg gccaccgcat ccactttctc ggcgttcaat 3480
gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc agcgaggccc 3540
ctccccgtgc gcgggcgcgc cgtccaggcc gcggccaccc gcttcaagaa ggagacgacg 3600
accacccgcg ccacgctgac gttcgacccc cccacgacca actccgagcg cgccaagcag 3660
cgcaagcaca ccatcgaccc ctcctccccc gacttccagc ccatcccctc cttcgaggag 3720
tgcttcccca agtccacgaa ggagcacaag gaggtggtgc acgaggagtc cggccacgtc 3780
ctgaaggtgc ccttccgccg cgtgcacctg tccggcggcg agcccgcctt cgacaactac 3840
gacacgtccg gcccccagaa cgtcaacgcc cacatcggcc tggcgaagct gcgcaaggag 3900
tggatcgacc gccgcgagaa gctgggcacg ccccgctaca cgcagatgta ctacgcgaag 3960
cagggcatca tcacggagga gatgctgtac tgcgcgacgc gcgagaagct ggaccccgag 4020
ttcgtccgct ccgaggtcgc gcggggccgc gccatcatcc cctccaacaa gaagcacctg 4080
gagctggagc ccatgatcgt gggccgcaag ttcctggtga aggtgaacgc gaacatcggc 4140
aactccgccg tggcctcctc catcgaggag gaggtctaca aggtgcagtg ggccaccatg 4200
tggggcgccg acaccatcat ggacctgtcc acgggccgcc acatccacga gacgcgcgag 4260
tggatcctgc gcaactccgc ggtccccgtg ggcaccgtcc ccatctacca ggcgctggag 4320
aaggtggacg gcatcgcgga gaacctgaac tgggaggtgt tccgcgagac gctgatcgag 4380
caggccgagc agggcgtgga ctacttcacg atccacgcgg gcgtgctgct gcgctacatc 4440
cccctgaccg ccaagcgcct gacgggcatc gtgtcccgcg gcggctccat ccacgcgaag 4500
tggtgcctgg cctaccacaa ggagaacttc gcctacgagc actgggacga catcctggac 4560
atctgcaacc agtacgacgt cgccctgtcc atcggcgacg gcctgcgccc cggctccatc 4620
tacgacgcca acgacacggc ccagttcgcc gagctgctga cccagggcga gctgacgcgc 4680
cgcgcgtggg agaaggacgt gcaggtgatg aacgagggcc ccggccacgt gcccatgcac 4740
aagatccccg agaacatgca gaagcagctg gagtggtgca acgaggcgcc cttctacacc 4800
ctgggccccc tgacgaccga catcgcgccc ggctacgacc acatcacctc cgccatcggc 4860
gcggccaaca tcggcgccct gggcaccgcc ctgctgtgct acgtgacgcc caaggagcac 4920
ctgggcctgc ccaaccgcga cgacgtgaag gcgggcgtca tcgcctacaa gatcgccgcc 4980
cacgcggccg acctggccaa gcagcacccc cacgcccagg cgtgggacga cgcgctgtcc 5040
aaggcgcgct tcgagttccg ctggatggac cagttcgcgc tgtccctgga ccccatgacg 5100
gcgatgtcct tccacgacga gacgctgccc gcggacggcg cgaaggtcgc ccacttctgc 5160
tccatgtgcg gccccaagtt ctgctccatg aagatcacgg aggacatccg caagtacgcc 5220
gaggagaacg gctacggctc cgccgaggag gccatccgcc agggcatgga cgccatgtcc 5280
gaggagttca acatcgccaa gaagacgatc tccggcgagc agcacggcga ggtcggcggc 5340
gagatctacc tgcccgagtc ctacgtcaag gccgcgcaga agtgatacgt actcgagacg 5400
gagcgtcgtg cgggagggag tgtgccgagc ggggagtccc ggtctgtgcg aggcccggca 5460
gctgacgctg gcgagccgta cgccccgagg gtccccctcc cctgcaccct cttccccttc 5520
cctctgacgg ccgcgcctgt tcttgcatgt tcagcgacga gctcttgttt tccagaagga 5580
gttgctcctt gagcctttca ttctcagcct cgataacctc caaagccgct ctaattgtgg 5640
agggggttcg aatttaaaag cttggaatgt tggttcgtgc gtctggaaca agcccagact 5700
tgttgctcac tgggaaaagg accatcagct ccaaaaaact tgccgctcaa accgcgtacc 5760
tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac attcatattg tgacgcttga 5820
gcagtctgta attgcctcag aatgtggaat catctgcccc ctgtgcgagc ccatgccagg 5880
catgtcgcgg gcgaggacac ccgccactcg tacagcagac cattatgcta cctcacaata 5940
gttcataaca gtgaccatat ttctcgaagc tccccaacga gcacctccat gctctgagtg 6000
gccacccccc ggccctggtg cttgcggagg gcaggtcaac cggcatgggg ctaccgaaat 6060
ccccgaccgg atcccaccac ccccgcgatg ggaagaatct ctccccggga tgtgggccca 6120
ccaccagcac aacctgctgg cccaggcgag cgtcaaacca taccacacaa atatccttgg 6180
catcggccct gaattccttc tgccgctctg ctacccggtg cttctgtccg aagcaggggt 6240
tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg gcggggcttg ttcgagcttg 6300
aagagc 6306
<210> 135
<211> 1938
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized nucleotide
<400> 135
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgtccag 120
gccgcggcca cccgcttcaa gaaggagacg acgaccaccc gcgccacgct gacgttcgac 180
ccccccacga ccaactccga gcgcgccaag cagcgcaagc acaccatcga cccctcctcc 240
cccgacttcc agcccatccc ctccttcgag gagtgcttcc ccaagtccac gaaggagcac 300
aaggaggtgg tgcacgagga gtccggccac gtcctgaagg tgcccttccg ccgcgtgcac 360
ctgtccggcg gcgagcccgc cttcgacaac tacgacacgt ccggccccca gaacgtcaac 420
gcccacatcg gcctggcgaa gctgcgcaag gagtggatcg accgccgcga gaagctgggc 480
acgccccgct acacgcagat gtactacgcg aagcagggca tcatcacgga ggagatgctg 540
tactgcgcga cgcgcgagaa gctggacccc gagttcgtcc gctccgaggt cgcgcggggc 600
cgcgccatca tcccctccaa caagaagcac ctggagctgg agcccatgat cgtgggccgc 660
aagttcctgg tgaaggtgaa cgcgaacatc ggcaactccg ccgtggcctc ctccatcgag 720
gaggaggtct acaaggtgca gtgggccacc atgtggggcg ccgacaccat catggacctg 780
tccacgggcc gccacatcca cgagacgcgc gagtggatcc tgcgcaactc cgcggtcccc 840
gtgggcaccg tccccatcta ccaggcgctg gagaaggtgg acggcatcgc ggagaacctg 900
aactgggagg tgttccgcga gacgctgatc gagcaggccg agcagggcgt ggactacttc 960
acgatccacg cgggcgtgct gctgcgctac atccccctga ccgccaagcg cctgacgggc 1020
atcgtgtccc gcggcggctc catccacgcg aagtggtgcc tggcctacca caaggagaac 1080
ttcgcctacg agcactggga cgacatcctg gacatctgca accagtacga cgtcgccctg 1140
tccatcggcg acggcctgcg ccccggctcc atctacgacg ccaacgacac ggcccagttc 1200
gccgagctgc tgacccaggg cgagctgacg cgccgcgcgt gggagaagga cgtgcaggtg 1260
atgaacgagg gccccggcca cgtgcccatg cacaagatcc ccgagaacat gcagaagcag 1320
ctggagtggt gcaacgaggc gcccttctac accctgggcc ccctgacgac cgacatcgcg 1380
cccggctacg accacatcac ctccgccatc ggcgcggcca acatcggcgc cctgggcacc 1440
gccctgctgt gctacgtgac gcccaaggag cacctgggcc tgcccaaccg cgacgacgtg 1500
aaggcgggcg tcatcgccta caagatcgcc gcccacgcgg ccgacctggc caagcagcac 1560
ccccacgccc aggcgtggga cgacgcgctg tccaaggcgc gcttcgagtt ccgctggatg 1620
gaccagttcg cgctgtccct ggaccccatg acggcgatgt ccttccacga cgagacgctg 1680
cccgcggacg gcgcgaaggt cgcccacttc tgctccatgt gcggccccaa gttctgctcc 1740
atgaagatca cggaggacat ccgcaagtac gccgaggaga acggctacgg ctccgccgag 1800
gaggccatcc gccagggcat ggacgccatg tccgaggagt tcaacatcgc caagaagacg 1860
atctccggcg agcagcacgg cgaggtcggc ggcgagatct acctgcccga gtcctacgtc 1920
aaggccgcgc agaagtga 1938
<210> 136
<211> 644
<212> PRT
<213> Arabidopsis thaliana
<400> 136
Met Ala Ala Ser Val His Cys Thr Leu Met Ser Val Val Cys Asn Asn
1 5 10 15
Lys Asn His Ser Ala Arg Pro Lys Leu Pro Asn Ser Ser Leu Leu Pro
20 25 30
Gly Phe Asp Val Val Val Gln Ala Ala Ala Thr Arg Phe Lys Lys Glu
35 40 45
Thr Thr Thr Thr Arg Ala Thr Leu Thr Phe Asp Pro Pro Thr Thr Asn
50 55 60
Ser Glu Arg Ala Lys Gln Arg Lys His Thr Ile Asp Pro Ser Ser Pro
65 70 75 80
Asp Phe Gln Pro Ile Pro Ser Phe Glu Glu Cys Phe Pro Lys Ser Thr
85 90 95
Lys Glu His Lys Glu Val Val His Glu Glu Ser Gly His Val Leu Lys
100 105 110
Val Pro Phe Arg Arg Val His Leu Ser Gly Gly Glu Pro Ala Phe Asp
115 120 125
Asn Tyr Asp Thr Ser Gly Pro Gln Asn Val Asn Ala His Ile Gly Leu
130 135 140
Ala Lys Leu Arg Lys Glu Trp Ile Asp Arg Arg Glu Lys Leu Gly Thr
145 150 155 160
Pro Arg Tyr Thr Gln Met Tyr Tyr Ala Lys Gln Gly Ile Ile Thr Glu
165 170 175
Glu Met Leu Tyr Cys Ala Thr Arg Glu Lys Leu Asp Pro Glu Phe Val
180 185 190
Arg Ser Glu Val Ala Arg Gly Arg Ala Ile Ile Pro Ser Asn Lys Lys
195 200 205
His Leu Glu Leu Glu Pro Met Ile Val Gly Arg Lys Phe Leu Val Lys
210 215 220
Val Asn Ala Asn Ile Gly Asn Ser Ala Val Ala Ser Ser Ile Glu Glu
225 230 235 240
Glu Val Tyr Lys Val Gln Trp Ala Thr Met Trp Gly Ala Asp Thr Ile
245 250 255
Met Asp Leu Ser Thr Gly Arg His Ile His Glu Thr Arg Glu Trp Ile
260 265 270
Leu Arg Asn Ser Ala Val Pro Val Gly Thr Val Pro Ile Tyr Gln Ala
275 280 285
Leu Glu Lys Val Asp Gly Ile Ala Glu Asn Leu Asn Trp Glu Val Phe
290 295 300
Arg Glu Thr Leu Ile Glu Gln Ala Glu Gln Gly Val Asp Tyr Phe Thr
305 310 315 320
Ile His Ala Gly Val Leu Leu Arg Tyr Ile Pro Leu Thr Ala Lys Arg
325 330 335
Leu Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala Lys Trp Cys
340 345 350
Leu Ala Tyr His Lys Glu Asn Phe Ala Tyr Glu His Trp Asp Asp Ile
355 360 365
Leu Asp Ile Cys Asn Gln Tyr Asp Val Ala Leu Ser Ile Gly Asp Gly
370 375 380
Leu Arg Pro Gly Ser Ile Tyr Asp Ala Asn Asp Thr Ala Gln Phe Ala
385 390 395 400
Glu Leu Leu Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp Glu Lys Asp
405 410 415
Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Met His Lys Ile
420 425 430
Pro Glu Asn Met Gln Lys Gln Leu Glu Trp Cys Asn Glu Ala Pro Phe
435 440 445
Tyr Thr Leu Gly Pro Leu Thr Thr Asp Ile Ala Pro Gly Tyr Asp His
450 455 460
Ile Thr Ser Ala Ile Gly Ala Ala Asn Ile Gly Ala Leu Gly Thr Ala
465 470 475 480
Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu Pro Asn Arg
485 490 495
Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala Ala His Ala
500 505 510
Ala Asp Leu Ala Lys Gln His Pro His Ala Gln Ala Trp Asp Asp Ala
515 520 525
Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Met Asp Gln Phe Ala Leu
530 535 540
Ser Leu Asp Pro Met Thr Ala Met Ser Phe His Asp Glu Thr Leu Pro
545 550 555 560
Ala Asp Gly Ala Lys Val Ala His Phe Cys Ser Met Cys Gly Pro Lys
565 570 575
Phe Cys Ser Met Lys Ile Thr Glu Asp Ile Arg Lys Tyr Ala Glu Glu
580 585 590
Asn Gly Tyr Gly Ser Ala Glu Glu Ala Ile Arg Gln Gly Met Asp Ala
595 600 605
Met Ser Glu Glu Phe Asn Ile Ala Lys Lys Thr Ile Ser Gly Glu Gln
610 615 620
His Gly Glu Val Gly Gly Glu Ile Tyr Leu Pro Glu Ser Tyr Val Lys
625 630 635 640
Ala Ala Gln Lys
<210> 137
<211> 6130
<212> DNA
<213> Unknown
<220>
<223> Synechocystis species
<400> 137
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080
tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140
tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200
accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260
gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320
tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380
gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440
tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500
ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560
ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620
gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680
cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740
gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800
tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860
gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920
ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980
tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040
ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100
tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160
tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220
cacgggaagt agtgggatgg gaacacaaat ggaggatcca ctagagagtt taggtccagc 2280
gtccgtgggg ggggacgggc tgggagcttg ggccgggaag ggcaagacga tgcagtccct 2340
ctggggagtc acagccgact gtgtgtgttg cactgtgcgg cccgcagcac tcacacgcaa 2400
aatgcctggc cgacaggcag gccctgtcca gtgcaacatc cacggtccct ctcatcaggc 2460
tcaccttgct cattgacata acggaatgcg taccgctctt tcagatctgt ccatccagag 2520
aggggagcag gctccccacc gacgctgtca aacttgcttc ctgcccaacc gaaaacatta 2580
ttgtttgagg gggggggggg gggggcagat tgcatggcgg gatatctcgt gaggaacatc 2640
actgggacac tgtggaacac agtgagtgca gtatgcagag catgtatgct aggggtcagc 2700
gcaggaaggg ggcctttccc agtctcccat gccactgcac cgtatccacg actcaccagg 2760
accagcttct tgatcggctt ccgctcccgt ggacaccagt gtgtagcctc tggactccag 2820
gtatgcgtgc accgcaaagg ccagccgatc gtgccgattc ctggggtgga ggatatgagt 2880
cagccaactt ggggctcaga gtgcacactg gggcacgata cgaaacaaca tctacaccgt 2940
gtcctccatg ctgacacacc acagcttcgc tccacctgaa tgtgggcgca tgggcccgaa 3000
tcacagccaa tgtcgctgct gccataatgt gatccagacc ctctccgccc agatgccgag 3060
cggatcgtgg gcgctgaata gattcctgtt tcgatcactg tttgggtcct ttccttttcg 3120
tctcggatgc gcgtctcgaa acaggctgcg tcgggctttc ggatcccttt tgctccctcc 3180
gtcaccatcc tgcgcgcggg caagttgctt gaccctgggc tggtaccagg gttggagggt 3240
attaccgcgt caggccattc ccagcccgga ttcaattcaa agtctgggcc accaccctcc 3300
gccgctctgt ctgatcactc cacattcgtg catacactac gttcaagtcc tgatccaggc 3360
gtgtctcggg acaaggtgtg cttgagtttg aatctcaagg acccactcca gcacagctgc 3420
tggttgaccc cgccctcgca aactagtatg gccaccgcat ccactttctc ggcgttcaat 3480
gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc agcgaggccc 3540
ctccccgtgc gcgggcgcgc catgcgcacc gcgtgggtcg ccaagcgcca gggccagacg 3600
aacgtctccc agatgcacta cgcgcgcaag ggcgtgatca ccgaggagat ggactacgtg 3660
gcgaagcgcg agaacctgcc cgtggagctg atcaaggacg aggtggcgcg gggccgcatg 3720
atcatccccg ccaacatcaa ccacacgaac ctggagccca tggccatcgg catcgcctcc 3780
aagtgcaagg tcaacgcgaa catcggcgcg tcccccaact cctccaacat cgacgaggag 3840
gtggagaagc tgctgctgtc cgtgaagtac ggcgcggaca cggtgatgga cctgtccacc 3900
ggcggcggcg acctggacgt gatccgcacc gccatcatca acgcctcccc cgtgcccatc 3960
ggcacggtgc ccatctacca ggccctggag tccgtgcacg gctccatcga gaacctgacg 4020
cccgacgact tcctgcacat catcgagaag cacgcccagc agggcgtgga ctacatgacg 4080
atccacgcgg gcctgctgat cgagtacctg cccctggtga agtcccgcat cacgggcatc 4140
gtgtcccgcg gcggcggcat catcgccaag tggatgctgc accaccacaa gcagaacccc 4200
ctgtacacgc acttcgacga gatcatcgag atcttcaaga agtacgacgt gtccttctcc 4260
ctgggcgact ccctgcgccc cggctgcacc cacgacgcct ccgacgacgc ccagctgtcc 4320
gagctgaaga cgctgggcca gctgacgcgc cgcgcctggg agcacgacgt ccaggtcatg 4380
gtggagggcc ccggccacgt ccccatcgac cagatcgagt tcaacgtcaa gaagcagatg 4440
gaggagtgct ccgaggcccc cttctacgtg ctgggccccc tggtcaccga catcgcgccc 4500
ggctacgacc acatcacctc cgcgatcggc gccgccatcg cgggctggca cggcaccgcg 4560
atgctgtgct acgtgacgcc caaggagcac ctgggcctgc ccaacgcgga ggacgtgcgc 4620
aacggcctga tcgcctacaa gatcgccgcg cacgccgcgg acatcgcccg ccaccgcccc 4680
ggcgcgcgcg accgcgacga cgagctgtcc aaggcgcgct acaacttcga ctggaaccgc 4740
cagttcgagc tgtccctgga ccccgagcgc gcgaaggagt accacgacga gacgctgccc 4800
gcggacatct acaagaccgc ggagttctgc tccatgtgcg gccccaagtt ctgccccatg 4860
cagaccaagg tggacgccga gatgctggag gagctggagg tcttcctggc caaggacaag 4920
gagatggtgt cccagcgctg atacgtactc gagacggagc gtcgtgcggg agggagtgtg 4980
ccgagcgggg agtcccggtc tgtgcgaggc ccggcagctg acgctggcga gccgtacgcc 5040
ccgagggtcc ccctcccctg caccctcttc cccttccctc tgacggccgc gcctgttctt 5100
gcatgttcag cgacgagctc ttgttttcca gaaggagttg ctccttgagc ctttcattct 5160
cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 5220
gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 5280
tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 5340
ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 5400
tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 5460
cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 5520
cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 5580
cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 5640
gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 5700
ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 5760
gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 5820
aaacccttgt cgcgtggcgg ggcttgttcg agcttgaaga gcctctagag tcgacctgca 5880
ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc 5940
tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat 6000
gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc 6060
tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg 6120
ggcgctcttc 6130
<210> 138
<211> 1494
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 138
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccatgcgc 120
accgcgtggg tcgccaagcg ccagggccag acgaacgtct cccagatgca ctacgcgcgc 180
aagggcgtga tcaccgagga gatggactac gtggcgaagc gcgagaacct gcccgtggag 240
ctgatcaagg acgaggtggc gcggggccgc atgatcatcc ccgccaacat caaccacacg 300
aacctggagc ccatggccat cggcatcgcc tccaagtgca aggtcaacgc gaacatcggc 360
gcgtccccca actcctccaa catcgacgag gaggtggaga agctgctgct gtccgtgaag 420
tacggcgcgg acacggtgat ggacctgtcc accggcggcg gcgacctgga cgtgatccgc 480
accgccatca tcaacgcctc ccccgtgccc atcggcacgg tgcccatcta ccaggccctg 540
gagtccgtgc acggctccat cgagaacctg acgcccgacg acttcctgca catcatcgag 600
aagcacgccc agcagggcgt ggactacatg acgatccacg cgggcctgct gatcgagtac 660
ctgcccctgg tgaagtcccg catcacgggc atcgtgtccc gcggcggcgg catcatcgcc 720
aagtggatgc tgcaccacca caagcagaac cccctgtaca cgcacttcga cgagatcatc 780
gagatcttca agaagtacga cgtgtccttc tccctgggcg actccctgcg ccccggctgc 840
acccacgacg cctccgacga cgcccagctg tccgagctga agacgctggg ccagctgacg 900
cgccgcgcct gggagcacga cgtccaggtc atggtggagg gccccggcca cgtccccatc 960
gaccagatcg agttcaacgt caagaagcag atggaggagt gctccgaggc ccccttctac 1020
gtgctgggcc ccctggtcac cgacatcgcg cccggctacg accacatcac ctccgcgatc 1080
ggcgccgcca tcgcgggctg gcacggcacc gcgatgctgt gctacgtgac gcccaaggag 1140
cacctgggcc tgcccaacgc ggaggacgtg cgcaacggcc tgatcgccta caagatcgcc 1200
gcgcacgccg cggacatcgc ccgccaccgc cccggcgcgc gcgaccgcga cgacgagctg 1260
tccaaggcgc gctacaactt cgactggaac cgccagttcg agctgtccct ggaccccgag 1320
cgcgcgaagg agtaccacga cgagacgctg cccgcggaca tctacaagac cgcggagttc 1380
tgctccatgt gcggccccaa gttctgcccc atgcagacca aggtggacgc cgagatgctg 1440
gaggagctgg aggtcttcct ggccaaggac aaggagatgg tgtcccagcg ctga 1494
<210> 139
<211> 459
<212> PRT
<213> Unknown
<220>
<223> Synechosystis species
<400> 139
Met Arg Thr Ala Trp Val Ala Lys Arg Gln Gly Gln Thr Asn Val Ser
1 5 10 15
Gln Met His Tyr Ala Arg Lys Gly Val Ile Thr Glu Glu Met Asp Tyr
20 25 30
Val Ala Lys Arg Glu Asn Leu Pro Val Glu Leu Ile Lys Asp Glu Val
35 40 45
Ala Arg Gly Arg Met Ile Ile Pro Ala Asn Ile Asn His Thr Asn Leu
50 55 60
Glu Pro Met Ala Ile Gly Ile Ala Ser Lys Cys Lys Val Asn Ala Asn
65 70 75 80
Ile Gly Ala Ser Pro Asn Ser Ser Asn Ile Asp Glu Glu Val Glu Lys
85 90 95
Leu Leu Leu Ser Val Lys Tyr Gly Ala Asp Thr Val Met Asp Leu Ser
100 105 110
Thr Gly Gly Gly Asp Leu Asp Val Ile Arg Thr Ala Ile Ile Asn Ala
115 120 125
Ser Pro Val Pro Ile Gly Thr Val Pro Ile Tyr Gln Ala Leu Glu Ser
130 135 140
Val His Gly Ser Ile Glu Asn Leu Thr Pro Asp Asp Phe Leu His Ile
145 150 155 160
Ile Glu Lys His Ala Gln Gln Gly Val Asp Tyr Met Thr Ile His Ala
165 170 175
Gly Leu Leu Ile Glu Tyr Leu Pro Leu Val Lys Ser Arg Ile Thr Gly
180 185 190
Ile Val Ser Arg Gly Gly Gly Ile Ile Ala Lys Trp Met Leu His His
195 200 205
His Lys Gln Asn Pro Leu Tyr Thr His Phe Asp Glu Ile Ile Glu Ile
210 215 220
Phe Lys Lys Tyr Asp Val Ser Phe Ser Leu Gly Asp Ser Leu Arg Pro
225 230 235 240
Gly Cys Thr His Asp Ala Ser Asp Asp Ala Gln Leu Ser Glu Leu Lys
245 250 255
Thr Leu Gly Gln Leu Thr Arg Arg Ala Trp Glu His Asp Val Gln Val
260 265 270
Met Val Glu Gly Pro Gly His Val Pro Ile Asp Gln Ile Glu Phe Asn
275 280 285
Val Lys Lys Gln Met Glu Glu Cys Ser Glu Ala Pro Phe Tyr Val Leu
290 295 300
Gly Pro Leu Val Thr Asp Ile Ala Pro Gly Tyr Asp His Ile Thr Ser
305 310 315 320
Ala Ile Gly Ala Ala Ile Ala Gly Trp His Gly Thr Ala Met Leu Cys
325 330 335
Tyr Val Thr Pro Lys Glu His Leu Gly Leu Pro Asn Ala Glu Asp Val
340 345 350
Arg Asn Gly Leu Ile Ala Tyr Lys Ile Ala Ala His Ala Ala Asp Ile
355 360 365
Ala Arg His Arg Pro Gly Ala Arg Asp Arg Asp Asp Glu Leu Ser Lys
370 375 380
Ala Arg Tyr Asn Phe Asp Trp Asn Arg Gln Phe Glu Leu Ser Leu Asp
385 390 395 400
Pro Glu Arg Ala Lys Glu Tyr His Asp Glu Thr Leu Pro Ala Asp Ile
405 410 415
Tyr Lys Thr Ala Glu Phe Cys Ser Met Cys Gly Pro Lys Phe Cys Pro
420 425 430
Met Gln Thr Lys Val Asp Ala Glu Met Leu Glu Glu Leu Glu Val Phe
435 440 445
Leu Ala Lys Asp Lys Glu Met Val Ser Gln Arg
450 455
<210> 140
<211> 312
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized nucleotide
<400> 140
ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg 60
cgctgcatgc aacaccgatg atgcttcgac cccccgaagc tccttcgggg ctgcatgggc 120
gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac 180
attatagcga gctaccaaag ccatattcaa acacctagat cactaccact tctacacagg 240
ccactcgagc ttgtgatcgc actccgctaa gggggcgcct cttcctcttc gtttcagtca 300
caacccgcaa ac 312
<210> 141
<211> 18
<212> DNA
<213> Unknown
<220>
<223> Coccomyxa species
<400> 141
gggtgatcgc ctacaaga 18
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 142
acgtcgcgac ccatgcttcc 20
<210> 143
<211> 18
<212> DNA
<213> Arabidopsis thaliana
<400> 143
gcgtcatcgc ctacaaga 18
<210> 144
<211> 18
<212> DNA
<213> Unknown
<220>
<223> Synechosystis sp.
<400> 144
cgatgctgtg ctacgtga 18
<210> 145
<211> 1197
<212> DNA
<213> Cuphea calophylla
<400> 145
atggcttccg cggcattcac catgtcggcg tgccccgcga tgactggcag ggcccctggg 60
gcacgtcgct ccggacggcc agtcgccacc cgcctgaggg ggcgcgcccc caaggccaac 120
ggctccgccg tgtccctgaa gtccggctcc ctggacaccc aggaggacac ctcctcctcc 180
tcctcccccc cccgcacctt catcaaccag ctgcccgact ggtccatgct gctgtccgcc 240
atcaccaccg tgttcgtggc cgccgagaag cagtggacca tgctggaccg caagtccaag 300
cgccccgaca ccctgatgga ccccttcggc gtggaccgcg tggtgcagga cggcgtggtg 360
ttccgccagt ccttctccat ccgctcctac gagatcggcg ccgaccgcac cgcctccatc 420
gagaccctga tgaacatctt ccaggagacc tccctgaacc actgcaagtc catcggcctg 480
ctgaacgacg gcttcggccg cacccccgag atgtgcaagc gcgacctgat ctgggtggtg 540
accaagatgc acatcgaggt gaaccgctac cccacctggg gcgacaccat cgaggtgaac 600
acctgggtgt ccgagtccgg caagaccggc atgggccgcg actggctgat ctccgactgc 660
cacaccggcg agatcctgat ccgcgccacc tccgtgtgcg ccatgatgaa ccagaccacc 720
cgccgcttct ccaagttccc ctacgaggtg cgccaggagc tggcccccca cttcgtggac 780
tccgcccccg tgatcgagga ctaccagaag ctgcacaagc tggacgtgaa gaccggcgac 840
tccatctgca acggcctgac cccccgctgg aacgacctgg acgtgaacca gcacgtgaac 900
aacgtgaagt acatcggctg gattctggag tccgtgccca aggaggtgtt cgagacccag 960
gagctgtgcg gcctgaccct ggagtaccgc cgcgagtgcg gccgcgactc cgtgctgaag 1020
tccgtgaccg ccatggaccc ctccaaggag ggcgaccgct ccctgtacca gcacctgctg 1080
cgcctggagg acggcaccga catcgccaag ggccgcacca agtggcgccc caagaacgcc 1140
ggcaccaacg gcgccatctc caccggcaag acctccaacg gcaactccat ctcctga 1197
<210> 146
<211> 398
<212> PRT
<213> Cuphea calophylla
<400> 146
Met Ala Ser Ala Ala Phe Thr Met Ser Ala Cys Pro Ala Met Thr Gly
1 5 10 15
Arg Ala Pro Gly Ala Arg Arg Ser Gly Arg Pro Val Ala Thr Arg Leu
20 25 30
Arg Gly Arg Ala Pro Lys Ala Asn Gly Ser Ala Val Ser Leu Lys Ser
35 40 45
Gly Ser Leu Asp Thr Gln Glu Asp Thr Ser Ser Ser Ser Ser Pro Pro
50 55 60
Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ser Ala
65 70 75 80
Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met Leu Asp
85 90 95
Arg Lys Ser Lys Arg Pro Asp Thr Leu Met Asp Pro Phe Gly Val Asp
100 105 110
Arg Val Val Gln Asp Gly Val Val Phe Arg Gln Ser Phe Ser Ile Arg
115 120 125
Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met
130 135 140
Asn Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser Ile Gly Leu
145 150 155 160
Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu
165 170 175
Ile Trp Val Val Thr Lys Met His Ile Glu Val Asn Arg Tyr Pro Thr
180 185 190
Trp Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu Ser Gly Lys
195 200 205
Thr Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys His Thr Gly Glu
210 215 220
Ile Leu Ile Arg Ala Thr Ser Val Cys Ala Met Met Asn Gln Thr Thr
225 230 235 240
Arg Arg Phe Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu Leu Ala Pro
245 250 255
His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Tyr Gln Lys Leu His
260 265 270
Lys Leu Asp Val Lys Thr Gly Asp Ser Ile Cys Asn Gly Leu Thr Pro
275 280 285
Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr
290 295 300
Ile Gly Trp Ile Leu Glu Ser Val Pro Lys Glu Val Phe Glu Thr Gln
305 310 315 320
Glu Leu Cys Gly Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp
325 330 335
Ser Val Leu Lys Ser Val Thr Ala Met Asp Pro Ser Lys Glu Gly Asp
340 345 350
Arg Ser Leu Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Asp Ile
355 360 365
Ala Lys Gly Arg Thr Lys Trp Arg Pro Lys Asn Ala Gly Thr Asn Gly
370 375 380
Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Ile Ser
385 390 395
<210> 147
<211> 1275
<212> DNA
<213> Ricinus communis
<400> 147
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgcctcc 120
accctgaagt ccggctccaa ggaggtggag aacctgaaga agcccttcat gcccccccgc 180
gaggtgcacg tgcaggtgac ccactccatg cccccccaga agatcgagat cttcaagtcc 240
ctggacaact gggccgagga gaacatcctg gtgcacctga agcccgtgga gaagtgctgg 300
cagccccagg acttcctgcc cgaccccgcc tccgacggct tcgacgagca ggtgcgcgag 360
ctgcgcgagc gcgccaagga gatccccgac gactacttcg tggtgctggt gggcgacatg 420
atcaccgagg aggccctgcc cacctaccag accatgctga acaccctgga cggcgtgcgc 480
gacgagaccg gcgcctcccc cacctcctgg gccatctgga cccgcgcctg gaccgccgag 540
gagaaccgcc acggcgacct gctgaacaag tacctgtacc tgtccggccg cgtggacatg 600
cgccagatcg agaagaccat ccagtacctg atcggctccg gcatggaccc ccgcaccgag 660
aactccccct acctgggctt catctacacc tccttccagg agcgcgccac cttcatctcc 720
cacggcaaca ccgcccgcca ggccaaggag cacggcgaca tcaagctggc ccagatctgc 780
ggcaccatcg ccgccgacga gaagcgccac gagaccgcct acaccaagat cgtggagaag 840
ctgttcgaga tcgaccccga cggcaccgtg ctggccttcg ccgacatgat gcgcaagaag 900
atctccatgc ccgcccacct gatgtacgac ggccgcgacg acaacctgtt cgaccacttc 960
tccgccgtgg cccagcgcct gggcgtgtac accgccaagg actacgccga catcctggag 1020
ttcctggtgg gccgctggaa ggtggacaag ctgaccggcc tgtccgccga gggccagaag 1080
gcccaggact acgtgtgccg cctgcccccc cgcatccgcc gcctggagga gcgcgcccag 1140
ggccgcgcca aggaggcccc caccatgccc ttctcctgga tcttcgaccg ccaggtgaag 1200
ctgatggact acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac 1260
gacgacgaca agtga 1275
<210> 148
<211> 424
<212> PRT
<213> Ricinus communis
<400> 148
Met Ala Thr Ala Ser Thr Phe Ser Ala Phe Asn Ala Arg Cys Gly Asp
1 5 10 15
Leu Arg Arg Ser Ala Gly Ser Gly Pro Arg Arg Pro Ala Arg Pro Leu
20 25 30
Pro Val Arg Gly Arg Ala Ala Ser Thr Leu Lys Ser Gly Ser Lys Glu
35 40 45
Val Glu Asn Leu Lys Lys Pro Phe Met Pro Pro Arg Glu Val His Val
50 55 60
Gln Val Thr His Ser Met Pro Pro Gln Lys Ile Glu Ile Phe Lys Ser
65 70 75 80
Leu Asp Asn Trp Ala Glu Glu Asn Ile Leu Val His Leu Lys Pro Val
85 90 95
Glu Lys Cys Trp Gln Pro Gln Asp Phe Leu Pro Asp Pro Ala Ser Asp
100 105 110
Gly Phe Asp Glu Gln Val Arg Glu Leu Arg Glu Arg Ala Lys Glu Ile
115 120 125
Pro Asp Asp Tyr Phe Val Val Leu Val Gly Asp Met Ile Thr Glu Glu
130 135 140
Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr Leu Asp Gly Val Arg
145 150 155 160
Asp Glu Thr Gly Ala Ser Pro Thr Ser Trp Ala Ile Trp Thr Arg Ala
165 170 175
Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Leu
180 185 190
Tyr Leu Ser Gly Arg Val Asp Met Arg Gln Ile Glu Lys Thr Ile Gln
195 200 205
Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr Glu Asn Ser Pro Tyr
210 215 220
Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser
225 230 235 240
His Gly Asn Thr Ala Arg Gln Ala Lys Glu His Gly Asp Ile Lys Leu
245 250 255
Ala Gln Ile Cys Gly Thr Ile Ala Ala Asp Glu Lys Arg His Glu Thr
260 265 270
Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe Glu Ile Asp Pro Asp Gly
275 280 285
Thr Val Leu Ala Phe Ala Asp Met Met Arg Lys Lys Ile Ser Met Pro
290 295 300
Ala His Leu Met Tyr Asp Gly Arg Asp Asp Asn Leu Phe Asp His Phe
305 310 315 320
Ser Ala Val Ala Gln Arg Leu Gly Val Tyr Thr Ala Lys Asp Tyr Ala
325 330 335
Asp Ile Leu Glu Phe Leu Val Gly Arg Trp Lys Val Asp Lys Leu Thr
340 345 350
Gly Leu Ser Ala Glu Gly Gln Lys Ala Gln Asp Tyr Val Cys Arg Leu
355 360 365
Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg Ala Gln Gly Arg Ala Lys
370 375 380
Glu Ala Pro Thr Met Pro Phe Ser Trp Ile Phe Asp Arg Gln Val Lys
385 390 395 400
Leu Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile
405 410 415
Asp Tyr Lys Asp Asp Asp Asp Lys
420
<210> 149
<211> 2678
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 149
gctcttcccg caccggctgg ctccacccca acttgaacct cgagaacccc gcgcctggcg 60
tcgaccccgt cgtgctcgtg gggccgcgga aggagcgcgc cgaagacctg gacgtcgtcc 120
tctccaactc ctttggcttt ggcgggcaca attcgtgcgt cggtaccctt tcttgcgcta 180
tgacacttcc agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac 240
accgatgatg cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc 300
tccagggcga gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct 360
accaaagcca tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg 420
tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaacg 480
gcgcgccatg ctgctgcagg ccttcctgtt cctgctggcc ggcttcgccg ccaagatcag 540
cgcctccatg acgaacgaga cgtccgaccg ccccctggtg cacttcaccc ccaacaaggg 600
ctggatgaac gaccccaacg gcctgtggta cgacgagaag gacgccaagt ggcacctgta 660
cttccagtac aacccgaacg acaccgtctg ggggacgccc ttgttctggg gccacgccac 720
gtccgacgac ctgaccaact gggaggacca gcccatcgcc atcgccccga agcgcaacga 780
ctccggcgcc ttctccggct ccatggtggt ggactacaac aacacctccg gcttcttcaa 840
cgacaccatc gacccgcgcc agcgctgcgt ggccatctgg acctacaaca ccccggagtc 900
cgaggagcag tacatctcct acagcctgga cggcggctac accttcaccg agtaccagaa 960
gaaccccgtg ctggccgcca actccaccca gttccgcgac ccgaaggtct tctggtacga 1020
gccctcccag aagtggatca tgaccgcggc caagtcccag gactacaaga tcgagatcta 1080
ctcctccgac gacctgaagt cctggaagct ggagtccgcg ttcgccaacg agggcttcct 1140
cggctaccag tacgagtgcc ccggcctgat cgaggtcccc accgagcagg accccagcaa 1200
gtcctactgg gtgatgttca tctccatcaa ccccggcgcc ccggccggcg gctccttcaa 1260
ccagtacttc gtcggcagct tcaacggcac ccacttcgag gccttcgaca accagtcccg 1320
cgtggtggac ttcggcaagg actactacgc cctgcagacc ttcttcaaca ccgacccgac 1380
ctacgggagc gccctgggca tcgcgtgggc ctccaactgg gagtactccg ccttcgtgcc 1440
caccaacccc tggcgctcct ccatgtccct cgtgcgcaag ttctccctca acaccgagta 1500
ccaggccaac ccggagacgg agctgatcaa cctgaaggcc gagccgatcc tgaacatcag 1560
caacgccggc ccctggagcc ggttcgccac caacaccacg ttgacgaagg ccaacagcta 1620
caacgtcgac ctgtccaaca gcaccggcac cctggagttc gagctggtgt acgccgtcaa 1680
caccacccag acgatctcca agtccgtgtt cgcggacctc tccctctggt tcaagggcct 1740
ggaggacccc gaggagtacc tccgcatggg cttcgaggtg tccgcgtcct ccttcttcct 1800
ggaccgcggg aacagcaagg tgaagttcgt gaaggagaac ccctacttca ccaaccgcat 1860
gagcgtgaac aaccagccct tcaagagcga gaacgacctg tcctactaca aggtgtacgg 1920
cttgctggac cagaacatcc tggagctgta cttcaacgac ggcgacgtcg tgtccaccaa 1980
cacctacttc atgaccaccg ggaacgccct gggctccgtg aacatgacga cgggggtgga 2040
caacctgttc tacatcgaca agttccaggt gcgcgaggtc aagtgacaat tggcagcagc 2100
agctcggata gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca 2160
cttgctgcct tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg 2220
atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc 2280
cccagcatcc ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct 2340
gtcctgctat ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt 2400
ttgggctccg cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat 2460
gcacgggaag tagtgggatg ggaacacaaa tggaggatcg tagagctcat cttccgaaag 2520
tacgacgagt gagcgagctg attctctttg agcggggtcg ggtggttcgg ggagagtgcg 2580
cggaaaggcg cagagacgtg cggccggccg tgtccctccg tcttcccctg gttggtgcta 2640
tagtaacctg cctgtgtcgc gtgcgcgtcg ggaagagc 2678
<210> 150
<211> 1113
<212> DNA
<213> Botryococcus braunii
<400> 150
aattggaaac cccgcgcaag accgggttgt ttggccgcct gaccggaaag ggggggcctg 60
tcccgaaggg ggtctatctc ttgggggatg tcgggcgcgg aaagtcgatg ttgatggacc 120
tcttcttcga ccatgtcggg gtcgaggcca agagccgcgt ccatttcgcc gagttcatga 180
tggaggtgaa tgaccgcatc gccaccgaac gcgccaagaa gcgggcgacc gatcgccccc 240
gtcgctgcag cccttgccga ggaagtccgg ctgctggcgt tcgacgagat gatggtgacg 300
aacagcccgg acgcgatgat cctgtcgcgg ctgttcaccg cgctgatcga ggcgggggtg 360
acgatcgtca ccacctccaa ccggccgccc agggatctct ataagaacgg gctcaaccgc 420
gagcatttcc tgcccttcat cgcgctgatc gaggcgcggc tggacgtgct ggcgctgaac 480
ggcccgaccg actatcggcg cgaccggctg gggcggctgg acacgtggtt ggtgcccaat 540
ggccccaagg cgacgattac cttgtcggcg gcgttcttcc gcctgaccga ctatccggtc 600
gaggatgccg cgcatgtgcc ctctgaggac ctgaaggtgg gcgggcgcgt gctgaatgtc 660
cccaaggcgc tgaagggcgt cgcggtcttc tcgttcaagc ggttgtgcgg cgaagcgcgg 720
ggggcggcgg actatctggc ggtcgcgcgg ggcttccaca ccgtcatcct ggtcggaatc 780
cccaagctgg gggcggagaa ccgcaacgag gcggggcgct tcgtccagct gatcgacgcg 840
ctctacgaac ataaggtcaa gctgctcgcc gcagccgatg ccagcccgcc gaactctatg 900
aaaccggcga cggccggttc gagtttgagc gcagatcagc cggttggaag agatgcgctc 960
cgaggattat ctggcccaag gccatggctc ggaggggcct tgatcaggcc ttaatgcact 1020
tcgcaaccat tatcgtttaa aatcttaaac tctgtggaat aacggttccc cgacgccgca 1080
atacacgtac gtccactacg gagtaggatt gga 1113
<210> 151
<211> 253
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 151
cgcttagaag atttcgataa ggcgccagaa ggagcgcagc caaaccagga tgatgtttga 60
tggggtattt gagcacttgc aacccttatc cggaagcccc ctggcccaca aaggctaggc 120
gccaatgcaa gcagttcgca tgcagcccct ggagcggtgc cctcctgata aaccggccag 180
ggggcctatg ttctttactt ttttacaaga gaagtcactc aacatcttaa acggtcttaa 240
gaagtctatc cgg 253
<210> 152
<211> 2435
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 152
ggatccccgg gaattcggcg cgccgggccc aacatggtgg agcacgacac tctcgtctac 60
tccaagaata tcaaagatac agtctcagaa gaccaaaggg ctattgagac ttttcaacaa 120
agggtaatat cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcaaa 180
aggacagtag aaaaggaagg tggcacctac aaatgccatc attgcgataa aggaaaggct 240
atcgttcaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 300
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgataac 360
atggtggagc acgacactct cgtctactcc aagaatatca aagatacagt ctcagaagac 420
caaagggcta ttgagacttt tcaacaaagg gtaatatcgg gaaacctcct cggattccat 480
tgcccagcta tctgtcactt catcaaaagg acagtagaaa aggaaggtgg cacctacaaa 540
tgccatcatt gcgataaagg aaaggctatc gttcaagatg cctctgccga cagtggtccc 600
aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc aaccacgtct 660
tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacgc acaatcccac 720
tatccttcgc aagaccttcc tctatataag gaagttcatt tcatttggag aggacacgct 780
gaaatcacca gtctctctct acaaatctat ctctctcgag ctttcgcaga tcccgggggg 840
caatgagata tgaaaaagcc tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa 900
aagttcgaca gcgtctccga cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc 960
agcttcgatg taggagggcg tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc 1020
tacaaagatc gttatgttta tcggcacttt gcatcggccg cgctcccgat tccggaagtg 1080
cttgacattg gggagtttag cgagagcctg acctattgca tctcccgccg tgcacagggt 1140
gtcacgttgc aagacctgcc tgaaaccgaa ctgcccgctg ttctacaacc ggtcgcggag 1200
gctatggatg cgatcgctgc ggccgatctt agccagacga gcgggttcgg cccattcgga 1260
ccgcaaggaa tcggtcaata cactacatgg cgtgatttca tatgcgcgat tgctgatccc 1320
catgtgtatc actggcaaac tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct 1380
ctcgatgagc tgatgctttg ggccgaggac tgccccgaag tccggcacct cgtgcacgcg 1440
gatttcggct ccaacaatgt cctgacggac aatggccgca taacagcggt cattgactgg 1500
agcgaggcga tgttcgggga ttcccaatac gaggtcgcca acatcttctt ctggaggccg 1560
tggttggctt gtatggagca gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca 1620
ggatcgccac gactccgggc gtatatgctc cgcattggtc ttgaccaact ctatcagagc 1680
ttggttgacg gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc 1740
cgatccggag ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg 1800
accgatggct gtgtagaagt actcgccgat agtggaaacc gacgccccag cactcgtccg 1860
agggcaaaga aatagagtag atgccgaccg gatctgtcga tcgacaagct cgagtttctc 1920
cataataatg tgtgagtagt tcccagataa gggaattagg gttcctatag ggtttcgctc 1980
atgtgttgag catataagaa acccttagta tgtatttgta tttgtaaaat acttctatca 2040
ataaaatttc taattcctaa aaccaaaatc cagtactaaa atccagatcc cccgaattaa 2100
ttcggcgtta attcagtaca ttaaaaacgt ccgcaatgtg ttattaagtt gtctaagcgt 2160
caatttgttt acaccacaat atatcctgcc accagccagc caacagctcc ccgaccggca 2220
gctcggcaca aaatcaccac tcgatacagg cagcccatca gtccgggacg gcgtcagcgg 2280
gagagccgtt gtaaggcggc agactttgct catgttaccg atgctattcg gaagaacggc 2340
aactaagctg ccgggtttga aacacggatg atctcgcgga gggtagcatg ttgattgtaa 2400
cgatgacaga gcgttgctgc ctgtgatcac cgcgg 2435
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized primer
<400> 153
caaccacgtc ttcaaagcaa 20
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 154
agcaatcgcg catatgaaat 20
<210> 155
<211> 1412
<212> DNA
<213> Chlorella protothecoides
<400> 155
gaattcgagt ttaggtccag cgtccgtggg gggggacggg ctgggagctt gggccgggaa 60
gggcaagacg atgcagtccc tctggggagt cacagccgac tgtgtgtgtt gcactgtgcg 120
gcccgcagca ctcacacgca aaatgcctgg ccgacaggca ggccctgtcc agtgcaacat 180
ccacggtccc tctcatcagg ctcaccttgc tcattgacat aacggaatgc gtaccgctct 240
ttcagatctg tccatccaga gaggggagca ggctccccac cgacgctgtc aaacttgctt 300
cctgcccaac cgaaaacatt attgtttgag gggggggggg ggggggcaga ttgcatggcg 360
ggatatctcg tgaggaacat cactgggaca ctgtggaaca cagtgagtgc agtatgcaga 420
gcatgtatgc taggggtcag cgcaggaagg gggcctttcc cagtctccca tgccactgca 480
ccgtatccac gactcaccag gaccagcttc ttgatcggct tccgctcccg tggacaccag 540
tgtgtagcct ctggactcca ggtatgcgtg caccgcaaag gccagccgat cgtgccgatt 600
cctggggtgg aggatatgag tcagccaact tggggctcag agtgcacact ggggcacgat 660
acgaaacaac atctacaccg tgtcctccat gctgacacac cacagcttcg ctccacctga 720
atgtgggcgc atgggcccga atcacagcca atgtcgctgc tgccataatg tgatccagac 780
cctctccgcc cagatgccga gcggatcgtg ggcgctgaat agattcctgt ttcgatcact 840
gtttgggtcc tttccttttc gtctcggatg cgcgtctcga aacaggctgc gtcgggcttt 900
cggatccctt ttgctccctc cgtcaccatc ctgcgcgcgg gcaagttgct tgaccctggg 960
ctggtaccag ggttggaggg tattaccgcg tcaggccatt cccagcccgg attcaattca 1020
aagtctgggc caccaccctc cgccgctctg tctgatcact ccacattcgt gcatacacta 1080
cgttcaagtc ctgatccagg cgtgtctcgg gacaaggtgt gcttgagttt gaatctcaag 1140
gacccactcc agcacagctg ctggttgacc ccgccctcgc aactccctac catgtctgct 1200
ggtaggtcca gggatctttg ccatgcacac aggaccccgt ttgtgggggt ccccggtgca 1260
tgctgtcgct gtgcaggcgc cggtgtgggg cctgggcccc gcgggagctc aactcctccc 1320
catatgcctg ccgtccctcc cacccaccgc gacctggccc cctttgcaga ggaaggcgaa 1380
gtcagcgcca tcgtgtgcga taatggatcc gg 1412
<210> 156
<211> 1627
<212> DNA
<213> Chlorella protothecoides
<400> 156
gaattcgccc ttgagtttag gtccagcgtc cgtggggggg gcgtgagact cccccctgac 60
cttcgtatgg cagggactcc tacttgccaa gtaatcagtt gacaatgcca cttcaatgct 120
cgttgtggta cactgacgcg ggtctaacat actgggaagc atgaattgcc gacatggact 180
cagttggaga cagtaacagc tctttgtgtt ctatcttcag gaacacattt ggcagcgcac 240
ccatacagtg gcgcacacgc agctgtacct gatgtggctc tattcccaca tgtttcaact 300
tgatccaaaa gtcactcaga ctctcagcag ctagacttga tcgcatcttt ggccatgaag 360
atgcttgcgc aactctagga atgggacgag aaaagagcct gctctgatcg gatatttcca 420
ttctctggat gggactgaga tgattctgaa gaaatgctgc tcgacttatt tggaagaaca 480
gcacctgacg catgctttga ggctgctgtg gctgggatgt gctgtatttg tcagcattga 540
gcatctacgg gtagatggcc ataaccacgc gctgcctatc atgcggtggg ttgtgtggaa 600
aacgtacaat ggacagaaat caatcccatt gcgagcctag cgtgcagcca tgcgctccct 660
ctgtagcccc gctccaagac aaagccagcc aatgccagaa cccacataga gagggtatct 720
tcctaatgac ctcgcccatc atttcctcca aattaactat aatgccttga ttgtggagtt 780
ggctttggct tgcagctgct cgcgctggca cttttgtagg cagcacaggg tatgccagcg 840
ccgaactttg tgcccttgag caggccacaa gggcacaaga ctacaccatg cagctggtat 900
acttggaact gataccattc ttaccaagca aggcacagca cagcctgcac cgactcactt 960
tgcttgagcg gggcacagcg ccgcgactga tcctgcgagc tgtggggagt tccgactgtt 1020
ctggacctcg gtctctgaaa gatgtgtacg atgggatcaa gtcattcaag tatgctcttc 1080
acatgagcaa tcgggggaga cacggtggcc ctaaaggtgt tcatctgatt caagtgtagt 1140
gggggggtgc tgtttgtccc ggggcgcccc ccgctccccg accccggaga agggccccag 1200
aggactcggc cgcccacaga ggaataaccg ggcgtggctc ggccctgcgc ctccctcttt 1260
caatatttca cctggtgttc agtgcacgga cacgtaaaga actagataca atggccgagg 1320
gaaagacggt gagagcttgg cgttggtgga ccgggcagca tcagaaactc ctcttccccg 1380
cccgccttga aactcactgt aactccctcc tcttccccct cgcagcatct gtctatcgtt 1440
atcgtgagtg aaagggactg ccatgtgtcg ggtcgttgac cacggtcggc tcgggcgctg 1500
ctgcccgcgt cgcgaacgtt ccctgcaaac gccgcgcagc cgtccctttt tctgccgccg 1560
ccccaccccc tcgctccccc cttcaatcac accgcagtgc ggacatgtcg attccggcaa 1620
gtccacc 1627
<210> 157
<211> 570
<212> DNA
<213> Chlorella protothecoides
<400> 157
gaattccctg caggaagaag gccggcagca gctggtactt gtccttcacc tccttgatcg 60
gctgggtgag cttggccggg tcgcagtcgt cgatgccggc atcgcccagc acgctgtgcg 120
gggagccggc atcgacaacc ttggcactgc tcaccttggt caccggcatg gggtcatggc 180
gctgcagacc agcggcctgt cagcatgctg caggcatctg tgttttgtag tagatacttt 240
ctgatgcatc accacacgtt tggaaggtcc ccaagcccct tcaacagtct cgacatatga 300
cactcgcgcc ctcttcctcg tcccgtggcc tgatgagggt acgcaggtac cgcagctgcg 360
ccccgtcccg ccagttgccc tggccccgcc gggcccaatc tgttcattgc cgctccctgg 420
cagccgtgaa cttcacacta ccgctctctg tgaccttcag cacagcagga atcgccattt 480
caccggcggt cgttgctgcg gagcctcagc tgatctcgcc tgcgagaccc cacagtttga 540
atttgcggtc cccacacaac ctctgacgcc 570
<210> 158
<211> 568
<212> DNA
<213> Chlorella protothecoides
<220>
<221> misc_feature
<222> (133)..(133)
<223> n is a, c, g, or t
<400> 158
gaattccctc aggaagaagg ccggcagcag ctggtacttg tccttcacct ccttgatcgg 60
ctgggtgagc ttcgcaggat cgcagtcgtc gatgccggca tcgcccagca cgctgtgcgg 120
ggagccggca tcnacaacct tggcactgct ccccttggtc accggcatgg ggtcatggcg 180
ctgcagccca gcggcctgtc agcatgctgc aggcatctgt gtattgtagt aggtacttcc 240
tgatgcatca acacacgttt ggaagctccc caagcccctt caacagtctc gacgtatgac 300
actcgcgccc tcttcctcgc cccgtggcct gatgagggta cgcaggtacc acagctgcgc 360
cccgtcccgc cagttgccct ggcccggccg ggcccaatct gttcattgcc gctccctggt 420
agccgtgaac tcacattacc gctctctgtg accttcagca cagcaggaat cgccatttca 480
ccggcggtcg ttgctgcgga gcctcagctg atctcgcctg cgagacccca cagtttgaat 540
ttgcggtccc cacacaacct ctgacgcc 568
<210> 159
<211> 1292
<212> DNA
<213> Chlorella protothecoides
<400> 159
atcaaaggca tagattcaca tttgttggca ttgcagagca atcatcgcgc aggacgaaca 60
tcgctcacca agcacgtact gggcatccgg aggcctccgc aaattcctgc aacaggactc 120
gctgatcagt tcgcccaagg tctacgacgc tccctatcgg cgctagactt caacacatat 180
ttcactgtca cagcctcggc atgcatcagg cctcagtctc caccatgaag accatccagt 240
ctcggcacgc cggtcccatc ggacatgtgc agtcgggtcg ccgatcggcg gggcgcgcgg 300
gatcccgcat ggcgaccccc gtggccgcag ctaccgtcgc agcccctcgc tcggccctca 360
acctctcccc caccatcatt cgacaggagg tgctccactc cgccagcgcc cagcaactag 420
actgcgtggc ctccctggcg cccgtcttcg agtcccagat cctccccctc ctgacgcccg 480
tggacgagat gtggcagccc accgacttcc tccccgcctc gaactcggag gcattcttcg 540
accagatcgg cgacctgcgg gcgcgatcgg cggccatccc cgacgacctg ctggtctgcc 600
tggtggggga catgatcacg gaggaggccc tgcccaccta catggccatg ctgaacaccc 660
tggacgtcgt gcgcgatgag acagggcaca gccagcaccc ctacgccaag tggaccaggg 720
cttggatcgc ggaggagaac cgccatggcg acctgctgaa caagtacatg tggctgacgg 780
ggcgggtggg acatgctggc ggtggagcgc accatccagc catgctggcg gtggagcgca 840
ccatccagcg cctcatctca tcgggcatgg acccgggcac ggagaaccac ccctaccacg 900
cctttgtgtt caccagcttc caggagcgcg ccaccaagct gagccacggc tccaccgccc 960
gcctggcggt cgccgccggg gacgaggccc tggccaagat ctgcgggacc attgcgcggg 1020
acgagtcgcg ccacgaggcg gcgtacacgc ggaccatgga tgccatcttc cagcgcgacc 1080
ccagcggggc catggtggcg tttgcgcaca tgatgatgcg caagatcacc atgcccgccc 1140
acctcatgga cgacggccag cacggcgcgc gcaacggggg ggcgcaactt gttcgacgac 1200
tttgcggcag tggcggagcg ggcaggggtg tacaccgccg gcgactacat cggcatcctg 1260
cgccacctca tccggcgctg ggacgtggag gg 1292
<210> 160
<211> 364
<212> PRT
<213> Chlorella protothecoides
<400> 160
Met His Gln Ala Ser Val Ser Thr Met Lys Thr Ile Gln Ser Arg His
1 5 10 15
Ala Gly Pro Ile Gly His Val Gln Ser Gly Arg Arg Ser Ala Gly Arg
20 25 30
Ala Gly Ser Arg Met Ala Thr Pro Val Ala Ala Ala Thr Val Ala Ala
35 40 45
Pro Arg Ser Ala Leu Asn Leu Ser Pro Thr Ile Ile Arg Gln Glu Val
50 55 60
Leu His Ser Ala Ser Ala Gln Gln Leu Asp Cys Val Ala Ser Leu Ala
65 70 75 80
Pro Val Phe Glu Ser Gln Ile Leu Pro Leu Leu Thr Pro Val Asp Glu
85 90 95
Met Trp Gln Pro Thr Asp Phe Leu Pro Ala Ser Asn Ser Glu Ala Phe
100 105 110
Phe Asp Gln Ile Gly Asp Leu Arg Ala Arg Ser Ala Ala Ile Pro Asp
115 120 125
Asp Leu Leu Val Cys Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu
130 135 140
Pro Thr Tyr Met Ala Met Leu Asn Thr Leu Asp Val Val Arg Asp Glu
145 150 155 160
Thr Gly His Ser Gln His Pro Tyr Ala Lys Trp Thr Arg Ala Trp Ile
165 170 175
Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Met Trp Leu
180 185 190
Thr Gly Arg Val Gly His Ala Gly Gly Gly Ala His His Pro Ala Met
195 200 205
Leu Ala Val Glu Arg Thr Ile Gln Arg Leu Ile Ser Ser Gly Met Asp
210 215 220
Pro Gly Thr Glu Asn His Pro Tyr His Ala Phe Val Phe Thr Ser Phe
225 230 235 240
Gln Glu Arg Ala Thr Lys Leu Ser His Gly Ser Thr Ala Arg Leu Ala
245 250 255
Val Ala Ala Gly Asp Glu Ala Leu Ala Lys Ile Cys Gly Thr Ile Ala
260 265 270
Arg Asp Glu Ser Arg His Glu Ala Ala Tyr Thr Arg Thr Met Asp Ala
275 280 285
Ile Phe Gln Arg Asp Pro Ser Gly Ala Met Val Ala Phe Ala His Met
290 295 300
Met Met Arg Lys Ile Thr Met Pro Ala His Leu Met Asp Asp Gly Gln
305 310 315 320
His Gly Ala Arg Asn Gly Gly Ala Gln Leu Val Arg Arg Leu Cys Gly
325 330 335
Ser Gly Gly Ala Gly Arg Gly Val His Arg Arg Arg Leu His Arg His
340 345 350
Pro Ala Pro Pro His Pro Ala Leu Gly Arg Gly Gly
355 360
<210> 161
<211> 1395
<212> DNA
<213> Chlorella protothecoides
<400> 161
attatacatc ggcatcgtct caggtttcac gatctgcatg ctatctatgg gactgtgact 60
ccgccggcca ggttgtggtg cgcgagaatc ctccccgctc ctgccttctc atttccctga 120
cgggagtcgc cgctgagcac cgggcggatc atgggcgtcg gcacactcca aaccccatat 180
acatgtggtc gtgcattcac gcatagcgca cggtatgtcc cgcgacgcgc ggctcgaagc 240
cgtggccatc cgacgcgctg cacggccgag gtgagggcac gcccctccgc caatggcgcg 300
cagcccatga ccgccttcga cttccggcag tacatgcagc agcgcgccgc gctggtggac 360
gcagcgctgg acctggcagt gccgctgcag taccccgaga agatcaacga ggccatgcgg 420
tacagcctgc tggccggggg caagcgcgtg cgccccgcgc tctgcctcgc tgcctgcgag 480
ctcgtgggcg gccccctgga ggcggccatg cccgccgcct gcgccatgga gatgatccac 540
accatgagcc tcatccacga cgacctcccc gccatggaca acgacgactt ccggcgcggc 600
cagcccgcca accacaaggc ctatggcgag gagattgcga tcctggcggg cgacgcgctg 660
ctgtcgctga gctttgagca catcgcgcgc gagacgcgag gcgtggaccc ggtgcgcgtc 720
ctggccgcca tctcggagtg gcgcgcggtg ggcagccgcg ggctggtggc ggggcaggtg 780
gtggacctgg gtttcgaggg cggcggcgtg gggctggccc cgctgcgcta catccacgag 840
cacaaaaccg cggcgctgct ggaggcggcg gtggtgtccg gcgcgctgct gggcggcgcg 900
gaggaggcgg acctggagcg cctgcgcacc tacaaccgcg ccatcggcct cgctttccag 960
gtggtggggg acatcctgga catcccgggg accagcgagg agctgggcaa gaccgcgggc 1020
aaggacctga gctcccccaa aaccccctac ccgtccctgg tggggctggc caggtccaaa 1080
aaaattgcgg acgaactgat tgaggacgcg aaaacccaac tcacccagta cgagccggcc 1140
cgagcggcgc ccctcgtaac cctggccgaa aacatttgaa accggaagaa ctgactgggg 1200
gccccccctg cccccagata cggcggggct cctccatcca gttttgggat gggaggagcg 1260
acaaccgacc ccgtaaccct gtgacgcgtt tgccttgcat acgtacgcat gccttgaaac 1320
ccatccatga ccctcaacaa tacctggttg tgtgtagctt ggtcctgaaa aaaaaaaaaa 1380
aaaaaaaaaa aaaaa 1395
<210> 162
<211> 342
<212> PRT
<213> Chlorella protothecoides
<400> 162
Met Gly Val Gly Thr Leu Gln Thr Pro Tyr Thr Cys Gly Arg Ala Phe
1 5 10 15
Thr His Ser Ala Arg Tyr Val Pro Arg Arg Ala Ala Arg Ser Arg Gly
20 25 30
His Pro Thr Arg Cys Thr Ala Glu Val Arg Ala Arg Pro Ser Ala Asn
35 40 45
Gly Ala Gln Pro Met Thr Ala Phe Asp Phe Arg Gln Tyr Met Gln Gln
50 55 60
Arg Ala Ala Leu Val Asp Ala Ala Leu Asp Leu Ala Val Pro Leu Gln
65 70 75 80
Tyr Pro Glu Lys Ile Asn Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly
85 90 95
Gly Lys Arg Val Arg Pro Ala Leu Cys Leu Ala Ala Cys Glu Leu Val
100 105 110
Gly Gly Pro Leu Glu Ala Ala Met Pro Ala Ala Cys Ala Met Glu Met
115 120 125
Ile His Thr Met Ser Leu Ile His Asp Asp Leu Pro Ala Met Asp Asn
130 135 140
Asp Asp Phe Arg Arg Gly Gln Pro Ala Asn His Lys Ala Tyr Gly Glu
145 150 155 160
Glu Ile Ala Ile Leu Ala Gly Asp Ala Leu Leu Ser Leu Ser Phe Glu
165 170 175
His Ile Ala Arg Glu Thr Arg Gly Val Asp Pro Val Arg Val Leu Ala
180 185 190
Ala Ile Ser Glu Trp Arg Ala Val Gly Ser Arg Gly Leu Val Ala Gly
195 200 205
Gln Val Val Asp Leu Gly Phe Glu Gly Gly Gly Val Gly Leu Ala Pro
210 215 220
Leu Arg Tyr Ile His Glu His Lys Thr Ala Ala Leu Leu Glu Ala Ala
225 230 235 240
Val Val Ser Gly Ala Leu Leu Gly Gly Ala Glu Glu Ala Asp Leu Glu
245 250 255
Arg Leu Arg Thr Tyr Asn Arg Ala Ile Gly Leu Ala Phe Gln Val Val
260 265 270
Gly Asp Ile Leu Asp Ile Pro Gly Thr Ser Glu Glu Leu Gly Lys Thr
275 280 285
Ala Gly Lys Asp Leu Ser Ser Pro Lys Thr Pro Tyr Pro Ser Leu Val
290 295 300
Gly Leu Ala Arg Ser Lys Lys Ile Ala Asp Glu Leu Ile Glu Asp Ala
305 310 315 320
Lys Thr Gln Leu Thr Gln Tyr Glu Pro Ala Arg Ala Ala Pro Leu Val
325 330 335
Thr Leu Ala Glu Asn Ile
340
<210> 163
<211> 833
<212> DNA
<213> Chlorella protothecoides
<400> 163
cagatgccat gcgccctcgg gccgcgggcc tgagggtcca cgcagcgtcc tcggtggccc 60
agacgcacca ggccgccccc ccggcggaca ggaggttcga cgactaccag ccccgcaccg 120
ccatcctctt ccccggccag ggcgcgcaga gcgtgggcat ggcgggagag ctggcgaagg 180
ccgtccccgc cgccgcggcg ctgttcgacg ccgcctccga ccagctcggc tatgacctgc 240
tccgcgtgtg cgttgagggc cccaaggcgc gcctggacag caccgccgtc agccagcccg 300
ccatctacgt ggccagcctg gcggcggtgg agaagctgcg cgcggagggc ggggaggagg 360
cactggccgc catcgacgtc gctgccggtc tgtccttggg cgagtacacc gcgctggcct 420
ttgccggcgc cttctccttc gccgacgggc tgcgcctggt ggccctgcgc ggcgccagca 480
tgcaggccgc cgccgacgcc gcaccctcgg gcatggtctc cgtcatcggt ctgccctccg 540
acgcggtggc cgcgctgtgc gaggccgcca acgcgcaggt ggcccccgac caggccgtgc 600
gcatcgccaa ctacctctgc gacggcaact acgccgtcag cggtgggctg gagggctgcg 660
cggcggtgga gggcctggcc aaggcccaca aggcgcgcat gacggtgcgc ctggcggtgg 720
cgggcgcctt ccacaccccc ttcatgcagc cggcggtgga ggcgctgagc gcgggcgctg 780
gcggacacgc cgctggtcgc gccgcgcatc cccgtggtca gcaacgggac gcc 833
<210> 164
<211> 275
<212> PRT
<213> Chlorella protothecoides
<400> 164
Met Arg Pro Arg Ala Ala Gly Leu Arg Val His Ala Ala Ser Ser Val
1 5 10 15
Ala Gln Thr His Gln Ala Ala Pro Pro Ala Asp Arg Arg Phe Asp Asp
20 25 30
Tyr Gln Pro Arg Thr Ala Ile Leu Phe Pro Gly Gln Gly Ala Gln Ser
35 40 45
Val Gly Met Ala Gly Glu Leu Ala Lys Ala Val Pro Ala Ala Ala Ala
50 55 60
Leu Phe Asp Ala Ala Ser Asp Gln Leu Gly Tyr Asp Leu Leu Arg Val
65 70 75 80
Cys Val Glu Gly Pro Lys Ala Arg Leu Asp Ser Thr Ala Val Ser Gln
85 90 95
Pro Ala Ile Tyr Val Ala Ser Leu Ala Ala Val Glu Lys Leu Arg Ala
100 105 110
Glu Gly Gly Glu Glu Ala Leu Ala Ala Ile Asp Val Ala Ala Gly Leu
115 120 125
Ser Leu Gly Glu Tyr Thr Ala Leu Ala Phe Ala Gly Ala Phe Ser Phe
130 135 140
Ala Asp Gly Leu Arg Leu Val Ala Leu Arg Gly Ala Ser Met Gln Ala
145 150 155 160
Ala Ala Asp Ala Ala Pro Ser Gly Met Val Ser Val Ile Gly Leu Pro
165 170 175
Ser Asp Ala Val Ala Ala Leu Cys Glu Ala Ala Asn Ala Gln Val Ala
180 185 190
Pro Asp Gln Ala Val Arg Ile Ala Asn Tyr Leu Cys Asp Gly Asn Tyr
195 200 205
Ala Val Ser Gly Gly Leu Glu Gly Cys Ala Ala Val Glu Gly Leu Ala
210 215 220
Lys Ala His Lys Ala Arg Met Thr Val Arg Leu Ala Val Ala Gly Ala
225 230 235 240
Phe His Thr Pro Phe Met Gln Pro Ala Val Glu Ala Leu Ser Ala Gly
245 250 255
Ala Gly Gly His Ala Ala Gly Arg Ala Ala His Pro Arg Gly Gln Gln
260 265 270
Arg Asp Ala
275
<210> 165
<211> 787
<212> DNA
<213> Chlorella protothecoides
<400> 165
tgtccatctc cccccaccct ccatccaacc atcgtcgacg gcatgcaggc gctgtgttct 60
caccccgcgt ccctcacggc gcgtgcggta ccccatgggc gggccagccc agcacagcgg 120
gtgtccagcg ccggcccggc ctacaccggc ctgtcccggc acaccctggg ctgccccagc 180
acccccaccc tccagtcccg cgccgcggtc cagacccgcg gctcctcctc cggctccacc 240
acgcgcatga ccaccaccgc ccagcgcaag atcaaggtgg ccatcaacgg gttcggccgc 300
atcggccgcc agttcctgcg ctgcgtggag gggcgcgagg actcgctgct ggagatcgtg 360
gccgtgaacg actccggcgg cgtgaagcag gccagccacc tgctcaagta cgactccacc 420
atgggcacct tcaacgccga catcaagatc tcgggcgagg gcaccttctc cgtcaacggc 480
cgcgacatcc gcgtcgtctc ctcccgcgac cccctggccc tgccctgggg cgagctgggc 540
gtggacctgg tgatcgaggg gacgggagtg tttgtggacc gcaagggtgc cagcaagcac 600
ctgcaggcgg gggccaagaa ggtcatcatc accgcgccgg ccaagggctc cgacgtgccc 660
acctacgtca tgggcgtgaa cgcggaccag tactccaact ccgacgacat catctccaac 720
gcctcctgca ccaccaactg cctggcgccc tttgtcaagg tgctcaacga ccgcttcggc 780
atcgtga 787
<210> 166
<211> 248
<212> PRT
<213> Chlorella protothecoides
<400> 166
Met Gln Ala Leu Cys Ser His Pro Ala Ser Leu Thr Ala Arg Ala Val
1 5 10 15
Pro His Gly Arg Ala Ser Pro Ala Gln Arg Val Ser Ser Ala Gly Pro
20 25 30
Ala Tyr Thr Gly Leu Ser Arg His Thr Leu Gly Cys Pro Ser Thr Pro
35 40 45
Thr Leu Gln Ser Arg Ala Ala Val Gln Thr Arg Gly Ser Ser Ser Gly
50 55 60
Ser Thr Thr Arg Met Thr Thr Thr Ala Gln Arg Lys Ile Lys Val Ala
65 70 75 80
Ile Asn Gly Phe Gly Arg Ile Gly Arg Gln Phe Leu Arg Cys Val Glu
85 90 95
Gly Arg Glu Asp Ser Leu Leu Glu Ile Val Ala Val Asn Asp Ser Gly
100 105 110
Gly Val Lys Gln Ala Ser His Leu Leu Lys Tyr Asp Ser Thr Met Gly
115 120 125
Thr Phe Asn Ala Asp Ile Lys Ile Ser Gly Glu Gly Thr Phe Ser Val
130 135 140
Asn Gly Arg Asp Ile Arg Val Val Ser Ser Arg Asp Pro Leu Ala Leu
145 150 155 160
Pro Trp Gly Glu Leu Gly Val Asp Leu Val Ile Glu Gly Thr Gly Val
165 170 175
Phe Val Asp Arg Lys Gly Ala Ser Lys His Leu Gln Ala Gly Ala Lys
180 185 190
Lys Val Ile Ile Thr Ala Pro Ala Lys Gly Ser Asp Val Pro Thr Tyr
195 200 205
Val Met Gly Val Asn Ala Asp Gln Tyr Ser Asn Ser Asp Asp Ile Ile
210 215 220
Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Phe Val Lys Val
225 230 235 240
Leu Asn Asp Arg Phe Gly Ile Val
245
<210> 167
<211> 860
<212> DNA
<213> Chlorella protothecoides
<400> 167
gatgttgaga atagtagctt gctgccttgt cgccatgcag agcgtgtgcg cgcagtcggt 60
ttcatgcaag ggggccttca cccagtccct gcggaccccc cgatgcagca ggagccagct 120
cgtctgccgg gctgatggca aggccggagc cttcatcaag accgtaaaga gcggtgctgc 180
cgctctggct gcctccctcc tcctgtctgg gggtgcgggc gcactgacct ttgatgagct 240
gcagggcctg acctacctgc aggtgaaggg ctctggcatc gccaacacct gccccaccct 300
gtctggcggc tcctccaaca tcaaggacct gaagagcggg acctactccg tcaacaagat 360
gtgcctggag cccacgtcct tcaaggtcaa ggaggaggca cagttcaaga acggcgaggc 420
cgactttgtg cccaccaagc tcgtcacgcg tctgacctac accctggacg agatctctgg 480
ccagatgaag atcgacggca gcggcggcgt ggagttcaag gaggaggatg gcatcgacta 540
tgctgcagtc accgtgcagc ttccgggcgg ggagcgcgtg cccttcctct tcaccatcaa 600
ggagcttgac gccaagggga ctgccgacgg cttcaagggc gagttcaccg tgccctccta 660
ccgtgggtcc tccttcctgg accccaaggg ccgcggcgcc tccaccggct acgacaacgc 720
cgtggccctg cccgccgccg gcgattccga ggagttggag aaggagaaca acaagtccac 780
caaggctctg aagggggagg ccatcttctc catcgccaag gtggacgccg ggacagggga 840
ggtggcgggc atctttgagt 860
<210> 168
<211> 275
<212> PRT
<213> Chlorella protothecoides
<400> 168
Met Gln Ser Val Cys Ala Gln Ser Val Ser Cys Lys Gly Ala Phe Thr
1 5 10 15
Gln Ser Leu Arg Thr Pro Arg Cys Ser Arg Ser Gln Leu Val Cys Arg
20 25 30
Ala Asp Gly Lys Ala Gly Ala Phe Ile Lys Thr Val Lys Ser Gly Ala
35 40 45
Ala Ala Leu Ala Ala Ser Leu Leu Leu Ser Gly Gly Ala Gly Ala Leu
50 55 60
Thr Phe Asp Glu Leu Gln Gly Leu Thr Tyr Leu Gln Val Lys Gly Ser
65 70 75 80
Gly Ile Ala Asn Thr Cys Pro Thr Leu Ser Gly Gly Ser Ser Asn Ile
85 90 95
Lys Asp Leu Lys Ser Gly Thr Tyr Ser Val Asn Lys Met Cys Leu Glu
100 105 110
Pro Thr Ser Phe Lys Val Lys Glu Glu Ala Gln Phe Lys Asn Gly Glu
115 120 125
Ala Asp Phe Val Pro Thr Lys Leu Val Thr Arg Leu Thr Tyr Thr Leu
130 135 140
Asp Glu Ile Ser Gly Gln Met Lys Ile Asp Gly Ser Gly Gly Val Glu
145 150 155 160
Phe Lys Glu Glu Asp Gly Ile Asp Tyr Ala Ala Val Thr Val Gln Leu
165 170 175
Pro Gly Gly Glu Arg Val Pro Phe Leu Phe Thr Ile Lys Glu Leu Asp
180 185 190
Ala Lys Gly Thr Ala Asp Gly Phe Lys Gly Glu Phe Thr Val Pro Ser
195 200 205
Tyr Arg Gly Ser Ser Phe Leu Asp Pro Lys Gly Arg Gly Ala Ser Thr
210 215 220
Gly Tyr Asp Asn Ala Val Ala Leu Pro Ala Ala Gly Asp Ser Glu Glu
225 230 235 240
Leu Glu Lys Glu Asn Asn Lys Ser Thr Lys Ala Leu Lys Gly Glu Ala
245 250 255
Ile Phe Ser Ile Ala Lys Val Asp Ala Gly Thr Gly Glu Val Ala Gly
260 265 270
Ile Phe Glu
275
<210> 169
<211> 818
<212> DNA
<213> Chlorella protothecoides
<400> 169
ataatcggaa cccagctgca cgcaccatca gtgcggcagc atgcagaccg tcgcagccag 60
ctatggcgta ttggcgccct ccggctccag cgtgacccgg ggctcgacca gcagcaagca 120
gcacttcacc accctcactc ccttttccgg cttcaggcgc ctgaatcatg tggatcgggc 180
ggggcaggcg gggtctggga gcccccagac cctgcagcag gccgtgggca aggccgtgcg 240
ccggtcgcgg ggccgcacca ccagcgccgt gcgcgtgacc cgcatgatgt ttgagcggtt 300
caccgagaag gccatcaagg tggtcatgct cgcgcaggag gaggctcgcc gtctgggcca 360
caacttcgtg gggacggagc aaatcctgct ggggttgatt ggggagtcca caggcatcgc 420
cgccaaggtc ctcaagtcga tgggcgtcac gctgaaagat gcgcgtgtgg aggtcgagaa 480
gatcatcggc cgggggagcg gctttgtggc cgtggagatc cccttcaccc cccgcgccaa 540
gcgtgtgctg gagctgtccc tggaggaggc tcgccagctc ggccacaact acattggcac 600
ggagcacatc ctgctgggcc tgctgcgcga gggtgagggc gtggcctccc gcgtgctgga 660
gaccctgggc gccgaccccc agaagatccg cactcaggtg gtacgcatgg tgggtgagtc 720
gcaggagccc gtgggcacca cggtgggcgg agggtccacc ggctccaaca agatgcccac 780
cctggaggag tacggcacca acctgaccgc ccaggccg 818
<210> 170
<211> 259
<212> PRT
<213> Chlorella protothecoides
<400> 170
Met Gln Thr Val Ala Ala Ser Tyr Gly Val Leu Ala Pro Ser Gly Ser
1 5 10 15
Ser Val Thr Arg Gly Ser Thr Ser Ser Lys Gln His Phe Thr Thr Leu
20 25 30
Thr Pro Phe Ser Gly Phe Arg Arg Leu Asn His Val Asp Arg Ala Gly
35 40 45
Gln Ala Gly Ser Gly Ser Pro Gln Thr Leu Gln Gln Ala Val Gly Lys
50 55 60
Ala Val Arg Arg Ser Arg Gly Arg Thr Thr Ser Ala Val Arg Val Thr
65 70 75 80
Arg Met Met Phe Glu Arg Phe Thr Glu Lys Ala Ile Lys Val Val Met
85 90 95
Leu Ala Gln Glu Glu Ala Arg Arg Leu Gly His Asn Phe Val Gly Thr
100 105 110
Glu Gln Ile Leu Leu Gly Leu Ile Gly Glu Ser Thr Gly Ile Ala Ala
115 120 125
Lys Val Leu Lys Ser Met Gly Val Thr Leu Lys Asp Ala Arg Val Glu
130 135 140
Val Glu Lys Ile Ile Gly Arg Gly Ser Gly Phe Val Ala Val Glu Ile
145 150 155 160
Pro Phe Thr Pro Arg Ala Lys Arg Val Leu Glu Leu Ser Leu Glu Glu
165 170 175
Ala Arg Gln Leu Gly His Asn Tyr Ile Gly Thr Glu His Ile Leu Leu
180 185 190
Gly Leu Leu Arg Glu Gly Glu Gly Val Ala Ser Arg Val Leu Glu Thr
195 200 205
Leu Gly Ala Asp Pro Gln Lys Ile Arg Thr Gln Val Val Arg Met Val
210 215 220
Gly Glu Ser Gln Glu Pro Val Gly Thr Thr Val Gly Gly Gly Ser Thr
225 230 235 240
Gly Ser Asn Lys Met Pro Thr Leu Glu Glu Tyr Gly Thr Asn Leu Thr
245 250 255
Ala Gln Ala
<210> 171
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 171
tccggtgtgt tgtaagtcca 20
<210> 172
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 172
ttgtcggaat gtcatatcaa 20
<210> 173
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 173
aacgcctttg tacaactgca 20
<210> 174
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 174
ctgacccgac ctatgggagc gctcttggc 29
<210> 175
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 175
cttgacttcc ctcacctgga atttgtcg 28
<210> 176
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 176
gtggccatat ggacttacaa 20
<210> 177
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 177
caagggctgg atgaatgacc ccaatggact gtggtacgac g 41
<210> 178
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic primer
<400> 178
cacccgtcgt catgttcacg gagcccagtg cg 32
<210> 179
<211> 3681
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 179
gccctttgtc atcgttggca tgctttttgc gtatgtacca tatgttgaat gtataatacg 60
aacggttgac cgtctgagat gcgagctttg ggtcttgtca aatgcgtggc cgcacggctc 120
cctcgcaccc agccccgagg cgtcgcgcac ctggcgagga gcagacccac gccaagaaag 180
tctagtccag catgtaacaa catcaggcaa tgtgacgttt tcggttcccg atttctctgc 240
cgctctttga cggcaggcac gggcgagcaa ccggcggcgc tcgcgtcagg cacgatggat 300
gcggcgctgc ccacctgtca atgtacccca ccagtctgtc gatcgctaca agcaaccttg 360
tgctccacat tcccacttgc agacagtcta gtcgattttg ccaagctgga tgtgaggatt 420
ggccatatct tggaggccaa gattcacccg gatgctgatg ggtacgtacg cgagccaggc 480
aggcagctgc gttgactttc tgattggcac aaagctttgg ctactctcaa taccaaccac 540
gtgccccttc tgcacacctg cttccttctg atgaccactc gccacgcatg tcgcagtctg 600
tacgtcgagc agatcgacct cggcgaggag gggggccctc gcaccatcgt gagtggcctg 660
gtccggcacg tgaccctgga ggaccttgtc ggccggcggg tggtggtgct ggccaacctc 720
aagcctcgga gcatgcgcgg ggtcaaatcg gctgggatgc tgctctgcgc cgccaacgcg 780
gatcacaccg cggtggagcc gctgcgggtc ccggacgccg ccgtgacggg ggagcgggtc 840
tgggcggggg acgaggcact cctgtccacg gagcctgcca cacccaatca ggtaaggaca 900
cgttattggt gcgcatggtg cgaatgcgtg gtctgacctg ctgtgggtat gtgttgtggg 960
attggaaacc gaatgagggc cgttcaggat tgagcccttg gccccaccct gctcatcctc 1020
tcacgcccgc aggtccagaa gaagaaaatc tgggaggcag tacagccgct gctgagagtg 1080
aacgcccagg ggatcgctac tgtggcagga gaggctatgg tgaccagtgc ggggccactg 1140
accgcgccca cgctggttga cgccgcgatt tcctgacgcg agcgactgat tcttgacctt 1200
tgagaagcca ccacagcacc attttcattg ttcatccttg atttcagtac gacttctcac 1260
catttcagta ctgtaggacc cccaaaatag tgtgatcacg ctcgcaaggc acctgtgtga 1320
tcacggggaa gggcgaattc ctttcttgcg ctatgacact tccagcaaaa ggtagggcgg 1380
gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac cccccgaagc 1440
tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt ttaaatagcc 1500
aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa acacctagat 1560
cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa gggggcgcct 1620
cttcctcttc gtttcagtca caacccgcaa acggcgcgcc atgctgctgc aggccttcct 1680
gttcctgctg gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga 1740
ccgccccctg gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg 1800
gtacgacgag aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt 1860
ctgggggacg cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga 1920
ccagcccatc gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt 1980
ggtggactac aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg 2040
cgtggccatc tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct 2100
ggacggcggc tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac 2160
ccagttccgc gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc 2220
ggccaagtcc caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa 2280
gctggagtcc gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct 2340
gatcgaggtc cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat 2400
caaccccggc gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg 2460
cacccacttc gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta 2520
cgccctgcag accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg 2580
ggcctccaac tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc 2640
cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat 2700
caacctgaag gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc 2760
caccaacacc acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg 2820
caccctggag ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt 2880
gttcgcggac ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat 2940
gggcttcgag gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt 3000
cgtgaaggag aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag 3060
cgagaacgac ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct 3120
gtacttcaac gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc 3180
cctgggctcc gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca 3240
ggtgcgcgag gtcaagtgat taattaactc gaggcagcag cagctcggat agtatcgaca 3300
cactctggac gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg 3360
aatatccctg ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt 3420
ttgcgagttg ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc 3480
gtttcatatc gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg 3540
ctgctcctgc tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc 3600
tcctggtact gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat 3660
gggaacacaa atggaaagct t 3681
<210> 180
<211> 3669
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 180
cccgtgatca cacaggtgcc ttgcgagcgt gatcacacta ttttgggggt cctacagtac 60
tgaaatggtg agaagtcgta ctgaaatcaa ggatgaacaa tgaaaatggt gctgtggtgg 120
cttctcaaag gtcaagaatc agtcgctcgc gtcaggaaat cgcggcgtca accagcgtgg 180
gcgcggtcag tggccccgca ctggtcacca tagcctctcc tgccacagta gcgatcccct 240
gggcgttcac tctcagcagc ggctgtactg cctcccagat tttcttcttc tggacctgcg 300
ggcgtgagag gatgagcagg gtggggccaa gggctcaatc ctgaacggcc ctcattcggt 360
ttccaatccc acaacacata cccacagcag gtcagaccac gcattcgcac catgcgcacc 420
aaataacgtg tccttacctg attgggtgtg gcaggctccg tggacaggag tgcctcgtcc 480
cccgcccaga cccgctcccc cgtcacggcg gcgtccggga cccgcagcgg ctccaccgcg 540
gtgtgatccg cgttggcggc gcagagcagc atcccagccg atttgacccc gcgcatgctc 600
cgaggcttga ggttggccag caccaccacc cgccggccga caaggtcctc cagggtcacg 660
tgccggacca ggccactcac gatggtgcga gggcccccct cctcgccgag gtcgatctgc 720
tcgacgtaca gactgcgaca tgcgtggcga gtggtcatca gaaggaagca ggtgtgcaga 780
aggggcacgt ggttggtatt gagagtagcc aaagctttgt gccaatcaga aagtcaacgc 840
agctgcctgc ctggctcgcg tacaattcct ttcttgcgct atgacacttc cagcaaaagg 900
tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat gcttcgaccc 960
cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg agcgctgttt 1020
aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc atattcaaac 1080
acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac tccgctaagg 1140
gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac ggcgcgccat gctgctgcag 1200
gccttcctgt tcctgctggc cggcttcgcc gccaagatca gcgcctccat gacgaacgag 1260
acgtccgacc gccccctggt gcacttcacc cccaacaagg gctggatgaa cgaccccaac 1320
ggcctgtggt acgacgagaa ggacgccaag tggcacctgt acttccagta caacccgaac 1380
gacaccgtct gggggacgcc cttgttctgg ggccacgcca cgtccgacga cctgaccaac 1440
tgggaggacc agcccatcgc catcgccccg aagcgcaacg actccggcgc cttctccggc 1500
tccatggtgg tggactacaa caacacctcc ggcttcttca acgacaccat cgacccgcgc 1560
cagcgctgcg tggccatctg gacctacaac accccggagt ccgaggagca gtacatctcc 1620
tacagcctgg acggcggcta caccttcacc gagtaccaga agaaccccgt gctggccgcc 1680
aactccaccc agttccgcga cccgaaggtc ttctggtacg agccctccca gaagtggatc 1740
atgaccgcgg ccaagtccca ggactacaag atcgagatct actcctccga cgacctgaag 1800
tcctggaagc tggagtccgc gttcgccaac gagggcttcc tcggctacca gtacgagtgc 1860
cccggcctga tcgaggtccc caccgagcag gaccccagca agtcctactg ggtgatgttc 1920
atctccatca accccggcgc cccggccggc ggctccttca accagtactt cgtcggcagc 1980
ttcaacggca cccacttcga ggccttcgac aaccagtccc gcgtggtgga cttcggcaag 2040
gactactacg ccctgcagac cttcttcaac accgacccga cctacgggag cgccctgggc 2100
atcgcgtggg cctccaactg ggagtactcc gccttcgtgc ccaccaaccc ctggcgctcc 2160
tccatgtccc tcgtgcgcaa gttctccctc aacaccgagt accaggccaa cccggagacg 2220
gagctgatca acctgaaggc cgagccgatc ctgaacatca gcaacgccgg cccctggagc 2280
cggttcgcca ccaacaccac gttgacgaag gccaacagct acaacgtcga cctgtccaac 2340
agcaccggca ccctggagtt cgagctggtg tacgccgtca acaccaccca gacgatctcc 2400
aagtccgtgt tcgcggacct ctccctctgg ttcaagggcc tggaggaccc cgaggagtac 2460
ctccgcatgg gcttcgaggt gtccgcgtcc tccttcttcc tggaccgcgg gaacagcaag 2520
gtgaagttcg tgaaggagaa cccctacttc accaaccgca tgagcgtgaa caaccagccc 2580
ttcaagagcg agaacgacct gtcctactac aaggtgtacg gcttgctgga ccagaacatc 2640
ctggagctgt acttcaacga cggcgacgtc gtgtccacca acacctactt catgaccacc 2700
gggaacgccc tgggctccgt gaacatgacg acgggggtgg acaacctgtt ctacatcgac 2760
aagttccagg tgcgcgaggt caagtgatta attaactcga ggcagcagca gctcggatag 2820
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 2880
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 2940
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 3000
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 3060
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 3120
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 3180
agtgggatgg gaacacaaat ggaaagcttg agctcggtac ccgtacccat cagcatccgg 3240
gtgaatcttg gcctccaaga tatggccaat cctcacatcc agcttggcaa aatcgactag 3300
actgtctgca agtgggaatg tggagcacaa ggttgcttgt agcgatcgac agactggtgg 3360
ggtacattga caggtgggca gcgccgcatc catcgtgcct gacgcgagcg ccgccggttg 3420
ctcgcccgtg cctgccgtca aagagcggca gagaaatcgg gaaccgaaaa cgtcacattg 3480
cctgatgttg ttacatgctg gactagactt tcttggcgtg ggtctgctcc tcgccaggtg 3540
cgcgacgcct cggggctggg tgcgagggag ccgtgcggcc acgcatttga caagacccaa 3600
agctcgcatc tcagacggtc aaccgttcgt attatacatt caacatatgg tacatacgca 3660
aaaagcatg 3669
<210> 181
<211> 3850
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 181
tttggccccg ctttccagct ccggatctgc tggcgtccgc cgcgagacgt gacatcgcac 60
gtcgccggga gcgccagctt gatcacttgg cagggggccg tgctctacaa ataccaggcc 120
ccgcggcggt cagttcgcac atccaatacc tgccgagcca tcttgcctac actttttatc 180
gactcctcta ctctgttcgc gagagcgctc ggtccaggct tggaattcgc cgaattcagc 240
tcgatcagtc gcttctgcaa ctgatctcgg ccgttcgcag actgcctttt ctcagcttgt 300
caggtagcga gttgttgttt tatatttatt cgatttcatc tgtgttgcat gtcttgttcg 360
tgctgtgcgt tctttctggg ccgcgctgtc gggtcgcatg ggctagctgt actcatgtta 420
gtcatgccgg tccgaccttg ttcgaggaag gccccacact gagcgtgccc tctttctaca 480
ccccttgtgc agaaattaga tagaaagcag aattcctttc ttgcgctatg acacttccag 540
caaaaggtag ggcgggctgc gagacggctt cccggcgctg catgcaacac cgatgatgct 600
tcgacccccc gaagctcctt cggggctgca tgggcgctcc gatgccgctc cagggcgagc 660
gctgtttaaa tagccaggcc cccgattgca aagacattat agcgagctac caaagccata 720
ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 780
gctaaggggg cgcctcttcc tcttcgtttc agtcacaacc cgcaaacggc gcgccatgct 840
gctgcaggcc ttcctgttcc tgctggccgg cttcgccgcc aagatcagcg cctccatgac 900
gaacgagacg tccgaccgcc ccctggtgca cttcaccccc aacaagggct ggatgaacga 960
ccccaacggc ctgtggtacg acgagaagga cgccaagtgg cacctgtact tccagtacaa 1020
cccgaacgac accgtctggg ggacgccctt gttctggggc cacgccacgt ccgacgacct 1080
gaccaactgg gaggaccagc ccatcgccat cgccccgaag cgcaacgact ccggcgcctt 1140
ctccggctcc atggtggtgg actacaacaa cacctccggc ttcttcaacg acaccatcga 1200
cccgcgccag cgctgcgtgg ccatctggac ctacaacacc ccggagtccg aggagcagta 1260
catctcctac agcctggacg gcggctacac cttcaccgag taccagaaga accccgtgct 1320
ggccgccaac tccacccagt tccgcgaccc gaaggtcttc tggtacgagc cctcccagaa 1380
gtggatcatg accgcggcca agtcccagga ctacaagatc gagatctact cctccgacga 1440
cctgaagtcc tggaagctgg agtccgcgtt cgccaacgag ggcttcctcg gctaccagta 1500
cgagtgcccc ggcctgatcg aggtccccac cgagcaggac cccagcaagt cctactgggt 1560
gatgttcatc tccatcaacc ccggcgcccc ggccggcggc tccttcaacc agtacttcgt 1620
cggcagcttc aacggcaccc acttcgaggc cttcgacaac cagtcccgcg tggtggactt 1680
cggcaaggac tactacgccc tgcagacctt cttcaacacc gacccgacct acgggagcgc 1740
cctgggcatc gcgtgggcct ccaactggga gtactccgcc ttcgtgccca ccaacccctg 1800
gcgctcctcc atgtccctcg tgcgcaagtt ctccctcaac accgagtacc aggccaaccc 1860
ggagacggag ctgatcaacc tgaaggccga gccgatcctg aacatcagca acgccggccc 1920
ctggagccgg ttcgccacca acaccacgtt gacgaaggcc aacagctaca acgtcgacct 1980
gtccaacagc accggcaccc tggagttcga gctggtgtac gccgtcaaca ccacccagac 2040
gatctccaag tccgtgttcg cggacctctc cctctggttc aagggcctgg aggaccccga 2100
ggagtacctc cgcatgggct tcgaggtgtc cgcgtcctcc ttcttcctgg accgcgggaa 2160
cagcaaggtg aagttcgtga aggagaaccc ctacttcacc aaccgcatga gcgtgaacaa 2220
ccagcccttc aagagcgaga acgacctgtc ctactacaag gtgtacggct tgctggacca 2280
gaacatcctg gagctgtact tcaacgacgg cgacgtcgtg tccaccaaca cctacttcat 2340
gaccaccggg aacgccctgg gctccgtgaa catgacgacg ggggtggaca acctgttcta 2400
catcgacaag ttccaggtgc gcgaggtcaa gtgattaatt aactcgaggc agcagcagct 2460
cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg 2520
ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct 2580
tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca 2640
gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc 2700
tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg 2760
gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac 2820
gggaagtagt gggatgggaa cacaaatgga ccgacacgcc cccggcccag gtccagttct 2880
cctgggtctt ccagaggccc gtcgccatgt aaagtggcag agattggcgc ctgattcgat 2940
ttggatccaa ggatctccaa tcggtgatgg ggactgagtg cccaactacc acccttgcac 3000
tatcgtcctc gcactattta ttcccacctt ctgctcgccc tgccgggcga ttgcgggcgt 3060
ttctgccctt gacgtatcaa tttcgcccct gctggcgcga ggattcttca ttctaataag 3120
aactcactcc cgccagctct gtacttttcc tgcggggccc ctgcatggct tgttcccaat 3180
gcttgctcga tcgacggcgc ccattgccca cggcgctgcc gcatccatgt gaagaaacac 3240
ggaagagtgc gaagactgga agtgaattaa gagtataaga agaggtacca agggattctc 3300
aggtgctctt aggaacggct tttccttcgc caagagaaac tgctactgct cgtgtcgcca 3360
cggtggtcaa gccgccccat ctgcgatcca ccaggcccat ccgcggactc gcgatcagcc 3420
tgctggatcc ggactgccga cctgaccgct cgcatccacc attacaaccc tccaattgga 3480
caccactccc acgtcctaaa gttcaccatg caagctgatc gatcgcattc gccgatgcac 3540
tcgcctgcca cagaggtgtg cgcttcggac tagcgtgcag gcgccccgag gccaccagca 3600
tgcaccgatg gaagcgggca cggccgctgc tccaggtcgc tggctcgctc agacccatag 3660
caacctccgc tgcgtcccta aatgtcacac agagcgtctt tgatgggtac ggatgggaga 3720
gaatctgatt gggcattgct ggtgcagtgc aggaagatgg caagtgcaca gtcagtcatg 3780
ctgtacaaac tggtgcctcg tagtattgac tcgtatagtg catagtatca tgcatggtcg 3840
ttacttgcaa 3850
<210> 182
<211> 3108
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 182
tttggccccg ctttccagct ccggatctgc tggcgtccgc cgcgagacgt gacatcgcac 60
gtcgccggga gcgccagctt gatcacttgg cagggggccg tgctctacaa ataccaggcc 120
ccgcggcggt cagttcgcac atccaatacc tgccgagcca tcttgcctac actttttatc 180
gactcctcta ctctgttcgc gagagcgctc ggtccaggct tggaattcgc cgaattcagc 240
tcgatcagtc gcttctgcaa ctgatctcgg ccgttcgcag actgcctttt ctcagcttgt 300
caggtagcga gttgttgttt tatatttatt cgatttcatc tgtgttgcat gtcttgttcg 360
tgctgtgcgt tctttctggg ccgcgctgtc gggtcgcatg ggctagctgt actcatgtta 420
gtcatgccgg tccgaccttg ttcgaggaag gccccacact gagcgtgccc tctttctaca 480
ccccttgtgc agaaattaga tagaaagcaa tgctgctgca ggccttcctg ttcctgctgg 540
ccggcttcgc cgccaagatc agcgcctcca tgacgaacga gacgtccgac cgccccctgg 600
tgcacttcac ccccaacaag ggctggatga acgaccccaa cggcctgtgg tacgacgaga 660
aggacgccaa gtggcacctg tacttccagt acaacccgaa cgacaccgtc tgggggacgc 720
ccttgttctg gggccacgcc acgtccgacg acctgaccaa ctgggaggac cagcccatcg 780
ccatcgcccc gaagcgcaac gactccggcg ccttctccgg ctccatggtg gtggactaca 840
acaacacctc cggcttcttc aacgacacca tcgacccgcg ccagcgctgc gtggccatct 900
ggacctacaa caccccggag tccgaggagc agtacatctc ctacagcctg gacggcggct 960
acaccttcac cgagtaccag aagaaccccg tgctggccgc caactccacc cagttccgcg 1020
acccgaaggt cttctggtac gagccctccc agaagtggat catgaccgcg gccaagtccc 1080
aggactacaa gatcgagatc tactcctccg acgacctgaa gtcctggaag ctggagtccg 1140
cgttcgccaa cgagggcttc ctcggctacc agtacgagtg ccccggcctg atcgaggtcc 1200
ccaccgagca ggaccccagc aagtcctact gggtgatgtt catctccatc aaccccggcg 1260
ccccggccgg cggctccttc aaccagtact tcgtcggcag cttcaacggc acccacttcg 1320
aggccttcga caaccagtcc cgcgtggtgg acttcggcaa ggactactac gccctgcaga 1380
ccttcttcaa caccgacccg acctacggga gcgccctggg catcgcgtgg gcctccaact 1440
gggagtactc cgccttcgtg cccaccaacc cctggcgctc ctccatgtcc ctcgtgcgca 1500
agttctccct caacaccgag taccaggcca acccggagac ggagctgatc aacctgaagg 1560
ccgagccgat cctgaacatc agcaacgccg gcccctggag ccggttcgcc accaacacca 1620
cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa cagcaccggc accctggagt 1680
tcgagctggt gtacgccgtc aacaccaccc agacgatctc caagtccgtg ttcgcggacc 1740
tctccctctg gttcaagggc ctggaggacc ccgaggagta cctccgcatg ggcttcgagg 1800
tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa ggtgaagttc gtgaaggaga 1860
acccctactt caccaaccgc atgagcgtga acaaccagcc cttcaagagc gagaacgacc 1920
tgtcctacta caaggtgtac ggcttgctgg accagaacat cctggagctg tacttcaacg 1980
acggcgacgt cgtgtccacc aacacctact tcatgaccac cgggaacgcc ctgggctccg 2040
tgaacatgac gacgggggtg gacaacctgt tctacatcga caagttccag gtgcgcgagg 2100
tcaagtgacc gacacgcccc cggcccaggt ccagttctcc tgggtcttcc agaggcccgt 2160
cgccatgtaa agtggcagag attggcgcct gattcgattt ggatccaagg atctccaatc 2220
ggtgatgggg actgagtgcc caactaccac ccttgcacta tcgtcctcgc actatttatt 2280
cccaccttct gctcgccctg ccgggcgatt gcgggcgttt ctgcccttga cgtatcaatt 2340
tcgcccctgc tggcgcgagg attcttcatt ctaataagaa ctcactcccg ccagctctgt 2400
acttttcctg cggggcccct gcatggcttg ttcccaatgc ttgctcgatc gacggcgccc 2460
attgcccacg gcgctgccgc atccatgtga agaaacacgg aagagtgcga agactggaag 2520
tgaattaaga gtataagaag aggtaccaag ggattctcag gtgctcttag gaacggcttt 2580
tccttcgcca agagaaactg ctactgctcg tgtcgccacg gtggtcaagc cgccccatct 2640
gcgatccacc aggcccatcc gcggactcgc gatcagcctg ctggatccgg actgccgacc 2700
tgaccgctcg catccaccat tacaaccctc caattggaca ccactcccac gtcctaaagt 2760
tcaccatgca agctgatcga tcgcattcgc cgatgcactc gcctgccaca gaggtgtgcg 2820
cttcggacta gcgtgcaggc gccccgaggc caccagcatg caccgatgga agcgggcacg 2880
gccgctgctc caggtcgctg gctcgctcag acccatagca acctccgctg cgtccctaaa 2940
tgtcacacag agcgtctttg atgggtacgg atgggagaga atctgattgg gcattgctgg 3000
tgcagtgcag gaagatggca agtgcacagt cagtcatgct gtacaaactg gtgcctcgta 3060
gtattgactc gtatagtgca tagtatcatg catggtcgtt acttgcaa 3108
<210> 183
<211> 398
<212> PRT
<213> Cuphea wrightii
<400> 183
Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Ser Val Pro Thr Pro
1 5 10 15
Gly Thr Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu
20 25 30
Ser Val Pro Phe Lys Pro Asp Asn Gly Gly Phe His Val Lys Ala Asn
35 40 45
Ala Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Asn Leu Lys Ser
50 55 60
Gly Ser Leu Glu Thr Pro Pro Arg Ser Phe Ile Asn Gln Leu Pro Asp
65 70 75 80
Leu Ser Met Leu Leu Ser Lys Ile Thr Thr Val Phe Gly Ala Ala Glu
85 90 95
Lys Gln Trp Lys Arg Pro Gly Met Leu Val Glu Pro Phe Gly Val Asp
100 105 110
Arg Ile Phe Gln Asp Gly Val Phe Phe Arg Gln Ser Phe Ser Ile Arg
115 120 125
Ser Tyr Glu Ile Gly Val Asp Arg Thr Ala Ser Ile Glu Thr Leu Met
130 135 140
Asn Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser Ile Gly Leu
145 150 155 160
Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys Arg Asp Leu
165 170 175
Ile Trp Val Val Thr Lys Ile Gln Val Glu Val Asn Arg Tyr Pro Thr
180 185 190
Trp Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu Ser Gly Lys
195 200 205
Asn Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Arg Thr Gly Glu
210 215 220
Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln Asn Thr
225 230 235 240
Arg Arg Leu Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu Ile Ala Pro
245 250 255
His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Asp Arg Lys Leu His
260 265 270
Lys Leu Asp Val Lys Thr Gly Asp Ser Ile Arg Asp Gly Leu Thr Pro
275 280 285
Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr
290 295 300
Ile Gly Trp Ile Leu Lys Ser Val Pro Ile Glu Val Phe Glu Thr Gln
305 310 315 320
Glu Leu Cys Gly Val Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp
325 330 335
Ser Val Leu Glu Ser Val Thr Thr Met Asp Pro Ala Lys Glu Gly Asp
340 345 350
Arg Cys Val Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Ala Asp Ile
355 360 365
Thr Ile Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn Gly
370 375 380
Ala Ile Ser Ser Gly Lys Thr Ser Asn Gly Asn Ser Val Ser
385 390 395
<210> 184
<211> 408
<212> PRT
<213> Cuphea wrightii
<400> 184
Met Val Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala
1 5 10 15
Pro Arg Pro Thr Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser
20 25 30
Leu Ser Gln Pro Phe Lys Pro Lys Ser Asn Pro Asn Gly Arg Phe Gln
35 40 45
Val Lys Ala Asn Val Ser Pro His Pro Lys Ala Asn Gly Ser Ala Val
50 55 60
Ser Leu Lys Ser Gly Ser Leu Asn Thr Leu Glu Asp Pro Pro Ser Ser
65 70 75 80
Pro Pro Pro Arg Thr Phe Leu Asn Gln Leu Pro Asp Trp Ser Arg Leu
85 90 95
Arg Thr Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Phe Thr
100 105 110
Arg Leu Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Trp Phe
115 120 125
Gly Ser Glu Thr Ile Val Gln Asp Gly Leu Val Phe Arg Glu Arg Phe
130 135 140
Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu
145 150 155 160
Thr Leu Met Asn His Leu Gln Asp Thr Ser Leu Asn His Cys Lys Ser
165 170 175
Val Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Thr
180 185 190
Arg Asp Leu Ile Trp Val Leu Thr Lys Met Gln Ile Val Val Asn Arg
195 200 205
Tyr Pro Thr Trp Gly Asp Thr Val Glu Ile Asn Ser Trp Phe Ser Gln
210 215 220
Ser Gly Lys Ile Gly Met Gly Arg Glu Trp Leu Ile Ser Asp Cys Asn
225 230 235 240
Thr Gly Glu Ile Leu Val Arg Ala Thr Ser Ala Trp Ala Met Met Asn
245 250 255
Gln Lys Thr Arg Arg Phe Ser Lys Leu Pro Cys Glu Val Arg Gln Glu
260 265 270
Ile Ala Pro His Phe Val Asp Ala Pro Pro Val Ile Glu Asp Asn Asp
275 280 285
Arg Lys Leu His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Cys Lys
290 295 300
Gly Leu Thr Pro Gly Trp Asn Asp Phe Asp Val Asn Gln His Val Ser
305 310 315 320
Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val
325 330 335
Leu Glu Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu
340 345 350
Cys Gly Arg Glu Ser Val Val Glu Ser Val Thr Ser Met Asn Pro Ser
355 360 365
Lys Val Gly Asp Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp
370 375 380
Gly Ala Asp Ile Met Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Ala
385 390 395 400
Gly Thr Asn Arg Ala Ile Ser Thr
405
<210> 185
<211> 540
<212> PRT
<213> Cuphea wrightii
<400> 185
Met Ala Ala Ala Ala Ser Met Val Ala Ser Pro Phe Cys Thr Trp Leu
1 5 10 15
Val Ala Ser Cys Met Ser Thr Ser Phe Asp Asn Asp Pro Arg Ser Pro
20 25 30
Ser Val Lys Arg Phe Pro Arg Arg Lys Arg Val Leu Ser Gln Arg Gly
35 40 45
Ser Thr Phe Gln Cys Leu Val Ala Ser Cys Ile Asp Pro Cys Asp Gln
50 55 60
Tyr Arg Ser Ser Ala Ser Leu Ser Phe Leu Gly Asp Asn Gly Phe Ala
65 70 75 80
Ser Leu Phe Gly Ser Lys Pro Phe Met Ser Asn Arg Gly His Arg Arg
85 90 95
Leu Arg Arg Ala Ser His Ser Gly Glu Ala Met Ala Val Ala Leu Gln
100 105 110
Pro Ala Gln Glu Ala Gly Thr Lys Lys Lys Pro Val Ile Lys Gln Arg
115 120 125
Arg Val Val Val Thr Gly Met Gly Val Val Thr Pro Leu Gly His Glu
130 135 140
Pro Asp Val Phe Tyr Asn Asn Leu Leu Asp Gly Val Ser Gly Ile Ser
145 150 155 160
Glu Ile Glu Thr Phe Asp Cys Thr Gln Phe Pro Thr Arg Ile Ala Gly
165 170 175
Glu Ile Lys Ser Phe Ser Thr Asp Gly Trp Val Ala Pro Lys Leu Ser
180 185 190
Lys Arg Met Asp Lys Phe Met Leu Tyr Leu Leu Thr Ala Gly Lys Lys
195 200 205
Ala Leu Ala Asp Gly Gly Ile Thr Asp Glu Val Met Lys Glu Leu Asp
210 215 220
Lys Arg Lys Cys Gly Val Leu Ile Gly Ser Gly Met Gly Gly Met Lys
225 230 235 240
Val Phe Asn Asp Ala Ile Glu Ala Leu Arg Val Ser Tyr Lys Lys Met
245 250 255
Asn Pro Phe Cys Val Pro Phe Ala Thr Thr Asn Met Gly Ser Ala Met
260 265 270
Leu Ala Met Asp Leu Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr
275 280 285
Ala Cys Ala Thr Ser Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile
290 295 300
Ile Arg Gly Glu Ala Asp Met Met Leu Cys Gly Gly Ser Asp Ala Val
305 310 315 320
Ile Ile Pro Ile Gly Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser
325 330 335
Gln Arg Asn Ser Asp Pro Thr Lys Ala Ser Arg Pro Trp Asp Ser Asn
340 345 350
Arg Asp Gly Phe Val Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu
355 360 365
Glu Leu Glu His Ala Lys Lys Arg Gly Ala Thr Ile Tyr Ala Glu Phe
370 375 380
Leu Gly Gly Ser Phe Thr Cys Asp Ala Tyr His Met Thr Glu Pro His
385 390 395 400
Pro Glu Gly Ala Gly Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln
405 410 415
Ala Gly Val Ser Lys Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr
420 425 430
Ser Thr Ser Ala Gly Asp Ile Lys Glu Tyr Gln Ala Leu Ala Arg Cys
435 440 445
Phe Gly Gln Asn Ser Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile
450 455 460
Gly His Leu Leu Gly Ala Ala Gly Gly Val Glu Ala Val Thr Val Val
465 470 475 480
Gln Ala Ile Arg Thr Gly Trp Ile His Pro Asn Leu Asn Leu Glu Asp
485 490 495
Pro Asp Lys Ala Val Asp Ala Lys Leu Leu Val Gly Pro Lys Lys Glu
500 505 510
Arg Leu Asn Val Lys Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly
515 520 525
His Asn Ser Ser Ile Leu Phe Ala Pro Cys Asn Val
530 535 540
<210> 186
<211> 534
<212> PRT
<213> Cuphea hookeriana
<400> 186
Met Ala Thr Ala Ser Cys Met Val Ala Ser Pro Phe Cys Thr Trp Leu
1 5 10 15
Val Ala Ala Cys Met Pro Thr Ser Ser Asp Asn Asp Pro Arg Ser Leu
20 25 30
Ser His Lys Arg Leu Arg Leu Ser Arg Arg Arg Arg Thr Leu Ser Ser
35 40 45
His Cys Ser Leu Arg Gly Ser Thr Phe Gln Cys Leu Asp Pro Cys Asn
50 55 60
Gln Gln Arg Phe Leu Gly Asp Asn Gly Phe Ala Ser Leu Phe Gly Ser
65 70 75 80
Lys Pro Leu Arg Ser Asn Arg Gly His Leu Arg Leu Gly Arg Thr Ser
85 90 95
His Ser Gly Glu Val Met Ala Val Ala Met Gln Pro Ala Gln Glu Val
100 105 110
Ser Thr Asn Lys Lys Pro Ala Thr Lys Gln Arg Arg Val Val Val Thr
115 120 125
Gly Met Gly Val Val Thr Pro Leu Gly His Asp Pro Asp Val Tyr Tyr
130 135 140
Asn Asn Leu Leu Asp Gly Ile Ser Gly Ile Ser Glu Ile Glu Asn Phe
145 150 155 160
Asp Cys Ser Gln Phe Pro Thr Arg Ile Ala Gly Glu Ile Lys Ser Phe
165 170 175
Ser Thr Asp Gly Trp Val Ala Pro Lys Phe Ser Glu Arg Met Asp Lys
180 185 190
Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys Ala Leu Ala Asp Gly
195 200 205
Gly Ile Thr Glu Asp Ala Met Lys Glu Leu Asn Lys Arg Lys Cys Gly
210 215 220
Val Leu Ile Gly Ser Gly Leu Gly Gly Met Lys Val Phe Ser Asp Ser
225 230 235 240
Ile Glu Ala Leu Arg Thr Ser Tyr Lys Lys Ile Ser Pro Phe Cys Val
245 250 255
Pro Phe Ser Thr Thr Asn Met Gly Ser Ala Ile Leu Ala Met Asp Leu
260 265 270
Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Ser
275 280 285
Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile Ile Lys Gly Glu Ala
290 295 300
Asp Met Met Leu Cys Gly Gly Ser Asp Ala Ala Val Leu Pro Val Gly
305 310 315 320
Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser Gln Arg Asn Asn Asp
325 330 335
Pro Thr Lys Ala Ser Arg Pro Trp Asp Ser Asn Arg Asp Gly Phe Val
340 345 350
Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu Glu Leu Glu His Ala
355 360 365
Lys Lys Arg Gly Ala Thr Ile Tyr Ala Glu Phe Leu Gly Gly Ser Phe
370 375 380
Thr Cys Asp Ala Tyr His Met Thr Glu Pro His Pro Glu Gly Ala Gly
385 390 395 400
Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln Ser Gly Val Ser Arg
405 410 415
Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr Ser Thr Pro Ala Gly
420 425 430
Asp Ile Lys Glu Tyr Gln Ala Leu Ala His Cys Phe Gly Gln Asn Ser
435 440 445
Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly
450 455 460
Gly Ala Gly Gly Val Glu Ala Val Ala Val Val Gln Ala Ile Arg Thr
465 470 475 480
Gly Trp Ile His Pro Asn Ile Asn Leu Glu Asp Pro Asp Glu Gly Val
485 490 495
Asp Ala Lys Leu Leu Val Gly Pro Lys Lys Glu Lys Leu Lys Val Lys
500 505 510
Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly His Asn Ser Ser Ile
515 520 525
Leu Phe Ala Pro Cys Asn
530
<210> 187
<211> 385
<212> PRT
<213> Carthamus tinctorius
<400> 187
Met Leu Ser Lys Gly Ala Pro Ala Ala Pro Ala Val Ala Ala Met Tyr
1 5 10 15
Asn Ala Ser Ala Lys Asp Thr Thr Phe Ala Leu Thr His Ser Arg Ser
20 25 30
Ile Gly Ser Val Ser Ile Arg Arg Arg Tyr Asn Val Phe Leu Cys Asn
35 40 45
Ser Ser Ser Ser Ser Arg Lys Val Ser Pro Leu Leu Ala Val Ala Thr
50 55 60
Gly Glu Gln Pro Ser Gly Val Ala Ser Leu Arg Glu Ala Asp Lys Glu
65 70 75 80
Lys Ser Leu Gly Asn Arg Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly
85 90 95
Leu Ser Tyr Lys Glu Lys Phe Val Ile Arg Cys Tyr Glu Val Gly Ile
100 105 110
Asn Lys Thr Ala Thr Ile Glu Thr Ile Ala Asn Leu Leu Gln Glu Val
115 120 125
Gly Gly Asn His Ala Gln Gly Val Gly Phe Ser Thr Asp Gly Phe Ala
130 135 140
Thr Thr Thr Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg
145 150 155 160
Met His Ile Glu Ile Tyr Arg Tyr Pro Ala Trp Ser Asp Val Ile Glu
165 170 175
Ile Glu Thr Trp Val Gln Gly Glu Gly Lys Val Gly Thr Arg Arg Asp
180 185 190
Trp Ile Leu Lys Asp Tyr Ala Asn Gly Glu Val Ile Gly Arg Ala Thr
195 200 205
Ser Lys Trp Val Met Met Asn Glu Asp Thr Arg Arg Leu Gln Lys Val
210 215 220
Ser Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg Thr Leu
225 230 235 240
Arg Leu Ala Phe Pro Glu Glu Asn Asn Asn Ser Met Lys Lys Ile Pro
245 250 255
Lys Leu Glu Asp Pro Ala Glu Tyr Ser Arg Leu Gly Leu Val Pro Arg
260 265 270
Arg Ser Asp Leu Asp Met Asn Lys His Val Asn Asn Val Thr Tyr Ile
275 280 285
Gly Trp Ala Leu Glu Ser Ile Pro Pro Glu Ile Ile Asp Thr His Glu
290 295 300
Leu Gln Ala Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Arg Asp Asp
305 310 315 320
Ile Val Asp Ser Leu Thr Ser Arg Glu Pro Leu Gly Asn Ala Ala Gly
325 330 335
Val Lys Phe Lys Glu Ile Asn Gly Ser Val Ser Pro Lys Lys Asp Glu
340 345 350
Gln Asp Leu Ser Arg Phe Met His Leu Leu Arg Ser Ala Gly Ser Gly
355 360 365
Leu Glu Ile Asn Arg Cys Arg Thr Glu Trp Arg Lys Lys Pro Ala Lys
370 375 380
Arg
385
<210> 188
<211> 584
<212> PRT
<213> Arabidopsis thaliana
<400> 188
Met Thr Lys Glu Val Cys Ser Asn Ile Gly Leu Trp Leu Leu Leu Thr
1 5 10 15
Leu Leu Ile Gly Asn Tyr Val Val Asn Leu Glu Ala Ser His His Val
20 25 30
Tyr Lys Arg Leu Thr Gln Ser Thr Asn Thr Lys Ser Pro Ser Val Asn
35 40 45
Gln Pro Tyr Arg Thr Gly Phe His Phe Gln Pro Pro Lys Asn Trp Met
50 55 60
Asn Asp Pro Asn Gly Pro Met Ile Tyr Lys Gly Ile Tyr His Leu Phe
65 70 75 80
Tyr Gln Trp Asn Pro Lys Gly Ala Val Trp Gly Asn Ile Val Trp Ala
85 90 95
His Ser Thr Ser Thr Asp Leu Ile Asn Trp Asp Pro His Pro Pro Ala
100 105 110
Ile Phe Pro Ser Ala Pro Phe Asp Ile Asn Gly Cys Trp Ser Gly Ser
115 120 125
Ala Thr Ile Leu Pro Asn Gly Lys Pro Val Ile Leu Tyr Thr Gly Ile
130 135 140
Asp Pro Lys Asn Gln Gln Val Gln Asn Ile Ala Glu Pro Lys Asn Leu
145 150 155 160
Ser Asp Pro Tyr Leu Arg Glu Trp Lys Lys Ser Pro Leu Asn Pro Leu
165 170 175
Met Ala Pro Asp Ala Val Asn Gly Ile Asn Ala Ser Ser Phe Arg Asp
180 185 190
Pro Thr Thr Ala Trp Leu Gly Gln Asp Lys Lys Trp Arg Val Ile Ile
195 200 205
Gly Ser Lys Ile His Arg Arg Gly Leu Ala Ile Thr Tyr Thr Ser Lys
210 215 220
Asp Phe Leu Lys Trp Glu Lys Ser Pro Glu Pro Leu His Tyr Asp Asp
225 230 235 240
Gly Ser Gly Met Trp Glu Cys Pro Asp Phe Phe Pro Val Thr Arg Phe
245 250 255
Gly Ser Asn Gly Val Glu Thr Ser Ser Phe Gly Glu Pro Asn Glu Ile
260 265 270
Leu Lys His Val Leu Lys Ile Ser Leu Asp Asp Thr Lys His Asp Tyr
275 280 285
Tyr Thr Ile Gly Thr Tyr Asp Arg Val Lys Asp Lys Phe Val Pro Asp
290 295 300
Asn Gly Phe Lys Met Asp Gly Thr Ala Pro Arg Tyr Asp Tyr Gly Lys
305 310 315 320
Tyr Tyr Ala Ser Lys Thr Phe Phe Asp Ser Ala Lys Asn Arg Arg Ile
325 330 335
Leu Trp Gly Trp Thr Asn Glu Ser Ser Ser Val Glu Asp Asp Val Glu
340 345 350
Lys Gly Trp Ser Gly Ile Gln Thr Ile Pro Arg Lys Ile Trp Leu Asp
355 360 365
Arg Ser Gly Lys Gln Leu Ile Gln Trp Pro Val Arg Glu Val Glu Arg
370 375 380
Leu Arg Thr Lys Gln Val Lys Asn Leu Arg Asn Lys Val Leu Lys Ser
385 390 395 400
Gly Ser Arg Leu Glu Val Tyr Gly Val Thr Ala Ala Gln Ala Asp Val
405 410 415
Glu Val Leu Phe Lys Val Arg Asp Leu Glu Lys Ala Asp Val Ile Glu
420 425 430
Pro Ser Trp Thr Asp Pro Gln Leu Ile Cys Ser Lys Met Asn Val Ser
435 440 445
Val Lys Ser Gly Leu Gly Pro Phe Gly Leu Met Val Leu Ala Ser Lys
450 455 460
Asn Leu Glu Glu Tyr Thr Ser Val Tyr Phe Arg Ile Phe Lys Ala Arg
465 470 475 480
Gln Asn Ser Asn Lys Tyr Val Val Leu Met Cys Ser Asp Gln Ser Arg
485 490 495
Ser Ser Leu Lys Glu Asp Asn Asp Lys Thr Thr Tyr Gly Ala Phe Val
500 505 510
Asp Ile Asn Pro His Gln Pro Leu Ser Leu Arg Ala Leu Ile Asp His
515 520 525
Ser Val Val Glu Ser Phe Gly Gly Lys Gly Arg Ala Cys Ile Thr Ser
530 535 540
Arg Val Tyr Pro Lys Leu Ala Ile Gly Lys Ser Ser His Leu Phe Ala
545 550 555 560
Phe Asn Tyr Gly Tyr Gln Ser Val Asp Val Leu Asn Leu Asn Ala Trp
565 570 575
Ser Met Asn Ser Ala Gln Ile Ser
580
<210> 189
<211> 1274
<212> DNA
<213> Cocosnucifer nucifera
<400> 189
actagtatgg tggcctccgt ggccgcctcc tcctccttct tccccgtgcc ctcctcctcc 60
tcctccgcct ccgccaaggc ctcccgcggc atccccgacg gcctggacgt gcgcggcatc 120
gtggccaagc ccgcctcctc ctccggctgg atgcaggcca aggcctccgc ccgcgccatc 180
cccaagatcg acgacaccaa ggtgggcctg cgcaccgacg tggaggagga cgccgcctcc 240
accgcccgcc gcacctccta cgggcgcgcc aaccagctgc ccgactggtc catgctgctg 300
gccgccatcc gcaccatctt ctccgccgcc gagaagcagt ggaccctgct ggactccaag 360
aagcgcggcg ccgacgccgt ggccgacgcc tccggcgtgg gcaagatggt gaagaacggc 420
ctggtgtacc gccagaactt ctccatccgc tcctacgaga tcggcgtgga caagcgcgcc 480
tccgtggagg ccctgatgaa ccacttccag gagacctccc tgaaccactg caagtgcatc 540
ggcctgatgc acggcggctt cggctgcacc cccgagatga cccgccgcaa cctgatctgg 600
gtggtggcca agatgctggt gcacgtggag cgctacccct ggtggggcga cgtggtgcag 660
atcaacacct ggatctcctc ctccggcaag aacggcatgg gccgcgactg gcacgtgcac 720
gactgccaga ccggcctgcc catcatgcgc ggcacctccg tgtgggtgat gatggacaag 780
cacacccgcc gcctgtccaa gctgcccgag gaggtgcgcg ccgagatcac ccccttcttc 840
tccgagcgcg acgccgtgct ggacgacaac ggccgcaagc tgcccaagtt cgacgacgac 900
tccgccgccc acgtgcgccg cggcctgacc ccccgctggc acgacttcga cgtgaaccag 960
cacgtgaaca acgtgaagta cgtgggctgg attctggagt ccgtgcccgt gtggatgctg 1020
gacggctacg aggtggccac catgtccctg gagtaccgcc gcgagtgccg catggactcc 1080
gtggtgcagt ccctgaccgc cgtgtcctcc gaccacgccg acggctcccc catcgtgtgc 1140
cagcacctgc tgcgcctgga ggacggcacc gagatcgtgc gcggccagac cgagtggcgc 1200
cccaagcagc aggcccgcga cctgggcaac atgggcctgc accccaccga gtccaagtga 1260
ttaattaact cgag 1274
<210> 190
<211> 640
<212> PRT
<213> Aspergillus awamorii
<400> 190
Met Ser Phe Arg Ser Leu Leu Ala Leu Ser Gly Leu Val Cys Thr Gly
1 5 10 15
Leu Ala Asn Val Ile Ser Lys Arg Ala Thr Leu Asp Ser Trp Leu Ser
20 25 30
Asn Glu Ala Thr Val Ala Arg Thr Ala Ile Leu Asn Asn Ile Gly Ala
35 40 45
Asp Gly Ala Trp Val Ser Gly Ala Asp Ser Gly Ile Val Val Ala Ser
50 55 60
Pro Ser Thr Asp Asn Pro Asp Tyr Phe Tyr Thr Trp Thr Arg Asp Ser
65 70 75 80
Gly Leu Val Leu Lys Thr Leu Val Asp Leu Phe Arg Asn Gly Asp Thr
85 90 95
Ser Leu Leu Ser Thr Ile Glu Asn Tyr Ile Ser Ala Gln Ala Ile Val
100 105 110
Gln Gly Ile Ser Asn Pro Ser Gly Asp Leu Ser Ser Gly Ala Gly Leu
115 120 125
Gly Glu Pro Lys Phe Asn Val Asp Glu Thr Ala Tyr Thr Gly Ser Trp
130 135 140
Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala Thr Ala Met Ile
145 150 155 160
Gly Phe Gly Gln Trp Leu Leu Asp Asn Gly Tyr Thr Ser Thr Ala Thr
165 170 175
Asp Ile Val Trp Pro Leu Val Arg Asn Asp Leu Ser Tyr Val Ala Gln
180 185 190
Tyr Trp Asn Gln Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly Ser
195 200 205
Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala Leu Val Glu Gly Ser
210 215 220
Ala Phe Ala Thr Ala Val Gly Ser Ser Cys Ser Trp Cys Asp Ser Gln
225 230 235 240
Ala Pro Glu Ile Leu Cys Tyr Leu Gln Ser Phe Trp Thr Gly Ser Phe
245 250 255
Ile Leu Ala Asn Phe Asp Ser Ser Arg Ser Gly Lys Asp Ala Asn Thr
260 265 270
Leu Leu Gly Ser Ile His Thr Phe Asp Pro Glu Ala Ala Cys Asp Asp
275 280 285
Ser Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala Asn His Lys Glu
290 295 300
Val Val Asp Ser Phe Arg Ser Ile Tyr Thr Leu Asn Asp Gly Leu Ser
305 310 315 320
Asp Ser Glu Ala Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr
325 330 335
Asn Gly Asn Pro Trp Phe Leu Cys Thr Leu Ala Ala Ala Glu Gln Leu
340 345 350
Tyr Asp Ala Leu Tyr Gln Trp Asp Lys Gln Gly Ser Leu Glu Val Thr
355 360 365
Asp Val Ser Leu Asp Phe Phe Lys Ala Leu Tyr Ser Asp Ala Ala Thr
370 375 380
Gly Thr Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Ser Ile Val Asp Ala
385 390 395 400
Val Lys Thr Phe Ala Asp Gly Phe Val Ser Ile Val Glu Thr His Ala
405 410 415
Ala Ser Asn Gly Ser Met Ser Glu Gln Tyr Asp Lys Ser Asp Gly Glu
420 425 430
Gln Leu Ser Ala Arg Asp Leu Thr Trp Ser Tyr Ala Ala Leu Leu Thr
435 440 445
Ala Asn Asn Arg Arg Asn Ser Val Val Pro Ala Ser Trp Gly Glu Thr
450 455 460
Ser Ala Ser Ser Val Pro Gly Thr Cys Ala Ala Thr Ser Ala Ile Gly
465 470 475 480
Thr Tyr Ser Ser Val Thr Val Thr Ser Trp Pro Ser Ile Val Ala Thr
485 490 495
Gly Gly Thr Thr Thr Thr Ala Thr Pro Thr Gly Ser Gly Ser Val Thr
500 505 510
Ser Thr Ser Lys Thr Thr Ala Thr Ala Ser Lys Thr Ser Thr Ser Thr
515 520 525
Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp
530 535 540
Leu Thr Ala Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser
545 550 555 560
Ile Ser Gln Leu Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser
565 570 575
Ala Asp Lys Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr
580 585 590
Leu Pro Ala Gly Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser
595 600 605
Asp Asp Ser Val Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val
610 615 620
Pro Gln Ala Cys Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg
625 630 635 640
<210> 191
<211> 604
<212> PRT
<213> Rhizopus oryzae
<400> 191
Met Gln Leu Phe Asn Leu Pro Leu Lys Val Ser Phe Phe Leu Val Leu
1 5 10 15
Ser Tyr Phe Ser Leu Leu Val Ser Ala Ala Ser Ile Pro Ser Ser Ala
20 25 30
Ser Val Gln Leu Asp Ser Tyr Asn Tyr Asp Gly Ser Thr Phe Ser Gly
35 40 45
Lys Ile Tyr Val Lys Asn Ile Ala Tyr Ser Lys Lys Val Thr Val Ile
50 55 60
Tyr Ala Asp Gly Ser Asp Asn Trp Asn Asn Asn Gly Asn Thr Ile Ala
65 70 75 80
Ala Ser Tyr Ser Ala Pro Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr
85 90 95
Phe Ser Ala Ser Ile Asn Gly Ile Lys Glu Phe Tyr Ile Lys Tyr Glu
100 105 110
Val Ser Gly Lys Thr Tyr Tyr Asp Asn Asn Asn Ser Ala Asn Tyr Gln
115 120 125
Val Ser Thr Ser Lys Pro Thr Thr Thr Thr Ala Thr Ala Thr Thr Thr
130 135 140
Thr Ala Pro Ser Thr Ser Thr Thr Thr Pro Pro Ser Arg Ser Glu Pro
145 150 155 160
Ala Thr Phe Pro Thr Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys Lys
165 170 175
Gln Glu Gly Ile Ser Arg Phe Ala Met Leu Arg Asn Ile Asn Pro Pro
180 185 190
Gly Ser Ala Thr Gly Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly Pro
195 200 205
Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp Ala Ala Leu Thr Ser Asn Val
210 215 220
Ile Val Tyr Glu Tyr Asn Thr Thr Leu Ser Gly Asn Lys Thr Ile Leu
225 230 235 240
Asn Val Leu Lys Asp Tyr Val Thr Phe Ser Val Lys Thr Gln Ser Thr
245 250 255
Ser Thr Val Cys Asn Cys Leu Gly Glu Pro Lys Phe Asn Pro Asp Ala
260 265 270
Ser Gly Tyr Thr Gly Ala Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala
275 280 285
Glu Arg Ala Thr Thr Phe Ile Leu Phe Ala Asp Ser Tyr Leu Thr Gln
290 295 300
Thr Lys Asp Ala Ser Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile Phe
305 310 315 320
Lys Asp Leu Asp Tyr Val Val Asn Val Trp Ser Asn Gly Cys Phe Asp
325 330 335
Leu Trp Glu Glu Val Asn Gly Val His Phe Tyr Thr Leu Met Val Met
340 345 350
Arg Lys Gly Leu Leu Leu Gly Ala Asp Phe Ala Lys Arg Asn Gly Asp
355 360 365
Ser Thr Arg Ala Ser Thr Tyr Ser Ser Thr Ala Ser Thr Ile Ala Asn
370 375 380
Lys Ile Ser Ser Phe Trp Val Ser Ser Asn Asn Trp Ile Gln Val Ser
385 390 395 400
Gln Ser Val Thr Gly Gly Val Ser Lys Lys Gly Leu Asp Val Ser Thr
405 410 415
Leu Leu Ala Ala Asn Leu Gly Ser Val Asp Asp Gly Phe Phe Thr Pro
420 425 430
Gly Ser Glu Lys Ile Leu Ala Thr Ala Val Ala Val Glu Asp Ser Phe
435 440 445
Ala Ser Leu Tyr Pro Ile Asn Lys Asn Leu Pro Ser Tyr Leu Gly Asn
450 455 460
Ser Ile Gly Arg Tyr Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn Ser
465 470 475 480
Gln Gly Asn Ser Trp Phe Leu Ala Val Thr Gly Tyr Ala Glu Leu Tyr
485 490 495
Tyr Arg Ala Ile Lys Glu Trp Ile Gly Asn Gly Gly Val Thr Val Ser
500 505 510
Ser Ile Ser Leu Pro Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr Ser
515 520 525
Gly Lys Lys Tyr Thr Val Gly Thr Ser Asp Phe Asn Asn Leu Ala Gln
530 535 540
Asn Ile Ala Leu Ala Ala Asp Arg Phe Leu Ser Thr Val Gln Leu His
545 550 555 560
Ala His Asn Asn Gly Ser Leu Ala Glu Glu Phe Asp Arg Thr Thr Gly
565 570 575
Leu Ser Thr Gly Ala Arg Asp Leu Thr Trp Ser His Ala Ser Leu Ile
580 585 590
Thr Ala Ser Tyr Ala Lys Ala Gly Ala Pro Ala Ala
595 600
<210> 192
<211> 637
<212> PRT
<213> Chlamydomonas reinhardtii
<400> 192
Met Gln Leu Phe Ala Arg Ser Pro Ala Gly Val Arg Val Gln Gln His
1 5 10 15
Ala Gln Arg Lys Ser Ala Lys Val Ala Gly Arg Gly Arg Leu Asn Val
20 25 30
Arg Ala Glu Ala Ile Ala Met Pro Pro Ala Pro Ala Glu Gln Glu Lys
35 40 45
Glu Leu Gln Arg Leu Glu Lys Gly Asn Ala Phe Glu Glu Leu Lys Ala
50 55 60
Met Ala Thr Ser Pro Arg Gln Ser Val Asn Arg Pro Gln Lys Ala Glu
65 70 75 80
Asp Leu Thr Phe Arg Gln Ala Pro Thr Ile Ala Asp Cys Phe Pro Asp
85 90 95
Ser Glu Lys Met Tyr Lys Glu Val Lys Tyr Asp Asp Glu Ile Thr Leu
100 105 110
Arg Val Pro Phe Arg Arg Ile His Leu Thr Thr Gly Thr Asp Phe Asp
115 120 125
Val Tyr Asp Thr Ser Gly Pro Gln Asn Val Asp Pro Arg Val Gly Leu
130 135 140
Pro Lys Leu Arg Lys Pro Trp Val Glu Arg Arg Glu Ala Asn Gly Thr
145 150 155 160
His Ala Arg Ala Gly Val Thr Gln Met Ala Leu Ala Arg Ala Gly Ile
165 170 175
Ile Ser Glu Glu Met Arg Phe Ala Ala Glu Arg Glu Gly Leu Asp Pro
180 185 190
Glu Phe Val Arg Ser Glu Leu Ala Arg Gly Arg Ala Ile Ile Pro Ala
195 200 205
Asn Lys Cys His Leu Glu Leu Glu Pro Cys Val Ile Gly Arg Asn Phe
210 215 220
Met Thr Lys Val Asn Ser Asn Phe Gly Asn Ser Ala Val Thr Ser Ser
225 230 235 240
Ile Glu Glu Glu Val Glu Lys Leu Gln Trp Ser Thr Ile Trp Gly Ala
245 250 255
Asp Thr Val Met Asp Leu Ser Thr Gly His Asn Ile Phe Glu Thr Arg
260 265 270
Glu Trp Val Met Arg Asn Ser Pro Val Pro Val Gly Thr Val Pro Ile
275 280 285
Tyr Glu Ala Leu Glu Arg Ala Asp Gly Gln Val Glu Gly Ile Thr Trp
290 295 300
Glu Leu Phe Arg Gln Val Leu Leu Asp Gln Ala Glu Gln Gly Val Asp
305 310 315 320
Tyr Trp Thr Ile His Ala Gly Val Leu Leu Arg His Val Pro Leu Thr
325 330 335
Ala Asn Arg Ile Thr Gly Ile Val Ser Arg Gly Gly Ser Ile His Ala
340 345 350
Lys Leu Cys Leu Met Glu His Lys Glu Asn Phe Ala Tyr Glu His Trp
355 360 365
Asp Glu Ile Leu Asp Ile Cys Ala Lys Tyr Asp Ile Thr Leu Ser Ile
370 375 380
Gly Asp Gly Leu Arg Pro Gly Cys Ile Ala Asp Ala Asn Asp Ala Ala
385 390 395 400
Gln Phe Ala Glu Leu Lys Thr Gln Gly Glu Leu Thr Arg Arg Ala Trp
405 410 415
Glu Lys Asn Val Gln Val Met Asn Glu Gly Pro Gly His Val Pro Leu
420 425 430
Asn Lys Ile Pro Glu Asn Met Ala Lys Gln Leu Glu Trp Cys Ser Glu
435 440 445
Ala Pro Phe Tyr Thr Leu Gly Pro Leu Thr Thr Asp Ile Ala Pro Gly
450 455 460
Tyr Asp His Ile Thr Ser Ala Ile Gly Ala Ala Thr Ile Gly Ala Leu
465 470 475 480
Gly Thr Ala Leu Leu Cys Tyr Val Thr Pro Lys Glu His Leu Gly Leu
485 490 495
Pro Asn Arg Asp Asp Val Lys Ala Gly Val Ile Ala Tyr Lys Ile Ala
500 505 510
Ala His Ala Ala Asp Leu Ala Lys Gly His Pro Ala Ala Ala Ser Trp
515 520 525
Asp Leu Glu Leu Ser Lys Ala Arg Phe Glu Phe Arg Trp Arg Asp Gln
530 535 540
Phe Ala Leu Ser Leu Asp Pro Val Thr Ala Gln Ala Tyr His Asp Ala
545 550 555 560
Thr Leu Pro Gln Glu Pro Ala Lys Thr Ala His Phe Cys Ser Met Cys
565 570 575
Gly Pro Lys Phe Cys Ser Met Asn Ile Thr Gln Glu Leu Arg Gln Met
580 585 590
Val Gln Ala Glu Gln Ala Gln Glu Ala Ala Ala Ala Ala Ala Ala Ala
595 600 605
Asp Asp Ala Asp Leu Leu Ala Ala Ala Ala Glu Gly Met Lys Glu Met
610 615 620
Ser Glu Lys Phe Lys Gln Ser Gly Ala Gln Leu Tyr His
625 630 635
<210> 193
<211> 631
<212> PRT
<213> Salmonella enterica
<400> 193
Met Ser Thr Thr Thr Leu Thr Arg Arg Glu Gln Arg Ala Lys Ala Gln
1 5 10 15
His Phe Ile Asp Thr Leu Glu Gly Thr Ala Phe Pro Asn Ser Lys Arg
20 25 30
Ile Tyr Val Thr Gly Ser Gln His Asp Ile Arg Val Pro Met Arg Glu
35 40 45
Ile Gln Leu Ser Pro Thr Leu Ile Gly Gly Ser Lys Asp Asn Pro Gln
50 55 60
Phe Glu Glu Asn Glu Ala Val Pro Val Tyr Asp Thr Ser Gly Pro Tyr
65 70 75 80
Gly Asp Pro Glu Val Ala Ile Asn Val Gln Gln Gly Leu Ala Lys Leu
85 90 95
Arg Gln Pro Trp Ile Asp Ala Arg Asn Asp Ser Glu Glu Leu Asp Asp
100 105 110
Arg Ser Ser Ala Tyr Thr Arg Glu Arg Leu Ala Asp Asp Gly Leu Asp
115 120 125
Asp Leu Arg Phe Thr Gly Leu Leu Thr Pro Lys Arg Ala Lys Ala Gly
130 135 140
Lys Arg Val Thr Gln Leu His Tyr Ala Arg Lys Gly Ile Val Thr Pro
145 150 155 160
Glu Met Glu Phe Ile Ala Ile Arg Glu Asn Met Gly Arg Glu Arg Ile
165 170 175
Arg Ser Glu Val Leu Arg His Gln His Pro Gly Met Asn Phe Gly Ala
180 185 190
Arg Leu Pro Glu Asn Ile Thr Pro Glu Phe Val Arg Asp Glu Val Ala
195 200 205
Ala Gly Arg Ala Ile Ile Pro Ala Asn Ile Asn His Pro Glu Ser Glu
210 215 220
Pro Met Ile Ile Gly Arg Asn Phe Leu Val Lys Val Asn Ala Asn Ile
225 230 235 240
Gly Asn Ser Ala Val Thr Ser Ser Ile Glu Glu Glu Val Glu Lys Leu
245 250 255
Val Trp Ser Thr Arg Trp Gly Ala Asp Thr Val Met Asp Leu Ser Thr
260 265 270
Gly Arg Tyr Ile His Glu Thr Arg Glu Trp Ile Leu Arg Asn Ser Pro
275 280 285
Val Pro Ile Gly Thr Val Pro Ile Tyr Gln Ala Leu Glu Lys Val Asn
290 295 300
Gly Ile Ala Glu Asp Leu Thr Trp Glu Ala Phe Arg Asp Thr Leu Leu
305 310 315 320
Glu Gln Ala Glu Gln Gly Val Asp Tyr Phe Thr Ile His Ala Gly Val
325 330 335
Leu Leu Arg Tyr Val Pro Met Thr Ala Lys Arg Leu Thr Gly Ile Val
340 345 350
Ser Arg Gly Gly Ser Ile Met Ala Lys Trp Cys Leu Ser His His Lys
355 360 365
Glu Asn Phe Leu Phe Glu His Phe Arg Glu Ile Cys Glu Ile Cys Ala
370 375 380
Ala Tyr Asp Val Ser Leu Ser Leu Gly Asp Gly Leu Arg Pro Gly Ser
385 390 395 400
Ile Gln Asp Ala Asn Asp Glu Ala Gln Phe Ser Glu Leu His Thr Leu
405 410 415
Gly Glu Leu Thr Lys Ile Ala Trp Glu Tyr Asp Val Gln Val Met Ile
420 425 430
Glu Gly Pro Gly His Val Pro Met His Met Ile Gln Arg Asn Met Thr
435 440 445
Glu Glu Leu Glu Ser Cys His Glu Ala Pro Phe Tyr Thr Leu Gly Pro
450 455 460
Leu Thr Thr Asp Ile Ala Pro Gly Tyr Asp His Phe Thr Ser Gly Ile
465 470 475 480
Gly Ala Ala Met Ile Gly Trp Phe Gly Cys Ala Met Leu Cys Tyr Val
485 490 495
Thr Pro Lys Glu His Leu Gly Leu Pro Asn Lys Glu Asp Val Lys Gln
500 505 510
Gly Leu Ile Thr Tyr Lys Ile Ala Ala His Ala Ala Asp Leu Ala Lys
515 520 525
Gly His Pro Gly Ala Gln Ile Arg Asp Asn Ala Met Ser Lys Ala Arg
530 535 540
Phe Glu Phe Arg Trp Glu Asp Gln Phe Asn Leu Ala Leu Asp Pro Phe
545 550 555 560
Thr Ala Arg Ala Tyr His Asp Glu Thr Leu Pro Gln Glu Ser Gly Lys
565 570 575
Val Ala His Phe Cys Ser Met Cys Gly Pro Lys Phe Cys Ser Met Lys
580 585 590
Ile Ser Gln Glu Val Arg Asp Tyr Ala Ala Ala Gln Thr Ile Glu Ile
595 600 605
Gly Met Ala Asp Met Ser Glu Asp Phe Arg Ala Lys Gly Gly Glu Ile
610 615 620
Tyr Leu Lys Arg Glu Glu Ala
625 630
<210> 194
<211> 264
<212> PRT
<213> Unknown
<220>
<223> source organism never identified, selectable marker
<400> 194
Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val
1 5 10 15
Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser
20 25 30
Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe
35 40 45
Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala
50 55 60
Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val
65 70 75 80
Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu
85 90 95
Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys
100 105 110
Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro
115 120 125
Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala
130 135 140
Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu
145 150 155 160
Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala
165 170 175
Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys
180 185 190
Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp
195 200 205
Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala
210 215 220
Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe
225 230 235 240
Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe
245 250 255
Tyr Arg Leu Leu Asp Glu Phe Phe
260
<210> 195
<211> 366
<212> PRT
<213> Brassica napus
<400> 195
Met Leu Lys Leu Ser Cys Asn Val Thr Asn Asn Leu His Thr Phe Ser
1 5 10 15
Phe Phe Ser Asp Ser Ser Leu Phe Ile Pro Val Asn Arg Arg Thr Ile
20 25 30
Ala Val Ser Ser Ser Gln Leu Arg Lys Pro Ala Leu Asp Pro Leu Arg
35 40 45
Ala Val Ile Ser Ala Asp Gln Gly Ser Ile Ser Pro Val Asn Ser Cys
50 55 60
Thr Pro Ala Asp Arg Leu Arg Ala Gly Arg Leu Met Glu Asp Gly Tyr
65 70 75 80
Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val Gly Ile Asn
85 90 95
Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln Glu Val Ala
100 105 110
Cys Asn His Val Gln Lys Cys Gly Phe Ser Thr Asp Gly Phe Ala Thr
115 120 125
Thr Leu Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg Met
130 135 140
His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val Val Glu Ile
145 150 155 160
Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg Arg Asp Trp
165 170 175
Ile Leu Arg Asp Ser Ala Thr Asn Glu Val Ile Gly Arg Ala Thr Ser
180 185 190
Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Arg Val Thr
195 200 205
Asp Glu Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Arg Glu Pro Arg
210 215 220
Leu Ala Phe Pro Glu Glu Asn Asn Ser Ser Leu Lys Lys Ile Pro Lys
225 230 235 240
Leu Glu Asp Pro Ala Gln Tyr Ser Met Leu Glu Leu Lys Pro Arg Arg
245 250 255
Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr Ile Gly
260 265 270
Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Ile Asp Thr His Glu Leu
275 280 285
Gln Val Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp Ile
290 295 300
Val Asp Ser Leu Thr Thr Ser Glu Ile Pro Asp Asp Pro Ile Ser Lys
305 310 315 320
Phe Thr Gly Thr Asn Gly Ser Ala Met Ser Ser Ile Gln Gly His Asn
325 330 335
Glu Ser Gln Phe Leu His Met Leu Arg Leu Ser Glu Asn Gly Gln Glu
340 345 350
Ile Asn Arg Gly Arg Thr Gln Trp Arg Lys Lys Ser Ser Arg
355 360 365
<210> 196
<211> 406
<212> PRT
<213> Garcinia mangostana
<400> 196
Met Val Ala Thr Ala Ala Thr Ser Ser Phe Phe Pro Leu Thr Ser Pro
1 5 10 15
Ser Gly Asp Ala Lys Ser Gly Asn Pro Gly Lys Gly Ser Val Ser Phe
20 25 30
Gly Ser Met Lys Ser Lys Ser Ala Ala Ser Ser Arg Gly Leu Gln Val
35 40 45
Lys Ala Asn Ala Gln Ala Pro Thr Lys Ile Asn Gly Ser Thr Asp Asp
50 55 60
Ala Gln Leu Pro Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp
65 70 75 80
Ser Met Leu Leu Ala Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys
85 90 95
Gln Trp Met Met Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu Ile
100 105 110
Asp Thr Phe Gly Leu Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg
115 120 125
Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala
130 135 140
Ser Ile Glu Thr Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His
145 150 155 160
Val Lys Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu
165 170 175
Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Met Gln Val Glu
180 185 190
Val Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln Val Asp Thr Trp
195 200 205
Val Ser Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Leu Arg
210 215 220
Asp Gly Asn Thr Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val
225 230 235 240
Met Met Asn Lys Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val
245 250 255
Arg Glu Glu Ile Gly Ser Tyr Phe Val Asn Ser Asp Pro Val Val Glu
260 265 270
Glu Asp Gly Arg Lys Val Thr Lys Leu Asp Asp Asn Thr Ala Asp Phe
275 280 285
Val Arg Lys Gly Leu Thr Pro Lys Trp Asn Asp Leu Asp Ile Asn Gln
290 295 300
His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro
305 310 315 320
Gln Pro Ile Leu Glu Thr Arg Glu Leu Ser Ala Val Thr Leu Glu Tyr
325 330 335
Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Arg Ser Leu Thr Ala Val
340 345 350
Ser Gly Gly Gly Val Gly Asp Leu Gly His Ala Gly Asn Val Glu Cys
355 360 365
Gln His Val Leu Arg Leu Glu Asp Gly Ala Glu Ile Val Arg Gly Arg
370 375 380
Thr Glu Trp Arg Pro Lys Tyr Ile Asn Asn Phe Ser Ile Met Gly Gln
385 390 395 400
Ile Pro Thr Asp Ala Ser
405
<210> 197
<211> 415
<212> PRT
<213> Cuphea hookeriana
<400> 197
Met Val Ala Ala Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ala Pro
1 5 10 15
Gly Ala Ser Pro Lys Pro Gly Lys Phe Gly Asn Trp Pro Ser Ser Leu
20 25 30
Ser Pro Ser Phe Lys Pro Lys Ser Ile Pro Asn Gly Gly Phe Gln Val
35 40 45
Lys Ala Asn Asp Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Ser
50 55 60
Leu Lys Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro
65 70 75 80
Pro Pro Arg Thr Phe Leu His Gln Leu Pro Asp Trp Ser Arg Leu Leu
85 90 95
Thr Ala Ile Thr Thr Val Phe Val Lys Ser Lys Arg Pro Asp Met His
100 105 110
Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Phe Gly Leu
115 120 125
Glu Ser Thr Val Gln Asp Gly Leu Val Phe Arg Gln Ser Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Thr Asp Arg Thr Ala Ser Ile Glu Thr Leu
145 150 155 160
Met Asn His Leu Gln Glu Thr Ser Leu Asn His Cys Lys Ser Thr Gly
165 170 175
Ile Leu Leu Asp Gly Phe Gly Arg Thr Leu Glu Met Cys Lys Arg Asp
180 185 190
Leu Ile Trp Val Val Ile Lys Met Gln Ile Lys Val Asn Arg Tyr Pro
195 200 205
Ala Trp Gly Asp Thr Val Glu Ile Asn Thr Arg Phe Ser Arg Leu Gly
210 215 220
Lys Ile Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
225 230 235 240
Glu Ile Leu Val Arg Ala Thr Ser Ala Tyr Ala Met Met Asn Gln Lys
245 250 255
Thr Arg Arg Leu Ser Lys Leu Pro Tyr Glu Val His Gln Glu Ile Val
260 265 270
Pro Leu Phe Val Asp Ser Pro Val Ile Glu Asp Ser Asp Leu Lys Val
275 280 285
His Lys Phe Lys Val Lys Thr Gly Asp Ser Ile Gln Lys Gly Leu Thr
290 295 300
Pro Gly Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn Val Lys
305 310 315 320
Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Thr Glu Val Leu Glu Thr
325 330 335
Gln Glu Leu Cys Ser Leu Ala Leu Glu Tyr Arg Arg Glu Cys Gly Arg
340 345 350
Asp Ser Val Leu Glu Ser Val Thr Ala Met Asp Pro Ser Lys Val Gly
355 360 365
Val Arg Ser Gln Tyr Gln His Leu Leu Arg Leu Glu Asp Gly Thr Ala
370 375 380
Ile Val Asn Gly Ala Thr Glu Trp Arg Pro Lys Asn Ala Gly Ala Asn
385 390 395 400
Gly Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Val Ser
405 410 415
<210> 198
<211> 371
<212> PRT
<213> Ricinus communis
<400> 198
Met Leu Lys Val Pro Cys Cys Asn Ala Thr Asp Pro Ile Gln Ser Leu
1 5 10 15
Ser Ser Gln Cys Arg Phe Leu Thr His Phe Asn Asn Arg Pro Tyr Phe
20 25 30
Thr Arg Arg Pro Ser Ile Pro Thr Phe Phe Ser Ser Lys Asn Ser Ser
35 40 45
Ala Ser Leu Gln Ala Val Val Ser Asp Ile Ser Ser Val Glu Ser Ala
50 55 60
Ala Cys Asp Ser Leu Ala Asn Arg Leu Arg Leu Gly Lys Leu Thr Glu
65 70 75 80
Asp Gly Phe Ser Tyr Lys Glu Lys Phe Ile Val Arg Ser Tyr Glu Val
85 90 95
Gly Ile Asn Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln
100 105 110
Glu Val Gly Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly
115 120 125
Phe Ala Thr Thr Thr Ser Met Arg Lys Met His Leu Ile Trp Val Thr
130 135 140
Ala Arg Met His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Ser Asp Val
145 150 155 160
Val Glu Val Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg
165 170 175
Arg Asp Trp Ile Leu Thr Asp Tyr Ala Thr Gly Gln Ile Ile Gly Arg
180 185 190
Ala Thr Ser Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln
195 200 205
Lys Val Thr Asp Asp Val Arg Glu Glu Tyr Leu Val Phe Cys Pro Arg
210 215 220
Glu Leu Arg Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Ser Lys Lys
225 230 235 240
Ile Ser Lys Leu Glu Asp Pro Ala Gln Tyr Ser Lys Leu Gly Leu Val
245 250 255
Pro Arg Arg Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr
260 265 270
Tyr Ile Gly Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Ile Asp Thr
275 280 285
His Glu Leu Gln Thr Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln His
290 295 300
Asp Asp Ile Val Asp Ser Leu Thr Ser Val Glu Pro Ser Glu Asn Leu
305 310 315 320
Glu Ala Val Ser Glu Leu Arg Gly Thr Asn Gly Ser Ala Thr Thr Thr
325 330 335
Ala Gly Asp Glu Asp Cys Arg Asn Phe Leu His Leu Leu Arg Leu Ser
340 345 350
Gly Asp Gly Leu Glu Ile Asn Arg Gly Arg Thr Glu Trp Arg Lys Lys
355 360 365
Ser Ala Arg
370
<210> 199
<211> 412
<212> PRT
<213> Ricinus communis
<400> 199
Phe Arg Gln Ile Thr Lys Asn Gln Lys Lys Lys Val Arg Lys Lys Thr
1 5 10 15
Met Ala Leu Lys Leu Asn Pro Phe Leu Ser Gln Thr Gln Lys Leu Pro
20 25 30
Ser Phe Ala Leu Pro Pro Met Ala Ser Thr Arg Ser Pro Lys Phe Tyr
35 40 45
Met Ala Ser Thr Leu Lys Ser Gly Ser Lys Glu Val Glu Asn Leu Lys
50 55 60
Lys Pro Phe Met Pro Pro Arg Glu Val His Val Gln Val Thr His Ser
65 70 75 80
Met Pro Pro Gln Lys Ile Glu Ile Phe Lys Ser Leu Asp Asn Trp Ala
85 90 95
Glu Glu Asn Ile Leu Val His Leu Lys Pro Val Glu Lys Cys Trp Gln
100 105 110
Pro Gln Asp Phe Leu Pro Asp Pro Ala Ser Asp Gly Phe Asp Glu Gln
115 120 125
Val Arg Glu Leu Arg Glu Arg Ala Lys Glu Ile Pro Asp Asp Tyr Phe
130 135 140
Val Val Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr
145 150 155 160
Gln Thr Met Leu Asn Thr Leu Asp Gly Val Arg Asp Glu Thr Gly Ala
165 170 175
Ser Pro Thr Ser Trp Ala Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu
180 185 190
Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg
195 200 205
Val Asp Met Arg Gln Ile Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser
210 215 220
Gly Met Asp Pro Arg Thr Glu Asn Ser Pro Tyr Leu Gly Phe Ile Tyr
225 230 235 240
Thr Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala
245 250 255
Arg Gln Ala Lys Glu His Gly Asp Ile Lys Leu Ala Gln Ile Cys Gly
260 265 270
Thr Ile Ala Ala Asp Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile
275 280 285
Val Glu Lys Leu Phe Glu Ile Asp Pro Asp Gly Thr Val Leu Ala Phe
290 295 300
Ala Asp Met Met Arg Lys Lys Ile Ser Met Pro Ala His Leu Met Tyr
305 310 315 320
Asp Gly Arg Asp Asp Asn Leu Phe Asp His Phe Ser Ala Val Ala Gln
325 330 335
Arg Leu Gly Val Tyr Thr Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe
340 345 350
Leu Val Gly Arg Trp Lys Val Asp Lys Leu Thr Gly Leu Ser Ala Glu
355 360 365
Gly Gln Lys Ala Gln Asp Tyr Val Cys Arg Leu Pro Pro Arg Ile Arg
370 375 380
Arg Leu Glu Glu Arg Ala Gln Gly Arg Ala Lys Glu Ala Pro Thr Met
385 390 395 400
Pro Phe Ser Trp Ile Phe Asp Arg Gln Val Lys Leu
405 410
<210> 200
<211> 390
<212> PRT
<213> Olea europaea
<400> 200
Met Ala Leu Lys Leu Cys Phe Pro Pro His Lys Met Pro Ser Phe Pro
1 5 10 15
Asp Ala Arg Ile Arg Ser His Arg Val Phe Met Ala Ser Thr Ile His
20 25 30
Ser Pro Ser Met Glu Val Gly Lys Val Lys Lys Pro Phe Thr Pro Pro
35 40 45
Arg Glu Val His Val Gln Val Thr His Ser Leu Ala Pro Glu Lys Arg
50 55 60
Glu Ile Phe Asn Ser Leu Asn Asn Trp Ala Gln Glu Asn Ile Leu Val
65 70 75 80
Leu Leu Lys Asp Val Asp Lys Cys Trp Gln Pro Ser Asp Phe Leu Pro
85 90 95
Asp Ser Ala Ser Glu Gly Phe Asp Glu Gln Val Met Glu Leu Arg Lys
100 105 110
Arg Cys Lys Glu Ile Pro Asp Asp Tyr Phe Ile Val Leu Val Gly Asp
115 120 125
Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr Met Leu Asn Thr
130 135 140
Leu Asp Gly Val Arg Asp Glu Thr Gly Ala Ser Leu Thr Pro Trp Ala
145 150 155 160
Ile Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg His Gly Asp Leu
165 170 175
Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp Met Lys Gln Ile
180 185 190
Glu Lys Thr Ile Gln Tyr Leu Ile Gly Ser Gly Met Asp Pro Arg Thr
195 200 205
Glu Asn Asn Pro Tyr Leu Gly Phe Ile Tyr Thr Ser Phe Gln Glu Arg
210 215 220
Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg Leu Ala Lys Glu His
225 230 235 240
Gly Asp Leu Lys Leu Ala Gln Ile Cys Gly Ile Ile Ala Ala Asp Glu
245 250 255
Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu Lys Leu Phe Glu
260 265 270
Ile Asp Pro Asp Gly Thr Val Leu Ala Leu Ala Asp Met Met Arg Lys
275 280 285
Lys Val Ser Met Pro Ala His Leu Met Tyr Asp Gly Gln Asp Asp Asn
290 295 300
Leu Phe Glu Asn Phe Ser Ser Val Ala Gln Arg Leu Gly Val Tyr Thr
305 310 315 320
Ala Lys Asp Tyr Ala Asp Ile Leu Glu Phe Leu Val Gly Arg Trp Asp
325 330 335
Ile Glu Lys Leu Thr Gly Leu Ser Gly Glu Gly Arg Lys Ala Gln Asp
340 345 350
Tyr Val Cys Thr Leu Pro Pro Arg Ile Arg Arg Leu Glu Glu Arg Ala
355 360 365
Gln Ser Arg Val Lys Lys Ala Ser Ala Thr Pro Phe Ser Trp Ile Phe
370 375 380
Gly Arg Glu Ile Asn Leu
385 390
<210> 201
<211> 415
<212> PRT
<213> Cuphea hookeriana
<400> 201
Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Leu Pro Ser Ala
1 5 10 15
Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Lys Pro Ser Ser Leu
20 25 30
Ser Pro Leu Lys Pro Lys Ser Thr Pro Asn Gly Gly Leu Gln Val Lys
35 40 45
Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Pro Val Gly Leu
50 55 60
Lys Ser Gly Gly Leu Lys Thr Gln Glu Asp Ala His Ser Ala Pro Pro
65 70 75 80
Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
85 90 95
Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
100 105 110
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
115 120 125
Gly Ser Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
145 150 155 160
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ile Ala Gly
165 170 175
Leu Ser Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Arg Asp
180 185 190
Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro
195 200 205
Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly
210 215 220
Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
225 230 235 240
Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys
245 250 255
Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg Asn Glu Ile Glu
260 265 270
Pro His Phe Val Asp Ser Pro Pro Val Ile Glu Asp Asp Asp Arg Lys
275 280 285
Leu Pro Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu
290 295 300
Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val
305 310 315 320
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Pro Glu Val Leu Glu
325 330 335
Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
340 345 350
Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Met Asp Pro Ser Gly Gly
355 360 365
Gly Tyr Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly
370 375 380
Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Asn Gly Val Ile
385 390 395 400
Asn Gly Val Val Pro Thr Gly Glu Ser Ser Pro Gly Asp Tyr Ser
405 410 415
<210> 202
<211> 414
<212> PRT
<213> Cuphea hookeriana
<400> 202
Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Val Ser Ser Pro
1 5 10 15
Val Thr Ser Ser Arg Pro Gly Lys Pro Gly Asn Gly Ser Ser Ser Phe
20 25 30
Ser Pro Ile Lys Pro Lys Phe Val Ala Asn Gly Gly Leu Gln Val Lys
35 40 45
Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Ser Val Gly Leu
50 55 60
Lys Ser Cys Ser Leu Lys Thr Gln Glu Asp Thr Pro Ser Ala Pro Ala
65 70 75 80
Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
85 90 95
Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
100 105 110
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
115 120 125
Gly Ser Ile Val Gln His Gly Leu Val Phe Arg Gln Asn Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
145 150 155 160
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Ala Gly
165 170 175
Leu Met Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Lys Asp
180 185 190
Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro
195 200 205
Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly
210 215 220
Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
225 230 235 240
Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys
245 250 255
Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg His Glu Ile Glu
260 265 270
Pro His Phe Val Asp Ser Pro Pro Val Ile Glu Asp Asp Asp Arg Lys
275 280 285
Leu Pro Lys Leu Asp Asp Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu
290 295 300
Thr Pro Lys Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val
305 310 315 320
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Gln Glu Val Leu Glu
325 330 335
Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
340 345 350
Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Ala Asp Pro Ser Gly Lys
355 360 365
Gly Phe Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly
370 375 380
Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Thr Ala Gly Ile
385 390 395 400
Asn Gly Ala Ile Pro Ser Gly Glu Thr Ser Pro Gly Asp Ser
405 410
<210> 203
<211> 383
<212> PRT
<213> Umbellularia californica
<400> 203
Met Val Thr Thr Ser Leu Ala Ser Ala Phe Phe Ser Met Lys Ala Val
1 5 10 15
Met Leu Ala Pro Asp Gly Ser Gly Ile Lys Pro Arg Ser Ser Gly Leu
20 25 30
Gln Val Arg Ala Gly Lys Glu Gln Asn Ser Cys Lys Met Ile Asn Gly
35 40 45
Thr Lys Val Lys Asp Thr Glu Gly Leu Lys Gly Arg Ser Thr Leu His
50 55 60
Gly Trp Ser Met Pro Leu Glu Leu Ile Thr Thr Ile Phe Ser Ala Ala
65 70 75 80
Glu Lys Gln Trp Thr Asn Leu Val Ser Lys Pro Pro Gln Leu Leu Asp
85 90 95
Asp His Leu Gly Leu His Gly Leu Val Phe Arg Arg Thr Phe Ala Ile
100 105 110
Arg Cys Ser Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Val Ala Val
115 120 125
Met Asn Tyr Leu Gln Glu Ala Ala Cys Asn His Ala Glu Ser Leu Gly
130 135 140
Leu Leu Gly Asp Gly Phe Gly Glu Thr Leu Glu Met Ser Arg Arg Asp
145 150 155 160
Leu Ile Trp Val Val Arg Arg Thr His Val Val Val Glu Arg Tyr Pro
165 170 175
Ala Trp Gly Asp Thr Val Glu Val Glu Ala Trp Ile Gly Ala Ala Gly
180 185 190
Asn Ile Gly Met Arg Arg His Phe Leu Val Arg Asp Cys Lys Thr Gly
195 200 205
His Ile Leu Ala Arg Cys Thr Ser Val Ser Val Met Met Asn Met Arg
210 215 220
Thr Arg Arg Leu Ser Lys Ile Pro Gln Glu Val Arg Gly Glu Ile Asp
225 230 235 240
Pro Leu Phe Ile Glu Lys Phe Ala Val Lys Glu Gly Glu Ile Lys Lys
245 250 255
Leu Gln Lys Phe Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly Trp
260 265 270
Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Ile
275 280 285
Lys Tyr Val Gly Trp Ile Phe Lys Ser Val Pro Asp Ser Ile Tyr Glu
290 295 300
Asn His His Leu Ser Ser Ile Thr Leu Glu Tyr Arg Arg Glu Cys Thr
305 310 315 320
Arg Gly Arg Ala Leu Gln Ser Leu Thr Thr Val Cys Gly Gly Ser Ser
325 330 335
Glu Ala Gly Ile Ile Cys Glu His Leu Leu Gln Leu Glu Asp Gly Ser
340 345 350
Glu Val Leu Arg Gly Arg Thr Asp Trp Arg Pro Lys Arg Thr Asp Ser
355 360 365
Phe Glu Gly Ile Ser Glu Arg Phe Pro Gln Gln Glu Pro His Asn
370 375 380
<210> 204
<211> 417
<212> PRT
<213> Elaeis guineensis
<400> 204
Met Val Ala Ser Ile Ala Ala Ser Ala Phe Phe Pro Thr Pro Ser Phe
1 5 10 15
Ser Pro Thr Ala Ser Ala Lys Ala Ser Lys Thr Ile Gly Glu Gly Ser
20 25 30
Glu Asn Leu Asp Ala Arg Gly Ile Ile Ala Lys Pro Thr Ser Ser Ser
35 40 45
Ala Ala Met Gln Gly Lys Val Met Ala Gln Ala Val Ser Lys Ile Asn
50 55 60
Gly Ala Lys Val Gly Leu Lys Ala Glu Ser Gln Lys Ala Glu Glu Asp
65 70 75 80
Ala Ala Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp
85 90 95
Trp Ser Val Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu
100 105 110
Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu
115 120 125
Thr Asp Ala Phe Ser Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe
130 135 140
Lys Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr
145 150 155 160
Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn
165 170 175
His Val Arg Ser Ala Gly Leu Met Gly Asp Gly Phe Gly Ala Thr Pro
180 185 190
Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Val Arg Val
195 200 205
Leu Ile Glu His Tyr Pro Ser Trp Gly Asp Val Val Glu Val Asp Thr
210 215 220
Trp Val Gly Pro Ala Gly Lys Asn Gly Met Arg Arg Asp Trp His Val
225 230 235 240
Arg Asp His Arg Thr Gly Gln Thr Ile Leu Arg Ala Thr Arg Val Trp
245 250 255
Val Met Met Asn Lys Asn Thr Arg Lys Leu Ser Lys Val Pro Glu Glu
260 265 270
Val Arg Ala Glu Ile Gly Pro Tyr Phe Val Glu Arg Ala Ala Ile Val
275 280 285
Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asp Glu Asp Thr Thr Asp
290 295 300
Tyr Val Lys Lys Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn
305 310 315 320
Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala
325 330 335
Pro Ile Ser Ile Leu Glu Asn His Glu Leu Ala Ser Met Thr Leu Glu
340 345 350
Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala
355 360 365
Val Ala Asn Asp Cys Thr Gly Gly Leu Pro Glu Ala Ser Ile Glu Cys
370 375 380
Gln His Leu Leu Gln Leu Glu Cys Gly Ala Glu Ile Val Arg Gly Arg
385 390 395 400
Thr Gln Trp Arg Pro Arg Arg Ala Ser Gly Pro Thr Ser Ala Gly Ser
405 410 415
Ala
<210> 205
<211> 417
<212> PRT
<213> Elaeis guineensis
<400> 205
Met Val Ala Ser Ile Val Ala Trp Ala Phe Phe Pro Thr Pro Ser Phe
1 5 10 15
Ser Pro Thr Ala Ser Ala Lys Ala Ser Lys Thr Ile Gly Glu Gly Ser
20 25 30
Glu Asn Leu Asn Val Arg Gly Ile Ile Ala Lys Pro Thr Ser Ser Ser
35 40 45
Ala Ala Lys Gln Gly Lys Val Met Ala Gln Ala Val Pro Lys Ile Asn
50 55 60
Gly Ala Lys Val Gly Leu Lys Ala Glu Ser Gln Lys Ala Glu Glu Asp
65 70 75 80
Ala Ala Pro Ser Ser Ala Pro Arg Thr Phe Tyr Asn Gln Leu Pro Asp
85 90 95
Trp Ser Val Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu
100 105 110
Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Arg Arg Pro Asp Met Leu
115 120 125
Thr Gly Ala Phe Ser Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe
130 135 140
Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr
145 150 155 160
Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn
165 170 175
His Val Arg Asn Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala Thr Pro
180 185 190
Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Thr Lys Met Gln Val
195 200 205
Leu Ile Glu His Tyr Pro Ser Trp Gly Asp Val Val Glu Val Asp Thr
210 215 220
Trp Val Gly Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp His Val
225 230 235 240
Arg Asp Tyr Arg Thr Gly Gln Thr Ile Leu Arg Ala Thr Ser Ile Trp
245 250 255
Val Met Met Asp Lys His Thr Arg Lys Leu Ser Lys Met Pro Glu Glu
260 265 270
Val Arg Ala Glu Ile Gly Pro Tyr Phe Met Glu His Ala Ala Ile Val
275 280 285
Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asp Asp Asp Thr Ala Asp
290 295 300
Tyr Ile Lys Trp Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn
305 310 315 320
Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala
325 330 335
Pro Ile Ser Ile Leu Glu Asn His Glu Leu Ala Ser Met Thr Leu Glu
340 345 350
Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala
355 360 365
Val Ala Asn Asp Cys Thr Gly Gly Leu Pro Glu Ala Ser Ile Glu Cys
370 375 380
Gln His Leu Leu Gln Leu Glu Cys Gly Ala Glu Ile Val Arg Gly Arg
385 390 395 400
Thr Gln Trp Arg Pro Arg Arg Ala Ser Gly Pro Thr Ser Ala Gly Ser
405 410 415
Ala
<210> 206
<211> 333
<212> PRT
<213> Elaeis guineensis
<400> 206
Phe Tyr Asn Gln Leu Pro Asp Trp Ser Val Leu Leu Ala Ala Val Thr
1 5 10 15
Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Thr Leu Leu Asp Trp Lys
20 25 30
Pro Arg Arg Pro Asp Met Leu Ala Asp Ala Phe Gly Leu Gly Lys Ile
35 40 45
Val Gln Asp Gly Leu Val Phe Lys Gln Asn Phe Ser Ile Arg Ser Tyr
50 55 60
Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His
65 70 75 80
Leu Gln Glu Thr Ala Leu Asn His Val Arg Ser Ala Gly Leu Met Gly
85 90 95
Asp Gly Phe Gly Ala Thr Pro Glu Met Ser Lys Arg Asn Leu Ile Trp
100 105 110
Val Val Thr Lys Met Arg Val Leu Ile Lys His Tyr Pro Ser Trp Gly
115 120 125
Asp Val Val Glu Val Asp Thr Trp Val Gly Pro Thr Gly Lys Asn Gly
130 135 140
Met Arg Arg Asp Trp His Val Arg Asp His Arg Thr Gly Gln Thr Ile
145 150 155 160
Leu Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Asn Thr Arg Lys
165 170 175
Leu Ser Lys Val Pro Glu Glu Val Arg Ala Glu Leu Gly Pro Tyr Phe
180 185 190
Val Glu Arg Ala Ala Ile Val Asp Glu Asp Ser Arg Lys Leu Pro Lys
195 200 205
Leu Asp Glu Asp Thr Thr Asp Tyr Ile Lys Lys Gly Leu Thr Pro Arg
210 215 220
Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile
225 230 235 240
Gly Trp Ile Leu Glu Ser Ala Pro Ile Ser Phe Leu Glu Asn His Glu
245 250 255
Leu Ala Ser Met Ser Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser
260 265 270
Val Leu Gln Ser Leu Thr Ala Val Ser Asn Asp Leu Thr Asp Gly Leu
275 280 285
Pro Glu Ala Gly Ile Glu Cys Gln His Leu Leu Gln Leu Glu Cys Gly
290 295 300
Thr Glu Leu Val Lys Gly Arg Thr Glu Trp Arg Pro Lys His Ser Leu
305 310 315 320
Ala Leu Arg Asn Met Gly Pro Thr Pro Gly Gly Ser Ala
325 330
<210> 207
<211> 421
<212> PRT
<213> Populus tomentosa
<400> 207
Met Val Ala Thr Ala Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Pro
1 5 10 15
Pro Gly Asp Ala Lys Ser Ser Lys Val Gly Ser Gly Ser Ala Ser Leu
20 25 30
Gly Gly Ile Lys Ser Lys Ser Ala Ser Ser Gly Ala Leu Gln Val Lys
35 40 45
Ala Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Ser Pro Val Gly Leu
50 55 60
Thr Ala Ser Val Glu Thr Ala Lys Lys Glu Asp Val Val Ser Ser Pro
65 70 75 80
Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu
85 90 95
Ala Ala Ile Thr Thr Met Phe Leu Ala Ala Glu Lys Gln Trp Met Met
100 105 110
Leu Asp Trp Lys Pro Lys Arg Ala Asp Met Leu Ile Asp Pro Phe Gly
115 120 125
Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Ser Gln Asn Phe Ser
130 135 140
Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr
145 150 155 160
Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala
165 170 175
Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Ser Lys Arg
180 185 190
Asn Leu Ile Trp Val Val Thr Arg Met Gln Ile Leu Val Asp Arg Tyr
195 200 205
Pro Thr Trp Gly Asp Val Val His Val Asp Thr Trp Val Ser Ala Ser
210 215 220
Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Ala Lys Thr
225 230 235 240
Gly Glu Thr Leu Thr Arg Ala Ser Ser Leu Trp Val Met Met Asn Lys
245 250 255
Val Thr Arg Arg Leu Ser Lys Ile Pro Glu Asp Val Arg Gly Glu Ile
260 265 270
Glu Pro Tyr Phe Leu Asn Ser Asp Pro Val Val Asn Glu Asp Ser Thr
275 280 285
Lys Leu Pro Lys Leu Asp Asp Lys Thr Ala Asp Tyr Ile Arg Lys Gly
290 295 300
Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn
305 310 315 320
Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Pro Pro Ile Leu
325 330 335
Glu Ser His Glu Leu Ala Ala Ile Thr Leu Glu Tyr Arg Arg Glu Cys
340 345 350
Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Ser Gly Ala Gly
355 360 365
Ile Gly Asn Leu Gly Gly Pro Gly Lys Val Glu Cys Gln His Leu Leu
370 375 380
Arg His Glu Asp Gly Ala Glu Ile Val Arg Gly Arg Thr Glu Trp Arg
385 390 395 400
Pro Lys His Ala Asn Asn Phe Gly Met Met Gly Gly Gln Met Pro Ala
405 410 415
Asp Glu Ser Gly Ala
420
<210> 208
<211> 412
<212> PRT
<213> Arabidopsis thaliana
<400> 208
Met Val Ala Thr Ser Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Ser
1 5 10 15
Ser Leu Asp Pro Asn Gly Lys Gly Asn Lys Ile Gly Ser Thr Asn Leu
20 25 30
Ala Gly Leu Asn Ser Ala Pro Asn Ser Gly Arg Met Lys Val Lys Pro
35 40 45
Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Lys Val Gly Leu Pro
50 55 60
Gly Ser Val Asp Ile Val Arg Thr Asp Thr Glu Thr Ser Ser His Pro
65 70 75 80
Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu
85 90 95
Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met
100 105 110
Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Val Asp Pro Phe Gly
115 120 125
Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser
130 135 140
Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr
145 150 155 160
Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala
165 170 175
Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Phe Lys Lys
180 185 190
Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Lys Tyr
195 200 205
Pro Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Gln Ser
210 215 220
Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Cys Asn Thr
225 230 235 240
Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys
245 250 255
Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile
260 265 270
Glu Pro Tyr Phe Val Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Arg
275 280 285
Lys Leu Thr Lys Ile Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly
290 295 300
Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn
305 310 315 320
Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Ile Met
325 330 335
Glu Arg Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys
340 345 350
Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Thr Gly Cys Asp
355 360 365
Ile Gly Asn Leu Ala Thr Ala Gly Asp Val Glu Cys Gln His Leu Leu
370 375 380
Arg Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser
385 390 395 400
Ser Lys Thr Pro Thr Thr Thr Trp Gly Thr Ala Pro
405 410
<210> 209
<211> 412
<212> PRT
<213> Arabidopsis thaliana
<400> 209
Met Val Ala Thr Ser Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Ser
1 5 10 15
Ser Leu Asp Pro Asn Gly Lys Gly Asn Lys Ile Gly Ser Thr Asn Leu
20 25 30
Ala Gly Leu Asn Ser Ala Pro Asn Ser Gly Arg Met Lys Val Lys Pro
35 40 45
Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Arg Val Gly Leu Pro
50 55 60
Gly Ser Val Asp Ile Val Arg Thr Asp Thr Glu Thr Ser Ser His Pro
65 70 75 80
Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu
85 90 95
Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met
100 105 110
Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Val Asp Pro Phe Gly
115 120 125
Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser
130 135 140
Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr
145 150 155 160
Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala
165 170 175
Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Phe Lys Lys
180 185 190
Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Lys Tyr
195 200 205
Pro Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Gln Ser
210 215 220
Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Cys Asn Thr
225 230 235 240
Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys
245 250 255
Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile
260 265 270
Glu Pro Tyr Phe Val Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Arg
275 280 285
Lys Leu Thr Lys Ile Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly
290 295 300
Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn
305 310 315 320
Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Ile Met
325 330 335
Glu Arg Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys
340 345 350
Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Thr Gly Cys Asp
355 360 365
Ile Gly Asn Leu Ala Thr Ala Gly Asp Val Glu Cys Gln His Leu Leu
370 375 380
Arg Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser
385 390 395 400
Ser Lys Thr Pro Thr Thr Thr Trp Gly Thr Ala Pro
405 410
<210> 210
<211> 412
<212> PRT
<213> Arabidopsis thaliana
<400> 210
Met Val Ala Thr Ser Ala Thr Ser Ser Phe Phe Pro Val Pro Ser Ser
1 5 10 15
Ser Leu Asp Pro Asn Gly Lys Gly Asn Lys Ile Gly Ser Thr Asn Leu
20 25 30
Ala Gly Leu Asn Ser Thr Pro Asn Ser Gly Arg Met Lys Val Lys Pro
35 40 45
Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Arg Val Gly Leu Pro
50 55 60
Gly Ser Val Asp Ile Val Arg Thr Asp Thr Glu Thr Ser Ser His Pro
65 70 75 80
Ala Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu
85 90 95
Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met
100 105 110
Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Val Asp Pro Phe Gly
115 120 125
Ile Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser
130 135 140
Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr
145 150 155 160
Val Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala
165 170 175
Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Phe Lys Lys
180 185 190
Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Lys Tyr
195 200 205
Pro Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Gln Ser
210 215 220
Gly Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Cys Asn Thr
225 230 235 240
Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys
245 250 255
Leu Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile
260 265 270
Glu Pro Tyr Phe Val Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Arg
275 280 285
Lys Leu Thr Lys Ile Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly
290 295 300
Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn
305 310 315 320
Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Ile Met
325 330 335
Glu Arg Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys
340 345 350
Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Thr Gly Cys Asp
355 360 365
Ile Gly Asn Leu Ala Thr Ala Gly Asp Val Glu Cys Gln His Leu Leu
370 375 380
Arg Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser
385 390 395 400
Ser Lys Thr Pro Thr Thr Thr Trp Gly Thr Ala Pro
405 410
<210> 211
<211> 413
<212> PRT
<213> Gossypium hirsutum
<400> 211
Met Val Ala Thr Ala Val Thr Ser Ala Phe Phe Pro Val Thr Ser Ser
1 5 10 15
Pro Asp Ser Ser Asp Ser Lys Asn Lys Lys Leu Gly Ser Ile Lys Ser
20 25 30
Lys Pro Ser Val Ser Ser Gly Ser Leu Gln Val Lys Ala Asn Ala Gln
35 40 45
Ala Pro Pro Lys Ile Asn Gly Thr Val Ala Ser Thr Thr Pro Val Glu
50 55 60
Gly Ser Lys Asn Asp Asp Gly Ala Ser Ser Pro Pro Pro Arg Thr Phe
65 70 75 80
Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr
85 90 95
Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro
100 105 110
Arg Arg Pro Asp Met Val Ile Asp Pro Phe Gly Ile Gly Lys Ile Val
115 120 125
Gln Asp Gly Leu Val Phe Ser Gln Asn Phe Ser Ile Arg Ser Tyr Glu
130 135 140
Ile Gly Ala Asp Gln Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu
145 150 155 160
Gln Glu Thr Ala Ile Asn His Cys Arg Ser Ala Gly Leu Leu Gly Glu
165 170 175
Gly Phe Gly Ala Thr Pro Glu Met Cys Lys Lys Asn Leu Ile Trp Val
180 185 190
Val Thr Arg Met Gln Val Val Val Asp Arg Tyr Pro Thr Trp Gly Asp
195 200 205
Val Val Gln Val Asp Thr Trp Val Ser Ala Ser Gly Lys Asn Gly Met
210 215 220
Arg Arg Asp Trp Leu Val Ser Asn Ser Glu Thr Gly Glu Ile Leu Thr
225 230 235 240
Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Leu Thr Arg Arg Leu
245 250 255
Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Glu Pro Phe Phe Met
260 265 270
Asn Ser Asp Pro Val Leu Ala Glu Asp Ser Gln Lys Leu Val Lys Leu
275 280 285
Asp Asp Ser Thr Ala Glu His Val Cys Lys Gly Leu Thr Pro Lys Trp
290 295 300
Ser Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly
305 310 315 320
Trp Ile Leu Glu Ser Ala Pro Leu Pro Ile Leu Glu Ser His Glu Leu
325 330 335
Ser Ala Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val
340 345 350
Leu Gln Ser Leu Thr Thr Val Ser Asp Ser Asn Thr Glu Asn Ala Val
355 360 365
Asn Val Gly Glu Phe Asn Cys Gln His Leu Leu Arg Leu Asp Asp Gly
370 375 380
Ala Glu Ile Val Arg Gly Arg Thr Arg Trp Arg Pro Lys His Ala Lys
385 390 395 400
Ser Ser Ala Asn Met Asp Gln Ile Thr Ala Lys Arg Ala
405 410
<210> 212
<211> 414
<212> PRT
<213> Cuphea lanceolata
<400> 212
Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Leu Pro Ser Pro
1 5 10 15
Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Gly Ser Ser Ser Leu
20 25 30
Ser Pro Leu Lys Pro Lys Phe Val Ala Asn Ala Gly Leu Lys Val Lys
35 40 45
Ala Ser Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Ser Val Gly Leu
50 55 60
Lys Ser Gly Ser Leu Lys Thr Gln Glu Asp Thr Pro Ser Val Pro Pro
65 70 75 80
Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
85 90 95
Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
100 105 110
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
115 120 125
Gly Ser Ile Val Gln Gly Gly Leu Val Phe Arg Gln Asn Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
145 150 155 160
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Ala Gly
165 170 175
Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Phe Lys Arg Asp
180 185 190
Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro
195 200 205
Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly
210 215 220
Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
225 230 235 240
Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys
245 250 255
Thr Arg Lys Leu Ser Lys Ile Pro Asp Glu Val Arg His Glu Ile Glu
260 265 270
Pro His Phe Ile Asp Cys Ala Pro Val Ile Glu Asp Asp Asp Arg Lys
275 280 285
Leu Arg Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu
290 295 300
Thr Pro Lys Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val
305 310 315 320
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Gln Glu Val Leu Glu
325 330 335
Thr Gln Glu Leu Ser Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
340 345 350
Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Val Asp Ser Ser Gly Lys
355 360 365
Gly Phe Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly
370 375 380
Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Thr Ala Gly Val
385 390 395 400
Asn Gly Ala Ile Ala Ser Gly Glu Thr Ser His Gly Asp Ser
405 410
<210> 213
<211> 414
<212> PRT
<213> Cuphea calophylla
<400> 213
Met Val Ala Thr Ala Ala Ser Ser Ala Phe Phe Pro Val Pro Ser Pro
1 5 10 15
Asp Thr Ser Ser Arg Pro Gly Lys Leu Gly Asn Gly Ser Ser Ser Leu
20 25 30
Ser Pro Leu Lys Pro Lys Leu Met Ala Asn Gly Gly Leu Gln Val Lys
35 40 45
Ala Asn Ala Ser Ala Pro Pro Lys Ile Asn Gly Ser Ser Val Gly Leu
50 55 60
Lys Ser Gly Ser Leu Lys Thr Gln Glu Asp Thr Pro Ser Ala Pro Pro
65 70 75 80
Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
85 90 95
Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
100 105 110
Asp Trp Lys Pro Lys Arg Pro Asp Met Leu Val Asp Pro Phe Gly Leu
115 120 125
Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Val
145 150 155 160
Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val Lys Ser Ala Gly
165 170 175
Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Tyr Lys Arg Asp
180 185 190
Leu Ile Trp Val Val Ala Lys Met Gln Val Met Val Asn Arg Tyr Pro
195 200 205
Thr Trp Gly Asp Thr Val Glu Val Asn Thr Trp Val Ala Lys Ser Gly
210 215 220
Lys Asn Gly Met Arg Arg Asp Trp Leu Ile Ser Asp Cys Asn Thr Gly
225 230 235 240
Glu Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Gln Lys
245 250 255
Thr Arg Arg Leu Ser Lys Ile Pro Asp Glu Val Arg His Glu Ile Glu
260 265 270
Pro His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Asp Asp Arg Lys
275 280 285
Leu Pro Lys Leu Asp Glu Lys Thr Ala Asp Ser Ile Arg Lys Gly Leu
290 295 300
Thr Pro Lys Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val
305 310 315 320
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Thr Pro Pro Glu Val Leu Glu
325 330 335
Thr Gln Glu Leu Cys Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly
340 345 350
Arg Glu Ser Val Leu Glu Ser Leu Thr Ala Val Asp Pro Ser Gly Lys
355 360 365
Gly Ser Gly Ser Gln Phe Gln His Leu Leu Arg Leu Glu Asp Gly Gly
370 375 380
Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Thr Ala Gly Ile
385 390 395 400
Asn Gly Pro Ile Ala Ser Gly Glu Thr Ser Pro Gly Asp Ser
405 410
<210> 214
<211> 410
<212> PRT
<213> Gossypium hirsutum
<400> 214
Thr Ala Val Thr Ser Ala Phe Phe Pro Val Thr Ser Ser Pro Asp Ser
1 5 10 15
Ser Asp Ser Lys Asn Lys Lys Leu Gly Ser Ile Lys Ser Lys Pro Ser
20 25 30
Val Ser Ser Gly Ser Leu Gln Val Lys Ala Asn Ala Gln Ala Pro Pro
35 40 45
Lys Ile Asn Gly Thr Val Ala Ser Thr Thr Pro Val Glu Gly Ser Lys
50 55 60
Asn Asp Asp Gly Ala Ser Ser Pro Pro Pro Arg Thr Phe Ile Asn Gln
65 70 75 80
Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu
85 90 95
Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro Arg Arg Pro
100 105 110
Asp Met Val Ile Asp Pro Phe Gly Ile Gly Lys Ile Val Gln Asp Gly
115 120 125
Leu Val Phe Ser Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala
130 135 140
Asp Gln Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr
145 150 155 160
Ala Ile Asn His Cys Arg Ser Ala Gly Leu Leu Gly Glu Gly Phe Gly
165 170 175
Ala Thr Pro Glu Met Cys Lys Lys Asn Leu Ile Trp Val Val Thr Arg
180 185 190
Met Gln Val Val Val Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln
195 200 205
Val Asp Thr Trp Val Ser Ala Ser Gly Lys Asn Gly Met Arg Arg Asp
210 215 220
Trp Leu Val Ser Asn Ser Glu Thr Gly Glu Ile Leu Thr Arg Ala Thr
225 230 235 240
Ser Val Trp Val Met Met Asn Lys Leu Thr Arg Arg Leu Ser Lys Ile
245 250 255
Pro Glu Glu Val Arg Gly Glu Ile Glu Pro Phe Phe Met Asn Ser Asp
260 265 270
Pro Val Leu Ala Glu Asp Ser Gln Lys Leu Val Lys Leu Asp Asp Ser
275 280 285
Thr Ala Glu His Val Cys Lys Gly Leu Thr Pro Lys Trp Ser Asp Leu
290 295 300
Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu
305 310 315 320
Glu Ser Ala Pro Leu Pro Ile Leu Glu Ser His Glu Leu Ser Ala Leu
325 330 335
Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser
340 345 350
Leu Thr Thr Val Ser Asp Ser Asn Thr Glu Asn Ala Val Asn Val Gly
355 360 365
Glu Phe Asn Cys Gln His Leu Leu Arg Leu Asp Asp Gly Ala Glu Ile
370 375 380
Val Arg Gly Arg Thr Arg Trp Arg Pro Lys His Ala Lys Ser Ser Ala
385 390 395 400
Asn Met Asp Gln Ile Thr Ala Lys Arg Ala
405 410
<210> 215
<211> 400
<212> PRT
<213> Vitis vinifera
<220>
<221> misc_feature
<222> (30)..(30)
<223> Xaa can be any naturally occurring amino acid
<400> 215
Met Val Ala Thr Ala Ala Thr Ser Ala Phe Phe Ala Val Ala Ser Pro
1 5 10 15
Ser Ser Asp Pro Asp Ala Lys Pro Ser Thr Lys Pro Gly Xaa Gly Ser
20 25 30
Ala Ile Leu Arg Gly Ile Lys Ser Arg Asn Ala Pro Ser Gly Ser Leu
35 40 45
Gln Val Lys Ala Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Thr Thr
50 55 60
Val Gly Tyr Thr Ser Ser Ala Glu Gly Val Lys Ile Glu Asp Asp Met
65 70 75 80
Ser Ser Pro Pro Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser
85 90 95
Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala Ala Glu Lys Gln
100 105 110
Trp Met Met Leu Asp Trp Lys Pro Arg Arg Ser Asp Met Leu Ile Asp
115 120 125
Pro Phe Gly Leu Gly Lys Ile Val Gln Asp Gly Leu Val Phe Arg Gln
130 135 140
Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser
145 150 155 160
Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn His Val
165 170 175
Arg Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met
180 185 190
Ser Ile Arg Asn Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val
195 200 205
Asp Arg Tyr Pro Thr Trp Gly Asp Val Val Gln Val Asp Thr Trp Val
210 215 220
Cys Ala Ser Gly Lys Asn Gly Met Arg Arg Asp Trp Ile Ile Arg Asp
225 230 235 240
Cys Lys Thr Gly Glu Thr Leu Thr Arg Ala Ser Ser Val Trp Val Met
245 250 255
Met Asn Lys Gln Thr Arg Arg Leu Ser Lys Ile Pro Asp Ala Val Arg
260 265 270
Ala Glu Ile Glu Pro Tyr Phe Met Asp Ser Ala Pro Ile Val Asp Glu
275 280 285
Asp Gly Arg Lys Leu Pro Lys Leu Asp Asp Ser Thr Ala Asp Tyr Ile
290 295 300
Arg Thr Gly Leu Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His
305 310 315 320
Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Leu
325 330 335
Pro Ile Leu Glu Ser His Glu Leu Ser Ser Met Thr Leu Glu Tyr Arg
340 345 350
Arg Glu Cys Gly Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Ser
355 360 365
Gly Thr Gly Val Gly Asn Leu Leu Asp Cys Gly Asn Val Glu Cys Gln
370 375 380
His Leu Leu Arg Leu Glu Glu Gly Ala Glu Ile Val Glu Gly Lys Asp
385 390 395 400
<210> 216
<211> 411
<212> PRT
<213> Brassica juncea
<220>
<221> misc_feature
<222> (22)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (171)..(171)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (192)..(192)
<223> Xaa can be any naturally occurring amino acid
<400> 216
Met Val Ala Thr Ser Ala Thr Ser Leu Phe Phe Pro Leu Pro Ser Ser
1 5 10 15
Ser Leu Asp Pro Asn Xaa Lys Thr Asn Asn Arg Val Thr Ser Thr Asn
20 25 30
Phe Ala Gly Leu Gly Pro Thr Pro Asn Ser Gly Gly Arg Met Lys Val
35 40 45
Lys Pro Asn Ala Gln Ala Pro Pro Lys Ile Asn Gly Lys Lys Val Gly
50 55 60
Leu Pro Gly Ser Val Glu Ile Glu Thr Ser Gln Gln Gln Gln Pro Ala
65 70 75 80
Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala
85 90 95
Ala Ile Thr Thr Val Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu
100 105 110
Asp Trp Lys Pro Arg Arg Ser Asp Met Ile Met Glu Pro Phe Gly Leu
115 120 125
Gly Arg Ile Val Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile
130 135 140
Arg Ser Tyr Glu Ile Gly Ala Asp Arg Ser Ala Ser Ile Glu Thr Val
145 150 155 160
Met Asn His Leu Gln Glu Thr Ala Leu Asn Xaa Val Lys Thr Ala Gly
165 170 175
Leu Leu Gly Asp Gly Phe Gly Ser Thr Pro Glu Met Val Lys Lys Xaa
180 185 190
Leu Ile Trp Val Val Thr Arg Met Gln Val Val Val Asp Thr Tyr Pro
195 200 205
Thr Trp Gly Asp Val Val Glu Val Asp Thr Trp Val Ser Lys Ser Gly
210 215 220
Lys Asn Gly Met Arg Arg Asp Trp Leu Val Arg Asp Gly Asn Thr Gly
225 230 235 240
Gln Ile Leu Thr Arg Ala Ser Ser Val Trp Val Met Met Asn Lys Leu
245 250 255
Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile Glu
260 265 270
Pro Tyr Phe Val Asp Phe Asp Pro Val Leu Ala Glu Asp Ser Arg Lys
275 280 285
Leu Thr Lys Leu Asp Asp Lys Thr Ala Asp Tyr Val Arg Ser Gly Leu
290 295 300
Thr Pro Arg Trp Ser Asp Leu Asp Val Asn Gln His Val Asn Asn Val
305 310 315 320
Lys Tyr Ile Gly Trp Ile Leu Glu Ser Ala Pro Val Gly Met Met Glu
325 330 335
Ser Gln Lys Leu Lys Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys Gly
340 345 350
Arg Asp Ser Val Leu Gln Ser Leu Thr Ala Val Ser Gly Cys Asp Ile
355 360 365
Gly Asn Leu Gly Thr Ala Gly Glu Val Glu Cys Gln His Leu Leu Arg
370 375 380
Leu Gln Asp Gly Ala Glu Val Val Arg Gly Arg Thr Glu Trp Ser Ser
385 390 395 400
Lys Thr Pro Thr Thr Thr Trp Asp Ile Thr Pro
405 410
<210> 217
<211> 333
<212> PRT
<213> Madhuca longifolia
<400> 217
Ile Asn Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr
1 5 10 15
Ile Phe Leu Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro
20 25 30
Lys Arg Pro Asp Met Leu Ile Asp Pro Phe Gly Leu Gly Lys Ile Val
35 40 45
Gln Asp Gly Leu Val Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu
50 55 60
Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu
65 70 75 80
Gln Glu Thr Ala Leu Asn His Val Lys Thr Ala Gly Leu Leu Gly Asp
85 90 95
Gly Phe Gly Val Thr Pro Glu Met Cys Lys Lys Asn Leu Ile Trp Val
100 105 110
Val Ala Lys Met Gln Val Leu Val Asp Arg Tyr Pro Thr Trp Gly Asp
115 120 125
Val Val Gln Val Asp Thr Trp Val Ala Ala Ser Gly Lys Asn Gly Met
130 135 140
Arg Arg Asp Trp Leu Val Arg Asp Phe Glu Thr Gly Asp Ile Leu Thr
145 150 155 160
Lys Ala Ser Ser Val Trp Val Met Met Asn Arg Glu Thr Arg Arg Leu
165 170 175
Ser Lys Ile Pro Asp Glu Val Arg Leu Glu Ile Gly Ser Tyr Phe Val
180 185 190
Asp Ser Pro Pro Val Leu Asp Glu Asp Gly Arg Lys Leu Pro Lys Leu
195 200 205
Asp Glu Ser Thr Ala Asp His Ile Arg Thr Gly Leu Thr Pro Arg Trp
210 215 220
Asn Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly
225 230 235 240
Trp Ile Leu Glu Ser Ala Pro Gln Pro Ile Leu Glu Asn His Glu Leu
245 250 255
Ala Ser Met Thr Leu Glu Tyr Arg Arg Glu Cys Gly Lys Asp Ser Val
260 265 270
Leu Gln Ser Leu Thr Gly Val Thr Ser Gly Gly Val Gly Gly Leu Ala
275 280 285
Asp Ser Gly His Val Glu Cys Gln His Leu Leu Arg Leu Glu Gly Gly
290 295 300
Ala Glu Ile Val Lys Gly Arg Thr Glu Trp Arg Pro Lys Tyr Ala Asn
305 310 315 320
Arg Leu Gly Cys Leu Asp Gln Leu Pro Ala Gly Ser Thr
325 330
<210> 218
<211> 425
<212> PRT
<213> Oryza sativa
<400> 218
Met Ala Gly Ser Leu Ala Ala Ser Ala Phe Phe Pro Gly Pro Gly Ser
1 5 10 15
Ser Pro Ala Ala Ser Ala Arg Ser Ser Lys Ser Ala Ala Val Thr Gly
20 25 30
Glu Leu Pro Glu Asn Leu Ser Val Arg Gly Ile Val Ala Lys Pro Asn
35 40 45
Pro Pro Pro Ala Ala Met Gln Val Lys Ala Gln Ala Gln Thr Leu Pro
50 55 60
Lys Val Asn Gly Thr Lys Val Asn Leu Lys Thr Val Lys Pro Asp Met
65 70 75 80
Glu Glu Thr Val Pro Tyr Ser Ala Pro Lys Thr Phe Tyr Asn Gln Leu
85 90 95
Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala
100 105 110
Ala Glu Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Lys Lys Pro Asp
115 120 125
Met Leu Val Asp Thr Phe Gly Phe Gly Arg Ile Ile Gln Asp Gly Met
130 135 140
Val Phe Arg Gln Asn Phe Met Ile Arg Ser Tyr Glu Ile Gly Ala Asp
145 150 155 160
Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala
165 170 175
Leu Asn His Val Arg Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala
180 185 190
Thr Pro Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Ser Lys Ile
195 200 205
Gln Leu Leu Val Glu Gln Tyr Pro Ala Trp Gly Asp Thr Val Gln Val
210 215 220
Asp Thr Trp Val Ala Ala Ala Gly Lys Asn Gly Met Arg Arg Asp Trp
225 230 235 240
His Val Arg Asp Tyr Asn Ser Gly Arg Thr Ile Leu Arg Ala Thr Ser
245 250 255
Val Trp Val Met Met His Lys Lys Thr Arg Arg Leu Ser Lys Met Pro
260 265 270
Asp Glu Val Arg Ala Glu Ile Gly Pro Tyr Phe Asn Asp Arg Ser Ala
275 280 285
Ile Thr Glu Glu Gln Ser Glu Lys Leu Ala Lys Thr Gly Asn Lys Val
290 295 300
Gly Asp Asp Ala Thr Glu Gln Phe Ile Arg Lys Gly Leu Thr Pro Arg
305 310 315 320
Trp Gly Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile
325 330 335
Gly Trp Ile Leu Glu Ser Ala Pro Ile Ser Val Leu Glu Lys His Glu
340 345 350
Leu Ala Ser Met Thr Leu Asp Tyr Arg Lys Glu Cys Gly Arg Asp Ser
355 360 365
Val Leu Gln Ser Leu Thr Thr Val Ser Gly Glu Cys Thr Ser Ile Gly
370 375 380
Ala Asp Lys Gln Ala Ser Ala Ile Gln Cys Asp His Leu Leu Gln Leu
385 390 395 400
Glu Ser Gly Ala Asp Ile Val Lys Ala His Thr Glu Trp Arg Pro Lys
405 410 415
Arg Ser His Ala Ala Ala Glu Asn Ala
420 425
<210> 219
<211> 425
<212> PRT
<213> Oryza sativa
<400> 219
Met Ala Gly Ser Leu Ala Ala Ser Ala Phe Phe Pro Gly Pro Gly Ser
1 5 10 15
Ser Pro Ala Ala Ser Ala Arg Ser Ser Lys Asn Ala Ala Val Thr Gly
20 25 30
Glu Leu Pro Glu Asn Leu Ser Val Arg Gly Ile Val Ala Lys Pro Asn
35 40 45
Pro Pro Pro Ala Ala Met Gln Val Lys Ala Gln Ala Gln Thr Leu Pro
50 55 60
Lys Val Asn Gly Thr Lys Val Asn Leu Lys Thr Val Lys Pro Asp Met
65 70 75 80
Glu Glu Thr Val Pro Tyr Ser Ala Pro Lys Thr Phe Tyr Asn Gln Leu
85 90 95
Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala
100 105 110
Ala Glu Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Lys Lys Pro Asp
115 120 125
Met Leu Val Asp Thr Phe Gly Phe Gly Arg Ile Ile Gln Asp Gly Met
130 135 140
Val Phe Arg Gln Asn Phe Met Ile Arg Ser Tyr Glu Ile Gly Ala Asp
145 150 155 160
Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala
165 170 175
Leu Asn His Val Arg Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala
180 185 190
Thr Pro Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Ser Lys Ile
195 200 205
Gln Leu Leu Val Glu Gln Tyr Pro Ala Trp Gly Asp Thr Val Gln Val
210 215 220
Asp Thr Trp Val Ala Ala Ala Gly Lys Asn Gly Met Arg Arg Asp Trp
225 230 235 240
His Val Arg Asp Tyr Asn Ser Gly Arg Thr Ile Leu Arg Ala Thr Ser
245 250 255
Val Trp Val Met Met His Lys Lys Thr Arg Arg Leu Ser Lys Met Pro
260 265 270
Asp Glu Val Arg Ala Glu Ile Gly Pro Tyr Phe Asn Asp Arg Ser Ala
275 280 285
Ile Thr Glu Glu Gln Ser Glu Lys Leu Ala Lys Thr Gly Asn Lys Val
290 295 300
Gly Asp Asp Ala Thr Glu Gln Phe Ile Arg Lys Gly Leu Thr Pro Arg
305 310 315 320
Trp Gly Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile
325 330 335
Gly Trp Ile Leu Glu Ser Ala Pro Ile Ser Val Leu Glu Lys His Glu
340 345 350
Leu Ala Ser Met Thr Leu Asp Tyr Arg Lys Glu Cys Gly Arg Asp Ser
355 360 365
Val Leu Gln Ser Leu Thr Thr Val Ser Gly Glu Cys Thr Ser Ile Gly
370 375 380
Ala Asp Lys Gln Ala Ser Ala Ile Gln Cys Asp His Leu Leu Gln Leu
385 390 395 400
Glu Ser Gly Ala Asp Ile Val Lys Ala His Thr Glu Trp Arg Pro Lys
405 410 415
Arg Ser His Ala Ala Ala Glu Asn Ala
420 425
<210> 220
<211> 427
<212> PRT
<213> Oryza sativa
<400> 220
Met Ala Gly Ser Leu Ala Ala Ser Ala Phe Phe Pro Val Pro Gly Ser
1 5 10 15
Ser Pro Ala Ala Ser Ala Arg Ser Ser Lys Asn Thr Thr Gly Glu Leu
20 25 30
Pro Glu Asn Leu Ser Val Arg Gly Ile Val Ala Lys Pro Asn Pro Ser
35 40 45
Pro Gly Ala Met Gln Val Lys Ala Gln Ala Gln Ala Leu Pro Lys Val
50 55 60
Asn Gly Thr Lys Val Asn Leu Lys Thr Thr Ser Pro Asp Lys Glu Asp
65 70 75 80
Ile Ile Pro Tyr Thr Ala Pro Lys Thr Phe Tyr Asn Gln Leu Pro Asp
85 90 95
Trp Ser Met Leu Leu Ala Ala Val Thr Thr Ile Phe Leu Ala Ala Glu
100 105 110
Lys Gln Trp Thr Leu Leu Asp Trp Lys Pro Lys Lys Pro Asp Met Leu
115 120 125
Ala Asp Thr Phe Gly Phe Gly Arg Ile Ile Gln Asp Gly Leu Val Phe
130 135 140
Arg Gln Asn Phe Leu Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr
145 150 155 160
Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr Ala Leu Asn
165 170 175
His Val Lys Thr Ala Gly Leu Leu Gly Asp Gly Phe Gly Ala Thr Pro
180 185 190
Glu Met Ser Lys Arg Asn Leu Ile Trp Val Val Ser Lys Ile Gln Leu
195 200 205
Leu Val Glu Arg Tyr Pro Ser Trp Gly Asp Met Val Gln Val Asp Thr
210 215 220
Trp Val Ala Ala Ala Gly Lys Asn Gly Met Arg Arg Asp Trp His Val
225 230 235 240
Arg Asp Tyr Asn Ser Gly Gln Thr Ile Leu Arg Ala Thr Ser Val Trp
245 250 255
Val Met Met Asn Lys Asn Thr Arg Arg Leu Ser Lys Met Pro Asp Glu
260 265 270
Val Arg Ala Glu Ile Gly Pro Tyr Phe Asn Gly Arg Ser Ala Ile Ser
275 280 285
Glu Glu Gln Gly Glu Lys Leu Pro Lys Pro Gly Thr Thr Phe Asp Gly
290 295 300
Ala Ala Thr Lys Gln Phe Thr Arg Lys Gly Leu Thr Pro Lys Trp Ser
305 310 315 320
Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
325 330 335
Ile Leu Glu Ser Ala Pro Ile Ser Ile Leu Glu Lys His Glu Leu Ala
340 345 350
Ser Met Thr Leu Asp Tyr Arg Lys Glu Cys Gly Arg Asp Ser Val Leu
355 360 365
Gln Ser Leu Thr Thr Val Ser Gly Glu Cys Asp Asp Gly Asn Thr Glu
370 375 380
Ser Ser Ile Gln Cys Asp His Leu Leu Gln Leu Glu Ser Gly Ala Asp
385 390 395 400
Ile Val Lys Ala His Thr Glu Trp Arg Pro Lys Arg Ala Gln Gly Glu
405 410 415
Gly Asn Met Gly Phe Phe Pro Ala Glu Ser Ala
420 425
<210> 221
<211> 419
<212> PRT
<213> Cuphea lanceolata
<400> 221
Met Val Ala Ala Ala Ala Thr Ser Ala Phe Phe Pro Val Pro Ala Pro
1 5 10 15
Gly Thr Ser Pro Lys Pro Gly Lys Ser Gly Asn Trp Pro Ser Ser Leu
20 25 30
Ser Pro Thr Phe Lys Pro Lys Ser Ile Pro Asn Ala Gly Phe Gln Val
35 40 45
Lys Ala Asn Ala Ser Ala His Pro Lys Ala Asn Gly Ser Ala Val Asn
50 55 60
Leu Lys Ser Gly Ser Leu Asn Thr Gln Glu Asp Thr Ser Ser Ser Pro
65 70 75 80
Pro Pro Arg Ala Phe Leu Asn Gln Leu Pro Asp Trp Ser Met Leu Leu
85 90 95
Thr Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr Met
100 105 110
Leu Asp Arg Lys Ser Lys Arg Pro Asp Met Leu Val Asp Ser Val Gly
115 120 125
Leu Lys Ser Ile Val Arg Asp Gly Leu Val Ser Arg Gln Ser Phe Leu
130 135 140
Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr
145 150 155 160
Leu Met Asn His Leu Gln Glu Thr Ser Ile Asn His Cys Lys Ser Leu
165 170 175
Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Gly Met Cys Lys Asn
180 185 190
Asp Leu Ile Trp Val Leu Thr Lys Met Gln Ile Met Val Asn Arg Tyr
195 200 205
Pro Thr Trp Gly Asp Thr Val Glu Ile Asn Thr Trp Phe Ser Gln Ser
210 215 220
Gly Lys Ile Gly Met Ala Ser Asp Trp Leu Ile Ser Asp Cys Asn Thr
225 230 235 240
Gly Glu Ile Leu Ile Arg Ala Thr Ser Val Trp Ala Met Met Asn Gln
245 250 255
Lys Thr Arg Arg Phe Ser Arg Leu Pro Tyr Glu Val Arg Gln Glu Leu
260 265 270
Thr Pro His Phe Val Asp Ser Pro His Val Ile Glu Asp Asn Asp Gln
275 280 285
Lys Leu His Lys Phe Asp Val Lys Thr Gly Asp Ser Ile Arg Lys Gly
290 295 300
Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Ser Asn
305 310 315 320
Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Met Pro Ile Glu Val Leu
325 330 335
Glu Thr Gln Glu Leu Cys Ser Leu Thr Val Glu Tyr Arg Arg Glu Cys
340 345 350
Gly Met Asp Ser Val Leu Glu Ser Val Thr Ala Val Asp Pro Ser Glu
355 360 365
Asn Gly Gly Arg Ser Gln Tyr Lys His Leu Leu Arg Leu Glu Asp Gly
370 375 380
Thr Asp Ile Val Lys Ser Arg Thr Glu Trp Arg Pro Lys Asn Ala Gly
385 390 395 400
Thr Asn Gly Ala Ile Ser Thr Ser Thr Ala Lys Thr Ser Asn Gly Asn
405 410 415
Ser Ala Ser
<210> 222
<211> 362
<212> PRT
<213> Myristica fragrans
<400> 222
Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala
1 5 10 15
Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg Pro Asp
20 25 30
Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val Gln Asp
35 40 45
Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly
50 55 60
Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu
65 70 75 80
Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp Gly Phe
85 90 95
Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val Val Thr
100 105 110
Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp Val Ile
115 120 125
Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met Lys Arg
130 135 140
Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Ala
145 150 155 160
Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu Ser Lys
165 170 175
Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val Glu His
180 185 190
Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn Asp Asn
195 200 205
Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser Asp Leu
210 215 220
Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu
225 230 235 240
Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr Gly Met
245 250 255
Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu Gln Ser
260 265 270
Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu Ala Gly
275 280 285
Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu Ile Met
290 295 300
Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr Thr Tyr
305 310 315 320
Phe Gly Ser Val Asp Asp Ile Pro Pro His Pro Ile Tyr Ile Tyr Ile
325 330 335
Tyr Ile Tyr Ile Tyr Ile Tyr Ile Tyr Trp Val Gly Ser Ser Cys Ser
340 345 350
Gly Ser Ser Thr Thr Met Ser Arg Thr Arg
355 360
<210> 223
<211> 382
<212> PRT
<213> Cinnamomum camphora
<400> 223
Met Ala Thr Thr Ser Leu Ala Ser Ala Phe Cys Ser Met Lys Ala Val
1 5 10 15
Met Leu Ala Arg Asp Gly Arg Gly Met Lys Pro Arg Ser Ser Asp Leu
20 25 30
Gln Leu Arg Ala Gly Asn Ala Gln Thr Ser Leu Lys Met Ile Asn Gly
35 40 45
Thr Lys Phe Ser Tyr Thr Glu Ser Leu Lys Lys Leu Pro Asp Trp Ser
50 55 60
Met Leu Phe Ala Val Ile Thr Thr Ile Phe Ser Ala Ala Glu Lys Gln
65 70 75 80
Trp Thr Asn Leu Glu Trp Lys Pro Lys Pro Asn Pro Pro Gln Leu Leu
85 90 95
Asp Asp His Phe Gly Pro His Gly Leu Val Phe Arg Arg Thr Phe Ala
100 105 110
Ile Arg Ser Tyr Glu Val Gly Pro Asp Arg Ser Thr Ser Ile Val Ala
115 120 125
Val Met Asn His Leu Gln Glu Ala Ala Leu Asn His Ala Lys Ser Val
130 135 140
Gly Ile Leu Gly Asp Gly Phe Gly Thr Thr Leu Glu Met Ser Lys Arg
145 150 155 160
Asp Leu Ile Trp Val Val Lys Arg Thr His Val Ala Val Glu Arg Tyr
165 170 175
Pro Ala Trp Gly Asp Thr Val Glu Val Glu Cys Trp Val Gly Ala Ser
180 185 190
Gly Asn Asn Gly Arg Arg His Asp Phe Leu Val Arg Asp Cys Lys Thr
195 200 205
Gly Glu Ile Leu Thr Arg Cys Thr Ser Leu Ser Val Met Met Asn Thr
210 215 220
Arg Thr Arg Arg Leu Ser Lys Ile Pro Glu Glu Val Arg Gly Glu Ile
225 230 235 240
Gly Pro Ala Phe Ile Asp Asn Val Ala Val Lys Asp Glu Glu Ile Lys
245 250 255
Lys Pro Gln Lys Leu Asn Asp Ser Thr Ala Asp Tyr Ile Gln Gly Gly
260 265 270
Leu Thr Pro Arg Trp Asn Asp Leu Asp Ile Asn Gln His Val Asn Asn
275 280 285
Ile Lys Tyr Val Asp Trp Ile Leu Glu Thr Val Pro Asp Ser Ile Phe
290 295 300
Glu Ser His His Ile Ser Ser Phe Thr Ile Glu Tyr Arg Arg Glu Cys
305 310 315 320
Thr Met Asp Ser Val Leu Gln Ser Leu Thr Thr Val Ser Gly Gly Ser
325 330 335
Ser Glu Ala Gly Leu Val Cys Glu His Leu Leu Gln Leu Glu Gly Gly
340 345 350
Ser Glu Val Leu Arg Ala Lys Thr Glu Trp Arg Pro Lys Leu Thr Asp
355 360 365
Ser Phe Arg Gly Ile Ser Val Ile Pro Ala Glu Ser Ser Val
370 375 380
<210> 224
<211> 429
<212> PRT
<213> Myristica fragrans
<400> 224
Met Val Ala Thr Ser Ala Ala Ser Ala Phe Phe Pro Val Ala Ser Pro
1 5 10 15
Ser Pro Val Lys Pro Ser Met Met Leu Gly Gly Gly Gly Gly Ser Asp
20 25 30
Asn Leu Asp Ala Arg Gly Ile Lys Ser Arg Pro Ala Ser Ser Gly Gly
35 40 45
Leu Gln Val Lys Ala Asn Ala His Thr Val Pro Lys Ile Asn Gly Asn
50 55 60
Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu Asp Ile
65 70 75 80
Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn Gln Leu
85 90 95
Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe Leu Ala
100 105 110
Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg Pro Asp
115 120 125
Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val Gln Asp
130 135 140
Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly
145 150 155 160
Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu
165 170 175
Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp Gly Phe
180 185 190
Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val Val Thr
195 200 205
Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp Val Ile
210 215 220
Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met Lys Arg
225 230 235 240
Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr Arg Ala
245 250 255
Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu Ser Lys
260 265 270
Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val Glu His
275 280 285
Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn Asp Asn
290 295 300
Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser Asp Leu
305 310 315 320
Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp Ile Leu
325 330 335
Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr Gly Met
340 345 350
Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu Gln Ser
355 360 365
Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu Ala Gly
370 375 380
Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu Ile Met
385 390 395 400
Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr Thr Tyr
405 410 415
Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala
420 425
<210> 225
<211> 8672
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 225
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940
tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000
cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060
accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120
acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180
tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240
tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300
acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360
acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420
tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480
agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540
acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600
acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660
tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720
tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780
tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840
ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900
ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960
cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020
cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080
tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140
cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200
aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260
acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320
accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380
agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440
tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500
acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920
agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980
tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040
tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100
ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160
cgaattcctt tcttgcgcta tgacacttcc agcaaaaggt agggcgggct gcgagacggc 5220
ttcccggcgc tgcatgcaac accgatgatg cttcgacccc ccgaagctcc ttcggggctg 5280
catgggcgct ccgatgccgc tccagggcga gcgctgttta aatagccagg cccccgattg 5340
caaagacatt atagcgagct accaaagcca tattcaaaca cctagatcac taccacttct 5400
acacaggcca ctcgagcttg tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt 5460
tcagtcacaa cccgcaaaca ctagtatggc caccgcatcc actttctcgg cgttcaatgc 5520
ccgctgcggc gacctgcgtc gctcggcggg ctccgggccc cggcgcccag cgaggcccct 5580
ccccgtgcgc gggcgcgcca cccaggagga cgcccactcc gccccccccc cccgcacctt 5640
catcaaccag ctgcccgact ggtccatgct gctggccgcc atcaccaccg tgttcctggc 5700
cgccgagaag cagtggatga tgctggactg gaagcccaag cgccccgaca tgctggtgga 5760
ccccttcggc ctgggctcca tcgtgcagga cggcctggtg ttccgccaga acttctccat 5820
ccgctcctac gagatcggcg ccgaccgcac cgcctccatc gagaccgtga tgaaccacct 5880
gcaggagacc gccctgaacc acgtgaagat cgccggcctg tccaacgacg gcttcggccg 5940
cacccccgag atgtacaagc gcgacctgat ctgggtggtg gccaagatgc aggtgatggt 6000
gaaccgctac cccacctggg gcgacaccgt ggaggtgaac acctgggtgg ccaagtccgg 6060
caagaacggc atgcgccgcg actggctgat ctccgactgc aacaccggcg agatcctgac 6120
ccgcgcctcc tccgtgtggg tgatgatgaa ccagaagacc cgccgcctgt ccaagatccc 6180
cgacgaggtg cgcaacgaga tcgagcccca cttcgtggac tccccccccg tgatcgagga 6240
cgacgaccgc aagctgccca agctggacga gaagaccgcc gactccatcc gcaagggcct 6300
gaccccccgc tggaacgacc tggacgtgaa ccagcacgtg aacaacgtga agtacatcgg 6360
ctggatcctg gagtccaccc cccccgaggt gctggagacc caggagctgt gctccctgac 6420
cctggagtac cgccgcgagt gcggccgcga gtccgtgctg gagtccctga ccgccatgga 6480
cccctccggc ggcggctacg gctcccagtt ccagcacctg ctgcgcctgg aggacggcgg 6540
cgagatcgtg aagggccgca ccgagtggcg ccccaagaac ggcgtgatca acggcgtggt 6600
gcccaccggc gagtcctccc ccggcgacta ctccatggac tacaaggacc acgacggcga 6660
ctacaaggac cacgacatcg actacaagga cgacgacgac aagtgaatcg atagatctct 6720
taaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt gtgatggact 6780
gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta tcaaacagcc 6840
tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct tgtgctattt 6900
gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa 6960
cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca ctgcccctcg 7020
cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac 7080
tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc ttaattaaga 7140
gctcttgttt tccagaagga gttgctcctt gagcctttca ttctcagcct cgataacctc 7200
caaagccgct ctaattgtgg agggggttcg aatttaaaag cttggaatgt tggttcgtgc 7260
gtctggaaca agcccagact tgttgctcac tgggaaaagg accatcagct ccaaaaaact 7320
tgccgctcaa accgcgtacc tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac 7380
attcatattg tgacgcttga gcagtctgta attgcctcag aatgtggaat catctgcccc 7440
ctgtgcgagc ccatgccagg catgtcgcgg gcgaggacac ccgccactcg tacagcagac 7500
cattatgcta cctcacaata gttcataaca gtgaccatat ttctcgaagc tccccaacga 7560
gcacctccat gctctgagtg gccacccccc ggccctggtg cttgcggagg gcaggtcaac 7620
cggcatgggg ctaccgaaat ccccgaccgg atcccaccac ccccgcgatg ggaagaatct 7680
ctccccggga tgtgggccca ccaccagcac aacctgctgg cccaggcgag cgtcaaacca 7740
taccacacaa atatccttgg catcggccct gaattccttc tgccgctctg ctacccggtg 7800
cttctgtccg aagcaggggt tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg 7860
gcggggcttg ttcgagcttg aagagcctct agagtcgacc tgcaggcatg caagcttggc 7920
gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa 7980
catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac 8040
attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca 8100
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 8160
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 8220
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 8280
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 8340
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 8400
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 8460
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 8520
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 8580
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 8640
tgagtccaac ccggtaagac acgacttatc gc 8672
<210> 226
<211> 9525
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 226
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940
gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000
cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060
caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120
gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180
caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240
cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300
gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360
ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420
cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480
gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540
gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600
gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660
gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720
cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780
caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840
gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900
ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960
gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020
gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080
caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140
ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200
gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260
caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320
gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380
catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440
caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500
cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920
ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980
ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040
cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100
gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160
ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220
tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280
acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340
agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400
gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460
cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagaa ctcgactacg 5520
acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580
actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640
gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700
ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760
ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820
cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880
gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940
accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000
ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060
ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120
tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180
ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggtg 6240
gccaccgccg cctcctccgc cttcttcccc ctgccctccg ccgacacctc ctcccgcccc 6300
ggcaagctgg gcaacaagcc ctcctccctg tcccccctga agcccaagtc cacccccaac 6360
ggcggcctgc aggtgaaggc caacgcctcc gcccccccca agatcaacgg ctcccccgtg 6420
ggcctgaagt ccggcggcct gaaggggcgc gccacccagg aggacgccca ctccgccccc 6480
cccccccgca ccttcatcaa ccagctgccc gactggtcca tgctgctggc cgccatcacc 6540
accgtgttcc tggccgccga gaagcagtgg atgatgctgg actggaagcc caagcgcccc 6600
gacatgctgg tggacccctt cggcctgggc tccatcgtgc aggacggcct ggtgttccgc 6660
cagaacttct ccatccgctc ctacgagatc ggcgccgacc gcaccgcctc catcgagacc 6720
gtgatgaacc acctgcagga gaccgccctg aaccacgtga agatcgccgg cctgtccaac 6780
gacggcttcg gccgcacccc cgagatgtac aagcgcgacc tgatctgggt ggtggccaag 6840
atgcaggtga tggtgaaccg ctaccccacc tggggcgaca ccgtggaggt gaacacctgg 6900
gtggccaagt ccggcaagaa cggcatgcgc cgcgactggc tgatctccga ctgcaacacc 6960
ggcgagatcc tgacccgcgc ctcctccgtg tgggtgatga tgaaccagaa gacccgccgc 7020
ctgtccaaga tccccgacga ggtgcgcaac gagatcgagc cccacttcgt ggactccccc 7080
cccgtgatcg aggacgacga ccgcaagctg cccaagctgg acgagaagac cgccgactcc 7140
atccgcaagg gcctgacccc ccgctggaac gacctggacg tgaaccagca cgtgaacaac 7200
gtgaagtaca tcggctggat cctggagtcc accccccccg aggtgctgga gacccaggag 7260
ctgtgctccc tgaccctgga gtaccgccgc gagtgcggcc gcgagtccgt gctggagtcc 7320
ctgaccgcca tggacccctc cggcggcggc tacggctccc agttccagca cctgctgcgc 7380
ctggaggacg gcggcgagat cgtgaagggc cgcaccgagt ggcgccccaa gaacggcgtg 7440
atcaacggcg tggtgcccac cggcgagtcc tcccccggcg actactccat ggactacaag 7500
gaccacgacg gcgactacaa ggaccacgac atcgactaca aggacgacga cgacaagtga 7560
atcgatagat ctcttaaggc agcagcagct cggatagtat cgacacactc tggacgctgg 7620
tcgtgtgatg gactgttgcc gccacacttg ctgccttgac ctgtgaatat ccctgccgct 7680
tttatcaaac agcctcagtg tgtttgatct tgtgtgtacg cgcttttgcg agttgctagc 7740
tgcttgtgct atttgcgaat accaccccca gcatcccctt ccctcgtttc atatcgcttg 7800
catcccaacc gcaacttatc tacgctgtcc tgctatccct cagcgctgct cctgctcctg 7860
ctcactgccc ctcgcacagc cttggtttgg gctccgcctg tattctcctg gtactgcaac 7920
ctgtaaacca gcactgcaat gctgatgcac gggaagtagt gggatgggaa cacaaatgga 7980
aagcttaatt aagagctctt gttttccaga aggagttgct ccttgagcct ttcattctca 8040
gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta aaagcttgga 8100
atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa aaggaccatc 8160
agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat ctgccctgtt 8220
gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc tcagaatgtg 8280
gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg acacccgcca 8340
ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc atatttctcg 8400
aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct ggtgcttgcg 8460
gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca ccacccccgc 8520
gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg ctggcccagg 8580
cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc cttctgccgc 8640
tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc gagtccgcaa 8700
acccttgtcg cgtggcgggg cttgttcgag cttgaagagc ctctagagtc gacctgcagg 8760
catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 8820
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 8880
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 8940
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 9000
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 9060
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 9120
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 9180
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 9240
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 9300
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 9360
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 9420
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 9480
ggtaactatc gtcttgagtc caacccggta agacacgact tatcg 9525
<210> 227
<211> 9313
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 227
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940
gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000
cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060
caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120
gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180
caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240
cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300
gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360
ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420
cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480
gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540
gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600
gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660
gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720
cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780
caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840
gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900
ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960
gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020
gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080
caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140
ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200
gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260
caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320
gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380
catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440
caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500
cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920
ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980
ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040
cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100
gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160
ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220
tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280
acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340
agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400
gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460
cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520
acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580
actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640
gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700
ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760
ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820
cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880
gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940
accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000
ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060
ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120
tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180
ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggcc 6240
accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg ctcggcgggc 6300
tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccca gctgcccgac 6360
tggagcatgc tgctggccgc gatcaccacc ctgttcctgg cggccgagaa gcagtggatg 6420
atgctggact ggaagcccaa gcgccccgac atgctggtgg accccttcgg cctgggccgc 6480
ttcgtgcagg acggcctggt gttccgcaac aacttcagca tccgcagcta cgagatcggc 6540
gcggaccgca ccgccagcat cgagaccctg atgaaccacc tgcaggagac cgccctgaac 6600
cacgtgaaga gcgtgggcct gctggaggac ggcctgggca gcacccgcga gatgagcctg 6660
cgcaacctga tctgggtggt gaccaagatg caggtggcgg tggaccgcta ccccacctgg 6720
ggcgacgagg tgcaggtgag cagctgggcg accgccatcg gcaagaacgg catgcgccgc 6780
gagtggatcg tgaccgactt ccgcaccggc gagaccctgc tgcgcgccac cagcgtgtgg 6840
gtgatgatga acaagctgac ccgccgcatc agcaagatcc ccgaggaggt gtggcacgag 6900
atcggcccca gcttcatcga cgcgcccccc ctgcccaccg tggaggacga cggccgcaag 6960
ctgacccgct tcgacgagag cagcgccgac ttcatccgca agggcctgac cccccgctgg 7020
agcgacctgg acatcaacca gcacgtgaac aacgtgaagt acatcggctg gctgctggag 7080
agcgcgcccc ccgagatcca cgagagccac gagatcgcca gcctgaccct ggagtaccgc 7140
cgcgagtgcg gccgcgacag cgtgctgaac agcgccacca aggtgagcga cagcagccag 7200
ctgggcaaga gcgccgtgga gtgcaaccac ctggtgcgcc tgcagaacgg cggcgagatc 7260
gtgaagggcc gcaccgtgtg gcgccccaag cgccccctgt acaacgacgg cgccgtggtg 7320
gacgtgcccg ccaagaccag cgatgacgat gacaagctgg gatgactcga ggcagcagca 7380
gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 7440
ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 7500
tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 7560
ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 7620
tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 7680
tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 7740
cacgggaagt agtgggatgg gaacacaaat ggaaagcttg agctcttgtt ttccagaagg 7800
agttgctcct tgagcctttc attctcagcc tcgataacct ccaaagccgc tctaattgtg 7860
gagggggttc gaatttaaaa gcttggaatg ttggttcgtg cgtctggaac aagcccagac 7920
ttgttgctca ctgggaaaag gaccatcagc tccaaaaaac ttgccgctca aaccgcgtac 7980
ctctgctttc gcgcaatctg ccctgttgaa atcgccacca cattcatatt gtgacgcttg 8040
agcagtctgt aattgcctca gaatgtggaa tcatctgccc cctgtgcgag cccatgccag 8100
gcatgtcgcg ggcgaggaca cccgccactc gtacagcaga ccattatgct acctcacaat 8160
agttcataac agtgaccata tttctcgaag ctccccaacg agcacctcca tgctctgagt 8220
ggccaccccc cggccctggt gcttgcggag ggcaggtcaa ccggcatggg gctaccgaaa 8280
tccccgaccg gatcccacca cccccgcgat gggaagaatc tctccccggg atgtgggccc 8340
accaccagca caacctgctg gcccaggcga gcgtcaaacc ataccacaca aatatccttg 8400
gcatcggccc tgaattcctt ctgccgctct gctacccggt gcttctgtcc gaagcagggg 8460
ttgctaggga tcgctccgag tccgcaaacc cttgtcgcgt ggcggggctt gttcgagctt 8520
gaagagcctc tagagtcgac ctgcaggcat gcaagcttgg cgtaatcatg gtcatagctg 8580
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 8640
aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 8700
ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 8760
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 8820
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 8880
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 8940
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 9000
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 9060
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 9120
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 9180
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 9240
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 9300
cacgacttat cgc 9313
<210> 228
<211> 8522
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 228
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 180
caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 240
ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 300
cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 360
agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 420
cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg 480
caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540
gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600
taaaacgacg gccagtgagc gcgcgtaata cgactcacta tagggcgaat tgcagctttt 660
gttcccttta gtgagggtta attgcgcgct tggcgtaatc atggtcatag ctgtttcctg 720
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 780
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 840
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 900
gaggcggtgc gtattgggcg ctcttccgct cccgtgatca cacaggtgcc ttgcgagcgt 960
gatcacacta ttttgggggt cctacagtac tgaaatggtg agaagtcgta ctgaaatcaa 1020
ggatgaacaa tgaaaatggt gctgtggtgg cttctcaaag gtcaagaatc agtcgctcgc 1080
gtcaggaaat cgcggcgtca accagcgtgg gcgcggtcag tggccccgca ctggtcacca 1140
tagcctctcc tgccacagta gcgatcccct gggcgttcac tctcagcagc ggctgtactg 1200
cctcccagat tttcttcttc tggacctgcg ggcgtgagag gatgagcagg gtggggccaa 1260
gggctcaatc ctgaacggcc ctcattcggt ttccaatccc acaacacata cccacagcag 1320
gtcagaccac gcattcgcac catgcgcacc aataacgtgt ccttacctga ttgggtgtgg 1380
caggctccgt ggacaggagt gcctcgtccc ccgcccagac ccgctccccc gtcacggcgg 1440
cgtccgggac ccgcagcggc tccaccgcgg tgtgatccgc gttggcggcg cagagcagca 1500
tcccagccga tttgaccccg cgcatgctcc gaggcttgag gttggccagc accaccaccc 1560
gccggccgac aaggtcctcc agggtcacgt gccggaccag gccactcacg atggtgcgag 1620
ggcccccctc ctcgccgagg tcgatctgct cgacgtacag actgcgacat gcgtggcgag 1680
tggtcatcag aaggaagcag gtgtgcagaa ggggcacgtg gttggtattg agagtagcca 1740
aagctttgtg ccaatcagaa agtcaacgca gctgcctgcc tggctcgcgt acggtaccct 1800
ttcttgcgct atgacacttc cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg 1860
ctgcatgcaa caccgatgat gcttcgaccc cccgaagctc cttcggggct gcatgggcgc 1920
tccgatgccg ctccagggcg agcgctgttt aaatagccag gcccccgatt gcaaagacat 1980
tatagcgagc taccaaagcc atattcaaac acctagatca ctaccacttc tacacaggcc 2040
actcgagctt gtgatcgcac tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca 2100
acccgcaaac tctagaatat caatgctgct gcaggccttc ctgttcctgc tggccggctt 2160
cgccgccaag atcagcgcct ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt 2220
cacccccaac aagggctgga tgaacgaccc caacggcctg tggtacgacg agaaggacgc 2280
caagtggcac ctgtacttcc agtacaaccc gaacgacacc gtctggggga cgcccttgtt 2340
ctggggccac gccacgtccg acgacctgac caactgggag gaccagccca tcgccatcgc 2400
cccgaagcgc aacgactccg gcgccttctc cggctccatg gtggtggact acaacaacac 2460
ctccggcttc ttcaacgaca ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta 2520
caacaccccg gagtccgagg agcagtacat ctcctacagc ctggacggcg gctacacctt 2580
caccgagtac cagaagaacc ccgtgctggc cgccaactcc acccagttcc gcgacccgaa 2640
ggtcttctgg tacgagccct cccagaagtg gatcatgacc gcggccaagt cccaggacta 2700
caagatcgag atctactcct ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc 2760
caacgagggc ttcctcggct accagtacga gtgccccggc ctgatcgagg tccccaccga 2820
gcaggacccc agcaagtcct actgggtgat gttcatctcc atcaaccccg gcgccccggc 2880
cggcggctcc ttcaaccagt acttcgtcgg cagcttcaac ggcacccact tcgaggcctt 2940
cgacaaccag tcccgcgtgg tggacttcgg caaggactac tacgccctgc agaccttctt 3000
caacaccgac ccgacctacg ggagcgccct gggcatcgcg tgggcctcca actgggagta 3060
ctccgccttc gtgcccacca acccctggcg ctcctccatg tccctcgtgc gcaagttctc 3120
cctcaacacc gagtaccagg ccaacccgga gacggagctg atcaacctga aggccgagcc 3180
gatcctgaac atcagcaacg ccggcccctg gagccggttc gccaccaaca ccacgttgac 3240
gaaggccaac agctacaacg tcgacctgtc caacagcacc ggcaccctgg agttcgagct 3300
ggtgtacgcc gtcaacacca cccagacgat ctccaagtcc gtgttcgcgg acctctccct 3360
ctggttcaag ggcctggagg accccgagga gtacctccgc atgggcttcg aggtgtccgc 3420
gtcctccttc ttcctggacc gcgggaacag caaggtgaag ttcgtgaagg agaaccccta 3480
cttcaccaac cgcatgagcg tgaacaacca gcccttcaag agcgagaacg acctgtccta 3540
ctacaaggtg tacggcttgc tggaccagaa catcctggag ctgtacttca acgacggcga 3600
cgtcgtgtcc accaacacct acttcatgac caccgggaac gccctgggct ccgtgaacat 3660
gacgacgggg gtggacaacc tgttctacat cgacaagttc caggtgcgcg aggtcaagtg 3720
acaattggca gcagcagctc ggatagtatc gacacactct ggacgctggt cgtgtgatgg 3780
actgttgccg ccacacttgc tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca 3840
gcctcagtgt gtttgatctt gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta 3900
tttgcgaata ccacccccag catccccttc cctcgtttca tatcgcttgc atcccaaccg 3960
caacttatct acgctgtcct gctatccctc agcgctgctc ctgctcctgc tcactgcccc 4020
tcgcacagcc ttggtttggg ctccgcctgt attctcctgg tactgcaacc tgtaaaccag 4080
cactgcaatg ctgatgcacg ggaagtagtg ggatgggaac acaaatggag gatcccgcgt 4140
ctcgaacaga gcgcgcagag gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc 4200
atacaccaca ataaccacct gacgaatgcg cttggttctt cgtccattag cgaagcgtcc 4260
ggttcacaca cgtgccacgt tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg 4320
tcgaaacgtt cacagcctag ggatatcgaa ttcctttctt gcgctatgac acttccagca 4380
aaaggtaggg cgggctgcga gacggcttcc cggcgctgca tgcaacaccg atgatgcttc 4440
gaccccccga agctccttcg gggctgcatg ggcgctccga tgccgctcca gggcgagcgc 4500
tgtttaaata gccaggcccc cgattgcaaa gacattatag cgagctacca aagccatatt 4560
caaacaccta gatcactacc acttctacac aggccactcg agcttgtgat cgcactccgc 4620
taagggggcg cctcttcctc ttcgtttcag tcacaacccg caaacactag tatggccacc 4680
gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4740
gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4800
ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4860
tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4920
gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4980
atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 5040
atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 5100
gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 5160
gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 5220
tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 5280
acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5340
gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5400
gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5460
gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5520
agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5580
ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5640
ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5700
ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5760
aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5820
tgactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg gtcgtgtgat 5880
ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc ttttatcaaa 5940
cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc 6000
tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt gcatcccaac 6060
cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct gctcactgcc 6120
cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa cctgtaaacc 6180
agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg aaagcttgag 6240
ctcgtaccca tcagcatccg ggtgaatctt ggcctccaag atatggccaa tcctcacatc 6300
cagcttggca aaatcgacta gactgtctgc aagtgggaat gtggagcaca aggttgcttg 6360
tagcgatcga cagactggtg gggtacattg acaggtgggc agcgccgcat ccatcgtgcc 6420
tgacgcgagc gccgccggtt gctcgcccgt gcctgccgtc aaagagcggc agagaaatcg 6480
ggaaccgaaa acgtcacatt gcctgatgtt gttacatgct ggactagact ttcttggcgt 6540
gggtctgctc ctcgccaggt gcgcgacgcc tcggggctgg gtgcgaggga gccgtgcggc 6600
cacgcatttg acaagaccca aagctcgcat ctcagacggt caaccgttcg tattatacat 6660
tcaacatatg gtacatacgc aaaaagcatg ccaacgatga cagctcttcg cccacatgtg 6720
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 6780
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 6840
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 6900
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 6960
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 7020
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 7080
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 7140
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 7200
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 7260
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 7320
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 7380
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 7440
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 7500
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 7560
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 7620
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 7680
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 7740
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 7800
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 7860
ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 7920
agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 7980
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 8040
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 8100
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 8160
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 8220
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 8280
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 8340
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 8400
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 8460
tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 8520
ac 8522
<210> 229
<211> 9426
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 229
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940
gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000
cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060
caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120
gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180
caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240
cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300
gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360
ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420
cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480
gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540
gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600
gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660
gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720
cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780
caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840
gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900
ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960
gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020
gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080
caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140
ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200
gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260
caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320
gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380
catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440
caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500
cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920
ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980
ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040
cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100
gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160
ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220
tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280
acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340
agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400
gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460
cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520
acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580
actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640
gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700
ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760
ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820
cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880
gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940
accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000
ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060
ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120
tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180
ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggtg 6240
gtggccgccg ccgccagcag cgccttcttc cccgtgcccg ccccccgccc cacccccaag 6300
cccggcaagt tcggcaactg gcccagcagc ctgagccagc ccttcaagcc caagagcaac 6360
cccaacggcc gcttccaggt gaaggccaac gtgagccccc acgggcgcgc ccccaaggcc 6420
aacggcagcg ccgtgagcct gaagtccggc agcctgaaca ccctggagga cccccccagc 6480
agcccccccc cccgcacctt cctgaaccag ctgcccgact ggagccgcct gcgcaccgcc 6540
atcaccaccg tgttcgtggc cgccgagaag cagttcaccc gcctggaccg caagagcaag 6600
cgccccgaca tgctggtgga ctggttcggc agcgagacca tcgtgcagga cggcctggtg 6660
ttccgcgagc gcttcagcat ccgcagctac gagatcggcg ccgaccgcac cgccagcatc 6720
gagaccctga tgaaccacct gcaggacacc agcctgaacc actgcaagag cgtgggcctg 6780
ctgaacgacg gcttcggccg cacccccgag atgtgcaccc gcgacctgat ctgggtgctg 6840
accaagatgc agatcgtggt gaaccgctac cccacctggg gcgacaccgt ggagatcaac 6900
agctggttca gccagagcgg caagatcggc atgggccgcg agtggctgat cagcgactgc 6960
aacaccggcg agatcctggt gcgcgccacc agcgcctggg ccatgatgaa ccagaagacc 7020
cgccgcttca gcaagctgcc ctgcgaggtg cgccaggaga tcgcccccca cttcgtggac 7080
gccccccccg tgatcgagga caacgaccgc aagctgcaca agttcgacgt gaagaccggc 7140
gacagcatct gcaagggcct gacccccggc tggaacgact tcgacgtgaa ccagcacgtg 7200
agcaacgtga agtacatcgg ctggattctg gagagcatgc ccaccgaggt gctggagacc 7260
caggagctgt gcagcctgac cctggagtac cgccgcgagt gcggccgcga gagcgtggtg 7320
gagagcgtga ccagcatgaa ccccagcaag gtgggcgacc gcagccagta ccagcacctg 7380
ctgcgcctgg aggacggcgc cgacatcatg aagggccgca ccgagtggcg ccccaagaac 7440
gccggcacca accgcgccat cagcacctga ttaattaact cgaggcagca gcagctcgga 7500
tagtatcgac acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc 7560
cttgacctgt gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg 7620
tgtacgcgct tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat 7680
ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct 7740
atccctcagc gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc 7800
cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga 7860
agtagtggga tgggaacaca aatggaaagc ttgagctctt gttttccaga aggagttgct 7920
ccttgagcct ttcattctca gcctcgataa cctccaaagc cgctctaatt gtggaggggg 7980
ttcgaattta aaagcttgga atgttggttc gtgcgtctgg aacaagccca gacttgttgc 8040
tcactgggaa aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg tacctctgct 8100
ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat attgtgacgc ttgagcagtc 8160
tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc caggcatgtc 8220
gcgggcgagg acacccgcca ctcgtacagc agaccattat gctacctcac aatagttcat 8280
aacagtgacc atatttctcg aagctcccca acgagcacct ccatgctctg agtggccacc 8340
ccccggccct ggtgcttgcg gagggcaggt caaccggcat ggggctaccg aaatccccga 8400
ccggatccca ccacccccgc gatgggaaga atctctcccc gggatgtggg cccaccacca 8460
gcacaacctg ctggcccagg cgagcgtcaa accataccac acaaatatcc ttggcatcgg 8520
ccctgaattc cttctgccgc tctgctaccc ggtgcttctg tccgaagcag gggttgctag 8580
ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag cttgaagagc 8640
ctctagagtc gacctgcagg catgcaagct tggcgtaatc atggtcatag ctgtttcctg 8700
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 8760
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 8820
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 8880
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 8940
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 9000
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 9060
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 9120
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 9180
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 9240
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 9300
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 9360
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 9420
tatcgc 9426
<210> 230
<211> 8964
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 230
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920
cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980
caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040
gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100
gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160
acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220
cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280
gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340
ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400
cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460
gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520
cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580
tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640
tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700
ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740
cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800
acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860
ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920
gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980
gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040
attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100
tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160
gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220
tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280
gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340
acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400
tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460
aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520
atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580
aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640
gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700
gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760
ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820
attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880
gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940
ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000
caggccggtc gcagccacta gtatggtggt ggccgccgcc gccagcagcg ccttcttccc 6060
cgtgcccgcc ccccgcccca cccccaagcc cggcaagttc ggcaactggc ccagcagcct 6120
gagccagccc ttcaagccca agagcaaccc caacggccgc ttccaggtga aggccaacgt 6180
gagcccccac gggcgcgccc ccaaggccaa cggcagcgcc gtgagcctga agtccggcag 6240
cctgaacacc ctggaggacc cccccagcag cccccccccc cgcaccttcc tgaaccagct 6300
gcccgactgg agccgcctgc gcaccgccat caccaccgtg ttcgtggccg ccgagaagca 6360
gttcacccgc ctggaccgca agagcaagcg ccccgacatg ctggtggact ggttcggcag 6420
cgagaccatc gtgcaggacg gcctggtgtt ccgcgagcgc ttcagcatcc gcagctacga 6480
gatcggcgcc gaccgcaccg ccagcatcga gaccctgatg aaccacctgc aggacaccag 6540
cctgaaccac tgcaagagcg tgggcctgct gaacgacggc ttcggccgca cccccgagat 6600
gtgcacccgc gacctgatct gggtgctgac caagatgcag atcgtggtga accgctaccc 6660
cacctggggc gacaccgtgg agatcaacag ctggttcagc cagagcggca agatcggcat 6720
gggccgcgag tggctgatca gcgactgcaa caccggcgag atcctggtgc gcgccaccag 6780
cgcctgggcc atgatgaacc agaagacccg ccgcttcagc aagctgccct gcgaggtgcg 6840
ccaggagatc gccccccact tcgtggacgc cccccccgtg atcgaggaca acgaccgcaa 6900
gctgcacaag ttcgacgtga agaccggcga cagcatctgc aagggcctga cccccggctg 6960
gaacgacttc gacgtgaacc agcacgtgag caacgtgaag tacatcggct ggattctgga 7020
gagcatgccc accgaggtgc tggagaccca ggagctgtgc agcctgaccc tggagtaccg 7080
ccgcgagtgc ggccgcgaga gcgtggtgga gagcgtgacc agcatgaacc ccagcaaggt 7140
gggcgaccgc agccagtacc agcacctgct gcgcctggag gacggcgccg acatcatgaa 7200
gggccgcacc gagtggcgcc ccaagaacgc cggcaccaac cgcgccatca gcacctgatt 7260
aattaactcg aggcagcagc agctcggata gtatcgacac actctggacg ctggtcgtgt 7320
gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc cgcttttatc 7380
aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg 7440
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 7500
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 7560
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 7620
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctt 7680
gagctccagc cacggcaaca ccgcgcgcct tgcggccgag cacggcgaca agaacctgag 7740
caagatctgc gggctgatcg ccagcgacga gggccggcac gagatcgcct acacgcgcat 7800
cgtggacgag ttcttccgcc tcgaccccga gggcgccgtc gccgcctacg ccaacatgat 7860
gcgcaagcag atcaccatgc ccgcgcacct catggacgac atgggccacg gcgaggccaa 7920
cccgggccgc aacctcttcg ccgacttctc cgcggtcgcc gagaagatcg acgtctacga 7980
cgccgaggac tactgccgca tcctggagca cctcaacgcg cgctggaagg tggacgagcg 8040
ccaggtcagc ggccaggccg ccgcggacca ggagtacgtc ctgggcctgc cccagcgctt 8100
ccggaaactc gccgagaaga ccgccgccaa gcgcaagcgc gtcgcgcgca ggcccgtcgc 8160
cttctcctgg agaagagcct ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat 8220
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 8280
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 8340
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 8400
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 8460
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 8520
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 8580
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 8640
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 8700
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 8760
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 8820
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 8880
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 8940
acccggtaag acacgactta tcgc 8964
<210> 231
<211> 8901
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 231
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920
cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980
caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040
gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100
gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160
acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220
cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280
gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340
ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400
cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460
gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520
cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580
tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640
tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700
ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740
cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800
acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860
ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920
gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980
gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040
attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100
tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160
gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220
tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280
gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340
acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400
tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460
aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520
atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580
aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640
gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700
gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760
ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820
attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880
gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940
ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000
caggccggtc gcagccacta gtatggctat caagacgaac aggcagcctg tggagaagcc 6060
tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 6120
gcttcgtggg cgcgccccca aggccaacgg cagcgccgtg agcctgaagt ccggcagcct 6180
gaacaccctg gaggaccccc ccagcagccc ccccccccgc accttcctga accagctgcc 6240
cgactggagc cgcctgcgca ccgccatcac caccgtgttc gtggccgccg agaagcagtt 6300
cacccgcctg gaccgcaaga gcaagcgccc cgacatgctg gtggactggt tcggcagcga 6360
gaccatcgtg caggacggcc tggtgttccg cgagcgcttc agcatccgca gctacgagat 6420
cggcgccgac cgcaccgcca gcatcgagac cctgatgaac cacctgcagg acaccagcct 6480
gaaccactgc aagagcgtgg gcctgctgaa cgacggcttc ggccgcaccc ccgagatgtg 6540
cacccgcgac ctgatctggg tgctgaccaa gatgcagatc gtggtgaacc gctaccccac 6600
ctggggcgac accgtggaga tcaacagctg gttcagccag agcggcaaga tcggcatggg 6660
ccgcgagtgg ctgatcagcg actgcaacac cggcgagatc ctggtgcgcg ccaccagcgc 6720
ctgggccatg atgaaccaga agacccgccg cttcagcaag ctgccctgcg aggtgcgcca 6780
ggagatcgcc ccccacttcg tggacgcccc ccccgtgatc gaggacaacg accgcaagct 6840
gcacaagttc gacgtgaaga ccggcgacag catctgcaag ggcctgaccc ccggctggaa 6900
cgacttcgac gtgaaccagc acgtgagcaa cgtgaagtac atcggctgga ttctggagag 6960
catgcccacc gaggtgctgg agacccagga gctgtgcagc ctgaccctgg agtaccgccg 7020
cgagtgcggc cgcgagagcg tggtggagag cgtgaccagc atgaacccca gcaaggtggg 7080
cgaccgcagc cagtaccagc acctgctgcg cctggaggac ggcgccgaca tcatgaaggg 7140
ccgcaccgag tggcgcccca agaacgccgg caccaaccgc gccatcagca cctgattaat 7200
taactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg gtcgtgtgat 7260
ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc ttttatcaaa 7320
cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc 7380
tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt gcatcccaac 7440
cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct gctcactgcc 7500
cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa cctgtaaacc 7560
agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg aaagcttgag 7620
ctccagccac ggcaacaccg cgcgccttgc ggccgagcac ggcgacaaga acctgagcaa 7680
gatctgcggg ctgatcgcca gcgacgaggg ccggcacgag atcgcctaca cgcgcatcgt 7740
ggacgagttc ttccgcctcg accccgaggg cgccgtcgcc gcctacgcca acatgatgcg 7800
caagcagatc accatgcccg cgcacctcat ggacgacatg ggccacggcg aggccaaccc 7860
gggccgcaac ctcttcgccg acttctccgc ggtcgccgag aagatcgacg tctacgacgc 7920
cgaggactac tgccgcatcc tggagcacct caacgcgcgc tggaaggtgg acgagcgcca 7980
ggtcagcggc caggccgccg cggaccagga gtacgtcctg ggcctgcccc agcgcttccg 8040
gaaactcgcc gagaagaccg ccgccaagcg caagcgcgtc gcgcgcaggc ccgtcgcctt 8100
ctcctggaga agagcctcta gagtcgacct gcaggcatgc aagcttggcg taatcatggt 8160
catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg 8220
gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt 8280
tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 8340
gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg 8400
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 8460
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 8520
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 8580
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 8640
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 8700
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 8760
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 8820
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 8880
cggtaagaca cgacttatcg c 8901
<210> 232
<211> 12406
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 232
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940
tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000
cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060
accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120
acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180
tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240
tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300
acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360
acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420
tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480
agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540
acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600
acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660
tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720
tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780
tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840
ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900
ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960
cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020
cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080
tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140
cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200
aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260
acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320
accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380
agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440
tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500
acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920
agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980
tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040
tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100
ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160
cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220
tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280
gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340
tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400
tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460
tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520
tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580
tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640
gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700
catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760
tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820
ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880
tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940
tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000
ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060
actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120
ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180
cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag cccatatggc 6240
ttccgcggca ttcaccatgt cggcgtgccc cgcgatgact ggcagggccc ctggggcacg 6300
tcgctccgga cggccagtcg ccacccgcct gaggtacgta ttccagtgcc tggtggccag 6360
ctgcatcgac ccctgcgacc agtaccgcag cagcgccagc ctgagcttcc tgggcgacaa 6420
cggcttcgcc agcctgttcg gcagcaagcc cttcatgagc aaccgcggcc accgccgcct 6480
gcgccgcgcc agccacagcg gcgaggccat ggccgtggcc ctgcagcccg cccaggaggc 6540
cggcaccaag aagaagcccg tgatcaagca gcgccgcgtg gtggtgaccg gcatgggcgt 6600
ggtgaccccc ctgggccacg agcccgacgt gttctacaac aacctgctgg acggcgtgag 6660
cggcatcagc gagatcgaga ccttcgactg cacccagttc cccacccgca tcgccggcga 6720
gatcaagagc ttcagcaccg acggctgggt ggcccccaag ctgagcaagc gcatggacaa 6780
gttcatgctg tacctgctga ccgccggcaa gaaggccctg gccgacggcg gcatcaccga 6840
cgaggtgatg aaggagctgg acaagcgcaa gtgcggcgtg ctgatcggca gcggcatggg 6900
cggcatgaag gtgttcaacg acgccatcga ggccctgcgc gtgagctaca agaagatgaa 6960
ccccttctgc gtgcccttcg ccaccaccaa catgggcagc gccatgctgg ccatggacct 7020
gggctggatg ggccccaact acagcatcag caccgcctgc gccaccagca acttctgcat 7080
cctgaacgcc gccaaccaca tcatccgcgg cgaggccgac atgatgctgt gcggcggcag 7140
cgacgccgtg atcatcccca tcggcctggg cggcttcgtg gcctgccgcg ccctgagcca 7200
gcgcaacagc gaccccacca aggccagccg cccctgggac agcaaccgcg acggcttcgt 7260
gatgggcgag ggcgccggcg tgctgctgct ggaggagctg gagcacgcca agaagcgcgg 7320
cgccaccatc tacgccgagt tcctgggcgg cagcttcacc tgcgacgcct accacatgac 7380
cgagccccac cccgagggcg ccggcgtgat cctgtgcatc gagaaggccc tggcccaggc 7440
cggcgtgagc aaggaggacg tgaactacat caacgcccac gccaccagca ccagcgccgg 7500
cgacatcaag gagtaccagg ccctggcccg ctgcttcggc cagaacagcg agctgcgcgt 7560
gaacagcacc aagagcatga tcggccacct gctgggcgcc gccggcggcg tggaggccgt 7620
gaccgtggtg caggccatcc gcaccggctg gattcacccc aacctgaacc tggaggaccc 7680
cgacaaggcc gtggacgcca agctgctggt gggccccaag aaggagcgcc tgaacgtgaa 7740
ggtgggcctg agcaacagct tcggcttcgg cggccacaac agcagcatcc tgttcgcccc 7800
ctgcaacgtg tgaatgcata cggagcgtcg tgcgggaggg agtgtgccga gcggggagtc 7860
ccggtctgtg cgaggcccgg cagctgacgc tggcgagccg tacgccccga gggtccccct 7920
cccctccccc ctcttcccct tccctctgac ggccgcgcct gtttttgcat gttcagcgac 7980
cttaaggatc taagtaagat tcgaagcgct cgaccgtgcc ggacggactg cagccccatg 8040
tcgtagtgac cgccaatgta agtgggctgg cgtttccctg tacgtgactc aacgtcactg 8100
cacgcgcacc accctctcga ccggcaggac caggcatcgc gagatacagc gcgagccaga 8160
cacggagtgc cgagctatgc gcacgctcca actagatatc gaattcggcc gacaggacgc 8220
gcgtcaaagg tgctggtcgt gtatgccctg gccggcaggt cgttgctgct gctggttagt 8280
gattccgcaa ccctgatttt ggcgtcttat tttggcgtgg caaacgctgg cgcccgcgag 8340
ccgggccggc ggcgatgcgg tgccccacgg ctgccggaat ccaagggagg caagagcgcc 8400
cgggtcagtt gaagggcttt acgcgcaagg tacagccgct cctgcaaggc tgcgtggtgg 8460
aattggacgt gcaggtcctg ctgaagttcc tccaccgcct caccagcgga caaagcaccg 8520
gtgtatcagg tccgtgtcat ccactctaaa gaactcgact acgacctact gatggcccta 8580
gattcttcat caaaaacgcc tgagacactt gcccaggatt gaaactccct gaagggacca 8640
ccaggggccc tgagttgttc cttccccccg tggcgagctg ccagccaggc tgtacctgtg 8700
atcgaggctg gcgggaaaat aggcttcgtg tgctcaggtc atgggaggtg caggacagct 8760
catgaaacgc caacaatcgc acaattcatg tcaagctaat cagctatttc ctcttcacga 8820
gctgtaattg tcccaaaatt ctggtctacc gggggtgatc cttcgtgtac gggcccttcc 8880
ctcaacccta ggtatgcgcg catgcggtcg ccgcgcaact cgcgcgaggg ccgagggttt 8940
gggacgggcc gtcccgaaat gcagttgcac ccggatgcgt ggcacctttt ttgcgataat 9000
ttatgcaatg gactgctctg caaaattctg gctctgtcgc caaccctagg atcagcggcg 9060
taggatttcg taatcattcg tcctgatggg gagctaccga ctaccctaat atcagcccga 9120
ctgcctgacg ccagcgtcca cttttgtgca cacattccat tcgtgcccaa gacatttcat 9180
tgtggtgcga agcgtcccca gttacgctca cctgtttccc gacctcctta ctgttctgtc 9240
gacagagcgg gcccacaggc cggtcgcagc cactagtatg gccaccgcat ccactttctc 9300
ggcgttcaat gcccgctgcg gcgacctgcg tcgctcggcg ggctccgggc cccggcgccc 9360
agcgaggccc ctccccgtgc gcgggcgcgc ccccaaggcc aacggcagcg ccgtgagcct 9420
gaagtccggc agcctgaaca ccctggagga cccccccagc agcccccccc cccgcacctt 9480
cctgaaccag ctgcccgact ggagccgcct gcgcaccgcc atcaccaccg tgttcgtggc 9540
cgccgagaag cagttcaccc gcctggaccg caagagcaag cgccccgaca tgctggtgga 9600
ctggttcggc agcgagacca tcgtgcagga cggcctggtg ttccgcgagc gcttcagcat 9660
ccgcagctac gagatcggcg ccgaccgcac cgccagcatc gagaccctga tgaaccacct 9720
gcaggacacc agcctgaacc actgcaagag cgtgggcctg ctgaacgacg gcttcggccg 9780
cacccccgag atgtgcaccc gcgacctgat ctgggtgctg accaagatgc agatcgtggt 9840
gaaccgctac cccacctggg gcgacaccgt ggagatcaac agctggttca gccagagcgg 9900
caagatcggc atgggccgcg agtggctgat cagcgactgc aacaccggcg agatcctggt 9960
gcgcgccacc agcgcctggg ccatgatgaa ccagaagacc cgccgcttca gcaagctgcc 10020
ctgcgaggtg cgccaggaga tcgcccccca cttcgtggac gccccccccg tgatcgagga 10080
caacgaccgc aagctgcaca agttcgacgt gaagaccggc gacagcatct gcaagggcct 10140
gacccccggc tggaacgact tcgacgtgaa ccagcacgtg agcaacgtga agtacatcgg 10200
ctggattctg gagagcatgc ccaccgaggt gctggagacc caggagctgt gcagcctgac 10260
cctggagtac cgccgcgagt gcggccgcga gagcgtggtg gagagcgtga ccagcatgaa 10320
ccccagcaag gtgggcgacc gcagccagta ccagcacctg ctgcgcctgg aggacggcgc 10380
cgacatcatg aagggccgca ccgagtggcg ccccaagaac gccggcacca accgcgccat 10440
cagcacctga ttaattaact cgaggcagca gcagctcgga tagtatcgac acactctgga 10500
cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt gaatatccct 10560
gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt 10620
gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct cgtttcatat 10680
cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc gctgctcctg 10740
ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt ctcctggtac 10800
tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga tgggaacaca 10860
aatggaaagc ttgagctctt gttttccaga aggagttgct ccttgagcct ttcattctca 10920
gcctcgataa cctccaaagc cgctctaatt gtggaggggg ttcgaattta aaagcttgga 10980
atgttggttc gtgcgtctgg aacaagccca gacttgttgc tcactgggaa aaggaccatc 11040
agctccaaaa aacttgccgc tcaaaccgcg tacctctgct ttcgcgcaat ctgccctgtt 11100
gaaatcgcca ccacattcat attgtgacgc ttgagcagtc tgtaattgcc tcagaatgtg 11160
gaatcatctg ccccctgtgc gagcccatgc caggcatgtc gcgggcgagg acacccgcca 11220
ctcgtacagc agaccattat gctacctcac aatagttcat aacagtgacc atatttctcg 11280
aagctcccca acgagcacct ccatgctctg agtggccacc ccccggccct ggtgcttgcg 11340
gagggcaggt caaccggcat ggggctaccg aaatccccga ccggatccca ccacccccgc 11400
gatgggaaga atctctcccc gggatgtggg cccaccacca gcacaacctg ctggcccagg 11460
cgagcgtcaa accataccac acaaatatcc ttggcatcgg ccctgaattc cttctgccgc 11520
tctgctaccc ggtgcttctg tccgaagcag gggttgctag ggatcgctcc gagtccgcaa 11580
acccttgtcg cgtggcgggg cttgttcgag cttgaagagc ctctagagtc gacctgcagg 11640
catgcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 11700
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 11760
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 11820
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 11880
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 11940
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 12000
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 12060
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 12120
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 12180
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 12240
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 12300
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 12360
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgc 12406
<210> 233
<211> 9362
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 233
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgggctgg tctgaatcct tcaggcgggt 1920
gttacccgag aaagaaaggg tgccgatttc aaagcagacc catgtgccgg gccctgtggc 1980
ctgtgttggc gcctatgtag tcaccccccc tcacccaatt gtcgccagtt tgcgcactcc 2040
ataaactcaa aacagcagct tctgagctgc gctgttcaag aacacctctg gggtttgctc 2100
acccgcgagg tcgacgccca gcatggctat caagacgaac aggcagcctg tggagaagcc 2160
tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 2220
gcttcgtagc agcatgtacc tggcctttga catcgcggtc atgtccctgc tctacgtcgc 2280
gtcgacgtac atcgaccctg caccggtgcc tacgtgggtc aagtacggca tcatgtggcc 2340
gctctactgg ttcttccagg tgtgtttgag ggttttggtt gcccgtattg aggtcctggt 2400
ggcgcgcatg gaggagaagg cgcctgtccc gctgaccccc ccggctaccc tcccggcacc 2460
ttccagggcg ccttcggcac gggtgtctgg gtgtgcgcgc acgagtgcgg ccaccaggcc 2520
ttttcctcca gccaggccat caacgacggc gtgggcctgg tgttccacag cctgctgctg 2580
gtgccctact actcctggaa gcactcgcac cgggtaccct ttcttgcgct atgacacttc 2640
cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat 2700
gcttcgaccc cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg 2760
agcgctgttt aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc 2820
atattcaaac acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac 2880
tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac tctagaatat 2940
caatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct 3000
ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga 3060
tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc 3120
agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg 3180
acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg 3240
gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca 3300
ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg 3360
agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc 3420
ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct 3480
cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct 3540
ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct 3600
accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct 3660
actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt 3720
acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg 3780
tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg 3840
ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca 3900
acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg 3960
ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg 4020
ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg 4080
tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca 4140
cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg 4200
accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc 4260
gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg 4320
tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc 4380
tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct 4440
acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc 4500
tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc 4560
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 4620
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 4680
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 4740
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 4800
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 4860
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 4920
ggaagtagtg ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag 4980
gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct 5040
gacgaatgcg cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt 5100
tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag 5160
ggatatcgaa ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc 5220
ggcaggtcgt tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt 5280
ggcgtggcaa acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg 5340
ccggaatcca agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac 5400
agccgctcct gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc 5460
accgcctcac cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagaa 5520
ctcgactacg acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc 5580
caggattgaa actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg 5640
cgagctgcca gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc 5700
tcaggtcatg ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca 5760
agctaatcag ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg 5820
ggtgatcctt cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg 5880
cgcaactcgc gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg 5940
gatgcgtggc accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct 6000
ctgtcgccaa ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag 6060
ctaccgacta ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac 6120
attccattcg tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct 6180
gtttcccgac ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac 6240
tagtatggcc accgcatcca ctttctcggc gttcaatgcc cgctgcggcg acctgcgtcg 6300
ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc cccgtgcgcg ggcgcgccgc 6360
caccggcgag cagccctccg gcgtggcctc cctgcgcgag gccgacaagg agaagtccct 6420
gggcaaccgc ctgcgcctgg gctccctgac cgaggacggc ctgtcctaca aggagaagtt 6480
cgtgatccgc tgctacgagg tgggcatcaa caagaccgcc accatcgaga ccatcgccaa 6540
cctgctgcag gaggtgggcg gcaaccacgc ccagggcgtg ggcttctcca ccgacggctt 6600
cgccaccacc accaccatgc gcaagctgca cctgatctgg gtgaccgccc gcatgcacat 6660
cgagatctac cgctaccccg cctggtccga cgtgatcgag atcgagacct gggtgcaggg 6720
cgagggcaag gtgggcaccc gccgcgactg gatcctgaag gactacgcca acggcgaggt 6780
gatcggccgc gccacctcca agtgggtgat gatgaacgag gacacccgcc gcctgcagaa 6840
ggtgtccgac gacgtgcgcg aggagtacct ggtgttctgc ccccgcaccc tgcgcctggc 6900
cttccccgag gagaacaaca actccatgaa gaagatcccc aagctggagg accccgccga 6960
gtactcccgc ctgggcctgg tgccccgccg ctccgacctg gacatgaaca agcacgtgaa 7020
caacgtgacc tacatcggct gggccctgga gtccatcccc cccgagatca tcgacaccca 7080
cgagctgcag gccatcaccc tggactaccg ccgcgagtgc cagcgcgacg acatcgtgga 7140
ctccctgacc tcccgcgagc ccctgggcaa cgccgccggc gtgaagttca aggagatcaa 7200
cggctccgtg tcccccaaga aggacgagca ggacctgtcc cgcttcatgc acctgctgcg 7260
ctccgccggc tccggcctgg agatcaaccg ctgccgcacc gagtggcgca agaagcccgc 7320
caagcgcatg gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa 7380
ggacgacgac gacaagtgaa tcgatagatc tcttaaggca gcagcagctc ggatagtatc 7440
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 7500
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 7560
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 7620
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 7680
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 7740
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 7800
ggatgggaac acaaatggaa agcttaatta agagctcccg ccaccactcc aacacggggt 7860
gcctggacaa ggacgaggtg tttgtgccgc cgcaccgcgc agtggcgcac gagggcctgg 7920
agtgggagga gtggctgccc atccgcatgg gcaaggtgct ggtcaccctg accctgggct 7980
ggccgctgta cctcatgttc aacgtcgcct cgcggccgta cccgcgcttc gccaaccact 8040
ttgacccgtg gtcgcccatc ttcagcaagc gcgagcgcat cgaggtggtc atctccgacc 8100
tggcgctggt ggcggtgctc agcgggctca gcgtgctggg ccgcaccatg ggctgggcct 8160
ggctggtcaa gacctacgtg gtgccctacc tgatcgtgaa catgtggctc gtgctcatca 8220
cgctgctcca gcacacgcac ccggcgctgc cgcactactt cgagaaggac tgggactggc 8280
tgcgcggcgc catggccacc gtggaccgct ccatgggccc gcccttcatg gacaacatcc 8340
tgcaccacat ctccgacacc cacgtgctgc accacctctt cagcaccatc ccgcactacc 8400
acgccgagga ggcctccgcc gccatcaggc ccatcctggg caagtactac cagtccgaca 8460
gccgctgggt cggccgcgcc ctgtgggagg actggcgcga ctgccgctac gtcgtcccgg 8520
acgcgcccga ggacgactcc gcgctctggt tccacaagtg agtgagtgag aagagcctct 8580
agagtcgacc tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg 8640
aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc 8700
ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt 8760
ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg 8820
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 8880
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 8940
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 9000
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 9060
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 9120
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 9180
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 9240
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 9300
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 9360
gc 9362
<210> 234
<211> 8609
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 234
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgggctgg tctgaatcct tcaggcgggt 1920
gttacccgag aaagaaaggg tgccgatttc aaagcagacc catgtgccgg gccctgtggc 1980
ctgtgttggc gcctatgtag tcaccccccc tcacccaatt gtcgccagtt tgcgcactcc 2040
ataaactcaa aacagcagct tctgagctgc gctgttcaag aacacctctg gggtttgctc 2100
acccgcgagg tcgacgccca gcatggctat caagacgaac aggcagcctg tggagaagcc 2160
tccgttcacg atcgggacgc tgcgcaaggc catccccgcg cactgtttcg agcgctcggc 2220
gcttcgtagc agcatgtacc tggcctttga catcgcggtc atgtccctgc tctacgtcgc 2280
gtcgacgtac atcgaccctg caccggtgcc tacgtgggtc aagtacggca tcatgtggcc 2340
gctctactgg ttcttccagg tgtgtttgag ggttttggtt gcccgtattg aggtcctggt 2400
ggcgcgcatg gaggagaagg cgcctgtccc gctgaccccc ccggctaccc tcccggcacc 2460
ttccagggcg ccttcggcac gggtgtctgg gtgtgcgcgc acgagtgcgg ccaccaggcc 2520
ttttcctcca gccaggccat caacgacggc gtgggcctgg tgttccacag cctgctgctg 2580
gtgccctact actcctggaa gcactcgcac cgggtaccct ttcttgcgct atgacacttc 2640
cagcaaaagg tagggcgggc tgcgagacgg cttcccggcg ctgcatgcaa caccgatgat 2700
gcttcgaccc cccgaagctc cttcggggct gcatgggcgc tccgatgccg ctccagggcg 2760
agcgctgttt aaatagccag gcccccgatt gcaaagacat tatagcgagc taccaaagcc 2820
atattcaaac acctagatca ctaccacttc tacacaggcc actcgagctt gtgatcgcac 2880
tccgctaagg gggcgcctct tcctcttcgt ttcagtcaca acccgcaaac tctagaatat 2940
caatgctgct gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct 3000
ccatgacgaa cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga 3060
tgaacgaccc caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc 3120
agtacaaccc gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg 3180
acgacctgac caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg 3240
gcgccttctc cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca 3300
ccatcgaccc gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg 3360
agcagtacat ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc 3420
ccgtgctggc cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct 3480
cccagaagtg gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct 3540
ccgacgacct gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct 3600
accagtacga gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct 3660
actgggtgat gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt 3720
acttcgtcgg cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg 3780
tggacttcgg caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg 3840
ggagcgccct gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca 3900
acccctggcg ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg 3960
ccaacccgga gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg 4020
ccggcccctg gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg 4080
tcgacctgtc caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca 4140
cccagacgat ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg 4200
accccgagga gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc 4260
gcgggaacag caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg 4320
tgaacaacca gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc 4380
tggaccagaa catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct 4440
acttcatgac caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc 4500
tgttctacat cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc 4560
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 4620
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 4680
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 4740
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 4800
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 4860
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 4920
ggaagtagtg ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag 4980
gaacgctgaa ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct 5040
gacgaatgcg cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt 5100
tggcgaggtg gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag 5160
ggatatcgaa ttcctttctt gcgctatgac acttccagca aaaggtaggg cgggctgcga 5220
gacggcttcc cggcgctgca tgcaacaccg atgatgcttc gaccccccga agctccttcg 5280
gggctgcatg ggcgctccga tgccgctcca gggcgagcgc tgtttaaata gccaggcccc 5340
cgattgcaaa gacattatag cgagctacca aagccatatt caaacaccta gatcactacc 5400
acttctacac aggccactcg agcttgtgat cgcactccgc taagggggcg cctcttcctc 5460
ttcgtttcag tcacaacccg caaacactag tatggccacc gcatccactt tctcggcgtt 5520
caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc gggccccggc gcccagcgag 5580
gcccctcccc gtgcgcgggc gcgccgccac cggcgagcag ccctccggcg tggcctccct 5640
gcgcgaggcc gacaaggaga agtccctggg caaccgcctg cgcctgggct ccctgaccga 5700
ggacggcctg tcctacaagg agaagttcgt gatccgctgc tacgaggtgg gcatcaacaa 5760
gaccgccacc atcgagacca tcgccaacct gctgcaggag gtgggcggca accacgccca 5820
gggcgtgggc ttctccaccg acggcttcgc caccaccacc accatgcgca agctgcacct 5880
gatctgggtg accgcccgca tgcacatcga gatctaccgc taccccgcct ggtccgacgt 5940
gatcgagatc gagacctggg tgcagggcga gggcaaggtg ggcacccgcc gcgactggat 6000
cctgaaggac tacgccaacg gcgaggtgat cggccgcgcc acctccaagt gggtgatgat 6060
gaacgaggac acccgccgcc tgcagaaggt gtccgacgac gtgcgcgagg agtacctggt 6120
gttctgcccc cgcaccctgc gcctggcctt ccccgaggag aacaacaact ccatgaagaa 6180
gatccccaag ctggaggacc ccgccgagta ctcccgcctg ggcctggtgc cccgccgctc 6240
cgacctggac atgaacaagc acgtgaacaa cgtgacctac atcggctggg ccctggagtc 6300
catccccccc gagatcatcg acacccacga gctgcaggcc atcaccctgg actaccgccg 6360
cgagtgccag cgcgacgaca tcgtggactc cctgacctcc cgcgagcccc tgggcaacgc 6420
cgccggcgtg aagttcaagg agatcaacgg ctccgtgtcc cccaagaagg acgagcagga 6480
cctgtcccgc ttcatgcacc tgctgcgctc cgccggctcc ggcctggaga tcaaccgctg 6540
ccgcaccgag tggcgcaaga agcccgccaa gcgcatggac tacaaggacc acgacggcga 6600
ctacaaggac cacgacatcg actacaagga cgacgacgac aagtgaatcg atagatctct 6660
taaggcagca gcagctcgga tagtatcgac acactctgga cgctggtcgt gtgatggact 6720
gttgccgcca cacttgctgc cttgacctgt gaatatccct gccgctttta tcaaacagcc 6780
tcagtgtgtt tgatcttgtg tgtacgcgct tttgcgagtt gctagctgct tgtgctattt 6840
gcgaatacca cccccagcat ccccttccct cgtttcatat cgcttgcatc ccaaccgcaa 6900
cttatctacg ctgtcctgct atccctcagc gctgctcctg ctcctgctca ctgcccctcg 6960
cacagccttg gtttgggctc cgcctgtatt ctcctggtac tgcaacctgt aaaccagcac 7020
tgcaatgctg atgcacggga agtagtggga tgggaacaca aatggaaagc ttaattaaga 7080
gctcccgcca ccactccaac acggggtgcc tggacaagga cgaggtgttt gtgccgccgc 7140
accgcgcagt ggcgcacgag ggcctggagt gggaggagtg gctgcccatc cgcatgggca 7200
aggtgctggt caccctgacc ctgggctggc cgctgtacct catgttcaac gtcgcctcgc 7260
ggccgtaccc gcgcttcgcc aaccactttg acccgtggtc gcccatcttc agcaagcgcg 7320
agcgcatcga ggtggtcatc tccgacctgg cgctggtggc ggtgctcagc gggctcagcg 7380
tgctgggccg caccatgggc tgggcctggc tggtcaagac ctacgtggtg ccctacctga 7440
tcgtgaacat gtggctcgtg ctcatcacgc tgctccagca cacgcacccg gcgctgccgc 7500
actacttcga gaaggactgg gactggctgc gcggcgccat ggccaccgtg gaccgctcca 7560
tgggcccgcc cttcatggac aacatcctgc accacatctc cgacacccac gtgctgcacc 7620
acctcttcag caccatcccg cactaccacg ccgaggaggc ctccgccgcc atcaggccca 7680
tcctgggcaa gtactaccag tccgacagcc gctgggtcgg ccgcgccctg tgggaggact 7740
ggcgcgactg ccgctacgtc gtcccggacg cgcccgagga cgactccgcg ctctggttcc 7800
acaagtgagt gagtgagaag agcctctaga gtcgacctgc aggcatgcaa gcttggcgta 7860
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 7920
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 7980
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8040
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8100
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8160
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8220
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8280
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8340
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 8400
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 8460
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 8520
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 8580
gtccaacccg gtaagacacg acttatcgc 8609
<210> 235
<211> 9387
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 235
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaacggcgcg ccatgctgct 2940
gcaggccttc ctgttcctgc tggccggctt cgccgccaag atcagcgcct ccatgacgaa 3000
cgagacgtcc gaccgccccc tggtgcactt cacccccaac aagggctgga tgaacgaccc 3060
caacggcctg tggtacgacg agaaggacgc caagtggcac ctgtacttcc agtacaaccc 3120
gaacgacacc gtctggggga cgcccttgtt ctggggccac gccacgtccg acgacctgac 3180
caactgggag gaccagccca tcgccatcgc cccgaagcgc aacgactccg gcgccttctc 3240
cggctccatg gtggtggact acaacaacac ctccggcttc ttcaacgaca ccatcgaccc 3300
gcgccagcgc tgcgtggcca tctggaccta caacaccccg gagtccgagg agcagtacat 3360
ctcctacagc ctggacggcg gctacacctt caccgagtac cagaagaacc ccgtgctggc 3420
cgccaactcc acccagttcc gcgacccgaa ggtcttctgg tacgagccct cccagaagtg 3480
gatcatgacc gcggccaagt cccaggacta caagatcgag atctactcct ccgacgacct 3540
gaagtcctgg aagctggagt ccgcgttcgc caacgagggc ttcctcggct accagtacga 3600
gtgccccggc ctgatcgagg tccccaccga gcaggacccc agcaagtcct actgggtgat 3660
gttcatctcc atcaaccccg gcgccccggc cggcggctcc ttcaaccagt acttcgtcgg 3720
cagcttcaac ggcacccact tcgaggcctt cgacaaccag tcccgcgtgg tggacttcgg 3780
caaggactac tacgccctgc agaccttctt caacaccgac ccgacctacg ggagcgccct 3840
gggcatcgcg tgggcctcca actgggagta ctccgccttc gtgcccacca acccctggcg 3900
ctcctccatg tccctcgtgc gcaagttctc cctcaacacc gagtaccagg ccaacccgga 3960
gacggagctg atcaacctga aggccgagcc gatcctgaac atcagcaacg ccggcccctg 4020
gagccggttc gccaccaaca ccacgttgac gaaggccaac agctacaacg tcgacctgtc 4080
caacagcacc ggcaccctgg agttcgagct ggtgtacgcc gtcaacacca cccagacgat 4140
ctccaagtcc gtgttcgcgg acctctccct ctggttcaag ggcctggagg accccgagga 4200
gtacctccgc atgggcttcg aggtgtccgc gtcctccttc ttcctggacc gcgggaacag 4260
caaggtgaag ttcgtgaagg agaaccccta cttcaccaac cgcatgagcg tgaacaacca 4320
gcccttcaag agcgagaacg acctgtccta ctacaaggtg tacggcttgc tggaccagaa 4380
catcctggag ctgtacttca acgacggcga cgtcgtgtcc accaacacct acttcatgac 4440
caccgggaac gccctgggct ccgtgaacat gacgacgggg gtggacaacc tgttctacat 4500
cgacaagttc caggtgcgcg aggtcaagtg acaattggca gcagcagctc ggatagtatc 4560
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 4620
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 4680
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 4740
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 4800
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 4860
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 4920
ggatgggaac acaaatggag gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa 4980
ggtctcgcct ctgtcgcacc tcagcgcggc atacaccaca ataaccacct gacgaatgcg 5040
cttggttctt cgtccattag cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg 5100
gcaggtgaca atgatcggtg gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa 5160
ttcggccgac aggacgcgcg tcaaaggtgc tggtcgtgta tgccctggcc ggcaggtcgt 5220
tgctgctgct ggttagtgat tccgcaaccc tgattttggc gtcttatttt ggcgtggcaa 5280
acgctggcgc ccgcgagccg ggccggcggc gatgcggtgc cccacggctg ccggaatcca 5340
agggaggcaa gagcgcccgg gtcagttgaa gggctttacg cgcaaggtac agccgctcct 5400
gcaaggctgc gtggtggaat tggacgtgca ggtcctgctg aagttcctcc accgcctcac 5460
cagcggacaa agcaccggtg tatcaggtcc gtgtcatcca ctctaaagag ctcgactacg 5520
acctactgat ggccctagat tcttcatcaa aaacgcctga gacacttgcc caggattgaa 5580
actccctgaa gggaccacca ggggccctga gttgttcctt ccccccgtgg cgagctgcca 5640
gccaggctgt acctgtgatc gaggctggcg ggaaaatagg cttcgtgtgc tcaggtcatg 5700
ggaggtgcag gacagctcat gaaacgccaa caatcgcaca attcatgtca agctaatcag 5760
ctatttcctc ttcacgagct gtaattgtcc caaaattctg gtctaccggg ggtgatcctt 5820
cgtgtacggg cccttccctc aaccctaggt atgcgcgcat gcggtcgccg cgcaactcgc 5880
gcgagggccg agggtttggg acgggccgtc ccgaaatgca gttgcacccg gatgcgtggc 5940
accttttttg cgataattta tgcaatggac tgctctgcaa aattctggct ctgtcgccaa 6000
ccctaggatc agcggcgtag gatttcgtaa tcattcgtcc tgatggggag ctaccgacta 6060
ccctaatatc agcccgactg cctgacgcca gcgtccactt ttgtgcacac attccattcg 6120
tgcccaagac atttcattgt ggtgcgaagc gtccccagtt acgctcacct gtttcccgac 6180
ctccttactg ttctgtcgac agagcgggcc cacaggccgg tcgcagccac tagtatggct 6240
tccgcggcat tcaccatgtc ggcgtgcccc gcgatgactg gcagggcccc tggggcacgt 6300
cgctccggac ggccagtcgc cacccgcctg agggggcgcg cccccaaggc caacggctcc 6360
gccgtgtccc tgaagtccgg ctccctggac acccaggagg acacctcctc ctcctcctcc 6420
cccccccgca ccttcatcaa ccagctgccc gactggtcca tgctgctgtc cgccatcacc 6480
accgtgttcg tggccgccga gaagcagtgg accatgctgg accgcaagtc caagcgcccc 6540
gacaccctga tggacccctt cggcgtggac cgcgtggtgc aggacggcgt ggtgttccgc 6600
cagtccttct ccatccgctc ctacgagatc ggcgccgacc gcaccgcctc catcgagacc 6660
ctgatgaaca tcttccagga gacctccctg aaccactgca agtccatcgg cctgctgaac 6720
gacggcttcg gccgcacccc cgagatgtgc aagcgcgacc tgatctgggt ggtgaccaag 6780
atgcacatcg aggtgaaccg ctaccccacc tggggcgaca ccatcgaggt gaacacctgg 6840
gtgtccgagt ccggcaagac cggcatgggc cgcgactggc tgatctccga ctgccacacc 6900
ggcgagatcc tgatccgcgc cacctccgtg tgcgccatga tgaaccagac cacccgccgc 6960
ttctccaagt tcccctacga ggtgcgccag gagctggccc cccacttcgt ggactccgcc 7020
cccgtgatcg aggactacca gaagctgcac aagctggacg tgaagaccgg cgactccatc 7080
tgcaacggcc tgaccccccg ctggaacgac ctggacgtga accagcacgt gaacaacgtg 7140
aagtacatcg gctggattct ggagtccgtg cccaaggagg tgttcgagac ccaggagctg 7200
tgcggcctga ccctggagta ccgccgcgag tgcggccgcg actccgtgct gaagtccgtg 7260
accgccatgg acccctccaa ggagggcgac cgctccctgt accagcacct gctgcgcctg 7320
gaggacggca ccgacatcgc caagggccgc accaagtggc gccccaagaa cgccggcacc 7380
aacggcgcca tctccaccgg caagacctcc aacggcaact ccatctcctg attaattaac 7440
tcgaggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 7500
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 7560
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 7620
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 7680
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 7740
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 7800
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggaaag cttgagctct 7860
tgttttccag aaggagttgc tccttgagcc tttcattctc agcctcgata acctccaaag 7920
ccgctctaat tgtggagggg gttcgaattt aaaagcttgg aatgttggtt cgtgcgtctg 7980
gaacaagccc agacttgttg ctcactggga aaaggaccat cagctccaaa aaacttgccg 8040
ctcaaaccgc gtacctctgc tttcgcgcaa tctgccctgt tgaaatcgcc accacattca 8100
tattgtgacg cttgagcagt ctgtaattgc ctcagaatgt ggaatcatct gccccctgtg 8160
cgagcccatg ccaggcatgt cgcgggcgag gacacccgcc actcgtacag cagaccatta 8220
tgctacctca caatagttca taacagtgac catatttctc gaagctcccc aacgagcacc 8280
tccatgctct gagtggccac cccccggccc tggtgcttgc ggagggcagg tcaaccggca 8340
tggggctacc gaaatccccg accggatccc accacccccg cgatgggaag aatctctccc 8400
cgggatgtgg gcccaccacc agcacaacct gctggcccag gcgagcgtca aaccatacca 8460
cacaaatatc cttggcatcg gccctgaatt ccttctgccg ctctgctacc cggtgcttct 8520
gtccgaagca ggggttgcta gggatcgctc cgagtccgca aacccttgtc gcgtggcggg 8580
gcttgttcga gcttgaagag cctctagagt cgacctgcag gcatgcaagc ttggcgtaat 8640
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac 8700
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa 8760
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 8820
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 8880
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 8940
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 9000
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 9060
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 9120
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 9180
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 9240
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 9300
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 9360
ccaacccggt aagacacgac ttatcgc 9387
<210> 236
<211> 7781
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 236
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatga 2940
tcgagcagga cggcctccac gccggctccc ccgccgcctg ggtggagcgc ctgttcggct 3000
acgactgggc ccagcagacc atcggctgct ccgacgccgc cgtgttccgc ctgtccgccc 3060
agggccgccc cgtgctgttc gtgaagaccg acctgtccgg cgccctgaac gagctgcagg 3120
acgaggccgc ccgcctgtcc tggctggcca ccaccggcgt gccctgcgcc gccgtgctgg 3180
acgtggtgac cgaggccggc cgcgactggc tgctgctggg cgaggtgccc ggccaggacc 3240
tgctgtcctc ccacctggcc cccgccgaga aggtgtccat catggccgac gccatgcgcc 3300
gcctgcacac cctggacccc gccacctgcc ccttcgacca ccaggccaag caccgcatcg 3360
agcgcgcccg cacccgcatg gaggccggcc tggtggacca ggacgacctg gacgaggagc 3420
accagggcct ggcccccgcc gagctgttcg cccgcctgaa ggcccgcatg cccgacggcg 3480
aggacctggt ggtgacccac ggcgacgcct gcctgcccaa catcatggtg gagaacggcc 3540
gcttctccgg cttcatcgac tgcggccgcc tgggcgtggc cgaccgctac caggacatcg 3600
ccctggccac ccgcgacatc gccgaggagc tgggcggcga gtgggccgac cgcttcctgg 3660
tgctgtacgg catcgccgcc cccgactccc agcgcatcgc cttctaccgc ctgctggacg 3720
agttcttctg acaattggca gcagcagctc ggatagtatc gacacactct ggacgctggt 3780
cgtgtgatgg actgttgccg ccacacttgc tgccttgacc tgtgaatatc cctgccgctt 3840
ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc gcttttgcga gttgctagct 3900
gcttgtgcta tttgcgaata ccacccccag catccccttc cctcgtttca tatcgcttgc 3960
atcccaaccg caacttatct acgctgtcct gctatccctc agcgctgctc ctgctcctgc 4020
tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt attctcctgg tactgcaacc 4080
tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg ggatgggaac acaaatggag 4140
gatcccgcgt ctcgaacaga gcgcgcagag gaacgctgaa ggtctcgcct ctgtcgcacc 4200
tcagcgcggc atacaccaca ataaccacct gacgaatgcg cttggttctt cgtccattag 4260
cgaagcgtcc ggttcacaca cgtgccacgt tggcgaggtg gcaggtgaca atgatcggtg 4320
gagctgatgg tcgaaacgtt cacagcctag ggatatcgaa ttcctttctt gcgctatgac 4380
acttccagca aaaggtaggg cgggctgcga gacggcttcc cggcgctgca tgcaacaccg 4440
atgatgcttc gaccccccga agctccttcg gggctgcatg ggcgctccga tgccgctcca 4500
gggcgagcgc tgtttaaata gccaggcccc cgattgcaaa gacattatag cgagctacca 4560
aagccatatt caaacaccta gatcactacc acttctacac aggccactcg agcttgtgat 4620
cgcactccgc taagggggcg cctcttcctc ttcgtttcag tcacaacccg caaacactag 4680
tatggccacc gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc 4740
ggcgggctcc gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga 4800
ctggtccatg ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac 4860
caacctggag tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc 4920
ccacggcctg gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg 4980
ctccaccagc atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa 5040
gtccgtgggc atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct 5100
gatctgggtg gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac 5160
cgtggaggtg gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct 5220
ggtgcgcgac tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat 5280
gaacacccgc acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc 5340
cgccttcatc gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa 5400
cgactccacc gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat 5460
caaccagcac gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag 5520
catcttcgag agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat 5580
ggacagcgtg ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt 5640
gtgcgagcac ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg 5700
gcgccccaag ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt 5760
gatggactac aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga 5820
cgacgacaag tgactcgagg cagcagcagc tcggatagta tcgacacact ctggacgctg 5880
gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata tccctgccgc 5940
ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc gagttgctag 6000
ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt catatcgctt 6060
gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc tcctgctcct 6120
gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct ggtactgcaa 6180
cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga acacaaatgg 6240
aaagcttgag ctcttgtttt ccagaaggag ttgctccttg agcctttcat tctcagcctc 6300
gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc ttggaatgtt 6360
ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga ccatcagctc 6420
caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc ctgttgaaat 6480
cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga atgtggaatc 6540
atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc cgccactcgt 6600
acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt tctcgaagct 6660
ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc ttgcggaggg 6720
caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc cccgcgatgg 6780
gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc ccaggcgagc 6840
gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct gccgctctgc 6900
tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc cgcaaaccct 6960
tgtcgcgtgg cggggcttgt tcgagcttga agagcctcta gagtcgacct gcaggcatgc 7020
aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 7080
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 7140
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 7200
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 7260
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 7320
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 7380
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 7440
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 7500
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 7560
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 7620
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 7680
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 7740
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg c 7781
<210> 237
<211> 8831
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 237
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940
tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000
cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060
accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120
acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180
tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240
tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300
acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360
acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420
tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480
agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540
acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600
acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660
tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720
tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780
tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840
ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900
ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960
cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020
cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080
tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140
cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200
aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260
acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320
accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380
agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440
tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500
acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920
agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980
tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040
tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100
ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160
cgaattcctt tcttgcgcta tgacacttcc agcaaaaggt agggcgggct gcgagacggc 5220
ttcccggcgc tgcatgcaac accgatgatg cttcgacccc ccgaagctcc ttcggggctg 5280
catgggcgct ccgatgccgc tccagggcga gcgctgttta aatagccagg cccccgattg 5340
caaagacatt atagcgagct accaaagcca tattcaaaca cctagatcac taccacttct 5400
acacaggcca ctcgagcttg tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt 5460
tcagtcacaa cccgcaaaca ctagtatggc caccgcatcc actttctcgg cgttcaatgc 5520
ccgctgcggc gacctgcgtc gctcggcggg ctccgggccc cggcgcccag cgaggcccct 5580
ccccgtgcgc gggcgcgccg cctccgccaa ggcctccaag accatcggcg agggctccga 5640
gaacctgaac gtgcgcggca tcatcgccaa gcccacctcc tcctccgccg ccaagcaggg 5700
caaggtgatg gcccaggccg tgcccaagat caacggcgcc aaggtgggcc tgaaggccga 5760
gtcccagaag gccgaggagg acgccgcccc ctcctccgcc ccccgcacct tctacaacca 5820
gctgcccgac tggtccgtgc tgctggccgc cgtgaccacc atcttcctgg ccgccgagaa 5880
gcagtggacc ctgctggact ggaagccccg ccgccccgac atgctgaccg gcgccttctc 5940
cctgggcaag atcgtgcagg acggcctggt gttccgccag aacttctcca tccgctccta 6000
cgagatcggc gccgaccgca ccgcctccat cgagaccctg atgaaccacc tgcaggagac 6060
cgccctgaac cacgtgcgca acgccggcct gctgggcgac ggcttcggcg ccacccccga 6120
gatgtccaag cgcaacctga tctgggtggt gaccaagatg caggtgctga tcgagcacta 6180
cccctcctgg ggcgacgtgg tggaggtgga cacctgggtg ggcgcctccg gcaagaacgg 6240
catgcgccgc gactggcacg tgcgcgacta ccgcaccggc cagaccatcc tgcgcgccac 6300
ctccatctgg gtgatgatgg acaagcacac ccgcaagctg tccaagatgc ccgaggaggt 6360
gcgcgccgag atcggcccct acttcatgga gcacgccgcc atcgtggacg aggactcccg 6420
caagctgccc aagctggacg acgacaccgc cgactacatc aagtggggcc tgaccccccg 6480
ctggtccgac ctggacgtga accagcacgt gaacaacgtg aagtacatcg gctggatcct 6540
ggagtccgcc cccatctcca tcctggagaa ccacgagctg gcctccatga ccctggagta 6600
ccgccgcgag tgcggccgcg actccgtgct gcagtccctg accgccgtgg ccaacgactg 6660
caccggcggc ctgcccgagg cctccatcga gtgccagcac ctgctgcagc tggagtgcgg 6720
cgccgagatc gtgcgcggcc gcacccagtg gcgcccccgc cgcgcctccg gccccacctc 6780
cgccggctcc gccatggact acaaggacca cgacggcgac tacaaggacc acgacatcga 6840
ctacaaggac gacgacgaca agtgaatcga tagatctctt aaggcagcag cagctcggat 6900
agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac acttgctgcc 6960
ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt gatcttgtgt 7020
gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac ccccagcatc 7080
cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta 7140
tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg tttgggctcc 7200
gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga tgcacgggaa 7260
gtagtgggat gggaacacaa atggaaagct taattaagag ctcttgtttt ccagaaggag 7320
ttgctccttg agcctttcat tctcagcctc gataacctcc aaagccgctc taattgtgga 7380
gggggttcga atttaaaagc ttggaatgtt ggttcgtgcg tctggaacaa gcccagactt 7440
gttgctcact gggaaaagga ccatcagctc caaaaaactt gccgctcaaa ccgcgtacct 7500
ctgctttcgc gcaatctgcc ctgttgaaat cgccaccaca ttcatattgt gacgcttgag 7560
cagtctgtaa ttgcctcaga atgtggaatc atctgccccc tgtgcgagcc catgccaggc 7620
atgtcgcggg cgaggacacc cgccactcgt acagcagacc attatgctac ctcacaatag 7680
ttcataacag tgaccatatt tctcgaagct ccccaacgag cacctccatg ctctgagtgg 7740
ccaccccccg gccctggtgc ttgcggaggg caggtcaacc ggcatggggc taccgaaatc 7800
cccgaccgga tcccaccacc cccgcgatgg gaagaatctc tccccgggat gtgggcccac 7860
caccagcaca acctgctggc ccaggcgagc gtcaaaccat accacacaaa tatccttggc 7920
atcggccctg aattccttct gccgctctgc tacccggtgc ttctgtccga agcaggggtt 7980
gctagggatc gctccgagtc cgcaaaccct tgtcgcgtgg cggggcttgt tcgagcttga 8040
agagcctcta gagtcgacct gcaggcatgc aagcttggcg taatcatggt catagctgtt 8100
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 8160
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 8220
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 8280
ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 8340
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 8400
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 8460
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 8520
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 8580
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 8640
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 8700
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 8760
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 8820
cgacttatcg c 8831
<210> 238
<211> 9380
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 238
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940
tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000
cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060
accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120
acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180
tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240
tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300
acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360
acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420
tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480
agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540
acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600
acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660
tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720
tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780
tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840
ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900
ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960
cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020
cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080
tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140
cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200
aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260
acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320
accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380
agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440
tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500
acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920
agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980
tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040
tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100
ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160
cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220
tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280
gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340
tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400
tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460
tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520
tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580
tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640
gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700
catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760
tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820
ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880
tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940
tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000
ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060
actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120
ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180
cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag ccactagtat 6240
ggccaccgca tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc 6300
gggctccggg ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg cctcccagct 6360
gcgcaagccc gccctggacc ccctgcgcgc cgtgatctcc gccgaccagg gctccatctc 6420
ccccgtgaac tcctgcaccc ccgccgaccg cctgcgcgcc ggccgcctga tggaggacgg 6480
ctactcctac aaggagaagt tcatcgtgcg ctcctacgag gtgggcatca acaagaccgc 6540
caccgtggag accatcgcca acctgctgca ggaggtggcc tgcaaccacg tgcagaagtg 6600
cggcttctcc accgacggct tcgccaccac cctgaccatg cgcaagctgc acctgatctg 6660
ggtgaccgcc cgcatgcaca tcgagatcta caagtacccc gcctggtccg acgtggtgga 6720
gatcgagacc tggtgccagt ccgagggccg catcggcacc cgccgcgact ggatcctgcg 6780
cgactccgcc accaacgagg tgatcggccg cgccacctcc aagtgggtga tgatgaacca 6840
ggacacccgc cgcctgcagc gcgtgaccga cgaggtgcgc gacgagtacc tggtgttctg 6900
cccccgcgag ccccgcctgg ccttccccga ggagaacaac tcctccctga agaagatccc 6960
caagctggag gaccccgccc agtactccat gctggagctg aagccccgcc gcgccgacct 7020
ggacatgaac cagcacgtga acaacgtgac ctacatcggc tgggtgctgg agtccatccc 7080
ccaggagatc atcgacaccc acgagctgca ggtgatcacc ctggactacc gccgcgagtg 7140
ccagcaggac gacatcgtgg actccctgac cacctccgag atccccgacg accccatctc 7200
caagttcacc ggcaccaacg gctccgccat gtcctccatc cagggccaca acgagtccca 7260
gttcctgcac atgctgcgcc tgtccgagaa cggccaggag atcaaccgcg gccgcaccca 7320
gtggcgcaag aagtcctccc gcatggacta caaggaccac gacggcgact acaaggacca 7380
cgacatcgac tacaaggacg acgacgacaa gtgaatcgat agatctctta aggcagcagc 7440
agctcggata gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca 7500
cttgctgcct tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg 7560
atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc 7620
cccagcatcc ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct 7680
gtcctgctat ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt 7740
ttgggctccg cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat 7800
gcacgggaag tagtgggatg ggaacacaaa tggaaagctt aattaagagc tcttgttttc 7860
cagaaggagt tgctccttga gcctttcatt ctcagcctcg ataacctcca aagccgctct 7920
aattgtggag ggggttcgaa tttaaaagct tggaatgttg gttcgtgcgt ctggaacaag 7980
cccagacttg ttgctcactg ggaaaaggac catcagctcc aaaaaacttg ccgctcaaac 8040
cgcgtacctc tgctttcgcg caatctgccc tgttgaaatc gccaccacat tcatattgtg 8100
acgcttgagc agtctgtaat tgcctcagaa tgtggaatca tctgccccct gtgcgagccc 8160
atgccaggca tgtcgcgggc gaggacaccc gccactcgta cagcagacca ttatgctacc 8220
tcacaatagt tcataacagt gaccatattt ctcgaagctc cccaacgagc acctccatgc 8280
tctgagtggc caccccccgg ccctggtgct tgcggagggc aggtcaaccg gcatggggct 8340
accgaaatcc ccgaccggat cccaccaccc ccgcgatggg aagaatctct ccccgggatg 8400
tgggcccacc accagcacaa cctgctggcc caggcgagcg tcaaaccata ccacacaaat 8460
atccttggca tcggccctga attccttctg ccgctctgct acccggtgct tctgtccgaa 8520
gcaggggttg ctagggatcg ctccgagtcc gcaaaccctt gtcgcgtggc ggggcttgtt 8580
cgagcttgaa gagcctctag agtcgacctg caggcatgca agcttggcgt aatcatggtc 8640
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 8700
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 8760
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 8820
ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 8880
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 8940
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 9000
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 9060
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 9120
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 9180
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 9240
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 9300
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 9360
ggtaagacac gacttatcgc 9380
<210> 239
<211> 9359
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 239
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940
tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000
cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060
accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120
acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180
tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240
tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300
acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360
acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420
tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480
agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540
acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600
acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660
tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720
tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780
tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840
ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900
ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960
cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020
cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080
tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140
cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200
aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260
acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320
accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380
agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440
tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500
acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920
agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980
tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040
tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100
ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160
cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220
tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280
gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340
tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400
tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460
tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520
tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580
tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640
gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700
catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760
tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820
ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880
tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940
tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000
ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060
actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120
ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180
cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag ccactagtat 6240
ggccaccgca tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc 6300
gggctccggg ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg ccgccaccgg 6360
cgagcagccc tccggcgtgg cctccctgcg cgaggccgac aaggagaagt ccctgggcaa 6420
ccgcctgcgc ctgggctccc tgaccgagga cggcctgtcc tacaaggaga agttcgtgat 6480
ccgctgctac gaggtgggca tcaacaagac cgccaccatc gagaccatcg ccaacctgct 6540
gcaggaggtg ggcggcaacc acgcccaggg cgtgggcttc tccaccgacg gcttcgccac 6600
caccaccacc atgcgcaagc tgcacctgat ctgggtgacc gcccgcatgc acatcgagat 6660
ctaccgctac cccgcctggt ccgacgtgat cgagatcgag acctgggtgc agggcgaggg 6720
caaggtgggc acccgccgcg actggatcct gaaggactac gccaacggcg aggtgatcgg 6780
ccgcgccacc tccaagtggg tgatgatgaa cgaggacacc cgccgcctgc agaaggtgtc 6840
cgacgacgtg cgcgaggagt acctggtgtt ctgcccccgc accctgcgcc tggccttccc 6900
cgaggagaac aacaactcca tgaagaagat ccccaagctg gaggaccccg ccgagtactc 6960
ccgcctgggc ctggtgcccc gccgctccga cctggacatg aacaagcacg tgaacaacgt 7020
gacctacatc ggctgggccc tggagtccat cccccccgag atcatcgaca cccacgagct 7080
gcaggccatc accctggact accgccgcga gtgccagcgc gacgacatcg tggactccct 7140
gacctcccgc gagcccctgg gcaacgccgc cggcgtgaag ttcaaggaga tcaacggctc 7200
cgtgtccccc aagaaggacg agcaggacct gtcccgcttc atgcacctgc tgcgctccgc 7260
cggctccggc ctggagatca accgctgccg caccgagtgg cgcaagaagc ccgccaagcg 7320
catggactac aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga 7380
cgacgacaag tgaatcgata gatctcttaa ggcagcagca gctcggatag tatcgacaca 7440
ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa 7500
tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt 7560
gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt 7620
ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct 7680
gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc 7740
ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg 7800
gaacacaaat ggaaagctta attaagagct cttgttttcc agaaggagtt gctccttgag 7860
cctttcattc tcagcctcga taacctccaa agccgctcta attgtggagg gggttcgaat 7920
ttaaaagctt ggaatgttgg ttcgtgcgtc tggaacaagc ccagacttgt tgctcactgg 7980
gaaaaggacc atcagctcca aaaaacttgc cgctcaaacc gcgtacctct gctttcgcgc 8040
aatctgccct gttgaaatcg ccaccacatt catattgtga cgcttgagca gtctgtaatt 8100
gcctcagaat gtggaatcat ctgccccctg tgcgagccca tgccaggcat gtcgcgggcg 8160
aggacacccg ccactcgtac agcagaccat tatgctacct cacaatagtt cataacagtg 8220
accatatttc tcgaagctcc ccaacgagca cctccatgct ctgagtggcc accccccggc 8280
cctggtgctt gcggagggca ggtcaaccgg catggggcta ccgaaatccc cgaccggatc 8340
ccaccacccc cgcgatggga agaatctctc cccgggatgt gggcccacca ccagcacaac 8400
ctgctggccc aggcgagcgt caaaccatac cacacaaata tccttggcat cggccctgaa 8460
ttccttctgc cgctctgcta cccggtgctt ctgtccgaag caggggttgc tagggatcgc 8520
tccgagtccg caaacccttg tcgcgtggcg gggcttgttc gagcttgaag agcctctaga 8580
gtcgacctgc aggcatgcaa gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 8640
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 8700
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 8760
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 8820
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 8880
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 8940
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 9000
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 9060
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 9120
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 9180
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 9240
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 9300
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgc 9359
<210> 240
<211> 9461
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 240
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttcgccgccg ccactcctgc tcgagcgcgc 1920
ccgcgcgtgc gccgccagcg ccttggcctt ttcgccgcgc tcgtgcgcgt cgctgatgtc 1980
catcaccagg tccatgaggt ctgccttgcg ccggctgagc cactgcttcg tccgggcggc 2040
caagaggagc atgagggagg actcctggtc cagggtcctg acgtggtcgc ggctctggga 2100
gcgggccagc atcatctggc tctgccgcac cgaggccgcc tccaactggt cctccagcag 2160
ccgcagtcgc cgccgaccct ggcagaggaa gacaggtgag gggggtatga attgtacaga 2220
acaaccacga gccttgtcta ggcagaatcc ctaccagtca tggctttacc tggatgacgg 2280
cctgcgaaca gctgtccagc gaccctcgct gccgccgctt ctcccgcacg cttctttcca 2340
gcaccgtgat ggcgcgagcc agcgccgcac gctggcgctg cgcttcgccg atctgaggac 2400
agtcggggaa ctctgatcag tctaaacccc cttgcgcgtt agtgttgcca tcctttgcag 2460
accggtgaga gccgacttgt tgtgcgccac cccccacacc acctcctccc agaccaattc 2520
tgtcaccttt ttggcgaagg catcggcctc ggcctgcaga gaggacagca gtgcccagcc 2580
gctgggggtt ggcggatgca cgctcaggta ccctttcttg cgctatgaca cttccagcaa 2640
aaggtagggc gggctgcgag acggcttccc ggcgctgcat gcaacaccga tgatgcttcg 2700
accccccgaa gctccttcgg ggctgcatgg gcgctccgat gccgctccag ggcgagcgct 2760
gtttaaatag ccaggccccc gattgcaaag acattatagc gagctaccaa agccatattc 2820
aaacacctag atcactacca cttctacaca ggccactcga gcttgtgatc gcactccgct 2880
aagggggcgc ctcttcctct tcgtttcagt cacaacccgc aaactctaga atatcaatgc 2940
tgctgcaggc cttcctgttc ctgctggccg gcttcgccgc caagatcagc gcctccatga 3000
cgaacgagac gtccgaccgc cccctggtgc acttcacccc caacaagggc tggatgaacg 3060
accccaacgg cctgtggtac gacgagaagg acgccaagtg gcacctgtac ttccagtaca 3120
acccgaacga caccgtctgg gggacgccct tgttctgggg ccacgccacg tccgacgacc 3180
tgaccaactg ggaggaccag cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct 3240
tctccggctc catggtggtg gactacaaca acacctccgg cttcttcaac gacaccatcg 3300
acccgcgcca gcgctgcgtg gccatctgga cctacaacac cccggagtcc gaggagcagt 3360
acatctccta cagcctggac ggcggctaca ccttcaccga gtaccagaag aaccccgtgc 3420
tggccgccaa ctccacccag ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga 3480
agtggatcat gaccgcggcc aagtcccagg actacaagat cgagatctac tcctccgacg 3540
acctgaagtc ctggaagctg gagtccgcgt tcgccaacga gggcttcctc ggctaccagt 3600
acgagtgccc cggcctgatc gaggtcccca ccgagcagga ccccagcaag tcctactggg 3660
tgatgttcat ctccatcaac cccggcgccc cggccggcgg ctccttcaac cagtacttcg 3720
tcggcagctt caacggcacc cacttcgagg ccttcgacaa ccagtcccgc gtggtggact 3780
tcggcaagga ctactacgcc ctgcagacct tcttcaacac cgacccgacc tacgggagcg 3840
ccctgggcat cgcgtgggcc tccaactggg agtactccgc cttcgtgccc accaacccct 3900
ggcgctcctc catgtccctc gtgcgcaagt tctccctcaa caccgagtac caggccaacc 3960
cggagacgga gctgatcaac ctgaaggccg agccgatcct gaacatcagc aacgccggcc 4020
cctggagccg gttcgccacc aacaccacgt tgacgaaggc caacagctac aacgtcgacc 4080
tgtccaacag caccggcacc ctggagttcg agctggtgta cgccgtcaac accacccaga 4140
cgatctccaa gtccgtgttc gcggacctct ccctctggtt caagggcctg gaggaccccg 4200
aggagtacct ccgcatgggc ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga 4260
acagcaaggt gaagttcgtg aaggagaacc cctacttcac caaccgcatg agcgtgaaca 4320
accagccctt caagagcgag aacgacctgt cctactacaa ggtgtacggc ttgctggacc 4380
agaacatcct ggagctgtac ttcaacgacg gcgacgtcgt gtccaccaac acctacttca 4440
tgaccaccgg gaacgccctg ggctccgtga acatgacgac gggggtggac aacctgttct 4500
acatcgacaa gttccaggtg cgcgaggtca agtgacaatt ggcagcagca gctcggatag 4560
tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac ttgctgcctt 4620
gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga tcttgtgtgt 4680
acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc ccagcatccc 4740
cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg tcctgctatc 4800
cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt tgggctccgc 4860
ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg cacgggaagt 4920
agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc 4980
tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc acctgacgaa 5040
tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc acgttggcga 5100
ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc ctagggatat 5160
cgaattcggc cgacaggacg cgcgtcaaag gtgctggtcg tgtatgccct ggccggcagg 5220
tcgttgctgc tgctggttag tgattccgca accctgattt tggcgtctta ttttggcgtg 5280
gcaaacgctg gcgcccgcga gccgggccgg cggcgatgcg gtgccccacg gctgccggaa 5340
tccaagggag gcaagagcgc ccgggtcagt tgaagggctt tacgcgcaag gtacagccgc 5400
tcctgcaagg ctgcgtggtg gaattggacg tgcaggtcct gctgaagttc ctccaccgcc 5460
tcaccagcgg acaaagcacc ggtgtatcag gtccgtgtca tccactctaa agaactcgac 5520
tacgacctac tgatggccct agattcttca tcaaaaacgc ctgagacact tgcccaggat 5580
tgaaactccc tgaagggacc accaggggcc ctgagttgtt ccttcccccc gtggcgagct 5640
gccagccagg ctgtacctgt gatcgaggct ggcgggaaaa taggcttcgt gtgctcaggt 5700
catgggaggt gcaggacagc tcatgaaacg ccaacaatcg cacaattcat gtcaagctaa 5760
tcagctattt cctcttcacg agctgtaatt gtcccaaaat tctggtctac cgggggtgat 5820
ccttcgtgta cgggcccttc cctcaaccct aggtatgcgc gcatgcggtc gccgcgcaac 5880
tcgcgcgagg gccgagggtt tgggacgggc cgtcccgaaa tgcagttgca cccggatgcg 5940
tggcaccttt tttgcgataa tttatgcaat ggactgctct gcaaaattct ggctctgtcg 6000
ccaaccctag gatcagcggc gtaggatttc gtaatcattc gtcctgatgg ggagctaccg 6060
actaccctaa tatcagcccg actgcctgac gccagcgtcc acttttgtgc acacattcca 6120
ttcgtgccca agacatttca ttgtggtgcg aagcgtcccc agttacgctc acctgtttcc 6180
cgacctcctt actgttctgt cgacagagcg ggcccacagg ccggtcgcag ccactagtat 6240
ggccaccgca tccactttct cggcgttcaa tgcccgctgc ggcgacctgc gtcgctcggc 6300
gggctccggg ccccggcgcc cagcgaggcc cctccccgtg cgcgggcgcg ccgccaacgc 6360
ccaggccccc accaagatca acggctccac cgacgacgcc cagctgcccg ccccccgcac 6420
cttcatcaac cagctgcccg actggtccat gctgctggcc gccatcacca ccgtgttcct 6480
ggccgccgag aagcagtgga tgatgctgga ctggaagccc cgccgccccg acatgctgat 6540
cgacaccttc ggcctgggcc gcatcgtgca ggacggcctg gtgttccgcc agaacttctc 6600
catccgctcc tacgagatcg gcgccgaccg caccgcctcc atcgagaccg tgatgaacca 6660
cctgcaggag accgccctga accacgtgaa gaccgccggc ctgctgggcg acggcttcgg 6720
ctccaccccc gagatgtcca agcgcaacct gatctgggtg gtgaccaaga tgcaggtgga 6780
ggtggaccgc taccccacct ggggcgacgt ggtgcaggtg gacacctggg tgtccgcctc 6840
cggcaagaac ggcatgcgcc gcgactggct gctgcgcgac ggcaacaccg gcgagaccct 6900
gacccgcgcc tcctccgtgt gggtgatgat gaacaagctg acccgccgcc tgtccaagat 6960
ccccgaggag gtgcgcgagg agatcggctc ctacttcgtg aactccgacc ccgtggtgga 7020
ggaggacggc cgcaaggtga ccaagctgga cgacaacacc gccgacttcg tgcgcaaggg 7080
cctgaccccc aagtggaacg acctggacat caaccagcac gtgaacaacg tgaagtacat 7140
cggctggatc ctggagtccg ccccccagcc catcctggag acccgcgagc tgtccgccgt 7200
gaccctggag taccgccgcg agtgcggccg cgactccgtg ctgcgctccc tgaccgccgt 7260
gtccggcggc ggcgtgggcg acctgggcca cgccggcaac gtggagtgcc agcacgtgct 7320
gcgcctggag gacggcgccg agatcgtgcg cggccgcacc gagtggcgcc ccaagtacat 7380
caacaacttc tccatcatgg gccagatccc caccgacgcc tccatggact acaaggacca 7440
cgacggcgac tacaaggacc acgacatcga ctacaaggac gacgacgaca agtgaatcga 7500
tagatctctt aaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 7560
tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 7620
caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt 7680
gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc gcttgcatcc 7740
caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac 7800
tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact gcaacctgta 7860
aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa atggaaagct 7920
taattaagag ctcttgtttt ccagaaggag ttgctccttg agcctttcat tctcagcctc 7980
gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc ttggaatgtt 8040
ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga ccatcagctc 8100
caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc ctgttgaaat 8160
cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga atgtggaatc 8220
atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc cgccactcgt 8280
acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt tctcgaagct 8340
ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc ttgcggaggg 8400
caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc cccgcgatgg 8460
gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc ccaggcgagc 8520
gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct gccgctctgc 8580
tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc cgcaaaccct 8640
tgtcgcgtgg cggggcttgt tcgagcttga agagcctcta gagtcgacct gcaggcatgc 8700
aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 8760
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 8820
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 8880
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 8940
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 9000
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 9060
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 9120
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 9180
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 9240
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 9300
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 9360
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 9420
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg c 9461
<210> 241
<211> 8872
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 241
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920
cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980
caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040
gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100
gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160
acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220
cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280
gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340
ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400
cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460
gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520
cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580
tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640
tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700
ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740
cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800
acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860
ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920
gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980
gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040
attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100
tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160
gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220
tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280
gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340
acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400
tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460
aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520
atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580
aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640
gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700
gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760
ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820
attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880
gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940
ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000
caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt tcaatgcccg 6060
ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga ggcccctccc 6120
cgtgcgcggg cgcgcccccg actggtccat gctgttcgcc gtgatcacca ccatcttcag 6180
cgccgccgag aagcagtgga ccaacctgga gtggaagccc aagcccaagc tgccccagct 6240
gctggacgac cacttcggcc tgcacggcct ggtgttccgc cgcaccttcg ccatccgctc 6300
ctacgaggtg ggccccgacc gcagcacctc catcctggcc gtgatgaacc acatgcagga 6360
ggccaccctg aaccacgcca agagcgtggg catcctgggc gacggcttcg gcaccaccct 6420
ggagatgtcc aagcgcgacc tgatgtgggt ggtgcgccgc acccacgtgg ccgtggagcg 6480
ctaccccacc tggggcgaca ccgtggaggt ggagtgctgg atcggcgcca gcggcaacaa 6540
cggcatgcgc cgcgacttcc tggtgcgcga ctgcaagacc ggcgagatcc tgacccgctg 6600
cacctccctg agcgtgctga tgaacacccg cacccgccgc ctgagcacca tccccgacga 6660
ggtgcgcggc gagatcggcc ccgccttcat cgacaacgtg gccgtgaagg acgacgagat 6720
caagaagctg cagaagctga acgactccac cgccgactac atccagggcg gcctgacccc 6780
ccgctggaac gacctggacg tgaaccagca cgtgaacaac ctgaagtacg tggcctgggt 6840
gttcgagacc gtgcccgaca gcatcttcga gtcccaccac atcagctcct tcaccctgga 6900
gtaccgccgc gagtgcaccc gcgactccgt gctgcgcagc ctgaccaccg tgagcggcgg 6960
cagctccgag gccggcctgg tgtgcgacca cctgctgcag ctggagggcg gcagcgaggt 7020
gctgcgcgcc cgcaccgagt ggcgccccaa gctgaccgac tccttccgcg gcatcagcgt 7080
gatccccgcc gagccccgcg tgatggacta caaggaccac gacggcgact acaaggacca 7140
cgacatcgac tacaaggacg acgacgacaa gtgactcgag gcagcagcag ctcggatagt 7200
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 7260
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 7320
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 7380
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 7440
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 7500
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 7560
gtgggatggg aacacaaatg gaaagcttga gctccagcca cggcaacacc gcgcgccttg 7620
cggccgagca cggcgacaag aacctgagca agatctgcgg gctgatcgcc agcgacgagg 7680
gccggcacga gatcgcctac acgcgcatcg tggacgagtt cttccgcctc gaccccgagg 7740
gcgccgtcgc cgcctacgcc aacatgatgc gcaagcagat caccatgccc gcgcacctca 7800
tggacgacat gggccacggc gaggccaacc cgggccgcaa cctcttcgcc gacttctccg 7860
cggtcgccga gaagatcgac gtctacgacg ccgaggacta ctgccgcatc ctggagcacc 7920
tcaacgcgcg ctggaaggtg gacgagcgcc aggtcagcgg ccaggccgcc gcggaccagg 7980
agtacgtcct gggcctgccc cagcgcttcc ggaaactcgc cgagaagacc gccgccaagc 8040
gcaagcgcgt cgcgcgcagg cccgtcgcct tctcctggag aagagcctct agagtcgacc 8100
tgcaggcatg caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 8160
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 8220
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 8280
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 8340
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 8400
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 8460
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 8520
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 8580
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 8640
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 8700
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 8760
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 8820
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gc 8872
<210> 242
<211> 8830
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 242
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 60
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 120
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 180
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 240
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 300
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 360
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 420
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 480
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 540
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 600
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 660
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 720
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 780
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 840
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 900
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 960
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 1020
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 1080
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 1140
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 1200
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 1260
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 1320
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 1380
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 1440
taacctataa aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg 1500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 1560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc 1620
ttaactatgc ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac 1680
cgcacagatg cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca 1740
actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg 1800
gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta 1860
aaacgacggc cagtgaattg atgcatgctc ttccgcctgg agctggtgca gagcatgggg 1920
cagtttgcgg aggagagggt gctccccgtg ctgcaccccg tggacaagct gtggcagccg 1980
caggacttcc tgcccgaccc cgagtcgccc gacttcgagg accaggtggc ggagctgcgc 2040
gcgcgcgcca aggacctgcc cgacgagtac tttgtggtgc tggtgggcga catgatcacg 2100
gaggaggcgc tgccgaccta catggccatg ctcaacacct tggacggtgt gcgcgacgac 2160
acgggcgcgg ctgaccaccc gtgggcgcgc tggacgcggc agtgggtggc cgaggagaac 2220
cggcacggcg acctgctgaa caagtactgt tggctgacgg ggcgcgtcaa catgcgggcc 2280
gtggaggtga ccatcaacaa cctgatcaag agcggcatga acccgcagac ggacaacaac 2340
ccttacttgg gcttcgtcta cacctccttc caggagcgcg ccaccaagta ggtacccttt 2400
cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct tcccggcgct 2460
gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc atgggcgctc 2520
cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc aaagacatta 2580
tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta cacaggccac 2640
tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt cagtcacaac 2700
ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg gccggcttcg 2760
ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg gtgcacttca 2820
cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag aaggacgcca 2880
agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg cccttgttct 2940
ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc gccatcgccc 3000
cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac aacaacacct 3060
ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc tggacctaca 3120
acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc tacaccttca 3180
ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc gacccgaagg 3240
tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc caggactaca 3300
agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc gcgttcgcca 3360
acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc cccaccgagc 3420
aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc gccccggccg 3480
gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc gaggccttcg 3540
acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag accttcttca 3600
acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac tgggagtact 3660
ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc aagttctccc 3720
tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag gccgagccga 3780
tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc acgttgacga 3840
aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag ttcgagctgg 3900
tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac ctctccctct 3960
ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag gtgtccgcgt 4020
cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag aacccctact 4080
tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac ctgtcctact 4140
acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac gacggcgacg 4200
tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc gtgaacatga 4260
cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac 4320
aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg tgtgatggac 4380
tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt atcaaacagc 4440
ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc ttgtgctatt 4500
tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat cccaaccgca 4560
acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc actgcccctc 4620
gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg taaaccagca 4680
ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga tcccgcgtct 4740
cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc agcgcggcat 4800
acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg aagcgtccgg 4860
ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga gctgatggtc 4920
gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc aaaggtgctg 4980
gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc cgcaaccctg 5040
attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg ccggcggcga 5100
tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt cagttgaagg 5160
gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg gacgtgcagg 5220
tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta tcaggtccgt 5280
gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc ttcatcaaaa 5340
acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg ggccctgagt 5400
tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga ggctggcggg 5460
aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga aacgccaaca 5520
atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt aattgtccca 5580
aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa ccctaggtat 5640
gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac gggccgtccc 5700
gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg caatggactg 5760
ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga tttcgtaatc 5820
attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc tgacgccagc 5880
gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg tgcgaagcgt 5940
ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag agcgggccca 6000
caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt tcaatgcccg 6060
ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga ggcccctccc 6120
cgtgcgcggg cgcgcccagc tgcccgactg gagcatgctg ctggccgcga tcaccaccct 6180
gttcctggcg gccgagaagc agtggatgat gctggactgg aagcccaagc gccccgacat 6240
gctggtggac cccttcggcc tgggccgctt cgtgcaggac ggcctggtgt tccgcaacaa 6300
cttcagcatc cgcagctacg agatcggcgc ggaccgcacc gccagcatcg agaccctgat 6360
gaaccacctg caggagaccg ccctgaacca cgtgaagagt gtgggcctgc tggaggacgg 6420
cctgggcagc acccgcgaga tgagcctgcg caacctgatc tgggtggtga ccaagatgca 6480
ggtggcggtg gaccgctacc ccacctgggg cgacgaggtg caggtgagca gctgggcgac 6540
cgccatcggc aagaacggca tgcgccgcga gtggatcgtg accgacttcc gcaccggcga 6600
gaccctgctg cgcgccacca gcgtgtgggt gatgatgaac aagctgaccc gccgcatcag 6660
caagatcccc gaggaggtgt ggcacgagat cggccccagc ttcatcgacg cgccccccct 6720
gcccaccgtg gaggacgacg gccgcaagct gacccgcttc gacgagagca gcgccgactt 6780
catccgcaag ggcctgaccc cccgctggag cgacctggac atcaaccagc acgtgaacaa 6840
cgtgaagtac atcggctggc tgctggagag cgcgcccccc gagatccacg agagccacga 6900
gatcgccagc ctgaccctgg agtaccgccg cgagtgcggc cgcgacagcg tgctgaacag 6960
cgccaccaag gtgagcgaca gcagccagct gggcaagagc gccgtggagt gcaaccacct 7020
ggtgcgcctg cagaacggcg gcgagatcgt gaagggccgc accgtgtggc gccccaagcg 7080
ccccctgtac aacgacggcg ccgtggtgga cgtgcccgcc aagaccagct gactcgaggc 7140
agcagcagct cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc 7200
gccacacttg ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg 7260
tgtttgatct tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat 7320
accaccccca gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc 7380
tacgctgtcc tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc 7440
cttggtttgg gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat 7500
gctgatgcac gggaagtagt gggatgggaa cacaaatgga aagcttgagc tccagccacg 7560
gcaacaccgc gcgccttgcg gccgagcacg gcgacaagaa cctgagcaag atctgcgggc 7620
tgatcgccag cgacgagggc cggcacgaga tcgcctacac gcgcatcgtg gacgagttct 7680
tccgcctcga ccccgagggc gccgtcgccg cctacgccaa catgatgcgc aagcagatca 7740
ccatgcccgc gcacctcatg gacgacatgg gccacggcga ggccaacccg ggccgcaacc 7800
tcttcgccga cttctccgcg gtcgccgaga agatcgacgt ctacgacgcc gaggactact 7860
gccgcatcct ggagcacctc aacgcgcgct ggaaggtgga cgagcgccag gtcagcggcc 7920
aggccgccgc ggaccaggag tacgtcctgg gcctgcccca gcgcttccgg aaactcgccg 7980
agaagaccgc cgccaagcgc aagcgcgtcg cgcgcaggcc cgtcgccttc tcctggagaa 8040
gagcctctag agtcgacctg caggcatgca agcttggcgt aatcatggtc atagctgttt 8100
cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag 8160
tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg 8220
cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg 8280
gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc 8340
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 8400
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 8460
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 8520
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 8580
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 8640
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 8700
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 8760
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 8820
gacttatcgc 8830
<210> 243
<211> 4674
<212> DNA
<213> Cuphea hookeriana
<400> 243
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgccca gctgcccgac tggagccgcc tgctgaccgc catcaccacc 3240
gtgttcgtga agtccaagcg ccccgacatg cacgaccgca agtccaagcg ccccgacatg 3300
ctggtggaca gcttcggcct ggagtccacc gtgcaggacg gcctggtgtt ccgccagtcc 3360
ttctccatcc gctcctacga gatcggcacc gaccgcaccg ccagcatcga gaccctgatg 3420
aaccacctgc aggagacctc cctgaaccac tgcaagagca ccggcatcct gctggacggc 3480
ttcggccgca ccctggagat gtgcaagcgc gacctgatct gggtggtgat caagatgcag 3540
atcaaggtga accgctaccc cgcctggggc gacaccgtgg agatcaacac ccgcttcagc 3600
cgcctgggca agatcggcat gggccgcgac tggctgatct ccgactgcaa caccggcgag 3660
atcctggtgc gcgccaccag cgcctacgcc atgatgaacc agaagacccg ccgcctgtcc 3720
aagctgccct acgaggtgca ccaggagatc gtgcccctgt tcgtggacag ccccgtgatc 3780
gaggactccg acctgaaggt gcacaagttc aaggtgaaga ccggcgacag catccagaag 3840
ggcctgaccc ccggctggaa cgacctggac gtgaaccagc acgtgtccaa cgtgaagtac 3900
atcggctgga tcctggagag catgcccacc gaggtgctgg agacccagga gctgtgctcc 3960
ctggccctgg agtaccgccg cgagtgcggc cgcgactccg tgctggagag cgtgaccgcc 4020
atggacccca gcaaggtggg cgtgcgctcc cagtaccagc acctgctgcg cctggaggac 4080
ggcaccgcca tcgtgaacgg cgccaccgag tggcgcccca agaacgccgg cgccaacggc 4140
gccatctcca ccggcaagac cagcaacggc aactccgtgt ccatggacta caaggaccac 4200
gacggcgact acaaggacca cgacatcgac tacaaggacg acgacgacaa gtgactcgag 4260
gcagcagcag ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg 4320
ccgccacact tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag 4380
tgtgtttgat cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga 4440
ataccacccc cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta 4500
tctacgctgt cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca 4560
gccttggttt gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca 4620
atgctgatgc acgggaagta gtgggatggg aacacaaatg gaaagcttga gctc 4674
<210> 244
<211> 1170
<212> DNA
<213> Cuphea hookeriana
<400> 244
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccagctg 120
cccgactgga gccgcctgct gaccgccatc accaccgtgt tcgtgaagtc caagcgcccc 180
gacatgcacg accgcaagtc caagcgcccc gacatgctgg tggacagctt cggcctggag 240
tccaccgtgc aggacggcct ggtgttccgc cagtccttct ccatccgctc ctacgagatc 300
ggcaccgacc gcaccgccag catcgagacc ctgatgaacc acctgcagga gacctccctg 360
aaccactgca agagcaccgg catcctgctg gacggcttcg gccgcaccct ggagatgtgc 420
aagcgcgacc tgatctgggt ggtgatcaag atgcagatca aggtgaaccg ctaccccgcc 480
tggggcgaca ccgtggagat caacacccgc ttcagccgcc tgggcaagat cggcatgggc 540
cgcgactggc tgatctccga ctgcaacacc ggcgagatcc tggtgcgcgc caccagcgcc 600
tacgccatga tgaaccagaa gacccgccgc ctgtccaagc tgccctacga ggtgcaccag 660
gagatcgtgc ccctgttcgt ggacagcccc gtgatcgagg actccgacct gaaggtgcac 720
aagttcaagg tgaagaccgg cgacagcatc cagaagggcc tgacccccgg ctggaacgac 780
ctggacgtga accagcacgt gtccaacgtg aagtacatcg gctggatcct ggagagcatg 840
cccaccgagg tgctggagac ccaggagctg tgctccctgg ccctggagta ccgccgcgag 900
tgcggccgcg actccgtgct ggagagcgtg accgccatgg accccagcaa ggtgggcgtg 960
cgctcccagt accagcacct gctgcgcctg gaggacggca ccgccatcgt gaacggcgcc 1020
accgagtggc gccccaagaa cgccggcgcc aacggcgcca tctccaccgg caagaccagc 1080
aacggcaact ccgtgtccat ggactacaag gaccacgacg gcgactacaa ggaccacgac 1140
atcgactaca aggacgacga cgacaagtga 1170
<210> 245
<211> 5123
<212> DNA
<213> Cuphea hookeriana
<400> 245
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agatctagaa tatcaatgat cgagcaggac ggcctccacg ccggctcccc 1380
cgccgcctgg gtggagcgcc tgttcggcta cgactgggcc cagcagacca tcggctgctc 1440
cgacgccgcc gtgttccgcc tgtccgccca gggccgcccc gtgctgttcg tgaagaccga 1500
cctgtccggc gccctgaacg agctgcagga cgaggccgcc cgcctgtcct ggctggccac 1560
caccggcgtg ccctgcgccg ccgtgctgga cgtggtgacc gaggccggcc gcgactggct 1620
gctgctgggc gaggtgcccg gccaggacct gctgtcctcc cacctggccc ccgccgagaa 1680
ggtgtccatc atggccgacg ccatgcgccg cctgcacacc ctggaccccg ccacctgccc 1740
cttcgaccac caggccaagc accgcatcga gcgcgcccgc acccgcatgg aggccggcct 1800
ggtggaccag gacgacctgg acgaggagca ccagggcctg gcccccgccg agctgttcgc 1860
ccgcctgaag gcccgcatgc ccgacggcga ggacctggtg gtgacccacg gcgacgcctg 1920
cctgcccaac atcatggtgg agaacggccg cttctccggc ttcatcgact gcggccgcct 1980
gggcgtggcc gaccgctacc aggacatcgc cctggccacc cgcgacatcg ccgaggagct 2040
gggcggcgag tgggccgacc gcttcctggt gctgtacggc atcgccgccc ccgactccca 2100
gcgcatcgcc ttctaccgcc tgctggacga gttcttctga caattggcag cagcagctcg 2160
gatagtatcg acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct 2220
gccttgacct gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg 2280
tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc 2340
atccccttcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 2400
ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 2460
tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 2520
gaagtagtgg gatgggaaca caaatggagg atcccgcgtc tcgaacagag cgcgcagagg 2580
aacgctgaag gtctcgcctc tgtcgcacct cagcgcggca tacaccacaa taaccacctg 2640
acgaatgcgc ttggttcttc gtccattagc gaagcgtccg gttcacacac gtgccacgtt 2700
ggcgaggtgg caggtgacaa tgatcggtgg agctgatggt cgaaacgttc acagcctagg 2760
gatatcgaat tcctttcttg cgctatgaca cttccagcaa aaggtagggc gggctgcgag 2820
acggcttccc ggcgctgcat gcaacaccga tgatgcttcg accccccgaa gctccttcgg 2880
ggctgcatgg gcgctccgat gccgctccag ggcgagcgct gtttaaatag ccaggccccc 2940
gattgcaaag acattatagc gagctaccaa agccatattc aaacacctag atcactacca 3000
cttctacaca ggccactcga gcttgtgatc gcactccgct aagggggcgc ctcttcctct 3060
tcgtttcagt cacaacccgc aaacactagt ggcgcgccat ggcgaccgcc agctgcatgg 3120
tggcgtcgcc cttctgcacc tggctggtcg ccgcgtgcat gcccacctcc agcgacaacg 3180
acccccgctc gctgtcccac aagcgcctgc gcctgagccg ccgccgccgc accctgagct 3240
cgcactgctc cctgcgcggc agcaccttcc agtgcctgga cccctgcaac cagcagcgct 3300
tcctgggcga caacggcttc gcgtcgctgt tcggctccaa gcccctgcgc agcaaccgcg 3360
gccacctgcg cctgggccgc acctcgcact ccggcgaggt gatggccgtc gcgatgcagc 3420
ccgcccagga ggtgagcacc aacaagaagc ccgcgaccaa gcagcgccgc gtggtcgtga 3480
ccggcatggg cgtcgtgacc cccctgggcc acgaccccga cgtgtattat aacaacctgc 3540
tggacggcat ctcgggcatc tccgagatcg agaacttcga ctgcagccag ttccccaccc 3600
gcatcgccgg cgagatcaag tcgttctcca ccgacggctg ggtcgcgccc aagttcagcg 3660
agcgcatgga caagttcatg ctgtatatgc tgaccgccgg caagaaggcg ctggccgacg 3720
gcggcatcac cgaggacgcg atgaaggagc tgaacaagcg caagtgcggc gtgctgatcg 3780
gctcgggcct gggcggcatg aaggtcttct ccgacagcat cgaggccctg cgcacctcgt 3840
ataagaagat ctcccccttc tgcgtgccct tcagcaccac caacatgggc tcggcgatcc 3900
tggcgatgga cctgggctgg atgggcccca actattccat cagcaccgcg tgcgccacct 3960
cgaacttctg catcctgaac gcggccaacc acatcatcaa gggcgaggcg gacatgatgc 4020
tgtgcggcgg ctccgacgcc gcggtgctgc ccgtcggcct gggcggcttc gtggcctgcc 4080
gcgcgctgag ccagcgcaac aacgacccca ccaaggcctc gcgcccctgg gactccaacc 4140
gcgacggctt cgtcatgggc gagggcgcgg gcgtgctgct gctggaggag ctggagcacg 4200
ccaagaagcg cggcgcgacc atctatgccg agttcctggg cggcagcttc acctgcgacg 4260
cgtatcacat gaccgagccc caccccgagg gcgccggcgt catcctgtgc atcgagaagg 4320
cgctggccca gtcgggcgtg tcccgcgagg acgtgaacta tatcaacgcg cacgccacca 4380
gcacccccgc gggcgacatc aaggagtatc aggccctggc gcactgcttc ggccagaact 4440
cggagctgcg cgtcaactcc accaagagca tgatcggcca cctgctgggc ggcgccggcg 4500
gcgtggaggc ggtcgccgtg gtccaggcga tccgcaccgg ctggatccac cccaacatca 4560
acctggagga ccccgacgag ggcgtggacg ccaagctgct ggtcggcccc aagaaggaga 4620
agctgaaggt gaaggtcggc ctgtcgaact ccttcggctt cggcggccac aacagctcga 4680
tcctgttcgc gccctgcaac tgactcgagg cagcagcagc tcggatagta tcgacacact 4740
ctggacgctg gtcgtgtgat ggactgttgc cgccacactt gctgccttga cctgtgaata 4800
tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc ttgtgtgtac gcgcttttgc 4860
gagttgctag ctgcttgtgc tatttgcgaa taccaccccc agcatcccct tccctcgttt 4920
catatcgctt gcatcccaac cgcaacttat ctacgctgtc ctgctatccc tcagcgctgc 4980
tcctgctcct gctcactgcc cctcgcacag ccttggtttg ggctccgcct gtattctcct 5040
ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca cgggaagtag tgggatggga 5100
acacaaatgg aaagcttgag ctc 5123
<210> 246
<211> 1605
<212> DNA
<213> Cuphea hookeriana
<400> 246
atggcgaccg ccagctgcat ggtggcgtcg cccttctgca cctggctggt cgccgcgtgc 60
atgcccacct ccagcgacaa cgacccccgc tcgctgtccc acaagcgcct gcgcctgagc 120
cgccgccgcc gcaccctgag ctcgcactgc tccctgcgcg gcagcacctt ccagtgcctg 180
gacccctgca accagcagcg cttcctgggc gacaacggct tcgcgtcgct gttcggctcc 240
aagcccctgc gcagcaaccg cggccacctg cgcctgggcc gcacctcgca ctccggcgag 300
gtgatggccg tcgcgatgca gcccgcccag gaggtgagca ccaacaagaa gcccgcgacc 360
aagcagcgcc gcgtggtcgt gaccggcatg ggcgtcgtga cccccctggg ccacgacccc 420
gacgtgtatt ataacaacct gctggacggc atctcgggca tctccgagat cgagaacttc 480
gactgcagcc agttccccac ccgcatcgcc ggcgagatca agtcgttctc caccgacggc 540
tgggtcgcgc ccaagttcag cgagcgcatg gacaagttca tgctgtatat gctgaccgcc 600
ggcaagaagg cgctggccga cggcggcatc accgaggacg cgatgaagga gctgaacaag 660
cgcaagtgcg gcgtgctgat cggctcgggc ctgggcggca tgaaggtctt ctccgacagc 720
atcgaggccc tgcgcacctc gtataagaag atctccccct tctgcgtgcc cttcagcacc 780
accaacatgg gctcggcgat cctggcgatg gacctgggct ggatgggccc caactattcc 840
atcagcaccg cgtgcgccac ctcgaacttc tgcatcctga acgcggccaa ccacatcatc 900
aagggcgagg cggacatgat gctgtgcggc ggctccgacg ccgcggtgct gcccgtcggc 960
ctgggcggct tcgtggcctg ccgcgcgctg agccagcgca acaacgaccc caccaaggcc 1020
tcgcgcccct gggactccaa ccgcgacggc ttcgtcatgg gcgagggcgc gggcgtgctg 1080
ctgctggagg agctggagca cgccaagaag cgcggcgcga ccatctatgc cgagttcctg 1140
ggcggcagct tcacctgcga cgcgtatcac atgaccgagc cccaccccga gggcgccggc 1200
gtcatcctgt gcatcgagaa ggcgctggcc cagtcgggcg tgtcccgcga ggacgtgaac 1260
tatatcaacg cgcacgccac cagcaccccc gcgggcgaca tcaaggagta tcaggccctg 1320
gcgcactgct tcggccagaa ctcggagctg cgcgtcaact ccaccaagag catgatcggc 1380
cacctgctgg gcggcgccgg cggcgtggag gcggtcgccg tggtccaggc gatccgcacc 1440
ggctggatcc accccaacat caacctggag gaccccgacg agggcgtgga cgccaagctg 1500
ctggtcggcc ccaagaagga gaagctgaag gtgaaggtcg gcctgtcgaa ctccttcggc 1560
ttcggcggcc acaacagctc gatcctgttc gcgccctgca actga 1605
<210> 247
<211> 534
<212> PRT
<213> Cuphea hookeriana
<400> 247
Met Ala Thr Ala Ser Cys Met Val Ala Ser Pro Phe Cys Thr Trp Leu
1 5 10 15
Val Ala Ala Cys Met Pro Thr Ser Ser Asp Asn Asp Pro Arg Ser Leu
20 25 30
Ser His Lys Arg Leu Arg Leu Ser Arg Arg Arg Arg Thr Leu Ser Ser
35 40 45
His Cys Ser Leu Arg Gly Ser Thr Phe Gln Cys Leu Asp Pro Cys Asn
50 55 60
Gln Gln Arg Phe Leu Gly Asp Asn Gly Phe Ala Ser Leu Phe Gly Ser
65 70 75 80
Lys Pro Leu Arg Ser Asn Arg Gly His Leu Arg Leu Gly Arg Thr Ser
85 90 95
His Ser Gly Glu Val Met Ala Val Ala Met Gln Pro Ala Gln Glu Val
100 105 110
Ser Thr Asn Lys Lys Pro Ala Thr Lys Gln Arg Arg Val Val Val Thr
115 120 125
Gly Met Gly Val Val Thr Pro Leu Gly His Asp Pro Asp Val Tyr Tyr
130 135 140
Asn Asn Leu Leu Asp Gly Ile Ser Gly Ile Ser Glu Ile Glu Asn Phe
145 150 155 160
Asp Cys Ser Gln Phe Pro Thr Arg Ile Ala Gly Glu Ile Lys Ser Phe
165 170 175
Ser Thr Asp Gly Trp Val Ala Pro Lys Phe Ser Glu Arg Met Asp Lys
180 185 190
Phe Met Leu Tyr Met Leu Thr Ala Gly Lys Lys Ala Leu Ala Asp Gly
195 200 205
Gly Ile Thr Glu Asp Ala Met Lys Glu Leu Asn Lys Arg Lys Cys Gly
210 215 220
Val Leu Ile Gly Ser Gly Leu Gly Gly Met Lys Val Phe Ser Asp Ser
225 230 235 240
Ile Glu Ala Leu Arg Thr Ser Tyr Lys Lys Ile Ser Pro Phe Cys Val
245 250 255
Pro Phe Ser Thr Thr Asn Met Gly Ser Ala Ile Leu Ala Met Asp Leu
260 265 270
Gly Trp Met Gly Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Ser
275 280 285
Asn Phe Cys Ile Leu Asn Ala Ala Asn His Ile Ile Lys Gly Glu Ala
290 295 300
Asp Met Met Leu Cys Gly Gly Ser Asp Ala Ala Val Leu Pro Val Gly
305 310 315 320
Leu Gly Gly Phe Val Ala Cys Arg Ala Leu Ser Gln Arg Asn Asn Asp
325 330 335
Pro Thr Lys Ala Ser Arg Pro Trp Asp Ser Asn Arg Asp Gly Phe Val
340 345 350
Met Gly Glu Gly Ala Gly Val Leu Leu Leu Glu Glu Leu Glu His Ala
355 360 365
Lys Lys Arg Gly Ala Thr Ile Tyr Ala Glu Phe Leu Gly Gly Ser Phe
370 375 380
Thr Cys Asp Ala Tyr His Met Thr Glu Pro His Pro Glu Gly Ala Gly
385 390 395 400
Val Ile Leu Cys Ile Glu Lys Ala Leu Ala Gln Ser Gly Val Ser Arg
405 410 415
Glu Asp Val Asn Tyr Ile Asn Ala His Ala Thr Ser Thr Pro Ala Gly
420 425 430
Asp Ile Lys Glu Tyr Gln Ala Leu Ala His Cys Phe Gly Gln Asn Ser
435 440 445
Glu Leu Arg Val Asn Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly
450 455 460
Gly Ala Gly Gly Val Glu Ala Val Ala Val Val Gln Ala Ile Arg Thr
465 470 475 480
Gly Trp Ile His Pro Asn Ile Asn Leu Glu Asp Pro Asp Glu Gly Val
485 490 495
Asp Ala Lys Leu Leu Val Gly Pro Lys Lys Glu Lys Leu Lys Val Lys
500 505 510
Val Gly Leu Ser Asn Ser Phe Gly Phe Gly Gly His Asn Ser Ser Ile
515 520 525
Leu Phe Ala Pro Cys Asn
530
<210> 248
<211> 7843
<212> DNA
<213> Cuphea hookeriana
<400> 248
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agatctagaa tatcaatgat cgagcaggac ggcctccacg ccggctcccc 1380
cgccgcctgg gtggagcgcc tgttcggcta cgactgggcc cagcagacca tcggctgctc 1440
cgacgccgcc gtgttccgcc tgtccgccca gggccgcccc gtgctgttcg tgaagaccga 1500
cctgtccggc gccctgaacg agctgcagga cgaggccgcc cgcctgtcct ggctggccac 1560
caccggcgtg ccctgcgccg ccgtgctgga cgtggtgacc gaggccggcc gcgactggct 1620
gctgctgggc gaggtgcccg gccaggacct gctgtcctcc cacctggccc ccgccgagaa 1680
ggtgtccatc atggccgacg ccatgcgccg cctgcacacc ctggaccccg ccacctgccc 1740
cttcgaccac caggccaagc accgcatcga gcgcgcccgc acccgcatgg aggccggcct 1800
ggtggaccag gacgacctgg acgaggagca ccagggcctg gcccccgccg agctgttcgc 1860
ccgcctgaag gcccgcatgc ccgacggcga ggacctggtg gtgacccacg gcgacgcctg 1920
cctgcccaac atcatggtgg agaacggccg cttctccggc ttcatcgact gcggccgcct 1980
gggcgtggcc gaccgctacc aggacatcgc cctggccacc cgcgacatcg ccgaggagct 2040
gggcggcgag tgggccgacc gcttcctggt gctgtacggc atcgccgccc ccgactccca 2100
gcgcatcgcc ttctaccgcc tgctggacga gttcttctga caattggcag cagcagctcg 2160
gatagtatcg acacactctg gacgctggtc gtgtgatgga ctgttgccgc cacacttgct 2220
gccttgacct gtgaatatcc ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg 2280
tgtgtacgcg cttttgcgag ttgctagctg cttgtgctat ttgcgaatac cacccccagc 2340
atccccttcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 2400
ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 2460
tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 2520
gaagtagtgg gatgggaaca caaatggagg atcccgcgtc tcgaacagag cgcgcagagg 2580
aacgctgaag gtctcgcctc tgtcgcacct cagcgcggca tacaccacaa taaccacctg 2640
acgaatgcgc ttggttcttc gtccattagc gaagcgtccg gttcacacac gtgccacgtt 2700
ggcgaggtgg caggtgacaa tgatcggtgg agctgatggt cgaaacgttc acagcctagg 2760
gagtttaggt ccagcgtccg tgggggggga cgggctggga gcttgggccg ggaagggcaa 2820
gacgatgcag tccctctggg gagtcacagc cgactgtgtg tgttgcactg tgcggcccgc 2880
agcactcaca cgcaaaatgc ctggccgaca ggcaggccct gtccagtgca acatccacgg 2940
tccctctcat caggctcacc ttgctcattg acataacgga atgcgtaccg ctctttcaga 3000
tctgtccatc cagagagggg agcaggctcc ccaccgacgc tgtcaaactt gcttcctgcc 3060
caaccgaaaa cattattgtt tgaggggggg gggggggggg cagattgcat ggcgggatat 3120
ctcgtgagga acatcactgg gacactgtgg aacacagtga gtgcagtatg cagagcatgt 3180
atgctagggg tcagcgcagg aagggggcct ttcccagtct cccatgccac tgcaccgtat 3240
ccacgactca ccaggaccag cttcttgatc ggcttccgct cccgtggaca ccagtgtgta 3300
gcctctggac tccaggtatg cgtgcaccgc aaaggccagc cgatcgtgcc gattcctggg 3360
gtggaggata tgagtcagcc aacttggggc tcagagtgca cactggggca cgatacgaaa 3420
caacatctac accgtgtcct ccatgctgac acaccacagc ttcgctccac ctgaatgtgg 3480
gcgcatgggc ccgaatcaca gccaatgtcg ctgctgccat aatgtgatcc agaccctctc 3540
cgcccagatg ccgagcggat cgtgggcgct gaatagattc ctgtttcgat cactgtttgg 3600
gtcctttcct tttcgtctcg gatgcgcgtc tcgaaacagg ctgcgtcggg ctttcggatc 3660
ccttttgctc cctccgtcac catcctgcgc gcgggcaagt tgcttgaccc tgggctggta 3720
ccagggttgg agggtattac cgcgtcaggc cattcccagc ccggattcaa ttcaaagtct 3780
gggccaccac cctccgccgc tctgtctgat cactccacat tcgtgcatac actacgttca 3840
agtcctgatc caggcgtgtc tcgggacaag gtgtgcttga gtttgaatct caaggaccca 3900
ctccagcaca gctgctggtt gaccccgccc tcgcaacata tggcgaccgc cagctgcatg 3960
gtggcgtcgc ccttctgcac ctggctggtc gccgcgtgca tgcccacctc cagcgacaac 4020
gacccccgct cgctgtccca caagcgcctg cgcctgagcc gccgccgccg caccctgagc 4080
tcgcactgct ccctgcgcgg cagcaccttc cagtgcctgg acccctgcaa ccagcagcgc 4140
ttcctgggcg acaacggctt cgcgtcgctg ttcggctcca agcccctgcg cagcaaccgc 4200
ggccacctgc gcctgggccg cacctcgcac tccggcgagg tgatggccgt cgcgatgcag 4260
cccgcccagg aggtgagcac caacaagaag cccgcgacca agcagcgccg cgtggtcgtg 4320
accggcatgg gcgtcgtgac ccccctgggc cacgaccccg acgtgtatta taacaacctg 4380
ctggacggca tctcgggcat ctccgagatc gagaacttcg actgcagcca gttccccacc 4440
cgcatcgccg gcgagatcaa gtcgttctcc accgacggct gggtcgcgcc caagttcagc 4500
gagcgcatgg acaagttcat gctgtatatg ctgaccgccg gcaagaaggc gctggccgac 4560
ggcggcatca ccgaggacgc gatgaaggag ctgaacaagc gcaagtgcgg cgtgctgatc 4620
ggctcgggcc tgggcggcat gaaggtcttc tccgacagca tcgaggccct gcgcacctcg 4680
tataagaaga tctccccctt ctgcgtgccc ttcagcacca ccaacatggg ctcggcgatc 4740
ctggcgatgg acctgggctg gatgggcccc aactattcca tcagcaccgc gtgcgccacc 4800
tcgaacttct gcatcctgaa cgcggccaac cacatcatca agggcgaggc ggacatgatg 4860
ctgtgcggcg gctccgacgc cgcggtgctg cccgtcggcc tgggcggctt cgtggcctgc 4920
cgcgcgctga gccagcgcaa caacgacccc accaaggcct cgcgcccctg ggactccaac 4980
cgcgacggct tcgtcatggg cgagggcgcg ggcgtgctgc tgctggagga gctggagcac 5040
gccaagaagc gcggcgcgac catctatgcc gagttcctgg gcggcagctt cacctgcgac 5100
gcgtatcaca tgaccgagcc ccaccccgag ggcgccggcg tcatcctgtg catcgagaag 5160
gcgctggccc agtcgggcgt gtcccgcgag gacgtgaact atatcaacgc gcacgccacc 5220
agcacccccg cgggcgacat caaggagtat caggccctgg cgcactgctt cggccagaac 5280
tcggagctgc gcgtcaactc caccaagagc atgatcggcc acctgctggg cggcgccggc 5340
ggcgtggagg cggtcgccgt ggtccaggcg atccgcaccg gctggatcca ccccaacatc 5400
aacctggagg accccgacga gggcgtggac gccaagctgc tggtcggccc caagaaggag 5460
aagctgaagg tgaaggtcgg cctgtcgaac tccttcggct tcggcggcca caacagctcg 5520
atcctgttcg cgccctgcaa ctgatgcata cggagcgtcg tgcgggaggg agtgtgccga 5580
gcggggagtc ccggtctgtg cgaggcccgg cagctgacgc tggcgagccg tacgccccga 5640
gggtccccct cccctccccc ctcttcccct tccctctgac ggccgcgcct gtttttgcat 5700
gttcagcgac cttaaggcgc tcgaccgtgc cggacggact gcagccccat gtcgtagtga 5760
ccgccaatgt aagtgggctg gcgtttccct gtacgtgagc tcaacgtcac tgcacgcgca 5820
ccaccctctc gaccggcagg accaggcatc gcgagataca gcgcgagcca gacacggagt 5880
gccgagctat gcgcacgctc caactagata tcatgtggat gatgagcatg aattcctttc 5940
ttgcgctatg acacttccag caaaaggtag ggcgggctgc gagacggctt cccggcgctg 6000
catgcaacac cgatgatgct tcgacccccc gaagctcctt cggggctgca tgggcgctcc 6060
gatgccgctc cagggcgagc gctgtttaaa tagccaggcc cccgattgca aagacattat 6120
agcgagctac caaagccata ttcaaacacc tagatcacta ccacttctac acaggccact 6180
cgagcttgtg atcgcactcc gctaaggggg cgcctcttcc tcttcgtttc agtcacaacc 6240
cgcaaacact agtatggcta tcaagacgaa caggcagcct gtggagaagc ctccgttcac 6300
gatcgggacg ctgcgcaagg ccatccccgc gcactgtttc gagcgctcgg cgcttcgtgg 6360
gcgcgcccag ctgcccgact ggagccgcct gctgaccgcc atcaccaccg tgttcgtgaa 6420
gtccaagcgc cccgacatgc acgaccgcaa gtccaagcgc cccgacatgc tggtggacag 6480
cttcggcctg gagtccaccg tgcaggacgg cctggtgttc cgccagtcct tctccatccg 6540
ctcctacgag atcggcaccg accgcaccgc cagcatcgag accctgatga accacctgca 6600
ggagacctcc ctgaaccact gcaagagcac cggcatcctg ctggacggct tcggccgcac 6660
cctggagatg tgcaagcgcg acctgatctg ggtggtgatc aagatgcaga tcaaggtgaa 6720
ccgctacccc gcctggggcg acaccgtgga gatcaacacc cgcttcagcc gcctgggcaa 6780
gatcggcatg ggccgcgact ggctgatctc cgactgcaac accggcgaga tcctggtgcg 6840
cgccaccagc gcctacgcca tgatgaacca gaagacccgc cgcctgtcca agctgcccta 6900
cgaggtgcac caggagatcg tgcccctgtt cgtggacagc cccgtgatcg aggactccga 6960
cctgaaggtg cacaagttca aggtgaagac cggcgacagc atccagaagg gcctgacccc 7020
cggctggaac gacctggacg tgaaccagca cgtgtccaac gtgaagtaca tcggctggat 7080
cctggagagc atgcccaccg aggtgctgga gacccaggag ctgtgctccc tggccctgga 7140
gtaccgccgc gagtgcggcc gcgactccgt gctggagagc gtgaccgcca tggaccccag 7200
caaggtgggc gtgcgctccc agtaccagca cctgctgcgc ctggaggacg gcaccgccat 7260
cgtgaacggc gccaccgagt ggcgccccaa gaacgccggc gccaacggcg ccatctccac 7320
cggcaagacc agcaacggca actccgtgtc catggactac aaggaccacg acggcgacta 7380
caaggaccac gacatcgact acaaggacga cgacgacaag tgactcgagg cagcagcagc 7440
tcggatagta tcgacacact ctggacgctg gtcgtgtgat ggactgttgc cgccacactt 7500
gctgccttga cctgtgaata tccctgccgc ttttatcaaa cagcctcagt gtgtttgatc 7560
ttgtgtgtac gcgcttttgc gagttgctag ctgcttgtgc tatttgcgaa taccaccccc 7620
agcatcccct tccctcgttt catatcgctt gcatcccaac cgcaacttat ctacgctgtc 7680
ctgctatccc tcagcgctgc tcctgctcct gctcactgcc cctcgcacag ccttggtttg 7740
ggctccgcct gtattctcct ggtactgcaa cctgtaaacc agcactgcaa tgctgatgca 7800
cgggaagtag tgggatggga acacaaatgg aaagcttgag ctc 7843
<210> 249
<211> 1239
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 249
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
cccgcgaacg gcagcgcggt gaacctgaag tcgggctccc tgaacaccca ggaggacacg 180
agctcgtccc cccccccccg cgcgttcctg aaccagctgc ccgactggag catgctgctg 240
accgcgatca ccaccgtctt cgtggcggcg gagaagcagt ggacgatgct ggaccgcaag 300
tcgaagcgcc ccgacatgct ggtggactcc gtcggcctga agagcatcgt gcgcgacggc 360
ctggtctcgc gccagtcctt cctgatccgc agctacgaga tcggcgcgga ccgcaccgcg 420
tcgatcgaga ccctgatgaa ccacctgcag gagacgtcca tcaaccactg caagagcctg 480
ggcctgctga acgacggctt cggccgcacc cccggcatgt gcaagaacga cctgatctgg 540
gtgctgacca agatgcagat catggtcaac cgctacccca cgtggggcga caccgtcgag 600
atcaacacgt ggttctcgca gtccggcaag atcggcatgg cgagcgactg gctgatctcg 660
gactgcaaca ccggcgagat cctgatccgc gcgacctccg tgtgggcgat gatgaaccag 720
aagacgcgcc gcttcagccg cctgccctac gaggtccgcc aggagctgac cccccacttc 780
gtggactcgc cccacgtcat cgaggacaac gaccagaagc tgcacaagtt cgacgtgaag 840
accggcgact ccatccgcaa gggcctgacg ccccgctgga acgacctgga cgtcaaccag 900
cacgtgtcga acgtgaagta catcggctgg atcctggagt ccatgcccat cgaggtcctg 960
gagacccagg agctgtgctc gctgaccgtg gagtaccgcc gcgagtgcgg catggactcc 1020
gtgctggagt cggtcacggc ggtggacccc agcgagaacg gcggccgcag ccagtacaag 1080
cacctgctgc gcctggagga cggcaccgac atcgtcaagt cgcgcaccga gtggcgcccc 1140
aagaacgcgg gcacgaacgg cgcgatctcc accagcaccg cgaagacgtc gaacggcaac 1200
tccgcgagcg atgacgatga caagctggga tgactcgag 1239
<210> 250
<211> 4656
<212> DNA
<213> Umbellularia californica
<400> 250
ggtacccgcc tgcaacgcaa gggcagccac agccgctccc acccgccgct gaaccgacac 60
gtgcttgggc gcctgccgcc tgcctgccgc atgcttgtgc tggtgaggct gggcagtgct 120
gccatgctga ttgaggcttg gttcatcggg tggaagctta tgtgtgtgct gggcttgcat 180
gccgggcaat gcgcatggtg gcaagagggc ggcagcactt gctggagctg ccgcggtgcc 240
tccaggtggt tcaatcgcgg cagccagagg gatttcagat gatcgcgcgt acaggttgag 300
cagcagtgtc agcaaaggta gcagtttgcc agaatgatcg gttcagctgt taatcaatgc 360
cagcaagaga aggggtcaag tgcaaacacg ggcatgccac agcacgggca ccggggagtg 420
gaatggcacc accaagtgtg tgcgagccag catcgccgcc tggctgtttc agctacaacg 480
gcaggagtca tccaacgtaa ccatgagctg atcaacactg caatcatcgg gcgggcgtga 540
tgcaagcatg cctggcgaag acacatggtg tgcggatgct gccggctgct gcctgctgcg 600
cacgccgttg agttggcagc aggctcagcc atgcactgga tggcagctgg gctgccactg 660
caatgtggtg gataggatgc aagtggagcg aataccaaac cctctggctg cttgctgggt 720
tgcatggcat cgcaccatca gcaggagcgc atgcgaaggg actggcccca tgcacgccat 780
gccaaaccgg agcgcaccga gtgtccacac tgtcaccagg cccgcaagct ttgcagaacc 840
atgctcatgg acgcatgtag cgctgacgtc ccttgacggc gctcctctcg ggtgtgggaa 900
acgcaatgca gcacaggcag cagaggcggc ggcagcagag cggcggcagc agcggcgggg 960
gccacccttc ttgcggggtc gcgccccagc cagcggtgat gcgctgatcc caaacgagtt 1020
cacattcatt tgcatgcctg gagaagcgag gctggggcct ttgggctggt gcagcccgca 1080
atggaatgcg ggaccgccag gctagcagca aaggcgcctc ccctactccg catcgatgtt 1140
ccatagtgca ttggactgca tttgggtggg gcggccggct gtttctttcg tgttgcaaaa 1200
cgcgccagct cagcaacctg tcccgtgggt cccccgtgcc gatgaaatcg tgtgcacgcc 1260
gatcagctga ttgcccggct cgcgaagtag gcgccctcct ttctgctcgc cctctctccg 1320
tcccgcctct agaatatcaa tgatcgagca ggacggcctc cacgccggct cccccgccgc 1380
ctgggtggag cgcctgttcg gctacgactg ggcccagcag accatcggct gctccgacgc 1440
cgccgtgttc cgcctgtccg cccagggccg ccccgtgctg ttcgtgaaga ccgacctgtc 1500
cggcgccctg aacgagctgc aggacgaggc cgcccgcctg tcctggctgg ccaccaccgg 1560
cgtgccctgc gccgccgtgc tggacgtggt gaccgaggcc ggccgcgact ggctgctgct 1620
gggcgaggtg cccggccagg acctgctgtc ctcccacctg gcccccgccg agaaggtgtc 1680
catcatggcc gacgccatgc gccgcctgca caccctggac cccgccacct gccccttcga 1740
ccaccaggcc aagcaccgca tcgagcgcgc ccgcacccgc atggaggccg gcctggtgga 1800
ccaggacgac ctggacgagg agcaccaggg cctggccccc gccgagctgt tcgcccgcct 1860
gaaggcccgc atgcccgacg gcgaggacct ggtggtgacc cacggcgacg cctgcctgcc 1920
caacatcatg gtggagaacg gccgcttctc cggcttcatc gactgcggcc gcctgggcgt 1980
ggccgaccgc taccaggaca tcgccctggc cacccgcgac atcgccgagg agctgggcgg 2040
cgagtgggcc gaccgcttcc tggtgctgta cggcatcgcc gcccccgact cccagcgcat 2100
cgccttctac cgcctgctgg acgagttctt ctgacaattg gcagcagcag ctcggatagt 2160
atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact tgctgccttg 2220
acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat cttgtgtgta 2280
cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc cagcatcccc 2340
ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt cctgctatcc 2400
ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt gggctccgcc 2460
tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc acgggaagta 2520
gtgggatggg aacacaaatg gaggatcccg cgtctcgaac agagcgcgca gaggaacgct 2580
gaaggtctcg cctctgtcgc acctcagcgc ggcatacacc acaataacca cctgacgaat 2640
gcgcttggtt cttcgtccat tagcgaagcg tccggttcac acacgtgcca cgttggcgag 2700
gtggcaggtg acaatgatcg gtggagctga tggtcgaaac gttcacagcc tagggatatc 2760
gaattccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 2820
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 2880
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 2940
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 3000
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 3060
cagtcacaac ccgcaaacac tagtatggcc accgcatcca ctttctcggc gttcaatgcc 3120
cgctgcggcg acctgcgtcg ctcggcgggc tccgggcccc ggcgcccagc gaggcccctc 3180
cccgtgcgcg ggcgcgcccc cgactggtcc atgctgttcg ccgtgatcac caccatcttc 3240
agcgccgccg agaagcagtg gaccaacctg gagtggaagc ccaagcccaa gctgccccag 3300
ctgctggacg accacttcgg cctgcacggc ctggtgttcc gccgcacctt cgccatccgc 3360
tcctacgagg tgggccccga ccgcagcacc tccatcctgg ccgtgatgaa ccacatgcag 3420
gaggccaccc tgaaccacgc caagagcgtg ggcatcctgg gcgacggctt cggcaccacc 3480
ctggagatgt ccaagcgcga cctgatgtgg gtggtgcgcc gcacccacgt ggccgtggag 3540
cgctacccca cctggggcga caccgtggag gtggagtgct ggatcggcgc cagcggcaac 3600
aacggcatgc gccgcgactt cctggtgcgc gactgcaaga ccggcgagat cctgacccgc 3660
tgcacctccc tgagcgtgct gatgaacacc cgcacccgcc gcctgagcac catccccgac 3720
gaggtgcgcg gcgagatcgg ccccgccttc atcgacaacg tggccgtgaa ggacgacgag 3780
atcaagaagc tgcagaagct gaacgactcc accgccgact acatccaggg cggcctgacc 3840
ccccgctgga acgacctgga cgtgaaccag cacgtgaaca acctgaagta cgtggcctgg 3900
gtgttcgaga ccgtgcccga cagcatcttc gagtcccacc acatcagctc cttcaccctg 3960
gagtaccgcc gcgagtgcac ccgcgactcc gtgctgcgca gcctgaccac cgtgagcggc 4020
ggcagctccg aggccggcct ggtgtgcgac cacctgctgc agctggaggg cggcagcgag 4080
gtgctgcgcg cccgcaccga gtggcgcccc aagctgaccg actccttccg cggcatcagc 4140
gtgatccccg ccgagccccg cgtgatggac tacaaggacc acgacggcga ctacaaggac 4200
cacgacatcg actacaagga cgacgacgac aagtgactcg aggcagcagc agctcggata 4260
gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca cttgctgcct 4320
tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg 4380
tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc cccagcatcc 4440
ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct gtcctgctat 4500
ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt ttgggctccg 4560
cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat gcacgggaag 4620
tagtgggatg ggaacacaaa tggaaagctt gagctc 4656
<210> 251
<211> 1152
<212> DNA
<213> Umbellularia californica
<400> 251
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120
tggtccatgc tgttcgccgt gatcaccacc atcttcagcg ccgccgagaa gcagtggacc 180
aacctggagt ggaagcccaa gcccaagctg ccccagctgc tggacgacca cttcggcctg 240
cacggcctgg tgttccgccg caccttcgcc atccgctcct acgaggtggg ccccgaccgc 300
agcacctcca tcctggccgt gatgaaccac atgcaggagg ccaccctgaa ccacgccaag 360
agcgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420
atgtgggtgg tgcgccgcac ccacgtggcc gtggagcgct accccacctg gggcgacacc 480
gtggaggtgg agtgctggat cggcgccagc ggcaacaacg gcatgcgccg cgacttcctg 540
gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgctgatg 600
aacacccgca cccgccgcct gagcaccatc cccgacgagg tgcgcggcga gatcggcccc 660
gccttcatcg acaacgtggc cgtgaaggac gacgagatca agaagctgca gaagctgaac 720
gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacgtg 780
aaccagcacg tgaacaacct gaagtacgtg gcctgggtgt tcgagaccgt gcccgacagc 840
atcttcgagt cccaccacat cagctccttc accctggagt accgccgcga gtgcacccgc 900
gactccgtgc tgcgcagcct gaccaccgtg agcggcggca gctccgaggc cggcctggtg 960
tgcgaccacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgcccg caccgagtgg 1020
cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gccccgcgtg 1080
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140
gacgacaagt ga 1152
<210> 252
<211> 6789
<212> DNA
<213> Garcinia mangostana
<400> 252
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300
aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360
cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420
ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480
cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540
gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600
tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660
ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720
ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780
ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840
aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900
aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960
ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020
gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080
caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140
tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200
tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260
tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320
agcgggccca caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt 4380
tcaatgcccg ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga 4440
ggcccctccc cgtgcgcggg cgcgccgcca acgcccaggc ccccaccaag atcaacggct 4500
ccaccgacga cgcccagctg cccgcccccc gcaccttcat caaccagctg cccgactggt 4560
ccatgctgct ggccgccatc accaccgtgt tcctggccgc cgagaagcag tggatgatgc 4620
tggactggaa gccccgccgc cccgacatgc tgatcgacac cttcggcctg ggccgcatcg 4680
tgcaggacgg cctggtgttc cgccagaact tctccatccg ctcctacgag atcggcgccg 4740
accgcaccgc ctccatcgag accgtgatga accacctgca ggagaccgcc ctgaaccacg 4800
tgaagaccgc cggcctgctg ggcgacggct tcggctccac ccccgagatg tccaagcgca 4860
acctgatctg ggtggtgacc aagatgcagg tggaggtgga ccgctacccc acctggggcg 4920
acgtggtgca ggtggacacc tgggtgtccg cctccggcaa gaacggcatg cgccgcgact 4980
ggctgctgcg cgacggcaac accggcgaga ccctgacccg cgcctcctcc gtgtgggtga 5040
tgatgaacaa gctgacccgc cgcctgtcca agatccccga ggaggtgcgc gaggagatcg 5100
gctcctactt cgtgaactcc gaccccgtgg tggaggagga cggccgcaag gtgaccaagc 5160
tggacgacaa caccgccgac ttcgtgcgca agggcctgac ccccaagtgg aacgacctgg 5220
acatcaacca gcacgtgaac aacgtgaagt acatcggctg gatcctggag tccgcccccc 5280
agcccatcct ggagacccgc gagctgtccg ccgtgaccct ggagtaccgc cgcgagtgcg 5340
gccgcgactc cgtgctgcgc tccctgaccg ccgtgtccgg cggcggcgtg ggcgacctgg 5400
gccacgccgg caacgtggag tgccagcacg tgctgcgcct ggaggacggc gccgagatcg 5460
tgcgcggccg caccgagtgg cgccccaagt acatcaacaa cttctccatc atgggccaga 5520
tccccaccga cgcctccatg gactacaagg accacgacgg cgactacaag gaccacgaca 5580
tcgactacaa ggacgacgac gacaagtgaa tcgatagatc tcttaaggca gcagcagctc 5640
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 5700
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 5760
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 5820
catccccttc cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct 5880
gctatccctc agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg 5940
ctccgcctgt attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg 6000
ggaagtagtg ggatgggaac acaaatggaa agcttaatta agagctcttg ttttccagaa 6060
ggagttgctc cttgagcctt tcattctcag cctcgataac ctccaaagcc gctctaattg 6120
tggagggggt tcgaatttaa aagcttggaa tgttggttcg tgcgtctgga acaagcccag 6180
acttgttgct cactgggaaa aggaccatca gctccaaaaa acttgccgct caaaccgcgt 6240
acctctgctt tcgcgcaatc tgccctgttg aaatcgccac cacattcata ttgtgacgct 6300
tgagcagtct gtaattgcct cagaatgtgg aatcatctgc cccctgtgcg agcccatgcc 6360
aggcatgtcg cgggcgagga cacccgccac tcgtacagca gaccattatg ctacctcaca 6420
atagttcata acagtgacca tatttctcga agctccccaa cgagcacctc catgctctga 6480
gtggccaccc cccggccctg gtgcttgcgg agggcaggtc aaccggcatg gggctaccga 6540
aatccccgac cggatcccac cacccccgcg atgggaagaa tctctccccg ggatgtgggc 6600
ccaccaccag cacaacctgc tggcccaggc gagcgtcaaa ccataccaca caaatatcct 6660
tggcatcggc cctgaattcc ttctgccgct ctgctacccg gtgcttctgt ccgaagcagg 6720
ggttgctagg gatcgctccg agtccgcaaa cccttgtcgc gtggcggggc ttgttcgagc 6780
ttgaagagc 6789
<210> 253
<211> 1257
<212> DNA
<213> Garcinia mangostana
<400> 253
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgccaac 120
gcccaggccc ccaccaagat caacggctcc accgacgacg cccagctgcc cgccccccgc 180
accttcatca accagctgcc cgactggtcc atgctgctgg ccgccatcac caccgtgttc 240
ctggccgccg agaagcagtg gatgatgctg gactggaagc cccgccgccc cgacatgctg 300
atcgacacct tcggcctggg ccgcatcgtg caggacggcc tggtgttccg ccagaacttc 360
tccatccgct cctacgagat cggcgccgac cgcaccgcct ccatcgagac cgtgatgaac 420
cacctgcagg agaccgccct gaaccacgtg aagaccgccg gcctgctggg cgacggcttc 480
ggctccaccc ccgagatgtc caagcgcaac ctgatctggg tggtgaccaa gatgcaggtg 540
gaggtggacc gctaccccac ctggggcgac gtggtgcagg tggacacctg ggtgtccgcc 600
tccggcaaga acggcatgcg ccgcgactgg ctgctgcgcg acggcaacac cggcgagacc 660
ctgacccgcg cctcctccgt gtgggtgatg atgaacaagc tgacccgccg cctgtccaag 720
atccccgagg aggtgcgcga ggagatcggc tcctacttcg tgaactccga ccccgtggtg 780
gaggaggacg gccgcaaggt gaccaagctg gacgacaaca ccgccgactt cgtgcgcaag 840
ggcctgaccc ccaagtggaa cgacctggac atcaaccagc acgtgaacaa cgtgaagtac 900
atcggctgga tcctggagtc cgccccccag cccatcctgg agacccgcga gctgtccgcc 960
gtgaccctgg agtaccgccg cgagtgcggc cgcgactccg tgctgcgctc cctgaccgcc 1020
gtgtccggcg gcggcgtggg cgacctgggc cacgccggca acgtggagtg ccagcacgtg 1080
ctgcgcctgg aggacggcgc cgagatcgtg cgcggccgca ccgagtggcg ccccaagtac 1140
atcaacaact tctccatcat gggccagatc cccaccgacg cctccatgga ctacaaggac 1200
cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga caagtga 1257
<210> 254
<211> 6707
<212> DNA
<213> Brassica napus
<400> 254
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300
gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360
accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420
cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480
tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540
tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600
gtccgtgtca tccactctaa agaactcgac tacgacctac tgatggccct agattcttca 3660
tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720
ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780
ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840
ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900
gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960
aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020
cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080
ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140
gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200
gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260
aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320
ggcccacagg ccggtcgcag ccactagtat gctgaagctg tcctgcaacg tgaccaacaa 4380
cctgcacacc ttctccttct tctccgactc ctccctgttc atccccgtga accgccgcac 4440
catcgccgtg tcctccgggc gcgcctccca gctgcgcaag cccgccctgg accccctgcg 4500
cgccgtgatc tccgccgacc agggctccat ctcccccgtg aactcctgca cccccgccga 4560
ccgcctgcgc gccggccgcc tgatggagga cggctactcc tacaaggaga agttcatcgt 4620
gcgctcctac gaggtgggca tcaacaagac cgccaccgtg gagaccatcg ccaacctgct 4680
gcaggaggtg gcctgcaacc acgtgcagaa gtgcggcttc tccaccgacg gcttcgccac 4740
caccctgacc atgcgcaagc tgcacctgat ctgggtgacc gcccgcatgc acatcgagat 4800
ctacaagtac cccgcctggt ccgacgtggt ggagatcgag acctggtgcc agtccgaggg 4860
ccgcatcggc acccgccgcg actggatcct gcgcgactcc gccaccaacg aggtgatcgg 4920
ccgcgccacc tccaagtggg tgatgatgaa ccaggacacc cgccgcctgc agcgcgtgac 4980
cgacgaggtg cgcgacgagt acctggtgtt ctgcccccgc gagccccgcc tggccttccc 5040
cgaggagaac aactcctccc tgaagaagat ccccaagctg gaggaccccg cccagtactc 5100
catgctggag ctgaagcccc gccgcgccga cctggacatg aaccagcacg tgaacaacgt 5160
gacctacatc ggctgggtgc tggagtccat cccccaggag atcatcgaca cccacgagct 5220
gcaggtgatc accctggact accgccgcga gtgccagcag gacgacatcg tggactccct 5280
gaccacctcc gagatccccg acgaccccat ctccaagttc accggcacca acggctccgc 5340
catgtcctcc atccagggcc acaacgagtc ccagttcctg cacatgctgc gcctgtccga 5400
gaacggccag gagatcaacc gcggccgcac ccagtggcgc aagaagtcct cccgcatgga 5460
ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 5520
caagtgaatc gatagatctc ttaaggcagc agcagctcgg atagtatcga cacactctgg 5580
acgctggtcg tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc 5640
tgccgctttt atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt 5700
tgctagctgc ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata 5760
tcgcttgcat cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct 5820
gctcctgctc actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta 5880
ctgcaacctg taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac 5940
aaatggaaag cttaattaag agctcttgtt ttccagaagg agttgctcct tgagcctttc 6000
attctcagcc tcgataacct ccaaagccgc tctaattgtg gagggggttc gaatttaaaa 6060
gcttggaatg ttggttcgtg cgtctggaac aagcccagac ttgttgctca ctgggaaaag 6120
gaccatcagc tccaaaaaac ttgccgctca aaccgcgtac ctctgctttc gcgcaatctg 6180
ccctgttgaa atcgccacca cattcatatt gtgacgcttg agcagtctgt aattgcctca 6240
gaatgtggaa tcatctgccc cctgtgcgag cccatgccag gcatgtcgcg ggcgaggaca 6300
cccgccactc gtacagcaga ccattatgct acctcacaat agttcataac agtgaccata 6360
tttctcgaag ctccccaacg agcacctcca tgctctgagt ggccaccccc cggccctggt 6420
gcttgcggag ggcaggtcaa ccggcatggg gctaccgaaa tccccgaccg gatcccacca 6480
cccccgcgat gggaagaatc tctccccggg atgtgggccc accaccagca caacctgctg 6540
gcccaggcga gcgtcaaacc ataccacaca aatatccttg gcatcggccc tgaattcctt 6600
ctgccgctct gctacccggt gcttctgtcc gaagcagggg ttgctaggga tcgctccgag 6660
tccgcaaacc cttgtcgcgt ggcggggctt gttcgagctt gaagagc 6707
<210> 255
<211> 1179
<212> DNA
<213> Brassica napus
<400> 255
atgctgaagc tgtcctgcaa cgtgaccaac aacctgcaca ccttctcctt cttctccgac 60
tcctccctgt tcatccccgt gaaccgccgc accatcgccg tgtcctccgg gcgcgcctcc 120
cagctgcgca agcccgccct ggaccccctg cgcgccgtga tctccgccga ccagggctcc 180
atctcccccg tgaactcctg cacccccgcc gaccgcctgc gcgccggccg cctgatggag 240
gacggctact cctacaagga gaagttcatc gtgcgctcct acgaggtggg catcaacaag 300
accgccaccg tggagaccat cgccaacctg ctgcaggagg tggcctgcaa ccacgtgcag 360
aagtgcggct tctccaccga cggcttcgcc accaccctga ccatgcgcaa gctgcacctg 420
atctgggtga ccgcccgcat gcacatcgag atctacaagt accccgcctg gtccgacgtg 480
gtggagatcg agacctggtg ccagtccgag ggccgcatcg gcacccgccg cgactggatc 540
ctgcgcgact ccgccaccaa cgaggtgatc ggccgcgcca cctccaagtg ggtgatgatg 600
aaccaggaca cccgccgcct gcagcgcgtg accgacgagg tgcgcgacga gtacctggtg 660
ttctgccccc gcgagccccg cctggccttc cccgaggaga acaactcctc cctgaagaag 720
atccccaagc tggaggaccc cgcccagtac tccatgctgg agctgaagcc ccgccgcgcc 780
gacctggaca tgaaccagca cgtgaacaac gtgacctaca tcggctgggt gctggagtcc 840
atcccccagg agatcatcga cacccacgag ctgcaggtga tcaccctgga ctaccgccgc 900
gagtgccagc aggacgacat cgtggactcc ctgaccacct ccgagatccc cgacgacccc 960
atctccaagt tcaccggcac caacggctcc gccatgtcct ccatccaggg ccacaacgag 1020
tcccagttcc tgcacatgct gcgcctgtcc gagaacggcc aggagatcaa ccgcggccgc 1080
acccagtggc gcaagaagtc ctcccgcatg gactacaagg accacgacgg cgactacaag 1140
gaccacgaca tcgactacaa ggacgacgac gacaagtga 1179
<210> 256
<211> 5988
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 256
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cctttcttgc gctatgacac 3300
ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat 3360
gatgcttcga ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg 3420
gcgagcgctg tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa 3480
gccatattca aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg 3540
cactccgcta agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacactagta 3600
tggccaccgc atccactttc tcggcgttca atgcccgctg cggcgacctg cgtcgctcgg 3660
cgggctccgg gccccggcgc ccagcgaggc ccctccccgt gcgcgggcgc gccgaggtgc 3720
acgtgcaggt gacccactcc ctggcccccg agaagcgcga gatcttcaac tccctgaaca 3780
actgggccca ggagaacatc ctggtgctgc tgaaggacgt ggacaagtgc tggcagccct 3840
ccgacttcct gcccgactcc gcctccgagg gcttcgacga gcaggtgatg gagctgcgca 3900
agcgctgcaa ggagatcccc gacgactact tcatcgtgct ggtgggcgac atgatcaccg 3960
aggaggccct gcccacctac cagaccatgc tgaacaccct ggacggcgtg cgcgacgaga 4020
ccggcgcctc cctgaccccc tgggccatct ggacccgcgc ctggaccgcc gaggagaacc 4080
gccacggcga cctgctgaac aagtacctgt acctgtccgg ccgcgtggac atgaagcaga 4140
tcgagaagac catccagtac ctgatcggct ccggcatgga cccccgcacc gagaacaacc 4200
cctacctggg cttcatctac acctccttcc aggagcgcgc caccttcatc tcccacggca 4260
acaccgcccg cctggccaag gagcacggcg acctgaagct ggcccagatc tgcggcatca 4320
tcgccgccga cgagaagcgc cacgagaccg cctacaccaa gatcgtggag aagctgttcg 4380
agatcgaccc cgacggcacc gtgctggccc tggccgacat gatgcgcaag aaggtgtcca 4440
tgcccgccca cctgatgtac gacggccagg acgacaacct gttcgagaac ttctcctccg 4500
tggcccagcg cctgggcgtg tacaccgcca aggactacgc cgacatcctg gagttcctgg 4560
tgggccgctg ggacatcgag aagctgaccg gcctgtccgg cgagggccgc aaggcccagg 4620
actacgtgtg caccctgccc ccccgcatcc gccgcctgga ggagcgcgcc cagtcccgcg 4680
tgaagaaggc ctccgccacc cccttctcct ggatcttcgg ccgcgagatc aacctgatgg 4740
actacaagga ccacgacggc gactacaagg accacgacat cgactacaag gacgacgacg 4800
acaagtgaat cgatagatct cttaaggcag cagcagctcg gatagtatcg acacactctg 4860
gacgctggtc gtgtgatgga ctgttgccgc cacacttgct gccttgacct gtgaatatcc 4920
ctgccgcttt tatcaaacag cctcagtgtg tttgatcttg tgtgtacgcg cttttgcgag 4980
ttgctagctg cttgtgctat ttgcgaatac cacccccagc atccccttcc ctcgtttcat 5040
atcgcttgca tcccaaccgc aacttatcta cgctgtcctg ctatccctca gcgctgctcc 5100
tgctcctgct cactgcccct cgcacagcct tggtttgggc tccgcctgta ttctcctggt 5160
actgcaacct gtaaaccagc actgcaatgc tgatgcacgg gaagtagtgg gatgggaaca 5220
caaatggaaa gcttaattaa gagctcttgt tttccagaag gagttgctcc ttgagccttt 5280
cattctcagc ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa 5340
agcttggaat gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa 5400
ggaccatcag ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct 5460
gccctgttga aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc 5520
agaatgtgga atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac 5580
acccgccact cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat 5640
atttctcgaa gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg 5700
tgcttgcgga gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc 5760
acccccgcga tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct 5820
ggcccaggcg agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct 5880
tctgccgctc tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga 5940
gtccgcaaac ccttgtcgcg tggcggggct tgttcgagct tgaagagc 5988
<210> 257
<211> 1209
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 257
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgaggtg 120
cacgtgcagg tgacccactc cctggccccc gagaagcgcg agatcttcaa ctccctgaac 180
aactgggccc aggagaacat cctggtgctg ctgaaggacg tggacaagtg ctggcagccc 240
tccgacttcc tgcccgactc cgcctccgag ggcttcgacg agcaggtgat ggagctgcgc 300
aagcgctgca aggagatccc cgacgactac ttcatcgtgc tggtgggcga catgatcacc 360
gaggaggccc tgcccaccta ccagaccatg ctgaacaccc tggacggcgt gcgcgacgag 420
accggcgcct ccctgacccc ctgggccatc tggacccgcg cctggaccgc cgaggagaac 480
cgccacggcg acctgctgaa caagtacctg tacctgtccg gccgcgtgga catgaagcag 540
atcgagaaga ccatccagta cctgatcggc tccggcatgg acccccgcac cgagaacaac 600
ccctacctgg gcttcatcta cacctccttc caggagcgcg ccaccttcat ctcccacggc 660
aacaccgccc gcctggccaa ggagcacggc gacctgaagc tggcccagat ctgcggcatc 720
atcgccgccg acgagaagcg ccacgagacc gcctacacca agatcgtgga gaagctgttc 780
gagatcgacc ccgacggcac cgtgctggcc ctggccgaca tgatgcgcaa gaaggtgtcc 840
atgcccgccc acctgatgta cgacggccag gacgacaacc tgttcgagaa cttctcctcc 900
gtggcccagc gcctgggcgt gtacaccgcc aaggactacg ccgacatcct ggagttcctg 960
gtgggccgct gggacatcga gaagctgacc ggcctgtccg gcgagggccg caaggcccag 1020
gactacgtgt gcaccctgcc cccccgcatc cgccgcctgg aggagcgcgc ccagtcccgc 1080
gtgaagaagg cctccgccac ccccttctcc tggatcttcg gccgcgagat caacctgatg 1140
gactacaagg accacgacgg cgactacaag gaccacgaca tcgactacaa ggacgacgac 1200
gacaagtga 1209
<210> 258
<211> 6753
<212> DNA
<213> Cuphea hookeriana
<400> 258
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggccgacag gacgcgcgtc 3300
aaaggtgctg gtcgtgtatg ccctggccgg caggtcgttg ctgctgctgg ttagtgattc 3360
cgcaaccctg attttggcgt cttattttgg cgtggcaaac gctggcgccc gcgagccggg 3420
ccggcggcga tgcggtgccc cacggctgcc ggaatccaag ggaggcaaga gcgcccgggt 3480
cagttgaagg gctttacgcg caaggtacag ccgctcctgc aaggctgcgt ggtggaattg 3540
gacgtgcagg tcctgctgaa gttcctccac cgcctcacca gcggacaaag caccggtgta 3600
tcaggtccgt gtcatccact ctaaagaact cgactacgac ctactgatgg ccctagattc 3660
ttcatcaaaa acgcctgaga cacttgccca ggattgaaac tccctgaagg gaccaccagg 3720
ggccctgagt tgttccttcc ccccgtggcg agctgccagc caggctgtac ctgtgatcga 3780
ggctggcggg aaaataggct tcgtgtgctc aggtcatggg aggtgcagga cagctcatga 3840
aacgccaaca atcgcacaat tcatgtcaag ctaatcagct atttcctctt cacgagctgt 3900
aattgtccca aaattctggt ctaccggggg tgatccttcg tgtacgggcc cttccctcaa 3960
ccctaggtat gcgcgcatgc ggtcgccgcg caactcgcgc gagggccgag ggtttgggac 4020
gggccgtccc gaaatgcagt tgcacccgga tgcgtggcac cttttttgcg ataatttatg 4080
caatggactg ctctgcaaaa ttctggctct gtcgccaacc ctaggatcag cggcgtagga 4140
tttcgtaatc attcgtcctg atggggagct accgactacc ctaatatcag cccgactgcc 4200
tgacgccagc gtccactttt gtgcacacat tccattcgtg cccaagacat ttcattgtgg 4260
tgcgaagcgt ccccagttac gctcacctgt ttcccgacct ccttactgtt ctgtcgacag 4320
agcgggccca caggccggtc gcagccacta gtatggccac cgcatccact ttctcggcgt 4380
tcaatgcccg ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga 4440
ggcccctccc cgtgcgcggg cgcgccaccc aggaggacgc ccactccgcc cccccccccc 4500
gcaccttcat caaccagctg cccgactggt ccatgctgct ggccgccatc accaccgtgt 4560
tcctggccgc cgagaagcag tggatgatgc tggactggaa gcccaagcgc cccgacatgc 4620
tggtggaccc cttcggcctg ggctccatcg tgcaggacgg cctggtgttc cgccagaact 4680
tctccatccg ctcctacgag atcggcgccg accgcaccgc ctccatcgag accgtgatga 4740
accacctgca ggagaccgcc ctgaaccacg tgaagatcgc cggcctgtcc aacgacggct 4800
tcggccgcac ccccgagatg tacaagcgcg acctgatctg ggtggtggcc aagatgcagg 4860
tgatggtgaa ccgctacccc acctggggcg acaccgtgga ggtgaacacc tgggtggcca 4920
agtccggcaa gaacggcatg cgccgcgact ggctgatctc cgactgcaac accggcgaga 4980
tcctgacccg cgcctcctcc gtgtgggtga tgatgaacca gaagacccgc cgcctgtcca 5040
agatccccga cgaggtgcgc aacgagatcg agccccactt cgtggactcc ccccccgtga 5100
tcgaggacga cgaccgcaag ctgcccaagc tggacgagaa gaccgccgac tccatccgca 5160
agggcctgac cccccgctgg aacgacctgg acgtgaacca gcacgtgaac aacgtgaagt 5220
acatcggctg gatcctggag tccacccccc ccgaggtgct ggagacccag gagctgtgct 5280
ccctgaccct ggagtaccgc cgcgagtgcg gccgcgagtc cgtgctggag tccctgaccg 5340
ccatggaccc ctccggcggc ggctacggct cccagttcca gcacctgctg cgcctggagg 5400
acggcggcga gatcgtgaag ggccgcaccg agtggcgccc caagaacggc gtgatcaacg 5460
gcgtggtgcc caccggcgag tcctcccccg gcgactactc catggactac aaggaccacg 5520
acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag tgaatcgata 5580
gatctcttaa ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 5640
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 5700
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 5760
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 5820
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 5880
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 5940
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaaagctta 6000
attaagagct cttgttttcc agaaggagtt gctccttgag cctttcattc tcagcctcga 6060
taacctccaa agccgctcta attgtggagg gggttcgaat ttaaaagctt ggaatgttgg 6120
ttcgtgcgtc tggaacaagc ccagacttgt tgctcactgg gaaaaggacc atcagctcca 6180
aaaaacttgc cgctcaaacc gcgtacctct gctttcgcgc aatctgccct gttgaaatcg 6240
ccaccacatt catattgtga cgcttgagca gtctgtaatt gcctcagaat gtggaatcat 6300
ctgccccctg tgcgagccca tgccaggcat gtcgcgggcg aggacacccg ccactcgtac 6360
agcagaccat tatgctacct cacaatagtt cataacagtg accatatttc tcgaagctcc 6420
ccaacgagca cctccatgct ctgagtggcc accccccggc cctggtgctt gcggagggca 6480
ggtcaaccgg catggggcta ccgaaatccc cgaccggatc ccaccacccc cgcgatggga 6540
agaatctctc cccgggatgt gggcccacca ccagcacaac ctgctggccc aggcgagcgt 6600
caaaccatac cacacaaata tccttggcat cggccctgaa ttccttctgc cgctctgcta 6660
cccggtgctt ctgtccgaag caggggttgc tagggatcgc tccgagtccg caaacccttg 6720
tcgcgtggcg gggcttgttc gagcttgaag agc 6753
<210> 259
<211> 1221
<212> DNA
<213> Cuphea hookeriana
<400> 259
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccacccag 120
gaggacgccc actccgcccc ccccccccgc accttcatca accagctgcc cgactggtcc 180
atgctgctgg ccgccatcac caccgtgttc ctggccgccg agaagcagtg gatgatgctg 240
gactggaagc ccaagcgccc cgacatgctg gtggacccct tcggcctggg ctccatcgtg 300
caggacggcc tggtgttccg ccagaacttc tccatccgct cctacgagat cggcgccgac 360
cgcaccgcct ccatcgagac cgtgatgaac cacctgcagg agaccgccct gaaccacgtg 420
aagatcgccg gcctgtccaa cgacggcttc ggccgcaccc ccgagatgta caagcgcgac 480
ctgatctggg tggtggccaa gatgcaggtg atggtgaacc gctaccccac ctggggcgac 540
accgtggagg tgaacacctg ggtggccaag tccggcaaga acggcatgcg ccgcgactgg 600
ctgatctccg actgcaacac cggcgagatc ctgacccgcg cctcctccgt gtgggtgatg 660
atgaaccaga agacccgccg cctgtccaag atccccgacg aggtgcgcaa cgagatcgag 720
ccccacttcg tggactcccc ccccgtgatc gaggacgacg accgcaagct gcccaagctg 780
gacgagaaga ccgccgactc catccgcaag ggcctgaccc cccgctggaa cgacctggac 840
gtgaaccagc acgtgaacaa cgtgaagtac atcggctgga tcctggagtc cacccccccc 900
gaggtgctgg agacccagga gctgtgctcc ctgaccctgg agtaccgccg cgagtgcggc 960
cgcgagtccg tgctggagtc cctgaccgcc atggacccct ccggcggcgg ctacggctcc 1020
cagttccagc acctgctgcg cctggaggac ggcggcgaga tcgtgaaggg ccgcaccgag 1080
tggcgcccca agaacggcgt gatcaacggc gtggtgccca ccggcgagtc ctcccccggc 1140
gactactcca tggactacaa ggaccacgac ggcgactaca aggaccacga catcgactac 1200
aaggacgacg acgacaagtg a 1221
<210> 260
<211> 6860
<212> DNA
<213> Elaeis guineensis
<400> 260
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300
gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360
accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420
cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480
tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540
tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600
gtccgtgtca tccactctaa agaactcgac tacgacctac tgatggccct agattcttca 3660
tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720
ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780
ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840
ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900
gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960
aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020
cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080
ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140
gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200
gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260
aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320
ggcccacagg ccggtcgcag ccactagtat ggtggcctcc atcgccgcct ccgccttctt 4380
ccccaccccc tccttctccc ccaccgggcg cgccgcctcc gccaaggcct ccaagaccat 4440
cggcgagggc tccgagaacc tggacgcccg cggcatcatc gccaagccca cctcctcctc 4500
cgccgccatg cagggcaagg tgatggccca ggccgtgtcc aagatcaacg gcgccaaggt 4560
gggcctgaag gccgagtccc agaaggccga ggaggacgcc gccccctcct ccgccccccg 4620
caccttctac aaccagctgc ccgactggtc cgtgctgctg gccgccgtga ccaccatctt 4680
cctggccgcc gagaagcagt ggaccctgct ggactggaag ccccgccgcc ccgacatgct 4740
gaccgacgcc ttctccctgg gcaagatcgt gcaggacggc ctggtgttca agcagaactt 4800
ctccatccgc tcctacgaga tcggcgccga ccgcaccgcc tccatcgaga ccctgatgaa 4860
ccacctgcag gagaccgccc tgaaccacgt gcgctccgcc ggcctgatgg gcgacggctt 4920
cggcgccacc cccgagatgt ccaagcgcaa cctgatctgg gtggtgacca aggtgcgcgt 4980
gctgatcgag cactacccct cctggggcga cgtggtggag gtggacacct gggtgggccc 5040
cgccggcaag aacggcatgc gccgcgactg gcacgtgcgc gaccaccgca ccggccagac 5100
catcctgcgc gccacccgcg tgtgggtgat gatgaacaag aacacccgca agctgtccaa 5160
ggtgcccgag gaggtgcgcg ccgagatcgg cccctacttc gtggagcgcg ccgccatcgt 5220
ggacgaggac tcccgcaagc tgcccaagct ggacgaggac accaccgact acgtgaagaa 5280
gggcctgacc ccccgctggt ccgacctgga cgtgaaccag cacgtgaaca acgtgaagta 5340
catcggctgg atcctggagt ccgcccccat ctccatcctg gagaaccacg agctggcctc 5400
catgaccctg gagtaccgcc gcgagtgcgg ccgcgactcc gtgctgcagt ccctgaccgc 5460
cgtggccaac gactgcaccg gcggcctgcc cgaggcctcc atcgagtgcc agcacctgct 5520
gcagctggag tgcggcgccg agatcgtgcg cggccgcacc cagtggcgcc cccgccgcgc 5580
ctccggcccc acctccgccg gctccgccat ggactacaag gaccacgacg gcgactacaa 5640
ggaccacgac atcgactaca aggacgacga cgacaagtga atcgatagat ctcttaaggc 5700
agcagcagct cggatagtat cgacacactc tggacgctgg tcgtgtgatg gactgttgcc 5760
gccacacttg ctgccttgac ctgtgaatat ccctgccgct tttatcaaac agcctcagtg 5820
tgtttgatct tgtgtgtacg cgcttttgcg agttgctagc tgcttgtgct atttgcgaat 5880
accaccccca gcatcccctt ccctcgtttc atatcgcttg catcccaacc gcaacttatc 5940
tacgctgtcc tgctatccct cagcgctgct cctgctcctg ctcactgccc ctcgcacagc 6000
cttggtttgg gctccgcctg tattctcctg gtactgcaac ctgtaaacca gcactgcaat 6060
gctgatgcac gggaagtagt gggatgggaa cacaaatgga aagcttaatt aagagctctt 6120
gttttccaga aggagttgct ccttgagcct ttcattctca gcctcgataa cctccaaagc 6180
cgctctaatt gtggaggggg ttcgaattta aaagcttgga atgttggttc gtgcgtctgg 6240
aacaagccca gacttgttgc tcactgggaa aaggaccatc agctccaaaa aacttgccgc 6300
tcaaaccgcg tacctctgct ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat 6360
attgtgacgc ttgagcagtc tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc 6420
gagcccatgc caggcatgtc gcgggcgagg acacccgcca ctcgtacagc agaccattat 6480
gctacctcac aatagttcat aacagtgacc atatttctcg aagctcccca acgagcacct 6540
ccatgctctg agtggccacc ccccggccct ggtgcttgcg gagggcaggt caaccggcat 6600
ggggctaccg aaatccccga ccggatccca ccacccccgc gatgggaaga atctctcccc 6660
gggatgtggg cccaccacca gcacaacctg ctggcccagg cgagcgtcaa accataccac 6720
acaaatatcc ttggcatcgg ccctgaattc cttctgccgc tctgctaccc ggtgcttctg 6780
tccgaagcag gggttgctag ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg 6840
cttgttcgag cttgaagagc 6860
<210> 261
<211> 1332
<212> DNA
<213> Elaeis guineensis
<400> 261
atggtggcct ccatcgccgc ctccgccttc ttccccaccc cctccttctc ccccaccggg 60
cgcgccgcct ccgccaaggc ctccaagacc atcggcgagg gctccgagaa cctggacgcc 120
cgcggcatca tcgccaagcc cacctcctcc tccgccgcca tgcagggcaa ggtgatggcc 180
caggccgtgt ccaagatcaa cggcgccaag gtgggcctga aggccgagtc ccagaaggcc 240
gaggaggacg ccgccccctc ctccgccccc cgcaccttct acaaccagct gcccgactgg 300
tccgtgctgc tggccgccgt gaccaccatc ttcctggccg ccgagaagca gtggaccctg 360
ctggactgga agccccgccg ccccgacatg ctgaccgacg ccttctccct gggcaagatc 420
gtgcaggacg gcctggtgtt caagcagaac ttctccatcc gctcctacga gatcggcgcc 480
gaccgcaccg cctccatcga gaccctgatg aaccacctgc aggagaccgc cctgaaccac 540
gtgcgctccg ccggcctgat gggcgacggc ttcggcgcca cccccgagat gtccaagcgc 600
aacctgatct gggtggtgac caaggtgcgc gtgctgatcg agcactaccc ctcctggggc 660
gacgtggtgg aggtggacac ctgggtgggc cccgccggca agaacggcat gcgccgcgac 720
tggcacgtgc gcgaccaccg caccggccag accatcctgc gcgccacccg cgtgtgggtg 780
atgatgaaca agaacacccg caagctgtcc aaggtgcccg aggaggtgcg cgccgagatc 840
ggcccctact tcgtggagcg cgccgccatc gtggacgagg actcccgcaa gctgcccaag 900
ctggacgagg acaccaccga ctacgtgaag aagggcctga ccccccgctg gtccgacctg 960
gacgtgaacc agcacgtgaa caacgtgaag tacatcggct ggatcctgga gtccgccccc 1020
atctccatcc tggagaacca cgagctggcc tccatgaccc tggagtaccg ccgcgagtgc 1080
ggccgcgact ccgtgctgca gtccctgacc gccgtggcca acgactgcac cggcggcctg 1140
cccgaggcct ccatcgagtg ccagcacctg ctgcagctgg agtgcggcgc cgagatcgtg 1200
cgcggccgca cccagtggcg cccccgccgc gcctccggcc ccacctccgc cggctccgcc 1260
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1320
gacgacaagt ga 1332
<210> 262
<211> 5937
<212> DNA
<213> artificial sequence
<220>
<223> synthetic polynucleotide
<400> 262
gctcttcggg ctggtctgaa tccttcaggc gggtgttacc cgagaaagaa agggtgccga 60
tttcaaagca gacccatgtg ccgggccctg tggcctgtgt tggcgcctat gtagtcaccc 120
cccctcaccc aattgtcgcc agtttgcgca ctccataaac tcaaaacagc agcttctgag 180
ctgcgctgtt caagaacacc tctggggttt gctcacccgc gaggtcgacg cccagcatgg 240
ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg acgctgcgca 300
aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tagcagcatg tacctggcct 360
ttgacatcgc ggtcatgtcc ctgctctacg tcgcgtcgac gtacatcgac cctgcaccgg 420
tgcctacgtg ggtcaagtac ggcatcatgt ggccgctcta ctggttcttc caggtgtgtt 480
tgagggtttt ggttgcccgt attgaggtcc tggtggcgcg catggaggag aaggcgcctg 540
tcccgctgac ccccccggct accctcccgg caccttccag ggcgccttcg gcacgggtgt 600
ctgggtgtgc gcgcacgagt gcggccacca ggccttttcc tccagccagg ccatcaacga 660
cggcgtgggc ctggtgttcc acagcctgct gctggtgccc tactactcct ggaagcactc 720
gcaccgggta ccctttcttg cgctatgaca cttccagcaa aaggtagggc gggctgcgag 780
acggcttccc ggcgctgcat gcaacaccga tgatgcttcg accccccgaa gctccttcgg 840
ggctgcatgg gcgctccgat gccgctccag ggcgagcgct gtttaaatag ccaggccccc 900
gattgcaaag acattatagc gagctaccaa agccatattc aaacacctag atcactacca 960
cttctacaca ggccactcga gcttgtgatc gcactccgct aagggggcgc ctcttcctct 1020
tcgtttcagt cacaacccgc aaactctaga atatcaatgc tgctgcaggc cttcctgttc 1080
ctgctggccg gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc 1140
cccctggtgc acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac 1200
gacgagaagg acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg 1260
gggacgccct tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag 1320
cccatcgcca tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg 1380
gactacaaca acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg 1440
gccatctgga cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac 1500
ggcggctaca ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag 1560
ttccgcgacc cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc 1620
aagtcccagg actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg 1680
gagtccgcgt tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc 1740
gaggtcccca ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac 1800
cccggcgccc cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc 1860
cacttcgagg ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc 1920
ctgcagacct tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc 1980
tccaactggg agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc 2040
gtgcgcaagt tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac 2100
ctgaaggccg agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc 2160
aacaccacgt tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc 2220
ctggagttcg agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc 2280
gcggacctct ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc 2340
ttcgaggtgt ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg 2400
aaggagaacc cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag 2460
aacgacctgt cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac 2520
ttcaacgacg gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg 2580
ggctccgtga acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg 2640
cgcgaggtca agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc 2700
tggtcgtgtg atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc 2760
gcttttatca aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct 2820
agctgcttgt gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc 2880
ttgcatccca accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc 2940
ctgctcactg cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc 3000
aacctgtaaa ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat 3060
ggaggatccc gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg 3120
cacctcagcg cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca 3180
ttagcgaagc gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc 3240
ggtggagctg atggtcgaaa cgttcacagc ctagggatat cgaattcctt tcttgcgcta 3300
tgacacttcc agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac 3360
accgatgatg cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc 3420
tccagggcga gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct 3480
accaaagcca tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg 3540
tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaaca 3600
ctagtatggc caccgcatcc actttctcgg cgttcaatgc ccgctgcggc gacctgcgtc 3660
gctcggcggg ctccgggccc cggcgcccag cgaggcccct ccccgtgcgc gggcgcgccg 3720
ccaccggcga gcagccctcc ggcgtggcct ccctgcgcga ggccgacaag gagaagtccc 3780
tgggcaaccg cctgcgcctg ggctccctga ccgaggacgg cctgtcctac aaggagaagt 3840
tcgtgatccg ctgctacgag gtgggcatca acaagaccgc caccatcgag accatcgcca 3900
acctgctgca ggaggtgggc ggcaaccacg cccagggcgt gggcttctcc accgacggct 3960
tcgccaccac caccaccatg cgcaagctgc acctgatctg ggtgaccgcc cgcatgcaca 4020
tcgagatcta ccgctacccc gcctggtccg acgtgatcga gatcgagacc tgggtgcagg 4080
gcgagggcaa ggtgggcacc cgccgcgact ggatcctgaa ggactacgcc aacggcgagg 4140
tgatcggccg cgccacctcc aagtgggtga tgatgaacga ggacacccgc cgcctgcaga 4200
aggtgtccga cgacgtgcgc gaggagtacc tggtgttctg cccccgcacc ctgcgcctgg 4260
ccttccccga ggagaacaac aactccatga agaagatccc caagctggag gaccccgccg 4320
agtactcccg cctgggcctg gtgccccgcc gctccgacct ggacatgaac aagcacgtga 4380
acaacgtgac ctacatcggc tgggccctgg agtccatccc ccccgagatc atcgacaccc 4440
acgagctgca ggccatcacc ctggactacc gccgcgagtg ccagcgcgac gacatcgtgg 4500
actccctgac ctcccgcgag cccctgggca acgccgccgg cgtgaagttc aaggagatca 4560
acggctccgt gtcccccaag aaggacgagc aggacctgtc ccgcttcatg cacctgctgc 4620
gctccgccgg ctccggcctg gagatcaacc gctgccgcac cgagtggcgc aagaagcccg 4680
ccaagcgcat ggactacaag gaccacgacg gcgactacaa ggaccacgac atcgactaca 4740
aggacgacga cgacaagtga atcgatagat ctcttaaggc agcagcagct cggatagtat 4800
cgacacactc tggacgctgg tcgtgtgatg gactgttgcc gccacacttg ctgccttgac 4860
ctgtgaatat ccctgccgct tttatcaaac agcctcagtg tgtttgatct tgtgtgtacg 4920
cgcttttgcg agttgctagc tgcttgtgct atttgcgaat accaccccca gcatcccctt 4980
ccctcgtttc atatcgcttg catcccaacc gcaacttatc tacgctgtcc tgctatccct 5040
cagcgctgct cctgctcctg ctcactgccc ctcgcacagc cttggtttgg gctccgcctg 5100
tattctcctg gtactgcaac ctgtaaacca gcactgcaat gctgatgcac gggaagtagt 5160
gggatgggaa cacaaatgga aagcttaatt aagagctccc gccaccactc caacacgggg 5220
tgcctggaca aggacgaggt gtttgtgccg ccgcaccgcg cagtggcgca cgagggcctg 5280
gagtgggagg agtggctgcc catccgcatg ggcaaggtgc tggtcaccct gaccctgggc 5340
tggccgctgt acctcatgtt caacgtcgcc tcgcggccgt acccgcgctt cgccaaccac 5400
tttgacccgt ggtcgcccat cttcagcaag cgcgagcgca tcgaggtggt catctccgac 5460
ctggcgctgg tggcggtgct cagcgggctc agcgtgctgg gccgcaccat gggctgggcc 5520
tggctggtca agacctacgt ggtgccctac ctgatcgtga acatgtggct cgtgctcatc 5580
acgctgctcc agcacacgca cccggcgctg ccgcactact tcgagaagga ctgggactgg 5640
ctgcgcggcg ccatggccac cgtggaccgc tccatgggcc cgcccttcat ggacaacatc 5700
ctgcaccaca tctccgacac ccacgtgctg caccacctct tcagcaccat cccgcactac 5760
cacgccgagg aggcctccgc cgccatcagg cccatcctgg gcaagtacta ccagtccgac 5820
agccgctggg tcggccgcgc cctgtgggag gactggcgcg actgccgcta cgtcgtcccg 5880
gacgcgcccg aggacgactc cgcgctctgg ttccacaagt gagtgagtga gaagagc 5937
<210> 263
<211> 1155
<212> DNA
<213> Carthamus tinctorius
<400> 263
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgccgccacc 120
ggcgagcagc cctccggcgt ggcctccctg cgcgaggccg acaaggagaa gtccctgggc 180
aaccgcctgc gcctgggctc cctgaccgag gacggcctgt cctacaagga gaagttcgtg 240
atccgctgct acgaggtggg catcaacaag accgccacca tcgagaccat cgccaacctg 300
ctgcaggagg tgggcggcaa ccacgcccag ggcgtgggct tctccaccga cggcttcgcc 360
accaccacca ccatgcgcaa gctgcacctg atctgggtga ccgcccgcat gcacatcgag 420
atctaccgct accccgcctg gtccgacgtg atcgagatcg agacctgggt gcagggcgag 480
ggcaaggtgg gcacccgccg cgactggatc ctgaaggact acgccaacgg cgaggtgatc 540
ggccgcgcca cctccaagtg ggtgatgatg aacgaggaca cccgccgcct gcagaaggtg 600
tccgacgacg tgcgcgagga gtacctggtg ttctgccccc gcaccctgcg cctggccttc 660
cccgaggaga acaacaactc catgaagaag atccccaagc tggaggaccc cgccgagtac 720
tcccgcctgg gcctggtgcc ccgccgctcc gacctggaca tgaacaagca cgtgaacaac 780
gtgacctaca tcggctgggc cctggagtcc atcccccccg agatcatcga cacccacgag 840
ctgcaggcca tcaccctgga ctaccgccgc gagtgccagc gcgacgacat cgtggactcc 900
ctgacctccc gcgagcccct gggcaacgcc gccggcgtga agttcaagga gatcaacggc 960
tccgtgtccc ccaagaagga cgagcaggac ctgtcccgct tcatgcacct gctgcgctcc 1020
gccggctccg gcctggagat caaccgctgc cgcaccgagt ggcgcaagaa gcccgccaag 1080
cgcatggact acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac 1140
gacgacgaca agtga 1155
<210> 264
<211> 6758
<212> DNA
<213> Myristica fragrans
<400> 264
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaacgg cgcgccatgc tgctgcaggc cttcctgttc ctgctggccg 1080
gcttcgccgc caagatcagc gcctccatga cgaacgagac gtccgaccgc cccctggtgc 1140
acttcacccc caacaagggc tggatgaacg accccaacgg cctgtggtac gacgagaagg 1200
acgccaagtg gcacctgtac ttccagtaca acccgaacga caccgtctgg gggacgccct 1260
tgttctgggg ccacgccacg tccgacgacc tgaccaactg ggaggaccag cccatcgcca 1320
tcgccccgaa gcgcaacgac tccggcgcct tctccggctc catggtggtg gactacaaca 1380
acacctccgg cttcttcaac gacaccatcg acccgcgcca gcgctgcgtg gccatctgga 1440
cctacaacac cccggagtcc gaggagcagt acatctccta cagcctggac ggcggctaca 1500
ccttcaccga gtaccagaag aaccccgtgc tggccgccaa ctccacccag ttccgcgacc 1560
cgaaggtctt ctggtacgag ccctcccaga agtggatcat gaccgcggcc aagtcccagg 1620
actacaagat cgagatctac tcctccgacg acctgaagtc ctggaagctg gagtccgcgt 1680
tcgccaacga gggcttcctc ggctaccagt acgagtgccc cggcctgatc gaggtcccca 1740
ccgagcagga ccccagcaag tcctactggg tgatgttcat ctccatcaac cccggcgccc 1800
cggccggcgg ctccttcaac cagtacttcg tcggcagctt caacggcacc cacttcgagg 1860
ccttcgacaa ccagtcccgc gtggtggact tcggcaagga ctactacgcc ctgcagacct 1920
tcttcaacac cgacccgacc tacgggagcg ccctgggcat cgcgtgggcc tccaactggg 1980
agtactccgc cttcgtgccc accaacccct ggcgctcctc catgtccctc gtgcgcaagt 2040
tctccctcaa caccgagtac caggccaacc cggagacgga gctgatcaac ctgaaggccg 2100
agccgatcct gaacatcagc aacgccggcc cctggagccg gttcgccacc aacaccacgt 2160
tgacgaaggc caacagctac aacgtcgacc tgtccaacag caccggcacc ctggagttcg 2220
agctggtgta cgccgtcaac accacccaga cgatctccaa gtccgtgttc gcggacctct 2280
ccctctggtt caagggcctg gaggaccccg aggagtacct ccgcatgggc ttcgaggtgt 2340
ccgcgtcctc cttcttcctg gaccgcggga acagcaaggt gaagttcgtg aaggagaacc 2400
cctacttcac caaccgcatg agcgtgaaca accagccctt caagagcgag aacgacctgt 2460
cctactacaa ggtgtacggc ttgctggacc agaacatcct ggagctgtac ttcaacgacg 2520
gcgacgtcgt gtccaccaac acctacttca tgaccaccgg gaacgccctg ggctccgtga 2580
acatgacgac gggggtggac aacctgttct acatcgacaa gttccaggtg cgcgaggtca 2640
agtgacaatt ggcagcagca gctcggatag tatcgacaca ctctggacgc tggtcgtgtg 2700
atggactgtt gccgccacac ttgctgcctt gacctgtgaa tatccctgcc gcttttatca 2760
aacagcctca gtgtgtttga tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt 2820
gctatttgcg aataccaccc ccagcatccc cttccctcgt ttcatatcgc ttgcatccca 2880
accgcaactt atctacgctg tcctgctatc cctcagcgct gctcctgctc ctgctcactg 2940
cccctcgcac agccttggtt tgggctccgc ctgtattctc ctggtactgc aacctgtaaa 3000
ccagcactgc aatgctgatg cacgggaagt agtgggatgg gaacacaaat ggaggatccc 3060
gcgtctcgaa cagagcgcgc agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg 3120
cggcatacac cacaataacc acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc 3180
gtccggttca cacacgtgcc acgttggcga ggtggcaggt gacaatgatc ggtggagctg 3240
atggtcgaaa cgttcacagc ctagggatat cgaattcggc cgacaggacg cgcgtcaaag 3300
gtgctggtcg tgtatgccct ggccggcagg tcgttgctgc tgctggttag tgattccgca 3360
accctgattt tggcgtctta ttttggcgtg gcaaacgctg gcgcccgcga gccgggccgg 3420
cggcgatgcg gtgccccacg gctgccggaa tccaagggag gcaagagcgc ccgggtcagt 3480
tgaagggctt tacgcgcaag gtacagccgc tcctgcaagg ctgcgtggtg gaattggacg 3540
tgcaggtcct gctgaagttc ctccaccgcc tcaccagcgg acaaagcacc ggtgtatcag 3600
gtccgtgtca tccactctaa agaactcgac tacgacctac tgatggccct agattcttca 3660
tcaaaaacgc ctgagacact tgcccaggat tgaaactccc tgaagggacc accaggggcc 3720
ctgagttgtt ccttcccccc gtggcgagct gccagccagg ctgtacctgt gatcgaggct 3780
ggcgggaaaa taggcttcgt gtgctcaggt catgggaggt gcaggacagc tcatgaaacg 3840
ccaacaatcg cacaattcat gtcaagctaa tcagctattt cctcttcacg agctgtaatt 3900
gtcccaaaat tctggtctac cgggggtgat ccttcgtgta cgggcccttc cctcaaccct 3960
aggtatgcgc gcatgcggtc gccgcgcaac tcgcgcgagg gccgagggtt tgggacgggc 4020
cgtcccgaaa tgcagttgca cccggatgcg tggcaccttt tttgcgataa tttatgcaat 4080
ggactgctct gcaaaattct ggctctgtcg ccaaccctag gatcagcggc gtaggatttc 4140
gtaatcattc gtcctgatgg ggagctaccg actaccctaa tatcagcccg actgcctgac 4200
gccagcgtcc acttttgtgc acacattcca ttcgtgccca agacatttca ttgtggtgcg 4260
aagcgtcccc agttacgctc acctgtttcc cgacctcctt actgttctgt cgacagagcg 4320
ggcccacagg ccggtcgcag ccactagtat ggctatcaag acgaacaggc agcctgtgga 4380
gaagcctccg ttcacgatcg ggacgctgcg caaggccatc cccgcgcact gtttcgagcg 4440
ctcggcgctt cgtgggcgcg ccgccaacgc ccacaccgtg cccaagatca acggcaacaa 4500
ggccggcctg ctgaccccca tggagagcac caaggacgag gacatcgtcg cggcccccac 4560
cgtggcgccc aagcgcacct tcatcaacca gctgcccgac tggtcgatgc tgctggccgc 4620
gatcaccacc atcttcctgg cggccgagaa gcagtggacc aacctggact ggaagccccg 4680
ccgccccgac atgctggtcg acttcgaccc cttctccctg ggccgcttcg tgcaggacgg 4740
cctgatcttc cgccagaact tcagcatccg ctcgtacgag atcggcgcgg accgcaccgc 4800
ctccatcgag accctgatga accacctgca ggagaccgcg ctgaaccacg tccgctgcat 4860
cggcctgctg gacgacggct tcggcagcac ccccgagatg acccgccgcg acctgatctg 4920
ggtggtcacc cgcatgcagg tcctggtgga ccgctacccc tcgtggggcg acgtgatcga 4980
ggtcgactcc tgggtgaccc ccagcggcaa gaacggcatg aagcgcgagt ggttcctgcg 5040
cgactgcaag accggcgaga tcctgacccg cgccacctcg gtctgggtga tgatgaacaa 5100
gcgcacccgc cgcctgtcca agatccccga ggaggtccgc gtggagatcg agccctactt 5160
cgtcgagcac ggcgtgctgg acgaggactc gcgcaagctg cccaagctga acgacaacac 5220
cgccaactac atccgccgcg gcctggcgcc ccgctggtcc gacctggacg tcaaccagca 5280
cgtgaacaac gtcaagtaca tcggctggat cctggagagc gtgcccagca gcctgctgga 5340
gtcgcacgag ctgtacggca tgaccctgga gtaccgcaag gagtgcggca aggacggcct 5400
gctgcagtcc ctgaccgccg tcgccagcga ctacggcggc ggctcgctgg aggccggcgt 5460
ggagtgcgac cacctgctgc gcctggagga cggctccgag atcatgcgcg gcaagaccga 5520
gtggcgcccc aagcgcgccg cgaacaccac ctacttcggc agcgtcgacg acatcccccc 5580
cgccaacaac gcgtgactcg aggcagcagc agctcggata gtatcgacac actctggacg 5640
ctggtcgtgt gatggactgt tgccgccaca cttgctgcct tgacctgtga atatccctgc 5700
cgcttttatc aaacagcctc agtgtgtttg atcttgtgtg tacgcgcttt tgcgagttgc 5760
tagctgcttg tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg 5820
cttgcatccc aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct 5880
cctgctcact gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg 5940
caacctgtaa accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa 6000
tggaaagctt gagctcttgt tttccagaag gagttgctcc ttgagccttt cattctcagc 6060
ctcgataacc tccaaagccg ctctaattgt ggagggggtt cgaatttaaa agcttggaat 6120
gttggttcgt gcgtctggaa caagcccaga cttgttgctc actgggaaaa ggaccatcag 6180
ctccaaaaaa cttgccgctc aaaccgcgta cctctgcttt cgcgcaatct gccctgttga 6240
aatcgccacc acattcatat tgtgacgctt gagcagtctg taattgcctc agaatgtgga 6300
atcatctgcc ccctgtgcga gcccatgcca ggcatgtcgc gggcgaggac acccgccact 6360
cgtacagcag accattatgc tacctcacaa tagttcataa cagtgaccat atttctcgaa 6420
gctccccaac gagcacctcc atgctctgag tggccacccc ccggccctgg tgcttgcgga 6480
gggcaggtca accggcatgg ggctaccgaa atccccgacc ggatcccacc acccccgcga 6540
tgggaagaat ctctccccgg gatgtgggcc caccaccagc acaacctgct ggcccaggcg 6600
agcgtcaaac cataccacac aaatatcctt ggcatcggcc ctgaattcct tctgccgctc 6660
tgctacccgg tgcttctgtc cgaagcaggg gttgctaggg atcgctccga gtccgcaaac 6720
ccttgtcgcg tggcggggct tgttcgagct tgaagagc 6758
<210> 265
<211> 1248
<212> DNA
<213> Myristica fragrans
<400> 265
atggctatca agacgaacag gcagcctgtg gagaagcctc cgttcacgat cgggacgctg 60
cgcaaggcca tccccgcgca ctgtttcgag cgctcggcgc ttcgtgggcg cgccgccaac 120
gcccacaccg tgcccaagat caacggcaac aaggccggcc tgctgacccc catggagagc 180
accaaggacg aggacatcgt cgcggccccc accgtggcgc ccaagcgcac cttcatcaac 240
cagctgcccg actggtcgat gctgctggcc gcgatcacca ccatcttcct ggcggccgag 300
aagcagtgga ccaacctgga ctggaagccc cgccgccccg acatgctggt cgacttcgac 360
cccttctccc tgggccgctt cgtgcaggac ggcctgatct tccgccagaa cttcagcatc 420
cgctcgtacg agatcggcgc ggaccgcacc gcctccatcg agaccctgat gaaccacctg 480
caggagaccg cgctgaacca cgtccgctgc atcggcctgc tggacgacgg cttcggcagc 540
acccccgaga tgacccgccg cgacctgatc tgggtggtca cccgcatgca ggtcctggtg 600
gaccgctacc cctcgtgggg cgacgtgatc gaggtcgact cctgggtgac ccccagcggc 660
aagaacggca tgaagcgcga gtggttcctg cgcgactgca agaccggcga gatcctgacc 720
cgcgccacct cggtctgggt gatgatgaac aagcgcaccc gccgcctgtc caagatcccc 780
gaggaggtcc gcgtggagat cgagccctac ttcgtcgagc acggcgtgct ggacgaggac 840
tcgcgcaagc tgcccaagct gaacgacaac accgccaact acatccgccg cggcctggcg 900
ccccgctggt ccgacctgga cgtcaaccag cacgtgaaca acgtcaagta catcggctgg 960
atcctggaga gcgtgcccag cagcctgctg gagtcgcacg agctgtacgg catgaccctg 1020
gagtaccgca aggagtgcgg caaggacggc ctgctgcagt ccctgaccgc cgtcgccagc 1080
gactacggcg gcggctcgct ggaggccggc gtggagtgcg accacctgct gcgcctggag 1140
gacggctccg agatcatgcg cggcaagacc gagtggcgcc ccaagcgcgc cgcgaacacc 1200
acctacttcg gcagcgtcga cgacatcccc cccgccaaca acgcgtga 1248
<210> 266
<211> 1260
<212> DNA
<213> Myristica fragrans
<400> 266
actagtatgg ctatcaagac gaacaggcag cctgtggaga agcctccgtt cacgatcggg 60
acgctgcgca aggccatccc cgcgcactgt ttcgagcgct cggcgcttcg tgggcgcgcc 120
gccaacgccc acaccgtgcc caagatcaac ggcaacaagg ccggcctgct gacccccatg 180
gagagcacca aggacgagga catcgtcgcg gcccccaccg tggcgcccaa gcgcaccttc 240
atcaaccagc tgcccgactg gtcgatgctg ctggccgcga tcaccaccat cttcctggcg 300
gccgagaagc agtggaccaa cctggactgg aagccccgcc gccccgacat gctggtcgac 360
ttcgacccct tctccctggg ccgcttcgtg caggacggcc tgatcttccg ccagaacttc 420
agcatccgct cgtacgagat cggcgcggac cgcaccgcct ccatcgagac cctgatgaac 480
cacctgcagg agaccgcgct gaaccacgtc cgctgcatcg gcctgctgga cgacggcttc 540
ggcagcaccc ccgagatgac ccgccgcgac ctgatctggg tggtcacccg catgcaggtc 600
ctggtggacc gctacccctc gtggggcgac gtgatcgagg tcgactcctg ggtgaccccc 660
agcggcaaga acggcatgaa gcgcgagtgg ttcctgcgcg actgcaagac cggcgagatc 720
ctgacccgcg ccacctcggt ctgggtgatg atgaacaagc gcacccgccg cctgtccaag 780
atccccgagg aggtccgcgt ggagatcgag ccctacttcg tcgagcacgg cgtgctggac 840
gaggactcgc gcaagctgcc caagctgaac gacaacaccg ccaactacat ccgccgcggc 900
ctggcgcccc gctggtccga cctggacgtc aaccagcacg tgaacaacgt caagtacatc 960
ggctggatcc tggagagcgt gcccagcagc ctgctggagt cgcacgagct gtacggcatg 1020
accctggagt accgcaagga gtgcggcaag gacggcctgc tgcagtccct gaccgccgtc 1080
gccagcgact acggcggcgg ctcgctggag gccggcgtgg agtgcgacca cctgctgcgc 1140
ctggaggacg gctccgagat catgcgcggc aagaccgagt ggcgccccaa gcgcgccgcg 1200
aacaccacct acttcggcag cgtcgacgac atcccccccg ccaacaacgc gtgactcgag 1260
<210> 267
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 267
Met Ala Ile Lys Thr Asn Arg Gln Pro Val Glu Lys Pro Pro Phe Thr
1 5 10 15
Ile Gly Thr Leu Arg Lys Ala Ile Pro Ala His Cys Phe Glu Arg Ser
20 25 30
Ala Leu Arg Gly Arg Ala Ala Asn Ala His Thr Val Pro Lys Ile Asn
35 40 45
Gly Asn Lys Ala Gly Leu Leu Thr Pro Met Glu Ser Thr Lys Asp Glu
50 55 60
Asp Ile Val Ala Ala Pro Thr Val Ala Pro Lys Arg Thr Phe Ile Asn
65 70 75 80
Gln Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Ile Phe
85 90 95
Leu Ala Ala Glu Lys Gln Trp Thr Asn Leu Asp Trp Lys Pro Arg Arg
100 105 110
Pro Asp Met Leu Val Asp Phe Asp Pro Phe Ser Leu Gly Arg Phe Val
115 120 125
Gln Asp Gly Leu Ile Phe Arg Gln Asn Phe Ser Ile Arg Ser Tyr Glu
130 135 140
Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu
145 150 155 160
Gln Glu Thr Ala Leu Asn His Val Arg Cys Ile Gly Leu Leu Asp Asp
165 170 175
Gly Phe Gly Ser Thr Pro Glu Met Thr Arg Arg Asp Leu Ile Trp Val
180 185 190
Val Thr Arg Met Gln Val Leu Val Asp Arg Tyr Pro Ser Trp Gly Asp
195 200 205
Val Ile Glu Val Asp Ser Trp Val Thr Pro Ser Gly Lys Asn Gly Met
210 215 220
Lys Arg Glu Trp Phe Leu Arg Asp Cys Lys Thr Gly Glu Ile Leu Thr
225 230 235 240
Arg Ala Thr Ser Val Trp Val Met Met Asn Lys Arg Thr Arg Arg Leu
245 250 255
Ser Lys Ile Pro Glu Glu Val Arg Val Glu Ile Glu Pro Tyr Phe Val
260 265 270
Glu His Gly Val Leu Asp Glu Asp Ser Arg Lys Leu Pro Lys Leu Asn
275 280 285
Asp Asn Thr Ala Asn Tyr Ile Arg Arg Gly Leu Ala Pro Arg Trp Ser
290 295 300
Asp Leu Asp Val Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
305 310 315 320
Ile Leu Glu Ser Val Pro Ser Ser Leu Leu Glu Ser His Glu Leu Tyr
325 330 335
Gly Met Thr Leu Glu Tyr Arg Lys Glu Cys Gly Lys Asp Gly Leu Leu
340 345 350
Gln Ser Leu Thr Ala Val Ala Ser Asp Tyr Gly Gly Gly Ser Leu Glu
355 360 365
Ala Gly Val Glu Cys Asp His Leu Leu Arg Leu Glu Asp Gly Ser Glu
370 375 380
Ile Met Arg Gly Lys Thr Glu Trp Arg Pro Lys Arg Ala Ala Asn Thr
385 390 395 400
Thr Tyr Phe Gly Ser Val Asp Asp Ile Pro Pro Ala Asn Asn Ala
405 410 415
<210> 268
<211> 5805
<212> DNA
<213> Ricinus communis
<400> 268
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cctttcttgc gctatgacac 3300
ttccagcaaa aggtagggcg ggctgcgaga cggcttcccg gcgctgcatg caacaccgat 3360
gatgcttcga ccccccgaag ctccttcggg gctgcatggg cgctccgatg ccgctccagg 3420
gcgagcgctg tttaaatagc caggcccccg attgcaaaga cattatagcg agctaccaaa 3480
gccatattca aacacctaga tcactaccac ttctacacag gccactcgag cttgtgatcg 3540
cactccgcta agggggcgcc tcttcctctt cgtttcagtc acaacccgca aacactagta 3600
tggccaccgc atccactttc tcggcgttca atgcccgctg cggcgacctg cgtcgctcgg 3660
cgggctccgg gccccggcgc ccagcgaggc ccctccccgt gcgcgggcgc gcccgctcct 3720
acgaggtggg catcaacaag accgccaccg tggagaccat cgccaacctg ctgcaggagg 3780
tgggctgcaa ccacgcccag tccgtgggct tctccaccga cggcttcgcc accaccacct 3840
ccatgcgcaa gatgcacctg atctgggtga ccgcccgcat gcacatcgag atctacaagt 3900
accccgcctg gtccgacgtg gtggaggtgg agacctggtg ccagtccgag ggccgcatcg 3960
gcacccgccg cgactggatc ctgaccgact acgccaccgg ccagatcatc ggccgcgcca 4020
cctccaagtg ggtgatgatg aaccaggaca cccgccgcct gcagaaggtg accgacgacg 4080
tgcgcgagga gtacctggtg ttctgccccc gcgagctgcg cctggccttc cccgaggaga 4140
acaaccgctc ctccaagaag atctccaagc tggaggaccc cgcccagtac tccaagctgg 4200
gcctggtgcc ccgccgcgcc gacctggaca tgaaccagca cgtgaacaac gtgacctaca 4260
tcggctgggt gctggagtcc atcccccagg agatcatcga cacccacgag ctgcagacca 4320
tcaccctgga ctaccgccgc gagtgccagc acgacgacat cgtggactcc ctgacctccg 4380
tggagccctc cgagaacctg gaggccgtgt ccgagctgcg cggcaccaac ggctccgcca 4440
ccaccaccgc cggcgacgag gactgccgca acttcctgca cctgctgcgc ctgtccggcg 4500
acggcctgga gatcaaccgc ggccgcaccg agtggcgcaa gaagtccgcc cgcatggact 4560
acaaggacca cgacggcgac tacaaggacc acgacatcga ctacaaggac gacgacgaca 4620
agtgaatcga tagatctctt aaggcagcag cagctcggat agtatcgaca cactctggac 4680
gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 4740
ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 4800
ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 4860
gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 4920
tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 4980
gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5040
atggaaagct taattaagag ctcttgtttt ccagaaggag ttgctccttg agcctttcat 5100
tctcagcctc gataacctcc aaagccgctc taattgtgga gggggttcga atttaaaagc 5160
ttggaatgtt ggttcgtgcg tctggaacaa gcccagactt gttgctcact gggaaaagga 5220
ccatcagctc caaaaaactt gccgctcaaa ccgcgtacct ctgctttcgc gcaatctgcc 5280
ctgttgaaat cgccaccaca ttcatattgt gacgcttgag cagtctgtaa ttgcctcaga 5340
atgtggaatc atctgccccc tgtgcgagcc catgccaggc atgtcgcggg cgaggacacc 5400
cgccactcgt acagcagacc attatgctac ctcacaatag ttcataacag tgaccatatt 5460
tctcgaagct ccccaacgag cacctccatg ctctgagtgg ccaccccccg gccctggtgc 5520
ttgcggaggg caggtcaacc ggcatggggc taccgaaatc cccgaccgga tcccaccacc 5580
cccgcgatgg gaagaatctc tccccgggat gtgggcccac caccagcaca acctgctggc 5640
ccaggcgagc gtcaaaccat accacacaaa tatccttggc atcggccctg aattccttct 5700
gccgctctgc tacccggtgc ttctgtccga agcaggggtt gctagggatc gctccgagtc 5760
cgcaaaccct tgtcgcgtgg cggggcttgt tcgagcttga agagc 5805
<210> 269
<211> 1026
<212> DNA
<213> Ricinus communis
<400> 269
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccgctcc 120
tacgaggtgg gcatcaacaa gaccgccacc gtggagacca tcgccaacct gctgcaggag 180
gtgggctgca accacgccca gtccgtgggc ttctccaccg acggcttcgc caccaccacc 240
tccatgcgca agatgcacct gatctgggtg accgcccgca tgcacatcga gatctacaag 300
taccccgcct ggtccgacgt ggtggaggtg gagacctggt gccagtccga gggccgcatc 360
ggcacccgcc gcgactggat cctgaccgac tacgccaccg gccagatcat cggccgcgcc 420
acctccaagt gggtgatgat gaaccaggac acccgccgcc tgcagaaggt gaccgacgac 480
gtgcgcgagg agtacctggt gttctgcccc cgcgagctgc gcctggcctt ccccgaggag 540
aacaaccgct cctccaagaa gatctccaag ctggaggacc ccgcccagta ctccaagctg 600
ggcctggtgc cccgccgcgc cgacctggac atgaaccagc acgtgaacaa cgtgacctac 660
atcggctggg tgctggagtc catcccccag gagatcatcg acacccacga gctgcagacc 720
atcaccctgg actaccgccg cgagtgccag cacgacgaca tcgtggactc cctgacctcc 780
gtggagccct ccgagaacct ggaggccgtg tccgagctgc gcggcaccaa cggctccgcc 840
accaccaccg ccggcgacga ggactgccgc aacttcctgc acctgctgcg cctgtccggc 900
gacggcctgg agatcaaccg cggccgcacc gagtggcgca agaagtccgc ccgcatggac 960
tacaaggacc acgacggcga ctacaaggac cacgacatcg actacaagga cgacgacgac 1020
aagtga 1026
<210> 270
<211> 5110
<212> DNA
<213> Cinnamomum camphora
<400> 270
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagccat attcaaacac ctagatcact accacttcta 960
cacaggccac tcgagcttgt gatcgcactc cgctaagggg gcgcctcttc ctcttcgttt 1020
cagtcacaac ccgcaaactc tagaatatca atgatcgagc aggacggcct ccacgccggc 1080
tcccccgccg cctgggtgga gcgcctgttc ggctacgact gggcccagca gaccatcggc 1140
tgctccgacg ccgccgtgtt ccgcctgtcc gcccagggcc gccccgtgct gttcgtgaag 1200
accgacctgt ccggcgccct gaacgagctg caggacgagg ccgcccgcct gtcctggctg 1260
gccaccaccg gcgtgccctg cgccgccgtg ctggacgtgg tgaccgaggc cggccgcgac 1320
tggctgctgc tgggcgaggt gcccggccag gacctgctgt cctcccacct ggcccccgcc 1380
gagaaggtgt ccatcatggc cgacgccatg cgccgcctgc acaccctgga ccccgccacc 1440
tgccccttcg accaccaggc caagcaccgc atcgagcgcg cccgcacccg catggaggcc 1500
ggcctggtgg accaggacga cctggacgag gagcaccagg gcctggcccc cgccgagctg 1560
ttcgcccgcc tgaaggcccg catgcccgac ggcgaggacc tggtggtgac ccacggcgac 1620
gcctgcctgc ccaacatcat ggtggagaac ggccgcttct ccggcttcat cgactgcggc 1680
cgcctgggcg tggccgaccg ctaccaggac atcgccctgg ccacccgcga catcgccgag 1740
gagctgggcg gcgagtgggc cgaccgcttc ctggtgctgt acggcatcgc cgcccccgac 1800
tcccagcgca tcgccttcta ccgcctgctg gacgagttct tctgacaatt ggcagcagca 1860
gctcggatag tatcgacaca ctctggacgc tggtcgtgtg atggactgtt gccgccacac 1920
ttgctgcctt gacctgtgaa tatccctgcc gcttttatca aacagcctca gtgtgtttga 1980
tcttgtgtgt acgcgctttt gcgagttgct agctgcttgt gctatttgcg aataccaccc 2040
ccagcatccc cttccctcgt ttcatatcgc ttgcatccca accgcaactt atctacgctg 2100
tcctgctatc cctcagcgct gctcctgctc ctgctcactg cccctcgcac agccttggtt 2160
tgggctccgc ctgtattctc ctggtactgc aacctgtaaa ccagcactgc aatgctgatg 2220
cacgggaagt agtgggatgg gaacacaaat ggaggatccc gcgtctcgaa cagagcgcgc 2280
agaggaacgc tgaaggtctc gcctctgtcg cacctcagcg cggcatacac cacaataacc 2340
acctgacgaa tgcgcttggt tcttcgtcca ttagcgaagc gtccggttca cacacgtgcc 2400
acgttggcga ggtggcaggt gacaatgatc ggtggagctg atggtcgaaa cgttcacagc 2460
ctagggatat cgaattcctt tcttgcgcta tgacacttcc agcaaaaggt agggcgggct 2520
gcgagacggc ttcccggcgc tgcatgcaac accgatgatg cttcgacccc ccgaagctcc 2580
ttcggggctg catgggcgct ccgatgccgc tccagggcga gcgctgttta aatagccagg 2640
cccccgattg caaagacatt atagcgagct accaaagcca tattcaaaca cctagatcac 2700
taccacttct acacaggcca ctcgagcttg tgatcgcact ccgctaaggg ggcgcctctt 2760
cctcttcgtt tcagtcacaa cccgcaaaca ctagtatggc caccgcatcc actttctcgg 2820
cgttcaatgc ccgctgcggc gacctgcgtc gctcggcggg ctccgggccc cggcgcccag 2880
cgaggcccct ccccgtgcgc gggcgcgccc ccgactggtc catgctgttc gccgtgatca 2940
ccaccatctt ctccgccgcc gagaagcagt ggaccaacct ggagtggaag cccaagccca 3000
acccccccca gctgctggac gaccacttcg gcccccacgg cctggtgttc cgccgcacct 3060
tcgccatccg cagctacgag gtgggccccg accgctccac cagcatcgtg gccgtgatga 3120
accacctgca ggaggccgcc ctgaaccacg ccaagtccgt gggcatcctg ggcgacggct 3180
tcggcaccac cctggagatg tccaagcgcg acctgatctg ggtggtgaag cgcacccacg 3240
tggccgtgga gcgctacccc gcctggggcg acaccgtgga ggtggagtgc tgggtgggcg 3300
cctccggcaa caacggccgc cgccacgact tcctggtgcg cgactgcaag accggcgaga 3360
tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac ccgcacccgc cgcctgagca 3420
agatccccga ggaggtgcgc ggcgagatcg gccccgcctt catcgacaac gtggccgtga 3480
aggacgagga gatcaagaag ccccagaagc tgaacgactc caccgccgac tacatccagg 3540
gcggcctgac cccccgctgg aacgacctgg acatcaacca gcacgtgaac aacatcaagt 3600
acgtggactg gatcctggag accgtgcccg acagcatctt cgagagccac cacatctcct 3660
ccttcaccat cgagtaccgc cgcgagtgca ccatggacag cgtgctgcag tccctgacca 3720
ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga gcacctgctg cagctggagg 3780
gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc caagctgacc gactccttcc 3840
gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga ctacaaggac cacgacggcg 3900
actacaagga ccacgacatc gactacaagg acgacgacga caagtgactc gaggcagcag 3960
cagctcggat agtatcgaca cactctggac gctggtcgtg tgatggactg ttgccgccac 4020
acttgctgcc ttgacctgtg aatatccctg ccgcttttat caaacagcct cagtgtgttt 4080
gatcttgtgt gtacgcgctt ttgcgagttg ctagctgctt gtgctatttg cgaataccac 4140
ccccagcatc cccttccctc gtttcatatc gcttgcatcc caaccgcaac ttatctacgc 4200
tgtcctgcta tccctcagcg ctgctcctgc tcctgctcac tgcccctcgc acagccttgg 4260
tttgggctcc gcctgtattc tcctggtact gcaacctgta aaccagcact gcaatgctga 4320
tgcacgggaa gtagtgggat gggaacacaa atggaaagct tgagctcctt gttttccaga 4380
aggagttgct ccttgagcct ttcattctca gcctcgataa cctccaaagc cgctctaatt 4440
gtggaggggg ttcgaattta aaagcttgga atgttggttc gtgcgtctgg aacaagccca 4500
gacttgttgc tcactgggaa aaggaccatc agctccaaaa aacttgccgc tcaaaccgcg 4560
tacctctgct ttcgcgcaat ctgccctgtt gaaatcgcca ccacattcat attgtgacgc 4620
ttgagcagtc tgtaattgcc tcagaatgtg gaatcatctg ccccctgtgc gagcccatgc 4680
caggcatgtc gcgggcgagg acacccgcca ctcgtacagc agaccattat gctacctcac 4740
aatagttcat aacagtgacc atatttctcg aagctcccca acgagcacct ccatgctctg 4800
agtggccacc ccccggccct ggtgcttgcg gagggcaggt caaccggcat ggggctaccg 4860
aaatccccga ccggatccca ccacccccgc gatgggaaga atctctcccc gggatgtggg 4920
cccaccacca gcacaacctg ctggcccagg cgagcgtcaa accataccac acaaatatcc 4980
ttggcatcgg ccctgaattc cttctgccgc tctgctaccc ggtgcttctg tccgaagcag 5040
gggttgctag ggatcgctcc gagtccgcaa acccttgtcg cgtggcgggg cttgttcgag 5100
cttgaagagc 5110
<210> 271
<211> 1152
<212> DNA
<213> Cinnamomum camphora
<400> 271
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccgac 120
tggtccatgc tgttcgccgt gatcaccacc atcttctccg ccgccgagaa gcagtggacc 180
aacctggagt ggaagcccaa gcccaacccc ccccagctgc tggacgacca cttcggcccc 240
cacggcctgg tgttccgccg caccttcgcc atccgcagct acgaggtggg ccccgaccgc 300
tccaccagca tcgtggccgt gatgaaccac ctgcaggagg ccgccctgaa ccacgccaag 360
tccgtgggca tcctgggcga cggcttcggc accaccctgg agatgtccaa gcgcgacctg 420
atctgggtgg tgaagcgcac ccacgtggcc gtggagcgct accccgcctg gggcgacacc 480
gtggaggtgg agtgctgggt gggcgcctcc ggcaacaacg gccgccgcca cgacttcctg 540
gtgcgcgact gcaagaccgg cgagatcctg acccgctgca cctccctgag cgtgatgatg 600
aacacccgca cccgccgcct gagcaagatc cccgaggagg tgcgcggcga gatcggcccc 660
gccttcatcg acaacgtggc cgtgaaggac gaggagatca agaagcccca gaagctgaac 720
gactccaccg ccgactacat ccagggcggc ctgacccccc gctggaacga cctggacatc 780
aaccagcacg tgaacaacat caagtacgtg gactggatcc tggagaccgt gcccgacagc 840
atcttcgaga gccaccacat ctcctccttc accatcgagt accgccgcga gtgcaccatg 900
gacagcgtgc tgcagtccct gaccaccgtg agcggcggct cctccgaggc cggcctggtg 960
tgcgagcacc tgctgcagct ggagggcggc agcgaggtgc tgcgcgccaa gaccgagtgg 1020
cgccccaagc tgaccgactc cttccgcggc atcagcgtga tccccgccga gtccagcgtg 1080
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 1140
gacgacaagt ga 1152
<210> 272
<211> 5576
<212> DNA
<213> Cinnamomum camphora
<400> 272
gaattcgccc tcccgtgatc acacaggtgc cttgcgagcg tgatcacact attttggggg 60
tcctacagta ctgaaatggt gagaagtcgt actgaaatca aggatgaaca atgaaaatgg 120
tgctgtggtg gcttctcaaa ggtcaagaat cagtcgctcg cgtcaggaaa tcgcggcgtc 180
aaccagcgtg ggcgcggtca gtggccccgc actggtcacc atagcctctc ctgccacagt 240
agcgatcccc tgggcgttca ctctcagcag cggctgtact gcctcccaga ttttcttctt 300
ctggacctgc gggcgtgaga ggatgagcag ggtgggccaa gggctcaatc ctgaacggcc 360
ctcattcggt ttccaatccc acaacacata cccacagcag gtcagaccac gcattccacc 420
atgcgcacca ataacgtgtc cttacctgat tgggtgtggc aggctccgtg gacaggagtg 480
cctcgtcccc cgcccagacc cgctcccccg tcacggcggc gtccgggacc cgcagcggct 540
ccaccgcggt gtgatccgcg ttggcggcgc agagcagcat cccagccgat ttgaccccgc 600
gcatgctccg aggcttgagg ttggccagca ccaccacccg ccggccgaca aggtcctcca 660
gggtcacgtg ccggaccagg ccactcacga tggtgcgagg gcccccctcc tcgccgaggt 720
cgatctgctc gacgtacaga ctgcgacatg cgtggcgagt ggtcatcaga aggaagcagg 780
tgtgcagaag gggcacgtgg ttggtattga gagtagccaa agctttgtgc caatcagaaa 840
gtcaacgcag ctgcctgcct ggctcgcgta caattccttt cttgcgctat gacacttcca 900
gcaaaaggta gggcgggctg cgagacggct tcccggcgct gcatgcaaca ccgatgatgc 960
ttcgaccccc cgaagctcct tcggggctgc atgggcgctc cgatgccgct ccagggcgag 1020
cgctgtttaa atagccaggc ccccgattgc aaagacatta tagcgagcta ccaaagcata 1080
ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 1140
gctaaggggg cgcctcttcc cttcgtttca gtcacaaccc gcaaacggcg cgccatgctg 1200
ctgcaggcct tcctgttcct gctggccggc ttcgccgcca agatcagcgc ctccatgacg 1260
aacgagacgt ccgaccgccc cctggtgcac ttcaccccca acaagggctg gatgaacgac 1320
cccaacggcc tgtggtacga cgagaaggac gccaagtggc acctgtactt ccagtacaac 1380
ccgaacgaca ccgtctgggg gacgcccttg ttctggggcc acgccacgtc cgacgacctg 1440
accaactggg aggaccagcc catcgccatc gccccgaagc gcaacgactc cggcgccttc 1500
tccggctcca tggtggtgga ctacaacaac acctccggct tcttcaacga caccatcgac 1560
ccgcgccagc gctgcgtggc catctggacc tacaacaccc cggagtccga ggagcagtac 1620
atctcctaca gcctggacgg cggctacacc ttcaccgagt accagaagaa ccccgtgctg 1680
gccgccaact ccacccagtt ccgcgacccg aaggtcttct ggtacgagcc ctcccagaag 1740
tggatcatga ccgcggccaa gtcccaggac tacaagatcg agatctactc ctccgacgac 1800
ctgaagtcct ggaagctgga gtccgcgttc gccaacgagg gcttcctcgg ctaccagtac 1860
gagtgccccg gcctgatcga ggtccccacc gagcaggacc ccagcaagtc ctactgggtg 1920
atgttcatct ccatcaaccc cggcgccccg gccggcggct ccttcaacca gtacttcgtc 1980
ggcagcttca acggcaccca cttcgaggcc ttcgacaacc agtcccgcgt ggtggacttc 2040
ggcaaggact actacgccct gcagaccttc ttcaacaccg acccgaccta cgggagcgcc 2100
ctgggcatcg cgtgggcctc caactgggag tactccgcct tcgtgcccac caacccctgg 2160
cgctcctcca tgtccctcgt gcgcaagttc tccctcaaca ccgagtacca ggccaacccg 2220
gagacggagc tgatcaacct gaaggccgag ccgatcctga acatcagcaa cgccggcccc 2280
tggagccggt tcgccaccaa caccacgttg acgaaggcca acagctacaa cgtcgacctg 2340
tccaacagca ccggcaccct ggagttcgag ctggtgtacg ccgtcaacac cacccagacg 2400
atctccaagt ccgtgttcgc ggacctctcc ctctggttca agggcctgga ggaccccgag 2460
gagtacctcc gcatgggctt cgaggtgtcc gcgtcctcct tcttcctgga ccgcgggaac 2520
agcaaggtga agttcgtgaa ggagaacccc tacttcacca accgcatgag cgtgaacaac 2580
cagcccttca agagcgagaa cgacctgtcc tactacaagg tgtacggctt gctggaccag 2640
aacatcctgg agctgtactt caacgacggc gacgtcgtgt ccaccaacac ctacttcatg 2700
accaccggga acgccctggg ctccgtgaac atgacgacgg gggtggacaa cctgttctac 2760
atcgacaagt tccaggtgcg cgaggtcaag tgattaatta actcgaggca gcagcagctc 2820
ggatagtatc gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc 2880
tgccttgacc tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt 2940
gtgtgtacgc gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag 3000
catcccctcc ctcgtttcat atcgcttgca tcccaaccgc aacttatcta cgctgtcctg 3060
ctatccctca gcgctgctcc tgctcctgct cactgcccct cgcacagcct tggtttgggc 3120
tccgcctgta ttctcctggt actgcaacct gtaaaccagc actgcaatgc tgatgcacgg 3180
gaagtagtgg gatgggaaca caaatggaaa gcttgagctc ctttcttgcg ctatgacact 3240
tccagcaaaa ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg 3300
atgcttcgac cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg 3360
cgagcgctgt ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag 3420
ccatattcaa acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc 3480
actccgctaa gggggcgcct cttcctcttc gtttcagtca caacccgcaa acactagtat 3540
gacgttcggg gtcgccctcc cggccatggg ccgcggtgtc tcccttcccc ggcccagggt 3600
cgcggtgcgc gcccagtcgg cgagtcaggt tttggagagc gggcgcgccc ccgactggtc 3660
catgctgttc gccgtgatca ccaccatctt ctccgccgcc gagaagcagt ggaccaacct 3720
ggagtggaag cccaagccca acccccccca gctgctggac gaccacttcg gcccccacgg 3780
cctggtgttc cgccgcacct tcgccatccg cagctacgag gtgggccccg accgctccac 3840
cagcatcgtg gccgtgatga accacctgca ggaggccgcc ctgaaccacg ccaagtccgt 3900
gggcatcctg ggcgacggct tcggcaccac cctggagatg tccaagcgcg acctgatctg 3960
ggtggtgaag cgcacccacg tggccgtgga gcgctacccc gcctggggcg acaccgtgga 4020
ggtggagtgc tgggtgggcg cctccggcaa caacggccgc cgccacgact tcctggtgcg 4080
cgactgcaag accggcgaga tcctgacccg ctgcacctcc ctgagcgtga tgatgaacac 4140
ccgcacccgc cgcctgagca agatccccga ggaggtgcgc ggcgagatcg gccccgcctt 4200
catcgacaac gtggccgtga aggacgagga gatcaagaag ccccagaagc tgaacgactc 4260
caccgccgac tacatccagg gcggcctgac cccccgctgg aacgacctgg acatcaacca 4320
gcacgtgaac aacatcaagt acgtggactg gatcctggag accgtgcccg acagcatctt 4380
cgagagccac cacatctcct ccttcaccat cgagtaccgc cgcgagtgca ccatggacag 4440
cgtgctgcag tccctgacca ccgtgagcgg cggctcctcc gaggccggcc tggtgtgcga 4500
gcacctgctg cagctggagg gcggcagcga ggtgctgcgc gccaagaccg agtggcgccc 4560
caagctgacc gactccttcc gcggcatcag cgtgatcccc gccgagtcca gcgtgatgga 4620
ctacaaggac cacgacggcg actacaagga ccacgacatc gactacaagg acgacgacga 4680
caagtgactc gaggcagcag cagctcggat agtatcgaca cactctggac gctggtcgtg 4740
tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg ccgcttttat 4800
caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg ctagctcttg 4860
tgctatttgc gaataccacc cccagcatcc ccttccctcg tttcatatcg cttgcatccc 4920
aaccgcaact tatctacgct gtcctgctat ccctcagcgc tgctcctgct cctgctcact 4980
gcccctcgca cagccttggt ttgggctccg cctgtattct cctggtactg caacctgtaa 5040
accagcactg caatgctgat gcacgggaag tagtgggatg ggaacacaaa tggaaagctg 5100
gtacccgtac ccatcagcat ccgggtgaat cttggcctcc aagatatggc caatcctcac 5160
atccagcttg gcaaaatcga ctagactgtc tgcaagtggg aatgtggagc acaaggttgc 5220
ttgtagcgat cgacagactg gtggggtaca ttgacaggtg ggcagcgccg catccatcgt 5280
gcctgacgcg agcgccgccg gttgctcgcc cgtgcctgcc gtcaaagagc ggcagagaaa 5340
tcgggaaccg aaaacgtcac attgcctgat gttgttacat gctggactag actttcttgg 5400
cgtgggtctg ctcctcgcca ggtgcgcgac gcctcggggc tgggtgcgag ggagccgtgc 5460
ggccacgcat ttgacaagac ccaaagctcg catctcagac ggtcaaccgt tcgtattata 5520
cattcaacat atggtacata cgcaaaaagc atgccaacga tgacataggc gaattc 5576
<210> 273
<211> 6981
<212> DNA
<213> Cinnamomum camphora
<400> 273
gctcttcggc cgccgccact cctgctcgag cgcgcccgac tcgcgctccg cctgcgcccg 60
cgcgtgcgcc gccagcgcct tggccttttc gccgcgctcg tgcgcgtcgc tgatgtccat 120
caccaggtcc atgaggtctg ccttgcgccg gctgagccac tgcttcgtcc gggcggccaa 180
gaggagcatg agggaggact cctggtccag ggtcctgacg tggtcgcggc tctgggagcg 240
ggccagcatc atctggctct gccgcaccga ggccgcctcc aactggtcct ccagcagccg 300
cagtcgccgc cgaccctggc agaggaagac aggtgagggg ggtatgaatt gtacagaaca 360
accacgagcc ttgtctaggc agaatcccta ccagtcatgg ctttacctgg atgacggcct 420
gcgaacagct gtccagcgac cctcgctgcc gccgcttctc ccgcacgctt ctttccagca 480
ccgtgatggc gcgagccagc gccgcacgct ggcgctgcgc ttcgccgatc tgaggacagt 540
cggggaactc tgatcagtct aaaccccctt gcgcgttagt gttgccatcc tttgcagacc 600
ggtgagagcc gacttgttgt gcgccacccc ccacaccacc tcctcccaga ccaattctgt 660
cacctttttg gcgaaggcat cggcctcggc ctgcagagag gacagcagtg cccagccgct 720
gggggttggc ggatgcacgc tcaggtaccc tttcttgcgc tatgacactt ccagcaaaag 780
gtagggcggg ctgcgagacg gcttcccggc gctgcatgca acaccgatga tgcttcgacc 840
ccccgaagct ccttcggggc tgcatgggcg ctccgatgcc gctccagggc gagcgctgtt 900
taaatagcca ggcccccgat tgcaaagaca ttatagcgag ctaccaaagc catattcaaa 960
cacctagatc actaccactt ctacacaggc cactcgagct tgtgatcgca ctccgctaag 1020
ggggcgcctc ttcctcttcg tttcagtcac aacccgcaaa cggcgcgcca tgctgctgca 1080
ggccttcctg ttcctgctgg ccggcttcgc cgccaagatc agcgcctcca tgacgaacga 1140
gacgtccgac cgccccctgg tgcacttcac ccccaacaag ggctggatga acgaccccaa 1200
cggcctgtgg tacgacgaga aggacgccaa gtggcacctg tacttccagt acaacccgaa 1260
cgacaccgtc tgggggacgc ccttgttctg gggccacgcc acgtccgacg acctgaccaa 1320
ctgggaggac cagcccatcg ccatcgcccc gaagcgcaac gactccggcg ccttctccgg 1380
ctccatggtg gtggactaca acaacacctc cggcttcttc aacgacacca tcgacccgcg 1440
ccagcgctgc gtggccatct ggacctacaa caccccggag tccgaggagc agtacatctc 1500
ctacagcctg gacggcggct acaccttcac cgagtaccag aagaaccccg tgctggccgc 1560
caactccacc cagttccgcg acccgaaggt cttctggtac gagccctccc agaagtggat 1620
catgaccgcg gccaagtccc aggactacaa gatcgagatc tactcctccg acgacctgaa 1680
gtcctggaag ctggagtccg cgttcgccaa cgagggcttc ctcggctacc agtacgagtg 1740
ccccggcctg atcgaggtcc ccaccgagca ggaccccagc aagtcctact gggtgatgtt 1800
catctccatc aaccccggcg ccccggccgg cggctccttc aaccagtact tcgtcggcag 1860
cttcaacggc acccacttcg aggccttcga caaccagtcc cgcgtggtgg acttcggcaa 1920
ggactactac gccctgcaga ccttcttcaa caccgacccg acctacggga gcgccctggg 1980
catcgcgtgg gcctccaact gggagtactc cgccttcgtg cccaccaacc cctggcgctc 2040
ctccatgtcc ctcgtgcgca agttctccct caacaccgag taccaggcca acccggagac 2100
ggagctgatc aacctgaagg ccgagccgat cctgaacatc agcaacgccg gcccctggag 2160
ccggttcgcc accaacacca cgttgacgaa ggccaacagc tacaacgtcg acctgtccaa 2220
cagcaccggc accctggagt tcgagctggt gtacgccgtc aacaccaccc agacgatctc 2280
caagtccgtg ttcgcggacc tctccctctg gttcaagggc ctggaggacc ccgaggagta 2340
cctccgcatg ggcttcgagg tgtccgcgtc ctccttcttc ctggaccgcg ggaacagcaa 2400
ggtgaagttc gtgaaggaga acccctactt caccaaccgc atgagcgtga acaaccagcc 2460
cttcaagagc gagaacgacc tgtcctacta caaggtgtac ggcttgctgg accagaacat 2520
cctggagctg tacttcaacg acggcgacgt cgtgtccacc aacacctact tcatgaccac 2580
cgggaacgcc ctgggctccg tgaacatgac gacgggggtg gacaacctgt tctacatcga 2640
caagttccag gtgcgcgagg tcaagtgaca attggcagca gcagctcgga tagtatcgac 2700
acactctgga cgctggtcgt gtgatggact gttgccgcca cacttgctgc cttgacctgt 2760
gaatatccct gccgctttta tcaaacagcc tcagtgtgtt tgatcttgtg tgtacgcgct 2820
tttgcgagtt gctagctgct tgtgctattt gcgaatacca cccccagcat ccccttccct 2880
cgtttcatat cgcttgcatc ccaaccgcaa cttatctacg ctgtcctgct atccctcagc 2940
gctgctcctg ctcctgctca ctgcccctcg cacagccttg gtttgggctc cgcctgtatt 3000
ctcctggtac tgcaacctgt aaaccagcac tgcaatgctg atgcacggga agtagtggga 3060
tgggaacaca aatggaggat cccgcgtctc gaacagagcg cgcagaggaa cgctgaaggt 3120
ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac gaatgcgctt 3180
ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg cgaggtggca 3240
ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga tatcgaattc 3300
ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc aggtcgttgc 3360
tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc gtggcaaacg 3420
ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg gaatccaagg 3480
gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc cgctcctgca 3540
aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc gcctcaccag 3600
cggacaaagc accggtgtat caggtccgtg tcatccactc taaagagctc gactacgacc 3660
tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag gattgaaact 3720
ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga gctgccagcc 3780
aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca ggtcatggga 3840
ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc taatcagcta 3900
tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt gatccttcgt 3960
gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc aactcgcgcg 4020
agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat gcgtggcacc 4080
ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg tcgccaaccc 4140
taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta ccgactaccc 4200
taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt ccattcgtgc 4260
ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt tcccgacctc 4320
cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag tatggccacc 4380
gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc ggcgggctcc 4440
gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccccga ctggtccatg 4500
ctgttcgccg tgatcaccac catcttctcc gccgccgaga agcagtggac caacctggag 4560
tggaagccca agcccaaccc cccccagctg ctggacgacc acttcggccc ccacggcctg 4620
gtgttccgcc gcaccttcgc catccgcagc tacgaggtgg gccccgaccg ctccaccagc 4680
atcgtggccg tgatgaacca cctgcaggag gccgccctga accacgccaa gtccgtgggc 4740
atcctgggcg acggcttcgg caccaccctg gagatgtcca agcgcgacct gatctgggtg 4800
gtgaagcgca cccacgtggc cgtggagcgc taccccgcct ggggcgacac cgtggaggtg 4860
gagtgctggg tgggcgcctc cggcaacaac ggccgccgcc acgacttcct ggtgcgcgac 4920
tgcaagaccg gcgagatcct gacccgctgc acctccctga gcgtgatgat gaacacccgc 4980
acccgccgcc tgagcaagat ccccgaggag gtgcgcggcg agatcggccc cgccttcatc 5040
gacaacgtgg ccgtgaagga cgaggagatc aagaagcccc agaagctgaa cgactccacc 5100
gccgactaca tccagggcgg cctgaccccc cgctggaacg acctggacat caaccagcac 5160
gtgaacaaca tcaagtacgt ggactggatc ctggagaccg tgcccgacag catcttcgag 5220
agccaccaca tctcctcctt caccatcgag taccgccgcg agtgcaccat ggacagcgtg 5280
ctgcagtccc tgaccaccgt gagcggcggc tcctccgagg ccggcctggt gtgcgagcac 5340
ctgctgcagc tggagggcgg cagcgaggtg ctgcgcgcca agaccgagtg gcgccccaag 5400
ctgaccgact ccttccgcgg catcagcgtg atccccgccg agtccagcgt gatggactac 5460
aaggaccacg acggcgacta caaggaccac gacatcgact acaaggacga cgacgacaag 5520
tgactcgagt taattaactc gaggcagcag cagctcggat agtatcgaca cactctggac 5580
gctggtcgtg tgatggactg ttgccgccac acttgctgcc ttgacctgtg aatatccctg 5640
ccgcttttat caaacagcct cagtgtgttt gatcttgtgt gtacgcgctt ttgcgagttg 5700
ctagctgctt gtgctatttg cgaataccac ccccagcatc cccttccctc gtttcatatc 5760
gcttgcatcc caaccgcaac ttatctacgc tgtcctgcta tccctcagcg ctgctcctgc 5820
tcctgctcac tgcccctcgc acagccttgg tttgggctcc gcctgtattc tcctggtact 5880
gcaacctgta aaccagcact gcaatgctga tgcacgggaa gtagtgggat gggaacacaa 5940
atggaaagct gtagagctcc ttgttttcca gaaggagttg ctccttgagc ctttcattct 6000
cagcctcgat aacctccaaa gccgctctaa ttgtggaggg ggttcgaatt taaaagcttg 6060
gaatgttggt tcgtgcgtct ggaacaagcc cagacttgtt gctcactggg aaaaggacca 6120
tcagctccaa aaaacttgcc gctcaaaccg cgtacctctg ctttcgcgca atctgccctg 6180
ttgaaatcgc caccacattc atattgtgac gcttgagcag tctgtaattg cctcagaatg 6240
tggaatcatc tgccccctgt gcgagcccat gccaggcatg tcgcgggcga ggacacccgc 6300
cactcgtaca gcagaccatt atgctacctc acaatagttc ataacagtga ccatatttct 6360
cgaagctccc caacgagcac ctccatgctc tgagtggcca ccccccggcc ctggtgcttg 6420
cggagggcag gtcaaccggc atggggctac cgaaatcccc gaccggatcc caccaccccc 6480
gcgatgggaa gaatctctcc ccgggatgtg ggcccaccac cagcacaacc tgctggccca 6540
ggcgagcgtc aaaccatacc acacaaatat ccttggcatc ggccctgaat tccttctgcc 6600
gctctgctac ccggtgcttc tgtccgaagc aggggttgct agggatcgct ccgagtccgc 6660
aaacccttgt cgcgtggcgg ggcttgttcg agcttgttcg agcttgaaga gcctctagag 6720
tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 6780
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 6840
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 6900
tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 6960
ttgcgtattg ggcgctcttc c 6981
<210> 274
<211> 5923
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 274
gctcttccgc ctggagctgg tgcagagcat ggggcagttt gcggaggaga gggtgctccc 60
cgtgctgcac cccgtggaca agctgtggca gccgcaggac ttcctgcccg accccgagtc 120
gcccgacttc gaggaccagg tggcggagct gcgcgcgcgc gccaaggacc tgcccgacga 180
gtactttgtg gtgctggtgg gcgacatgat cacggaggag gcgctgccga cctacatggc 240
catgctcaac accttggacg gtgtgcgcga cgacacgggc gcggctgacc acccgtgggc 300
gcgctggacg cggcagtggg tggccgagga gaaccggcac ggcgacctgc tgaacaagta 360
ctgttggctg acggggcgcg tcaacatgcg ggccgtggag gtgaccatca acaacctgat 420
caagagcggc atgaacccgc agacggacaa caacccttac ttgggcttcg tctacacctc 480
cttccaggag cgcgccacca agtaggtacc ctttcttgcg ctatgacact tccagcaaaa 540
ggtagggcgg gctgcgagac ggcttcccgg cgctgcatgc aacaccgatg atgcttcgac 600
cccccgaagc tccttcgggg ctgcatgggc gctccgatgc cgctccaggg cgagcgctgt 660
ttaaatagcc aggcccccga ttgcaaagac attatagcga gctaccaaag ccatattcaa 720
acacctagat cactaccact tctacacagg ccactcgagc ttgtgatcgc actccgctaa 780
gggggcgcct cttcctcttc gtttcagtca caacccgcaa actctagaat atcaatatca 840
atgctgctgc aggccttcct gttcctgctg gccggcttcg ccgccaagat cagcgcctcc 900
atgacgaacg agacgtccga ccgccccctg gtgcacttca cccccaacaa gggctggatg 960
aacgacccca acggcctgtg gtacgacgag aaggacgcca agtggcacct gtacttccag 1020
tacaacccga acgacaccgt ctgggggacg cccttgttct ggggccacgc cacgtccgac 1080
gacctgacca actgggagga ccagcccatc gccatcgccc cgaagcgcaa cgactccggc 1140
gccttctccg gctccatggt ggtggactac aacaacacct ccggcttctt caacgacacc 1200
atcgacccgc gccagcgctg cgtggccatc tggacctaca acaccccgga gtccgaggag 1260
cagtacatct cctacagcct ggacggcggc tacaccttca ccgagtacca gaagaacccc 1320
gtgctggccg ccaactccac ccagttccgc gacccgaagg tcttctggta cgagccctcc 1380
cagaagtgga tcatgaccgc ggccaagtcc caggactaca agatcgagat ctactcctcc 1440
gacgacctga agtcctggaa gctggagtcc gcgttcgcca acgagggctt cctcggctac 1500
cagtacgagt gccccggcct gatcgaggtc cccaccgagc aggaccccag caagtcctac 1560
tgggtgatgt tcatctccat caaccccggc gccccggccg gcggctcctt caaccagtac 1620
ttcgtcggca gcttcaacgg cacccacttc gaggccttcg acaaccagtc ccgcgtggtg 1680
gacttcggca aggactacta cgccctgcag accttcttca acaccgaccc gacctacggg 1740
agcgccctgg gcatcgcgtg ggcctccaac tgggagtact ccgccttcgt gcccaccaac 1800
ccctggcgct cctccatgtc cctcgtgcgc aagttctccc tcaacaccga gtaccaggcc 1860
aacccggaga cggagctgat caacctgaag gccgagccga tcctgaacat cagcaacgcc 1920
ggcccctgga gccggttcgc caccaacacc acgttgacga aggccaacag ctacaacgtc 1980
gacctgtcca acagcaccgg caccctggag ttcgagctgg tgtacgccgt caacaccacc 2040
cagacgatct ccaagtccgt gttcgcggac ctctccctct ggttcaaggg cctggaggac 2100
cccgaggagt acctccgcat gggcttcgag gtgtccgcgt cctccttctt cctggaccgc 2160
gggaacagca aggtgaagtt cgtgaaggag aacccctact tcaccaaccg catgagcgtg 2220
aacaaccagc ccttcaagag cgagaacgac ctgtcctact acaaggtgta cggcttgctg 2280
gaccagaaca tcctggagct gtacttcaac gacggcgacg tcgtgtccac caacacctac 2340
ttcatgacca ccgggaacgc cctgggctcc gtgaacatga cgacgggggt ggacaacctg 2400
ttctacatcg acaagttcca ggtgcgcgag gtcaagtgac aattgacgga gcgtcgtgcg 2460
ggagggagtg tgccgagcgg ggagtcccgg tctgtgcgag gcccggcagc tgacgctggc 2520
gagccgtacg ccccgagggt ccccctcccc tgcaccctct tccccttccc tctgacggcc 2580
gcgcctgttc ttgcatgttc agcgacggat cccgcgtctc gaacagagcg cgcagaggaa 2640
cgctgaaggt ctcgcctctg tcgcacctca gcgcggcata caccacaata accacctgac 2700
gaatgcgctt ggttcttcgt ccattagcga agcgtccggt tcacacacgt gccacgttgg 2760
cgaggtggca ggtgacaatg atcggtggag ctgatggtcg aaacgttcac agcctaggga 2820
tatcgaattc ggccgacagg acgcgcgtca aaggtgctgg tcgtgtatgc cctggccggc 2880
aggtcgttgc tgctgctggt tagtgattcc gcaaccctga ttttggcgtc ttattttggc 2940
gtggcaaacg ctggcgcccg cgagccgggc cggcggcgat gcggtgcccc acggctgccg 3000
gaatccaagg gaggcaagag cgcccgggtc agttgaaggg ctttacgcgc aaggtacagc 3060
cgctcctgca aggctgcgtg gtggaattgg acgtgcaggt cctgctgaag ttcctccacc 3120
gcctcaccag cggacaaagc accggtgtat caggtccgtg tcatccactc taaagaactc 3180
gactacgacc tactgatggc cctagattct tcatcaaaaa cgcctgagac acttgcccag 3240
gattgaaact ccctgaaggg accaccaggg gccctgagtt gttccttccc cccgtggcga 3300
gctgccagcc aggctgtacc tgtgatcgag gctggcggga aaataggctt cgtgtgctca 3360
ggtcatggga ggtgcaggac agctcatgaa acgccaacaa tcgcacaatt catgtcaagc 3420
taatcagcta tttcctcttc acgagctgta attgtcccaa aattctggtc taccgggggt 3480
gatccttcgt gtacgggccc ttccctcaac cctaggtatg cgcgcatgcg gtcgccgcgc 3540
aactcgcgcg agggccgagg gtttgggacg ggccgtcccg aaatgcagtt gcacccggat 3600
gcgtggcacc ttttttgcga taatttatgc aatggactgc tctgcaaaat tctggctctg 3660
tcgccaaccc taggatcagc ggcgtaggat ttcgtaatca ttcgtcctga tggggagcta 3720
ccgactaccc taatatcagc ccgactgcct gacgccagcg tccacttttg tgcacacatt 3780
ccattcgtgc ccaagacatt tcattgtggt gcgaagcgtc cccagttacg ctcacctgtt 3840
tcccgacctc cttactgttc tgtcgacaga gcgggcccac aggccggtcg cagccactag 3900
tatggccacc gcatccactt tctcggcgtt caatgcccgc tgcggcgacc tgcgtcgctc 3960
ggcgggctcc gggccccggc gcccagcgag gcccctcccc gtgcgcgggc gcgcccagct 4020
gcccgactgg agcatgctgc tggccgcgat caccaccctg ttcctggcgg ccgagaagca 4080
gtggatgatg ctggactgga agcccaagcg ccccgacatg ctggtggacc ccttcggcct 4140
gggccgcttc gtgcaggacg gcctggtgtt ccgcaacaac ttcagcatcc gcagctacga 4200
gatcggcgcg gaccgcaccg ccagcatcga gaccctgatg aaccacctgc aggagaccgc 4260
cctgaaccac gtgaagagtg tgggcctgct ggaggacggc ctgggcagca cccgcgagat 4320
gagcctgcgc aacctgatct gggtggtgac caagatgcag gtggcggtgg accgctaccc 4380
cacctggggc gacgaggtgc aggtgagcag ctgggcgacc gccatcggca agaacggcat 4440
gcgccgcgag tggatcgtga ccgacttccg caccggcgag accctgctgc gcgccaccag 4500
cgtgtgggtg atgatgaaca agctgacccg ccgcatcagc aagatccccg aggaggtgtg 4560
gcacgagatc ggccccagct tcatcgacgc gccccccctg cccaccgtgg aggacgacgg 4620
ccgcaagctg acccgcttcg acgagagcag cgccgacttc atccgcaagg gcctgacccc 4680
ccgctggagc gacctggaca tcaaccagca cgtgaacaac gtgaagtaca tcggctggct 4740
gctggagagc gcgccccccg agatccacga gagccacgag atcgccagcc tgaccctgga 4800
gtaccgccgc gagtgcggcc gcgacagcgt gctgaacagc gccaccaagg tgagcgacag 4860
cagccagctg ggcaagagcg ccgtggagtg caaccacctg gtgcgcctgc agaacggcgg 4920
cgagatcgtg aagggccgca ccgtgtggcg ccccaagcgc cccctgtaca acgacggcgc 4980
cgtggtggac gtgcccgcca agaccagctg actcgaggca gcagcagctc ggatagtatc 5040
gacacactct ggacgctggt cgtgtgatgg actgttgccg ccacacttgc tgccttgacc 5100
tgtgaatatc cctgccgctt ttatcaaaca gcctcagtgt gtttgatctt gtgtgtacgc 5160
gcttttgcga gttgctagct gcttgtgcta tttgcgaata ccacccccag catccccttc 5220
cctcgtttca tatcgcttgc atcccaaccg caacttatct acgctgtcct gctatccctc 5280
agcgctgctc ctgctcctgc tcactgcccc tcgcacagcc ttggtttggg ctccgcctgt 5340
attctcctgg tactgcaacc tgtaaaccag cactgcaatg ctgatgcacg ggaagtagtg 5400
ggatgggaac acaaatggaa agcttgagct ccagccacgg caacaccgcg cgccttgcgg 5460
ccgagcacgg cgacaagaac ctgagcaaga tctgcgggct gatcgccagc gacgagggcc 5520
ggcacgagat cgcctacacg cgcatcgtgg acgagttctt ccgcctcgac cccgagggcg 5580
ccgtcgccgc ctacgccaac atgatgcgca agcagatcac catgcccgcg cacctcatgg 5640
acgacatggg ccacggcgag gccaacccgg gccgcaacct cttcgccgac ttctccgcgg 5700
tcgccgagaa gatcgacgtc tacgacgccg aggactactg ccgcatcctg gagcacctca 5760
acgcgcgctg gaaggtggac gagcgccagg tcagcggcca ggccgccgcg gaccaggagt 5820
acgtcctggg cctgccccag cgcttccgga aactcgccga gaagaccgcc gccaagcgca 5880
agcgcgtcgc gcgcaggccc gtcgccttct cctggagaag agc 5923
<210> 275
<211> 1110
<212> DNA
<213> Ulmus americana
<400> 275
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccagctg 120
cccgactgga gcatgctgct ggccgcgatc accaccctgt tcctggcggc cgagaagcag 180
tggatgatgc tggactggaa gcccaagcgc cccgacatgc tggtggaccc cttcggcctg 240
ggccgcttcg tgcaggacgg cctggtgttc cgcaacaact tcagcatccg cagctacgag 300
atcggcgcgg accgcaccgc cagcatcgag accctgatga accacctgca ggagaccgcc 360
ctgaaccacg tgaagagtgt gggcctgctg gaggacggcc tgggcagcac ccgcgagatg 420
agcctgcgca acctgatctg ggtggtgacc aagatgcagg tggcggtgga ccgctacccc 480
acctggggcg acgaggtgca ggtgagcagc tgggcgaccg ccatcggcaa gaacggcatg 540
cgccgcgagt ggatcgtgac cgacttccgc accggcgaga ccctgctgcg cgccaccagc 600
gtgtgggtga tgatgaacaa gctgacccgc cgcatcagca agatccccga ggaggtgtgg 660
cacgagatcg gccccagctt catcgacgcg ccccccctgc ccaccgtgga ggacgacggc 720
cgcaagctga cccgcttcga cgagagcagc gccgacttca tccgcaaggg cctgaccccc 780
cgctggagcg acctggacat caaccagcac gtgaacaacg tgaagtacat cggctggctg 840
ctggagagcg cgccccccga gatccacgag agccacgaga tcgccagcct gaccctggag 900
taccgccgcg agtgcggccg cgacagcgtg ctgaacagcg ccaccaaggt gagcgacagc 960
agccagctgg gcaagagcgc cgtggagtgc aaccacctgg tgcgcctgca gaacggcggc 1020
gagatcgtga agggccgcac cgtgtggcgc cccaagcgcc ccctgtacaa cgacggcgcc 1080
gtggtggacg tgcccgccaa gaccagctga 1110
<210> 276
<211> 10326
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized polynucleotide
<400> 276
gctcttcgcc gccgccactc ctgctcgagc gcgcccgcgc gtgcgccgcc agcgccttgg 60
ccttttcgcc gcgctcgtgc gcgtcgctga tgtccatcac caggtccatg aggtctgcct 120
tgcgccggct gagccactgc ttcgtccggg cggccaagag gagcatgagg gaggactcct 180
ggtccagggt cctgacgtgg tcgcggctct gggagcgggc cagcatcatc tggctctgcc 240
gcaccgaggc cgcctccaac tggtcctcca gcagccgcag tcgccgccga ccctggcaga 300
ggaagacagg tgaggggggt atgaattgta cagaacaacc acgagccttg tctaggcaga 360
atccctacca gtcatggctt tacctggatg acggcctgcg aacagctgtc cagcgaccct 420
cgctgccgcc gcttctcccg cacgcttctt tccagcaccg tgatggcgcg agccagcgcc 480
gcacgctggc gctgcgcttc gccgatctga ggacagtcgg ggaactctga tcagtctaaa 540
cccccttgcg cgttagtgtt gccatccttt gcagaccggt gagagccgac ttgttgtgcg 600
ccacccccca caccacctcc tcccagacca attctgtcac ctttttggcg aaggcatcgg 660
cctcggcctg cagagaggac agcagtgccc agccgctggg ggttggcgga tgcacgctca 720
ggtacccttt cttgcgctat gacacttcca gcaaaaggta gggcgggctg cgagacggct 780
tcccggcgct gcatgcaaca ccgatgatgc ttcgaccccc cgaagctcct tcggggctgc 840
atgggcgctc cgatgccgct ccagggcgag cgctgtttaa atagccaggc ccccgattgc 900
aaagacatta tagcgagcta ccaaagcata ttcaaacacc tagatcacta ccacttctac 960
acaggccact cgagcttgtg atcgcactcc gctaaggggg cgcctcttcc cttcgtttca 1020
gtcacaaccc gcaaacggcg cgccatatca atgctgctgc aggccttcct gttcctgctg 1080
gccggcttcg ccgccaagat cagcgcctcc atgacgaacg agacgtccga ccgccccctg 1140
gtgcacttca cccccaacaa gggctggatg aacgacccca acggcctgtg gtacgacgag 1200
aaggacgcca agtggcacct gtacttccag tacaacccga acgacaccgt ctgggggacg 1260
cccttgttct ggggccacgc cacgtccgac gacctgacca actgggagga ccagcccatc 1320
gccatcgccc cgaagcgcaa cgactccggc gccttctccg gctccatggt ggtggactac 1380
aacaacacct ccggcttctt caacgacacc atcgacccgc gccagcgctg cgtggccatc 1440
tggacctaca acaccccgga gtccgaggag cagtacatct cctacagcct ggacggcggc 1500
tacaccttca ccgagtacca gaagaacccc gtgctggccg ccaactccac ccagttccgc 1560
gacccgaagg tcttctggta cgagccctcc cagaagtgga tcatgaccgc ggccaagtcc 1620
caggactaca agatcgagat ctactcctcc gacgacctga agtcctggaa gctggagtcc 1680
gcgttcgcca acgagggctt cctcggctac cagtacgagt gccccggcct gatcgaggtc 1740
cccaccgagc aggaccccag caagtcctac tgggtgatgt tcatctccat caaccccggc 1800
gccccggccg gcggctcctt caaccagtac ttcgtcggca gcttcaacgg cacccacttc 1860
gaggccttcg acaaccagtc ccgcgtggtg gacttcggca aggactacta cgccctgcag 1920
accttcttca acaccgaccc gacctacggg agcgccctgg gcatcgcgtg ggcctccaac 1980
tgggagtact ccgccttcgt gcccaccaac ccctggcgct cctccatgtc cctcgtgcgc 2040
aagttctccc tcaacaccga gtaccaggcc aacccggaga cggagctgat caacctgaag 2100
gccgagccga tcctgaacat cagcaacgcc ggcccctgga gccggttcgc caccaacacc 2160
acgttgacga aggccaacag ctacaacgtc gacctgtcca acagcaccgg caccctggag 2220
ttcgagctgg tgtacgccgt caacaccacc cagacgatct ccaagtccgt gttcgcggac 2280
ctctccctct ggttcaaggg cctggaggac cccgaggagt acctccgcat gggcttcgag 2340
gtgtccgcgt cctccttctt cctggaccgc gggaacagca aggtgaagtt cgtgaaggag 2400
aacccctact tcaccaaccg catgagcgtg aacaaccagc ccttcaagag cgagaacgac 2460
ctgtcctact acaaggtgta cggcttgctg gaccagaaca tcctggagct gtacttcaac 2520
gacggcgacg tcgtgtccac caacacctac ttcatgacca ccgggaacgc cctgggctcc 2580
gtgaacatga cgacgggggt ggacaacctg ttctacatcg acaagttcca ggtgcgcgag 2640
gtcaagtgac aattggcagc agcagctcgg atagtatcga cacactctgg acgctggtcg 2700
tgtgatggac tgttgccgcc acacttgctg ccttgacctg tgaatatccc tgccgctttt 2760
atcaaacagc ctcagtgtgt ttgatcttgt gtgtacgcgc ttttgcgagt tgctagctgc 2820
ttgtgctatt tgcgaatacc acccccagca tccccttccc tcgtttcata tcgcttgcat 2880
cccaaccgca acttatctac gctgtcctgc tatccctcag cgctgctcct gctcctgctc 2940
actgcccctc gcacagcctt ggtttgggct ccgcctgtat tctcctggta ctgcaacctg 3000
taaaccagca ctgcaatgct gatgcacggg aagtagtggg atgggaacac aaatggagga 3060
tcccgcgtct cgaacagagc gcgcagagga acgctgaagg tctcgcctct gtcgcacctc 3120
agcgcggcat acaccacaat aaccacctga cgaatgcgct tggttcttcg tccattagcg 3180
aagcgtccgg ttcacacacg tgccacgttg gcgaggtggc aggtgacaat gatcggtgga 3240
gctgatggtc gaaacgttca cagcctaggg atatcgaatt cggcgctatg acacttccag 3300
caaaaggtag ggcgggctgc gagacggctt cccggcgctg catgcaacac cgatgatgct 3360
tcgacccccc gaagctcctt cggggctgca tgggcgctcc gatgccgctc cagggcgagc 3420
gctgtttaaa tagccaggcc cccgattgca aagacattat agcgagctac caaagccata 3480
ttcaaacacc tagatcacta ccacttctac acaggccact cgagcttgtg atcgcactcc 3540
gctaaggggg cgcctcttcc tcttcgtttc agtcggccga caggacgcgc gtcaaaggtg 3600
ctggtcgtgt atgccctggc cggcaggtcg ttgctgctgc tggttagtga ttccgcaacc 3660
ctgattttgg cgtcttattt tggcgtggca aacgctggcg cccgcgagcc gggccggcgg 3720
cgatgcggtg ccccacggct gccggaatcc aagggaggca agagcgcccg ggtcagttga 3780
agggctttac gcgcaaggta cagccgctcc tgcaaggctg cgtggtggaa ttggacgtgc 3840
aggtcctgct gaagttcctc caccgcctca ccagcggaca aagcaccggt gtatcaggtc 3900
cgtgtcatcc actctaaaga gctcgactac gacctactga tggccctaga ttcttcatca 3960
aaaacgcctg agacacttgc ccaggattga aactccctga agggaccacc aggggccctg 4020
agttgttcct tccccccgtg gcgagctgcc agccaggctg tacctgtgat cgaggctggc 4080
gggaaaatag gcttcgtgtg ctcaggtcat gggaggtgca ggacagctca tgaaacgcca 4140
acaatcgcac aattcatgtc aagctaatca gctatttcct cttcacgagc tgtaattgtc 4200
ccaaaattct ggtctaccgg gggtgatcct tcgtgtacgg gcccttccct caaccctagg 4260
tatgcgcgca tgcggtcgcc gcgcaactcg cgcgagggcc gagggtttgg gacgggccgt 4320
cccgaaatgc agttgcaccc ggatgcgtgg cacctttttt gcgataattt atgcaatgga 4380
ctgctctgca aaattctggc tctgtcgcca accctaggat cagcggcgta ggatttcgta 4440
atcattcgtc ctgatgggga gctaccgact accctaatat cagcccgact gcctgacgcc 4500
agcgtccact tttgtgcaca cattccattc gtgcccaaga catttcattg tggtgcgaag 4560
cgtccccagt tacgctcacc tgtttcccga cctccttact gttctgtcga cagagcgggc 4620
ccacaggccg gtcgcagccc atatggccac cgcatccact ttctcggcgt tcaatgcccg 4680
ctgcggcgac ctgcgtcgct cggcgggctc cgggccccgg cgcccagcga ggcccctccc 4740
cgtgcgctac gtattccagt gcctggtggc cagctgcatc gacccctgcg accagtaccg 4800
cagcagcgcc agcctgagct tcctgggcga caacggcttc gccagcctgt tcggcagcaa 4860
gcccttcatg agcaaccgcg gccaccgccg cctgcgccgc gccagccaca gcggcgaggc 4920
catggccgtg gccctgcagc ccgcccagga ggccggcacc aagaagaagc ccgtgatcaa 4980
gcagcgccgc gtggtggtga ccggcatggg cgtggtgacc cccctgggcc acgagcccga 5040
cgtgttctac aacaacctgc tggacggcgt gagcggcatc agcgagatcg agaccttcga 5100
ctgcacccag ttccccaccc gcatcgccgg cgagatcaag agcttcagca ccgacggctg 5160
ggtggccccc aagctgagca agcgcatgga caagttcatg ctgtacctgc tgaccgccgg 5220
caagaaggcc ctggccgacg gcggcatcac cgacgaggtg atgaaggagc tggacaagcg 5280
caagtgcggc gtgctgatcg gcagcggcat gggcggcatg aaggtgttca acgacgccat 5340
cgaggccctg cgcgtgagct acaagaagat gaaccccttc tgcgtgccct tcgccaccac 5400
caacatgggc agcgccatgc tggccatgga cctgggctgg atgggcccca actacagcat 5460
cagcaccgcc tgcgccacca gcaacttctg catcctgaac gccgccaacc acatcatccg 5520
cggcgaggcc gacatgatgc tgtgcggcgg cagcgacgcc gtgatcatcc ccatcggcct 5580
gggcggcttc gtggcctgcc gcgccctgag ccagcgcaac agcgacccca ccaaggccag 5640
ccgcccctgg gacagcaacc gcgacggctt cgtgatgggc gagggcgccg gcgtgctgct 5700
gctggaggag ctggagcacg ccaagaagcg cggcgccacc atctacgccg agttcctggg 5760
cggcagcttc acctgcgacg cctaccacat gaccgagccc caccccgagg gcgccggcgt 5820
gatcctgtgc atcgagaagg ccctggccca ggccggcgtg agcaaggagg acgtgaacta 5880
catcaacgcc cacgccacca gcaccagcgc cggcgacatc aaggagtacc aggccctggc 5940
ccgctgcttc ggccagaaca gcgagctgcg cgtgaacagc accaagagca tgatcggcca 6000
cctgctgggc gccgccggcg gcgtggaggc cgtgaccgtg gtgcaggcca tccgcaccgg 6060
ctggattcac cccaacctga acctggagga ccccgacaag gccgtggacg ccaagctgct 6120
ggtgggcccc aagaaggagc gcctgaacgt gaaggtgggc ctgagcaaca gcttcggctt 6180
cggcggccac aacagcagca tcctgttcgc cccctgcaac gtgtgaatgc atacggagcg 6240
tcgtgcggga gggagtgtgc cgagcgggga gtcccggtct gtgcgaggcc cggcagctga 6300
cgctggcgag ccgtacgccc cgagggtccc cctcccctcc cccctcttcc ccttccctct 6360
gacggccgcg cctgtttttg catgttcagc gaccttaagg atctaagtaa gattcgaagc 6420
gctcgaccgt gccggacgga ctgcagcccc atgtcgtagt gaccgccaat gtaagtgggc 6480
tggcgtttcc ctgtacgtga ctcaacgtca ctgcacgcgc accaccctct cgaccggcag 6540
gaccaggcat cgcgagatac agcgcgagcc agacacggag tgccgagcta tgcgcacgct 6600
ccaactagat atcgaattcg gcgctatgac acttccagca aaaggtaggg cgggctgcga 6660
gacggcttcc cggcgctgca tgcaacaccg atgatgcttc gaccccccga agctccttcg 6720
gggctgcatg ggcgctccga tgccgctcca gggcgagcgc tgtttaaata gccaggcccc 6780
cgattgcaaa gacattatag cgagctacca aagccatatt caaacaccta gatcactacc 6840
acttctacac aggccactcg agcttgtgat cgcactccgc taagggggcg cctcttcctc 6900
ttcgtttcag tcggccgaca ggacgcgcgt caaaggtgct ggtcgtgtat gccctggccg 6960
gcaggtcgtt gctgctgctg gttagtgatt ccgcaaccct gattttggcg tcttattttg 7020
gcgtggcaaa cgctggcgcc cgcgagccgg gccggcggcg atgcggtgcc ccacggctgc 7080
cggaatccaa gggaggcaag agcgcccggg tcagttgaag ggctttacgc gcaaggtaca 7140
gccgctcctg caaggctgcg tggtggaatt ggacgtgcag gtcctgctga agttcctcca 7200
ccgcctcacc agcggacaaa gcaccggtgt atcaggtccg tgtcatccac tctaaagagc 7260
tcgactacga cctactgatg gccctagatt cttcatcaaa aacgcctgag acacttgccc 7320
aggattgaaa ctccctgaag ggaccaccag gggccctgag ttgttccttc cccccgtggc 7380
gagctgccag ccaggctgta cctgtgatcg aggctggcgg gaaaataggc ttcgtgtgct 7440
caggtcatgg gaggtgcagg acagctcatg aaacgccaac aatcgcacaa ttcatgtcaa 7500
gctaatcagc tatttcctct tcacgagctg taattgtccc aaaattctgg tctaccgggg 7560
gtgatccttc gtgtacgggc ccttccctca accctaggta tgcgcgcatg cggtcgccgc 7620
gcaactcgcg cgagggccga gggtttggga cgggccgtcc cgaaatgcag ttgcacccgg 7680
atgcgtggca ccttttttgc gataatttat gcaatggact gctctgcaaa attctggctc 7740
tgtcgccaac cctaggatca gcggcgtagg atttcgtaat cattcgtcct gatggggagc 7800
taccgactac cctaatatca gcccgactgc ctgacgccag cgtccacttt tgtgcacaca 7860
ttccattcgt gcccaagaca tttcattgtg gtgcgaagcg tccccagtta cgctcacctg 7920
tttcccgacc tccttactgt tctgtcgaca gagcgggccc acaggccggt cgcagccact 7980
agtatggcca ccgcatccac tttctcggcg ttcaatgccc gctgcggcga cctgcgtcgc 8040
tcggcgggct ccgggccccg gcgcccagcg aggcccctcc ccgtgcgcgg gcgcgccccc 8100
aaggccaacg gcagcgccgt gagcctgaag tccggcagcc tgaacaccct ggaggacccc 8160
cccagcagcc cccccccccg caccttcctg aaccagctgc ccgactggag ccgcctgcgc 8220
accgccatca ccaccgtgtt cgtggccgcc gagaagcagt tcacccgcct ggaccgcaag 8280
agcaagcgcc ccgacatgct ggtggactgg ttcggcagcg agaccatcgt gcaggacggc 8340
ctggtgttcc gcgagcgctt cagcatccgc agctacgaga tcggcgccga ccgcaccgcc 8400
agcatcgaga ccctgatgaa ccacctgcag gacaccagcc tgaaccactg caagagcgtg 8460
ggcctgctga acgacggctt cggccgcacc cccgagatgt gcacccgcga cctgatctgg 8520
gtgctgacca agatgcagat cgtggtgaac cgctacccca cctggggcga caccgtggag 8580
atcaacagct ggttcagcca gagcggcaag atcggcatgg gccgcgagtg gctgatcagc 8640
gactgcaaca ccggcgagat cctggtgcgc gccaccagcg cctgggccat gatgaaccag 8700
aagacccgcc gcttcagcaa gctgccctgc gaggtgcgcc aggagatcgc cccccacttc 8760
gtggacgccc cccccgtgat cgaggacaac gaccgcaagc tgcacaagtt cgacgtgaag 8820
accggcgaca gcatctgcaa gggcctgacc cccggctgga acgacttcga cgtgaaccag 8880
cacgtgagca acgtgaagta catcggctgg attctggaga gcatgcccac cgaggtgctg 8940
gagacccagg agctgtgcag cctgaccctg gagtaccgcc gcgagtgcgg ccgcgagagc 9000
gtggtggaga gcgtgaccag catgaacccc agcaaggtgg gcgaccgcag ccagtaccag 9060
cacctgctgc gcctggagga cggcgccgac atcatgaagg gccgcaccga gtggcgcccc 9120
aagaacgccg gcaccaaccg cgccatcagc acctgattaa ttaactcgag gcagcagcag 9180
ctcggatagt atcgacacac tctggacgct ggtcgtgtga tggactgttg ccgccacact 9240
tgctgccttg acctgtgaat atccctgccg cttttatcaa acagcctcag tgtgtttgat 9300
cttgtgtgta cgcgcttttg cgagttgcta gctgcttgtg ctatttgcga ataccacccc 9360
cagcatcccc ttccctcgtt tcatatcgct tgcatcccaa ccgcaactta tctacgctgt 9420
cctgctatcc ctcagcgctg ctcctgctcc tgctcactgc ccctcgcaca gccttggttt 9480
gggctccgcc tgtattctcc tggtactgca acctgtaaac cagcactgca atgctgatgc 9540
acgggaagta gtgggatggg aacacaaatg gaaagcttga gctcttgttt tccagaagga 9600
gttgctcctt gagcctttca ttctcagcct cgataacctc caaagccgct ctaattgtgg 9660
agggggttcg aatttaaaag cttggaatgt tggttcgtgc gtctggaaca agcccagact 9720
tgttgctcac tgggaaaagg accatcagct ccaaaaaact tgccgctcaa accgcgtacc 9780
tctgctttcg cgcaatctgc cctgttgaaa tcgccaccac attcatattg tgacgcttga 9840
gcagtctgta attgcctcag aatgtggaat catctgcccc ctgtgcgagc ccatgccagg 9900
catgtcgcgg gcgaggacac ccgccactcg tacagcagac cattatgcta cctcacaata 9960
gttcataaca gtgaccatat ttctcgaagc tccccaacga gcacctccat gctctgagtg 10020
gccacccccc ggccctggtg cttgcggagg gcaggtcaac cggcatgggg ctaccgaaat 10080
ccccgaccgg atcccaccac ccccgcgatg ggaagaatct ctccccggga tgtgggccca 10140
ccaccagcac aacctgctgg cccaggcgag cgtcaaacca taccacacaa atatccttgg 10200
catcggccct gaattccttc tgccgctctg ctacccggtg cttctgtccg aagcaggggt 10260
tgctagggat cgctccgagt ccgcaaaccc ttgtcgcgtg gcggggcttg ttcgagcttg 10320
aagagc 10326
<210> 277
<211> 1584
<212> DNA
<213> Cuphea wrightii
<400> 277
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgctacgt attccagtgc 120
ctggtggcca gctgcatcga cccctgcgac cagtaccgca gcagcgccag cctgagcttc 180
ctgggcgaca acggcttcgc cagcctgttc ggcagcaagc ccttcatgag caaccgcggc 240
caccgccgcc tgcgccgcgc cagccacagc ggcgaggcca tggccgtggc cctgcagccc 300
gcccaggagg ccggcaccaa gaagaagccc gtgatcaagc agcgccgcgt ggtggtgacc 360
ggcatgggcg tggtgacccc cctgggccac gagcccgacg tgttctacaa caacctgctg 420
gacggcgtga gcggcatcag cgagatcgag accttcgact gcacccagtt ccccacccgc 480
atcgccggcg agatcaagag cttcagcacc gacggctggg tggcccccaa gctgagcaag 540
cgcatggaca agttcatgct gtacctgctg accgccggca agaaggccct ggccgacggc 600
ggcatcaccg acgaggtgat gaaggagctg gacaagcgca agtgcggcgt gctgatcggc 660
agcggcatgg gcggcatgaa ggtgttcaac gacgccatcg aggccctgcg cgtgagctac 720
aagaagatga accccttctg cgtgcccttc gccaccacca acatgggcag cgccatgctg 780
gccatggacc tgggctggat gggccccaac tacagcatca gcaccgcctg cgccaccagc 840
aacttctgca tcctgaacgc cgccaaccac atcatccgcg gcgaggccga catgatgctg 900
tgcggcggca gcgacgccgt gatcatcccc atcggcctgg gcggcttcgt ggcctgccgc 960
gccctgagcc agcgcaacag cgaccccacc aaggccagcc gcccctggga cagcaaccgc 1020
gacggcttcg tgatgggcga gggcgccggc gtgctgctgc tggaggagct ggagcacgcc 1080
aagaagcgcg gcgccaccat ctacgccgag ttcctgggcg gcagcttcac ctgcgacgcc 1140
taccacatga ccgagcccca ccccgagggc gccggcgtga tcctgtgcat cgagaaggcc 1200
ctggcccagg ccggcgtgag caaggaggac gtgaactaca tcaacgccca cgccaccagc 1260
accagcgccg gcgacatcaa ggagtaccag gccctggccc gctgcttcgg ccagaacagc 1320
gagctgcgcg tgaacagcac caagagcatg atcggccacc tgctgggcgc cgccggcggc 1380
gtggaggccg tgaccgtggt gcaggccatc cgcaccggct ggattcaccc caacctgaac 1440
ctggaggacc ccgacaaggc cgtggacgcc aagctgctgg tgggccccaa gaaggagcgc 1500
ctgaacgtga aggtgggcct gagcaacagc ttcggcttcg gcggccacaa cagcagcatc 1560
ctgttcgccc cctgcaacgt gtga 1584
<210> 278
<211> 1173
<212> DNA
<213> Cuphea wrightii
<400> 278
atggccaccg catccacttt ctcggcgttc aatgcccgct gcggcgacct gcgtcgctcg 60
gcgggctccg ggccccggcg cccagcgagg cccctccccg tgcgcgggcg cgcccccaag 120
gccaacggca gcgccgtgag cctgaagtcc ggcagcctga acaccctgga ggaccccccc 180
agcagccccc ccccccgcac cttcctgaac cagctgcccg actggagccg cctgcgcacc 240
gccatcacca ccgtgttcgt ggccgccgag aagcagttca cccgcctgga ccgcaagagc 300
aagcgccccg acatgctggt ggactggttc ggcagcgaga ccatcgtgca ggacggcctg 360
gtgttccgcg agcgcttcag catccgcagc tacgagatcg gcgccgaccg caccgccagc 420
atcgagaccc tgatgaacca cctgcaggac accagcctga accactgcaa gagcgtgggc 480
ctgctgaacg acggcttcgg ccgcaccccc gagatgtgca cccgcgacct gatctgggtg 540
ctgaccaaga tgcagatcgt ggtgaaccgc taccccacct ggggcgacac cgtggagatc 600
aacagctggt tcagccagag cggcaagatc ggcatgggcc gcgagtggct gatcagcgac 660
tgcaacaccg gcgagatcct ggtgcgcgcc accagcgcct gggccatgat gaaccagaag 720
acccgccgct tcagcaagct gccctgcgag gtgcgccagg agatcgcccc ccacttcgtg 780
gacgcccccc ccgtgatcga ggacaacgac cgcaagctgc acaagttcga cgtgaagacc 840
ggcgacagca tctgcaaggg cctgaccccc ggctggaacg acttcgacgt gaaccagcac 900
gtgagcaacg tgaagtacat cggctggatt ctggagagca tgcccaccga ggtgctggag 960
acccaggagc tgtgcagcct gaccctggag taccgccgcg agtgcggccg cgagagcgtg 1020
gtggagagcg tgaccagcat gaaccccagc aaggtgggcg accgcagcca gtaccagcac 1080
ctgctgcgcc tggaggacgg cgccgacatc atgaagggcc gcaccgagtg gcgccccaag 1140
aacgccggca ccaaccgcgc catcagcacc tga 1173
<210> 279
<211> 1404
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized nucleotide
<400> 279
atgcagaccg cgcaccagcg gcccccgacc gaggggcact gcttcggtgc gaggctgccc 60
acggcgtcga ggcgggcggt gcgccgggca tggtcccgca tcgcgcgcgc ggcggccgcg 120
gccgacgcaa accccgcccg ccctgagcgc cgcgtggtca tcacgggcca gggcgtggtg 180
accagcctgg gccagacgat cgagcagttt tacagcagcc tgctggaggg cgtgagcggc 240
atctcgcaga tacagaagtt cgacaccacg ggctacacga cgacgatcgc gggcgagatc 300
aagtcgctgc agctggaccc gtacgtgccc aagcgctggg cgaagcgcgt ggacgacgtg 360
ataaagtacg tctacatcgc gggcaagcag gcgctggaga gcgccggcct gccgatcgag 420
gcggcggggc tggcgggcgc ggggctggac ccggcgctgt gcggcgtgct catcggcacc 480
gccatggcgg gcatgacgtc tttcgcggcg ggcgtggagg cgctgacgcg cggcggcgtg 540
cgcaagatga accccttttg catccccttc tccatctcca acatgggcgg cgcgatgctg 600
gcgatggaca tcggcttcat gggccccaac tactccatct ccacggcctg cgcgacgggc 660
aactactgca tcctgggcgc ggcggaccac atccggcgcg gcgacgcaaa cgtgatgctg 720
gccggcggcg cggacgcggc catcatcccc tcgggcatcg gcggcttcat cgcgtgcaag 780
gcgctgagca agcgcaacga cgagcccgag cgcgcgagcc ggccctggga cgccgaccgc 840
gacggcttcg tcatgggcga gggcgccggc gtgctggtgc tggaggagct ggagcacgcc 900
aagcgccgcg gcgcgaccat tttggctgaa ttagttggcg gcgcggccac ctcggacgcg 960
caccacatga ccgagcccga cccgcagggc cgcggcgtgc gcctctgcct cgagcgcgcg 1020
ctcgagcgcg cgcgcctcgc gcccgagcgc gtcggctacg tcaacgcgca cggcaccagc 1080
acgcccgcgg gcgacgtggc cgagtaccgc gccatccgcg ccgtcatccc gcaggactca 1140
ctacgcatca actccacaaa gtccatgatc gggcacctgc tcggcggcgc cggcgcggtc 1200
gaggccgtgg ccgccatcca ggccctgcgc accggctggc tccaccccaa cttgaacctc 1260
gagaaccccg cgcctggcgt cgaccccgtc gtgctcgtgg ggccgcggaa ggagcgcgcc 1320
gaagacctgg acgtcgtcct ctccaactcc tttggctttg gcgggcacaa ttcgtgcgtc 1380
atcttccgaa agtacgacga gtga 1404
<210> 280
<211> 1404
<212> DNA
<213> Artificial Sequence
<220>
<223> synthesized nucleotide
<400> 280
atgcagaccg cgcaccagcg gcccccgacc gaggggcact gcttcggtgc gaggctgccc 60
acggcgtcga ggcgggcggt gcgccgggcg tggtcccgca tcgcgcgcgc ggcggccgcg 120
gccgacgcga cccccgcccg ccctccgcgc cgcgtggtcg tgacgggcca gggcgtggtg 180
accagcctgg gccagacgat cgagcagttt tacagcagcc tgctggaggg cgtgagcggc 240
atctcgcaga tccaaaagtt tgacaccacg ggctacacga cgacgatcgc gggcgagatc 300
aagtcgctgc agctggaccc gtacgtgccc aagcgctggg ccaagcgcgt ggacgacgtc 360
atcaagtacg tctacatcgc gggcaagcag gcgctggaga acgcggggct gccgatcgag 420
gcggcggggc tggcgggcgc ggggctggac cccgcgctgt gcggcgtgct catcggcacc 480
gccatggcgg gcatgacgtc cttcgcggcg ggcgtggagg cgctgacgcg cggcggcgtg 540
cgcaagatga accccttttg catccccttc tccatctcca acatgggcgg cgcgatgctg 600
gcgatggaca tcggcttcat gggccccaac tactccatct ccacggcctg cgcgacgggc 660
aactactgca tcctgggcgc ggcggaccac atccggcgcg gcgacgcgga cgtgatgctg 720
gccggcggcg cggacgcggc catcatcccc tcgggcatcg gcggcttcat cgcgtgcaag 780
gcgctgagca agcgcaacga cgagcccgag cgcgcgagcc ggccctggga cgccgaccgc 840
gacggcttcg tcatgggcga gggcgccggc gtgctggtgc tggaggagct ggagcacgcc 900
aagcgccgcg gcgcgaccat cctggccgaa ttcgtcggcg gcgcggccac ctcggacgcg 960
caccacatga ccgagccgga cccgcagggc cgcggcgtgc gcctctgcct cgaacgcgcg 1020
ctcgagcgcg cgcgcctcgc gcccgagcgc gtcggctacg tcaacgcgca cggcaccagc 1080
acgcccgcgg gcgacgtggc cgagtaccgc gccatccgcg ccgtcatccc gcaggactcg 1140
ctgcgcatca actccaccaa gtccatgatc gggcacctgc tcggcggcgc cggcgcggtc 1200
gaggccgtgg ccgccatcca ggccctgcgc accggctggc tccaccccaa cctcaacctc 1260
gagaaccccg cacccggggt cgaccccgtc gtgctcgtgg ggccgcgcaa ggagcgcgcc 1320
gaagacctcg acgtcgtcct ctccaactcc tttggcttcg gcgggcacaa ctcgtgcgtc 1380
atcttccaaa agtacgacga gtga 1404
<210> 281
<211> 467
<212> PRT
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 281
Met Gln Thr Ala His Gln Arg Pro Pro Thr Glu Gly His Cys Phe Gly
1 5 10 15
Ala Arg Leu Pro Thr Ala Ser Arg Arg Ala Val Arg Arg Ala Trp Ser
20 25 30
Arg Ile Ala Arg Ala Ala Ala Ala Ala Asp Ala Asn Pro Ala Arg Pro
35 40 45
Glu Arg Arg Val Val Ile Thr Gly Gln Gly Val Val Thr Ser Leu Gly
50 55 60
Gln Thr Ile Glu Gln Phe Tyr Ser Ser Leu Leu Glu Gly Val Ser Gly
65 70 75 80
Ile Ser Gln Ile Gln Lys Phe Asp Thr Thr Gly Tyr Thr Thr Thr Ile
85 90 95
Ala Gly Glu Ile Lys Ser Leu Gln Leu Asp Pro Tyr Val Pro Lys Arg
100 105 110
Trp Ala Lys Arg Val Asp Asp Val Ile Lys Tyr Val Tyr Ile Ala Gly
115 120 125
Lys Gln Ala Leu Glu Ser Ala Gly Leu Pro Ile Glu Ala Ala Gly Leu
130 135 140
Ala Gly Ala Gly Leu Asp Pro Ala Leu Cys Gly Val Leu Ile Gly Thr
145 150 155 160
Ala Met Ala Gly Met Thr Ser Phe Ala Ala Gly Val Glu Ala Leu Thr
165 170 175
Arg Gly Gly Val Arg Lys Met Asn Pro Phe Cys Ile Pro Phe Ser Ile
180 185 190
Ser Asn Met Gly Gly Ala Met Leu Ala Met Asp Ile Gly Phe Met Gly
195 200 205
Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Gly Asn Tyr Cys Ile
210 215 220
Leu Gly Ala Ala Asp His Ile Arg Arg Gly Asp Ala Asn Val Met Leu
225 230 235 240
Ala Gly Gly Ala Asp Ala Ala Ile Ile Pro Ser Gly Ile Gly Gly Phe
245 250 255
Ile Ala Cys Lys Ala Leu Ser Lys Arg Asn Asp Glu Pro Glu Arg Ala
260 265 270
Ser Arg Pro Trp Asp Ala Asp Arg Asp Gly Phe Val Met Gly Glu Gly
275 280 285
Ala Gly Val Leu Val Leu Glu Glu Leu Glu His Ala Lys Arg Arg Gly
290 295 300
Ala Thr Ile Leu Ala Glu Leu Val Gly Gly Ala Ala Thr Ser Asp Ala
305 310 315 320
His His Met Thr Glu Pro Asp Pro Gln Gly Arg Gly Val Arg Leu Cys
325 330 335
Leu Glu Arg Ala Leu Glu Arg Ala Arg Leu Ala Pro Glu Arg Val Gly
340 345 350
Tyr Val Asn Ala His Gly Thr Ser Thr Pro Ala Gly Asp Val Ala Glu
355 360 365
Tyr Arg Ala Ile Arg Ala Val Ile Pro Gln Asp Ser Leu Arg Ile Asn
370 375 380
Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Gly Ala Gly Ala Val
385 390 395 400
Glu Ala Val Ala Ala Ile Gln Ala Leu Arg Thr Gly Trp Leu His Pro
405 410 415
Asn Leu Asn Leu Glu Asn Pro Ala Pro Gly Val Asp Pro Val Val Leu
420 425 430
Val Gly Pro Arg Lys Glu Arg Ala Glu Asp Leu Asp Val Val Leu Ser
435 440 445
Asn Ser Phe Gly Phe Gly Gly His Asn Ser Cys Val Ile Phe Arg Lys
450 455 460
Tyr Asp Glu
465
<210> 282
<211> 467
<212> PRT
<213> Artificial Sequence
<220>
<223> synthesized construct
<400> 282
Met Gln Thr Ala His Gln Arg Pro Pro Thr Glu Gly His Cys Phe Gly
1 5 10 15
Ala Arg Leu Pro Thr Ala Ser Arg Arg Ala Val Arg Arg Ala Trp Ser
20 25 30
Arg Ile Ala Arg Ala Ala Ala Ala Ala Asp Ala Thr Pro Ala Arg Pro
35 40 45
Pro Arg Arg Val Val Val Thr Gly Gln Gly Val Val Thr Ser Leu Gly
50 55 60
Gln Thr Ile Glu Gln Phe Tyr Ser Ser Leu Leu Glu Gly Val Ser Gly
65 70 75 80
Ile Ser Gln Ile Gln Lys Phe Asp Thr Thr Gly Tyr Thr Thr Thr Ile
85 90 95
Ala Gly Glu Ile Lys Ser Leu Gln Leu Asp Pro Tyr Val Pro Lys Arg
100 105 110
Trp Ala Lys Arg Val Asp Asp Val Ile Lys Tyr Val Tyr Ile Ala Gly
115 120 125
Lys Gln Ala Leu Glu Asn Ala Gly Leu Pro Ile Glu Ala Ala Gly Leu
130 135 140
Ala Gly Ala Gly Leu Asp Pro Ala Leu Cys Gly Val Leu Ile Gly Thr
145 150 155 160
Ala Met Ala Gly Met Thr Ser Phe Ala Ala Gly Val Glu Ala Leu Thr
165 170 175
Arg Gly Gly Val Arg Lys Met Asn Pro Phe Cys Ile Pro Phe Ser Ile
180 185 190
Ser Asn Met Gly Gly Ala Met Leu Ala Met Asp Ile Gly Phe Met Gly
195 200 205
Pro Asn Tyr Ser Ile Ser Thr Ala Cys Ala Thr Gly Asn Tyr Cys Ile
210 215 220
Leu Gly Ala Ala Asp His Ile Arg Arg Gly Asp Ala Asp Val Met Leu
225 230 235 240
Ala Gly Gly Ala Asp Ala Ala Ile Ile Pro Ser Gly Ile Gly Gly Phe
245 250 255
Ile Ala Cys Lys Ala Leu Ser Lys Arg Asn Asp Glu Pro Glu Arg Ala
260 265 270
Ser Arg Pro Trp Asp Ala Asp Arg Asp Gly Phe Val Met Gly Glu Gly
275 280 285
Ala Gly Val Leu Val Leu Glu Glu Leu Glu His Ala Lys Arg Arg Gly
290 295 300
Ala Thr Ile Leu Ala Glu Phe Val Gly Gly Ala Ala Thr Ser Asp Ala
305 310 315 320
His His Met Thr Glu Pro Asp Pro Gln Gly Arg Gly Val Arg Leu Cys
325 330 335
Leu Glu Arg Ala Leu Glu Arg Ala Arg Leu Ala Pro Glu Arg Val Gly
340 345 350
Tyr Val Asn Ala His Gly Thr Ser Thr Pro Ala Gly Asp Val Ala Glu
355 360 365
Tyr Arg Ala Ile Arg Ala Val Ile Pro Gln Asp Ser Leu Arg Ile Asn
370 375 380
Ser Thr Lys Ser Met Ile Gly His Leu Leu Gly Gly Ala Gly Ala Val
385 390 395 400
Glu Ala Val Ala Ala Ile Gln Ala Leu Arg Thr Gly Trp Leu His Pro
405 410 415
Asn Leu Asn Leu Glu Asn Pro Ala Pro Gly Val Asp Pro Val Val Leu
420 425 430
Val Gly Pro Arg Lys Glu Arg Ala Glu Asp Leu Asp Val Val Leu Ser
435 440 445
Asn Ser Phe Gly Phe Gly Gly His Asn Ser Cys Val Ile Phe Gln Lys
450 455 460
Tyr Asp Glu
465
<210> 283
<211> 2678
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 283
gctcttcccg caccggctgg ctccacccca acttgaacct cgagaacccc gcgcctggcg 60
tcgaccccgt cgtgctcgtg gggccgcgga aggagcgcgc cgaagacctg gacgtcgtcc 120
tctccaactc ctttggcttt ggcgggcaca attcgtgcgt cggtaccctt tcttgcgcta 180
tgacacttcc agcaaaaggt agggcgggct gcgagacggc ttcccggcgc tgcatgcaac 240
accgatgatg cttcgacccc ccgaagctcc ttcggggctg catgggcgct ccgatgccgc 300
tccagggcga gcgctgttta aatagccagg cccccgattg caaagacatt atagcgagct 360
accaaagcca tattcaaaca cctagatcac taccacttct acacaggcca ctcgagcttg 420
tgatcgcact ccgctaaggg ggcgcctctt cctcttcgtt tcagtcacaa cccgcaaacg 480
gcgcgccatg ctgctgcagg ccttcctgtt cctgctggcc ggcttcgccg ccaagatcag 540
cgcctccatg acgaacgaga cgtccgaccg ccccctggtg cacttcaccc ccaacaaggg 600
ctggatgaac gaccccaacg gcctgtggta cgacgagaag gacgccaagt ggcacctgta 660
cttccagtac aacccgaacg acaccgtctg ggggacgccc ttgttctggg gccacgccac 720
gtccgacgac ctgaccaact gggaggacca gcccatcgcc atcgccccga agcgcaacga 780
ctccggcgcc ttctccggct ccatggtggt ggactacaac aacacctccg gcttcttcaa 840
cgacaccatc gacccgcgcc agcgctgcgt ggccatctgg acctacaaca ccccggagtc 900
cgaggagcag tacatctcct acagcctgga cggcggctac accttcaccg agtaccagaa 960
gaaccccgtg ctggccgcca actccaccca gttccgcgac ccgaaggtct tctggtacga 1020
gccctcccag aagtggatca tgaccgcggc caagtcccag gactacaaga tcgagatcta 1080
ctcctccgac gacctgaagt cctggaagct ggagtccgcg ttcgccaacg agggcttcct 1140
cggctaccag tacgagtgcc ccggcctgat cgaggtcccc accgagcagg accccagcaa 1200
gtcctactgg gtgatgttca tctccatcaa ccccggcgcc ccggccggcg gctccttcaa 1260
ccagtacttc gtcggcagct tcaacggcac ccacttcgag gccttcgaca accagtcccg 1320
cgtggtggac ttcggcaagg actactacgc cctgcagacc ttcttcaaca ccgacccgac 1380
ctacgggagc gccctgggca tcgcgtgggc ctccaactgg gagtactccg ccttcgtgcc 1440
caccaacccc tggcgctcct ccatgtccct cgtgcgcaag ttctccctca acaccgagta 1500
ccaggccaac ccggagacgg agctgatcaa cctgaaggcc gagccgatcc tgaacatcag 1560
caacgccggc ccctggagcc ggttcgccac caacaccacg ttgacgaagg ccaacagcta 1620
caacgtcgac ctgtccaaca gcaccggcac cctggagttc gagctggtgt acgccgtcaa 1680
caccacccag acgatctcca agtccgtgtt cgcggacctc tccctctggt tcaagggcct 1740
ggaggacccc gaggagtacc tccgcatggg cttcgaggtg tccgcgtcct ccttcttcct 1800
ggaccgcggg aacagcaagg tgaagttcgt gaaggagaac ccctacttca ccaaccgcat 1860
gagcgtgaac aaccagccct tcaagagcga gaacgacctg tcctactaca aggtgtacgg 1920
cttgctggac cagaacatcc tggagctgta cttcaacgac ggcgacgtcg tgtccaccaa 1980
cacctacttc atgaccaccg ggaacgccct gggctccgtg aacatgacga cgggggtgga 2040
caacctgttc tacatcgaca agttccaggt gcgcgaggtc aagtgacaat tggcagcagc 2100
agctcggata gtatcgacac actctggacg ctggtcgtgt gatggactgt tgccgccaca 2160
cttgctgcct tgacctgtga atatccctgc cgcttttatc aaacagcctc agtgtgtttg 2220
atcttgtgtg tacgcgcttt tgcgagttgc tagctgcttg tgctatttgc gaataccacc 2280
cccagcatcc ccttccctcg tttcatatcg cttgcatccc aaccgcaact tatctacgct 2340
gtcctgctat ccctcagcgc tgctcctgct cctgctcact gcccctcgca cagccttggt 2400
ttgggctccg cctgtattct cctggtactg caacctgtaa accagcactg caatgctgat 2460
gcacgggaag tagtgggatg ggaacacaaa tggaggatcg tagagctcat cttccgaaag 2520
tacgacgagt gagcgagctg attctctttg agcggggtcg ggtggttcgg ggagagtgcg 2580
cggaaaggcg cagagacgtg cggccggccg tgtccctccg tcttcccctg gttggtgcta 2640
tagtaacctg cctgtgtcgc gtgcgcgtcg ggaagagc 2678
<210> 284
<211> 717
<212> DNA
<213> Ganoderma tsugae
<400> 284
ctccaccaca agaagcacca ccagacctac gtgaacgcgc tcaacgccgc agagcaggcc 60
tacgccaagg ccaccacccc caaggagcgc atcgccctcc agtccgccct caagttcaac 120
ggcggtggtg agtgaatttc gcgaatgtcg gctcaccgcg acgcgattac gaatccgcta 180
actctaacac tttgctgcgg gggatgtgca ggtcacatca accactccct cttctggaag 240
aacctcgccc cagccaagtc tgagggcaag ggaaacggcg gcgccatcaa ggacggcccc 300
ctcaagtcgg cgatcgagca gaactttggt tccgtcgacg tcttcatcaa ggagttcaac 360
gcgaccaccg cgtccatcca gggctccggc tggggctggc tcgtgagtct tctcttctgc 420
gatcggaagg cgcatccggt gttatggtcg cgcgctgcac gcgtgtctcg cttcggctcc 480
gccgtcgaag cgctgatacc gagaccgatc tgctgcaaat catttgcgct gcgatagagc 540
tccgggggct ttaacccttc gttccatgtg ataagaccgc gtctgaccgg gtggtgtttt 600
ctatcgcagg gtctcaaccc ggcgaccaag cgcctcgaga tcacgacgac ggccaaccag 660
gaccctctcc tcacgcacgt ccccatcatc ggcgtcgaca tctgggagca cgcgttc 717
<210> 285
<211> 1561
<212> DNA
<213> Umbellularia californica
<400> 285
agagagagag agagagagag agctaaatta aaaaaaaaac ccagaagtgg gaaatcttcc 60
ccatgaaata acggatcctc ttgctactgc tactactact actacaaact gtagccattt 120
atataattct atataatttt caacatggcc accacctctt tagcttccgc tttctgctcg 180
atgaaagctg taatgttggc tcgtgatggc cggggcatga aacccaggag cagtgatttg 240
cagctgaggg cgggaaatgc gccaacctct ttgaagatga tcaatgggac caagttcagt 300
tacacggaga gcttgaaaag gttgcctgac tggagcatgc tctttgcagt gatcacaacc 360
atcttttcgg ctgctgagaa gcagtggacc aatctagagt ggaagccgaa gccgaagcta 420
ccccagttgc ttgatgacca ttttggactg catgggttag ttttcaggcg cacctttgcc 480
atcagatctt atgaggtggg acctgaccgc tccacatcta tactggctgt tatgaatcac 540
atgcaggagg ctacacttaa tcatgcgaag agtgtgggaa ttctaggaga tggattcggg 600
acgacgctag agatgagtaa gagagatctg atgtgggttg tgagacgcac gcatgttgct 660
gtggaacggt accctacttg gggtgatact gtagaagtag agtgctggat tggtgcatct 720
ggaaataatg gcatgcgacg tgatttcctt gtccgggact gcaaaacagg cgaaattctt 780
acaagatgta ccagcctttc ggtgctgatg aatacaagga caaggaggtt gtccacaatc 840
cctgacgaag ttagagggga gatagggcct gcattcattg ataatgtggc tgtcaaggac 900
gatgaaatta agaaactaca gaagctcaat gacagcactg cagattacat ccaaggaggt 960
ttgactcctc gatggaatga tttggatgtc aatcagcatg tgaacaacct caaatacgtt 1020
gcctgggttt ttgagaccgt cccagactcc atctttgaga gtcatcatat ttccagcttc 1080
actcttgaat acaggagaga gtgcacgagg gatagcgtgc tgcggtccct gaccactgtc 1140
tctggtggct cgtcggaggc tgggttagtg tgcgatcact tgctccagct tgaaggtggg 1200
tctgaggtat tgagggcaag aacagagtgg aggcctaagc ttaccgatag tttcagaggg 1260
attagtgtga tacccgcaga accgagggtg taactaatga aagaagcatc tgttgaagtt 1320
tctcccatgc tgttcgtgag gatacttttt agaagctgca gtttgcattg cttgtgcaga 1380
atcatggtct gtggttttag atgtatataa aaaatagtcc tgtagtcatg aaacttaata 1440
tcagaaaaat aactcaatgg gtcaaggtta tcgaagtagt catttaagct ttgaaatatg 1500
ttttgtattc ctcggcttaa tctgtaagct ctttctcttg caataaagtt cgcctttcaa 1560
t 1561
<210> 286
<211> 417
<212> PRT
<213> Cuphea calophylla
<400> 286
Met Val Ala Ala Glu Ala Ser Ser Ala Leu Phe Ser Val Arg Thr Pro
1 5 10 15
Gly Thr Ser Pro Lys Pro Gly Lys Phe Arg Asn Trp Pro Ser Ser Leu
20 25 30
Ser Val Pro Phe Lys Ser Lys Ser Asn His Asn Gly Gly Phe Gln Val
35 40 45
Lys Ala Asn Ala Ser Ala Arg Pro Lys Ala Asn Gly Ser Ala Val Ser
50 55 60
Leu Lys Ser Gly Ser Leu Asp Thr Gln Glu Asp Thr Ser Ser Ser Ser
65 70 75 80
Ser Pro Pro Arg Thr Phe Ile Asn Gln Leu Pro Asp Trp Ser Met Leu
85 90 95
Leu Ser Ala Ile Thr Thr Val Phe Val Ala Ala Glu Lys Gln Trp Thr
100 105 110
Met Leu Asp Arg Lys Ser Lys Arg Pro Asp Thr Leu Met Asp Pro Phe
115 120 125
Gly Val Asp Arg Val Val Gln Asp Gly Val Val Phe Arg Gln Ser Phe
130 135 140
Ser Ile Arg Ser Tyr Glu Ile Gly Ala Asp Arg Thr Ala Ser Ile Glu
145 150 155 160
Thr Leu Met Asn Ile Phe Gln Glu Thr Ser Leu Asn His Cys Lys Ser
165 170 175
Ile Gly Leu Leu Asn Asp Gly Phe Gly Arg Thr Pro Glu Met Cys Lys
180 185 190
Arg Asp Leu Ile Trp Val Val Thr Lys Met His Ile Glu Val Asn Arg
195 200 205
Tyr Pro Thr Trp Gly Asp Thr Ile Glu Val Asn Thr Trp Val Ser Glu
210 215 220
Ser Gly Lys Thr Gly Met Gly Arg Asp Trp Leu Ile Ser Asp Cys His
225 230 235 240
Thr Gly Glu Ile Leu Ile Arg Ala Thr Ser Val Cys Ala Met Met Asn
245 250 255
Gln Thr Thr Arg Arg Phe Ser Lys Phe Pro Tyr Glu Val Arg Gln Glu
260 265 270
Leu Ala Pro His Phe Val Asp Ser Ala Pro Val Ile Glu Asp Tyr Gln
275 280 285
Lys Leu His Lys Leu Asp Val Lys Thr Gly Asp Ser Ile Cys Asn Gly
290 295 300
Leu Thr Pro Arg Trp Asn Asp Leu Asp Val Asn Gln His Val Asn Asn
305 310 315 320
Val Lys Tyr Ile Gly Trp Ile Leu Glu Ser Val Pro Lys Glu Val Phe
325 330 335
Glu Thr Gln Glu Leu Cys Gly Leu Thr Leu Glu Tyr Arg Arg Glu Cys
340 345 350
Gly Arg Asp Ser Val Leu Lys Ser Val Thr Ala Met Asp Pro Ser Lys
355 360 365
Glu Gly Asp Arg Ser Leu Tyr Gln His Leu Leu Arg Leu Glu Asp Gly
370 375 380
Thr Asp Ile Ala Lys Gly Arg Thr Lys Trp Arg Pro Lys Asn Ala Gly
385 390 395 400
Thr Asn Gly Ala Ile Ser Thr Gly Lys Thr Ser Asn Gly Asn Ser Ile
405 410 415
Ser
<210> 287
<211> 378
<212> PRT
<213> Ulmus americana
<220>
<221> misc_feature
<222> (265)..(265)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (374)..(374)
<223> Xaa can be any naturally occurring amino acid
<400> 287
Gly Ser Gly Ala Leu Gln Val Lys Ala Ser Ser Gln Ala Pro Pro Lys
1 5 10 15
Leu Asn Gly Ser Asn Val Gly Leu Val Lys Ser Ser Gln Ile Val Lys
20 25 30
Lys Gly Asp Asp Thr Thr Ser Pro Pro Ala Arg Thr Phe Ile Asn Gln
35 40 45
Leu Pro Asp Trp Ser Met Leu Leu Ala Ala Ile Thr Thr Leu Phe Leu
50 55 60
Ala Ala Glu Lys Gln Trp Met Met Leu Asp Trp Lys Pro Lys Arg Pro
65 70 75 80
Asp Met Leu Val Asp Pro Phe Gly Leu Gly Arg Phe Val Gln Asp Gly
85 90 95
Leu Val Phe Arg Asn Asn Phe Ser Ile Arg Ser Tyr Glu Ile Gly Ala
100 105 110
Asp Arg Thr Ala Ser Ile Glu Thr Leu Met Asn His Leu Gln Glu Thr
115 120 125
Ala Leu Asn His Val Lys Ser Val Gly Leu Leu Glu Asp Gly Leu Gly
130 135 140
Ser Thr Arg Glu Met Ser Leu Arg Asn Leu Ile Trp Val Val Thr Lys
145 150 155 160
Met Gln Val Ala Val Asp Arg Tyr Pro Thr Trp Gly Asp Glu Val Gln
165 170 175
Val Ser Ser Trp Ala Thr Ala Ile Gly Lys Asn Gly Met Arg Arg Glu
180 185 190
Trp Ile Val Thr Asp Phe Arg Thr Gly Glu Thr Leu Leu Arg Ala Thr
195 200 205
Ser Val Trp Val Met Met Asn Lys Leu Thr Arg Arg Ile Ser Lys Ile
210 215 220
Pro Glu Glu Val Trp His Glu Ile Gly Pro Ser Phe Ile Asp Ala Pro
225 230 235 240
Pro Leu Pro Thr Val Glu Asp Asp Gly Arg Lys Leu Thr Arg Phe Asp
245 250 255
Glu Ser Ser Ala Asp Phe Ile Arg Xaa Gly Leu Thr Pro Arg Trp Ser
260 265 270
Asp Leu Asp Ile Asn Gln His Val Asn Asn Val Lys Tyr Ile Gly Trp
275 280 285
Leu Leu Glu Ser Ala Pro Pro Glu Ile His Glu Ser His Glu Ile Ala
290 295 300
Ser Leu Thr Leu Glu Tyr Arg Arg Glu Cys Gly Arg Asp Ser Val Leu
305 310 315 320
Asn Ser Ala Thr Lys Val Ser Asp Ser Ser Gln Leu Gly Lys Ser Ala
325 330 335
Val Glu Cys Asn His Leu Val Arg Leu Gln Asn Gly Gly Glu Ile Val
340 345 350
Lys Gly Arg Thr Val Trp Arg Pro Lys Arg Pro Leu Tyr Asn Asp Gly
355 360 365
Ala Val Val Asp Val Xaa Ala Lys Thr Ser
370 375
Claims (69)
- 프로토테카(Prototheca) 속의 재조합 미세조류로부터 수득된 미세조류 트라이글라이세라이드 오일 조성물로서, 여기서 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0을 가지는 적어도 40% 포화된 지방산을 포함하고, 상기 오일은 상기 재조합 미세조류의 스테롤을 추가로 포함하며, 상기 재조합 미세조류는 조작되지 않은 미세조류에 비해 낮은 수준 또는 높은 수준에서 적어도 하나의 지질 경로 효소를 발현하도록 유전적으로 조작되고, 상기 지질 경로 효소는 불포화효소, 케토아실 신타제 및 아실-ACP 티오에스터라제로 이루어진 군으로부터 선택되고, 상기 오일의 지방산 프로파일은 적어도 4% C10:0, 적어도 10% C12:0, 또는 적어도 10% C14:0을 포함하고,
상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 낮은 수준에서 발현되는 내인성 지질 경로 효소이거나, 또는
상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 높은 수준에서 발현되는 외인성 지질 경로 효소인, 미세조류 트라이글라이세라이드 오일 조성물. - 삭제
- 삭제
- 제1항에 있어서, 상기 불포화효소는 스테아로일-ACP 불포화효소 또는 지방 아실 불포화효소인, 미세조류 트라이글라이세라이드 오일 조성물.
- 제1항에 있어서, 상기 오일의 지방산 프로파일은 적어도 70% 포화된 지방산을 포함하는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
- 제1항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii), 쿠페아 칼로필라(Cuphea callophylla), 및 미국 느릅나무(Ulmus americana)로 이루어진 군으로부터 선택된 종 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0의 전체 조합량을 적어도 50% 포함하는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
- 제1항에 있어서, 상기 재조합 미세조류가 캘리포니아 월계수(Umbellularia californica) 및 녹나무(Cinnamomum camphora) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함하거나; 또는 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 유래의 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자 및 케토 아실-ACP 신타제를 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 적어도 5:1의 C12:0 : C14:0 지방산의 비를 가지는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
- 제1항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 또는 쿠페아 칼로필라(Cuphea callophylla) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 50% 이상의 C12:0-C14:0 수준을 가지는 것인, 미세조류 트라이글라이세라이드 오일 조성물.
- 제1항, 및 제4항 내지 제8항 중 어느 한 항에 있어서, 상기 미세조류 오일은 프로토테카 모리포미스(Prototheca moriformis) 오일인, 미세조류 트라이글라이세라이드 오일 조성물.
- 제1항, 및 제4항 내지 제8항 중 어느 한 항의 오일 조성물을 생성하는 재조합 미세조류 세포.
- a) 프로토테카(Prototheca) 속의 재조합 미세조류를 배양하는 단계로서, 여기서 상기 재조합 미세조류는 조작되지 않은 미세조류에 비해 낮은 수준 또는 높은 수준에서 적어도 하나의 지질 경로 효소를 발현하도록 유전적으로 조작되고, 상기 지질 경로 효소는 불포화효소, 케토아실 신타제 및 아실-ACP 티오에스터라제로 이루어진 군으로부터 선택되는 것인 단계; 및
b) 트라이글라이세라이드 오일 조성물을 분리하는 단계를 포함하고,
여기서 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0을 가지는 적어도 40% 포화된 지방산을 포함하고, 상기 오일은 상기 재조합 미세조류의 스테롤을 추가로 포함하고,
상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 낮은 수준에서 발현되는 내인성 지질 경로 효소이거나, 또는
상기 적어도 하나의 지질 경로 효소는 조작되지 않은 미세조류에 비해 높은 수준에서 발현되는 외인성 지질 경로 효소인, 트라이글라이세라이드 오일 조성물의 생성방법. - 삭제
- 삭제
- 제11항에 있어서, 상기 불포화효소는 스테아로일-ACP 불포화효소 또는 지방 아실 불포화효소인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 70% 포화된 지방산을 포함하는 것인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 4% C10:0을 포함하는 것인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 10% C12:0을 포함하는 것인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 오일의 지방산 프로파일은 적어도 10% C14:0을 포함하는 것인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii), 쿠페아 칼로필라(Cuphea callophylla), 및 미국 느릅나무(Ulmus americana)로 이루어진 군으로부터 선택된 종 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일의 지방산 프로파일은 C10:0, C12:0 및 C14:0의 전체 조합량을 적어도 50% 포함하는 것인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 재조합 미세조류가 캘리포니아 월계수(Umbellularia californica) 및 녹나무(Cinnamomum camphora) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 적어도 2개의 외인성 유전자를 포함하거나; 또는 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 유래의 아실-ACP 티오에스터라제를 암호화하는 외인성 유전자 및 케토 아실-ACP 신타제를 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 적어도 5:1의 C12:0 : C14:0 지방산의 비를 가지는 것인, 오일 조성물의 생성방법.
- 제11항에 있어서, 상기 재조합 미세조류가 쿠페아 라이티(Cuphea wrightii) 또는 쿠페아 칼로필라(Cuphea callophylla) 유래의 아실-ACP 티오에스터라제 단백질을 암호화하는 외인성 유전자를 포함할 때, 상기 오일은 50% 이상의 C12:0-C14:0 수준을 가지는 것인, 오일 조성물의 생성방법.
- 제11항, 및 제14항 내지 제21항 중 어느 한 항에 있어서, 상기 미세조류 오일은 프로토테카 모리포미스 오일인, 오일 조성물의 생성방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US34977410P | 2010-05-28 | 2010-05-28 | |
US61/349,774 | 2010-05-28 | ||
US37499210P | 2010-08-18 | 2010-08-18 | |
US61/374,992 | 2010-08-18 | ||
US41439310P | 2010-11-16 | 2010-11-16 | |
US61/414,393 | 2010-11-16 | ||
US201061428192P | 2010-12-29 | 2010-12-29 | |
US61/428,192 | 2010-12-29 | ||
PCT/US2011/038463 WO2011150410A2 (en) | 2010-05-28 | 2011-05-27 | Tailored oils produced from recombinant heterotrophic microorganisms |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127034232A Division KR101916421B1 (ko) | 2010-05-28 | 2011-05-27 | 종속영양 미생물유기체로부터 생성된 맞춤 오일 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180122486A KR20180122486A (ko) | 2018-11-12 |
KR102148462B1 true KR102148462B1 (ko) | 2020-08-26 |
Family
ID=45004441
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127034232A KR101916421B1 (ko) | 2010-05-28 | 2011-05-27 | 종속영양 미생물유기체로부터 생성된 맞춤 오일 |
KR1020187031842A KR102148462B1 (ko) | 2010-05-28 | 2011-05-27 | 종속영양 미생물유기체로부터 생성된 맞춤 오일 |
KR1020127034225A KR101899938B1 (ko) | 2010-05-28 | 2011-05-27 | 맞춤 오일을 포함하는 식품 조성물 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127034232A KR101916421B1 (ko) | 2010-05-28 | 2011-05-27 | 종속영양 미생물유기체로부터 생성된 맞춤 오일 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127034225A KR101899938B1 (ko) | 2010-05-28 | 2011-05-27 | 맞춤 오일을 포함하는 식품 조성물 |
Country Status (13)
Country | Link |
---|---|
US (10) | US8592188B2 (ko) |
EP (2) | EP2576800B1 (ko) |
JP (6) | JP5868962B2 (ko) |
KR (3) | KR101916421B1 (ko) |
CN (4) | CN103097540A (ko) |
AU (4) | AU2011257982B2 (ko) |
BR (2) | BR112012030329A2 (ko) |
CA (3) | CA2801024A1 (ko) |
ES (2) | ES2718489T3 (ko) |
MX (3) | MX339639B (ko) |
SG (4) | SG10201504197SA (ko) |
WO (2) | WO2011150410A2 (ko) |
ZA (2) | ZA201209186B (ko) |
Families Citing this family (137)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040077604A1 (en) | 2001-12-19 | 2004-04-22 | Lenard Lichtenberger | Method and compositions employing formulations of lecithin oils and nsaids for protecting the gastrointestinal tract and providingenhanced therapeutic activity |
AU2008259834B2 (en) | 2007-06-01 | 2013-08-01 | Corbion Biotech, Inc. | Production of oil in microorganisms |
US20100303990A1 (en) * | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | High Protein and High Fiber Algal Food Materials |
US20100303961A1 (en) * | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Methods of Inducing Satiety |
US20100297296A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Healthier Baked Goods Containing Microalgae |
US20100297323A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Gluten-free Foods Containing Microalgae |
US20100297295A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Microalgae-Based Beverages |
US20100303957A1 (en) * | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Edible Oil and Processes for Its Production from Microalgae |
US20100297331A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Reduced Fat Foods Containing High-Lipid Microalgae with Improved Sensory Properties |
US20100297325A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Egg Products Containing Microalgae |
US20100297292A1 (en) * | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Reduced Pigmentation Microalgae Strains and Products Therefrom |
ES2583639T3 (es) | 2008-11-28 | 2016-09-21 | Terravia Holdings, Inc. | Producción de aceites específicos en microorganismos heterótrofos |
JP5868962B2 (ja) | 2010-05-28 | 2016-02-24 | ソラザイム, インコーポレイテッドSolazyme Inc | 組み換え従属栄養性微生物から産生された用途に応じた油 |
US8637689B2 (en) | 2010-08-31 | 2014-01-28 | Biosynthetic Technologies, Llc | Catalytic processes for preparing estolide base oils |
US9382489B2 (en) | 2010-10-29 | 2016-07-05 | Inaeris Technologies, Llc | Renewable heating fuel oil |
US9447350B2 (en) | 2010-10-29 | 2016-09-20 | Inaeris Technologies, Llc | Production of renewable bio-distillate |
EP3521408B1 (en) | 2010-11-03 | 2021-12-22 | Corbion Biotech, Inc. | Genetically-engineered chlorella or prototheca microbe and oil produced therefrom |
US20140290127A1 (en) * | 2010-12-30 | 2014-10-02 | BP Corporate North America Inc. | Derivation and conversion of natural oilswith chemical compositions for hydroprocessing to transport fuels |
ES2386474B1 (es) | 2011-01-21 | 2013-07-09 | Norel, Sa | Aditivos para alimentación animal. |
KR101964965B1 (ko) | 2011-02-02 | 2019-04-03 | 테라비아 홀딩스 인코포레이티드 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
US9315739B2 (en) * | 2011-08-18 | 2016-04-19 | Kior, Llc | Process for upgrading biomass derived products |
BR112013023613A2 (pt) | 2011-03-17 | 2017-09-19 | Solazyme Inc | método de gaseificação, método de conversão da biomassa de um micróbio oleaginoso, composição torrificada combustível, e, combustível combinado |
GB201104761D0 (en) * | 2011-03-21 | 2011-05-04 | Univ United Arab Emirates | Biodiesel production |
MX339607B (es) | 2011-05-06 | 2016-05-31 | Solazyme Inc | Microorganismos geneticamente modificados que metabolizan xilosa. |
MY191912A (en) | 2011-06-17 | 2022-07-18 | Biosynthetic Technologies Llc | Estolide compositions exhibiting high oxidative stability |
WO2012173674A1 (en) * | 2011-06-17 | 2012-12-20 | Lubrigreen Biosynthetics, Llc | Dielectric fluids comprising estolide compounds and methods of making and using the same |
EP2702124A1 (en) | 2011-06-17 | 2014-03-05 | Biosynthetic Technologies, LLC | Compositions comprising estolide compounds and methods of making and using the same |
US8951762B2 (en) | 2011-07-27 | 2015-02-10 | Iowa State University Research Foundation, Inc. | Materials and methods for using an acyl—acyl carrier protein thioesterase and mutants and chimeras thereof in fatty acid synthesis |
US9399768B2 (en) | 2011-07-27 | 2016-07-26 | Iowa State University Research Foundation, Inc. | Materials and methods for using an acyl-acyl carrier protein thioesterase and mutants and chimeras thereof in fatty acid synthesis |
US10427069B2 (en) | 2011-08-18 | 2019-10-01 | Inaeris Technologies, Llc | Process for upgrading biomass derived products using liquid-liquid extraction |
BR112014012917A2 (pt) | 2011-11-28 | 2017-06-13 | Solazyme Inc | ácido nucleico recombinante, cassete de expressão, célula, método para obter óleo microbiano, e, óleo microbiano |
US9011733B2 (en) * | 2011-12-21 | 2015-04-21 | Joan Lynch | Dielectric fluids compositions and methods |
SG11201403419SA (en) | 2011-12-23 | 2014-07-30 | Solazyme Inc | Algal thermoplastics, thermosets, paper, adsorbants and absorbants |
US9163267B2 (en) * | 2012-04-11 | 2015-10-20 | REG Life Sciences, LLC | Metathesis transformations of microbially-produced fatty acids and fatty acid derivatives |
US9719114B2 (en) | 2012-04-18 | 2017-08-01 | Terravia Holdings, Inc. | Tailored oils |
BR112014025719A8 (pt) | 2012-04-18 | 2017-10-03 | Solazyme Inc | Óleos customizados |
US8686198B2 (en) | 2012-05-18 | 2014-04-01 | Uop Llc | Integrated hydrolysis/hydroprocessing process for converting feedstocks containing renewable glycerides to paraffins and polyols |
KR102107261B1 (ko) | 2012-06-18 | 2020-05-06 | 바이오신세틱 테크놀로지스 엘엘씨 | 술포네이트 잔기를 제거하는 것을 포함하는 에스톨라이드 화합물의 제조 방법 |
US9382491B2 (en) | 2012-07-03 | 2016-07-05 | Sartec Corporation | Hydrocarbon synthesis methods, apparatus, and systems |
US9388345B2 (en) | 2012-07-03 | 2016-07-12 | Sartec Corporation | Hydrocarbon synthesis methods, apparatus, and systems |
UA118090C2 (uk) | 2012-09-07 | 2018-11-26 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив |
WO2014074772A1 (en) | 2012-11-09 | 2014-05-15 | Heliae Development, Llc | Mixotrophic, phototrophic, and heterotrophic combination methods and systems |
WO2014074770A2 (en) | 2012-11-09 | 2014-05-15 | Heliae Development, Llc | Balanced mixotrophy methods |
US8580119B1 (en) * | 2012-11-27 | 2013-11-12 | Menlo Energy Management, LLC | Transesterification of biodiesel feedstock with solid heterogeneous catalyst |
US8540881B1 (en) * | 2012-11-27 | 2013-09-24 | Menlo Energy Management, LLC | Pretreatment, esterification, and transesterification of biodiesel feedstock |
US8545703B1 (en) * | 2012-11-27 | 2013-10-01 | Menlo Energy Management, LLC | Production of glycerin from feedstock |
WO2014089514A1 (en) | 2012-12-07 | 2014-06-12 | Solazyme, Inc. | Genetically engineered microbial strains including chlorella protothecoides lipid pathway genes |
AU2013367325B2 (en) | 2012-12-27 | 2019-12-19 | Kao Corporation | Acyl-ACP thioesterase |
KR101575208B1 (ko) | 2013-01-09 | 2015-12-07 | 한국생명공학연구원 | 북극 해양에서 분리한 전분 및 지질 고생산 미세조류 클로렐라 세포주 및 이의 용도 |
US10098371B2 (en) | 2013-01-28 | 2018-10-16 | Solazyme Roquette Nutritionals, LLC | Microalgal flour |
US9816079B2 (en) | 2013-01-29 | 2017-11-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
US9567615B2 (en) | 2013-01-29 | 2017-02-14 | Terravia Holdings, Inc. | Variant thioesterases and methods of use |
CA2903494A1 (en) * | 2013-03-08 | 2014-09-12 | Solazyme, Inc. | Oleaginous microbial lubricants |
US9783836B2 (en) * | 2013-03-15 | 2017-10-10 | Terravia Holdings, Inc. | Thioesterases and cells for production of tailored oils |
US9290749B2 (en) | 2013-03-15 | 2016-03-22 | Solazyme, Inc. | Thioesterases and cells for production of tailored oils |
US9493640B2 (en) | 2013-03-15 | 2016-11-15 | Terravia Holdings, Inc. | Wood plastic and thermoplastic composites |
CA2904395A1 (en) | 2013-03-15 | 2014-09-25 | Solazyme, Inc. | Thioesterases and cells for production of tailored oils |
EP2777400A1 (en) * | 2013-03-15 | 2014-09-17 | Roquette Freres | Microalgal flour granules and process for preparation thereof |
EP2993993A2 (en) | 2013-04-26 | 2016-03-16 | Solazyme, Inc. | Low polyunsaturated fatty acid oils and uses thereof |
US9079814B2 (en) | 2013-06-10 | 2015-07-14 | Uop Llc | Linear alkylbenzenes from natural oils and methods of producing |
US9080134B2 (en) | 2013-06-10 | 2015-07-14 | Uop Llc | Linear alkylbenzenes from natural oils and methods of producing |
US9079811B2 (en) | 2013-06-10 | 2015-07-14 | Uop Llc | Linear alkylbenzenes from natural oils and methods of producing |
FR3007625B1 (fr) * | 2013-06-26 | 2015-07-17 | Roquette Freres | Procede de production de biomasse de microalgues de qualite sensorielle optimisee |
BR112016000553A2 (pt) | 2013-07-12 | 2018-05-29 | Kao Corporation | acil-acp tioesterase |
FR3008581B1 (fr) | 2013-07-19 | 2016-11-04 | Roquette Freres | Farine de microalgues riches en lipides et procede de preparation |
FR3009619B1 (fr) | 2013-08-07 | 2017-12-29 | Roquette Freres | Compositions de biomasse de microalgues riches en proteines de qualite sensorielle optimisee |
MX368472B (es) * | 2013-08-23 | 2019-10-03 | Corbion Biotech Inc | Método para la producción industrial de harina de biomasa de microalgas ricas en lípidos sin mal sabor al controlar la disponibilidad del oxígeno. |
MX369685B (es) | 2013-10-04 | 2019-11-19 | Terravia Holdings Inc | Aceites adaptables. |
DK3082459T3 (en) | 2013-11-29 | 2019-04-23 | Corbion Biotech Inc | GRANULATES OF MICROALGE BIOMASS MULTIPLE PROTEIN AND METHOD OF PRODUCING THEREOF |
US20160326551A1 (en) * | 2013-12-31 | 2016-11-10 | Butamax Advanced Biofuels Llc | Isobutanol tolerance in yeast with an altered lipid profile |
US9752165B2 (en) * | 2014-02-10 | 2017-09-05 | Cellulosic Ethanol Technologies, Llc | Processes and systems for recovering oil from fermentation products |
US9394550B2 (en) | 2014-03-28 | 2016-07-19 | Terravia Holdings, Inc. | Lauric ester compositions |
WO2015164550A1 (en) | 2014-04-23 | 2015-10-29 | Solazyme, Inc. | Food-related uses of high-stability oil |
WO2015171472A1 (en) * | 2014-05-06 | 2015-11-12 | Monsanto Technology Llc | Utilization of transgenic high oleic soybean oil in industrial applications |
US20150320086A1 (en) | 2014-05-07 | 2015-11-12 | Solazyme, Inc. | Microalgae Meal |
KR101447976B1 (ko) * | 2014-05-10 | 2014-10-14 | 박승민 | 오일을 포함한 앨지매스와 천연오일 및 그 오일슬러지를 포함하는 고체연료 및 이의 제조방법 |
KR101445253B1 (ko) * | 2014-05-10 | 2014-10-01 | 알펫 주식회사 | 오일을 함유한 앨지매스를 미분화한 고체연료 |
KR101445254B1 (ko) * | 2014-05-10 | 2014-10-02 | 알펫 주식회사 | 오일을 포함한 앨지매스와 연료첨가제를 포함하는 고체연료 및 이의 제조 방법 |
RU2558448C1 (ru) * | 2014-06-03 | 2015-08-10 | Федеральное Государственное бюджетное образовательное учреждение высшего профессионального образования "Воронежский государственный университет инженерных технологий" ("ВГУИТ") | Способ получения растительного масла и белкового продукта из смеси семян подсолнечника, льна и расторопши |
WO2015191449A2 (en) | 2014-06-08 | 2015-12-17 | Solazyme, Inc. | Personal care products containing microalgae or extracts thereof |
CN106604990B (zh) | 2014-06-16 | 2022-04-05 | 基因组股份公司 | 具有改进的特性的ω-羟化酶相关的融合多肽 |
US10550412B2 (en) | 2014-06-20 | 2020-02-04 | Kao Corporation | Method of producing lipid |
WO2015196134A1 (en) | 2014-06-20 | 2015-12-23 | Solazyme, Inc. | Wood composites |
JP6332855B2 (ja) * | 2014-06-23 | 2018-05-30 | 花王株式会社 | アシル−acpチオエステラーゼを用いた脂質の製造方法 |
US20160002521A1 (en) | 2014-07-03 | 2016-01-07 | Solazyme, Inc. | Lubricants and wellbore fluids |
US9969990B2 (en) | 2014-07-10 | 2018-05-15 | Corbion Biotech, Inc. | Ketoacyl ACP synthase genes and uses thereof |
US10676763B2 (en) | 2014-07-18 | 2020-06-09 | Genomatica, Inc. | Microbial production of fatty diols |
CN107087416A (zh) | 2014-07-24 | 2017-08-22 | 泰拉瑞亚控股公司 | 变体硫酯酶及使用方法 |
BR112017005370A2 (pt) | 2014-09-18 | 2017-12-12 | Terravia Holdings Inc | acil-acp tioesterases e mutantes das mesmas |
US20160176800A1 (en) * | 2014-12-17 | 2016-06-23 | Solazyme, Inc. | Microalgal Derived Cleaners and Surfactants |
EP4047049A1 (en) | 2014-12-23 | 2022-08-24 | Bridgestone Americas Tire Operations, LLC | Oil-containing rubber compositions and related methods |
JP2018509516A (ja) | 2015-03-24 | 2018-04-05 | テラヴィア ホールディングス, インコーポレイテッド | 微細藻類組成物およびその使用 |
EP3277793A1 (en) | 2015-03-31 | 2018-02-07 | TerraVia Holdings, Inc. | Microalgae adapted for heterotrophic culture conditions |
JP2018512851A (ja) | 2015-04-06 | 2018-05-24 | テラヴィア ホールディングス, インコーポレイテッド | Lpaatアブレーションを有する油産生微細藻類 |
WO2017101987A1 (en) | 2015-12-15 | 2017-06-22 | REG Life Sciences, LLC | Omega-hydroxylase-related fusion polypeptide variants with improved properties |
CN105671106B (zh) * | 2016-02-16 | 2021-06-11 | 珀莱雅化妆品股份有限公司 | 一种采用橄榄油发酵法制备鞘糖脂的方法 |
US10377792B2 (en) * | 2016-03-16 | 2019-08-13 | The Texas A&M University System | Moisture displacement and simultaneous migration of surface-functionalized algae from water to an extraction solvent using ionic polyelectrolytes |
US20180066288A1 (en) | 2016-08-05 | 2018-03-08 | Kuehnle Agrosystems, Inc. | Producing and altering microbial fermentation products using non-commonly used lignocellulosic hydrolysates |
CN109809840B (zh) * | 2016-08-28 | 2021-08-20 | 刘明 | 一种城市垃圾处理方法 |
US10650621B1 (en) | 2016-09-13 | 2020-05-12 | Iocurrents, Inc. | Interfacing with a vehicular controller area network |
US20180142218A1 (en) | 2016-10-05 | 2018-05-24 | Terravia Holdings, Inc. | Novel acyltransferases, variant thioesterases, and uses thereof |
US10239812B2 (en) | 2017-04-27 | 2019-03-26 | Sartec Corporation | Systems and methods for synthesis of phenolics and ketones |
US10704066B2 (en) | 2017-05-05 | 2020-07-07 | Purissima, Inc. | Neurotransmitters and methods of making the same |
US11306300B2 (en) * | 2017-05-11 | 2022-04-19 | Kansai Chemical Engineering Co., Ltd. | Microorganism capable of displaying α-galactosidase on surface layer thereof, and use thereof |
FR3077299B1 (fr) * | 2018-02-01 | 2020-10-30 | Tropical Essence Sdn Bhd | Additif pour huile a base de triglycerides |
US10696923B2 (en) | 2018-02-07 | 2020-06-30 | Sartec Corporation | Methods and apparatus for producing alkyl esters from lipid feed stocks, alcohol feedstocks, and acids |
US10544381B2 (en) | 2018-02-07 | 2020-01-28 | Sartec Corporation | Methods and apparatus for producing alkyl esters from a reaction mixture containing acidified soap stock, alcohol feedstock, and acid |
CN111971379A (zh) * | 2018-02-28 | 2020-11-20 | 嘉吉公司 | 葡糖淀粉酶工程化酵母和发酵方法 |
CA3103083A1 (en) * | 2018-06-08 | 2019-12-12 | Mizkan Holdings Co., Ltd. | Fat/oil composition containing fine particle composite and method for producing same |
JP7053401B2 (ja) * | 2018-08-06 | 2022-04-12 | 株式会社デンソー | 新規環化物及び新規環化物の製造方法 |
US11618890B2 (en) | 2018-08-22 | 2023-04-04 | Corbion Biotech, Inc. | Beta-ketoacyl-ACP synthase II variants |
CN112955563A (zh) | 2018-08-30 | 2021-06-11 | 格纹蛱蝶公司 | 加氢甲酰基化甘油三酯及其用途 |
CN109456905B (zh) * | 2018-12-07 | 2020-11-06 | 扬州大学 | 一株促进微藻利用蔗糖的隐球酵母及其应用 |
CA3121547A1 (en) * | 2019-01-11 | 2020-07-16 | Societe Des Produits Nestle S.A. | Process for an instant oil fried noodle |
WO2020167745A1 (en) | 2019-02-11 | 2020-08-20 | Checkerspot, Inc. | Triglyceride oil compositions |
CN113614238A (zh) | 2019-03-28 | 2021-11-05 | 公益财团法人实验动物中央研究所 | 免疫缺陷小鼠 |
WO2020207843A1 (en) * | 2019-04-12 | 2020-10-15 | Unilever N.V. | Oil-in-water emulsified food composition with high oleic oil |
US11149290B2 (en) * | 2019-05-16 | 2021-10-19 | Purdue Research Foundation | Virus-assisted algal cell disruption for cost-effective biofuel production |
CN112553182B (zh) * | 2019-09-25 | 2022-01-25 | 东莞泛亚太生物科技有限公司 | 具提升活性的α-半乳糖苷酶 |
CN110643582B (zh) * | 2019-09-29 | 2021-07-27 | 浙江工业大学 | 一种从沙棘鲜果中提取sod的方法 |
BR112022009803A2 (pt) | 2019-11-20 | 2022-08-16 | Corbion Biotech Inc | Variantes de sacarose invertase |
WO2021127181A1 (en) | 2019-12-18 | 2021-06-24 | Checkerspot, Inc. | Uses of microbially derived materials in polymer applications |
WO2021146520A1 (en) | 2020-01-16 | 2021-07-22 | Corbion Biotech, Inc. | β-KETOACYL-ACP SYNTHASE IV VARIANTS |
KR20230004502A (ko) * | 2020-03-20 | 2023-01-06 | 옥시 로우 카본 벤쳐스, 엘엘씨 | 이산화탄소를 이용한 에틸렌 제조방법 |
CN111718968B (zh) * | 2020-08-04 | 2023-04-07 | 山东理工大学 | 一种提高卷枝毛霉wj11中链脂肪酸产量的方法 |
CN112387250B (zh) * | 2020-10-21 | 2022-05-20 | 广西大学 | 一种类印迹mof吸附剂及其制备方法与应用 |
US20220154229A1 (en) * | 2020-11-05 | 2022-05-19 | Phycoil Biotechnology International, Inc. | Production of lipids and terpenoids in auxenochlorella protothecoides |
WO2022178302A1 (en) * | 2021-02-18 | 2022-08-25 | Zero Acre Farms Inc. | Systems and methods of making oil from microorganisms |
WO2023043945A2 (en) | 2021-09-17 | 2023-03-23 | Checkerspot, Inc. | High oleic oil compositions and uses thereof |
CN113717919B (zh) * | 2021-09-18 | 2023-04-11 | 四川大学 | 一种促进微藻积累β-葡聚糖的方法 |
WO2023096858A1 (en) | 2021-11-23 | 2023-06-01 | Senda Biosciences, Inc. | A bacteria-derived lipid composition and use thereof |
WO2023102069A1 (en) | 2021-12-01 | 2023-06-08 | Checkerspot, Inc. | Polyols, polyurethane dispersions, and uses thereof |
WO2023133417A2 (en) * | 2022-01-05 | 2023-07-13 | Change Foods, Inc. | Dairy-like compositions |
KR20230115735A (ko) * | 2022-01-27 | 2023-08-03 | 씨제이제일제당 (주) | 냉각 공정을 이용한 오일 회수율이 향상된 바이오오일 추출 방법 |
SE2250075A1 (en) * | 2022-01-28 | 2023-07-29 | Mycorena Ab | Fungi-based fat tissue |
WO2024020359A1 (en) * | 2022-07-22 | 2024-01-25 | Pioneer Hi-Bred International, Inc. | Brassica plants with mutant fata2-14 alleles yielding oils with a low total saturated fatty acid content |
WO2024064684A1 (en) * | 2022-09-19 | 2024-03-28 | Zero Acre Farms Inc. | Food compositions for consumption |
Family Cites Families (398)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2235056A (en) | 1938-03-04 | 1941-03-18 | Ici Ltd | Process for the recovery of glycerol from still residues from fermentation processes |
US2383602A (en) | 1943-03-04 | 1945-08-28 | Colgate Palmolive Peet Co | Process for treatment of fatty glycerides |
US2967700A (en) | 1955-03-01 | 1961-01-10 | Morris B Kallison | Whipping and aerating apparatus |
US2874171A (en) | 1957-02-20 | 1959-02-17 | Upjohn Co | Recovery of ergosterol |
US3142135A (en) | 1962-02-13 | 1964-07-28 | Grain Processing Corp | Production of carotenoids by the cultivation of algae |
US3280502A (en) | 1962-11-07 | 1966-10-25 | Hoffmann La Roche | Process for the preparation of lutein |
US3320693A (en) | 1964-09-11 | 1967-05-23 | Kk | Method of industral cultivation of unicellular green algae such as chlorella |
US3475274A (en) | 1967-08-07 | 1969-10-28 | Commercial Solvents Corp | Production of riboflavin |
US3962466A (en) | 1972-11-10 | 1976-06-08 | Dai-Nippon Sugar Manufacturing Co., Ltd. | Method for treatment of microorganisms |
US4049724A (en) | 1973-11-20 | 1977-09-20 | Atlantic Richfield Company | Osmium catalyzed organic hydroperoxide hydroxylation of olefinic compounds |
JPS5328989B2 (ko) | 1974-05-27 | 1978-08-17 | ||
US4005062A (en) | 1974-08-16 | 1977-01-25 | Standard Oil Company (Indiana) | Process of preparing water-soluble whippable extract from microorganism protein material |
US3957578A (en) | 1975-01-03 | 1976-05-18 | Hokkaido Sugar Co., Ltd. | Method for manufacture of α-galactosidase by microorganism |
US4103039A (en) | 1976-08-18 | 1978-07-25 | Fuji Oil Company, Limited | Method for producing improved shea fat |
FR2375319A1 (fr) | 1976-12-23 | 1978-07-21 | British Petroleum Co | Procede de traitement d'extraits lipidiques |
US4182777A (en) | 1977-03-01 | 1980-01-08 | Standard Oil Company (Indiana) | Co-dried yeast whey food product and process |
US4140805A (en) | 1977-03-11 | 1979-02-20 | Edwards George W | Process of producing useful materials from plants |
US4288378A (en) | 1979-05-23 | 1981-09-08 | The Procter & Gamble Company | Method of preparing an enriched peanut oil peanut butter stabilizer |
IL57712A (en) | 1979-07-03 | 1984-02-29 | Yissum Res Dev Co | Cultivation of halophilic algae of the dunaliella species for the production of fuel-like product |
US4273790A (en) * | 1979-11-19 | 1981-06-16 | Standard Brands Incorporated | Low-fat liquid spread and process |
US4335156A (en) | 1980-09-19 | 1982-06-15 | Nabisco Brands, Inc. | Edible fat product |
US4373434A (en) | 1980-11-24 | 1983-02-15 | Simon-Rosedowns Limited | Apparatus for the expansion of oil bearing seeds |
JPS57150379A (en) | 1981-03-14 | 1982-09-17 | Kikujiro Ishiwatari | Crushing of cell membrane of chlorella |
US4390561A (en) | 1981-11-04 | 1983-06-28 | The Procter & Gamble Company | Margarine oil product |
US4584139A (en) | 1983-01-31 | 1986-04-22 | Olin Corporation | Hydrogenation of long chain olefinic oils with Raney catalyst |
JPS606799A (ja) | 1983-06-07 | 1985-01-14 | 北畠 三之丞 | 汚れ落しに効果を発揮する米糠を原料とする洗剤の製法 |
DK402583D0 (da) | 1983-09-05 | 1983-09-05 | Novo Industri As | Fremgangsmade til fremstilling af et immobiliseret lipasepraeparat og anvendelse deraf |
US4519845A (en) | 1984-02-09 | 1985-05-28 | Uop Inc. | Separation of sucrose from molasses |
US4940845A (en) | 1984-05-30 | 1990-07-10 | Kao Corporation | Esterification process of fats and oils and enzymatic preparation to use therein |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4627192B1 (en) | 1984-11-16 | 1995-10-17 | Sigco Res Inc | Sunflower products and methods for their production |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4755467A (en) | 1985-06-03 | 1988-07-05 | Unisearch Limited | Method for the production of sorbitol and gluconate |
US5900370A (en) | 1985-07-01 | 1999-05-04 | Bio-Technical Resources | Process for the production of ascorbic acid with prototheca |
US5792631A (en) | 1985-07-01 | 1998-08-11 | Dcv, Inc. | Microbial process for the production of ascorbic acid using Chlorella protothecoides |
US5001059A (en) | 1985-07-01 | 1991-03-19 | Bio-Technical Resources, Inc. | L-ascorbic acid production in microorganisms |
US4603188A (en) | 1985-07-10 | 1986-07-29 | Itoh Seiyu Kabushiki Kaisha | Curable urethane composition |
US4940835A (en) | 1985-10-29 | 1990-07-10 | Monsanto Company | Glyphosate-resistant plants |
US4673490A (en) | 1985-08-23 | 1987-06-16 | Fluor Corporation | Process for separating crude oil components |
JPH0775557B2 (ja) | 1986-04-25 | 1995-08-16 | 富士レビオ株式会社 | 脂質結合性シアル酸の測定法 |
US5091116A (en) | 1986-11-26 | 1992-02-25 | Kraft General Foods, Inc. | Methods for treatment of edible oils |
JPH077557Y2 (ja) | 1987-04-29 | 1995-02-22 | スズキ株式会社 | 発動発電機の周波数切換装置 |
US5360730A (en) | 1987-06-05 | 1994-11-01 | Universal Foods Corporation | Zeaxanthin producing strains of Neospongiococcum Excentricum |
DK399387D0 (da) | 1987-07-31 | 1987-07-31 | Novo Industri As | Immobiliseret lipase og dennes anvendelse |
JP2641935B2 (ja) | 1987-09-28 | 1997-08-20 | ノボ‐ノルディスク アクティーゼルスカブ | リパーゼの固定化方法 |
FR2626584B1 (fr) | 1988-01-28 | 1990-07-13 | Agronomique Inst Nat Rech | Sequence ars efficace chez yarrowia lipolytica et procede pour sa preparation |
US4992605A (en) | 1988-02-16 | 1991-02-12 | Craig Wayne K | Production of hydrocarbons with a relatively high cetane rating |
US4901635A (en) | 1988-04-08 | 1990-02-20 | Anderson International Corp. | Apparatus and method for the continuous extrusion and partial deliquefaction of oleaginous materials |
US5080848A (en) | 1988-12-22 | 1992-01-14 | The Proctor & Gamble Company | Process for making concentrated surfactant granules |
JPH078217Y2 (ja) | 1988-07-07 | 1995-03-01 | 日立電線株式会社 | 発光ダイオードヘッド |
US5130242A (en) | 1988-09-07 | 1992-07-14 | Phycotech, Inc. | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5340742A (en) | 1988-09-07 | 1994-08-23 | Omegatech Inc. | Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids |
US20060094089A1 (en) | 1988-09-07 | 2006-05-04 | Martek Biosciences Corporation | Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids |
US5693507A (en) | 1988-09-26 | 1997-12-02 | Auburn University | Genetic engineering of plant chloroplasts |
US6680426B2 (en) | 1991-01-07 | 2004-01-20 | Auburn University | Genetic engineering of plant chloroplasts |
DE3836447C2 (de) | 1988-10-26 | 1994-02-03 | Stockhausen Chem Fab Gmbh | Verfahren zur Gewinnung hochsulfatierter Fettsäuren, Hydroxifettsäuren oder oxalkylierter Hydroxifettsäuren |
DK638688D0 (da) | 1988-11-16 | 1988-11-16 | Novo Industri As | Partikelformet immobiliseret lipase-praeparat, fremgangsmaade til fremstilling deraf og anvendelse deraf |
EP0474663B1 (en) | 1989-05-10 | 1994-03-02 | DAVY McKEE (LONDON) LIMITED | Multi-step hydrodesulphurisation process |
US5434278A (en) | 1989-09-20 | 1995-07-18 | Nabisco, Inc. | Synthesis of acetoglyceride fats |
US5258197A (en) | 1989-09-20 | 1993-11-02 | Nabisco, Inc. | Reduced calorie triglyceride mixtures |
US5391383A (en) | 1989-09-20 | 1995-02-21 | Nabisco, Inc. | Edible spray oil |
WO1991009924A1 (en) | 1989-12-29 | 1991-07-11 | The Procter & Gamble Company | Ultra mild surfactant with good lather |
US4992189A (en) | 1990-02-07 | 1991-02-12 | Mobil Oil Corporation | Lubricants and lube additives from hydroxylation and esterification of lower alkene oligomers |
US5407957A (en) | 1990-02-13 | 1995-04-18 | Martek Corporation | Production of docosahexaenoic acid by dinoflagellates |
DE4004800C2 (de) | 1990-02-13 | 2000-12-21 | Aventis Cropscience Gmbh | Im Habitus und Ertrag veränderte transgene Pflanzen |
US7053267B2 (en) * | 1990-03-16 | 2006-05-30 | Calgene Llc | Plant seed oils |
US5298421A (en) | 1990-04-26 | 1994-03-29 | Calgene, Inc. | Plant medium-chain-preferring acyl-ACP thioesterases and related methods |
US5164308A (en) | 1990-05-21 | 1992-11-17 | Martek Corporation | Preparation of labelled triglyceride oils by cultivation of microorganisms |
US6483008B1 (en) | 1990-08-15 | 2002-11-19 | Calgene Llc | Methods for producing plants with elevated oleic acid content |
US6022577A (en) | 1990-12-07 | 2000-02-08 | Nabisco Technology Company | High stearic acid soybean oil blends |
US5945585A (en) | 1990-12-20 | 1999-08-31 | E. I. Du Pont De Nemours And Company | Specific for palmitoyl, stearoyl and oleoyl-alp thioesters nucleic acid fragments encoding acyl-acp thiosesterase enzymes and the use of these fragments in altering plant oil composition |
WO1992011373A1 (en) | 1990-12-20 | 1992-07-09 | E.I. Du Pont De Nemours And Company | Nucleotide sequences of soybean acyl-acp thioesterase genes |
JPH0699337B2 (ja) | 1990-12-27 | 1994-12-07 | 花王株式会社 | アルコールの製造方法 |
MY107920A (en) | 1990-12-27 | 1996-06-29 | Kao Corp | Process for producing alcohol |
US5380894A (en) | 1991-03-01 | 1995-01-10 | The United States Of America As Represented By The Secretary Of Agriculture | Production of hydroxy fatty acids and estolide intermediates |
US5346724A (en) | 1991-04-12 | 1994-09-13 | Nippon Oil Company, Ltd. | Oil and fat composition for lubricating food processing machines and use thereof |
CU22292A1 (es) | 1991-05-07 | 1995-01-31 | Cigb | Procedimiento para la obtencion a escala industrial de licores de fructosa-glucosa a partir de sacarosa e instalacion para el mismo |
US5455167A (en) | 1991-05-21 | 1995-10-03 | Calgene Inc. | Medium-chain thioesterases in plants |
US5270175A (en) | 1991-07-12 | 1993-12-14 | Dna Plant Technology Corporation | Methods and compositions for producing metabolic products for algae |
US5268192A (en) | 1991-07-16 | 1993-12-07 | Nabisco, Inc. | Low calorie nut products and process of making |
JP3143636B2 (ja) | 1991-09-11 | 2001-03-07 | 株式会社サン・クロレラ | 細胞破裂によるクロレラ細胞壁の破砕方法 |
DE4130986A1 (de) | 1991-09-18 | 1993-03-25 | Bayer Ag | Pinosylvinsynthase-gene |
PH31293A (en) | 1991-10-10 | 1998-07-06 | Rhone Poulenc Agrochimie | Production of y-linolenic acid by a delta6-desaturage. |
US6355861B1 (en) | 1991-10-10 | 2002-03-12 | Rhone-Poulenc Agrochimie | Production of gamma linolenic acid by a Δ6-desaturase |
FR2686619B1 (fr) | 1992-01-28 | 1995-07-13 | Commissariat Energie Atomique | Procede de production selective de lipides poly-insatures a partir d'une culture de micro-algues du type porphyridium et cuve utilisee dans ce procede. |
US5395455A (en) | 1992-03-10 | 1995-03-07 | Energy, Mines And Resources - Canada | Process for the production of anhydrosugars from lignin and cellulose containing biomass by pyrolysis |
DE4209779C1 (ko) | 1992-03-26 | 1993-07-15 | Oelmuehle Leer Connemann Gmbh & Co., 2950 Leer, De | |
ES2141767T3 (es) | 1992-06-19 | 2000-04-01 | Arthur M Nonomura | Procedimientos y composiciones que estimulan la fijacion del carbono en las plantas. |
TW211523B (en) | 1992-06-29 | 1993-08-21 | Amerchol Corp | Hydroxylated milk glycerides |
US6410281B1 (en) | 1992-07-10 | 2002-06-25 | Omegatech, Inc. | Reducing corrosion in a fermentor by providing sodium with a non-chloride sodium salt |
US5298637A (en) | 1992-10-22 | 1994-03-29 | Arco Chemical Technology, L.P. | Process for producing a reduced calorie lipid composition |
JP3090810B2 (ja) | 1993-03-09 | 2000-09-25 | 日本碍子株式会社 | パルミトオレイン酸の製造方法 |
GB2277052A (en) | 1993-04-14 | 1994-10-19 | Du Pont Canada | Polyurethane foam laminates |
JPH078215A (ja) | 1993-04-30 | 1995-01-13 | Kawasaki Steel Corp | ドコサヘキサエン酸含有海洋性微細藻類食品素材およびその製造方法 |
JPH078217A (ja) | 1993-06-29 | 1995-01-13 | Kawasaki Steel Corp | ドコサヘキサエン酸含有健康食品およびその製造方法 |
JP3506740B2 (ja) | 1993-09-09 | 2004-03-15 | 日清オイリオ株式会社 | ドコサヘキサエン酸含有藻類の培養方法 |
CA2118071C (en) | 1993-10-28 | 2004-09-14 | Rodney B. Croteau | Dna encoding limonene synthase from mentha spicata |
CA2176137A1 (en) | 1993-11-10 | 1995-05-18 | Alois Toni Voelker | Plant acyl acp thioesterase sequences |
US5427704A (en) | 1994-01-28 | 1995-06-27 | The Lubrizol Corporation | Triglyceride oils thickened with estolides of hydroxy-containing triglycerides |
US5451332A (en) | 1994-01-28 | 1995-09-19 | The Lubrizol Corporation | Estolides of hydroxy-containing triglycerides that contain a performance additive |
US5458795A (en) | 1994-01-28 | 1995-10-17 | The Lubrizol Corporation | Oils thickened with estolides of hydroxy-containing triglycerides |
EP0746608B1 (en) | 1994-02-21 | 2003-08-20 | Novozymes A/S | Method for production of an immobilized enzyme preparation and use of the immobilized enzyme preparation |
US5910630A (en) | 1994-04-06 | 1999-06-08 | Davies; Huw Maelor | Plant lysophosphatidic acid acyltransferases |
US5563058A (en) | 1994-04-06 | 1996-10-08 | Calgene, Inc. | Plant lysophosphatidic acid acyltransferases |
US5506201A (en) | 1994-04-29 | 1996-04-09 | International Flavors & Fragrances Inc. | Formulation of a fat surfactant vehicle containing a fragrance |
JP3375726B2 (ja) | 1994-05-18 | 2003-02-10 | 雪印乳業株式会社 | 食用油脂および油脂混合物 |
ATE368118T1 (de) | 1994-05-18 | 2007-08-15 | Bayer Bioscience Gmbh | Für enzyme, die die fähigkeit besitzen lineare alpha 1,4-glucane in pflanzen, pilzen und mikroorganismen zu synthesieren, kodierende dna sequenzen |
US6113971A (en) | 1994-07-25 | 2000-09-05 | Elmaleh; David R. | Olive oil butter |
ATE181745T1 (de) | 1994-08-16 | 1999-07-15 | Frische Gmbh | Verfahren zur gewinnung von nicht wasserlöslichen, nativen produkten aus nativen stoffgemengen mit hilfe der zentrifugalkraft |
US5756135A (en) | 1994-09-15 | 1998-05-26 | Robert D. Seeley Trust | Water insoluble yeast solids product and process of making same |
EP0805673A1 (en) | 1994-10-20 | 1997-11-12 | The Procter & Gamble Company | Personal treatment compositions and/or cosmetic compositions containing enduring perfume |
US5475160A (en) | 1994-11-07 | 1995-12-12 | Shell Oil Company | Process for the direct hydrogenation of triglycerides |
US5680812A (en) | 1995-01-23 | 1997-10-28 | Linsgeseder; Helmut | Apparatus and method for the extraction of vegetable oils |
DE19503062A1 (de) | 1995-02-01 | 1996-08-08 | Henkel Kgaa | Verwendung von Alkoxylierungsprodukten epoxydierter Fettstoffe als Entschäumer |
US5942479A (en) | 1995-05-27 | 1999-08-24 | The Proctor & Gamble Company | Aqueous personal cleansing composition with a dispersed oil phase comprising two specifically defined oil components |
ATE290580T1 (de) | 1995-06-06 | 2005-03-15 | Agro Man Group Inc | Biologisch abbaubare schmierflüssigkeiten auf pflanzlicher basis |
US5685218A (en) | 1995-07-14 | 1997-11-11 | The French Oil Mill Machinery Co. | Method for treating oil-bearing material |
EP0874802A1 (de) | 1995-10-27 | 1998-11-04 | Basf Aktiengesellschaft | Fettsäurederivate und ihre verwendung als tenside in wasch- und reinigungsmitteln |
FI100248B (fi) | 1996-02-05 | 1997-10-31 | Fortum Oil Oy | Keskitisleen valmistus |
US6086903A (en) | 1996-02-26 | 2000-07-11 | The Proctor & Gamble Company | Personal treatment compositions and/or cosmetic compositions containing enduring perfume |
US6255505B1 (en) | 1996-03-28 | 2001-07-03 | Gist-Brocades, B.V. | Microbial polyunsaturated fatty acid containing oil from pasteurised biomass |
WO1997039106A1 (en) | 1996-04-12 | 1997-10-23 | Martek Biosciences Corporation | Methods and tools for transformation of eukaryotic algae |
WO1997038571A1 (en) | 1996-04-15 | 1997-10-23 | Washington State University Research Foundation | Compositions and methods for taxol biosynthesis |
AR006830A1 (es) | 1996-04-26 | 1999-09-29 | Du Pont | Aceite de soja con alta estabilidad oxidativa |
US5595965A (en) * | 1996-05-08 | 1997-01-21 | The Lubrizol Corporation | Biodegradable vegetable oil grease |
US6312623B1 (en) | 1996-06-18 | 2001-11-06 | Abb Power T&D Company Inc. | High oleic acid oil compositions and methods of making and electrical insulation fluids and devices comprising the same |
BR9711019A (pt) | 1996-08-02 | 1999-08-17 | Plum Kemi Prod | EmulsÆo de Äleo-em- gua para uso em pela humana para limpeza preserva-Æo ou aperfei-oamento da condi-Æo da pele |
CZ36499A3 (cs) | 1996-08-08 | 1999-07-14 | The Procter & Gamble Company | Syntéza polyolových polyesterů |
US5885440A (en) | 1996-10-01 | 1999-03-23 | Uop Llc | Hydrocracking process with integrated effluent hydrotreating zone |
US7109392B1 (en) | 1996-10-09 | 2006-09-19 | Cargill, Incorporated | Methods for increasing oleic acid content in seeds from transgenic plants containing a mutant delta 12 desaturase |
US6200788B1 (en) * | 1997-01-24 | 2001-03-13 | Kirin Beer Kabushiki Kaisha | β-ketoacyl-ACP synthetase II enzymes and genes coding for same |
US6465642B1 (en) | 1997-02-07 | 2002-10-15 | The Procter & Gamble Company | Lower alkyl ester recycling in polyol fatty acid polyester synthesis |
DE19710152C2 (de) | 1997-03-12 | 1999-04-22 | Henkel Kgaa | Verfahren zur Herstellung von Aniontensidgranulaten |
US6395965B1 (en) | 1997-03-21 | 2002-05-28 | Restoragen, Inc. | Plant containing a gene construct comprising a chlorella virus promoter and a lac operator |
US6243725B1 (en) | 1997-05-21 | 2001-06-05 | Premier International, Ltd. | List building system |
US6083731A (en) | 1997-06-24 | 2000-07-04 | Washington State University Research Foundation | Recombinant materials and methods for the production of limonene hydroxylases |
US6429014B1 (en) | 1997-07-11 | 2002-08-06 | Washington State University Research Foundation | Monoterpene synthases from grand fir (Abies grandis) |
US6372460B1 (en) | 1997-08-01 | 2002-04-16 | Martek Biosciences | DHA-containing nutritional compositions and methods for their production |
US5891697A (en) | 1997-09-25 | 1999-04-06 | Washington State University Research Foundation | Monoterpene synthases from common sage (Salvia officinalis) |
EP1016708B1 (en) | 1997-09-29 | 2006-11-29 | Japan Tobacco Inc. | Yeast extract composition, yeast for obtaining the same, and process for producing yeast extract composition |
NZ505943A (en) | 1998-01-21 | 2002-12-20 | Univ Maryland Biotech Inst | Methods for increasing the ratio of docosahexaenoic acid to eicosapentaenoic acid in the live prey of larval fish |
US6265639B1 (en) | 1998-01-22 | 2001-07-24 | Washington State University Foundation | Gymnosperm nucleic acid molecules encoding sesquiterpene synthases and methods of use |
US6407044B2 (en) | 1998-01-28 | 2002-06-18 | The Proctor & Gamble Company | Aerosol personal cleansing emulsion compositions which contain low vapor pressure propellants |
AU2490399A (en) | 1998-02-02 | 1999-08-16 | Regents Of The University Of California, The | Germacrene c synthase gene of (lycopersicon esculentum) |
US6139897A (en) | 1998-03-24 | 2000-10-31 | Kao Corporation | Oil or fat composition containing phytosterol |
US6468955B1 (en) | 1998-05-01 | 2002-10-22 | The Proctor & Gamble Company | Laundry detergent and/or fabric care compositions comprising a modified enzyme |
US20020012979A1 (en) | 1998-06-08 | 2002-01-31 | Alan Berry | Vitamin c production in microorganisms and plants |
US6051539A (en) | 1998-07-02 | 2000-04-18 | Cargill, Inc. | Process for modifying unsaturated triacylglycerol oils resulting products and uses thereof |
EP2305825B1 (en) | 1998-07-06 | 2015-01-14 | DCV Inc. doing business as Bio-Technical Resourses | Method of vitamin production |
ATE537265T1 (de) | 1998-07-06 | 2011-12-15 | Dcv Inc | Verfahren zur vitaminherstellung |
US7511190B2 (en) | 1999-11-17 | 2009-03-31 | Mendel Biotechnology, Inc. | Polynucleotides and polypeptides in plants |
JP2000136199A (ja) | 1998-10-29 | 2000-05-16 | Asahi Glass Co Ltd | シゾサッカロミセス・ポンベで使用可能なシグナルペプチド、分泌型発現ベクター、およびそれらを用いたタンパク質生産方法 |
US6043072A (en) | 1998-11-05 | 2000-03-28 | Washington State University Research Foundation | Nucleic acids encoding Taxus geranylgeranyl diphosphate synthase, and methods of use |
US6762345B1 (en) | 1998-12-03 | 2004-07-13 | E. I. Du Pont De Nemours And Company | Plant stearoyl desaturases |
JP2000175696A (ja) | 1998-12-14 | 2000-06-27 | Yoshio Tanaka | ドナリエラ藻体の抽出方法 |
US6166231A (en) | 1998-12-15 | 2000-12-26 | Martek Biosciences Corporation | Two phase extraction of oil from biomass |
US6020509A (en) | 1998-12-22 | 2000-02-01 | Condea Vista Company | Method for producing surfactant compositions |
US6630066B2 (en) | 1999-01-08 | 2003-10-07 | Chevron U.S.A. Inc. | Hydrocracking and hydrotreating separate refinery streams |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7211418B2 (en) | 1999-01-14 | 2007-05-01 | Martek Biosciences Corporation | PUFA polyketide synthase systems and uses thereof |
US6278006B1 (en) | 1999-01-19 | 2001-08-21 | Cargill, Incorporated | Transesterified oils |
WO2000061740A1 (en) | 1999-04-10 | 2000-10-19 | Maxygen, Inc. | Modified lipid production |
BR0010597A (pt) | 1999-04-12 | 2002-02-13 | Monsanto Technology Llc | Plantas transgênicas contendo nìveis alterados de compostos esterol e tocoferóis |
HU228892B1 (en) | 1999-06-04 | 2013-06-28 | Consejo Superior Investigacion | High oleic high stearic plants, seeds and oils |
DE19926456A1 (de) | 1999-06-10 | 2000-12-14 | Norddeutsche Pflanzenzucht Han | Verfahren zur Erhöhung des Fettsäuregehalts in Pflanzensamen |
US6320101B1 (en) | 1999-06-14 | 2001-11-20 | Yissum Research Development Company Of The Hebrew University Of Jerusalem | Enhancing inorganic carbon fixation by photosynthetic organisms |
WO2001001949A1 (en) | 1999-07-01 | 2001-01-11 | Johnson And Johnson Consumer Companies, Inc. | Cleansing compositions |
US6217746B1 (en) | 1999-08-16 | 2001-04-17 | Uop Llc | Two stage hydrocracking process |
DE10000978A1 (de) | 2000-01-12 | 2001-07-26 | Gvs Ges Fuer Erwerb Und Verwer | Verfahren zur Erhöhung des Gehalts an Fettsäuren in Pflanzen und Mikroorganismen |
US6391815B1 (en) | 2000-01-18 | 2002-05-21 | Süd-Chemie Inc. | Combination sulphur adsorbent and hydrogenation catalyst for edible oils |
AU780619B2 (en) | 2000-01-19 | 2005-04-07 | Dsm Ip Assets B.V. | Solventless extraction process |
US6338866B1 (en) | 2000-02-15 | 2002-01-15 | Applied Food Biotechnology, Inc. | Pet foods using algal or fungal waste containing fatty acids |
GB0007651D0 (en) | 2000-03-29 | 2000-05-17 | Ascorbex Ltd | Gene sequence |
ES2291312T3 (es) * | 2000-04-21 | 2008-03-01 | Martek Biosciences Corporation | Conversion trofica de algas fototroficas estrictas mediante ingenieria metabolica. |
US6268517B1 (en) | 2000-05-09 | 2001-07-31 | Condea Vista Company | Method for producing surfactant compositions |
AU2001263062A1 (en) | 2000-05-11 | 2001-11-20 | The Procter And Gamble Company | Highly concentrated fabric softener compositions and articles containing such compositions |
US20020178467A1 (en) | 2000-05-12 | 2002-11-28 | Katayoon Dehesh | Plastid transit peptide sequences for efficient plastid targeting |
MY122480A (en) | 2000-05-29 | 2006-04-29 | Premium Vegetable Oils Sdn Bhd | Trans free hard structural fat for margarine blend and spreads |
DE10035213A1 (de) | 2000-07-20 | 2002-01-31 | Beiersdorf Ag | Geformtes Seifenprodukt, enthaltend Talkum, eine oder mehrere Fettsäuren in Form ihrer Alkaliseifen und eine oder mehrere rückfettend wirkende Substanzen bei gleichzeitiger Abwesenheit von Alkyl-(oligo)-glycosiden |
WO2002008403A2 (en) * | 2000-07-25 | 2002-01-31 | Calgene Llc | Nucleic acid sequences encoding beta-ketoacyl-acp synthase and uses thereof |
EP1178118A1 (en) | 2000-08-02 | 2002-02-06 | Dsm N.V. | Isolation of microbial oils |
FR2814064B1 (fr) | 2000-09-20 | 2005-06-17 | Oreal | Composition de lavage comprenant des particules d'oxyde d'aluminium, au moins un agent conditionneur et au moins un tensioactif detergent |
US6596155B1 (en) | 2000-09-26 | 2003-07-22 | Uop Llc | Hydrocracking process |
JP2002125601A (ja) | 2000-10-25 | 2002-05-08 | Kurorera Kogyo Kk | 動物性プランクトン用餌料とその製造方法及び動物性プランクトンの培養方法 |
AU2002224445A1 (en) | 2000-10-26 | 2002-05-06 | Joe E. Guyer | Method of generating and recovering gas from subsurface formations of coal, carbonaceous shale and organic-rich shales |
US6538169B1 (en) | 2000-11-13 | 2003-03-25 | Uop Llc | FCC process with improved yield of light olefins |
SK11162003A3 (sk) | 2000-11-21 | 2004-02-03 | Unilever Nv | Jedlá emulzná nátierka voda v oleji (W/O) a spôsob jej výroby |
US7081567B2 (en) | 2000-12-03 | 2006-07-25 | Lexun Xue | Transgenic dunaliella salina as a bioreactor |
ATE542520T1 (de) | 2000-12-21 | 2012-02-15 | Aarhuskarlshamn Denmark As | Verfahren zur herstellung von pflanzenölfraktionen, die reich an nichttocolhaltigem, hochschmelzendem, unverseifbarem material sind |
US20020144455A1 (en) | 2001-01-06 | 2002-10-10 | Bertrand Jerome C. | Non sooting candle composition |
JP4226906B2 (ja) | 2001-03-26 | 2009-02-18 | ダウ グローバル テクノロジーズ インコーポレイティド | 低級オレフィンによる不飽和脂肪酸エステルまたは不飽和脂肪酸の複分解 |
JP4823430B2 (ja) | 2001-03-28 | 2011-11-24 | 花王株式会社 | 界面活性剤組成物 |
US20040235123A1 (en) | 2001-04-20 | 2004-11-25 | Liao Hans H | Production of alpha-lipoic acid |
US6620427B2 (en) * | 2001-04-24 | 2003-09-16 | Abbott Laboratories | Method for improving bone mineralization |
FR2824266B1 (fr) | 2001-05-04 | 2005-11-18 | Oreal | Composition cosmetique de soin ou de maquillage des matieres keratiniques comprenant un ester a groupement aromatique et un agent photoprotecteur et utilisations |
US6503285B1 (en) | 2001-05-11 | 2003-01-07 | Cargill, Inc. | Triacylglycerol based candle wax |
US6596768B2 (en) | 2001-05-22 | 2003-07-22 | Church & Dwight Co., Inc. | Unsaturated lipid-enriched feedstock for ruminants |
US6398707B1 (en) | 2001-05-31 | 2002-06-04 | Wen-Teng Wu | Method of preparing lower alkyl fatty acids esters and in particular biodiesel |
WO2003002719A2 (en) | 2001-06-29 | 2003-01-09 | Brookhaven Science Associates, Llc | Isoform of castor oleate hydroxylase |
US20030082595A1 (en) | 2001-08-03 | 2003-05-01 | Bo Jiang | Nucleic acids of aspergillus fumigatus encoding industrial enzymes and methods of use |
US6706659B2 (en) | 2001-08-29 | 2004-03-16 | Uop Llc | High-activity isomerization catalyst and process |
WO2003037884A2 (en) | 2001-09-19 | 2003-05-08 | Archer-Daniels-Midland Company | Process for separation of tocopherols |
JP3816774B2 (ja) | 2001-10-01 | 2006-08-30 | 独立行政法人科学技術振興機構 | 炭化水素資化微細藻類およびそれを用いたバイオレメディエーション方法 |
DE60231331D1 (de) | 2002-01-03 | 2009-04-09 | Archer Daniels Midland Co | Mehrfach ungesättige fettsäuren als teil von reaktiven strukturen für latexanstriche, verdickungsmittel, tenside und dispergiermittel |
US7622284B2 (en) | 2002-01-23 | 2009-11-24 | Royal Nedalco B.V. | Transformed eukaryotic cells that directly convert xylose to xylulose |
US7314974B2 (en) | 2002-02-21 | 2008-01-01 | Monsanto Technology, Llc | Expression of microbial proteins in plants for production of plants with improved properties |
JP4095392B2 (ja) | 2002-03-11 | 2008-06-04 | 水澤化学工業株式会社 | バイオ燃料の製造方法 |
US6590113B1 (en) | 2002-03-26 | 2003-07-08 | Ronald T. Sleeter | Process for treating oils containing antioxidant compounds |
US20030229237A1 (en) | 2002-04-02 | 2003-12-11 | Haas Michael J. | In situ production of fatty acid alkyl esters |
ES2391381T3 (es) | 2002-05-03 | 2012-11-23 | Martek Biosciences Corporation | Lípidos de alta calidad y métodos para su producción mediante liberación enzimática a partir de biomasa |
US20030211594A1 (en) | 2002-05-07 | 2003-11-13 | Rosebrook Donald Ian | Microalgae for remediation of waste and method of culturing the same |
WO2003097763A1 (en) | 2002-05-14 | 2003-11-27 | Chemical Specialities, Inc. | Water repellent compositions for wood preservatives |
US6818589B1 (en) | 2002-06-18 | 2004-11-16 | Uop Llc | Isomerization catalyst and processes |
US20050262588A1 (en) | 2002-06-21 | 2005-11-24 | Katayoon Dehesh | Thioesterase-related nucleic acid sequences and methods of use for the production of plants with modified fatty acid composition |
DE60336902D1 (de) | 2002-07-19 | 2011-06-09 | Cytos Biotechnology Ag | Impfstoffzusammensetzungen enthaltende amyloid beta 1-6 antigenarrays |
US7232935B2 (en) | 2002-09-06 | 2007-06-19 | Fortum Oyj | Process for producing a hydrocarbon component of biological origin |
US7041866B1 (en) | 2002-10-08 | 2006-05-09 | Uop Llc | Solid-acid isomerization catalyst and process |
US20040074760A1 (en) | 2002-10-17 | 2004-04-22 | Carnegie Mellon University | Production of biofuels |
FI116627B (fi) | 2002-11-01 | 2006-01-13 | Danisco | Menetelmä triglyseridien rasvahappoketjukoostumuksen säätelemiseksi sekä niiden käyttö |
US7135290B2 (en) | 2003-04-12 | 2006-11-14 | Solazyme, Inc. | Methods and compositions for evolving hydrogenase genes |
WO2004046336A2 (en) | 2002-11-18 | 2004-06-03 | Monsanto Technology, Llc | Production of increased oil and protein in plants by the disruption of the phenylpropanoid pathway |
DE602004009538T2 (de) | 2003-01-08 | 2008-07-31 | Texas Tech University, Lubbock | Elastomere zusammensetzungen auf basis von rizinusöl/epoxidiertem sojabohnenöl |
CA2513289A1 (en) | 2003-01-20 | 2004-08-05 | Sungene Gmbh & Co. Kgaa | Expression cassette with promotors of starch synthesis 3 for the expression of nucleic acids in plant tissue containing starch |
US20060206949A1 (en) | 2003-01-28 | 2006-09-14 | Sylvain Arnould | Custom-made meganuclease and use thereof |
US20060156436A1 (en) | 2003-03-03 | 2006-07-13 | Meiji Seika Kaisha, Ltd. | Transgenic plant having fructooligosaccharide accumulated therein and process for constructing |
US7125672B2 (en) | 2003-05-07 | 2006-10-24 | E. I. Du Pont De Nemours And Company | Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts |
US7238482B2 (en) | 2003-05-07 | 2007-07-03 | E. I. Du Pont De Nemours And Company | Production of polyunsaturated fatty acids in oleaginous yeasts |
US7032664B2 (en) | 2004-06-02 | 2006-04-25 | Halliburton Energy Services, Inc. | Nanocomposite particulates and methods of using nanocomposite particulates |
US7259255B2 (en) | 2003-06-25 | 2007-08-21 | E. I. Du Pont De Nemours And Company | Glyceraldehyde-3-phosphate dehydrogenase and phosphoglycerate mutase promoters for gene expression in oleaginous yeast |
WO2005005586A1 (ja) | 2003-07-09 | 2005-01-20 | The Nisshin Oillio, Ltd | 対称型トリグリセリドの製造方法 |
DE10332151A1 (de) * | 2003-07-15 | 2005-02-03 | Cognis Deutschland Gmbh & Co. Kg | Verfahren zur Herstellung von Carbonsäure-Metallseifen |
CN1871351B (zh) | 2003-08-25 | 2010-06-23 | 富诺齐梅生物技术股份有限公司 | 一种新的真菌蛋白及其编码核酸 |
PE20050398A1 (es) | 2003-09-22 | 2005-06-03 | Rosales Jose Antonio Socla | Proceso y purificacion de las xantofilas de marigold |
US20060048240A1 (en) | 2004-04-01 | 2006-03-02 | Nickolai Alexandrov | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
EP1670880A4 (en) | 2003-10-02 | 2007-04-04 | Univ Mississippi | METHOD FOR PRODUCING BIODIESEL AND OTHER VALUABLE CHEMICALS FROM SLUDGE FROM WASTEWATER TREATMENT PLANTS |
US7504259B2 (en) | 2003-11-12 | 2009-03-17 | E. I. Du Pont De Nemours And Company | Δ12 desaturases suitable for altering levels of polyunsaturated fatty acids in oleaginous yeast |
ES2314467T3 (es) | 2003-11-13 | 2009-03-16 | Neste Oil Oyj | Proceso para la hidrogenacion de olefinas. |
DE602004031895D1 (de) | 2003-11-20 | 2011-04-28 | Solvay | Verfahren zur Herstellung von Dichlorpropanol |
CN1898389A (zh) | 2003-12-23 | 2007-01-17 | 巴斯福植物科学有限公司 | 植物中的糖及脂质代谢调节剂vi |
CN1238469C (zh) | 2004-01-16 | 2006-01-25 | 清华大学 | 有机介质反应体系中脂肪酶转化油脂生产生物柴油新工艺 |
US7063957B2 (en) | 2004-03-26 | 2006-06-20 | The University Of Hong Kong | Methods for production of astaxanthin from the green microalgae Chlorella in dark-heterotrophic cultures |
US7364883B2 (en) | 2004-05-07 | 2008-04-29 | Yeastern Biotech Co., Ltd. | Process for producing poly-unsaturated fatty acids by oleaginous yeasts |
WO2005108586A1 (en) | 2004-05-07 | 2005-11-17 | Universität Regensburg | A method for increasing the ratio of homologous to non-homologous recombination |
WO2005113784A1 (en) | 2004-05-12 | 2005-12-01 | Luca Technologies, Llc | Generation of hydrogen from hydrocarbon-bearing materials |
US7214297B2 (en) | 2004-06-28 | 2007-05-08 | Applied Materials, Inc. | Substrate support element for an electrochemical plating cell |
US20060075522A1 (en) | 2004-07-31 | 2006-04-06 | Jaclyn Cleveland | Genes and uses for plant improvement |
US7279617B2 (en) | 2004-09-22 | 2007-10-09 | Ceres, Inc. | Promoter, promoter control elements, and combinations, and uses thereof |
ES2689290T3 (es) | 2004-09-28 | 2018-11-13 | Neste Oyj | Proceso para eterificar iso-olefinas |
GB0421937D0 (en) | 2004-10-02 | 2004-11-03 | Univ York | Acyl CoA synthetases |
US7678931B2 (en) | 2004-10-22 | 2010-03-16 | Martek Biosciences Corporation | Process for preparing materials for extraction |
US7189559B2 (en) | 2004-11-04 | 2007-03-13 | E. I. Du Pont De Nemours And Company | Mortierella alpina lysophosphatidic acid acyltransferase homolog for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms |
US7550286B2 (en) | 2004-11-04 | 2009-06-23 | E. I. Du Pont De Nemours And Company | Docosahexaenoic acid producing strains of Yarrowia lipolytica |
US8685679B2 (en) | 2004-11-04 | 2014-04-01 | E I Du Pont De Nemours And Company | Acyltransferase regulation to increase the percent of polyunsaturated fatty acids in total lipids and oils of oleaginous organisms |
US7879591B2 (en) | 2004-11-04 | 2011-02-01 | E.I. Du Pont De Nemours And Company | High eicosapentaenoic acid producing strains of Yarrowia lipolytica |
US7238277B2 (en) | 2004-12-16 | 2007-07-03 | Chevron U.S.A. Inc. | High conversion hydroprocessing |
US20060225341A1 (en) | 2004-12-20 | 2006-10-12 | Rodolfo Rohr | Production of biodiesel |
MX2007007914A (es) | 2004-12-30 | 2007-08-14 | Sun Drilling Products Corp | Particulas nanocompuestas termoendurecibles, procesamiento para su produccion, y su uso en aplicaciones de perforacion de petroleo y gas natural. |
ATE490298T1 (de) | 2005-01-14 | 2010-12-15 | Neste Oil Oyj | Verfahren zur herstellung von kohlenwasserstoffen |
DE102005003624A1 (de) | 2005-01-26 | 2006-07-27 | Nutrinova Nutrition Specialties & Food Ingredients Gmbh | Herstellung und Anwendung eines antioxidativ wirksamen Extraktes aus Crypthecodinium sp. |
US7692049B2 (en) | 2005-01-31 | 2010-04-06 | Exxonmobil Chemical Patents Inc. | Hydrocarbon compositions useful for producing fuels and methods of producing the same |
EP1871883A1 (en) | 2005-03-02 | 2008-01-02 | Metanomics GmbH | Process for the production of fine chemicals |
US7851199B2 (en) | 2005-03-18 | 2010-12-14 | Microbia, Inc. | Production of carotenoids in oleaginous yeast and fungi |
US20060223153A1 (en) | 2005-04-05 | 2006-10-05 | Luca Technologies, Llc | Generation of materials with enhanced hydrogen content from anaerobic microbial consortia |
US7426960B2 (en) | 2005-05-03 | 2008-09-23 | Luca Technologies, Inc. | Biogenic fuel gas generation in geologic hydrocarbon deposits |
CN101227900A (zh) | 2005-05-11 | 2008-07-23 | 高级生物营养公司 | 稳定形式的鱼油 |
CA2624616A1 (en) | 2005-05-12 | 2006-11-23 | Martek Biosciences Corporation | Biomass hydrolysate and uses and production thereof |
US7288685B2 (en) | 2005-05-19 | 2007-10-30 | Uop Llc | Production of olefins from biorenewable feedstocks |
EP2990462A1 (en) | 2005-07-04 | 2016-03-02 | Neste Oil Oyj | Process for the manufacture of diesel range hydrocarbons |
PL1741768T5 (pl) | 2005-07-04 | 2024-02-05 | Neste Oyj | Sposób wytwarzania węglowodorów w zakresie oleju napędowego |
MX2008002633A (es) | 2005-08-25 | 2008-09-26 | A2Be Carbon Capture Llc | Metodo, aparato y sistema para produccion de biodiesel a partir de algas. |
WO2007027669A1 (en) | 2005-08-29 | 2007-03-08 | Cps Biofuels, Inc. | Improved biodiesel fuel, additives, and lubbricants |
FR2890961B1 (fr) | 2005-09-21 | 2007-11-23 | Inst Francais Du Petrole | Procede perfectionne de fabrication d'esters ethyliques a partir de corps gras d'origine naturelle |
WO2007038566A2 (en) | 2005-09-27 | 2007-04-05 | Cornell University | Invertase and inhibitors from coffee |
CN100408656C (zh) | 2005-09-28 | 2008-08-06 | 中国科学院大连化学物理研究所 | 一种生物柴油的制备方法 |
US8163675B2 (en) | 2005-10-20 | 2012-04-24 | Akzo Nobel N.V. | Emulsifier based on polyamines and fatty acid/maleic anhydride |
ES2491871T3 (es) | 2005-12-12 | 2014-09-08 | Neste Oil Oyj | Proceso para la elaboración de hidrocarburos |
US20070167396A1 (en) | 2006-01-19 | 2007-07-19 | Solazyme, Inc. | Methods and compositions for cholesterol reduction in mammals |
US20090274736A1 (en) | 2006-01-19 | 2009-11-05 | Solazyme Inc. | Nutraceutical Compositions From Microalgae And Related Methods of Production And Administration |
US20070166266A1 (en) * | 2006-01-19 | 2007-07-19 | Solazyme, Inc. | Methods and compositions for improving the health and appearance of skin |
US9109170B2 (en) | 2006-02-02 | 2015-08-18 | Reg Biofuels, Llc | Biodiesel cold filtration process |
US20070218183A1 (en) | 2006-03-14 | 2007-09-20 | Bunge Oils, Inc. | Oil composition of conjugated linoleic acid |
WO2007106904A2 (en) | 2006-03-15 | 2007-09-20 | Martek Biosciences Corporation | Plant seed oils containing polyunsaturated fatty acids |
CN100590186C (zh) | 2006-03-17 | 2010-02-17 | 中国科学院大连化学物理研究所 | 一种生产生物油脂和生物柴油的方法 |
WO2007117511A2 (en) | 2006-04-03 | 2007-10-18 | Advanced Bionutrition Corporation | Feed formulations containing docosahexaenoic acid |
US20100248322A1 (en) | 2006-04-05 | 2010-09-30 | Luca Technologies, Inc. | Chemical amendments for the stimulation of biogenic gas generation in deposits of carbonaceous material |
BRPI0709946A2 (pt) | 2006-04-13 | 2011-08-02 | Ambrozea Inc | composições e métodos para produzir produtos e resìduos de fermentação |
US7309602B2 (en) | 2006-04-13 | 2007-12-18 | Ambrozea, Inc. | Compositions and methods for producing fermentation products and residuals |
CN101460609A (zh) | 2006-05-12 | 2009-06-17 | 亚利桑那州立大学董事会,代表亚利桑那州立大学法人团体利益 | 新的小球藻属(chlorella)物种及其应用 |
WO2007141257A1 (en) | 2006-06-06 | 2007-12-13 | Total Raffinage Marketing | Lysophosphatidic acid acyltransferase genes and uses thereof |
US20070286908A1 (en) | 2006-06-08 | 2007-12-13 | Kent Clampitt | Salt and soap compositions |
US8029579B2 (en) | 2006-06-28 | 2011-10-04 | COH Inc. | Fatty acid blends and uses therefor |
CN101108997B (zh) | 2006-07-19 | 2010-07-21 | 中国科学院大连化学物理研究所 | 一种微生物油脂的制备方法 |
KR20090040476A (ko) | 2006-08-16 | 2009-04-24 | 바이오이콘 인터내셔널 홀딩 엔.브이. | 감압 경유와 트리글리세라이드의 혼합물을 수소화처리함으로써 직쇄형 알칸의 제조 방법 |
WO2008034109A1 (en) * | 2006-09-14 | 2008-03-20 | Biofuelbox Corporation | Methods of robust and efficient conversion of cellular lipids to biofuels |
MX2009002835A (es) | 2006-09-18 | 2009-08-07 | Univ Arizona | Ácidos grasos e hidrocarburos de longitud de cadena media de algas. |
JP2008081559A (ja) | 2006-09-26 | 2008-04-10 | Nippon Shokubai Co Ltd | バイオディーゼル燃料組成物およびその製造方法 |
US8367395B2 (en) | 2006-09-28 | 2013-02-05 | Dsm Ip Assets B.V. | Production of sterols in oleaginous yeast and fungi |
WO2008046106A2 (en) | 2006-10-13 | 2008-04-17 | Elevance Renewable Sciences, Inc. | Synthesis of terminal alkenes from internal alkenes via olefin metathesis |
US9101161B2 (en) | 2006-11-02 | 2015-08-11 | The Coca-Cola Company | High-potency sweetener composition with phytoestrogen and compositions sweetened therewith |
US8088614B2 (en) | 2006-11-13 | 2012-01-03 | Aurora Algae, Inc. | Methods and compositions for production and purification of biofuel from plants and microalgae |
ITMI20062193A1 (it) | 2006-11-15 | 2008-05-16 | Eni Spa | Processo per produrre frazioni idrocarburiche da miscele di origine biologica |
JP4820277B2 (ja) | 2006-12-20 | 2011-11-24 | 花王株式会社 | ケトン体及び/又は2級アルコールの製造法 |
US9637714B2 (en) * | 2006-12-28 | 2017-05-02 | Colorado State University Research Foundation | Diffuse light extended surface area water-supported photobioreactor |
JP2008178871A (ja) | 2006-12-28 | 2008-08-07 | Tohoku Techno Arch Co Ltd | 強塩基性陰イオン交換樹脂の再生方法 |
US7977076B2 (en) | 2006-12-29 | 2011-07-12 | Genifuel Corporation | Integrated processes and systems for production of biofuels using algae |
WO2008083352A1 (en) | 2006-12-29 | 2008-07-10 | Genifuel Corporation | Production of biofuels using algae |
CN101652477A (zh) | 2007-02-02 | 2010-02-17 | 麒麟控股株式会社 | 编码木糖醇脱氢酶的dna |
US8129512B2 (en) | 2007-04-12 | 2012-03-06 | Pioneer Hi-Bred International, Inc. | Methods of identifying and creating rubisco large subunit variants with improved rubisco activity, compositions and methods of use thereof |
MX2009007356A (es) | 2007-05-02 | 2009-10-08 | Ouro Fino Participacoes E Empr | Proceso para producir biodiesel y/o aceite combustible. |
JP5628024B2 (ja) | 2007-05-15 | 2014-11-19 | ダウ グローバル テクノロジーズ エルエルシー | 高弾性発泡体 |
US8801975B2 (en) | 2007-05-17 | 2014-08-12 | Cooper Industries, Llc | Vegetable oil dielectric fluid composition |
ATE540112T1 (de) * | 2007-06-01 | 2012-01-15 | Sapphire Energy Inc | Verwendung gentechnisch veränderter organismen zur erzeugung biomasse abbauender enzyme |
AU2008259834B2 (en) | 2007-06-01 | 2013-08-01 | Corbion Biotech, Inc. | Production of oil in microorganisms |
US7914832B2 (en) | 2007-06-01 | 2011-03-29 | Kyoto Eiyo Co., Ltd. | Method for producing chlorella fermented food |
WO2008156651A1 (en) | 2007-06-12 | 2008-12-24 | Cps Biofuels, Inc. | Production of gasoline from fermentable feedstocks |
US20090018300A1 (en) | 2007-07-11 | 2009-01-15 | Archer-Daniels-Midland Company | Monomers and polymers from bioderived carbon |
CN101092353B (zh) * | 2007-07-12 | 2010-12-01 | 上海交通大学 | 动植物油脂转化脂肪酸单酯的制备方法 |
CN101130513A (zh) | 2007-08-24 | 2008-02-27 | 北京科技大学 | 一种从小球藻藻粉中提取纯化叶黄素的方法 |
KR101650680B1 (ko) | 2007-08-31 | 2016-08-23 | 디에스엠 아이피 어셋츠 비.브이. | 다중불포화된 지방산 함유 고체 지방 조성물 및 그의 용도 및 생산 |
US20090197312A1 (en) | 2007-09-07 | 2009-08-06 | Helsinki University Of Technology | Production of fat from alcohol |
WO2009035551A1 (en) | 2007-09-12 | 2009-03-19 | Martek Biosciences Corporation | Biological oils and production and uses thereof |
WO2009036385A2 (en) | 2007-09-12 | 2009-03-19 | Kuehnle Agrosystems, Inc. | Expression of nucleic acid sequences for production of biofuels and other products in algae and cyanobacteria |
US8323935B2 (en) * | 2007-10-03 | 2012-12-04 | E I Du Pont De Nemours And Company | Optimized strains of Yarrowia lipolytica for high eicosapentaenoic acid production |
CA2704371A1 (en) | 2007-11-01 | 2009-05-07 | Wake Forest University School Of Medicine | Compositions and methods for prevention and treatment of mammalian diseases |
FR2924126B1 (fr) | 2007-11-28 | 2011-04-15 | Roquette Freres | Nouveau procede de culture d'une microalgue heterotrophe |
US20090145392A1 (en) | 2007-11-30 | 2009-06-11 | Clark Richard Hugh | Fuel formulations |
US8815567B2 (en) | 2007-11-30 | 2014-08-26 | E I Du Pont De Nemours And Company | Coenzyme Q10 production in a recombinant oleaginous yeast |
EP2231864B1 (en) * | 2007-12-11 | 2017-05-24 | Synthetic Genomics, Inc. | Secretion of fatty acids by photosynthetic microorganisms |
GB0724720D0 (en) | 2007-12-19 | 2008-01-30 | Ici Plc | Triglyceride macromonomers |
WO2009105620A1 (en) | 2008-02-20 | 2009-08-27 | Cco Technology, Ltd. | Selective short chain monounsaturated oils |
CN101230364A (zh) | 2008-02-25 | 2008-07-30 | 清华大学 | 一种利用异养小球藻高密度发酵生产生物柴油的方法 |
US8048654B2 (en) | 2010-06-09 | 2011-11-01 | Joule Unlimited Technologies, Inc. | Methods and compositions for the recombinant biosynthesis of fatty acids and esters |
US8598378B2 (en) * | 2008-03-14 | 2013-12-03 | University Of Hawaii | Methods and compositions for extraction and transesterification of biomass components |
US8043496B1 (en) | 2008-03-18 | 2011-10-25 | Peter Allen Schuh | System for extracting oil from algae |
AU2009231810A1 (en) | 2008-03-31 | 2009-10-08 | Kuehnle Agrosystems, Inc. | Nuclear based expression of genes for production of biofuels and process co-products in algae |
MX2010011065A (es) | 2008-04-09 | 2010-12-06 | Solazyme Inc | Modificacion química directa de biomasa microbiana y aceites microbianos. |
US20100170144A1 (en) | 2008-04-09 | 2010-07-08 | Solazyme, Inc. | Hydroprocessing Microalgal Oils |
WO2009140354A1 (en) | 2008-05-13 | 2009-11-19 | Cargill, Incorporated | Polyol made from partially hydrogenated, fully epoxidized natural oils |
CN101280328B (zh) | 2008-05-27 | 2011-06-29 | 清华大学 | 一种从自养到异养两步培养小球藻生产生物柴油的方法 |
US8435790B2 (en) | 2008-07-25 | 2013-05-07 | The Regents Of The University Of California | Methods of modulating lipid concentrations in eukaryotic cells |
US8273694B2 (en) | 2008-07-28 | 2012-09-25 | Jeffrey A Brown | Synthetic compositions obtained from algae |
BRPI0916598A2 (pt) | 2008-07-28 | 2017-05-30 | Qteros Inc | métodos e composições para aumentar a produção de produtos em micro-organismos |
US20100035309A1 (en) | 2008-08-06 | 2010-02-11 | Luca Technologies, Inc. | Analysis and enhancement of metabolic pathways for methanogenesis |
US8927475B2 (en) | 2008-08-08 | 2015-01-06 | The Dial Corporation | Consumer products comprising algae derived ingredients |
WO2010019813A2 (en) | 2008-08-13 | 2010-02-18 | Sapphire Energy, Inc. | Production of fatty actds by genetically modified photosynthetic organisms |
AU2009299075B2 (en) | 2008-10-03 | 2017-01-19 | Agrisoma Bioscience Inc. | Production of modified fatty acids in plants |
JP2012504963A (ja) | 2008-10-07 | 2012-03-01 | エルエス9・インコーポレイテッド | 脂肪アルデヒドを生産するための方法および組成物 |
WO2010045268A2 (en) * | 2008-10-13 | 2010-04-22 | Learning Curve Brands, Inc. | Electronic interactive toy |
US20120128851A1 (en) | 2008-10-14 | 2012-05-24 | Solazyme, Inc | Novel microalgal food compositions |
US20100303990A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | High Protein and High Fiber Algal Food Materials |
US20100297323A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Gluten-free Foods Containing Microalgae |
US20100303989A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Microalgal Flour |
US20100297295A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Microalgae-Based Beverages |
US20100303957A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Edible Oil and Processes for Its Production from Microalgae |
US20130122180A1 (en) | 2008-10-14 | 2013-05-16 | Solazyme, Inc. | Microalgal Food Compositions |
CN104770424A (zh) | 2008-10-14 | 2015-07-15 | 索拉兹米公司 | 微藻生物质的食品组合物 |
US20100297292A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Reduced Pigmentation Microalgae Strains and Products Therefrom |
US20100297325A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Egg Products Containing Microalgae |
US20100297331A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Reduced Fat Foods Containing High-Lipid Microalgae with Improved Sensory Properties |
US20100297296A1 (en) | 2008-10-14 | 2010-11-25 | Solazyme, Inc. | Healthier Baked Goods Containing Microalgae |
US20100303961A1 (en) | 2008-10-14 | 2010-12-02 | Solazyme, Inc. | Methods of Inducing Satiety |
ES2583639T3 (es) | 2008-11-28 | 2016-09-21 | Terravia Holdings, Inc. | Producción de aceites específicos en microorganismos heterótrofos |
MX2011006081A (es) | 2008-12-11 | 2011-06-24 | Bio Architecture Lab Inc | Biosintesis de productos quimicos de uso generalizado. |
CA2747516C (en) | 2008-12-23 | 2019-11-05 | Ls9, Inc. | Methods and compositions related to thioesterase enzymes |
US8389625B2 (en) | 2008-12-23 | 2013-03-05 | Exxonmobil Research And Engineering Company | Production of synthetic hydrocarbon fluids, plasticizers and synthetic lubricant base stocks from renewable feedstocks |
US20100196575A1 (en) * | 2009-01-30 | 2010-08-05 | Solae, Llc | Melting Vegetable Protein Based Substitute Cheese |
CN101824440A (zh) | 2009-03-04 | 2010-09-08 | 中国科学院大连化学物理研究所 | 一种微生物油脂的分离方法 |
AU2010229686B2 (en) | 2009-03-27 | 2015-09-03 | Corteva Agriscience Llc | Dielectric heat-transfer fluid |
AU2010236412B2 (en) | 2009-04-14 | 2015-10-01 | Corbion Biotech, Inc. | Methods of microbial oil extraction and separation |
CN102946738B (zh) | 2009-04-14 | 2015-04-01 | 索拉兹米公司 | 新颖的微藻食物组合物 |
WO2010130725A1 (en) | 2009-05-13 | 2010-11-18 | Basf Plant Science Company Gmbh | Acyltransferases and uses thereof in fatty acid production |
WO2011026008A1 (en) | 2009-08-28 | 2011-03-03 | Phycal Llc | Biofuel from recombinant oleginous algae using sugar carbon sources |
US20110162259A1 (en) | 2009-09-25 | 2011-07-07 | Ls9, Inc. | Production of fatty acid derivatives |
EP2327776A1 (en) | 2009-11-30 | 2011-06-01 | Institut National De La Recherche Agronomique | Method for the production of Very Long Chain Fatty Acids (VLCFA) by fermentation with a recombinant Yarrowia sp |
SG181114A1 (en) | 2009-12-18 | 2012-07-30 | Cargill Inc | Brassica plants yielding oils with a low total saturated fatty acid content |
EP2519642B1 (en) | 2009-12-28 | 2017-10-25 | DSM IP Assets B.V. | Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof |
WO2011082253A2 (en) | 2009-12-30 | 2011-07-07 | Board Of Trustees Of Michigan State University | A method to produce acetyldiacylglycerols (ac-tags) by expression ofan acetyltransferase gene isolated from euonymus alatus (burning bush) |
EP2558565A4 (en) | 2010-04-14 | 2014-01-29 | Solazyme Inc | FUEL AND CHEMICAL PRODUCTION OF OIL-HOLDING YEAST |
US20110256268A1 (en) | 2010-04-14 | 2011-10-20 | Solazyme, Inc. | Oleaginous Yeast Food Compositions |
JP5865894B2 (ja) | 2010-04-14 | 2016-02-17 | ソラザイム ロケット ニュートリショナルズ, エルエルシー | 高脂質微細藻類粉末食品組成物 |
AT509777B1 (de) | 2010-04-30 | 2012-03-15 | Orphanidis Pharma Res Gmbh | Adhesive retardformulierungen zur lokalen verabreichung von curcumin |
JP5868962B2 (ja) | 2010-05-28 | 2016-02-24 | ソラザイム, インコーポレイテッドSolazyme Inc | 組み換え従属栄養性微生物から産生された用途に応じた油 |
EP3521408B1 (en) | 2010-11-03 | 2021-12-22 | Corbion Biotech, Inc. | Genetically-engineered chlorella or prototheca microbe and oil produced therefrom |
US8530207B2 (en) | 2010-12-23 | 2013-09-10 | Exxonmobil Research And Engineering Company | Photosynthetic microorganisms comprising exogenous prokaryotic acyl-ACP thioesterases and methods for producing fatty acids |
KR101964965B1 (ko) | 2011-02-02 | 2019-04-03 | 테라비아 홀딩스 인코포레이티드 | 재조합 유지성 미생물로부터 생산된 맞춤 오일 |
MX339607B (es) | 2011-05-06 | 2016-05-31 | Solazyme Inc | Microorganismos geneticamente modificados que metabolizan xilosa. |
BR112014012917A2 (pt) | 2011-11-28 | 2017-06-13 | Solazyme Inc | ácido nucleico recombinante, cassete de expressão, célula, método para obter óleo microbiano, e, óleo microbiano |
SG11201403419SA (en) | 2011-12-23 | 2014-07-30 | Solazyme Inc | Algal thermoplastics, thermosets, paper, adsorbants and absorbants |
BR112014025719A8 (pt) | 2012-04-18 | 2017-10-03 | Solazyme Inc | Óleos customizados |
US9719114B2 (en) | 2012-04-18 | 2017-08-01 | Terravia Holdings, Inc. | Tailored oils |
CA2903494A1 (en) | 2013-03-08 | 2014-09-12 | Solazyme, Inc. | Oleaginous microbial lubricants |
EP2993993A2 (en) | 2013-04-26 | 2016-03-16 | Solazyme, Inc. | Low polyunsaturated fatty acid oils and uses thereof |
MX369685B (es) | 2013-10-04 | 2019-11-19 | Terravia Holdings Inc | Aceites adaptables. |
US9394550B2 (en) | 2014-03-28 | 2016-07-19 | Terravia Holdings, Inc. | Lauric ester compositions |
US9969990B2 (en) | 2014-07-10 | 2018-05-15 | Corbion Biotech, Inc. | Ketoacyl ACP synthase genes and uses thereof |
CN107087416A (zh) | 2014-07-24 | 2017-08-22 | 泰拉瑞亚控股公司 | 变体硫酯酶及使用方法 |
JP2018512851A (ja) | 2015-04-06 | 2018-05-24 | テラヴィア ホールディングス, インコーポレイテッド | Lpaatアブレーションを有する油産生微細藻類 |
US20180216144A1 (en) | 2015-09-28 | 2018-08-02 | Corbion Biotech, Inc. | Triglyceride oils having asymmetric triglyceride molecules |
-
2011
- 2011-05-27 JP JP2013512064A patent/JP5868962B2/ja active Active
- 2011-05-27 EP EP11787551.8A patent/EP2576800B1/en active Active
- 2011-05-27 CN CN2011800368709A patent/CN103097540A/zh active Pending
- 2011-05-27 AU AU2011257982A patent/AU2011257982B2/en active Active
- 2011-05-27 US US13/118,365 patent/US8592188B2/en active Active
- 2011-05-27 ES ES11787551T patent/ES2718489T3/es active Active
- 2011-05-27 AU AU2011257983A patent/AU2011257983B2/en active Active
- 2011-05-27 KR KR1020127034232A patent/KR101916421B1/ko active IP Right Grant
- 2011-05-27 CN CN201610609653.9A patent/CN106135460B/zh active Active
- 2011-05-27 WO PCT/US2011/038463 patent/WO2011150410A2/en active Application Filing
- 2011-05-27 MX MX2012013777A patent/MX339639B/es active IP Right Grant
- 2011-05-27 EP EP11787552.6A patent/EP2575486B1/en active Active
- 2011-05-27 KR KR1020187031842A patent/KR102148462B1/ko active IP Right Grant
- 2011-05-27 ES ES11787552T patent/ES2898678T3/es active Active
- 2011-05-27 CN CN201180036696.8A patent/CN103124499B/zh active Active
- 2011-05-27 MX MX2016007127A patent/MX352746B/es unknown
- 2011-05-27 MX MX2012013756A patent/MX356949B/es active IP Right Grant
- 2011-05-27 SG SG10201504197SA patent/SG10201504197SA/en unknown
- 2011-05-27 CA CA2801024A patent/CA2801024A1/en not_active Abandoned
- 2011-05-27 BR BR112012030329A patent/BR112012030329A2/pt not_active Application Discontinuation
- 2011-05-27 CN CN201710138384.7A patent/CN107058116A/zh active Pending
- 2011-05-27 BR BR112012030333A patent/BR112012030333A2/pt not_active Application Discontinuation
- 2011-05-27 CA CA2801057A patent/CA2801057C/en active Active
- 2011-05-27 SG SG10201504187YA patent/SG10201504187YA/en unknown
- 2011-05-27 US US13/118,369 patent/US20110293785A1/en not_active Abandoned
- 2011-05-27 KR KR1020127034225A patent/KR101899938B1/ko active IP Right Grant
- 2011-05-27 SG SG2012087276A patent/SG185780A1/en unknown
- 2011-05-27 SG SG2012087359A patent/SG185781A1/en unknown
- 2011-05-27 CA CA3039432A patent/CA3039432A1/en not_active Abandoned
- 2011-05-27 JP JP2013512065A patent/JP5996527B2/ja active Active
- 2011-05-27 WO PCT/US2011/038464 patent/WO2011150411A1/en active Application Filing
-
2012
- 2012-06-19 US US13/527,480 patent/US20130004646A1/en not_active Abandoned
- 2012-07-06 US US13/543,666 patent/US8765424B2/en active Active
- 2012-09-28 US US13/630,757 patent/US9279136B2/en active Active
- 2012-10-11 US US13/650,018 patent/US9109239B2/en active Active
- 2012-12-05 ZA ZA2012/09186A patent/ZA201209186B/en unknown
- 2012-12-05 ZA ZA2012/09185A patent/ZA201209185B/en unknown
-
2014
- 2014-05-13 US US14/276,943 patent/US9255282B2/en active Active
-
2015
- 2015-08-05 US US14/819,117 patent/US10006034B2/en active Active
- 2015-10-07 JP JP2015199078A patent/JP2016005484A/ja not_active Withdrawn
- 2015-12-18 US US14/975,016 patent/US9657299B2/en active Active
-
2016
- 2016-01-06 JP JP2016001030A patent/JP6150911B2/ja active Active
- 2016-05-05 AU AU2016202905A patent/AU2016202905B2/en active Active
-
2017
- 2017-03-14 JP JP2017048186A patent/JP6542283B2/ja active Active
-
2018
- 2018-05-08 AU AU2018203211A patent/AU2018203211A1/en not_active Abandoned
- 2018-05-21 US US15/985,576 patent/US20180327758A1/en not_active Abandoned
-
2019
- 2019-01-30 JP JP2019014051A patent/JP2019062919A/ja active Pending
Non-Patent Citations (2)
Title |
---|
Eukaryotic Cell, Vol. 9, No. 6, Pages 486-501(공개일: 2010. 4.)* |
Plant Journal, Vol. 54, Pages 621-639(공개일: 2008.)* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102148462B1 (ko) | 종속영양 미생물유기체로부터 생성된 맞춤 오일 | |
AU2016247159B2 (en) | Tailored oils produced from recombinant oleaginous microorganisms | |
KR102001129B1 (ko) | 재조합 종속영양성 미생물에서 맞춤 오일의 제조 | |
KR102065526B1 (ko) | 유동점이 낮은 미생물 오일, 이 오일로 제조된 유전성 유체 및 관련 방법 | |
KR101504618B1 (ko) | 미생물에서 오일의 생성 | |
KR20140033378A (ko) | 자일로오스를 대사시키는 유전자 조작된 미생물 | |
KR20150001830A (ko) | 맞춤 오일 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |