TW200813222A - Polyunsaturated fatty acid production in heterologous organisms using PUFA polyketide synthase systems - Google Patents

Polyunsaturated fatty acid production in heterologous organisms using PUFA polyketide synthase systems Download PDF

Info

Publication number
TW200813222A
TW200813222A TW096108937A TW96108937A TW200813222A TW 200813222 A TW200813222 A TW 200813222A TW 096108937 A TW096108937 A TW 096108937A TW 96108937 A TW96108937 A TW 96108937A TW 200813222 A TW200813222 A TW 200813222A
Authority
TW
Taiwan
Prior art keywords
plant
seq
pufa
genetically modified
plant cell
Prior art date
Application number
TW096108937A
Other languages
English (en)
Inventor
James G Metz
Jerry M Kuner
James Casey Lippmeier
Maurice Martin Moloney
Cory Lee Nykiforuk
Original Assignee
Martek Biosciences Corp
Sembiosys Genetics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Martek Biosciences Corp, Sembiosys Genetics Inc filed Critical Martek Biosciences Corp
Publication of TW200813222A publication Critical patent/TW200813222A/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/04Plant cells or tissues
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/04Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P15/00Drugs for genital or sexual disorders; Contraceptives
    • A61P15/06Antiabortive agents; Labour repressants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/08Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/08Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
    • A61P19/10Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease for osteoporosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/08Antiepileptics; Anticonvulsants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/24Antidepressants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/02Nutrients, e.g. vitamins, minerals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/06Antihyperlipidemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/06Immunosuppressants, e.g. drugs for graft rejection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • C12P7/6432Eicosapentaenoic acids [EPA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • C12P7/6434Docosahexenoic acids [DHA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6472Glycerides containing polyunsaturated fatty acid [PUFA] residues, i.e. having two or more double bonds in their backbone
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Molecular Biology (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Rheumatology (AREA)
  • Cell Biology (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Immunology (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Nutrition Science (AREA)
  • Pain & Pain Management (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Psychiatry (AREA)

Description

200813222 九、發明說明: C發明所屬之技術領域3 案之$互來昭 本申請案係依據35 U.S.C· § 119(e)申明美國專利暫時 5申請案序號60/784,616,於2006年3月21曰提申,以及美國 專利暫時申請案序號60/783,205,於2006年3月15曰提申, 之優先權。美國專利暫時申請序號60/784,616,以及美國專 利暫時申請案序60/783,205,於2006年3月15日提申,在此 併入本案以作為參考資料。 10 發明領域 本發明一般係相關於使用附屬蛋白與其標的物,以增 進多不飽和脂肪酸(PUFAs),尤其是長鏈PUFAs(LCPUFAs) 於宿主中之製造,該宿主經PKS-類似系統進行基因修飾, 以製造此類PUFAs(即PUFA PKS系統或PUFA合成酶)。本發 15 明亦相關於經基因修飾之生物體,以表現此類附屬蛋白或 此類標的之修飾,並相關於製造與使用此類生物體之方法。 t先前技術3 發明背景 多不飽和脂肪酸(PUFA)被認為可使用於營養應用、醫 20 藥應用、工業應用,以及其他目的。然而,目前得自天然 來源與化學合成來源之PUFAs並無法滿足工業需求。衍生 自油類種子作物之蔬菜油相對較便宜,且不會有與魚油相 關之污染組織。然而,在工業發展植物油中發現之PUFAs 一般限制於次亞麻油酸(18個碳,具有2個雙鍵,在delta 9 5 200813222 與12位置-18 : 2 delta 9,12),以及次亞麻油酸(18 : 3 ddta 9,12,15)。數種單獨之去飽和酶與鏈延長酶酵素係自次亞麻 油與次亞麻油酸合成脂肪酸,以製造更多飽和與更長鏈 PUFAs所必需。因此,以基因工程表現puFAs,如epa與 5二十二碳六烯酸PHA)之植物宿主細胞,為表現數種合成 所需之酵素所需要。此外,為了製造出可用量之此類 PUFAs’需要額外之基因工程。因此,另一製造PUFAs系統, 其為聚酮合成酶-類似系統,之發現,便提供了植物或其他 生物體(如微生物體)基因工程之替代,其使用"典型"或,,標 10準’’脂肪酸合成路徑之去飽和酶與鏈延長酶。 目前已有許多研究相關於在油類種子作物中製造 PUFA,藉由修倚内生性製造之脂肪酸。這些具有各種脂肪 酸鏈延長酶與去飽和酶獨立基因之基因修飾之植物,可生 產出含有明顯量之PUFA如EPA,並含有明顯量之混合較短 15鏈與較不飽和PUFA之葉子或種子(Qi et al·,Nature Biotech. 22:739(2004);PCT 公開案號 WO 04/071467; Abbadietal.,
Plant Cell 16: 1(2004)); Napier and Sayanova, Proceedings of the Nutrition Society(2005),64 : 387-393 ; Robert et al·, Functional Plant Biology(2005)32 : 473_479 ;或U.S·專利申 20 請案公開號2004/0172682。 因此,目前此技術上仍需要可有效率且有效地自油類 種子植物中製造大量富含希望之PUFA之脂質(如,三醯基 甘油(TAG)與磷脂質(PL))。 聚酮合成酶(PKS)系統一般為此領域已知,為相關於脂 200813222 肪酸合成酶(FAS)系統之酵素複合物,但通常經高度修飾, 以製造特化之產物,僅顯示脂肪酸之些許相似性。然而, 目前已知,聚酮合成酶系統存在於海洋細菌與某些微藻類 (microalgae),其可自乙醯基-CoA與丙二醯基-CoA合成多不 5 飽和脂肪酸(PUFAs)。這些系統在此稱之為PUFA PKS系 統、用於製造PUFA之PKS-類似系統,或PUFA合成酶系統。 沙雷菌(Shewanella)與另一海洋細菌,海洋弧菌(Vibrio marinus)中,用於PUFA合成之PUFA PKS路徑,係詳細描 述於美國專利號6,140,486。在真核生物破囊壺菌 10 (thraustochytrid),裂殖壺菌(Schizochytrium)中用於PUFA合 成之PUFA PKS路徑,係詳細描述於美國專利號 6,566,583。在真核生物中,如破囊壺菌目成員,用於PUFA 合成之PUFA PKS路徑,包括關於裂殖壺菌(Schizochytrium) 中PUFA PKS系統之額外描述,以及破囊壺菌 15 (thraustochytrium)中PUFA PKS系統之辨識,係詳細描述於 美國專利申請案公開號20020194641,公開於2002年12月 19日,以及PCT公開案號WO 2006/135866,公開於2006年 12月21日。美國專利申請公開案號,20040235127公開於 2004年11月25曰’係揭示破囊壺菌(thraustochytrium)中 20 pUFA PKS系統之詳細架構,尤其是二十碳五烯酸(C2〇 : 5, ω-3)(ΕΡΑ)之製造,以及其他使用此系統之PUFA。美國專利 申請公開案號20050100995,公開於2005年5月12日,係揭 示沙雷菌(Shewanella olleyana)與沙雷菌(Shewanella japonica)中之PUFAPKS糸統之架構與功能描述,以及此類 7 200813222 系統之用途。這些申請案亦揭示生物體之基因修飾,包括 微生物體與植物,具有包含PUFAPKS路徑之基因,以及以 此類生物體製造PUFA。此外,PCT專利公開案號w〇 05/097982,係描述巫肯尼亞菌(Ulkenia)中之PUFA PKS系 5 統,以及美國專利申請公開案號20050014231,係描述金黃 色破囊壺菌(thraustochytrium aureum)中之PUFA PKS基因 與其產生之蛋白質。上述申請案之每一者皆在此併入本案 以作為參考資料。 因此,該PUFA合成酶家族酵素之基本區塊(d〇main)結 10構與序列特性,已經描述,顯示出PUFA合成酶可重新合成 各種PUFA(如,二十碳五烯酸(EPA ; C2〇 : 5n_3)、二十二碳 六烯酸(DHA ·’ 22 : 6η·3),以及二十二碳五烯酸(DpAn_6 ; C22· 5n-6)。已瞭解PUFA產物會堆積於宿主生物體磷脂質 (PL)中’以及,在某些情況下,天然脂質中(如,三酿基甘 15油(TAG))然而,就本發明人背景知識所瞭解,目前尚未 定義出這些標的物之酵素中,pUFA轉移之確切機制。 由於瞭解生物體中這些標的終點之ρυρΑ轉移之確切 機制,可幫助經基因修舞以製造ρ·之生物體中,pwA 之製造效率增加及/或改良,因此目前此領域需要有關此種 20機制之資訊。因此’目前此領域需要一種製造PUFA之改良 方法^^於:基因修錦以產生此類p u F A於植物與微生物 體中,1瞭解此機制則更具優勢。 【曰月内j 發明概要 200813222 本發明之一實施例係相關於一種經分離之核酸分子, 包含一編碼醯基_(:〇八合成酶(ACoAS),其會催化長鏈PUFA 自由脂肪酸(FFA)轉換為醯基-CoA,之核酸序列,其中該核 酸序列編碼一醯基_CoA合成酶(ACoAS),其至少60%相等 5 於ACoAS,具有一胺基酸序列選自於由:SEQ ID NO : 83、 SEQ ID NO : 85、SEQ ID NO : 87、SEQ ID NO : 89、SEQ ID NO : 9卜 SEQ ID NO : 93、SEQ ID NO : 95、SEQ ID NO : 97,以及SEQ ID NO : 99組成之族群。在另一觀點中,該 核酸序列係編碼一醯基-CoA合成酶(ACoAS),具有胺基酸 10 序列選自於由:SEQ ID NO : 83、SEQ ID NO : 85、SEQ ID NO : 87、SEQ ID NO : 89、SEQ ID NO : 9卜 SEQ ID NO : 93、SEQ ID NO : 95、SEQ ID NO : 97,以及SEQ ID NO : 99組成之族群。在一觀點中,該核酸序列係編碼一胺基酸 序列,選自於由:SEQ ID NO : 83、SEQ ID NO : 85,以及 15 SEQ JD NO : 97組成之族群。在一觀點中,該核酸序列係 選自於由:SEQ ID NO : 82、SEQ ID NO : 84、SEQ ID NO : 86、SEQ ID NO : 88、SEQ ID NO : 90、SEQ ID NO : 92、 SEQ ID NO : 94、SEQ ID NO : 96,以及SEQ ID NO : 98 組成之族群。 20 本發明之另一觀點係相關於一種經分離之核酸分子, 包含編碼一蛋白質之核酸序列,該蛋白質利用PUFA_CoA 作為受質,形成磷脂質(PL)或三醯基甘油(TAG),其中該蛋 白質包含一胺基酸,其至少60%相等於一胺基酸序列,選 自於由:SEQ ID NO : 102、SEQ ID NO : 104、SEQ ID NO : 9 200813222 107、SEQ ID NO: 110,以及 SEQ ID NO: 113 組成之族群。 在一觀點中,該核酸係編碼一蛋白質,包含一胺基酸序列, 選自於由:SEQ ID NO: 102、SEQ ID NO: 104、SEQ ID NO : 107、SEQ ID NO: 110,以及 SEQ ID NO: 113 組成之族群。 5 在一觀點中,該核酸係編碼一蛋白質,包含一胺基酸序列, 選自於由:SEQ ID NO: 102與SEQ ID NO: 104組成之族群。 在一觀點中,該核酸序列係選自於由SEQ ID NO: 1〇〇、SEq ID NO : 102、SEQ ID NO : 103、SEQ ID NO : 105、SEQ ID NO : 106、SEQ ID NO : 108、SEQ ID NO : 109、SEQ ID NO : 10 111,以及SEQ ID NO : 112組成之族群。 本發明之另一觀點係相關於一種經分離之之蛋白質, 係由上述核酸分子所編碼。 本發明之另一實施例係相關於一種一種重組核酸分 子,包含上述核酸分子,操作性地與一表現控制序列聯結。 15 本發明之另一實施例係相關於一種重組宿主細胞,包 含上述之重組核酸分子。在一觀點中,該宿主細胞為_生 物體。在另一觀點中,該宿主細胞為一植物細胞。 本發明之另一實施例係相關於一種經基因修飾之生物 體,其中該生物體已經基因修飾,以表現上述之經分離之 2〇 核酸分子或其組合物。在一觀點中,該生物體係表 PUFA合成酶,以及一磷酸泛醯酼基轉移酶(PPTase)。在― 觀點中,該生物體已經基因修飾,以表現該合成酶與 PPTase。在一觀點中,該生物體係包含一額外之基因修飾, 以剔除或使該生物體表現之脂肪酸合成酶(FAS)失| # 10 200813222 性。在一觀點中,該生物體係包含一額外之基因修飾,以 降低丙二醯CoA與PUFA合成酶之競爭,或增加丙二醯C〇A 在生物體中之含量。 另一實施例係相關於一種經基因修飾之生物體,其中 5 該生物體係表現一PUFA合成酶,其製造至少一多不飽和脂 肪酸(PUFA),以及一磷酸泛醯巯基轉移酶(PPTase),真其 中該生物體含有一基因修飾,以表現一或多個異源性醯基 -CoA合成酶(ACoAS),或一同源性該合成酶,其會催化長 鏈PUFA自由脂肪酸(FFA)轉換為醯基-CoA。在一觀點中, 1〇 該生物體係經一核酸分子轉型,其包含一核酸序列,係编 碼一醯基-CoA合成酶(ACoAS),或其同源物,來自會内生 性製造PUFA合成酶之生物體。在一觀點中,該生物體係録 由一核酸分子轉型,該核酸包含一編碼來自隱甲藻 (Crypthecodinium cohnii)之醯基_CoA合成酶(ACoAS),或其 15 同源物之核酸序列,其中該ACoAS或其同源物係催化長键 PUFA自由脂肪酸(FFA)轉換為醯基-CoA。在一觀點中,該 生物體係經由一核酸分子轉型,該核酸包含一編碼來自破 囊壺菌目微生物體之醯基-CoA合成酶(ACoAS),或其同源 物之核酸序列,其中該ACoAS或其同源物係催化長鏈 2〇 PUFA自由脂肪酸(FFA)轉換為醯基-CoA。在一觀點中,該 生物體係經由一核酸分子轉型,該核酸包含一編碼來自裂 殖壺菌(Schizochytrium)之醯基-CoA合成酶(ACoAS),或其 同源物之核酸序列,其中該ACoAS或其同源物係催化長鏈 PUFA自由脂肪酸(FFA)轉換為醯基-CoA。在一觀點中,該 11 200813222 生物體係包含一額外之基因修飾,以剔除或使該生物體表 現之脂肪酸合成酶(FAS)失去活性。在一觀點中,該生物體 係包含一額外之基因修飾,以降低丙二醯CoA與PUFA合成 酶之競爭,或增加丙二醯CoA在生物體中之含量。在一觀 5 點中,該生物體包含一額外之基因修飾,以自可内生性製 造PUFA之生物體中表現一或多種異源性蛋白質,其中該蛋 白質利用PUFA-CoA作為受質,形成磷脂質(PL)或三醯基甘 油(TAG)。 另一實施例係相關於一種經基因修飾之生物體,其中 10 該生物體係表現一PUFA合成酶,其可製造至少一多不飽和 脂肪酸(PUFA) ’以及一填酸泛酿减基轉移酶(ppTase),其 中該生物體包含一基因修飾,以剔除或使該生物體表現之 脂肪酸合成酶(FAS)失去活性。在一觀點中,該生物體包含 一額外之基因修飾,以降低丙二醯CoA與PUFA合成酶之競 15 爭,或增加丙二醯CoA在生物體中之含量。 另一實施例係相關於一種經基因修飾之生物體,其中 該生物體係表現一PUFA合成酶,其可製造至少一多不飽和 脂肪酸(PUFA),以及一磷酸泛醯巯基轉移酶(PPTase),以 及其中該生物體含有一基因修飾,以降低丙二醯c〇A與 2〇 PUFA合成酶之競爭,或增加丙二醯CoA在生物體中之含 量。在一觀點中,該生物體包含一額外之基因修飾,以剔 除或使該生物體表現之脂肪酸合成酶(FAS)失去活性。 又一實施例係相關於一種經基因修飾之生物體,其中 該生物體係表現一PUFA合成酶,其可製造至少一多不飽和 12 200813222 脂肪酸(PUFA),以及一磷酸泛醯巯基轉移酶(ppTase),其 中該生物體包含一基因修飾,以自可内生性製造PUFAs之 生物體中表現一或多種異源性蛋白質,其中該蛋白質利用 PUFA-CoA作為受質,形成磷脂質(PL)或三醯基甘油 5 (TAG)。在一觀點中,該蛋白質為DAGAT或LPAAT。在一 觀點中,該生物體係以一核酸分子轉型,該核酸分子包含 一核酸序列,編碼來自破囊壺菌(thraustochytrid)或網黏菌 (labyrinthulid)微生物體之醯基-CoA合成酶(ACoAS),或其 同源物,其利用PUFA-CoA為受質,形成磷脂質(PL)或三 10 醯基甘油(TAG)。在一觀點中,該生物體係經由一核酸分子 轉型,該核酸分子包含一核酸序列,編碼得自隱甲藻 (Crypthecodinium cohnii)之醯基-CoA合成酶(ACoAS),或其 同源物,其利用PUFA-CoA為受質,形成磷脂質(pl)或三 醯基甘油(TAG)。在一觀點中,該生物體包含一額外之修 15飾,以表現一或多種異源性醯基-CoA合成酶(ACoAS),或 其同源物,可催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基 -CoA。在一觀點中,該生物體包含一額外之基因修飾,以 剔除或使該生物體表現之脂肪酸合成酶(FAS)失去活性。在 一觀點中,該生物體包含一額外之基因修飾,以降低丙二 2〇醢C〇A與PUFA合成_之競爭’或增加丙二醯c〇a在生物體 中之含量。 在一實施例中,本發明係提供一種經基因修飾之生物 體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 13 200813222 肪酸(PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾; 且其中该生物體含有一基因修飾,以抑制一蛋白質之表現 或活性,該蛋白質選自於由KASII與KASIn組成之族群。 在另一實施例中,本發明係提供一種經基因修飾之生 5物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾, 以及其中編碼PUFA合成酶或PPTase之至少一核酸分子,係 操作性地與編碼色素體-標的序列,由SEQ ID NO : 81代表 10 之核酸序列聯結。 在另一實施例中,本發明係提供一種經基因修飾之生 物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA) ’與磷:酸泛酿敏基轉移酶(ppTase)基因修飾, 15 且其中該生物體含有一基因修飾,以抑制一蛋白質之表現 或活性,該蛋白質選自於由KASII與KASIII組成之族群, 且其中5玄生物體含有一名頁外之基因修飾,以表現一或多種 異源性醯基-CoA合成酶(ACoAS)或其同源物,其會催化長 鏈PUFA自由脂肪酸(FFA)轉換為醯基_c〇A。 20 在又一實施例中,本發明係提供一種經基因修飾之生 物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修飾; 其中至少一編碼PUFA合成酶或PPTase之核酸分子,係操作 200813222 性地與編碼色素體-標的序列,由SEQ ID N〇 : 81代表之核 酸序列聯結;或其中該生物體含有一額外之基因修飾,以 表現一或多種異源性醯基_CoA合成酶(ACoAS)或其同源 物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基 5 -CoA。 在一實施例中,本發明係提供一種經基因修飾之生物 體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯騎基轉移酶(ppTase)基因修飾; 10其中該生物體含有一基因修飾,以抑制一蛋白質之表現或 活性,該蛋白質選自於由KASII與KASIII組成之族群;其 中該生物體含有一額外之基因修飾,以自會内生性製造 PUFA合成酶之生物體中表現一或多種異源性蛋白質;以及 其中該蛋白質會利用PUFA-CoA作為受質,形成磷脂質(pl) 15 或三醯基甘油(TAG)。 在又一實施例中,本發明係提供一種經基因修飾之生 物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯酼基轉移酶(ppTase)基因修飾; 20 其中該生物體含有一基因修飾,以抑制一蛋白質之表現或 活性,該蛋白質選自於由KASII與KASIII組成之族群;其 中該生物體含有一額外之基因修飾,以自會内生性製造 PUFA合成酶之生物體中表現一或多種異源性蛋白質;其中 該蛋白質會利用PUFA-CoA作為受質,形成磷脂質(PL)或三 15 200813222 醯基甘油(TAG);以及其中該生物體含有一額外之基因修飾, 以表現一或多種異源性醯基-CoA合成酶(ACoAS)或其同源 物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基-CoA。 在另一實施例中,本發明係提供一種經基因修飾之生 5 物體,包括一包括一微生物、植物、植物之一部分,或植 物細胞,其中該生物體經PUFA合成酶,其可製造至少一多 不飽和脂肪酸(PUFA),與磷酸泛醯酼基轉移酶(ppTase)基 因修飾;其中編碼PUFA合成酶或PPTase之至少一核酸分 子,係操作性地與編碼色素體-標的序列,由SEQ ID NO : 10 81代表之核酸序列聯結;其中該生物體含有一額外之基因 修飾,以自會内生性製造PUFA合成酶之生物體中表現一或 多種異源性蛋白質;以及其中該蛋白質會利用PUFA-CoA 作為受質,形成磷脂質(PL)或三醯基甘油(TAG)。 在另一實施例中,本發明係提供一種經基因修飾之生 15 物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯Μ基轉移酶(PPTase)基因修傅; 其中至少一編碼PUFA合成酶或PPTase之核酸分子,係操作 性地與編碼色素體-標的序列,由SEQ ID NO : 81代表之核 2〇 酸序列聯結;其中該生物體含有一額外之基因修飾,以自 會内生性製造PUFA合成酶之生物體中表現一或多種異源 性蛋白質,其中該蛋白質會利用PUFA-CoA作為受質,形成 磷脂質(PL)或三醯基甘油(TAG);以及其中該生物體含有一 額外之基因修飾,以表現一或多種異源性醯基-C〇A合成酶 16 200813222 (ACoAS)或其同源物,其會催化長鏈PUFA自由脂肪酸 (FFA)轉換為醯基-CoA。 在另一實施例中,本發明係提供一種經基因修飾之生 物體,包括一微生物、植物、植物之一部分,或植物細胞, 5其中該生物體經pUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾; 其中ό亥生物體含有一基因修飾,以抑制一蛋白質之表現或 活性,該蛋白質選自於由KASII與尺八8111組成之族群;以 及其中該生物體含有一額外之基因修飾,以剔除或使内生 10性脂肪酸合成酶(FAS)失去活性,或使與該植物表現之FAS 結合之蛋白質失去活性。 在一實施例中,本發明係提供一種經基因修飾之生物 體,包括一包括一微生物、植物、植物之一部分,或植物 細胞,其中該生物體經PUFA合成酶,其可製造至少一多不 15飽和爿曰肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因 修飾;其中該生物體含有一基因修飾,以抑制一蛋白質之 表現或活性,該蛋白質選自於由KASII與㈣顺成之族 群,其中该生物體含有-額外之基因修飾,以剔除或使内 生性脂肪酸合«(FAS)失去蹄,或使與雜物表現之 20 FAS之結合蛋白質失去活性;以及其中該生物體含有一額外 之基因修飾,以表現一或多種異源性酿基-c〇a合成酶 (AC〇AS)或#同源物,其會催化㈣PUFA自由脂肪酸 (FFA)轉換為醯基_C〇A。 在實施例中’本發明係提供一種經基因修飾之生物 17 200813222 體,包括一包括一微生物、植物、植物之一部分,或植物 細胞,其中該生物體經PUFA合成酶,其可製造至少一多不 飽和脂肪酸(PUFA),與磷酸泛醯酼基轉移酶(PPTase)基因 修飾;其中該生物體含有一基因修飾,以抑制一蛋白質之 5 表現或活性,該蛋白質選自於由KASII與KASIII組成之族 群;其中該生物體含有一額外之基因修飾,以剔除或使内 生性脂肪酸合成酶(FAS)失去活性,或使與該植物表現之 FAS結合之蛋白質失去活性;其中該生物體含有一額外之基 因修飾,以自會内生性製造PUFA合成酶之生物體中表現一 10 或多種異源性蛋白質;且其中該蛋白質會利用PUFA-CoA 作為受質,形成磷脂質(PL)或三醯基甘油(TAG)。 在一實施例中,本發明係提供一種經基因修飾之生物 體,包括一包括一微生物、植物、植物之一部分,或植物 細胞,其中該生物體經PUFA合成酶,其可製造至少一多不 15 飽和脂肪酸(PUFA),與磷酸泛醯Μ基轉移酶(PPTase)基因 修飾;其中該生物體含有一基因修飾,以抑制一蛋白質之 表現或活性,該蛋白質選自於由KASII與KASIII組成之族 群;其中該生物體含有一額外之基因修飾,以剔除或使内 生性脂肪酸合成酶(FAS)失去活性,或使與該植物表現之 20 FAS結合之蛋白質失去活性;其中該生物體含有一額外之基 因修飾,以表現一或多種異源性醯基-CoA合成酶(ACoAS) 或其同源物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為 醯基-CoA ;其中該生物體含有一額外之基因修飾,以自會 内生性製造PUFA合成酶之生物體中表現一或多種異源性 18 200813222 蛋白質;以及其中該蛋白質會利用PUFA-CoA作為受質,形 成鱗脂質(PL)或二醯基甘油(TAG)。在另一實施例中,本發 明係提供一種經基因修飾之生物體,包括微生物、植物、 植物之一部分,或植物細胞,其中該生物體經PUFA合成 5 酶,其可製造至少一多不飽和脂肪酸(PUFA),與磷酸泛醯 魏基轉移酶(PPTase)基因修飾;其中至少一編碼pUFA合成 酶或PPTase之核酸分子,係操作性地與編碼色素體_標的序 列,由SEQ ID NO : 81代表之核酸序列聯結;以及其中該 生物體含有一額外之基因修飾,以剔除或使内生性脂肪酸 10 合成酶(FAS)或與該植物表現之FAS結合之蛋白質失去活 性0 在另一實施例中,本發明係提供一種經基因修飾之生 物體,包括微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 15 肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修飾; 其中至少一編碼PUFA合成酶或PPTase之核酸分子,係操作 性地與編碼色素體-標的序列,由SEQ ID NO : 81代表之核 酸序列聯結;其中該生物體含有一額外之基因修飾,以剔 除或使内生性脂肪酸合成酶(FAS)或與該植物表現之FAS結 20 合之蛋白質失去活性;以及其中該生物體含有一額外之基 因修飾,以表現一或多種異源性醯基-CoA合成酶(ACoAS) 或其同源物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為 醢基-CoA。 在另一實施例中,本發明係提供一種經基因修飾之生 19 200813222 物體’包括微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(pPTase)基因修飾; 其中至少一編碼PUFA合成酶或PPTase之核酸分子,係操作 5 性地與編碼色素體-標的序列,由SEQ ID NO : 81代表之核 酸序列聯結;其中該生物體含有一額外之基因修飾,以剔 除或使内生性脂肪酸合成酶(FAS)或與該植物表現之FAS結 合之蛋白質失去活性;其中該生物體含有一額外之基因修 飾’以自會内生性製造PUFA合成酶之生物體中表現一或多 10 種異源性蛋白質;其中該蛋白質會利用PUFA-CoA作為受 貝’形成鱗脂質(PL)或三酿基甘油(TAG)。 在另一實施例中,本發明係提供一種經基因修飾之生 物體,包括微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 15肪酸(pUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾; 其中至少一編碼PUFA合成酶或PPTase之核酸分子,係操作 性地與編碼色素體-標的序列,由SEQ ID NO : 81代表之核 酸序列聯結;其中該生物體含有一額外之基因修飾,以剔 除或使内生性脂肪酸合成酶(FAS)或與該植物表現之FAS結 20合之蛋白質失去活性;其中該生物體含有一額外之基因修 飾’以表現一或多種異源性醯基-CoA合成酶(ACoAS)或其 同源物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基 -Co A,以及其中該生物體含有一額外之基因修飾,以自會 内生性製造PUFA合成酶之生物體中表現一或多種異源性 20 200813222 蛋白質;以及其中該蛋白質會利用pUFA_CoA作為受質,形 成石粦脂質(PL)或三醯基甘油(tag)。 在貝施例中’本發明係提供一種經基因修飾之生物 體,包括微生物、植物、植物之一部分,或植物細胞,其 5中該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪 酸(PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾,以 及其中該生物體含有一基因修飾,以抑制一蛋白質之表現 或活性,該蛋白質選自於由KASII與KASIII組成之族群, 其中該生物體包含一額外之基因修飾,以降低丙二醯C〇A 10與PUFA合成酶之競爭,或增加丙二醯c〇A在生物體中之含 量。 在一實施例中,本發明係提供一種經基因修飾之生物 體,包括微生物、植物、植物之一部分,或植物細胞,其 中該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪 15酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修飾,以 及其中該生物體含有一基因修飾,以抑制一蛋白質之表現 或活性,該蛋白質選自於由KASII與KASIII組成之族群,其 中该生物體包含一額外之基因修飾,以降低丙二醯C〇a與 pUFA合成酶之競爭,或增加丙二醯c〇a在生物體中之含 2 0 曰 · 里,以及其中該生物體含有一額外之基因修飾,以表現一 或多種異源性醯基_coA合成酶(AcoAS)或其同源物,其會 催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基_c〇A。 在一實施例中,本發明係提供一種經基因修飾之生物 體,包括微生物、植物、植物之一部分,或植物細胞,其 21 200813222 中該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪 酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修舞,以 及其中該生物體含有一基因修飾,以抑制一蛋白質之表現 或活性’該蛋白質選自於由KASII與KASIII組成之族群, 5其中該生物體包含一額外之基因修飾,以降低丙二醯c〇A 與PUFA合成酶之競爭,或增加丙二酿c〇a在生物體中之含 量;其中該生物體含有一額外之基因修飾,以自會内生性 製造PUFA合成酶之生物體中表現一或多種異源性蛋白 質;以及其中該蛋白質會利用PUFA_C〇A作為受質,形成石粦 10 脂質(PL)或三醯基甘油(TAG)。 在一實施例中,本發明係提供一種經基因修舞之生物 體,包括微生物、植物、植物之一部分,或植物細胞,其 中該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪 酸(PUFA),與磷酸泛醯魏基轉移酶(ppTase)基因修飾,以 15 及其中該生物體含有一基因修飾,以抑制一蛋白質之表現 或活性,該蛋白質選自於由KASII與KASIII組成之族群, 其中該生物體包含一額外之基因修飾,以降低丙二酿CoA 與PUFA合成酶之競爭,或增加丙二醯CoA在生物體中之含 量;以及其中該生物體含有一額外之基因修飾,以剔除或 20 使内生性脂肪酸合成酶(FAS)或與該植物表現之FAS結合之 蛋白質失去活性。 在一實施例中,本發明係提供一種經基因修飾之生物 體’包括被生物、植物、植物之一部分’或植物細胞,其 中該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪 22 200813222 酸(PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾,以 及其中該生物體含有一基因修飾,以抑制一蛋白質之表現 或活性,該蛋白質選自於由KASII與KASIII組成之族群, 其中該生物體包令額外之基因修飾,以降低丙二酿c〇A 5 與PUFA合成酶之競爭,或增加丙二醯CoA在生物體中之含 量;其中該生物體含有一額外之基因修飾,以表現一或多 種異源性醯基-CoA合成酶(ACoAS)或其同源物,其會催化 長鏈PUFA自由脂肪酸(FFA)轉換為醯基-CoA;其中該生物 體含有一額外之基因修飾,以自會内生性f造PUFA合成酶 10 之生物體中表現一或多種異源性蛋白質;以及其中該蛋白 質會利用PUFA-CoA作為受質,形成麟脂質(pl)或三醯基甘 油(TAG)。在一實施例中,本發明係提供一種經基因修飾之 生物體,包括一微生物、植物、植物之一部分,或植物細 胞,其中該生物體經PUFA合成酶,其可製造至少一多不飽 15和脂肪酸(PUFA),與鱗酸泛醯巯基轉移酶(ppTase)基因修 飾,以及其中該生物體含有一基因修飾,以抑制一蛋白質 之表現或活性,該蛋白質選自於由KASII與KASIII組成之 族群’其中該生物體包含一額外之基因修飾,以降低丙二 酿CoA與PUFA合成酶之競爭,或增加丙二醯c〇a在生物體 20中之含量;其中該生物體含有一額外之基因修飾,以表現 一或多種異源性醯基-CoA合成酶(ACoAS)或其同源物,其 會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基_CoA;以及 其中該生物體含有一額外之基因修飾,以剔除或使内生性 脂肪酸合成酶(FAS)或與該植物表現之FAS結合之蛋白質失 23 200813222 去活性。在一實施例中,本發明係提供一種經基因修飾之 生物體,包括一微生物、植物、植物之一部分,或植物細 胞,其中該生物體經PUFA合成酶,其可製造至少一多不飽 和脂肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修 5 飾,以及其中該生物體含有一基因修飾,以抑制一蛋白質 之表現或活性,該蛋白質選自於由KASII與KASIII組成之 族群,其中該生物體包含一額外之基因修飾,以降低丙二 醯CoA與PUFA合成酶之競爭,或增加丙二醢CoA在生物體 中之含量;其中該生物體含有一額外之基因修飾,以剔除 10 或使内生性脂肪酸合成酶(FAS)或與該植物表現之FAS結合 之蛋白質失去活性;以及其中該蛋白質會利用PUFA-CoA 作為受質,形成磷脂質(PL)或三醯基甘油(TAG);以及其中 該生物體含有一額外之基因修飾,以剔除或使内生性脂月方 酸合成酶(FAS)或與該植物表現之FAS結合之蛋白質失去活 15 性。在一實施例中,本發明係提供一種經基因修飾之生物 體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和月旨 肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修錦, 以及其中該生物體含有一基因修飾,以抑制一蛋白質之I 20 現或活性,該蛋白質選自於由KASII與KASIII組成之族 群,其中該生物體包含一額外之基因修飾,以降低内二^ CoA與PUFA合成酶之競爭,或增加丙二醯CoA在生物體中 之含量;其中該生物體含有一額外之基因修飾,以表現_ 或多種異源性醯基-CoA合成酶(ACoAS)或其同源物,其會 24 200813222 催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基-C〇a;其中該 生物體含有一額外之基因修飾,以自會内生性製造puFA合 成S#之生物體中表現一或多種異源性蛋白質;其中該蛋白 質會利用PUFA-CoA作為受質,形成磷脂質(PL)或三醯基甘 5油(TAG);以及其中該生物體含有一額外之基因修飾,以剔 除或使内生性脂肪酸合成酶(FAS)或與該植物表現之^^^結 合之蛋白質失去活性。在另一實施例中,本發明係提供一 種經基因修飾之生物體,包括一微生物、植物、植物之一 部分,或植物細胞,其中該生物體經PUFA合成酶,其可製 10 造至少一多不飽和脂肪酸(PUFA),與磷酸泛醯巯基轉移酶 (PPTase)基因修飾,以及其中至少一編碼PUFA*成酶或 PPTase之核酸分子,係操作性地與編碼色素體_標的序列, 由SEQ ID NO : 81代表之核酸序列聯結,其中該生物體包 含一額外之基因修飾,以降低丙二醯CoA與PUFA合成酶之 15 競爭,或增加丙二醯CoA在生物體中之含量。 在另一實施例中,本發明係提供一種經基因修飾之生 物體’包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修飾, 20 以及其中至少一編碼PUFA合成酶或PPTase之核酸分子,係 操作性地與編碼色素體-標的序列,由SEQ ID NO : 81代表 之核酸序列聯結,其中該生物體包含一額外之基因修飾, 以降低丙二醯C〇A與PUFA合成酶之競爭,或增加丙二醯 CoA在生物體中之含量;以及其中該生物體含有一額外之 25 200813222 基因修飾,以表現一或多種異源性醯基_coA合成酶(ac〇as) 或其同源物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為 醯基-CoA。 在另一實施例中,本發明係提供一種經基因修飾之生 5物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾, 以及其中至少一編碼PUFA合成酶或ppTase之核酸分子,係 操作性地與編碼色素體-標的序列,由SEq ID NO : si代表 10之核酸序列聯結,其中該生物體包含一額外之基因修飾, 以降低丙二醯CoA與PUFA合成酶之競爭,或增加丙二醯 CoA在生物體中之含量;其中該生物體含有一額外之基因 修飾,以自會内生性製造PUFA合成酶之生物體中表現一或 多種異源性蛋白質;以及其中該蛋白質會利用PUFA-CoA 15 作為受質,形成磷脂質(PL)或三醯基甘油(TAG)。 在另一實施例中,本發明係提供一種經基因修飾之生 物體’包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯鲅基轉移酶(ppTase)基因修飾, 20 以及其中至少一編碼PUFA合成酶或PPTase之核酸分子,係 操作性地與編碼色素體-標的序列,由SEQ ID NO : 81代表 之核酸序列聯結,其中該生物體包含一額外之基因修飾, 以降低丙二醯CoA與PUFA合成酶之競爭,或增加丙二醯 CoA在生物體中之含量;以及其中該生物體含有_額外之 26 200813222 基因修飾,以剔除或使内生性脂肪酸合成酶(FAS)或與該植 物表現之FAS結合之蛋白質失去活性。 在另一實施例中,本發明係提供一種經基因修飾之生 物體,包括一微生物、植物、植物之一部分,或植物細胞, 其中該生物體經PUFA合成酶,其可製造至少一多不飽和脂 肪酸(PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修飾, 以及其中至少一編碼PUFA合成酶或ppTase之核酸分子,係 操作性地與編碼色素體-標的序列,由Seq ID NO : 81代表 之核酸序列聯結,其中該生物體包含一額外之基因修飾, 10以降低丙二醯CoA與PUFA合成酶之競爭,或增加丙二醯 CoA在生物體中之含量;其中該生物體含有一額外之基因 修飾,以表現一或多種異源性醯基_c〇A合成酶(AC〇AS)或 其同源物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯 基-CoA ;其中該生物體含有_額外之基因修飾,以自會内 15生性製造PUFA合成酶之生物體中表現—或多種異源性蛋
白質;以及其中該蛋白質會利用PUFA_c〇A作為受質,形成 石舞脂質(PL)或三醯基甘油(TAG)。在另一實施财,本發明 係提供-種經基因修飾之生物體,包括一微生物、植物、 植物之-部分,或植物細胞,其中該生物體經職合成 20酶,其可製造至少-多不飽和脂肪酸(pUFA),與鱗酸泛酿 魏基轉移酶(PP㈣基因修錦,以及其中至少一編碼PUFA
合成酶或PPTase之核酸分子,係操作性地與編碼色素體標 的序列,由SEQID N0:81代表之核酸序列聯結,豆中該 生物體包含—額外之基因修錦,以降低f PUFA 27 200813222 合成酶之競爭,或增加丙二醯C〇A在生物體中之含量;其 中該生物體含有一額外之基因修飾,以表現一或多種異源 性醯基-CoA合成酶(ACoAS)或其同源物,其會催化長鏈 PUFA自由脂肪酸(FFA)轉換為醯基_c〇A ;以及其中該生物 5體含有一額外之基因修飾,以剔除或使内生性脂肪酸合成 酶(FAS)或與該植物表現之FAS結合之蛋白質失去活性。在 另一實施例中,本發明係提供一種經基因修飾之生物體, 包括一微生物、植物、植物之一部分,或植物細胞,其中 該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪酸 10 (PUFA),與磷酸泛醯巯基轉移酶(PPTase)基因修飾,以及 其中至少一編碼PUFA合成酶或ppTase之核酸分子,係操作 性地與編碼色素體-標的序列,由SEQ ID NO : 81代表之核 酸序列聯結,其中該生物體包含一額外之基因修飾,以降 低丙二醯CoA與PUFA合成酶之競爭,或增加丙二醯CoA在 15生物體中之含量;其中該生物體含有一額外之基因修飾, 以自會内生性製造PUFA合成酶之生物體中表現一或多種 異源性蛋白質;以及其中該蛋白質會利用PUFA-CoA作為受 質,形成磷脂質(PL)或三醯基甘油(TAG);以及其中該生物 體含有一額外之基因修飾,以剔除或使内生性脂肪酸合成 20 酶(FAS)或與該植物表現之FAS結合之蛋白質失去活性。在 另一實施例中,本發明係提供一種經基因修飾之生物體, 包括一微生物、植物、植物之一部分,或植物細胞,其中 該生物體經PUFA合成酶,其可製造至少一多不飽和脂肪酸 (PUFA),與磷酸泛醯巯基轉移酶(ppTase)基因修飾,以及 28 200813222 其中至少一編碼PUFA合成酶或PPTase之核酸分子,係操作 性地與編碼色素體-標的序列,由SEQ ID NO : 81代表之核 酸序列聯結,其中該生物體包含一額外之基因修飾,以降 低丙二醯CoA與PUFA合成酶之競爭,或增加丙二醯c〇A在 5 生物體中之含量;其中該生物體含有一額外之基因修飾, 以表現一或多種異源性醯基-CoA合成酶(ACoAS)或其同源 物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基 -CoA ;其中該生物體含有一額外之基因修飾,以自會内生 性製造PUFA合成酶之生物體中表現一或多種異源性蛋白 10 質;以及其中該蛋白質會利用PUFA-CoA作為受質,形成鱗 脂質(PL)或三醯基甘油(TAG);以及其中該生物體含有一額 外之基因修飾,以剔除或使内生性脂肪酸合成酶(FAS)或與 該植物表現之FAS結合之蛋白質失去活性。在某些實施例 中,該生物體含有一基因修飾,以抑制一蛋白質之表現或 15 活性,該蛋白質選自於由KASII與KASIII組成之族群。 在其他實施例中,該生物體會產生較多量之該至少一 PUFA,與缺乏該KASII或KASIII抑制之情況相較。 該基因修飾可包含將生物體以RNAi建構物轉型,該 RNAi建構物可抑制KASII之表現或活性,或可抑制 20 KASIII之表現或活性。該RNAi建構物可包含一核酸序列, 由 SEQIDNO : 122或SEQIDNO : 124代表。 在其他實施例中,該基因修飾包含以反義股(antisense) 核酸分子使該生物體轉型,該反義股核酸分子可抑制KASII 之表現或活性,或可抑制KASIII之表現或活性。該反義股 29 200813222 核酸分子可包含一核酸序列,由SEQ ID NO : 123或SEQ ij) NO : 125代表。 在某些實施例中,該生物體包含一額外之基因修飾, 以表現一或多種異源性醯基-CoA合成酶(ACoAS)或其同源 5 物,其會催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基 -CoA,該生物體可經由一核酸分子轉型,該核酸包含一編 碼得自隱甲藻(Crypthecodinium cohnii)之酿基-CoA合成酶 (ACoAS),或其同源物之核酸序列,其中該ACoAS或其同 源物係催化長鏈PUFA自由脂肪酸(FFA)轉換為醯基 10 -CoA。在其他實施例中,該生物體可經由一核酸分子轉型, 該核酸包含一編碼得自裂殖壺菌(Schizochytrium)之醯基 -CoA合成酶(ACoAS)或其同源物之核酸序列,該合成酶至 少60%等同於得自裂殖壺菌(Schizochytrium)之ACoAS之 胺基酸序列,其中該ACoAS或其同源物係催化長鏈PUFA 15 自由脂肪酸(FFA)轉換為醯基-CoA。在其他實施例中,該生 物體係經一核酸分子轉型,該核酸分子包含一編碼醯基 -CoA合成酶(ACoAS)之核酸序列,該合成酶至少60%等同 於具有胺基酸序列選自於由SEQ ID NO: 83、SEQ ID NO : 85、SEQ ID NO : 8、SEQ ID NO : 89、SEQ ID NO : 91、 20 SEQ ID NO : 93、SEQ ID NO : 95、SEQ ID NO : 97 與 SEQ ID NO : 99組成族群之ACoAS。在其他實施例中,該生物 體係經一核酸分子轉型,該核酸分子包含一編碼醯基-CoA 合成酶(ACoAS)之核酸序列,該合成酶至少60%等同於具 有胺基酸序列選自於由SEQ ID NO : 83、SEQ ID NO : 85、 30 200813222
SEQ ID NO : 87、SEQ ID NO : 89、SEQ ID NO : 91、SEQ ID NO : 93、SEQ ID NO : 95、SEQ ID NO : 97與 SEQ ID NO : 99組成族群之ACoAS ;且更佳為,編碼醯基_CoA合成酶 (ACoAS),具有胺基酸序列選自於由:SEQ ID NO : 83、SEQ 5 ID NO : 85與SEQ ID NO ·· 97組成族群之核酸分子。在其 他實施例中,該生物體係經一核酸分子轉型,該核酸分子 包含一編碼醯基-CoA合成酶(ACoAS)之核酸序列,該合成 酶具有胺基酸序列如SEQ ID NO: 83或SEQ ID NO: 85,以 及該核酸分子包含一編碼醯基-CoA合成酶(ACoAS)之核酸 10 序列,該合成酶具有胺基酸序列如SEQ ID NO : 97。在其 他實施例中,該生物體係經一核酸分子轉型,該核酸分子 包含一核酸序列選自於由:SEQ ID NO: 82、SEQ ID NO : 84、SEQ ID NO : 86、SEQ ID NO : 88、SEQ ID NO : 90、 SEQ ID NO : 92、SEQ ID NO : 94、SEQ ID NO : 96,與 SEQ 15 ID NO : 98組成之族群。 在某些實施例中,其中該生物體包含一額外之基因修 飾,以自會内生性製造PUFA合成酶之生物體中表現一或多 種異源性蛋白質;以及其中該蛋白質會利用PUFA-CoA作為 受質’形成構脂質(PL)或三醯基甘油(TAG),該生物體會内 20生性地表現pUFA合成酶。在其他實施例中,該蛋白質為 DAGAT或LPAAT。在其他實施例中,該生物體係以一核酸 分子轉型,該核酸分子包含一核酸序列,編碼一得自破囊 壺菌(thraustochytrid)或網黏菌(labyrinthulid)之蛋白質,其 利用PUFA-CoA為受質,形成磷脂質(PL)或三醯基甘油 31 200813222 (TAG)。在其他實施例中,該生物體係以一核酸分子轉型, 该核酸分子包含一核酸序列,編碼一得自裂殖壺菌 (Schizochytrium)之蛋白質,其利用PUFA-CoA為受質,形 成磷脂質(PL)或三醯基甘油(TAG)。在某些實施例中,該核 5 酸分子係編碼一蛋白質,包含一胺基酸序列,其至少60% 等同於選自於由:SEQ ID NO : 102、SEQ ID NO : 104、SEQ ID NO : 107、SEQ ID NO : 110與SEQ ID NO : 113組成族 群之胺基酸序列。在其他實施例中,該生物體係以一核酸 分子轉型,該核酸分子包含一核酸序列,係編碼一蛋白質, 10 其包含胺基酸序列選自於由:SEQ ID NO : 102、SEQ ID >10:104、3£()10 1^0:107、3£(510 1^0:110與8£(^1〇]^0: 113 ;且較佳為一核酸分子,包含一核酸序列,係編碼一蛋 白質,其包含胺基酸序列選自於由SEQ ID NO: 102與SEQ ID NO : 104組成之族群。在其他實施例中,生物體係以一 15 核酸分子轉型,該核酸分子包含一核酸序列,係編碼一蛋 白質,其包含胺基酸序列SEQ ID NO : 102,以及一核酸序 列,係編碼一蛋白質,其包含胺基酸序列SEQ ID NO: 104。 在其他實施例中,生物體係以一核酸分子轉型,該核酸分 子包含一核酸序列,係編碼一蛋白質,其包含胺基酸序列 20 選自於由 SEQIDNO: 100、SEQIDNO: 102、SEQIDNO: 103、SEQ ID NO : 105、SEQ ID NO : 106、SEQ ID NO : 108、SEQ ID NO : 109、SEQ ID NO : 111與 SEQ ID NO : 112組成之族群。其中該生物體係經由一核酸分子轉型,該 核酸分子包含一核酸序列,係編碼得自隱甲藻 32 200813222 (Crypthecodinium cohnii)之酿基-CoA合成酶(ACoAS)’ 或其 同源物,之核酸序列,其利用pUFA-CoA為受質,形成磷 脂質(PL)或三醯基甘油(TAG)。在某些實施例中,該生物體 係經一核酸分子轉变’該核酸分子包含一核酸序列,其至 5 少 90%等同於選自於由:SEQ ID NO : 114、SEQ ID NO : 115、SEQ ID NO : 116、SEQ ID NO : 117、SEQ ID NO : 118、SEQ ID NO : 119、SEQ ID NO : 120與 SEQ ID NO : 121組成族群之一核酸序列。 在前述實施例之某些實施例中,該PUFA合成酶包含至 10 少一功能性區塊,得自破囊壺菌(thraustochytrid)或網黏菌 (labyrinthulid)之PUFA合成酶。在某些實施例中,該PUFA 合成酶包含至少一功能性區塊,得自破囊壺菌 (thraustochytrid)微生物體之PUFA合成酶。在其他實施例 中,該PUFA合成酶包含至少一功能性區塊,得自選自於由 15 裂殖壺菌(Schizochytrium)、破囊壺菌(thraustochytrium)、巫 肯尼亞菌(Ulkenia),以及網黏菌(Labyrinthula)組成族群之 一微生物體之PUFA合成酶。在其他實施例中,該PUFA合 成酶包含至少一功能性區塊,得自選自於由美國菌種中心 (ATCC)No· 20888之裂殖壺菌(Schizochytrium sp·)、ATCC 2〇 No· 20892之破囊壺菌(thraustochytriimi)23B,及該微生物之 任一突變株組成族群之一者之PUFA合成酶。在某些實施例 中,該PUFA合成酶包含至少一功能性區塊,得自海洋細菌 之PUFA合成酶。在其他實施例中,該PUFA合成酶包含至 少一功能性區塊,得自選自於由沙雷菌(Shewanella)、嗜壓 33 200813222 菌(Moritella),以及發光菌(Photobacterium)組成族群之一者 之PUFA合成酶。 在其他實施例中,該該PUFA合成酶係由一或多種蛋白 質組成,包含: 5 至少一烯酯-ACP還原酶(ER)區塊; 至少四醯基載體蛋白質(ACP)區塊; 至少二β-酮基醯基-ACP合成酶(KS)區塊; 至少一醯基轉移酶(AT)區塊; 至少一 β·酮基醯基-ACP還原酶(KR)區塊; 10 至少二FabA-類似β-羥基醯基-ACP脫氫酶(DH)區塊; 以及 至少一鏈長度因子(CLF)區塊; 至少一丙二醯-CoA : ACP醯基轉移酶(MAT)區塊。 在其他實施例中,該該PUFA合成酶係由一或多種蛋白 15 質組成,包含: 二個烯酯-ACP還原酶(ER)區塊; 八或九個醯基載體蛋白質(ACP)區塊; 二β-酮基醯基-ACP合成酶(KS)區塊; 一醯基轉移酶(AT)區塊; 20 一酮基還原酶(KR)區塊; 二FabA·類似β-羥基醯基-ACP脫氫酶(DH)區塊; 一鏈長度因子(CLF)區塊;以及 一丙二醯-CoA: ACP醯基轉移酶(MAT)區塊。 在其他實施例中,PUFA合成酶為一細菌性PUFA合成 34 200813222 酶,其於溫度至少約25°C製造PUFAs,且其中該PUFA合成 酶係由一或多種蛋白質組成,包含: 至少一烯酯ACP-還原酶(ER)區塊; 至少六醯基載體(ACP)區塊; 5 至少二β-酮基醯基-ACP合成酶(KS)區塊; 至少一醯基轉移酶(AT)區塊; 至少一酮基還原酶(KR)區塊; 至少二FabA-類似β-羥基醯基-ACP脫氫酶(DH)區塊; 至少一鏈長度因子(CLF)區璣; 10 至少一丙二醯基-CoA : ACP醯基轉移酶(MAT)區塊; 以及 至少一 4,-磷酸泛醯酼基轉移酶(ppTase)區塊。
在某些實施例中,該PUFA合成酶包含一或更多個序 列,選自於由:SEQ ID NOs : 1-32任一者,以及SEQ ID 15 N0s : 35-80任一者組成之族群。 在某些實施例中,一或多種編碼PUFA合成酶之核酸序 列’係經最佳化,以增進PUFA合成酶在植物或植物細胞中 之表現。在其他實施例中,PUFA合成酶與該ppTase之表現 係以植物或植物細胞中之色素體為標的。 20 在某些實施例中,該經基因修飾生物體為一植物,且 該植物為一油類種子植物。在其他實施例中,該植物為雙 子葉(dicotyledonous)植物。在其他實施例中,該植物係選 自於由··油菜(canola)、大豆、油菜(rapeseed)、亞麻子 (linseed)、玉米、紅花(safflower)、葵花與煙草(tobacc〇)組 35 200813222 成之族群。 在其他實施例中,該經基因修飾之生物體係製造至少 一多不飽和脂肪酸(PUFA),選自於由:epa(C2〇 : 5, n_3)、 DHA(C22 : 6, η·3)、DPA(C22 : 5, “或,、ARA(C2〇 : 5 4, η·6)、GLA(C18 : 3, n-6),及/或SDA(C18 : 4, n-3))組成 之族群。在某些實施例中,該經基因修飾之生物體係製造 至少一多不飽和脂肪酸(PUFA),選自於由:dha、EPA與 DPAn-6組成之族群。在其他實施例中,該經基因修飾之生 物體係產生DHA與DPAn-6。在其他實施例中,該經基因修 10 飾之生物體係產生ARA。
在某些實施例中,該經基因修飾之生物體包含至少 0.5%重之該至少一PUFA。在其他實施例中,該PUFA合成 酶產生之總脂肪酸,除了該至少一PUFA之外,尚包含小於 約10%重之由該生物體所製造之總脂肪酸。在其他實施例 15中,該pUFA合成酶製造之總脂肪酸,除了該至少一puFA 之外’尚包含小於約5 %重之由該生物體所製造之總脂肪 酸0 在其他實施例中,該植物、植物部分或植物細胞之總 脂肪酸分佈,包含至少約0.5%重之至少一多不飽和脂肪酸 20 (PUFA),具有至少20個碳與4或更多個碳·碳雙鍵,且其中 該植物、植物部分或植物細胞之總脂肪酸分佈包含小於5〇/〇 之下列總PUFAs : γ-次亞麻油酸(GLA ; 18 : 3, n-6)、具有18 個碳與4個碳-碳雙鍵之PUFA、具有20個碳與3個碳·碳雙鍵 之PUFA ’以及具有22個碳與2或3個碳-碳雙鍵之puFA。 36
在其他實施例中,該植物、植物部分或植物細胞之總 脂肪酸分佈,包含至少0.5%重之至少一多不飽和脂肪酸 (PUFA) ’具有至少2〇個碳與4或更多個碳_碳雙鍵,且其中 该植物、植物部分或植物細胞之總脂肪酸分佈包含小於1% 之下列總PUFA : γ·次亞麻油酸(GLA ; 18 : 3, n-6)、具有18 個碳與4個碳-碳雙鍵之PUFA、具有2〇個碳與3個碳_碳雙鍵 之PUFA ’以及具有22個碳與2或3個碳-碳雙鍵之pufA。 在其他實施例中,該植物、植物部分或植物細胞之總 脂肪酸分佈,包含至少〇·5%重之£少一多不飽和脂肪酸 10 (pUFA),具有至少20個碳與4或更多個碳-碳雙鍵,且其中 該植物、植物部分或植物細胞之總脂肪酸分佈包含小於2% 之γ-次亞麻油酸(GLA ; 18 : 3, η-6),以及二高-γ-次亞麻油 酸(DGLA或HGLA ; 20 : 3, η·6)。 在其他實施例中,該植物、植物部分或植物細胞之總 15脂肪酸分佈,包含小於1%之γ-次亞麻油酸(GLA ; 18 ·· 3, η-6),以及二高-γ·次亞麻油酸(DGLA或HGLA; 20: 3, η-6)。 在其他實施例中,該經基因修飾之生物體之總脂肪酸 分佈,包含至少約0.5%重之至少一多不飽和脂肪酸 (PUFA),具有至少20個碳與4或更多個碳-碳雙鍵,且其中 20該植物、植物部分或植物細胞之總脂肪酸分佈包含小於1% 之γ-次亞麻油酸(GLA ; 18 : 3, η-6)。 在其他實施例中,該經基因修飾之生物體之總脂肪酸 分佈,包含至少約0.5%重之次亞麻油酸(GLA ; 18 : 3, η-6) ° 37 200813222 本發明亦提供—種油類,得自本發明之任一經基因修 飾生物體。在一實施例中,本發明係提供一種油類,包含 可债測里之DHA(二十二燒六稀酸(C22 : 6, n-3)),以及 DPA(二十二院五烯酸(C22 : 5 n 6),其中㈣μ與腿 5之比例為1 : 1或大於1 :卜其中該植物油係得自本發明任 一經基因修飾之生物體。 ’、X、工基〇修.之生物體為—植物,本發明提供得 自該植物之種子。 本發明亦提供—種食物產品,包含本發明任-油類或 10 種子。 本發明亦提供—種醫療用產品,其包含本發明之油類。 、本發明亦提供一種製造包含至少一 pufa之油類之方 法,包含自本發明之種子中回收一油類。 15 20 、本發明亦提供一種製造包含至少一 PUFA之油類之方 法’包含自本發明經基因修飾之生物體回收_油類。 本發明亦提供-㈣造至少-多残和脂賊(PUFA) 之方法,包含生長本發明之經基因修飾植物或微生物體。 本發明更提供-種提供包含至少一 puFA之補充或醫 療用產品至-個體之方法’包含提供該個體本發明之經基 因修飾之生物體或其-部份、本發明之種子、本發明之二 類、本發明之食物產品,或本發明之醫療用產品。 本發明亦提供-種製造前述經基因料生物體之方 法’包含將-生物體以-或多個編碼職合成酶㈣ PPTase之核酸分子轉型,其中該生物體含有_基因修佛, 38 200813222
以抑制一蛋白質之表現,該蛋白質選自於由KASII與KASIII 組成之族群。 本發明亦提供一種製造前述經基因修飾之生物體之方 法,包含將一生物體以一或多個編碼PUFA合成酶與該 5 PPTase之核酸分子轉型,並更進一步基因修飾該生物體, 以抑制一蛋白質之表現或活性,該蛋白質選自於由KASII 與KASIII組成之族群。 本發明亦提供一種將生物體轉型以表現PUFA之方 法’包含以編碼PUFA合成酶之核酸分子、碟酸泛醯黯基轉 10移酶(PPTase)之核酸分子,以及此述任一醯基_c〇A合成酶 或酉基轉移酶之核酸分子,使一生物體轉型。在一觀點中, 該生物體含有一基因修飾,以剔除或使該生物體表現之脂 肪酸合成酶(FAS)失去活性。在一觀點中,該生物體含有一 基因修飾,以降低丙二醯CoA與PUFA合成酶之競爭,或增 15 加丙二醯CoA在該生物體中之含量。該生物體可包括一植 物或一微生物體’舉例而言。 圖式簡單說明 第1圖為螢光影像分析之數位影像,用於分析裂殖壺菌 (Schizochytrium)Ac66株與衍生自該殖株之puFA-S KO與 20 FAS K0突變株之不含細胞均質物之體外活性試驗。 第2圖為螢光影像分析之數位影像,用於分析以正相 TLC分離之裂殖壺菌(Schizochytrium)FAS-KO株之外活性 試驗。反應於指示時間下進行。 第3圖為螢光影像分析之數位影像,用於分析以正相 39 200813222 TLC分離之裂殖壺菌(Schizochytrium)FAS_KO株之外活性 試驗。係使用標準試驗成分,但變化NADH、NADPH與乙 醯基-CoA成分(欄1- NADH/NADPH/乙醯基-CoA,欄2 -NADPH/乙醯基-CoA,欄3 - NADH/乙醯基-CoA,欄4 -5 NADH/NADPH,欄 5 -無)。 第4圖為螢光影像分析之數位影像,用於分析以正相 TLC分離之裂殖壺菌(Schizochytrium)FAS_KO株之外活性 試驗。反應係進行10分鐘,之後加入ATP與Mg+2。反應於 底部標示時間終止(“==秒,‘=分鐘)。 10 第5圖為螢光影像分析之數位影像,用於分析以正相 TLC分離之裂殖壺菌(Schizochytrium)FAS-KO株之體外活 性試驗。反應係進行10分鐘,之後加入ATP與Mg+2(除了 樣本1之外),繼續靜置20分鐘(欄3 - 2 uL DMSΟ,欄4 - 4 uL DMSO,欄 5 - 25 uM Triascin C,欄 6 - 100 uM Triascin C, 15 欄 7 - 200 uM Triascin C)。 第6A圖為FAME分析之數位影像,用於分析表現有裂 殖壺菌(Schizochytrium)OrfA、OrfB*、OrfC 與 Het I之大 腸桿菌。標的PUFA在均質物、高速沈澱物分液(P2)、上清 液(S1)與高速上清液(S2)中。 2〇 第6B圖為第6A圖所使用之大腸桿菌之樣本分析結 果,除了脂質產物僅以HIP(而非轉換為FAMES)萃取之外, 在以TLC分離之前。 第7圖控制組酵母菌與表現有裂殖壺菌 (Schizochytrium)OrfA、OrfB*、OrfC 與 Het I之酵母菌之 40 200813222 FAME分佈圖。 第8圖為第1圖酵母菌之FAME分佈圖,延伸說明標的 PUFA之製造。
苐9圖為FAS活性之抑制對於dha分佈之影響(為總 5 FAMEi百分比),在表現有裂殖壺菌(Schizochytrimn)PUFA 合成酶(sOrfA,sOrfB,OrfC)與Het I,單獨或與醯基c〇A合成 酶表現組合之酵母菌中。 第10圖為FAS活性之抑制對於dha與DPAn6分佈之影 響(為總FAME之百分比),在表現有裂殖壺菌 10 (Schizochytrium)PUFA 合成酶(s0rfA,s0rffi,〇rfc)與 Het I ’單獨或與醯基CoA合成酶表現組合之酵母菌中。 第11圖為FAME分佈,顯示抑制FAS活性(藉由淺藍菌 素)、裂殖壺菌(Schizochytrium)PUFA合成酶(sOfA,s〇ffB, OrfC)與Het I之表現,以及醯基c〇A合成酶之表現,對於酵 15 母菌中DHA與DPAn6產生之共同影響。 第12圖顯示剔除DAG AT基因之裂殖壺菌 (Schizochytrium)之脂質分佈。 第13圖為野生型阿拉伯芥(Arabidopsis)與品系263(色 素體標的),在種子發育過程中表現有裂殖壺菌 20 (Schizochytrium) Orfs A,B*,C 與Het I,之FAME分佈。 第14圖來自品糸1087-7(色素體標的)之阿拉伯芥種 子’在種子發月過粒中表現有裂殖壺菌(Schizochytrium) Orfs A,B*,C 與Het I,之FAME分佈。 第15圖為品系1366匯集之阿拉伯芥種子,在種子發育 41 200813222 過程中表現有裂殖壺菌(Schizochytrium) Orfs A,B*,C與Het I,標的為色素體,並結合FAS抑制(KAS II RNAi)與ACS-1, 之FAME分佈。 【實施方式】 5 發明詳述 本發明一般相關於提供一種蛋白質或標的(於此一般 稱之為’’附屬蛋白”或“附屬標的”),以及編碼此蛋白質之核 酸分子’以增進多不飽和脂肪酸(PUFAs),以及,尤其是, 長鏈PUFAs(LCPUFAs)之製造,於已經基因修飾以製造此 10類PUFA之宿主生物體中。本發明亦相關於一種生物體,其 已經基因修飾表現此類蛋白質,以及製造並使用此類蛋白 質與生物體之方法。本發明亦相關於製造1>1117八(包括經基 因修飾以製造PUFA)生物體之其他基因修飾,其可包括生 物體中特定基因或標的之剔除或失活。尤其是,本發明係 15相關於表現PUFA PKS系統(不論是内生性或基因操作)之生 物體之基因修飾,以增進或強化生物體中PUFA之製造,及 /或堆積。例如,本發明亦相關於人為降低調節酵素,以與 受質競爭,並人為提高酵素活性,如藉由突變或將酵素傳 送至色素體胞器與細胞質中。 20 依據本發明,經基因修飾以表現PUFA PKS系統(亦已 知為PUFA合成酶系統)之生物體,其中該生物體並非自然 地(内生性,非基因修飾)表現此系統,或至少特別是PUfa PKS系統或其部分,其中該生物體係經基因修飾,於此可 稱之為”異源性”宿主生物體,該生物體具有1>1;1^1>1^系統 42 200813222 或另一非該生物體内生性製造蛋白質之修飾。本發明之基 因修飾亦可用於增進已内生性製造PUFA PKS系統之宿主 生物體中PUFA之製造,其中該生物體並未經不同PUFA PKS系統或其一部份修飾。 5 更特別的是,本發明人發現並於此首度揭示裂殖壺菌 (Schizochytrium)PUFA合成酶之脂肪酸產物(主要為DHA與 DPAn-6),會以自由脂肪酸(FFA)形式自酵素中釋放出,釋 放機制一般相信為所有破囊壺菌(thraustochytrid)PUFA PKS(PUFA合成酶)酵素系統之特徵,且為所有真核生物 10 PUFA PKS系統之特徵,包括網黏菌(labyrinthulid)系統。此 外,本發明人指出,使用裂殖壺菌(Schizochytrium)作為模 式,DHA與DPA FFAs之後會酯化為CoA(CoA),藉由内生性 醯基-CoA合成酶(ACoAS或ACS)或合成酶之作用。這些脂 肪酸之活化形式(醯基-CoA)之後可作為PL與TAG形成酵素 15 之受質。 裂殖壺菌(Schizochytrium)之内生性酵素,可非常有效 轉換其PUFA合成酶之FFA產物為醯基-CoA,之後使用於pl 與TAG合成。此證據為高含量之DHA與DPA堆積於裂殖壺 菌(Schizochytrium)之油類與PL分液中。然而,不受理論束 2〇 缚,本發明人相信異源性宿主中之ACoAS酵素轉換為可轉 型之PUFA合成酶系統,不會如同PUFA合成酶供應生物體 之AcoAS般有效率。此外,會在新宿主生物體中形成pl與 TAG之内生性醯基-轉移酶,並不會有效地利用puFA-CoA 作為受質,尤其是與PUFA合成酶衍生之生物體比較。本發 43 200813222 明人亦假設,某些生物體之醯基轉移酶一般為較佳之酵 素,用於堆積PUFA於宿主生物體之油類與油類分液中,尤 其是某些PUFA,與其他生物體之類似酵素相較(如,來自 某一生物體之醯基轉移酶可轉換更多之DHA-CoA單元為 5 TAG,與不同生物體之醯基轉移酶相較)。因此,本發明人 係於此揭示’生物體,如裂殖壺菌(Schizochytrium),但不 限制於裂殖壺菌(Schizochytrium),(如a破囊壺菌 (thmustochytrid)或另一生物體,尤其是另一真核生物體), 其會產生PUFA,經由PUFA合成酶酵素(PUFA PKS系統), 10或經由另一醯基鏈生合成系統,其會堆積高含量之pufa於 其PL與TAG中,將提供作為編碼這些酵素之基因之良好來 源。 本發明人發現以FFA形式自PUFA合成酶釋放PUFV^ 物’代表在轉移該系統至異源性宿主方面之挑戰與機會, 15並提供實質上控制並增進異源性宿主生物體中PUFA之製 造效率之機會。 於此解釋,長鏈PUFAs(LCPUFAs)通常不會以ffa形式 作為”標準,,或,,典型” PUFA生合成路徑之一部分(定義如 下)。事實上,生物體中將PUFA作為砰八,通常僅發生於當 2〇其為外生性供應時。例如,大腸桿菌,像大部分細菌一樣, 不會合成PUFA。由這些生物體製造16與18個碳之飽和或 單-未飽和脂肪酸,係於醯基載體蛋白(ACPS)上合成,經由 第II型FAS系統。醯基_ACp作為pL形成酵素之受質。大腸 才干囷月b利用各種FFA作為外生性碳來源。這些ffa會轉換為 44 200813222 醯基-CoA,在其進入PL或降解循環時。FadD基因係編碼大 腸桿菌中唯一已知之ACoAS酵素,該基因之突變會導致生 長之不穩定,在FFA作為唯一之碳來源時。 真核生物體一般會製造飽和脂肪酸(16與18個碳),使 5用第1型脂肪酸合成酶(FAS)(或第II型FAS,在較高等植物 中)。FAS系統之產物可以FFA(如動物FAS),或以醯基 -CoA(如黴菌FAS)形式釋放。在植物中,第η型fas係位於 色素體中。在這些情況下,16或18個碳之脂肪酸係經由第 II型FAS製造,且通常形成單鍵,當脂肪酸連結至acp上 10 時。該醯基-ACP可作為形成色素體pl之受質。就這些最終 由色素體輸出之脂肪酸而言(用於細胞質PL或TAG合成), 醯基-ACP硫S旨酶會水解硫自旨鍵,以釋放FFA。該FFA之後自 色素體輸出,藉由細胞質ACoAS轉換為醯基-CoA。這些醯 基-CoA可作為PL與TAG合成酵素之受質。 15 真核生物體中長鏈PUFAs(LCPUFAs)之,,標準”或,,典 型”合成路徑,涉及中鏈長度之飽和或單-未飽和脂肪酸(如 上述FAS系統之產物)之修飾。這些修飾係由碳鏈延長步驟 與去飽和步驟組成。碳鏈延長反應之受質為脂肪基醯基 -CoA(該脂肪酸鏈待延長)與丙二醯基_c〇A(在每一次延長 20 反應中加入二個碳之來源)。碳鏈延長酶反應之產物為脂肪 基醯基-CoA,其在直鏈上具有二額外之碳。自由脂肪酸 (FFAs) —般不會在此反應循環中發生。該去飽和酶會產生 順式雙鍵於預存之脂肪酸鏈上,藉由在氧依賴型反應中減 去2個氫而得。該去飽和酶之受質為醯基-C〇A(在某些動物 45 200813222 中),或是脂肪酸,其可與甘油骨架酯化為PL(如磷酯醯膽 驗)。同樣地’ FFAs並不會在此反應機制中產生。因此’在 ’’標準”或’’典型’’LCPUFA合成路徑中,FFA出現的唯一機會 為在脂肪酸自某些FAS系統釋放時。如上所述,一般為16 5 或18個碳之脂肪酸,且通常不是飽和,就是單_未飽和脂肪 酸,並非較長鏈之PUFA,如EPA或DHA。此長鏈PUFA製造 流程之一結果為,路徑中之中間產物通常會堆積,這通常 代表該系統產生之大部分新的脂肪酸。 因此,依據本發明,稱之為PUFA製造之,,標準”或,,典型 10 ”路徑’係指該脂肪酸合成路徑,其中中鏈長度之飽和脂肪 酸(如上述脂肪酸合成酶(FAS)系統之產物),係經由碳鏈延 長反應與去飽和反應修飾。碳鏈延長反應之受質為脂肪基 醯基-CoA(該脂肪酸鏈待延長)與丙二醯基-C〇a(在每一次 延長反應中加入二個碳之來源)。碳鏈延長酶反應之產物為 15脂肪基醯基-CoA,其在直鏈上具有二額外之碳。該去飽和 酶會產生順式雙鍵於預存之脂肪酸鏈上,藉由在氧依賴型 反應中減去2個氫而得。此路徑與涉及此路徑之基因為文獻 上已知(請參照如先前技術一節)。
使用PUFA PKS(PUFA合成酶)之長鏈PUFAs合成路徑 20 (如下所述)’非常不同於上述之’,標準,,路徑。該PUFA合成 酶會利用丙二醯基-CoA作為碳來源,並製造最終之puFA, 而不會釋放明顯量之中間產物。可在合成過程中加入適當 之順式雙鍵,使用不需要氧之機制。NADpH係在合成循環 中使用作為還原劑。至少在破囊壺菌(thmustGehytHd)puFA 46 200813222 PKS系統中,酵素係以FFA形式釋放PUFA,如同本發明人 首度揭示者。此釋放機制為酵素本身之一部分。因此,以 FFA形式自PUFA酵素系統釋放LCpuFA,為裂殖壺菌 (SChiZ〇Chytrhnn)PUFA PKS系統之獨特特徵,且似乎可為所 5有真核PUFA合成酶系統之特徵,如破囊壺菌 (thraustochytrid)s 〇 因此,本發明人係假設,當表現PUFA PKS系統(PUFA 合成S#系統)於異源性宿主(如不會内生性製造特定pUFA PKS系統之宿主生物體)中時,在希望之部分或脂質分液 10中,PUFA之製造與堆積最佳化需考慮之一因素為,宿主内 生性酿基-CoA合成酶(ACoAS)辨識引入系統之FFA產物,作 為相對應醯基-CoA轉換之受質之能力。如上所述,由於大 部分異源性宿主生物體中引入之PUFAPKS系統,僅會在其 外生性提供時,以PUFA作為FFA,該宿主生物體並不具有 15最佳附屬蛋白,可取而代之控制FFA,其可存在一抑制因子 於最佳PUFA製造與堆積中,在希望之脂質分液,或宿主生 物體之部分中。例如,已知有數家族之蛋白質具有八(:〇八8 活性,且這些酵素之FFA受質傾向性皆具特異性。因此,存 在於某些有潛力之宿主中之ACoAS,並不會轉移長鍵 2〇 PUFA FFA至醯基-CoA,尤其是於一般不會有丹^形式之 PUFA之宿主中。此外,宿主生物體可能不會有形成?]1與 TAG,並可利用pUFA-CoA作為受質之最佳醯基轉移酶。最 後,甚至在内生性製造PUFAPKS系統之宿主生物體中,本 發明人亦相信可經由基因修飾該生物體,使用上述討論之 47 200813222 修飾方法,增進該生物體中油類與油類分液之PUFA堆積。 上述本發明人之發現與路徑,提供了數個原則或策 略,於異源性(或原始)生物體中製造PUFAs,藉由表現PUFA 合成酶: 5 篡因最佳化需要最佳化基因序列以匹配(match)異源 性宿主中之序列,以使蛋白質表現。此以下列範例說明, 其中編碼來自裂殖壺菌(Schizochytrium)PUFA PKS系統之 蛋白質之基因,係經細菌宿主及酵母菌中密碼子使用率最 佳化。最適用於細菌中之基因,亦發現可用於植物中裂殖 10 壺菌(Schizochytrium)PUFA PKS之表現。這些最佳化基因之 細節係如下所述。 PPTase之表齓本發明人測定大腸桿蘭、酵母菌與植物 中存在之内生性PPTases,無法活化PUFA合成酶ACP區 塊。本發明人已於先前定義出適當之替代PPTase,來自 15 Nostoc之Het I(描述於美國專利申請案公開號 20020194641),其可使用於其内生性PPTases*會活化 PUFA合成酶ACP區塊之宿主中。其他適用之ppTases亦經 描述,且可立即獲得。使用PPTases於各種異源性宿主細胞 係如下描述與示範。 2〇 FAS受質淹通_量/抑制之條飾 PUFA合成酶利用丙二 醯基-CoA作為碳鏈延長反應中礙之來源。丙二醯基_c〇A 亦被FAS、細胞質脂肪酸延長反應,與其他酵素(如查爾酮 (chalcone)合成酶)使用。該PUFA合成酶會與其他丙二醯基 -CoA酵素系統競爭。此代表經由PUFA合成酶增進流通量之 48 200813222 一方法,會增強其穩定性, 以與丙二醯基_c〇A匯集物競爭。
(如藉由使用反義股RNA、RNAi、 RNAl、共抑制或突變),2)於異 源性宿主中表現PUFA合成酶,其中競 t路徑已降低或阻斷 (如在卡諾拉油菜杆(CanGla)巾,其細胞質巾延長脂肪酸之 能力已被阻斷),及/或3)藉由增加丙二酿基_c〇A匯集物(如 藉由表現乙醯基_CoA紐酶)。職略範例係於下個範例中 10 更詳細描述與說明。 邋盖-CoA合成酶之表現裂殖壺菌(Schizochytrium)中 存在之酵素,可有效地轉換PUFA合成酶之自由脂肪酸產物 為醯基-CoA。存在於異源性宿主中之酵素,並不會在這些 反應中以類似之效率進行,由於這些自由脂肪酸一般不會 15在這些生物體中產生。例如,醯基_CoA合成酶酵素,其可 有效轉換各種PUFA合成酶之自由脂肪酸產物(如dha、DPA n-6、EPA或其他產物)為醯基_CoA,於這些異源性宿主中之 表現’會導致這些產物堆積能力增加。在此方面,裂殖壺 菌(Schizochytrium),或其他可經由puFA合成酶路徑製造 20 PUFA之生物體,可提供作為編碼這些酵素之基因之良好來 源(請見下列描述與範例)。 (基轉移酶與也關酵素之表現存在於裂殖壺菌 (Schizochytrium)中之酵素,可有效地利用醯基-CoA形式之 PUFA合成酶產物,以合成pl與TAG分子。存在於異源性宿 49 200813222 主中之酵素並不會在這些反應中以類似效率進行,由於這 些自由脂肪酸一般不會在這些生物體中產生。例如,PL或 TAG合成酵素,其可有效整合各種PUFA合成酶之醯基CoA 產物(如DHA、DPA n-6、EPA或其他產物),為pL或TAG分 5子,於這些異源性宿主中之表現,會導致這些產物堆積能 力之增加。在此方面,裂殖壺菌(Schiz〇chytriurn),或其他 可經由PUFA合成酶路徑製造PUFA之生物體,可提供作為 編碼這些酵素之基因之良好來源(請見下列描述與範例)。 之表現可利用其他方法增加異源性宿主 10中PUFAi堆積量或改變其分佈。作為一範例,可於宿主不 同部分中表現PUFA合成酶系統,因而取得個別之丙二醯基 -CoA匯集物者,可產生堆積增加(如於植物細胞之色素體與 細胞質中)。此策略亦以下列範例示範。 因此,本發明係提供一種異源性宿主生物體中製 15造及/或堆積抑制之解決方案,亦提供一種獨特之機會,可 控制並增強任-生物體中PUFA之製造,該生物體係使用 PUFAPKS系統(不論是基因修飾或内生性)製造puFA。特別 的是,本發明係提供多種標的,為蛋白質形式,以及編碼 此種蛋白質之核酸分子,該蛋白質可於經基因修飾以表現 20 PUFAPKS系統以及其他基因修錦之生物體中表現,以及於 此所述之策略,以強化或增加生物體中卿八之製造及/或堆 積,尤其是在生物體中希望之部分或脂質分液中。此類標 的於此-般可稱之為PUFAPKS系統之”附屬"標的。如此所 述,該標的可為核酸分子,及/或其編碼之蛋白質,於此所 50 200813222 述之宿主生物體中表現或過度表現,以及剔除或失活之標 的,或甚至為標的胞器(如目標為植物之色素體)。換句話 說,一標的可為加至PUFA PKS系統之元素,或製造PUFA 之酵素系統之修飾,尤其是,其中該標的係經定義,可用 5 於增加或增進宿主生物體中脂肪酸之製造及/或堆積。 £UFA PKS 系旒(PUFA合成 因此,本發明係相關於一種附屬蛋白與其他標的,用 於與PUFAPKS系統相連結。使用於此,PUFAPKS系統(其 亦可稱之為P U F A合成酶系統或P U FA合成酶)一般具有下列 10特徵:⑴可製造PUFA,尤其是長鏈PUFA,為該系統之天 然產物;以及(2)包含數種多功能性蛋白質,組合為複合體, 可恩_疫產生脂肪酸鏈迭代與非迭代過程,包括反式-順式異 構物化與_自旨還原反應,於選定之循環中。此外,PUfa合 成酶酵素中存在之ACP區塊需要藉由連結一輔酶(4-磷酸泛 15醯巯基)而活化。此辅酶之連結係以磷酸泛醯巯基轉移酶 (PPTase)達成。若宿主生物體中之内生性ppTase無法活化該 pUFA合成酶ACP區塊,則它必須提供一PPTase,其可執行 忒功能。本發明人已辨識出Nostoc sp·之Het I酵素可作為 一不範性且適當之ppTase,用以活化該PUFA合成酶ACp區 2〇塊。PUFA PKS系統或PUFA合成酶,係通稱所有的基因及 其編碼之產物,其以複合體方式發揮功能,在生物體中製 造PUFA。因此,該PUFA PKS系統特別指一pKS系統,其自 然產物為PUFA。 更特別的是,於此稱之為PUFAPKS系統者,會製造多 51 200813222 不飽和脂肪酸(PUFAs),尤其是長鏈PUFAs(LCPUFAs)為產 物。例如,内生性(自然地)含有PUFAPKS系統之生物體會 使用此系統製造PUFA。依據本發明,puFA為具有至少16 個碳鏈長度之脂肪酸,更佳為至少18個碳,較佳為至少2〇 5個碳’尤佳為22或更多個碳,具有至少3或更多個雙鍵,較 佳為4個或更多,更佳為5個或更多,尤佳為6個或更多雙 鍵,其中所有雙鍵皆位於順式結構中。於此稱為長鏈多不 飽和脂肪酸(LCPUFAs)者,特別指具有18個或更多個碳原 子之鏈長度之脂肪酸,較佳為20與更多個碳鏈長度,含有 10 3或更多個雙鍵。omega-6系列之LCPUFA包括:γ_次亞麻 油酸(C18 : 3)、二高个次亞麻油酸(C20 : 3η-6)、花生四稀 酸(C20 : 4n-6)、adrenic add(亦稱之為二十二碳四烯酸或 DTA)(C22: 4n-6),以及二十二碳五烯酸(C22: 5n-6)。〇mega-3 系列之LCPUFA : r -次亞麻油酸(C18 : 3)、二十碳三烯酸 15 (C20 : 3n-3)、二十碳四烯酸(C20 : 4n_3)、二十碳五烯酸 (C20 : 5n-3)、二十二碳五烯酸(C22 : 5n_3),以及二十二碳 六稀酸(C22 : 6n-3)。該LCPUFAs亦包括具有大於22個碳與 4或更多個雙鍵之脂肪酸,包括,但不侷限於,c28: 本發明之PUFA PKS系統亦包含數個多功能之蛋白質 (且可包括單—功能蛋白質,尤其是來自海洋細菌之柯二 pks系統),其可組合為—複合體,可職弓丨導脂肪酸鍵迭 代與非送代過程,包括反式順式異構物化與烯酯還原反 應,於選冑之循環中。這些蛋白質於此亦稱之為核心tpufa PKS酵素複合體,或核心PUFA PKS系統。這些蛋白質内 52 200813222 含之區塊與模體之一般功能皆為技術上已知,且已詳細描 述各種來自海洋細菌與真核生物體之PUFA PKS系統(請 見,如美國專利案號6,140,486 ;美國專利案號6,566,583 ; Metz et al·,Science 293 : 290-293(2001);美國專利申請公 5開案號20020194641 ;美國專利申請公開案號 20040235127;美國專利申請公開案號20050100995,以及 PCT公開案號WO 2006/135866)。該區塊可為單一蛋白質 (即,該區塊與蛋白質為同義),或在一單一蛋白質上有二或 更多(多重)區塊,如上所述。 10 來自海洋細菌與破囊壺菌(thraustochytrium)成員之各 種PUFA PKS系統區塊架構,以及包含此PUFA PKS系統之 基因與蛋白質之結構與功能特性,已詳細描述(請見如美國 專利號6,140,486;美國專利號6,566,583; Metz et al.,Science 293 : 290-293(2001);美國專利申請公開案號20020194641 ; 15美國專利申請公開案號20040235127 ;美國專利申請公開案 號20050100995,以及PCT 公開號WO 2006/135866)。 可使用於本發明之PUFA PKS系統與其蛋白質或區 塊,包括細菌性與非細菌性PUFA PKS系統。非細菌性PUFA PKS系統為來自或衍生自非細菌之生物體,如真核生物或 20古生菌’之PUFAPKS系統。真核生物與原核生物之分別為 細胞分化之程度,真核生物較原核生物更進一步分化。一 般而s ’原核生物不具有核膜,在細胞分裂時無有絲分裂 現象,僅具有一個染色體,在細胞質中含有7〇s核醣體,不 具有粒線體、内質網、葉綠體、溶小體或高基氏體,且可 53 200813222 具有鞭毛,若存在的話,則具含有單_纖絲。相反地,真 核生物則具有核膜,在細胞分裂時有有絲分裂現象,有ς 多染色體,在細胞質中含_8核酿體,具有粒線體、内質 網、葉綠體(海藻中)、溶小體或高基氏體,可具有鞭毛,= 5存在的話,則具含有許多纖絲。-般而言,細菌為原= 物’而海藻、黴菌、單細胞生物、原生動物與較高等植物 為真核生物。依據本發明,可產生經基因修飾之植物,其 具有非細菌性PUFA PKS功能性區塊、細菌性pUFA pKS# 能性區塊,以及來自其他PKS系統(第〗型迭代式或模塊式、 10第η型或第hi型)之PKS功能性區塊或蛋白質,或fas系統。 較佳為,本發明之PUFAPKS系統包含至少下列具生物 活性之區塊,其一般含有三或更多個蛋白質:(a)至少一烯 酯-ACP還原酶(ER)區塊;(b)多重醯基載體蛋白質(ACP) 區塊(如至少一至四,較佳至少五個ACP區塊,在某些實施 15例中,至多六、七、八、九、十,或大於十個ACP區塊); (c)至少二β_酮基醯基_acp合成酶(KS)區塊;(d)至少一醯基 轉移酶(AT)區塊;(e)至少一 β-酮基醯基-ACP還原酶(KR) 區塊;(f)至少二FabA-類似-β-羥基醯基-ACP脫氫酶(DH)區 塊;(g)至少一鏈長度因子(CLF)區塊;(h)至少一丙二醯基 20 _CoA : ACP醯基轉移酶(MAT)區塊。在一實施例中,本發 明之一 PUFA PKS系統亦包含至少一含有脫氫酶(DH)保守 活性位置之區域。 在一較佳實施例中,PUFAPKS系統包含至少下列具生 物活性區塊:(幻至少一烯酯_ACP還原酶(ER)區塊;(b)至 54 200813222 少五酿基載體蛋白質(ACP)區塊,(c)至少二β-嗣基酿基 -ACP合成酶(KS)區塊;(d)至少一醯基轉移酶(AT)區塊;(e) 至少一β_酮基酿基-ACP還原酶(KR)區塊;(f)至少二FabA-類似β-羥基醯基-ACP脫氫酶(DH)區塊;(g)至少一鏈長度因 5 子(CLF)區塊;以及(h)至少一丙二醯基-CoA : ACP醯基轉 移酶(MAT)區塊。在一實施例中,本發明之PUFAPKS系統 亦包含至少一區域或區塊含有一脫氫酶(DH)保守活性位置 模體,其並非FabA-類似DH區塊之一部分。這些區塊每一 者之結構與功能特性,皆詳細描述於美國專利申請案公開 10號20020194641 ;美國專利申請案公開號20040235127;美 國專利申請案公開號20050100995 ;以及PCT公開號WO 2006/135866。 依據本發明,具有3-酮基醯基-ACP合成酶(KS)生物活 性(功能)之區塊或蛋白質之特徵為該酵素會進行FAS(與 15 PKS)^鏈延長反應循環之起始步驟。術語,,β-酮基醯基-ACP 。成酶可與’’3-酮基醯基_Acp合成酶,,、,,β_酮基醯*_ACp 合成酶’’以及”酮基_醯基Acp合成酶",及其類似衍生詞互 /、、使用待延長之醯基係藉由硫自旨鍵連結至酵素活性 位置之半胱胺酸殘基上。在多步驟反應中,醯基_酵素係 ”丙一|&基_八(:1>進行縮合反應,形成-酮基醯基、〔a 2自由酵素。KS在碳鏈延長循環中扮演重要角色,且在許 夕系統中顯示具有較大之受質特異性,與該反應循環中之 f他酵素相較。例士σ,大腸桿菌具有三侧特之KS酵素· 每者左在該生物體中具有特定功 tb (Magnuson et al. 55 200813222
Microbiol. Rev· 57,522(1993))。海洋細菌與破囊壺菌 (thraustochytrid)中 PUFA-PKS系統之二KS區塊,在PUFA 生 合成反應順序上扮演獨特的角色。作為某一類之酵素,Kg 已經完整鑑定。許多已辨識出之KS基因之序列為已知,該 5活性位置模體已辨識出,且其中數種已解出其結晶結構。 蛋白質(或蛋白質區塊)可立即辨識出,屬於KS家族酵素, 與已知之KS序列具有相似性。 依據本發明,具有丙二醯基_C〇A : ACP醯基轉移酶 (MAT)生物活性(功能)之區塊或蛋白質之特性為,其可自丙 10二醯基_CoA上轉移丙二醯基片段至ACP。術語,,丙二醯基 -CoA : ACP醯基轉移酶”可與,,丙二醯基醯基轉移酶”,及 類似衍生詞互相交換使用。除了該活性位置模體(GxSxG> 之外’這些酵素在關鍵位置上具有一延長之R與Q胺基酸 模體’使其被辨識為MAT酵素(如相對於下列之AT區塊)。 15在某些PKS系統(但非PUFA PKS區塊)中,MAT區塊並不傾 向於載入甲基-或乙基-丙二酸酯於ACP基團上(自相對應之 CoA酯),因此引入分支至直線碳鏈上。MAT區塊之特徵為 其與已知之MAT序列及其延伸之模體結構之相似度。 依據本發明,具有醯基載體蛋白質(ACP)生物活性(功 20能)之區塊或蛋白質特徵為其為小型多胜肽(一般而言,80 至100個胺基酸),其功能係作為成長脂肪基醯基鏈時之載 體’该鏈成長經由硫g旨鍵連結至共價性結合之蛋白質與輔 酶。它們發生於不同之單元或較大蛋白質之區塊中。ACP 係自未活化之不完全(&1)0>形式轉換為功能性完全(h〇1〇)_ 56 200813222 形式,藉由轉移CoA上之磷酸泛醯巯基片段至ACP上之高度 保守絲胺酸殘基。醯基基團係連結至ACP上,藉由於磷酸 泛醯巯基片段之自由終端之硫酯鍵連結。ACp係以標記有 放射活性之泛醯酼基,以及與已知ACP之序列相似性而辨 5識出。上述模體(LGIDS*)變化之存在亦為ACP之一特徵。 依據本發明’具有_基還原酶活性,亦稱之為3-酮基 醯基-ACP還原酶(KR)生物活性(功能),之區塊或蛋白質特 徵為’可催化3-_基醯基形式之AcPiat咬-核苷酸-依賴型 還原。此為脂肪酸重新生合成延長循環之第一還原步驟, 10以及通常於聚酮生合成中進行之反應。術語”β_酮基醯基 -ACP還原酶”可與術語”酮基還原酶,,、” 3_酮基醯基_八(^]?還 原酶π、π酮基-醯基ACP還原酶,,及該術語之類似衍生詞, 互相父換使用。明顯之序列類似度係觀察自烯酯Acp還原 酶豕族(ER);其他FAS還原酶(但非出現於puFApKS系統之 15 ER豕族)’以及短鏈酒精脫氫酶家族。上述之pUFA pks區 域之Pfam分析透露出其與短鏈酒精脫氫酶家族核心區域 之相似性。相同區域之Blast分析則與已知之反尺酵素核心區 域匹配,並有一延伸區域與其他已鑑定之pUFApKS系統區 塊具有相似性。 20 依據本發明,該區塊或蛋白質係可作為一鏈長度因子 (CLF) ’依據下列邏輯。CLF原本描述之特徵為第π型(分離 酵素)PKS系統,且假設在延長循環次數上扮演重要角色, 因而在最終產物鏈長度上相當重要。CLF胺基酸序列顯示 與KS區塊具相似性(被認為與Ks蛋白質形成異體二合 57 200813222 物),但缺乏活性位置半胱胺酸。clf在pKs系統中之角色 是有辛議的。新的證據(C· Bisang et al·,Nature 401, 5〇2( 1999))顯不在PKS系統之啟動㈣㈤㈣)(提供待延長之 醯基基團)上扮演重要角色。在此角色中,CLF區塊被認為 5是賴基丙二酸自旨(為丙HAcp),因此形成可轉移至 KS活性位置之醋酸鹽基團。因此,此醋酸鹽可作為‘啟動 (priming)’分子,其可進行起始延長(縮合)反應。第η型CLF 之類似性已被辨識為某些模塊式PKS系統之‘載入,區塊。具 有CLF序列特徵之區塊在所有最近辨識出之PUFA 系 10統皆發現到,且在每一情況下,皆發現為多區塊蛋白質之 一部分。 ’’醯基轉移酶”或”AT”係指一般類型之酵素,其可進行 數種獨特之醯基轉移反應。術語”醯基轉移酶,,可與術語,, 醯基轉移酶"互相交換使用。PUFA PKS系統中辨識出之八丁 15區塊與另一者,以及所有最近檢視出之其他PUFA 1>反8系 統之區塊顯示良好之相似性,並與某些醯基轉移酶顯示較 差之相似性,該轉移酶之功能已經辨識(如丙二酿基_c〇a : ACP醯基轉移酶,MAT)。雖然與MAT相似性較差,Ατ區塊 並不被為可作為MAT,由於其不具有此類酵素之延伸模體 20 結構(請見上述有關MAT區塊之描述)。就本發明目的,ρυρΑ PKS系統中AT區塊之可能功能包括,但不侷限於:脂肪某 醯基基團自ORFA ACP區塊轉移至水上(即以自由脂肪酸形 式進行脂肪基醯基之硫酯鍵_釋放)、將脂肪基隨基轉#1才妾 受者如CoA上、將醯基在各ACP區塊間轉移,或將脂肪基酿 58 200813222 基轉移至親脂性受器分子上(如至溶血磷酸上)。 依據本發明,此區塊具有烯酯還原酶(ER)生物活性。 該ER酵素會還原脂肪基醯基-ACP上之反式雙鍵(由DH活 性引入),使這些碳鏈完全飽和。PUFA-PKS中之ER區塊, 5 顯示與最近新發現之ER酵素家族具有相似性(Heath et al., Nature 406,145(2000))。Heath與Rock發現此新類型之ER 酵素,藉由選殖肺炎雙球菌(Streptococcus pneumoniae)中有 興趣之基因、純化由該基因表現之蛋白質,並顯示出其在 體外試驗中具有ER活性。目前所有新發現之PUFAPKS系統 10 皆含有至少一區塊,與裂殖壺菌(Schizochytrium)ER區塊具 有非常高之相似性,其顯示與肺炎雙球菌ER蛋白質具相似 性。 依據本發明,具有脫水酶或脫水酶(DH)蛋白質或區塊 會催化一脫水反應。使用於此,具有DH活性一般係指具有 15 FabA-類似β-羥基醯基-ACP脫水酶(DH)生物活性。FabA·類 似β-羥基醯基-ACP脫水酶(DH)生物活性會自β-酮基醯基 -ACP移除ΗΟΗ,一開始會在碳鏈上製造出一反式雙鍵。術 語"FabA-類似β-羥基醯基-ACP脫水酶”可與術語’’FabΑ-類 似β-羥基醯基-ACP脫水酶”、”β-羥基醯基-ACP脫水酶,,、 2〇 ’’脫水酶”及類似衍生術語交換使用。PUFA PKS系統之DH 區塊顯示與具有FAS系統(而非其他PKS系統之DH區塊)之 細菌DH酵素具有相似性。次族群之細菌DH中,該FabA-類 似DH具有順式-反式異構酶活性(Heath et al.,J. Biol. Chem., 271,27795(1996))。與FabA-類似DH蛋白質之相似性,代表 59 200813222 此述之一或所有DH區塊對應於PUFA PKS產物順式雙鍵之 插入0 用於本發明之PUFA PKS蛋白質亦具有脫水酶之活 性,並未鑑定為FabA-類似(如上述與FabA-類似活性相關之 5 順式-反式活性),於此一般稱之為非-FabA-類似DH活性, 或非-FabA-類似β-羥基醯基-ACP脫水酶(DH)生物活性。更 特別的是,保守活性位置模體(〜13胺基酸長: L*xxHxxxGxxxxP ;如SEQIDNO : 70胺基酸2504-2516 所 示;*在該模體中,L可為I)係於PKS系統之脫水酶區塊中 10 發現(Donadio S,Katz L· Gene. 1992 Feb 1 ; 111(1): 51-60)。 此保守模體,亦稱之為脫水酶(DH)保守活性位置模體或DH 模體,係發現於所有目前已知PUFA_PKS序列之類似區域 中,但一般認為,其模體最近才被偵測到。此保守模體係 位於PUFA-PKS序列中高度相似之尚未辨識區域中。假設經 15由PUFA-PKS之PUFA生合成需要非-FabA類似之脫水反 應,而此模體則可用於該反應。 用於說明目的,數種PUFA PKS系統之架構係於下詳 述。然而,應瞭解到本發明並非限制這些PUFA PKS系統之 使用。 20 裂殖套菌(Schizochvtrium)PUFA PKS 系繞
在一實施例中’來自裂殖3?囷(Schizochytrium)之PUFA PKS系統包含至少下列生物活性區塊:(a)二烯酯_ACP還原 酶(ER)區塊;(b)5至10個或更多之醯基載體蛋白質(ACp)區 塊,且在一觀點中,9個ACP區塊;(c)二β_酮基醯基_ACP 60 200813222 合成酶(KS)區塊;(d)—醯基轉移酶(AT)區塊;(e) — β-酮基 醯基-ACP還原酶(KR)區塊;(f)二FabA-類似β-羥基醯基 -ACP脫水酶(DH)區塊;(g) —碳鏈長度因子(CLF)區塊;以 及(h) —丙一基-CoA · ACP酿基轉移酶(MAT)區塊。在^一 5 實施例中’本發明之裂殖壺菌(Schizochytrium)PUFA PKS 系統亦包含至少一區域或區塊,含有一脫水酶(DH)保守活 性位置模體,其並非FabA-類似DH區塊之一部分。這些區 塊之結構與功能性特徵分別為技術上已知(請見如美國專 利號 6,566,583 ; Metz et al·,Science 293 : 290-293(2001); 10 美國專利申請案公開號20020194641 ;以及PCT公開號WO 2006/135866)。 先前已描述有三個開放閱讀框架(open reading frames) 會形成裂殖壺菌(Schizochytrium)PUFA PKS系統。每一開放 閱讀框架(open reading frame)之區塊架構如下。 15 裂殖壺菌(Schizochvtrium)開放閱讀框架(open reading frame)A(OrfA):
OrfA之完整核苷酸序列於此係描述為SEQ ID NO : 1。OrfA為8730個核苷酸序列(不包括終止密碼子),其編 碼2910個胺基酸序列,於此為SEQ ID NO : 2。在OrfA中有 20 12個區塊:(a) — β-酮基醯基-ACP合成酶(KS)區塊;(b)—丙 二醯基-CoA : ACP醯基轉移酶(MAT)區塊;(c)9個醯基載 體蛋白質(ACP)區塊;以及(d) —個酮基還原酶(KR)區塊。 編碼OrfA之基因體DNA複製株(質體),來自裂殖壺菌 (Schizochytrium)sp· ATCC 20888與其子株 ATCC 20888,命 61 200813222 名為裂殖壺菌(Schizochytrium)sp· N230D株,係分離出並定 序。 於此所述之基因體複製株為JK1126,分離自裂殖壺菌 (Schizochytrium)sp· ATCC 20888,包含,就本發明人所知, 5 SEQ ID NO : 1位置1至8730之核苷酸序列,並編碼SEQ ID NO ·· 2所對應之胺基酸序列。基因體複製株pJK1126(命名 為pJK1126 OrfA基因體複製株,為大腸桿菌質體載體形 式,含有裂殖壺菌(Schizochytrium)ATCC 20888之’OrfAn 基因),係寄存於美國菌種中心(ATCC),10801 University 10 Boulevard,Manassas,Va. 20110-2209 USA,於2006年6 月 8 曰,ATCC取得號為PTA-7648。本發明包含pJK1126 OrfA 基因體複製株之核苷酸序列,以及由此質體編碼之胺基酸 序列。 於此描述之二基因體為pJK306 OrfA基因體複製株與 15 pJK320 OrfA基因體複製株,分離自裂殖壺菌 (Schizochytrium)sp· N230D,共同包含(重疊複製株),就本 發明人所知,SEQ ID NO : 1之核苷酸序列,以及其所編碼 之SEQIDNO ·· 2胺基酸序列。基因體複製株pJK306(命名 為pJK306 OrfA基因體複製株,為大腸桿菌質體形式,含 20 有來自裂殖壺菌(Schizochytrium)sp. N230D(與 pJK320 重疊 2.2kB)OrfA基因之5’端部分),係寄存於美國菌種中心 (ATCC),10801 University Boulevard, Manassas, Va. 20110-2209 USA,於 2006 年 6 月 8 日,ATCC 取得號為 PTA-7641。本發明包含pJK306 OrfA基因體複製株之核苷 62 200813222 酸序列,以及此質體編碼之胺基酸序列。基因體複製株 PJK320(稱之為pJK320 0rfA基因體複製株,為大腸桿菌 夤體形式’含有來自裂殖壺菌(Schizochytrimn)sp. N230D(與PJK306重疊2.2kB)OrfA基因之3,端部分),係寄 5 存於美國囷種中心(ATCC),10801 University Boulevard, Manassas,Va. 20110-2209 USA,於2006年6月 8 日,ATCC 取 得號為No· PTA-7644。本發明包含pJK320 OrfA基因體複製 株之核皆酸序列’以及此質體編碼之胺基酸序列。
OrfA之第一區塊為KS區塊,於此亦稱之為ORFA-KS, 10 含有編碼此ORFA-KS區塊之序列之核苷酸序列為SEQ ID NO : 7(SEQ ID NO : 1 之位置 1-1500)。含有〇RFA_KS區塊 之胺基酸序列為SEQ ID NO : 8(SEQ ID NO : 2之位置 1-500)。值得注意的是該ORFA-KS區塊含有一活性位置模 體:DXAC*(*醯基結合位置C215)。同時,在裂殖壺菌 15 (Schizochytrium)KS末端之一特徵模體,GFGG,出現於 SEQ ID NO: 2之此區塊中,因此亦存在於SEQ ID NO: 8。
OrfA之第二區塊為MAT區塊,於此亦稱之為 ORFA-MAT,含有編碼此ORFA-MAT區塊之序列之核苷酸 序列為SEQIDNO: 9(SEQIDNO: 1 之位置 1723-3000)。含 20 有ORFA-MAT區塊之胺基酸序列為SEQIDNO : 10(SEQID NO : 2之位置575-1000)。該MAT區塊包含一天門冬胺酸於 位置93,以及一組胺酸於位置94(分別對應於SEQ ID NO : 2 之位置667與668)。值得注意的是,ORFA-MAT區塊含有一 活性位置模體:GHS*XG(*醯基結合位置S7〇6),於此為SEQ 63 200813222 ID NO : 11 〇
OrfA之區塊3-11為9個重複之aCP區塊,於此亦稱之為 ORFA-ACP(該序列中之第一區塊為〇RFA_ACp丨、第二區塊 為0RFA-ACP2、第三區塊為〇rfa_ACp3等)。該第一 Acp 5區塊’ 0RFA-ACP卜係位於SEQ ID NO : l(OrfA)之位置約 3343至約3600之核苷酸序列内。含有編碼此〇1^八-八(:1>1區 塊之序列之核苷酸序列為SEQ ID NO : 12(SEQ ID NQ : 1 之位置3343-3600)。含有第一 ACP區塊之胺基酸序列為 SEQ ID NO : 2之位置約1115至約位置12〇〇。含有 10 ORFA-ACP1區塊之胺基酸序列於此係為SEq m no : 13(SEQ ID NO : 2位置1115_12〇〇)。值得注意的是 0RFA_ACP1區塊含有一活性位置模體·· LGIDS*(*泛醯巯基 結合模體S1157),於此為SEQ ID NO : 14。 所有9個ACP區塊之核苷酸與胺基酸序列皆為高度保 15守,因此,每一區塊之序列並非由個別序列辨識子(identifier) 代表。然而,基於此述之資訊,熟習此技術領域者可立即 決疋含有其他8個ACP區塊任一個之序列。所有9個acp共 同橫越SEQ ID NO : 1約位置3283至約位置6288之區域, 其對應於SEQ ID NO : 2之胺基酸位置約1〇95至約2096。含 20有所有9個區塊之完整ACP區域之核苷酸序列於此係以SEq
ID NO : 16代表。由SEQ ID NO : 16代表之區域包括各ACP 區塊間之聯結片段。9個區塊間之重複間隔約為SEq ID NO : 16每330個核苷酸(鄰近活性位置絲胺酸之實際胺基酸 數目為104至116個胺基酸)。9個ACP區塊之每一者皆含有一 64 200813222 泛醯巯基結合模體LGIDS*(於此以SEQIDNO: 14代表), 其中S*為泛醯巯基結合位置絲胺酸(s)。泛醯Μ基結合位 置絲胺酸(S)係位於接近每一ACP區塊序列中心處。在ACP 區塊區域之每一末端與介於每一ACP區塊之間為一富含脯 5 胺酸(Ρ)與丙胺酸(Α)之區域,其一般認為為一聯結區域。例 如,介於ACP區塊1與2之間為序列: APAPVKAAAPAAPVASAPAPA,於此以SEQ ID NO : 15代 表。9個ACP區塊每一者之活性位置絲胺酸殘基位置(即,該 泛醯巯基結合位置),就SEQ ID NO: 2胺基酸序列而言,如 1〇 下· ACPI = S1157,ACP2 = S1266,ACP3 = S1377,ACP4 = S1488,ACP5 = Si6〇4,ACP6 = S1715,ACP7 = S1819,ACP8 = S193〇;以及ACP9 = S2034 〇 ACP區塊之平均大小為約85胺基 酸,除了聯結基之外,約110胺基酸包含於聯結基中,活性 位置絲胺酸約在該區塊之中心,熟習此技術領域者可立即 15 決定OrfA中9個ACP區塊之每一者。
OrfA之區塊12為一KR區塊,於此亦稱之為0RFA-KR, 含有編碼此0RFA-KR區塊之序列之核苷酸序列為SEQ ID NO : 17(SEQ ID NO : 1 之位置6598_8730)。含有0RFA-KR 區塊之胺基酸序列為SEQ ID NO : 18(SEQ ID NO ·· 2位置 20 2200-2910)。在KR區塊中為一核心區域,與短鏈醛類-脫氫 酶具有相似性(KR為此家族之一成員)。此核心區域橫越 SEQIDNO:l之約位置7198至約位置7500,其對應於SEQ IDNO : 2胺基酸位置2400_2500。 裂殖壺菌(Schizochytrium)開放閱讀榧絮r〇pen reading 65 200813222 frame)B(OrfB) ··
Orffl之完整核苷酸序列於此係描述為SEQ ID NO : 3。Orffl為6177個核苷酸序列(不包括終止密碼子),其編碼 2059個胺基酸序列,於此為SEQ ID NO ·· 4。Orffi有4個區 5 塊:⑻一酮基醯基-ACP合成酶(KS)區塊;⑻一鏈長度因子 (CLF)區塊;(c)一醯基轉移酶(AT)區塊;以及(d)—烯酯ACP-還原酶(ER)區塊。 編碼來自裂殖壺菌(Schizochytrium)sp. ATCC 20888 與其子株ATCC 20888,命名為裂殖壺菌(Schizochytrium) 10 sp·,N230DOrfB株,之Orffl基因體DNA複製株(色素體), 係經分離與定序。 於此所述之基因體複製株為JK1129,分離自裂殖壺菌 (Schizochytrium)sp. ATCC 20888,包含,就本發明人所知, SEQ ID NO: 3之核苷酸序列,並編碼SEQ ID NO: 4所對應 15 之胺基酸序列。基因體複製株pJK1129(稱之為PJK1129 Orffl基因體複製株,為大腸桿菌質體載體形式,含有裂殖 壺菌(Schizochytrium)ATCC 20888之’Orffi’’基因),係寄存於 美國菌種中心(ATCC),10801 University Boulevard, Manassas,Va· 20110-2209 USA,於2006年6月 8 日,ATCC 取 2〇 得號為PTA-7649。本發明包含pJK1126 Orffl基因體複製株 之核苷酸序列,以及由此質體編碼之胺基酸序列。 於此描述之基因體複製株為pJK324 OrfB基因體複製 株’分離自裂殖壺菌(Schizochytrium)sp. N230D,包含就本 發明人所知,SEQ ID NO : 3之核苷酸序列,以及其所編碼 66 200813222 之SEQ ID NO : 4胺基酸序列。基因體複製株pJK324(命名 為pJK324 Orffi基因體複製株,為大腸桿菌質體形式,含 有來自裂殖壺菌(Schizochytrium)N230D OrfB基因),係寄存 於美國菌種中心(ATCC),10801 University Boulevard, 5 Manassas,Va. 20110-2209 USA,於2006年6月 8 日,ATCC 取 得號為PTA-7643。本發明包含pJK324 Orffi基因體複製株 之核苷酸序列,以及此質體編碼之胺基酸序列。
Orffi之第一區塊為KS區塊,於此亦稱之為ORFB-KS, 含有編碼此ORFB-KS區塊之序列之核苷酸序列為SEQ ID 10 NO : 19(SEQ ID NO : 3之位置 1-1350)。含有ORFB-KS區塊 之胺基酸序列為SEQ ID NO : 20(SEQ ID NO : 4之位置 1-450)。此KS區塊包含一纈胺酸於SEQ ID NO : 20位置 371(亦在SEQ ID NO : 20之位置371)。值得注意的是該 ORFB-KS區塊含有一活性位置模體:DXAC*(*醯基結合位 15 置Ci96)。同時,在裂殖壺菌(Schizochytrium)KS末端之一 特徵模體,GFGG,出現於SEQ ID NO : 4之此區塊中,因 此亦存在於SEQ IDNO : 20。
OrfB之弟二區塊為CLF區塊’於此亦稱之為 ORFB-CLF,含有編碼此ORFB-CLF區塊之序列之核苷酸序 20 列為 SEQ ID NO : 21(SEQ ID NO : 3之位置 1378-2700)。含 有ORFB-CLF區塊之胺基酸序列為SEQ ID NO : 22(SEQ ID NO : 4之位置460-900)。值得注意的是,ORFB_CLF區塊含 有KS活性位置模體,不含醯基-結合半胱胺酸。
Orffi之第三區塊為AT區塊,於此亦稱之為ORFB-AT, 67 200813222 含有編碼此ORFB-AT區塊之序列之核苷酸序列為SEQ ID NO : 23(SEQ ID NO : 3之位置2701-4200)。含有ORFB-AT 區塊之胺基酸序列為SEQ ID NO : 24(SEQ ID NO : 4之位置 901-1400)。值得注意的是,ORFB-AT區塊含有一活性位置 5 模體:GxS*xG(*醯基結合位置S114G),其特徵為醯基轉移酶 (AT)蛋白質。
OrfB之第四區塊為ER區塊,於此亦稱之為ORFB-ER, 含有編碼此ORFB-ER區塊之序列之核苷酸序列為SEQ ID NO : 25(SEQ ID NO : 3之位置4648-6177)。含有ORFB-ER 10 區塊之胺基酸序列為SEQ ID NO: 26(SEQ ID NO: 4之位置 1550-2059)。 裂殖壺菌(Schizochvtrium)開放閱讀框架(open reading frame^CfOrfC):
OrfC之完整核苷酸序列於此係描述為SEQ ID NO : 15 5<^OrfC為4506個核苷酸序列(不包括終止密碼子),其編碼 1502個胺基酸序列,於此為SEQ ID NO : 6。在OrfC中有3 個區塊:(a)二FabA-類似.經基醯基-ACP脫水酶(DH)區 塊;以及(b)—烯酯ACP-還原酶(ER)區塊。 編碼來自裂殖壺菌(Schizochytrium)sp. ATCC 20888 20 與其子株ATCC 20888 ,命名為裂殖壺菌 (Schizochytrium)sp.,N230DOrfB株,之OrfC基因體DNA複 製株(質體),係經分離與定序。 於此所述之基因體複製株為pJKl 131,分離自裂殖壺菌 (Schizochytrium)sp. ATCC 20888,包含,就本發明人所知, 68 200813222 SEQ ID NO: 5之核苷酸序列,並編碼SEQ ID NO: 6所對應 之胺基酸序列。基因體複製株pJK1131(稱之為pJK1131 OrfC基因體複製株,為大腸桿菌質體載體形式,含有裂殖 壺菌(Schizochytriimi)ATCC 20888之’OrfC” 基因),係寄存 5 於美國菌種中心(ATCC),10801 University Boulevard, Manassas,Va· 20110-2209 USA,於2006年6月 8 日,ATCC 取 得號為PTA-7650。本發明包含pJK1131 OrfC基因體複製株 之核苷酸序列,以及由此質體編碼之胺基酸序列。 於此描述之基因體複製株為pBR002 OrfC基因體複掣 10 株,分離自裂殖壺菌(Schizochytrium)sp. N230D,包含就本 發明人所知,SEQ ID NO : 5之核苷酸序列,以及其所編碼 之SEQIDNO : 6胺基酸序列◦基因體複製株pBR002(命名 為pBR002 OrfC基因體複製株,為大腸桿菌質體形式,含 有來自裂殖壺菌(Schizochytrium)N230D OrfB基因),係寄存 15 於美國菌種中心(ATCC),10801 University Boulevard, Manassas,Va· 20110-2209 USA,於2006年6月 8 日,ATCC 取 得號為PTA-7642。本發明包含pBR002 0rfC基因體複製株 之核苷酸序列,以及此質體編碼之胺基酸序列。
OrfC之第一區塊為DH區塊,於此亦稱之為 20 ORFC-DH1。此為OrfC中二DH區塊之一。因此於此命名為 DH1。含有編碼此ORFC-DH 1區塊之序列之核苷酸序列為 SEQ ID NO : 27(SEQ ID NO : 5之位置 M350)。含有 ORFC-DH1區塊之胺基酸序列為SEQ ID NO : 28(SEQ ID NO : 6之位置 1-450)。 69 200813222
OrfC之第二區塊為DH區塊,於此亦稱之為 0RFC-DH2。此為OrfC中二DH區塊之一。因此於此命名為 DH2。含有編碼此0RFC-DH 2區塊之序列之核苷酸序列為 SEQ ID NO : 29(SEQ ID NO : 5之位置 1351-2847)。含有 5 ORFC-DH2區塊之胺基酸序列為SEQ ID NO : 30(SEQ ID NO : 6之位置451-949)。此DH區塊包含胺基酸 H-G-I-A-N_P-T-F-V-H-A-P-G-K-I(SEQ ID NO : 6 之位置 876-890),於SEQ ID NO : 30之位置426-440。
OrfC之第三區塊為ER區塊,於此亦稱之為ORFC-ER, 10 含有編碼此ORFC-ER區塊之序列之核苷酸序列為SEQ ID NO : 31(SEQ ID NO : 5之位置2995-4506)。含有ORFC-ER 區塊之胺基酸序列為SEQ ID NO: 32(SEQ ID NO: 6之位置 999-1502) 〇
破囊壺菌(thraustochvtrium)之 PUFA PKS 系統 15 在一實施例中,破囊壺菌(thraustochytrium)PUFA PKS 系統包含至少下列生物活性區塊:(a)二烯酯-ACP還原酶 (ER)區塊;(b)5至10個或更多之醯基載體蛋白質(ACP)區 塊,且在一觀點中,8個ACP區塊;(c)二β-酮基醯基-ACP 合成酶(KS)區塊;(d)—醯基轉移酶(AT)區塊;(e) — β-酮基 20 醯基-ACP還原酶(KR)區塊;(f)二FabA-類似β-羥基醯基 -ACP脫水酶(DH)區塊;(g) —碳鏈長度因子(CLF)區塊;以 及(h)—丙二醯基-CoA : ACP醯基轉移酶(MAT)區塊。在一 實施例中,本發明之破囊壺菌(thraustochytrium)PUFAPKS 系統亦包含至少一區域或區塊,含有一脫水酶(DH)保守活 70 200813222 性位置模體’其並非FabA-類似DH區塊之一部分。這些區 塊之結構與功能性特徵分別為技術上已知(請見,如美國專 利申請案公開號2004035127,如上所述)。 先鈾已描述有三個開放閱讀框架(〇petl reading frames) 會形成核心破囊壺菌(thraustochytrium)23B PUFA PKS系 統。母一開放閱讀框架(〇peil rea(jing frame)之區塊架構如 下0 破囊斋菌(thraustochvtrium)23B開放閱讀框架(open reading framedA(OrfA):
10 Th· 23B OrfA之完整核苷酸序列於此係描述為SEQ IDNO : 38。Th· 23B OrfA為8433個核苷酸序列(不包括終 止密碼子),其編碼2811個胺基酸序列,於此為SEQ ID NO : 39。SEQ ID NO : 38 編碼下列Th. 23B OrfA區塊:⑻一β-酮基醯基-ACP合成酶(KS)區塊;(b)—丙二醯基-CoA : ACP 15 醯基轉移酶(MAT)區塊;(c)8個醯基載體蛋白質(ACP)區 塊;以及(d) — β-酮基醯基-ACP還原酶(KR)區塊。
Th. 23Β OrfA之第一區塊為KS區塊,於此亦稱之為Th· 23B OrfA-KS,包含於核苷酸序列SEQ ID NO : 38之約位置 1至約位置1500,於此以SEQ ID NO : 40代表。含有Th· 23B 20 KS區塊之胺基酸序列為SEQ ID NO: 39之一區域,橫越SEQ IDNO : 39之約位置1至約位置500,於此以SEQ Π) NO : 41 代表。SEQ ID NO : 39之此區域與FabB(p-酮基醯基-ACP 合成酶),橫越SEQ ID NO : 39之約位置1至約位置450(亦可 為SEQ ID NO : 41之約位置1至約位置450),呈Pfam匹配。 71 200813222 值得注意的是邊Th. 23B OrfA-KS區塊含有一活性位置模 體:DXAC*(*醢基結合位置C207)。同時,在Th. 23B KS區 域末端之一特徵模體,GFGG,出現於SEQ ID NO : 39之 位置453-456(亦出現於SEQ ID NO : 41之位置453-456)。 5 Th. 23B OrfA之第二區塊為MAT區塊,於此亦稱之為
Th. 23B OrfA-MAT,包含於核苷酸序列SEQ ID NO : 38之 約位置1503至約位置3000,於此以SEQ ID NO : 42代表。 含有Th. 23B MAT區塊之胺基酸序列為SEQ ID NO : 39之一 區域,橫越SEQ ID NO : 39之約位置501至約位置1000,於 10 此以SEQ ID NO : 43代表。SEQ ID NO : 39之此區域與 FabD(丙二醯基-CoA ·· ACP醯基轉移酶),橫越SEQ ID NO : 39之約位置580至約位置900(亦可為SEQ ID NO : 43 之約位置80至約位置400),呈Pfam匹配。值得注意的是該 Th. 23B OrfA-MAT區塊含有一活性位置模體:GHS*XG(* 15 醯基結合位置S697),以SEQ ID NO : 39之位置695-699表 示0
Th. 23B OrfA之區塊3-10為8個重複之ACP區塊,於此 亦稱之為Th. 23B OrfA-ACP(該序列中之第一區塊為OrfA -ACPI、第二區塊為OrfA -ACP2、第三區塊為OrfA -ACP3 20 等)。第一 Th. 23B ACP區塊,Th. 23B OrfA-ACPl,係位於 SEQ ID NO: 38(OrfA)之位置約3205至約3555之核苷酸序列 内,於此以SEQ ID NO : 44代表。含有第一Th. 23B ACP區 塊之胺基酸序列為SEQ ID NO : 39之一區域,橫跨SEQ ID NO : 39之位置約1069至約位置1185,於此以SEQ ID NO : 72 200813222 45表示。
Th· 23B 〇rfA之8個ACP區塊皆互相鄰近,且可以磷酸 泛醯巯基結合位置模體,LGXDS*(以SEQ ID NO : 46代表) 位置之存在辨識出,其中該S*為磷酸泛醯巯基聯結位置。 5該8個3*位置之胺基酸位置,參照SEQ ID NO : 39,分別為 1128(ACP1)、1244(ACP2)、1360(ACP3)、1476(ACP4)、 1592(ACP5)、1708(ACP6)、1824(ACP7)與 1940(ACP8)。 所有8個Th. 23B ACP區塊之核苷酸與胺基酸序列皆為高度 保守,因此,每一區塊之序列並非由個別序列辨識子 10 (identifier)代表。然而,基於此述之資訊,熟習此技術領域 者可立即決定SEQ ID NO : 38與SEQ ID NO : 39中含有其 他8個ACP區塊任一個之序列。 所有8個ACP共同橫越SEQ ID NO : 38約位置3205至 約位置5994之區域,其對應於SEQ ID NO : 39之胺基酸位 15 置約1069至約1998。含有所有8個區塊之完整ACP區域之 核苷酸序列於此係以SEQ ID NO : 47代表。SEQ ID NO : 47 係編碼一胺基酸序列,於此以SEQ ID NO: 48代表。SEQ ID NO : 48包括各ACP區塊間之聯結片段。8個區塊間之重複 間隔約為SEQ ID NO : 48之每116個核苦酸,且每一區塊可 20 視為由約活性位置模體中心之116個胺基酸組成(如上所 述)。
Th· 23B OrfA最後一個區塊為KR區塊,於此亦稱之為 Th. 23B OrfA-KR,其包含於核苷酸序列橫越SEQ ID NO : 38之約位置6001至約位置8433,於此以SEQ ID NO : 49代 73 200813222 表。含有Th· 23B KR區塊之胺基酸序列為SEq ID NO : 39 之一區域,橫越SEQ ID NO : 39約位置2001至約位置 2811,於此係以SEQ ID NO : 50代表。SEQ ID NO : 39之此 區域與FabG(p-酮基醯基-ACP還原酶),橫越SEQ ID NO : 5 39 之位置2300至約2550(SEQ ID NO : 5之位置300-550), 具有Pfam匹配。 破囊壺菌(thraustochytrium). 23B關放間讀框架(open reading frame)B(OrfB) ·
Th. 23B OrfB之完整核苷酸序列於此係描述為SEQ 10 ID NO : 51,其為一5805個核苷酸之序列(不包括終止密碼 子),其編碼1935個胺基酸序列,於此為SEQ ID NO : 52。 SEQ ID NO : 51 編碼下列 Th· 23B OrfB 區塊:(a) — β_酮基 醯基-ACP合成酶(KS)區塊;(b)—鏈長度因子(CLF)區塊;(c) 一醯基轉移酶(AT)區塊;以及(d)—烯酯-ACP還原酶(ER)區 15 塊。
Th· 23B OrfB之第一區塊為KS區塊,於此亦稱之為Th. 23B Orffi-KS,包含於核苷酸序列SEQ ID NO : 51(Th. 23B OrfB)之約位置1至約位置1500,於此以SEQ ID NO : 53代 表。含有Th. 23B KS區塊之胺基酸序列為SEQ ID NO : 52 20 之一區域,橫越SEQ ID NO : 52之約位置1至約位置500, 於此以SEQ ID NO : 54代表。SEQ ID NO : 52之此區域與 FabB(P-酮基醯基-ACP合成酶),橫越約位置1至約450(SEQ ID NO : 54之位置1-450),具有Pfam匹配。值得注意的是該 Th. 23B Orffi-KS區塊含有一活性位置模體:DXAC*,其中 74 200813222 C*為醯基結合位置,且C*為於SEQ ID NO :52之位置201, 以SEQ ID NO : 39之位置695-699表示。同時,在KS區域 末端之一特徵模體,GFGG,出現於SEQ ID NO : 52之位 置434-437。 5 Th· 23B CMB之第二區塊為CLF區塊,於此亦稱之為Th. 23B OrfB-CLF,包含於核苷酸序列SEQ ID NO : 51之約位 置1501(Orffl)至約位置3000,於此以SEQIDNO:55代表。 含有CLF區塊之胺基酸序列為SEQ ID NO : 52之一區域,橫 越SEQIDNO : 52之約位置501至約位置1000,於此以SEQ 10 ID NO : 56代表。SEQ ID NO : 52之此區域與FabB(p-酮基 醯基-ACP合成酶),橫越位置550至約位置910(SEQ ID NO : 56之約位置50至約位置410),呈Pfam匹配。雖然CLF 與KS蛋白質具有相似性,但其缺乏活性位置半胱胺酸至 KS蛋白質聯結之醯基上。 15 Th· 23B OifA之第三區塊為AT區塊,於此亦稱之為Th. 23B OrfB-AT,包含於核苷酸序列SEQ ID NO : 51(Th. 23B Orffi)之約位置3001至約位置4500,於此以SEQ ID NO : 58 代表。含有Th· 23B AT區塊之胺基酸序列為SEQ ID NO ·· 52 之一區域,橫越SEQ ID NO : 52之約位置1001至約位置 20 1500,於此以SEQ ID NO ·· 58代表。SEQ ID NO ·· 52之此區 域與FabD(丙二醯基-CoA : ACP醯基轉移酶),橫越約位 置1100至約位置1375(亦可為SEQ ID NO : 58之約位置 100-375),呈Pfam匹配。雖然PUFA合成酶之此AT區塊與 MAT蛋白質具相似性,但其缺乏MAT之延伸模體(關鍵精胺 75 200813222 酸與麩胺酸殘基),且其被認為涉及丙二醯基-CoA之轉移。 醯基轉移酶之GXS*XG模體係存在,其中S*為醯基連結 位置,且位於SEQ ID NO : 52之位置1123。
Th. 23B OrfA之第四區塊為ER區塊,於此亦稱之為Th. 5 23B 〇rfB-ER,包含於核苷酸序列SEQ ID NO : 51(〇rfB)之 約位置4501至約位置5805,於此以SEQ ID NO : 59代表。 含有Th. 23B ER區塊之胺基酸序列為SEQ ID NO: 52之一區 域,橫越SEQ ID NO : 52之約位置1501至約位置1935,於 此以SEQ ID NO : 60代表。SEQ ID NO : 52之此區域與2-10硝基丙院二氧化酶相關之二氧化酶家族,橫越約位置1501 至約位置1810(SEQIDNO: 60之位置1-310),呈pfam匹配。 此作為ER之區塊可進一步預測,由於其與新發現之肺炎雙 球菌(Streptococcus pneumoniae)ER 酵素具有相似性。 破囊壺菌(thraustochvtrium)23B開放間讀框架(open reading frame)CiOrfC):
Th· 23B OrfC之完整核苷酸序列於此係描述為SEQ ID NO : 61,其具有4410個核苷酸序列(不包括終止密碼 子),其編碼1470個胺基酸序列,於此係以SEQ ID NO : 62 代表。SEQ ID NO : 61係編碼下列Th· 23B OrfC區塊:(a) 20 二FabA-類似β·羥基醯基-ACP脫水酶(DH)區塊,二者皆與 FabA蛋白質(為一酵素,其會催化反式-2-十烯酯-ACP之合 成,與此產物可逆異構化為順式-3-十烯酯-ACP)具有相似 性;以及⑻一烯酯-ACP還原酶(ER)區塊,與裂殖壺菌 (Schizochytrium)OrfB之ER區塊具高度相似性。 76 200813222
Th· 23B OrfC之第一區塊為DH區塊,於此亦稱之為Th. 23B OrfC-Dm,包含於核苷酸序列 SEQ ID NO : 61(0rfC) 之約位置1至約位置1500,於此以SEQ ID NO : 63代表。含 有Th· 23B DH1區塊之胺基酸序列為SEQ ID NO : 62之一 5 區域,橫越SEQ ID NO : 62之約位置1至約位置500,於此 以SEQ ID NO : 64代表。SEQ ID NO : 62之此區域與 FabA, 如上所述,橫越約位置275至約位置400(SEQ ID NO : 64之 約位置275-400),呈Pfam匹配。
Th· 23B OrfC之第二區塊亦為一DH區塊,於此亦稱之 10 為Th· 23B OrfC-DH2,包含於核苷酸序列SEQ ID NO : 61(OrfC)之約位置1501至約位置3000,於此以SEQ ID NO : 65代表。含有Th· 23B DH2區塊之胺基酸序列為SEQ ID NO : 62之一區域,橫越SEQ ID NO : 62之約位置501至約 位置 1000,於此以SEQ ID NO : 66代表。SEQ ID NO : 62 15 之此區域與FabA,如上所述,橫越約位置800至約位置 925(SEQ ID NO : 66之約位置300_425),呈Pfam匹配。
Th· 23B OrfC之第三區塊為ER區塊,於此亦稱之為Th. 23BOrfC-ER,包含於核苷酸序列SEQIDNO··61(OrfC)之 約位置3001至約位置4410,於此以SEQ ID NO : 67代表。 20 含有Th_ 23B ER區塊之胺基酸序列為SEQ ID NO : 62之一 區域,橫越SEQ ID NO : 62之約位置looi至約位置1470, 於此以SEQ ID NO : 68代表。SEQ ID NO : 62之此區域與2· 硝基丙烷二氧化酶相關之二氧化酶家族,如上所述,橫越 約位置1025至約位置1320(SEQ ID NO : 68之約位置 77 200813222 25-320),呈Pfam匹配。此作為ER之區塊可預測,由於其與 新發現之肺炎雙球菌(Streptococcus pneumoniae)ER酵素 具有相似性。 沙雷菌(Shewanella iap〇nica)PUFA PKS 5 有5個開放閱讀框架形成沙雷菌(Shewanella japonica) 核心PUFAPKS系統與其PPTase,如先前所述。每一開放閱 讀框架之區塊架構如下。 SEQ ID NO : 69為沙雷菌(Shewanella japonica)黏粒 (cosmid)3F3之核苷酸序列,並發現含有15個ORF。在此微 10 生物體中與PUFAPKS系統相關之ORF特徵如下。 pfaA(SEQ ID NO : 69之核苷酸 10491-18854)係編碼 PFASA(SEQIDNO: 70),一種PUFAPKS 蛋白質,具有下 列區塊:β-酮基醯基·合成酶(KS)(SEQ ID NO : 69核苷酸 10575-12029、SEQ ID NO: 70 胺基酸 29-513);丙二醯基 15 -CoA : ACP醯基轉移酶(MAT)(SEQ ID NO : 69之核苷酸 12366-13319、SEQ ID NO : 70之胺基酸 625-943) ; 6個重 複醯基-載體蛋白質(ACP)區塊(SEQ ID NO : 69之核苷酸 14280-16157、SEQ ID NO : 70之胺基酸 1364-1889) ; β_酮基 醯基-ACP還原酶(KR)(SEQ ID NO : 69之核苷酸 20 17280-17684,SEQ ID NO : 70之胺基酸 2264-2398);以及 一PFAS A蛋白質區域,介於SEQ ID NO : 70胺基酸2399 與2787間,含有一脫水酶(DH)保守活性位置模體 LxxHxxxGxxxxP(SEQ ID NO : 70之胺基酸 2504-2516),於 此稱之為DH-模體區域。 78 200813222 在PFAS A中,KS活性位置DXAC*係位於SEQ ID NO : 70之胺基酸226-229,其中C*為醯基連結位置。MAT 活性位置,GHS*XG,係位於SEQ ID NO : 70胺基酸 721-725,其中S*為醯基結合位置。ACP活性位置LGXDS* 5 係位於下列位置:SEQ ID NO ·· 70之胺基酸1296-1300、胺 基酸 1402-1406、胺基酸 1513-1517、胺基酸 1614-1618、胺 基酸1728-1732與胺基酸1843-1847,其中S*為磷泛醯酼基 連結位置。介於SEQ ID NO : 70胺基酸2399與2787之間, PFAS A亦包含脫水酶(DH)保守活性位置模體 10 LxxHxxxGxxxxP(SEQ ID NO : 70之胺基酸 2504-2516),請 參照上述。 pfaB(SEQ ID NO ·· 69之核苷酸 18851-21130)係編碼 PFASB(SEQIDNO: 71),一種PUFAPKS 蛋白質,包含下 列區塊:醯基轉移酶(AT)(SEQ ID NO : 69之核苷酸 15 19982-20902、SEQ ID NO : 71 之胺基酸 378-684)。 在PFAS B中,活性位置GXS*XG模體係位於SEQ ID NO : 71之胺基酸463-467,其中S*為醯基連結位置。 pfaC(SEQ ID NO : 69之核苷酸21127-27186)係編碼 PFAS C(SEQ ID NO: 72),一種PUFAPKS 蛋白質,包含下 20 列區塊:KS(SEQ ID NO: 69之核苷酸21139-22575、SEQ ID NO : 72之胺基酸5-483)、鏈長度因子(CLF)(SEQ ID NO : 69之核苷酸22591-23439、SEQ ID NO : 72之胺基酸 489-771);以及二FabA 3-羥基醯基-ACP脫水酶,稱之為 DH1(SEQ ID NO : 69之核苷酸 25408-25836、SEQ ID NO : 79 200813222 72之胺基酸1428-1570)與DH2(SEQ ID NO : 69之核苷酸 26767-27183、SEQ ID NO : 72之胺基酸 1881-2019)。 在PFAS C中,KS活性位置DXAC*係位於SEQ ID NO : 72之胺基酸211-214,其中C*為醯基結合位置。 5 pfaD(SEQ ID NO : 69之核苷酸27197-28825)係編碼 PFAS D(SEQ ID NO : 73),PUFA PKS 蛋白質包含下列區 塊:一烯酯還原酶(ER)(SEQ ID NO : 69之核苷酸 27446-28687、SEQ ID NO : 73之胺基酸 84-497)。 pfaE(SEQ ID NO : 69之核苷酸 6150-7061 反義股)係 10 編碼PFAS E(SEQ ID NO : 74),一4’-磷酸泛醯酼基轉移 酶(PPTase),具有已辨識之區塊(SEQ ID NO : 69之核苷酸 6504-6944、SEQ ID NO : 74之胺基酸 40-186)。 沙雷菌(Shewanella ollevana)PUFA PKS 有5個開放閱讀框架形成沙雷菌(Shewanella olleyana) 15 核心PUFAPKS系統與其PPTase,如先前所述。每一開放閱 讀框架之區塊架構如下。 SEQ ID NO : 75為沙雷菌(Shewanella olleyana)黏粒 (cosmid)9A10之核苷酸序列,並發現含有17個ORF。在此微 生物體中與PUFAPKS系統相關之ORF特徵如下。 20 pfaA(SEQ ID NO : 75之核苷酸 17437-25743)係編碼 PFAS A(SEQ ID NO : 76),一種PUFA PKS 蛋白質,具有下 列區塊:β-酮基醯基-合成酶(KS)(SEQIDNO : 75之核苷酸 17521-18975、SEQ ID NO : 76之胺基酸29-513);丙二醯基 -CoA : ACP醯基轉移酶(MAT)(SEQ ID NO : 75之核苷酸 80 200813222 19309-20265、SEQ ID NO : 76之胺基酸 625-943) ; 6個重 複醯基-載體蛋白質(ACP)區塊(SEQ ID NO : 75之核苷酸 21259-23052、SEQ ID NO : 76之胺基酸 1275-1872) ; β-酮基 醯基-ACP還原酶(KR)(SEQ ID NO : 75之核苷酸 5 24154-24558、SEQ ID NO : 76之胺基酸 2240-2374);以 及PFAS A蛋白質之一區域,介於SEQ ID NO: 76之胺基酸 2241與2768之間,含有一脫水酶(DH)保守活性位置模體 LxxHxxxGxxxxP(SEQ ID NO : 76之胺基酸 2480-2492),於 此稱之為DH-模體區域。
10 在PFAS A中,KS活性位置DXAC*係位於SEQ ID NO : 76之AA 226-229,其中C*為醯基連結位置。MAT活 性位置,GHS*XG,係位於SEQIDNO: 76胺基酸721-725, 其中S*為醯基結合位置。ACP活性位置LGXDS*係位於下 列位置:SEQ ID NO : 76之胺基酸1307-1311、胺基酸 15 1408-1412、胺基酸 1509-1513、胺基酸 1617-1621、胺基酸 1721-1725,以及胺基酸1826-1830,其中S*為磷酸泛醯巯 基連結位置。介於SEQ ID NO: 76之胺基酸2241與2768間, PFAS A亦包含脫水酶(DH)保守活性位置模體 LxxHxxxGxxxxP(SEQ ID NO : 76之胺基酸2480-2492),請 20 參照上述。 pfaB(SEQ ID NO : 75之核苷酸25740-27971)係編碼 PFAS B(SEQ ID NO : 77),一種 PUFAPKS 蛋白質,包含 下列區塊:醯基轉移酶(AT)(SEQ ID NO : 75之核苷酸 26837-27848、SEQ ID NO : 77之胺基酸 366-703)。 81 200813222 在PFAS B中,活性位置GXS*XG模體係位於SEQ ID NO : 77之胺基酸451-455,其中S*為醯基連結位置。 pfaC(SEQ ID NO : 75之核苷酸27968-34030)係編碼 PFASC(SEQIDNO: 78),一種PUFAPKS 蛋白質,包含下 5 列區塊:KS(SEQ ID NO: 75之核苷酸 27995-29431、SEQ ID NO : 78之胺基酸10-488);鏈長度因子(CLF)(SEQIDNO : 75之核苷酸29471-30217、SEQ ID NO : 78之胺基酸 502-750);以及二FabA 3-羥基醯基-ACP脫水酶,稱之為 DH1(SEQ ID NO : 75之核苷酸32258-32686、SEQ ID NO : 10 78之胺基酸143M573),以及DH2(SEQ ID NO : 75之核苷 酸 33611-34027、SEQ ID NO : 78之胺基酸 1882-2020)。 在PFAS C中,KS活性位置DXAC*係位於SEQ ID NO : 78之胺基酸216_219,其中C*為醯基連結位置。 pfaD(核苷酸 34041-35669 of SEQ ID NO : 75)係編碼 15 PFAS D(SEQ ID NO : 79),一種PUFA PKS 蛋白質,包含 下列區塊:一烯酯還原酶(ER)(SEQ ID NO : 75之核苷酸 34290-35531、SEQ ID NO : 79之胺基酸84-497)。 pfaE(SEQ ID NO : 75之核苷酸 13027-13899,反義股) 係編碼PFAS E(SEQ ID NO : 80),一種4’-磷酸泛醯巯基 20 轉移酶(PPTase),具有已辨識之區塊(SEQ ID NO : 75之核 苷酸 13369-13815、SEQ ID NO: 80 之胺基酸 29-177)。 其他PUFAPKS序列,包括最佳化之PUFAPKS戽! 本發明包括各種最佳化序列,用以於異源性宿主中表 現PUFAPKS系統,如下提供之範例。熟習此技術領域者可 82 200813222 製造最佳化之序列,尤其是,使用異源性宿主較喜歡之密 碼子或較佳之表現或功能。
sOrfA SEQ ID NO : 35,稱之為sOrfA,代表編碼裂殖壺菌 5 (Schizochytrium)OrfA之核酸序列(SEQ ID NO : 1),其經再 合成,以使酵母菌中密碼子之使用最佳化。SEQ ID NO : 1 與SEQ ID NO : 35每一者皆編碼SEQ ID NO : 2。
sOrfB SEQ ID NO : 36,稱之為sOrffi,代表編碼裂殖壺菌 10 (Schizochytrium)OrfB之核酸序列(SEQ ID NO : 3),其經再 合成,以使酵母菌中密碼子之使用最佳化。SEQ ID NO : 3 與SEQ ID NO : 36每一者皆編碼 SEQ ID NO : 4。
OrfB*pJK78Q SEQ ID NO : 37,稱之為Orffi*,代表編碼裂殖壺菌 15 (Schizochytrium)OrfB之核酸序列(SEQ ID NO : 3),其經再 合成SEQ ID NO : 3之一部分,用於植物細胞中,且其係衍 生自非常類似於初始發展時大腸桿菌中密碼子最佳化使用 之序列。Orffi*與SEQ ID NO : 3相同,不同之處在於再 合成BspHI(SEQIDNO: 3之核苷酸4415)至 SacII片段(SEQ 20 ID NO : 3之獨特位置)上,且該SEQ ID NO : 37與SEQ ID NO : 3二者皆編碼SEQ ID NO : 4。 用於增進PUFA之產生與堆積之附屬蛋白奧額外夕摁 的與策略
依據本發明,用以於異源性宿主中製造及/或堆積PUFA 83 200813222 之PUFA PKS系統,或是於内生性宿主中增進PUFA之製造 及/或堆積之PUFAPKS系統,該PUFAPKS系統較佳使用一 或多種各式標的或策略,如同前述有關PUFA之製造(請見 上述之6項準則與策略)。這些策略包括,在其他策略中, 5 使用各種附屬蛋白,其於此係定義為一種蛋白質,其不被 視為上述核心PUFAPKS系統之一部分(即,非PUFA合成酶 酵素複合體本身之一部分),但其可為,或為使用本發明核 心PUFA合成酶酵素複合體製造PUFA,或至少有效製造 PUFA所必須。這些策略亦包括各種基因修飾,以增進受 10 質,丙二醯CoA,通過PUFA合成酶路徑之流通量,藉由增 強其與丙二醯基-CoA匯集物競爭之能力。本發明這些實施 例之變化係如下所述。 碟酸泛酶締某轉移酶(PPTase) 如上所述,在異源性宿主中製造PUFA之一般性準則與 15 策略下,為了製造PUFA,PUFAPKS系統,必須以會自CoA 轉移4’-磷酸泛醯酼基片段至醯基載體蛋白質(ACP)區塊之 附屬蛋白工作。因此,PUFAPKS系統被視為包括至少一4,-磷酸泛醯Μ基轉移酶(PPTase)區塊,或此區塊被視為一 PUFA PKS系統之附屬區塊或蛋白質。PPTases之結構與功 20 能特徵已經詳細描述,例如,於美國專利申請案公開號 20020194641 ;美國專利申請案公開號20040235127;以及 美國專利申請案公開號20050100995。 依據本發明’具有4、碟酸泛酿疏基轉移酶(ppTase)生 物活性(功能)之區塊或蛋白質之特徵為,該酵素會自C〇A轉 84 200813222 移4’·磷酸泛醯酼基片段至醯基載體蛋白質(ACP)上。此轉 移至ACP無變化之絲胺酸殘基上之動作,會活化不完全_形 式為完全形式。在聚酮與脂肪酸合成中,磷酸泛醯髄基會 與成長中之醯基鏈形成硫醋。PPTases為一酵素家族,其 5 已於脂肪酸合成、聚酮合成,以及非核醣體胜肽合成步驟 中鑑定出。許多PPTases序列為已知,並已決定其結晶結構 (如 Reuter K,Mofid MR,Marahiel MA,Ficner R. “Crystal structure of the surfactin synthetase - activating enzyme sfp ^ a prototype of the 4f- phosphopantetheinyl transferase 10 superfamily” EMBO J. 1999 Dec 1 ; 18(23) : 6823-31),以及 對於活性相當重要之胺基酸殘基突變分析(Mofid MR, Finking R,Essen LO,Marahiel MA. “Structure-based mutational analysis of the 4f-phosphopantetheinyl transferases Sfp from Bacillus subtilis · carrier protein 15 recognition and reaction mechanism” Biochemistry. 2004 Apr 13 ; 43(14) : 4128-36)。這些PPTases中高度保守之胺基酸係 包含於來自上述沙雷菌(Shewanella)株之pfaE ORF中。 一作為受質之異源性PPTase,其先前已知可辨識出此 述之OrfA ACP區塊,為Nostoc sp. PCC 7120(先前稱之為 20 Anabaenasp·PCC7120)之HetI蛋白質。HetI係存在於 Nostoc基因組中,可合成長鏈經基-脂肪酸,其為該生物體 異形細胞存在之·脂層成*i — (BlackandWolk,1994,J. Bacteriol. 176, 2282-2292 ; Campbell et al.? 1997? Arch. Microbiol. 167, 251-258)。Het I似乎可活化該基因組中存在 85 200813222 之一蛋白質,Hgl E之ACP區塊。該二Hgl E之ACP區塊與 裂殖壺菌(Schizochytrium)Orf A中發現之ACP區塊具有高 度序列相似性。SEQ ID NO : 34代表Nostoc Het I蛋白質 之胺基酸序列,為功能性PPTase,其可使用此述之pUFA 5 PKS糸統’包括來自裂殖壺(Schizochytfium)與破囊壺菌 (thraustochytrium)之PUFA PKS 系統。SEQ ID NO : 34 係由 SEQ ID NO : 33所編碼。Het I之内生性起始密碼子尚未經 確認(並無甲硫胺酸存在於假定之蛋白質上)。有數種可能之 替代起始密碼子(如TTG與ATT)靠近開放閱讀框架之5’ 10 端。無甲硫胺酸密碼子(ATG)出現於該序列中。然而,Het I 表現建構物之建構係使用PCR完成,係使用甲硫胺酸密碼 子(ATG,作為Ndel限制酶辨識位置之一部分)取代最遠5’端 可能之替代起使密碼子(TTG),並於編碼序列3,端引入一 Xhol位置,且該編碼之PPTase(SEQ ID NO : 34)已知具有 15 功能性。 另一作為受質之異源性PPTase,其先前已知可辨識此 述之OrfA ACP區塊’為sfp ’竹生自枯草桿菌(Bacillus subtilis)°Sfp已經鑑定並廣泛使用,由於其可辨識廣範圍受 質之能力。基於已公開之序列資訊(Nakana,et al.,1992, 20 Molecular and General Genetics 232 : 313-321),用於sfp表 現之載體’已藉由複製該編碼區域,與經定義之上游-與下 游側接DNA序列,至PACYC-184複製載體上而製備。此建 構物係編碼一功能性PPTase,其能力為可與裂殖壺菌 (Schizochytriiim)Orfs A、B*與C,於大腸桿菌中共同表現, 86 200813222 在適當條件下,產生DHA堆積於這些細胞中(請見美國專利 申請案公開號20040235127)。 當使用基因修飾生物體(如微生物體或植物)表現本發 明PUFAPKS系統時,某些宿主生物體可内生性製造附屬蛋 5白,該蛋白為PUFA PKS製造PUFA所必須(如PPTases)。然 而,某些生物體可經核酸轉型,該核酸係編碼一或多個此 述之附屬蛋白,可允許及/或增強該生物體製造pUFA,即使 β亥生物體會内生性製造一同源性附屬蛋白(即,某些異源性 附屬蛋白可更有效地或更有效率地協同轉型之PUfa合成 10酶蛋白質操作,與宿主細胞之内生性附屬蛋白相較)。本發 明係提供一細菌、酵母菌與植物範例,其經本發明puFA pks系統基因性修飾,並包含一附屬PPTase。 因此,本發明之一實施例係相關於一種經基因修飾之 宿主細胞或生物體(如微生物體或植物或其細胞),其中該宿 15 主細胞或生物體已經基因修飾,以表現此述之核心PUFA PKS系統,以及ppTaSe。適當之ppTases^、如上戶斤述,亦為 技術上已知。該PPTase可表現於同一或不同之建構物上, 為一或多個核酸分子編碼之核心PUFA PKS蛋白質或蛋白 質。該二實施例皆如範例中所述(請見範例12與13)。在一觀 20 點中,該PPTase為Nostoc Hetl(於此以 SEQ ID NOs : 33與34 代表;)。 在本發明之一實施例中,PUFA之製造與堆積係藉由降 低(抑制、降低調節、減少)宿主細胞或宿主生物體所表現之 内生性PPTase之表現量或活性而達成(如防止與本實施例 87 200813222 PUFAPKS酵素引入之ppTase競爭)。内生性ppTase活性之 抑制可藉由任何適當之基因剔除或失活而達成,包括,但 不侷限於,使用反義股RNA、RNAi、共抑制或引入突變)。 本發明包括外生性PPTases之表現(單獨或與内生性 5 PPTases之抑制結合),以及表現此述之PUFA合成酶,其可 單獨使用,或與此述任一或多種策略結合(如以下之任一、 二、三、四或五種:密碼子最佳化、胞器·標的 '強化puFA 合成酶與丙二醯CoA之競爭(如藉由抑制FAS) '醯基c〇a合 成酶之表現,及/或一或多種醯基轉移酶或相關酵素之表 H)現),以增加PUFA於異源性宿主中之製造及/或堆積、。 1 二醯CoA流诵修飭/FAS:^抑制 如上所述,PUFAPKS系統(PUFA合成酶)之受f,丙二 酿基-CoA,亦被脂肪酸合成酶系統(FASs)、細胞質脂肪酸 延長反應,以及其他酵素(如查賴㈣⑶㈣合成酶)使 15用。因此·Α合成酶會與丙二酿基-C〇A其他酵素系統競 等。因此,本發明之一實施例係相關於一種方法與基因修 飾、曰力丙一醯CoA於pUFA合成酶路徑之流通量,藉 由增強PUFA合成酶酵素與丙二醯基七
此假設之方法包括,但不揭限於,υ抑制競爭路^包I 2〇抑制FAS路k上之任—成分,如藉由降低涉及這些路徑之酵 素或次單凡之表現量(如藉由使用反義股RNA、RNAi、丘抑 制或突變),2)於異源性宿主中表現puFA合成酶,其中競爭 路徑經降低或轉(如於油菜(CanGla)中,其中在細胞質中 延長脂肪酸之能力已被阻斷),及域3)藉由增加丙二酿基 200813222 -CoA匯集物(如藉由表現乙醯基_c〇A羧酸酶)。 更特別的是,在一觀點中,本發明亦包括宿主生物體 之基因修飾,其可製造PUFA,尤其是表現異源性puFA PKS系統之宿主生物體,以剔除或失活該基因,或降低由 5 11些基因編碼之酵素之活性,其可競爭或干擾PUFAPKS系 統製造及/或堆積PUFA。例如,本發明人發現,藉由降低!^ 於宿主生物體中之活性,該宿主已經puFApKS系統轉型, 會增進PUFA之製造與堆積,與維持正常FAS活性之宿主生 物體相較(响見如裂殖壺菌(Schizochytrium)之範例實驗,以 10及範例中描述酵母菌與植物實驗之詳細描述)。 在一實施例中,係顯示各種可抑制脂肪酸經FAS路徑 製造之酵素。在本發明之此實施例中,許多酵素可為適當 之標的,係示範二特別適用之標的,並詳述如下。本發明 人已展現於裂殖壺菌(Schizochytdum)中剔除FAS酵素之 15能力(請見範例),且此策略可應用於異源性宿主中。在另一 實施例中,本發明人展示可藉由生化方法,於酵母菌中抑 制FAS系統之能力,導致PUFA製造之增進,於表現有ρυρΑ 合成酶與PPTase之酵母菌中,與缺乏FAS系統生化標的相 較。某些其他宿主亦可使用類似策略。 20 最後,在植物中,本發明人進行對於FAS路徑之抑制, 藉由抑制KasII或KasIIl,使用反義股或尺^仏丨技術,增進 PUFA之製造,於表現有PUFA合成酶與冲丁^代之異源性宿 主中。而本發明並不侷限於這些標的,本發明之一觀點為 以這些酵素之一或二者為抑制標的,並與此述之pUFA合成 200813222 酶與PPTase結合,單獨或與此述之其他策略結合(如密碼子 最佳化、胞器-標的、醢基CoA合成酶之表現,及/或一或多 種醯基轉移酶或相關酵素之表現),以增加PUFA於異源性 宿主中之製造及/或堆積。 5 在脂肪類種子中,主要為三醯基甘油(TAGs)形式,係 衍生自複雜酵素路徑之同化物中。一般而言,還原礙係經 由韌皮部,自植物之其他部分傳送至種子。在植物種子中, TAG之生合成係於細胞内進行,於不同胞器内(〇hrolgge and Browse,1995, Plant Cell 7 : 957_970)。在色素體中,短 10 鏈碳前驅物係轉換為長鏈脂肪酸,藉由第II型可溶性脂肪酸 合成酶(FAS)複合體(Slabas and Fawcett,1992,Plant Molecular Biology 19 : 169-191),其重複地加入C2-單元至 脂肪基醯基鏈上,並準備下一延長循環之碳鏈。8或9個循 環之C2-單元縮合反應,會產生C16與C18脂肪酸,其特徵 15 為膜脂質。初始之FAS活性係以細胞核編碼、色素體標的之 酵素丙二醯基-CoA : ACP醯基轉移酶(MCAT)進行,其會自 丙二醯基_CoA上轉移丙二醯基至醯基載體蛋白質上 (ACP)(Yasuno et al.9 2004, Journal of Biological Chemistry 292: 8242-8251)。此形成受質,丙二醯基-ACP,其提供C2-20 單元於後續之延長反應中。合成之下一步驟係經由細胞核 編碼、色素體標的之β-酮基醯基-醯基載體蛋白質合成酶 III(KAS III)之催化活性而完成,其中丙二醯基-CoA縮合至 提供者,丙二醯基-ACP,之反應,產生丁醯基(C4)-ACP。 ACP-活化醯基鏈之所有後續延長反應,係以細胞核編碼、 90 200813222 色素體標的之3-酮基醯基-醯基載體蛋白質合成酶I(KAS ί) ’與β-酮基醯基-醯基載體蛋白質合成酶II(KAS⑴同功酶 進行。KAS I會催化縮合反應,轉換C4_ACP為C16-ACP, 藉由使用丁醯基(C4)·至十四醯(C14)-ACP,作為受質,KAS 5 11係進行最終步驟,以產生十八醯(C18)-ACP,藉由使用十 ’、ii&(C16)_ACP(Carlsson et al·,2002,Plant Journal 29 : 761_770)。因此,藉由抑制或降低KasIII或KasII之表現,便 可達到於種子發育期間抑制脂肪酸之生合成。 在一實施例中,本發明包括將異源性宿主生物體,或 10 具有包含KasII或KasIII標的RNAi之核酸分子於宿主細胞 中之細胞轉型。在一實施例中,該宿主細胞為一植物細胞。 在一實施例中,本發明係包括將異源性宿主生物體, 或具有包含SEQ ID NO : 122之核酸序列,其為具有CHSA 内含子之KasII RNAi之核酸分子,描述於範例13,於宿主 15 細胞中之細胞轉型。在一實施例中,本發明係包括將異源 性宿主生物體,或具有包含SEQ ID NO : 124之核酸序列, 其為具有CHSA内含子之KasIII RNAi之核酸分子’描述 於範例13,於宿主細胞中之細胞轉型。在一實施例中’本 發明係包括將異源性宿主生物體’或具有包含SEQ ID 20 NO : 123之核酸序列,其為KAS II反義股核酸序列’描述 於範例13,於宿主細胞中之細胞轉型。在一實施例中,本 發明係包括將異源性宿主生物體’或具有包含SEQ ID NO : 125之核酸序列,其為具有KAS III反義股核酸序列, 描述於範例13,於宿主細胞中之細胞轉型。 91 200813222 強化PUFA合成酶能力,以與丙二醯基-CoA匯集物競爭 之其他方法包括,於異源性宿主中表現PUFA合成酶,其中 該競爭路徑已經降低或阻斷(如於油菜(Canola)中,其中在 細胞質中延長脂肪酸之能力已被阻斷)。其他適當之異源性 5 宿主可經選擇(天然產生之生物體及/或經選擇、隨機突變與 篩選,及/或定點突變),藉由技術如tilling、育種、標記辅 助篩選等,以降低或阻斷競爭路徑,如FAS路徑及類似路 徑。 其他酵素之表現,如乙醯基-CoA羧酸酶,亦可增加所 10 有酵素系統可獲得之丙二醯CoA匯集物,因而增進通過 PUFA PKS系統之流通量。 本發明包括增進PUFAPKS系統能力之實施例準則,其 表現外生性PPTases(單獨或與内生性PPTases抑制結合),以 及表現此述之PUFA合成酶,其可單獨使用,或與此述任一 15 或多種朿略結合(如以下之任一、二、三或四種:密碼子最 佳化、胞器·標的、醯基CoA合成酶之表現,及/或一或多種 醯基轉移酶或相關酵素之表現),以增加PUFA於異源性宿 主中之製造及/或堆積。 酿基-Co A合成酵 20 本發明之另一實施例係提供一種醯基-CoA合成酶 (ACoAS)蛋白質,其可催化長鏈PUFA自由脂肪酸(ffa)轉 換為醯基-CoA。 本發明人已發現PUFA PKS系統之PUFA内生性製造 者,裂殖壺菌(Schizochytrium),具有一或多種AC〇AS,其 92 200813222 可轉換PUFA PKS系統之FFA產物為醯基-CoA。此為在此生 物體中這些分液高含量PUFA堆積之證據。因此,裂殖壺菌 (Schizochytrimn),以及其他内生性包含PUFA PKS系統(如 其他破囊壺菌(thraustochytrid)s)之生物體,或其他製造 5 PUFA之真核生物(如海洋石夕藻(Thalassiosira pseudonana)或 隱甲藻(Crypthecodinium cohnii)),為良好之基因編碼酵素 來源,其可用於允許或增加異源性宿主中PUFA PKS系統表 現產物之堆積。 本發明人已於裂殖壺菌(Schizochytrium)中辨識出9個 10核酸序列,其編碼之蛋白質與已知或假設之具醯基-CoA合 成酶(ACoAS)活性之蛋白質具有相似性。本發明人認為這 些序列之一或多者,係與編碼ACoAS之基因相關,其可轉 換裂殖壺菌(Schizochytrium)PUFA合成酶FFA產物為醯基 -CoA,並展現使用數種這些序列以增加宿主生物體中PUFA 15 之製造及/或堆積之能力。因此,它們便具有絕佳之利用 性,可用以增加異源性宿主中PUFA之堆積,其中係表現該 裂殖壺菌(Schizochytrium)PUFA合成酶或另一 PUFA合成 酶。不受任合理論束缚,本發明人認為其發現之ACoAS可 用於增加表現PUFA合成酶之宿主中,PUFA之堆積,其產 2〇 物分佈類似於裂殖壺菌(Schizochytrium)中發現者,以及表 現有PUFA合成S#之宿主’其產物分佈不同於裂殖壺菌 (Schizochytrium)之PUFA合成酶。事實上,於此所示之範例 有數種來自裂殖壺菌(Schizochytrium)之ACoAS,會增加 PUFAs於酵母菌株中堆積,該酵母菌經裂殖壺菌 93 200813222 (Schizochytrium)PUFAPKS系統修飾,在植物中亦經類似之 基因修_。此外’裂殖壺菌(Schizochytrium)ACoAS預期可 有效辨識其他生物體之PUFA合成酶製造之EPA,若EPA以 FFA方式呈現。此外,本發明係揭示編碼其他生物體ac〇AS 5之基因,其已經辨識出並可用於異源性宿主生物體中表現 這些PUFA合成酶。這些ACoAS蛋白質之每一者,以及編 碼該蛋白質之核酸,以及其同源物與生物活性片段,係包 含於本發明中。這些蛋白質與核酸分子將於下面描述與範 例中詳細討論。 10 本發明之一實施例係相關於一種經經分離之之醯基 -CoA合成酶(ACoAS),其其可催化長鏈PUFA自由脂肪酸 (FFA)轉換為醢基-CoA。在本發明之觀點中,該經分離之 ACoAS係衍生自内生性表現有PuFA PKS系統(PUFA合成 酶)之生物體中。此生物體包括,但不侷限於,破囊壺菌 15 (thraustochytrid)。在一觀點中,該經分離之ac〇AS係衍生 自裂殖 3?滴(Schizochytrium)、破囊壺菌(thraustochytrimn), 或巫肯尼亞菌(Ulkenia)。在另一觀點中,該經分離之ac〇AS 係衍生自裂殖壺菌(Schizochytrium)ATCC 20888或裂殖壺 菌(Schizochytrium)sp.株N230D,其為衍生自裂殖壺菌 20 (Schizochytrium)ATCC 20888之菌株,藉由突變與筛選以增 加油類生產。在另一觀點中,任一與PUFA PKS系統結合, 以製造及/或堆積宿主細胞或生物體之PUFAi ACoAS,皆 可使用於本發明。本發明並未受到於此所述之特定範例所 限制。 94 200813222 在另一觀點中,該經分離之ACoAS係由核苷酸序列, 選自於SEQ ID NO : 82、84、86、88、90、92、94、96或 98任一者所編碼。在另一觀點中,該經分離之ac〇AS係經 由一退化演繹(degenerate)之核酸序列所編碼,該核酸序列 5 係編碼一蛋白質,其由選自於SEQ ID NOs : 82、84、86、 88、90、92、94、96或98任一核苷酸序列所編碼。在另一 觀點中’該經分離之ACoAS係包含一胺基酸序列,選自於 SEQ ID NOs : 83、85、87、89、91、93、95、97或99任一 者,或此胺基酸序列任一者之同源物(如下描述),包括此序 10 列任一生物活性片段或區塊。在一較佳實施例中,該經分 離之ACoAS係包含一胺基酸序列,於此以SEQ ID NO : 83、 85、87、89、91、93 ' 95、97或99,或此胺基酸序列之同 源物代表。在一更佳實施例中,該經分離之ACoAS係包含 一胺基酸序列,於此係以SEQ ID NO : 83、85、87、91或 15 97,或此序列之同源物代表,特佳為SEQ ID NO : 83、85 或97。任一或更多之醯基-CoA合成酶組合亦包含於本發明 中。 本發明包括一或多種醯基-CoA合成酶,如此所述與示 範,以及PUFA合成酶,如此所述與示範,以及外生性 2〇 PPTase(單獨或與内生性PPTases之抑制結合)之表現,其 可單獨使用或與任一或多種此述之策略結合(如下列任 一、二、三或四者··密碼子最佳化、胞器-標的、強化PUFA 合成酶與丙二醯C〇A之競爭(如藉由抑制FAS),及/或一或多 種醯基轉移酶或相關酵素之表現),以增加pUFA於異源性 95 200813222 宿主中之製造及/或堆積。 醯某韓移酶 相關於另一上述之於異源性宿主中增加PUFA之製造 及/或堆積之策略,本發明之另一實施例係提供一種額外之 5醯基轉移酶蛋白質’其可利用PUFA-CoA作為受質,形成pl 或TAG(如3-甘油-磷酸鹽醯基轉移酶(GPAT)、溶血磷脂酸醯 基轉移酶(LPAAT)與二醯基甘油醯基轉移酶(dagAT))或其 他醯基轉移酶,其可導致PL或TAG形式之PUFA之增加(如 磷脂質:二醯基甘油醯基轉移酶(PDAT))。本發明包括此經 10 分離之蛋白質與其同源物、編碼此蛋白質之核酸分子、表 現此蛋白質之經基因修倚生物體,以及使用此蛋白質之各 種方法,特別用以增強生物體中PUFA之製造與堆積。 此外,本發明亦揭示可利用PUFA-CoA作為受質形成 PL或TAG之酵素,因此為一額外之附屬蛋白,其用於表現 15 有PUFA合成酶之異源性宿主生物體中,以強化PUFA合成 酶製造之PUFA堆積。候選酵素包括,但不侷限於,3-甘油 -磷酸鹽醯基轉移酶(GPAT)、溶血磷脂酸醯基轉移酶(LPAAT) 與二醯基甘油醯基轉移酶(DAGAT)。這些醯基-CoA-利用蛋 白質之每一者,與編碼該蛋白質之核酸,皆包含於本發明 20 中。例如,裂殖壺菌(Schizochytrium)核酸序列已經辨識出, 並認為其編碼一具有DAGAT活性之酵素(請見如 ScDAGAT)。此夕卜,隱甲藻(Crypthecodinium cohnii)序歹ij 已 辨識出編碼具有LPAAT或DAGAT活性之酵素之序列,亦如 下所述。這些蛋白質、其具生物活性之同源物、核酸分子, 96 200813222 以及其他醯基轉移酶蛋白質,其同源物與核酸分子,皆包 含於本發明中,且特定範例將於下描述。 本發明之另一實施例係相關於一種經分離之蛋白質, 其利用PUFA-CoA作為受質,形成PL或TAG(如3-甘油-磷酸 5 鹽醯基轉移酶(GPAT)、溶血磷脂酸醯基轉移酶(LPAAT)與二 酿基甘油基轉移i#(DAGAT))。較佳之蛋白質包括酿基轉 移酶,選自於GPAT、LPAAT與DAGAT任一者。在一觀點 中’該經分離之蛋白質係衍生自一生物體,其會内生性地 表現PUFAPKS系統(PKS合成酶),或至少製造PUFA之一生 10 合成路徑。此生物體包括,但不侷限於,破囊壺菌 (thraustochytrid)或隱曱藻(Crypthecodinium cohni)。在一觀 點中,該經分離之醯基轉移酶係衍生自裂殖壺菌 (Schizochytrium)、破囊壺菌(thraustochytrium)或巫肯尼亞菌 (Ulkenia)。在另一觀點中,該經分離之醯基轉移酶係衍生 15 自裂殖壺菌(Schizochytrium)ATCC 20888或裂殖壺菌 (Schizochytrium sp·)株N230D。在另一觀點中,該醯基轉 移酶係衍生自隱甲藻(Crypthecodinium cohni)。在另一觀點 中,任一醯基轉移酶,其功能係與任一 PUFA PKS系統結 合,以增加宿主細胞或生物體中PUFA之製造及/或堆積,皆 20 可使用於本發明。本發明並非侷限於此述之特定範例。 在另一方面,經分離之醯基轉移酶係以一核苦酸序列 編碼,該序列選自於SEQ ID NOs : 100、102、103、105、 106、108、109、1U、112或 114-121之任一者。在另一觀點 中,該經分離之醯基轉移酶係經由一退化演繹(degenerate) 97 200813222 之核酸序列所編碼,該核酸序列係編碼一蛋白質,其由選 自於SEQ ID NOs ·· 100、102、103、105、106、108、109、 111、112或114-121任一核苦酸序列所編碼。在另一觀點中, 該經經分離之之醯基轉移酶包含一胺基酸序列,選自於 5 SEQ ID NOs : 1(H、104、107、110或 113任一者,或此胺基 酸序列任一者之同源物(如下描述),包括此序列任一生物活 性片段或區塊。在一較佳實施例中,該經分離之之醯基轉 移酶包含一胺基酸序列,於此以SEQ ID NO : 101、104、 107、110或113,或此胺基酸序列之同源物代表。在一較佳 10實施例中,該經分離之醯基轉移酶包含一胺基酸序列,於 此以SEQ ID NO : 101或1〇4,或此序列之同源物代表,特 佳為SEQ ID NO · 1〇1。此述醯基轉移酶之組合亦包含於本 發明之用途中。 在另一觀點中,該經分離之之醯基轉移酶係包含一胺 κ基酸序列,選自於SEQIDNOs:之任一者或此胺基酸序 列之同源物(如下描述),包括此序列之任-生物活性片段或 區塊。 20 本發明包括表現-或多種醯基_coA合成酶,如此所 述乂及PUFA合成酶,如此所述與示範,以及外生性 pp,择料與内生性ρρτ_之抑能合)之表現,其 H蜀、使用或與任一或多種此述之策略結合(如下列任 二二或四者:密碼子最佳化、胞器·標的、強化卿A H與^醯—之競爭(如藉由抑制MS),及/或酿基 纽),叫加卿續⑽性宿主中之製造 98 200813222 及/或堆積。 皰器·特異性砉規 相關於上述之另一策略,本發明之一實施例係相關於 標的PUFA合成酶酵素、ppTase及/或任一或多種附屬蛋白之 5 表現’及/或標的宿主一或多種胞器中之基因修飾。例如, 在一實施例中,PUFA合成酶系統與PPTase之表現係以植 物之色素體為標的。在另一實施例中,PUFA合成酶系統與 PPTase之表現係以細胞質為標的。另一實施例中,PUFA合 成酶系統與PPTase之表現係以植物細胞之色素體與細胞質 10 二者為標的。在這些實施例之任一者中,其他目標可導向 於色素體或細胞質。在一觀點中,醯基-CoA合成酶之表現 係以細胞質為標的,在另一實施例中,此表現係以色素體 為標的。在一實施例中,一醯基-CoA合成酶係以細胞質為 標的,而另一醯基-CoA合成酶則以色素體為標的。較佳為, 15 醯基-CoA合成酶係表現於細胞質中,以轉換dha及/或 DPA自由脂肪酸為醯基-CoA,其之後可被醯基轉移酶利 用。醯基轉移酶一般可共轉譯,標的為内質網。FAS系統之 抑制,如藉由基因修飾以抑制一或多個宿主酵素,可導入 相同胞器中,其中該PUFA合成酶係被表現。 20 一示範性色素體標的序列係衍生自甘藍型油菜 (Bmssicanapus)之醯基-ACP硫酯酶,該經編碼之標的胜肽 之胺基酸序列於此係由SEQ ID NO : 81代表。多種其他色 素體標的序列為技術上已知,且可用於實施例中,其中該 異源性宿主為植物或植物細胞,且其中標的為色素體者較 99 200813222 佳0 本發明包括使用胞器標的(如標的為色素體或植物中 之葉綠體),並表現PUFA合成酶,如此所述與示範,以及 外生性PPTase(單獨或與内生性PPTases之抑制結合)之表 5現,其可單獨使用或與任-或多種此述之策略結合(如下列 任一、一、二或四者:密碼子最佳化、強化PUFA合成酶與 丙二醯CoA之競爭(如藉由抑制FAS)、一或多種醯基_c〇a合 成酶之表現,及/或一或多種醯基轉移酶或相關酵素之表 現),以增加PUFA於異源性宿主中之製造及/或堆積。 1〇 色素體或葉綠體之基因產物標的係由訊號序列控制, 其發現於各種蛋白質之胺基端,且可在輸入時被切割,而 產生成熟蛋白質(如就葉綠體標的而言,請見如c〇maietai., J· Biol· Chem· 263 : 15104-15109(1988))。這些訊號序列可 融合至異源性基因產物上,以影響異源性產物輸入葉綠體 15 中(職 den Broecketal· Nature 313 : 358-363(1985))。編碼 適當訊號序列之DNA可分離自編碼RUBISC〇蛋白質、 CAB蛋白質、EPSP合成酶酵素、GS2蛋白質,以及許多 其他蛋白質之cDNA,其已知可定位至葉綠體。 在本發明之各實施例中,較佳係相關於本發明之蛋白 20負定位至細胞内部分,例如,至色素體或葉綠體。蛋白質 可引導至葉綠體,藉由包含一葉綠體轉移胜肽(CTp)於其胺 基端。類似地,蛋白質可引導至色素體,藉由包含一色素 體轉移胜肽或訊號胜肽於其胺基端。 天然發生之葉綠體標的蛋白質,係以較大之前驅蛋白 100 200813222 質形式合成,其含有一胺基端葉綠體標的胜肽而引導該前 驅物至葉綠體輸入機器’為技術上已知。葉綠體標的胜狀 一般係以葉綠體胞裔内之特異性内蛋白酶切割,因而自前 驅物釋放該標的之成熟’較佳具活性之酵素,至葉綠體 5 melieu。編碼該胜肽之序列,該胜肽適用於引導基因標的或 基因產物至植物細胞之葉綠體或色素體中,包括牽牛花 EPSPS CTP、阿拉伯芥(Arabidopsis)EPSPS CTP2與内含 子,以及其他技術上已知者。此標的序列係用以提供所希 望之表現蛋白質,轉移至可發揮最有效功能之細胞結構 10中,或轉移該表現之蛋白質至細胞某一區域,該處會集中 所希望之現象功能之細胞加工。特定之葉綠體標的胜肽範 例為技術上已知’包括阿拉伯芬(Arabidopsis thaliana)核綱 醣雙鱗酸鹽羧酸酶小次單元atsl A轉移胜肽、阿拉伯芥 (Arabidopsis thaliana)EPSPS 轉移胜肽,以及玉米(Zea 15 maize)核酮醣雙磷酸鹽羧酸酶小次單元轉移胜肽。 一最佳化之轉移胜肽為較佳,例如,Van den Broeck et al·所述”Targeting of a foreign protein to chloroplasts by fusion to the transit peptide from the small subunit of ribulose l,5_biphosphate carboxylase’’,Nature,313 : 20 358-363(1985)。原核與真核訊號序列係揭示於,如Michaelis et al.(1982)Ann. Rev. Microbiol. 36, 425。可使用於本發明之 額外轉移胜肽包括葉綠體轉移胜肽,如描述於Von Heijne et al.,Plant Mol. Biol. Rep. 9 : 104- 126(1991) ; Mazur et al·, Plant Physiol. 85: 1110(1987); Vorst et al.? Gene 65: 59(1988) 101 200813222 者。Chen & Jagendorf(J. Biol· Chem. 268 : 2363-2367(1993)) 已描述使用葉綠體轉移胜肽,以輸入異源性轉殖基因。此 胜肽為來自於草(Nicotiana plumbaginifolia)之rbcS基因之 轉移胜狀(Poulsen et al. Mol. Gen. Genet. 205 · 5 193-200(1986))。此述功能為定位異源性蛋白質至葉綠體中 之一CTP,係衍生自甘藍型油菜(Brassica napus)醯基-ACP 硫酯酶。
另一定位基因至葉綠體或色素體之方法包括葉綠體或 色素體轉型。重組植物可經製造,其中僅葉綠體DNA經改 10 變或加入此植物中出現之分子。作用於葉綠體之驅動子為 技術上已知(Hanley-Bowden et al·,Trends in Biochemical Sciences 12 : 67-70, 1987)。獲得含有已插入異源性DNA 之葉綠體之細胞之方法與組成物,已描述於如Daniell et al·(美國專利號5,693,507 ; 1997),及Maligaet al.(美國專利 15 號5,451,513 ; 1995)。 衆略之組合 依據本發明,於異源性宿主中製造與堆積一或多種標 的PUFA,此述增進該宿主製造及/或堆積pUFA之任一或更 多之(任一組合)策略皆可使用。事實上,該策略之各種組合 20可加成或同步,並提供增進之PUFA製造及/或堆積,與無一 或多種此策略時相較。事實上,該範例係提供多種示範性 策略包括夕種策略組合,以於宿主生物體(異源性宿主與 天然表現PUFA PKS系統之生物體二者皆可)中製造puFA。 適當用於製造本發明PUFA之經基因修飾宿主細胞或 102 200813222 生物體具有下列基本特性。該宿主細胞或生物體係表現 PUFA PKS系統,其包含此述之核心puFA pKS酵素與 PPTase,其可有效製造PUFA,當與核心puFApKS酵素一 同使用時。該PUFAPKS系統及/或PPTase可由宿主細胞或 5生物體内生性地製造,或於宿主中表現為異源性蛋白質(如 藉由重組技術)。編碼核心PUFA PKS酵素及/或ppTase之核 酸分子,可經密碼子使用最佳〖,或於宿主細胞或生物體 較佳表現。該宿主細胞或生物體可額外地經修飾,以表現 一、一、二或更多醯基_co A合成酶,包括於此所述之任一 10者或技術上已知之其他者。該宿主細胞或生物體可額外地 、、、工U飾以表現-、二、二或更多醯基轉移酶,包括於此 所述之任-者或技術上已知之其他者。該宿主細胞或生物 體可額外地經基因修飾(或經選擇或製造),以強化ρυρΑ PKS系統與受質,丙二醯CgA,競爭之能力。在—觀點中, 15此可藉由筛選生物體而達成,此特徵為天然,或一天然、 、、二4k或直接之突變,或藉由育種或其他技術而達成。在 另觀點中,此可藉由選擇性抑制與ρυρΑρκ§競爭丙二醯 CoA之路徑,如FAS系統,之—或多種酵素而達《。在任一 只也例中4PUFAPKS或附屬蛋自或修飾物之標的可為胞 20器特異性,如至植物之色素體。 某些用於與核心PUFA PKS系統與沖仏代之較佳組合 包括,但不侷限於:⑴表現一、二或更多酿基-CoA合成酶; (2)FAS抑制(如藉由抑制KASII或KASIII);⑶一、二或更 夕-基c〇a合成酶與FAS抑制(如藉由抑制kasii或 103 200813222 之結合;(4)表現一、二或更多醯基轉移酶;(5)表現一、二 或更多醯基-CoA合成酶;抑制FAS(如藉由抑制KASII或 KASIII);以及表現一、二或更多醯基轉移酶之結合。 某些植物中修飾之示範性組合(請見範例13)包括表現 5 PUFA PKS(如來自裂殖壺菌(Schizochytrium))與異源性 PPTase(如來自 Nostoc 之Hetl),以及: 表現醯基-CoA合成酶(範例為ACS-1與ACS-2); 抑制FAS(範例為抑制KASII RNAi、KAS II反義股、 KASIIIRNAi與 KASIII 反義股); 10 表現醯基-CoA合成酶與抑制FAS之結合(範例為表現 ACS-1 並抑制 FAS,使用 KASII RNAi、KAS II 反義股、 KASIII RNAi與 KASIII 反義股); 表現醯基轉移酶(範例為LPAAT-1); 表現醯基轉移酶、表現醯基-CoA合成酶,以及抑制FAS 15 之結合(範例為表現DAGAT-1與表現ACS_1,每一者皆與抑 制FAS結合,藉由KASII RNAi或KASIII反義股); 表現醯基轉移酶、表現二醯基-CoA合成酶,以及抑制 FAS之結合(範例為表現DAGAT-1,表現ACS-1,與表現 ACS-8 ’每一者皆與抑制FAS組合,藉由KASII RNAi或 20 KASIII 反義股); 表現二醯基轉移酶、表現醯基-CoA合成酶,與抑制FAS 之結合(範例為表現DAGAT-1與LPAAT-:l,與表現ACS], 每一者皆與FAS抑制結合,藉由KASII RNAi或KASIII反 義股);以及 104 200813222 表現二醯基轉移酶、二表現醯基-CoA合成酶,與抑制 F$AS之結合(範例為表現dagat_ i與LpAAT小與表現八⑶1 '、ACS 8每者皆與1^抑制結合,藉由KASII RNAi或 KASIII反義股)。 使用這些修飾組合、其他修飾,或此述修飾組合 之植物,、植物細胞,係包含於本發明中。此外,任一使用 此述任何修飾或修飾組合之宿主細胞或生物體以及衍生 自此田胞或生物體之產物,包括含有標的物PUFA之油 類’亦包含於本發明中。本發明之所有 實施例皆可用於此 述、、工基口修娜之生物體,與製造及使用此生物體之方法之 討論中。
為了製造明顯高產率之一或多種希望之多不飽和脂肪 酸或其他生物活性八 刀子,一生物體,較佳為一微生物體或 15 一植物,可經基因狄1 、s U修飾,以改變其PUFAPKS系統之活性, 、’、疋最、;產物,於該微生物體或植物中,或引入PUFA PKS系統至該微峰舲 、 生物體或楂物中。本發明係相關於一種增 進或強化此類基因修傅之方法,尤其是,相關於增進或強 化PUFAPKS系統最終產物,較佳為腳a,之製造及域堆 20 積。 因此,f 實施例係相關於一種經基因修飾之 生物體,其中該生物 王物體係表現一PUFAPKS系統,其中該生 物體已經基因修飴 、 少巾’从表現此述之一附屬蛋白,以增進 舰之製造及其他驗 PKS系統之生物活性 105 200813222 產物)於該宿主中,及/或其中該生物體已經任何方法基因修 飾,包括天然篩選與突變,以強化PUFAPKS與宿主中之 受質競爭之能力(如藉由抑制FAS路徑與此述其他競爭路 徑)。若PUFAPKS系統對於宿主而言為異源性,則該生物 5 體較佳經基因修飾,以表現PPTase為PUFA PKS附屬蛋 白’其如上所述。在一實施例中,該生物體經基因修飾, 以表現此述之ACoAS ’較佳為ACoAS,其係衍生自相同屬、 種或特定生物體,PUFA PKS系統衍生之生物體,可催化轉 換PUFA PKS系統製造之長鏈PUFA自由脂肪酸(FFA)為醯 10基-CoA。在另一實施例中,該生物體已經基因修飾,以表 現蛋白質’其可利用PUFA-CoA作為受質形成pl或TAG。 在另一實施例中,該生物體已經基因修飾,以表現上述 ACoAS與利用PUFA-CoA作為受質形成pl或TAG之蛋白 質。在一實施例中,若PUFA PKS系統對宿主而言為内生 15性,该生物體可經基因修飾以表現異源性附屬蛋白,如上 所述’其可增進或強化PUFA之製造及/或堆積(或puFA PKS 系統之另一生物活性產物)於宿主生物體中,及/或該生物體 可經基因修飾,以增加、最佳化或強化該生物體内生性製 造之此一附屬蛋白之表現及/或生物活性(如增進内生性 20 ACoAS之表現或活性,其可以内生性pUFApK^^、統操作 於宿主中)。在一實施例中,該生物體係以任何方式經基因 修飾,包括天然篩選與突變、定點突變或隨機突變與篩檢 等,以· PUFAPKS與該宿主中受質之競爭能力(藉由抑 制FAS路徑與此述其他競爭路徑)。在—實施例中,該生物 106 200813222 體中之FAS路徑係經抑制。在一實施例中,該生物體中之 KASII及/或KASIII係經抑制。本發明之這些實施例係如上 詳細描述。較佳之經基因修飾生物體包括經基因修飾微生 物體與經基因修飾之植物。 5 該生物體可内生性地表現PUFA PKS系統,雖然本發明 特別適用於強化生物體PUFA之製造及/或堆積,該生物體係 經基因修飾,以表現PUFAPKS系統(異源性宿主)。由該生 物體表現之PUFA PKS系統可包括任一 PUFA PKS系統,例 如,PUFA PKS系統,其完全衍生自一特定之生物體(如裂 10 殖壺菌(Schizochytrium)PUFA PKS系統),以及PUFA PKS系 統,其可由”混合與匹配”之核酸序列製造,該核酸係編碼 來自不同PUFA PKS糸統之蛋白質及/或區塊(如藉由混合裂 殖壺菌(Schizochytrium)PUFA PKS蛋白質及/或區塊,以及 來自如破囊壺菌(thraustochytrium)、巫肯尼亞菌(Ulkenia)、 15 沙雷菌(Shewanella)、嗜壓菌(Moritella),及/或發光菌 (Photobacterium)之PUFA PKS蛋白質及/或區塊等),及/或來 自不同之非-PUFA PKS系統(如第I型模塊式、第I型迭代 式、第II型或第III型PKS系統),其中該來自不同生物體之 蛋白質及/或區塊係結合,以形成一完全、功能性PUFAPKS 20系統。PUFA PKS系統,包括結合來自不同生物體之PUFA pks基因或蛋白質,係詳細描述於美國專利號6,140,486 ; 美國專利號 6,566,583 ; Metz et al·,Science 293 : 290-293(2001);美國專利申請案公開號20020194641 ;美國 專利申請案公開號20040235127 ;美國專利申請案公開號 107 200813222 20050100995 ;以及PCT公開號WO 2006/135866 ;如上所 述^PUFAPKS基因與蛋白質亦揭示於:PCT專利公開號 WO 05/097982 ;以及美國專利申請案公開號20050014231。 上述每一份文件,以及此述之基因與蛋白質,皆在此併入 5 本案以作為參考資料。 因此,本發明包含基因修飾該生物體之方法:藉由基 因修飾該生物體之至少一核酸序列,其編碼PUFA PKS系 統之至少一功能性區塊或蛋白質(或生物活性片段或其同 源物),包括,但不侷限於,任一PUFA PKS系統,特別是 10 於此所述者,及/或藉由表現至少一重組核酸分子,其包含 一編碼此區塊或蛋白質之核酸序列。此外,該方法包括基 因修飾該生物體,藉由基因修飾至少一核酸序列於該生物 體中,其編碼一 ACoAS及/或一利用puFA-CoA作為受質形 成PL或TAG之蛋白質,及/或藉由表現至少一重組核酸分 15子,其包含編碼此蛋白質之核酸序列。該方法可更包括基 因修飾該生物體,以抑制與PUFA PKS作為受質競爭之路 徑,如FAS系統,包括,但不侷限於,抑制生物體中之KASn 或KASIII。在一實施例中,任一外生性引入之核酸序列可 經密碼子使用最佳化,或增進於宿主中之表現在一實施例 中任引入之核酸序列可標的生物體中一或多種胞器。 此序列、基因修飾-生物體之方法、特定修飾與其組合之 各種只施例,已於上詳細描述,並包含於此。一般而言, 忒方去係用於製造特定之經基因修飾生物體,其可製造具 特定生物活性之分子或分子群。較佳為,該經基因修飾生 108 200813222 物體為經基因修飾之微生物體或經基因修飾之植物。 較佳為,本發明之一經基因修飾生物體係製造一或多 種多不飽和脂肪酸,包括,但不侷限於,EPA(C20 : 5, n-3)、 DHA(C22 : 6, n-3)、DPA(C22 : 5, 11-6或11_3)、ARA(C20 : 5 4,η·6)、GLA(C18 : 3,n-6)、ALA(C18 : 3,n-3),及/或 SDA(C18 : 4, n-3)),更佳為,一或多種更長鏈之puFA,包 括,但不偏限於,EPA(C20 : 5, n-3)、DHA(C22 : 6, n-3)、 DPA(C22 : 5, n-6或n-3)或DTA(C22 : 4, n-6)。在一較佳實施 例中,本發明經基因修飾之植物係製造一或多種多不飽和 10 脂肪酸,包括,但不侷限於,:EPA(C20 : 5, n.3>、: 6, n-3),及/或DPA(C22 : 5, n-6或n-3)。 依據本發明,經基因修飾之生物體包括一生物體,其 藉由使用重組技術或典型突變與篩選技術而修飾。如此所 述,會導致基因表現或基因產物(即,該基因編碼之蛋白質) 15功能降低之基因修飾,可稱之為失活(完全或部分)、剔除、 干擾、阻斷或降低調節一基因。例如,一基因之基因修飾, 其會導致此基因編碼之蛋白質功能降低,可為該基因完全 剔除之結果(即,該基因不存在,因而該蛋白質不存在)、該 基因之突變’其會導致蛋白質不完全或無轉譯(如該蛋白質 20不表現)’或基因突變,其會降低或抵銷蛋白質之天然功能 (如-蛋白質係表現,但酵素活性或作㈣降低或無活性)。 會導致基因表現或功能增加之基因修飾,係稱之為倍增、 過度製造、活化、強化、加成,或加__基因。 本發明生物體之基因修飾較佳係影響該生物體表現之 109 200813222 PUFA PKS系統,不論該PUFA PKS系統是内生性與經基因 修飾、内生性並引入重組核酸分子至該生物體中(可修飾内 生性糸統或不修飾)’或是完全由重組技術提供。為了改變 PUFA PKS系統或表現此系統之生物體中pUFA《製造分 5 佈,此系統包括會導致任何可偵測或可測量之一或多種 PUFA(或其他由此PUFA PKS系統製造之生物活性分子)製 造量改變者,於該宿主生物體中,與無此基因修都者相較 (即,與未經修飾、野生型生物體,或生物體至少於pufa 合成方面未經修飾-即,該生物體可能具有其他與1>111^無 10關之修飾,相較)。為了影響PUFA PKS系統之活性,該系 統包括任何會導致該生物體PUFA PKS系統產生可偵測或 可測量之改變或修飾之基因修飾,係與無基因修飾者相 較。PUFA PKS糸統之可偵測改變或修飾可包括,但不侷限 於:經修飾PUFA PKS系統之一或多個區塊之表現,及/或 15生物活性之改變或修飾(引入、增加或降低),與無此基因修 飾之内生性PUFAPKS系統相較;將PUFAPKS系統活性引 入至一生物體中(即,該生物體不包含PKS系統或基因修飾 前之PUFA PKS系統),使得該生物體具有可測量/可偵測之 PUFAPKS系統活性。 20 值得注意的是,增加PUFAPKS系統中功能性區塊或蛋 白質之活性’包括PUFA PKS系統之一附屬蛋白,係稱之為 含有該區塊或蛋白質之生物體(或該區塊或蛋白質待引入 處)之基因修飾,其導致該區塊或蛋白質或系統功能性之增 加,並可包括該區塊或蛋白質或系統之更高活性(如特異活 110 200813222 性或體内酵素活性)、降低該區塊或蛋白w 分解,並過度表現該區塊或蛋白質或系^减系統之抑制或 基因複製數、藉由使用可提供較原始驅動。例如,可增加 動子增加表現量,或可藉由基因工程或典子鬲表現量之驅 因,以增加該基因編碼之區塊或蛋 、裂突變改變之基 貝之法付 類似地,PUFAPKS系統中功能性 生。 10 15 20 降低,包括JPUFAPKS系統之附屬蛋白,係·^蛋白質活性之 蛋白質之生物體之基因修飾(或該區塊:日含有:區塊或 處),其會導致區塊或蛋白f功能性降低蛋白f待引入 白質活性之降低、增加該輯或蛋㈣^包括區塊或蛋 降低或消除該區塊或蛋白質之表現。例如=或降解,並 蛋白質之作用可藉由阻斷或降低該區塊或蛋白 降低’“剔除”該基因或其編碼區塊或蛋白質之邱八= 該區塊或蛋白質之活性,或抑制該區塊或蛋白質二活=低 阻斷或降低該區塊或蛋白質之製造,可包括將編碼該區塊 或蛋白質基因置於驅動子之控制下,其需要在培養基中有 誘發化合物存在。藉由建立將誘發劑自培養基中耗盡之條 件,編碼該區塊或蛋白質之基因之表現(因此,蛋白質合成) 可被關閉。本發明人展現在破囊壺菌(thraust〇chytrid)微生 物體中剔除(knock out)標的基因之能力,請見範例一節。阻 斷或降低區塊或蛋白質之活性亦可包括使用刪除技術法, 類似於美國專利號4,743,546中所述,在此併入本案以作為 參考資料。為了使用此方法,編碼有興趣蛋白質之基因係 選殖至特定基因序列之間,其可允許該基因自基因體中特 111 200813222 異性、經控制地刪除。該刪除可藉由,如,改變培養溫度 而促進,如美國專利號4,743,546中所述,或藉由某些其他 物理性或營養性訊號。 經基因條飾之檄峰铷辨 5 如此所述,經基因修飾之微生物體可包括一經基因修 飾之細菌、單細胞生物、微藻類、真菌或其他微生物。此 經基因修飾之微生物體具有一基因體,其修飾(即,突變或 改變)自其正常形式(即,野生型或天然發生),使得所希望 之結果可達成(即,增加或修飾PUFAPKS活性,及/或使用 10 PUFA PKS系統希望產物之製造與堆積)。微生物體之基因 修飾可使用典型菌株發育及/或分子基因技術達成。此類技 術為技術上已知,且一般揭示用於微生物體,例如,於 Sambrook et al·,1989,Molecular Cloning : A Laboratory Manual,Cold Spring Harbor Labs Press。參考文獻Sambrook 15 et a1·,ibid·,係在此併入本案以作為參考資料。經基因修飾 之微生物體可包括一微生物體,其中核酸分子已經插入、 刪除或修飾(即,突變;如藉由核苷酸插入、刪除、取代, 及/或倒位),以此方式使得此類修飾可對於該微生物體提供 所希望之影響。 20 適用於基因修飾之宿主微生物體範例包括,但不侷限 於’酵母囷’包括讓酒酵母(Saccharomyces cerevisiae)、啤 酒酵母(Saccharomyces carlsbergensis),或其他酵母菌,如 饭絲酵母(Candida)、脆壁克魯維酵母(Kluyveromyces)或其 他真菌,例如,絲狀真菌,如麴菌(ASpergiuus)、胞菌 112 200813222 (Neurospora)、青黴菌(Penicillium)等。細菌細胞亦可使用 作為宿主。這些包括,但不侷限於,大腸桿菌,其可用於 發酵製程中。此外,僅作為範例,宿主如乳酸菌 (Lactobacillus)或桿菌(Bacillus),皆可使用作為宿主。 5 其他可用於本發明之宿主包括微生物體,來自各屬包 括,但不侷限於,破囊壺菌(thraustochytrium)、加彭歐飢崔 恩菌(Japonochytrium)、不遊走壺菌(Aplanochytrium)、艾利 納菌(Elina)與裂殖壺菌(Schizochytrimn),落於破囊壺菌科 中,以及網黏菌(Labyrinthula)、拉比琳休洛依迪斯菌 10 (Labyrinthuloides),與迷黏菌(Labyrinthomyxa ),落於網黏 菌科中。在這些屬中之較佳物種包括,但不侷限於,下列 描述之任一物種。特佳之破囊壺菌目株包括,但不侷限於: 裂殖壺菌(Schizochytrium)sp.(S31)(ATCC 20888);裂殖壺菌 (Schizochytrium)sp.(S8)(ATCC 20889);裂殖壺菌 15 (Schizochytrium)sp.(LC-RM)(ATCC 18915);裂殖壺菌 (Schizochytrium)sp.(SR21);裂殖壺菌(Schizochytrium)sp· N230D、聚裂殖壺菌(Schizochytrium aggregatum)(Goldstein et Belsky)(ATCC 28209);裂殖壺菌(Schizochytrium limacinum)(Honda et Yokochi)(IFO 32693);破囊壺菌 20 (thraustochytrium sp.)(23B)(ATCC 20891);紋狀破囊壺菌 (thraustochytrium striatum)(Schneider)(ATCC 24473);破囊 壺菌(thraustochytrium aureum)(Goldstein)(ATCC 34304);紅 破囊壺菌(thraustochytrium roseum)(Goldstein)(ATCC 28210);以及加彭歐凱崔恩菌(Japonochytrium 113 200813222 sp.)(Ll)(ATCC 28207)。 依據本發明,術語’’破囊壺菌(thraustochytrid)’’係指破囊 壺菌目目之任一成員,包括破囊壺菌科家族,術語’’網黏菌 (labyrinthulid)”係指網黏菌目之任一成員,其包括網黏菌 5 科家族。網黏菌科家族成員一度被認為是破囊壺菌目成 員,但最近有關生物體的分類學研究指出,該家族被認為 是網黏菌目之一員,且網黏菌目與破囊壺菌目二者皆被認 為是網黏菌門(Labyrinthulomycota)之一員。此發展導致破 囊壺菌(thraustochytrid)與網黏菌(labyrinthulid)時常在分類 10 學上修正。然而,分類學者現在一般將這群組分類為微生 物體,具有海藻或海藻-類似單細胞生物,在原生藻菌 (Stramenopile)品系中。目前對於破囊壺菌(thraustochytrid) 與網黏菌(labyrinthulid)之分類摘要如下: 界:原生藻菌(Chromista) 15 門:網黏菌門 綱:網黏菌綱 目:網黏菌目 科:網黏菌科 屬:破囊壺菌屬 20 種:破囊壺菌科 然而,由在分類學上仍不明碟,用於本發明目的較佳 可視為破囊壺菌(thraustochytrid)之菌株包括下列生物體: 目:破囊壺菌目;科:破囊壺菌科;屬:破囊壺菌 (thraustochytrium)(種:sp·,阿魯迪曼達雷(arudimentale)、 114 200813222 阿伍雷恩(aureum)、班思寇拉(benthicola)、格洛巴森 (globosum)、肯内伊(kinnei)、摩提夫(motivum)、馬堤盧蒂 曼達雷(multirudimentale)、巴飢得門(pachydermum)、普洛 利芬盧(proliferum)、紅破囊壺菌(roseum)、紋狀破囊壺菌 5 (striatum))、巫肯尼亞菌(Ulkenia)(種:sp.、阿墨巴戴亞 (amoeboidea)、開古蓮西斯(kerguelensis)、迷努它(minuta)、 普羅弗達(profunda)、拉迪亞它(radiata)、沙伊廉斯 (sailens)、沙勒乃利阿納(sarkariana)、赛索凱特羅皮思 (schizochytrops)、維蘇爾傑西斯(visurgensis)、約肯西斯 10 (yorkensis))、裂殖壺菌(Schizochytrium)(種:sp.、聚裂殖壺 菌(aggregatum)、利納賽恩(limnaceum)、曼格洛維伊 (mangrovei)、迷努頓(minutum)、歐克多斯波倫 (octosporum))、加彭歐凱崔恩菌(Japonochytrium)(種:sp·, 馬利奴恩(marinum))、不遊走壺菌(Aplanochytrium)(種: 15 sp.、哈利歐堤蒂斯(haliotidis)、開古蓮西斯(kerguelensis)、 普羅弗達(profunda)、史多其諾伊(stocchinoi))、歐索爾尼亞 菌(Althornia)(種:sp·、可勞齊(crouchii)),或艾利納菌 (Elina)(種:sp·,馬利撒爾巴(marisalba)、辛諾李菲卡 (sinorifica))。值得注意的是,巫肯尼亞菌(Ulkenia)屬之原 20 始描述,並未發表於同儕評核(peer-reviewed)之期刊上,所 以在此屬以及其下之種之確認上仍有些問題存在。就本 發明目的而言,巫肯尼亞菌(Ulkenia)下之種被視為是破囊 壺菌屬之一員。 本發明描述之菌株為網黏菌(labyrinthulid),包括下列 115 200813222 生物體·目:網黏菌目’科:網黏菌科,屬:網黏菌屬(種: sp·,阿勒傑利恩西斯(algeriensis)、可安諾賽斯提斯 (coenocystis)、恰特圖尼(chattonii)、麥可洛塞斯提斯 (macrocystis)、麥可洛塞斯提斯阿特蘭提卡(macr〇cystis 5 atlantica)、麥可洛塞斯提斯麥可洛塞斯提斯(macr0CyStiS macrocystis)、馬利納(marina)、迷努它(minuta)、羅斯可芬 西斯(roscoffensis)、芳考羅伊蒂斯(vaikaui〇ides)^ : sp·、 哈利歐堤蒂斯(haliotidis)、約肯西斯(yorkensis))、利比琳索 米克斯諾維(Labyrinthomyxnovii)、維特里納(vitellina)、維 10 特里納帕西菲卡(vitellina pacifica)、維特里納維特里納 (vitellina vitellina)、索琵菲(zopfii)),利比琳索 (Labyrintha)(種:sp·,馬利納(marina))、雙孔蟲(種:sp·,阿 爾切利(archeri))、派爾侯蘇勒斯菌(pyrrhosorusx種:sp•,馬 利努思(marinus))、蘇洛迪普洛菲力斯菌 15 (Sorodiplophrys)(種:sp·,史特爾寇來亞(stercorea))或克廉 米多米克沙菌(Chlamydomyxa)(種:sp·,拉比琳休洛依迪斯 (labyrinthuloides)、蒙大拿(montana))(雖然並無與派爾侯蘇 勒斯菌(Pyrrhosorus)、蘇洛迪普洛菲力斯菌(Sorodiplophrys) 或克廉米多米克沙菌(Chlamydomyxa)確切一致之分類)。
2〇 在本發明之一實施例中,該微生物體之内生性PUFA PKS系統,及/或内生性PUFAPKS附屬蛋白(如ACoAS)係 經基因修飾,藉由如典型突變與篩選技術,及/或分子基因 技術,包括基因工程技術。基因工程技術包括,例如,使 用標的重組載體以剔除内生性基因部分,或置換内生性基 116 200813222 因為一異源性序列。可引入宿主基因體中之異源性序列範 例,包括編碼來自另一PKS系統之至少一功能性PUFAPKS 區塊或蛋白質,或甚至完整PUFA PKS系統之序列(如所有 與PUFA PKS系統相關之基因)。異源性序列亦可包括一序 5 列,其編碼一PUFAPKS系統天然區塊之經修飾功能性區塊 (同源物)。其他可引入該宿主基因體之異源性序列包括編碼 一蛋白質之核酸分子,該蛋白質會影響内生性PUFAPKS系 統之活性,如於此所述之附屬蛋白。例如,可引入宿主基 因體之一核酸分子係編碼ACoAS,尤其是,會強化宿主中 10 PUFA之製造及/或堆積之AC〇AS,與PUFApKS系統共同操 作之内生性ACoAS相較。 座·基因絛飾之姑物 本發明之另一實施例係相關於一種經基因修飾之植
物’其中該植物經基因修飾,以重組性地表現一 PUFAPKS 15系統,包括一PPTase,如此所述,且其中該植物進一步經 基因修飾,以表現一如此所述之附屬蛋白,以增進宿主中 PUFA之製造及/或堆積(或puFA pKS系統之其他生物活 性),及/或抑制與PUFA PKS系統競爭之路徑(如抑制FAS系
統)。較佳為,此附屬蛋白為ACoAS及/或一利用PUFA_coA 2〇作為叉貝形成PL或TAG之蛋白質(如GPAT、LFAAT或 DAGAT) 〇 使用於此,一經基因修飾之植物可包括任何經基因修 7之植物’包括較高植物,尤其是消耗性植物,或可用於 製、本t月所希望生物活性分子(如pUFA)之植物。“植物部 117 200813222 分’使用於此’包括植物之任一部分,包括,但不侷限於, 種子(包括成熟與未成熟種子)、花粉、胚胎、花、果實、幼 芽、葉子、根、樹幹、外植片體等。經基因修飾之植物具 有一基因體,其修飾(即,突變或改變)自其正常形式(即, 5野生型或天然發生),使得所希望之結果可達成(即,增加或 修飾PUFAPKS活性,及/或使用puFAPKg統希望產物之 製造與堆積)。植物之基因修飾可使用典型菌株發育,及/ 或分子基因技術達成。製造轉殖植物之方法,其中一重組 核酸分子係編碼一希望之胺基酸序列,係加入植物之基因 10體中,為技術上已知。特佳之植物係依據本發明經基因修 飾,較佳為適用於動物,包括人類消耗之植物。 本發明經基因修飾之較佳植物(即,植物宿主細胞)包 括,但不侷限於任一較高植物,包括雙子葉與單子葉植物, 尤其是消耗性植物(consumable plant),包括作物,尤其是 15使用其油類之植物。此植物可包括,如:油菜(canola)、大 豆、油菜(rapeseed)、亞麻子(linseed)、玉米、紅花 (safflower)、葵花與煙草(t〇bacco)包括。其他較佳之植物為 已知可製造用於醫藥試劑、香味劑、營養劑、功能性食品 成分或化妝品活性成分之化合物者,或該植物經基因工程 20 改造以製造這些化合物/試劑者。 如上所討論,本發明之PUFA PKS合成酶並不會利用 FAS糸統之脂肪酸產物。相反地’其會自FAS與鍵延長酶使 用之小分子前驅物(丙二醯基-CoA),製造最終PUFA產物 (主要PUFA產物)。因此,並不會釋放出明顯量之合成循環 118 200813222 之中間物,且該PUFA產物(於此亦稱之為主要PUFA產物) 可有效轉移至脂質之磷脂質(PL)與三醯基甘油(TAG)部分 中,事實上,PUFA PKS系統可製造二標的或主要PUFA產 物(如來自裂殖壺菌(Schizochytrium)之PUFA PKS系統會製 5 造DHA與DPA n-6為主要產物),但DPA並非該路徑可製造 DHA之中間產物。此外,每一者皆為相同PUFA PKS系統之 單獨產物。因此,PUFA PKS基因為於異源性宿主如植物 中,製造含有PUFA,尤其是長鏈PUFA(LCPUFAs)之油類之 絕佳工具,其中該油類為中間產物之實質上自由形式(定義 1〇如下),且該產物係由,,標準” PUFA路徑(定義如下)製造。 因此’本發明之一目標為經由此述植物之基因操作, 製造一多不飽和脂肪酸,具有所希望之鏈長度與雙鍵數 目,以及,延伸來說,包含這些pUFA之油類種子與此植物 獲得之油類(即,由此植物之油類種子獲得)。可由本發明製 15造之PUFA範例包括,但不侷限於,DHA(二十二碳六烯酸 (C22 · 6, n-3))、ARA(二十碳四烯酸或花生四烯酸(C2〇 : 4, n-6))、DPA(二十二碳五烯酸(C22 : 5, n_6或n_州與EpA(二 十碳五烯酸(C20 : 5, n-3))。本發明可允許製造商業上可購 柃之月曰貝,其萄含一或多種希望之(標的或主要)pUFA,藉 2〇由本發明人發展之經基因修飾植物,透過使用會產生PUFA :聚酮合成酶-類似系統。 依據本發明,”主要PUFA”、"標的PUFA,,、,,預期之 PUFA”或"希望之PUFA”仙特定之puFA#服,其為製 wPUFA之酵素路彳!之預期或標的產物。例如,當使用鍵延 119 200813222 長酶與去飽和酶修飾FAS系統之產物時,吾人可選擇鍵延長 酶與去飽和酶之特定組合,當一同使用時,將產生_標的 或希望之PUFA(如DHA或EPA)。如上所討論,此由標準路 徑製造之標的或希望之PUFA,實際上可能並非”主要,, 5 PUFA ’就1"111^佔該系統所製造之總脂肪酸百分比而言, 由於中間產物與副產物之形成,其可實際上代表該系統製 造之大部分產物。然而,吾人可使用術語”主要pUFA”,即 使在指由系統中使用鏈延長酶或去飽和酶製造標的或預期 PUFA產物時。 10 當使用PUFAPKS系統為本發明之較佳例時,所提供衍 生自特定生物體之PUFA PKS系統,將製造特定之PUFA, 使得經由篩選來自特定生物體PUFAPKS系統,便可導致特 定標的或主要PUFA之製造。例如,使用來自裂殖壺菌 (Schizochytrium)之 PUFA PKS 系統會導致 DHA 與 DPAn-6 I5 之製造,為標的或主要PUFA。另一方面,使用來自各種沙 雷菌(Shewanella)物種之PUFA PKS系統會導致EPA之製 造,為標的或主要PUFA。值得注意的是,主要或標的PUFA 之比例會依據特定PUFA PKS系統之篩選,以及該系統如何 反應表現時之特定條件而不同。例如,使用來自破囊壺菌 20 (thraustochytrium)23B(ATCC No· 20892)之 PUFA PKS 系 統,會導致DHA與DPAn-6之製造,為標的或主要PUFA ;然 而,在破囊壺菌(thraustochytrium)23B之情況下,DHA比 DPAn-6之比例為約10 ·· 1(且可變化為約8 : 1至約40 : 1), 其中在裂殖壺菌(Schizochytrium)中,該比例一般為約2.5 : 120 200813222 1。因此,使用破囊壺菌(thraustochytriUm)之Pufa PKS系統 或蛋白質或區塊,可改變該生物體製造之PUFA之比例,與 裂殖壺菌(Schizochytrium)相較,即使其標的Pufa相同。 此外’吾人可修飾一 PUFA PKS系統,藉由混合來自不同 5 PUFA PKS系統或PUFA PKS與PKS系統之蛋白質與區塊,或 吾人可修飾PUFA PKS系統之區塊或蛋白質,以改變標的 PUFA產物及/或比例。 依據本發明,製造PUFA之酵素系統之”中間產物”或,, 副產物”係指任一產物,尤其是脂肪酸產物,其係由該酵 10 素系統製造,為該系統製造標的或主要PUFA之結果,但並 非主要或標的PUFA。在一實施例中,中間物與副產物可包 括非標的脂肪酸,其自然地由野生型植物,或用於接受預 定基因修飾之母株植物製造,但現在被分類為中間物或副 產物’由於其被製造為較高含量,為基因修之結果,與 15野生型植物,或用於接受預定基因修飾之母株植物製造者 相較。中間物或副產物在PUFA合成之標準路徑中特別明 顯,且在PUFA PKS路徑上實質不明顯,如上所討論。值 得注意的是,一酵素系統之主要或標的PUFA可為不同酵素 系統之中間物,其中該主要或標的產物為不同之PUFA,此 20現象相當正確,對於製造PUFA之標準路徑之產物而言,由 於PUFA PKS系統會實質上防止中間產物之製造。例如,當 使用標準路徑製造EPA時,脂肪酸如GLA、DGLA與SDA 係以中間產物形式製造,具明顯大量(如美國專利申請案公 開號2004/0172682說明了此點)。同樣地,美國專利申請 121 200813222 案公開號2004/0172682亦說明,當使用標準路徑製造 DHA,除了上述之脂肪酸,eta與EPA(注意上述第一範例 之PUFA)係以明顯量製造,事實上,為總脂肪酸中相當明 顯大量,與其本身之標的PUFA相較。後者觀點亦顯示於美 5 國專利申請案公開號2004/0172682,其中一植物係經基因 工程製造DHA,以標準路徑製造更多之EPA,其在總脂肪 酸中之百分比較DHA高出許多。 為了製造明顯高產量之一或多種所希望之多不飽和脂 肪酸,植物可經基因修飾,以引入PUFA PKS系統於該植物 10 中。植物已知並無内生性包含一 PUFA PKS系統,因此,本 發明之PUFA PKS系統係代表一機會,可產生具有獨特脂肪 酸製造能力之植物。本發明之一尤佳實施例為,經基因工 程改造之植物,以於相同植物中製造一或多種PUFA,包括 EPA、DHA、DPA(n3或n6)、ARA、GLA、SDA與其他。本 15 發明係提供一種能力,可創造數種“設計者油類”,具有各 種比例與形式。此外,所揭示來自特定海洋生物體之PUFA PKS基因,於此所述,係提供一種機會,可立即延伸PUFA 製造之範圍,並成功製造PUFA,在大部分作物成長之範圍 内。 20 因此,本發明之一實施例係相關於一種經基因修飾之 植物或植物之一部分(如其中該植物已經基因修飾,以表現 PUFAPKS系統,如此所述),其包括核心PUFAPKS酵素複 合體與PPTase,如此所述,其中該植物經更進一步基因修 飾,以表現一附屬蛋白,如此所述,以增進宿主中 122 200813222 臟(職⑽狀其他她續產椒製造及/或堆 積,及/或其中該植物經基因修飾,以抑制與腿PKS系 統競爭之路徑(如抑制FAS系統),如此所述。㈣為,_ 屬蛋白為-AC〇AS及/或-蛋白質,其利用puFA_c〇A作為 5 受質,以形成PL或TAG(如GPat、lfa^dagat) ,使得 該植物製造PUFA。 較佳為,此麟之基因修飾可為任—修飾(天然發生、 經筛選或合成),其可增加通過PUFA合成酶路徑之流通 量’藉由降低與丙二醯基_C0A匯集物之競爭。有許多可能 之方法達成增強與此受質競爭之能力。這些方法包括,但 不侷限於,υ競爭路徑之抑制,包括抑制腸路徑上之任 -元素’如藉由降低涉錢祕徑之料或次單元之表現 (如藉由使用反義股RNA、RNAi、共抑制或突變),2)在異 源!生伯主中PUFA合成酶之表現,其中競爭路徑已被降低或 15阻斷(如在油菜(Canola)中,其中在細胞質中延長脂肪酸之 旎力已被阻斷),及/或3)增加丙二醯基_c〇A之匯集物(如藉 由表現乙醯基-CoA叛基酶)。在一實施例中,KASn及/或 KASIII係於該植物中抑制(如藉由RNAi或反義股)。 如上所述,該使用於本發明之經基因修飾植物,已經 2〇基因修飾表現PUFA PKS系統。該PUFA PKS系統可包括任 一PUFA PKS系統,如任一PUFA pKS系統,描述於如美國 專利號6,566,583 ;美國專利申請案公開號2〇〇2〇194641 ;美 國專利申請案公開號20040235127 ;美國專利申請案公開號
20050100995 ;與 PCT 公開號 w〇 2006/135866。該 PUFA 123 200813222 PKS系統可選自,但不侷限於,任一特定之pUFA PKS系 統,已於這些專利或專利公開案中辨識出並鑑定,如來自 裂殖壺菌(Schizochytrium)sp·,美國菌種中心(ATCC)No· 20888之PUFA PKS系統,及其衍生之突變株(如菌株 5 N230D),破囊壺菌(thraustochytrium)23B ATCC No· 20892 ’及其衍生之突變株;沙雷菌(shewanella olleyana) 南極微生物體澳洲菌種中心(ACAM)菌株編號644,及其衍 生之大變株,或沙雷菌(Shewanella japonica)ATCC菌株編號 BAA-316,及其衍生之突變株。 10 在一實施例中,該PUFAPKS系統係包含一區塊,選自 於上述任一PUFA PKS系統,其中該區塊係合併(混合與匹 配)形成一完整之PUFA PKS系統,符合上述之最低需求。 该植物可更進一步經另一PKS系統之至少一區塊或生物活 性片段修飾,該系統包括,但不限制於,第1型1>反8系統(迭 15代式或模塊式)、第11型PKS系統,及/或第III型PKS系統, 其可取代PUFA PKS系統之一區塊。最後,puFA pKS系統 之任一區塊可修飾自其天然結構,以修飾或強化pUFApKS 系統之該區塊之功能(如修飾PUFA種類或其於該系統之 製造比例)。混合此區塊以製造嵌合性pUFA pKS蛋白 20 質,係描述於上述專利與專利公開案中。 較佳為,具有上述定義特徵之植物為經基因修飾以表 現PUFAPKS系統(PUFA合成酶)之植物,如此詳細描述(即 PUFAPKS系統為製造植物中標的pUFA之酵素系統在一 實施例中,該植物經基因修飾,以表現_ pUFApKs系統, 124 200813222 其包含PUFA PKS蛋白質/區塊,來自破囊壺菌 (thraustochytrid),包括,但不侷限於,裂殖壺菌 (Schizochytrium)、破囊壺菌(thraustochytrium)、巫肯尼亞菌 (Ulkenia)、加彭歐凱崔恩菌(Japonochytrium)、不遊走壺菌 5 (Aplanochytrium)、歐索爾尼亞菌(Althornia)或艾利納菌 (Elina)。在一實施例中,該植物經基因修飾以表現一PUFA PKS系統,其包含來自網黏菌(labrynthulid)之PUFA PKS 蛋白質/區塊。在另一實施例中,該植物經基因修飾以表現 PUFAPKS系統,其包含來自海洋細菌之PUFAPKS蛋白質 10 /區塊,包括,但不侷限於,沙雷菌(Shewanellajaponica)或
沙雷菌(Shewanella olleyana)。在一實施例中,該植物經基 因修飾以表現一 PUFA PKS系統,其包含裂瘦壺菌 (Schizochytrimn)OrfsA、B與C(包括其同源物或合成物),及 PPTase(如Hetl),如上所述(如SEQ ID NOs : 1-32與SEQ ID 15 NO · 33 ’ 及有關上述裂殖壺菌(Schizochytrium)PUFA PKS 系統之討論)。在另一實施例中,該植物經基因修飾以表現 一 PUFA PKS系統,其包含破囊壺菌 (thmist〇Chytrimn)〇rfSA、B與C(包括其同源物或合成物), 與PPTase(如Hetl),如上所述(如SEQmN〇s : 38-6_seq
2〇 ID NO .33’ 以及上述有關破囊壺菌(thraust〇chytrium)puFA PKS系統之討論;亦請見美國專利申請案公開號 20050014231)。在另一實施例中,該植物經基因修飾以表 現一 PUFA PKS系統,其包含其他破囊壺菌 (thranstochytricDOrfsA、B與C(包括其同源物或合成物),與 125 200813222 PPTase(如Hetl)(如PCT 專利公開號 WO 05/097982)。在另 一實施例中,該植物經基因修飾以表現一PUFAPKS系統, 其包含PUFA PKS Orfs,來自海洋細菌如沙雷菌 (Shewanella)(包括其同源物或合成物),與ppTase(如内生 5 性沙雷菌(Shewanella)PPTase),如上所述,(如 SEQ ID NOs : 1-6 ’ 有關沙雷菌(Shewanella japonica),SEQ ID NOs : 7-12, 有關沙雷菌(Shewanella olleyana))。在另一實施例中,該植 物經基因修飾以表現來自此PUFA PKS系統之區塊與蛋白 質之任一組合(如嵌合pUFApKS系統 10 隶後’如上所述,該植物之基因修飾可包括引入一或 多種附屬蛋白,其可與核心PUFA PKS酵素複合體共同作 用,以允許、加速或強化該植物製造PUFA,及/或可強化 丙二酿以八受質通過PUFA PKS系統之流通量之基因修 飾,如藉由抑制此述之FAS系統,或使用其他策略以達到 15此述之相同結果。該植物之基因修飾亦可包括該基因之宿 主密碼子使用最佳化,以及引導PUFA合成酶酵素至特定 胞器(如色素體)。 較佳為,該植物為一油類種子植物,其中該油類種子, 及/或油類種子中之油類,係包含pUFA pKS系統製造之 20 PUFA。此油類包含一可偵測量之至少一標的或主要 PUFA,其為PUFApKS系統之產物。此外,此油類實質上 不含中間產物或副產物,其並非標的或主要PUFA產物, 且其並非天然地由野生型植物之内生性FAS系統製造(即 野生型植物製造某些較短或中間長度之pUFA,如Μ個碳 126 200813222 之PUFA,經由FAS系統,但為該植物中製造之新穎或額外 之脂肪酸,為經PUFA PKS系統基因修飾之結果)。換句話 說,與野生型(非經基因修飾)植物或預定接受經基因修飾之 母植物之總脂肪酸分佈相較,該植物製造之總脂肪酸分佈 5之大部分其他脂肪酸(新穎之脂肪酸或由於基因修飾增加 之脂肪酸),已經PUFA PKS系統基因修飾,包含標的戍預 期之PUFA PKS系統之PUFA產物(即該植物製造之總脂肪酸 分佈之大部分其他或新穎之脂肪酸為標的PUFA)。 此外,合成PUFA之系統,,實質上不含”中間產物或副產 1〇物於實際量中,係指任一中間產物或副產物脂肪酸(非標的 PUFA),其由經基因修飾之植物(及/或植物之部分及/或種子 油類分液)製造,為該製造PUFAS之酵素系統引入或存在 之結果(即非由野生型植物或用於基因修飾之母株植物製 造),其量小於植物總脂肪酸之約10%重,較佳小於約, 15更佳小於約8%,尤佳小於約7%,特佳小於約6%,,更佳 於約5%,更佳小於約4%,更佳小於約3%,更佳小於約2%, 更佳小於約1%重之植物製造之總脂肪酸,更佳小於約〇·5% 重之植物製造之總脂肪酸。 在一較佳實施例中,合成PUFA之系統”實質上不含,,中 2〇間產物或副產物,或不具有中間產物或副產物於實際量 中,係指任-中間產物或副產物脂肪酸,其由經基因修飾 植物(及/或植物之部分及/或種子油類分液)製造,為該製造 P UFA S之酵素系統引入或存在之結果(即非由野生型植物 或用於接受基因修飾之母株植物製造),其量小於植物製造 127 200813222 5
之總脂肪酸之_%重(額外脂肪酸係定義為並非由野生型 植物’或祕製造標的顺仏基因料之母株植物天然製 造之脂肪酸含量),較佳為小於約9%,更佳小於約8%,尤 佳小於約7% ’特佳小於約6%,更佳小於約5%,更佳小於 約4%,£佳小於約3%,更佳小於約2%,更佳小於約1% 種之該植物製造之總脂肪酸。因此,相對於經基因修飾、 經由標準路徑製造PUFA之植物之脂肪酸分佈,由puFA PKS系統基因修飾產生之主要脂肪酸產物將為標的或預期 之脂肪酸產物。 10 當PUFA PKS系統之標的產物為長鏈puFA,如DHA、 DPA(n-6或n-3)或EPA時,並未在經PUFA PKS基因修飾植 物之總脂質中佔有實質量之中間產物與副產物為,但不侷 限於:γ·次亞麻油酸(GLA ; 18 : 3, n_6);十八碳四烯酸(STA 或SDA ; 18 : 4, n-3);二高个次亞麻油酸(DGLA或HGLA ; 15 20 : 3, n-6)、花生四烯酸(ARA,C20 : 4, η·6);二十碳三烯 酸(ΕΤΑ ; 20 : 3, η-9),以及各種其他中間產物或副產物, 如 20 : 0 ; 20: 1(Δ5); 20: 1(Δ11); 20 : 2(Δ8,11); 20 : 2(Δ11,14); 20: 3(Δ5,11,14); 20: 3(M1,14,17);蜂蜜酸(20: 3 ; A5,8,ll); 或20 : 4(Δ5,1,14,17)。此外,當標的產物特別為PUFA,如 2〇 DHA時,並未在經基因修飾植物之總脂質中佔有實質量之 中間產物與副產物,亦包括其他PUFA,其為不同PUFA PKS 系統之天然產物,如EPA,在此範例中。值得注意的是, 本發明之PUFA PKS系統亦可使用於,若希望的話,製造 標的PUFA,其可包括GLA、SDA或DGLA。 128 200813222 使用此述PUFA PKS系統之基因基礎與區塊結構知 識,本發明設計並製造出編碼此PUFAPK^^、統之建構物, 並已成功地製造出基因轉殖植物,表現PUFA pks系統。# 基因轉殖植物製造含有PUFA之油類,且該油類實質上不含 5中間產物,其於標準PUFA路徑中堆積。本發明人亦呈現 了使用该建構物製造PUFA於另一真核生物,酵母菌中,此 為概念驗證實驗,在製造基因轉殖植物之前。該範例呈現 了具有PUFA PKS系統之酵母菌與植物,其會製造djja與 DPAn-6為標的PUFA,係製造這些PUFA之二者為主要額外 10 脂肪酸,於該植物與酵母菌之總脂肪酸中(即,減去野生型 植物製造之脂肪酸),此外,任一其他為出現於野生型植物 或植物母株脂肪酸中之其他脂肪酸,實際上未偵測到。經 基因修飾之植物與其油類部分之特定特徵,係如下所述。 依據本發明,經基因修飾脂質物包括一植物,其使用 15 重組技術修飾,可與典型突變與篩選技術合併。如此所述, 會導致基因表現降低、基因功能降低或基因產物之功能降 低之基因修飾(即,由該基因編碼之蛋白質)可稱之為一基因 之失活(完全或部分)、剔除、干擾阻斷或降低調節。例如, 一基因之基因修飾,其會導致由此基因編碼之蛋白質功能 20之降低,可為該基因完全剔除之結果(艮卩,該基因不存在, 因此該蛋白質不存在),基因突變,其會導致蛋白質之不完 全或無轉譯(如該蛋白質未表現),或基因突變,其降低或抵 銷蛋白質之天然功能(如一蛋白質之表現係降低或無酵素 活性或作用)。基因修飾’其導致基因表現或功能之增加, 129 200813222 可稱之為一基因之倍增、過度表現、活化、強化、加成或 加強調節。 本發明植物之基因修飾可導致該植物製造一或多種 PUFA。該植物製造之PUFA分佈與PUFA比例,並不需要與 5 該PUFA PKS系統衍生之生物體所製造之PUFA分佈與 PUFA比例相同。 就經基因修飾植物之製造而言,基因工程改造植物之 方法為技術上已知。例如,數種植物轉型之方法已發展出, 包括生物性與物理性轉型流程。請見,如Miki et al·, 10 ’’Procedures for Introducing Foreign DNA into Plants" in Methods in Plant Molecular Biology and Biotechnology, Glick,B.R. and Thompson,J.E. Eds.(CRC Press, Inc” Boca Raton,1993)pp. 67-88。此外,植物細胞或植物之組織轉型 與再生用之載體與體外培養方法,皆可獲得。請見,如, 15 Gruber et al.? "Vectors for Plant Transformation" in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R. and Thompson,J.E· Eds.(CRC Press,Inc_,Boca Raton, 1993)pp· 89-119 。 最廣泛用於引入一表現載體至植物中之方法,係基於 20 農桿菌(Agrobacterium)之天然轉型系統。請見,如,H〇rsch et al·,Science 227: 1229(1985)。根瘤農桿菌(Α· tumefaciens) 與髮根農桿菌(A.rhizogenes)為植物病理土壤細菌,其可使 植物細胞基因轉型。根瘤農桿菌(A. tumefaciens)與髮根農 桿菌(A· rhizogenes)之Ti與Ri質體,係分別攜帶對應之使植 130 200813222 物基因轉型之基因。請見,W,Kado,C.I.,Crit.Rev.Plant. Sci· 10 : 1(1991)。關於農桿菌載體系統與農桿菌媒介之基 因轉移方法之^田述’係提供於數種文獻中,包括Gruber et al., supra,Miki et al·,如上所述,Moloney et al·,Plant Cell 5 RePorts 8:238(1989),與美國專利號 4,940,838與5,464,763。 另一植物轉型之一般應用方法為微喷射 (microprojectile)-媒介轉型,其中DNA係攜帶於微喷射之表 面。表現之載體係引入植物組織中,使用基因搶(bi〇Hstic) 裝置,其可加速微噴射粒子至足以穿透植物細胞壁與細胞 10 膜之速度。Sanford et al·,Part. Sci. Technol. 5 : 27(1987), Sanford,J.C·,Trends Biotech· 6 : 299(1988),Sanford,J.C·, Physiol· Plant 79 : 206(1990), Klein et al·,Biotechnology 10 : 268(1992) 〇 另一物理性傳送DNA至植物中之方法為將標的細胞 15 超音波震盪。Zhang et al·,Bio/Technology 9 : 996(1991)。 此外,微脂體或球狀體(spheroplast)融合已用於引入表現載 體至植物中。Deshayes et al·,EMBO J·,4 : 2731(1985), Christou et al·,Proc Natl· Acad· Sci. USA 84 : 3962(1987)。 DNA直接攝入於原生質體(protoplast)中,使用CaCl2沈 20 澱、聚乙二醇或聚-L-烏胺酸(ornithine),已經報導。Hain et al·,Mol. Gen. Genet. 199 : 161(1985)與Draper et al·,Plant Cell Physiol. 23 : 451(1982)。原生質體與全細胞與組織之 電破法已經描述。Donn et al·,In Abstracts of Vllth International Congress on Plant Cell and Tissue Culture 131 200813222 IAPTC,A2-38, p. 53(1990) ; D,Halluin et al·,Plant Cell 4 : 1495-1505(1992)與 Spencer et al·,Plant Mol. Biol. 24 : 51-61(1994)。 因此’本發明係包含基因修飾植物細胞之方法,藉由 5 使用來自海洋細菌、任一破囊壺菌(thraustochytrid)或其他 真核PUFA PKS系統之基因,更可利用基因混合,以延伸 及/或改變PUFA產物之範圍,包括EPA、DHA、DPA(n-3或 n-6)、ARA、GLA、SDA與其他。獲得這些經改變PUFA製 造分佈之方法,包括混合來自不同生物體之基因至破囊壺 10 菌(thraustochytrid)PUFA PKS基因上,以及基因修飾該内 生性破囊壺菌(thraustochytrid)PUFA PKS基因之方法,如 此所述。有關破囊壺菌(thraustochytrid)PUFA PKS系統與海 洋細囷PUFA PKS系統之基因基礎與區塊結構之知識,係提 供設計新穎之經基因修飾生物體之基礎,其可製造各種 15 PUFA分佈。新穎之PUFA PKS建構物係製備於微生物體 中,如破囊壺菌(thraustochytrid)或大腸桿菌,可經分離之 出並使用於使植物轉型,以輸入類似之PUFA製造特性至 該植物中。包含於本發明中有關PUFA PKS系統特定修飾之 詳細討論請參照’如美國專利申請案公開號20020194641 ; 20 美國專利申請案公開號20040235127 ;與美國專利申請案公 開號20050100995)。 經基因修飾之植物較佳係培養於發酵培養基中,或成 長於適當之基質如土壤中。一適當或有效之發酵培養基已 如上述詳細討論。適用於較高等植物之成長培養基,包括, 132 200813222 但不侷限於,土壤、沙子、任一其他可支撐根部生長之特 定介質(如蛭石(vermiculite)、珍珠岩(perlite)等)或水栽培 養,以及適^之光線、水與營養補充物,使較高等植物之 生長隶佳化。本發明經基因修飾之植物係經基因改造,以 5製造PUFA,經由PUFA PKS系統之活性。該PlJFA可經由 純化過程回收,可自植物中萃取該化合物。在一較佳實施 例中,5亥PUFA係經该植物中收穫而回收。在一特佳實施例 中,PUFA係由該植物之油類中收穫而回收(如自油類種 子)。該植物亦可以其自然狀態消粍或更進一步處理為可消 10 耗產品。 車父佳為,本發明之經基因修飾植物係製造一或多種多 不飽和月曰肪酸,包括,但不侷限於,EpA(C2〇 ·· 5、、 DHA(C22 · 6、n-3)、DPA(C22 : 5、n-6或n-3)、ARA(C20 : 4、n-6)、GLA(C18 : 3、n-6)、ALA(C18 : 3, n-3),及/或 l5 SDA(C18 · 4,n-3)),較佳為,一或多種長鏈脂肪酸 (LCPUFAs),包括,但不侷限於,EpA(C2〇 : 5,n_3)、 DHA(C22 · 6, n-3)、DPA(C22 : 5, n-6或n-3)或DTA(C22 : 4, n-6)。在一特佳實施例中,本發明經基因修飾之植物係製造 一或多種多不飽和脂肪酸,包括,但不侷限於,EpA(C2〇 : 20 5, η·3)、DHA(C22 ·· 6, n-3),及/或 DpA(C22 : 5, n-^n-3)。 因此,本發明之一實施例係相關於一種植物,較佳為 -油類種子植物,其中難物係製造(如於其成熟種子中, 若為一油類種子植物,或於油類種子植物之種子之油類)至 少一PUFA(標的PUFA),且其中該植物或可堆積pUFA之植 133 200813222 物部分之總脂肪酸分佈(如於其成熟種子中,若為一油類種 子植物,或於油類種子植物之種子之油類),包含一可偵測 ϊ之此PUFA或PUFA。較佳為,該標的puFA為至少加個 碳之PUFA,並包含至少3個雙鍵,更佳至少4個雙鍵,尤佳 5為,至少5個雙鍵。此外,該標的PUFA較佳為一 PUFA,其 非天然地由該植物製造(即,缺乏該基因修飾之野生型植 物,或作為基因修飾接受者之植物母株)。較佳為,該植物 或可堆積PUFA之植物部分之總脂肪酸分佈(包括該植物之 種子油類)係包含至少約0.1%之標的PUFA,佔總脂肪酸之 10重量,較佳至少約〇·2%,更佳至少約〇3%,尤佳至少約 〇·4%,更佳至少約0.5%,更佳至少約1%,更佳至少約i 5%, 更佳至少約2 %,更佳至少約2·5%,更佳至少約3%,更佳 至少約3.5%,更佳至少約4%,更佳至少約4.5%,更佳至少 約5%,更佳至少約5.5%,更佳至少約10%,更佳至少約 15 15%,更佳至少約20%,更佳至少約25%,更佳至少約3〇〇/。, 更佳至少約35%,更佳至少約40%,更佳至少約45%,更佳 至少約50%,更佳至少約55%,更佳至少約60%,更佳至少 約65%,更佳至少約70%,更佳至少約75%,更佳至少約75%
之至少一多不飽和脂肪酸(標的PUFA或PUFA),佔該植物製 20 造之總脂肪酸重量,或自0.1%至75%之任一百分比,或大 於75%(至多1〇〇〇/0或約1〇〇〇/0),以〇·ι〇/0增加量,之標的 PUFA。如此一般所述,製造之puFA百分比係以該生物體(植 物)製造之總脂肪酸之重量為基準,除非另有指出(如在某些 情況下,百分之重係相對於由該酵素複合體,如PUFAPKS 134 200813222 系統,製造之總脂肪酸)。在一實施例中,由該植物製造之 總脂肪酸係以重量百分比表示,係以氣相層析法分析脂肪 酸曱酯(FAME)製備物,雖然總脂肪酸之決定並不受限於此 方法。 如上所述,由上述植物(及/或植物部分或種子油類分液) 製造之總脂肪酸之其他特徵為,這些由該植物製造之總脂 肪酸包含小於(或不含任何大於)約1〇%重之任_脂肪酸,伊 的PUFA除外,其係由製造標的PUFA之酵素複合體製 造。較佳為,由製造標的PUFA之酵素趨合體 10 15 20 …一殿I造之脂肪 Μ如為該植物經製造標的PUFA之酵素或酵素複合體美因 修飾之結果),標的PUFA除外,存在量係小於約9〇/〇,土因 小於約8%,尤佳小於約7%,特佳小於約6% 更佳 m ϋ小於約 更佳小於約4%,更佳小於約3%,更佳小於約2%, 仏小於約1%重之該植物製造之總脂肪酸。 更 在另一實施例中,該製造標的PUFA之酵素複人—· 之任一脂肪酸,標的PUFA除外,之存在量係小於°體製造 於)約1〇%重之該酵素複合體製造之總脂肪酸t (或不大 於植物中製造標的puFA(即,此測量係限制 體可 PUFA之酵素複合體製造之總脂肪酸),更佳小於良坆軚的 佳小於約8%,特佳小於約7%,更佳小於約6〇/勺9/°,尤 約抓,更佳小於約4%,更佳小於約3%,更佳。1佳小於 更佳小於約1%重之總脂肪酸,且,更佳小=:和%, 總脂肪酸’其由製造標的PUFA之酵素複合體製造·。5%重之 在本發明此實施例之另-觀點中,該由 135 200813222 總脂肪酸(及/或植物部分或種子油類分液)係含有小於(或 不大於)1〇%重PUFA,其具有18或更多個碳,佔該植物製 造之總脂肪酸重量,標的PUFA或野生型(非經基因修飾)植 物,或預定之基因修飾接受者之植物母株存在之PUFA除 5 外。在另一觀點中,由該植物(及/或植物部分或種子油類分 液)製造之總脂肪酸,含有小於約9% PUFA,其具有18或更 多個碳,或小於8% PUFA,其具有18或更多個碳,或小於 7% PUFA,其具有18或更多個碳,或小於6% PUFA,其具 有18或更多個碳,或小於5% PUFA,其具有18或更多個碳, 10或小於4% PUFA,其具有18或更多個碳,或小於3〇/。PUFA, 其具有18或更多個碳,或小於2% PUFA,其具有18或更多 個碳,或小於1% PUFA,其具有18或更多個碳,重之總脂 肪酸,由該植物製造,標的PUFA或野生型(非經基因修飾) 植物,或預定之基因修飾接受者之植物母株存在之PUFA除 15 外。 在本發明此實施例之另一觀點中,由該植物(及/或植物 部分或種子油類分液)製造之總脂肪酸含有小於(或不大 於)10% PUFA,其具有20或更多個碳,重之總脂肪酸,由 該植物製造,標的PUFA或野生型(非經基因修飾)植物,或 20預定之基因修飾接受者之植物母株存在之PUFA除外。在另 一觀點中,由該植物(及/或植物部分或種子油類分液)製造 之總脂肪酸含有小於(或不大於)9% PUFA,其具有20或更多 個碳,或小於8% PUFA,其具有2〇或更多個碳,或小於7% PUFA,其具有20或更多個碳,或小於6。/。PUFA,其具有20 136 200813222 或更多個碳,或小於5% PUFA,其具有20或更多個碳,或 小於4% PUFA ’其具有20或更多個碳,或小於3% PUFA, 其具有20或更多個碳,或小於2% PUFA,其具有20或更多 個碳,或小於1% PUFA,其具有20或更多個碳,重之總脂 5 肪酸,由該植物製造,標的PUFA或野生型(非經基因修飾) 植物,或預定之基因修飾接受者之植物母株存在之PUFA除 外。 在一實施例中,由該植物(及/或植物部分或種子油類分 液)製造之總脂肪酸含有小於(或不大於)10%重之由該植物 10 製造之總脂肪酸,更佳小於約9%,更佳小於約8%,更佳 小於約7% ’更佳小於約6%,更佳小於約5%,更佳小於約 4%,更佳小於約3%,更佳小於約2%,更佳小於約1%之脂 肪酸,選自於下列任一或更多者:γ-次亞麻油酸(GLA ; 18 : 3,η-6);十八碳四烯酸(stearidonic acid)(STA或SDA ; 18 : 15 4, n-3);二南次亞麻油酸(DGLA或HGLA ; 20 : 3, η·6)、 花生四烯酸(ARA,C20 : 4, η_6);二十碳三稀酸(ETA ; 20 : 3, n-9)與各種其他脂肪酸,如20: 0; 20: 1(Δ5); 20: l(All); 20 : 2(Δ8,11) ; 20 : 2(Δ11,14) ; 20 : 3(Δ5,11,14) ; 20 : 3(Δ11,14,17);蜂蜜酸(20: 3; Δ5,8,11);或20:4(Δ5,1,14,17)。 20 在另一實施例中,於該植物中製造長鏈PUFA之酵素 系統製造之脂肪酸,含有小於約10%重之脂肪酸,選自:γ-次亞麻油酸(GLA; 18: 3,n_6);十八碳四烯酸(STA或SDA ; 18 : 4, n-3);二高个次亞麻油酸(DGLA 或 HGLA ; 20 : 3, η·6)、花生四烯酸(ARA,C20 : 4, n-6);二十碳三烯酸(ETA ; 137 200813222 20 : 3, n-9)與各種其他脂肪酸,如20 : 0 ; 20 : 1(Δ5) ; 20 : 1(A11) ; 20 : 2(A8,11) ; 20 : 2(Δ11,14) ; 20 : 3(A5,11,14); 20 : 3(Δ11,14,17);蜂蜜酸(20 : 3 ; Δ5,8,11);或 20 : 4(八5,1,14,17),佔該植物製造之總脂肪酸百分比較佳小於約 5 9%,更佳小於約8%,尤佳小於約7%,特佳小於約6%,更 佳小於約5%,更佳小於約4%,’更佳小於約3%,更佳小於 約2%,更佳小於約1%之脂肪酸,選自於:γ-次亞麻油酸 (GLA; 18: 3,n_6);十八碳四烯酸(STA或SDA; 18:4,η-3); 二高个次亞麻油酸(DGLA或HGLA ; 20 : 3, η-6)、花生四烯 10 酸(ARA,C20 : 4, η·6);二十碳三烯酸(ΕΤΑ ; 20 : 3, η_9)與 各種其他脂肪酸,如20 : 〇 ; 20 : 1(Δ5) ; 20 : 1(Δ11) ; 20 : 2(Δ8,11); 20: 2(Δ11,14); 20: 3(Δ5,11,14); 20: 3(Δ11,14,17); 蜂蜜酸(20 : 3 ; Δ5,8,11);或20 : 4(Δ5,1,14,17)。 在另一實施例中,於該植物中製造長鏈PUFA之酵素 15 系統製造之脂肪酸,含有小於約10%重之脂肪酸之下列所 有PUFA,選自:γ-次亞麻油酸(GLA ; 18 : 3,η-6),具有18 個碳與4個碳-碳雙鍵之PUFA,具有20個碳與3個碳-碳雙鍵 之PUFA,以及具有22個碳與2或3個碳-碳雙鍵之PUFA,佔 該植物製造之總脂肪酸百分比,較佳小於約9%,更佳小於 20約8%,尤佳小於約7%,特佳小於約6%,更佳小於約5%, 更佳小於約4%,,更佳小於約3%,更佳小於約2%,更佳小 於約1%之下列所有PUFA : γ·次亞麻油酸(GLA ; 18 : 3, η_6),具有18個碳與4個碳-碳雙鍵之PUFA,具有20個碳與3 個碳-碳雙鍵之PUFA,具有22個碳與2或3個碳碳雙鍵之 138 200813222 PUFA。 在另一實施例中,於該植物中製造長鏈PUFA之酵素 系統製造之脂肪酸,含有小於約1〇%重之脂肪酸之下列所 有PUFA,選自:次亞麻油酸(GLA ; 18 : 3, n-6),具有18 5個碳與4個碳-碳雙鍵之PUFA,具有20個碳與3個碳_碳雙鍵 之PUFA,具有22個碳與2或3個碳-碳雙鍵之PUFA,佔該植 物製造之總脂肪酸百分比,較佳小於約9%,更佳約小於 8/〇 ’尤仏約小於7°/◦’特佳約小於6%,更佳約小於,更 佳約小於4%,更佳約小於3%,更佳約小於2%,更佳約小 10於1%之下列PUFA之每一者:次亞麻油酸(GLA ; 18 : 3, n-6) ’具有18個碳與4個碳碳雙鍵之PUFA,具有2〇個碳與3 個碳-碳雙鍵之PUFA,具有22個碳與2或3個碳_碳雙鍵之 PUFA。 於該植物中製造長鏈PUFA之酵素系統製造之脂肪 15酸,含有小於約10%重之脂肪酸之下列任一 PUFA,選自:γ-次亞麻油酸(GLA ; 18 : 3,η-6),具有18個碳與4個碳-碳雙 鍵之PUFA,具有20個碳與3個碳-碳雙鍵之PUFA,具有22 個碳與2或3個碳-碳雙鍵之PUFA,佔該植物製造之總脂肪 酸百分比,較佳小於約9%,更佳約小於8%,尤佳約小於 20 7%,特佳約小於6%,更佳約小於5%,更佳約小於4%,更 佳約小於3%,更佳約小於2%,更佳約小於1%之下列pUFA 之一或多者:γ-次亞麻油酸(GLA ; 18 : 3, η-6),具有18個 碳與4個碳-碳雙鍵之PUFA,具有2〇個碳與3個碳·碳雙鍵之 PUFA ’具有22個碳與2或3個碳_碳雙鍵之pufa。 139 200813222 在本發明實施例之一觀點中,該植物製造至少二標的 PUFA,且該植物或堆積puFA之植物部分(包括油類種子之 油)之總脂肪酸,包含可偵測量之這些PUFA。在此實施例 中,該PUFA較佳每一者至少為20個碳之PUFA,並包含至 5 少3個雙鍵,更佳至少4個雙鍵,尤佳至少5個雙鍵。此PUFA 較佳係選自DHA、DPAn-6與EPA。在一觀點中,該植物係 製造DHA與DPAn-6,DHA比DPAn-6之比例為約1 : 10至約 10 : 1,包括之間之任一比例。在一實施例中,DHA比DPA 之比例為約1 : 1至約3 : 1,在另一實施例中約2.5 : 1。在 10 一實施例中,該植物係製造DHA與EPA。 在本發明此實施例之另一觀點中,該植物製造之總脂 肪酸分佈,係由第13圖或第14圖表示。 本發明更包括任一由此述植物製造之種子,以及該由 植物或此述種子製造之油類。本發明亦包括使用此植物、 15 種子或此述油類製造之任一產物。 主璧igg經基因修飾之4物艚之传用 本發明之一實施例為一製造所希望之生物活性分子之 方法(亦稱之為產物或化合物),藉由成長或培養本發明之經 基口修都生物體(如一微生物體或一植物)(如上所述)。較佳 2〇為’該生物活性分子為pUFA,較佳為LCPUFA。較佳為, 該經基因修飾生物體為一經基因修飾微生物體或一經基因 修飾植物。此方法包括,例如,分別於發酵培養基中培養 或於適當環境下,如土壤,成長該微生物體或植物之步驟, "亥生物體具有前述之基因修飾,如本發明所述。用於基因 140 200813222 G飾之較佳宿主細胞與生物體,其相關於本發明之pUFA PKS系統,係如上所述。 本t明之一實施例為一種藉由培養本發明經基因修飾 被生物體而製造希望之PUFA之方法(如上所述)。此方法包 5括在發酵培養基與可有效於該微生物體中,其具有上述並 與本發明一致之基因修飾,製造PUFA條件下培養之步 驟。一適當或有效之培養基係指任一培養基,其中本發明 之一經基因修飾之微生物體,當培養時,可製造所希望之 PUFA產物。此培養基一般為一水溶液培養基,包含可吸 1〇收之碳、氮與磷來源。此培養基亦可包括適當之鹽類、礦 物夤、金屬與其他營養物。本發明之任一微生物體可培養 於一般發酵用生物反應器中。該微生物體可培養於任一發 酵流程中,其包括,但不侷限於,批次、進料批次、細胞 再擔環與連續式發酵。本發明較佳之破囊壺菌 15 (thraustochytrid)微生物體生長條件為技術上已知,並詳細 描述於如美國專利號5,130,242、美國專利號5,340,742與美 國專利號5,698,244,在此併入本案以作為參考資料。 由該經基因修飾微生物體製造之所希望之PUFA,及/ 或其他生物活性分子,可回收自發酵培養基,使用一般分 20 離與純化技術。例如,該發酵培養基可經過濾或離心,以 移除微生物體、細胞殘骸與其他特殊物質,且該產物可以 一般方法移除自不含細胞之上清液,如,離子交換法、層 析法、萃取、溶劑萃取、相分離、膜分離、電透析、逆向 滲透、蒸餾、化學衍生法與結晶法。此外,製造pUFA之微 141 200813222 生物體或其萃取物與各分液 產物之微生物體成分。 可直接使用,而不需移除該 曰較佳為’ PUFA之製造量係大於約5%微生物體乾燥重 里,且在一觀點中,其量係大於約6%, 中,其量大於約9%,在另一觀點中,其量大於約ι〇%,以 此類推,佔整體百分比至多大於慨微生物體賴重量(如 15〇/。、20%、30%、40%、5〇%,及介於其間之任一百分比)。 較佳為,有興趣之生物活性化合物係由該經基因修飾 10之微生物體製造,其量大於約0 〇5%,較佳大於約〇 1%,更 佳大於約0.25%,尤佳大於約〇·5%,特佳大於約〇 75%, 更佳大於約1%,更佳大於約2·5%,更佳大於約5%,更佳 大於約10/〇,更佳大於約15%,尤佳大於約2〇%之微生物 體乾燥重量。就脂質化合物而言,較佳為,此化合物之製 15 &里係大於約5%之微生物體乾燥重量。就其他生物活性化 合物而言,如抗生素或以較小量合成之化合物,這些殖株 具有此化類合物,其佔微生物體乾燥重量之百分比,係經 辨識出,預測含有上述種類之新穎PKS系統。在某些實施 例中,特定之生物活性分子(化合物)係由該微生物體分泌, 2〇而非堆積。因此,此生物活性分子一般係回收自培養基中, 且其製造之分子濃度將取決於該微生物體與培養之規模。 在本發明之一製造所希望生物活性化合物之方法中, 經基因修飾之植物係培養於發酵培養基,或於適當環境 下,如土壤中成長。一適當或有效之發酵培養基係如上述。 142 200813222 用於高等植物之適當成長培養基包括,但不侷限於,土壤、 沙質、任一其他可支撐根部生長之培養基(如虫至石 (vermiculite)、珍珠岩(perlite)等)或水栽培養,以及適當之 光線、水與營養補充物,其可使較高等植物生長最佳化。 5 本發明經基因修飾之植物係經改造,以製造大量之希望產 物,經由PUFAPKS系統之活性,與本發明其他異源性蛋白 質(PUFA PKS系統之附屬蛋白)。該化合物可經由純化過程 回收’其可自該植物萃取出化合物。在一較佳實施例中, 該化合物係以收稽該植物而回收。在此實施例中,該植物 10可於其自然狀態下被消耗,或更進一步處理成可消耗產物。 本發明更包括任一此述生物體或其部分(如微生物體 與其製劑或为液,或植物、植物部分(如油類種子),或直製 劑或分液),以及由此述生物體製造之任一油類。本發明亦 包括任一產物,使用該生物體、其部分或此述之油類製造。 15 本發明之一實施例係相關於一種修飾含有至少一脂肪 酸之產物之方法,包含加入一生物體、其部分,或由本發 明與此述之經基因修飾生物體(如一植物或微生物體,其經 PUFAPKS系統基因修飾,使用此述製造及/或堆積puFA之 增進策略’並具有此述之脂肪酸分佈)製造之_至該產物 中。由此方法製造之產物,或一般包含此述任一生物體、 其部分或得自該生物體之油類,亦包含於本發明中。 較佳為,該產物係選自於由食物、飲食補充品、醫藥 配方、人源化動物乳與嬰兒配方乳組成之族群。適當之醫 藥配方包括,但不偈限於,抗發炎配方、化療試劑、活性 143 200813222 賦形劑、骨質疏鬆藥物、抗憂鬱劑、抗瘦擎劑、抗幽門桿 菌藥物'治療神經退化疾病藥物、治療退化性肝病之藥物二 抗生素、與膽固醇降低配方。在—實施例中,該產物係用 於治療-病症,選自於由:慢性發炎、急性發炎、腸胃疾 5病、癌症、惡病質、心臟再狹窄、神經退化疾病、退化性 肝病丄血脂病、骨質疏鬆症、骨關節炎、自體免疫疾病、 子痛前症、早產、老年黃斑病變、肺部疾病,以及過氧化 體病變組成之族群。 適當之食物產品包括,但不侷限於,培烤製品、麵包、 10早餐麥片、加工或未加工乳酪、調味料(蕃茄醬、美乃茲等)、 乳製品(牛乳、優格)、布丁與果;東甜點、碳酸飲料、茶、粉 末飲品混合物、加工魚製品、水果基底飲料、口香糖、硬 糕餅、冷絲製品、加工肉類、堅果與堅果基底抹醬、麵 團、加工家禽類產品、肉汁與醬汁、洋字片或其他薄片或 15油炸洋芋片、巧克力與其他糖果、湯類與湯類混合物、大 豆基底產品(豆乳、飲料、奶油、增白劑)、蔬菜油基底抹醬, 與蔬菜油基底飲料。 一般定義輿準則 依據本發明,分離出之蛋白質為一蛋白質或其片段(包 20括多胜肽或胜肽)’其移自天然環境(即經由人為操作),並 可包含經純化之蛋白質、部分純化之蛋白質、重組製造之 蛋白質’與合成製造之蛋白質,舉例而言。因此,”分離,, it非延伸為該蛋白質經純化。較佳為,本發明之一分離出 之蛋白質係重組製造。分離出之胜肽可合成製造(如化學 144 200813222 性,如藉由胜肽合成)或重組性。 使用於此,術語“脂質”包括磷脂質;自由脂肪酸;脂 肪酸之自旨類,二醯基甘油,一醯基甘油g旨;單醯基甘油g旨; 溶血構脂質;皂類;填脂;躐(醇類與脂肪酸之酯類);固醇 5與固醇酯;類胡蘿蔔素;葉黃素(如含氧類胡蘿蔔素);碳水 化合物,與其他技術上已知之脂質。術語,,多不飽和脂肪 酸’’與”PUFA”不僅包括自由脂肪酸形式,亦包括其他形 式,如TAG形式與PL形式。 特定生物體之特定蛋白質或衍生自特定生物體之蛋白 10 質,如’’裂殖壺菌(Schizochytrium)ACoAS”或,,衍生自裂殖 壺菌(Schizochytrium)之ACoAS ’’,舉例而言,係指一來自 裂殖壺菌(Schizochytrium)之ACoAS(包括天然發生之 ACoAS之同源物),或由來自裂殖壺菌(Schizochytrium)天然 發生之ACoAS已知結構資訊(如序列)產生之ACoAS。換句 15 話說,裂殖壺菌(Schizochytrium)ACoAS包括任一 ACoAS ’其具有裂殖壺菌(Schizochytrium)天然發生之 ACoAS之#構與功能,或具有類似於裂殖壺菌 (Schizochytrium)ACoAS類似之結構與功能,使得ACoAS為 生物活性(即’具有生物活性)裂殖壺菌(Schizochytrium)天 2〇然發生之ACoAS同源物。如此,裂殖壺菌 (Schizochytriiim)ACoAS可包括經純化、部分純化、重組、 突變/修飾與合成之蛋白質。 依據本發明’術語”修錦”與,,突變”可互相交換使用,尤 其是此述之蛋白質或胜肽之一級胺基酸序列(或核酸序列) 145 200813222 之修飾/突變。術語,,修询”亦可用於描述蛋白質或胜狀之轉 譯後修飾,包括,值不侷限於,甲基化、法呢燒基化 (farnesylati〇n)、羧基甲基化、香葉醇香葉醇化(geranyi gemnylaticm)、醣化、磷酸化、乙醯基化、十四醯基化、異 5戊二烯化、十六醯基化,及/或醯胺基化。修飾亦可包括, 如,錯合一蛋白質或胜肽與另一化合物。此種修飾可視為 一種突變,如,若修飾不同於天然、野生型蛋白質或胜肽 之轉譯後修錦。 使用於此,術語,,同源物”係指一蛋白質或胜肽,其不 10同於天然發生之蛋白質或胜肽(即,”原型”或,,野生型”蛋白 質),經一或多種次要修飾,或天然發生之蛋白質或胜肽產 生突變,但其維持天然發生形式之總體基礎蛋白質與側鏈 結構(即,該同源物可辨識出與野生型蛋白質相關)。此改變 包括,但不侷限於:一或某些(如1%或更少)胺基酸側鏈之 15改變;一或某些(如丨%或更少)胺基酸之改變,包括剔除(如 該蛋白質或胜肽之截斷形式)、插入及/或取代;一或某些(如 1%或更少)原子之空間結構改變;及/或次要衍生,包括, 但不偏限於·甲基化、法呢燒基化(farneSylati〇n)、羧基甲 基化、香葉醇香葉醇化(geranyl geranylation)、化、填酸 20化、乙醯基化、十四醯基化、異戊二烯化、十六醯基化, 及/或&&胺基化。同源物可具有與天然發生蛋白質或胜肽增 強、減少或實質上類似之性質。較佳之蛋白質同源物係如 下所述。值得注意的是,同源物可包括合成製造之同源物、 蛋白質或其區塊之天然發生等位變異物,或來自一生物體 146 200813222 之類似序列,S生物體並非來自參考序列衍生之生物體。 保守性取代-般包括下列族群之取代:甘胺酸與丙胺 酸;纈胺酸、異亮胺酸與亮胺酸;天門冬胺酸、麩胺酸、 精胺酸,與麩胺酸鹽;絲胺酸與蘇胺酸、離胺酸與精胺酸; 5苯丙胺酸與酪胺酸。取代亦可產生於保守疏水性或親水性 基礎上(Kyte and Doolittle,J· Mol. Biol. 157 : 105(1982)), 或假設類似多胜肽二級結構之基礎上(Ch〇u and Fasman,
Adv· Enzymol· 47 : 45(1978)) ° 同源物可為天然等位變異物或天然突變之結果。編碼 10 一蛋白質之核酸之天然發生等位變異物為一基因,其發生 於基因體之實質上相同位點(或位點群),該基因係編碼此蛋 白夤,但由於,如突變或重組導致之天然變異,而具有類 似但不元全相等之序列。等位變異物一般係編碼具有類似 活性之蛋白質,與待比較之基因編碼之蛋白質相較。等位 15纟交異物之一群可編碼相同之蛋白質,但具有不同之核酸序 列,係由於基因密碼子退化演繹而得。等位變異物亦可包 含在该基因5或3’端未轉譯區域改變(如調節控制區域)。等 位變異物為技術上已知。 同源物可使用_般已知製造蛋白質之技術製造,包 2〇括,但不侷限於,分離、天然發生之蛋白質、直接蛋白質 合成,或修飾編碼該蛋白質之核酸序列,例如,典型或重 組DNA技術,以完成隨機或標的突變。 蛋白質同源物之修飾與突變,與野生型蛋白質相較, 可增加、降低或非實質上改變該同源物之基礎生物活性, 147 200813222
與天然發生(野生型)蛋白質相較。一般而言,一蛋白質之生 物活性或生物作用係指該蛋白質具有或表現之任一功能, 為▲蛋白質之天然發生形式,於體内測量或觀察(即該蛋白 質之天然生理環境),或體外(即在實驗室條件下)。puFA 5 PKS系統之生物活性與各蛋白質/區塊,其組成柯从PKS 系統,已於本文別處與參考專利與申請案中詳細描述。 ACoAS之生物活性包括結合至受質,本發明較佳為,puFA 之自由脂肪酸(FFA),並催化FFA轉換為醯基_c〇ApuFA。 蛋白質之修飾,如同源物,可產生具有類似活性之蛋 10白質,與天然發生之蛋白質相較,或具有降低或增加生物 活性之蛋白質,與天然發生之蛋白質相較。導致蛋白質表 現降低或蛋白質活性降低之修飾,可稱之為一蛋白質之失 活(元全或部分)、降低調節,或降低作用(或活性)。類似地, 導致蛋白質表現增加或蛋白質活性增加之修飾,可稱之為 15 -蛋白質之倍增、過度製造、活化、強化、加強調節或增 加作用(或活性)。值得注意的是,一般稱之為具野生型蛋 白質生物活性之同源物,並非具有與野生型蛋白質相等生 物活性之同源物,尤其是在生物活性方面。此外,同源物 可展現與野生型蛋白質相同之生物活性,但降低或增加活 20性量,與野生型蛋白質相較。蛋白質之功能性區塊為一區 塊(即-區塊可為蛋白質之一部分),其可展現生物活性 (即’具有生物活性)。
偵測蛋白質或測量蛋白質活性之方法包括,但不侷限 於,測量蛋白質之轉錄、測量蛋白質之轉譯、測量蛋白J 148 200813222 之轉譯後修飾、測量蛋白質之酵素活性,及/或測量由該蛋 白質活性產生之產物製造(如PUFA之製造)。值得注意的 是,本發明分離出之蛋白質(包括同源物)並非必須具有野生 型蛋白質之生物活性。例如,一蛋白質可為截斷、突變或 5 失活之蛋白質,舉例而言。此蛋白質可用於篩選試驗,舉 例而言,或用於其他目的,如抗體製造。在一較佳實施例 中,本發明分離出之蛋白質具有一生物活性,類似於野生 型蛋白質(雖然並非等價,如上所述)。 測量蛋白質表現量之方法一般包括,但不侷限於:西 10 方墨潰法、免疫浸潰法、酵素-連結免疫吸附試驗(ELISA)、 放射免疫試驗(RIA)、免疫沈澱、表面等離子共振、化學放 光、螢光極化、磷光、免疫組織分析、基質輔助雷射脫附/ 離子化飛行時間(MALDI-TOF)質譜法、微細胞儀、微陣列、 顯微鏡、螢光活化細胞分類儀(FACS),以及流式細胞儀, 15 以及以蛋白質性質為基礎之試,包括,但不侷限於,酵素 活性或與其他結合蛋白質之作用。結合試驗亦為技術上已 知。例如,BIAcore機器可用於決定二蛋白質間之錯合常 數。錯合物之解離常數可以監測反射率隨著時間之改變, 當緩衝液通過該晶片而決定(〇fShannessy et al. Anal. 20 Biochem. 212 . 457(1993) ; Schuster et al.5 Nature 365 : 343(1993))。其他適用於測量一蛋白質與另一者之結合之試 驗包括,如,免疫試驗,如酵素連結免疫吸附試驗(elisa) 與放射免疫試驗(RIA);或以監測蛋白質之光譜或光學性質 改變而決定結合,經由螢光、UV吸收、圓二偏極光,或核 149 200813222 磁共振(NMR)。 在本發明之一觀點中,本發明包含之一蛋白質,包括 此述特定蛋白質之同源物,係包含一胺基酸序列,其包括 參考蛋白質之胺基酸序列之至少約100個連續胺基酸,其中 5 同源物之胺基酸序列具有此述蛋白質之生物活性。在另一 觀點中,該蛋白質之胺基酸序列包含至少200個連續胺基 酸,更佳為至少300個連續胺基酸,尤佳至少400個連續胺 基酸,並可包括參考蛋白質胺基酸序列之500個連續胺基 酸,至多為蛋白質全長,包括以整數方式增加(如200、2CU、 10 202 、 203等)。 依據本發明,術語“接續,,或“連續,,,就此述核酸或胺 基酸序列而言,係指相連未間斷之序列。例如,就包含第 二序列30個接續(或連續)胺基酸之第一序列而言,係指該第 一序列包括一未間段之30胺基酸殘基之序列,其與第二序 15 列之30個未間斷胺基酸序列100%相等。類似地,就與第二 序列具有”100%相等度,,之第一序列而言,係指該第一序列 完全匹配該第二序列,在核苦酸或胺基酸間不會有空格。 一般而言,參考蛋白質之同源物,如如此述之ACoAS 蛋白質,具有一胺基酸序列,其至少約50%相等,較佳至 20 少約55%相等,更佳至少約60%相等,更佳至少約65%相 等,更佳至少約70%相等,更佳至少約75%相等,更佳至少 約80%相等,更佳至少約85%相等,更佳至少約9〇%相等, 更佳至少約95%相等,更佳至少約96%相等,更佳至少約 97%相等,更佳至少約98%相等,更佳至少約99%相等(或任 150 200813222 一介於60%至99%之間之百分比,以一個百分比方式增加) 於參考蛋白質(如ACoAS蛋白質)之胺基酸序列。該同源物 較佳具有其衍生或相關之蛋白質或區塊之生物活性(即,該 蛋白質或區塊具有參考胺基酸序列)。就ACoAS同源物而 5 言,該同源物較佳具有ACoAS酵素活性,更佳為,催化長 鏈PUFA自由脂肪酸(FFA)轉換為醯基-CoA之能力。就此述 之其他附屬蛋白而言,此蛋白質可具有生物活性,如,利 用PUFA-CoA作為受質形成PL或TAG。 使用於此,除非另有指出,百分比(%)相似度係指類似 10 性之評估,其使用:(l)a BLAST 2.0 Basic BLAST類似性 搜尋,使用blastp於胺基酸搜尋、blastn於核酸搜尋,以及 blastX於核酸搜尋,並以6種所有開放閱讀框架搜尋轉譯之 胺基酸,所有皆使用標準預設參數,其中該要求序列係經 預設低複雜度區域過濾(described in Altschul,S.F·,Madden, 15 T.L·,ScM注ffer,A.A·,Zhang,J·,Zhang,Z·,Miller,W· &
Lipman,D.J.(1997)”Gapped BLAST and PSI-BLAST : a new generation of protein database search programs.,,Nuclear Acids Res· 25 : 3389,在此併入本案以作為參考資料);(2)a BLAST 2比對(使用下述參數);(3)及/或PSI-BLAST,具 20 有標準預設參數(Position-Specific Iterated BLAST)。值得注 意的是由於BLAST 2.0 Basic BLAST與BLAST 2間標準參 數之不同,二特定序列可辨識為具有明顯相似度,使用 BLAST 2程式,而 BLAST 2.0 Basic BLAST 上進行之搜 尋,使用一序列作為要求序列,可能無法辨識上方匹配之 151 200813222 第二序列。此外,PSI-BLAST係提供一種自動化、容易使 用之π分佈’’搜尋版本,其具有尋找序列同源物之高感度。 該程式首先呈現一有裂口(gapped)之BLAST資料庫搜尋。 PSI-BLAST程式係使用來自任一明顯比對之資訊,轉為建 5 構一位置-特異性積分矩陣,其取代下一回合資料搜尋之要 求序列。因此,可瞭解到該百分比相似度可使用任一這些 程式決定。 二特定序列可互相比對,使用BLAST2序列,如同描 述於Tatusova and Madden, ’’Blast 2 sequences - a new tool 10 for comparing protein and nucleotide sequences f?? FEMS Microbiol Lett· 174 : 247(1999),在此併入本案以作為參考 資料。BLAST 2序列比對係以blastp或blastn進行,使用 BLAST 2.0演算法,進行二序列間之Gapped BLAST搜尋 (BLAST 2.0),允許在所得比對中引入缺口(刪除與插入)。 15 就此述目的而言,BLAST 2序列比對係使用如下標準預設 參數進行。 就blastn而言,使用〇BLOSUM62矩陣: 匹配報酬=1 2〇 錯位罰分=-2 開放缺口(5)與延伸缺口(2)罰分 gap x_drop〇ff(5Q)expect( 10)word size(l l)filter(on) 就blastp而言,使用〇bl〇SUM62矩陣: 開放缺口(11)與延伸缺口(1)罰分 152 200813222 gap x_dropoff(50)expect( 10)word size(3)filter(on) o 在本發明之一實施例中,本發明分離出之蛋白質或區 塊包含下列胺基酸序列、實質上由下列胺基酸序列組成, 5 或由下列胺基酸序列組成,該序列描述於美國專利 6,566,583 ; Metz et al·,Science 293 : 290-293(2001);美國 專利申請案公開號20020194641 ;美國專利申請案公開號 20040235127;美國專利申請案公開號20050100995;以及 美國暫時申請案號60/689,167,於2005年6月10日提申,或 10 其任一生物活性片段或區塊。這些蛋白質為PUFAPKS系統 之蛋白質’並可用於與此述之任一附屬蛋白連結。 在本發明之另一實施例中,具有此述蛋白質(如ACoAS 蛋白質)生物活性之胺基酸序列,包括一胺基酸序列,其足 以類似於天然發生之蛋白質或多胜肽,其於此特別描述, 15編碼該胺基酸序列之核酸序列可於中度、高度或非常高嚴 可條件下(描述如下),雜合至(即與)一核酸分子,其編碼天 然發生之蛋白質或多胜肽(即,雜合至編碼天然發生之蛋白 貝或多胜肽之核酸互補股)。較佳為,具有此述蛋白質生物 活I*生之胺基酸序列,係由一核酸序列編碼,其可於中度、 20向度或非常高嚴苛條件下,雜合至此述之任一核酸分子。 演繹一互補序列之方法為技術上已知。應注意的是,由於 胺基酸定序與核酸定序技術並非完全無錯誤,該序列示於 此’最佳為’代表本發明包含之蛋白質之原始序列。 使用於此,雜合條件係指標準雜合條件,其中核酸分 153 200813222 子係用於辨識類似之核酸分子。此標準條件係揭示於,如 Sambrook et al.? Molecular Cloning : A Laboratory Manual,
Cold Spring Harbor Labs Press(1989)。Sambrook et al·, ibid.,在此併入本案以作為參考資料(請見第9·31-9 62頁)。 5 此外,計算適當雜合與清洗條件以達到雜合,其允許各種 核普酸錯位’之公式係揭示於,如Meinkoth et al.,And
Biochem· 138, 267(1984) ; Meinkoth et al·,ibid·,在此併入 本案以作為參考資料。
更特別的是’中度嚴苛雜合與清洗條件,如此所述, 1〇係指一條件,其允許分離出與用於雜合反應用探針之核酸 分子至少約70%核酸序列等同度之分子(即,該條件允許約 30%或更少之核苷酸錯位)。高度嚴苛雜合與清洗條件,如 此所述,係指一條件,其允許分離出與用於雜合反應用探 針之核酸分子至少約80%核酸序列等同度之分子(即,該條 15件允許約20%或更少之核苷酸錯位)。非常高度嚴苛雜合與 清洗條件,如此所述,係指一條件,其允許分離出與用於 雜合反應用探針之核酸分子至少約9〇〇/〇核酸序列等同度之 分子(即,該條件允許約1〇%或更少之核苷酸錯位)。如上所 述’此技術領域者可使用Meinkothetal.,ibid.之公式計算 2〇適S之雜合與清洗條件,以達到這些特定之核苷酸錯位 里。此條件將依據進行之雜合種類為DNA : RNA或DNA : DNA而不同。DNA : DNA雜合物之熔融溫度計算值為 iMC,小於DNA: RNA雜合物所使用者。在特定實施例 中,用於dna:dna雜合物之嚴苛雜合條件包括k6XSSC 154 200813222 之離子強度(0.9MNa+),溫度介於約20°C至約35°C之間(較 低嚴苛度)’更佳為,介於約28°C至約40°C之間(較嚴苛), 尤佳為,介於約35°C至約45°C(更嚴苛),下雜合,配合適 當清洗條件。在特定實施例中,用於DNA : RNA雜合物之 5嚴苛雜合條件包括於6X SSC之離子強度(0.9 MNa+),溫度
介於約30°C至約45°C之間,更佳為,介於約38°C至約50°C 之間,尤佳為,介於45。^至約55。〇之間,配合類似之嚴苛 清洗條件。這些值係以大於約1〇〇個核苷酸之分子之熔融溫 度為基礎計算,〇〇/。甲醯胺與G + c含量約4〇%。此外,τ⑺可 10依據經驗計异,如Sambrook et al.,如上所述,第9.31至9.62 頁。一般而言,清洗條件應盡量嚴苛,且應適用於選擇雜 合條件。例如,雜合條件可包括鹽類之組合,與溫度條件 約低於特疋雜合物Tm 20_25°C,清洗條件—般包括鹽類之 組合,與溫度條件約低於特定雜合物^ i2_2()C)C。適用於 15 DNA.DNA雜合物之雜合條件範例之—包括2_24小時雜合 於6Χ SSC(50%甲醯胺),於約42〇c,之後之清洗步驟包括 一或多次清洗,於室溫下,於約2XSSC中,之後為額外之 清洗,於較高溫度與較⑽子強度下(如至少—次清洗於約 37〇C,約㈣㈣敗中,之後至少-次清洗於約㈣, 20 約 0.1X-0.5X SSC)。 本發明亦包括-融合蛋白質,其包括本發明任一蛋白 質或任-同源物或其片段,連結於一或多種融合片段上。 適用於本發明之融合片段包括,但不偈限於可:增強一蛋 白質之穩定度;提供其他希望之生物活性;及/或幫助蛋白 155 200813222 質純化(如使用親和性管柱)。適當之融合片段可為任一大小 之區塊,其具有適當之功能(如提供增進之穩定性、溶解 度、生物活性;及/或簡化蛋白質之純化)。融合片段可接合 蛋白質之胺基及/或羧基端,並可切割以直接獲得所希望之 5蛋白質。融合蛋白質較佳係由培養經融合核酸分子轉型之 重組細胞而製造,該核酸分子係編碼一蛋白質,其包含一 融合片段,可接合上述本發明蛋白質之羧基及/或胺基端。 在本發明之一實施例中,任一此述之胺基酸序列,以 及此序列之同源物,可製造為至少一,至多約2〇個額外之 10 異源性胺基酸,側接於所提供胺基酸序列之C-及/或ν· 端。所得之蛋白質或多胜肽可稱之為”實質上由,,一特定 胺基酸序列組成。依據本發明,該異源性胺基酸為一胺基 酸序列,其並非自然發現(即,並非於自然界,體内發現) 側接於特定胺基酸序列,或不由側接於編碼基因中特定胺 15 基酸序列天然發生之核酸序列之核苷酸編碼,若此天然發 生序列中使用該生物體之標準密碼子轉譯,衍生出該特定 之胺基酸序列。類似地,術語”實質上由…組成”,當用於 核酸序列時,係指一核酸序列,編碼一特定胺基酸序列, 其可側接至少1至多60個額外異源性核苷酸於編碼該胺基 20 酸序列之核酸序列之5’及/或3’端。異源性核苷酸並非自然 發現(即,並非於自然界,體内發現)側接於特定胺基酸序 列,其發生於天然基因中。 本發明蛋白質或區塊,及/或其片段同源物之最小尺 寸,在一觀點中,該尺寸係足以具有要求之生物活性,或 156 200813222 5 10 15 20 足以作為產生抗體之抗原,或做為體外試驗之—標的。在 一實施例中,本發明之一蛋白質為至少約8個胺基酸長度 (如適用於抗體之表位,或作為試驗令可偵測之胜肽),或至 少約25個胺基酸長度,或至少約5〇個胺基酸長度或至少 約100個胺基酸長度,或至少約15〇個胺基酸長度,或至少 約200個胺基酸長度,或至少約25〇個胺基酸長度,或至少 約300個胺基酸長度,或至少約35帽胺基酸長度,或至少 約400個胺基酸長度,或至少約個胺基酸長度,或至少 約500個胺錢長度,以制_,介於請胺級至最多本 發明蛋白質或區塊全長,或更長,以整數增加(如8' 9、 10、...25、26、…·、則,)。對於蛋白質最大尺寸並無 限制,在實際限制之外,該蛋白質可包括蛋白質之一部分、 區塊或其生物活性或可使用片段,或—全長蛋白質或區 塊’加上&額外之序列(如—融合蛋白質序•騎望的話。 本發明之另—實施例係相關於一種分離之核酸分子, '、上由或由-核酸序列組成,該序列係編碼任— 此、〔之蛋白貝’包括一同源物或任一此蛋白質之片段,以 3全:補之核酸序列。依據本發明,該分離 Γ::子’其移自其天然背景(即,經由人為操作), 為基因體或染色體,其中該核酸分子係於自然 W °因此’ ”分離"並非延伸為該蛋白質經純化,但代 表-亥刀子並不包含完整之基因體或完整之染色體, =分子,然界中發現。分離出之核酸分子可包: 基因…包括-基因之經分離核酸分子,並非包含此基因 157 200813222 之基因體之一片段,但包括與該基因相關之編碼區域以及 調控區域,但無其他基因自然發現於相同染色體上,除了 編碼此述PUFAPKS系統之其他蛋白質之其他基因,當核酸 分子編碼一核心PUFA PKS蛋白質時。一分離出之核酸分 5 子亦可包括一特定核酸序列,侧接(即於該序列之5,及/或 3’端)一額外核酸,其在自然界中並非正常側接該特定核酸 序列(即異源性序列)。分離出之核酸分子可包括DNA、 RNA(如mRNA),或DNA或RNA之衍生物(如cDNA)。雖然 片語”核酸分子”主要係指一物理性核酸分子,片語,,核酸 10 序列’’主要係指該核酸分子上之一核苷酸序列,該二片語 可交換使用,尤其是核酸分子,或核酸序列,可編碼一蛋 白質或蛋白質之一區塊。 較佳為,本發明之一經分離之核酸分子係使用重組 DNA技術製造(如聚合酶連鎖反應(PCR)倍增、選殖)或化 15 學合成。分離之核酸分子包括天然核酸分子與其同源物, 包括,但不侷限於,天然等位變異物與經修飾核酸分子, 其中核苷酸經插入、剔除、取代,及/或倒位,使得此修 飾可提供希望之作用(如維持、增進或降低蛋白質之活性)。 蛋白質同源物(如由核酸同源物編碼之蛋白質)已於上述討 20 論。 核酸分子同源物可使用數種技術上已知之方法製造 (請見,如 Sambrook et al·,Molecular Cloning : A Laboratory Manual,Cold Spring Harbor Labs Press(1989))。例如,核酸 分子可使用各種技術修飾,包括,但不侷限於,典型突變 158 200813222 技術重組DNA技術,如定點突變、化學處理核酸分子以誘 發突變、核酸片段之限制酶切割、核酸片段之黏合反應、 PCR倍增,及/或核酸序列選定區域之突變、募核苷酸混合 物之合成,與混合物族群之接合,以”建構”核酸分子混合 5物及其組合物。核酸分子同源物可選自經修飾核酸之混合 物,藉由篩選蛋白質功能,該蛋白質係由核酸編碼,及/或 與野生型基因雜合。 本發明核酸分子之最小尺寸為足以形成探針或寡核苷 酸引子之尺寸,其可形成穩定之雜合物(如在中度、高度或 10非常高度嚴苛條件下),具有與本發明核酸分子互補之序 列,或该尺寸足以編碼一胺基酸序列,具有本發明蛋白質 之生物活性。如此,編碼此蛋白質之核酸分子大小,係依 據核酸組成物,以及核酸分子與互補序列間類似度或等同 度百分比,並取決於本身之雜合條件(如溫度、鹽類濃度與 15甲醯胺濃度)。使用作為寡核苷酸引子或探針之核酸分子最 小尺寸,一般為至少約12至約15個核苷酸長度,若核酸分 子為富含GC,以及至少約15至約18個鹼基長度,若其富 含AT。除了實際限制外,對於本發明核酸分子之最大尺寸 並無限制,其中該核酸分子可包括一序列,其足以編碼一 20蛋白質之生物活性片段,或蛋白質全長。 本發明之另一實施例包括一^重組核酸分子,其包含一 重組載體與一核酸序列,其編碼此述之蛋白質或具有該蛋 白質生物活性之胜肽。此核酸序列係如上詳述。依據本發 明’重組之載體為經工程改造(即人工製造)之核酸分子,其 159 200813222 用於作為操作核酸序列之工具,經選擇並用以引入此核酸 序列至佰主細胞中。因此,重組之載體適用於選殖、定序, 及/或操作所選用之核酸序列,如藉由表現,及/或傳遞所 選之核酸序列至宿主細胞中,以形成重組細胞。此載體一 5般包含異源性核酸序列,其為一核酸序列,並非天然發現 於鄰近待複製或傳遞之核酸序列,雖然該載體亦可包含一 調控核酸序列(如驅動子、未轉譯區域),其可天然發現鄰近 於本發明之核酸分子’或其可用於表現本發明之核酸分子 (於下詳細討論)。該載體可為RNA或DNA,不論是原核或 10真核,一般為一質體。該載體可以染色體外元素方式維持 (如一質體),或其可整合至重組生物體之染色體中(如一微 生物或植物)。完整之載體可維持於宿主細胞中,或在某些 條件下,該質體DNA可經剔除,留下本發明之核酸分子。 整合之核酸分子可置於染色體驅動子之控制下,在原始或 15質體驅動子控制下,或在數個驅動子控制之組合下。核酸 分子之單一或多重複製版本可整合至染色體中。本發明之 重組載體可包含至少一可篩選之標記。 在一實施例中,使用於本發明重組核酸分子之重組載 體為一表現載體。使用於此,片語,,表現載體,,係指一載 20體,其適用於製造一經編碼之產物(如有興趣之蛋白質)。在 此實施例中,編碼待製造之產物之核酸序列(如PUFA pKS 區塊或蛋白質)係插入重組載體中,以製造重組核酸分子。 編碼待製造蛋白質之核酸序列係插入該載體中,操作性地 連結該核酸序列與載體上之調控序列,其可允許重組宿主 160 200813222 細胞中該核酸序列之轉錄與轉譯。 在另一實施例中,使用於本發明重組核酸分子之重組 載體為一標的載體。使用於此,術語”標的載體’’係指一載 體,其可用於傳送特定核酸分子至重組宿主細胞中,其中 5 該核酸分子係用於刪除、失活或取代宿主細胞或微生物體 之内生性基因,或基因之一部分(即,用於標的基因之破 壞或剔除(knock-out)技術)。此載體為技術上已知之’’剔除 (knock-out)’’載體。在本實施例之一觀點中,載體之一部分, 更典塑的,插入載體之核酸分子(即插入子),具有一核酸序 10 列,其類似於宿主細胞中標的基因之核酸序列(即該基因標 的為剔除或失活)。該載體插入子之核酸序列係設計與標的 基因結合,使得該標的基因與插入子可進行類似重組,其 中該内生性標的基因係經剔除、失活、降低(即,藉由至少 一部份之内生性標的基因,其經突變或剔除),或取代。使 15 用此類型之重組載體取代内生性裂殖壺菌(Schizochytrium) 基因,例如,使用前述本發明人所述之重組基因,以及一 般用於破囊壺菌(thraustochytrid)s基因轉型之技術,描述 於美國專利申請系列案號10/124,807,為美國專利申請案公 開號20030166207,公開於2003年9月4日。用於植物之基因 20 轉型技術為技術上已知。 一般而言,重組核酸分子包括本發明至少一核酸分 子,操作性地連結至一或多個表現控制序列。使用於此, 術語”重組分子”或“重組核酸分子,,主要係指一核酸分子或 核酸序列,操作性地聯結至一表現控制序列,但可與術語” 161 200813222 核酸分子”交換使用,當此核酸分 述。依據本發明,術語”操作性聯結”“,、、且刀子如此所 轉錄技制序物或轉譯控制序 列)H刀子可於經轉染(即轉 5 10 15 20 人 γ 1 轉導(transfected)、接 合(conjugated)或引入(c〇nduc 條 } 伯主細胞中表規。糙4本 控制序列為一序列,其控制轉 十、
^要之轉錄控制序列為控制轉錄起始者,如驅動子、L =俾操作子與抑制子序列。適當之轉錄控制序列包如 轉錄控制序列,其可作用於d J判於狀4_酸分子之宿主細 胞或生物體中。 本發明之重組核酸分子亦可包含一額外之調控序列, 轉筆;控序列’複製源與其他可與該重组細胞相容之調 工歹丨在實靶例中,本發明之一重組分子,包括整合 歹,百主、、、田胞木色體者,亦包含分泌訊號(即訊號片段核酸序 =)’以使表現之蛋白質自製造蛋白質之細胞中分泌出。適 二之《片段包括—訊號片段,其天然地與待表現之蛋白 貝〜合’或任一異源性訊號片段,可引導本發明蛋白質之 刀/ 。在另一實施例中,本發明之重組分子包含一引導序 以使表現之蛋白質傳送至並插入至宿主細胞之細胞膜 適田之引導序列包括一天然地與蛋白質結合之引導序 歹 f] 9 JL· . 、2壬一異源性引導序列,可引導本發明蛋白質傳送至 插入至俏主細胞之細胞膜上。 本^明之—或更多個重組分子可用於製造本發明之一 扁馬之產物(如-AC〇AS)。在一實施例中,、經編碼之產 162 200813222 物係由表現此述之核酸分子而製造,在可有效製造該蛋白 質之條件下。一較佳製造經編碼蛋白質之方法,係以一或 多種重組分子轉染一宿主細胞,以形成一重組細胞。待轉 染之適當宿主細胞包括,但不侷限於,任一細菌、真菌(如 5 酵母菌)、昆蟲、植物或動物細胞,其可經轉染。在本發明 之一實施例中,較佳之宿主細胞為一植物宿主細胞。宿主 細胞可為未經轉染之細胞,或已經至少一其他重組核酸分 子轉染之細胞。 依據本發明,術語”轉染’’係指任一方法,其使用一外 10 源性核酸分子(即,一重組核酸分子),可插入細胞中。術語 ”轉型”可與術語”轉染”交互使用,當此術語用於引入核酸 分子至微生物體細胞中,如藻類、細菌與酵母菌,或植物 細胞中。在微生物與植物系統中,術語’’轉型’’係用於描述 於一遺傳性改變,由於該微生物體或植物取得該外生性核 15 酸,並與術語’’轉染’’為同義詞。然而,在動物細胞中,轉 型需要第二意義,其指細胞培養時生長特性之改變,舉例 而言,變得更具癌性。因此,為避免混淆,術語’’轉染’’較 佳係用於指稱引入一外生性核酸至動物細胞中,且術語’’轉 染” 一般包含動物細胞之轉染,與微生物細胞或植物細胞 20 之轉型,延伸該術語之意義為引入外生性核酸至一細胞 中。因此,轉染技術包括,但不侷限於,轉型、顆粒轟炸、 擴散、主動運輸、水浴超音波震盪、電破法、微注射法、 脂質體轉染法、吸附、感染與原生質體融合法。 此技術領域者應瞭解到,使用重組DNA技術可增進轉 163 200813222 染核酸分子表現之控制,藉由操作,如宿主細胞中核酸八 子之複製版本數目、核酸分子轉錄之效率、所得轉錄物之 轉譯效率,以及轉譯後修飾之效率。此外,該驅動子序列 可經基因改造,以增進表現量,與原始驅動子相較。可用 5 於控制核酸分子表現之重組技術包括,但不侷限於,整人 核酸分子至一或多個宿主細胞染色體中、加入載體穩定序 列至質體中、取代或修飾轉錄控制訊號(如驅動子、操作 子、增強子)、取代或修飾轉譯控制訊號(如核_體結合位 置、Shine-Dalgarno序列)、修飾核餿分子以對應宿主細胞 10 所使用之密碼子,以及刪去使轉錄物不穩定之序列。 許多用於製造生物活性分子之基因修飾,為本發明包 含任一相關於此述之PUFA PKS系統及/或附屬蛋白之基因 修飾,其會產生所希望之生物活性分子之製造。 生物活性分子,依據本發明,包括任一分子(化合物、 15產物等),其具有生物活性,可由PUFAPKS系統製造。此 生物活性分子可包括,但不侷限於:多不飽和脂肪酸 (PUFA)、抗發炎配方、化療試劑、活性賦形劑、骨質疏鬆 藥物、抗憂鬱劑、抗痙攣劑、抗幽門桿菌藥物、治療神經 退化疾病藥物、治療退化性肝病之藥物、抗生素、與膽固 20醇降低配方。本發明之pUFAPKS系統之一優勢為此系統引 入碳-碳雙鍵至順式構形上之能力,且該分子每隔三個碳便 包含一雙鍵。此能力可用於製造各種化合物。 每一文獻、專利或專利申請案皆在此併入本案以作為 參考資料。 164 200813222 下列範例係以_目的提供,鱗詩P㈣彳本發明範 範例 範例之一般引言。 10 15 PUFA合成酶之編碼基因已於鼠科、細菌與破囊壺菌等 物種中其巾有數種基@可表達湘_,當提供適量 PPT说時,這些酵素的特定PUFA產物可於細胞中累積。然 而就本毛明人所知,目前有關這類酵素之PUFAs釋放並 未有詳盡描述。釋放機制與PUFA合成酶系統於異源宿主生 物體:之表達有關。同時亦提供—努力方向,即經由該系 統調節碳的㈣及最終PUFAs於異源絲始宿主生物體内 之累積量。本發明揭示了裂殖壺菌pUFA合成酶(並且,不 受理論束缚,幾乎為所有真核PUFA合成酶減,包括所有 破囊壺g PUFAPKS系統)之產物為游離脂肪酸,且游離脂 肪酸可由酵素複合物中完整釋出。此外,在裂殖壺菌中, PUFA FFA於形成磷脂質(pL)與三酸甘油醋(TAG)之前會先 酯化成CoA。以下範例之數據提出異源宿主生物體之表達 及原始宿主生物體中PUFA累積量之調節策略。 範例1 20 疇 本範例係描述一裂殖壺菌FAS基因剔除殖株以進行生 物化學研究。 裂殖壺菌含有一編碼FAS酵素之基因,以產生短鏈飽和 脂肪酸(揭示於美國專利申請案公開號20050191679 A1)。裂 殖壺菌FAS基因剔除(FAS-KO)構築體之建立係利用美國 165 200813222 專利號7,001,772所揭示之方法。將一含有FAS Orf(由推測 之ATG起使密碼下游約728 bp處至停止密碼下游約680 bp 處)之〜10.0 kB EcoRV基因體DNA片段選殖至Stratagene bluescript載體(pBSK)多重選殖區内之EcoRV位置。將選殖 5 之裂殖壺菌DNA内〜3.5 kB Bglll片段移去並置換〜1·1 kB BamHI片段,係選自pTubZeoll-2並含有抗Zeocin基因盒 (請見美國專利號7,001,772,如上所述)。質體(PJK878)藉由 粒子轟擊法(particle bombardment)導入細胞壁缺失殖株裂 殖壺菌(以Ac66表示)中。轉形物初步以含Zeocin與棕櫚酸之 10固體培養基筛選。在二次筛選時,未補充棕櫚酸者無法在 培養盤上生長,可用於確認可能的雙重交互效應,因為FAS 基因體之一部分已被抗Zeocin基因盒取代。利用PCR與南方 墨點法(Southern blot)分析並確認具備預期基因構造之轉形 物(標示為FAS-KO)。本殖株係生長於添加500 uM棕櫚酸之 15 培養基。另使用一類似方法,亦即將一抗Zeocin基因盒插 入編碼裂殖壺菌PUFA合成酶次單元之基因中,使裂殖壺 菌Ac66殖株之酵素失活。在此情況中,培養基係添加5〇〇 uM DHA。這些殖株的整體細胞與細胞萃取液部分隨後進行 生化研究(請見以下範例)。 20 範例2 以下範例係描述裂殖壺菌Ac66,及裂殖壺菌Ac66之 PUFA合成酶KO與FAS-KO殖株之細胞萃取液製備方法。 以下範例係裂殖壺菌細胞壁缺失殖株之細胞均質液 (CFH)製備方法。細胞生長於A50-3培養基並隨後以M2B培 166 200813222 養基稀釋。κο殖株生長時所使用之培養基係添加適量之脂 肪酸。細胞於Μ2Β培養基内生長至OD600 nm>〜2.5且<〜5。 細胞於50 mL培養基中離心收集(桌上型離心〜1200 rpm X 4 分鐘)。移去上清液後將細胞再懸浮於5 mL緩衝液A(100 5 mM磷酸鹽pH 7·2、10 %(w/v)甘油、1 mM EDTA與2 mM DTT)並以前述方法離心。移去上清液後將細胞再懸浮於冰 冷之5 mL緩衝液A。懸液置於試管内,並於冰上超音波震 盈 1.5分鐘(Ultrasonic Processor Model GE130連接微探針, Pulser為2秒,〜1 Watt電源設定)。樣品以顯微鏡確認所有 10 細胞均破裂。CFH以200 uL體積分裝於〇·5 mL PCR管内, 加蓋後以液態氮冰凍。樣品保存於-74°C中備用。 範例3 本範例係描述活體外FAS與PUFA合成酶活性分析之一 般條件。 15 FAS與pUFA合成酶活體外活性分析之範例如下。在一 最終體積100 uL之反應中,將酵素與緩衝液a混合(兩者之 總體積90 uL),再加入下列成分(1〇 uL)使其產生以下各最 終濃度:丙二醯基-C〇A(50 uM -混合未標定與丙二醯基 -2-14C-CoA,最終標定濃度為〇 65 mM)、 20 NADPH(1 mM)及乙醯_c〇A(10 UM)。這些成分及其他成分 均可依實驗需求進行調整。反應於室溫水浴之玻璃管内進 行(〜21°C)。反應時間依實驗需求而定。反應之終止可依需 要採用以下兩種方法。若進行脂肪酸轉換為脂肪酸甲基酯 類(FAMES)則使用酸性終止法,係加、FAME試劑終止反應 167 200813222 (請見如下)。若進行脂肪萃取而非衍生化反應,則加入125 uL異丙醇:醋酸(4 : 1 v/v)終止反應(請見如下)。 酸性FAME終止法·反應之終止係加入溶於甲醇斑5〇 uL甲苯之2_〇 mL 4% HC1 ’玻璃管以鐵氟龍加蓋後於i〇〇〇c 5 下加熱1 hr。冷卻至室溫後,加入1.0 mL己烧與0 5 mL水, 混合後使其分離。若有需要,取一部分進行液態閃爍計數 (LSC)。將〜600 uL之有機層移至一新試管内,並以氮氣吹 除溶劑部分。將殘留物溶於50 uL己烧並點於石夕膠6〇a TLC 薄片上(以己烷:二乙基醚:醋酸-70 : 30 : 2進行反應)或經 10 10% AgNOMO%乙腈浸泡之矽膠G薄片上(使用前,先於 100°C下活化30 min)(以己烧:二乙基轉:醋酸-70 : 20 : 2 進行反應)。待薄片風乾後,以螢光影像技術 (phosphorimaging technology)偵測輻射反應區域。 HIP終止法—未衍生化脂肪之萃取:如前面所述,反 15 應之終止係加入125 uL異丙醇:醋酸(4 : 1 v/v),隨後加入2 mL己院·異丙醇(3 : 2, v/v),經混合後加入1 mL 6.7 硫酸鈉並再次混合。使各相分層。若有需要,取部分有機 層(上層)進行LSC後將其餘部分移至(〜1·〇 mL)—新試管 内。以氮氣吹除溶劑並將殘留物溶於50 UL己烷。將樣品點 20於矽膠60 A TLC薄片上並以己烷:二乙基醚:醋酸(7〇 : 3〇 : 2)進行反應。待薄片風乾後,以榮光影像技術偵測輕射反 應區域。 範例4 以下範例係描述FAS與PUFA合成酶活體外活性分析之 168 200813222 結果。 準備裂殖壺菌Ac66及裂殖壺菌Ac66衍生之PUFA合 成酶KO與FAS-KO殖株之CFHs,並進行FAS與PUFA合成酶 之活性分析,係使用上述之酸性FAME與銀染TLC法。第1 5圖顯示其分析結果。TLC薄片上經標定帶域之影像代表 FAMEs具備之放射線活性(其可由標準品之共同遷移及 HPLC分離法進行再確認)。第1與第2行顯示由原始Ac66萃 取液產生之結果。FAS(14 : 0與16 : 0 FAMEs)與PUFA合成 酶(DHA與DPA n-6)之產物可見於其他行。PUFA合成酶失活 10 後之結果如第3與第4行所示。在此情況下,DHA與DPAn-6 FAMEs不存在。FAS失活後之結果如第5與第6行所示。在 此情況下,脂肪酸衍生自FAS,亦即,14 : 0與16 : 0及脂肪 酸衍生物消失。數據顯示,在FAS-KO殖株中,FAS活性明 顯或完全消失。利用FAS-KO殖株進一步確認裂殖壺菌 I5 PUFA之合成及累積途徑。 範例5 以下範例係描述裂殖壺菌内合成PUFA之其他確認結 果,並顯示裂殖壺菌PUFA合成酶之初始產物為游離脂肪 酸(FFA)。 20 利用酸性法將活體外反應產物轉變為FAMEs有利於決 定丙二醯基-CoA結合脂肪酸片段之輻射活性,但在衍生作 用前無法顯示這些脂肪酸的分子形式。第2圖顯示FAS-KO 殖株之活體外時間進程分析結果,其中脂質係利用前述HIP 方法萃取(亦即,無需將脂醯基片段轉為甲酯基)並隨後以正 169 200813222 相TLC刀離。薄片上TAG與游離脂肪酸(FFA)標準品之移動 位置顯示於左方。在此TLC系統巾,不_長與不飽和程 度之FFA無法有效分離。然而,由於所使用之殖株具有很小 或無FAS活性’故此區域?1^8很可能衍生自ρυρΑ合成酶系 5統。其他支持證據顯示於第3圖。其中,活體外分析時FFA 帶域輻射標定之表現取決於NADpH的加入。相較之下, NADH無法完成此反應。如此精確地#NADpH為還原劑的 情況亦為沙雷菌(沙雷菌)SCRC2738 PUFA合成酶之特性 (第 2C圖,Metz等人,Science 293 : 290-293(2001))。在第 2 10與第3圖中’發現經輻射標定帶域之移動明顯稍快於FFA帶 域(標示為6未知,)。由於帶域之表現與還原劑的加入無關, (NADH或NADPH -請見第5行,第3圖),因此可能與PUFA 合成酶活性無關。此外,此帶域可於PUFA合成酶失活殖株 之類似分析中偵測出(數據未顯示)。第2與第3圖之數據顯 15示,裂殖壺菌PUFA合成酶之初步產物為fFa。FAS系統釋 出之產物為FFA(例如哺乳動物FAS),這些FFA隨即於變成 PL·或TAG之如S旨化為Co A。FFA之活化由酿基-輔酶A合成酶 進行,此反應需要ATP與Mg+2。在TAG部分之活體外反應 中,某些輻射活性表現的時間進程變慢符合裂殖壺菌之反 2〇 應途徑(由於樣品中殘留ATP)。此現象將進一步檢測(請見 如下)。 範例6 以下範例證實醯基-輔酶A合成酶參與裂殖壺菌PUFA 累積途徑之反應。 170 200813222 外加ΑΤΡ(2·5 mM)與Mg+2(l〇 mM)對於裂殖壺菌 FAS-KO樣本活體外分析產物之影響顯示於第4圖。樣本於 標準反應混合物中反應10分鐘後加入八11>與]^§+2。反應於 外加ATP與Mg+2後收取多個時間點(亦即,〇=未加入、1〇與 5 30 sec ’及1、3、10與30 min)。在時間進程期間,可發現 FFA帶域之輻射標定減少且TAG帶域之輻射標定增加。‘未 知’帶域之輻射標定不受外加ATP之影響。這些數據符合 ATP需求反應參與由經標定FFA移至TAG片段之情況。
Triacsin C目前被視為醯基_輔酶a合成酶之特定抑制 10劑,其可活化長鏈PUFAs(Knoll等人,1995)。進行Triacsin C 對於FAS-KO樣本活體外分析期間產物表現之檢測。樣本於 標準配方中反應10分鐘,其中包含各種濃度的Triacsin C(0、25、100或200 uM),隨後加入ATP與Mg+2。反應繼續 進行20分鐘後終止,萃取脂質並利用hip法之TLC分離。結 15果顯示於第5圖。加入高濃度Triacsin C可阻止FFA帶域輻射 才木疋之喪失。此結果符合醯基-輔酶A合成酶參與之情況。 範例7 以下範例係描述表達裂殖壺菌〇rf A、OrfBss(OrfB*)、 OrfC與NostocHetl之Ε· coli萃取物活體外分析。 20 上述範例之數據顯示,裂殖壺菌PUFAs在形成TAG與 PL之鈾可先轉變為游離脂肪酸。數據顯示,ρυρΑ以游離脂 肪酸形式釋出之方式為PUFA合成酶之不可或缺部分。裂殖 壺菌原始Orf A(核酸序列顯示於SEQ ID NO : 1)、〇rfBss(亦 以0rfB*表示;核酸序列顯示於SEQ ID NO : 37)與原始 171 200813222
OrfC(核酸序列顯示於SEQ ID NO : 5)係以人工操縱子形式 選殖於pET載體並表達於Ε· coli,如美國申請案公開號 20050100995,如上所述,所揭不。Het I選殖至pACYC載 體並表達於相同細胞中。細胞生長至〇D·值〜丨後加入 5 IPTG(最終濃度1 mM)以誘發產生T7聚合酶。誘發約4小時 後,收取細胞,並以緩衝液A清洗,再利用French細胞壓力 破碎機進行兩次破菌。取均質液進行離心(5k χ g χ 5 min) 產生上清液1(S1)。隨後,再以1〇〇,000叉§離心1小時產生高 速沈澱物(P2)與咼速上清液(S2)部分。沈殿物部分再懸浮於 10緩衝液A至原離心體積。所有部分均以前述之一般方法分 析’包括使用酸性FAME/銀相TLC檢測法或hip脂質萃取法 結合正相TLC分離法。第6圖顯示這些分析之結果。 酸性FAME分析(第6A圖)顯示活體外分析的主要產物 為DHA與DPA n-6。均質液部分具有最高活性,而“與打 I5部分活性較低。S2部分的活性很小。有趣的是,cfh與S1 部分可偵測到小量的FAS系統產物(如第6A圖中16 : 〇箭頭 所指)。這可能是因為利用T7系統可產生高度表現量的 PUFA合成酶。相較之下,以含編碼沙雷菌EpA合成酶黏粒 之E.coli萃取物(CFH與S1)進行之類似分析中,顯示TLC薄 20片上的多數輻射活性與FAS產物有關(Metz等人,Sdence 293 ·· 290-293(2001),第2B圖)。同時,Ε·純内部⑽系統 包含數個可溶性蛋白,且高速離心後上清液部分仍具有fas 活性(Metz等人,Science 293 : 290-293(2001),第2B圖)。 相較之下,第6A圖中PUFA合成酶活性部分於高速離心後位 172 200813222 於沈澱物位置。 第6B圖之數據係與第6八圖相同之E c〇ii殖株樣本之分 析結果,除了脂質產物在TLC分離前必須以HIP法萃取(而 非FAMES)。利用兩部分進行,即CFH(圖左)與p2(圖右)。 5調整分析時萃取物之用量,所以兩者會有大約等量的脂質 產生輻射活性。同時進行不同還原劑成分(]^八〇11與/或 NADPH)之影響:第1行—單獨NADpH、第2行—單獨 NDPH、第3行-NADH與NADPH及第4行-水,而非每-種成分都加入。第6B圖數據顯示Tlc薄片上大部分輻射標 10定可與游離脂肪酸標準品一起移動。同時,分析時主要 (FFA)帶域的表現取決於NADPH的加入。這些部分之 NADPH需求及缺乏明顯FAS活性之情況(尤其是P2部分) 顯示FFA為PUFA合成酶產物。由於只有三種裂殖壺菌(編碼 Orfs A、B與C)基因表達於本E. coli(結合Het I)殖株,數據 15顯示合成酶之pUFA釋放係此酵素之固有特性,而非其他硫 酯酶所致。 上述範例中的許多重要數據顯示裂殖壺菌之 成與累積具有以下特點。DPAn-6與DHA之PUFA合成酶編 碼基因為Orfs A、B與C,其如美國專利號6,566,583、Metz 20 等人,Science 293 : 290-293(2001)、美國專利申請案公開 號20020194641與PCT公開號WO 2006/135866所揭示。次單 元内之ACP區塊可受内生性PPTase活化。合成反應係利用 丙二醯基-CoA為碳的來源(醯基-CoA可能或可能不需要)並 以NADPH為還原劑。PUFA產物以FFAs形式由酵素釋出, 173 200813222 且該釋出反應係酵素之固有特性。FFAs可酯化為CoA,其 為ATP依賴反應並可受一或更多内生性醯基-輔酶a合成酶 催化。PUFA-CoAs隨後可作為PL與TAG合成酶之受質。 範例8 5 以下範例係顯示麵包酵母之裂殖壺菌PUFA合成酶 (sOrf A、sOrffi與原始OrfC,請見如下)與Het I之編碼基因 表現。 裂殖壺菌PUFA合成酶基因與Het I於酵母菌内表達所 需之材料係購自Invitrogen。以酵母菌(saccharomyces 10 cerevisiae)之INVscl殖株配合以下轉形載體: pYESLeu(sOrfA,SEQ ID NO : 35,編碼SEQ ID NO : 2)、 pYES3/CT(sOrffi,SEQ ID NO : 36,編碼SEQ ID NO : 4)、 pYES2/CT(OrfC,SEQ ID NO : 5,編碼SEQ ID NO : 6)與 pYESHis(HetI,SEQ ID NO : 33,編碼SEQ ID NO : 34) 〇 15 修改某些載體以因應特殊選殖需求。使用適當的篩選培養 基,係取決於特定實驗。在各實驗中,將基因選殖至GAL1 啟動子之後,且誘發作用係以經洗務細胞再懸浮於含有乳 糖之培養基中,其方法如Invitrogen所提供。細胞生長於 3 0 C並於移至誘發培養基後之指定時間點收取(利用離心 20 方式)。細胞沈澱物經冷凍乾燥,且FAMEs以酸性甲醇製備 並萃取至己烷中,再以GC分析。 先前實驗指出,原始形式OrfA(SEQ ID NO : 1)與小量 修飾之原始形式0rffl(0rfB*,SEQ ID NO : 37)於酵母菌内 之表達不會產生預期分子大小之蛋白質(亦未發現其正確 174 200813222 之mRNAs)。相較之下,預期分子大小之蛋白質可見於原始 形式OrfC(SEQIDNO : 5)表達之細胞中。〇rfsA與b之編碼 基因t過再合成’因此其进碼子使用情形(c〇(j〇n usage)較優 於其他酵母菌耐受株(再合成反應由Blue Heron,Inc.進 5 行)。這些經合成基因為sOrfA(SEQ ID NO: 35)與sOrfB(SEQ ID NO : 36)。酵母菌中這些基因之表現會分別使預期大小 之OrfA與B蛋白開始累積。 第7圖係比較表達裂殖壺菌PUFA合成酶系統 (sOrfA、sOrfB、OrfC與Het I)之酵母菌細胞與控制組細胞(缺 10乏s〇rfA基因)之月曰肪酸表現。細胞於誘發〜20 hrs後收集。 可以發現,表達完整PUFA合成酶系統之殖株出現兩個新的 FAME尖峰。此二尖峰經確認為dpa n-6與DHA,係以其沖 k日守間比對標準品並隨即以]vis分析。如發明人所預期之裂 殖壺菌PUFA合成酶特徵,亦即,除了DHA與DPAn-6以外, 15 並未發現新的尖峰。 第8圖係顯示第7圖之GC圖譜區域,其包含PUFA FAMEs。控制組細胞與PUFA合成酶表達細胞兩者均含有一 尖峰’且沖提位置接近DHAFAME。經確認為C26 : 0 FAME 且(依據文獻參考資料)已知衍生自鞘脂類(sphingolipids)。 2〇 雖然沖提位置接近DHA尖峰,但解析程度夠’故不會干擾 DHA的定量。DPAn-6尖峰可有效地由其他内生性酵母菌脂 質中分離出來並以FAME形式表現。在此特定範例中,裂殖 壺菌PUFA合成酶系統表達細胞可累積2.4% DHA與2.0% DPAn_6(以總FAMEs百分比表示)。DHA與DPA n_6於細胞中 175 200813222 所測得脂肪酸之總和為4·4%。細胞内DHA與dpa n-6之比為 〜1·2 : :1。 上述結果顯示,酵母菌裂殖壺菌PUFA合成酶之表 達’可用於續認先前申請案中所提出之假設,並可預測酵 5母菌與植物中脂肪酸表現改變後之狀況。 範例9 以下範例係描述以共同表達特定醯基-輔酶Α合成酶的 方式’增加表達裂殖壺菌PUFA合成酶之酵母菌puFA^^、 積情況。 0 發明人指出,在裂殖壺菌,其PUFA合成酶之FFA產物 可受内生性醯基·輔酶A合成酶(ACoASs)之作用而有效轉變 為醯基-輔酶A(請見上述範例藉由比對EST數據庫後,發 明人發現9個AcoASs可能參與PUFAs轉變為醯基_輔酶A之 過程。 15 簡單來說,本發明人比對裂殖壺菌EST數據庫,其中 含有由不同cDNA基因庫挑出的〜2〇,〇〇〇個別質體序列,且 這些ESTs具備蛋白類似性及已知(或預期)之Ac〇as活性。發 明人使用VectorNTI程式,Contig Express,組合這些基因 疊連群(c〇ntigs)(當出現二或更多重疊序列時)並依據各序 2〇列A息進彳于編排。結果摘要如下。有八個不同疊連群盘單 一片段(於數據庫内無重g序列)被確認出可能與Ac〇a§酵 素有關,並能有效地將PUFA合成酶產物轉變為醯基_輔酶 A。利用EST之數據,可獲得每一可能片段之完整編碼區序 列’並可使用多種^準方法進行檢驗(例如,基因體Dna與 176 200813222 基因體DNA衍生之PCR產物定序分析)。 裂殖壶菌醯某-輔_ A合成酶(ACS)之編碼序列與演繹 性轉譯作用: 長度=2004個核苷酸(不包括終止密碼)(SEQ ID NO : 5 82)。預期可編碼668個胺基酸(SEQ ID NO: 83),分子量73·5 kDa的蛋白。蛋白質序列與已知ACSs具有良好的類似性。 最好的 Blast 比對結果為 Thalassiosira pseudonanna ACS(TplacA,編號:AAW58006),已知其具有高DHA活性 (Tonon等人,Plant Physiol· 2005 May; 138(1): 402-8)。SEQ 10 ID NO : 83之碳端三個胺基酸為:SKL -係一將標的蛋白 帶往過氧化體(peroxisome)之相關區域。此碳端區域亦出現 於上述Thalassiosira pseudonanna ACS 中。
ScACS-2(亦標示為ScAC〇AS-2或ACS-2):長度=2340 個核苷酸(不包括終止密碼)(SEQ ID NO : 84)。預期可編碼 15 780個胺基酸(SEQ ID NO : 85),分子量84.7 kDa的蛋白。大 部分經推測之蛋白與已知之ACSs,包括人類之示範性 Lipidosin與口香糖(Bubble Gum)形式,具有良好的類似性。
ScACS-3(亦標示為ScACoAS-3或ACS-3):長度=2526 個核苷酸(不包括終止密碼)(SEQ ID NO : 86)。預期可編碼 2〇 842個胺基酸(SEQ ID NO: 87),分子量90.6 kDa的蛋白。大 部分經推測之蛋白(特別是中心部位〜700個胺基酸)與口香 糖(Bubble Gmn)形式之ACS蛋白具有良好的類似性。
ScACS-4(亦標兩為scACoAS-4成ACS-4):長度=2037 個核苷酸(不包括終止密碼)(SEQ ID NO : 88)。預期可編碼 177 200813222 679個胺基酸(SEQ ID NO : 89),分子量74_7 kDa的蛋白。大 部分經推測之蛋白與已知ACSs蛋白,包括人類與其他哺乳 類之範例,具有良好的類似性。 gcACS-5(亦標^^ScAC〇AS_5^ ACS_5):長度=1734 5個核苷酸(不包括終止密碼)(SEQ ID NO : 90)。預期可編碼 578個胺基酸(SEQIDN0: 91),分子量63丨kDa的蛋白。大 部分經推測之蛋白與已知ACS蛋白具有良好的類似性。最 好的Blast比對結果為細菌ACSs。SEQ ID NO : 91之碳端三 個胺基酸為:SKL-係一將標的蛋白帶往過氧化體之相關區 10 域。 紅Acs_6(亦標^JlScACoAS-6成ACS,:長度=1806 個核苷酸(不包括終止密碼)(SEQn)N〇: 92)。預期可編碼 602個胺基酸(SEQ ID NO: 93),分子量66.0 kDa的蛋白。大 部分經推測之蛋白與已知Acs蛋白具有良好的類似性。最 15好的Blast比對結果為細菌ACSs。SEQ ID NO : 93之碳端三 個胺基酸為:係一將標的蛋白帶往過氧化體之相關區域。
ScACS^Z(亦標^^ScACoAS-7成ACS-7):長度=1920 個核苷酸(不包括終止密碼)(SEQIDN〇 : 94)。預期可編碼 640個胺基酸蛋白(SEQ ID NO : 95),分子量70.4 kDa的蛋 20白。大部分經推測之蛋白與已知ACS蛋白具有良好的類似 性。最好的Blast比對結果為細菌ACSs。
ScACS-8(亦標兔為ScACoAS-8戒ACS-S):長度=1893 個核苷酸(不包括終止密碼)(SEQ ID NO : 96)。預期可編碼 631個胺基酸(SEQ ID NO : 97),分子量70.7 kDa的蛋白。最 178 200813222 好的Blast比對結果為脂肪酸運輸蛋白家族成員,可能具備 AcoAS活性。
ScACS_9(亦標示為ScACoAS-9成ACS-W :長度=295〇 個核苷酸(不包括終止密碼)(SEQ ID NO : 98)。預期可編碼 5 766個胺基酸(SEQ ID NO: 99),分子量84.1 kDa的蛋白。大 部分經推測之蛋白與已知ACS蛋白具有良好的類似性。最 好的Blast比對結果為動物ACSs。 發明人認為,異源宿主所表現之PUFA合成酶可能無法 有效處理新生成的(針對該生物體)PUFA游離脂肪酸 10 (FFAs),而共同表現適當的ACoAS(s)可能會增加該宿主 PUFAs的累積。上述裂殖壺菌ACoASs中,其中有兩種可 個別表達於(ScACS_l,SEQIDNO: 82/83與ScACS-2, SEQ ID NO : 84/85)酵母菌,並含有裂殖壺菌PUFA合成酶系統 之編碼基因(例如,sOrfA、sOrfB與nOrfC,及Het I)。 15 更特別的是,上述範例之酵母菌表達系統係經修正, 其中使用4載體並導入第五種ACoAS基因(亦即,酵母菌亦 含有裂殖壺菌 PUFA合成酶系統OrfsA、B與C與 PPTase(Het I源自Nostoc))。可選殖兩基因之酵母菌表達載 體(pESC載體)係購自Stratagene。這些載體均類似,並與上 20 述pYES載體相容。將兩基因,原始〇rfC(nOrfC,SEQ ID NO : 5)與HetI(SEQ ID NO ·· 33),選殖至pESC載體,而 sOrfA(SEQ ID NO : 35,sOrffi(SEQ ID NO : 36)與第五種基 因(ScACS-l(SEQ ID NO : 82)或ScACS-2(SEQ ID NO : 84)) 則選殖至pYES載體。將四載體導入酵母菌中,而基因之誘 179 200813222 發作用如前述將細胞再懸浮於含乳糖培養基中。細胞生長 於30 C並於誘發後18小時收取。這些細胞的FAME*析摘錄 於表1。控制組細胞含有所有4種載體,但缺少〇rfA編碼基 因。共同表達任何一種ScACOASs可增加DHA與DPA n-6之 累積ϊ(約為控制組細胞之兩倍)。因此可以確定,異源宿主 PUFA合成酶產物之累積因酵素之共同表達而增加,因其能 更有效利用這些產物。 表1 30 C ’ 誘發 18 hr 控制組(pufa基因)ScACS-1 ScACS-2 脂肪酸 FAME(面積 %) FAME(面積 %) FAME(面積 %) 1.7 1.8 2.0 0.5 0.5 0.6 0.5 0.5 0.5 17.1 16.5 15.5 40.7 38.8 38.5 4.7 4.3 4.2 23.8 1.3 22.4 1.0 21.9 1.0 0.1 0.1 0.1 1.3 2.5 3.1 1.7 1.6 1.6 2.0 3.8 3.9 3.3 6.3 7.0 C14 : 0* C14.1 C15 : 〇 C16 : 0* C16 : 1* C18 : 0* C18 : 1 N9* C18 : 1 N7 C24 : 0 C22 : 5 N6 C26 : 0 C22 : 6 N3* DH A 外加 DPAn-6 10 在隨後實驗中,ScACS-3、ScACS-5、ScACS-6 與
ScACS-8亦利用酵母菌進行檢測,其中含有裂殖壺菌puFA 合成_糸統編碼基因(例如,s〇rfA、sOrffl與nOrfC,及
Hetl) ’並使用前述類似之方法。相較於不加入醯基-輔酶a 180 200813222 合成酶基因之結果,ScACS-3、ScACS-5或ScACS-8之個別 表達均造成酵母菌DHA產量的增加(數據未顯示)。 如前面所述’ ScACS-8具有脂肪酸運輸蛋白家族成貝 類似性,可能也具備ACS活性。已知這些蛋白可結合至細 5 胞膜,以協助游離脂肪酸進入細胞並將其轉變為醯基-輔酶 A衍生物。在植物細胞色素體(plasms)内,此家族酵素於 PUFA合成酶系統表達時可能具有特定用途,其中產物以游 離脂肪酸形式釋出。色素體的外膜被認為源自細胞膜,故 細胞膜標的蛋白(例如ScACS-8)亦可能作為色素體之外膜 1〇標的蛋白。如此一來,這些脂肪酸運輸蛋白(例如ScAC-8) 可協助色素體内PUFA合成酶游離脂肪酸產物之釋放,並可 將其轉變為酸基-輔酶A衍生物。一表達裂殖壺菌pUFA PKS糸統之植物醯基-輔酶A合成酶實驗敘述如下。 範例10 以下範例顯示,表達裂殖壺菌PUFA合成酶之酵母菌 PUFA表現量之增加情形,以及在無或有且生手 時加入淺藍菌素(cerulenin)以抑制FAs途徑。 成_與!^^均以丙二醯基_c〇A為碳的來源以 20 合成其脂㈣產物。此外,兩系統所合成之脂肪酸驗基= 酶A形式,可作為合成PL與TAG之酵素受質。如前面= 論,當PUFA合成酶與FAS存在於—生物糾,⑽系,討 向下調節或抑制作用預期會增加PUFAs的累積。❹,之 為-常見之脂肪酸合成縮合反應抑制劑。先前研素 相較於FAS“ ’ PUFA合成酶對於淺藍时之:出, 作用敏 181 200813222 感性較低。 本發明人檢測淺藍菌素對於範例8所述酵母菌殖株脂 肪酸表現之影響,並以此作為FAS活性降低之模式。範例9 所述之酵母菌亦含有醯基CoA-合成酶,亦於本系統中檢 5 測,以確定兩種方式之效果是否為加成地或協同地增加 PUFA產量。 初步實驗顯示,最大效用(亦即,PUFAs之增加以總脂 肪酸表現百分比表示)出現於淺藍菌素濃度4 uM時。在移至 乳糖誘發培養基後4小時加入淺藍菌素。細胞於移至誘發培 10 養基後19 hr收取,冷凍乾燥,並製備FAMES以進行GC分析。 經檢測之酵母菌殖株為: 殖株5.5含有PUFA合成酶基因(sOrfA、sOrffl、OrfC與 Het I),如前述範例8所示;以及 殖株5.6含有殖株5.5之PUFA合成酶基因,再加上 15 ScACoAS](SEQ ID NO : 82),如前述範例9所示。 參照表2,“〇Cer”意指不加入淺藍菌素,且“4uMCer,, 意指移至誘發培養基4小時後加入4 uM淺藍菌素。每一殖株 均評估其於存在與不存在淺藍菌素時脂肪酸之產生,以確 認FAS途徑之抑制對於PUFA產生之影響。表2顯示以GC分 20析時之主要脂肪酸表現情形(亦請見第11 圖)。其結果以總脂 肪酸百分比表示。DHA與DpAn_6為裂殖壺菌puFApKS系 統之產物’並為僅有之PUFAs。DHA外加DPAn-6之總和列 於表2 °第9與第1〇圖係酵母菌DHA(第9圖)或DHA外加 DPAn-6(第10圖;白色柱狀圖為DHA;黑色柱狀圖為DHA + 182 200813222 DPAn·6)之產量,並以總FAME百分比表示。 不含PUFA合成酶基因之酵母菌細胞未發現任何 PUFAs。在本實驗中,表達PUFA合成酶系統之酵母菌會累
積 1.2% DHA。含有 ScACoA-1 基因(SEQ ID NO : 82)之DHA 5產量可增加4·1%。含PUFA合成酶系統之細胞於4uM淺藍菌 素(抑制FAS系統)存在時之DHA產量增加3·7%。以表達 PUFA合成與ScACoAS-Ι基因之細胞生長於含4 u]y[淺藍 菌素(亦即,結合醯基-輔酶A合成酶表達系統與抑制FAS系 統)之培養基時,DHA產量增加至總脂肪酸的8 2%。在所有 10樣本中,DpAn-6累積量相對增加。樣本中]〇11八外加1)1>八11_6 之總和亦列於表2,其中最大量者(為總脂肪酸14.5%)為生 長於4 uM淺藍菌素之殖株5·6。可以發現的是,AC〇A合成 酶基因之表達與淺藍菌素之生長條件為附加效應。這些數 據顯示,本發明可增加異源宿主之pUFAs累積。 15 表2 脂肪酸 殖株5.5 殖株5.5 殖株5.6 殖株5.6 〇 Cer 4uM Cer 0 Cer 4 uM Cer 0.0 1.7 0.0 4.9 17.5 6.1 38.4 41.7 34.8 3.8 5.3 4.5 40.4 23.7 35.3 0.8 0.0 0.6 2.9 2.8 6.3 2.9 1.9 2.4 3.7 4.1 8.2 C14 : 0 1.5 C16 :0 17.5 C16 :1 43.4 C18 :0 5.8 C18 : 1 N9 26.2 C18 : 1 N7 0.9 C22 : 5 N6 0.9 C26 :0 2.0 C22 : 6 N3 1.3
DHA外加DPA N6 2 1 6 6 6.9 14.5 183 200813222 範例11 以下範例係描述可增加異源宿主PUFA產量與/或累積 量之其他組裝蛋白或標的物之確認。 裂殖壺菌内之酵素可有效利用PUFA合成酶產物醯基_ 5輔酶A以合成磷脂質(PL)與三酸甘油酯(TAG)分子。然而, 異源宿主内之酵素無法進行這些反應以產生類似功效,因 為這些PUFA-CoAs無法為該生物體所使用。舉例而言,PL 或TAG合成酵素之表達可增加產物累積能力,這是因為其 可於異源宿主内,有效地將各種PUFA合成酶(例如, 10 DHA-CoA、DPAn-6_CoA、EPA-CoA或其他)之醯基-輔酶A 產物轉變為PL或TAG分子。如此一來,裂殖壺菌或其他可 經由PUFA合成酶途徑產生puFAs之生物體,可作為編碼這 類酵素基因之良好來源。因此,本發明人提出可使用數種 醯基轉移酶蛋白,其以PUFA_c〇A為受質產生pl或TAG(例 15如’ 3_甘油-磷酸醯基轉移酶(GPAT)、溶血磷酸酯醯基轉移 酶(LPAAT)與甘油二酯醯基轉移酶(DAGAT)),或其他醯基 轉移酶,其可增加PUFAs中的PL或TAG(例如,磷脂質:甘 油二酯醯基轉移酶(P D AT))。多種此類醯基轉移酶之確認如 下。其中少部分已於酵母菌與植物中進行檢測。 20 DAGAT 酵免 本發明人進行裂殖壺菌EST數據庫中之相關以心比 對,其具備類似已知(或推測)DAGAT活性之蛋白。發明人 確認二種可能的DAGAT酵素並用於結合PUFA PKS系統, 其中一種描述如下並顯示可參與裂殖壺菌游離脂肪酸以 184 200813222 TAG分子累積之過程: DAGATY 亦指 DAGAT-1 或 ScDAGAT-Π-密 碼區長度=1518個核苷酸(不包括終止密碼)(SEQ ID NO : 100)°預期可編碼506個胺基酸(SEQIDNO : 101),分子量 5為57·4 kDa之蛋白。其與已知DAGAT Type 2B酵素蛋白内部 二分之二具有良好的類似性(始於〜胺基酸170並延伸至碳 端)° W面三分之一蛋白序列(胺基酸1至170)的Blast比對分 析並未明顯與任何蛋白有類似性且未發現任何Pfam配對。 利用上述範例1之裂殖壺菌FAS基因剔除抟術,發明人 10可剔除裂殖壺菌殖株之DAGAT基因(包含有SEQ ID NO : 1〇〇)’並標示為B73_8。如第13圖所示,裂殖壺菌中DAGAT 基因失活可明顯抑制脂肪酸TAG之累積。特別的是,DAGAT 的失活’可減少大約80〇/α mg FAME/gm生物量及減少大約 90% TAG。因此,發明人認為此dagaT為主要參與裂殖壺 15囷TAG合成之酵素。 因此’預期此核酸分子於本發明PUFAPKS系統表達宿
主(例如’酵母菌、植物)内之表現,為增加游離脂肪酸以PL 或TAG之形式累積。於轉基因植物内表達此基因之代表性 實驗描述如下。 20 LPAAT^^ 本發明人亦進行裂殖壺菌EST數據庫中之相關ESTs比 對,其具備類似已知(或推測)LPAAT活性之蛋白。發明人將 其收集成豐連群(即形成二或更多重疊序列),並依據前述各 序列息進行編排。結果摘錄如下。有三個不同疊連群與 185 200813222 單-片段(於數據庫内無重疊序列)被確認出與lpaat酵素 有關。可以理解的是,這些序列所編碼之酵素可能具備類 似’但不同於,所推測之〇>擔活性。在所有四種情況之 中,有-推測之Orf(包括起始與終止密碼)被碟認。可以理 5解的是,隨著更多數據的取得,會發現原本精確的序列, 包括内在之起始密碼,可能有所改變。
分析EST氣據庫以確認可能的裂碚壶简LpAAT : ScLPAAT-1 # :長度=1478 個核苷酸(SEQ ID NO : 102)。其巾包括0rf全長927 m(包括終止密碼, 10 ScLPAAT-1 CDS,SEQ ID NO : 103)。利用 CDS(SEQ ID N0 : 104) 轉譯與Blast搜尋,顯示其中大部分之蛋白編碼部位與 已知及推測之醯基轉移酶蛋白具有良好之類似性。最佳配 對之蛋白來自Arabidopsis。Pfam分析顯示有一大塊中央保 留區域與PlsC(l-醯基_sn-甘油-3-磷酸醯基轉移酶,亦即, 15 LPAAT)家族有關。 ^gLPAAT-2疊連群:長度=2112個核苷酸(SEQ ID NO : 105) 。其中包括〇rf全長H4〇nt(包括終止密碼,ScLPAAT_2 CDS,SEQ ID NO : 106)。利用 CDS(SEQ ID NO : 107)轉譯 與Blast搜尋,顯示其中大部分之蛋白編碼部位與已知及推 20 測之醯基轉移酶蛋白具有良好之類似性。最佳配對之蛋白 來自阿拉伯芥(Arabidopsis)。Pfam分析顯示有一大塊中央保 留區域與PlsC(l-醯基-sn-甘油-3-鱗酸醯基轉移酶,亦即, LPAAT)家族有關。
Μ^ΡΑΑΤ-λ辱逵群:長度=1862個核苷酸(SEQ ID 186 200813222 NO : 108)。其中包括(Μ全長l323 m(包括終止密碼,
ScLPAAT-3 CDS ’ SEQ ID NO : 109)。利用 CDS(SEQ ID NO : 110) 轉譯與Blast搜尋,顯示其中大部分之蛋白編碼部位與 已知及推測之醯基轉移酶蛋白具有良好之類似性。最佳配 5對之蛋白來自哺乳類動物。Pfam分析顯示有一大塊中央保 留區域與PlsC(l_醯基-sn-甘油-3-鱗酸醯基轉移酶,亦即, LPAAT)家族有關。 包LPAAT-4單體:長度=794個核苷酸(SEQ ID NO : 111) 。其中包括Orf全長756 nt(包括終止密碼,ScLPAAT-4 10 CDS,SEQ ID NO : 112)。利用 CDS(SEQ ID NO : 113)轉譯 與Blast搜尋’顯示其中大部分之蛋白編碼部位與已知及推 測之醯基轉移酶蛋白具有良好之類似性。最佳配對之蛋白 來自鳥類與哺乳類動物。Pfam分析顯示有一大塊中央保留 £域與PlsC(l-酿基-sn-甘油-3-鱗酸酿基轉移酶,亦即, 15 LPAAT)家族有關。 gcLPAAT-Ι經撰殖及表逵於醢母菌邀楠物。 其他DAGAT或LPAAT酵辛 發明人亦比對隱甲藻(Crypthecodinium cohnii)EST數 據庫’係針對已知或推測具備DAGAT或LPAAT活性之類似 2〇 蛋白之ESTs。結果摘錄如下。 A)免析EST數攄座以確認可能的隱甲蕩 (Crypthecodinium cohnii^DAGAT : CA5 PTA.838.C :長度=817個核苷酸(SEQ ID NO : 114)。本序列最後274個核苷酸與pCT專利公開號w〇 187 200813222 2004/087902所揭示之隱甲藻醯基轉移酶序列有好的類似 性。 CA5 PTA.131.C1 :長度=850個核苷酸(SEQ ID NO : 115)。
5 CA12 cotlO 003a hlO :長度=663個核苷酸(SEQ ID NO : 116)。 CA12 cotlO 001a h02 :長度=807個核苷酸(SEQ ID NO : 117)。 CA12 cotlO 005b g!2 :長度=765個核苷酸(SEQ ID 10 NO : 118)。 CA12 cot50 005c d07 :長度=782個核苷酸(SEQ ID NO : 119)。 B)分析EST數攄廉以確認可能的藤曱蕩 rCrvpthecodinium cohnii^LPAAT :
15 CA12 cotlO 003a ell :長度=793個核苷酸(SEq ID NO : 120)。 CA12m PTA.739.C1 :長度=744個核普酸(SEQ Π) NO : 121)。 本範例中所述之任何一或更多之核酸分子可轉形於任 20 何宿主細胞,包括產生任何經基因修飾生物體(例如,植物 或微生物),以進一步增加生物體内PUFA之累積,特別的 是,表達PUFAPKS系統之生物體。若宿主生物體利用傳統 或標準脂肪酸合成酶途徑產生PUFAs,則這些酵素的表達 亦具有用途。這些構築體可單獨於PUFAPKS系統進行或結 188 200813222 合其他方法,以增加本發明宿主生物PUFA之產量與累積量 (例如,結合醯基-輔酶A合成酶表達殖株或結合1^5途徑抑 制殖株)。PCT專利公開號WO 2004/087902所揭示之其他· 基轉移酶序列,於本發明中亦考量其可能用途,在此列為 5 參考資料。 範例12 以下範例係描述於阿拉伯芥中表現編碼裂殖壺菌 PUFA合成酶(〇rfA、〇rffi*與〇rfC)以及HetI之基因,以 及製造PUFA、DHA與DPAn-6 ’在實質上無任一可偵測之中 10 間產物或副產物存在下。 裂殖壺菌OrfA(核苷酸序列由SEQ ID NO : 1代表)、 Orffi*(核苷酸序列由SEQIDNO: 37代表),與〇rfC(核苷酸 序列由SEQIDNO : 5代表),及Hetl(核苷酸序列由SEQID NO : 33代表)係選殖(分別或以各種組合,包括所有4基因於 15 一超級構築體上),至適當之雙價載體上,以引入該基因至 植物上。此構築體與載體之範例描述如下(三個表現構築 體),及範例13(—“超級構築體,,4127)。 之構築:〇rfB*(色素體表現)
Orf B*(編碼SEQ ID NO : 4)係限制選殖於表現基因匣 2〇 上,在flax linin啟動子/終結子控制下(美國專利號 6,777,591)。linin啟動子控制轉殖基因之特定_短暫與組織 特異性表現’在種子發育期間。裂殖壺菌〇rfB*之直接上 游與框内區域為色素體標的序列,衍生自甘藍型油菜 (Brassica napus)醯基-ACP硫酯酶(ρτ-訊號胜肽),將〇rf B* 189 200813222 傳送至色素體。該植物雙價表達載體亦包含一現存之大腸 桿菌磷酸甘露糖異構酶基因(Miles and Guest,1984, Gene 32 : 41-48),由得自荷蘭芹(Petroselinum crispum)之泛素 (ubiquitin)啟動子/終結子驅動(Kawalleck等人,1993,Plant 5 Mol. Bio·, 21 : 673-684),介於左與右邊界序列間,用於陽 性篩選(Haldrup等人,1998, Plant Mol. Biol. 37 : 287-296)。 4107之構築:Hetl邀OrfC(色素體表現) 裂殖壺菌OrfC(核苷酸序列,由SEQIDNO : 5代表)以 及Hetl(核苷酸序列由SEQIDNO : 33代表)係選殖至表現基 10 因盒上,在flax linin啟動子/終結子控制下(美國專利號 6,777,591)。linin啟動子控制轉殖基因之特定-短暫與組織 特異性表現,在種子發育期間。裂殖壺菌Orf C與Hetl之 直接上游與框内區域為色素體標的序列,衍生自甘藍型油
菜(Brassica napus)醯基-ACP硫酯酶(PT-訊號胜肽),將PUFA 15合成酶與PPTase傳送至色素體。二表現基因盒之後組合成 一植物雙價表達載體,含有一pat基因,提供宿主植物膦基 丁胺酸(phosphinothricine)抵抗性(Wohlleben 等人,1988, Gene 70: 25-37)由得自荷蘭芹(Petroselinum crispum)之泛素 (ubiquitin)啟動子/終結子驅動(Kawalleck等人,1993,Plant 2〇 Mol. Bio·,21 : 673-684),介於左與右邊界序列間。 4757之構築:〇rfA(色素體表現) 裂殖壺菌Orf A(核苷酸序列,由SEQ ID NO : 1代表) 係選殖至表現基因盒上,在flax linin啟動子/終結子控制下 (美國專利號6,777,591)。linin啟動子控制轉殖基因之特定_ 190 200813222 短暫與組織特異性表現,在種子發育期間。裂殖壺菌〇rfA 為色素體^的序列’衍生自甘藍型油菜(Brassica napus)醯 基-ACP硫酯酶(PT-訊號胜肽),將pufa合成酶與PPTase傳 送至色素體。表現基因匣係包含於植物雙價表達載體中, 5其含有一叩111基因,提供宿主植物卡那黴素抵抗性,由MAS 啟動子/終結子驅動,介於左與右邊界序列間。 在一範例中,轉殖基因係選殖至三單獨之表現基因盒 上:一構築體命名為5720(含有〇rfB*,係編碼SEQ ID NO : 4)、一構築體命名為4107(含有〇rfC,係編碼SEQ TD NO: (S, 10與Hetl,係編碼SEQ ID NO ·· 34),以及一構築體命名為 4757(包含〇rfA,包含SEQ ID NO : 2),如上所述。在每一 構築體中’基因係選殖。為了引導蛋白質至色素體中,額 外之5’序列係編碼一色素體標的序列,衍生自荷蘭芹 (Petroselinum crispum)之醯基-ACP硫酯酶,係直接位於〇rfs 15 A、B*、C與Hetl之上游。經編碼標的胜肽之胺基酸序列 為:MLKLSCNVTNHLHTFSFFSDSSLFIPVNRRTLAVS(SEQ ID NO : 81)。編碼此胜肽之核苷酸序列係置於讀框内,起 使密碼子為甲硫胺酸,在每一PUFA合成酶Orf中,Het I之 起使密碼子為人造(ATG)。在其他構築體中,其中PUFA合 20 成酶之位置係以植物細胞之細胞質為標的,無額外之蛋白 質編碼序列係附於Orfs之5’端。 標準方法係用於引入該基因於阿拉伯芥中(浸蘸(floral dipping)至含有適當載體之阿拉伯芥殖株懸浮液中,如 Clough等人,1998, Plant J. 16 : 735-743所述)。該方法之細 191 200813222 節係描述於下面範例13。由這些植物獲得之種子係種植於 選擇性培養基上,並使其發芽。某些成長中植物係生長至 成熟,並分析種子之PUFA含量。基於PUFA含量,這些種 子之一部分係進行至下一代。由這些植物獲得之匯集種子 係刀析其月曰肪酸含置。這些基因轉殖植物中之標的PUFa為 一十二碳六烯酸(DHA)與二十二碳五烯酸(DpAn_6),其為由 裂殖壺菌PUFA PKS系統製造之主要PUFA所衍生,其中該 基因係用於轉型該植物。 一示範性基因轉殖植物株之脂肪酸分析範例係示於第 10 13圖。第13圖上圖顯示野生型阿拉伯芥種子典型之脂肪酸 为佈,以匯集種子樣本製備之FAME代表,其經由Gc分離 與FID偵測。主要脂肪酸為:16 : 〇、18 : 〇、16 : 1、18 : 1、 20 · 1、20 : 2與22 : 1。無DHA或DPA n-6出現於野生型種 子樣本中。 15 第13圖之下圖顯示一示範性基因轉殖阿拉伯芥株(品 系263)之脂肪酸分佈,其表現裂殖壺菌puFA合成酶基因 與Het I基因,自三個分離之表現基因盒(572〇、41〇7與4757) 引入’所有皆以色素體為標的,如上所述。參照品系263之 脂肪酸分佈,可立即觀察到二FAME尖峰係出現於轉殖植物 20種子之分佈中,而非出現於野生型種子之分佈中。此二尖 峰之沖提態樣確實反應於真正之DHA與DPAn-6沖提情況 (使用製備自裂殖壺菌油類之FAME作為標準物,以及商業 上可購自NuCheckPrep之DHA標準物)。在此特定範例中, 該DHA尖峰代表〇·8%之總計算FAME,而DPAn-6尖峰代表 192 200813222 1.7%。新PUFA之總和為2.5%總FAME。 其他基因轉殖植物品系之實驗產生類似之結果。舉例 而言,另一轉殖基因品糸’命名為269 ’其以與263品系相 同之構築體與類似之方法轉型,製造約〇·75%總計算FAME 5 之DHA,以及1.41%總計算FAME之DPAn-6(資料未顯示)。 此外,多個使用上述相同核酸分子之其他轉殖基因阿 拉伯芥,亦製造標的PUFA,不論其使用PUFA PKS基因與 Hetl PPTase分離構築之構築體、合併之構築體,或單一超 級構築體(資料顯示於範例13)。 10 此外,將PUFA PKS基因傳送至細胞質之基因轉殖植 物,皆表現出標的PUFA(資料未顯示)。舉例而言,表現裂 殖壺菌PUFA PKS與Hetl於細胞質中之植物品系,係引入 至三個分離之表現基因盒,如上所述(無色素體標的序列), 係製造約0.45% DHA與約0.8% DPA,佔總FAME之比例。在 15另一範例中,表現裂殖壺菌PUFA PKS與Hetl於細胞質中植 物,係引入至一超級構築體上(類似於下列範例丨3所述),製 造約0.2-0.3%DHA與約〇.5%DPA,佔總FAME之比例。 DHA與DPAn-6在種子脂肪酸分佈中之出現係示於第 13圖(並於其他轉殖殖株中觀察到,某些如上所述),顯示有 20引入裂殖壺菌PUFA合成酶系統功能,當表現於植物細胞 中時,且該蛋白質可以色素體為標的。此外,本發明人確 認該蛋白質可以細胞質為標的,或以色素體與細胞質二者 為標的’製造PUFA。如同其他宿主中之生化與異源性表現 數據(例如,於大腸桿菌與酵母菌中),在轉殖植物種子分佈 193 200813222 中僅偵測到之新脂肪酸為DHA或DPA n-6(亦即,該脂肪酸 分佈實質上不含污染之中間產物或副產物,得自PUFA產生 酵素系統),更進一步說明在植物製造PUFA方面,PUFA PKS 系統較標準路徑酵素佳。 5 簸例13(a)— 13⑴ 以下範例係描述使用此述各種策略(包括策略之結 合),以增加植物中PUFA之製造及/或累積。 特別是,以下範例描述在阿拉伯芥種子中表現編$馬裂 殖壺菌PUFA合成酶(nOrfA、OrfB*與nOrfC)之基因,以及 10 Het I,單獨或與其他附屬蛋白質結合,與/或基因修飾策 略,以增強PUFA之製造與累積。特別地,該裂殖壺菌 PUFA合成_與Het I係單獨表現於植物中,或與:⑴編碼醯 基-CoA合成酶(ACS)之基因,或(2)用於抑制内生性FAS活性 之基因元素結合。此外’亦展示合併使用裂殖壺菌PUfa 15 合成酶與HetI,以及表現ACS基因,與用於抑制内生性FAS /舌性之基因元素’之範例。最後,醯基轉移酶,包括dagat 與/或LPAAT ’之表現範例,單獨或與一或多種醯基_〔〇八合 成酶’以及用於抑制内生性FAS活性之基因元素合併,係描 述如下。此述指出之策略係說明了執行先前植物範例中所 2〇 描述概念之能力。 範例13(aV(j^材料與古冰 ⑴構築f 後乘體: Ρ,Τ-訊號胜肽:nORFA、ΡΤ·訊號 胜肽· nORFB *、ΡΤ-訊號胜肽:HetI、ρτ-訊號胜肽:n〇RFC(裂 194 200813222 殖壺菌PUFA合成酶,具有Hetl之色素體標的表現) 裂殖壺菌原始0rfA(n0rfA,由SEQ ID NO ·· 1代表, 係編碼 SEQ ID NO · 2)、合成(再合成,由 seq ID NO : 37代表,係編碼SEQ ID NO : 4),及原始 5 0rfc(n〇rfC,由 SEQ ID NO : 5代表,並編碼SEQ ID NO : 6),以及來自Nostoc之Hetl(由SEQ ID NO: 33代表並編碼 SEQ ID NO : 34),係選殖於表現基因盒上,在f|ax linin啟 動子/終結子控制下(清見美國專利號No· 6,777,591,啟動子 /終結子方面)。linin啟動子控制轉殖基因之特定_短暫與組 10織特異性表現,在種子發育期間。裂殖壺菌〇rfs A、b*、 C與Hetl之直接上游與框内區域為色素體標的序列,衍生 自甘藍型油菜(Brassica napus)醯基-ACP硫酯酶(於此係指 一PT-訊號胜肽,其胺基酸序列係由seqIDn〇: 81代表), 描述於範例12,PUFA合成酶與PPTase標的為色素體。所有 15四種表現基因盒係組合至一植物雙價表達載體上,其含有 pat基因,提供宿主植物膦基丁胺酸抵抗性(w〇hUeben等 人 ’ 1988,Gene 70 : 25-37),由得自荷蘭芽(petroseiinum crispum)之泛素啟動子/終結子驅動(Kawalleck等人,1993,
Plant Mol· Bio” 21 : 673-684),介於左與右邊界序列間。 20 之構i : ACS_1(細胞質表現) 為了表現醯基-CoA合成酶,係構築單獨之植物雙價表 達載體,以表現裂殖壺菌ACS-1之核酸序列(SEQ ID NO ·· 82 ’係編碼SEQ ID NO : 83)。ACS-1,5’與3’端經改造具 有適當之限制酶位置,係係經選殖與定序。ACS-12後經限 195 200813222 制選殖至表現基因匣(expression cassette)中,在flax linin啟 動子/終結子(美國專利號6,777,591)控制下,至植物雙價表 達載體中,其含有大腸桿菌之磷酸甘露糖異構酶基因(Miles and Guest, 1984,Gene 32 : + 41-48),由得自荷蘭芹 5 (Petroselinum crispum)之泛素啟動子/終結子驅動 (Kawalleck等人,1993, Plant Mol· Bio·,21 : 673-684),介於 左與右邊界序列之間,用於陽性篩選(Haldrup等人,1998, Plant Mol· Biol· 37 : 287-296)。 類似之構築體亦製造,以表現醯基-CoA合成酶,於此 10 分別稱之為 ACS_2(SEQ ID NO : 84/85)與 ACS-8(SEQ ID NO : 96/97),5724與5730。在一觀點中,該醯基-CoA合成 酶序列結合編碼DAGAT(SEQ ID NO : 100/101)與/或 LPAAT(SEQ ID NO : 102/103/104)之核酸,如下所述。 红?7之構築KASIIRNAi,具有CHSA内含子(具有内 15 含子之KAS II RNAi之細胞質表現) 就FAS抑制而言,個別植物雙價表達載體係構築以降低 KAS II之表現。在此情況下,由Atlg7496〇位點編碼之細 胞核編碼KAS II轉錄子之499 bp區域(Carlsson等人,2002, Plant J· 29 : 761_77〇),係以RNA干擾(RNAi)為標的,其具 20有干擾内s子’竹生自镑牽牛花(petunia chalcone)合成酶 A(CHSA)基因(McGinnis 等人,2〇〇5,Meth〇ds 比 Enzymology 392 : ; K〇es 等人,1989, Gene 81 : 245-257)。具有 CHSAr 含子之 KAS n RNAi(由 SEQ ID NO · 122代表)係選殖至植物雙價表達載體上,介於linin啟 196 200813222 動子/終結子間(美國專利號6,777,591),於含有大腸桿菌鱗 酸甘露糖異構酶基因之植物雙價表達載體中(Miles and Guest, 1984, Gene 32 : 41-48),由得自荷蘭芽(petroselinum crispum)之泛素啟動子/終結子驅動(Kawalleck等人,1993, 5 Plant Mol· Bio·,21 : 673-684),介於左與右邊界序列間,用 於陽性篩選(Haldrup等人,1998,Plant Mol. Biol. 37 : 287-296) 〇 57?_9之構築:KAS III反義股RNA(KAS III反義股 RNA之細胞内表現) 10 就FA S抑制而言,個別植物雙價表達載體係構築以降低 KAS III之表現。在此情況下,衍生自由Atlg62640位點編 碼之細胞核編碼反義股KAS III序列轉錄子之1210 bp(Yamada專人 ’ 2002, GenBank Accession AY091275)係為 標的。KAS III反義股序歹,j(於此係由seQ ID NO: 125代表) 15係選殖於植物雙價表達載體上,介於linin啟動子/終結子間 (美國專利號6,777,591),於含有大腸桿菌磷酸甘露糖異構酶 基因之植物雙價表達載體中(Miles and Guest,1984, Gene 32 · 41-48) ’ 其由得自荷蘭芹(petr〇seiinum criSpum)之泛素 啟動子/終結子驅動(Kawalleck等人,1993, Plant Mol. Bio., 2〇 21 : 673-684),介於左與右邊界序列間,用於陽性篩選 (Haldrup等人,1998, Plant Mol· Biol. 37 : 287-296)。 ACS_1與具有内含子之KASIIRNAi(細 胞質表現) 就表現醯基-CoA合成酶,合併FAS抑制而言,個別之 197 200813222 植物雙價表達載體係構築以降低KAS II之表現,並表現裂 殖亞囷ACS_1之核酸序列(SEQ ID NO : 82,係編碼SEQ ID NO · 83)。就此構築體而言,ACS-1與具有内含子之KAS II RNAi之雙重表現基因[£係表現,在fjax Hnin啟動子/終結子 5 (美國專利號6,777,591)控制下,其選殖至含有大腸桿菌磷酸 甘露糖異構酶基因之植物雙價表達載體上(Miles and Guest, 1984, Gene 32 · 41-48) ’ 由得自荷蘭芹(Petroselinum crispum) 之泛素啟動子/終結子驅動(Kawalleck等人,1993, Plant Mol. Bio.,21 : 673-684),介於左與右邊界序列間,用於陽性篩 10 選(Haldrup等人,1998, Plant Mol· Biol. 37 : 287-296)。 1712之構築:ACS_1與反義股KASII(細胞質表現) 就表現醯基-CoA合成酶,合併FAS抑制而言,個別植 物雙價表達載體係構築以降低KAS II之表現,並表現裂殖 壺菌ACS-1之核酸序列(SEQ ID NO : 82,編碼SEQ ID NO : 15 83)。就此構築體而言,ACS-1與具有内含子之KAS II RNAi 之雙重表現基因匣係表現(KASII反義股序列係由SEQ ID NO : 123代表),在flax linin啟動子/終結子(美國專利號 6,777,591)控制下,其選殖至含有大腸桿菌磷酸甘露糖異構 酶基因之植物雙價表達載體上(Miles and Guest,1984, Gene 20 32 : 41-48),由得自荷蘭芹(Petroselinum crispum)之泛素啟 動子/終結子驅動(Kawalleck等人,1993,Plant Mol· Bio·, 21 : 673-684),介於左與右邊界序列間,用於陽性篩選 (Haldrup等人,1998, Plant Mol. Biol. 37 : 287-296)。 5733之構築:ACS-1與KAS 11111麗(細胞質表現) 198 200813222 就表現at基-CoA合成酶,合併FAS抑制而言,個別植 物雙價表達載體係構築以降低KAS III之表現,並表現裂殖 壺菌ACS-1之核酸序列(SEq id NO : 82,編碼SEQ ID NO : 83)。就此構築體而言,Acs-l與具有内含子之KAS IIIRNAi 5之雙重表現基因匣係表現,(KASIIIRNAi序列係由SEQID NO : 124代表),在flax Hnin啟動子/終結子(美國專利號 6,777,591)控制下,其選殖至含有大腸桿菌磷酸甘露糖異構 _基因之植物雙價表達載體上(Miles and Guest,1984, Gene 32 · 41-48) ’由得自荷蘭芹(petr〇seHnum criSpum)之泛素啟 10 動子/終結子驅動(Kawalleck等人,1993,Plant Mol. Bio., 21 : 673-684),介於左與右邊界序列間,用於陽性筛選 (Haldrup等人,1998, Plant Mol· Biol· 37 : 287-296)。 公_34之構築_ : ACS-1與KAS III反義股RNA(細胞質表現) 就表現醯基-CoA合成酶,合併FAS抑制而言,個別植 15物雙價表達載體係構築以降低KAS III之表現,並表現裂殖 壺菌ACS-1之核酸序列(SEQ ID NO ·· 82,編碼SEQ ID NO : 83)。就此構築體而言,ACS-1與具有内含子之KAS III RNAi之雙重表現基因匣係表現,在fjax iinin啟動子/終結子 (美國專利號6,777,591)控制下,其選殖至含有大腸桿菌磷酸 20甘露糖異構酶基因之植物雙價表達載體上(Miles and Guest, 1984, Gene 32· 41-48),由得自荷蘭芹(Petroselinum crispum) 之泛素啟動子/終結子驅動(Kawalleck等人,1993, Plant Mol. Βιο·,21 : 673-684),介於左與右邊界序列間,用於陽性篩 選(Haldrup等人,1998, Plant Mol. Biol. 37 : 287-296)。 199 200813222
避 · DAGAT 就DAGAT之表現而言,個別之植物雙價表達載體係構 築’以表現裂殖壺菌DAGAT-1(SEQ ID NO : 100,係編碼
SEQIDNO: 1〇1)。裂殖壺菌dAGAT(核酸序列係由SEQID 5 N0 : 100代表)係選殖於表現基因盒上,在flaxlinin啟動子/ 終結子(美國專利號6,777,591)控制下。linin啟動子控制轉 殖基因之特定-短暫與組織特異性表現,在種子發育期間。 表現基因E係包含於植物雙價表達載體内,其含有叩⑴基 因,可提供宿主植物卡那黴素抵抗性,由MAS啟動子/終結 10子驅動,介於左與右邊界序列間。 1294之構築:dAGAT盥 ACS-8 就DAGAT與醯基-CoA合成酶之表現而言,個別之植物 雙價表達載體係構築以表現:(1)裂殖壺菌DAGAT之核酸 序列(SEQIDNO : 1〇〇,係編碼SEQIDNO : 101),以及(2) 15裂殖壺菌ACS-8之核酸序列(SEQ ID NO:96,係編碼SEQ ID NO : 97)。就此構築體而言,ACS-8與DAGAT之雙重表現 基因匣係表現,在flax linin啟動子/終結子(美國專利號 6,777,591)控制下,其選殖至含有nptII基因之植物雙價表 達載體上,其提供宿主植物卡那黴素抵抗性,由MAS啟動 20 子/終結子驅動,介於左與右邊界序列間。
4295之構签:LPAAT與DAGAT 就LPAAT與DAGAT之表現而言,個別之植物雙價表達 載體係構築以表現:(1)裂殖壺菌LPAAT之核酸序列(SEQ ID NO : 103,編碼SEQ ID NO : 104,以及(2)裂殖壺菌 200 200813222 DAGAT-1之核酸序歹丨J(SEQ ID NO : 100,係編碼SEQ ID NO : 101)。就此構築體而言,LPAAT與DAGAT之雙重表現 基因匣係表現,在flax linin啟動子/終結子(美國專利號 6,777,591)控制下,其選殖至含有nptII基因之植物雙價表 5 達載體上,其提供宿主植物卡那黴素抵抗性,由MAS啟動 子/終結子驅動,介於左與右邊界序列間。 4796之構築:ACS-8、LPAAT與DAGAT 就醯基-CoA合成酶、LPAAT與DAGAT之表現而言,個 別之植物雙價表達載體係構築以表現:(1)裂殖壺菌LPAAT 1〇 之核酸序列(SEQ ID NO : 103,係編碼SEQ ID NO : 8104), (2)裂殖壺菌DAGAT-1之核酸序列(SEQ ID NO : 100,係 編碼SEQ ID NO : 101),以及(3)裂殖壺菌ACS-8之核酸序 列(SEQIDNO : 96,係編碼SEQIDNO : 97)。就此構築體 而言,ACS-8、LPAAT與DAGAT之三重表現基因匣係表現, 15 在flax Hnin啟動子/終結子(美國專利號6,777,591)控制下, 其選殖至含有nptII基因之植物雙價表達載體上,其提供宿 主植物卡那黴素抵抗性,由mas啟動子/終結子驅動,介於 左與右邊界序列間。 (2) 阿拉伯芥之韓型 20 所有植物雙價載體之整體性,係以診斷性限制切割與 序列分析而確定。分離出之質體係用以使農桿菌株EH101 勝任株轉型(Hood et al·,1986, J· Bacteriol· 144 : 732-743), 使用電破法(25 gF,2.5 kV, 200 Ω)。重組農桿菌係置於AB-壯觀黴素(spectinomycin)/卡那黴素(kanamycin)(20x AB 鹽 201 200813222 類、2 Μ 葡萄糖、0.25 mg/ml FeSo4 7H2〇、1 M MgSo4、1 Μ CaCl2),單一殖株用於接種5 ml之ab-壯觀黴素 (spectinomycin)/卡那黴素(kanamycin)溶液。這些培養物係 成長於28C至隔日。含有4127質體之重組農桿菌係用於使 5野生型C24阿拉伯芥植物轉型,利用花序浸潰法(fl0wer dipping)(Clough et al·,1998, Plant J· 16 : 735-743)。由這些 植物獲得之種子係置於選擇性基質上,在膦基丁胺酸存在 下,並允許發芽。經陽性辨識出之幼苗係轉移至土壤中至 成熟,在種子經PUFA含量分析之後。 10 就含有其他質體之重組農桿菌而言(5723,5724,5730, 5727, 5729, 5731,5732, 5733, 5734, 4793, 4794, 4795,及/ 或4796),基因轉殖4127_品系15〇阿拉伯芥係使用花序浸 潰法再轉型(Clough etal·,1998, Plant J. 16:735-743)。由這 些植物獲得之種子係置於選擇性培養基上,在膦基丁胺酸 15與甘露醣存在下,進行雙重篩選,或膦基丁胺酸、甘露醣 與卡那黴素存在下,進行適當處之三重篩選,並允許其發 芽。陽性辨識出之幼苗係轉移至土壤中至成熟,之後種子 經PUFA含量分析。 範例 13a 20 _例係描述於轉殖阿拉伯芥種子中,其表現超級構 築體(4127)上之裂殖壺菌pUFA合成酶(〇rfA、*與^忙) 與Hetl,製造DHA與DPAn-6 〇 得自表現裂殖壺菌PUFA合成酶(〇rfA、〇116*與〇^〇 與Het 1(構築體4127)之阿拉伯芬之匯集種子中,進行 202 200813222 GC-FAME分析,顯示產生明顯量之標的PUFA、DHAn-3與 DPAn-6,於其脂肪酸内容物中。如表3所示,某一株(4127-品系150)特別具有0.6% DHAn_3與0.7% DPAn-6,就合併之 1.3%裂殖壺菌型PUFA内容物而言。如預期的,得自野生 5 型背景(C24)之控制組種子並不含可偵測量之DHAn_3或 DPAn-6°4127-品系150後續之表現分析係以SDS-PAGE與西 方墨潰法分析,顯示該重組種子表現有OrfA、Orffi*、OrfC 與Het I,正確的傳送至色素體(資料未顯示)。此外,表型 相當穩定,由T2代分析至T4代,可作為一陽性控制組,決 10 定DHA與裂殖壺菌PUFA之量,在使用此述各種策略(包括 策略之結合)評估該植物中PUFA之製造及/或堆積是否有 增加時。 表3_在成熟野生型阿拉伯芥種子中之DHA與DPA含 量’與表現裂殖壺菌(Schizochytrium)PUFA合成酶以及 15 Hetl(色素體標的)轉殖種子相較,於T2與T4匯集種子分佈 中,其選自膦基丁胺酸陽性植物。DHAn-3與DPAn-6之百 分比,係在進行總計算值FAME分析,使用GC分離與FID偵 測之後決定。 策略 丨::s;丨 品糸 代 表型 %DHA( C22 : 6 n-3) %DPA(C 22 : 5 n-6) %DHA + DPA 陰性控制 組 野生型(匯集 之種子) C24生態 型 N/A 0 0 0 PUFA合成 酶 + Hetl OrfA,OrfB*, OrfC, Hetl (匯集之種子) 4127-品系 150 T2 0.6 0.7 1.3 T4 0.6 0.6 1.2 203 200813222 範例13b 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(OrfA、OrfB* 與〇rfC)與 Het 1(4127),結合裂殖壺菌(Schizochytrium)ScACS-l 基因 5 (5723)或ScACS-2基因(5724),DHAn-3與DPAn-6之製造。 衍生自4127-品系150之植物(請見範例13a)係用於引入 ScACS-1構築體(5723)或ScACS-2構築體(5724),使用農桿 菌-媒介之轉型,如上所述。在膦基丁胺酸與甘露醣存在下 篩選重組植物後,種子係經收穫並分析脂肪酸分佈,使用 10 匯集種子製備之FAMES進行GC分析與F1D偵測。 舉例而言’特別表現裂殖壺菌(Schizochytrium)PKS與 Hetl,結合ACS_l(4127/5723-品系514)之特定品系,具有 1.5% DHA與0.9% DPAn-6,在總脂肪酸分佈之合併2.4%裂 殖壺菌(Schizochytrium)PUFA含量中(表4)。此代表DHAn-3 I5 含量2.5倍增加,與4127-品系150陽性控制組相較。類似之 結果在表現有裂殖壺菌(Schizochytrium)PKS與Hetl,結合 ACS-2(4127/5724-品系552)之特定品系中觀察到,其在 DHAn-3含量上具有1.8倍增加,與陽性控制組相較。此外, DHA比DPA之比例由4127-品系150之T2代之約0.85 : 1.0, 20 或T4代之約1.0: 1.〇,變動為ACS-1之1.7: 1.0,與ACS-2品 系之1.2 : 1.0。在所有分析之轉殖種子中,在分佈中僅偵測 到之新脂肪酸為DHA n-3或DPA n-6。 表4·在成熟野生型,與表現裂殖壺菌 (Schizochytrium)PUFA合成酶以及Hetl(色素體標的)之轉殖 204 200813222 阿拉伯芥種子中,DHAn-3與DPAn-6之含量,與結合表現裂 殖壺菌(Schizochytrium)PUFA合成酶以及Hetl(色素體標 的),以及裂殖壺菌(Schizochytrium)ACS-l或ACS-2之轉殖 種子相較,在匯集種子中。DHAn-3與DPAn-6之百分比, 5 係在進行總計算值FAME分析,使用GC分離與FID偵測之後 決定。 表型 桌略 基因型 品系 代 %DHA( C22 : 6 n-3) %DPA(C 22 : 5 n-6) %DHA + DPA 陰性控制組 野生型 (匯集種子) C24生態 型 N/A 0 0 0 陽性控制組 OrfA, OrfB*, OrfC,Hetl (匯集種子) 4127-品 T2 0.6 0.7 1.3 系150 T4 0.6 0.6 1.2 醯基CoAS 表現 OrfA,OrfB*, OrfC,Hetl, ACS-1(匯集種 子) 4127/572 3 -品糸 514 T4/T2 1.5 0.9 2.4 OrfA,OrfB*, OrfC,Hetl, ACS-2 (匯集種子) 4127/572 4- 品糸 552 1.1 0.9 2.0 麗例13c 10 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(〇rfA、〇rfB* 與〇rfc)與 Het I’合併FAS抑制,經由降低KAS II,使用RNA干擾(RNAi) 而達成,DHA與DPAn_6之製造。 衍生自4127-品系150之植物係用於引入具有内含子之 15 KAS Π RNAi(構築體5727),使用農桿菌-媒介之轉型,如上 所述。在膦基丁胺酸與甘露醣存在下篩選重組植物後,種 205 200813222 子係經收穫並分析脂肪酸分佈,使用匯集種子製備之 FAMES進行GC分析與HD偵測。 舉例而言,一特定品系(4127/5727-品系1〇97)具有1.3% DHA n-3與1.2% DPA η·6,在總脂肪酸分佈之合併2·5%裂殖 5壺菌(Schizochytrium)PUFA含量中(表5)。此代表DHA含量 大於2.1倍之增加,與4127_品系15〇陽性控制組相較。之後, 得自4127/5727_品系1097之單一種子係個別地進行總計算 值FAME分析,使用GC分離與FID偵測。 分析之後,觀察到此族群中之種子具有至多2 0〇/〇 10 〇ΗΑη·3與1_6% DPAn-6,在總脂肪酸分佈之合併3·6%裂殖 壺菌(Schizochytrium)PUFA含量中(表5)。此代表DHA含量 3·3倍之增加,在裂殖壺菌(gchizochytrium)puFA含量方 面’與4127-品系150陽性控制組相較◦此外,係觀察到dhA 比DPA之比例由4127-品系150 T2代之〇.85 :⑶或^代之 15 1·〇 · 1·〇 ’變動為FAS抑制品系之1·25 : 1·〇或更多。單一 種子之平均值係與匯集樣本一致,在%DHAn-3、%DPAn-6 與總%(DHA+DPA)方面,此族群中不同處係由於共轉型種 子中4127與5727位點之分離所造成。在所有分析之轉殖種 子中’在分佈中僅偵測到之新脂肪酸為DHA n-3或DPA n-6。 20 表5·在成熟野生型,與表現裂殖壺菌 (Schizochytrmm)PUFA合成酶以及Hetl(色素體標的)之轉殖 阿拉伯芥種子中,DHA與DPA之含量,與結合表現裂殖壺 菌(Schizochytrium)PUFA合成酶以及Hetl(色素體標的),以 及KAS II降低之轉殖種子相較,在匯集種子中。DHAn-3與 206 200813222 DPAn-6之百分比’係在進行總計算值FAme分析,使用GC 分離與FID偵測之後決定。 策略 基因型 品系 代 表型 %DHA( C22 : 6 n-3) %DPA(C 22 : 5 n-6) %DHA + DPA 陰性控制 組 野生型(匯 集種子) C24生 態型 N/A 0 0 0 陽性控制 組 OrfA, Orffi *, OrfC,Hetl (匯集種子) 4127-品 系150 T2 0.6 0.7 1.3 T4 0.6 0.6 1.2 FAS抑制 OrfA, Orffi *, OrfC,Hetl, KAS II RNAi,具 有内含子 (匯集種子) 4127/572 7-品系 1097 T4/T2 1.3 1.2 2.5 OrfA, Orffi *, OrfC,Hetl, KAS II RNAi,具 有内含子 (單一種子) 1097-7 0.7 0.7 1.4 1097-9 0.7 0.8 1.5 1097-2 1097-5 1 1097-6 1097-1 1097-8 0.9 0.9 1.8 1.0 0.9 1.9 1.0 1.1 2.1 1.2 1.3 2.5 1.3 1.3 2.6 1097-4 1.4 0.8 2.2 1097-10 1.4 1.2 2.6 1097-3 2.0 1.6 3.6 單一種子 平均值 T4/T2 1.2 1.0 2.2 5 範例13d 本範例係描述於於轉殖阿拉伯芬種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(〇rfA、Orffi* 與〇rfC)與 Het 1(4127),結合FAS抑制,經由使用反義股RNA而降低 KAS III 〇 207 200813222 衍生自4127-品系150之植物係用於引入KAS III反義 股構築體(5129),使用農桿菌-媒介之轉型,如上所述。在 膦基丁胺酸與甘露醣存在下筛選重組植物後,種子係經收 穫並分析脂肪酸分佈,使用匯集種子製備之FAMES進行GC 5 分析與FID偵測。 舉例而言,一特定品系(4127/5729-品系1087)具有1.7% DHAn-3與1.2% DPAn-6,在總脂肪酸分佈之合併2.9%裂殖 壺菌(Schizochytrium)PUFA含量中(表6)。此代表DHA含量 大於2.8倍之增加,與4127-品系150陽性控制組相較。 10 之後,得自4127/5729-品系1〇87之單一種子係個別地 進行總計算值FAME分析,使用GC分離與FID偵測。分析之 後’觀察到此族群中之種子具有至多2.4% DHA n_3與1.8% DPA n-6,在總脂肪酸分佈之合併4·2%裂殖壺菌 (Schizochytrium)PUFA 含量中(表6)。此代表DHA 含量3.2 15倍之增加’以及裂殖壺菌(Schizochytriiim)PUFA含量4倍之 增加,與4127_品系150陽性控制組相較。此外,係觀察到 DHA比DPA之比例由4127-品系150 T2代之0.85: 1.0或T4 代之1_0 : 1·0,變動為FAS抑制品系之ι·33 : 1.0或更多。 單一種子之平均值係與匯集樣本一致,在%〇11八11-3、%〇?八 20 11-6與總%(011八+ DPA)方面,此族群中不同處係由於共轉 型種子中4127與5729位點之分離所造成。在所有分析之轉 殖種子中’在分佈中僅偵測到之新脂肪酸為DHAn_3或DPA n-6,如同先别大腸桿菌與酵母菌中觀察到的生化與異源性 表現數據。由分析種子樣本1〇87-7獲得之GC_FAME層析 208 200813222 圖,係列於第14圖。 表6·在成熟野生型,與表現裂殖壺菌 (Schizochytrium)PUFA合成酶以及Hetl(色素體標的)之轉殖 阿拉伯芥種子中,DHA與DPA之含量,與結合表現裂殖壺 5 菌(Schizochytrium)PUFA合成酶以及Hetl(色素體標的),以 及KAS III降低之轉殖種子相較,在匯集種子與單一種子 中。DHAn-3與DPAn-6之百分比,係在進行總計算值FAME 分析,使用GC分離與HD偵測之後決定。 策略 基因型 品糸 代 表型 %DHA( C22 ·· 6 n-3) %DPA( C22 ·· 5 n-6) %DHA + DPA 陰性控制 組 野生型(匯集 種子) C24生態 型 N/A 0 0 0 陽性控制 組 OrfA,Orffi*, OrfC,Hetl (匯集種子) 4127-品 系150 T2 0.6 0.7 1.3 T4 0.6 0.6 1.2 FAS抑制 OrfA, Orffl*, OrfC, Hetl, KAS III 反 義股RNA (匯集種子) 4127/572 9-品糸 1087 T4/T2 1.7 1.2 2.9 OrfA,OrfB*, OrfC,Hetl, KAS III 反 義股RNA (單一種子) 1087-9 0.9 1.0 1.9 1087-4 1.0 1.1 2.1 1087-2 1.1 0.9 2.0 1087-6 1.2 0.6 1.8 1087-1 1.3 1.1 2.4 1087-8 1.4 1.5 2.9 1087-3 1.7 1.1 2.8 1087-10 1.8 Γ 1.6 3.4 1087-5 2.0 1.6 h 3.6 1087-7 2.4 1.8 4.2 單一種子 平均值 T4/T2 1.5 1.2 2.7 209 200813222 範例13e 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 3?囷(Schizochytrium)PUFA合成酶(OrfA、OrfB* 與OrfC)與
Hetl,合併ScACS-1基因之表現與FAS抑制,經由使用反義 5股狀八降低KAS 111而達成,DHA與DPAn-6之製造。 衍生自4127·品系150之植物,係用於引入ScAesq與 KAS II RNAi,使用構築體5731,農桿菌-媒介之轉型,如 上所述。在膦基丁胺酸與甘露醣存在下篩選重組植物後, 種子係經收穫並分析脂肪酸分佈,使用匯集種子製備之 10 FAMES進行GC分析與FID偵測。 舉例而言,一特定品系(4127/5731-品系1366)具有ι·9〇/0 DHA與1.9%DPAn-6,在總脂肪酸分佈之合併38%裂殖壺菌 (SchiZ〇Chytrhnn)PUFA含量中(表7)。此代表3 2倍之增加, 與4127-品系150陽性控制組相較、13倍之增加,與 15 4127/5723-品系514之單-ACS]策略相較、15倍之增加, 與4U7/5727-品系之1097單一 KAS n RNAi降低策略相 較,當分別與範例13b與13c(表4與5)匯集種子族群之加八 含量相較時。 吾人會預期在此族群之單—種子中觀察到較高含量之 2〇 DHA,對應於在匯集種子中化7與5?31位點之分離。在所 有分析之轉錄子巾,在分佈中僅制狀新脂肪酸為 DHAn3$ An6如同⑸大腸桿菌與酵母菌中觀察到 的生化與異源性表現數據。由分析匯集種子樣本4127/5731 品系㈣獲得之GC-F侧層析圖,係列於第Η圖。 210 200813222 表7·在成熟野生型,與表現裂殖壺菌 (Schizochytrium)PUFA合成酶以及Hetl(色素體標的)之轉殖 阿拉伯芥種子中,DHAn-3與DPAn-6之含量,結合表現裂殖 壺菌(Schizochytrium)PUFA合成酶以及Hetl(色素體標的), 5 以及裂殖壺菌(Schizochytrium)ACS-l表現與KAS III降低 之轉殖種子相較,在匯集種子中。DHAn-3與DPAn-6之百 分比,係在進行總計算值FAME分析,使用GC分離與FID偵 測之後決定。 策略 基因型 品系 代 表型 %DHA( C22 : 6 n-3) %DPA( C22 : 5 η-6) %dha + dpa 陰性控制 組 野生型(匯集 種子) C24生 態型 N/A 0 0 0 陽性控制 組 OrfA, OrfB*, OrfC,Hetl (匯集種子) 4127-品 系150 T2 0.6 0.7 1.3 T4 0.6 0.6 1.2 醢基Co AS 表現與FAS 抑制 OrfA, OrfB*, OrfC, Hetl, ACS-1, KAS II RNAi(匯 集種子) 4127/57 31 -品糸 1366 T4/T2 1.9 1.9 3.8 _ 範例13f 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(OrfA、Orffl* 與 OrfC)與 Hetl,合併LPAAT之表現,DHA與DPAn_6之製造。 衍生自4127-品系150之植物係用於引入LPAAT構築體 (5725),使用農桿菌-媒介之轉型,如上所述。在膦基丁胺 211 200813222 酸與甘露醣存在下筛選重組植物後,種子係經收穫並分析 脂肪酸分佈,使用匯集種子製備之FAMES進行GC分析與 FID偵測。 預期得自這些植物之種子將製造標的PUFA(DHA與 5 DPAn-6)。亦預期DHA與/或DPAn-6製造量將增加,與未加 入LPAAT構築體之PUFAPKS-表現植物相較。 範例13g 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(OrfA、Orffi* 與OrfC)與 10 Het I,合併裂殖壺菌(Schizochytrium)DAGAT與ACS-1 表 現’與FAS抑制,經由降低KAS II,使用RNAi而達成,或 經由降低KAS III,使用反義股而達成。 衍生自5731之植物(合併ACS-1之表現與FAS之抑 制’使用KASII RNAi),係用於引入DAGAT構築體(4793), 15使用農桿菌-媒介之轉型,如上所述。類似之植物亦製造於 5734背景上(合併表現ACS-1與抑制FAS,使用KASIII反義 股)。在膦基丁胺酸與甘露醣存在下篩選重組植物後,種子 係經收穫並分析脂肪酸分佈,使用匯集種子製備之FA]VIEs 進行GC分析與FID偵測。 20 預期得自這些植物之種子將製造標的PUFA(DHA與 DPAn-6)。亦預期DHA與/或DPAn-6製造量將增加,與未加 入DAGAT構築體與FAS抑制之PUFA PKS·表現植物相 較0 範例13h 212 200813222 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(〇rfA、Orffi* 與〇rf〇與
Het 1 ’ 合併裂殖壺菌(Schizochytrium)DAGAT與ACS-8表 現’更a併裂殖壺菌(Schizochytrium)ACS-l表現與FAS抑 5制,經由使用RNAi降低KAS II而達成,或經由使用反義股 降低KAS III而達成。 衍生自5731之植物(合併ACS-1之表現與FAS之抑 制’使用KASII RNAi),係用於引入DAGAT/ACS-8構築體 (4794),使用農桿菌_媒介之轉型,如上所述。類似之植物 10亦製造於5734背景上(合併表現ACS-1與抑制FAS,使用 KASIII反義股)。在膦基丁胺酸與甘露醣存在下篩選重組植 物後,種子係經收穫並分析脂肪酸分佈,使用匯集種子製 備之FAMES,進行GC分析與FID偵測。 預期得自這些植物之種子將製造標的PUFA(DHA與 15 DPAn_6)。亦預期DHA與/或DPAn_6製造量將增加,與未加 入DAGAT/ACS-8構築體、ACS-1構築體,與FAS抑制之 PUFAPKS-表現植物相較。 範例13i 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 20 壺菌(Schizochytrium)PUFA合成酶(〇rfA、Orffi* 與OrfC)與 Het I ’合併裂殖壺菌(Schizochytrium)LPAAT與裂殖壺菌 (Schizochytrium)DAGAT表現,更合併裂殖壺菌 (Schizochytrium)ACS-l表現與FAS抑制,經由使用RNAi降 低KAS II而達成,或經由使用反義股降低KAS III而達成。 213 200813222 衍生自5731之植物(合併ACS-1之表現與FAS之抑制, 使用KASII RNAi),係用於引入DAGAT/LPAAT構築體 (4795),使用農桿菌-媒介之轉型,如上所述。類似之植物 亦製造於5734背景上(合併表現ACS-1與抑制FAS,使用 5 KASIII反義股)。在膦基丁胺酸與甘露醣存在下篩選重組植 物後,種子係經收穫並分析脂肪酸分佈,使用匯集種子製 備之FAMES進行GC分析與FID偵測。 預期得自這些植物之種子將製造標的PUFA(DHA與 DPAn-6)。亦預期DHA與/或DPAn-6製造量將增加,與未加 10入DAGAT/LPAAT構築體、ACS-1構築體與FAS抑制之 PUFAPKS-表現植物相較。 範例13i 本範例係描述於於轉殖阿拉伯芥種子中,其表現裂殖 壺菌(Schizochytrium)PUFA合成酶(〇rfA、〇rfB* 與〇rfC)與 15 Het 1,合併裂殖壺菌(Schizochytrium)LPAAT、裂殖壺菌 (Schizochytrium)DAGAT 與裂 殖壺菌 (Schizochytrium)ACS-8 ,更合併裂殖壺菌 (SchizochytHum)ACS-l之表現與FAS抑制,經由使用RNAi 降低KAS II而達成,或經由使用反義股降低KAS m而達成。 20 衍生自5731之植物(合併ACS-1之表現與FAS之抑 制’使用 KASII RNAi),係用於引入DAGAT/LPAAT/ACS-8 構桌體(4796) ’使用農桿菌-媒介之轉型,如上所述。類似 之植物亦製造於5734背景上(合併表現Acs—〗與抑制 FAS,使用KASIII反義股)。在膦基丁胺酸與甘露醣存在下 214 200813222 篩選重組植物後’種子係經收穫並分析脂肪酸分佈,使用 匯集種子製備之FAMES進行GC分析與HD偵測。 預期得自這些植物之種子將製造標的pufa(dha與 DPAn-6)。亦預期DHA與/或DPAn-6製造量將增加,與未加 5 入DAGAT/LPAAT/ACS-8 構築體、ACS-1 構築體與 FAS 抑制之PUFAPKS-表現植物相較。 本發明之各種實施例已經詳細描述,顯而易見地,這 些實施例之修飾與變化可由熟習此技術領域者進行。然 而,應瞭解到此種修飾與變化皆落於本發明範缚中。 10 【圖式簡單說明】 第1圖為螢光影像分析之數位影像,用於分析裂殖壺菌 (Schizochytrium)Ac66株與衍生自該殖株之pUFA-S KO與 FAS KO突變株之不含細胞均質物之體外活性試驗。 第2圖為螢光影像分析之數位影像,用於分析以正相 15 TLC分離之裂殖壺菌(Schizochytrium)FAS-KO株之外活性 試驗。反應於指示時間下進行。 第3圖為螢光影像分析之數位影像,用於分析以正相 TLC分離之裂殖壺菌(Schizochytrium)FAS-KO株之外活性 試驗。係使用標準試驗成分,但變化NADH、NADPH與乙 2〇 醯基-CoA成分(欄1_ NADH/NADPH/乙醯基-CoA,欄2 -NADPH/乙醯基-CoA,才闌3 - NADH/乙醯基-CoA,奸索]4 一 NADH/NADPH,攔 5 -無)。 第4圖為螢光影像分析之數位影像,用於分析以正相 TLC分離之裂殖壺菌(Schizochytrium)FAS-KO株之外活性 215 200813222 試驗。反應係進行10分鐘,之後加入ATP與Mg+2。反應於 底部標示時間終止(“=秒,‘=分鐘)。 第5圖為螢光影像分析之數位影像,用於分析以正相 TLC分離之裂殖壺菌(Schizochytrium)FAS-KO株之體外活 5 性試驗。反應係進行10分鐘,之後加入ATP與Mg+2(除了 樣本1之外),繼續靜置20分鐘(攔3 - 2 uL DMSO,欄4 - 4 uL DMSO,欄 5 - 25 uM Triascin C,欄 6 - 100 uM Triascin C, 欄 7 -200 uMTriascinC)。 第6A圖為FAME分析之數位影像,用於分析表現有裂 10 殖壺菌(Schizochytrium)OrfA、Orffi*、OrfC 與 Het I之大 腸桿菌。標的PUFA在均質物、高速沈澱物分液(P2)、上清 液(S1)與高速上清液(S2)中。 第6B圖為第6A圖所使用之大腸桿菌之樣本分析結 果,除了脂質產物僅以HIP(而非轉換為FAMES)萃取之外, 15 在以TLC分離之前。 第7圖控制組酵母菌與表現有裂殖壺菌 (Schizochytdum)OrfA、Orffi*、〇rfC 與 Het I 之酵母菌之 FAME分佈圖。 第8圖為第1圖酵母菌之FAME分佈圖,延伸說明標的 20 PUFA之製造。 第9圖為FAS活性之抑制對於DHA分佈之影響(為總 FAME之百分比),在表現有裂殖壺菌(Schiz〇chyt^m)puFA 合成酶(sOrfA,sOrffi,〇rfC)與Het ϊ,單獨或與醯基c〇a合成 酶表現組合之酵母菌中。 216 200813222 第10圖為FAS活性之抑制對於DHA與DPAn6分佈之影 響(為總FAME之百分比)’在表現有裂殖壺菌 (Schizochytrium)PUFA 合成酶(s〇rfA,sOrffi,〇rf〇 與 Het I,單獨或與醯基CoA合成酶表現組合之酵母菌中。 5 第Η圖為FAME分佈,顯示抑制fas活性(藉由淺藍菌 素)、裂殖壺菌(Schizochytrium)PUFA合成酶(s〇rfA,sOrffi, OrfC)與Het I之表現’以及酿基CoA合成酶之表現,對於酵 母菌中DHA與DPAn6產生之共同影響。 第12圖顯示剔除DAGAT基因之裂殖壺菌 10 (Schizochytrium)之脂質分佈。 第13圖為野生型阿拉伯芥(Arabidopsis)與品系263(色 素體標的),在種子發育過程中表現有裂殖壺菌 (Schizochytrium) OrfsA,B*,C 與Het I,之FAME分佈。 第14圖來自品系1087-7(色素體標的)之阿拉伯芥種 I5 子’在種子發育過程中表現有裂瘦壺菌(Schizochytrium) Orfs A,B*,C 與Het I,之FAME分佈。 第15圖為品系1366匯集之阿拉伯芬種子,在種子發育 過程中表現有裂殖壺菌(Schizochytrium) Orfs A,B*,C與Het I,標的為色素體,並結合FAS抑制(KAS II RNAi)與ACS-1, 20 之FAME分佈。 【主要元件符號說明】 (無) 217 200813222 序列表 <110> Martek Biosciences Corporation SemBioSys Genetics Inc.
Metz, James G Kuner, Jerry M Lippmeier, Jerry Casey Moloney, Martin Nykiforuk, Cory Lee <120>於異源性生物體中使用多不飽和脂肪酸(puFA)聚酮合成酶系統 製造多不飽和脂肪酸之技術(二) <130〉 2997-114-1 <150> 60/783,205 <151> 2006-03-15 <150〉 60/784,616 <151> 2006-03-21 <160〉 125 <170> Patent In version 3.4 <210〉 1 <211〉 8733
<212〉 DNA <213> 裂愈壺菌(Schizochytrium sp.) <220〉 <221〉 CDS <222〉 (1)..(8733) <400> 1 atg gcg gcc cgt ctg cag gag caa aag gga ggc gag atg gat acc cgc
Met Ala Ala Arg Leu Gin Glu Gin Lys Gly Gly Glu Met Asp Thr Arg 15 10 15 att gcc ate ate ggc atg teg gcc ate etc ccc tgc ggc aeg acc gtg lie Ala lie lie Gly Met Ser Ala lie Leu Pro Cys Gly Thr Thr Val 20 25 30 cgc gag teg tgg gag acc ate cgc gcc ggc ate gac tgc ctg teg gat
Arg Glu Ser Trp Glu Thr lie Arg Ala Gly lie Asp Cys Leu Ser Asp 35 40 45 etc ccc gag gac cgc gtc gac gtg aeg gcg tac ttt gac ccc gtc aag
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys 50 55 60 acc acc aag gac aag ate tac tgc aag cgc ggt ggc ttc att ccc gag
Thr Thr Lys Asp Lys lie Tyr Cys Lys Arg Gly Gly Phe lie Pro Glu 65 70 75 80 tac gac ttt gac gcc cgc gag ttc gga etc aac atg ttc cag atg gag
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gin Met Glu 85 90 95 gac teg gac gca aac cag acc ate teg ett etc aag gtc aag gag gcc
Asp Ser Asp Ala Asn Gin Thr lie Ser Leu Leu Lys Val Lys Glu Ala 100 105 110 etc cag gac gcc ggc ate gac gcc etc ggc aag gaa aag aag aac ate
Leu Gin Asp Ala Gly lie Asp Ala Leu Gly Lys Glu Lys Lys Asn lie 115 120 125 ggc tgc gtg etc ggc att ggc ggc ggc caa aag tcc age cac gag ttc
Gly Cys Val Leu Gly lie Gly Gly Gly Gin Lys Ser Ser His Glu Phe 130 135 140 tac teg cgc ett aat tat gtt gtc gtg gag aag gtc etc cgc aag atg
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met 145 150 155 160 218 528 200813222 ggc atg ccc gag gag gac gtc aag gtc gcc gtc gaa aag tac aag gcc
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala 165 170 175 aac ttc ccc gag tgg cgc etc gac tee ttc cct ggc ttc etc ggc aac
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn 180 185 190 gtc acc gcc ggt cgc tgc acc aac acc ttc aac etc gac ggc atg aac
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn 195 200 205 tgc gtt gtc gac gcc gca tgc gcc teg tee etc ate gcc gtc aag gtc
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu lie Ala Val Lys Val 210 215 220 gcc ate gac gag ctg etc tac ggt gac tgc gac atg atg gtc acc ggt
Ala lie Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly 225 230 235 240 gcc acc tgc aeg gat aac tee ate ggc atg tac atg gcc ttc tee aag
Ala Thr Cys Thr Asp Asn Ser lie Gly Met Tyr Met Ala Phe Ser Lys 245 250 255 acc ccc gtg ttc tee aeg gac ccc age gtg cgc gcc tac gac gaa aag
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys 260 265 270 aca aag ggc atg etc ate ggc gag ggc tee gcc atg etc gtc etc aag
Thr Lys Gly Met Leu lie Gly Glu Gly Ser Ala Met Leu Val Leu Lys 275 280 285 cgc tac gcc gac gcc gtc cgc gac ggc gat gag ate cac get gtt att
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu lie His Ala Val lie 290 295 300 cgc ggc tgc gcc tee tee agt gat ggc aag gcc gcc ggc ate tac aeg
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly lie Tyr Thr 305 310 315 320 ccc acc att teg ggc cag gag gag gcc etc cgc cgc gcc tac aac cgc
Pro Thr lie Ser Gly Gin Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg 325 330 335 gcc tgt gtc gac ccg gcc acc gtc act etc gtc gag ggt cac ggc acc
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr 340 345 350 ggt act ccc gtt ggc gac cgc ate gag etc acc gcc ttg cgc aac etc
Gly Thr Pro Val Gly Asp Arg lie Glu Leu Thr Ala Leu Arg Asn Leu 355 360 365 ttt gac aag gcc tac ggc gag ggc aac acc gaa aag gtc get gtg ggc
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly 370 375 380 age ate aag tee age ate ggc cat etc aag gcc gtc gcc ggt etc gcc Ser lie Lys Ser Ser lie Gly His Leu Lys Ala Val Ala Gly Leu Ala 385 390 395 400 ggt atg ate aag gtc ate atg geg etc aag cac aag act etc ccg ggc
Gly Met lie Lys Val lie Met Ala Leu Lys His Lys Thr Leu Pro Gly 405 410 415 acc ate aac gtc gac aac cca ccc aac etc tac gac aac aeg ccc ate
Thr lie Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro lie 420 425 430 aac gag tee teg etc tac att aac acc atg aac cgc ccc tgg ttc ccg
Asn Glu Ser Ser Leu Tyr lie Asn Thr Met Asn Arg Pro Trp Phe Pro 435 440 445 ccc cct ggt gtg ccc cgc cgc gcc ggc att teg age ttt ggc ttt ggt
Pro Pro Gly Val Pro Arg Arg Ala Gly lie Ser Ser Phe Gly Phe Gly 576 624 672 720 768 816 864 912 960 1008 1056 1104 1152 1200 1248 1296 1344 219 1392 1440 200813222 450 455 460 ggc gcc aac tac cac gcc gtc etc gag gag gee gag ccc gag cac aeg
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr 465 470 475 480 acc geg tac ege etc aac aag ege ccg cag ccc gtg etc atg atg gcc
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gin Pro Val Leu Met Met Ala 485 490 495 gcc aeg ccc geg gcc etc cag teg etc tgc gag gcc cag etc aag gag
Ala Thr Pro Ala Ala Leu Gin Ser Leu Cys Glu Ala Gin Leu Lys Glu 500 505 510 ttc gag gcc gcc ate aag gag aac gag acc gtc aag aac acc gcc tac
Phe Glu Ala Ala lie Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr 515 520 525 ate aag tgc gtc aag ttc ggc gag cag ttc aaa ttc cct ggc tee ate lie Lys Cys Val Lys Phe Gly Glu Gin Phe Lys Phe Pro Gly Ser lie 530 535 540 ccg gcc aca aac geg ege etc ggc ttc etc gtc aag gat get gag gat
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp 545 550 555 560 gcc tgc tee acc etc cgt gcc ate tgc gcc caa ttc gcc aag gat gtc Ala Cys Ser Thr Leu Arg Ala lie Cys Ala Gin Phe Ala Lys Asp Val 565 570 575 acc aag gag gcc tgg ege etc ccc ege gag ggc gtc age ttc ege gcc
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala 580 585 590 aag ggc ate gcc acc aac ggc get gtc gcc geg etc ttc tee ggc cag
Lys Gly lie Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gin 595 600 605 ggc geg cag tac aeg cac atg ttt age gag gtg gcc atg aac tgg ccc
Gly Ala Gin Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro 610 615 620 cag ttc ege cag age att gcc gcc atg gac gcc gcc cag tee aag gtc
Gin Phe Arg Gin Ser lie Ala Ala Met Asp Ala Ala Gin Ser Lvs Val 625 630 635 640 get gga age gac aag gac ttt gag ege gtc tee cag gtc etc tac ccg
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gin Val Leu Tvr Pro 645 650 655 ege aag ccg tac gag cgt gag ccc gag cag gac cac aag aag ate tee
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gin Asp His Lys Lys lie Ser 660 665 670 etc acc gee tac teg cag ccc teg acc ctg gcc tgc get etc sst see
Leu Thr Ala Tyr Ser Gin Pro Ser Thr Leu Ala Cys Ala Leu G?y Ala 675 680 685 ηί1 aag ga^ sec ggc ttc acc ccg gac ttt gee see ssc phe enn 1 e Phe Lys Glu Ala Gly Phe Thr Pro AsP Phe Ala Ala §fy 695 700 cat teg etc ggt gag ttc gcc gcc etc tac gcc geg ggc tsc etc ?ac
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp 710 715 720 ege gac gag etc ttt gag ett gtc tgc ege ege gcc ege ate atg src
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg lie Met ify 7Z5 73〇 735 ggc aag §ca ccg gcc acc ccc sag tgc atsf 2CC 9Tr atr att
Gly Lys Asp Ala Pro Ala Thr Pro Lyl Gly C?s Met Ala Ala Val lie 740 745 750 ggc ccc aac gcc gag aac ate aag gtc cag gee gcc aac gtc tgg etc 1488 1536 1584 1632 1680 1728 1776 1824 1872 1920 1968 2016 2064 2112 2160 2208 2256 2304 220 200813222
Gly Pro Asn Ala Glu Asn lie Lys Val Gin Ala Ala Asn Val Trp Leu 755 760 765 ggc aac tcc aac teg cct teg cag acc gtc ate acc ggc tee gtc gaa
Gly Asn Ser Asn Ser Pro Ser Gin Thr Val lie Thr Gly Ser Val Glu 770 775 780 ggt ate cag gee gag age gee ege etc cag aag gag ggc ttc ege gtc
Gly lie Gin Ala Glu Ser Ala Arg Leu Gin Lys Glu Gly Phe Arg Val 785 790 795 800 gtg cct ett gee tgc gag age gee ttc cac teg ccc cag atg gag aac
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gin Met Glu Asn 805 810 815 gee teg teg gee ttc aag gac gtc ate tec aag gtc tec ttc ege acc
Ala Ser Ser Ala Phe Lys Asp Val lie Ser Lys Val Ser Phe Arg Thr 820 825 830 ccc aag gee gag acc aag etc ttc age aac gtc tet ggc gag acc tac
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr 835 840 845 ccc aeg gac gee ege gag atg ett aeg cag cac atg acc age age gtc
Pro Thr Asp Ala Arg Glu Met Leu Thr Gin His Met Thr Ser Ser Val 850 855 860 aag ttc etc acc cag gtc ege aac atg cac cag gee ggt geg ege ate
Lys Phe Leu Thr Gin Vai Arg Asn Met His Gin Aia Gly Ala Arg lie 865 870 875 880 ttt gtc gag ttc gga ccc aag cag gtg etc tec aag ett gtc tec gag
Phe Val Glu Phe Gly Pro Lys Gin Val Leu Ser Lys Leu Val Ser Glu 885 890 895 acc etc aag gat gac ccc teg gtt gtc acc gtc tet gtc aac ccg gee
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala 900 905 910 teg ggc aeg gat teg gac ate cag etc ege gac geg gee gtc cag etc
Ser Gly Thr Asp Ser Asp lie Gin Leu Arg Asp Ala Ala Val Gin Leu 915 920 925 gtt gtc get ggc gtc aac ett cag ggc ttt gac aag tgg gac gee ccc
Val Val Ala Gly Val Asn Leu Gin Gly Phe Asp Lys Trp Asp Ala Pro 930 935 940 gat gee acc ege atg cag gee ate aag aag aag ege act acc etc ege
Asp Ala Thr Arg Met Gin Ala lie Lys Lys Lys Arg Thr Thr Leu Arg 945 950 955 960 ett teg gee gee acc tac gtc teg gac aag acc aag aag gtc ege gac
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp 965 970 975 gee gee atg aac gat ggc ege tgc gtc acc tac etc aag ggc gee gca
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala 980 985 990 ccg etc ate aag gee ccg gag ccc gtt gtc gac gag gee gee aag ege
Pro Leu lie Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg 995 1000 1005 gag gee gag cgt etc cag aag gag ett cag gat gee cag ege cag
Glu Ala Glu Arg Leu Gin Lys Glu Leu Gin Asp Ala Gin Arg Gin 1010 1015 1020 etc gac gac gee aag ege gee gee gee gag gee aac tec aag etc
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu 1025 1030 1035 gee get gee aag gag gag gee aag acc gee get get Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala 1040 1045 1050 teg gee aag Ser Ala Lys 2352 2400 2448 2496 2544 2592 2640 2688 2736 2784 2832 2880 2928 2976 3024 3069 3114 3159 221 ccc gca gtt gac act get gtt Pro Ala Val Asp Thr Ala Val 1055 1060 aag tee atg etc geg gag etc Lys Ser Met Leu Ala Glu Leu 1070 1075 tet tee etc cag cag cag cag Ser Ser Leu Gin Gin Gin Gin 1085 1090 gtc aag get get geg cct gee Val Lys Ala Ala Ala Pro Ala 1100 1105 ccg get gtc teg aac gag ett Pro Ala Val Ser Asn Glu Leu 1115 1120 atg gag gtc etc gee gee aag Met Glu Val Leu Ala Ala Lys 1130 1135 gag get gac atg gag etc gag Glu Ala Asp Met Glu Leu Glu 1145 1150 aag cgt gtc gag ate etc tee Lys Arg Val Glu lie Leu Ser 1160 1165 200813222 gtc gaa aag cat cgt gee ate etc
Val Glu Lys His Arg Ala lie Leu 1065 gat ggc tac gga teg gtc gac get
Asp Gly Tyr Gly Ser Val Asp Ala 1080 cag cag cag aeg gee ccc gee ccg
Gin Gin Gin Thr Ala Pro Ala Pro 1095 gee ccc gtt gee teg gee cct gee
Ala Pro Val Ala Ser Ala Pro Ala 1110 ett gag aag gee gag act gtc gtc
Leu Glu Lys Ala Glu Thr Val Val 1125 acc ggc tac gag acc gac atg ate
Thr Gly Tyr Glu Thr Asp Met lie 1140 acc gag etc ggc att gac tee ate
Thr Glu Leu Gly lie Asp Ser lie 1155 gag gtc cag gee atg etc aat gtc
Glu Val Gin Ala Met Leu Asn Val 1170 gag gee aag gat gtc gat gee etc age ege act ege act gtt ggt
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly 1175 1180 1185 gag gtt gtc aac gee atg aag gee gag ate get ggc age tet gee
Glu Val Val Asn Ala Met Lys Ala Glu lie Ala Gly Ser Ser Ala 1190 1195 1200 ccg geg cct get gee get get ccg get ccg gee aag get gee cct Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro 1205 1210 1215 gee gee get geg cct get gtc teg aac gag ett etc gag aag gee
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala 1220 1225 1230 gag acc gtc gtc atg gag gtc etc gee gee aag act ggc tac gag
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu 1235 1240 1245 act gac atg ate gag tee gac atg gag etc gag act gag etc ggc
Thr Asp Met lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly 1250 1255 1260 att gac tee ate aag cgt gtc gag ate etc tee gag gtt cag gee lie Asp Ser lie Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala 1265 1270 1275 atg etc aac gtc gag gee aag gac gtc gac get etc age ege act
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr 1280 1285 1290 ege act gtg ggt gag gtc gtc aac gee atg aag get gag ate get
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala Glu lie Ala 1295 1300 1305 ggt ggc tet gee ccg geg cct gee gee get gee cca ggt ccg get
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Gly Pro Ala 1310 1315 1320 get gee gee cct geg cct gee gee gee gee cct get gtc teg aac
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn 1325 1330 1335 3204 3249 3294 3339 3384 3429 3474 3519 3564 3609 3654 3699 3744 3789 3834 3879 3924 3969 4014 222 200813222 gag ctt ctt gag aag gcc gag acc gtc gtc atg gag gtc etc gee 4059
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala 1340 1345 1350 gcc aag act ggc tac gag act gac atg ate gag tee gac atg gag 4104
Ala Lys Thr Gly Tyr Glu Thr Asp Met lie Glu Ser Asp Met Glu 1355 1360 1365 etc gag acc gag etc ggc att gac tee ate aag cgt gtc gag att 4149
Leu Glu Thr Glu Leu Gly lie Asp Ser lie Lys Arg Val Glu lie 1370 1375 1380 etc tee gag gtc cag gcc atg etc aac gtc gag gcc aag gac gtc 4194
Leu Ser Glu Val Gin Ala Met Leu Asn Val Glu Ala Lys Asp Val 1385 1390 1395 gac get etc age ege acc ege act gtt ggc gag gtc gtc gat gcc 4239
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala 1400 1405 1410 atg aag gcc gag ate get ggt ggc tet gcc ccg geg cct gcc gcc 4284
Met Lys Ala Glu lie Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala 1415 1420 1425 get get cct get ccg get get gcc gcc cct geg cct gcc gcc cct 4329
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Pro 1430 1435 1440 geg cct get gtc leg age gag eti etc gag aag gcc gag act gic 4374
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val 1445 1450 1455 gtc atg gag gtc etc gcc gcc aag act ggc tac gag act gac atg 4419
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met 1460 1465 1470 ate gag tee gac atg gag etc gag acc gag etc ggc att gac tee 4464 lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly lie Asp Ser 1475 1480 1485 ate aag cgt gtc gag att etc tee gag gtc cag gcc atg etc aac 4509 lie Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala Met Leu Asn 1490 1495 1500 gtc gag gcc aag gac gtc gac get etc age ege acc ege act gtt 4554
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val 1505 1510 1515 ggc gag gtc gtc gat gcc atg aag gcc gag ate get ggt ggc tet 4599
Gly Glu Val Val Asp Ala Met Lys Ala Glu lie Ala Gly Gly Ser 1520 1525 1530 gcc ccg geg cct gcc gcc get get cct get ccg get get gcc gcc 4644
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala 1535 1540 1545 cct geg cct gcc gcc cct geg cct gcc gcc cct geg cct get gtc 4689
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val 1550 1555 1560 teg age gag ctt etc gag aag gcc gag act gtc gtc atg gag gtc 4734
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val 1565 1570 1575 etc gcc gcc aag act ggc tac gag act gac atg att gag tee gac 4779
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met lie Glu Ser Asp 1580 1585 1590 atg gag etc gag acc gag etc ggc att gac tee ate aag cgt gtc 4824
Met Glu Leu Glu Thr Glu Leu Gly lie Asp Ser lie Lys Arg Val 1595 1600 1605 gag att etc tee gag gtt cag gcc atg etc aac gtc gag gee aag 4869
Glu lie Leu Ser Glu Val Gin Ala Met Leu Asn Val Glu Ala Lys 223 200813222 1610 1615 1620
Asn i 1 cgC AgC SiCt ?gc act gtt ggt gag gtc gtc A P Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val 1625 1630 1635 A^n Τ]ϊ m!? fag ?iC ?ct ggC agC tCC gCC tC^ CCt Asp Met Lys Sla 6lu lie Xla Gly Ser §er Ala Ser Ala Pro 1640 1645 1650 gcc gcc get get cct get ccg get get gee get CCt geg ccc get /Ua ^ Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala 1655 1660 1665 gee gee gee cct get gtc teg aac gag ett etc gag aaa gcc gag A a $ a Pro Ala Val $er Asn Glu Leu Leu Glu Lys Ala Glu 1670 1675 1680 TU1 wtg §ag gtc ctc sec gee aag act ggc tac gag act Thr Val Met Glu Val Leu Xla Xla Lys Thr Gly fyr Glu Thr 1685 1690 1695 fac ?/? tcc gac atS §ag etc gag act gag etc ggc att Asp Met lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly lie 1700 1705 1710 gac tcc Asp Ser 1715 ate lie aag cgt gtc gag Lys Arg Val Glu 1720 ate etc tcc gag gtt lie Leu Ser Glu Val 1725 cag gcc atg Gin Ala Met etc aac gtc gag gcc aag gac gtc gat gcc etc age ege acc ege Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg 1730 1735 1740 ^ gtt ggc gag gtt gtc gat gcc atg aag gcc gag ate get ggt Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu lie Ala Gly 1745 1750 1755 ggc tet gee ccg geg cct gcc gcc get gcc cct get ccg get gcc Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala 1760 1765 1770 gcc gcc cct get gtc teg aac Ala Ala Pro Ala Val Ser Asn 1775 1780 gtc gtc atg gag gtc etc gcc Val Val Met Glu Val Leu Ala 1790 1795 atg ate gag tcc gac atg gag Met lie Glu Ser Asp Met Glu 1805 1810 tcc ate aag cgt gtc gag att Ser lie Lys Arg Val Glu lie 1820 1825 gag ett etc gag aag gcc gag act Glu Leu Leu Glu Lys Ala Glu Thr 1785 gcc aag act ggc tac gag acc gac Ala Lys Thr Gly Tyr Glu Thr Asp 1800 etc gag acc gag etc ggc att gac Leu Glu Thr Glu Leu Gly lie Asp 1815 etc tcc gag gtt cag gcc atg etc Leu Ser Glu Val Gin Ala Met Leu 1830 aac gtc gag gcc aag gac gtc gat get etc age ege act ege act Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr 1835 1840 1845 gtt ggc gag gtc gtc gat gcc atg aag get gag ate gcc ggc age Val Gly Glu Val Val Asp Ala Met Lys Ala Glu lie Ala Gly Ser 1850 1855 1860 tcc gcc ccg geg cct gcc gcc get get cct get ccg get get gcc Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala 1865 1870 1875 get cct geg ccc get gcc get gcc cct get gtc teg age gag ett Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu 1880 1885 1890 etc gag aag gcc gag acc gtc gtc atg gag gtc etc gcc gcc aag 4914 4959 5004 5049 5094 5139 5184 5229 5274 5319 5364 5409 5454 5499 5544 5589 5634 5679 5724 224 200813222
Leu Glu Lys Ala Glu Thr Val 1895 1900 act ggc tac gag act gac atg
Thr Gly Tyr Glu Thr Asp Met 1910 1915 act gag etc ggc att gac tcc
Thr Glu Leu Gly lie Asp Ser 1925 1930 gag gtt cag gcc atg etc aac
Glu Val Gin Ala Met Leu Asn 1940 1945 etc age ege acc ege act gtt
Leu Ser Arg Thr Arg Thr Val 1955 1960 gcc gag ate get ggt ggc tet
Ala Glu lie Ala Gly Gly Ser 1970 1975 ect get ccg get gcc gcc gcc
Pro Ala Pro Ala Ala Ala Ala 1985 1990 gag aag gcc gag acc gtc gtc Ο 1 T \ 1 r\ 1 τ T 1 T τ 1 mu Lys uni 丄nr vai va丄 2000 2005 ggc tac gag acc gac atg ate
Gly Tyr Glu Thr Asp Met lie 2015 2020 gag etc ggc att gac tec ate
Glu Leu Gly lie Asp Ser lie 2030 2035 gtt cag gcc atg etc aac gtc
Val Gin Ala Met Leu Asn Val 2045 2050 age ege act ege act gtt ggc
Ser Arg Thr Arg Thr Val Gly 2060 2065 gag ate get ggt ggc tet gcc
Glu lie Ala Gly Gly Ser Ala 2075 2080 gcc teg get ggc gcc geg cct
Ala Ser Ala Gly Ala Ala Pro 2090 2095 ggc get gac tgt gat gat ett
Gly Ala Asp Cys Asp Asp Leu 2105 2110 gac ate ege ege ccg gac gag
Asp lie Arg Arg Pro Asp Glu 2120 2125 ege ccc gtt etc gtt gtc gat
Arg Pro Val Leu Val Val Asp 2135 2140 ctg gtc ege gtc etc ggc gcc
Leu Val Arg Val Leu Gly Ala 2150 2155 ggt etc cag etc get cag ege
Gly Leu Gin Leu Ala Gin Arg 2165 2170
Val Met Glu Val Leu Ala Ala Lys 1905 att gag tec gac atg lie Glu Ser Asp Met 1920 gag etc gag Glu Leu Glu 5769 ate aag cgt gtc gag lie Lys Arg Val Glu 1935 ate etc tec lie Leu Ser 5814 gtc gag gcc aag gac Val Glu Ala Lys Asp 1950 gtc gat gcc Val Asp Ala 5859 ggc gag gtt gtc gat Gly Glu Val Val Asp 1965 gcc atg aag Ala Met Lys 5904 gcc ccg geg cct gcc Ala Pro Ala Pro Ala 1980 gcc get gcc Ala Ala Ala 5949 cct get gtc teg aac Pro Ala Val Ser Asn 1995 gag ett ett Glu Leu Leu 5994 atg gag gtc etc gcc Met Giu Vai Leu Aia 2010 gcc aag act Aia Lys Thr 6039 gag tec gac atg gag Glu Ser Asp Met Glu 2025 etc gag acc Leu Glu Thr 6084 aag cgt gtc gag att Lys Arg Val Glu lie 2040 etc tec gag Leu Ser Glu 6129 gag gcc aag gac gtc Glu Ala Lys Asp Val 2055 gac get etc Asp Ala Leu 6174 gag gtc gtc gat gee Glu Val Val Asp Ala 2070 atg aag get Met Lys Ala 6219 ccg geg cct gcc gcc Pro Ala Pro Ala Ala 2085 get get cct Ala Ala Pro 6264 geg gtc aag att gac Ala Val Lys lie Asp 2100 teg gtc cac Ser Val His 6309 tec ctg atg cac gcc Ser Leu Met His Ala 2115 aag gtg gtt Lys Val Val 6354 etc ate ctg gag ege Leu lie Leu Glu Arg 2130 ccc gag aac Pro Glu Asn 6399 gac ggc age gag etc Asp Gly Ser Glu Leu 2145 acc etc gcc Thr Leu Ala 6444 tgc gcc gtt gtc ctg Cys Ala Val Val Leu 2160 acc ttt gag Thr Phe Glu 6489 get ggt gee get gcc Ala Gly Ala Ala Ala 2175 ate ege cac lie Arg His 6534 225 200813222 gtg etc Val Leu 2180 aag gag Lys Glu 2195 cag cag Gin Gin 2210 etc atg Leu Met 2225 get ggc Ala Gly 2240 ege etc Arg Leu 2255 gee cag Ala Gin 2270 gag tgg Glu Trp 2285 cag ggc Gin Gly 2300 atg geg Met Ala 2315 aac cag Asn Gin 2330 aac ccg Asn Pro 2345 ggc ggc Gly Gly 2360 ege cag Arg Gin 2375 gtc tet Val Ser 2390 aag get Lys Ala 2405 age get Ser Ala 2420 ett gtg Leu Val 2435 get geg Ala Ala 2450 gee aag gat ett tee geg gag age gee gag aag gee ate 6579
Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu Lys Ala lie 2185 2190 gee gag cag ege ttt ggc get etc ggc ggc ttc ate teg 6624
Ala Glu Gin Arg Phe Gly Ala Leu Gly Gly Phe lie Ser 2200 2205 geg gag ege ttc gag ccc gee gaa ate etc ggc ttc aeg 6669
Ala Glu Arg Phe Glu Pro Ala Glu lie Leu Gly Phe Thr 2215 2220 tgc gee aag ttc gee aag get tee etc tgc aeg get gtg 6714
Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys Thr Ala Val 2230 2235 ggc ege ccg gee ttt ate ggt gtg geg ege ett gac ggc 6759
Gly Arg Pro Ala Phe lie Gly Val Ala Arg Leu Asp Gly 2245 2250 gga ttc act teg cag ggc act tet gac geg etc aag cgt 6804
Gly Phe Thr Ser Gin Gly Thr Ser Asp Ala Leu Lys Arg 2260 2265 cgt ggt gee ate ttt ggc etc tgc aag acc ate ggc etc 6849
Arg Gly Ala lie Phe Gly Leu Cys Lys Thr lie Gly Leu 2275 2280 tee gag tet gac gtc ttt tee ege ggc gtg gac att get 6894
Ser Glu Ser Asp Val Phe Ser Arg Gly Val Asp lie Ala 2290 2295 atg cac ccc gag gat gee gee gtg geg att gtg ege gag 6939
Met His Pro Glu Asp Ala Ala Val Ala lie Val Arg Glu 2305 2310 tgc get gac att ege att ege gag gtc ggc att ggc gca 6984
Cys Ala Asp lie Arg lie Arg Glu Val Gly lie Gly Ala 2320 2325 cag ege tgc aeg ate cgt gee gee aag etc gag acc ggc 7029
Gin Arg Cys Thr lie Arg Ala Ala Lys Leu Glu Thr Gly 2335 2340 cag ege cag ate gee aag gac gac gtg ctg etc gtt tet 7074
Gin Arg Gin lie Ala Lys Asp Asp Val Leu Leu Val Ser 2350 2355 get ege ggc ate aeg cct ett tgc ate egg gag ate aeg 7119
Ala Arg Gly lie Thr Pro Leu Cys lie Arg Glu lie Thr 2365 2370 ate geg ggc ggc aag tac att ctg ett ggc ege age aag 7164 lie Ala Gly Gly Lys Tyr lie Leu Leu Gly Arg Ser Lys 2380 2385 geg age gaa ccg gca tgg tgc get ggc ate act gac gag 7209
Ala Ser Glu Pro Ala Trp Cys Ala Gly lie Thr Asp Glu 2395 2400 gtg caa aag get get acc cag gag etc aag ege gee ttt 7254
Val Gin Lys Ala Ala Thr Gin Glu Leu Lys Arg Ala Phe 2410 2415 ggc gag ggc ccc aag ccc aeg ccc ege get gtc act aag 7299
Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala Val Thr Lys 2425 2430 ggc tet gtt ett ggc get ege gag gtg ege age tet att 7344
Gly Ser Val Leu Gly Ala Arg Glu Val Arg Ser Ser lie 2440 2445 att gaa geg etc ggc ggc aag gee ate tac teg teg tgc 7389 lie Glu Ala Leu Gly Gly Lys Ala lie Tyr Ser Ser Cys 2455 2460 226 200813222 gac gtg aac tct gcc gcc gac gtg gcc aag gcc gtg cgc gat gcc 7434
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val Arg Asp Ala 2465 2470 2475 gag tcc cag etc ggt gcc cgc gtc teg ggc ate gtt cat gcc teg 7479
Glu Ser Gin Leu Gly Ala Arg Val Ser Gly lie Val His Ala Ser 2480 2485 2490 ggc gtg etc cgc gac cgt etc ate gag aag aag etc ccc gac gag 7524
Gly Val Leu Arg Asp Arg Leu lie Glu Lys Lys Leu Pro Asp Glu 2495 2500 2505 ttc gac gcc gtc ttt ggc acc aag gtc acc ggt etc gag aac etc 7569
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu Glu Asn Leu 2510 2515 2520 etc gcc gcc gtc gac cgc gcc aac etc aag cac atg gtc etc ttc 7614
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met Val Leu Phe 2525 2530 2535 age teg etc gcc ggc ttc cac ggc aac gtc ggc cag tct gac tac 7659
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gin Ser Asp Tyr 2540 2545 2550 gcc atg gcc aac gag gcc ett aac aag atg ggc etc gag etc gcc 7704
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu Ala 2555 2560 aag gac gtc teg gtc aag teg ate tgc ttc ggt ccc tgg gac ggt 7749
Lys Asp Val Ser Val Lys Ser lie Cys Phe Gly Pro Trp Asp Gly 2570 2575 2580 ggc atg gtg aeg ccg cag etc aag aag cag ttc cag gag atg ggc 7794
Gly Met Val Thr Pro Gin Leu Lys Lys Gin Phe Gin Glu Met Gly 2585 2590 2595 gtg cag ate ate ccc cgc gag ggc ggc get gat acc gtg geg cgc 7839
Val Gin lie lie Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg 2600 2605 2610 ate gtg etc ggc tec teg ccg get gag ate ett gtc ggc aac tgg 7884 lie Val Leu Gly Ser Ser Pro Ala Glu lie Leu Val Gly Asn Trp 2615 2620 2625 cgc acc ccg tec aag aag gtc ggc teg gac acc ate acc ctg cac 7929
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr lie Thr Leu His 2630 2635 2640 cgc aag att tec gcc aag tec aac ccc ttc etc gag gac cac gtc 7974
Arg Lys lie Ser Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val 2645 2650 2655 ate cag ggc cgc cgc gtg ctg ccc atg aeg ctg gcc att ggc teg 8019 lie Gin Gly Arg Arg Val Leu Pro Met Thr Leu Ala lie Gly Ser 2660 2665 2670 geg gag acc tgc etc ggc etc ttc ccc ggc tac teg etc tgg 8064
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp 2675 2680 2685 gcc att gac gac gcc cag etc ttc aag ggt gtc act gtc gac ggc 8109
Ala lie Asp Asp Ala Gin Leu Phe Lys Gly Val Thr Val Asp Gly 2690 2695 2700 gac gtc aac tgc gag gtg acc etc acc ccg teg aeg geg ccc teg 8154
Asp Yali Asn Cys 5lu VaT Thr Leu Thr Pro §er Thr Ala Pro Ser 2705 2710 2715 ggc cgc gtc aac gtc cag gcc aeg etc aag acc ttt tec age ggc 8199
Gly Arg Val Asn Val Gin Ala Thr Leu Lys Thr Phe Ser Ser Gly 2720 2725 2730 aag ctg gtc ccg gcc tac cgc gcc gtc ate gtg etc tec aac cag 8244
Lys Leu Val Pro Ala Tyr Arg Ala Val lie Val Leu Ser Asn Gin 227 200813222 2735 2740 2745 ggc gcg ccc ccg gcc aac gcc acc atg cag ccg ccc teg etc gat
Gly Ala Pro Pro Ala Asn Ala Thr Met Gin Pro Pro Ser Leu Asp 2750 2755 2760 gcc gat ccg gcg etc cag ggc tee gtc tac gac ggc aag acc etc
Ala Asp Pro Ala Leu Gin Gly Ser Val Tyr Asp Gly Lys Thr Leu 2765 2770 2775 ttc cac ggc ccg gcc ttc ege ggc ate gat gac gtg etc teg tgc
Phe His Gly Pro Ala Phe Arg Gly lie Asp Asp Val Leu Ser Cys 2780 2785 2790 acc aag age cag ett gtg gcc aag tgc age get gtc ccc ggc tee
Thr Lys Ser Gin Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser 2795 2800 2805 gac gcc get ege ggc gag ttt gcc aeg gac act gac gcc cat gac
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp 2810 2815 2820 ccc ttc gtg aac gac ctg gcc ttt cag gcc atg etc gtc tgg gtg
Pro Phe Val Asn Asp Leu Ala Phe Gin Ala Met Leu Val Trp Val 2825 2830 2835 ege ege aeg etc ggc cag get gcg etc ccc aac teg ate cag ege
Arg Arg Thr Leu Gly Gin Ala Ala Leu Pro Asn Ser lie Gin Arg 2840 2845 2850 ate gtc cag cac ege ccg gtc ccg cag gac aag ccc ttc tac att lie Val Gin His Arg Pro Val Pro Gin Asp Lys Pro Phe Tyr lie 2855 2860 2865 acc etc ege tee aac cag teg ggc ggt cac tee cag cac aag cac
Thr Leu Arg Ser Asn Gin Ser Gly Gly His Ser Gin His Lys His 2870 2875 2880 gcc ett cag ttc cac aac gag cag ggc gat etc ttc att gat gtc
Ala Leu Gin Phe His Asn Glu Gin Gly Asp Leu Phe lie Asp Val 2885 2890 2895 cag get teg gtc ate gcc aeg gac age ett gcc ttc taa
Gin Ala Ser Val lie Ala Thr Asp Ser Leu Ala Phe 2900 2905 2910
<210〉 2 <211> 2910 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 2
Met Ala Ala Arg Leu Gin Glu Gin Lys Gly Gly Glu Met Asp Thr Arg 15 10 15 lie Ala lie lie Gly Met Ser Ala lie Leu Pro Cys Gly Thr Thr Val 20 25 30
Arg Glu Ser Trp Glu Thr lie Arg Ala Gly lie Asp Cys Leu Ser Asp 35 40 45
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys 50 55 60
Thr Thr Lys Asp Lys lie Tyr Cys Lys Arg Gly Gly Phe lie Pro Glu 65 70 75 80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gin Met Glu 8289 8334 8379 8424 8469 8514 8559 8604 8649 8694 8733 228 200813222 85 90 95
Asp Ser Asp Ala Asn Gin Thr lie Ser Leu Leu Lys Val Lys Glu Ala 100 105 110
Leu Gin Asp Ala Gly lie Asp Ala Leu Gly Lys Glu Lys Lys Asn lie 115 120 125
Gly Cys Val Leu Gly lie Gly Gly Gly Gin Lys Ser Ser His Glu Phe 130 135 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met 145 150 155 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala 165 170 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn 180 185 190
Val Thr Ala Glv Arg Cvs Thr Asn Thr Phe Asn Γριι A^n Glv Mpf Asn 195 ^ 200 205 ‘
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu lie Ala Val Lys Val 210 215 220
Ala lie Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly 225 230 235 240
Ala Thr Cys Thr Asp Asn Ser lie Gly Met Tyr Met Ala Phe Ser Lys 245 250 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys 260 265 270
Thr Lys Gly Met Leu lie Gly Glu Gly Ser Ala Met Leu Val Leu Lys 275 280 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu lie His Ala Val lie 290 295 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly lie Tyr Thr 305 310 315 320
Pro Thr lie Ser Gly Gin Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg 325 330 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr 340 345 350
Gly Thr Pro Val Gly Asp Arg lie Glu Leu Thr Ala Leu Arg Asn Leu 355 360 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly 370 375 380 229 200813222
Ser lie Lys Ser Ser lie Gly His Leu Lys Ala Val Ala Gly Leu Ala 385 390 395 400
Gly Met lie Lys Val lie Met Ala Leu Lys His Lys Thr Leu Pro Gly 405 410 415
Thr lie Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro lie 420 425 430
Asn Glu Ser Ser Leu Tyr lie Asn Thr Met Asn Arg Pro Trp Phe Pro 435 440 445
Pro Pro Gly Val Pro Arg Arg Ala Gly lie Ser Ser Phe Gly Phe Gly 450 455 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr 465 470 475 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gin Pro Val Leu Met Met Ala 485 490 495
Ala Thr Pro Ala Ala Leu Gin Ser Leu Cys Glu Ala Gin Leu Lys Glu 500 505 510
Phe Glu Ala Ala lie Lys Glu Asn Glu Thr Val Lys Asn Thr Ala Tyr 515 520 525 lie Lys Cys Val Lys Phe Gly Glu Gin Phe Lys Phe Pro Gly Ser lie 530 535 540
Pro Ala Thr Asn Ala Arg Leu Gly Phe Leu Val Lys Asp Ala Glu Asp 545 550 555 560
Ala Cys Ser Thr Leu Arg Ala lie Cys Ala Gin Phe Ala Lys Asp Val 565 570 575
Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe Arg Ala 580 585 590
Lys Gly lie Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser Gly Gin 595 600 605
Gly Ala Gin Tyr Thr His Met Phe Ser Glu Val Ala Met Asn Trp Pro 610 615 620
Gin Phe Arg Gin Ser lie Ala Ala Met Asp Ala Ala Gin Ser Lys Val 625 630 635 640
Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gin Val Leu Tyr Pro 645 650 655
Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gin Asp His Lys Lys lie Ser 660 665 670
Leu Thr Ala Tyr Ser Gin Pro Ser Thr Leu Ala Cys Ala Leu Gly Ala 675 680 685 230 200813222
Phe Glu lie Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala Ala Gly 690 695 700
His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys Val Asp 705 710 715 720
Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg lie Met Gly 725 730 735
Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala Val lie 740 745 750
Gly Pro Asn Ala Glu Asn lie Lys Val Gin Ala Ala Asn Val Trp Leu 755 760 765
Gly Asn Ser Asn Ser Pro Ser Gin Thr Val lie Thr Gly Ser Val Glu 770 775 780
Gly lie Gin Ala Glu Ser Ala Arg Leu Gin Lys Glu Gly Phe Arg Val 785 790 795 800
Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gin Met Glu Asn 805 810 815
Ala Ser Ser Ala Phe Lys Asp Val lie Ser Lys Val Ser Phe Arg Thr 820 825 830
Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu Thr Tyr 835 840 845
Pro Thr Asp Ala Arg Glu Met Leu Thr Gin His Met Thr Ser Ser Val 850 855 860
Lys Phe Leu Thr Gin Val Arg Asn Met His Gin Ala Gly Ala Arg lie 865 870 875 880
Phe Val Glu Phe Gly Pro Lys Gin Val Leu Ser Lys Leu Val Ser Glu 885 890 895
Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn Pro Ala 900 905 910
Ser Gly Thr Asp Ser Asp lie Gin Leu Arg Asp Ala Ala Val Gin Leu 915 920 925
Val Val Ala Gly Val Asn Leu Gin Gly Phe Asp Lys Trp Asp Ala Pro 930 935 940
Asp Ala Thr Arg Met Gin Ala lie Lys Lys Lys Arg Thr Thr Leu Arg 945 950 955 960
Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val Arg Asp 965 970 975
Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly Ala Ala 980 985 990 231 200813222
Pro Leu lie Lys Ala Pro Glu Pro Val Val Asp Glu Ala Ala Lys Arg 995 1000 1005
Glu Ala Glu Arg Leu Gin Lys Glu Leu Gin Asp Ala Gin Arg Gin 1010 1015 1020
Leu Asp Asp Ala Lys Arg Ala Ala Ala Glu Ala Asn Ser Lys Leu 1025 1030 1035
Ala Ala Ala Lys Glu Glu Ala Lys Thr Ala Ala Ala Ser Ala Lys 1040 1045 1050
Pro Ala Val Asp Thr Ala Val Val Glu Lys His Arg Ala lie Leu 1055 1060 1065
Lys Ser Met Leu Ala Glu Leu Asp Gly Tyr Gly Ser Val Asp Ala 1070 1075 1080
Ser Ser Leu Gin Gin Gin Gin Gin Gin Gin Thr Ala Pro Ala Pro 1085 1090 1095
Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser Ala Pro Ala 1100 1105 1110
Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val 1115 1120 1125
Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met lie 1130 1135 1140
Glu Ala Asp Met Glu Leu Glu Thr Glu Leu Gly lie Asp Ser lie 1145 1150 1155
Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala Met Leu Asn Val 1160 1165 1170
Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly 1175 1180 1185
Glu Val Val Asn Ala Met Lys Ala Glu lie Ala Gly Ser Ser Ala 1190 1195 1200
Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Lys Ala Ala Pro 1205 1210 1215
Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala 1220 1225 1230
Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu 1235 1240 1245
Thr Asp Met lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly 1250 1255 1260 lie Asp Ser lie Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala 232 200813222 1265 1270 1275
Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu 1280 1285 1290
Arg Thr Val Gly Glu Val Val Asn Ala Met Lys Ala 1295 1300 1305
Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro 1310 1315 1320
Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala 1325 1330 1335
Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu 1340 1345 1350
Ala Lys Thr Gly Tyr Glu Thr Asp Met lie Glu Ser 1355 1360 1365
Leu Gin Thr Gin Lph GIv I Ip A^n Spr Tip Lvs Arcr 1370 1375 ^ ^ 1380
Leu Ser Glu Val Gin Ala Met Leu Asn Val Glu Ala 1385 1390 1395
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val 1400 1405 1410
Met Lys Ala Glu lie Ala Gly Gly Ser Ala Pro Ala 1415 1420 1425
Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro 1430 1435 1440
Ala Pro Ala Val Ser Ser Glu Leu Leu Glu Lys Ala 1445 1450 1455
Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu 1460 1465 1470 lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly 1475 1480 1485 lie Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala 1490 1495 1500
Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr 1505 1510 1515
Gly Glu Val Val Asp Ala Met Lys Ala Glu lie Ala 1520 1525 1530
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala 1535 1540 1545
Ser Arg Thr Glu lie Ala Gly Pro Ala Val Ser Asn Val Leu Ala Asp Met Glu Val Glu He Lys Asp Val Val Asp Ala Pro Ala Ala Ala Ala Pro Glu Thr Val Thr Asp Met lie Asp Ser Met Leu Asn Arg Thr Val Gly Gly Ser Ala Ala Ala 233 200813222
Pro Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Pro Ala Val 1550 1555 1560
Ser Ser Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu Val 1565 1570 1575
Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met lie Glu Ser Asp 1580 1585 1590
Met Glu Leu Glu Thr Glu Leu Gly lie Asp Ser lie Lys Arg Val 1595 1600 1605
Glu lie Leu Ser Glu Val Gin Ala Met Leu Asn Val Glu Ala Lys 1610 1615 1620
Asp Val Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val 1625 1630 1635
Asp Ala Met Lys Ala Glu lie Ala Gly Ser Ser Ala Ser Ala Pro 1640 1645 1650
Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala 1655 1660 1665
Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu 1670 1675 1680
Thr Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr 1685 1690 1695
Asp Met lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly lie 1700 1705 1710
Asp Ser lie Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala Met 1715 1720 1725
Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg 1730 1735 1740
Thr Val Gly Glu Val Val Asp Ala Met Lys Ala Glu lie Ala Gly 1745 1750 1755
Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala 1760 1765 1770
Ala Ala Pro Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr 1775 1780 1785
Val Val Met Glu Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp 1790 1795 1800
Met lie Glu Ser Asp Met Glu Leu Glu Thr Glu Leu Gly lie Asp 1805 1810 1815
Ser lie Lys Arg Val Glu lie Leu Ser Glu Val Gin Ala Met Leu 1820 1825 1830 234 200813222
Asn Val Glu Ala Lys Asp Val Asp Ala Leu Ser Arg Thr Arg Thr 1835 1840 1845
Val Gly Glu Val Val Asp Ala Met Lys Ala Glu lie Ala Gly Ser 1850 1855 1860
Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Ala Ala Ala 1865 1870 1875
Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Ser Glu Leu 1880 1885 1890
Leu Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys 1895 1900 1905
Thr Gly Tyr Glu Thr Asp Met lie Glu Ser Asp Met Glu Leu Glu 1910 1915 1920
Thr Glu Leu Gly lie Asp Ser lie Lys Arg Val Glu lie Leu Ser 1925 1930 1935
Glu Val Gin Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala 1940 1945 1950
Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys 1955 1960 1965
Ala Glu lie Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala 1970 1975 1980
Pro Ala Pro Ala Ala Ala Ala Pro Ala Val Ser Asn Glu Leu Leu 1985 1990 1995
Glu Lys Ala Glu Thr Val Val Met Glu Val Leu Ala Ala Lys Thr 2000 2005 2010
Gly Tyr Glu Thr Asp Met lie Glu Ser Asp Met Glu Leu Glu Thr 2015 2020 2025
Glu Leu Gly lie Asp Ser lie Lys Arg Val Glu lie Leu Ser Glu 2030 2035 2040
Val Gin Ala Met Leu Asn Val Glu Ala Lys Asp Val Asp Ala Leu 2045 2050 2055
Ser Arg Thr Arg Thr Val Gly Glu Val Val Asp Ala Met Lys Ala 2060 2065 2070
Glu lie Ala Gly Gly Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro 2075 2080 2085
Ala Ser Ala Gly Ala Ala Pro Ala Val Lys lie Asp Ser Val His 2090 2095 2100
Gly Ala Asp Cys Asp Asp Leu Ser Leu Met His Ala Lys Val Val 2105 2110 2115 235 200813222
Asp lie Arg Arg Pro Asp Glu Leu lie Leu Glu Arg 2120 2125 2130
Arg Pro Val Leu Val Val Asp Asp Gly Ser Glu Leu 2135 2140 2145
Leu Val Arg Val Leu Gly Ala Cys Ala Val Val Leu 2150 2155 2160
Gly Leu Gin Leu Ala Gin Arg Ala Gly Ala Ala Ala 2165 2170 2175
Val Leu Ala Lys Asp Leu Ser Ala Glu Ser Ala Glu 2180 2185 2190
Lys Glu Ala Glu Gin Arg Phe Gly Ala Leu Gly Gly 2195 2200 2205
Gin Gin Ala Glu Arg Phe Glu Pro Ala Glu lie Leu 2210 2215 2220
Leu Met Cys Ala Lys Phe Ala Lys Ala Ser Leu Cys 2225 2230 2235
Ala Gly Gly Arg Pro Ala Phe lie Gly Val Ala Arg 2240 2245 2250
Arg Leu Gly Phe Thr Ser Gin Gly Thr Ser Asp Ala 2255 2260 2265
Ala Gin Arg Gly Ala lie Phe Gly Leu Cys Lys Thr 2270 2275 2280
Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val 2285 2290 2295
Gin Gly Met His Pro Glu Asp Ala Ala Val Ala lie 2300 2305 2310
Met Ala Cys Ala Asp lie Arg lie Arg Glu Val Gly 2315 2320 2325
Asn Gin Gin Arg Cys Thr lie Arg Ala Ala Lys Leu 2330 2335 2340
Asn Pro Gin Arg Gin lie Ala Lys Asp Asp Val Leu 2345 2350 2355
Gly Gly Ala Arg Gly lie Thr Pro Leu Cys lie Arg 2360 2365 2370
Arg Gin lie Ala Gly Gly Lys Tyr lie Leu Leu Gly 2375 2380 2385
Val Ser Ala Ser Glu Pro Ala Trp Cys Ala Gly lie
Pro Glu Asn Thr Leu Ala Thr Phe Glu lie Arg His Lys Ala lie Phe lie Ser Gly Phe Thr Thr Ala Val Leu Asp Gly Leu Lys Arg lie Gly Leu Asp lie Ala Val Arg Glu lie Gly Ala Glu Thr Gly Leu Val Ser Glu lie Thr Arg Ser Lys Thr Asp Glu 236 200813222 2390 2395 2400
Lys Ala Val Gin Lys Ala Ala Thr Gin Glu Leu Lys 2405 2410 2415
Ser Ala Gly Glu Gly Pro Lys Pro Thr Pro Arg Ala 2420 2425 2430
Leu Val Gly Ser Val Leu Gly Ala Arg Glu Val Arg 2435 2440 2445
Ala Ala lie Glu Ala Leu Gly Gly Lys Ala lie Tyr 2450 2455 2460
Asp Val Asn Ser Ala Ala Asp Val Ala Lys Ala Val 2465 2470 2475
Glu Ser Gin Leu Gly Ala Arg Val Ser Gly lie Val 2480 2485 2490
Gly Val Leu Arg Asd Arg Leu lie Glu Lvs Lvs Leu 2495 2500 ' ' 2505
Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly Leu 2510 2515 2520
Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met 2525 2530 2535
Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gin 2540 2545 2550
Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu 2555 2560 2565
Lys Asp Val Ser Val Lys Ser lie Cys Phe Gly Pro 2570 2575 2580
Gly Met Val Thr Pro Gin Leu Lys Lys Gin Phe Gin 2585 2590 2595
Val Gin lie lie Pro Arg Glu Gly Gly Ala Asp Thr 2600 2605 2610 lie Val Leu Gly Ser Ser Pro Ala Glu lie Leu Val 2615 2620 2625
Arg Thr Pro Ser Lys Lys Val Gly Ser Asp Thr lie 2630 2635 2640
Arg Lys lie Ser Ala Lys Ser Asn Pro Phe Leu Glu 2645 2650 2655 lie Gin Gly Arg Arg Val Leu Pro Met Thr Leu Ala 2660 2665 2670
Arg Ala Phe Val Thr Lys Ser Ser lie Ser Ser Cys Arg Asp Ala His Ala Ser Pro Asp Gin Glu Asn Leu Val Leu Phe Ser Asp Tyr Glu Leu Ala Trp Asp Gly Glu Met Gly Val Ala Arg Gly Asn Trp Thr Leu His Asp His Val lie Gly Ser 237 200813222
Leu Ala Glu Thr Cys Leu Gly Leu Phe Pro Gly Tyr Ser Leu Trp 2675 2680 2685
Ala lie Asp Asp Ala Gin Leu Phe Lys Gly Val Thr Val Asp Gly 2690 2695 2700
Asp Val Asn Cys Glu Val Thr Leu Thr Pro Ser Thr Ala Pro Ser 2705 2710 2715
Gly Arg Val Asn Val Gin Ala Thr Leu Lys Thr Phe Ser Ser Gly 2720 2725 2730
Lys Leu Val Pro Ala Tyr Arg Ala Val lie Val Leu Ser Asn Gin 2735 2740 2745
Gly Ala Pro Pro Ala Asn Ala Thr Met Gin Pro Pro Ser Leu Asp 2750 2755 2760
Ala Asp Pro Ala Leu Gin Gly Ser Val Tyr Asp Gly Lys Thr Leu 2765 2770 2775
Phe His Gly Pro Ala Phe Arg Gly lie Asp Asp Val Leu Ser Cys 2780 2785 2790
Thr Lys Ser Gin Leu Val Ala Lys Cys Ser Ala Val Pro Gly Ser 2795 2800 2805
Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp 2810 2815 2820
Pro Phe Val Asn Asp Leu Ala Phe Gin Ala Met Leu Val Trp Val 2825 2830 2835
Arg Arg Thr Leu Gly Gin Ala Ala Leu Pro Asn Ser lie Gin Arg 2840 2845 2850 lie Val Gin His Arg Pro Val Pro Gin Asp Lys Pro Phe Tyr lie 2855 2860 2865
Thr Leu Arg Ser Asn Gin Ser Gly Gly His Ser Gin His Lys His 2870 2875 2880
Ala Leu Gin Phe His Asn Glu Gin Gly Asp Leu Phe lie Asp Val 2885 2890 2895
Gin Ala Ser Val lie Ala Thr Asp Ser Leu Ala Phe 2900 2905 2910
<210〉 3 <211〉 6180 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <220〉
<221> CDS <222〉 (1)..(6180) <400〉 3 238 48 200813222 atg gcc get egg aat gtg age gee geg cat gag atg cac gat gaa aag
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys 15 10 15 ege ate gcc gtc gtc ggc atg gcc gtc cag tac gcc gga tgc aaa acc
Arg lie Ala Val Val Gly Met Ala Val Gin Tyr Ala Gly Cys Lys Thr 20 25 30 aag gac gag ttc tgg gag gtg etc atg aac ggc aag gtc gag tee aag
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys 35 40 45 gtg ate age gac aaa ega etc ggc tee aac tac ege gcc gag cac tac
Val lie Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr 50 55 60 aaa gca gag ege age aag tat gcc gac acc ttt tgc aac gaa aeg tac
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr 65 70 75 80 ggc acc ett gac gag aac gag ate gac aac gag cac gaa etc etc etc
Gly Thr Leu Asp Glu Asn Glu lie Asp Asn Glu His Glu Leu Leu Leu 85 90 95 aac etc gcc aag cag gca etc gca gag aca tee gtc aaa gac teg aca
Asn Leu Ala Lys Gin Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr 100 105 110 ege tgc ggc ate gtc age ggc tgc etc teg ttc ccc atg gac aac etc
Arg Cys Gly lie Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu 115 120 125 cag ggt gaa etc etc aac gtg tac caa aac cat gtc gag aaa aag etc
Gin Gly Glu Leu Leu Asn Val Tyr Gin Asn His Val Glu Lys Lys Leu 130 135 140 ggg gee ege gtc ttc aag gac gcc tee cat tgg tee gaa ege gag cag
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gin 145 150 155 160 tee aac aaa ccc gag gcc ggt gac ege ege ate ttc atg gac ccg gcc
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg lie Phe Met Asp Pro Ala 165 170 175 tee ttc gtc gcc gaa gaa etc aac etc ggc gcc ett cac tac tee gtc
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val 180 185 190 gac gca gca tgc gcc aeg geg etc tac gtg etc ege etc geg cag gat
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gin Asp 195 200 205 cat etc gtc tee ggc gcc gcc gac gtc atg etc tgc ggt gcc acc tgc
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys 210 215 220 ctg ccg gag ccc ttt ttc ate ett teg ggc ttt tee acc ttc cag gcc
Leu Pro Glu Pro Phe Phe lie Leu Ser Gly Phe Ser Thr Phe Gin Ala 225 230 235 240 atg ccc gtc ggc aeg ggc cag aac gtg tee atg ccg ctg cac aag gac
Met Pro Val Gly Thr Gly Gin Asn Val Ser Met Pro Leu His Lys Asp 245 250 255 age cag ggc etc acc ccg ggt gag ggc ggc tee ate atg gtc etc aag
Ser Gin Gly Leu Thr Pro Gly Glu Gly Gly Ser lie Met Val Leu Lys 260 265 270 cgt etc gat gat gcc ate ege gac ggc gac cac ate tac ggc acc ett
Arg Leu Asp Asp Ala lie Arg Asp Gly Asp His lie Tyr Gly Thr Leu 275 280 285 etc ggc gcc aat gtc age aac tee ggc aca ggt ctg ccc etc aag ccc
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro 290 295 300 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 864 239 912 960 200813222 ctt etc ccc age gag aaa aag tgc etc atg gac acc tac aeg ege att
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg lie 305 310 315 320 aac gtg cac ccg cac aag att cag tac gtc gag tgc cac gee acc ggc
Asn Val His Pro His Lys lie Gin Tyr Val Glu Cys His Ala Thr Gly 325 330 335 aeg ccc cag ggt gat cgt gtg gaa ate gac gee gtc aag gee tgc ttt
Thr Pro Gin Gly Asp Arg Val Glu lie Asp Ala Val Lys Ala Cys Phe 340 345 350 gaa ggc aag gtc ccc cgt ttc ggt acc aca aag ggc aac ttt gga cac
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His 355 360 365 acc etc gtc gca gee ggc ttt gee ggt atg tgc aag gtc etc etc tee
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser 370 375 380 atg aag cat ggc ate ate ccg ccc acc ccg ggt ate gat gac gag acc
Met Lys His Gly lie lie Pro Pro Thr Pro Gly lie Asp Asp Glu Thr 385 390 395 400 aag atg gac cct etc gtc gtc tee ggt gag gee ate cca tgg cca gag
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala lie Pro Trp Pro Glu 405 410 415 acc aac ggc gag ccc aag ege gee ggt etc teg gee ttt ggc ttt ggt
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly 420 425 430 ggc acc aac gee cat gee gtc ttt gag gag cat gac ccc tee aac gee
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala 435 440 445 gee tgc aeg ggc cac gac tee att tet geg etc teg gee ege tgc ggc
Ala Cys Thr Gly His Asp Ser lie Ser Ala Leu Ser Ala Arg Cys Gly 450 455 460 ggt gaa age aac atg ege ate gee ate act ggt atg gac gee acc ttt
Gly Glu Ser Asn Met Arg lie Ala lie Thr Gly Met Asp Ala Thr Phe 465 470 475 480 ggc get etc aag gga etc gac gee ttc gag ege gee att tac acc ggc
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala lie Tyr Thr Gly 485 490 495 get cac ggt gee ate cca etc cca gaa aag ege tgg ege ttt etc ggc
Ala His Gly Ala lie Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly 500 505 510 aag gac aag gac ttt ctt gac etc tgc ggc gtc aag gee acc ccg cac
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His 515 520 525 ggc tgc tac att gaa gat gtt gag gtc gac ttc cag ege etc ege aeg
Gly Cys Tyr lie Glu Asp Val Glu Val Asp Phe Gin Arg Leu Arg Thr 530 535 540 ccc atg acc cct gaa gac atg etc etc cct cag cag ctt ctg gee gtc
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gin Gin Leu Leu Ala Val 545 550 555 560 acc acc att gac ege gee ate etc gac teg gga atg aaa aag ggt ggc
Thr Thr lie Asp Arg Ala lie Leu Asp Ser Gly Met Lys Lys Gly Gly 565 570 575 aat gtc gee gtc ttt gtc ggc etc ggc acc gac etc gag etc tac cgt
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg 580 585 590 cac cgt get ege gtc get etc aag gag ege gtc ege cct gaa gee tee
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1536 1584 1632 1680 1728 1776 1824 240 200813222 595 600 605 aag aag etc aat gac atg atg cag tac att aac gac tgc ggc aca tee 1872
Lys Lys Leu Asn Asp Met Met Gin Tyr lie Asn Asp Cys Gly Thr Ser 610 615 620 aca teg tac acc teg tac att ggc aac etc gtc gee aeg ege gtc teg 1920
Thr Ser Tyr Thr Ser Tyr lie Gly Asn Leu Val Ala Thr Arg Val Ser 625 630 635 640 teg cag tgg ggc ttc aeg ggc ccc tee ttt aeg ate acc gag ggc aac 1968
Ser Gin Trp Gly Phe Thr Gly Pro Ser Phe Thr lie Thr Glu Gly Asn 645 650 655 aac tee gtc tac ege tgc gee gag etc ggc aag tac etc etc gag acc 2016 - Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr 660 665 670 〜 ggc gag gtc gat ggc gtc gtc gtt geg ggt gtc gat etc tgc ggc agt 2064 • . Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser 675 680 685 gee gaa aac ett tac gtc aag tet ege ege ttc aag gtg tee acc tee 2112
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser 690 695 700 *: gat acc ccg ege gee age ttt gac gee gee gee gat ggc tac ttt gtc 2160
Asp Thr Pro ArR Ala Ser Phe Asd Ala Ala Ala Asd Glv Tvr Phe Val 705 710 ' 715 ^ 720 ggc gag ggc tgc ggt gee ttt gtg etc aag cgt gag act age tgc acc 2208
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr 725 730 735 aag gac gac cgt ate tac get tgc atg gat gee ate gtc cct ggc aac 2256
Lys Asp Asp Arg lie Tyr Ala Cys Met Asp Ala lie Val Pro Gly Asn 740 745 750 gtc cct age gee tgc ttg ege gag gee etc gac cag geg ege gtc aag 2304
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gin Ala Arg Val Lys 755 760 765 ccg ggc gat ate gag atg etc gag etc age gee gac tee gee ege cac 2352
Pro Gly Asp lie Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His 770 775 780 etc aag gac ccg tee gtc ctg ccc aag gag etc act gee gag gag gaa 2400
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu 785 790 795 800 ate ggc ggc ett cag aeg ate ett cgt gac gat gac aag etc ccg ege 2448 lie Gly Gly Leu Gin Thr lie Leu Arg Asp Asp Asp Lys Leu Pro Arg 805 810 815 X aac gtc gca aeg ggc agt gtc aag gee acc gtc ggt gac acc ggt tat 2496
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr … 820 825 830 gee tet ggt get gee age etc ate aag get geg ett tgc ate tac aac 2544 一 Ala Ser Gly Ala Ala Ser Leu lie Lys Ala Ala Leu Cys lie Tyr Asn ^ 835 840 845 ege tac ctg ccc age aac ggc gac gac tgg gat gaa ccc gee cct gag 2592
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu 850 855 860 geg ccc tgg gac age acc etc ttt geg tgc cag acc teg ege get tgg 2640
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gin Thr Ser Arg Ala Trp 865 870 875 880 etc aag aac cct ggc gag cgt ege tat geg gee gtc teg ggc gtc tee 2688
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser 885 890 895 gag aeg ege teg tgc tat tee gtg etc etc tee gaa gee gag ggc cac 2736 241 200813222
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His 900 905 910 tac gag cgc gag aac cgc ate teg etc gac gag gag geg ccc aag etc
Tyr Glu Arg Glu Asn Arg lie Ser Leu Asp Glu Glu Ala Pro Lys Leu 915 920 925 att gtg ett cgc gee gac tee cac gag gag ate ett ggt cgc etc gac lie Val Leu Arg Ala Asp Ser His Glu Glu lie Leu Gly Arg Leu Asp 930 935 940 aag ate cgc gag cgc ttc ttg cag ccc aeg ggc gee gee ccg cgc gag
Lys lie Arg Glu Arg Phe Leu Gin Pro Thr Gly Ala Ala Pro Arg Glu 945 950 955 960 tee gag etc aag geg cag gee cgc cgc ate ttc etc gag etc etc ggc
Ser Glu Leu Lys Ala Gin Ala Arg Arg lie Phe Leu Glu Leu Leu Gly 965 970 975 gag acc ett gee cag gat gee get tet tea ggc teg caa aag ccc etc
Glu Thr Leu Ala Gin Asp Ala Ala Ser Ser Gly Ser Gin Lys Pro Leu 980 985 990 get etc age etc gtc tee aeg ccc tee aag etc cag cgc gag gtc gag Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gin Arg Glu Val Glu 995 1000 1005 etc geg gee aag ggt ate ccg cgc tgc etc aag atg cgc cgc gat
Leu Ala Ala Lys Gly lie Pro Arg Cys Leu Lys Met Arg Arg Asp 1010 1015 1020 tgg age tee cct get ggc age cgc tac geg cct gag ccg etc gee
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala 1025 1030 1035 age gac cgc gtc gee ttc atg tac ggc gaa ggt cgc age cct tac
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr 1040 1045 1050 tac ggc ate acc caa gac att cac cgc att tgg ccc gaa etc cac
Tyr Gly lie Thr Gin Asp lie His Arg lie Trp Pro Glu Leu His 1055 1060 1065 gag gtc ate aac gaa aag aeg aac cgt etc tgg gee gaa ggc gac
Glu Val lie Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp 1070 1075 1080 cgc tgg gtc atg ccg cgc gee age ttc aag teg gag etc gag age
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser 1085 1090 1095 cag cag caa gag ttt gat cgc aac atg att gaa atg ttc cgt ett
Gin Gin Gin Glu Phe Asp Arg Asn Met lie Glu Met Phe Arg Leu 1100 1105 1110 gga ate etc acc tea att gee ttc acc aat ctg geg cgc gac gtt
Gly lie Leu Thr Ser lie Ala Phe Thr Asn Leu Ala Arg Asp Val 1115 1120 1125 etc aac ate aeg ccc aag gee gee ttt ggc etc agt ett ggc gag
Leu Asn lie Thr Pro Lys Ala Ala Phe Gly Leu Ser Leu Gly Glu 1130 1135 1140 att tee atg att ttt gee ttt tee aag aag aac ggt etc ate tee lie Ser Met lie Phe Ala Phe Ser Lys Lys Asn Gly Leu lie Ser 1145 1150 1155 gac cag etc acc aag gat ett cgc gag tee gac gtg tgg aac aag
Asp Gin Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn Lys 1160 1165 1170 get ctg gee gtt gaa ttt aat geg ctg cgc gag gee tgg ggc att
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly lie 1175 1180 1185 2784 2832 2880 2928 2976 3024 3069 3114 3159 3204 3249 3294 3339 3384 3429 3474 3519 3564 242 200813222 cca cag agt gtc ccc aag gac gag ttc tgg caa ggc tac att gtg 3609
Pro Gin Ser Val Pro Lys Asp Glu Phe Trp Gin Gly Tyr lie Val 1190 1195 1200 cgc ggc acc aag cag gat ate gag geg gee ate gee ccg gac age 3654
Arg Gly Thr Lys Gin Asp lie Glu Ala Ala lie Ala Pro Asp Ser 1205 1210 1215 aag tac gtg cgc etc acc ate ate aat gat gee aac acc gee etc 3699
Lys Tyr Val Arg Leu Thr lie lie Asn Asp Ala Asn Thr Ala Leu 1220 1225 1230 att age ggc aag ccc gac gee tgc aag get geg ate geg cgt etc 3744 lie Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala lie Ala Arg Leu .. 1235 1240 1245 ggt ggc aac att cct geg ett ccc gtg acc cag ggc atg tgc ggc 3789
Gly Gly Asn lie Pro Ala Leu Pro Val Thr Gin Gly Met Cys Gly 广 1250 1255 1260 cac tgc ccc gag gtg gga cct tat acc aag gat ate gee aag ate 3834 ' His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp lie Ala Lys lie 1265 1270 1275 cat gee aac ett gag ttc ccc gtt gtc gac ggc ett gac etc tgg 3879
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu Asp Leu Trp 1280 1285 1290 acc aca ate aac cag aag cgc etc gtg cca cgc gee aeg ggc gee 3924
Thr Thr lie Asn Gin Lys Arg Leu Val Pro Arg Ala Thr Gly Ala 1295 1300 1305 aag gac gaa tgg gee cct tet tee ttt ggc gag tac gee ggc cag 3969
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr Ala Gly Gin 1310 1315 1320 etc tac gag aag cag get aac ttc ccc caa ate gtc gag acc att 4014
Leu Tyr Glu Lys Gin Ala Asn Phe Pro Gin lie Val Glu Thr lie 1325 1330 1335 tac aag caa aac tac gac gtc ttt gtc gag gtt ggg ccc aac aac 4059
Tyr Lys Gin Asn Tyr Asp Val Phe Val Glu Val Gly Pro Asn Asn 1340 1345 1350 cac cgt age acc gca gtg cgc acc aeg ett ggt ccc cag cgc aac 4104
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro Gin Arg Asn 1355 1360 1365 cac ett get ggc gee ate gac aag cag aac gag gat get tgg aeg 4149
His Leu Ala Gly Ala lie Asp Lys Gin Asn Glu Asp Ala Trp Thr 1370 1375 1380 acc ate gtc aag ett gtg get teg etc aag gee cac ett gtt cct 4194 , Thr lie Val Lys Leu Val Ala Ser Leu Lys Ala His Leu Val Pro , 1385 1390 1395 … ggc gtc aeg ate teg ccg ctg tac cac tee aag ett gtg geg gag 4239 . Gly Val Thr lie Ser Pro Leu Tyr His Ser Lys Leu Val Ala Glu 1400 1405 1410 ' get gag get tgc tac get geg etc tgc aag ggt gaa aag ccc aag 4284
Ala Glu Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu Lys Pro Lys 1415 1420 1425 aag aac aag ttt gtg cgc aag att cag etc aac ggt cgc ttc aac 4329
Lys Asn Lys Phe Val Arg Lys lie Gin Leu Asn Gly Arg Phe Asn 1430 1435 1440 age aag geg gac ccc ate tee teg gee gat ett gee age ttt ccg 4374
Ser Lys Ala Asp Pro lie Ser Ser Ala Asp Leu Ala Ser Phe Pro 1445 1450 1455 cct geg gac cct gee att gaa gee gee ate teg age cgc ate atg 4419
Pro Ala Asp Pro Ala lie Glu Ala Ala lie Ser Ser Arg lie Met 1460 1465 1470 243 200813222 aag cct gtc get ccc aag ttc tac geg cgt etc aac att gac gag
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn lie Asp Glu 1475 1480 1485 cag gac gag acc ega gat ccg ate etc aac aag gac aac geg ccg
Gin Asp Glu Thr Arg Asp Pro lie Leu Asn Lys Asp Asn Ala Pro 1490 1495 1500 tet tet tet tet tet tet tet tet tet tet tet tet tet tet tet
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 1505 1510 1515 ccg teg cct get cct teg gee ccc gtg caa aag aag get get ccc
Pro Ser Pro Ala Pro Ser Ala Pro Val Gin Lys Lys Ala Ala Pro 1520 1525 1530 gee geg gag acc aag get gtt get teg get gac gca ett ege agt
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala Leu Arg Ser 1535 1540 1545 gee ctg etc gat etc gac agt atg ett geg ctg age tet gee agt
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser 1550 1555 1560 gee tee ggc aac ett gtt gag act geg cct age gac gee teg gtc
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val 1565 1570 1575 att gtg ccg ccc tgc aac att geg gat etc ggc age ege gee ttc lie Val Pro Pro Cys Asn lie Ala Asp Leu Gly Ser Arg Ala Phe 1580 1585 1590 atg aaa aeg tac ggt gtt teg geg cct ctg tac aeg ggc gee atg
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met 1595 1600 1605 gee aag ggc att gee tet geg gac etc gtc att gee gee ggc ege
Ala Lys Gly lie Ala Ser Ala Asp Leu Val lie Ala Ala Gly Arg 1610 1615 1620 cag ggc ate ett geg tee ttt ggc gee ggc gga ett ccc atg cag
Gin Gly lie Leu Ala Ser Phe Gly Ala Gly Gly Leu Pro Met Gin 1625 1630 1635 gtt gtg cgt gag tee ate gaa aag att cag gee gee ctg ccc aat
Val Val Arg Glu Ser lie Glu Lys lie Gin Ala Ala Leu Pro Asn 1640 1645 1650 ggc ccg tac get gtc aac ett ate cat tet ccc ttt gac age aac
Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro Phe Asp Ser Asn 1655 1660 1665 etc gaa aag ggc aat gtc gat etc ttc etc gag aag ggt gtc acc
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val Thr 1670 1675 1680 ttt gtc gag gee teg gee ttt atg aeg etc acc ccg cag gtc gtg
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gin Val Val 1685 1690 1695 egg tac ege geg get ggc etc aeg ege aac gee gac ggc teg gtc
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp Gly Ser Val 1700 1705 1710 aac ate ege aac cgt ate att ggc aag gtc teg ege acc gag etc
Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu 1715 1720 1725 gee gag atg ttc atg cgt cct geg ccc gag cac ett ett cag aag
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu Gin Lys 1730 1735 1740 etc att get tee ggc gag ate aac cag gag cag gee gag etc gee
Leu lie Ala Ser Gly Glu lie Asn Gin Glu Gin Ala Glu Leu Ala 4464 4509 4554 4599 4644 4689 4734 4779 4824 4869 4914 4959 5004 5049 5094 5139 5184 5229 5274 244 200813222 1745 1750 1755 Cgc cgt gtt ccc gtc get gac gac ate geg gtc gaa get gac teg 5319 Arg Arg Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser 1760 1765 1770 ggt ggc cac acc gac aac cgc ccc ate cac gtc att ctg ccc etc 5364 Gly Gly His Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu 1775 1780 1785 ate ate aac ett cgc gac cgc ett cac cgc gag tgc ggc tac ccg 5409 lie lie Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro 1790 1795 1800 gee aac ett cgc gtc cgt gtg ggc gee ggc ggt ggc att ggg tgc 5454 Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly lie Gly Cys 1805 1810 1815 ccc cag geg geg ctg gee acc ttc aac atg ggt gee tee ttt att 5499 Pro Gin Ala Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe lie 1820 1825 1830 gtc acc ggc acc gtg aac cag gtc gee aag cag teg ggc aeg tgc 5544 Val Thr Gly Thr Val Asn Gin Val Ala Lys Gin Ser Gly Thr Cys 1835 1840 1845 gac aat gtg cgc aag cag etc geg aag gee act tac teg gac gta 5589 Asd Asn Val Ars Lvs Gin Leu Ala Lvs Ala Thr Tvr Ser Asp Val 1850 1855 1860 tgc atg gee ccg get gee gac atg ttc gag gaa ggc gtc aag ett 5634 Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys Leu 1865 1870 1875 cag gtc etc aag aag gga acc atg ttt ccc teg cgc gee aac aag 5679 Gin Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn Lys 1880 1885 1890 etc tac gag etc ttt tgc aag tac gac teg ttc gag tee atg ccc 5724 Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ser Met Pro 1895 1900 1905 ccc gca gag ett geg cgc gtc gag aag cgc ate ttc age cgc geg 5769 Pro Ala Glu Leu Ala Arg Val Glu Lys Arg lie Phe Ser Arg Ala 1910 1915 1920 etc gaa gag gtc tgg gac gag acc aaa aac ttt tac att aac cgt 5814 Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr lie Asn Arg 1925 1930 1935 ett cac aac ccg gag aag ate cag cgc gee gag cgc gac ccc aag 5859 Leu His Asn Pro Glu Lys lie Gin Arg Ala Glu Arg Asp Pro Lys 1940 1945 1950 etc aag atg teg ctg tgc ttt cgc tgg tac ctg age ctg geg age 5904 Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser Leu Ala Ser 1955 1960 1965 cgc tgg gee aac act gga get tee gat cgc gtc atg gac tac cag 5949 Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gin 1970 1975 1980 gtc tgg tgc ggt cct gee att ggt tee ttc aac gat ttc ate aag 5994 Val Trp Cys Gly Pro Ala lie Gly Ser Phe Asn Asp Phe lie Lys 1985 1990 1995 gga act tac ett gat ccg gee gtc gca aac gag tac ccg tgc gtc 6039 Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val 2000 2005 2010 gtt cag att aac aag cag ate ett cgt gga geg tgc ttc ttg cgc 6084 Val Gin lie Asn Lys Gin lie Leu Arg Gly Ala Cys Phe Leu Arg 2015 2020 2025 cgt etc gaa att ctg cgc aac gca cgc ett tee gat ggc get gee 6129 245 200813222
Arg Leu Glu lie Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala 2030 2035 2040 6174 6180 get ett gtg gcc age ate gat gac aca tac gtc ccg gee gag aag
Ala Leu Val Ala Ser lie Asp Asp Thr Tyr Val Pro Ala Glu Lys 2045 2050 2055
ctg taa Leu <210〉 4 <211> 2059 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <>4
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys 15 10 15
Arg lie Ala Val Val Gly Met Ala Val Gin Tyr Ala Gly Cys Lys Thr 20 25 30
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys 35 40 45
Val lie Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr 50 55 60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr 65 70 75 80
Gly Thr Leu Asp Glu Asn Glu lie Asp Asn Glu His Glu Leu Leu Leu 85 90 95
Asn Leu Ala Lys Gin Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr 100 105 110
Arg Cys Gly lie Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu 115 120 125
Gin Gly Glu Leu Leu Asn Val Tyr Gin Asn His Val Glu Lys Lys Leu 130 135 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gin 145 150 155 160
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg lie Phe Met Asp Pro Ala 165 170 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val 180 185 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gin Asp 195 200 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys 210 215 220 246 200813222
Leu Pro Glu Pro Phe Phe lie Leu Ser Gly Phe Ser Thr Phe Gin Ala 225 230 235 240
Met Pro Val Gly Thr Gly Gin Asn Val Ser Met Pro Leu His Lys Asp 245 250 255
Ser Gin Gly Leu Thr Pro Gly Glu Gly Gly Ser lie Met Val Leu Lys 260 265 270
Arg Leu Asp Asp Ala lie Arg Asp Gly Asp His lie Tyr Gly Thr Leu 275 280 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro 290 295 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg lie 305 310 315 320
Asn Val His Pro His Lys lie Gin Tyr Val Glu Cys His Ala Thr Gly 325 330 335
Thr Pro Gin Gly Asp Arg Val Glu lie Asp Ala Val Lys Ala Cys Phe 340 345 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His 355 360 365
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser 370 375 380
Met Lys His Gly lie lie Pro Pro Thr Pro Gly lie Asp Asp Glu Thr 385 390 395 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala lie Pro Trp Pro Glu 405 410 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly 420 425 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala 435 440 445
Ala Cys Thr Gly His Asp Ser lie Ser Ala Leu Ser Ala Arg Cys Gly 450 455 460
Gly Glu Ser Asn Met Arg lie Ala lie Thr Gly Met Asp Ala Thr Phe 465 470 475 480
Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg Ala lie Tyr Thr Gly 485 490 495
Ala His Gly Ala lie Pro Leu Pro Glu Lys Arg Trp Arg Phe Leu Gly 500 505 510
Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val Lys Ala Thr Pro His 515 520 525 247 200813222
Gly Cys Tyr lie Glu Asp Val Glu Val Asp Phe Gin Arg Leu Arg Thr 530 535 540
Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gin Gin Leu Leu Ala Val 545 550 555 560
Thr Thr lie Asp Arg Ala lie Leu Asp Ser Gly Met Lys Lys Gly Gly 565 570 575
Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg 580 585 590
His Arg Ala Arg Val Ala Leu Lys Glu Arg Val Arg Pro Glu Ala Ser 595 600 605
Lys Lys Leu Asn Asp Met Met Gin Tyr lie Asn Asp Cys Gly Thr Ser 610 615 620
Thr Ser Tyr Thr Ser Tyr lie Gly Asn Leu Val Ala Thr Arg Val Ser 625 630 635 640
Ser Gin Trp Gly Phe Thr Gly Pro Ser Phe Thr lie Thr Glu Gly Asn 645 650 655
Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys Tyr Leu Leu Glu Thr 660 665 670
Gly Glu Val Asp Gly Val Val Val Ala Gly Val Asp Leu Cys Gly Ser 675 680 685
Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe Lys Val Ser Thr Ser 690 695 700
Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala Asp Gly Tyr Phe Val 705 710 715 720
Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg Glu Thr Ser Cys Thr 725 730 735
Lys Asp Asp Arg lie Tyr Ala Cys Met Asp Ala lie Val Pro Gly Asn 740 745 750
Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp Gin Ala Arg Val Lys 755 760 765
Pro Gly Asp lie Glu Met Leu Glu Leu Ser Ala Asp Ser Ala Arg His 770 775 780
Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu Thr Ala Glu Glu Glu 785 790 795 800 lie Gly Gly Leu Gin Thr lie Leu Arg Asp Asp Asp Lys Leu Pro Arg 805 810 815
Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val Gly Asp Thr Gly Tyr 820 825 830 248 200813222
Ala Ser Gly Ala Ala Ser Leu lie Lys Ala Ala Leu Cys lie Tyr Asn 835 840 845
Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp Glu Pro Ala Pro Glu 850 855 860
Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gin Thr Ser Arg Ala Trp 865 870 875 880
Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala Val Ser Gly Val Ser 885 890 895
Glu Thr Arg Ser Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His 900 905 910
Tyr Glu Arg Glu Asn Arg lie Ser Leu Asp Glu Glu Ala Pro Lys Leu 915 920 925 lie Val Leu Arg Ala Asp Ser His Glu Glu lie Leu Gly Arg Leu Asp 930 935 940
Lys lie Arg Glu Arg Phe Leu Gin Pro Thr Gly Ala Ala Pro Arg Glu 945 950 955 960
Ser Glu Leu Lys Ala Gin Ala Arg Arg lie Phe Leu Glu Leu Leu Gly 965 970 975
Glu Thr Leu Ala Gin Asp Ala Ala Ser Ser Gly Ser Gin Lys Pro Leu 980 985 990
Ala Leu Ser Leu Val Ser Thr Pro Ser Lys Leu Gin Arg Glu Val Glu 995 1000 1005
Leu Ala Ala Lys Gly lie Pro Arg Cys Leu Lys Met Arg Arg Asp 1010 1015 1020
Trp Ser Ser Pro Ala Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala 1025 1030 1035
Ser Asp Arg Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr 1040 1045 1050
Tyr Gly lie Thr Gin Asp lie His Arg lie Trp Pro Glu Leu His 1055 1060 1065
Glu Val lie Asn Glu Lys Thr Asn Arg Leu Trp Ala Glu Gly Asp 1070 1075 1080
Arg Trp Val Met Pro Arg Ala Ser Phe Lys Ser Glu Leu Glu Ser 1085 1090 1095
Gin Gin Gin Glu Phe Asp Arg Asn Met lie Glu Met Phe Arg Leu 1100 1105 1110
Gly lie Leu Thr Ser lie Ala Phe Thr Asn Leu Ala Arg Asp Val 249 200813222 1115 1120 1125
Leu Asn lie Thr Pro Lys Ala Ala Phe Gly Leu Ser 1130 1135 1140 lie Ser Met lie Phe Ala Phe Ser Lys Lys Asn Gly 1145 1150 1155
Asp Gin Leu Thr Lys Asp Leu Arg Glu Ser Asp Val 1160 1165 1170
Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala 1175 1180 1185
Pro Gin Ser Val Pro Lys Asp Glu Phe Trp Gin Gly 1190 1195 1200
Arg Gly Thr Lys Gin Asp lie Glu Ala Ala lie Ala 1205 1210 1215
Lys Tyr Val Arg Leu Thr lie lie Asn Asp Ala Asn 1220 1225 1230 lie Ser Gly Lys Pro Asp Ala Cys Lys Ala Ala lie 1235 1240 1245
Gly Gly Asn lie Pro Ala Leu Pro Val Thr Gin Gly 1250 1255 1260
His Cys Pro Glu Val Gly Pro Tyr Thr Lys Asp lie 1265 1270 1275
His Ala Asn Leu Glu Phe Pro Val Val Asp Gly Leu 1280 1285 1290
Thr Thr lie Asn Gin Lys Arg Leu Val Pro Arg Ala 1295 1300 1305
Lys Asp Glu Trp Ala Pro Ser Ser Phe Gly Glu Tyr 1310 1315 1320
Leu Tyr Glu Lys Gin Ala Asn Phe Pro Gin lie Val 1325 1330 1335
Tyr Lys Gin Asn Tyr Asp Val Phe Val Glu Val Gly 1340 1345 1350
His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly Pro 1355 1360 1365
His Leu Ala Gly Ala lie Asp Lys Gin Asn Glu Asp 1370 1375 1380
Thr lie Val Lys Leu Val Ala Ser Leu Lys Ala His 1385 1390 1395
Leu Gly Glu Leu lie Ser Trp Asn Lys Trp Gly lie Tyr lie Val Pro Asp Ser Thr Ala Leu Ala Arg Leu Met Cys Gly Ala Lys lie Asp Leu Trp Thr Gly Ala Ala Gly Gin Glu Thr lie Pro Asn Asn Gin Arg Asn Ala Trp Thr Leu Val Pro 250 200813222
Gly Val Thr lie Ser Pro Leu Tyr His Ser Lys Leu 1400 1405 1410
Ala Glu Ala Cys Tyr Ala Ala Leu Cys Lys Gly Glu 1415 1420 1425
Lys Asn Lys Phe Val Arg Lys lie Gin Leu Asn Gly 1430 1435 1440
Ser Lys Ala Asp Pro lie Ser Ser Ala Asp Leu Ala 1445 1450 1455
Pro Ala Asp Pro Ala lie Glu Ala Ala lie Ser Ser 1460 1465 1470
Lys Pro Val Ala Pro Lys Phe Tyr Ala Arg Leu Asn 1475 1480 1485
Gin Asp Glu Thr Arg Asp Pro lie Leu Asn Lys Asp 1490 1495 1500
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 1505 1510 1515
Pro Ser Pro Ala Pro Ser Ala Pro Val Gin Lys Lys 1520 1525 1530
Ala Ala Glu Thr Lys Ala Val Ala Ser Ala Asp Ala 1535 1540 1545
Ala Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser 1550 1555 1560
Ala Ser Gly Asn Leu Val Glu Thr Ala Pro Ser Asp 1565 1570 1575 lie Val Pro Pro Cys Asn lie Ala Asp Leu Gly Ser 1580 1585 1590
Met Lys Thr Tyr Gly Val Ser Ala Pro Leu Tyr Thr 1595 1600 1605
Ala Lys Gly lie Ala Ser Ala Asp Leu Val lie Ala 1610 1615 1620
Gin Gly lie Leu Ala Ser Phe Gly Ala Gly Gly Leu 1625 1630 1635
Val Val Arg Glu Ser lie Glu Lys lie Gin Ala Ala 1640 1645 1650
Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro Phe 1655 1660 1665
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys 1670 1675 1680
Val Ala Glu Lys Pro Lys Arg Phe Asn Ser Phe Pro Arg lie Met lie Asp Glu Asn Ala Pro Ser Ser Ser Ala Ala Pro Leu Arg Ser Ser Ala Ser Ala Ser Val Arg Ala Phe Gly Ala Met Ala Gly Arg Pro Met Gin Leu Pro Asn Asp Ser Asn Gly Val Thr 251 200813222
Phe Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro 1685 1690 1695
Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala Asp 1700 1705 1710
Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg 1715 1720 1725
Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu 1730 1735 1740
Leu lie Ala Ser Gly Glu lie Asn Gin Glu Gin Ala 1745 1750 1755
Arg Arg Val Pro Val Ala Asp Asp lie Ala Val Glu 1760 1765 1770
Gly Gly His Thr Asp Asn Arg Pro lie His Val lie 1775 1780 1785 lie lie Asn Leu Arg Asp Arg Leu His Arg Glu Cys 1790 1795 1800
Ala Asn Leu Arg Val Arg Val Gly Ala Gly Gly Gly 1805 1810 1815
Pro Gin Ala Ala Leu Ala Thr Phe Asn Met Gly Ala 1820 1825 1830
Val Thr Gly Thr Val Asn Gin Val Ala Lys Gin Ser 1835 1840 1845
Asp Asn Val Arg Lys Gin Leu Ala Lys Ala Thr Tyr 1850 1855 1860
Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly 1865 1870 1875
Gin Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg 1880 1885 1890
Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu 1895 1900 1905
Pro Ala Glu Leu Ala Arg Val Glu Lys Arg lie Phe 1910 1915 1920
Leu Glu Glu Val Trp Asp Glu Thr Lys Asn Phe Tyr 1925 1930 1935
Leu His Asn Pro Glu Lys lie Gin Arg Ala Glu Arg 1940 1945 1950
Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser 1955 1960 1965
Gin Val Val Gly Ser Val Thr Glu Leu Leu Gin Lys Glu Leu Ala Ala Asp Ser Leu Pro Leu Gly Tyr Pro lie Gly Cys Ser Phe lie Gly Thr Cys Ser Asp Val Val Lys Leu Ala Asn Lys Ser Met Pro Ser Arg Ala lie Asn Arg Asp Pro Lys Leu Ala Ser 252 200813222
Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp Tyr Gin 1970 1975 1980
Val Trp Cys Gly Pro Ala He Gly Ser Phe Asn Asp Phe lie Lys 1985 1990 1995
Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val 2000 2005 2010
Val Gin lie Asn Lys Gin lie Leu Arg Gly Ala Cys Phe Leu Arg 2015 2020 2025
Arg Leu Glu lie Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala 2030 2035 2040
Ala Leu Val Ala Ser lie Asp Asp Thr Tyr Val Pro Ala Glu Lys 2045 2050 2055
Leu <210> 5 <211> 4509 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <220> <221> CDS <222> (1)..(4509) <400> 5 atg gcg etc cgt gtc aag aeg aac aag aag cca tgc tgg gag atg acc
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr 15 10 15 aag gag gag ctg acc age ggc aag acc gag gtg ttc aac tat gag gaa
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu 20 25 30 etc etc gag ttc gca gag ggc gac ate gcc aag gtc ttc gga ccc gag
Leu Leu Glu Phe Ala Glu Gly Asp lie Ala Lys Val Phe Gly Pro Glu 35 40 45 ttc gcc gtc ate gac aag tac ccg ege ege gtg ege ctg ccc gcc ege
Phe Ala Val lie Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg 50 55 60 gag tac ctg etc gtg acc ege gtc acc etc atg gac gcc gag gtc aac
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn 65 70 75 80 aac tac ege gtc ggc gcc ege atg gtc acc gag tac gat etc ccc gtc
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val 85 90 95 aac gga gag etc tee gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val 100 105 110 gag agt ggc cag tgc gat etc atg etc ate tee tac atg ggc att gac
Glu Ser Gly Gin Cys Asp Leu Met Leu lie Ser Tyr Met Gly lie Asp 115 120 125 ttc cag aac cag ggc gac ege gtc tac ege ctg etc aac acc aeg etc
Phe Gin Asn Gin Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 48 96 144 192 240 288 336 384 253 432 480 200813222 130 135 140 acc ttt tac ggc gtg gcc cac gag ggc gag acc etc gag tac gac att
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp lie 145 150 155 160 ege gtc acc ggc ttc gcc aag cgt etc gac ggc ggc ate tee atg ttc
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly lie Ser Met Phe 165 170 175 ttc ttc gag tac gac tgc tac gtc aac ggc ege etc etc ate gag atg
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu lie Glu Met 180 185 190 ege gat ggc tgc gcc ggc ttc ttc acc aac gag gag etc gac gcc ggc
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly 195 200 205 aag ggc gtc gtc ttc acc ege ggc gac etc gcc gcc ege gcc aag ate
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys lie 210 215 220 cca aag cag gac gtc tee ccc tac gcc gtc gcc ccc tgc etc cac aag
Pro Lys Gin Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys 225 230 235 240 acc aag etc aac gaa aag gag atg cag acc etc gtc gac aag gac tgg
Thr Lys Leu Asn Glu Lys Glu Met Gin Thr Leu Val Asp Lys Asp Trp 245 250 255 gca tee gtc ttt ggc tee aag aac ggc atg ccg gaa ate aac tac aaa
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu lie Asn Tyr Lys 260 265 270 etc tgc geg cgt aag atg etc atg att gac ege gtc acc age att gac
Leu Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr Ser lie Asp 275 280 285 cac aag ggc ggt gtc tac ggc etc ggt cag etc gtc ggt gaa aag ate
His Lys Gly Gly Val Tyr Gly Leu Gly Gin Leu Val Gly Glu Lys lie 290 295 300 etc gag ege gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gin 305 310 315 320 gtc atg gcc gga tee etc gtc tee gac ggc tgc age cag atg etc aag
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Met Leu Lys 325 330 335 atg tac atg ate tgg etc ggc etc cac etc acc acc gga ccc ttt gac
Met Tyr Met lie Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp 340 345 350 ttc ege ccg gtc aac ggc cac ccc aac aag gtc ege tgc ege ggc caa
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 ate tee ccg cac aag ggc aag etc gtc tac gtc atg gag ate aag gag lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Glu 370 375 380 atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala lie Ala Asp Val Asn 385 390 395 400 ate att gat gtc gac ttc gaa aag ggc cag gac ttt age etc gac ege lie lie Asp Val Asp Phe Glu Lys Gly Gin Asp Phe Ser Leu Asp Arg 405 410 415 ate age gac tac ggc aag ggc gac etc aac aag aag ate gtc gtc gac lie Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys lie Val Val Asp 420 425 430 ttt aag ggc ate get etc aag atg cag aag ege tee acc aac aag aac 528 576 624 672 720 768 816 864 912 960 1008 1056 1104 1152 1200 1248 1296 1344 254 200813222
Phe Lys Gly lie Ala Leu Lys Met Gin Lys Arg Ser Thr Asn Lys Asn 435 440 445 ccc tcc aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc 1392
Pro Ser Lys Val Gin Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly 450 455 460 ccc gag gcc tcc aag get tcc tcc ggc gcc age gcc age gcc age gcc 1440
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala 465 470 475 480 gcc ccg gcc aag cct gcc ttc age gcc gat gtt ett geg ccc aag ccc 1488
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro 485 490 495 gtt gcc ett ccc gag cac ate etc aag ggc gac gcc etc gcc ccc aag 1536
Val Ala Leu Pro Glu His lie Leu Lys Gly Asp Ala Leu Ala Pro Lys 500 505 510 gag atg tcc tgg cac ccc atg gcc ege ate ccg ggc aac ccg aeg ccc 1584
Glu Met Ser Trp His Pro Met Ala Arg lie Pro Gly Asn Pro Thr Pro 515 520 525 tet ttt geg ccc teg gcc tac aag ccg ege aac ate gcc ttt aeg ccc 1632
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn lie Ala Phe Thr Pro 530 535 540 ttc ccc ggc aac ccc aac gat aac gac cac acc ccg ggc aag atg ccg
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro 545 550 555 560 etc acc tgg ttc aac atg gcc gag ttc atg gcc ggc aag gtc age atg 1728
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met 565 570 575 tgc etc ggc ccc gag ttc gcc aag ttc gac gac teg aac acc age ege 1776
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg 580 585 590 age ccc get tgg gac etc get etc gtc acc ege gcc gtg tet gtg tet 1824
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser 595 600 605 gac etc aag cac gtc aac tac ege aac ate gac etc gac ccc tcc aag 1872
Asp Leu Lys His Val Asn Tyr Arg Asn lie Asp Leu Asp Pro Ser Lys 610 615 620 ggt acc atg gtc ggc gag ttc gac tgc ccc geg gac gcc tgg ttc tac 1920
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr 625 630 635 640 aag ggc gcc tgc aac gat gcc cac atg ccg tac teg ate etc atg gag 1968
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser lie Leu Met Glu 645 650 655 ate gcc etc cag acc teg ggt gtg etc acc teg gtg etc aag geg ccc 2016 lie Ala Leu Gin Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro 660 665 670 ctg acc atg gag aag gac gac ate etc ttc ege aac etc gac gcc aac 2064
Leu Thr Met Glu Lys Asp Asp lie Leu Phe Arg Asn Leu Asp Ala Asn 675 680 685 gcc gag ttc gtg ege gcc gac etc gac tac ege ggc aag act ate ege 2112
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr lie Arg 690 695 700 aac gtc acc aag tgc act ggc tac age atg etc ggc gag atg ggc gtc 2160
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val 705 710 715 720 cac ege ttc acc ttt gag etc tac gtc gat gat gtg etc ttt tac aag 2208
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys 725 730 735 255 200813222 ggc teg acc teg ttc ggc tgg ttc gtg ccc gag gtc ttt gee gee cag
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gin 740 745 750 gee ggc etc gac aac ggc ege aag teg gag ccc tgg ttc att gag aac
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe lie Glu Asn 755 760 765 aag gtt ccg gee teg cag gtc tee tee ttt gac gtg ege ccc aac ggc
Lys Val Pro Ala Ser Gin Val Ser Ser Phe Asp Val Arg Pro Asn Gly 770 775 780 age ggc ege acc gee ate ttc gee aac gee ccc age ggc gee cag etc
Ser Gly Arg Thr Ala lie Phe Ala Asn Ala Pro Ser Gly Ala Gin Leu 785 790 795 800 aac ege ege aeg gac cag ggc cag tac etc gac gee gtc gac att gtc
Asn Arg Arg Thr Asp Gin Gly Gin Tyr Leu Asp Ala Val Asp lie Val 805 810 815 tee ggc age ggc aag aag age etc ggc tac gee cac ggt tee aag aeg
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr 820 825 830 gtc aac ccg aac gac tgg ttc ttc teg tgc cac ttt tgg ttt gac teg
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser 835 840 845 gtc atg ccc gga agt etc ggt gtc gag tee atg ttc cag etc gtc gag
Val Met Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gin Leu Val Glu 850 855 860 gee ate gee gee cac gag gat etc get ggc aag cac ggc att gee aac
Ala lie Ala Ala His Glu Asp Leu Ala Gly Lys His Gly lie Ala Asn 865 870 875 880 ccc acc ttt gtg cac gee ccg ggc aag ate age tgg aag tac ege ggc
Pro Thr Phe Val His Ala Pro Gly Lys lie Ser Trp Lys Tyr Arg Gly 885 890 895 cag etc aeg ccc aag age aag aag atg gac teg gag gtc cac ate gtg
Gin Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His lie Val 900 905 910 tee gtg gac gee cac gac ggc gtt gtc gac etc gtc gee gac ggc ttc
Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe 915 920 925 etc tgg gee gac age etc ege gtc tac teg gtg age aac att ege gtg
Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn lie Arg Val 930 935 940 ege ate gee tee ggt gag gee cct gee gee gee tee tee gee gee tet
Arg lie Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala Ser 945 950 955 960 gtg ggc tee teg get teg tee gtc gag ege aeg ege teg age ccc get
Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro Ala 965 970 975 gtc gee tee ggc ccg gee cag acc ate gac etc aag cag etc aag acc
Val Ala Ser Gly Pro Ala Gin Thr lie Asp Leu Lys Gin Leu Lys Thr 980 985 990 gag etc etc gag etc gat gee ccg etc tac etc teg cag gac ccg acc
Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gin Asp Pro Thr 995 1000 1005 age ggc cag etc aag aag cac acc gac gtg gee tee ggc cag gee
Ser Gly Gin Leu Lys Lys His Thr Asp Val Ala Ser Gly Gin Ala 1010 1015 1020 acc ate gtg cag ccc tgc aeg etc ggc gac etc ggt gac ege tee
Thr lie Val Gin Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg Ser 1025 1030 1035 2256 2304 2352 2400 2448 2496 2544 2592 2640 2688 2736 2784 2832 2880 2928 2976 3024 3069 3114 256 ttc atg Phe Met 1040 atg gcc Met Ala 1055 aag cgc Lys Arg 1070 cac cac His His 1085 cag ggc Gin Gly 1100 aac etc Asn Leu 1115 act gtg Thr Val 1130 gtg cgc Val Arg 1145 gtc aac Val Asn 1160 etc gcc Leu Ala 1175 aag etc Lys Leu 1190 geg cgc Ala Arg 1205 teg ggc Ser Gly 1220 etc ate Leu lie 1235 ccc geg Pro Ala 1250 tgc ccg Cys Pro 1265 ate gtc lie Val 1280 tgc gac Cys Asp 1295 ate tgc lie Cys 200813222 gag acc tac ggc gtc gtc gcc ccg ctg tac aeg ggc gcc
Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly Ala 1045 1050 aag ggc att gcc teg geg gac etc gtc ate gcc gcc ggc
Lys Gly lie Ala Ser Ala Asp Leu Val lie Ala Ala Gly 1060 1065 aag ate etc ggc tee ttt ggc gcc ggc ggc etc ccc atg
Lys lie Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Met 1075 1080 gtg cgc gcc gcc etc gag aag ate cag gcc gcc ctg cct
Val Arg Ala Ala Leu Glu Lys lie Gin Ala Ala Leu Pro 1090 1095 ccc tac gcc gtc aac etc ate cac teg cct ttt gac age
Pro Tyr Ala Val Asn Leu lie His Ser Pro Phe Asp Ser 1105 1110 gag aag ggc aac gtc gat etc ttc etc gag aag ggc gtc
Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val 1120 1125 gtg gag gcc teg gca ttc atg acc etc acc ccg cag gtc
Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gin Val 1135 1140 tac cgc gcc gcc ggc etc teg cgc aac gcc gac ggt teg
Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser 1150 1155 ate cgc aac cgc ate ate ggc aag gtc teg cgc acc gag lie Arg Asn Arg lie lie Gly Lys Val Ser Arg Thr Glu 1165 1170 gag atg ttc ate cgc ccg gcc ccg gag cac etc etc gag
Glu Met Phe lie Arg Pro Ala Pro Glu His Leu Leu Glu 1180 1185 ate gcc teg ggc gag ate acc cag gag cag gcc gag etc lie Ala Ser Gly Glu lie Thr Gin Glu Gin Ala Glu Leu 1195 1200 cgc gtt ccc gtc gcc gac gat ate get gtc gag get gac
Arg Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp 1210 1215 ggc cac acc gac aac cgc ccc ate cac gtc ate etc ccg
Gly His Thr Asp Asn Arg Pro lie His Val lie Leu Pro 1225 1230 ate aac etc cgc aac cgc ctg cac cgc gag tgc ggc tac lie Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly Tyr 1240 1245 cac etc cgc gtc cgc gtt ggc gcc ggc ggt ggc gtc ggc
His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val Gly 1255 1260 cag gcc gcc gcc gcc geg etc acc atg ggc gcc gcc ttc
Gin Ala Ala Ala Ala Ala Leu Thr Met Gly Ala Ala Phe 1270 1275 acc ggc act gtc aac cag gtc gcc aag cag tee ggc acc
Thr Gly Thr Val Asn Gin Val Ala Lys Gin Ser Gly Thr 1285 1290 aac gtg cgc aag cag etc teg cag gcc acc tac teg gat
Asn Val Arg Lys Gin Leu Ser Gin Ala Thr Tyr Ser Asp 1300 1305 atg gee ccg gee gcc gac atg ttc gag gag ggc gtc aag
Met Ala Pro Ala Ala Asp Met Phe Glu Glu Gly Val Lys 3159 3204 3249 3294 3339 3384 3429 3474 3519 3564 3609 3654 3699 3744 3789 3834 3879 3924 3969 257 200813222 1310 1315 1320 etc cag gtc etc aag aag gga acc atg ttc ccc teg ege gee aac
Leu Gin Val Leu Lys Lys Gly Thr Met Phe Pro Ser Arg Ala Asn 1325 1330 1335 aag etc tac gag etc ttt tgc aag tac gac tee ttc gac tee atg
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Asp Ser Met 1340 1345 1350 cct cct gee gag etc gag ege ate gag aag cgt ate ttc aag ege
Pro Pro Ala Glu Leu Glu Arg lie Glu Lys Arg lie Phe Lys Arg 1355 1360 1365 gca etc cag gag gtc tgg gag gag acc aag gac ttt tac att aac
Ala Leu Gin Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr lie Asn 1370 1375 1380 ggt etc aag aac ccg gag aag ate cag ege gee gag cac gac ccc
Gly Leu Lys Asn Pro Glu Lys lie Gin Arg Ala Glu His Asp Pro 1385 1390 1395 aag etc aag atg teg etc tgc ttc ege tgg tac ett ggt ett gee
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala 1400 1405 1410 age ege tgg gee aac atg ggc gee ccg gac ege gtc atg gac tac
Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr 1415 1420 1425 cag gtc tgg tgt ggc ccg gee att ggc gee ttc aac gac ttc ate
Gin Val Trp Cys Gly Pro Ala lie Gly Ala Phe Asn Asp Phe lie 1430 1435 1440 aag ggc acc tac etc gac ccc get gtc tee aac gag tac ccc tgt
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys 1445 1450 1455 gtc gtc cag ate aac ctg caa ate etc cgt ggt gee tgc tac ctg
Val Val Gin lie Asn Leu Gin lie Leu Arg Gly Ala Cys Tyr Leu 1460 1465 1470 ege cgt etc aac gee ctg ege aac gac ccg ege att gac etc gag
Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg lie Asp Leu Glu 1475 1480 1485 acc gag gat get gee ttt gtc tac gag ccc acc aac geg etc taa
Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn Ala Leu 1490 1495 1500
<210〉 6 <211〉 1502 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 6
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr 15 10 15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu 20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp lie Ala Lys Val Phe Gly Pro Glu 35 40 45
Phe Ala Val lie Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg 50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn 4014 4059 4104 4149 4194 4239 4284 4329 4374 4419 4464 4509 258 200813222 65 70 75 80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val 85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val 100 105 110
Glu Ser Gly Gin Cys Asp Leu Met Leu lie Ser Tyr Met Gly lie Asp 115 120 125
Phe Gin Asn Gin Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp lie 145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly lie Ser Met Phe 165 170 175
Pbp Phe Gin Tvr Asn Tvr Val Asn v Arp- ϊ.ριι ϊ.ριι Tip Gin Mpt ' 180 A 185 190
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly 195 200 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys lie 210 215 220
Pro Lys Gin Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys 225 230 235 240
Thr Lys Leu Asn Glu Lys Glu Met Gin Thr Leu Val Asp Lys Asp Trp 245 250 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu lie Asn Tyr Lys 260 265 270
Leu Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr Ser lie Asp 275 280 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gin Leu Val Gly Glu Lys lie 290 295 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gin 305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Met Leu Lys 325 330 335
Met Tyr Met lie Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp 340 345 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 259 200813222 lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Glu 370 375 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala lie Ala Asp Val Asn 385 390 395 400 lie lie Asp Val Asp Phe Glu Lys Gly Gin Asp Phe Ser Leu Asp Arg 405 410 415 lie Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys lie Val Val Asp 420 425 430
Phe Lys Gly lie Ala Leu Lys Met Gin Lys Arg Ser Thr Asn Lys Asn 435 440 445
Pro Ser Lys Val Gin Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly 450 455 460
Pro Glu Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala 465 470 475 480
Ala Pro Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro 485 490 495
Val Ala Leu Pro Glu His lie Leu Lys Gly Asp Ala Leu Ala Pro Lys 500 505 510
Glu Met Ser Trp His Pro Met Ala Arg lie Pro Gly Asn Pro Thr Pro 515 520 525
Ser Phe Ala Pro Ser Ala Tyr Lys Pro Arg Asn lie Ala Phe Thr Pro 530 535 540
Phe Pro Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro 545 550 555 560
Leu Thr Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met 565 570 575
Cys Leu Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg 580 585 590
Ser Pro Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser 595 600 605
Asp Leu Lys His Val Asn Tyr Arg Asn lie Asp Leu Asp Pro Ser Lys 610 615 620
Gly Thr Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr 625 630 635 640
Lys Gly Ala Cys Asn Asp Ala His Met Pro Tyr Ser lie Leu Met Glu 645 650 655 lie Ala Leu Gin Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro 660 665 670 260 200813222
Leu Thr Met Glu Lys Asp Asp lie Leu Phe Arg Asn Leu Asp Ala Asn 675 680 685
Ala Glu Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr lie Arg 690 695 700
Asn Val Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val 705 710 715 720
His Arg Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys 725 730 735
Gly Ser Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gin 740 745 750
Ala Gly Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe lie Glu Asn 755 760 765
Lys Val Pro Ala Ser Gin Val Ser Ser Phe Asp Val Arg Pro Asn Gly 770 775 780
Ser Gly Arg Thr Ala lie Phe Ala Asn Ala Pro Ser Gly Ala Gin Leu 785 790 795 800
Asn Arg Arg Thr Asp Gin Gly Gin Tyr Leu Asp Ala Val Asp lie Val 805 810 815
Ser Gly Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr 820 825 830
Val Asn Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser 835 840 845
Val Met Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gin Leu Val Glu 850 855 860
Ala lie Ala Ala His Glu Asp Leu Ala Gly Lys His Gly lie Ala Asn 865 870 875 880
Pro Thr Phe Val His Ala Pro Gly Lys lie Ser Trp Lys Tyr Arg Gly 885 890 895
Gin Leu Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His lie Val 900 905 910
Ser Val Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe 915 920 925
Leu Trp Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn lie Arg Val 930 935 940
Arg lie Ala Ser Gly Glu Ala Pro Ala Ala Ala Ser Ser Ala Ala Ser 945 950 955 960
Val Gly Ser Ser Ala Ser Ser Val Glu Arg Thr Arg Ser Ser Pro Ala 965 970 975 261 200813222
Val Ala Ser Gly Pro Ala Gin Thr lie Asp Leu Lys Gin Leu Lys Thr 980 985 990
Glu Leu Leu Glu Leu Asp Ala Pro Leu Tyr Leu Ser Gin Asp Pro Thr 995 1000 1005
Ser Gly Gin Leu Lys Lys His Thr Asp Val Ala Ser Gly Gin Ala 1010 1015 1020
Thr lie Val Gin Pro Cys Thr Leu Gly Asp Leu Gly Asp Arg Ser 1025 1030 1035
Phe Met Glu Thr Tyr Gly Val Val Ala Pro Leu Tyr Thr Gly Ala 1040 1045 1050
Met Ala Lys Gly lie Ala Ser Ala Asp Leu Val lie Ala Ala Gly 1055 1060 1065
Lys Arg Lys lie Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro Met 1070 1075 1080
His His Val Arg Ala Ala Leu Glu Lys lie Gin Ala Ala Leu Pro 1085 1090 1095
Gin Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro Phe Asp Ser 1100 1105 1110
Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys Gly Val 1115 1120 1125
Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gin Val 1130 1135 1140
Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser 1145 1150 1155
Val Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg Thr Glu 1160 1165 1170
Leu Ala Glu Met Phe lie Arg Pro Ala Pro Glu His Leu Leu Glu 1175 1180 1185
Lys Leu lie Ala Ser Gly Glu lie Thr Gin Glu Gin Ala Glu Leu 1190 1195 1200
Ala Arg Arg Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp 1205 1210 1215
Ser Gly Gly His Thr Asp Asn Arg Pro lie His Val lie Leu Pro 1220 1225 1230
Leu lie lie Asn Leu Arg Asn Arg Leu His Arg Glu Cys Gly Tyr 1235 1240 1245
Pro Ala His Leu Arg Val Arg Val Gly Ala Gly Gly Gly Val Gly 262 200813222 1250 1255 1260
Cys Pro Gin Ala Ala Ala Ala Ala Leu Thr Met Gly 1265 1270 1275 lie Val Thr Gly Thr Val Asn Gin Val Ala Lys Gin 1280 1285 1290
Cys Asp Asn Val Arg Lys Gin Leu Ser Gin Ala Thr 1295 1300 1305 lie Cys Met Ala Pro Ala Ala Asp Met Phe Glu Glu 1310 1315 1320
Leu Gin Val Leu Lys Lys Gly Thr Met Phe Pro Ser 1325 1330 1335
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe 1340 1345 1350
Pro Pro Ala Gin Leu Glu Arg He Glu Lvs Arg lie 1355 1360 ' ~ 1365
Ala Leu Gin Glu Val Trp Glu Glu Thr Lys Asp Phe 1370 1375 1380
Gly Leu Lys Asn Pro Glu Lys lie Gin Arg Ala Glu 1385 1390 1395
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu 1400 1405 1410
Ser Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val 1415 1420 1425
Gin Val Trp Cys Gly Pro Ala lie Gly Ala Phe Asn 1430 1435 1440
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ser Asn Glu 1445 1450 1455
Val Val Gin lie Asn Leu Gin lie Leu Arg Gly Ala 1460 1465 1470
Arg Arg Leu Asn Ala Leu Arg Asn Asp Pro Arg lie 1475 1480 1485
Thr Glu Asp Ala Ala Phe Val Tyr Glu Pro Thr Asn 1490 1495 1500
Ala Ala Phe Ser Gly Thr Tyr Ser Asp Gly Val Lys Arg Ala Asn Asp Ser Met Phe Lys Arg Tyr lie Asn His Asp Pro Gly Leu Ala Met Asp Tyr Asp Phe lie Tyr Pro Cys Cys Tyr Leu Asp Leu Glu Ala Leu <210〉 7 <211> 1500 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.)
<220> <221〉 CDS 263 48 200813222 <222> (1)..(1500) <400> 7 atg gcg gcc cgt ctg cag gag caa aag gga ggc gag atg gat acc cgc
Met Ala Ala Arg Leu Gin Glu Gin Lys Gly Gly Glu Met Asp Thr Arg 1 5 10 15 att gcc ate ate ggc atg teg gcc ate etc ccc tgc ggc aeg acc gtg lie Ala lie lie Gly Met Ser Ala lie Leu Pro Cys Gly Thr Thr Val 20 25 30 cgc gag teg tgg gag acc ate cgc gcc ggc ate gac tgc ctg teg gat
Arg Glu Ser Trp Glu Thr lie Arg Ala Gly lie Asp Cys Leu Ser Asp 35 40 45 etc ccc gag gac cgc gtc gac gtg aeg gcg tac ttt gac ccc gtc aag
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys 50 55 60 acc acc aag gac aag ate tac tgc aag cgc ggt ggc ttc att ccc gag
Thr Thr Lys Asp Lys lie Tyr Cys Lys Arg Gly Gly Phe lie Pro Glu 65 70 75 80 tac gac ttt gac gcc cgc gag ttc gga etc aac atg ttc cag atg gag
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gin Met Glu 85 90 95 gac teg gac gca aac cag acc ate teg ett etc aag gtc aag gag gcc
Asp Ser Asp Ala Asn Gin Thr lie Ser Leu Leu Lys Val Lys Glu Ala 100 105 110 etc cag gac gcc ggc ate gac gcc etc ggc aag gaa aag aag aac ate
Leu Gin Asp Ala Gly lie Asp Ala Leu Gly Lys Glu Lys Lys Asn lie 115 120 125 ggc tgc gtg etc ggc att ggc ggc ggc caa aag tee age cac gag ttc
Gly Cys Val Leu Gly lie Gly Gly Gly Gin Lys Ser Ser His Glu Phe 130 135 140 tac teg cgc ett aat tat gtt gtc gtg gag aag gtc etc cgc aag atg
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met 145 150 155 160 ggc atg ccc gag gag gac gtc aag gtc gcc gtc gaa aag tac aag gcc
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala 165 170 175 aac ttc ccc gag tgg cgc etc gac tee ttc cct ggc ttc etc ggc aac
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn 180 185 190 gtc acc gcc ggt cgc tgc acc aac acc ttc aac etc gac ggc atg aac
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn 195 200 205 tgc gtt gtc gac gcc gca tgc gcc teg tee etc ate gcc gtc aag gtc
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu lie Ala Val Lys Val 210 215 220 gcc ate gac gag ctg etc tac ggt gac tgc gac atg atg gtc acc ggt
Ala lie Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly 225 230 235 240 gcc acc tgc aeg gat aac tee ate ggc atg tac atg gcc ttc tee aag
Ala Thr Cys Thr Asp Asn Ser lie Gly Met Tyr Met Ala Phe Ser Lys 245 250 255 acc ccc gtg ttc tee aeg gac ccc age gtg cgc gcc tac gac gaa aag
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys 260 265 270 aca aag ggc atg etc ate ggc gag ggc tee gcc atg etc gtc etc aag
Thr Lys Gly Met Leu lie Gly Glu Gly Ser Ala Met Leu Val Leu Lys 275 280 285 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 264 864 912 912 cgc aac etc Arg Asn Leu 200813222 cgc tac gcc gac gcc gtc cgc gac ggc gat gag ate cac Ret gtt att Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu lie His Ala Val lie 290 295 300 cgc ggc tgc gee tee tee agt gat ggc aag gee gcc ggc ate tac aeg Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly lie Tvr Thr 305 310 315 320 ccc acc att teg ggc cag gag gag gcc etc cgc cgc gcc tac aac esc Pro Thr lie Ser Gly Gin Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg 325 330 335 gcc tgt gtc gac ccg gcc acc gtc act etc gtc gag ggt cac ggc acc Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Glv Thr 340 345 350 ggt act ccc gtt ggc gac cgc ate gag etc acc gcc ttg Gly Thr Pro Val Gly Asp Arg lie Glu Leu Thr Ala Leu 355 360 365 ttt gac aag gcc tac ggc gag ggc aac acc gaa aag gtc get gtg ggc Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly 370 375 380 age ate aag tee age ate ggc cat etc aag gcc gtc gcc ggt etc gcc
Ser lie Lys Ser Ser lie Gly His Leu Lys Ala Val Ala Gly Leu Ala 385 390 395 400 ggt atg ate aag gtc ate atg geg etc aag cac aag act etc ccg ggc
Gly Met lie Lys Val lie Met Ala Leu Lys His Lys Thr Leu Pro Gly 405 410 415 acc ate aac gtc gac aac cca ccc aac etc tac gac aac aeg ccc ate Thr lie Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro lie 420 425 430 aac gag tee teg etc tac att aac acc atg aac cgc ccc tgg ttc ccg Asn Glu Ser Ser Leu Tyr lie Asn Thr Met Asn Arg Pro Trp Phe Pro 435 440 445 ccc cct ggt gtg ccc cgc cgc gcc ggc att teg age ttt ggc ttt ggt Pro Pro Gly Val Pro Arg Arg Ala Gly lie Ser Ser Phe Gly Phe Gly 450 455 460 ggc gcc aac tac cac gcc gtc etc gag gag gcc gag ccc gag cac aeg Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr 465 470 475 480 acc geg tac cgc etc aac aag cgc ccg cag ccc gtg etc atg atg gcc Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gin Pro Val Leu Met Met Ala 485 490 495 gcc aeg ccc geg Ala Thr Pro Ala 500
<210> 8 <211> 500 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 8
Met Ala Ala Arg Leu Gin Glu Gin Lys Gly Gly Glu Met Asp Thr Arg 15 10 15 lie Ala lie lie Gly Met Ser Ala lie Leu Pro Cys Gly Thr Thr Val 20 25 30
Arg Glu Ser Trp Glu Thr lie Arg Ala Gly lie Asp Cys Leu Ser Asp 35 40 45 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1500 265 200813222
Leu Pro Glu Asp Arg Val Asp Val Thr Ala Tyr Phe Asp Pro Val Lys 50 55 60
Thr Thr Lys Asp Lys lie Tyr Cys Lys Arg Gly Gly Phe lie Pro Glu 65 70 75 80
Tyr Asp Phe Asp Ala Arg Glu Phe Gly Leu Asn Met Phe Gin Met Glu 85 90 95
Asp Ser Asp Ala Asn Gin Thr lie Ser Leu Leu Lys Val Lys Glu Ala 100 105 110
Leu Gin Asp Ala Gly lie Asp Ala Leu Gly Lys Glu Lys Lys Asn lie 115 120 125
Gly Cys Val Leu Gly lie Gly Gly Gly Gin Lys Ser Ser His Glu Phe 130 135 140
Tyr Ser Arg Leu Asn Tyr Val Val Val Glu Lys Val Leu Arg Lys Met 145 150 155 160
Gly Met Pro Glu Glu Asp Val Lys Val Ala Val Glu Lys Tyr Lys Ala 165 170 175
Asn Phe Pro Glu Trp Arg Leu Asp Ser Phe Pro Gly Phe Leu Gly Asn 180 185 190
Val Thr Ala Gly Arg Cys Thr Asn Thr Phe Asn Leu Asp Gly Met Asn 195 200 205
Cys Val Val Asp Ala Ala Cys Ala Ser Ser Leu lie Ala Val Lys Val 210 215 220
Ala lie Asp Glu Leu Leu Tyr Gly Asp Cys Asp Met Met Val Thr Gly 225 230 235 240
Ala Thr Cys Thr Asp Asn Ser lie Gly Met Tyr Met Ala Phe Ser Lys 245 250 255
Thr Pro Val Phe Ser Thr Asp Pro Ser Val Arg Ala Tyr Asp Glu Lys 260 265 270
Thr Lys Gly Met Leu lie Gly Glu Gly Ser Ala Met Leu Val Leu Lys 275 280 285
Arg Tyr Ala Asp Ala Val Arg Asp Gly Asp Glu lie His Ala Val lie 290 295 300
Arg Gly Cys Ala Ser Ser Ser Asp Gly Lys Ala Ala Gly lie Tyr Thr 305 310 315 320
Pro Thr lie Ser Gly Gin Glu Glu Ala Leu Arg Arg Ala Tyr Asn Arg 325 330 335
Ala Cys Val Asp Pro Ala Thr Val Thr Leu Val Glu Gly His Gly Thr 340 345 350 266 200813222
Gly Thr Pro Val Gly Asp Arg lie Glu Leu Thr Ala Leu Arg Asn Leu 355 360 365
Phe Asp Lys Ala Tyr Gly Glu Gly Asn Thr Glu Lys Val Ala Val Gly 370 375 380
Ser lie Lys Ser Ser lie Gly His Leu Lys Ala Val Ala Gly Leu Ala 385 390 395 400
Gly Met lie Lys Val lie Met Ala Leu Lys His Lys Thr Leu Pro Gly 405 410 415
Thr lie Asn Val Asp Asn Pro Pro Asn Leu Tyr Asp Asn Thr Pro lie 420 425 430
Asn Glu Ser Ser Leu Tyr lie Asn Thr Met Asn Arg Pro Trp Phe Pro 435 440 445
Pro Pro Gly Val Pro Arg Arg Ala Gly lie Ser Ser Phe Gly Phe Gly 450 455 460
Gly Ala Asn Tyr His Ala Val Leu Glu Glu Ala Glu Pro Glu His Thr 465 470 475 480
Thr Ala Tyr Arg Leu Asn Lys Arg Pro Gin Pro Val Leu Met Met Ala 485 490 495
Ala Thr Pro Ala 500
<210> 9 <211> 1278 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <220〉 <221> CDS <222> (1)..(1278) <400〉 9 48 96 144 192 240 288 ?at $cc Taag ?cc tgg cgc etc ccc cgc gag ggc gtc age tt( Asp Val Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Ph( 15 10 15 ege gcc aag ggc ate gcc acc aac ggc get gtc gcc geg etc ttc tcc Arg Ala Lys Gly lie Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser 2〇 25 30 ggc cag ggc geg cag tac aeg cac atg ttt age gag gtg gcc atg aac
Gly Gin Gly Ala Gin Tyr Thr His Met Phe Ser Glu Val Ala Met Asn 35 40 45 tgg ccc cag ttc ege cag age att gcc gcc atg gac gcc gcc cag tcc
Trp Pro Gin Phe Arg Gin Ser lie Ala Ala Met Asp Ala Ala Gin Ser 50 55 60 aag gtc get gga age gac aag gac ttt gag ege gtc tcc cag gtc etc
Lys Val Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gin Val Leu 65 70 75 80 Τ?ί PrC〇 A?g lyl Tyr Glu A?g Glu Prl Glu Gif A?p His ίγϊ Lyf 267 336 200813222 85 90 95 ate tee etc acc gee tac teg cag ccc teg acc ctg gee tgc get etc lie Ser Leu Thr Ala Tyr Ser Gin Pro Ser Thr Leu Ala Cys Ala Leu 100 105 110 ggt gee ttt gag ate ttc aag gag gee ggc ttc acc ccg gac ttt gee Gly Ala Phe Glu lie Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala 115 120 125 gee ggc cat teg etc ggt gag ttc gee gee etc tac gee geg ggc tgc Ala Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys 130 135 140 gtc gac ege gac gag etc ttt gag ett gtc tgc ege ege gee ege ate
Val Asp Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg lie 145 150 155 i6〇 atg ggc ggc aag gac gca ccg gee acc ccc aag ggc tgc atg gee gee
Met Gly Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala 165 170 175 gtc att ggc ccc aac gee gag aac ate aag gtc cag gee gee aac gtc
Val lie Gly Pro Asn Ala Glu Asn lie Lys Val Gin Ala Ala Asn Val 180 185 190 tgg etc ggc aac tee aac teg cct teg cag acc gtc ate acc ggc tee Trp Leu Gly Asn Ser Asn Ser Pro Ser Gin Thr Val lie Thr Gly Ser 195 200 205 gtc gaa ggt ate cag gee gag age gee ege etc cag aag gag ggc ttc Val Glu Gly lie Gin Ala Glu Ser Ala Arg Leu Gin Lys Glu Gly Phe 210 215 220 ege gtc gtg cct ett gee tgc gag age gee ttc cac teg ccc cag atg
Arg Val Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gin Met 225 230 235 240 gag aac gee teg teg gee ttc aag gac gtc ate tee aag gtc tee ttc
Glu Asn Ala Ser Ser Ala Phe Lys Asp Val lie Ser Lys Val Ser Phe 245 250 255 ege acc ccc aag gee gag acc aag etc ttc age aac gtc tet ggc gag
Arg Thr Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu 260 265 270 acc tac ccc aeg gac gee ege gag atg ett aeg cag cac atg acc age Thr Tyr Pro Thr Asp Ala Arg Glu Met Leu Thr Gin His Met Thr Ser 275 280 285 age gtc aag ttc etc acc cag gtc ege aac atg cac cag gee ggt geg Ser Val Lys Phe Leu Thr Gin Val Arg Asn Met His Gin Ala Gly Ala 290 295 300 ege ate ttt gtc gag ttc gga ccc aag cag gtg etc tee aag ett gtc
Arg lie Phe Val Glu Phe Gly Pro Lys Gin Val Leu Ser Lys Leu Val 305 310 315 320 tee gag acc etc aag gat gac ccc teg gtt gtc acc gtc tet gtc aac
Ser Glu Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn 325 330 335 ccg gee teg ggc aeg gat teg gac ate cag etc ege gac geg gee gtc
Pro Ala Ser Gly Thr Asp Ser Asp lie Gin Leu Arg Asp Ala Ala Val 340 345 350 cag etc gtt gtc get ggc gtc aac ett cag ggc ttt gac aag tgg gac
Gin Leu Val Val Ala Gly Val Asn Leu Gin Gly Phe Asp Lys Trp Asp 355 360 365 gee ccc gat gee acc ege atg cag gee ate aag aag aag ege act acc Ala Pro Asp Ala Thr Arg Met Gin Ala lie Lys Lys Lys Arg Thr Thr 370 375 380 etc ege ett teg gee gee acc tac gtc teg gac aag acc aag aag gtc 384 432 480 528 576 624 672 720 768 816 864 912 960 1008 1056 1104 1152 1200 268 1248 200813222
Leu Arg Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val 385 390 395 400 cgc gac gcc gcc atg aac gat ggc cgc tgc gtc acc tac etc aag ggc
Arg Asp Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly 405 410 415 1278 gcc gca ccg etc ate aag gcc ccg gag ccc
Ala Ala Pro Leu lie Lys Ala Pro Glu Pro 420 425
<210> 10 <211> 426 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 10
Asp Val Thr Lys Glu Ala Trp Arg Leu Pro Arg Glu Gly Val Ser Phe 15 10 15
Arg Ala Lys Gly lie Ala Thr Asn Gly Ala Val Ala Ala Leu Phe Ser 20 25 30
Civ G1r> GW Ala Tvr Thr Hie Mpt Php Qpr dij V^l Alg Aqti 35^ .......初…… 45^ —
Trp Pro Gin Phe Arg Gin Ser lie Ala Ala Met Asp Ala Ala Gin Ser 50 55 60
Lys Val Ala Gly Ser Asp Lys Asp Phe Glu Arg Val Ser Gin Val Leu 65 70 75 80
Tyr Pro Arg Lys Pro Tyr Glu Arg Glu Pro Glu Gin Asp His Lys Lys 85 90 95 lie Ser Leu Thr Ala Tyr Ser Gin Pro Ser Thr Leu Ala Cys Ala Leu 100 105 110
Gly Ala Phe Glu lie Phe Lys Glu Ala Gly Phe Thr Pro Asp Phe Ala 115 120 125
Ala Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly Cys 130 135 140
Val Asp Arg Asp Glu Leu Phe Glu Leu Val Cys Arg Arg Ala Arg lie 145 150 155 160
Met Gly Gly Lys Asp Ala Pro Ala Thr Pro Lys Gly Cys Met Ala Ala 165 170 175
Val lie Gly Pro Asn Ala Glu Asn lie Lys Val Gin Ala Ala Asn Val 180 185 190
Trp Leu Gly Asn Ser Asn Ser Pro Ser Gin Thr Val lie Thr Gly Ser 195 200 205
Val Glu Gly lie Gin Ala Glu Ser Ala Arg Leu Gin Lys Glu Gly Phe 210 215 220 269 200813222
Arg Val Val Pro Leu Ala Cys Glu Ser Ala Phe His Ser Pro Gin Met 225 230 235 240
Glu Asn Ala Ser Ser Ala Phe Lys Asp Val lie Ser Lys Val Ser Phe 245 250 255
Arg Thr Pro Lys Ala Glu Thr Lys Leu Phe Ser Asn Val Ser Gly Glu 260 265 270
Thr Tyr Pro Thr Asp Ala Arg Glu Met Leu Thr Gin His Met Thr Ser 275 280 285
Ser Val Lys Phe Leu Thr Gin Val Arg Asn Met His Gin Ala Gly Ala 290 295 300
Arg lie Phe Val Glu Phe Gly Pro Lys Gin Val Leu Ser Lys Leu Val 305 310 315 320
Ser Glu Thr Leu Lys Asp Asp Pro Ser Val Val Thr Val Ser Val Asn 325 330 335
Pro Ala Ser Gly Thr Asp Ser Asp lie Gin Leu Arg Asp Ala Ala Val 340 345 350
Gin Leu Val Val Ala Gly Val Asn Leu Gin Gly Phe Asp Lys Trp Asp 355 360 365
Ala Pro Asp Ala Thr Arg Met Gin Ala lie Lys Lys Lys Arg Thr Thr 370 375 380
Leu Arg Leu Ser Ala Ala Thr Tyr Val Ser Asp Lys Thr Lys Lys Val 385 390 395 400
Arg Asp Ala Ala Met Asn Asp Gly Arg Cys Val Thr Tyr Leu Lys Gly 405 410 415
Ala Ala Pro Leu lie Lys Ala Pro Glu Pro 420 425
<210〉 11 <211> 5 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <220〉 <221〉 MISC一FEATURE <222> (4)..(4) <223> X = any amino acid <400〉 11
Gly His Ser Xaa Gly 1 5 <210〉 12 <211> 258 <212> DNA <213> 裂殖壺菌(Schizochytrium sp·) 270 48 200813222 <220〉 <221> CDS <222> (1)..(258) <400> 12 get gtc teg aac gag ett ett gag aag gee gag act gtc gtc atg gag
Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu 15 10 15 96 144 192 240 258 gtc etc gee gee aag acc ggc tac gag acc gac atg ate gag get gac
Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met lie Glu Ala Asp 20 25 30 atg gag etc gag acc gag etc ggc att gac tee ate aag cgt gtc gag
Met Glu Leu Glu Thr Glu Leu Gly lie Asp Ser lie Lys Arg Val Glu 35 40 45 ate etc tee gag gtc cag gee atg etc aat gtc gag gee aag gat gtc lie Leu Ser Glu Val Gin Ala Met Leu Asn Val Glu Ala Lys Asp Val 50 55 60 gat gee etc age ege act ege act gtt ggt gag gtt gtc aac gee atg
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asn Ala Met 65 70 75 80 aag gee gag ate get ggc Lys Ala Glu lie Ala Gly 85
<210〉 13 <211〉 86 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 13
Ala Val Ser Asn Glu Leu Leu Glu Lys Ala Glu Thr Val Val Met Glu 15 10 15
Val Leu Ala Ala Lys Thr Gly Tyr Glu Thr Asp Met lie Glu Ala Asp 20 25 30
Met Glu Leu Glu Thr Glu Leu Gly lie Asp Ser lie Lys Arg Val Glu 35 40 45 lie Leu Ser Glu Val Gin Ala Met Leu Asn Val Glu Ala Lys Asp Val 50 55 60
Asp Ala Leu Ser Arg Thr Arg Thr Val Gly Glu Val Val Asn Ala Met 65 70 75 80
Lys Ala Glu lie Ala Gly 85
<210> 14 <211〉 5 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 14
Leu Gly lie Asp Ser 1 5 <210> 15 <211〉 21 <212> PRT 271 200813222 <213〉裂殖壺菌(Schizochytrium sp.) <400> 15
Ala Pro Ala Pro Val Lys Ala Ala Ala Pro Ala Ala Pro Val Ala Ser 15 10 15
Ala Pro Ala Pro Ala 20
<210> 16 <211> 3006 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 16 gcccccgccc cggtcaaggc tgctgcgcct gccgcccccg ttgcctcggc ccctgccccg 60 gctgtctcga acgagcttct tgagaaggcc gagactgtcg tcatggaggt cctcgccgcc 120 aagaccggct acgagaccga catgatcgag gctgacatgg agctcgagac cgagctcggc 180 attgactcca tcaagcgtgt cgagatcctc tccgaggtcc aggccatgct caatgtcgag 240 gccaaggatg tcgatgccct cagccgcact cgcactgttg gtgaggttgt caacgccatg 300 aaggccgaga tcgctggcag ctctgccccg gcgcctgctg ccgctgctcc ggctccggcc 360 aaggctgccc ctgccgccgc tgcgcctgct gtctcgaacg agcttctcga gaaggccgag 420 accgtcgtca tggaggtcct cgccgccaag actggctacg agactgacat gatcgagtcc 480 gacatggagc tcgagactga gctcggcatt gactccatca agcgtgtcga gatcctctcc 540 gaggttcagg ccatgctcaa cgtcgaggcc aaggacgtcg acgctctcag ccgcactcgc 600 actgtgggtg aggtcgtcaa cgccatgaag gctgagatcg ctggtggctc tgccccggcg 660 cctgccgccg ctgccccagg tccggctgct gccgcccctg cgcctgccgc cgccgcccct 720 gctgtctcga acgagcttct tgagaaggcc gagaccgtcg tcatggaggt cctcgccgcc 780 aagactggct acgagactga catgatcgag tccgacatgg agctcgagac cgagctcggc 840 attgactcca tcaagcgtgt cgagattctc tccgaggtcc aggccatgct caacgtcgag 900 gccaaggacg tcgacgctct cagccgcacc cgcactgttg gcgaggtcgt cgatgccatg 960 aaggccgaga tcgctggtgg ctctgccccg gcgcctgccg ccgctgctcc tgctccggct 1020 gctgccgccc ctgcgcctgc cgcccctgcg cctgctgtct cgagcgagct tctcgagaag 1080 gccgagactg tcgtcatgga ggtcctcgcc gccaagactg gctacgagac tgacatgatc 1140 gagtccgaca tggagctcga gaccgagctc ggcattgact ccatcaagcg tgtcgagatt 1200 ctctccgagg tccaggccat gctcaacgtc gaggccaagg acgtcgacgc tctcagccgc 1260 acccgcactg ttggcgaggt cgtcgatgcc atgaaggccg agatcgctgg tggctctgcc 1320 ccggcgcctg ccgccgctgc tcctgctccg gctgctgccg cccctgcgcc tgccgcccct 1380 gcgcctgccg cccctgcgcc tgctgtctcg agcgagcttc tcgagaaggc cgagactgtc 1440 gtcatggagg tcctcgccgc caagactggc tacgagactg acatgattga gtccgacatg 1500 gagctcgaga ccgagctcgg cattgactcc atcaagcgtg tcgagattct ctccgaggtt 1560 caggccatgc tcaacgtcga ggccaaggac gtcgacgctc tcagccgcac tcgcactgtt 1620 ggtgaggtcg tcgatgccat gaaggctgag atcgctggca gctccgcctc ggcgcctgcc 1680 gccgctgctc ctgctccggc tgctgccgct cctgcgcccg ctgccgccgc ccctgctgtc 1740 272 200813222 tcgaacgagc ttctcgagaa agccgagact gtcgtcatgg aggtcctcgc cgccaagact 1800 ggctacgaga ctgacatgat cgagtccgac atggagctcg agactgagct cggcattgac 1860 tccatcaagc gtgtcgagat cctctccgag gttcaggcca tgctcaacgt cgaggccaag 1920 gacgtcgatg ccctcagccg cacccgcact gttggcgagg ttgtcgatgc catgaaggcc 1980 gagatcgctg gtggctctgc cccggcgcct gccgccgctg cccctgctcc ggctgccgcc 2040 gcccctgctg tctcgaacga gcttctcgag aaggccgaga ctgtcgtcat ggaggtcctc 2100 gccgccaaga ctggctacga gaccgacatg atcgagtccg acatggagct cgagaccgag 2160 ctcggcattg actccatcaa gcgtgtcgag attctctccg aggttcaggc catgctcaac 2220 gtcgaggcca aggacgtcga tgctctcagc cgcactcgca ctgttggcga ggtcgtcgat 2280 gccatgaagg ctgagatcgc cggcagctcc gccccggcgc ctgccgccgc tgctcctgct 2340 ccggctgctg ccgctcctgc gcccgctgcc gctgcccctg ctgtctcgag cgagcttctc 2400 gagaaggccg agaccgtcgt catggaggtc ctcgccgcca agactggcta cgagactgac 2460 atgattgagt ccgacatgga gctcgagact gagctcggca ttgactccat caagcgtgtc 2520 g^gRtrrtrt rrgAggttca ggccatgctc aacgtcgagg ccaaggacgt cgatgccctc 2580 agccgcaccc gcactgttgg cgaggttgtc gatgccatga aggccgagat cgctggtggc 2640 tctgccccgg cgcctgccgc cgctgcccct gctccggctg ccgccgcccc tgctgtctcg 2700 aacgagcttc ttgagaaggc cgagaccgtc gtcatggagg tcctcgccgc caagactggc 2760 tacgagaccg acatgatcga gtccgacatg gagctcgaga ccgagctcgg cattgactcc 2820 atcaagcgtg tcgagattct ctccgaggtt caggccatgc tcaacgtcga ggccaaggac 2880 gtcgacgctc tcagccgcac tcgcactgtt ggcgaggtcg tcgatgccat gaaggctgag 2940 atcgctggtg gctctgcccc ggcgcctgcc gccgctgctc ctgcctcggc tggcgccgcg 3000 cctgcg 3006
<210〉 17 <211〉 2133 <212〉 DNA <213〉裂殖壺菌(Schizochytrium sp.) <220〉 <221〉 CDS <222> (1)..(2133) <400> 17 ttt ggc get etc ggc ggc ttc ate teg cag cag geg gag ege ttc gag 48
Phe Gly Ala Leu Gly Gly Phe lie Ser Gin Gin Ala Glu Arg Phe Glu 15 10 15 ccc gee gaa ate etc ggc ttc aeg etc atg tgc gee aag ttc gee aag 96
Pro Ala Glu lie Leu Gly Phe Thr Leu Met Cys Ala Lys Phe Ala Lys 20 25 30 get tee etc tgc aeg get gtg get ggc ggc ege ccg gee ttt ate ggt 144
Ala Ser Leu Cys Thr Ala Val Ala Gly Gly Arg Pro Ala Phe lie Gly 35 40 45 gtg geg ege ett gac ggc ege etc gga ttc act teg cag ggc act tet 192
Val Ala Arg Leu Asp Gly Arg Leu Gly Phe Thr Ser Gin Gly Thr Ser 50 55 60 gac geg etc aag cgt gee cag cgt ggt gee ate ttt ggc etc tgc aag 240
Asp Ala Leu Lys Arg Ala Gin Arg Gly Ala lie Phe Gly Leu Cys Lys 273 200813222 65 70 75 80 acc ate ggc etc gag tgg tee gag tet gac gtc ttt tee ege ggc gtg 288
Thr lie Gly Leu Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val 85 90 95 gac att get cag ggc atg cac ccc gag gat gee gee gtg geg att gtg 336
Asp lie Ala Gin Gly Met His Pro Glu Asp Ala Ala Val Ala lie Val 100 105 110 ege gag atg geg tgc get gac att ege att ege gag gtc ggc att ggc 384
Arg Glu Met Ala Cys Ala Asp lie Arg lie Arg Glu Val Gly lie Gly 115 120 125 gca aac cag cag ege tgc aeg ate cgt gee gee aag etc gag acc ggc 432
Ala Asn Gin Gin Arg Cys Thr lie Arg Ala Ala Lys Leu Glu Thr Gly 130 135 140 aac ccg cag ege cag ate gee aag gac gac gtg ctg etc gtt tet ggc 480
Asn Pro Gin Arg Gin lie Ala Lys Asp Asp Val Leu Leu Val Ser Gly 145 150 155 160 ggc get ege ggc ate aeg cct ett tgc ate egg gag ate aeg ege cag 528
Gly Ala Arg Gly lie Thr Pro Leu Cys lie Arg Glu lie Thr Arg Gin 165 170 175 ate geg ggc ggc aag tac att ctg ett ggc ege age aag gtc tet geg 576 lie Ala Gly Gly Lys Tyr lie Leu Leu Gly Arg Ser Lys Val Ser Ala 180 185 190 age gaa ccg gca tgg tgc get ggc ate act gac gag aag get gtg caa 624
Ser Glu Pro Ala Trp Cys Ala Gly lie Thr Asp Glu Lys Ala Val Gin 195 200 205 aag get get acc cag gag etc aag ege gee ttt age get ggc gag ggc 672
Lys Ala Ala Thr Gin Glu Leu Lys Arg Ala Phe Ser Ala Gly Glu Gly 210 215 220 ccc aag ccc aeg ccc ege get gtc act aag ett gtg ggc tet gtt ett 720
Pro Lys Pro Thr Pro Arg Ala Val Thr Lys Leu Val Gly Ser Val Leu 225 230 235 240 ggc get ege gag gtg ege age tet att get geg att gaa geg etc ggc 768
Gly Ala Arg Glu Val Arg Ser Ser lie Ala Ala lie Glu Ala Leu Gly 245 250 255 ggc aag gee ate tac teg teg tgc gac gtg aac tet gee gee gac gtg 816
Gly Lys Ala lie Tyr Ser Ser Cys Asp Val Asn Ser Ala Ala Asp Val 260 265 270 gee aag gee gtg ege gat gee gag tee cag etc ggt gee ege gtc teg 864
Ala Lys Ala Val Arg Asp Ala Glu Ser Gin Leu Gly Ala Arg Val Ser 275 280 285 ggc ate gtt cat gee teg ggc gtg etc ege gac cgt etc ate gag aag 912
Gly lie Val His Ala Ser Gly Val Leu Arg Asp Arg Leu lie Glu Lys 290 295 300 aag etc ccc gac gag ttc gac gee gtc ttt ggc acc aag gtc acc ggt 960
Lys Leu Pro Asp Glu Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly 305 310 315 320 etc gag aac etc etc gee gee gtc gac ege gee aac etc aag cac atg 1008
Leu Glu Asn Leu Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met 325 330 335 gtc etc ttc age teg etc gee ggc ttc cac ggc aac gtc ggc cag tet 1056
Val Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gin Ser 340 345 350 gac tac gee atg gee aac gag gee ett aac aag atg ggc etc gag etc 1104
Asp Tyr Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu 355 360 365 gee aag gac gtc teg gtc aag teg ate tgc ttc ggt ccc tgg gac ggt 1152 274 200813222
Ala Lys Asp Val Ser Val Lys Ser lie Cys Phe Gly Pro Trp Asp Gly 370 375 380 ggc atg gtg acg ccg cag etc aag aag cag ttc cag gag atg ggc gtg 1200
Gly Met Val Thr Pro Gin Leu Lys Lys Gin Phe Gin Glu Met Gly Val 385 390 395 400 cag ate ate ccc ege gag ggc ggc get gat acc gtg geg ege ate gtg 1248
Gin lie lie Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg lie Val 405 410 415 etc ggc tee teg ccg get gag ate ett gtc ggc aac tgg ege acc ccg 1296
Leu Gly Ser Ser Pro Ala Glu lie Leu Val Gly Asn Trp Arg Thr Pro 420 425 430 tee aag aag gtc ggc teg gac acc ate acc ctg cac ege aag att tee 1344
Ser Lys Lys Val Gly Ser Asp Thr lie Thr Leu His Arg Lys lie Ser 435 440 445 gee aag tee aac ccc ttc etc gag gac cac gtc ate cag ggc ege ege 1392
Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val lie Gin Gly Arg Arg 450 455 460 gtg ctg ccc atg acg ctg gee att ggc teg etc geg gag acc tgc etc 1440
Val Leu Pro Met Thr Leu Ala lie Gly Ser Leu Ala Glu Thr Cys Leu 465 470 475 480 ggc r,tr ttc ere ggr tar teg rtr tgg grr t gac g^c gee cag etc 1488
Gly Leu Phe Pro Gly Tyr Ser Leu Trp Ala lie Asp Asp Ala Gin Leu 485 490 495 ttc aag ggt gtc act gtc gac ggc gac gtc aac tgc gag gtg acc etc 1536
Phe Lys Gly Val Thr Val Asp Gly Asp Val Asn Cys Glu Val Thr Leu 500 505 510 acc ccg teg acg geg ccc teg ggc ege gtc aac gtc cag gee acg etc 1584
Thr Pro Ser Thr Ala Pro Ser Gly Arg Val Asn Val Gin Ala Thr Leu 515 520 525 aag acc ttt tee age ggc aag ctg gtc ccg gee tac ege gee gtc ate 1632
Lys Thr Phe Ser Ser Gly Lys Leu Val Pro Ala Tyr Arg Ala Val lie 530 535 540 gtg etc tee aac cag ggc geg ccc ccg gee aac gee acc atg cag ccg 1680
Val Leu Ser Asn Gin Gly Ala Pro Pro Ala Asn Ala Thr Met Gin Pro 545 550 555 560 ccc teg etc gat gee gat ccg geg etc cag ggc tee gtc tac gac ggc 1728
Pro Ser Leu Asp Ala Asp Pro Ala Leu Gin Gly Ser Val Tyr Asp Gly 565 570 575 aag acc etc ttc cac ggc ccg gee ttc ege ggc ate gat gac gtg etc 1776
Lys Thr Leu Phe His Gly Pro Ala Phe Arg Gly lie Asp Asp Val Leu 580 585 590 teg tgc acc aag age cag ett gtg gee aag tgc age get gtc ccc ggc 1824
Ser Cys Thr Lys Ser Gin Leu Val Ala Lys Cys Ser Ala Val Pro Gly 595 600 605 tee gac gee get ege ggc gag ttt gee acg gac act gac gee cat gac 1872
Ser Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp 610 615 620 ccc ttc gtg aac gac ctg gee ttt cag gee atg etc gtc tgg gtg ege 1920
Pro Phe Val Asn Asp Leu Ala Phe Gin Ala Met Leu Val Trp Val Arg 625 630 635 640 ege acg etc ggc cag get geg etc ccc aac teg ate cag ege ate gtc 1968
Arg Thr Leu Gly Gin Ala Ala Leu Pro Asn Ser lie Gin Arg lie Val 645 650 655 cag cac ege ccg gtc ccg cag gac aag ccc ttc tac att acc etc ege 2016
Gin His Arg Pro Val Pro Gin Asp Lys Pro Phe Tyr lie Thr Leu Arg 660 665 670 275 200813222 2064 2112 2133 tcc aac cag teg ggc ggt cac tee cag cac aag cac gee ett cag ttc
Ser Asn Gin Ser Gly Gly His Ser Gin His Lys His Ala Leu Gin Phe 675 680 685 cac aac gag cag ggc gat etc ttc att gat gtc cag get teg gtc ate
His Asn Glu Gin Gly Asp Leu Phe lie Asp Val Gin Ala Ser Val lie 690 695 700 gee aeg gac age ett gee ttc Ala Thr Asp Ser Leu Ala Phe 705 710
<210〉 18 <211> 711 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 18
Phe Gly Ala Leu Gly Gly Phe lie Ser Gin Gin Ala Glu Arg Phe Glu 15 10 15
Pro Ala Glu lie Leu Gly Phe Thr Leu Met Cys Ala Lys Phe Ala Lys 20 25 30
Ala Ser Leu Cys Thr Ala Val Ala Gly Gly Arg Pro Ala Phe lie Gly 35 40 45
Val Ala Arg Leu Asp Gly Arg Leu Gly Phe Thr Ser Gin Gly Thr Ser 50 55 60
Asp Ala Leu Lys Arg Ala Gin Arg Gly Ala lie Phe Gly Leu Cys Lys 65 70 75 80
Thr lie Gly Leu Glu Trp Ser Glu Ser Asp Val Phe Ser Arg Gly Val 85 90 95
Asp lie Ala Gin Gly Met His Pro Glu Asp Ala Ala Val Ala lie Val 100 105 110
Arg Glu Met Ala Cys Ala Asp lie Arg lie Arg Glu Val Gly lie Gly 115 120 125
Ala Asn Gin Gin Arg Cys Thr lie Arg Ala Ala Lys Leu Glu Thr Gly 130 135 140
Asn Pro Gin Arg Gin lie Ala Lys Asp Asp Val Leu Leu Val Ser Gly 145 150 155 160
Gly Ala Arg Gly lie Thr Pro Leu Cys lie Arg Glu lie Thr Arg Gin 165 170 175 lie Ala Gly Gly Lys Tyr lie Leu Leu Gly Arg Ser Lys Val Ser Ala 180 185 190
Ser Glu Pro Ala Trp Cys Ala Gly lie Thr Asp Glu Lys Ala Val Gin 195 200 205
Lys Ala Ala Thr Gin Glu Leu Lys Arg Ala Phe Ser Ala Gly Glu Gly 210 215 220 276 200813222
Pro Lys Pro Thr Pro Arg Ala Val Thr Lys Leu Val Gly Ser Val Leu 225 230 235 240
Gly Ala Arg Glu Val Arg Ser Ser lie Ala Ala lie Glu Ala Leu Gly 245 250 255
Gly Lys Ala lie Tyr Ser Ser Cys Asp Val Asn Ser Ala Ala Asp Val 260 265 270
Ala Lys Ala Val Arg Asp Ala Glu Ser Gin Leu Gly Ala Arg Val Ser 275 280 285
Gly lie Val His Ala Ser Gly Val Leu Arg Asp Arg Leu lie Glu Lys 290 295 300
Lys Leu Pro Asp Glu Phe Asp Ala Val Phe Gly Thr Lys Val Thr Gly 305 310 315 320
Leu Glu Asn Leu Leu Ala Ala Val Asp Arg Ala Asn Leu Lys His Met 325 330 335
Val Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Val Gly Gin Ser 340 345 350
Asp Tyr Ala Met Ala Asn Glu Ala Leu Asn Lys Met Gly Leu Glu Leu 355 360 365
Ala Lys Asp Val Ser Val Lys Ser lie Cys Phe Gly Pro Trp Asp Gly 370 375 380
Gly Met Val Thr Pro Gin Leu Lys Lys Gin Phe Gin Glu Met Gly Val 385 390 395 400
Gin lie lie Pro Arg Glu Gly Gly Ala Asp Thr Val Ala Arg lie Val 405 410 415
Leu Gly Ser Ser Pro Ala Glu lie Leu Val Gly Asn Trp Arg Thr Pro 420 425 430
Ser Lys Lys Val Gly Ser Asp Thr lie Thr Leu His Arg Lys lie Ser 435 440 445
Ala Lys Ser Asn Pro Phe Leu Glu Asp His Val lie Gin Gly Arg Arg 450 455 460
Val Leu Pro Met Thr Leu Ala lie Gly Ser Leu Ala Glu Thr Cys Leu 465 470 475 480
Gly Leu Phe Pro Gly Tyr Ser Leu Trp Ala lie Asp Asp Ala Gin Leu 485 490 495
Phe Lys Gly Val Thr Val Asp Gly Asp Val Asn Cys Glu Val Thr Leu 500 505 510
Thr Pro Ser Thr Ala Pro Ser Gly Arg Val Asn Val Gin Ala Thr Leu 515 520 525 277 200813222
Lys Thr Phe Ser Ser Gly Lys Leu Val Pro Ala Tyr Arg Ala Val lie 530 535 540
Val Leu Ser Asn Gin Gly Ala Pro Pro Ala Asn Ala Thr Met Gin Pro 545 550 555 560
Pro Ser Leu Asp Ala Asp Pro Ala Leu Gin Gly Ser Val Tyr Asp Gly 565 570 575
Lys Thr Leu Phe His Gly Pro Ala Phe Arg Gly lie Asp Asp Val Leu 580 585 590
Ser Cys Thr Lys Ser Gin Leu Val Ala Lys Cys Ser Ala Val Pro Gly 595 600 605
Ser Asp Ala Ala Arg Gly Glu Phe Ala Thr Asp Thr Asp Ala His Asp 610 615 620
Pro Phe Val Asn Asp Leu Ala Phe Gin Ala Met Leu Val Trp Val Arg 625 630 635 640
Arg Thr Leu Gly Gin Ala Ala Leu Pro Asn Ser lie Gin Arg lie Val 645 650 655
Gin His Arg Pro Val Pro Gin Asp Lys Pro Phe Tyr lie Thr Leu Arg 660 665 670
Ser Asn Gin Ser Gly Gly His Ser Gin His Lys His Ala Leu Gin Phe 675 680 685
His Asn Glu Gin Gly Asp Leu Phe lie Asp Val Gin Ala Ser Val lie 690 695 700
Ala Thr Asp Ser Leu Ala Phe 705 710 <210> 19 <211〉 1350 <212〉 DNA <213> 瘦殖壺菌(Schizochytrium sp.) <220〉 <221〉 CDS <222〉 (1)..(1350) <400> 19 48 96 144 atg gcc get egg aat gtg age gcc geg cat gag atg cac gat gaa aag
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys 1 5 10 15 ege ate gcc gtc gtc ggc atg gcc gtc cag tac gcc gga tgc aaa acc
Arg lie Ala Val Val Gly Met Ala Val Gin Tyr Ala Gly Cys Lys Thr 20 25 30 aag gac gag ttc tgg gag gtg etc atg aac ggc aag gtc gag tcc aag
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lvs 35 40 45 gtg ate age gac aaa ega etc ggc tcc aac tac ege gcc gag cac tac
Val lie Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr 278 192 200813222 50 55 60 aaa gca gag cgc age aag tat gee gac acc ttt tgc aac gaa aeg tac 240
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr 65 70 75 80 ggc acc ett gac gag aac gag ate gac aac gag cac gaa etc etc etc 288
Gly Thr Leu Asp Glu Asn Glu lie Asp Asn Glu His Glu Leu Leu Leu 85 90 95 aac etc gee aag cag gca etc gca gag aca tee gtc aaa gac teg aca 336
Asn Leu Ala Lys Gin Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr 100 105 110 * cgc tgc ggc ate gtc age ggc tgc etc teg ttc ccc atg gac aac etc 384 - Arg Cys Gly lie Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu 115 120 125 ’ cag ggt gaa etc etc aac gtg tac caa aac cat gtc gag aaa aag etc 432 • Gin Gly Glu Leu Leu Asn Val Tyr Gin Asn His Val Glu Lys Lys Leu 130 135 140 ggg gee cgc gtc ttc aag gac gee tee cat tgg tee gaa cgc gag cag 480
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gin • 145 150 155 160 tee aac aaa ccc gag gee ggt gac cgc cgc ate ttc atg gac ccg gee 528
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg lie Phe Met Asp Pro Ala 165 170 175 tee ttc gtc gee gaa gaa etc aac etc ggc gee ett cac tac tee gtc 576
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val 180 185 190 gac gca gca tgc gee aeg geg etc tac gtg etc cgc etc geg cag gat 624
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gin Asp 195 200 205 cat etc gtc tee ggc gee gee gac gtc atg etc tgc ggt gee acc tgc 672
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys 210 215 220 ctg ccg gag ccc ttt ttc ate ett teg ggc ttt tee acc ttc cag gee 720
Leu Pro Glu Pro Phe Phe lie Leu Ser Gly Phe Ser Thr Phe Gin Ala 225 230 235 240 atg ccc gtc ggc aeg ggc cag aac gtg tee atg ccg ctg cac aag gac 768
Met Pro Val Gly Thr Gly Gin Asn Val Ser Met Pro Leu His Lys Asp 245 250 255 age cag ggc etc acc ccg ggt gag ggc ggc tee ate atg gtc etc aag 816
Ser Gin Gly Leu Thr Pro Gly Glu Gly Gly Ser lie Met Val Leu Lys 260 265 270 cgt etc gat gat gee ate cgc gac ggc gac cac ate tac ggc acc ett 864 ^ Arg Leu Asp Asp Ala lie Arg Asp Gly Asp His lie Tyr Gly Thr Leu 275 280 285 、 etc ggc gee aat gtc age aac tee ggc aca ggt ctg ccc etc aag ccc 912 *、 Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro 290 295 300 ett etc ccc age gag aaa aag tgc etc atg gac acc tac aeg cgc att 960
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg lie 305 310 315 320 aac gtg cac ccg cac aag att cag tac gtc gag tgc cac gee acc ggc 1008
Asn Val His Pro His Lys lie Gin Tyr Val Glu Cys His Ala Thr Gly 325 330 335 aeg ccc cag ggt gat cgt gtg gaa ate gac gee gtc aag gee tgc ttt 1056
Thr Pro Gin Gly Asp Arg Val Glu lie Asp Ala Val Lys Ala Cys Phe 340 345 350 gaa ggc aag gtc ccc cgt ttc ggt acc aca aag ggc aac ttt gga cac 1104 279 1152 200813222
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His 355 360 365 acc etc gtc gca gcc ggc ttt gcc ggt atg tgc aag gtc etc etc tcc
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser 370 375 380 1200 1248 1296 1344 1350 atg aag cat ggc ate ate ccg ccc acc ccg ggt ate gat gac gag acc
Met Lys His Gly lie lie Pro Pro Thr Pro Gly lie Asp Asp Glu Thr 385 390 395 400 aag atg gac cct etc gtc gtc tec ggt gag gcc ate cca tgg cca gag
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala lie Pro Trp Pro Glu 405 410 415 acc aac ggc gag ccc aag ege gcc ggt etc teg gcc ttt ggc ttt ggt
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly 420 425 430 ggc acc aac gcc cat gcc gtc ttt gag gag cat gac ccc tec aac gcc
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala 435 440 445 gcc tgc Ala Cys 450
<210> 20 <211> 450 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 20
Met Ala Ala Arg Asn Val Ser Ala Ala His Glu Met His Asp Glu Lys 15 10 15
Arg lie Ala Val Val Gly Met Ala Val Gin Tyr Ala Gly Cys Lys Thr
Lys Asp Glu Phe Trp Glu Val Leu Met Asn Gly Lys Val Glu Ser Lys 35 40 45
Val lie Ser Asp Lys Arg Leu Gly Ser Asn Tyr Arg Ala Glu His Tyr 50 55 60
Lys Ala Glu Arg Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Thr Tyr 65 70 75 80
Gly Thr Leu Asp Glu Asn Glu lie Asp Asn Glu His Glu Leu Leu Leu 85 90 95
Asn Leu Ala Lys Gin Ala Leu Ala Glu Thr Ser Val Lys Asp Ser Thr 100 105 110
Arg Cys Gly lie Val Ser Gly Cys Leu Ser Phe Pro Met Asp Asn Leu 115 120 125
Gin Gly Glu Leu Leu Asn Val Tyr Gin Asn His Val Glu Lys Lys Leu 130 135 140
Gly Ala Arg Val Phe Lys Asp Ala Ser His Trp Ser Glu Arg Glu Gin 145 150 155 160 280 200813222
Ser Asn Lys Pro Glu Ala Gly Asp Arg Arg lie Phe Met Asp Pro Ala 165 170 175
Ser Phe Val Ala Glu Glu Leu Asn Leu Gly Ala Leu His Tyr Ser Val 180 185 190
Asp Ala Ala Cys Ala Thr Ala Leu Tyr Val Leu Arg Leu Ala Gin Asp 195 200 205
His Leu Val Ser Gly Ala Ala Asp Val Met Leu Cys Gly Ala Thr Cys 210 215 220
Leu Pro Glu Pro Phe Phe lie Leu Ser Gly Phe Ser Thr Phe Gin Ala 225 230 235 240
Met Pro Val Gly Thr Gly Gin Asn Val Ser Met Pro Leu His Lys Asp 245 250 255
Ser Gin Gly Leu Thr Pro Gly Glu Gly Gly Ser lie Met Val Leu Lys 260 265 270
Arg Leu Asp Asp Ala lie Arg Asp Gly Asp His lie Tyr Gly Thr Leu 275 280 285
Leu Gly Ala Asn Val Ser Asn Ser Gly Thr Gly Leu Pro Leu Lys Pro 290 295 300
Leu Leu Pro Ser Glu Lys Lys Cys Leu Met Asp Thr Tyr Thr Arg lie 305 310 315 320
Asn Val His Pro His Lys lie Gin Tyr Val Glu Cys His Ala Thr Gly 325 330 335
Thr Pro Gin Gly Asp Arg Val Glu lie Asp Ala Val Lys Ala Cys Phe 340 345 350
Glu Gly Lys Val Pro Arg Phe Gly Thr Thr Lys Gly Asn Phe Gly His 355 360 365
Thr Leu Val Ala Ala Gly Phe Ala Gly Met Cys Lys Val Leu Leu Ser 370 375 380
Met Lys His Gly lie lie Pro Pro Thr Pro Gly lie Asp Asp Glu Thr 385 390 395 400
Lys Met Asp Pro Leu Val Val Ser Gly Glu Ala lie Pro Trp Pro Glu 405 410 415
Thr Asn Gly Glu Pro Lys Arg Ala Gly Leu Ser Ala Phe Gly Phe Gly 420 425 430
Gly Thr Asn Ala His Ala Val Phe Glu Glu His Asp Pro Ser Asn Ala 435 440 445
Ala Cys 450 281 48 200813222
<210> 21 <211〉 1323 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <220〉 <221〉 CDS <222> (1)..(1323) <400> 21 teg gee ege tgc ggc ggt gaa age aac atg ege ate gee ate act ggt
Ser Ala Arg Cys Gly Gly Glu Ser Asn Met Arg lie Ala lie Thr Gly 15 10 15 atg gac gee acc ttt ggc get etc aag gga etc gac gee ttc gag ege
Met Asp Ala Thr Phe Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Arg 20 25 30 gee att tac acc ggc get cac ggt gee ate cca etc cca gaa aag ege
Ala lie Tyr Thr Gly Ala His Gly Ala lie Pro Leu Pro Glu Lys Arg 35 40 45 tgg ege ttt etc ggc aag gac aag gac ttt ett gac etc tgc ggc gtc
Trp Arg Phe Leu Gly Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Val 50 55 60 aag gee acc ccg cac ggc tgc tac att gaa gat gtt gag gtc gac ttc
Lys Ala Thr Pro His Gly Cys Tyr lie Glu Asp Val Glu Val Asp Phe 65 70 75 80 cag ege etc ege aeg ccc atg acc cct gaa gac atg etc etc cct cag
Gin Arg Leu Arg Thr Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gin 85 90 95 cag ett ctg gee gtc acc acc att gac ege gee ate etc gac teg gga
Gin Leu Leu Ala Val Thr Thr lie Asp Arg Ala lie Leu Asp Ser Gly 100 105 110 atg aaa aag ggt ggc aat gtc gee gtc ttt gtc ggc etc ggc acc gac
Met Lys Lys Gly Gly Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp 115 120 125 etc gag etc tac cgt cac cgt get ege gtc get etc aag gag ege gtc
Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala Leu Lys Glu Arg Val 130 135 140 ege cct gaa gee tee aag aag etc aat gac atg atg cag tac att aac
Arg Pro Glu Ala Ser Lys Lys Leu Asn Asp Met Met Gin Tyr lie Asn 145 150 155 160 gac tgc ggc aca tee aca teg tac acc teg tac att ggc aac etc gtc
Asp Cys Gly Thr Ser Thr Ser Tyr Thr Ser Tyr lie Gly Asn Leu Val 165 170 175 gee aeg ege gtc teg teg cag tgg ggc ttc aeg ggc ccc tee ttt aeg
Ala Thr Arg Val Ser Ser Gin Trp Gly Phe Thr Gly Pro Ser Phe Thr 180 185 190 ate acc gag ggc aac aac tee gtc tac ege tgc gee gag etc ggc aag lie Thr Glu Gly Asn Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys 195 200 205 tac etc etc gag acc ggc gag gtc gat ggc gtc gtc gtt geg ggt gtc
Tyr Leu Leu Glu Thr Gly Glu Val Asp Gly Val Val Val Ala Gly Val 210 215 220 gat etc tgc ggc agt gee gaa aac ett tac gtc aag tet ege ege ttc
Asp Leu Cys Gly Ser Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe 225 230 235 240 aag gtg tee acc tee gat acc ccg ege gee age ttt gac gee gee gee
Lys Val Ser Thr Ser Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala 245 250 255 96 144 192 240 288 336 384 432 480 528 576 624 672 720 282 768 816 200813222 gat ggc tac ttt gtc ggc gag ggc tgc ggt gcc ttt gtg etc aag cgt
Asp Gly Tyr Phe Val Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg 260 265 270 gag act age tgc acc aag gac gac cgt ate tac get tgc atg gat gcc
Glu Thr Ser Cys Thr Lys Asp Asp Arg lie Tyr Ala Cys Met Asp Ala 275 280 285 ate gtc cct ggc aac gtc cct age gcc tgc ttg ege gag gcc etc gac lie Val Pro Gly Asn Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp 290 295 300 cag geg ege gtc aag ccg ggc gat ate gag atg etc gag etc age gcc
Gin Ala Arg Val Lys Pro Gly Asp lie Glu Met Leu Glu Leu Ser Ala 305 310 315 320 gac tee gcc ege cac etc aag gac ccg tee gtc ctg ccc aag gag etc
Asp Ser Ala Arg His Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu 325 330 335 act gcc gag gag gaa ate ggc ggc ett cag aeg ate ett cgt gac gat
Thr Ala Glu Glu Glu lie Gly Gly Leu Gin Thr lie Leu Arg Asp Asp 340 345 350 gac aag etc ccg ege aac gtc gca aeg ggc agt gtc aag gcc acc gtc
Asp Lys Leu Pro Arg Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val 355 360 ^ ggt gac acc ggt tat gcc tet ggt get gcc age etc ate aag get geg
Gly Asp Thr Gly Tyr Ala Ser Gly Ala Ala Ser Leu lie Lys Ala Ala 370 375 380 ett tgc ate tac aac ege tac ctg ccc age aac ggc gac gac tgg gat
Leu Cys lie Tyr Asn Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asn 385 390 395 4〇〇 gaa ccc gcc cct gag geg ccc tgg gac age acc etc ttt geg tgc cag
Glu Pro Ala Pro Glu Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gin 405 410 415 acc teg ege get tgg etc aag aac cct ggc gag cgt ege tat geg gCc
Thr Ser Arg Ala Trp Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala 420 425 430 gtc teg ggc gtc tee gag aeg ege teg
Val Ser Gly Val Ser Glu Thr Arg Ser 435 440
<210〉 22 <211〉 441 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 22
Ser Ala Arg Cys Gly Gly Glu Ser Asn Met Arg lie Ala lie Thr Glv 1 5 10 15 y
Met Asp Ala Thr Phe Gly Ala Leu Lys Gly Leu Asp Ala Phe Glu Ar& 20 25 30 s
Ala lie Tyr Thr Gly Ala His Gly Ala lie Pro Leu Pro Glu Lys Ar^ 35 40 45 ^
Trp Arg Phe Leu Gly Lys Asp Lys Asp Phe Leu Asp Leu Cys Gly Vai 50 55 60
Lys Ala Thr Pro His Gly Cys Tyr lie Glu Asp Val Glu Val Asp Phe 65 70 75 80 864 912 960 1008 1056 1104 1152 1200 1248 1296 1323 283 200813222
Gin Arg Leu Arg Thr Pro Met Thr Pro Glu Asp Met Leu Leu Pro Gin 85 90 95
Gin Leu Leu Ala Val Thr Thr lie Asp Arg Ala lie Leu Asp Ser Gly 100 105 110
Met Lys Lys Gly Gly Asn Val Ala Val Phe Val Gly Leu Gly Thr Asp 115 120 125
Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala Leu Lys Glu Arg Val 130 135 140
Arg Pro Glu Ala Ser Lys Lys Leu Asn Asp Met Met Gin Tyr lie Asn 145 150 155 160
Asp Cys Gly Thr Ser Thr Ser Tyr Thr Ser Tyr lie Gly Asn Leu Val 165 170 175
Ala Thr Arg Val Ser Ser Gin Trp Gly Phe Thr Gly Pro Ser Phe Thr 180 185 190 lie Thr Glu Gly Asn Asn Ser Val Tyr Arg Cys Ala Glu Leu Gly Lys 195 200 205
Tyr Leu Leu Glu Thr Gly Glu Val Asp Gly Val Val Val Ala Gly Val 210 215 220
Asp Leu Cys Gly Ser Ala Glu Asn Leu Tyr Val Lys Ser Arg Arg Phe 225 230 235 240
Lys Val Ser Thr Ser Asp Thr Pro Arg Ala Ser Phe Asp Ala Ala Ala 245 250 255
Asp Gly Tyr Phe Val Gly Glu Gly Cys Gly Ala Phe Val Leu Lys Arg 260 265 270
Glu Thr Ser Cys Thr Lys Asp Asp Arg lie Tyr Ala Cys Met Asp Ala 275 280 285 lie Val Pro Gly Asn Val Pro Ser Ala Cys Leu Arg Glu Ala Leu Asp 290 295 300
Gin Ala Arg Val Lys Pro Gly Asp lie Glu Met Leu Glu Leu Ser Ala 305 310 315 320
Asp Ser Ala Arg His Leu Lys Asp Pro Ser Val Leu Pro Lys Glu Leu 325 330 335
Thr Ala Glu Glu Glu lie Gly Gly Leu Gin Thr lie Leu Arg Asp Asp 340 345 350
Asp Lys Leu Pro Arg Asn Val Ala Thr Gly Ser Val Lys Ala Thr Val 355 360 365
Gly Asp Thr Gly Tyr Ala Ser Gly Ala Ala Ser Leu lie Lys Ala Ala 284 200813222 370 375 380
Leu Cys lie Tyr Asn Arg Tyr Leu Pro Ser Asn Gly Asp Asp Trp Asp 385 390 395 400
Glu Pro Ala Pro Glu Ala Pro Trp Asp Ser Thr Leu Phe Ala Cys Gin 405 410 415
Thr Ser Arg Ala Trp Leu Lys Asn Pro Gly Glu Arg Arg Tyr Ala Ala 420 425 430
Val Ser Gly Val Ser Glu Thr Arg Ser 435 440
<210〉 23 <211〉 1500 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <220〉 <221〉 CDS <22?> Π) Π5ΠΠ) <400〉 23 tgc tat tcc gtg etc etc tcc gaa gcc gag ggc cac tac gag ege gag
Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His Tyr Glu Arg Glu 15 10 15 aac ege ate teg etc gac gag gag geg ccc aag etc att gtg ett ege
Asn Arg lie Ser Leu Asp Glu Glu Ala Pro Lys Leu lie Val Leu Arg 20 25 30 gcc gac tcc cac gag gag ate ett ggt ege etc gac aag ate ege gag
Ala Asp Ser His Glu Glu lie Leu Gly Arg Leu Asp Lys lie Arg Glu 35 40 45 ege ttc ttg cag ccc aeg ggc gcc gcc ccg ege gag tcc gag etc aag
Arg Phe Leu Gin Pro Thr Gly Ala Ala Pro Arg Glu Ser Glu Leu Lys 50 55 60 geg cag gcc ege ege ate ttc etc gag etc etc ggc gag acc ett gcc
Ala Gin Ala Arg Arg lie Phe Leu Glu Leu Leu Gly Glu Thr Leu Ala 65 70 75 80 cag gat gcc get tet tea ggc teg caa aag ccc etc get etc age etc
Gin Asp Ala Ala Ser Ser Gly Ser Gin Lys Pro Leu Ala Leu Ser Leu 85 90 95 gtc tcc aeg ccc tcc aag etc cag ege gag gtc gag etc geg gcc aag
Val Ser Thr Pro Ser Lys Leu Gin Arg Glu Val Glu Leu Ala Ala Lys 100 105 110 ggt ate ccg ege tgc etc aag atg ege ege gat tgg age tcc cct get
Gly lie Pro Arg Cys Leu Lys Met Arg Arg Asp Trp Ser Ser Pro Ala 115 120 125 ggc age ege tac geg cct gag ccg etc gcc age gac ege gtc gcc ttc
Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala Ser Asp Arg Val Ala Phe 130 135 140 atg tac ggc gaa ggt ege age cct tac tac ggc ate acc caa gac att
Met Tyr Gly Glu Gly Arg Ser Pro Tyr Tyr Gly lie Thr Gin Asp lie 145 150 155 160 cac ege att tgg ccc gaa etc cac gag gtc ate aac gaa aag aeg aac
His Arg lie Trp Pro Glu Leu His Glu Val lie Asn Glu Lys Thr Asn 165 170 175 cgt etc tgg gcc gaa ggc gac ege tgg gtc atg ccg ege gcc age ttc 48 96 144 192 240 288 336 384 432 480 528 576 285 624 200813222
Arg Leu Trp Ala Glu Gly Asp Arg Trp Val Met Pro Arg Ala Ser Phe 180 185 190 aag teg gag etc gag age cag cag caa gag ttt gat ege aac atg att
Lys Ser Glu Leu Glu Ser Gin Gin Gin Glu Phe Asp Arg Asn Met lie 195 200 205 gaa atg ttc cgt ett gga ate etc acc tea att gee ttc acc aat ctg
Glu Met Phe Arg Leu Gly lie Leu Thr Ser lie Ala Phe Thr Asn Leu 210 215 220 geg ege gac gtt etc aac ate aeg ccc aag gee gee ttt ggc etc agt
Ala Arg Asp Val Leu Asn lie Thr Pro Lys Ala Ala Phe Gly Leu Ser 225 230 235 240 ett ggc gag att tee atg att ttt gee ttt tee aag aag aac ggt etc
Leu Gly Glu lie Ser Met lie Phe Ala Phe Ser Lys Lys Asn Gly Leu 245 250 255 ate tee gac cag etc acc aag gat ett ege gag tee gac gtg tgg aac lie Ser Asp Gin Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn 260 265 270 aag get ctg gee gtt gaa ttt aat geg ctg ege gag gee tgg ggc att
Lys Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly lie 275 280 285 cca cag agt gtc ccc aag gac gag ttc tgg caa ggc tac att gtg ege
Pro Gin Ser Val Pro Lys Asp Glu Phe Trp Gin Gly Tyr lie Val Arg 290 295 300 ggc acc aag cag gat ate gag geg gee ate gee ccg gac age aag tac
Gly Thr Lys Gin Asp lie Glu Ala Ala lie Ala Pro Asp Ser Lys Tyr 305 310 315 320 gtg ege etc acc ate ate aat gat gee aac acc gee etc att age ggc
Val Arg Leu Thr lie lie Asn Asp Ala Asn Thr Ala Leu lie Ser Gly 325 330 335 aag ccc gac gee tgc aag get geg ate geg cgt etc ggt ggc aac att
Lys Pro Asp Ala Cys Lys Ala Ala lie Ala Arg Leu Gly Gly Asn lie 340 345 350 cct geg ett ccc gtg acc cag ggc atg tgc ggc cac tgc ccc gag gtg
Pro Ala Leu Pro Val Thr Gin Gly Met Cys Gly His Cys Pro Glu Val 355 360 365 gga cct tat acc aag gat ate gee aag ate cat gee aac ett gag ttc
Gly Pro Tyr Thr Lys Asp lie Ala Lys lie His Ala Asn Leu Glu Phe 370 375 380 ccc gtt gtc gac ggc ett gac etc tgg acc aca ate aac cag aag ege
Pro Val Val Asp Gly Leu Asp Leu Trp Thr Thr lie Asn Gin Lys Arg 385 390 395 400 etc gtg cca ege gee aeg ggc gee aag gac gaa tgg gee cct tet tee
Leu Val Pro Arg Ala Thr Gly Ala Lys Asp Glu Trp Ala Pro Ser Ser 405 410 415 ttt ggc gag tac gee ggc cag etc tac gag aag cag get aac ttc ccc
Phe Gly Glu Tyr Ala Gly Gin Leu Tyr Glu Lys Gin Ala Asn Phe Pro 420 425 430 caa ate gtc gag acc att tac aag caa aac tac gac gtc ttt gtc gag
Gin lie Val Glu Thr lie Tyr Lys Gin Asn Tyr Asp Val Phe Val Glu 435 440 445 gtt ggg ccc aac aac cac cgt age acc gca gtg ege acc aeg ett ggt
Val Gly Pro Asn Asn His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly 450 455 460 ccc cag ege aac cac ett get ggc gee ate gac aag cag aac gag gat
Pro Gin Arg Asn His Leu Ala Gly Ala lie Asp Lys Gin Asn Glu Asp 465 470 475 480 672 720 768 816 864 912 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 286 1440 1488 200813222 get tgg aeg acc ate gtc aag ett gtg get teg etc aag gee cac ett Ala Trp Thr Thr lie Val Lys Leu Val Ala Ser Leu Lys Ala His Leu 485 490 495 1500 gtt cct ggc gtc Val Pro Gly Val 500
<210〉 24 <211> 500 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 24
Cys Tyr Ser Val Leu Leu Ser Glu Ala Glu Gly His Tyr Glu Arg Glu 15 10 15
Asn Arg lie Ser Leu Asp Glu Glu Ala Pro Lys Leu lie Val Leu Arg 20 25 30
Ala Asp Ser His Glu Glu He Leu Gly Arg Leu Asp Lys lie Arg Glu 35 40 45
Arg Phe Leu Gin Pro Thr Gly Ala Ala Pro Arg Glu Ser Glu Leu Lys 50 55 60
Ala Gin Ala Arg Arg lie Phe Leu Glu Leu Leu Gly Glu Thr Leu Ala 65 70 75 80
Gin Asp Ala Ala Ser Ser Gly Ser Gin Lys Pro Leu Ala Leu Ser Leu 85 90 95
Val Ser Thr Pro Ser Lys Leu Gin Arg Glu Val Glu Leu Ala Ala Lys 100 105 110
Gly lie Pro Arg Cys Leu Lys Met Arg Arg Asp Trp Ser Ser Pro Ala 115 120 125
Gly Ser Arg Tyr Ala Pro Glu Pro Leu Ala Ser Asp Arg Val Ala Phe 130 135 140
Met Tyr Gly Glu Gly Arg Ser Pro Tyr Tyr Gly lie Thr Gin Asp lie 145 150 155 160
His Arg lie Trp Pro Glu Leu His Glu Val lie Asn Glu Lys Thr Asn 165 170 175
Arg Leu Trp Ala Glu Gly Asp Arg Trp Val Met Pro Arg Ala Ser Phe 180 185 190
Lys Ser Glu Leu Glu Ser Gin Gin Gin Glu Phe Asp Arg Asn Met lie 195 200 205
Glu Met Phe Arg Leu Gly lie Leu Thr Ser lie Ala Phe Thr Asn Leu 210 215 220
Ala Arg Asp Val Leu Asn lie Thr Pro Lys Ala Ala Phe Gly Leu Ser 225 230 235 240 287 200813222
Leu Gly Glu lie Ser Met lie Phe Ala Phe Ser Lys Lys Asn Gly Leu 245 250 255 lie Ser Asp Gin Leu Thr Lys Asp Leu Arg Glu Ser Asp Val Trp Asn 260 265 270
Lys Ala Leu Ala Val Glu Phe Asn Ala Leu Arg Glu Ala Trp Gly lie 275 280 285
Pro Gin Ser Val Pro Lys Asp Glu Phe Trp Gin Gly Tyr lie Val Arg 290 295 300
Gly Thr Lys Gin Asp lie Glu Ala Ala lie Ala Pro Asp Ser Lys Tyr 305 310 315 320
Val Arg Leu Thr lie lie Asn Asp Ala Asn Thr Ala Leu lie Ser Gly 325 330 335
Lys Pro Asp Ala Cys Lys Ala Ala lie Ala Arg Leu Gly Gly Asn lie 340 345 350
Pro Ala Leu Pro Val Thr Gin Gly Met Cys Gly His Cys Pro Glu Val 355 360 365
Gly Pro Tyr Thr Lys Asp lie Ala Lys lie His Ala Asn Leu Glu Phe 370 375 380
Pro Val Val Asp Gly Leu Asp Leu Trp Thr Thr lie Asn Gin Lys Arg 385 390 395 400
Leu Val Pro Arg Ala Thr Gly Ala Lys Asp Glu Trp Ala Pro Ser Ser 405 410 415
Phe Gly Glu Tyr Ala Gly Gin Leu Tyr Glu Lys Gin Ala Asn Phe Pro 420 425 430
Gin lie Val Glu Thr lie Tyr Lys Gin Asn Tyr Asp Val Phe Val Glu 435 440 445
Val Gly Pro Asn Asn His Arg Ser Thr Ala Val Arg Thr Thr Leu Gly 450 455 460
Pro Gin Arg Asn His Leu Ala Gly Ala lie Asp Lys Gin Asn Glu Asp 465 470 475 480
Ala Trp Thr Thr lie Val Lys Leu Val Ala Ser Leu Lys Ala His Leu 485 490 495
Val Pro Gly Val 500
<210> 25 <211> 1530 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) 288 48 200813222 <220〉 <221〉 CDS <222〉 (1)..(1530) <400> 25 ctg etc gat etc gac agt atg ett geg ctg age tet gee agt gee tee
Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser Ala Ser 1 5 10 15 ggc aac ett gtt gag act geg cct age gac gee teg gtc att gtg ccg
Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val lie Val Pro 20 25 30 ccc tgc aac att geg gat etc ggc age ege gee ttc atg aaa aeg tac
Pro Cys Asn lie Ala Asp Leu Gly Ser Arg Ala Phe Met Lys Thr Tyr 35 40 45 ggt gtt teg geg cct ctg tac aeg ggc gee atg gee aag ggc att gee
Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala 50 55 60 tet geg gac etc gtc att gee gee ggc ege cag ggc ate ett geg tee
Ser Ala Asp Leu Val lie Ala Ala Gly Arg Gin Gly lie Leu Ala Ser 65 70 75 80 ttt ggc gee ggc gga ett ccc atg cag gtt gtg cgt gag tee ate gaa
Phe Gly Ala Gly Gly Leu Pro Met Gin Val Val Arg Glu Ser lie Glu 奶 90 95 aag att cag gee gee ctg ccc aat ggc ccg tac get gtc aac ett ate
Lys lie Gin Ala Ala Leu Pro Asn Gly Pro Tyr Ala Val Asn Leu lie 100 105 110 cat tet ccc ttt gac age aac etc gaa aag ggc aat gtc gat etc ttc
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe 115 120 125 etc gag aag ggt gtc acc ttt gtc gag gee teg gee ttt atg aeg etc
Leu Glu Lys Gly Val Thr Phe Val Glu Ala Ser Ala Phe Met Thr Leu 130 135 140 acc ccg cag gtc gtg egg tac ege geg get ggc etc aeg ege aac gee
Thr Pro Gin Val Val Arg Tyr Arg Ala Ala Gly Leu Thr Arg Asn Ala 145 150 155 160 gac ggc teg gtc aac ate ege aac cgt ate att ggc aag gtc teg ege
Asp Gly Ser Val Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg 165 170 175 acc gag etc gee gag atg ttc atg cgt cct geg ccc gag cac ett ett
Thr Glu Leu Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu 180 185 190 cag aag etc att get tee ggc gag ate aac cag gag cag gee gag etc
Gin Lys Leu lie Ala Ser Gly Glu lie Asn Gin Glu Gin Ala Glu Leu 195 200 205 gee ege cgt gtt ccc gtc get gac gac ate geg gtc gaa get gac teg
Ala Arg Arg Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser 210 215 220 ggt ggc cac acc gac aac ege ccc ate cac gtc att ctg ccc etc ate
Gly Gly His Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu lie 225 230 235 240 ate aac ett ege gac ege ett cac ege gag tgc ggc tac ccg gee aac lie Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro Ala Asn 245 250 255 ett ege gtc cgt gtg ggc gee ggc ggt ggc att ggg tgc ccc cag geg
Leu Arg Val Arg Val Gly Ala Gly Gly Gly lie Gly Cys Pro Gin Ala 260 265 270 geg ctg gee acc ttc aac atg ggt gee tee ttt att gtc acc ggc acc
Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe lie Val Thr Gly Thr 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 289 864 912 200813222 275 280 285 gtg aac cag gtc gcc aag cag teg ggc aeg tgc gac aat gtg ege aag
Val Asn Gin Val Ala Lys Gin Ser Gly Thr Cys Asp Asn Val Arg Lys 290 295 300 cag etc geg aag gcc act tac teg gac gta tgc atg gcc ccg get gcc
Gin Leu Ala Lys Ala Thr Tyr Ser Asp Val Cys Met Ala Pro Ala Ala 305 310 315 320 gac atg ttc gag gaa ggc gtc aag ett cag gtc etc aag aag gga acc
Asp Met Phe Glu Glu Gly Val Lys Leu Gin Val Leu Lys Lys Gly Thr 325 330 335 atg ttt ccc teg ege gcc aac aag etc tac gag etc ttt tgc aag tac
Met Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr 340 345 350 gac teg ttc gag tee atg ccc ccc gca gag ett geg ege gtc gag aag
Asp Ser Phe Glu Ser Met Pro Pro Ala Glu Leu Ala Arg Val Glu Lys 355 360 365 ege ate ttc age ege geg etc gaa gag gtc tgg gac gag acc aaa aac
Arg lie Phe Ser Arg Ala Leu Glu Glu Val Trp Asp Glu Thr Lys Asn 370 375 380 ttt tac att aac cgt ett cac aac ccg gag aag ate cag ege gcc gag
Phe Tyr lie Asn Arg Leu His Asn Pro Glu Lys lie Gin Arg Ala Glu 385 390 395 400 ege gac ccc aag etc aag atg teg ctg tgc ttt ege tgg tac ctg age
Arg Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser 405 410 415 ctg geg age ege tgg gcc aac act gga get tee gat ege gtc atg gac
Leu Ala Ser Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp 420 425 430 tac cag gtc tgg tgc ggt cct gcc att ggt tee ttc aac gat ttc ate
Tyr Gin Val Trp Cys Gly Pro Ala lie Gly Ser Phe Asn Asp Phe lie 435 440 445 aag gga act tac ett gat ccg gcc gtc gca aac gag tac ccg tgc gtc
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val 450 455 460 gtt cag att aac aag cag ate ett cgt gga geg tgc ttc ttg ege cgt
Val Gin lie Asn Lys Gin lie Leu Arg Gly Ala Cys Phe Leu Arg Arg 465 470 475 480 etc gaa att ctg ege aac gca ege ett tee gat ggc get gcc get ett
Leu Glu lie Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala Ala Leu 485 490 495 gtg gcc age ate gat gac aca tac gtc ccg gcc gag aag ctg
Val Ala Ser lie Asp Asp Thr Tyr Val Pro Ala Glu Lys Leu 500 505 510 <210〉 26 <211〉 510 <212〉 PRT 、 <213> 裂殖壺菌(Schizochytrium sp.) <400〉 26
Leu Leu Asp Leu Asp Ser Met Leu Ala Leu Ser Ser Ala Ser Ala Ser
Gly Asn Leu Val Glu Thr Ala Pro Ser Asp Ala Ser Val lie Val Pro
Pro Cys Asn lie Ala Asp Leu Gly Ser Arg Ala Phe Met Lys Thr Tyr 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1530 290 200813222 35 40 45
Gly Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala 50 55 60
Ser Ala Asp Leu Val lie Ala Ala Gly Arg Gin Gly lie Leu Ala Ser 65 70 75 80
Phe Gly Ala Gly Gly Leu Pro Met Gin Val Val Arg Glu Ser lie Glu 85 90 95
Lys lie Gin Ala Ala Leu Pro Asn Gly Pro Tyr Ala Val Asn Leu lie 100 105 110
His Ser Pro Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe 115 120 125
Leu Glu Lys Gly Val Thr Phe Val Glu Ala Ser Ala Phe Met Thr Leu 130 135 140
Thr Pro Gin Val Val Arg Tvr Arg Ala Ala Glv Leu Thr Arg Asn Ala 145 150 155 160
Asp Gly Ser Val Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg 165 170 175
Thr Glu Leu Ala Glu Met Phe Met Arg Pro Ala Pro Glu His Leu Leu 180 185 190
Gin Lys Leu lie Ala Ser Gly Glu lie Asn Gin Glu Gin Ala Glu Leu 195 200 205
Ala Arg Arg Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser 210 215 220
Gly Gly His Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu lie 225 230 235 240 lie Asn Leu Arg Asp Arg Leu His Arg Glu Cys Gly Tyr Pro Ala Asn 245 250 255
Leu Arg Val Arg Val Gly Ala Gly Gly Gly lie Gly Cys Pro Gin Ala 260 265 270
Ala Leu Ala Thr Phe Asn Met Gly Ala Ser Phe lie Val Thr Gly Thr 275 280 285
Val Asn Gin Val Ala Lys Gin Ser Gly Thr Cys Asp Asn Val Arg Lys 290 295 300
Gin Leu Ala Lys Ala Thr Tyr Ser Asp Val Cys Met Ala Pro Ala Ala 305 310 315 320
Asp Met Phe Glu Glu Gly Val Lys Leu Gin Val Leu Lys Lys Gly Thr 325 330 335 291 200813222
Met Phe Pro Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr 340 345 350
Asp Ser Phe Glu Ser Met Pro Pro Ala Glu Leu Ala Arg Val Glu Lys 355 360 365
Arg lie Phe Ser Arg Ala Leu Glu Glu Val Trp Asp Glu Thr Lys Asn 370 375 380
Phe Tyr lie Asn Arg Leu His Asn Pro Glu Lys lie Gin Arg Ala Glu 385 390 395 400
Arg Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser 405 410 415
Leu Ala Ser Arg Trp Ala Asn Thr Gly Ala Ser Asp Arg Val Met Asp 420 425 430
Tyr Gin Val Trp Cys Gly Pro Ala lie Gly Ser Phe Asn Asp Phe lie 435 440 445
Lys Gly Thr Tyr Leu Asp Pro Ala Val Ala Asn Glu Tyr Pro Cys Val 450 455 460
Val Gin lie Asn Lys Gin lie Leu Arg Gly Ala Cys Phe Leu Arg Arg 465 470 475 480
Leu Glu lie Leu Arg Asn Ala Arg Leu Ser Asp Gly Ala Ala Ala Leu 485 490 495
Val Ala Ser lie Asp Asp Thr Tyr Val Pro Ala Glu Lys Leu 500 505 510
<210〉 27 <211> 1350 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <220〉 <221〉 CDS <222> (1)..(1350) <400〉 27 48 96 144 192 atg gcg etc cgt gtc aag aeg aac aag aag cca tgc tgg gag atg acc
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr 15 10 15 aag gag gag ctg acc age ggc aag acc gag gtg ttc aac tat gag gaa
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu 20 25 30 etc etc gag ttc gca gag ggc gac ate gcc aag gtc ttc gga ccc gag
Leu Leu Glu Phe Ala Glu Gly Asp lie Ala Lys Val Phe Gly Pro Glu 35 40 45 ttc gcc gtc ate gac aag tac ccg ege ege gtg ege ctg ccc gcc ege
Phe Ala Val lie Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg 50 55 60 gag tac ctg etc gtg acc ege gtc acc etc atg gac gcc gag gtc aac
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn 65 70 75 80 292 240 200813222 aac tac cgc gtc ggc gcc cgc atg gtc acc gag tac gat etc ccc gtc 288
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val 85 90 95 aac gga gag etc tee gag ggc gga gac tgc ccc tgg gcc gtc ctg gtc 336
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val 100 105 110 gag agt ggc cag tgc gat etc atg etc ate tee tac atg ggc att gac 384
Glu Ser Gly Gin Cys Asp Leu Met Leu lie Ser Tyr Met Gly lie Asp 115 120 125 ttc cag aac cag ggc gac cgc gtc tac cgc ctg etc aac acc aeg etc 432
Phe Gin Asn Gin Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140 acc ttt tac ggc gtg gcc cac gag ggc gag acc etc gag tac gac att 480
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp lie 145 150 155 160 cgc gtc acc ggc ttc gcc aag cgt etc gac ggc ggc ate tee atg ttc 528
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly lie Ser Met Phe 165 170 175 ttc ttc gag tac gac tgc tac gtc aac ggc cgc etc etc ate gag atg 576
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu lie Glu Met 180 185 190 cgc gat ggc tgc gcc ggc ttc ttc acc aac gag gag etc gac gcc ggc 624
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly 195 200 205 aag ggc gtc gtc ttc acc cgc ggc gac etc gcc gcc cgc gcc aag ate 672
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys lie 210 215 220 cca aag cag gac gtc tee ccc tac gcc gtc gcc ccc tgc etc cac aag 720
Pro Lys Gin Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys 225 230 235 240 acc aag etc aac gaa aag gag atg cag acc etc gtc gac aag gac tgg 768
Thr Lys Leu Asn Glu Lys Glu Met Gin Thr Leu Val Asp Lys Asp Trp 245 250 255 gca tee gtc ttt ggc tee aag aac ggc atg ccg gaa ate aac tac aaa 816
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu lie Asn Tyr Lys 260 265 270 etc tgc geg cgt aag atg etc atg att gac cgc gtc acc age att gac 864
Leu Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr Ser lie Asp 275 280 285 cac aag ggc ggt gtc tac ggc etc ggt cag etc gtc ggt gaa aag ate 912
His Lys Gly Gly Val Tyr Gly Leu Gly Gin Leu Val Gly Glu Lys lie 290 295 300 etc gag cgc gac cac tgg tac ttt ccc tgc cac ttt gtc aag gat cag 960
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gin 305 310 315 320 gtc atg gcc gga tee etc gtc tee gac ggc tgc age cag atg etc aag 1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Met Leu Lys 325 330 335 atg tac atg ate tgg etc ggc etc cac etc acc acc gga ccc ttt gac 1056
Met Tyr Met lie Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp 340 345 350 ttc cgc ccg gtc aac ggc cac ccc aac aag gtc cgc tgc cgc ggc caa 1104
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 ate tee ccg cac aag ggc aag etc gtc tac gtc atg gag ate aag gag 1152 lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Glu 370 375 380 293 1200 200813222 atg ggc ttc gac gag gac aac gac ccg tac gcc att gcc gac gtc aac
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala lie Ala Asp Val Asn 385 390 395 400 1248 1296 1344 1350 ate att gat gtc gac ttc gaa aag ggc cag gac ttt age etc gac ege lie lie Asp Val Asp Phe Glu Lys Gly Gin Asp Phe Ser Leu Asp Arg 405 410 415 ate age gac tac ggc aag ggc gac etc aac aag aag ate gtc gtc gac lie Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys lie Val Val Asp 420 425 430 ttt aag ggc ate get etc aag atg cag aag ege tee acc aac aag aac
Phe Lys Gly lie Ala Leu Lys Met Gin Lys Arg Ser Thr Asn Lys Asn 435 440 445 ccc tee Pro Ser 450
<210〉 28 <211> 450 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 28
Met Ala Leu Arg Val Lys Thr Asn Lys Lys Pro Cys Trp Glu Met Thr 15 10 15
Lys Glu Glu Leu Thr Ser Gly Lys Thr Glu Val Phe Asn Tyr Glu Glu 20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp lie Ala Lys Val Phe Gly Pro Glu 35 40 45
Phe Ala Val lie Asp Lys Tyr Pro Arg Arg Val Arg Leu Pro Ala Arg 50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Asn 65 70 75 80
Asn Tyr Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Leu Pro Val 85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Cys Pro Trp Ala Val Leu Val 100 105 110
Glu Ser Gly Gin Cys Asp Leu Met Leu lie Ser Tyr Met Gly lie Asp 115 120 125
Phe Gin Asn Gin Gly Asp Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140
Thr Phe Tyr Gly Val Ala His Glu Gly Glu Thr Leu Glu Tyr Asp lie 145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Leu Asp Gly Gly lie Ser Met Phe 165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Val Asn Gly Arg Leu Leu lie Glu Met 180 185 190 294 200813222
Arg Asp Gly Cys Ala Gly Phe Phe Thr Asn Glu Glu Leu Asp Ala Gly 195 200 205
Lys Gly Val Val Phe Thr Arg Gly Asp Leu Ala Ala Arg Ala Lys lie 210 215 220
Pro Lys Gin Asp Val Ser Pro Tyr Ala Val Ala Pro Cys Leu His Lys 225 230 235 240
Thr Lys Leu Asn Glu Lys Glu Met Gin Thr Leu Val Asp Lys Asp Trp 245 250 255
Ala Ser Val Phe Gly Ser Lys Asn Gly Met Pro Glu lie Asn Tyr Lys 260 265 270
Leu Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr Ser lie Asp 275 280 285
His Lys Gly Gly Val Tyr Gly Leu Gly Gin Leu Val Gly Glu Lys lie 290 295 300
Leu Glu Arg Asp His Trp Tyr Phe Pro Cys His Phe Val Lys Asp Gin 305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Met Leu Lys 325 330 335
Met Tyr Met lie Trp Leu Gly Leu His Leu Thr Thr Gly Pro Phe Asp 340 345 350
Phe Arg Pro Val Asn Gly His Pro Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Glu 370 375 380
Met Gly Phe Asp Glu Asp Asn Asp Pro Tyr Ala lie Ala Asp Val Asn 385 390 395 400 lie lie Asp Val Asp Phe Glu Lys Gly Gin Asp Phe Ser Leu Asp Arg 405 410 415 lie Ser Asp Tyr Gly Lys Gly Asp Leu Asn Lys Lys lie Val Val Asp 420 425 430
Phe Lys Gly lie Ala Leu Lys Met Gin Lys Arg Ser Thr Asn Lys Asn 435 440 445
Pro Ser 450
<210〉 29 <211〉 1497 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) 295 48 200813222 <220〉 <221〉 CDS <222〉 (1)..(1497) <400> 29 aag gtt cag ccc gtc ttt gcc aac ggc gcc gcc act gtc ggc ccc gag ps Val Gin Pro !al Phe Xla Asn Gly Ala Ala Thr Val Gly Pro Glu 15 10 15 gcc tcc aag get tee tee ggc gee age gcc age gcc age gcc gcc ccg
Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala Ala Pro 2〇 25 30 gee aag cct gee ttc age gee gat gtt ett geg ccc aag ccc gtt gcc
Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro Val Ala 35 40 45 ett ccc gag cac ate etc aag ggc gac gcc etc gcc ccc aag gag atg
Leu Pro Glu His lie Leu Lys Gly Asp Ala Leu Ala Pro Lys Glu Met 5〇 55 60 tee tgg cac ccc atg gee ege ate ccg ggc aac ccg aeg ccc tet ttt Ser Trp His Pro Met Ala Arg lie Pro Gly Asn Pro Thr Pro Ser Phe 65 70 75 80 geg ccc teg gee tac aag ccg ege aac ate gcc ttt aeg ccc ttc ccc Ala Pro Ser Ala Tyr Lys Pro Arg Asn lie Ala Phe Thr Pro Phe Pro 85 90 95 ggc aac ccc aac gat aac gac cac acc ccg ggc aag atg ccg etc acc
Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro Leu Thr 100 105 HO tgg ttc aac atg gcc gag ttc atg gcc ggc aag gtc age atg tgc etc Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met Cys Leu 115 120 125 ggc ccc gag ttc gcc aag ttc gac gac teg aac acc age ege age ccc Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg Ser Pro 130 135 140 get tgg gac etc get etc gtc acc ege gcc gtg tet gtg tet gac etc
Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser Asp Leu 145 150 155 160 aag cac gtc aac tac ege aac ate gac etc gac ccc tec aag ggt acc
Lys His Val Asn Tyr Arg Asn lie Asp Leu Asp Pro Ser Lys Gly Thr 165 170 175 atg gtc ggc gag ttc gac tgc ccc geg gac gcc tgg ttc tac aag ggc
Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr Lys Gly 180 185 190 gcc tgc aac gat gcc cac atg ccg tac teg ate etc atg gag ate gcc Ala Cys Asn Asp Ala His Met Pro Tyr Ser lie Leu Met Glu lie Ala 195 200 205 etc cag acc teg ggt gtg etc acc teg gtg etc aag geg ccc ctg acc Leu Gin Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro Leu Thr 210 215 220 atg gag aag gac gac ate etc ttc ege aac etc gac gcc aac gcc gag
Met Glu Lys Asp Asp lie Leu Phe Arg Asn Leu Asp Ala Asn Ala Glu 225 230 235 240 ttc gtg ege gcc gac etc gac tac ege ggc aag act ate ege aac gtc
Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr lie Arg Asn Val 245 250 255 acc aag tgc act ggc tac age atg etc ggc gag atg ggc gtc cac ege
Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val His Arg 260 265 270 ttc acc ttt gag etc tac gtc gat gat gtg etc ttt tac aag ggc teg 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 864 296 912 200813222
Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys Gly Ser 275 280 285 acc teg ttc ggc tgg ttc gtg ccc gag gtc ttt gcc gcc cag gcc ggc
Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gin Ala Gly 290 295 300 etc gac aac ggc ege aag teg gag ccc tgg ttc att gag aac aag gtt
Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe lie Glu Asn Lys Val 305 310 315 320 ccg gcc teg cag gtc tcc tcc ttt gac gtg ege ccc aac ggc age ggc
Pro Ala Ser Gin Val Ser Ser Phe Asp Val Arg Pro Asn Gly Ser Gly 325 330 335 ege acc gcc ate ttc gcc aac gcc ccc age ggc gcc cag etc aac ege
Arg Thr Ala lie Phe Ala Asn Ala Pro Ser Gly Ala Gin Leu Asn Arg 340 345 350 ege aeg gac cag ggc cag tac etc gac gcc gtc gac att gtc tcc ggc
Arg Thr Asp Gin Gly Gin Tyr Leu Asp Ala Val Asp lie Val Ser Gly 355 360 365 age ggc aag aag age etc ggc tac gcc cac ggt tcc aag aeg gtc aac
Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr Val Asn 370 375 380 r「g 叩r gar tgg nr ttr trg tgr ttt tgg ttt gac teg gtc atg
Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser Val Met 385 390 395 400 ccc gga agt etc ggt gtc gag tcc atg ttc cag etc gtc gag gcc ate
Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gin Leu Val Glu Ala lie 405 410 415 gcc gcc cac gag gat etc get ggc aag cac ggc att gcc aac ccc acc
Ala Ala His Glu Asp Leu Ala Gly Lys His Gly lie Ala Asn Pro Thr 420 425 430 ttt gtg cac gcc ccg ggc aag ate age tgg aag tac ege ggc cag etc
Phe Val His Ala Pro Gly Lys lie Ser Trp Lys Tyr Arg Gly Gin Leu 435 440 445 aeg ccc aag age aag aag atg gac teg gag gtc cac ate gtg tcc gtg
Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His lie Val Ser Val 450 455 460 gac gcc cac gac ggc gtt gtc gac etc gtc gcc gac ggc ttc etc tgg
Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe Leu Trp 465 470 475 480 gcc gac age etc ege gtc tac teg gtg age aac att ege gtg ege ate
Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn lie Arg Val Arg lie 485 490 495
gcc tcc ggt Ala Ser Gly <210> 30 <211> 499 <212〉 PRT <213> 齒殖壺菌(Schizochytrium sp.) <400> 30
Lys Val Gin Pro Val Phe Ala Asn Gly Ala Ala Thr Val Gly Pro Glu 15 10 15
Ala Ser Lys Ala Ser Ser Gly Ala Ser Ala Ser Ala Ser Ala Ala Pro 20 25 30 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1497 297 200813222
Ala Lys Pro Ala Phe Ser Ala Asp Val Leu Ala Pro Lys Pro Val Ala 35 40 45
Leu Pro Glu His lie Leu Lys Gly Asp Ala Leu Ala Pro Lys Glu Met 50 55 60
Ser Trp His Pro Met Ala Arg lie Pro Gly Asn Pro Thr Pro Ser Phe 65 70 75 80
Ala Pro Ser Ala Tyr Lys Pro Arg Asn lie Ala Phe Thr Pro Phe Pro 85 90 95
Gly Asn Pro Asn Asp Asn Asp His Thr Pro Gly Lys Met Pro Leu Thr 100 105 110
Trp Phe Asn Met Ala Glu Phe Met Ala Gly Lys Val Ser Met Cys Leu 115 120 125
Gly Pro Glu Phe Ala Lys Phe Asp Asp Ser Asn Thr Ser Arg Ser Pro 130 135 140
Ala Trp Asp Leu Ala Leu Val Thr Arg Ala Val Ser Val Ser Asp Leu 145 150 155 160
Lys His Val Asn Tyr Arg Asn lie Asp Leu Asp Pro Ser Lys Gly Thr 165 170 175
Met Val Gly Glu Phe Asp Cys Pro Ala Asp Ala Trp Phe Tyr Lys Gly 180 185 190
Ala Cys Asn Asp Ala His Met Pro Tyr Ser lie Leu Met Glu lie Ala 195 200 205
Leu Gin Thr Ser Gly Val Leu Thr Ser Val Leu Lys Ala Pro Leu Thr 210 215 220
Met Glu Lys Asp Asp lie Leu Phe Arg Asn Leu Asp Ala Asn Ala Glu 225 230 235 240
Phe Val Arg Ala Asp Leu Asp Tyr Arg Gly Lys Thr lie Arg Asn Val 245 250 255
Thr Lys Cys Thr Gly Tyr Ser Met Leu Gly Glu Met Gly Val His Arg 260 265 270
Phe Thr Phe Glu Leu Tyr Val Asp Asp Val Leu Phe Tyr Lys Gly Ser 275 280 285
Thr Ser Phe Gly Trp Phe Val Pro Glu Val Phe Ala Ala Gin Ala Gly 290 295 300
Leu Asp Asn Gly Arg Lys Ser Glu Pro Trp Phe lie Glu Asn Lys Val 305 310 315 320
Pro Ala Ser Gin Val Ser Ser Phe Asp Val Arg Pro Asn Gly Ser Gly 325 330 335 298 200813222
Arg Thr Ala lie Phe Ala Asn Ala Pro Ser Gly Ala Gin Leu Asn Arg 340 345 350
Arg Thr Asp Gin Gly Gin Tyr Leu Asp Ala Val Asp lie Val Ser Gly 355 360 365
Ser Gly Lys Lys Ser Leu Gly Tyr Ala His Gly Ser Lys Thr Val Asn 370 375 380
Pro Asn Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp Ser Val Met 385 390 395 400
Pro Gly Ser Leu Gly Val Glu Ser Met Phe Gin Leu Val Glu Ala lie 405 410 415
Ala Ala His Glu Asp Leu Ala Gly Lys His Gly lie Ala Asn Pro Thr 420 425 430
Phe Val His Ala Pro Gly Lys lie Ser Trp Lys Tyr Arg Gly Gin Leu 435 440 445
Thr Pro Lys Ser Lys Lys Met Asp Ser Glu Val His lie Val Ser Val 450 455 460
Asp Ala His Asp Gly Val Val Asp Leu Val Ala Asp Gly Phe Leu Trp 465 470 475 480
Ala Asp Ser Leu Arg Val Tyr Ser Val Ser Asn lie Arg Val Arg lie 485 490 495
Ala Ser Gly
<210〉 31 <211> 1512 <212> DNA <213〉裂殖壺菌(Schizochytrium sp.) <220> <221> CDS <222> (1)..(1512) <400> 31 gcc ccg etc tac etc teg cag gac ccg acc age ggc cag etc aag aag 48
Ala Pro Leu Tyr Leu Ser Gin Asp Pro Thr Ser Gly Gin Leu Lys Lys 15 10 15 cac acc gac gtg gcc tcc ggc cag gcc acc ate gtg cag ccc tgc aeg 96
His Thr Asp Val Ala Ser Gly Gin Ala Thr lie Val Gin Pro Cys Thr 20 25 30 etc ggc gac etc ggt gac ege tcc ttc atg gag acc tac ggc gtc gtc 144
Leu Gly Asp Leu Gly Asp Arg Ser Phe Met Glu Thr Tyr Gly Val Val 35 40 45 gcc ccg ctg tac aeg ggc gcc atg gcc aag ggc att gcc teg geg gac 192
Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala Ser Ala Asp 50 55 60 etc gtc ate gcc gcc ggc aag ege aag ate etc ggc tcc ttt ggc gcc 240
Leu Val lie Ala Ala Gly Lys Arg Lys lie Leu Gly Ser Phe Gly Ala 65 70 75 80 299 288 200813222 ggc ggc etc ccc atg cac cac gtg ege gee gee etc gag aag ate cag
Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys lie Gin 85 90 95 gee gee ctg cct cag ggc ccc tac gee gtc aac etc ate cac teg cct
Ala Ala Leu Pro Gin Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro 100 105 110 ttt gac age aac etc gag aag ggc aac gtc gat etc ttc etc gag aag
Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys 115 120 125 ggc gtc act gtg gtg gag gee teg gca ttc atg acc etc acc ccg cag
Gly Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gin 130 135 140 gtc gtg ege tac ege gee gee ggc etc teg ege aac gee gac ggt teg
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser 145 150 155 160 gtc aac ate ege aac ege ate ate ggc aag gtc teg ege acc gag etc
Val Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu 165 170 175 gee gag atg ttc ate ege ccg gee ccg gag cac etc etc gag aag etc
Ala Glu Met Phe lie Arg Pro Ala Pro Glu His Leu Leu Glu Lys Leu 180 185 190 ate gee teg ggc gag ate acc cag gag cag gee gag etc geg ege ege lie Ala Ser Gly Glu lie Thr Gin Glu Gin Ala Glu Leu Ala Arg Arg 195 200 205 gtt ccc gtc gee gac gat ate get gtc gag get gac teg ggc ggc cac
Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser Gly Gly His 210 215 220 acc gac aac ege ccc ate cac gtc ate etc ccg etc ate ate aac etc
Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu lie lie Asn Leu 225 230 235 240 ege aac ege ctg cac ege gag tgc ggc tac ccc geg cac etc ege gtc
Arg Asn Arg Leu His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val 245 250 255 ege gtt ggc gee ggc ggt ggc gtc ggc tgc ccg cag gee gee gee gee Arg Val Gly Ala Gly Gly Gly Val Gly Cys Pro Gin Ala Ala Ala Ala 260 265 270 geg etc acc atg ggc gee gee ttc ate gtc acc ggc act gtc aac cag Ala Leu Thr Met Gly Ala Ala Phe lie Val Thr Gly Thr Val Asn Gin 275 280 285 gtc gee aag cag tee ggc acc tgc gac aac gtg ege aag cag etc teg Val Ala Lys Gin Ser Gly Thr Cys Asp Asn Val Arg Lys Gin Leu Ser 290 295 300 cag gee acc tac teg gat ate tgc atg gee ccg gee gee gac atg ttc
Gin Ala Thr Tyr Ser Asp lie Cys Met Ala Pro Ala Ala Asp Met Phe 305 310 315 320 gag gag ggc gtc aag etc cag gtc etc aag aag gga acc atg ttc ccc
Glu Glu Gly Val Lys Leu Gin Val Leu Lys Lys Gly Thr Met Phe Pro 325 330 335 teg ege gee aac aag etc tac gag etc ttt tgc aag tac gac tee ttc
Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe 340 345 350 gac tee atg cct cct gee gag etc gag ege ate gag aag cgt ate ttc
Asp Ser Met Pro Pro Ala Glu Leu Glu Arg lie Glu Lys Arg lie Phe 355 360 365 aag ege gca etc cag gag gtc tgg gag gag acc aag gac ttt tac att Lys Arg Ala Leu Gin Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr lie 336 384 432 480 528 576 624 672 720 768 816 864 912 960 1008 1056 1104 300 1152 1200 200813222 370 375 380 aac ggt etc aag aac ccg gag aag ate cag ege gee gag cac gac ccc Asn Gly Leu Lys Asn Pro Glu Lys lie Gin Arg Ala Glu His Asp Pro 385 390 395 400 aag Lys 1248 1296 1344 1392 1440 1488 1512 etc aag atg teg etc tgc ttc ege tgg tac ett ggt ett gee age Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala Ser 405 410 415 ege tgg gee aac atg ggc gee ccg gac ege gtc atg gac tac cag gtc
Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr Gin Val 420 425 430 tgg tgt ggc ccg gee att ggc gee ttc aac gac ttc ate aag ggc acc
Trp Cys Gly Pro Ala lie Gly Ala Phe Asn Asp Phe lie Lys Gly Thr 435 440 445 tac etc gac ccc get gtc tee aac gag tac ccc tgt gtc gtc cag ate
Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys Val Val Gin lie 450 455 460 aac ctg caa ate etc cgt ggt gee tgc tac ctg ege cgt etc aac gee
Asn Leu Gin lie Leu Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala 465 470 475 480 ctg ege aac gac ccg ege att gac etc gag acc gag gat get gee ttt
Lpii Αγρ A.^n A.^n Pro Arg Tie Asp Leu Glu Thr Glu Asp Ala Ala Phe ^ 485 490 495 gtc tac gag ccc acc aac geg etc
Val Tyr Glu Pro Thr Asn Ala Leu 500
<210> 32 <211> 504 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400〉 32
Ala Pro Leu Tyr Leu Ser Gin Asp Pro Thr Ser Gly Gin Leu Lys Lys 15 10 15
His Thr Asp Val Ala Ser Gly Gin Ala Thr lie Val Gin Pro Cys Thr 20 25 30
Leu Gly Asp Leu Gly Asp Arg Ser Phe Met Glu Thr Tyr Gly Val Val 35 40 45
Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala Ser Ala Asp 50 55 60
Leu Val lie Ala Ala Gly Lys Arg Lys lie Leu Gly Ser Phe Gly Ala 65 70 75 80
Gly Gly Leu Pro Met His His Val Arg Ala Ala Leu Glu Lys lie Gin 85 90 95
Ala Ala Leu Pro Gin Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro 100 105 110
Phe Asp Ser Asn Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Lys 115 120 125
Gly Val Thr Val Val Glu Ala Ser Ala Phe Met Thr Leu Thr Pro Gin 301 200813222 130 135 140
Val Val Arg Tyr Arg Ala Ala Gly Leu Ser Arg Asn Ala Asp Gly Ser 145 150 155 160
Val Asn lie Arg Asn Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu 165 170 175
Ala Glu Met Phe lie Arg Pro Ala Pro Glu His Leu Leu Glu Lys Leu 180 185 190 lie Ala Ser Gly Glu lie Thr Gin Glu Gin Ala Glu Leu Ala Arg Arg 195 200 205
Val Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser Gly Gly His 210 215 220
Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu lie lie Asn Leu 225 230 235 240
Arg Asn Arg Leu His Arg Glu Cys Gly Tyr Pro Ala His Leu Arg Val 245 250 255
Arg Val Gly Ala Gly Gly Gly Val Gly Cys Pro Gin Ala Ala Ala Ala 260 265 270
Ala Leu Thr Met Gly Ala Ala Phe lie Val Thr Gly Thr Val Asn Gin 275 280 285
Val Ala Lys Gin Ser Gly Thr Cys Asp Asn Val Arg Lys Gin Leu Ser 290 295 300
Gin Ala Thr Tyr Ser Asp lie Cys Met Ala Pro Ala Ala Asp Met Phe 305 310 315 320
Glu Glu Gly Val Lys Leu Gin Val Leu Lys Lys Gly Thr Met Phe Pro 325 330 335
Ser Arg Ala Asn Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe 340 345 350
Asp Ser Met Pro Pro Ala Glu Leu Glu Arg lie Glu Lys Arg lie Phe 355 360 365
Lys Arg Ala Leu Gin Glu Val Trp Glu Glu Thr Lys Asp Phe Tyr lie 370 375 380
Asn Gly Leu Lys Asn Pro Glu Lys lie Gin Arg Ala Glu His Asp Pro 385 390 395 400
Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ala Ser 405 410 415
Arg Trp Ala Asn Met Gly Ala Pro Asp Arg Val Met Asp Tyr Gin Val 420 425 430 302 200813222
Trp Cys Gly Pro Ala lie Gly Ala Phe Asn Asp Phe lie Lys Gly Thr 435 440 445
Tyr Leu Asp Pro Ala Val Ser Asn Glu Tyr Pro Cys Val Val Gin lie 450 455 460
Asn Leu Gin lie Leu Arg Gly Ala Cys Tyr Leu Arg Arg Leu Asn Ala 465 470 475 480
Leu Arg Asn Asp Pro Arg lie Asp Leu Glu Thr Glu Asp Ala Ala Phe 485 490 495
Val Tyr Glu Pro Thr Asn Ala Leu 500 <210> 33 <211> 714 <212〉 DNA <213〉 Nostoc sp. <400〉 33 60 120 180 240 300 360 420 480 540 600 660 714 atgttgcagc atacttggct accaaaaccc ccaaatttaa ccttattgtc agatgaagtt catctctggc gcattcccct tgaccaacca gaatcacagc tacaggattt agccgctacc ttatctagtg acgaattagc ccgtgcaaac agattttatt ttcccgaaca tcgccggcgt tttactgctg gtcgtggtat tctccgcagt atcttggggg gctatttggg tgtggaacca gggcaagtta aatttgatta tgaatcccgt ggtaaaccaa tattaggcga tcgctttgcc gagagtggtt tattatttaa cttgtcacac tcccagaact tggccttgtg tgcagtcaat tacacgcgcc aaatcggcat cgatttagaa tatctccgcc ccacatctga tttagaatcc cttgccaaaa ggttcttttt accgcgagaa tatgaattat tgcgatcgct acccgatgag caaaaacaaa aaattttctt tcgttactgg acttgtaaag aggcttatct taaagcaacg ggtgacggca tcgctaaatt agaggaaatt gaaatagcac taactcccac agaaccagct aagttacaga cagctccagc gtggagtctc ctagagctag tgccagatga taattgtgtt gctgctgttg ccgtggcggg ttttggctgg cagccaaaat tctggcatta ttga
<210> 34 <211〉 237 <212> PRT <213> 念珠藻(Nostoc. sp) <400> 34
Met Leu Gin His Thr Trp Leu Pro Lys Pro Pro Asn Leu Thr Leu Leu 15 10 15
Ser Asp Glu Val His Leu Trp Arg lie Pro Leu Asp Gin Pro Glu Ser 20 25 30
Gin Leu Gin Asp Leu Ala Ala Thr Leu Ser Ser Asp Glu Leu Ala Arg 35 40 45
Ala Asn Arg Phe Tyr Phe Pro Glu His Arg Arg Arg Phe Thr Ala Gly 50 55 60
Arg Gly lie Leu Arg Ser lie Leu Gly Gly Tyr Leu Gly Val Glu Pro 303 200813222 65 70 75 80
Gly Gin Val Lys Phe Asp Tyr Glu Ser Arg Gly Lys Pro lie Leu Gly 85 90 95
Asp Arg Phe Ala Glu Ser Gly Leu Leu Phe Asn Leu Ser His Ser Gin 100 105 110
Asn Leu Ala Leu Cys Ala Val Asn Tyr Thr Arg Gin lie Gly lie Asp 115 120 125
Leu Glu Tyr Leu Arg Pro Thr Ser Asp Leu Glu Ser Leu Ala Lys Arg 130 135 140
Phe Phe Leu Pro Arg Glu Tyr Glu Leu Leu Arg Ser Leu Pro Asp Glu 145 150 155 160
Gin Lys Gin Lys lie Phe Phe Arg Tyr Trp Thr Cys Lys Glu Ala Tyr 165 170 175
Leu Lys Ala Thr Gly Asp Gly lie Ala Lys Leu Glu Glu lie Glu lie 180 185 190
Ala Leu Thr Pro Thr Glu Pro Ala Lys Leu Gin Thr Ala Pro Ala Trp 195 200 205
Ser Leu Leu Glu Leu Val Pro Asp Asp Asn Cys Val Ala Ala Val Ala 210 215 220
Val Ala Gly Phe Gly Trp Gin Pro Lys Phe Trp His Tyr 225 230 235 <210> 35 <211> 8733 <212> DNA <213>人造 <220> <223>合成 <400> 35 atggctgcta ggttgcaaga acaaaaaggt ggtgagatgg atactagaat tgctatcatt 60 ggaatgtctg ctattttgcc atgtggtact actgttagag aatcttggga aactattaga 120 gctggtattg attgtttgtc tgatttgcct gaagatagag ttgatgttac tgcttacttt 180 gatccagtta aaactactaa agataaaatc tattgtaaga gaggtggttt cattccagaa 240 tatgattttg atgctagaga atttggtttg aatatgtttc agatggaaga ttctgatgct 300 aatcaaacta tttctttgtt gaaagttaaa gaagcattgc aagatgctgg catcgatgct 360 ttgggtaaag agaagaagaa tattggttgt gttttgggta ttggtggtgg tcaaaaatct 420 tctcatgaat tttactcaag attgaattat gttgttgttg agaaggtatt gagaaaaatg 480 ggtatgccag aagaagatgt taaagttgct gttgaaaaat acaaagctaa ttttccagag 540 tggagattgg attcttttcc aggtttcttg ggaaatgtta ctgcaggaag atgtactaat 600 acttttaatc ttgatggcat gaattgtgtt gttgatgctg cttgtgcttc ttctttgatt 660 gctgttaaag ttgctattga tgaattgttg tacggtgatt gtgatatgat ggttactggt 720 304 200813222 gctacttgta tctactgatc ggttctgcta catgctgtta ccaactattt ccagctactg gaattgactg gttgctgttg ggaatgatta gataatccac actatgaata tttggttttg actgcttata get i t gcaM gaaactgtta cctggtagta gcttgttcta tggagattgc gttgctgctt atgaattgge gctggttctg gagagagaac actttggctt tttgctgctg agagatgaat ccagctactc gttcaagctg ggttctgttg gttccattgg tttaaagatg tctaatgttt aettettetg tttgttgaat gatccatctg ttgagagatg tgggatgctc ttgtctgctg ctgataattc catctgttag tgttggtttt ttagaggttg ctggtcaaga ttactttggt ctttgagaaa gttctattaa aagttatcat caaacttgta gaccttggtt gtggtgctaa ggttgaacaa rt 11 at ert ^ ~ ~ Q ~ w 〇 --- aaaatactgc ttccagctac etttgagage caagagaagg tgttttctgg cacaattcag ataaagattt cagagcaaga gtgctttggg gtcattcttt tgtttgaatt caaaaggttg ctaatgtttg aaggtattca cttgtgaatc ttatctctaa ctggtgaaac ttaaattttt tcggtccaaa ttgttactgt ctgctgttca cagatgctac etaettatgt tattggaatg agettatgat gaaaagatat tgettettet agaageattg tgaaggtcat tttgtttgat atettetatt ggctttgaaa cgataatact tccaccacca ttatcatgct aagaccacaa ?.gct c?.at tg ttatattaaa taatgetagg tatttgtgct tgtttctttt tcaaggtgct acaatctatt tgaaagagtt tcataagaag tgcttttgaa gggtgaattt ggtttgtaga catggctgct gttaggaaat agetgaatet tgcttttcat agtttctttt ttatccaact gactcaagtt acaagttttg ttctgttaat attggttgtt tagaatgcaa ttctgataaa tacatggctt gaaaaaacta gctgatgctg tctgatggta agaagagett ggtactggta aaagcatatg ggtcatttga cataaaactt ccaattaacg ggtgttccaa gttttggaag ccagttttga aaagaat t tg tgtgttaaat ttgggtttct caatttgcta agagetaaag caatatactc gctgctatgg tctcaagttt atttctttga atttttaaag gctgctttgt agagetagaa gttattggtc tctaattctc gctaggttgc tctccacaga agaactccaa gatgetagag agaaatatgc tctaaattgg ccagcttctg gctggtgtta gctattaaaa actaagaaag tttctaaaac aaggaatgtt ttagagatgg aagctgctgg ataatagage ctccagttgg gtgaaggtaa aagctgttgc tgccaggaac aatcttcttt gaagagctgg aagctgaacc tgatggctgc aagctgct ?.t ttggtgaaca tggttaaaga aagatgttac gtattgctac atatgttttc atgetgetea tgtatccaag ctgcttattc aagctggttt acgctgctgg ttatgggtgg caaatgctga catctcaaac aaaaagaagg tggaaaatgc aagctgaaac aaatgttgac atcaagctgg tttctgaaac gtactgattc atttgcaagg aaaaaagaac ttagagatgc tccagttttc gattggtgaa tgatgaaatt tatctatact ttgtgttgat tgatagaatt tactgaaaaa tggtttggct tattaatgtt gtacattaat tatttettet agaacatact tactccagct t aaagaaaac attcaaattc tgctgaagat taaagaagca taatggtgct tgaagttgct atctaaagtt aaaaccatac tcaaccatct tactccagat ttgtgttgat taaagatgct aaatattaaa tgttattact ttttagagtt ttcttctgct taaattgttt tcaacatatg tgetagaatt tttgaaagat tgatattcaa ttttgataaa taetttgaga tgctatgaat 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 305 200813222 gatggtagat gtgttactta cttgaaaggt gctgctccat tgattaaagc tccagaacca gttgttgatg aagctgctaa aagagaagct gaaagattgc aaaaagaatt gcaagatgct caaagacaat tggatgatgc taaaagagct gctgctgaag ctaattctaa attggctgct gctaaagaag aagctaaaac tgctgctgct tctgctaaac cagctgttga tactgctgtt gttgaaaaac atagagctat tttgaaatct atgttggctg aattggatgg ttatggttct gttgatgctt cttctttgca acaacaacaa caacaacaaa ctgctccagc tccagttaaa gctgctgctc cagctgctcc agttgcttct gctccagcac ccgcagttag caacgaactc ttagaaaaag ccgagacagt agtgatggaa gttcttgcag ctaaaacggg gtacgaaaca gatatgattg aagcagatat ggaacttgaa actgaactgg gcattgattc gattaaacgc gtggaaattc tgtcagaagt gcaagctatg ttaaatgttg aagcgaaaga tgttgatgca ctgtcacgca cacgcaccgt gggcgaagta gtgaacgcca tgaaagcaga aattgcaggc tcctcagcac ccgcgccggc cgcagcagca ccagcccccg caaaagccgc ccccgcagcg gcggctccag ccgtttcaaa cgaattactc gaaaaagcag aaaccgtagt gatggaagtc cttgccgcca aaacgggtta tgagaccgat atgatcgaaa gcgatatgga attagaaacc gaattaggga ttgatagtat taaacgcgta gaaattctgt ccgaagtaca agctatgctg aatgtagaag caaaagatgt agatgcgtta agccgcacac gcactgttgg tgaagttgtg aatgctatga aagctgaaat tgcaggaggt tcagcaccgg ccccagcagc cgcagcccca ggtccagcag cagccgcacc ggcccccgcc gccgccgcac cggcagtatc aaacgagttg ttagagaaag cggaaaccgt tgtgatggaa gtacttgccg cgaagacagg ttacgagacc gatatgatcg aaagtgacat ggaattagaa accgaattgg gcattgatag cattaaacgc gtagaaattt tatccgaagt tcaagccatg ttaaatgttg aagccaaaga tgtggatgcg ttatcccgca cgcgtaccgt cggagaagta gtggacgcta tgaaagcaga gattgcagga ggaagtgcac cggctccagc ageageagea cccgccccag cggcagcggc gccggcaccg gccgctccgg ccccagccgt tagttcagaa ctcctcgaaa aagcagaaac tgttgtcatg gaagtattag ctgcaaaaac aggttacgag aeggatatga ttgaaagcga tatggaatta gaaaccgaat taggeattga ttcaattaaa cgtgttgaaa tcttaagtga agtccaagcc atgettaatg ttgaagccaa agatgtagat gcattatctc gcacgcgtac agtgggtgaa gttgtcgatg egatgaaage agaaatcgcg ggaggatcag cgccagcccc ggeageagea gcccccgcgc ccgccgcggc cgcacctgcg ccggccgccc cagcccctgc agcaccggcc ccagcagtgt egteggaatt actcgaaaaa gctgaaacgg tcgttatgga agtaettget gcaaagacgg gctatgaaac ggatatgatt gaateggata tggaattaga aacagaactt ggtattgact ctattaaacg cgtggaaatt ctgagcgaag tacaggcaat gttaaacgta gaagccaaag atgtagaege tttgtcacgc acacggacgg taggagaagt tgtggatgcg atgaaagctg aaattgeegg ttcaagtgct agcgcccctg ctgccgccgc ccctgcccct gccgccgcag caccggcccc ggcagccgca gctccagcag ttagtaaega attactcgaa aaagcagaaa cggtggtcat ggaagtgtta gcagcaaaaa ctggatatga aacggacatg attgaaagcg atatggaatt agaaacagaa ctgggaattg atagtattaa acgtgttgag attttatctg aggttcaagc tatgctgaat gttgaagega aagatgtaga cgcactgtct 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 306 200813222 cggacccgca gctccggccc gaattactcg gaaacggata aaacgtgtcg gatgccctgt gcaggcagta gcgccagccg gttatggaag gaattagaaa caagctatgt ggagaagtcg gcagcagccc gctgaaarrg gaatcagata ttatcggagg actcgtactg cctgccccgg tctgttcatg agaagaccag gatggttctg acttttgaag gctaaagatt ggtgctttgg ggttttactt ggtagaccag ggaacttctg attggtttgg atgcatccag attagagaag gaaactggaa gctagaggaa tatattttgt actgatgaaa ggtgaaggtc gctagagaag tcttcttgtg cagtaggtga cggcggcagc agaaagcaga tgattgaaag aaatcttatc cacgtacccg gcgccccggc cagctgctcc tgctcgccgc ccgaactggg tgaatgtaga tagacgccat cageaccage t cgtr.atgga tggaactcga tacaagcaat ttggtgaggt ccgccgccgc gtgctgattg atgaattgat aattgacttt gtttgcaatt tgtctgctga gtggttttat tgatgtgtgc ctttcattgg atgctttgaa aatggtctga aagatgctgc ttggtattgg atccacaaag ttactccatt tgggtaggtc aagctgttca caaaaccaac ttaggtcttc atgttaattc agtggtggac cgcacccgcg aactgtagtg cgatatggaa ggaagtccaa taccgtaggt accagccgcc agctgtatct taaaacagga tattgatagt agccaaagat gaaagcagag ggccgccgct agtgrtggrt aaccgaactg gttaaatgtg cgtggatgcg acccgcgtct tgatgatttg tttggaaaga ggctttggtt ggctcaaaga atctgctgaa ctctcaacaa taaatttgct tgttgctagg aagagctcaa atctgatgtt tgttgctatt tgctaatcaa acaaattgct gtgeattaga taaagtttct aaaagctgct tccaagagct tattgetget tgctgctgat gegatgaaag cccgcggccg atggaagtgt ctggaaaccg gcaatgctga gaagttgtag gccgcccccg agtgagctgc tatgaaaccg attaagegtg gtagaegett attgeaggeg cctgcagtgt graaaaartg gggattgata gaagcaaaag atgaaagcag gccggtgctg tctttgatgc ccagaaaata agagttttgg gctggtgctg aaagetatta gctgaaagat aaageatett ttggatggta agaggtgcta ttctcaagag gttagagaaa caaagatgta aaagatgatg gaaattacta gcttctgaac actcaagaat gttactaaat attgaageat gttgctaaag cagaaatcgc cagccccagc tagccgcaaa aactgggcat aegtagagge atgccatgaa cgccggcagc tcgaaaaagc atatgattga ttgaaatttt taagteggae gaagtgcacc caaacgaact gcattaaacg atgtggatgc aaattgctgg cccccgctgt atgctaaagt gaccagtttt gtgcttgtgc ctgctattag aagaagctga ttgaaccagc tgtgcactgc ggttgggttt tttttggttt gtgttgatat tggcttgtgc etattagage ttttgttggt gacaaattgc cagcttggtg tgaaaagagc tggttggttc tgggtggaaa ctgttagaga aggtggaagt agttagcaac aacgggttat tgattetatt aaaggatgtt agctgaaatc cgccgcaccc agaaaccgtg aagcgatatg gtcagaagtt gcgtactgtt ggccccggca tctggaaaaa agaratgatt tgtggaaatt actgagccgt agggagtgcg caaaattgat tgttgatatt ggttgttgat tgttgttttg acatgttttg acaaagattt tgaaattttg tgttgctggt tacttctcaa gtgcaagact tgctcaaggt tgatattaga tgctaaattg ttctggtggt tggtggaaag tgctggtatt tttttctgct tgttttgggt agetatetat tgctgaatct 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 mm 6120 6180 6240 6300 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 307 200813222 caattgggtg ctagagtttc tggtattgtt catgcttctg gtgttttgag agataggttg attgaaaaaa aattgccaga tgaatttgat gctgtttttg gtactaaagt tactggtttg gaaaatttgt tggctgctgt tgatagagct aatttgaaac atatggtttt gttttcttct ttggctggtt ttcatggtaa tgttggtcaa tctgattatg ctatggctaa cgaagcattg aacaaaatgg gtttggaatt ggctaaagat gtttctgtta aatctatttg ttttggtcct tgggatggtg gtatggttac tccacaattg aaaaaacaat ttcaagaaat gggtgttcaa attattccaa gagaaggtgg tgetgatact gttgctagaa ttgttttggg ttcttctcca gctgaaattt tggttggtaa ttggagaact ccatctaaaa aagttggttc tgatactatt actttgcaca gaaaaatttc tgctaaatct aatccatttt tggaagatca tgtcattcaa ggtagaagag ttttgccaat gactttggct attggttctt tggctgaaac ttgtttgggt ttgtttcctg gatattettt gtgggctatt gatgatgctc aattgtttaa aggtgttact gttgatggtg atgttaattg tgaagttact ttgactccat ctactgctcc ttctggtaga gttaatgttc aagctacttt gaaaactttt tcttctggta aattggttcc agettataga gctgttattg ttttgtctaa tcaaggtgct ccaccagcta atgctactat gcaaccacca tctttggatg ctgatccagc tttgcaaggt tctgtttatg atggaaagac tttgtttcat ggtccagctt ttagaggtat tgatgatgtt ttgtcttgta etaaatetea attggttgct aaatgttctg ctgttccagg ttctgatgct gctagaggtg aatttgctac tgatactgat gctcatgatc catttgttaa tgatttggct tttcaagcta tgttggtttg ggttagaaga actttgggtc aagctgcttt gccaaattct attcaaagaa ttgttcaaca cagaccagtt ccacaagata aaccatttta tattactttg agatetaate aatctggtgg tcattctcaa cataaacatg ctttgcaatt teataaegaa caaggtgatt tgttcattga tgttcaagca tctgttattg ctactgattc tttggctttt taa <210> 36 <211> 6180 <212〉 DNA <213>人造 <220〉 <223>合成 <400> 36 atggctgcta gaaatgtttc tgctgctcat gaaatgcatg atgaaaaaag aattgctgtt gttggtatgg ctgttcaata tgctggttgt aagactaaag atgaattttg ggaagttttg atgaatggta aagttgaatc taaagttatc tctgataaaa gattgggttc taattaccga gctgaacatt acaaggctga aagatccaaa taegetgata ctttttgtaa egaaaettat ggtactttgg atgaaaacga aattgataac gaacatgaat tgttgttgaa tttggctaaa caagcattgg ctgaaacttc tgttaaagat tctactagat gtggtattgt ttctggttgt ttgtcttttc ctatggataa tttgcaaggt gaattgttga atgtetatea aaatcatgtt gagaagaaat tgggtgctag agtttttaaa gatgcttctc attggtctga aagagaacaa tctaacaaac cagaagctgg tgatagaaga attttcatgg acccagcttc ttttgttgct gaagaattga atttgggtgc tttgeattat tctgttgatg ctgcttgtgc tactgcttta tacgttttga gattggetea agatcatttg gtttctggtg ctgctgatgt tatgttgtgt 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 8280 8340 8400 8460 8520 8580 8640 8700 8733 60 120 180 240 300 360 420 480 540 600 308 660 720 200813222 ggtgctactt gtttgccaga accattcttt atcttgtctg gtttttctac ttttcaagct atgccagttg gtactggtca aaatgtttct atgccattgc ataaagattc tcaaggtttg actccaggtg aaggtggttc tatcatggtt ttgaaaagat tggatgatgc tattagagat ggtgatcata tctatggtac tttgttgggt gctaatgttt ctaattctgg cactggtttg ccattgaaac cattgttgcc atctgaaaaa aaatgtttga tggatactta tactagaatt aatgttcatc cacataaaat tcaatatgtt gaatgtcatg ctactggtac tccacaaggt gatagggttg aaattgatgc tgttaaagca tgttttgaag gaaaagttcc aagatttggt actactaaag gaaactttgg tcatactttg gttgctgctg gttttgctgg aatgtgcaaa gttttgttgt ctatgaaaca tggtatcatt ccaccaactc caggtattga tgatgaaact aagatggacc cattggttgt ttctggtgaa gctattcctt ggccagaaac taatggtgaa ccaaaaagag ctggtttgtc tgcttttggt tttggtggta ctaatgctca tgctgttttt gaagaacatg atccatctaa tgctgcttgt actggtcatg attctatttc tgctttgtct gctagatgtg gtggtgaatc taatatgaga attgctatta ctggtatgga tgctactttt crcrt crni 11 rro oorrrTt 11 rrrro t rrr t t 11 era a nt crrrt cm t r q t crort art ^ ^ w V ^ ^ ^ ‘ ^ ^ W ^ W W4. W ^ 〇〇 w w w w ^ ^ attccattgc cagaaaagag atggagattt ttgggcaaag ataaagattt cttggatttg tgtggtgtta aagctactcc acatggttgt tatattgaag atgttgaagt tgattttcaa agattgagaa ctccaatgac tccagaagat atgttgttgc cacaacaatt gttggctgtt actactattg atagagetat tttggattct ggtatgaaaa aaggtggtaa tgttgctgtt tttgttggtt tgggtaccga tttggaattg tacagacata gagetagagt tgctttgaaa gaaagagtta gaccagaagc atctaaaaaa ttgaatgata tgatgcagta cattaatgat tgtggcacct etaettetta taettettat attggtaatt tggttgctac tagagtttct tctcaatggg gttttactgg tccatctttt actattactg aagggaataa ctctgtttat agatgtgctg aattgggaaa gtatttgttg gaaactggtg aagttgatgg tgttgttgtt gctggtgttg atttgtgtgg ttctgctgaa aacttatacg ttaaatcaag aagattcaaa gtttctactt ctgatactcc aagagettet tttgatgctg ctgctgatgg ttactttgtt ggtgaaggtt gtggtgcttt tgttttgaaa agagaaaett cttgtactaa agatgataga atetatgett gcatggatgc tattgttcca ggtaatgttc catctgcttg tttgagagaa gcattggatc aagctagagt taaaccaggt gatattgaaa tgttggaatt gtctgctgat tetgetagae atttgaaaga tccatctgtt ttgccaaaag aattgactgc tgaagaagaa attggtggtt tgcaaactat tttgagagat gatgataaat tgccaagaaa tgttgctact ggttctgtta aagctactgt tggtgatact ggttatgctt ctggtgctgc ttctttgatt aaagctgctt tgtgcatcta taataggtat ttgccatcta atggtgatga ttgggatgaa ccagctccag aagctccttg ggattctact ttgtttgctt gtcaaacttc aagagcttgg ttgaaaaatc ctggagagag aagatatget gctgtttctg gtgtttctga aactaggtct tgttattctg ttttgttgtc tgaagctgaa ggtcattatg aaagagaaaa tagaatttet ttggatgaag aagctccaaa attgattgtt ttgagagctg attctcatga agaaattttg ggtaggttgg ataaaattag agaaagattt ttgcaaccaa ctggtgctgc tccaagagaa 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 309 200813222 tctgaattga aagctcaagc tagaagaatt ttcttggaat tgttgggtga aactttggct caagatgctg cttcttctgg ttctcaaaaa ccattggctt tgtctttggt ttctactcca tctaaattgc aaagagaagt tgaattggct gctaaaggta ttccaagatg tttgaaaatg agaagagatt ggtcttctcc agctggttca agatatgctc cagaaccatt ggcttctgat agagttgctt tcatgtacgg tgaaggaagg tctccatact atggaatcac tcaagatatt catagaattt ggccagaatt gcatgaagtt attaacgaaa aaactaatag gttgtgggct gaaggtgata gatgggttat gccaagagct tcttttaaat ctgaattgga atctcaacaa caagaatttg atagaaatat gattgaaatg tttaggttgg gtattttgac ttctattgct tttactaatt tggctagaga tgttttgaat attactccaa aagctgcttt tggtttgtct ttgggtgaaa tttctatgat ttttgctttt tctaaaaaaa atggtttgat ttctgatcaa ttgactaaag atttgagaga atctgatgtt tggaacaaag cattggctgt tgaattcaat gctttgagag aagcatgggg tattccacaa tctgttccaa aagatgaatt ttggcaaggt tatattgtta gaggtactaa acaagatatt gaagctgcta ttgctccaga ttccaaatac gttaggttga ctatcattaa tgatgctaat actgctttga tttctggtaa accagatgct tgtaaagctg ctattgctag gttgggtggt aatattccag ctttgccagt tactcaagga atgtgtggtc attgtccaga agttggtcca tatactaaag atattgctaa aattcatgct aatttggaat ttccagttgt tgatggtttg gatttgtgga ctactattaa tcaaaaaaga ttggttccaa gagctactgg tgctaaagat gaatgggctc catcttcttt tggtgaatat gctggtcaac tttacgaaaa acaagctaat tttccacaaa ttgttgaaac tatctacaaa caaaattatg atgtttttgt tgaggttggt ccaaacaacc ataggtctac tgctgttaga actactttgg gtccacaaag aaatcatttg gctggtgcta ttgataaaca aaacgaagat gcttggacta ctattgttaa attggttgct tctttgaaag ctcatttggt tccaggtgtt actatttctc cattgtatca ttctaaattg gttgctgaag ctgaagcatg ttatgctgct ctgtgcaaag gagaaaaacc taagaagaac aaatttgtta gaaaaattca attgaatggt aggttcaatt ctaaagctga tccaatttct tctgctgatt tggcttcttt tccaccagct gatccagcta ttgaagctgc tatttcttca agaattatga aaccagttgc tccaaaattt tatgctaggt tgaatattga tgaacaagac gaaacaagag atccaatttt gaacaaagat aatgctccat ctagttcatc tagttcctct tcatctagtt cttcatctag ttctccatct ccagctcctt ctgctccagt tcaaaaaaaa gctgctccag ctgctgaaac taaagctgtt gcttctgctg atgctttgag atctgctttg ttggatttgg attctatgtt ggctttgtct tctgcttctg cttctggtaa tttggttgaa actgctccat ctgatgcttc tgttattgtt ccaccatgta atattgctga tttgggttca agagctttta tgaaaactta tggtgtttct gctccattgt acactggtgc tatggctaaa ggtattgctt ctgctgattt ggttattgct gctggtagac aaggcatttt ggcttctttt ggtgctggtg gtttgccaat gcaagttgtt agagaatcta ttgaaaaaat tcaagctgct ttgccaaatg gtccatatgc tgttaatttg attcattctc catttgattc taatttggaa aaaggtaatg ttgatttgtt tttggaaaaa ggtgttactt ttgttgaagc atctgctttt atgactttga ctccacaagt tgttaggtac agagctgctg gtttgactag aaatgctgat ggttctgtta atattagaaa tagaattatc 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 310 200813222 ggaaaggt11 caagaactga attggctgaa atgtttatga gacctgcccc agaacacttg ttgcaaaaat tgattgcttc tggtgaaatt aatcaagaac aagctgaatt ggctagaaga gttccagttg ctgatgatat tgctgttgaa gctgattctg gtggtcatac tgataataga ccaattcatg ttatcttgcc attgattatt aatttgagag acagattgca tagagaatgt ggttatccag ctaatttgag agttagagtt ggtgctggtg gtggtattgg ttgtccacaa gctgctttgg ctacttttaa tatgggtgct tctttcattg ttactggcac tgttaatcaa gttgctaaac aatctggtac ttgtgataat gttagaaaac aattggctaa agctacttat tctgatgttt gcatggctcc agctgctgat atgtttgaag aaggtgttaa attgcaagtt ttgaagaaag ggacaatgtt tccatcaaga gctaataagt tatacgaatt gttttgcaag tatgattctt ttgaatctat gccaccagct gaattggcta gagttgaaaa aagaattttc tcaagagctt tggaagaagt ttgggatgaa actaaaaatt tttacattaa taggttgcac aatccagaaa aaattcaaag agctgaaaga gatccaaaat tgaaaatgtc tttgtgtttt agatggtatt tgtctttggc ttcaagatgg gctaatactg gtgcttctga tagagttatg rrof fof oonrr f f f rxrrf rrf rxrr f 〇 rO rrr* f o f t t f t q o t rrQ f t t t t Q q Q (ΤΟΤ* Ci P Γ' gCiU LCIUV-/CIC4^ L U C U CA C U ^ w w ^ C%. w tacttggacc cagctgttgc taacgaatat ccatgcgttg ttcaaattaa caaacaaatt ttgagaggtg cttgtttcct cagaagattg gaaattttga gaaatgctag gttgtctgat ggtgctgctg ctttggttgc ttctattgat gatacttatg ttccagctga aaaattgtaa <210> 37 <211> 6180 <212> DNA <213〉人造 <220〉 <223>合成 <400〉 37 atggccgctc gcaacgtgtc tgcagcgcat gagatgcacg atgaaaagcg catcgccgtc gtcggcatgg ccgtccagta cgccggatgc aaaaccaagg acgagttctg ggaggtgctc atgaacggca aggtcgagtc caaggtgatc agcgacaaac gactcggctc caactaccgc gccgagcact acaaagcaga gcgcagcaag tatgccgaca ccttttgcaa cgaaacgtac ggcacccttg acgagaacga gatcgacaac gagcacgaac tcctcctcaa cctcgccaag caggcactcg cagagacatc cgtcaaagac tcgacacgct gcggcatcgt cagcggctgc ctctcgttcc ccatggacaa cctccagggt gaactcctca acgtgtacca aaaccatgtc gagaaaaagc tcggggcccg cgtcttcaag gacgcctccc attggtccga acgcgagcag tccaacaaac ccgaggccgg tgaccgccgc atcttcatgg acccggcctc cttcgtcgcc gaagaactca acctcggcgc ccttcactac tccgtcgacg cagcatgcgc cacggcgctc tacgtgctcc gcctcgcgca ggatcatctc gtctccggcg ccgccgacgt catgctctgc ggtgccacct gcctgccgga gccctttttc atcctttcgg gcttttccac cttccaggcc atgcccgtcg gcacgggcca gaacgtgtcc atgccgctgc acaaggacag ccagggcctc accccgggtg agggcggctc catcatggtc ctcaagcgtc tcgatgatgc catccgcgac ggcgaccaca tctacggcac ccttctcggc gccaatgtca gcaactccgg cacaggtctg 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 6120 6180 60 120 180 240 300 360 420 480 540 600 660 720 780 840 311 900 200813222 cccctcaagc aacgtgcacc gatcgtgtgg accacaaagg gtcctcctct aagatggacc cccaagcgcg gaggagcatg gcccgctgcg ggcgctctca atcccactcc tgcggcgtca cgcctccgca accaccattg tttgtcggcc gagcgcgtcc tgcggcacat tcgcagtggg cgctgcgccg gcgggtgtcg gtgtccacct ggcgagggct atctacgctt gccctcgacc tccgcccgcc atcggcggcc ggcagtgtca aaggctgcgc cccgcccctg ctcaagaacc tgctattccg ctcgacgagg ggtcgcctcg tccgagctca caggatgccg tccaagctcc cgccgcgatt cgcgtcgcct cccttctccc cgcacaagat aaatcgacgc gcaactttgg ccatgaagca ctctcgtcgt ccggtctctc acccctccaa gcggtgaaag agggactcga cagaaaagcg aggccacccc cgcccatgac accgcgccat tcggcaccga gccctgaagc ccacatcgta gcttcacggg agctcggcaa atctctgcgg ccgatacccc gcggtgcctt gcatggatgc aggcgcgcgt acctcaagga ttcagacgat aggccaccgt tttgcatcta aggcgccctg ctggcgagcg tgctcctctc aggcgcccaa acaagatccg aggcgcaggc cttcttcagg agcgcgaggt ggagctcccc tcatgtacgg cagcgagaaa tcagtacgtc cgtcaaggcc acacaccctc tggcatcatc ctccggtgag ggcctttggc cgccgcctgc caacatgcgc cgccttcgag ctggcgcttt gcacggctgc ccctgaagac cctcgactcg cctcgagctc ctccaagaag cacctcgtac cccctccttt gtacctcctc cagtgccgaa gcgcgccagc tgtgctcaag catcgtccct caagccgggc cccgtccgtc ccttcgtgac cggtgacacc caaccgctac ggacagcacc tcgctatgcg cgaagccgag gctcattgtg cgagcgcttc ccgccgcatc ctcgcaaaag cgagctcgcg tgctggcagc cgaaggtcgc aagtgcctca gagtgccacg tgctttgaag gtcgcagccg ccgcccaccc gccatcccat tttggtggca acgggccacg atcgccatca cgcgccattt ctcggcaagg tacattgaag atgctcctcc ggaatgaaaa taccgtcacc ctcaatgaca attggcaacc acgatcaccg gagaccggcg aacctttacg tttgacgccg cgtgagacta ggcaacgtcc gatatcgaga ctgcccaagg gatgacaagc ggttatgcct ctgcccagca ctctttgcgt gccgtctcgg ggccactacg cttcgcgccg ttgcagccca ttcctcgagc cccctcgctc gccaagggta cgctacgcgc agcccttact tggacaccta ccaccggcac gcaaggtccc gctttgccgg cgggtatcga ggccagagac ccaacgccca actccatttc ctggtatgga acaccggcgc acaaggactt atgttgaggt ctcagcagct agggtggcaa gtgctcgcgt tgatgcagta tcgtcgccac agggcaacaa aggtcgatgg tcaagtctcg ccgccgatgg gctgcaccaa ctagcgcctg tgctcgagct agctcactgc tcccgcgcaa ctggtgctgc acggcgacga gccagacctc gcgtctccga agcgcgagaa actcccacga cgggcgccgc tcctcggcga tcagcctcgt tcccgcgctg ctgagccgct acggcatcac cacgcgcatt gccccagggt ccgtttcggt tatgtgcaag tgacgagacc caacggcgag tgccgtcttt tgcgctctcg cgccaccttt tcacggtgcc tcttgacctc cgacttccag tctggccgtc tgtcgccgtc cgctctcaag cattaacgac gcgcgtctcg ctccgtctac cgtcgtcgtt ccgcttcaag ctactttgtc ggacgaccgt cttgcgcgag cagcgccgac cgaggaggaa cgtcgcaacg cagcctcatc ctgggatgaa gcgcgcttgg gacgcgctcg ccgcatctcg ggagatcctt cccgcgcgag gacccttgcc ctccacgccc cctcaagatg cgccagcgac ccaagacatt 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 312 200813222 caccgcattt ggcccgaact ccacgaggtc atcaacgaaa agacgaaccg tctctgggcc gaaggcgacc gctgggtcat gccgcgcgcc agcttcaagt cggagctcga gagccagcag caagagtttg atcgcaacat gattgaaatg ttccgtcttg gaatcctcac ctcaattgcc ttcaccaatc tggcgcgcga cgttctcaac atcacgccca aggccgcctt tggcctcagt cttggcgaga tttccatgat ttttgccttt tccaagaaga acggtctcat ctccgaccag ctcaccaagg atcttcgcga gtccgacgtg tggaacaagg ctctggccgt tgaatttaat gcgctgcgcg aggcctgggg cattccacag agtgtcccca aggacgagtt ctggcaaggc tacattgtgc gcggcaccaa gcaggatatc gaggcggcca tcgccccgga cagcaagtac gtgcgcctca ccatcatcaa tgatgccaac accgccctca ttagcggcaa gcccgacgcc tgcaaggctg cgatcgcgcg tctcggtggc aacattcctg cgcttcccgt gacccagggc atgtgcggcc actgccccga ggtgggacct tataccaagg atatcgccaa gatccatgcc aaccttgagt tccccgttgt cgacggcctt gacctctgga ccacaatcaa ccagaagcgc ctcgtgccac gcgccacggg cgccaaggac gaatgggccc cttcttcctt tggcgagtac gccggccsgc tctacgagaa gcaggctsac 11cccccsss t cgtc?.t 11 caaaactacg acgtctttgt cgaggttggg cccaacaacc accgtagcac cgcagtgcgc accacgcttg gtccccagcg caaccacctt gctggcgcca tcgacaagca gaacgaggat gcttggacga ccatcgtcaa gcttgtggct tcgctcaagg cccaccttgt tcctggcgtc acgatctcgc cgctgtacca ctccaagctt gtggcggagg ctgaggcttg ctacgctgcg ctctgcaagg gtgaaaagcc caagaagaac aagtttgtgc gcaagattca gctcaacggt cgcttcaaca gcaaggcgga ccccatctcc tcggccgatc ttgccagctt tccgcctgcg gaccctgcca ttgaagccgc catctcgagc cgcatcatga agccggttgc tccgaagttc tacgcgcgtc tcaacattga cgagcaggac gagacccgtg atccgatcct caacaaggac aacgcgccgt cttccagctc tagctcctct tccagctctt ccagctcttc cagcccgtcg ccagctccgt ccgccccagt gcaaaagaag gctgctccgg ccgcggagac caaggctgtt gcttcggctg acgcacttcg cagtgccctg ctcgatctcg acagtatgct tgcgctgagc tctgccagtg cctccggcaa ccttgttgag actgcgccta gcgacgcctc ggtcattgtg ccgccctgca acattgcgga tctcggcagc cgcgccttca tgaaaacgta cggtgtttcg gcgcctctgt acacgggcgc catggccaag ggcattgcct ctgcggacct cgtcattgcc gccggccgcc agggcatcct tgcgtccttt ggcgccggcg gacttcccat gcaggttgtg cgtgagtcca tcgaaaagat tcaggccgcc ctgcccaatg gcccgtacgc tgtcaacctt atccattctc cctttgacag caacctcgaa aagggcaatg tcgatctctt cctcgagaag ggtgtcacct ttgtcgaggc ctcggccttt atgacgctca ccccgcaggt cgtgcggtac cgcgcggctg gcctcacgcg caacgccgac ggctcggtca acatccgcaa ccgtatcatt ggcaaggtct cgcgcaccga gctcgccgag atgttcatgc gtcctgcgcc cgagcacctt cttcagaagc tcattgcttc cggcgagatc aaccaggagc aggccgagct cgcccgccgt gttcccgtcg ctgacgacat cgcggtcgaa gctgactcgg gtggccacac cgacaaccgc cccatccacg tcattctgcc cctcatcatc aaccttcgcg accgccttca ccgcgagtgc 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4〇2〇 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 5280 5340 5400 313 200813222 ggctacccgg ccaaccttcg cgtccgtgtg ggcgccggcg gtggcattgg gtgcccccag gcggcgctgg ccaccttcaa catgggtgcc tcctttattg tcaccggcac cgtgaaccag gtcgccaagc agtcgggcac gtgcgacaat gtgcgcaagc agctcgcgaa ggccacttac tcggacgtat gcatggcccc ggctgccgac atgttcgagg aaggcgtcaa gcttcaggtc ctcaagaagg gaaccatgtt tccctcgcgc gccaacaagc tctacgagct cttttgcaag tacgactcgt tcgagtccat gccccccgca gagcttgcgc gcgtcgagaa gcgcatcttc agccgcgcgc tcgaagaggt ctgggacgag accaaaaact tttacattaa ccgtcttcac aacccggaga agatccagcg cgccgagcgc gaccccaagc tcaagatgtc gctgtgcttt cgctggtacc tgagcctggc gagccgctgg gccaacactg gagcttccga tcgcgtcatg gactaccagg tctggtgcgg tcctgccatt ggttccttca acgatttcat caagggaact taccttgatc cggccgtcgc aaacgagtac ccgtgcgtcg ttcagattaa caagcagatc cttcgtggag cgtgcttctt gcgccgtctc gaaattctgc gcaacgcacg cctttccgat ggcgctgccg ctcttgtggc cagcatcgat gacacatacg tcccggccga gaagctgtaa
<210> 38 <211> 8436 <212〉 DNA <213> 破囊壺菌(Thraustochytrium sp.) <220〉 <221〉 CDS <222〉 (1)..(8433) <400> 38 atg aag gac atg gaa gat aga egg gtc get att gtg ggc atg tea get
Met Lys Asp Met Glu Asp Arg Arg Val Ala lie Val Gly Met Ser Ala 15 10 15 cac ttg cct tgt ggg aca gat gtg aag gaa tea tgg cag get att ege
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gin Ala lie Arg 20 25 30 gat gga ate gac tgt eta agt gac eta ccc geg gat cgt etc gac gtt
Asp Gly lie Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val 35 40 45 aca get tac tac aat ccc aac aaa gee aeg aaa gac aag ate tac tgc
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys lie Tyr Cys 50 55 60 aaa egg ggt ggc ttc ate ccg aac tat gac ttc gac ccc ege gaa ttt
Lys Arg Gly Gly Phe lie Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe 65 70 75 80 ggg etc aac atg ttt caa atg gaa gac tet gat geg aat cag aca ett
Gly Leu Asn Met Phe Gin Met Glu Asp Ser Asp Ala Asn Gin Thr Leu 85 90 95 acc ttg etc aaa gtc aaa caa get etc gaa gat gca age at a gag cct
Thr Leu Leu Lys Val Lys Gin Ala Leu Glu Asp Ala Ser lie Glu Pro 100 105 110 ttc acc aag gag aag aag aac att gga tgt gtt tta ggt att ggt ggg
Phe Thr Lys Glu Lys Lys Asn lie Gly Cys Val Leu Gly lie Gly Gly 115 120 125 ggc caa aag geg agt cat gag ttc tac tet cgt etc aac tac gtt gtc
Gly Gin Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val 130 135 140 gtt gaa aag gta ett egg aaa atg ggt tta cca gat get gat gtt gaa 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 6120 6180 48 96 144 192 240 288 336 384 432 480 314 200813222
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu 145 150 155 160 gaa get gtg gag aaa tac aag gca aat ttt ccc gag tgg ege eta gac 528
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp 165 170 175 tet ttc cct ggg ttt ett ggg aat gta aeg get ggt egg tgc agt aac 576
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn 180 185 190 acc ttc aac atg gaa ggt atg aac tgc gtt gtg gat get gca tgt gee 624
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala 195 200 205 agt tet eta att gca ate aag gtt gca gtt gaa gag eta etc ttt ggt 672
Ser Ser Leu lie Ala lie Lys Val Ala Val Glu Glu Leu Leu Phe Gly 210 215 220 gac tgt gac acc atg att gca ggt gee acc tgc aeg gac aat tea ett 720
Asp Cys Asp Thr Met lie Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu 225 230 235 240 ggc atg tac atg gee ttc tet aaa aeg cca gtt ttt tet act gac cca 768
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro 245 250 255 agt gtc ege geg tat gat gag aaa aca aaa ggg atg eta att gga gaa 816
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu lie Gly Glu 260 265 270 ggt tea gca atg ttc gtt ett aaa ege tat geg gat gee gta cgt gat 864
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp 275 280 285 ggc gac aca att cac geg gtt ctg cgt tet tgc tet teg tet agt gat 912
Gly Asp Thr lie His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp 290 295 300 gga aaa geg gca gga att tat act cct act ata tet gga caa gaa gaa 960
Gly Lys Ala Ala Gly lie Tyr Thr Pro Thr lie Ser Gly Gin Glu Glu 305 310 315 320 get ttg cgt ega geg tat gee cgt geg ggg gta tgt cca tet aeg ate 1008
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr lie 325 330 335 ggg ett gtt gag ggt cac ggg aca ggg acc cct gtt gga gat ege att 1056
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg lie 340 345 350 gag tta aca get ctg egg aac ttg ttt gac aaa get ttt ggt age aag 1104
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys 355 360 365 aag gaa caa ata gca gtt ggc age ata aag tet cag ata ggt cac ctg 1152
Lys Glu Gin lie Ala Val Gly Ser lie Lys Ser Gin lie Gly His Leu 370 375 380 aaa tet gtt gee ggc ttt gee ggc ttg gtc aaa get gtg ett geg ett 1200
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu 385 390 395 400 aaa cac aaa aeg etc cca ggt teg att aat gtc gac cag cca cct ttg 1248
Lys His Lys Thr Leu Pro Gly Ser lie Asn Val Asp Gin Pro Pro Leu 405 410 415 ttg tat gac ggt act caa att caa gac tet tet tta tat ate aac aag 1296
Leu Tyr Asp Gly Thr Gin lie Gin Asp Ser Ser Leu Tyr lie Asn Lys 420 425 430 aca aat aga cca tgg ttt aeg caa aac aag ett ccg cgt egg get ggt 1344
Thr Asn Arg Pro Trp Phe Thr Gin Asn Lys Leu Pro Arg Arg Ala Gly 435 440 445 315 1392 200813222 gtc tea agt ttt gga ttt gga ggt gca aac tac cac geg gtt ctg gaa
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu 450 455 460 gaa ttc gag ccc gag cat gaa aaa cca tac ege etc aat act gtt gga
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly 465 470 475 480 cat cct gtc etc ttg tac get ccg tet gtg gaa gee etc aaa gta ett
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu 485 490 495 tgc aac gac cag ett geg gag etc aca att gca ttg gaa gag gca aaa
Cys Asn Asp Gin Leu Ala Glu Leu Thr lie Ala Leu Glu Glu Ala Lys 500 505 510 aca cat aaa aat gtt gac aaa gtt tgt ggc tac aag ttt att gac gaa
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe lie Asp Glu 515 520 525 ttt cag etc caa gga age tgt cct cca gaa aat ccg aga gta gga ttt
Phe Gin Leu Gin Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe 530 535 540 tta gca aca ctg cct act tea aat ate att gtc geg ett aag gca att
Leu Ala Thr Leu Pro Thr Ser Asn lie lie Val Ala Leu Lys Ala lie 545 550 555 560 etc geg cag ett gat gca aaa cca gat geg aag aaa tgg gat ttg cct
Leu Ala Gin Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro 565 570 575 cat aaa aag get ttt ggg get acc ttc gca teg tet tea gtg aaa ggc
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly 580 585 590 tet gtt get geg etc ttc gca gga cag ggt acc cag tac tta aac atg
Ser Val Ala Ala Leu Phe Ala Gly Gin Gly Thr Gin Tyr Leu Asn Met 595 600 605 ttc tet gat gtg gca atg aac tgg cca ccg ttc cgt gac age att gtc
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser lie Val 610 615 620 gca atg gaa gaa get caa act gag gta ttt gag ggc caa gtt gaa cca
Ala Met Glu Glu Ala Gin Thr Glu Val Phe Glu Gly Gin Val Glu Pro 625 630 635 640 att age aaa gtt ctg ttt cca ega gag ege tat gca tee gaa agt gaa lie Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu 645 650 655 cag ggg aat gaa ett ett tgc tta aca gag tac tet cag cca act aeg
Gin Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gin Pro Thr Thr 660 665 670 ata gca gee gca gta ggg gee ttc gat att ttc aaa geg get ggc ttt lie Ala Ala Ala Val Gly Ala Phe Asp lie Phe Lys Ala Ala Gly Phe 675 680 685 aag cca gac atg gtt gga ggg cat tea ett ggc gaa ttt get get ttg
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu 690 695 700 tac geg get ggg tee att teg cgt gac gac ctg tac aag ett gtg tgc
Tyr Ala Ala Gly Ser lie Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys 705 710 715 720 aaa egg gca aag gca atg geg aac get agt gac gga get atg gca gca
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala 725 730 735 gtg att ggc cca gat gca cgt eta gtt aeg cca caa aat agt gac gtt
Val lie Gly Pro Asp Ala Arg Leu Val Thr Pro Gin Asn Ser Asp Val 740 745 750 1440 1488 1536 1584 1632 1680 1728 1776 1824 1872 1920 1968 2016 2064 2112 2160 2208 2256 316 200813222 tat gtc gca aac ttc aac tcc gca act caa gta gtc ate agt ggc act 2304
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gin Val Val lie Ser Gly Thr 755 760 765 gtt caa ggt gtg aaa gaa gag teg aaa ttg etc att tea aag ggg ttc 2352
Val Gin Gly Val Lys Glu Glu Ser Lys Leu Leu lie Ser Lys Gly Phe 770 775 780 ege gta ctg cca ett aaa tgc cag ggc gee ttc cat tet cct ttg atg 2400
Arg Val Leu Pro Leu Lys Cys Gin Gly Ala Phe His Ser Pro Leu Met 785 790 795 800 ggg cct tet gag gat agt ttc aaa tea ett gtg gag act tgt acc ate 2448
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr lie 805 810 815 teg ccg cca aaa aat gtg aaa ttc ttt tgc aat gtt agt ggc aag gaa 2496
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu 820 825 830 age cca aac cca aaa cag acc etc aag tea cac atg aeg tet age gtt 2544
Ser Pro Asn Pro Lys Gin Thr Leu Lys Ser His Met Thr Ser Ser Val 835 840 845 cag ttc gag gag cag att cgt aac atg tac gat gee gga gca cgt gtt 2592
Gin Phe Glu Glu Gin lie Arg Asn Met Tyr Asp Ala Gly Ala Arg Val 850 855 860 ttt ctg gag ttt gga ccc ege caa gtc ett gca aag ett ate geg gaa 2640
Phe Leu Glu Phe Gly Pro Arg Gin Val Leu Ala Lys Leu lie Ala Glu 865 870 875 880 atg ttt ccc teg tgt aca get ate age gtt aac ccc geg age agt ggt 2688
Met Phe Pro Ser Cys Thr Ala lie Ser Val Asn Pro Ala Ser Ser Gly 885 890 895 gac agt gac gtg caa etc ege etc gee gee gta aaa ttc geg gtc teg 2736
Asp Ser Asp Val Gin Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser 900 905 910 ggt gca gee ett age acc ttt gat cca tgg gag tat ege aag cca caa 2784
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gin 915 920 925 gat ett ett att ega aaa cca ega aaa act gee ett gtt eta tea gca 2832
Asp Leu Leu lie Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala 930 935 940 gca aca tat gtt tec cca aag act ett gca gaa cgt aaa aag get atg 2880
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met 945 950 955 960 gaa gat ate aag eta gta tec att aca cca aga gat agt atg gta tea 2928
Glu Asp lie Lys Leu Val Ser lie Thr Pro Arg Asp Ser Met Val Ser 965 970 975 att gga aaa ate geg caa gaa gta egg aca get aaa cag cct tta gaa 2976 lie Gly Lys lie Ala Gin Glu Val Arg Thr Ala Lys Gin Pro Leu Glu 980 985 990 acc gaa att ega aga etc aac aaa gaa tta gaa cat etc aag aga gag 3024
Thr Glu lie Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu 995 1000 1005 eta gca gca gee aaa geg agt gtc aag tet gca tea aaa age tet 3069
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser 1010 1015 1020 aaa gag ega tet gtc eta tea aag cac ege get ttg ett caa aac 3114
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gin Asn 1025 1030 1035 att ttg caa gac tac gat gat ett cgt gtg gtg cca ttc get gtt 3159 lie Leu Gin Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val 317 200813222 1040 1045 1050 cgt tct gtt gca gtg gac aac acc gcg ccg tat get gac caa gtt
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gin Val 1055 1060 1065 teg acc cca gcg tea gag egg teg get tea ccg ett ttc gag aaa
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys 1070 1075 1080 ege agt teg gtt teg tea gca ege etc get gaa get gaa gee gcg
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala 1085 1090 1095 gta ctg age gtt etc gca gac aag aca ggc tac gac age tea atg
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met 1100 1105 1110 ate gag atg gac atg gac ctg gag agt gag ett ggc gtt gat age lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser 1115 1120 1125 ate aaa ege gtg gag ate atg age gag gtt caa aeg ctg etc age lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser 1130 1135 1140 gtg gaa gtc tee gac gtt gac get ctg tea aga acc aag act gtt
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val 1145 1150 1155 ggc gac gtc ate gag gcg atg aag ctg gaa etc ggt gga ccc caa
Gly Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gin 1160 1165 1170 ggc cag act ttg acc gcg gaa teg ate cgt cag cca ccg gtg tee
Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser 1175 1180 1185 gag cct get gta ccg acc tea teg tea age agt att get aat gtt
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val 1190 1195 1200 teg tea gca ege etc get gaa get gaa get gcg gta ctg age gtt
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val 1205 1210 1215 etc gca gac aag aca ggc tac gac age tea atg ate gag atg gac
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp 1220 1225 1230 atg gac ctg gag age gag ett ggc gtt gat age ate aaa ege gtg
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 1235 1240 1245 gag ate atg age gag gtt caa aeg ctg etc age gtg gaa gtc tee
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser 1250 1255 1260 gac gtt gac get ctg tea aga act aag act gtt ggc gac gtc ate
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie 1265 1270 1275 gag gcg atg aag ctg gaa etc ggt gga ccc caa ggc cag act ttg
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu 1280 1285 1290 acc gcg gaa teg ate cgt cag cca ccg gtg tct gag cct get gta
Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val 1295 1300 1305 ccg acc tea teg tea age agt att get aat gtt teg tea gca ege
Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg 1310 1315 1320 etc get gaa get gaa gcg gcg gta ctg age gtt etc gca gac aag 3204 3249 3294 3339 3384 3429 3474 3519 3564 3609 3654 3699 3744 3789 3834 3879 3924 3969 4014 318 200813222
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys 1325 1330 1335 aca ggc tac gac age tea atg ate gag atg gac atg gac ctg gag 4059
Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu Glu 1340 1345 1350 age gag ett ggc gtc gac age ate aaa ege gtg gag ate atg age 4104
Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser 1355 1360 1365 gag gtt caa aeg ctg etc age gtg gaa gtc tee gac gtt gac get 4149
Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala 1370 1375 1380 ctg tea aga acc aag act gtt ggc gac gtc ate gag geg atg aag 4194
Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys 1385 1390 1395 ctg gaa etc ggt gga ccc caa ggc cag act ttg acc geg gaa teg 4239
Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser 1400 1405 1410 ate cgt cag cca ccg gtg tee gag cct get gta ccg acc tea teg 4284 lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser 1415 1420 1425 tea age agt att get aat gtt ttg tea gca ege etc get gaa get 4329
Ser Ser Ser lie Ala Asn Val Leu Ser Ala Arg Leu Ala Glu Ala 1430 1435 1440 gaa gee geg gta ctg age gtt etc gca gac aag aca ggc tac gac 4374
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp 1445 1450 1455 age tea atg ate gag atg gac atg gac ctg gag age gag ett ggc 4419
Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly 1460 1465 1470 gtt gat age ate aaa ege gtg gag ate atg age gag gtt caa aeg 4464
Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr 1475 1480 1485 ttg etc age gtg gaa gtc tee gac gtt gac get ctg tea aga acc 4509
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr 1490 1495 1500 aag act gtt ggc gac gtc ate gag geg atg aag ctg gaa etc ggt 4554
Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly 1505 1510 1515 gga ccc caa ggc cag act ttg acc geg gaa teg ate cgt cag cca 4599
Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin Pro 1520 1525 1530 ccg gtg tet gag cct get gta ccg acc tea teg tea age agt att 4644
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie 1535 1540 1545 get aat gtt teg tea gca ege etc get gaa get gaa gee geg gta 4689
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val 1550 1555 1560 ctg age gtt etc gca gac aag aca ggc tac gac age tea atg ate 4734
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie 1565 1570 1575 gag atg gac atg gac ctg gag agt gag ett ggc gtc gac age ate 4779
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie 1580 1585 1590 aaa ege gtg gag ate atg age gag gtt caa aeg ctg etc age gtg 4824
Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val 1595 1600 1605 319 gaa gtc tcc gac gtt gac get Glu Val Ser Asp Val Asp Ala 1610 1615 200813222 ctg tea aga acc aag act gtt ggc Leu Ser Arg Thr Lys Thr Val Gly 1620 ate gag geg atg aag ctg gaa etc ggt gga ccc caa ggc lie Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gin Gly 1630 1635 cag act ttg acc tet gaa ccg ate cat cag cca cca gtg tec gag Gin Thr Leu Thr Ser Glu Pro lie His Gin Pro Pro Val Ser Glu 1640 1645 1650 cct get gta ccg acc tea teg tea age agt att get aat gtt tet Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser 1655 1660 1665 tea gca ege etc get gaa get gaa gee geg gta ctg age gtt etc Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu 1670 1675 1680 gca gac aag aca ggc tac gac age tea atg ate gag atg gac atg Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met 1685 1690 1695 gac ctg gag age gag ett ggc gtt gat age ate aaa ege gtg gaa Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu 1700 1705 1710 ate atg age gag gtt caa aeg ctg etc age gtg gaa gtc tec gac lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 1715 1720 1725 gtt gac get ctg tea aga acc aag act gtt ggc gac gtc ate gag Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu 1730 1735 1740 geg atg aag atg gaa etc ggt gga ccc caa ggc cag act ttg acc Ala Met Lys Met Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr 1745 1750 1755 geg gaa teg ate cgt cag cca ccg gtg tet gag cct get gta ccg Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val Pro 1760 1765 1770 acc tea teg tea age agt att get aat gtt teg tea gca ege etc Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu 1775 1780 1785 get gaa get gaa geg geg gta ctg age gtt etc gca gac aag aca Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr 1790 1795 1800 ggc tac gac age tea atg ate gag atg gac atg gac ctg gag age Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser 1805 1810 1815 gag ett ggc gtt gat age ate aaa ege gtg gag ate atg age gag
Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu 1820 1825 1830 gtt caa geg ctg etc age gtg gaa gtc tec gac gtt gac get ctg
Val Gin Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 1835 1840 1845 tea aga acc aag act gtt ggc gac gtc ate gag geg atg aag atg
Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Met 1850 1855 I860 gaa etc ggt gga ccc caa ggc cag act ttg acc gca gaa teg ate
Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser lie 1865 1870 1875 cgt gag cca ccg gtg tet gag cct get gta ccg acc tea teg tea
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser 1880 1885 1890 4869 4914 4959 5004 5049 5094 5139 5184 5229 5274 5319 5364 5409 5454 5499 5544 5589 5634 5679 gtc Val 1625 gac Asp 320 200813222 agt agt Ser Ser 1895 gcc gcg Ala Ala 1910 tea atg Ser Met 1925 gac age Asp Ser 1940 etc age Leu Ser 1955 act gtt Thr Val 1970 tea tea Ser Ser 1985 age tac Ser Tyr 2000 cgt ttc Arg Phe 2015 tee act Ser Thr 2030 aeg ccc Thr Pro 2045 gtg gtt Val Val 2060 gag gtg Glu Val 2075 ttg att Leu lie 2090 caa gtg Gin Val 2105 etc gca Leu Ala 2120 gat tea Asp Ser 2135 ett gga Leu Gly 2150 aeg aaa Thr Lys ate get aat gtt tet tea get ege etc get gaa get gaa 5724 lie Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 1900 1905 gta ctg age gtt etc gca gac aag aca ggc tac gac age 5769
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser 1915 1920 ate gag atg gac atg gac ctg gag agt gag ett ggc gtc 5814 lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val 1930 1935 ate aaa ege gtg gag ate atg age gag gtt caa aeg ttg 5859 lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu 1945 1950 gtg gaa gtc tee gac gtt gac get ctg tea aga acc aag 5904
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys 1960 1965 ggc gac gtc ate gag gcg atg aag ctg gaa ett ggg gaa 5949
Gly Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly Glu 1975 1980 agt att gag act etc aat tgt acc gag gtt gag cac aeg 5994
Ser lie Glu Thr Leu Asn Cys Thr Glu Val Glu His Thr 1990 1995 aaa agt gtc aag get tea ggg tgt gag aat gta gat acc 6039
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr 2005 2010 get aag gtt gta caa ate teg ett cct age aag ctg aaa 6084
Ala Lys Val Val Gin lie Ser Leu Pro Ser Lys Leu Lys 2020 2025 gtg teg cac gat ega cct gta att gtt gta gat gat gga 6129
Val Ser His Asp Arg Pro Val lie Val Val Asp Asp Gly 2035 2040 tta acc aeg gag ett tgt aaa att ett ggg ggt aat att 6174
Leu Thr Thr Glu Leu Cys Lys lie Leu Gly Gly Asn lie 2050 2055 etc tet tat caa ggg aag ccc get ggt cca egg gga gtc 6219
Leu Ser Tyr Gin Gly Lys Pro Ala Gly Pro Arg Gly Val 2065 2070 cca gat ett tee gag gaa gcc eta att caa get ett gca 6264
Pro Asp Leu Ser Glu Glu Ala Leu lie Gin Ala Leu Ala 2080 2085 egg tet aca tat gga gtt cca att ggt ttt att tgt cag 6309
Arg Ser Thr Tyr Gly Val Pro lie Gly Phe lie Cys Gin 2095 2100 tet aat gtg age acc aag gca cag ett tgt tgg gca etc 6354
Ser Asn Va丁 Ser Thr Lys Ala Gin Leu Cys Trp Ala Leu 2110 2115 gcg aag cat etc aag aag gat ttg aat get gtc tta ccc 6399
Ala Lys His Leu Lys Lys Asp Leu Asn Ala Val Leu Pro 2125 2130 aga tee ttc ttc gtc gga gtt gta ege ttg aac ggg aaa 6444
Arg Ser Phe Phe Val Gly Val Val Arg Leu Asn Gly Lys 2140 2145 act ttc gaa aac ate age gac ttc tet aaa ttt gat ttg 6489
Thr Phe Glu Asn lie Ser Asp Phe Ser Lys Phe Asp Leu 2155 2160 gcc eta gat tac gga cag cgt ggt tet etc tta ggc ctg 6534
Ala Leu Asp Tyr Gly Gin Arg Gly Ser Leu Leu Gly Leu 321 200813222 2165 2170 2175 tgc aag tea eta gac tta gaa tgg gaa cag gtg ttt tgc cgt gga
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gin Val Phe Cys Arg Gly 2180 2185 2190 ata gat ett geg tgt gat ett atg cca etc cag gee gca agg ata
He Asp Leu Ala Cys Asp Leu Met Pro Leu Gin Ala Ala Arg lie 2195 2200 2205 etc aga aat gag ett cag tgt ccc aat atg ege ett ege gag gtt
Leu Arg Asn Glu Leu Gin Cys Pro Asn Met Arg Leu Arg Glu Val 2210 2215 2220 ggg tac gat att tet ggc gee agg tac acc att tea acc gat gac
Gly Tyr Asp lie Ser Gly Ala Arg Tyr Thr lie Ser Thr Asp Asp 2225 2230 2235 ctg eta tgt gga ccc teg aag get aaa gta gag gee gca gac ttg
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu 2240 2245 2250 ttt ett gtg aca ggt ggc gca ega ggt att aca cct cat tgt gtt
Phe Leu Val Thr Gly Gly Ala Arg Gly lie Thr Pro His Cys Val 2255 2260 2265 cgt gag att gca agt ega tee ccc gga acc aca ttt gtg ctg gtt
Arg Glu lie Ala Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val 2270 2275 2280 gga aga age gaa atg tee gac gag cct gac tgg get gtt ggc cac
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala Val Gly His 2285 2290 2295 tac aat aaa gac ctg gac caa age aca atg aaa cac ttg aaa gca
Tyr Asn Lys Asp Leu Asp Gin Ser Thr Met Lys His Leu Lys Ala 2300 2305 2310 aeg cat get get gga ggg gta aaa cct aeg cct aaa gca cat cgt
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys Ala His Arg 2315 2320 2325 gca ett gtg aac agg gtc act ggc tea egg gag gta ega gaa tet
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val Arg Glu Ser 2330 2335 2340 ett aga gca ate cag gag gca ggg gca aat gtc gaa tat ate gee
Leu Arg Ala lie Gin Glu Ala Gly Ala Asn Val Glu Tyr lie Ala 2345 2350 2355 tgt gat gtt teg gat gaa aac aag gtc ege caa ett gtg caa aga
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gin Leu Val Gin Arg 2360 2365 2370 gtg gag caa aag tat ggc tgt gaa ata act ggg att tgg cat gca
Val Glu Gin Lys Tyr Gly Cys Glu lie Thr Gly lie Trp His Ala 2375 2380 2385 age ggg gtt ett cgt gac aaa ett gtc gag caa aag act aca gac
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gin Lys Thr Thr Asp 2390 2395 2400 gac ttt gag gca gtt ttt ggg acc aag gtg act ggc ett gta aac
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu Val Asn 2405 2410 2415 ate gtg tea caa gtc aat atg tet aag eta ega cac ttc ate etc lie Val Ser Gin Val Asn Met Ser Lys Leu Arg His Phe lie Leu 2420 2425 2430 ttc agt tet ttg get gga ttt cat ggg aac aag ggc caa aeg gat
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gin Thr Asp 2435 2440 2445 tat gca att get aat gaa gee ttg aac aaa ate geg cat act etc 6579 6624 6669 6714 6759 6804 6849 6894 6939 6984 7029 7074 7119 7164 7209 7254 7299 7344 7389 322 200813222
Tyr Ala lie Ala Asn Glu Ala Leu Asn Lys lie Ala His Thr Leu 2450 2455 2460 tea geg ttt ttg ccc aaa ctg aat gca aag gtg eta gac ttc ggt 7434 Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly 2465 2470 2475 ccg tgg gta ggt tea gga atg gta acc gaa aca ett gag aag cat 7479 Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His 2480 2485 2490 ttt aaa get atg ggg gtt cag act att cct etc gag cca gga gca 7524 Phe Lys Ala Met Gly Val Gin Thr lie Pro Leu Glu Pro Gly Ala 2495 2500 2505 • egg act gtt geg caa ate att ttg gca agt teg cca ccg caa teg 7569 Arg Thr Val Ala Gin lie lie Leu Ala Ser Ser Pro Pro Gin Ser . 2510 2515 2520 ett ttg ggg aac tgg ggc ttt cca gee acc aaa ccg eta caa ege 7614 Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro Leu Gin Arg ' 2525 2530 2535 tet aat gta gtc aeg ggc aca etc tet ccg gaa gag ata gaa ttc 7659 Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu lie Glu Phe 2540 2545 2550 ate gca gac cac aaa att caa ggc ege aag gtg ett ccc atg atg 7704 lie Ala Asp His Lys lie Gin Gly Arg Lys Val Leu Pro Met Met 2555 2560 2565 get gca ate ggg ttc atg gee tet att geg gaa gga etc tac ccg 7749 Ala Ala lie Gly Phe Met Ala Ser lie Ala Glu Gly Leu Tyr Pro 2570 2575 2580 ggg tac aat ctg caa ggc gtg gaa aat get cag etc ttt caa ggc 7794 Gly Tyr Asn Leu Gin Gly Val Glu Asn Ala Gin Leu Phe Gin Gly 2585 2590 2595 ttg act ate aac caa gag aca aaa ttt caa ate act etc att gag 7839 Leu Thr lie Asn Gin Glu Thr Lys Phe Gin lie Thr Leu lie Glu 2600 2605 2610 gag cac aac tet gag gaa aac ctg gat gtc ctg aca Leu Asp Val Leu Thr tee ett ggt 7884 Glu His Asn Ser Glu Glu Asn Ser Leu Gly 2615 2620 2625 gta atg ttg gaa age ggg aag gtg ett ccc get tac ega tgt gtt 7929 Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr Arg Cys Val 2630 2635 2640 gta tgc ttg aat aca acc cag cag cag ccc aag eta tet cca aaa 7974 Val Cys Leu Asn Thr Thr Gin Gin Gin Pro Lys Leu Ser Pro Lys f 2645 2650 2655 … att ett aac ttg gaa gtt gac cct gca tgc gag gtt aac ccc tat 8019 lie Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro Tyr ' 2660 2665 2670 gat gga aag teg ttg ttc cac ggt ccg ett ttg caa ttc gtt caa 8064 Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gin Phe Val Gin 2675 2680 2685 caa gtg ttg cac tea agt acc aaa ggc etc gtt gee aag tgc ege 8109 Gin Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg 2690 2695 2700 geg ett cca ate aaa gaa gee ate ega ggg cca ttt ate aag caa 8154 Ala Leu Pro lie Lys Glu Ala lie Arg Gly Pro Phe lie Lys Gin 2705 2710 2715 aca etc cat gat cca att eta gac gac gtc att ttt cag eta atg 8199 Thr Leu His Asp Pro lie Leu Asp Asp Val lie Phe Gin Leu Met 2720 2725 2730 323 200813222 8244 8289 8334 8379 8424 8436 etc gtg tgg tgt cgt aat get eta gga agt gca teg eta ccc aac
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn 2735 2740 2745 aga att gaa aag atg tea tac ttt ggg aat gtc tea gaa ggt age
Arg lie Glu Lys Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser 2750 2755 2760 act ttc ttt gee tea gtt aca cct gtg gga cca aga gta cca aag
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys 2765 2770 2775 gat ccc gtg ate aaa atg cag ttt ett etc caa gat gaa tee ggc
Asp Pro Val lie Lys Met Gin Phe Leu Leu Gin Asp Glu Ser Gly 2780 2785 2790 aac aca ttt tea teg ggg gag ggc teg gtt gtg ett agt gac gaa
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu 2795 2800 2805 etc gtc ttt tga Leu Val Phe 2810
<210> 39 <211> 2811 <212> PRT <213>破囊壺菌(1'1^1131:〇(:1^1:1^111113?.) <400> 39
Met Lys Asp Met Glu Asp Arg Arg Val Ala lie Val Gly Met Ser Ala 1 5 10 15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gin Ala lie Arg 20 25 30
Asp Gly lie Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val 35 40 45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys lie Tyr Cys 50 55 60
Lys Arg Gly Gly Phe lie Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe 65 70 75 80
Gly Leu Asn Met Phe Gin Met Glu Asp Ser Asp Ala Asn Gin Thr Leu 85 90 95
Thr Leu Leu Lys Val Lys Gin Ala Leu Glu Asp Ala Ser lie Glu Pro 100 105 110
Phe Thr Lys Glu Lys Lys Asn lie Gly Cys Val Leu Gly lie Gly Gly 115 120 125
Gly Gin Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val 130 135 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu 145 150 155 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp 165 170 175 324 200813222
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn 180 185 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala 195 200 205
Ser Ser Leu lie Ala lie Lys Val Ala Val Glu Glu Leu Leu Phe Gly 210 215 220
Asp Cys Asp Thr Met lie Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu 225 230 235 240
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro 245 250 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu lie Gly Glu 1 260 265 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp 275 280 285
Gly Asp Thr lie His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp 290 295 300
Gly Lys Ala Ala Gly lie Tyr Thr Pro Thr lie Ser Gly Gin Glu Glu 305 310 315 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr lie 325 330 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg lie 340 345 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys 355 360 365
Lys Glu Gin lie Ala Val Gly Ser lie Lys Ser Gin lie Gly His Leu 370 375 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu 385 390 395 400
Lys His Lys Thr Leu Pro Gly Ser lie Asn Val Asp Gin Pro Pro Leu 405 410 415
Leu Tyr Asp Gly Thr Gin lie Gin Asp Ser Ser Leu Tyr lie Asn Lys 420 425 430
Thr Asn Arg Pro Trp Phe Thr Gin Asn Lys Leu Pro Arg Arg Ala Gly 435 440 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu 450 455 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly 465 470 475 480 325 200813222
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu 485 490 495
Cys Asn Asp Gin Leu Ala Glu Leu Thr lie Ala Leu Glu Glu Ala Lys 500 505 510
Thr His Lys Asn Val Asp Lys Val Cys Gly Tyr Lys Phe lie Asp Glu 515 520 525
Phe Gin Leu Gin Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe 530 535 540
Leu Ala Thr Leu Pro Thr Ser Asn lie lie Val Ala Leu Lys Ala lie 545 550 555 560
Leu Ala Gin Leu Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro i 565 570 575
His Lys Lys Ala Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly 580 585 590
Ser Val Ala Ala Leu Phe Ala Gly Gin Gly Thr Gin Tyr Leu Asn Met 595 600 605
Phe Ser Asp Val Ala Met Asn Trp Pro Pro Phe Arg Asp Ser lie Val 610 615 620
Ala Met Glu Glu Ala Gin Thr Glu Val Phe Glu Gly Gin Val Glu Pro 625 630 635 640 lie Ser Lys Val Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu 645 650 655
Gin Gly Asn Glu Leu Leu Cys Leu Thr Glu Tyr Ser Gin Pro Thr Thr 660 665 670 lie Ala Ala Ala Val Gly Ala Phe Asp lie Phe Lys Ala Ala Gly Phe 675 680 685
Lys Pro Asp Met Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu 690 695 700
Tyr Ala Ala Gly Ser lie Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys 705 710 715 720
Lys Arg Ala Lys Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala 725 730 735
Val lie Gly Pro Asp Ala Arg Leu Val Thr Pro Gin Asn Ser Asp Val 740 745 750
Tyr Val Ala Asn Phe Asn Ser Ala Thr Gin Val Val lie Ser Gly Thr 755 760 765
Val Gin Gly Val Lys Glu Glu Ser Lys Leu Leu lie Ser Lys Gly Phe 326 200813222 770 775 780
Arg Val Leu Pro Leu Lys Cys Gin Gly Ala Phe His Ser Pro Leu Met 785 790 795 800
Gly Pro Ser Glu Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr lie 805 810 815
Ser Pro Pro Lys Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu 820 825 830
Ser Pro Asn Pro Lys Gin Thr Leu Lys Ser His Met Thr Ser Ser Val 835 840 845
Gin Phe Glu Glu Gin lie Arg Asn Met Tyr Asp Ala Gly Ala Arg Val 850 855 860
Phe Leu Glu Phe Gly Pro Arg Gin Val Leu Ala Lys Leu lie Ala Glu 865 870 875 880
Met Phe Pro Ser Cys Thr Ala lie Ser Val Asn Pro Ala Ser Ser Gly 885 890 895
Asp Ser Asp Val Gin Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser 900 905 910
Gly Ala Ala Leu Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gin 915 920 925
Asp Leu Leu lie Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala 930 935 940
Ala Thr Tyr Val Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met 945 950 955 960
Glu Asp lie Lys Leu Val Ser lie Thr Pro Arg Asp Ser Met Val Ser 965 970 975 lie Gly Lys lie Ala Gin Glu Val Arg Thr Ala Lys Gin Pro Leu Glu 980 985 990
Thr Glu lie Arg Arg Leu Asn Lys Glu Leu Glu His Leu Lys Arg Glu 995 1000 1005
Leu Ala Ala Ala Lys Ala Ser Val Lys Ser Ala Ser Lys Ser Ser 1010 1015 1020
Lys Glu Arg Ser Val Leu Ser Lys His Arg Ala Leu Leu Gin Asn 1025 1030 1035 lie Leu Gin Asp Tyr Asp Asp Leu Arg Val Val Pro Phe Ala Val 1040 1045 1050
Arg Ser Val Ala Val Asp Asn Thr Ala Pro Tyr Ala Asp Gin Val 1055 1060 1065 327 200813222 Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu 1070 1075 1080
Arg Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala 1085 1090 1095
Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp 1100 1105 1110 lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly 1115 1120 1125 lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr 1130 1135 1140
Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr 1145 1150 1155
Gly Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly 1160 1165 1170
Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin Pro 1175 1180 1185
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie 1190 1195 1200
Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val 1205 1210 1215
Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie 1220 1225 1230
Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie 1235 1240 1245
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val 1250 1255 1260
Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly 1265 1270 1275
Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gin Gly 1280 1285 1290
Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu 1295 1300 1305
Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser 1310 1315 1320
Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu 1325 1330 1335
Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met 1340 1345 1350
Phe Glu Lys Glu Ala Ala Ser Ser Met Val Asp Ser Leu Leu Ser Lys Thr Val Gly Pro Gin Pro Val Ser Ala Asn Val Leu Ser Val Glu Met Asp Lys Arg Val Glu Val Ser Asp Val lie Gin Thr Leu Pro Ala Val Ser Ala Arg Ala Asp Lys Asp Leu Glu 328 200813222
Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu 1355 1360 1365
Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 1370 1375 1380
Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu 1385 1390 1395
Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr 1400 1405 1410 lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val Pro 1415 1420 1425
Ser Ser Ser lie Ala Asn Val Leu Ser Ala Arg Leu 1430 1435 1440
Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr 1445 1450 1455
Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser 1460 1465 1470
Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu 1475 1480 1485
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 1490 1495 1500
Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Leu 1505 1510 1515
Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser lie 1520 1525 1530
Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser 1535 1540 1545 i Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 1550 1555 1560
Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser 1565 1570 1575
Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val 1580 1585 1590
Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu 1595 1600 1605
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys 1610 1615 1620
Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly Gly 1625 1630 1635 lie Met Ser Val Asp Ala Ala Met Lys Ala Glu Ser Thr Ser Ser Ala Glu Ala Gly Tyr Asp Glu Leu Gly Val Gin Thr Ser Arg Thr Glu Leu Gly Arg Gin Pro Ser Ser lie Ala Ala Val Ser Met lie Asp Ser lie Leu Ser Val Thr Val Gly Pro Gin Gly 329 200813222
Gin Thr Leu Thr Ser Glu Pro lie His Gin Pro Pro Val Ser Glu 1640 1645 1650
Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser 1655 1660 1665
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu 1670 1675 1680
Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met 1685 1690 1695
Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu 1700 1705 1710 lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 1715 1720 1725
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu 1730 1735 1740
Ala Met Lys Met Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr 1745 1750 1755
Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val Pro 1760 1765 1770
Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu 1775 1780 1785
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr 1790 1795 1800
Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser 1805 1810 1815
Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu 1820 1825 1830
Val Gin Ala Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 1835 1840 1845
Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Met 1850 1855 1860
Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser lie 1865 1870 1875
Arg Glu Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser 1880 1885 1890
Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 1895 1900 1905
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser 330 200813222 1910 1915 1920
Ser Met lie Glu Met Asp Met Asp Leu Glu Ser Glu 1925 1930 1935
Asp Ser lie Lys Arg Val Glu lie Met Ser Glu Val 1940 1945 1950
Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser 1955 1960 1965
Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu 1970 1975 1980
Ser Ser Ser lie Glu Thr Leu Asn Cys Thr Glu Val 1985 1990 1995
Ser Tyr Lys Ser Val Lys Ala Ser Gly Cys Glu Asn 2000 2005 2010
Arg Phe Ala Lvs Val Val Gin lie Ser Leu Pro Ser ~ 2015 2020 2025
Ser Thr Val Ser His Asp Arg Pro Val lie Val Val 2030 2035 2040
Thr Pro Leu Thr Thr Glu Leu Cys Lys lie Leu Gly 2045 2050 2055
Val Val Leu Ser Tyr Gin Gly Lys Pro Ala Gly Pro 2060 2065 2070
Glu Val Pro Asp Leu Ser Glu Glu Ala Leu lie Gin 2075 2080 2085
Leu lie Arg Ser Thr Tyr Gly Val Pro lie Gly Phe 2090 2095 2100
Gin Val Ser Asn Val Ser Thr Lys Ala Gin Leu Cys 2105 2110 2115
Leu Ala Ala Lys His Leu Lys Lys Asp Leu Asn Ala 2120 2125 2130
Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg Leu 2135 2140 2145
Leu Gly Thr Phe Glu Asn lie Ser Asp Phe Ser Lys 2150 2155 2160
Thr Lys Ala Leu Asp Tyr Gly Gin Arg Gly Ser Leu 2165 2170 2175
Cys Lys Ser Leu Asp Leu Glu Trp Glu Gin Val Phe 2180 2185 2190
Leu Gly Val Gin Thr Leu Arg Thr Lys Leu Gly Glu Glu His Thr Val Asp Thr Lys Leu Lys Asp Asp Gly Gly Asn lie Arg Gly Val Ala Leu Ala lie Cys Gin Trp Ala Leu Val Leu Pro Asn Gly Lys Phe Asp Leu Leu Gly Leu Cys Arg Gly 331 200813222 lie Asp Leu Ala Cys Asp Leu Met Pro Leu Gin Ala 2195 2200 2205
Leu Arg Asn Glu Leu Gin Cys Pro Asn Met Arg Leu 2210 2215 2220
Gly Tyr Asp lie Ser Gly Ala Arg Tyr Thr lie Ser 2225 2230 2235
Leu Leu Cys Gly Pro Ser Lys Ala Lys Val Glu Ala 2240 2245 2250
Phe Leu Val Thr Gly Gly Ala Arg Gly lie Thr Pro 2255 2260 2265
Arg Glu lie Ala Ser Arg Ser Pro Gly Thr Thr Phe 2270 2275 2280
Gly Arg Ser Glu Met Ser Asp Glu Pro Asp Trp Ala 2285 2290 2295
Tyr Asn Lys Asp Leu Asp Gin Ser Thr Met Lys His 2300 2305 2310
Thr His Ala Ala Gly Gly Val Lys Pro Thr Pro Lys 2315 2320 2325
Ala Leu Val Asn Arg Val Thr Gly Ser Arg Glu Val 2330 2335 2340
Leu Arg Ala lie Gin Glu Ala Gly Ala Asn Val Glu 2345 2350 2355
Cys Asp Val Ser Asp Glu Asn Lys Val Arg Gin Leu 2360 2365 2370
Val Glu Gin Lys Tyr Gly Cys Glu lie Thr Gly lie 2375 2380 2385
Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gin Lys 2390 2395 2400
Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly 2405 2410 2415 lie Val Ser Gin Val Asn Met Ser Lys Leu Arg His 2420 2425 2430
Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly 2435 2440 2445
Tyr Ala lie Ala Asn Glu Ala Leu Asn Lys lie Ala 2450 2455 2460
Ser Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu 2465 2470 2475
Ala Arg lie Arg Glu Val Thr Asp Asp Ala Asp Leu His Cys Val Val Leu Val Val Gly His Leu Lys Ala Ala His Arg Arg Glu Ser Tyr lie Ala Val Gin Arg Trp His Ala Thr Thr Asp Leu Val Asn Phe lie Leu Gin Thr Asp His Thr Leu Asp Phe Gly 332 200813222
Pro Trp Val Gly Ser Gly Met Val Thr Glu Thr Leu 2480 2485 2490
Phe Lys Ala Met Gly Val Gin Thr lie Pro Leu Glu 2495 2500 2505
Arg Thr Val Ala Gin lie lie Leu Ala Ser Ser Pro 2510 2515 2520
Leu Leu Gly Asn Trp Gly Phe Pro Ala Thr Lys Pro 2525 2530 2535
Ser Asn Val Val Thr Gly Thr Leu Ser Pro Glu Glu 2540 2545 2550 lie Ala Asp His Lys lie Gin Gly Arg Lys Val Leu 2555 2560 2565
Ala Ala lie Gly Phe Met Ala Ser lie Ala Glu Gly 2570 2575 2580
Gly Tyr Asn Leu Gin Gly Val Glu Asn Ala Gin Leu 2585 2590 2595
Leu Thr lie Asn Gin Glu Thr Lys Phe Gin lie Thr 2600 2605 2610
Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu Thr 2615 2620 2625
Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr 2630 2635 2640
Val Cys Leu Asn Thr Thr Gin Gin Gin Pro Lys Leu 2645 2650 2655 lie Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val 2660 2665 2670
Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gin 2675 2680 2685
Gin Val Leu His Ser Ser Thr Lys Gly Leu Val Ala 2690 2695 2700
Ala Leu Pro lie Lys Glu Ala lie Arg Gly Pro Phe 2705 2710 2715
Thr Leu His Asp Pro lie Leu Asp Asp Val lie Phe 2720 2725 2730
Leu Val Trp Cys Arg Asn Ala Leu Gly Ser Ala Ser 2735 2740 2745
Arg lie Glu Lys Met Ser Tyr Phe Gly Asn Val Ser 2750 2755 2760
Glu Lys His Pro Gly Ala Pro Gin Ser Leu Gin Arg lie Glu Phe Pro Met Met Leu Tyr Pro Phe Gin Gly Leu lie Glu Ser Leu Gly Arg Cys Val Ser Pro Lys Asn Pro Tyr Phe Val Gin Lys Cys Arg lie Lys Gin Gin Leu Met Leu Pro Asn Glu Gly Ser 333 200813222
Thr Phe Phe Ala Ser Val Thr Pro Val Gly Pro Arg Val Pro Lys 2765 2770 2775
Asp Pro Val lie Lys Met Gin Phe Leu Leu Gin Asp Glu Ser Gly 2780 2785 2790
Asn Thr Phe Ser Ser Gly Glu Gly Ser Val Val Leu Ser Asp Glu 2795 2800 2805
Leu Val Phe 2810
<210> 40 <211〉 1500 <212〉 DNA <213> 破囊壺菌(Thraustochytrium sp.) <220〉 <221〉 CDS <222〉 (1)..(1500) <400> 40 atg aag gac atg gaa gat aga egg gtc get att gtg ggc atg tea get
Met Lys Asp Met Glu Asp Arg Arg Val Ala lie Val Gly Met Ser Ala 15 10 15 cac ttg cct tgt ggg aca gat gtg aag gaa tea tgg cag get att ege
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gin Ala lie Arg 20 25 30 gat gga ate gac tgt eta agt gac eta ccc geg gat cgt etc gac gtt
Asp Gly lie Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val 35 40 45 aca get tac tac aat ccc aac aaa gcc aeg aaa gac aag ate tac tgc
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys lie Tyr Cys 50 55 60 aaa egg ggt ggc ttc ate ccg aac tat gac ttc gac ccc ege gaa ttt
Lys Arg Gly Gly Phe lie Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe 65 70 75 80 ggg etc aac atg ttt caa atg gaa gac tet gat geg aat cag aca ett
Gly Leu Asn Met Phe Gin Met Glu Asp Ser Asp Ala Asn Gin Thr Leu 85 90 95 acc ttg etc aaa gtc aaa caa get etc gaa gat gca age ata gag cct
Thr Leu Leu Lys Val Lys Gin Ala Leu Glu Asp Ala Ser lie Glu Pro 100 105 110 ttc acc aag gag aag aag aac att gga tgt gtt tta ggt att ggt ggg
Phe Thr Lys Glu Lys Lys Asn lie Gly Cys Val Leu Gly lie Gly Gly 115 120 125 ggc caa aag geg agt cat gag ttc tac tet cgt etc aac tac gtt gtc
Gly Gin Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val 130 135 140 gtt gaa aag gta ett egg aaa atg ggt tta cca gat get gat gtt gaa
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu 145 150 155 160 gaa get gtg gag aaa tac aag gca aat ttt ccc gag tgg ege eta gac
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp 165 170 175 tet ttc cct ggg ttt ett ggg aat gta aeg get ggt egg tgc agt aac
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn 334 200813222 180 185 190 acc ttc aac atg gaa ggt atg aac tgc gtt gtg gat get gca tgt gee 624
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala 195 200 205 agt tet eta att gca ate aag gtt gca gtt gaa gag eta etc ttt ggt 672
Ser Ser Leu lie Ala lie Lys Val Ala Val Glu Glu Leu Leu Phe Gly 210 215 220 gac tgt gac acc atg att gca ggt gee acc tgc aeg gac aat tea ett 720
Asp Cys Asp Thr Met lie Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu 225 230 235 240 - ggc atg tac atg gee ttc tet aaa aeg cca gtt ttt tet act gac cca 768
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro e 245 250 255 ' agt gtc ege geg tat gat gag aaa aca aaa ggg atg eta att gga gaa 816 一 Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu lie Gly Glu 260 265 270 L ggt tea gca atg ttc gtt ett aaa ege tat geg gat gee gta cgt gat 864
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp 275 280 285 ’ ggc gac aca att cac geg gtt ctg cgt tet tgc tet teg tet agt gat 912
Glv Asn Thr Up Hi^ Ala Val Leu Arp· Ser Cvs Ser Spr Ser Ser Asn ^ 290 295 300 ^ gga aaa geg gca gga att tat act cct act ata tet gga caa gaa gaa 960
Gly Lys Ala Ala Gly lie Tyr Thr Pro Thr lie Ser Gly Gin Glu Glu 305 310 315 320 get ttg cgt ega geg tat gee cgt geg ggg gta tgt cca tet aeg ate 1008
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr lie 325 330 335 ggg ett gtt gag ggt cac ggg aca ggg acc cct gtt gga gat ege att 1056
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg lie 340 345 350 gag tta aca get ctg egg aac ttg ttt gac aaa get ttt ggt age aag 1104
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys 355 360 365 aag gaa caa ata gca gtt ggc age ata aag tet cag ata ggt cac ctg 1152
Lys Glu Gin lie Ala Val Gly Ser lie Lys Ser Gin lie Gly His Leu 370 375 380 \ aaa tet gtt gee ggc ttt gee ggc ttg gtc aaa get gtg ett geg ett 1200
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu 385 390 395 400 aaa cac aaa aeg etc cca ggt teg att aat gtc gac cag cca cct ttg 1248 . Lys His Lys Thr Leu Pro Gly Ser lie Asn Val Asp Gin Pro Pro Leu 405 410 415 ttg tat gac ggt act caa att caa gac tet tet tta tat ate aac aag 1296 •、 Leu Tyr Asp Gly Thr Gin lie Gin Asp Ser Ser Leu Tyr lie Asn Lys 420 425 430 aca aat aga cca tgg ttt aeg caa aac aag ett ccg cgt egg get ggt 1344
Thr Asn Arg Pro Trp Phe Thr Gin Asn Lys Leu Pro Arg Arg Ala Gly 435 440 445 gtc tea agt ttt gga ttt gga ggt gca aac tac cac geg gtt ctg gaa 1392
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu 450 455 460 gaa ttc gag ccc gag cat gaa aaa cca tac ege etc aat act gtt gga 1440
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly 465 470 475 480 cat cct gtc etc ttg tac get ccg tet gtg gaa gee etc aaa gta ett 1488 335 1500 1500200813222
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu 485 490 495 tgc aac gac cag Cys Asn Asp Gin 500
<210〉 41 <211> 500 <212〉 PRT <213>破囊壺菌(11^1131:〇(:1171:1'丨111113口·) <400〉 41
Met Lys Asp Met Glu Asp Arg Arg Val Ala lie Val Gly Met Ser Ala 15 10 15
His Leu Pro Cys Gly Thr Asp Val Lys Glu Ser Trp Gin Ala lie Arg 20 25 30
Asp Gly lie Asp Cys Leu Ser Asp Leu Pro Ala Asp Arg Leu Asp Val 35 40 45
Thr Ala Tyr Tyr Asn Pro Asn Lys Ala Thr Lys Asp Lys lie Tyr Cys 50 55 60
Lys Arg Gly Gly Phe lie Pro Asn Tyr Asp Phe Asp Pro Arg Glu Phe 65 70 75 80
Gly Leu Asn Met Phe Gin Met Glu Asp Ser Asp Ala Asn Gin Thr Leu 85 90 95
Thr Leu Leu Lys Val Lys Gin Ala Leu Glu Asp Ala Ser lie Glu Pro 100 105 110
Phe Thr Lys Glu Lys Lys Asn lie Gly Cys Val Leu Gly lie Gly Gly 115 120 125
Gly Gin Lys Ala Ser His Glu Phe Tyr Ser Arg Leu Asn Tyr Val Val 130 135 140
Val Glu Lys Val Leu Arg Lys Met Gly Leu Pro Asp Ala Asp Val Glu 145 150 155 160
Glu Ala Val Glu Lys Tyr Lys Ala Asn Phe Pro Glu Trp Arg Leu Asp 165 170 175
Ser Phe Pro Gly Phe Leu Gly Asn Val Thr Ala Gly Arg Cys Ser Asn 180 185 190
Thr Phe Asn Met Glu Gly Met Asn Cys Val Val Asp Ala Ala Cys Ala 195 200 205
Ser Ser Leu lie Ala lie Lys Val Ala Val Glu Glu Leu Leu Phe Gly 210 215 220
Asp Cys Asp Thr Met lie Ala Gly Ala Thr Cys Thr Asp Asn Ser Leu 225 230 235 240 336 200813222
Gly Met Tyr Met Ala Phe Ser Lys Thr Pro Val Phe Ser Thr Asp Pro 245 250 255
Ser Val Arg Ala Tyr Asp Glu Lys Thr Lys Gly Met Leu lie Gly Glu 260 265 270
Gly Ser Ala Met Phe Val Leu Lys Arg Tyr Ala Asp Ala Val Arg Asp 275 280 285
Gly Asp Thr lie His Ala Val Leu Arg Ser Cys Ser Ser Ser Ser Asp 290 295 300
Gly Lys Ala Ala Gly lie Tyr Thr Pro Thr lie Ser Gly Gin Glu Glu 305 310 315 320
Ala Leu Arg Arg Ala Tyr Ala Arg Ala Gly Val Cys Pro Ser Thr lie 325 330 335
Gly Leu Val Glu Gly His Gly Thr Gly Thr Pro Val Gly Asp Arg lie 340 345 350
Glu Leu Thr Ala Leu Arg Asn Leu Phe Asp Lys Ala Phe Gly Ser Lys 355 360 365
Lys Glu Gin lie Ala Val Gly Ser lie Lys Ser Gin lie Gly His Leu 370 375 380
Lys Ser Val Ala Gly Phe Ala Gly Leu Val Lys Ala Val Leu Ala Leu 385 390 395 400
Lys His Lys Thr Leu Pro Gly Ser lie Asn Val Asp Gin Pro Pro Leu 405 410 415
Leu Tyr Asp Gly Thr Gin lie Gin Asp Ser Ser Leu Tyr lie Asn Lys 420 425 430
Thr Asn Arg Pro Trp Phe Thr Gin Asn Lys Leu Pro Arg Arg Ala Gly 435 440 445
Val Ser Ser Phe Gly Phe Gly Gly Ala Asn Tyr His Ala Val Leu Glu 450 455 460
Glu Phe Glu Pro Glu His Glu Lys Pro Tyr Arg Leu Asn Thr Val Gly 465 470 475 480
His Pro Val Leu Leu Tyr Ala Pro Ser Val Glu Ala Leu Lys Val Leu 485 490 495
Cys Asn Asp Gin 500
<210> 42 <211〉 1500 <212〉 DNA <213>破囊壺菌(11^31131:〇(:1^1:1'丨111113口.) 337 <220〉 48 200813222 <221〉 CDS <222〉 (1)..(1500) <400> 42 ctt gcg gag etc aca att gca ttg gaa gag gca aaa aca cat aaa aat
Leu Ala Glu Leu Thr lie Ala Leu Glu Glu Ala Lys Thr His Lys Asn 15 10 15 gtt gac aaa gtt tgt ggc tac aag ttt att gac gaa ttt cag etc caa
Val Asp Lys Val Cys Gly Tyr Lys Phe lie Asp Glu Phe Gin Leu Gin 20 25 30 gga age tgt cct cca gaa aat ccg aga gta gga ttt tta gca aca ctg
Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe Leu Ala Thr Leu 35 40 45 cct act tea aat ate att gtc gcg ctt aag gca att etc gcg cag ctt
Pro Thr Ser Asn lie lie Val Ala Leu Lys Ala lie Leu Ala Gin Leu 50 55 60 gat gca aaa cca gat gcg aag aaa tgg gat ttg cct cat aaa aag get
Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro His Lys Lys Ala 65 70 75 80 ttt ggg get acc ttc gca teg tet tea gtg aaa ggc tet gtt get gcg
Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly Ser Val Ala Ala 85 90 95 etc ttc gca gga cag ggt acc cag tac tta aac atg ttc tet gat gtg
Leu Phe Ala Gly Gin Gly Thr Gin Tyr Leu Asn Met Phe Ser Asp Val 100 105 110 gca atg aac tgg cca ccg ttc cgt gac age att gtc gca atg gaa gaa
Ala Met Asn Trp Pro Pro Phe Arg Asp Ser lie Val Ala Met Glu Glu 115 120 125 get caa act gag gta ttt gag ggc caa gtt gaa cca att age aaa gtt
Ala Gin Thr Glu Val Phe Glu Gly Gin Val Glu Pro lie Ser Lys Val 130 135 140 ctg ttt cca ega gag ege tat gca tee gaa agt gaa cag ggg aat gaa
Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu Gin Gly Asn Glu 145 150 155 160 ctt ctt tgc tta aca gag tac tet cag cca act aeg ata gca gee gca
Leu Leu Cys Leu Thr Glu Tyr Ser Gin Pro Thr Thr lie Ala Ala Ala 165 170 175 gta ggg gee ttc gat att ttc aaa gcg get ggc ttt aag cca gac atg
Val Gly Ala Phe Asp lie Phe Lys Ala Ala Gly Phe Lys Pro Asp Met 180 185 190 gtt gga ggg cat tea ctt ggc gaa ttt get get ttg tac gcg get ggg
Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly 195 200 205 tee att teg cgt gac gac ctg tac aag ctt gtg tgc aaa egg gca aag
Ser lie Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys Lys Arg Ala Lys 210 215 220 gca atg gcg aac get agt gac gga get atg gca gca gtg att ggc cca
Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala Val lie Gly Pro 225 230 235 240 gat gca cgt eta gtt aeg cca caa aat agt gac gtt tat gtc gca aac
Asp Ala Arg Leu Val Thr Pro Gin Asn Ser Asp Val Tyr Val Ala Asn 245 250 255 ttc aac tee gca act caa gta gtc ate agt ggc act gtt caa ggt gtg
Phe Asn Ser Ala Thr Gin Val Val lie Ser Gly Thr Val Gin Gly Val 260 265 270 aaa gaa gag teg aaa ttg etc att tea aag ggg ttc ege gta ctg cca
Lys Glu Glu Ser Lys Leu Leu lie Ser Lys Gly Phe Arg Val Leu Pro 275 280 285 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 338 864 912 200813222 ctt aaa tgc cag ggc gcc ttc cat tct cct ttg atg ggg cct tct gag
Leu Lys Cys Gin Gly Ala Phe His Ser Pro Leu Met Gly Pro Ser Glu 290 295 300 gat agt ttc aaa tea ctt gtg gag act tgt acc ate teg ccg cca aaa
Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr lie Ser Pro Pro Lys 305 310 315 320 aat gtg aaa ttc ttt tgc aat gtt agt ggc aag gaa age cca aac cca
Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu Ser Pro Asn Pro 325 330 335 aaa cag acc etc aag tea cac atg aeg tct age gtt cag ttc gag gag
Lys Gin Thr Leu Lys Ser His Met Thr Ser Ser Val Gin Phe Glu Glu 340 345 350 cag att cgt aac atg tac gat gcc gga gca cgt gtt ttt ctg gag ttt
Gin lie Arg Asn Met Tyr Asp Ala Gly Ala Arg Val Phe Leu Glu Phe 355 360 365 gga ccc ege caa gtc ctt gca aag ctt ate geg gaa atg ttt ccc teg
Gly Pro Arg Gin Val Leu Ala Lys Leu lie Ala Glu Met Phe Pro Ser 370 375 380 tgt aca get ate age gtt aac ccc geg age agt ggt gac agt gac gtg
Cys Thr Ala lie Ser Val Asn Pro Ala Ser Ser Gly Asp Ser Asp Val 385 390 395 400 caa etc ege etc gcc gcc gta aaa ttc geg gtc teg ggt gca gcc ctt
Gin Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser Gly Ala Ala Leu 405 410 415 age acc ttt gat cca tgg gag tat ege aag cca caa gat ctt ctt att
Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gin Asp Leu Leu lie 420 425 430 ega aaa cca ega aaa act gcc ctt gtt eta tea gca gca aca tat gtt
Arg Lys Pro Arg Lys Thr Ala Leu Val Leu Ser Ala Ala Thr Tyr Val 435 440 445 tee cca aag act ctt gca gaa cgt aaa aag get atg gaa gat ate aag
Ser Pro Lys Thr Leu Ala Glu Arg Lys Lys Ala Met Glu Asp lie Lys 450 455 460 eta gta tee att aca cca aga gat agt atg gta tea att gga aaa ate
Leu Val Ser lie Thr Pro Arg Asp Ser Met Val Ser lie Gly Lys lie 465 470 475 480 geg caa gaa gta egg aca get aaa cag cct tta gaa acc gaa att ega
Ala Gin Glu Val Arg Thr Ala Lys Gin Pro Leu Glu Thr Glu lie Arg 485 490 495 aga etc aac aaa Arg Leu Asn Lys 500
<210〉 43 <211> 500 <212〉 PRT <213>破囊壺菌(11^1131:〇(:11>^1'丨111113?.) <400> 43
Leu Ala Glu Leu Thr lie Ala Leu Glu Glu Ala Lys Thr His Lys Asn 1 5 10 15
Val Asp Lys Val Cys Gly Tyr Lys Phe lie Asp Glu Phe Gin Leu Gin 20 25 30
Gly Ser Cys Pro Pro Glu Asn Pro Arg Val Gly Phe Leu Ala Thr Leu 35 40 45 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1500 339 200813222
Pro Thr Ser Asn lie lie Val Ala Leu Lys Ala lie Leu Ala Gin Leu 50 55 60
Asp Ala Lys Pro Asp Ala Lys Lys Trp Asp Leu Pro His Lys Lys Ala 65 70 75 80
Phe Gly Ala Thr Phe Ala Ser Ser Ser Val Lys Gly Ser Val Ala Ala 85 . 90 95
Leu Phe Ala Gly Gin Gly Thr Gin Tyr Leu Asn Met Phe Ser Asp Val 100 105 110
Ala Met Asn Trp Pro Pro Phe Arg Asp Ser lie Val Ala Met Glu Glu 115 120 125
Ala Gin Thr Glu Val Phe Glu Gly Gin Val Glu Pro lie Ser Lys Val 130 135 140
Leu Phe Pro Arg Glu Arg Tyr Ala Ser Glu Ser Glu Gin Gly Asn Glu 145 150 155 160
Leu Leu Cys Leu Thr Glu Tyr Ser Gin Pro Thr Thr lie Ala Ala Ala 165 170 175
Val Gly Ala Phe Asp lie Phe Lys Ala Ala Gly Phe Lys Pro Asp Met 180 185 190
Val Gly Gly His Ser Leu Gly Glu Phe Ala Ala Leu Tyr Ala Ala Gly 195 200 205
Ser lie Ser Arg Asp Asp Leu Tyr Lys Leu Val Cys Lys Arg Ala Lys 210 215 220
Ala Met Ala Asn Ala Ser Asp Gly Ala Met Ala Ala Val lie Gly Pro 225 230 235 240
Asp Ala Arg Leu Val Thr Pro Gin Asn Ser Asp Val Tyr Val Ala Asn 245 250 255
Phe Asn Ser Ala Thr Gin Val Val lie Ser Gly Thr Val Gin Gly Val 260 265 270
Lys Glu Glu Ser Lys Leu Leu lie Ser Lys Gly Phe Arg Val Leu Pro 275 280 285
Leu Lys Cys Gin Gly Ala Phe His Ser Pro Leu Met Gly Pro Ser Glu 290 295 300
Asp Ser Phe Lys Ser Leu Val Glu Thr Cys Thr lie Ser Pro Pro Lys 305 310 315 320
Asn Val Lys Phe Phe Cys Asn Val Ser Gly Lys Glu Ser Pro Asn Pro 325 330 335
Lys Gin Thr Leu Lys Ser His Met Thr Ser Ser Val Gin Phe Glu Glu 340 200813222 340 345 350
Gin lie Arg Asn Met Tyr Asp Ala Gly Ala Arg Val Phe Leu Glu Phe 355 360 365
Gly Pro Arg Gin Val Leu Ala Lys Leu lie Ala Glu Met Phe Pro Ser 370 375 380
Cys Thr Ala lie Ser Val Asn Pro Ala Ser Ser Gly Asp Ser Asp Val 385 390 395 400
Gin Leu Arg Leu Ala Ala Val Lys Phe Ala Val Ser Gly Ala Ala Leu 405 410 415
Ser Thr Phe Asp Pro Trp Glu Tyr Arg Lys Pro Gin Asp Leu Leu lie 420 425 430
Arp Lvs Prn Arp· Lvs 丁hr Ala Le11 Vgl Leu Sp” Ala Ala Thr Tvr Val 435 ° 440 445 "· *
Ser Pro Lvs Thr Leu Ala Glu Ars Lvs Lys Ala Met Glu Asp lie Lys 450 455 460 _
Leu Val Ser lie Thr Pro Arg Asp Ser Met Val Ser lie Gly Lys lie 465 470 475 480
Ala Gin Glu Val Arg Thr Ala Lys Gin Pro Leu Glu Thr Glu lie Arg 485 490 495
Arg Leu Asn Lys 500
<210> 44 <211> 351 <212> DNA <213> 破囊壺菌(Thraustochytrium sp.) <220>
v <221> CDS <222〉 (1)..(351) : <400> 44 48 96 144 192 240 288 teg acc cca geg tea gag egg teg get tea ccg ett ttc gag aaa ege -· Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg 一 15 10 15 agt teg gtt teg tea gca ege etc get gaa get gaa gcc geg gta ctg • 、 Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu 20 25 30 age gtt etc gca gac aag aca ggc tac gac age tea atg ate gag atg
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met 35 40 45 gac atg gac ctg gag agt gag ett ggc gtt gat age ate aaa ege gtg
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 50 55 60 gag ate atg age gag gtt caa aeg ctg etc age gtg gaa gtc tcc gac
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 65 70 75 80 gtt gac get ctg tea aga acc aag act gtt ggc gac gtc ate gag geg 341 336 200813222
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala 85 90 95 atg aag ctg gaa etc ggt gga ccc caa ggc cag act ttg acc geg gaa
Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu 100 105 110 351 teg ate cgt cag cca
Ser lie Arg Gin Pro 115
<210> 45 <211〉 117 <212> PRT <213>破囊壺菌(1!^1131:〇(:]1丫1:1'丨111113口·) <400> 45
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg 15 10 15
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu 20 25 30
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met 35 40 45
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 50 55 60
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 65 70 75 80
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala 85 90 95
Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu 100 105 110
Ser lie Arg Gin Pro 115
<210> 46 <211> 5 <212> PRT <213>破囊壺菌(11^1131:〇(:1171:1^111113口·) <220〉 <221〉 MISC一FEATURE <222〉 (1)..(5) <223> Xaa = any amino acid <400> 46
Leu Gly Xaa Asp Ser
<210> 47 <211> 2790 <212> DNA <213> 破囊壺菌(Thraustochytrium sp.) 342 <220〉 48 48
200813222 <221> CDS <222〉 (1)..(2790) <400> 47 teg acc cca geg tea gag egg teg get tea ccg ett ttc gag aaa ege
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg 15 10 15 agt teg gtt teg tea gca ege etc get gaa get gaa gee geg gta ctg
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu 20 25 30 age gtt etc gca gac aag aca ggc tac gac age tea atg ate gag atg
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met 35 40 45 gac atg gac ctg gag agt gag ett ggc gtt gat age ate aaa ege gtg
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 50 55 60 gag ate atg age gag gtt caa aeg ctg etc age gtg gaa gtc tee gac
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 65 70 75 80 gtt gac get ctg tea aga acc aag act gtt ggc gac gtc ate gag geg
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala 85 90 95
atg aag ctg gaa etc ggt gga ccc caa ggc cag act ttg acc geg gaa Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu 100 105 HO teg ate cgt cag cca ccg gtg tee gag cct get gta ccg acc tea teg
Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser 115 120 125 tea age agt att get aat gtt teg tea gca ege etc get gaa get gaa
Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 130 135 140 get geg gta ctg age gtt etc gca gac aag aca ggc tac gac age tea
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser 145 150 155 160 atg ate gag atg gac atg gac ctg gag age gag ett ggc gtt gat age
Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser 165 170 175 ate aaa ege gtg gag ate atg age gag gtt caa aeg ctg etc age gtg lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val 180 185 190 gaa gtc tee gac gtt gac get ctg tea aga act aag act gtt ggc gac
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp 195 200 205 gtc ate gag geg atg aag ctg gaa etc ggt gga ccc caa ggc cag act Val lie Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr 210 215 220 tg acc geg gaa teg ate cgt cag cca ccg gtg tet gag cct get gta .eu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val 225 230 235 240 ccg acc tea teg tea age agt att get aat gtt teg tea gca ege etc Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu 245 250 255 get gaa get gaa geg geg gta ctg age gtt etc gca gac aag aca ggc Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly 260 265 270 tac gac age tea atg ate gag atg gac atg gac ctg gag age gag ett Tvr Asn Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu 275 280 285 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 343 864 912 200813222 ggc gtc gac age ate aaa cgc gtg gag ate atg age gag gtt caa acg
Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr 290 295 300 ctg etc age gtg gaa gtc tee gac gtt gac get ctg tea aga acc aag
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys 305 310 315 320 act gtt ggc gac gtc ate gag geg atg aag ctg gaa etc ggt gga ccc
Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly Gly Pro 325 330 335 caa ggc cag act ttg acc geg gaa teg ate cgt cag cca ccg gtg tee
Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser 340 345 350 gag cct get gta ccg acc tea teg tea age agt att get aat gtt ttg
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Leu 355 360 365 tea gca ege etc get gaa get gaa gee geg gta ctg age gtt etc gca
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala 370 375 380 gac aag aca ggc tac gac age tea atg ate gag atg gac atg gac ctg
Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu 385 390 395 400 gag age gag ett ggc gtt gat age ate aaa ege gtg gag ate atg age
Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser 405 410 415 gag gtt caa aeg ttg etc age gtg gaa gtc tee gac gtt gac get ctg
Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 420 425 430 tea aga acc aag act gtt ggc gac gtc ate gag geg atg aag ctg gaa
Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu 435 440 445 etc ggt gga ccc caa ggc cag act ttg acc geg gaa teg ate cgt cag
Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin 450 455 460 cca ccg gtg tet gag cct get gta ccg acc tea teg tea age agt att
Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie 465 470 475 480 get aat gtt teg tea gca ege etc get gaa get gaa gee geg gta ctg
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu 485 490 495 age gtt etc gca gac aag aca ggc tac gac age tea atg ate gag atg
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met 500 505 510 gac atg gac ctg gag agt gag ett ggc gtc gac age ate aaa ege gtg
Xsp Met Asp Leu Slu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 515 520 525 gag ate atg age gag gtt caa aeg ctg etc age gtg gaa gtc tee gac
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 530 535 540 gtt gac get ctg tea aga acc aag act gtt ggc gac gtc ate gag geg
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala 545 550 555 560 atg aag ctg gaa etc ggt gga ccc caa ggc cag act ttg acc tet gaa
Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ser Glu 565 570 575 ccg ate cat cag cca cca gtg tee gag cct get gta ccg acc tea teg
Pro lie His Gin Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1536 1584 1632 1680 1728 1776 344 200813222 580 585 590 tea age agt att get aat gtt tet tea gca ege etc get gaa get gaa 1824 Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 595 600 605 gee geg gta ctg age gtt etc gca gac aag aca ggc tac gac age tea 1872 Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser 610 615 620 atg ate gag atg gac atg gac ctg gag age gag ett ggc gtt gat age 1920 Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser 625 630 635 640 . ate aaa ege gtg gaa ate atg age gag gtt caa aeg ctg etc age gtg 1968 lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val 645 650 655 gaa gtc tee gac gtt gac get ctg tea aga acc aag act gtt ggc gac 2016 * Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp 660 665 670 • gtc ate gag geg atg aag atg gaa etc ggt gga ccc caa ggc cag act 2064 Val Tie Gin Ala Met Lys Met Gin Leu Gly Gly Pro Gin Gly Gin Thr 675 680 685 ttg acc geg gaa teg ate cgt cag cca ccg gtg tet gag cct get gta 2112 Leu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val 690 695 700 ccg acc tea teg tea age agt att get aat gtt teg tea gca ege etc 2160 Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu 705 710 715 720 get gaa get gaa geg geg gta ctg age gtt etc gca gac aag aca ggc 2208 Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly 725 730 735 tac gac age tea atg ate gag atg gac atg gac ctg gag age gag ett 2256 Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu 740 745 750 ggc gtt gat age ate aaa ege gtg gag ate atg age gag gtt caa geg 2304 Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu Val Gin Ala 755 760 765 ctg etc age gtg gaa gtc tee gac gtt gac get ctg tea aga acc aag 2352 Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys 770 775 780 % act gtt ggc gac gtc ate gag geg atg aag atg gaa etc ggt gga ccc 2400 Thr Val Gly Asp Val lie Glu Ala Met Lys Met Glu Leu Gly Gly Pro 785 790 795 800 caa ggc cag act ttg acc gca gaa teg ate cgt gag cca ccg gtg tet 2448 -· Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Glu Pro Pro Val Ser 805 810 815 gag cct get gta ccg acc tea teg tea agt agt ate get aat gtt tet 2496 w v Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser 820 825 830 tea get ege etc get gaa get gaa gee geg gta ctg age gtt etc gca 2544 Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala 835 840 845 gac aag aca ggc tac gac age tea atg ate gag atg gac atg gac ctg 2592 Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu 850 855 860 gag agt gag ett ggc gtc gac age ate aaa ege gtg gag ate atg age 2640 Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser 865 870 875 880 gag gtt caa aeg ttg etc age gtg gaa gtc tee gac gtt gac get ctg 2688 345 200813222
Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 885 890 895 2736 2784 2790 tea aga acc aag act gtt ggc gac gtc ate gag geg atg aag ctg gaa
Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu 900 905 910 ett ggg gaa tea tea agt att gag act etc aat tgt acc gag gtt gag
Leu Gly Glu Ser Ser Ser lie Glu Thr Leu Asn Cys Thr Glu Val Glu 915 920 925 cac aeg His Thr 930
<210〉 48 <211> 930 <212> PRT <213>破囊壺菌(11^31131:〇(:1171:1'丨111113?.) <400> 48
Ser Thr Pro Ala Ser Glu Arg Ser Ala Ser Pro Leu Phe Glu Lys Arg 15 10 15
Ser Ser Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu 20 25 30
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met 35 40 45
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 50 55 60
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 65 70 75 80
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala 85 90 95
Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu 100 105 110
Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser 115 120 125
Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 130 135 140
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser 145 150 155 160
Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser 165 170 175 lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val 180 185 190
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp 195 200 205 346 200813222
Val lie Glu Ala Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr 210 215 220
Leu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val 225 230 235 240
Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu 245 250 255
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly 260 265 270
Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu 275 280 285
Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr 290 295 300
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys 305 310 315 320
Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu Leu Gly Gly Pro 325 330 335
Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser 340 345 350
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Leu 355 360 365
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala 370 375 380
Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu 385 390 395 400
Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser 405 410 415
Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 420 425 430
Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu 435 440 445
Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Gin 450 455 460
Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie 465 470 475 480
Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu 485 490 495
Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met 500 505 510 347 200813222
Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val 515 520 525
Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp 530 535 540
Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala 545 550 555 560
Met Lys Leu Glu Leu Gly Gly Pro Gin Gly Gin Thr Leu Thr Ser Glu 565 570 575
Pro lie His Gin Pro Pro Val Ser Glu Pro Ala Val Pro Thr Ser Ser 580 585 590
Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu Ala Glu Ala Glu 595 600 605
Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly Tyr Asp Ser Ser 610 615 620
Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu Gly Val Asp Ser 625 630 635 640 lie Lys Arg Val Glu lie Met Ser Glu Val Gin Thr Leu Leu Ser Val 645 650 655
Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys Thr Val Gly Asp 660 665 670
Val lie Glu Ala Met Lys Met Glu Leu Gly Gly Pro Gin Gly Gin Thr 675 680 685
Leu Thr Ala Glu Ser lie Arg Gin Pro Pro Val Ser Glu Pro Ala Val 690 695 700
Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser Ser Ala Arg Leu 705 710 715 720
Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala Asp Lys Thr Gly 725 730 735
Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu Glu Ser Glu Leu 740 745 750
Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser Glu Val Gin Ala 755 760 765
Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu Ser Arg Thr Lys 770 775 780
Thr Val Gly Asp Val lie Glu Ala Met Lys Met Glu Leu Gly Gly Pro 785 790 795 800
Gin Gly Gin Thr Leu Thr Ala Glu Ser lie Arg Glu Pro Pro Val Ser 805 810 815 348 200813222
Glu Pro Ala Val Pro Thr Ser Ser Ser Ser Ser lie Ala Asn Val Ser 820 825 830
Ser Ala Arg Leu Ala Glu Ala Glu Ala Ala Val Leu Ser Val Leu Ala 835 840 845
Asp Lys Thr Gly Tyr Asp Ser Ser Met lie Glu Met Asp Met Asp Leu 850 855 860
Glu Ser Glu Leu Gly Val Asp Ser lie Lys Arg Val Glu lie Met Ser 865 870 875 880
Glu Val Gin Thr Leu Leu Ser Val Glu Val Ser Asp Val Asp Ala Leu 885 890 895
Ser Arg Thr Lys Thr Val Gly Asp Val lie Glu Ala Met Lys Leu Glu 900 905 910
Leu Gly Glu Ser Ser Ser lie Glu Thr Leu Asn Cys Thr Glu Val Glu 915 920 925
His Thr 930
<210〉 49 <211〉 2433 <212〉 DNA <213>破囊壺菌(1^31!31:0(:1171:1'丨111113口·) <220> <221> CDS <222〉 (1)..(2433) <400> 49 48 96 144 192 240 288 336 aaa agt gtc aag get tea ggg tgt gag aat gta gat acc cgt ttc get
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr Arg Phe Ala 15 10 15 aag gtt gta caa ate teg ett cct age aag ctg aaa tcc act gtg teg ^ Lys Val Val Gin lie Ser Leu Pro Ser Lys Leu Lys Ser Thr Val Ser 20 25 30 ; cac gat ega cct gta att gtt gta gat gat gga aeg ccc tta acc aeg
His Asp Arg Pro Val lie Val Val Asp Asp Gly Thr Pro Leu Thr Thr . 35 40 45 gag ett tgt aaa att ett ggg ggt aat att gtg gtt etc tet tat caa
Glu Leu Cys Lys lie Leu Gly Gly Asn lie Val Val Leu Ser Tyr Gin ^ 50 55 60 ggg aag ccc get ggt cca egg gga gtc gag gtg cca gat ett tcc gag
Gly Lys Pro Ala Gly Pro Arg Gly Val Glu Val Pro Asp Leu Ser Glu 65 70 75 80 gaa gcc eta att caa get ett gca ttg att egg tet aca tat gga gtt
Glu Ala Leu lie Gin Ala Leu Ala Leu lie Arg Ser Thr Tyr Gly Val 85 90 95 cca att ggt ttt att tgt cag caa gtg tet aat gtg age acc aag gca
Pro lie Gly Phe lie Cys Gin Gin Val Ser Asn Val Ser Thr Lys Ala 100 105 110 cag ett tgt tgg gca etc etc gca geg aag cat etc aag aag gat ttg
Gin Leu Cys Trp Ala Leu Leu Ala Ala Lys His Leu Lys Lys Asp Leu 349 384 200813222 115 120 125 aat get gtc tta ccc gat tea aga tee ttc ttc gtc gga gtt gta ege 432
Asn Ala Val Leu Pro Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg 130 135 140 ttg aac ggg aaa ett gga act ttc gaa aac ate age gac ttc tet aaa 480
Leu Asn Gly Lys Leu Gly Thr Phe Glu Asn lie Ser Asp Phe Ser Lys 145 150 155 160 ttt gat ttg aeg aaa gee eta gat tac gga cag cgt ggt tet etc tta 528
Phe Asp Leu Thr Lys Ala Leu Asp Tyr Gly Gin Arg Gly Ser Leu Leu 165 170 175 ggc ctg tgc aag tea eta gac tta gaa tgg gaa cag gtg ttt tgc cgt 576
Gly Leu Cys Lys Ser Leu Asp Leu Glu Trp Glu Gin Val Phe Cys Arg 180 185 190 gga ata gat ett geg tgt gat ett atg cca etc cag gee gca agg ata 624
Gly lie Asp Leu Ala Cys Asp Leu Met Pro Leu Gin Ala Ala Arg lie 195 200 205 etc aga aat gag ett cag tgt ccc aat atg ege ett ege gag gtt ggg 672
Leu Arg Asn Glu Leu Gin Cys Pro Asn Met Arg Leu Arg Glu Val Gly 210 215 220 tac gat att tet ggc gee agg tac acc att tea acc gat gac ctg eta 720
Tyr Asp lie Ser Gly Ala Arg Tyr Thr lie Ser Thr Asp Asp Leu Leu 225 230 235 240 tgt gga ccc teg aag get aaa gta gag gee gca gac ttg ttt ett gtg 768
Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu Phe Leu Val 245 250 255 aca ggt ggc gca ega ggt att aca cct cat tgt gtt cgt gag att gca 816
Thr Gly Gly Ala Arg Gly lie Thr Pro His Cys Val Arg Glu lie Ala 260 265 270 agt ega tee ccc gga acc aca ttt gtg ctg gtt gga aga age gaa atg 864
Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val Gly Arg Ser Glu Met 275 280 285 tee gac gag cct gac tgg get gtt ggc cac tac aat aaa gac ctg gac 912
Ser Asp Glu Pro Asp Trp Ala Val Gly His Tyr Asn Lys Asp Leu Asp 290 295 300 caa age aca atg aaa cac ttg aaa gca aeg cat get get gga ggg gta 960
Gin Ser Thr Met Lys His Leu Lys Ala Thr His Ala Ala Gly Gly Val 305 310 315 320 aaa cct aeg cct aaa gca cat cgt gca ett gtg aac agg gtc act ggc 1008
Lys Pro Thr Pro Lys Ala His Arg Ala Leu Val Asn Arg Val Thr Gly 325 330 335 tea egg gag gta ega gaa tet ett aga gca ate cag gag gca ggg gca 1056
Ser Arg Glu Val Arg Glu Ser Leu Arg Ala lie Gin Glu Ala Gly Ala 340 345 350 aat gtc gaa tat ate gee tgt gat gtt teg gat gaa aac aag gtc ege 1104
Asn Val Glu Tyr lie Ala Cys Asp Val Ser Asp Glu Asn Lys Val Arg 355 360 365 caa ett gtg caa aga gtg gag caa aag tat ggc tgt gaa ata act ggg 1152
Gin Leu Val Gin Arg Val Glu Gin Lys Tyr Gly Cys Glu lie Thr Gly 370 375 380 att tgg cat gca age ggg gtt ett cgt gac aaa ett gtc gag caa aag 1200 lie Trp His Ala Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gin Lys 385 390 395 400 act aca gac gac ttt gag gca gtt ttt ggg acc aag gtg act ggc ett 1248
Thr Thr Asp Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu 405 410 415 gta aac ate gtg tea caa gtc aat atg tet aag eta ega cac ttc ate 1296 350 1344 200813222
Val Asn lie Val Ser Gin Val Asn Met Ser Lys Leu Arg His Phe lie 420 425 430 etc ttc agt tet ttg get gga ttt cat ggg aac aag ggc caa aeg gat
Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gin Thr Asp 435 440 445 tat gca att get aat gaa gcc ttg aac aaa ate geg cat act etc tea
Tyr Ala lie Ala Asn Glu Ala Leu Asn Lys lie Ala His Thr Leu Ser 450 455 460 geg ttt ttg ccc aaa ctg aat gca aag gtg eta gac ttc ggt ccg tgg
Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly Pro Trp 465 470 475 480 gta ggt tea gga atg gta acc gaa aca ett gag aag cat ttt aaa get
Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His Phe Lys Ala 485 490 495 atg ggg gtt cag act att cct etc gag cca gga gca egg act gtt geg
Met Gly Val Gin Thr lie Pro Leu Glu Pro Gly Ala Arg Thr Val Ala 500 505 510 caa ate att ttg gca agt teg cca ccg caa teg ett ttg ggg aac tgg
Gin lie lie Leu Ala Ser Ser Pro Pro Gin Ser Leu Leu Gly Asn Trp 515 520 525 ggc ttt era gcc arc aaa ccg eta caa ege tet aat gta gtc aeg ggc
Gly Phe Pro Ala Thr Lys Pro Leu Gin Arg Ser Asn Val Val Thr Gly 530 535 540 aca etc tet ccg gaa gag ata gaa ttc ate gca gac cac aaa att caa
Thr Leu Ser Pro Glu Glu lie Glu Phe lie Ala Asp His Lys lie Gin 545 550 555 560 ggc ege aag gtg ett ccc atg atg get gca ate ggg ttc atg gcc tet
Gly Arg Lys Val Leu Pro Met Met Ala Ala lie Gly Phe Met Ala Ser 565 570 575 att geg gaa gga etc tac ccg ggg tac aat ctg caa ggc gtg gaa aat lie Ala Glu Gly Leu Tyr Pro Gly Tyr Asn Leu Gin Gly Val Glu Asn 580 585 590 get cag etc ttt caa ggc ttg act ate aac caa gag aca aaa ttt caa
Ala Gin Leu Phe Gin Gly Leu Thr lie Asn Gin Glu Thr Lys Phe Gin 595 600 605 ate act etc att gag gag cac aac tet gag gaa aac ctg gat gtc ctg lie Thr Leu lie Glu Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu 610 615 620 aca tee ett ggt gta atg ttg gaa age ggg aag gtg ett ccc get tac
Thr Ser Leu Gly Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr 625 630 635 640 ega tgt gtt gta tgc ttg aat aca acc cag cag cag ccc aag eta tet
Arg Cys Val Val Cys Leu Asn Thr Thr Gin Gin Gin Pro Lys Leu Ser 645 650 655 cca aaa att ett aac ttg gaa gtt gac cct gca tgc gag gtt aac ccc
Pro Lys lie Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro 660 665 670 tat gat gga aag teg ttg ttc cac ggt ccg ett ttg caa ttc gtt caa
Tyr Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gin Phe Val Gin 675 680 685 caa gtg ttg cac tea agt acc aaa ggc etc gtt gcc aag tgc ege geg
Gin Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg Ala 690 695 700 ett cca ate aaa gaa gcc ate ega ggg cca ttt ate aag caa aca etc
Leu Pro lie Lys Glu Ala lie Arg Gly Pro Phe lie Lys Gin Thr Leu 705 710 715 720 1392 1440 1488 1536 1584 1632 1680 1728 1776 1824 1872 1920 1968 2016 2064 2112 2160 351 200813222 2208 2256 2304 2352 2400 2433 cat gat cca att eta gac gac gtc att ttt cag eta atg etc gtg tgg
His Asp Pro lie Leu Asp Asp Val lie Phe Gin Leu Met Leu Val Trp 725 730 735 tgt cgt aat get eta gga agt gca teg eta ccc aac aga att gaa aag
Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn Arg lie Glu Lys 740 745 750 atg tea tac ttt ggg aat gtc tea gaa ggt age act ttc ttt gee tea
Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser Thr Phe Phe Ala Ser 755 760 765 gtt aca cct gtg gga cca aga gta cca aag gat ccc gtg ate aaa atg
Val Thr Pro Val Gly Pro Arg Val Pro Lys Asp Pro Val lie Lys Met 770 775 780 cag ttt ett etc caa gat gaa tee ggc aac aca ttt tea teg ggg gag
Gin Phe Leu Leu Gin Asp Glu Ser Gly Asn Thr Phe Ser Ser Gly Glu 785 790 795 800 ggc teg gtt gtg ett agt gac gaa etc gtc ttt
Gly Ser Val Val Leu Ser Asp Glu Leu Val Phe 805 810
<210〉 50 <211〉 811 <212> PRT <213>破囊壺菌(11^1131:〇(:11:^:1'丨111113?.) <400> 50
Lys Ser Val Lys Ala Ser Gly Cys Glu Asn Val Asp Thr Arg Phe Ala 15 10 15
Lys Val Val Gin lie Ser Leu Pro Ser Lys Leu Lys Ser Thr Val Ser 20 25 30
His Asp Arg Pro Val lie Val Val Asp Asp Gly Thr Pro Leu Thr Thr 35 40 45
Glu Leu Cys Lys lie Leu Gly Gly Asn lie Val Val Leu Ser Tyr Gin 50 55 60
Gly Lys Pro Ala Gly Pro Arg Gly Val Glu Val Pro Asp Leu Ser Glu 65 70 75 80
Glu Ala Leu lie Gin Ala Leu Ala Leu lie Arg Ser Thr Tyr Gly Val 85 90 95
Pro lie Gly Phe lie Cys Gin Gin Val Ser Asn Val Ser Thr Lys Ala 100 105 110
Gin Leu Cys Trp Ala Leu Leu Ala Ala Lys His Leu Lys Lys Asp Leu 115 120 125
Asn Ala Val Leu Pro Asp Ser Arg Ser Phe Phe Val Gly Val Val Arg 130 135 140
Leu Asn Gly Lys Leu Gly Thr Phe Glu Asn lie Ser Asp Phe Ser Lys 145 150 155 160
Phe Asp Leu Thr Lys Ala Leu Asp Tyr Gly Gin Arg Gly Ser Leu Leu 165 170 175 352 200813222
Gly Leu Cys Lys Ser Leu Asp Leu Glu Trp Glu Gin Val Phe Cys Arg 180 185 190
Gly lie Asp Leu Ala Cys Asp Leu Met Pro Leu Gin Ala Ala Arg lie 195 200 205
Leu Arg Asn Glu Leu Gin Cys Pro Asn Met Arg Leu Arg Glu Val Gly 210 215 220
Tyr Asp lie Ser Gly Ala Arg Tyr Thr lie Ser Thr Asp Asp Leu Leu 225 230 235 240
Cys Gly Pro Ser Lys Ala Lys Val Glu Ala Ala Asp Leu Phe Leu Val 245 250 255
Thr Gly Gly Ala Arg Gly lie Thr Pro His Cys Val Arg Glu lie Ala 260 265 270
Ser Arg Ser Pro Gly Thr Thr Phe Val Leu Val Gly Arg Ser Glu Met 275 280 285
Ser Asp Glu Pro Asp Trp Ala Val Gly His Tyr Asn Lys Asp Leu Asp 290 295 300
Gin Ser Thr Met Lys His Leu Lys Ala Thr His Ala Ala Gly Gly Val 305 310 315 320
Lys Pro Thr Pro Lys Ala His Arg Ala Leu Val Asn Arg Val Thr Gly 325 330 335
Ser Arg Glu Val Arg Glu Ser Leu Arg Ala lie Gin Glu Ala Gly Ala 340 345 350
Asn Val Glu Tyr lie Ala Cys Asp Val Ser Asp Glu Asn Lys Val Arg 355 360 365
Gin Leu Val Gin Arg Val Glu Gin Lys Tyr Gly Cys Glu lie Thr Gly ^ 370 375 380 lie Trp His Ala Ser Gly Val Leu Arg Asp Lys Leu Val Glu Gin Lys 385 390 395 400
Thr Thr Asp Asp Phe Glu Ala Val Phe Gly Thr Lys Val Thr Gly Leu 405 410 415
Val Asn lie Val Ser Gin Val Asn Met Ser Lys Leu Arg His Phe lie 420 425 430
Leu Phe Ser Ser Leu Ala Gly Phe His Gly Asn Lys Gly Gin Thr Asp 435 440 445
Tyr Ala lie Ala Asn Glu Ala Leu Asn Lys lie Ala His Thr Leu Ser 450 455 460
Ala Phe Leu Pro Lys Leu Asn Ala Lys Val Leu Asp Phe Gly Pro Trp 465 470 475 480 353 200813222
Val Gly Ser Gly Met Val Thr Glu Thr Leu Glu Lys His Phe Lys Ala 485 490 495
Met Gly Val Gin Thr lie Pro Leu Glu Pro Gly Ala Arg Thr Val Ala 500 505 510
Gin lie lie Leu Ala Ser Ser Pro Pro Gin Ser Leu Leu Gly Asn Trp 515 520 525
Gly Phe Pro Ala Thr Lys Pro Leu Gin Arg Ser Asn Val Val Thr Gly 530 535 540
Thr Leu Ser Pro Glu Glu lie Glu Phe lie Ala Asp His Lys lie Gin 545 550 555 560
Gly Arg Lys Val Leu Pro Met Met Ala Ala lie Gly Phe Met Ala Ser 565 570 575 lie Ala Glu Gly Leu Tyr Pro Gly Tyr Asn Leu Gin Gly Val Glu Asn 580 585 590
Ala Gin Leu Phe Gin Gly Leu Thr lie Asn Gin Glu Thr Lys Phe Gin 595 600 605 lie Thr Leu lie Glu Glu His Asn Ser Glu Glu Asn Leu Asp Val Leu 610 615 620
Thr Ser Leu Gly Val Met Leu Glu Ser Gly Lys Val Leu Pro Ala Tyr 625 630 635 640
Arg Cys Val Val Cys Leu Asn Thr Thr Gin Gin Gin Pro Lys Leu Ser 645 650 655
Pro Lys lie Leu Asn Leu Glu Val Asp Pro Ala Cys Glu Val Asn Pro 660 665 670
Tyr Asp Gly Lys Ser Leu Phe His Gly Pro Leu Leu Gin Phe Val Gin 675 680 685
Gin Val Leu His Ser Ser Thr Lys Gly Leu Val Ala Lys Cys Arg Ala 690 695 700
Leu Pro lie Lys Glu Ala lie Arg Gly Pro Phe lie Lys Gin Thr Leu 705 710 715 720
His Asp Pro lie Leu Asp Asp Val lie Phe Gin Leu Met Leu Val Trp 725 730 735
Cys Arg Asn Ala Leu Gly Ser Ala Ser Leu Pro Asn Arg lie Glu Lys
Met Ser Tyr Phe Gly Asn Val Ser Glu Gly Ser Thr Phe Phe Ala Ser 755 760 765
Val Thr Pro Val Gly Pro Arg Val Pro Lys Asp Pro Val lie Lys Met 354 200813222 770 775 780
Gin Phe Leu Leu Gin Asp Glu Ser Gly Asn Thr Phe Ser Ser Gly Glu 785 790 795 800
Gly Ser Val Val Leu Ser Asp Glu Leu Val Phe 805 810
<210> 51 <211> 5808 <212〉 DNA <213> 破囊壺菌(Thraustochytrium sp.) <220〉 <221〉 CDS <222〉 (1)..(5805) <220〉 <221> misc_feature <222〉 (1)..(5808) <223> n = a c t or g <400> 51 atg caa ctt cct cca rcr cat tct rcc gat gag aat crc ate rcr Rtc
Met Gin Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg lie Ala Val 15 10 15 gtg ggc atg gcc gtc aaa tat geg ggc tgt gac aat aaa gaa gag ttt
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe 20 25 30 tgg aag act ttg atg aat ggt agt ate aat acc aag teg att teg gca
Trp Lys Thr Leu Met Asn Gly Ser lie Asn Thr Lys Ser lie Ser Ala 35 40 45 gca agg ttg ggc age aat aag cgt gac gaa cac tat gtt cct gaa ega
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg 50 55 60 teg aaa tat gca gat aeg ttc tgt aac gaa agg tac ggt tgt ate cag
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys lie Gin 65 70 75 80 caa ggt aeg gat aat gag cat gac etc etc eta ggt ctt get caa gaa
Gin Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gin Glu get etc get gac get gcc ggg egg atg gag aaa caa cct teg gag geg
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gin Pro Ser Glu Ala 100 105 110 ttc gat ctg gaa aat act ggc ate gtg agt ggg tgc tta tct ttt cca
Phe Asp Leu Glu Asn Thr Gly lie Val Ser Gly Cys Leu Ser Phe Pro 115 120 125 atg gat aac ctg caa gga gag ttg ttg aac ttg tat caa age cat gtg
Met Asp Asn Leu Gin Gly Glu Leu Leu Asn Leu Tyr Gin Ser His Val 130 135 140 gag aaa caa ctt cca cct agt gcc ttg gta gaa gcc gtg aag ctt tgg
Glu Lys Gin Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp 145 150 155 160 tct gag ega cag aaa tct aeg aaa gca cat gca ggg gac aag ege egg
Ser Glu Arg Gin Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg 165 170 175 ttc att gac cca get tct ttt gta get gat aaa ctg aac eta ggc cca
Phe lie Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro 180 185 190 355 624 200813222 eta cat tat geg ate gat gca gca tgc get tet gca ttg tac gtg tta
Leu His Tyr Ala lie Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu 195 200 205 aaa tta get caa gac cac ett gtt tea ggt gee gtt gat atg atg tta
Lys Leu Ala Gin Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu 210 215 220 tgt gga geg aeg tgc ttc cca gaa cca ttc ttc ate ttg tet ggg ttc
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe lie Leu Ser Gly Phe 225 230 235 240 teg act ttt caa geg atg cct gnt ggg gca gat gga gtc tea eta cct
Ser Thr Phe Gin Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro 245 250 255 etc cat aaa aeg agt get ggg etc act cca ggt gaa ggg ggg tee att
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser lie 260 265 270 atg gtg etc aag ega ctg aaa gac get ate aga gat gga aat cac att
Met Val Leu Lys Arg Leu Lys Asp Ala lie Arg Asp Gly Asn His lie 275 280 285 tat ggt gtg etc ett gaa gca aat tta agt aac gca ggt tgt ggg ett
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu 290 295 300 cca etc age ccg cac tta ccg age gaa gaa tea tgt att cgt gat acc
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys lie Arg Asp Thr 305 310 315 320 tac ege cgt get gga gtt get gca gat caa agt att cag tat att gag
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gin Ser lie Gin Tyr lie Glu 325 330 335 tgc cac get aeg gga acc cct ega ggg gat gtc gtg gaa att gag geg
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu lie Glu Ala 340 345 350 gtt gaa aga gtt ttc aag aaa aac gtt cca ege tta ggc teg aeg aaa
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys 355 360 365 gga aat ttt ggt cac teg tta gtt geg get ggt ttc gca ggt atg gca
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala 370 375 380 aag ett ett ett gca atg gaa cat gga gtg att cct ccc aca cca ggt
Lys Leu Leu Leu Ala Met Glu His Gly Val lie Pro Pro Thr Pro Gly 385 390 395 400 ett gat get teg aac cag gca agt gag cac gtt gtg aca aag get ate
Leu Asp Ala Ser Asn Gin Ala Ser Glu His Val Val Thr Lys Ala lie 405 410 415 act tgg cct gag aca cat ggg get cca aaa ega get ggc ett tea gca
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala 420 425 430 ttt gga ttt ggt ggg act aat geg cat gca etc ttc gaa gag ttt aat
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn 435 440 445 gee gag ggc ata agt tat ege cct gga aag cct cca gtc gaa teg aat
Ala Glu Gly lie Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn 450 455 460 acc cgt cct tee gtc gta ata act ggg atg gac tgt acc ttt ggg age
Thr Arg Pro Ser Val Val lie Thr Gly Met Asp Cys Thr Phe Gly Ser 465 470 475 480 ett gaa ggg att gat geg ttc gag act gee ctg tac gag ggg cgt gac
Leu Glu Gly lie Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp 485 490 495 672 720 768 816 864 912 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 356 1488 200813222 gca get cgt gac tta ccc gee aaa cgt tgg agg ttc eta ggt gag gac 1536
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp 500 505 510 ttg gag ttt etc ega gee ate agg etc aag gaa aag cct agg ggt tgt 1584
Leu Glu Phe Leu Arg Ala lie Arg Leu Lys Glu Lys Pro Arg Gly Cys 515 520 525 ttt gtg gag agt gtt gac gtt aac ttt aga egg ctg aaa aeg ccc ttg 1632
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu 530 535 540 aca cca gaa gat atg ttg egg ccc caa caa etc ttg geg gtt tet aeg 1680 - Thr Pro Glu Asp Met Leu Arg Pro Gin Gin Leu Leu Ala Val Ser Thr ^ 545 550 555 560 - atg gac ega gca att ate gat gca ggt eta aag aag ggc caa cat gta 1728 ' Met Asp Arg Ala lie lie Asp Ala Gly Leu Lys Lys Gly Gin His Val 565 570 575 - gca gtt ett gtt ggc eta gga act gac ctg gaa ett tac cgt cat ega 1776 - Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg 580 585 590 gca aga gtc geg ett aaa gag gtt ttg cac ccg age tta aag tea gac 1824 f Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp 595 600 605 act gca att etc cag aaa ata atg caa tat gtg aat gat gca gga act 1872
Thr Ala lie Leu Gin Lys lie Met Gin Tyr Val Asn Asp Ala Gly Thr 610 615 620 teg act tea tac aca tet tac att gga aac etc gtt gee aeg cgt att 1920
Ser Thr Ser Tyr Thr Ser Tyr lie Gly Asn Leu Val Ala Thr Arg lie 625 630 635 640 teg tet cag tgg gga ttc aca ggg ccg tee ttt act gtc aca gaa gga 1968
Ser Ser Gin Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly 645 650 655 aat aat tee gtg tac aga tgt gca caa eta gee aaa gat atg ett cag 2016
Asn Asn Ser Val Tyr Arg Cys Ala Gin Leu Ala Lys Asp Met Leu Gin 660 665 670 gtt aac ega gtt gat get gtc gtc ate gca ggc gtt gat etc aac gga 2064
Val Asn Arg Val Asp Ala Val Val lie Ala Gly Val Asp Leu Asn Gly 675 680 685 age gee gaa agt ttt ttt gtc ega gca aat cgt caa aag ata tee aag 2112
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gin Lys lie Ser Lys 690 695 700 - eta agt cat cca tgt gca age ttc gac aga gat gca gat gga ttt ttc 2160
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe ' 705 710 715 720 ’ gca ggt gag ggc tgt ggt gee eta gtt ttc aag agg tta gaa gac tgt 2208
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys ' 725 730 735 get cct cag gaa aaa att tat get agt ata gac tet ate gca ata gat 2256
Ala Pro Gin Glu Lys lie Tyr Ala Ser lie Asp Ser lie Ala lie Asp 740 745 750 aaa gag cct act age tea get gtg aaa get gtc tac caa agt gat teg 2304
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gin Ser Asp Ser 755 760 765 agt etc tee gat att gag ctg tta gaa ate agt gga gac tee aaa egg 2352
Ser Leu Ser Asp lie Glu Leu Leu Glu lie Ser Gly Asp Ser Lys Arg 770 775 780 ttt gca gca ttc gaa ggc get gtg gaa att caa tea agt gtg gaa gee 2400
Phe Ala Ala Phe Glu Gly Ala Val Glu lie Gin Ser Ser Val Glu Ala 357 200813222 785 790 795 800 cag eta aaa gga ett tee aaa gtc ett gaa cct gca aaa ggc caa ggc 2448
Gin Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gin Gly 805 810 815 gta geg gtg gga agt act ega gca acc gtt ggg gat ata ggg tat get 2496
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp lie Gly Tyr Ala 820 825 830 aca gga geg gca age ctg att aaa act gca etc tgc tta tat aat ege 2544
Thr Gly Ala Ala Ser Leu lie Lys Thr Ala Leu Cys Leu Tyr Asn Arg 835 840 845 tac ett ccg gca tta gca aac tgg agt ggc cca tgt gaa cag tee gee 2592
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gin Ser Ala 850 855 860 tgg ggc tea aac atg ttc gtt tgc cat gaa aca egg ccg tgg atg aaa 2640
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys 865 870 875 880 aac cag aat gaa aag aga tgt gee etc att tet gga aca gat cca tet 2688
Asn Gin Asn Glu Lys Arg Cys Ala Leu lie Ser Gly Thr Asp Pro Ser 885 890 895 cat aca tgc ttt tee etc gta eta teg gat act ggg tgt tat gaa gag 2736
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu 900 905 910 cac aat ega aeg tgc ttt gat gtg caa geg cca cag eta gtt ctg ata 2784
His Asn Arg Thr Cys Phe Asp Val Gin Ala Pro Gin Leu Val Leu lie 915 920 925 cac gga ttc gat gga aaa act att gtg egg ega ett gaa gga tat etc 2832
His Gly Phe Asp Gly Lys Thr lie Val Arg Arg Leu Glu Gly Tyr Leu 930 935 940 ett gaa ett gtt gaa ggg cat gca age cct tea gag tat ttc cac aaa 2880
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys 945 950 955 960 ctg att gga caa agt eta ett gag aac teg aaa gaa agt aaa etc aca 2928
Leu lie Gly Gin Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr 965 970 975 ett teg ett gtg tgc aat ccg aac cag etc caa aag gag etc atg ett 2976
Leu Ser Leu Val Cys Asn Pro Asn Gin Leu Gin Lys Glu Leu Met Leu 980 985 990 get ate aaa gga gta caa ega age atg tta aca ggg aag gat tgg gtc 3024
Ala lie Lys Gly Val Gin Arg Ser Met Leu Thr Gly Lys Asp Trp Val 995 1000 1005 agt cca tea gga agt tgt ttt gee cca aat ccg tta tea age gca 3069
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala 1010 1015 1020 aaa gtg gca ttc atg tac gga gaa ggc ega age ccg tac tgt ggt 3114
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly 1025 1030 1035 gta ggc ttg ggt eta cat cgt ttg tgg ccc ggt etc cat gaa aat 3159
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn 1040 1045 1050 gtg aac aat aag aca gtc gat tta tgg aeg gaa gga gat ggt tgg 3204
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp 1055 1060 1065 tta tat cct ega aeg ttg aca ega gaa gag cat aca aaa gee ate 3249
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala lie 1070 1075 1080 gaa tet ttc aac gca aat caa att gaa atg ttt ege get ggg att 3294 358 200813222
Glu Ser Phe Asn Ala Asn Gin lie Glu Met Phe Arg Ala Gly lie 1085 1090 1095 ttc ate tea atg tgt cag aca gac tat gtc atg aat gtt etc ggt
Phe lie Ser Met Cys Gin Thr Asp Tyr Val Met Asn Val Leu Gly 1100 1105 1110 gtc cag cct aag gcc gga ttt ggg ctg age ttg gga gaa att tea
Val Gin Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu lie Ser 1115 1120 1125 atg etc ttt geg atg tea aag gag aac tgc agg cag tea cag gaa
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gin Ser Gin Glu 1130 1135 1140 atg acc aat cgt ttg ege ggt tet cca gtg tgg tet aac gag ett * Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu . 1145 1150 1155 • get ate aac ttc aat gca att ege aag tta tgg aaa ate ccc ega
Ala lie Asn Phe Asn Ala lie Arg Lys Leu Trp Lys lie Pro Arg 一 1160 1165 1170 4 gga get ccc tta gaa tee ttt tgg caa gga tac ttg gtt cac ggc
Gly Ala Pro Leu Glu Ser Phe Trp Gin Gly Tyr Leu Val His Gly 1175 1180 1185 / , aca aga Raa Raa Rta RaR cat Ret att RRt ett tet gag cct tat
Thr Arg Glu Glu Val Glu His Ala lie Gly Leu Ser Glu Pro Tyr 1190 1195 1200 gta cgt ctg ett att gtg aac gat tea agg agt gcc ttg att get
Val Arg Leu Leu lie Val Asn Asp Ser Arg Ser Ala Leu lie Ala 1205 1210 1215 gga aaa cca gac gcc tgt cag gca gta ate agt aga eta aac tee
Gly Lys Pro Asp Ala Cys Gin Ala Val lie Ser Arg Leu Asn Ser 1220 1225 1230 aag ttc cct tet ctg ccg gta aag caa gga atg att ggt cat tgc
Lys Phe Pro Ser Leu Pro Val Lys Gin Gly Met lie Gly His Cys 1235 1240 1245 cca gaa gtt cgt geg ttc ate aaa gat att ggg tac ate cat gaa
Pro Glu Val Arg Ala Phe lie Lys Asp lie Gly Tyr lie His Glu 1250 1255 1260 aca etc ega att tee aat gac tat teg gat tgt cag ett ttc tea
Thr Leu Arg lie Ser Asn Asp Tyr Ser Asp Cys Gin Leu Phe Ser ,, 1265 1270 1275 geg gta acc aag ggc gca ett gac age tee aca atg gaa ate aaa
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu lie Lys , 1280 1285 1290 、 cac ttt gtg gga gag gtc tac tee egg ate gca gac ttt cct caa
His Phe Val Gly Glu Val Tyr Ser Arg lie Ala Asp Phe Pro Gin ' 1295 1300 1305 … ate gtc aac aeg gtg cat teg get ggt tat gac gta ttt ett gag lie Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu 1310 1315 1320 ett ggc tgt gat get tet aga tet gca gca gtt caa aac att ett
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gin Asn lie Leu 1325 1330 1335 ggt ggt caa gga aag ttc ttg tet aca get att gac aaa aaa gga
Gly Gly Gin Gly Lys Phe Leu Ser Thr Ala lie Asp Lys Lys Gly 1340 1345 1350 cac tee gcc tgg tea caa gta ett egg get acc gca tea tta get
His Ser Ala Trp Ser Gin Val Leu Arg Ala Thr Ala Ser Leu Ala 1355 1360 1365 3339 3384 3429 3474 3519 3564 3609 3654 3699 3744 3789 3834 3879 3924 3969 4014 4059 4104 359 200813222 gca cat cga gta ccg gga ate tea att ttg gat ttg ttt cac cca
Ala His Arg Val Pro Gly lie Ser lie Leu Asp Leu Phe His Pro 1370 1375 1380 aat ttc cga gaa atg tgc tgt aca atg gca acc aca cct aaa gtg
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val 1385 1390 1395 gaa gat aag ttc ctg ege aeg att caa ate aat ggt egg ttt gaa
Glu Asp Lys Phe Leu Arg Thr lie Gin lie Asn Gly Arg Phe Glu 1400 1405 1410 aaa gaa atg att cac eta gaa gat aca aca tta agt tgc tta ccc
Lys Glu Met lie His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro 1415 1420 1425 get cca agt gaa gca aat ate gca get att caa tet egg tea att
Ala Pro Ser Glu Ala Asn lie Ala Ala lie Gin Ser Arg Ser lie 1430 1435 1440 cga tet get geg geg cgt tet gga caa tee cat gat tgt gca tee
Arg Ser Ala Ala Ala Arg Ser Gly Gin Ser His Asp Cys Ala Ser 1445 1450 1455 cat age cat gaa gaa aat aag gat tea tgc cct gaa aag ctg aag
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu Lys Leu Lys 1460 1465 1470 ett gat tet gtg tee gtc gee ata aat ttc gac aat gat gac ege
Leu Asp Ser Val Ser Val Ala lie Asn Phe Asp Asn Asp Asp Arg 1475 1480 1485 att cag ett ggg cac geg ggt ttt egg gag atg tac aat aca aga lie Gin Leu Gly His Ala Gly Phe Arg Glu Met Tyr Asn Thr Arg 1490 1495 1500 tat age ttg tac aca ggg geg atg gca aag gga att gca tet gca
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala Ser Ala 1505 1510 1515 gat ett gtc att gee get ggg aaa gag ggc ate eta get tee tat
Asp Leu Val lie Ala Ala Gly Lys Glu Gly lie Leu Ala Ser Tyr 1520 1525 1530 gga get gga gga eta cct ett get act gtt cga aag gga ata gac
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly lie Asp 1535 1540 1545 aaa att caa caa gee ttg cca agt ggc cca tat get gta aat ett
Lys lie Gin Gin Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu 1550 1555 1560 att cac tet ccc ttt gac ggc aac ttg gag cag gga aac gtc gat lie His Ser Pro Phe Asp Gly Asn Leu Glu Gin Gly Asn Val Asp 1565 1570 1575 ttg ttc ttg gaa aag aac gtc ege gtg geg gaa tgt tee geg ttt
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe 1580 1585 1590 aca aeg eta aca gtg cca gta gta cac tat cgt get gca ggg ett
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu 1595 1600 1605 gtt egg ege caa gat gga age att ttg ate aag aac cga ate att
Val Arg Arg Gin Asp Gly Ser lie Leu lie Lys Asn Arg lie lie 1610 1615 1620 get aaa gta tet agg aca gaa etc get gag atg ttc ett cgt ccg
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe Leu Arg Pro 1625 1630 1635 gca cct caa ate ate etc gaa aaa ctg gta gca gca gaa ate att
Ala Pro Gin lie lie Leu Glu Lys Leu Val Ala Ala Glu lie lie 1640 1645 1650 4149 4194 4239 4284 4329 4374 4419 4464 4509 4554 4599 4644 4689 4734 4779 4824 4869 4914 4959 360 200813222 tea tet gac caa geg cgt atg gca gee aaa gtt ccc atg geg gac 5004
Ser Ser Asp Gin Ala Arg Met Ala Ala Lys Val Pro Met Ala Asp 1655 1660 1665 gac ate gca gtc gaa gee gac tet ggt ggg cac aeg gat aat egg 5049
Asp lie Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg 1670 1675 1680 cct atg cac gtc att ttg ccc ctg ata att caa etc ege aat act 5094
Pro Met His Val lie Leu Pro Leu lie lie Gin Leu Arg Asn Thr 1685 1690 1695 ata ett gca gag tat ggc tgt gee aeg get ttt cgt acc cgt ata 5139 - lie Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg Thr Arg lie . 1700 1705 1710 : ggc get gga gga ggc att ggt tgt cct tea geg gee etc gca gee 5184 ‘ Gly Ala Gly Gly Gly lie Gly Cys Pro Ser Ala Ala Leu Ala Ala 1715 1720 1725 ' ttt gat atg ggt geg agt ttt gtc gtg act gga age ata aat caa 5229
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser lie Asn Gin 1730 1735 1740 att tgc ege gag gca ggg act tgc gat act gtt egg gag eta ett 5274 * lie Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu Leu Leu 1745 1750 1755 gee aac tea age tac teg gac gtg aeg atg geg cca gca gca gac 5319
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala Asp 1760 1765 1770 atg ttt gac caa ggt gtg aaa etc caa gtc tta aaa ega gga aeg 5364
Met Phe Asp Gin Gly Val Lys Leu Gin Val Leu Lys Arg Gly Thr 1775 1780 1785 atg ttt cca age aga gca aat aaa etc egg aag etc ttt gtg aac 5409
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn 1790 1795 1800 tac gaa tet eta gaa aca etc ccg teg aaa gag ttg aaa tac ctg 5454
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu 1805 1810 1815 gaa aac ate ata ttc aag caa gca gta gac cag gtg tgg gag gaa 5499
Glu Asn lie lie Phe Lys Gin Ala Val Asp Gin Val Trp Glu Glu 1820 1825 1830 s' aca aag ege ttt tac tgt gaa aaa ctg aac aat cca gat aaa att 5544 ^ Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys lie 1835 1840 1845 r gca agg gee atg aaa gat cct aaa ttg aag atg teg ett tgc ttt 5589
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe -· 1850 1855 1860 egg tgg tat etc tee aag age tet ggg tgg gee aac gca gga att 5634
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn Ala Gly lie 1865 1870 1875 aaa tet cgt gca etc gac tac cag ate tgg tgt ggc ccg gca atg 5679
Lys Ser Arg Ala Leu Asp Tyr Gin lie Trp Cys Gly Pro Ala Met 1880 1885 1890 ggc teg ttc aac aat ttc gee age ggc aca tee etc gat tgg aaa 5724
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu Asp Trp Lys 1895 1900 1905 gtg act ggg gtt ttc cct ggc gtt geg gaa gta aac atg gee att 5769
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn Met Ala lie 1910 1915 1920 tta gat ggc geg ega gaa eta get get aaa ega aat taa 5808
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn 361 200813222 1925 1930 1935
<210〉 52 <211> 1935 <212〉 PRT <213〉破囊壺菌(Thraustochytrium sp.) <220〉 <221> mi sc_feature <222> (248)..(248) <223〉位置248之'Xaa’ 代表 Asp, Gly,Ala,或 Val. <400> 52
Met Gin Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg lie Ala Val 15 10 15
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe 20 25 30
Trp Lys Thr Leu Met Asn Gly Ser lie Asn Thr Lys Ser lie Ser Ala 35 40 45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg 50 55 60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys lie Gin 65 70 75 80
Gin Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gin Glu 85 90 95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gin Pro Ser Glu Ala 100 105 110
Phe Asp Leu Glu Asn Thr Gly lie Val Ser Gly Cys Leu Ser Phe Pro 115 120 125
Met Asp Asn Leu Gin Gly Glu Leu Leu Asn Leu Tyr Gin Ser His Val 130 135 140
Glu Lys Gin Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp 145 150 155 160
Ser Glu Arg Gin Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg 165 170 175
Phe lie Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro 180 185 190
Leu His Tyr Ala lie Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu 195 200 205
Lys Leu Ala Gin Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu 210 215 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe lie Leu Ser Gly Phe 225 230 235 240 362 200813222
Ser Thr Phe Gin Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro 245 250 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser lie 260 265 270
Met Val Leu Lys Arg Leu Lys Asp Ala lie Arg Asp Gly Asn His lie 275 280 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu 290 295 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys lie Arg Asp Thr 305 310 315 320
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gin Ser lie Gin Tyr lie Glu 325 330 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu lie Glu Ala 340 345 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys 355 360 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala 370 375 380
Lys Leu Leu Leu Ala Met Glu His Gly Val lie Pro Pro Thr Pro Gly 385 390 395 400
Leu Asp Ala Ser Asn Gin Ala Ser Glu His Val Val Thr Lys Ala lie 405 410 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala 420 425 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn 435 440 445
Ala Glu Gly lie Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn 450 455 460
Thr Arg Pro Ser Val Val lie Thr Gly Met Asp Cys Thr Phe Gly Ser 465 470 475 480
Leu Glu Gly lie Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp 485 490 495
Ala Ala Arg Asp Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp 500 505 510
Leu Glu Phe Leu Arg Ala lie Arg Leu Lys Glu Lys Pro Arg Gly Cys 515 520 525
Phe Val Glu Ser Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu 530 535 540 363 200813222
Thr Pro Glu Asp Met Leu Arg Pro Gin Gin Leu Leu Ala Val Ser Thr 545 550 555 560
Met Asp Arg Ala lie lie Asp Ala Gly Leu Lys Lys Gly Gin His Val 565 570 575
Ala Val Leu Val Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg 580 585 590
Ala Arg Val Ala Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp 595 600 605
Thr Ala lie Leu Gin Lys lie Met Gin Tyr Val Asn Asp Ala Gly Thr 610 615 620
Ser Thr Ser Tyr Thr Ser Tyr lie Gly Asn Leu Val Ala Thr Arg lie 625 630 635 640
Ser Ser Gin Trp Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly 645 650 655
Asn Asn Ser Val Tyr Arg Cys Ala Gin Leu Ala Lys Asp Met Leu Gin 660 665 670
Val Asn Arg Val Asp Ala Val Val lie Ala Gly Val Asp Leu Asn Gly 675 680 685
Ser Ala Glu Ser Phe Phe Val Arg Ala Asn Arg Gin Lys lie Ser Lys 690 695 700
Leu Ser His Pro Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe 705 710 715 720
Ala Gly Glu Gly Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys 725 730 735
Ala Pro Gin Glu Lys lie Tyr Ala Ser lie Asp Ser lie Ala lie Asp 740 745 750
Lys Glu Pro Thr Ser Ser Ala Val Lys Ala Val Tyr Gin Ser Asp Ser 755 760 765
Ser Leu Ser Asp lie Glu Leu Leu Glu lie Ser Gly Asp Ser Lys Arg 770 775 780
Phe Ala Ala Phe Glu Gly Ala Val Glu lie Gin Ser Ser Val Glu Ala 785 790 795 800
Gin Leu Lys Gly Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gin Gly 805 810 815
Val Ala Val Gly Ser Thr Arg Ala Thr Val Gly Asp lie Gly Tyr Ala 820 825 830
Thr Gly Ala Ala Ser Leu lie Lys Thr Ala Leu Cys Leu Tyr Asn Arg 835 840 845 364 200813222
Tyr Leu Pro Ala Leu Ala Asn Trp Ser Gly Pro Cys Glu Gin Ser Ala 850 855 860
Trp Gly Ser Asn Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys 865 870 875 880
Asn Gin Asn Glu Lys Arg Cys Ala Leu lie Ser Gly Thr Asp Pro Ser 885 890 895
His Thr Cys Phe Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu 900 905 910
His Asn Arg Thr Cys Phe Asp Val Gin Ala Pro Gin Leu Val Leu lie 915 920 925
His Gly Phe Asp Gly Lys Thr lie Val Arg Arg Leu Glu Gly Tyr Leu 930 935 940
Leu Glu Leu Val Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys 945 950 955 960
Leu lie Gly Gin Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr 965 970 975
Leu Ser Leu Val Cys Asn Pro Asn Gin Leu Gin Lys Glu Leu Met Leu 980 985 990
Ala lie Lys Gly Val Gin Arg Ser Met Leu Thr Gly Lys Asp Trp Val 995 1000 1005
Ser Pro Ser Gly Ser Cys Phe Ala Pro Asn Pro Leu Ser Ser Ala 1010 1015 1020
Lys Val Ala Phe Met Tyr Gly Glu Gly Arg Ser Pro Tyr Cys Gly 1025 1030 1035
Val Gly Leu Gly Leu His Arg Leu Trp Pro Gly Leu His Glu Asn 1040 1045 1050
Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu Gly Asp Gly Trp 1055 1060 1065
Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr Lys Ala lie 1070 1075 1080
Glu Ser Phe Asn Ala Asn Gin lie Glu Met Phe Arg Ala Gly lie 1085 1090 1095
Phe lie Ser Met Cys Gin Thr Asp Tyr Val Met Asn Val Leu Gly 1100 1105 1110
Val Gin Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu lie Ser 1115 1120 1125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gin Ser Gin Glu 365 200813222 1130 1135 1140
Met Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu 1145 1150 1155
Ala lie Asn Phe Asn Ala lie Arg Lys Leu Trp Lys lie Pro Arg 1160 1165 1170
Gly Ala Pro Leu Glu Ser Phe Trp Gin Gly Tyr Leu Val His Gly 1175 1180 1185
Thr Arg Glu Glu Val Glu His Ala lie Gly Leu Ser Glu Pro Tyr 1190 1195 1200
Val Arg Leu Leu lie Val Asn Asp Ser Arg Ser Ala Leu lie Ala 1205 1210 1215
Gly Lys Pro Asp Ala Cys Gin Ala Val lie Ser Arg Leu Asn Ser 1220 1225 1230
Lys Phe Pro Ser Leu Pro Val Lys Gin Gly Met lie Gly His Cys 1235 1240 1245
Pro Glu Val Arg Ala Phe lie Lys Asp lie Gly Tyr lie His Glu 1250 1255 1260
Thr Leu Arg lie Ser Asn Asp Tyr Ser Asp Cys Gin Leu Phe Ser 1265 1270 1275
Ala Val Thr Lys Gly Ala Leu Asp Ser Ser Thr Met Glu lie Lys 1280 1285 1290
His Phe Val Gly Glu Val Tyr Ser Arg lie Ala Asp Phe Pro Gin 1295 1300 1305 lie Val Asn Thr Val His Ser Ala Gly Tyr Asp Val Phe Leu Glu 1310 1315 1320
Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gin Asn lie Leu 1325 1330 1335
Gly Gly Gin Gly Lys Phe Leu Ser Thr Ala lie Asp Lys Lys Gly 1340 1345 1350
His Ser Ala Trp Ser Gin Val Leu Arg Ala Thr Ala Ser Leu Ala 1355 1360 1365
Ala His Arg Val Pro Gly lie Ser lie Leu Asp Leu Phe His Pro 1370 1375 1380
Asn Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val 1385 1390 1395
Glu Asp Lys Phe Leu Arg Thr lie Gin lie Asn Gly Arg Phe Glu 1400 1405 1410 366 200813222
Lys Glu Met lie His Leu Glu Asp Thr Thr Leu Ser 1415 1420 1425
Ala Pro Ser Glu Ala Asn lie Ala Ala lie Gin Ser 1430 1435 1440
Arg Ser Ala Ala Ala Arg Ser Gly Gin Ser His Asp 1445 1450 1455
His Ser His Glu Glu Asn Lys Asp Ser Cys Pro Glu 1460 1465 1470
Leu Asp Ser Val Ser Val Ala lie Asn Phe Asp Asn 1475 1480 1485 lie Gin Leu Gly His Ala Gly Phe Arg Glu Met Tyr 1490 1495 1500
Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly lie 1505 1510 1515
Asp Leu Val lie Ala Ala Gly Lys Glu Gly lie Leu 1520 1525 1530
Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys 1535 1540 1545
Lys lie Gin Gin Ala Leu Pro Ser Gly Pro Tyr Ala 1550 1555 1560 lie His Ser Pro Phe Asp Gly Asn Leu Glu Gin Gly 1565 1570 1575
Leu Phe Leu Glu Lys Asn Val Arg Val Ala Glu Cys 1580 1585 1590
Thr Thr Leu Thr Val Pro Val Val His Tyr Arg Ala 1595 1600 1605
Val Arg Arg Gin Asp Gly Ser lie Leu lie Lys Asn 1610 1615 1620
Ala Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe 1625 1630 1635
Ala Pro Gin lie lie Leu Glu Lys Leu Val Ala Ala 1640 1645 1650
Ser Ser Asp Gin Ala Arg Met Ala Ala Lys Val Pro 1655 1660 1665
Asp lie Ala Val Glu Ala Asp Ser Gly Gly His Thr 1670 1675 1680
Pro Met His Val lie Leu Pro Leu lie lie Gin Leu 1685 1690 1695
Cys Leu Pro Arg Ser lie Cys Ala Ser Lys Leu Lys Asp Asp Arg Asn Thr Arg Ala Ser Ala Ala Ser Tyr Gly lie Asp Val Asn Leu Asn Val Asp Ser Ala Phe Ala Gly Leu Arg lie lie Leu Arg Pro Glu lie lie Met Ala Asp Asp Asn Arg Arg Asn Thr 367 200813222 lie Leu Ala Glu Tyr Gly Cys Ala Thr Ala Phe Arg 1700 1705 1710
Gly Ala Gly Gly Gly lie Gly Cys Pro Ser Ala Ala 1715 1720 1725
Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser 1730 1735 1740 lie Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg 1745 1750 1755
Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro 1760 1765 1770
Met Phe Asp Gin Gly Val Lys Leu Gin Val Leu Lys 1775 1780 1785
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu 1790 1795 1800
Tyr Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu 1805 1810 1815
Glu Asn lie lie Phe Lys Gin Ala Val Asp Gin Val 1820 1825 1830
Thr Lys Arg Phe Tyr Cys Glu Lys Leu Asn Asn Pro 1835 1840 1845
Ala Arg Ala Met Lys Asp Pro Lys Leu Lys Met Ser 1850 1855 1860
Arg Trp Tyr Leu Ser Lys Ser Ser Gly Trp Ala Asn 1865 1870 1875
Lys Ser Arg Ala Leu Asp Tyr Gin lie Trp Cys Gly 1880 1885 1890
Gly Ser Phe Asn Asn Phe Ala Ser Gly Thr Ser Leu 1895 1900 1905
Val Thr Gly Val Phe Pro Gly Val Ala Glu Val Asn 1910 1915 1920
Thr Arg lie Leu Ala Ala lie Asn Gin Glu Leu Leu Ala Ala Asp Arg Gly Thr Phe Val Asn Lys Tyr Leu Trp Glu Glu Asp Lys lie Leu Cys Phe Ala Gly lie Pro Ala Met Asp Trp Lys Met Ala lie
Leu Asp Gly Ala Arg Glu Leu Ala Ala Lys Arg Asn 1925 1930 1935 <210〉 53 <211> 1500 <212> DNA <213>破囊壺菌(1!^1^1:〇(:1^1:1'丨111113口·) <220> <221〉 CDS <222> (1)..(1500) 368 48 200813222 <220〉 <221〉mi sc一feature <222〉 (1)..(1500) <223> n = a c t or g <400> 53 atg caa ctt cct cca gcg cat tct gcc gat gag aat cgc ate geg gtc
Met Gin Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg lie Ala Val 15 10 15 gtg ggc atg gcc gtc aaa tat gcg ggc tgt gac aat aaa gaa gag ttt
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe 20 25 30 - tgg aag act ttg atg aat ggt agt ate aat acc aag teg att teg gca
Trp Lys Thr Leu Met Asn Gly Ser lie Asn Thr Lys Ser lie Ser Ala * 35 40 45 ' gca agg ttg ggc age aat aag cgt gac gaa cac tat gtt cct gaa ega ' Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg 50 55 60 h teg aaa tat gca gat aeg ttc tgt aac gaa agg tac ggt tgt ate cag
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys lie Gin 65 70 75 80 ’ caa ggt aeg gat aat gag cat gac etc etc eta ggt ctt get caa gaa
Gin Gly Thr Asd Asn Glu His Asd Leu Leu Leu Gly Leu Ala Gin Glu 85 90 95 get etc get gac get gcc ggg egg atg gag aaa caa cct teg gag gcg
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gin Pro Ser Glu Ala 100 105 110 ttc gat ctg gaa aat act ggc ate gtg agt ggg tgc tta tct ttt cca
Phe Asp Leu Glu Asn Thr Gly lie Val Ser Gly Cys Leu Ser Phe Pro 115 120 125 atg gat aac ctg caa gga gag ttg ttg aac ttg tat caa age cat gtg
Met Asp Asn Leu Gin Gly Glu Leu Leu Asn Leu Tyr Gin Ser His Val 130 135 140 gag aaa caa ctt cca cct agt gcc ttg gta gaa gcc gtg aag ctt tgg
Glu Lys Gin Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp 145 150 155 160 tct gag ega cag aaa tct aeg aaa gca cat gca ggg gac aag cgc egg
Ser Glu Arg Gin Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg 165 170 175 v. / ttc att gac cca get tct ttt gta get gat aaa ctg aac eta ggc cca
Phe lie Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro 180 185 190 eta cat tat gcg ate gat gca gca tgc get tct gca ttg tac gtg tta ·. Leu His Tyr Ala lie Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu 195 200 205 « aaa tta get caa gac cac ctt gtt tea ggt gcc gtt gat atg atg tta 一 Lys Leu Ala Gin Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu 210 215 220 tgt gga gcg aeg tgc ttc cca gaa cca ttc ttc ate ttg tct ggg ttc
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe lie Leu Ser Gly Phe 225 230 235 240 teg act ttt caa gcg atg cct gnt ggg gca gat gga gtc tea eta cct
Ser Thr Phe Gin Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro 245 250 255 etc cat aaa aeg agt get ggg etc act cca ggt gaa ggg ggg tee att
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser lie 260 265 270 atg gtg etc aag ega ctg aaa gac get ate aga gat gga aat cac att 96 144 192 240 288 336 384 432 480 528 576 624 672 720 768 816 864 369 912 200813222
Met Val Leu Lys Arg Leu Lys Asp Ala lie Arg Asp Gly Asn His lie 275 280 285 tat ggt gtg etc ett gaa gca aat tta agt aac gca ggt tgt ggg ett
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Glv Cvs Glv Leu 290 295 300 cca etc age ccg cac tta ccg age gaa gaa tea tgt att cgt gat acc
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys lie Are Asp Thr 305 310 315 320 tac ege cgt get gga gtt get gca gat caa agt att cag tat att gag
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gin Ser lie Gin Tyr lie Glu 325 330 335 tgc cac get aeg gga acc cct ega ggg gat gtc gtg gaa att gag geg
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu lie Glu Ala 340 345 350 gtt gaa aga gtt ttc aag aaa aac gtt cca ege tta ggc teg aeg aaa
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys 355 360 365 gga aat ttt ggt cac teg tta gtt geg get ggt ttc gca ggt atg gca
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala 370 375 380 aag ett ett ett gca atg gaa cat gga gtg att cct ccc aca cca ggt
Lys Leu Leu Leu Ala Met Glu His Gly Val lie Pro Pro Thr Pro Gly 385 390 395 400 ett gat get teg aac cag gca agt gag cac gtt gtg aca aag get ate
Leu Asp Ala Ser Asn Gin Ala Ser Glu His Val Val Thr Lys Ala lie 405 410 415 act tgg cct gag aca cat ggg get cca aaa ega get ggc ett tea gca
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala 420 425 430 ttt gga ttt ggt ggg act aat geg cat gca etc ttc gaa gag ttt aat
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn 435 440 445 gee gag ggc ata agt tat ege cct gga aag cct cca gtc gaa teg aat
Ala Glu Gly lie Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn 450 455 460 acc cgt cct tee gtc gta ata act ggg atg gac tgt acc ttt ggg age
Thr Arg Pro Ser Val Val lie Thr Gly Met Asp Cys Thr Phe Gly Ser 465 470 475 480 ett gaa ggg att gat geg ttc gag act gee ctg tac gag ggg cgt gac
Leu Glu Gly lie Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp 485 490 495 gca get cgt gac Ala Ala Arg Asp 500
<210〉 54 <211〉 500 <212> PRT <213> 破囊壺菌(Thraustochytrium sp.) <220〉 <221〉mi sc一feature <222> (248)..(248) <223> 位置248之 ’Xaa1 代表 Asp, Gly,Ala,或 Val. <400> 54
Met Gin Leu Pro Pro Ala His Ser Ala Asp Glu Asn Arg lie Ala Val 15 10 15 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1500 370 200813222
Val Gly Met Ala Val Lys Tyr Ala Gly Cys Asp Asn Lys Glu Glu Phe 20 25 30
Trp Lys Thr Leu Met Asn Gly Ser lie Asn Thr Lys Ser lie Ser Ala 35 40 45
Ala Arg Leu Gly Ser Asn Lys Arg Asp Glu His Tyr Val Pro Glu Arg 50 55 60
Ser Lys Tyr Ala Asp Thr Phe Cys Asn Glu Arg Tyr Gly Cys lie Gin 65 70 75 80
Gin Gly Thr Asp Asn Glu His Asp Leu Leu Leu Gly Leu Ala Gin Glu 85 90 95
Ala Leu Ala Asp Ala Ala Gly Arg Met Glu Lys Gin Pro Ser Glu Ala 100 105 110
Phe Asp Leu Glu Asn Thr Gly lie Val Ser Gly Cys Leu Ser Phe Pro 115 120 125
Met Asp Asn Leu Gin Gly Glu Leu Leu Asn Leu Tyr Gin Ser His Val 130 135 140
Glu Lys Gin Leu Pro Pro Ser Ala Leu Val Glu Ala Val Lys Leu Trp 145 150 155 160
Ser Glu Arg Gin Lys Ser Thr Lys Ala His Ala Gly Asp Lys Arg Arg 165 170 175
Phe lie Asp Pro Ala Ser Phe Val Ala Asp Lys Leu Asn Leu Gly Pro 180 185 190
Leu His Tyr Ala lie Asp Ala Ala Cys Ala Ser Ala Leu Tyr Val Leu 195 200 205
Lys Leu Ala Gin Asp His Leu Val Ser Gly Ala Val Asp Met Met Leu % J 210 215 220
Cys Gly Ala Thr Cys Phe Pro Glu Pro Phe Phe lie Leu Ser Gly Phe 225 230 235 240
Ser Thr Phe Gin Ala Met Pro Xaa Gly Ala Asp Gly Val Ser Leu Pro 245 250 255
Leu His Lys Thr Ser Ala Gly Leu Thr Pro Gly Glu Gly Gly Ser lie 260 265 270
Met Val Leu Lys Arg Leu Lys Asp Ala lie Arg Asp Gly Asn His lie 275 280 285
Tyr Gly Val Leu Leu Glu Ala Asn Leu Ser Asn Ala Gly Cys Gly Leu 290 295 300
Pro Leu Ser Pro His Leu Pro Ser Glu Glu Ser Cys lie Arg Asp Thr 305 310 315 320 371 200813222
Tyr Arg Arg Ala Gly Val Ala Ala Asp Gin Ser lie Gin Tyr lie Glu 325 330 335
Cys His Ala Thr Gly Thr Pro Arg Gly Asp Val Val Glu lie Glu Ala 340 345 350
Val Glu Arg Val Phe Lys Lys Asn Val Pro Arg Leu Gly Ser Thr Lys 355 360 365
Gly Asn Phe Gly His Ser Leu Val Ala Ala Gly Phe Ala Gly Met Ala 370 375 380
Lys Leu Leu Leu Ala Met Glu His Gly Val lie Pro Pro Thr Pro Gly 385 390 395 400
Leu Asp Ala Ser Asn Gin Ala Ser Glu His Val Val Thr Lys Ala lie 405 410 415
Thr Trp Pro Glu Thr His Gly Ala Pro Lys Arg Ala Gly Leu Ser Ala 420 425 430
Phe Gly Phe Gly Gly Thr Asn Ala His Ala Leu Phe Glu Glu Phe Asn 435 440 445
Ala Glu Gly lie Ser Tyr Arg Pro Gly Lys Pro Pro Val Glu Ser Asn 450 455 460
Thr Arg Pro Ser Val Val lie Thr Gly Met Asp Cys Thr Phe Gly Ser 465 470 475 480
Leu Glu Gly lie Asp Ala Phe Glu Thr Ala Leu Tyr Glu Gly Arg Asp 485 490 495
Ala Ala Arg Asp 500
<210> 55 <211> 1500 <212〉 DNA <213>破囊壺菌(1!^1131:〇(:1^1:1'丨111113口.) <220〉 <221〉 CDS <222> (1)..(1500) <400> 55 tta ccc gcc aaa cgt tgg agg ttc eta ggt gag gac ttg gag ttt etc
Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp Leu Glu Phe Leu 15 10 15 ega gcc ate agg etc aag gaa aag cct agg ggt tgt ttt gtg gag agt
Arg Ala lie Arg Leu Lys Glu Lys Pro Arg Gly Cys Phe Val Glu Ser 20 25 30 aaa aeg ccc ttg aca cca gaa gat Lys Thr Pro Leu Thr Pro Glu Asp 45 geg gtt tet aeg atg gac ega gca Ala Val Ser Thr Met Asp Arg Ala 48 96 144 gtt gac gtt aac ttt aga egg ctg
Val Asp Val Asn Phe Arg Arg Leu 35 40 atg ttg egg ccc caa caa etc ttg
Met Leu Arg Pro Gin Gin Leu Leu 372 192 200813222 50 55 60 att ate gat gca ggt eta aag aag ggc caa cat gta gca gtt ett gtt 240 lie lie Asp Ala Gly Leu Lys Lys Gly Gin His Val Ala Val Leu Val 65 70 75 80 ggc eta gga act gac ctg gaa ett tac cgt cat ega gca aga gtc geg 288
Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala 85 90 95 ett aaa gag gtt ttg cac ccg age tta aag tea gac act gca att etc 336
Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp Thr Ala lie Leu 100 105 110 cag aaa ata atg caa tat gtg aat gat gca gga act teg act tea tac 384
Gin Lys lie Met Gin Tyr Val Asn Asp Ala Gly Thr Ser Thr Ser Tyr ^ 115 120 125 ·' aca tet tac att gga aac etc gtt gee aeg cgt att teg tet cag tgg 432 * Thr Ser Tyr lie Gly Asn Leu Val Ala Thr Arg lie Ser Ser Gin Trp 130 135 140 gga ttc aca ggg ccg tee ttt act gtc aca gaa gga aat aat tee gtg 480
Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly Asn Asn Ser Val 145 150 155 160 ’ tac aga tgt gca caa eta gee aaa gat atg ett cag gtt aac ega gtt 528
Tvr Arg Cvs Ala Gin Leu Ala Lvs Asd Met Leu Gin Val AvSn Arg Val * … 165 170 175 gat get gtc gtc ate gca ggc gtt gat etc aac gga age gee gaa agt 576
Asp Ala Val Val lie Ala Gly Val Asp Leu Asn Gly Ser Ala Glu Ser 180 185 190 ttt ttt gtc ega gca aat cgt caa aag ata tee aag eta agt cat cca 624
Phe Phe Val Arg Ala Asn Arg Gin Lys lie Ser Lys Leu Ser His Pro 195 200 205 tgt gca age ttc gac aga gat gca gat gga ttt ttc gca ggt gag ggc 672
Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe Ala Gly Glu Gly 210 215 220 tgt ggt gee eta gtt ttc aag agg tta gaa gac tgt get cct cag gaa 720
Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys Ala Pro Gin Glu 225 230 235 240 aaa att tat get agt ata gac tet ate gca ata gat aaa gag cct act 768
Lys lie Tyr Ala Ser lie Asp Ser lie Ala lie Asp Lys Glu Pro Thr 245 250 255 i 、 、 age tea get gtg aaa get gtc tac caa agt gat teg agt etc tee gat 816
Ser Ser Ala Val Lys Ala Val Tyr Gin Ser Asp Ser Ser Leu Ser Asp — 260 265 270 ψ att gag ctg tta gaa ate agt gga gac tee aaa egg ttt gca gca ttc 864 lie Glu Leu Leu Glu lie Ser Gly Asp Ser Lys Arg Phe Ala Ala Phe , 275 280 285 gaa ggc get gtg gaa att caa tea agt gtg gaa gee cag eta aaa gga 912 … Glu Gly Ala Val Glu lie Gin Ser Ser Val Glu Ala Gin Leu Lys Gly 290 295 300 ett tee aaa gtc ett gaa cct gca aaa ggc caa ggc gta geg gtg gga 960
Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gin Gly Val Ala Val Gly 305 310 315 320 agt act ega gca acc gtt ggg gat ata ggg tat get aca gga geg gca 1008
Ser Thr Arg Ala Thr Val Gly Asp lie Gly Tyr Ala Thr Gly Ala Ala 325 330 335 age ctg att aaa act gca etc tgc tta tat aat ege tac ett ccg gca 1056
Ser Leu lie Lys Thr Ala Leu Cys Leu Tyr Asn Arg Tyr Leu Pro Ala 340 345 350 tta gca aac tgg agt ggc cca tgt gaa cag tee gee tgg ggc tea aac 1104 373 1152 200813222
Leu Ala Asn Trp Ser Gly Pro Cys Glu Gin Ser Ala Trp Gly Ser Asn 355 360. 365 atg ttc gtt tgc cat gaa aca egg ccg tgg atg aaa aac cag aat gaa
Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys Asn Gin Asn Glu 370 375 380 aag aga tgt gcc etc att tet gga aca gat cca tet cat aca tgc ttt
Lys Arg Cys Ala Leu lie Ser Gly Thr Asp Pro Ser His Thr Cys Phe 385 390 395 400 tcc etc gta eta teg gat act ggg tgt tat gaa gag cac aat ega aeg
Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu His Asn Arg Thr 405 410 415 tgc ttt gat gtg caa geg cca cag eta gtt ctg ata cac gga ttc gat
Cys Phe Asp Val Gin Ala Pro Gin Leu Val Leu lie His Gly Phe Asp 420 425 430 gga aaa act att gtg egg ega ett gaa gga tat etc ett gaa ett gtt
Gly Lys Thr lie Val Arg Arg Leu Glu Gly Tyr Leu Leu Glu Leu Val 435 440 445 gaa ggg cat gca age cct tea gag tat ttc cac aaa ctg att gga caa
Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys Leu lie Gly Gin 450 455 460 agt eta ett gag aac teg aaa gaa agt aaa etc aca ett teg ett gtg
Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr Leu Ser Leu Val 465 470 475 480 tgc aat ccg aac cag etc caa aag gag etc atg ett get ate aaa gga
Cys Asn Pro Asn Gin Leu Gin Lys Glu Leu Met Leu Ala lie Lys Gly 485 490 495 gta caa ega age Val Gin Arg Ser 500
<210> 56 <211〉 500 <212〉 PRT <213> 破囊壺菌(Thraustochytrium sp.) <400> 56
Leu Pro Ala Lys Arg Trp Arg Phe Leu Gly Glu Asp Leu Glu Phe Leu 15 10 15
Arg Ala lie Arg Leu Lys Glu Lys Pro Arg Gly Cys Phe Val Glu Ser 20 25 30
Val Asp Val Asn Phe Arg Arg Leu Lys Thr Pro Leu Thr Pro Glu Asp 35 40 45
Met Leu Arg Pro Gin Gin Leu Leu Ala Val Ser Thr Met Asp Arg Ala 50 55 60 lie lie Asp Ala Gly Leu Lys Lys Gly Gin His Val Ala Val Leu Val 65 70 75 80
Gly Leu Gly Thr Asp Leu Glu Leu Tyr Arg His Arg Ala Arg Val Ala 85 90 95
Leu Lys Glu Val Leu His Pro Ser Leu Lys Ser Asp Thr Ala lie Leu 100 105 110 1200 1248 1296 1344 1392 1440 1488 1500 374 200813222
Gin Lys lie Met Gin Tyr Val Asn Asp Ala Gly Thr Ser Thr Ser Tyr 115 120 125
Thr Ser Tyr lie Gly Asn Leu Val Ala Thr Arg lie Ser Ser Gin Trp 130 135 140
Gly Phe Thr Gly Pro Ser Phe Thr Val Thr Glu Gly Asn Asn Ser Val 145 150 155 160
Tyr Arg Cys Ala Gin Leu Ala Lys Asp Met Leu Gin Val Asn Arg Val 165 170 175
Asp Ala Val Val lie Ala Gly Val Asp Leu Asn Gly Ser Ala Glu Ser 180 185 190
Phe Phe Val Arg Ala Asn Arg Gin Lys lie Ser Lys Leu Ser His Pro 195 200 205
Cys Ala Ser Phe Asp Arg Asp Ala Asp Gly Phe Phe Ala Gly Glu Gly 210 215 220
Cys Gly Ala Leu Val Phe Lys Arg Leu Glu Asp Cys Ala Pro Gin Glu 225 230 235 240
Lys lie Tyr Ala Ser lie Asp Ser lie Ala lie Asp Lys Glu Pro Thr 245 250 255
Ser Ser Ala Val Lys Ala Val Tyr Gin Ser Asp Ser Ser Leu Ser Asp 260 265 270 lie Glu Leu Leu Glu lie Ser Gly Asp Ser Lys Arg Phe Ala Ala Phe 275 280 285
Glu Gly Ala Val Glu lie Gin Ser Ser Val Glu Ala Gin Leu Lys Gly 290 295 300
Leu Ser Lys Val Leu Glu Pro Ala Lys Gly Gin Gly Val Ala Val Gly 305 310 315 320
Ser Thr Arg Ala Thr Val Gly Asp lie Gly Tyr Ala Thr Gly Ala Ala 325 330 335
Ser Leu lie Lys Thr Ala Leu Cys Leu Tyr Asn Arg Tyr Leu Pro Ala 340 345 350
Leu Ala Asn Trp Ser Gly Pro Cys Glu Gin Ser Ala Trp Gly Ser Asn 355 360 365
Met Phe Val Cys His Glu Thr Arg Pro Trp Met Lys Asn Gin Asn Glu 370 375 380
Lys Arg Cys Ala Leu lie Ser Gly Thr Asp Pro Ser His Thr Cys Phe 385 390 395 400
Ser Leu Val Leu Ser Asp Thr Gly Cys Tyr Glu Glu His Asn Arg Thr 405 410 415 375 200813222
Cys Phe Asp Val Gin Ala Pro Gin Leu Val Leu lie His Gly Phe Asp 420 425 430
Gly Lys Thr lie Val Arg Arg Leu Glu Gly Tyr Leu Leu Glu Leu Val 435 440 445
Glu Gly His Ala Ser Pro Ser Glu Tyr Phe His Lys Leu lie Gly Gin 450 455 460
Ser Leu Leu Glu Asn Ser Lys Glu Ser Lys Leu Thr Leu Ser Leu Val 465 470 475 480
Cys Asn Pro Asn Gin Leu Gin Lys Glu Leu Met Leu Ala lie Lys Gly 485 490 495
Val Gin Arg Ser 500
<210> 57 <211> 1500 <212〉 DNA <213>破囊壺菌(11^1131:〇(:11>^1'丨111113卩.) <220〉 <221〉 CDS <222〉 (1)..(1500) <400> 57 atg tta aca ggg aag gat tgg gtc agt cca tea gga agt tgt ttt gcc
Met Leu Thr Gly Lys Asp Trp Val Ser Pro Ser Gly Ser Cys Phe Ala 15 10 15 cca aat ccg tta tea age gca aaa gtg gca ttc atg tac gga gaa ggc
Pro Asn Pro Leu Ser Ser Ala Lys Val Ala Phe Met Tyr Gly Glu Gly 20 25 30 ega age ccg tac tgt ggt gta ggc ttg ggt eta cat cgt ttg tgg ccc
Arg Ser Pro Tyr Cys Gly Val Gly Leu Gly Leu His Arg Leu Trp Pro 35 40 45 ggt etc cat gaa aat gtg aac aat aag aca gtc gat tta tgg aeg gaa
Gly Leu His Glu Asn Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu 50 55 60 gga gat ggt tgg tta tat cct ega aeg ttg aca ega gaa gag cat aca
Gly Asp Gly Trp Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr 65 70 75 80 aaa gcc ate gaa tet ttc aac gca aat caa att gaa atg ttt ege get
Lys Ala lie Glu Ser Phe Asn Ala Asn Gin lie Glu Met Phe Arg Ala 85 90 95 ggg att ttc ate tea atg tgt cag aca gac tat gtc atg aat gtt etc
Gly lie Phe lie Ser Met Cys Gin Thr Asp Tyr Val Met Asn Val Leu 100 105 110 ggt gtc cag cct aag gcc gga ttt ggg ctg age ttg gga gaa att tea
Gly Val Gin Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu lie Ser 115 120 125 atg etc ttt geg atg tea aag gag aac tgc agg cag tea cag gaa atg
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gin Ser Gin Glu Met 130 135 140 acc aat cgt ttg ege ggt tet cca gtg tgg tet aac gag ett get ate
Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu Ala lie 145 150 155 160 48 96 144 192 240 288 336 384 432 376 480 200813222 aac ttc aat gca att cgc aag tta tgg aaa ate ccc ega gga get ccc 528
Asn Phe Asn Ala lie Arg Lys Leu Trp Lys lie Pro Arg Gly Ala Pro 165 170 175 tta gaa tee ttt tgg caa gga tac ttg gtt cac ggc aca aga gaa gaa 576
Leu Glu Ser Phe Trp Gin Gly Tyr Leu Val His Gly Thr Arg Glu Glu 180 185 190 gta gag cat get att ggt ett tet gag cct tat gta cgt ctg ett att 624
Val Glu His Ala lie Gly Leu Ser Glu Pro Tyr Val Arg Leu Leu lie 195 200 205 gtg aac gat tea agg agt gee ttg att get gga aaa cca gac gee tgt 672 — Val Asn Asp Ser Arg Ser Ala Leu lie Ala Gly Lys Pro Asp Ala Cys , 210 215 220 ; cag gca gta ate agt aga eta aac tee aag ttc cct tet ctg ccg gta 720 〜 Gin Ala Val lie Ser Arg Leu Asn Ser Lys Phe Pro Ser Leu Pro Val ‘ 225 230 235 240 、 aag caa gga atg att ggt cat tgc cca gaa gtt cgt geg ttc ate aaa 768
Lys Gin Gly Met lie Gly His Cys Pro Glu Val Arg Ala Phe lie Lys 245 250 255 gat att ggg tac ate cat gaa aca etc ega att tee aat gac tat teg 816 f Asp lie Gly Tyr lie His Glu Thr Leu Arg lie Ser Asn Asp Tyr Ser 260 265 270 gat tgt cag ett ttc tea geg gta acc aag ggc gca ett gac age tee 864
Asp Cys Gin Leu Phe Ser Ala Val Thr Lys Gly Ala Leu Asp Ser Ser 275 280 285 aca atg gaa ate aaa cac ttt gtg gga gag gtc tac tee egg ate gca 912
Thr Met Glu lie Lys His Phe Val Gly Glu Val Tyr Ser Arg lie Ala 290 295 300 gac ttt cct caa ate gtc aac aeg gtg cat teg get ggt tat gac gta 960
Asp Phe Pro Gin lie Val Asn Thr Val His Ser Ala Gly Tyr Asp Val 305 310 315 320 ttt ett gag ett ggc tgt gat get tet aga tet gca gca gtt caa aac 1008
Phe Leu Glu Leu Gly Cys Asp Ala Ser Arg Ser Ala Ala Val Gin Asn 325 330 335 att ett ggt ggt caa gga aag ttc ttg tet aca get att gac aaa aaa 1056 lie Leu Gly Gly Gin Gly Lys Phe Leu Ser Thr Ala lie Asp Lys Lys 340 345 350 gga cac tee gee tgg tea caa gta ett egg get acc gca tea tta get 1104 , Gly His Ser Ala Trp Ser Gin Val Leu Arg Ala Thr Ala Ser Leu Ala 355 360 365 : gca cat ega gta ccg gga ate tea att ttg gat ttg ttt cac cca aat 1152
Ala His Arg Val Pro Gly lie Ser lie Leu Asp Leu Phe His Pro Asn -· 370 375 380 ' ttc ega gaa atg tgc tgt aca atg gca acc aca cct aaa gtg gaa gat 1200
Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val Glu Asp “ 385 390 395 400 aag ttc ctg cgc aeg att caa ate aat ggt egg ttt gaa aaa gaa atg 1248
Lys Phe Leu Arg Thr lie Gin lie Asn Gly Arg Phe Glu Lys Glu Met 405 410 415 att cac eta gaa gat aca aca tta agt tgc tta ccc get cca agt gaa 1296 lie His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro Ala Pro Ser Glu 420 425 430 gca aat ate gca get att caa tet egg tea att ega tet get geg geg 1344
Ala Asn lie Ala Ala lie Gin Ser Arg Ser lie Arg Ser Ala Ala Ala 435 440 445 cgt tet gga caa tee cat gat tgt gca tee cat age cat gaa gaa aat 1392
Arg Ser Gly Gin Ser His Asp Cys Ala Ser His Ser His Glu Glu Asn 377 1440 200813222 450 455 460 aag gat tea tgc cct gaa aag ctg aag ett gat tet gtg tee gtc gee
Lys Asp Ser Cys Pro Glu Lys Leu Lys Leu Asp Ser Val Ser Val Ala 465 470 475 480 1488 1500 ata aat ttc gac aat gat gac ege att cag ett ggg cac geg ggt ttt lie Asn Phe Asp Asn Asp Asp Arg lie Gin Leu Gly His Ala Gly Phe 485 490 495 egg gag atg tac Arg Glu Met Tyr 500
<210> 58 <211> 500 <212> PRT <213> 破_壺菌(Thraustochytrium sp.) <400> 58
Met Leu Thr Gly Lys Asp Trp Val Ser Pro Ser Gly Ser Cys Phe Ala 1 5 10 15
Pro Asn Pro Leu Ser Ser Ala Lys Val Ala Phe Met Tyr Gly Glu Gly 20 25 30
Arg Ser Pro Tyr Cys Gly Val Gly Leu Gly Leu His Arg Leu Trp Pro 35 40 45
Gly Leu His Glu Asn Val Asn Asn Lys Thr Val Asp Leu Trp Thr Glu 50 55 60
Gly Asp Gly Trp Leu Tyr Pro Arg Thr Leu Thr Arg Glu Glu His Thr 65 70 75 80
Lys Ala lie Glu Ser Phe Asn Ala Asn Gin lie Glu Met Phe Arg Ala 85 90 95
Gly lie Phe lie Ser Met Cys Gin Thr Asp Tyr Val Met Asn Val Leu 100 105 110
Gly Val Gin Pro Lys Ala Gly Phe Gly Leu Ser Leu Gly Glu lie Ser 115 120 125
Met Leu Phe Ala Met Ser Lys Glu Asn Cys Arg Gin Ser Gin Glu Met 130 135 140
Thr Asn Arg Leu Arg Gly Ser Pro Val Trp Ser Asn Glu Leu Ala lie 145 150 155 160
Asn Phe Asn Ala lie Arg Lys Leu Trp Lys lie Pro Arg Gly Ala Pro 165 170 175
Leu Glu Ser Phe Trp Gin Gly Tyr Leu Val His Gly Thr Arg Glu Glu 180 185 190
Val Glu His Ala lie Gly Leu Ser Glu Pro Tyr Val Arg Leu Leu lie 195 200 205
Val Asn Asp Ser Arg Ser Ala Leu lie Ala Gly Lys Pro Asp Ala Cys 378 200813222 210 215 220
Gin Ala Val lie Ser Arg Leu Asn Ser Lys Phe Pro Ser Leu Pro Val 225 230 235 240
Lys Gin Gly Met lie Gly His Cys Pro Glu Val Arg Ala Phe lie Lys 245 250 255
Asp lie Gly Tyr lie His Glu Thr Leu Arg lie Ser Asn Asp Tyr Ser 260 265 270
Asp Cys Gin Leu Phe Ser Ala Val Thr Lys Gly Ala Leu Asp Ser Ser 275 280 285
Thr Met Glu lie Lys His Phe Val Gly Glu Val Tyr Ser Arg lie Ala
Asp Phe Pro Gin lie Val Asn Thr Val His Ser Ala Gly Tyr Asp Val 305 310 315 320
Phe Leu Glu Leu Glv Cvs Asd Ala Ser Arg Ser Ala Ala Val Gin Asn 325 ' 330 335 lie Leu Gly Gly Gin Gly Lys Phe Leu Ser Thr Ala lie Asp Lys Lys 340 345 350
Gly His Ser Ala Trp Ser Gin Val Leu Arg Ala Thr Ala Ser Leu Ala 355 360 365
Ala His Arg Val Pro Gly lie Ser lie Leu Asp Leu Phe His Pro Asn 370 375 380
Phe Arg Glu Met Cys Cys Thr Met Ala Thr Thr Pro Lys Val Glu Asp 385 390 395 400
Lys Phe Leu Arg Thr lie Gin lie Asn Gly Arg Phe Glu Lys Glu Met 405 410 415 lie His Leu Glu Asp Thr Thr Leu Ser Cys Leu Pro Ala Pro Ser Glu 420 425 430
Ala Asn lie Ala Ala lie Gin Ser Arg Ser lie Arg Ser Ala Ala Ala 435 440 445
Arg Ser Gly Gin Ser His Asp Cys Ala Ser His Ser His Glu Glu Asn 450 455 460
Lys Asp Ser Cys Pro Glu Lys Leu Lys Leu Asp Ser Val Ser Val Ala 465 470 475 480 lie Asn Phe Asp Asn Asp Asp Arg lie Gin Leu Gly His Ala Gly Phe 485 490 495
Arg Glu Met Tyr 500 379 200813222
<210> 59 <211> 1305 <212> DNA <213〉破囊壺菌(Thraustochytrium sp.) <220〉 <221〉 CDS <222〉 (1)..(1305) <400> 59 aat aca aga tat age ttg tac aca ggg geg atg gca aag gga att gca
Asn Thr Arg Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala 15 10 15 tet gca gat ett gtc att gee get ggg aaa gag ggc ate eta get tee
Ser Ala Asp Leu Val lie Ala Ala Gly Lys Glu Gly lie Leu Ala Ser 20 25 30 tat gga get gga gga eta cct ett get act gtt ega aag gga ata gac
Tyr Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly lie Asp 35 40 45 aaa att caa caa gee ttg cca agt ggc cca tat get gta aat ett att
Lys lie Gin Gin Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu lie 50 55 60 cac tet ccc ttt gac ggc aac ttg gag cag gga aac gtc gat ttg ttc
His Ser Pro Phe Asp Gly Asn Leu Glu Gin Gly Asn Val Asp Leu Phe 65 70 75 80 ttg gaa aag aac gtc ege gtg geg gaa tgt tee geg ttt aca aeg eta
Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe Thr Thr Leu 85 90 95 aca gtg cca gta gta cac tat cgt get gca ggg ett gtt egg ege caa
Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu Val Arg Arg Gin 100 105 110 gat gga age att ttg ate aag aac ega ate att get aaa gta tet agg
Asp Gly Ser lie Leu lie Lys Asn Arg lie lie Ala Lys Val Ser Arg 115 120 125 aca gaa etc get gag atg ttc ett cgt ccg gca cct caa ate ate etc
Thr Glu Leu Ala Glu Met Phe Leu Arg Pro Ala Pro Gin lie lie Leu 130 135 140 gaa aaa ctg gta gca gca gaa ate att tea tet gac caa geg cgt atg
Glu Lys Leu Val Ala Ala Glu lie lie Ser Ser Asp Gin Ala Arg Met 145 150 155 160 gca gee aaa gtt ccc atg geg gac gac ate gca gtc gaa gee gac tet
Ala Ala Lys Val Pro Met Ala Asp Asp lie Ala Val Glu Ala Asp Ser 165 170 175 ggt ggg cac aeg gat aat egg cct atg cac gtc att ttg ccc ctg ata
Gly Gly His Thr Asp Asn Arg Pro Met His Val lie Leu Pro Leu lie 180 185 190 att caa etc ege aat act ata ett gca gag tat ggc tgt gee aeg get lie Gin Leu Arg Asn Thr lie Leu Ala Glu Tyr Gly Cys Ala Thr Ala 195 200 205 ttt cgt acc cgt ata ggc get gga gga ggc att ggt tgt cct tea geg
Phe Arg Thr Arg lie Gly Ala Gly Gly Gly lie Gly Cys Pro Ser Ala 210 215 220 gee etc gca gee ttt gat atg ggt geg agt ttt gtc gtg act gga age
Ala Leu Ala Ala Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser 225 230 235 240 ata aat caa att tgc ege gag gca ggg act tgc gat act gtt egg gag lie Asn Gin lie Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu 245 250 255 380 816 816
200813222 eta ett gee aac tea age tac teg gac gtg aeg atg geg cca gca gca
Leu Leu Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala 260 265 270 gac atg ttt gac caa ggt gtg aaa etc caa gtc tta aaa ega gga aeg
Asp Met Phe Asp Gin Gly Val Lys Leu Gin Val Leu Lys Arg Gly Thr 275 280 285 atg ttt cca age aga gca aat aaa etc egg aag etc ttt gtg aac tac
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn Tyr 290 295 300 gaa tet eta gaa aca etc ccg teg aaa gag ttg aaa tac ctg gaa aac
Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu Glu Asn 305 310 315 320 ate ata ttc aag caa gca gta gac cag gtg tgg gag gaa aca aag ege lie lie Phe Lys Gin Ala Val Asp Gin Val Trp Glu Glu Thr Lys Arg 325 330 335 ttt tac tgt gaa aaa ctg aac aat cca gat aaa att gca agg gee atg
Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys lie Ala Arg Ala Met 340 345 350 aaa gat cct aaa ttg aag atg teg ett tgc ttt egg tgg.tat etc tee
Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser 355 360 365 aag age tet ggg tgg gee aac gca gga att aaa tet cgt gca etc gac
Lys Ser Ser Gly Trp Ala Asn Ala Gly lie Lys Ser Arg Ala Leu Asp 370 375 380 tac cag ate tgg tgt ggc ccg gca atg ggc teg ttc aac aat ttc gee
Tyr Gin lie Trp Cys Gly Pro Ala Met Gly Ser Phe Asn Asn Phe Ala 385 390 395 400 age ggc aca tee etc gat tgg aaa gtg act ggg gtt ttc cct ggc gtt
Ser Gly Thr Ser Leu Asp Trp Lys Val Thr Gly Val Phe Pro Gly Val 405 410 415 geg gaa gta aac atg gee att tta gat ggc geg ega gaa eta get get
Ala Glu Val Asn Met Ala lie Leu Asp Gly Ala Arg Glu Leu Ala Ala 420 425 430 aaa ega aat Lys Arg Asn 435
<210> 60 <211> 435 <212> PRT <213>破囊壺菌(1'1^1131:〇(:1^1:1^111113口.) <400> 60
Asn Thr Arg Tyr Ser Leu Tyr Thr Gly Ala Met Ala Lys Gly lie Ala 15 10 15
Ser Ala Asp Leu Val lie Ala Ala Gly Lys Glu Gly lie Leu Ala Ser 20 25 30
Tyr Gly Ala Gly Gly Leu Pro Leu Ala Thr Val Arg Lys Gly lie Asp 35 40 45
Lys lie Gin Gin Ala Leu Pro Ser Gly Pro Tyr Ala Val Asn Leu lie 50 55 60
His Ser Pro Phe Asp Gly Asn Leu Glu Gin Gly Asn Val Asp Leu Phe 65 70 75 80 864 912 960 1008 1056 1104 1152 1200 1248 1296 1305 381 200813222
Leu Glu Lys Asn Val Arg Val Ala Glu Cys Ser Ala Phe Thr Thr Leu 85 90 95
Thr Val Pro Val Val His Tyr Arg Ala Ala Gly Leu Val Arg Arg Gin 100 105 110
Asp Gly Ser lie Leu lie Lys Asn Arg lie lie Ala Lys Val Ser Arg 115 120 125
Thr Glu Leu Ala Glu Met Phe Leu Arg Pro Ala Pro Gin lie lie Leu 130 135 140
Glu Lys Leu Val Ala Ala Glu lie lie Ser Ser Asp Gin Ala Arg Met 145 150 155 160
Ala Ala Lys Val Pro Met Ala Asp Asp lie Ala Val Glu Ala Asp Ser 165 170 175
Gly Gly His Thr Asp Asn Arg Pro Met His Val lie Leu Pro Leu lie 180 185 190 lie Gin Leu Arg Asn Thr lie Leu Ala Glu Tyr Gly Cys Ala Thr Ala 195 200 205
Phe Arg Thr Arg lie Gly Ala Gly Gly Gly lie Gly Cys Pro Ser Ala 210 215 220
Ala Leu Ala Ala Phe Asp Met Gly Ala Ser Phe Val Val Thr Gly Ser 225 230 235 240 lie Asn Gin lie Cys Arg Glu Ala Gly Thr Cys Asp Thr Val Arg Glu 245 250 255
Leu Leu Ala Asn Ser Ser Tyr Ser Asp Val Thr Met Ala Pro Ala Ala 260 265 270
Asp Met Phe Asp Gin Gly Val Lys Leu Gin Val Leu Lys Arg Gly Thr 275 280 285
Met Phe Pro Ser Arg Ala Asn Lys Leu Arg Lys Leu Phe Val Asn Tyr 290 295 300
Glu Ser Leu Glu Thr Leu Pro Ser Lys Glu Leu Lys Tyr Leu Glu Asn 305 310 315 320 lie lie Phe Lys Gin Ala Val Asp Gin Val Trp Glu Glu Thr Lys Arg 325 330 335
Phe Tyr Cys Glu Lys Leu Asn Asn Pro Asp Lys lie Ala Arg Ala Met 340 345 350
Lys Asp Pro Lys Leu Lys Met Ser Leu Cys Phe Arg Trp Tyr Leu Ser 355 360 365
Lys Ser Ser Gly Trp Ala Asn Ala Gly lie Lys Ser Arg Ala Leu Asp 370 375 380 382 200813222
Tyr Gin lie Trp Cys Gly Pro Ala Met Gly Ser Phe Asn Asn Phe Ala 385 390 395 400
Ser Gly Thr Ser Leu Asp Trp Lys Val Thr Gly Val Phe Pro Gly Val 405 410 415
Ala Glu Val Asn Met Ala lie Leu Asp Gly Ala Arg Glu Leu Ala Ala 420 425 430
Lys Arg Asn 435
<210〉 61 <211> 4410 <212> DNA <213>破囊壺菌(1'1^^1131:〇(:1171:1'丨111115口.) <220〉
<221〉 CDS # <222〉 (1)..(4410) <400> 61 atg ggc ccg cga gtg gcg tea ggc aag gtg ccg get tgg gag atg age
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser 15 10 15 aag tcc gag ctg tgt gat gac ege aeg gta gtc ttt gac tat gag gag
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu 20 25 30 ctg ctg gag ttc get gag ggc gat ate agt aag gtt ttt ggg ccg gag
Leu Leu Glu Phe Ala Glu Gly Asp lie Ser Lys Val Phe Gly Pro Glu 35 40 45 ttc aaa gtg gtg gac ggg ttt agg ege agg gtg agg ttg ccc get cga
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg 50 55 60 gag tac ctg ctg gtg acc egg gtt aeg ctg atg gat gcc gag gtg ggc
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly 65 70 75 80 aac ttt cga gtg gga gca cgt atg gtg aca gag tat gac gta cct gtg ^ Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val 85 90 95 " aac gga gag etc teg gaa ggg gga gat gtg ccg tgg get gtg ttg gtg
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val 、 100 105 110 gaa gcc ggg cag tgc gac ttg ctg eta att tet tac atg ggc ate gat
Glu Ala Gly Gin Cys Asp Leu Leu Leu lie Ser Tyr Met Gly lie Asp ^ 115 120 125 ttc cag tgc aaa gga gag egg gtc tac egg ctg ctg aac acc acc ttg
Phe Gin Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140 aeg ttt ttt ggc gtc gcg aaa gaa ggg gaa aeg ett gtg tac gat att
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp lie 145 150 155 160 ege gtc aeg ggt ttc gcc aag agg ccg gac gga gat ate tec atg ttc
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp lie Ser Met Phe 165 170 175 ttt ttc gaa tat gat tgc tac tgc aat ggc aag ett etc ate gaa atg
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu lie Glu Met 48 96 144 192 240 288 336 384 432 480 528 383 576 624 200813222 180 185 190 cga gat ggc tct gca ggc ttc ttc acg gac gaa gag etc get gee ggc
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly 195 200 205 aaa gga gtg gtc gtc act cgt gca cag caa aac atg egg gac aaa att
Lys Gly Val Val Val Thr Arg Ala Gin Gin Asn Met Arg Asp Lys lie 210 215 220 gta egg cag tee att gag cct ttt gca ctg geg get tgc acg cac aaa
Val Arg Gin Ser lie Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys 225 230 235 240 acg act ctg aac gag agt gac atg cag tee ett gtg gag cga aac tgg
Thr Thr Leu Asn Glu Ser Asp Met Gin Ser Leu Val Glu Arg Asn Trp 245 250 255 gca aac gtt ttt ggc acc agt aac aag atg geg gag etc aac tat aaa
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys 260 265 270 att tgc gee agg aaa atg etc atg ate gac agg gtt acc cac att gac lie Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr His lie Asp 275 280 285 cac cac ggt ggg geg tat ggc etc gga eta ett gtt gga gag aag ate
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys lie 290 295 300 ttg gat cga aac cat tgg tac ttt cct tgt cac ttt gtc aat gat caa
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gin 305 310 315 320 gtc atg gca ggg tea ctg gtc age gat ggt tgc age cag etc tta aaa
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Leu Leu Lys 325 330 335 etc tat atg ate tgg ett ggc etc cac ctg aaa atg gag gaa ttt gat
Leu Tyr Met lie Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp 340 345 350 ttt etc cca gtt age ggc cac aaa aac aag gtg cga tgc agg gga caa
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 att tea ccg cat aaa ggc aag ett gtc tac gtc atg gaa ate aaa aag lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Lys 370 375 380 atg ggt tac gat caa gca tct gga age cca tac gee ate geg gac gtt
Met Gly Tyr Asp Gin Ala Ser Gly Ser Pro Tyr Ala lie Ala Asp Val 385 390 395 400 gat ate att gac gtc aac gaa gag ctg ggt caa agt ttt gac ate aac
Asp lie lie Asp Val Asn Glu Glu Leu Gly Gin Ser Phe Asp lie Asn 405 410 415 gac ett geg age tac gga aaa ggt gac ctg age aaa aaa ate gtg gtt
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys lie Val Val 420 425 430 gac ttc aaa gga att get ttg cag etc aaa ggc ege get ttt tea ege
Asp Phe Lys Gly lie Ala Leu Gin Leu Lys Gly Arg Ala Phe Ser Arg 435 440 445 atg agt tee age teg tee ttg aac gaa gga tgg caa tgt gtt cca aaa
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gin Cys Val Pro Lys 450 455 460 cca age cag aga atg gaa cac gaa cag ccc cct get cac tgc ett gca
Pro Ser Gin Arg Met Glu His Glu Gin Pro Pro Ala His Cys Leu Ala 465 470 475 480 age gac ccc gaa gee cct tea act gtg acc tgg cac cca atg tea aag 672 720 768 816 864 912 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 384 200813222
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys 485 490 495 ctt cct ggc aac cct acg ccg ttc ttc tcc cct tea tet tac cct ccg
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro 500 505 510 agg gca att tgc ttc ate cct ttc ccg ggc aat ccc ctt gac aac aac
Arg Ala lie Cys Phe lie Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn 515 520 525 tgc aag get gga gaa atg ccc ctg aac tgg tac aac atg tea gag ttc
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe 530 535 540 atg tgt ggc aag gtt tet aac tgc ttg ggc cca gaa ttc gca ege ttt
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe 545 550 555 560 gac aag teg aac acc age egg age cct get ttt gac ttg get ctg gtg
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val 565 570 575 acc ega gtt gtt gaa gtc aca aac atg gaa cac ggc aag ttt eta aac
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn 580 585 590 gtt gat tgc aat cca age aaa ggc aca atg gtg ggg gag ttt gac tgt
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys 595 600 605 ccc caa gac geg tgg ttc ttt gat ggt teg tgc aac gac ggc cat atg
Pro Gin Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met 610 615 620 ccg tat tcc att ate atg gaa ate gga ctg caa acc tea ggt gtt etc
Pro Tyr Ser lie lie Met Glu lie Gly Leu Gin Thr Ser Gly Val Leu 625 630 635 640 acc teg gtg ttg aag gca ccg ctg act atg gac aag gat gac att etc
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp lie Leu 645 650 655 ttt ega aac etc gat gca agt get gaa atg gtg cgt cca gac gtg gat
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp 660 665 670 gtt ege ggc aaa acg att ega aac gtg acc aag tgt acc ggc tat gca
Val Arg Gly Lys Thr lie Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala 675 680 685 atg ttg gga aag atg ggg att cac egg ttc acg ttt gag ttg age gtt
Met Leu Gly Lys Met Gly lie His Arg Phe Thr Phe Glu Leu Ser Val 690 695 700 gac ggc gtg gta ttt tat aaa gga tcc act tcc ttt gga tgg ttc act
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr 705 710 715 720 ccc gag gtg ttt get cag caa get gga etc gac aac ggg aaa aag acg
Pro Glu Val Phe Ala Gin Gin Ala Gly Leu Asp Asn Gly Lys Lys Thr 725 730 735 gag ccc tgg tgc aag act aac aac acc teg gtt ega aga gtt gaa ate
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu lie 740 745 750 gca tcc gee aaa gga aaa gag cag ctg act gag aag ctt ccc gac gca
Ala Ser Ala Lys Gly Lys Glu Gin Leu Thr Glu Lys Leu Pro Asp Ala 755 760 765 act aat get caa gtt ctt egg cgt tea gag cag tgt gaa tac etc gat
Thr Asn Ala Gin Val Leu Arg Arg Ser Glu Gin Cys Glu Tyr Leu Asp 770 775 780 1536 1584 1632 1680 1728 1776 1824 1872 1920 1968 2016 2064 2112 2160 2208 2256 2304 2352 385 200813222 tac etc aat att gee cct gac tet ggg ctg cat ggg aag ggc tac gee
Tyr Leu Asn lie Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala 785 790 795 800 cac gga cac aaa gac gtt aac ccg caa gac tgg ttc ttc tet tgc cac
His Gly His Lys Asp Val Asn Pro Gin Asp Trp Phe Phe Ser Cys His 805 810 815 ttt tgg ttc gat cct gta atg cca gga tet tta gga att gaa tea atg
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly lie Glu Ser Met 820 825 ' 830 ttc cag ett ate gag gee ttt geg gtg gac caa aac att cct gga gag
Phe Gin Leu lie Glu Ala Phe Ala Val Asp Gin Asn lie Pro Gly Glu 835 840 845 tac aac gta tee aat ccg acc ttt gee cat gca cca ggc aaa aeg geg
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala 850 855 860 tgg aaa tac ega ggc cag etc aca cca aag aac cgt geg atg gac tgc
Trp Lys Tyr Arg Gly Gin Leu Thr Pro Lys Asn Arg Ala Met Asp Cys 865 870 875 880 gag gtg cat ate gtt tea att acc gee tee ccc gag aac ggg ggc tac
Glu Val His lie Val Ser lie Thr Ala Ser Pro Glu Asn Gly Gly Tyr 885 890 895 gtt gac ate gtg gee gat gga geg ett tgg gta gat gga ett ege gtg
Val Asp lie Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val 900 905 910 tac gaa gee aaa gag ett ega gtt cgt gtc gtt teg gca aaa cct caa
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gin 915 920 925 gca att ccg gat gta caa caa cag cca cct age gca aag geg gac ccg
Ala lie Pro Asp Val Gin Gin Gin Pro Pro Ser Ala Lys Ala Asp Pro 930 935 940 ggg aaa aca gga gtt gca ett teg ccc act cag eta ege gac gtc ctg
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gin Leu Arg Asp Val Leu 945 950 955 960 ett gaa gtg gac aat cca ttg tat ett ggt gta gag aac tee aat ttg
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu 965 970 975 gtg cag ttt gag teg aaa cct gca act tet tea cgt ate gtt teg ate
Val Gin Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg lie Val Ser lie 980 985 990 aaa ccg tgc teg att agt gac ett ggc gat aag tet ttt atg gaa aeg
Lys Pro Cys Ser lie Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr 995 1000 1005 tac aac gtg tea gca cct ctg tat act gga gca atg gee aag ggc
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly 1010 1015 1020 att gca tee gee gac ttg gtc att get get ggg aaa ege aag ata lie Ala Ser Ala Asp Leu Val lie Ala Ala Gly Lys Arg Lys lie 1025 1030 1035 ett gga teg ttt ggt geg gga ggg ctg cct att tee ata gtc cgt
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro lie Ser He Val Arg 1040 1045 1050 gaa gca ctg gag aaa att caa caa cac ctg ccc cac ggc ccc tac
Glu Ala Leu Glu Lys lie Gin Gin His Leu Pro His Gly Pro Tyr 1055 1060 1065 get gtt aac etc att cac teg cct ttc gac age aac ttg gaa aag
Ala Val Asn Leu lie His Ser Pro Phe Asp Ser Asn Leu Glu Lys 1070 1075 1080 2400 2448 2496 2544 2592 2640 2688 2736 2784 2832 2880 2928 2976 3024 3069 3114 3159 3204 3249 386 200813222 ggc aac gtt gac etc ttt etc gag atg ggc gtg aca gtg gta gaa Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val Val Glu 1085 1090 1095 tgc age geg ttc atg gaa etc aeg gee cag gtt gtc egg tac ege Cys Ser Ala Phe Met Glu Leu Thr Ala Gin Val Val Arg Tyr Arg 1100 1105 1110 geg tet ggt eta age aaa agt geg gac ggt teg att ege att get Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser lie Arg lie Ala 1115 1120 1125 cac cgt att att ggc aag gtt tee aga acc gag ctg gca gaa atg His Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met 1130 1135 1140 ttt att cgt cca gca cca cag cac etc etc caa aaa etc gta gee Phe lie Arg Pro Ala Pro Gin His Leu Leu Gin Lys Leu Val Ala 1145 1150 1155 f tee ggc gag ctg aca get gag caa gee gag ett gca aca cag gtt Ser Gly Glu Leu Thr Ala Glu Gin Ala Glu Leu Ala Thr Gin Val 1160 1165 1170 ccg gtg geg gat gac att geg gtc gaa gee gac teg ggg ggg cat Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser Gly Gly His 1175 1180 1185 acc gac aac agg cct att cac gtc att ett cct eta ate ate aac Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu lie lie Asn 1190 1195 1200 eta ege aac cgt ttg cat aaa gag ett gac tac cct teg cat etc Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro Ser His Leu 1205 1210 1215 egg gta cgt gtg ggt get ggt ggt ggt att gga tgt cct caa gee Arg Val Arg Val Gly Ala Gly Gly Gly lie Gly Cys Pro Gin Ala 1220 1225 1230 get ett gca gca ttt caa atg ggg gca geg ttt tta ate act gga Ala Leu Ala Ala Phe Gin Met Gly Ala Ala Phe Leu lie Thr Gly 1235 1240 1245 aeg gtg aac cag ett get cgt gaa agt ggc act tgt gac aac gtc Thr Val Asn Gin Leu Ala Arg Glu Ser Gly Thr Cys Asp Asn Val 1250 1255 1260
egg tta cag etc tea aag gee Arg Leu Gin Leu Ser Lys Ala 1265 1270 aeg tat age gac gtg Thr Tyr Ser Asp Val 1275 tgt atg get Cys Met Ala cct get gee gat atg ttt gac caa ggc gtg gag ctg caa gta ttg Pro Ala Ala Asp Met Phe Asp Gin Gly Val Glu Leu Gin Val Leu 1280 1285 1290 tag aaa ggc aeg ctg ttc cca ,ys Lys Gly Thr Leu Phe Pro 1295 1300 agt cgt get aag aag ctg tac gag Ser Arg Ala Lys Lys Leu Tyr Glu 1305 ctg ttc tgc aag tat gac teg ttt gag gca atg ccg get gaa gaa Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro Ala blu 1310 1315 1320 ttg caa egg gtt gaa aag egg Leu Gin Arg Val Glu Lys Arg 1325 1330 att ttt caa aag teg ett get gaa lie Phe Gin Lys Ser Leu Ala Glu 1335 gtt tgg cag gag acc agt gac ttt tac att cat cgt aaS ^ac Val Trp Gin Glu Thr Ser Asp Phe Tyr lie His Arg lie Lys Asn 1340 1345 1350 cct gag aaa ate aat cgt get gca age gat ggc aaa Pro Glu Lys lie Asn Arg Ala Ala Ser Asp Gly Lys ctg aaa atg Leu Lys Met 3294 3339 3384 3429 3474 3519 3564 3609 3654 3699 3744 3789 3834 3879 3924 3969 4014 4059 4104 387 200813222 1355 1360 1365 4149 4194 4239 4284 4329 4374 4410 teg ett tgc ttt ege tgg tac ett ggg ett tee tea ttt tgg gee
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala 1370 1375 1380 aac tet ggg gca caa gat ege gtc atg gac tat caa att tgg tgt
Asn Ser Gly Ala Gin Asp Arg Val Met Asp Tyr Gin lie Trp Cys 1385 1390 1395 ggc cct get att ggc get ttc aat gat ttt acc aag ggc aeg tac
Gly Pro Ala lie Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr 1400 1405 1410 ett gac gtg act gtt gca aag agt tac cct tgt gtg gca cag ate
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gin lie 1415 1420 1425 aat ttg caa att ttg caa gga get geg tat ctg aaa ege ett ggt
Asn Leu Gin lie Leu Gin Gly Ala Ala Tyr Leu Lys Arg Leu Gly 1430 1435 1440 gtc att cgt ttt gac ege atg ctg ctg cag gee gtc gat ate gac
Val lie Arg Phe Asp Arg Met Leu Leu Gin Ala Val Asp lie Asp 1445 1450 1455 gat cct gta ttt act tac gtg ccg acc cag cca ett
Asp Pro Val Phe Thr Tyr Val Pro Thr Gin Pro Leu 1460 1465 1470
<210> 62 <211> 1470 <212> PRT <213>破囊壺菌(1!^1131:〇(:1171:1*丨111113?·) <400> 62
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser 15 10 15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu 20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp lie Ser Lys Val Phe Gly Pro Glu 35 40 45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg 50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly 65 70 75 80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val 85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val 100 105 110
Glu Ala Gly Gin Cys Asp Leu Leu Leu lie Ser Tyr Met Gly lie Asp 115 120 125
Phe Gin Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp lie 388 200813222 145 150 155 160
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp lie Ser Met Phe 165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu lie Glu Met 180 185 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly 195 200 205
Lys Gly Val Val Val Thr Arg Ala Gin Gin Asn Met Arg Asp Lys lie 210 215 220
Val Arg Gin Ser lie Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys 225 230 235 240
Thr Thr Leu Asn Glu Ser Asp Met Gin Ser Leu Val Glu Arg Asn Trp 245 250 255
Ala Asn Val Phe Glv Thr Ser Asn Lvs Met Ala Glu Leu Asn Tvr Lvs 260 265 270 lie Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr His lie Asp 275 280 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys lie 290 295 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gin 305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Leu Leu Lys 325 330 335
Leu Tyr Met lie Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp 340 345 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Lys 370 375 380
Met Gly Tyr Asp Gin Ala Ser Gly Ser Pro Tyr Ala lie Ala Asp Val 385 390 395 400
Asp lie lie Asp Val Asn Glu Glu Leu Gly Gin Ser Phe Asp lie Asn 405 410 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys lie Val Val 420 425 430
Asp Phe Lys Gly lie Ala Leu Gin Leu Lys Gly Arg Ala Phe Ser Arg 435 440 445 389 200813222
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gin Cys Val Pro Lys 450 455 460
Pro Ser Gin Arg Met Glu His Glu Gin Pro Pro Ala His Cys Leu Ala 465 470 475 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys 485 490 495
Leu Pro Gly Asn Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro 500 505 510
Arg Ala lie Cys Phe lie Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn 515 520 525
Cys Lys Ala Gly Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe 530 535 540
Met Cys Gly Lys Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe 545 550 555 560
Asp Lys Ser Asn Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val 565 570 575
Thr Arg Val Val Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn 580 585 590
Val Asp Cys Asn Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys 595 600 605
Pro Gin Asp Ala Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met 610 615 620
Pro Tyr Ser lie lie Met Glu lie Gly Leu Gin Thr Ser Gly Val Leu 625 630 635 640
Thr Ser Val Leu Lys Ala Pro Leu Thr Met Asp Lys Asp Asp lie Leu 645 650 655
Phe Arg Asn Leu Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp 660 665 670
Val Arg Gly Lys Thr lie Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala 675 680 685
Met Leu Gly Lys Met Gly lie His Arg Phe Thr Phe Glu Leu Ser Val 690 695 700
Asp Gly Val Val Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr 705 710 715 720
Pro Glu Val Phe Ala Gin Gin Ala Gly Leu Asp Asn Gly Lys Lys Thr 725 730 735
Glu Pro Trp Cys Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu lie 740 745 750 390 200813222
Ala Ser Ala Lys Gly Lys Glu Gin Leu Thr Glu Lys Leu Pro Asp Ala 755 760 765
Thr Asn Ala Gin Val Leu Arg Arg Ser Glu Gin Cys Glu Tyr Leu Asp 770 775 780
Tyr Leu Asn lie Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala 785 790 795 800
His Gly His Lys Asp Val Asn Pro Gin Asp Trp Phe Phe Ser Cys His 805 810 815
Phe Trp Phe Asp Pro Val Met Pro Gly Ser Leu Gly lie Glu Ser Met 820 825 830
Phe Gin Leu lie Glu Ala Phe Ala Val Asp Gin Asn lie Pro Gly Glu 835 840 845
Tyr Asn Val Ser Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala 850 855 860
Trp Lys Tyr Arg Gly Gin Leu Thr Pro Lys Asn Arg Ala Met Asp Cys 865 870 875 880
Glu Val His lie Val Ser lie Thr Ala Ser Pro Glu Asn Gly Gly Tyr 885 890 895
Val Asp lie Val Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val 900 905 910
Tyr Glu Ala Lys Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gin 915 920 925
Ala lie Pro Asp Val Gin Gin Gin Pro Pro Ser Ala Lys Ala Asp Pro 930 935 940
Gly Lys Thr Gly Val Ala Leu Ser Pro Thr Gin Leu Arg Asp Val Leu 945 950 955 960
Leu Glu Val Asp Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu 965 970 975
Val Gin Phe Glu Ser Lys Pro Ala Thr Ser Ser Arg lie Val Ser lie 980 985 990
Lys Pro Cys Ser lie Ser Asp Leu Gly Asp Lys Ser Phe Met Glu Thr 995 1000 1005
Tyr Asn Val Ser Ala Pro Leu Tyr Thr Gly Ala Met Ala Lys Gly 1010 1015 1020 lie Ala Ser Ala Asp Leu Val lie Ala Ala Gly Lys Arg Lys lie 1025 1030 1035
Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro lie Ser lie Val Arg 1040 1045 1050 391 200813222
Glu Ala Leu Glu Lys lie Gin Gin His Leu Pro His 1055 1060 1065
Ala Val Asn Leu lie His Ser Pro Phe Asp Ser Asn 1070 1075 1080
Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr 1085 1090 1095
Cys Ser Ala Phe Met Glu Leu Thr Ala Gin Val Val 1100 1105 1110
Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser lie 1115 1120 1125
His Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu 1130 1135 1140
Phe lie Arg Pro Ala Pro Gin His Leu Leu Gin Lys 1145 1150 1155
Ser Gly Glu Leu Thr Ala Glu Gin Ala Glu Leu Ala 1160 1165 1170
Pro Val Ala Asp Asp lie Ala Val Glu Ala Asp Ser 1175 1180 1185
Thr Asp Asn Arg Pro lie His Val lie Leu Pro Leu 1190 1195 1200
Leu Arg Asn Arg Leu His Lys Glu Leu Asp Tyr Pro 1205 1210 1215
Arg Val Arg Val Gly Ala Gly Gly Gly lie Gly Cys 1220 1225 1230
Ala Leu Ala Ala Phe Gin Met Gly Ala Ala Phe Leu 1235 1240 1245
Thr Val Asn Gin Leu Ala Arg Glu Ser Gly Thr Cys 1250 1255 1260
Arg Leu Gin Leu Ser Lys Ala Thr Tyr Ser Asp Val 1265 1270 1275
Pro Ala Ala Asp Met Phe Asp Gin Gly Val Glu Leu 1280 1285 1290
Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys Lys 1295 1300 1305
Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro 1310 1315 1320
Leu Gin Arg Val Glu Lys Arg lie Phe Gin Lys Ser
Gly Pro Tyr Leu Glu Lys Val Val Glu Arg Tyr Arg Arg lie Ala Ala Glu Met Leu Val Ala Thr Gin Val Gly Gly His lie lie Asn Ser His Leu Pro Gin Ala lie Thr Gly Asp Asn Val Cys Met Ala Gin Val Leu Leu Tyr Glu Ala Glu Glu Leu Ala Glu 392 200813222 1325 1330 1335
Val Trp Gin Glu Thr Ser Asp Phe Tyr lie His Arg lie Lys Asn 1340 1345 1350
Pro Glu Lys lie Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met 1355 1360 1365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala 1370 1375 1380
Asn Ser Gly Ala Gin Asp Arg Val Met Asp Tyr Gin lie Trp Cys 1385 1390 1395
Gly Pro Ala lie Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr 1400 1405 1410
Leu Asp Val Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gin lie 1415 1420 1425
Asn Leu Gin lie Leu Gin Glv Ala Ala Tvr Leu Lys Arg Leu Gly 1430 1435 1440
Val lie Arg Phe Asp Arg Met Leu Leu Gin Ala Val Asp lie Asp 1445 1450 1455
Asp Pro Val Phe Thr Tyr Val Pro Thr Gin Pro Leu 1460 1465 1470
<210> 63 <211> 1500 <212> DNA <213>破囊壺菌(11^1131:0(:]1>1:1^111113口·) <220〉 <221> CDS <222> (1)..(1500) <400> 63 atg ggc ccg cga gtg gcg tea ggc aag gtg ccg get tgg gag atg age
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser 1 5 10 15 aag tcc gag ctg tgt gat gac ege aeg gta gtc ttt gac tat gag gag
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu 20 25 30 ctg ctg gag ttc get gag ggc gat ate agt aag gtt ttt ggg ccg gag
Leu Leu Glu Phe Ala Glu Gly Asp lie Ser Lys Val Phe Gly Pro Glu 35 40 45 ttc aaa gtg gtg gac ggg ttt agg ege agg gtg agg ttg ccc get cga
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg 50 55 60 gag tac ctg ctg gtg acc egg gtt aeg ctg atg gat gcc gag gtg ggc
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly 65 70 75 80 aac ttt cga gtg gga gca cgt atg gtg aca gag tat gac gta cct gtg
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val 85 90 95 aac gga gag etc teg gaa ggg gga gat gtg ccg tgg get gtg ttg gtg 48 96 144 192 240 288 336 393 200813222
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val 100 105 110 gaa gcc ggg cag tgc gac ttg ctg eta att tet tac atg ggc ate gat 384
Glu Ala Gly Gin Cys Asp Leu Leu Leu lie Ser Tyr Met Gly lie Asp 115 120 125 ttc cag tgc aaa gga gag egg gtc tac egg ctg ctg aac acc acc ttg 432
Phe Gin Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140 aeg ttt ttt ggc gtc geg aaa gaa ggg gaa aeg ett gtg tac gat att 480
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp lie 145 150 155 160 ege gtc aeg ggt ttc gcc aag agg ccg gac gga gat ate tee atg ttc 528
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp lie Ser Met Phe 165 170 175 ttt ttc gaa tat gat tgc tac tgc aat ggc aag ett etc ate gaa atg 576
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu lie Glu Met 180 185 190 ega gat ggc tet gca ggc ttc ttc aeg gac gaa gag etc get gcc ggc 624
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly 195 200 205 aaa gga gtg gtc gtc act cgt gca cag caa aac atg egg gac aaa att 672
Lys Gly Val Val Val Thr Arg Ala Gin Gin Asn Met Arg Asp Lys lie 210 215 220 gta egg cag tee att gag cct ttt gca ctg geg get tgc aeg cac aaa 720
Val Arg Gin Ser lie Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys 225 230 235 240 aeg act ctg aac gag agt gac atg cag tee ett gtg gag ega aac tgg 768
Thr Thr Leu Asn Glu Ser Asp Met Gin Ser Leu Val Glu Arg Asn Trp 245 250 255 gca aac gtt ttt ggc acc agt aac aag atg geg gag etc aac tat aaa 816
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys 260 265 270 att tgc gcc agg aaa atg etc atg ate gac agg gtt acc cac att gac 864 lie Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr His lie Asp 275 280 285 cac cac ggt ggg geg tat ggc etc gga eta ett gtt gga gag aag ate 912
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys lie 290 295 300 ttg gat ega aac cat tgg tac ttt cct tgt cac ttt gtc aat gat caa 960
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gin 305 310 315 320 gtc atg gca ggg tea ctg gtc age gat ggt tgc age cag etc tta aaa 1008
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Leu Leu Lys 325 330 335 etc tat atg ate tgg ett ggc etc cac ctg aaa atg gag gaa ttt gat 1056
Leu Tyr Met lie Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp 340 345 350 ttt etc cca gtt age ggc cac aaa aac aag gtg ega tgc agg gga caa 1104
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 att tea ccg cat aaa ggc aag ett gtc tac gtc atg gaa ate aaa aag 1152 lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Lys 370 375 380 atg ggt tac gat caa gca tet gga age cca tac gcc ate geg gac gtt 1200
Met Gly Tyr Asp Gin Ala Ser Gly Ser Pro Tyr Ala lie Ala Asp Val 385 390 395 400 394 1248 200813222 gat ate att gac gtc aac gaa gag ctg ggt caa agt ttt gac ate aac
Asp lie lie Asp Val Asn Glu Glu Leu Gly Gin Ser Phe Asp lie Asn 405 410 415 1296 1344 1392 1440 1488 1500 gac ett geg age tac gga aaa ggt gac ctg age aaa aaa ate gtg gtt
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys lie Val Val 420 425 430 gac ttc aaa gga att get ttg cag etc aaa ggc ege get ttt tea ege
Asp Phe Lys Gly lie Ala Leu Gin Leu Lys Gly Arg Ala Phe Ser Arg 435 440 445 atg agt tee age teg tee ttg aac gaa gga tgg caa tgt gtt cca aaa
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gin Cys Val Pro Lys 450 455 460 cca age cag aga atg gaa cac gaa cag ccc cct get cac tgc ett gca
Pro Ser Gin Arg Met Glu His Glu Gin Pro Pro Ala His Cys Leu Ala 465 470 475 480 age gac ccc gaa gee cct tea act gtg acc tgg cac cca atg tea aag
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys 485 490 495 ett cct ggc aac Leu Pro Gly Asn 500
<210> 64 <211> 500 <212〉 PRT <213〉破囊壺菌(Thraustochytrium sp.) <400> 64
Met Gly Pro Arg Val Ala Ser Gly Lys Val Pro Ala Trp Glu Met Ser 15 10 15
Lys Ser Glu Leu Cys Asp Asp Arg Thr Val Val Phe Asp Tyr Glu Glu 20 25 30
Leu Leu Glu Phe Ala Glu Gly Asp lie Ser Lys Val Phe Gly Pro Glu 35 40 45
Phe Lys Val Val Asp Gly Phe Arg Arg Arg Val Arg Leu Pro Ala Arg 50 55 60
Glu Tyr Leu Leu Val Thr Arg Val Thr Leu Met Asp Ala Glu Val Gly 65 70 75 80
Asn Phe Arg Val Gly Ala Arg Met Val Thr Glu Tyr Asp Val Pro Val 85 90 95
Asn Gly Glu Leu Ser Glu Gly Gly Asp Val Pro Trp Ala Val Leu Val 100 105 110
Glu Ala Gly Gin Cys Asp Leu Leu Leu lie Ser Tyr Met Gly lie Asp 115 120 125
Phe Gin Cys Lys Gly Glu Arg Val Tyr Arg Leu Leu Asn Thr Thr Leu 130 135 140
Thr Phe Phe Gly Val Ala Lys Glu Gly Glu Thr Leu Val Tyr Asp lie 145 150 155 160 395 200813222
Arg Val Thr Gly Phe Ala Lys Arg Pro Asp Gly Asp lie Ser Met Phe 165 170 175
Phe Phe Glu Tyr Asp Cys Tyr Cys Asn Gly Lys Leu Leu lie Glu Met 180 185 190
Arg Asp Gly Ser Ala Gly Phe Phe Thr Asp Glu Glu Leu Ala Ala Gly 195 200 205
Lys Gly Val Val Val Thr Arg Ala Gin Gin Asn Met Arg Asp Lys lie 210 215 220
Val Arg Gin Ser lie Glu Pro Phe Ala Leu Ala Ala Cys Thr His Lys 225 230 235 240
Thr Thr Leu Asn Glu Ser Asp Met Gin Ser Leu Val Glu Arg Asn Trp 245 250 255
Ala Asn Val Phe Gly Thr Ser Asn Lys Met Ala Glu Leu Asn Tyr Lys 260 265 270 lie Cys Ala Arg Lys Met Leu Met lie Asp Arg Val Thr His lie Asp 275 280 285
His His Gly Gly Ala Tyr Gly Leu Gly Leu Leu Val Gly Glu Lys lie 290 295 300
Leu Asp Arg Asn His Trp Tyr Phe Pro Cys His Phe Val Asn Asp Gin 305 310 315 320
Val Met Ala Gly Ser Leu Val Ser Asp Gly Cys Ser Gin Leu Leu Lys 325 330 335
Leu Tyr Met lie Trp Leu Gly Leu His Leu Lys Met Glu Glu Phe Asp 340 345 350
Phe Leu Pro Val Ser Gly His Lys Asn Lys Val Arg Cys Arg Gly Gin 355 360 365 lie Ser Pro His Lys Gly Lys Leu Val Tyr Val Met Glu lie Lys Lys 370 375 380
Met Gly Tyr Asp Gin Ala Ser Gly Ser Pro Tyr Ala lie Ala Asp Val 385 390 395 400
Asp lie lie Asp Val Asn Glu Glu Leu Gly Gin Ser Phe Asp lie Asn 405 410 415
Asp Leu Ala Ser Tyr Gly Lys Gly Asp Leu Ser Lys Lys lie Val Val 420 425 430
Asp Phe Lys Gly lie Ala Leu Gin Leu Lys Gly Arg Ala Phe Ser Arg 435 440 445
Met Ser Ser Ser Ser Ser Leu Asn Glu Gly Trp Gin Cys Val Pro Lys 450 455 460 396 200813222
Pro Ser Gin Arg Met Glu His Glu Gin Pro Pro Ala His Cys Leu Ala 465 470 475 480
Ser Asp Pro Glu Ala Pro Ser Thr Val Thr Trp His Pro Met Ser Lys 485 490 495
Leu Pro Gly Asn 500
<210> 65 <211> 1500 <212〉 DNA <213>破囊壺菌(11^1131:〇(:]171:1'1111113?·) <220〉 <221〉CDS <222〉 (1)..(1500) <400> 65 # cct acg ccg ttc ttc tcc cct tea tet tac cct ccg agg gca att tgc # Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala lie Cys 15 10 15 ttc ate cct ttc ccg ggc aat ccc ett gac aac aac tgc aag get gga
Phe lie Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly 20 25 30 gaa atg ccc ctg aac tgg tac aac atg tea gag ttc atg tgt ggc aag
Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys 35 40 45 gtt tet aac tgc ttg ggc cca gaa ttc gca ege ttt gac aag teg aac
Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn 50 55 60 acc age egg age cct get ttt gac ttg get ctg gtg acc ega gtt gtt
Thr Ser Arg Ser Pro Ala Phe Asp Leu Ala Leu Val Thr Arg Val Val 65 70 75 80 gaa gtc aca aac atg gaa cac ggc aag ttt eta aac gtt gat tgc aat
Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn 85 90 95 f cca age aaa ggc aca atg gtg ggg gag ttt gac tgt ccc caa gac geg
Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gin Asp Ala 100 105 110 tgg ttc ttt gat ggt teg tgc aac gac ggc cat atg ccg tat tcc att
Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser lie ' 115 120 125 ate atg gaa ate gga ctg caa acc tea ggt gtt etc acc teg gtg ttg lie Met Glu lie Gly Leu Gin Thr Ser Gly Val Leu Thr Ser Val Leu ^ 130 135 140 aag gca ccg ctg act atg gac aag gat gac att etc ttt ega aac etc
Lys Ala Pro Leu Thr Met Asp Lys Asp Asp lie Leu Phe Arg Asn Leu 145 150 155 160 gat gca agt get gaa atg gtg cgt cca gac gtg gat gtt ege ggc aaa
Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys 165 170 175 acg att ega aac gtg acc aag tgt acc ggc tat gca atg ttg gga aag
Thr lie Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys 180 185 190 atg ggg att cac egg ttc acg ttt gag ttg age gtt gac ggc gtg gta
Met Gly lie His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val 48 96 144 192 240 288 336 384 432 480 528 576 397 624 672 200813222 195 200 205 ttt tat aaa gga tcc act tcc ttt gga tgg ttc act ccc gag gtg ttt
Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe 210 215 220 get cag caa get gga etc gac aac ggg aaa aag aeg gag ccc tgg tgc
Ala Gin Gin Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys 225 230 235 240 aag act aac aac acc teg gtt ega aga gtt gaa ate gca tcc gee aaa
Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu lie Ala Ser Ala Lys 245 250 255 gga aaa gag cag ctg act gag aag ett ccc gac gca act aat get caa
Gly Lys Glu Gin Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gin 260 265 270 gtt ett egg cgt tea gag cag tgt gaa tac etc gat tac etc aat att
Val Leu Arg Arg Ser Glu Gin Cys Glu Tyr Leu Asp Tyr Leu Asn lie 275 280 285 gee cct gac tet ggg ctg cat ggg aag ggc tac gee cac gga cac aaa
Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys 290 295 300 gac gtt aac ccg caa gac tgg ttc ttc tet tgc cac ttt tgg ttc gat
Asp Val Asn Pro Gin Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp 305 310 315 320 cct gta atg cca gga tet tta gga att gaa tea atg ttc cag ett ate
Pro Val Met Pro Gly Ser Leu Gly lie Glu Ser Met Phe Gin Leu lie 325 330 335 gag gee ttt geg gtg gac caa aac att cct gga gag tac aac gta tcc
Glu Ala Phe Ala Val Asp Gin Asn lie Pro Gly Glu Tyr Asn Val Ser 340 345 350 aat ccg acc ttt gee cat gca cca ggc aaa aeg geg tgg aaa tac ega
Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg 355 360 365 ggc cag etc aca cca aag aac cgt geg atg gac tgc gag gtg cat ate
Gly Gin Leu Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His lie 370 375 380 gtt tea att acc gee tcc ccc gag aac ggg ggc tac gtt gac ate gtg
Val Ser lie Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp lie Val 385 390 395 400 gee gat gga geg ett tgg gta gat gga ett ege gtg tac gaa gee aaa
Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys 405 410 415 gag ett ega gtt cgt gtc gtt teg gca aaa cct caa gca att ccg gat
Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gin Ala lie Pro Asp 420 425 430 gta caa caa cag cca cct age gca aag geg gac ccg ggg aaa aca gga
Val Gin Gin Gin Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly 435 440 445 gtt gca ett teg ccc act cag eta ege gac gtc ctg ett gaa gtg gac
Val Ala Leu Ser Pro Thr Gin Leu Arg Asp Val Leu Leu Glu Val Asp 450 455 460 aat cca ttg tat ett ggt gta gag aac tcc aat ttg gtg cag ttt gag
Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gin Phe Glu 465 470 475 480 teg aaa cct gca act tet tea cgt ate gtt teg ate aaa ccg tgc teg
Ser Lys Pro Ala Thr Ser Ser Arg lie Val Ser lie Lys Pro Cys Ser 485 490 495 att agt gac ett 720 768 816 864 912 960 1008 1056 1104 1152 1200 1248 1296 1344 1392 1440 1488 1500 398 200813222 lie Ser Asp Leu 5⑻
<210> 66 <211> 500 <212> PRT <213> 破囊壺菌(Thraustochytrium sp.) <400> 66
Pro Thr Pro Phe Phe Ser Pro Ser Ser Tyr Pro Pro Arg Ala lie Cys 1 5 10 15
Phe lie Pro Phe Pro Gly Asn Pro Leu Asp Asn Asn Cys Lys Ala Gly 20 25 30
Glu Met Pro Leu Asn Trp Tyr Asn Met Ser Glu Phe Met Cys Gly Lys 35 40 45
Val Ser Asn Cys Leu Gly Pro Glu Phe Ala Arg Phe Asp Lys Ser Asn 50 55 60
Thr Ser Arg Ser Pro Ala Phe Asd Leu Ala Leu Val Thr Arg Val Val 65 70 75 80
Glu Val Thr Asn Met Glu His Gly Lys Phe Leu Asn Val Asp Cys Asn 85 90 95
Pro Ser Lys Gly Thr Met Val Gly Glu Phe Asp Cys Pro Gin Asp Ala 100 105 110
Trp Phe Phe Asp Gly Ser Cys Asn Asp Gly His Met Pro Tyr Ser lie 115 120 125 lie Met Glu lie Gly Leu Gin Thr Ser Gly Val Leu Thr Ser Val Leu 130 135 140
Lys Ala Pro Leu Thr Met Asp Lys Asp Asp lie Leu Phe Arg Asn Leu 145 150 155 160
Asp Ala Ser Ala Glu Met Val Arg Pro Asp Val Asp Val Arg Gly Lys 165 170 175
Thr lie Arg Asn Val Thr Lys Cys Thr Gly Tyr Ala Met Leu Gly Lys 180 185 190
Met Gly lie His Arg Phe Thr Phe Glu Leu Ser Val Asp Gly Val Val 195 200 205
Phe Tyr Lys Gly Ser Thr Ser Phe Gly Trp Phe Thr Pro Glu Val Phe 210 215 220
Ala Gin Gin Ala Gly Leu Asp Asn Gly Lys Lys Thr Glu Pro Trp Cys 225 230 235 240
Lys Thr Asn Asn Thr Ser Val Arg Arg Val Glu lie Ala Ser Ala Lys 245 250 255 399 200813222
Gly Lys Glu Gin Leu Thr Glu Lys Leu Pro Asp Ala Thr Asn Ala Gin 260 265 270
Val Leu Arg Arg Ser Glu Gin Cys Glu Tyr Leu Asp Tyr Leu Asn lie 275 280 285
Ala Pro Asp Ser Gly Leu His Gly Lys Gly Tyr Ala His Gly His Lys 290 295 300
Asp Val Asn Pro Gin Asp Trp Phe Phe Ser Cys His Phe Trp Phe Asp 305 310 315 320
Pro Val Met Pro Gly Ser Leu Gly lie Glu Ser Met Phe Gin Leu lie 325 330 335
Glu Ala Phe Ala Val Asp Gin Asn lie Pro Gly Glu Tyr Asn Val Ser 340 345 350
Asn Pro Thr Phe Ala His Ala Pro Gly Lys Thr Ala Trp Lys Tyr Arg 355 360 365
Gly Gin Leu Thr Pro Lys Asn Arg Ala Met Asp Cys Glu Val His lie 370 375 380
Val Ser lie Thr Ala Ser Pro Glu Asn Gly Gly Tyr Val Asp lie Val 385 390 395 400
Ala Asp Gly Ala Leu Trp Val Asp Gly Leu Arg Val Tyr Glu Ala Lys 405 410 415
Glu Leu Arg Val Arg Val Val Ser Ala Lys Pro Gin Ala lie Pro Asp 420 425 430
Val Gin Gin Gin Pro Pro Ser Ala Lys Ala Asp Pro Gly Lys Thr Gly 435 440 445
Val Ala Leu Ser Pro Thr Gin Leu Arg Asp Val Leu Leu Glu Val Asp 450 455 460
Asn Pro Leu Tyr Leu Gly Val Glu Asn Ser Asn Leu Val Gin Phe Glu 465 470 475 480
Ser Lys Pro Ala Thr Ser Ser Arg lie Val Ser lie Lys Pro Cys Ser 485 490 495 lie Ser Asp Leu 500
<210〉 67 <211> 1410 <212> DNA <213> 破囊壺菌(Thraustochytrium sp.) <220> <221〉 CDS <222> (1)..(1410) <400> 67 400 200813222 ggc gat aag tct ttt atg gaa acg tac aac gtg tea gca cct ctg tat 48
Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala Pro Leu Tyr 1 5 10 15 act gga gca atg gcc aag ggc att gca tcc gcc gac ttg gtc att get 96
Thr Gly Ala Met Ala Lys Gly lie Ala Ser Ala Asp Leu Val lie Ala 20 25 30 get ggg aaa ege aag ata ett gga teg ttt ggt geg gga ggg ctg cct 144
Ala Gly Lys Arg Lys lie Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro 35 40 45 att tec ata gtc cgt gaa gca ctg gag aaa att caa caa cac ctg ccc 192 lie Ser lie Val Arg Glu Ala Leu Glu Lys lie Gin Gin His Leu Pro 一 50 55 60 cac ggc ccc tac get gtt aac etc att cac teg cct ttc gac age aac 240 " His Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro Phe Asp Ser Asn :: 65 70 75 80 ttg gaa aag ggc aac gtt gac etc ttt etc gag atg ggc gtg aca gtg 288
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val 85 90 95 gta gaa tgc age geg ttc atg gaa etc acg gcc cag gtt gtc egg tac 336
Val Glu Cys Ser Ala Phe Met Glu Leu Thr Ala Gin Val Val Arg Tyr λ 100 105 110 ege geg tct ggt eta age aaa agt geg gac ggt teg att ege att get 384
Arg Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser lie Arg lie Ala 115 120 125 cac cgt att att ggc aag gtt tec aga acc gag ctg gca gaa atg ttt 432
His Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe 130 135 140 att cgt cca gca cca cag cac etc etc caa aaa etc gta gcc tec ggc 480 lie Arg Pro Ala Pro Gin His Leu Leu Gin Lys Leu Val Ala Ser Gly 145 150 155 160 gag ctg aca get gag caa gcc gag ett gca aca cag gtt ccg gtg geg 528
Glu Leu Thr Ala Glu Gin Ala Glu Leu Ala Thr Gin Val Pro Val Ala 165 170 175 gat gac att geg gtc gaa gcc gac teg ggg ggg cat acc gac aac agg 576
Asp Asp lie Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg 180 185 190 cct att cac gtc att ett cct eta ate ate aac eta ege aac cgt ttg 624
Pro lie His Val lie Leu Pro Leu lie lie Asn Leu Arg Asn Arg Leu \ 195 200 205 / cat aaa gag ett gac tac cct teg cat etc egg gta cgt gtg ggt get 672 His Lys Glu Leu Asp Tyr Pro Ser His Leu Arg Val Arg Val Gly Ala 210 215 220 - ggt ggt ggt att gga tgt cct caa gcc get ett gca gca ttt caa atg 720
Gly Gly Gly lie Gly Cys Pro Gin Ala Ala Leu Ala Ala Phe Gin Met _ 225 230 235 240 ggg gca geg ttt tta ate act gga acg gtg aac cag ett get cgt gaa 768
Gly Ala Ala Phe Leu lie Thr Gly Thr Val Asn Gin Leu Ala Arg Glu 245 250 255 agt ggc act tgt gac aac gtc egg tta cag etc tea aag gcc acg tat 816
Ser Gly Thr Cys Asp Asn Val Arg Leu Gin Leu Ser Lys Ala Thr Tyr 260 265 270 age gac gtg tgt atg get cct get gcc gat atg ttt gac caa ggc gtg 864
Ser Asp Val Cys Met Ala Pro Ala Ala Asp Met Phe Asp Gin Gly Val 275 280 285 gag ctg caa gta ttg aag aaa ggc acg ctg ttc cca agt cgt get aag 912
Glu Leu Gin Val Leu Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys 290 295 300 401 960 200813222 aag ctg tac gag ctg ttc tgc aag tat gac teg ttt gag gca atg ccg
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro 305 310 315 320 get gaa gaa ttg caa egg gtt gaa aag egg att ttt caa aag teg ett
Ala Glu Glu Leu Gin Arg Val Glu Lys Arg lie Phe Gin Lys Ser Leu 325 330 335 get gaa gtt tgg cag gag acc agt gac ttt tac att cat cgt ate aag
Ala Glu Val Trp Gin Glu Thr Ser Asp Phe Tyr lie His Arg lie Lys 340 345 350 aac cct gag aaa ate aat cgt get gca age gat ggc aaa ctg aaa atg
Asn Pro Glu Lys lie Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met 355 360 365 teg ett tgc ttt ege tgg tac ett ggg ett tee tea ttt tgg gee aac
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala Asn 370 375 380 tet ggg gca caa gat ege gtc atg gac tat caa att tgg tgt ggc cct
Ser Gly Ala Gin Asp Arg Val Met Asp Tyr Gin lie Trp Cys Gly Pro 385 390 395 400 get att ggc get ttc aat gat ttt acc aag ggc aeg tac ett gac gtg
Ala lie Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr Leu Asp Val 405 410 415 act gtt gca aag agt tac cct tgt gtg gca cag ate aat ttg caa att
Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gin lie Asn Leu Gin lie 420 425 430 ttg caa gga get geg tat ctg aaa ege ett ggt gtc att cgt ttt gac
Leu Gin Gly Ala Ala Tyr Leu Lys Arg Leu Gly Val lie Arg Phe Asp 435 440 445 ege atg ctg ctg cag gee gtc gat ate gac gat cct gta ttt act tac
Arg Met Leu Leu Gin Ala Val Asp lie Asp Asp Pro Val Phe Thr Tyr 450 455 460 gtg ccg acc cag cca ett
Val Pro Thr Gin Pro Leu 465 470
<210> 68 <211〉 470 <212> PRT <213>破囊壺菌(1'1^1131:〇(:1171:1^111115口.) <400> 68
Gly Asp Lys Ser Phe Met Glu Thr Tyr Asn Val Ser Ala Pro Leu Tyr 15 10 15
Thr Gly Ala Met Ala Lys Gly lie Ala Ser Ala Asp Leu Val lie Ala 20 25 30
Ala Gly Lys Arg Lys lie Leu Gly Ser Phe Gly Ala Gly Gly Leu Pro 35 40 45 lie Ser lie Val Arg Glu Ala Leu Glu Lys lie Gin Gin His Leu Pro 50 55 60
His Gly Pro Tyr Ala Val Asn Leu lie His Ser Pro Phe Asp Ser Asn 65 70 75 80
Leu Glu Lys Gly Asn Val Asp Leu Phe Leu Glu Met Gly Val Thr Val 85 90 95 1008 1056 1104 1152 1200 1248 1296 1344 1392 1410 402 200813222
Val Glu Cys Ser Ala Phe Met Glu Leu Thr Ala Gin Val Val Arg Tyr 100 105 110
Arg Ala Ser Gly Leu Ser Lys Ser Ala Asp Gly Ser lie Arg lie Ala 115 120 125
His Arg lie lie Gly Lys Val Ser Arg Thr Glu Leu Ala Glu Met Phe 130 135 140 lie Arg Pro Ala Pro Gin His Leu Leu Gin Lys Leu Val Ala Ser Gly 145 150 155 160
Glu Leu Thr Ala Glu Gin Ala Glu Leu Ala Thr Gin Val Pro Val Ala 165 170 175
Asp Asp lie Ala Val Glu Ala Asp Ser Gly Gly His Thr Asp Asn Arg 180 185 190
Pro lie His Val lie Leu Pro Leu lie lie Asn Leu Arg Asn Arg Leu 195 200 205
His Lys Glu Leu Asp Tyr Pro Ser His Leu Arg Val Arg Val Gly Ala 210 215 220
Gly Gly Gly lie Gly Cys Pro Gin Ala Ala Leu Ala Ala Phe Gin Met 225 230 235 240
Gly Ala Ala Phe Leu lie Thr Gly Thr Val Asn Gin Leu Ala Arg Glu 245 250 255
Ser Gly Thr Cys Asp Asn Val Arg Leu Gin Leu Ser Lys Ala Thr Tyr 260 265 270
Ser Asp Val Cys Met Ala Pro Ala Ala Asp Met Phe Asp Gin Gly Val 275 280 285
Glu Leu Gin Val Leu Lys Lys Gly Thr Leu Phe Pro Ser Arg Ala Lys 290 295 300
Lys Leu Tyr Glu Leu Phe Cys Lys Tyr Asp Ser Phe Glu Ala Met Pro 305 310 315 320
Ala Glu Glu Leu Gin Arg Val Glu Lys Arg lie Phe Gin Lys Ser Leu 325 330 335
Ala Glu Val Trp Gin Glu Thr Ser Asp Phe Tyr lie His Arg lie Lys 340 345 350
Asn Pro Glu Lys lie Asn Arg Ala Ala Ser Asp Gly Lys Leu Lys Met 355 360 365
Ser Leu Cys Phe Arg Trp Tyr Leu Gly Leu Ser Ser Phe Trp Ala Asn 370 375 380
Ser Gly Ala Gin Asp Arg Val Met Asp Tyr Gin lie Trp Cys Gly Pro 403 200813222 385 390 395 400
Ala lie Gly Ala Phe Asn Asp Phe Thr Lys Gly Thr Tyr Leu Asp Val 405 410 415
Thr Val Ala Lys Ser Tyr Pro Cys Val Ala Gin lie Asn Leu Gin lie 420 425 430
Leu Gin Gly Ala Ala Tyr Leu Lys Arg Leu Gly Val lie Arg Phe Asp 435 440 445
Arg Met Leu Leu Gin Ala Val Asp lie Asp Asp Pro Val Phe Thr Tyr 450 455 460
Val Pro Thr Gin Pro Leu 465 470
<210〉 69 <211〉 39669 <212〉 DNA <213〉沙雷菌(Sh. japonica) <400> 69 gatctggcga taacttactc cccattccac tgtatcagct gcctgcaacc tttaacggcg 60 atcataaacg cgtcattcgc tggcagacag agtggcaagc ctgtgatgaa ttacaaatgg 120 cagcggccac aaaggctgaa tttgcagcat tagaagaaat taccagtcat caaagtgatt 180 tatttagacg gggctgggat atcaggggcg gagttgagta tttaactaaa atcccaactt 240 attattattt ataccgtgtc ggtggcgaaa accttgccag tgaaaaaaac cgagcttgtc 300 cacgttgcgg ctcaaaagcg tggcgtttag atgagccatt attagacatg ttccacttta 360 ggtgcgagcc atgtcgaatt gtatcgaata tctcatggga tcatcagtaa aattatcttc 420 tcgtcaatag atactaatac aacgagttag ctgataacgc attatcggtt cattcaataa 480 aaaagccaga ccgcatctat agcctgatct atagcctggc ttttttattt tatgtccgaa 540 taagcaatta tttcttgcct ttaatcaaat cattccacat cattttcatt cgctgccaaa 600 tacctggatg agcaacatat tcctctacaa tcggctctac cggcggcgtt actcgtggtg 660 ttagcgcatc aataaattcc gcaagactat cggctaattt atctttgggc ctatcacctg 720 gaatttcaat ccacacactg ccatcttcat tatcgacagt aatcatctgt tcgccatcac 780 ctaaaacgcc aacaaaccaa gttggtgctt gtttaagctt tttcttcatc attaagtggc 840 caattacatt ttgttgcaaa gattcaaaat cttgctggtt ccaaacctgc agtaactccc 900 cttcgcccca tttagaatcg aaaaaaagtg gcgcagaaaa aaactcacca taaaaggcat 960 taatgtcttg atgaagcttg atgtctaatg catgttctac attactgaaa tctgaattac 1020 tttttcgttt taccgctttc caaaaaaccg caccgtcaga ttcaagatca tacttgcctt 1080 caatacaagc ggatccttgc ccaagtggga aataacgggg taactcgtct aatacatcct 1140 gataagcttg tatataacgg ctagaaaaat gttccaatga agttgaacaa gacacttaag 1200 atgctccagt tttgggttat aataaaagtc tattttgaca cggaaacaga ctagatgaca 1260 cacaatcacg acccctatag tgatgcagat gcacttaaag gactcacttt aggtcaatcg 1320 acgcaatatc aagcagaata tgatgcttca ctgctgcaag gggttcctcg taaacttaat 1380 404 1440 200813222 cgcgacgcta ttgaattaac tgatactctg ccgtttcaag gggcagatat ttggactggc tacgagttat cttggttgaa cgccaaaggt aaacctatgg tcgcaatgat tgaagtttac cttgctatcg aaagtgataa tttaatcgaa tcaaaatcgt tcaagttgta tttaaacagc tttaaccaaa cacgttttga cagtgtagac cacgttcagc aaaccttaac cactgactta agccaatgcg ctaatggtaa ggtaacagtg aaagtgattg agcctaagca tttcaatact caacgtattg ttgaactacc tggcaattgt atcgatgagc tagatattga agtcaatgat tatgaattta accctgagta cttgcaagac agcactgaag agaaaaatgt tgtcgaaaca - ctcacatcaa acttattaaa atctaactgt ttaatcactt cacagcctga ttggggaagt " gtgatgatcc gttatcaagg cccaaagatt aatcatgaaa agctattgcg ctatttaatc / tcattccgcc aacataatga atttcatgag caatgtgtag agcgtatttt taccgaccta aaacgatact gtcattgtac taagctcact gtttatgcac gttatacteg ccgcggtgga ttggatatca acccattcag aagcgacctt gagcaacctc cagagacgca ccgtttagca agacaataaa tagettatte atcaatcagc ttaatgaata aagcctaatc cctaggcttt _ attcatttat tttctgtcgt aataccgagc ccttcatgcc tacagacaat gttacttgtt taacaccaac aactgacgat attcagtccc ataageattt caaaatattt aaaccctttg gttttttaag tcagtttgtg cctgaaactc gaaagaaaaa acacttattg ggcgagttat gtcagtttcc agataaaacc atggcaattg gtegattaga ccatgattct gaaggettat tactgctaac aactgacggc atgatgagee ataaagtgag aagtaaaggc atcgaaaaag aatattatgt tcaagtggat ggegatateg atgacaaggc gatgtcacaa ctacaaaacg gagttgaaat tggcattaat agcacgaaat atctcactca gccctgtaaa gcagtcaagc taaacgcaga gccaatactt ccctcacgcg gtaaaaaaat ccgcgatcca agacatggcc ccaccagctg ggtttcaatc acattaactg aaggtaaaaa ccgtcaaatc agaaaaatga ccgctgccgt tggctttgcc acattaaggc ttgttagggt cagaattggt aatatacata ttgatgatat gcgagctggc gacgttattg aactcaataa ettagattea gtaataaacc ctaaccttag ctaacccata aaacggggct attcatttat cggcttacct tactagttat ‘ tggttaaata cactttctcc atcgcagact ccaccagctc ccgtaaccac tttatcgcag ggtcttgatg attacgtgtt ggccaaatac tgtaaatcga aatcacttgg ctttcaaaag gcaagtccat caaaattaaa ttaaaaatag attgatagtt tttegegtag gtataaggcg 、 caatacatat ggeateggat ttactcacgc cagataacat cgtcagtaaa gaggattttt 〜 caccatacat atetegttea ggtaaatggt ctgttgaaat catctctgca actcgctggt tatgaegatg aagtcgataa aacagatgct tageagegaa gtacgacact teatetatte catgtttaaa ttgcgggtgc tcagccctag caacacaaac aagcttttcg gtggcaattt gcttactggt aaageteget tcagttggcg caacaatatc tagegetaaa tcaatttgct gatttttaag ggettgatat aaattaccct catctaaaat cgcttctgta aaaatgattt caacgccttt atccgtcagt gacttttcga tatetgette aatcaaatca ataattgatt cattagcgct gacatgaaat atccgttttg acaacgaagg gtcaaaggct ttaaegetat taatgcattg ttcgatttcg atgagtggca aacttaactg tcggtgcaag tgctgaccta tcgcagtgag agctatccct cttccttgcc taataaatag ttcaacaccc acaaccgctt 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 405 200813222 taaaccgatt gatagcatta ctgactgacg actgagttaa tgcaaggtgc tccgctgcaa gcgtaataga ttgataatca catacacagc aaaaaactct aataaggtta agatccaact taagtaattg ttgttgcata agagcatcag actctaagtt ctcttgcttc atcacttctc ccataacaca tatcgccaaa tacattcaca cggtaaatgt attaaccatt tttagccata gttatatttg ggctttttat tgttaactta tctttaacaa taaaaagtac ccgaggccta catgagaaaa acacgagttg ctttagtcat cagtttatca tttaccaatg cagtggctgc tgcgcagcac gaacatgacc acatcagtct tgattaccag ggtaagcctg cgacgcccat taccgcagag cacaacaaag ccatagcaca aaagttaccg ttcgaagata aatccgcttt tgagcgcttt agtcgacata aaattgcctc ttttgatgaa gccaccgcca agatactgcg tgcagaattt aactttatca gtgacacgct tcctgattca gtcaaccctt cgttatatcg ccaagctcaa cttaatatgg taccagacgg gctctataaa gtgactgatg gcatttacca agtacgaggc actgacttat ctaacttaac ccttattcga ggtaaaacgg gttggattgt atatgacgtt ttattaacta aagaagctgt tcagcaatca ttaacatttg cttttgctca cttgcctgag ggcaaagatt tacctgttgt ggcaatgatt tactctcaca gccatgcaga tcatttcggt ggtgcccgtg gcgttcagga acgctaccct gatgtcaaag tgtatggttc atataatatt acccaagaga tagtggatga aaatgtactc gcgggtaatg tcatgagccg gcgagctgct taccaatacg gcgttacact cgataaacac aatcacggaa ttgtcgatgc agcgttagca aaaggtttat caaaaggcga aatcacttac gtcaaacctg attatgaact tcatcatcaa ggcaaatggg aaaccttgac cattgatggt cttgaaatgg tctttatgga tgcatctggc actgaagctg ccagtgaaat gatcacatat ataccatcta tgaaggcgct atggtcaggc gaattaacat atgatggtat gcacaatatt tataccttac gaggcgctaa agttcgcgac gcattaaaat ggtctaaaga cattaacgag atgattaatg catttggcga aaatgttcag gtactatttg cttcacattc tgcgccggta tggggaaata aagaaattaa tcattacctt cgcatgcagc gagataatta tggcctcgtt cataatcaat ctttacgttt agccaatgaa ggtgtggtaa tacaagatat tggtgatgca atcatggaaa ccattccaca aaatgtccaa gacgaatggt acaccaatgg ttatcacggt acatacagcc ataacgctaa agctgtgtac aacatgtatt taggctattt tgatatgaat ccagccaact taaacccctt acctacaaag gctgaagcaa ttaagtttgt agaatatatg ggcggcgcca acaatgtagt atcaaaagcg caagcagact tcaatcaagg cgagtatcgg tttgtcgcca ctgcattaaa taaggtggtc atggccgaac cacaacaccc ccaagcccga gaattacttg ccgataccta tgagcaactt ggctaccaag ccgaaggagc tggttggcga aatatttact taacaggtgc gcaagagtta cgtattggca ttaaacctgg cgcacctaaa tccgcatccg ctgatgttat cagcgaaatg gacatgtcca ctttatttga ctttctcgcg gttaaagttg acagcattaa cgccgccaag cttggcaata tcactttaaa tgtggtgaca caaagcggcg ataaaactga cacgctcttt gtagagttaa gtaacggaaa cttgagtaat atcaaagtag acgaggctaa aaaagccgat gccacactga caattaataa gtctgatgtc gttgcaatat tattaggtaa agcagatatg aaagcgttaa tgcaatcagg agctgcgagt atgcaaggtg acaaattagc 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 406 200813222 atttgccaaa attgcatcaa cactggtgca atttaatcct gattttgaaa tcgtaccgct acagcatact cattagctca taacttaacg aaattcggct gcgaagtttt tcactctgct tctttgctta tattcactag tttaccaaga gtaatggcat gagagtttaa agcaaaaatg accgactaag acaagtgagg gaagattgtt ctgataagcc gtttttgatt agcagttaaa catccaaaaa accttaacag ttcgataaat cagttggttt ttatgaacat ttttatttgt tcatgccagc tgattttttt tgcctttaat tgaagtgtta atggcttttc gccaaaagcg aactcgccca cactcacagc aaatcgatat gaattattaa gcttacctaa acaacattgc - cataaaggtg agacttcata aaaagactca acatcattag tctgttcaag ctcatcaacg ’ tctgtaggct tcaataagct aagtgaaata tcatgctgaa ttggcaacaa ctgatcatct 了 attgttaagt tagctaagct cggtgcagat aagtcaaatg caaacgattt aagcgacaag gccagtccca gtccctttgc tttaatataa gattctttca gtgcccataa atcgaaaaat cgctcacgct gctgactttc aggtaacgcc aataatgcag tttcttctgg ttttgaaaaa tagtgatgta aaattgaatg gatattcgtg ctttctcggc gacgttcaat atcgaccccc f aattgaatgg gcattgaagc gtcctctttg gagtgaatga caccaataag caaccagtta ccactgtgac ttaaattaaa ctgtaagccc gtttgtttat attgcacagc cgatagccta ggtttgccct tctcaccata ctcaaattgc caatcgtctg gttcgatatt tgcaaagttc gataatacgc tgcgcaaata cccacgcacc attaaccctt gctgttgagc agcctgttga ataaaacgat ccactttatt tatctcagca tcagataacc atgaacgcac tgtagagacg gttttctcat ctaataaatt ggtatctaaa ggacaaaaaa ataattgaat agtgggtaaa gggctcaaac caaactcgca tttataatag caataagaca ttgtcgcttg ttctaggtcg ctaattcaac acataaacaa tcttgattga aaatgtcgtc taaggtttaa acaaataaag gaaggtttag acaaataaaa aagggttaag ccatccttaa ccctttgcat atcatctgtt atttcaataa gtattagcca atcaatctac cagtgctttt accgcctttt taggtaaaac atcataacgg ctaaactgca ttgaaaactg accttctcca cctgtcatag atttaagctt tgaagagtag ctactgacat tggcaagtgg cacttcaacg ctgacttcaa caagtccatt 、 ggcatttgcc tgcgttccac aaataatgcc tctagatgca ctaatgtcac ctgtcacttc ., gccgacatgc tcttgcccaa ctaaaatgct catatcaact aatggttcta acattacagg ttttgctaac gatactgctt ctataaaagc ttttttaccc gccatcacaa aagcaatttc — tttagagtct acactgtggt gtttgccatc caataacgtg acttttatgt cttgtaatgg 〜 atagccacct aactcaccgg ctagcatggc ttctcgcacg cctttctcta ctgctggaat atattgactt ggcactgage caccaaccac ettegaaata aactcaaagc cttcaccacg ctcaagtggc tcaatggcta attcaacttc accaaattgg ccagatccgc ctgattgttt tttatggcga taaeggeatt gtgctttctc ggtgatggtt tetegataag ccaccgccgg cgtatcagta tccatgtcga ggtggaacat attttgcgct ttttcaagcg caatttttaa atgcaaatcc ccttgacctt gcaatacggt ttgcccttca acctcacttc gagtgatgtg taaacttgga tcttcagcga ccagtttatt gagaacatcg gagatctttt gttcatcacc aegaegettg gctgatacag ccaaaccaaa aataggttgc ggcacttcca gttctggtaa atgaaattca tcttcatcat ggctatcatg cagtacagaa ccaacactta atgcatccaa 5940 6000 6060 6120 6180 6240 6300 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 407 200813222 ttttgcaata gcgcaaatat cgccaggaaa cgcttgggat acattaattt gtttatcgcc ttgaagcttc attaagtgag agactttgaa aggtttgcgg ccttggccaa taagcagctt catgccaaca ttcagcgtcc cttggtacaa cctaaatacg cccagtcttc ctaaaaatgg gtcaattgaa acgctaaaca catgggctaa aacatgatct gttgcctttt gtgtcactgt tactggtgtc gactgttcac caaatccttt cataaattgt ggtgcattgg cttcaagtgg acttggcatg agtttgatca acatttctaa caatgaacta atcccaatat cttgttctgc acttgtaaag cagactggca ctaagtgccc cattctgagt gctttttcta gcggagcatg aagctgctga ggcgttaacg actcaccttg ctctaaatac aaggtcatta acgcttcatc ttcttcaagt accgtatcaa ctagctcatc tctagcacta gcaggttgac taaataatgt ctctgcactt tcatcacaat gtaaataaca atcaacaacg gcttttccat cggcactggg caagttaacc ggtaaacatc ggtgtccaaa ttgatgctga atgtcgatca tcacatctga cactcgcgtg agattactgt cgaggtggtt aatggcaata atcaccgctt taccttgcgc tcttgcagct tcaaaagcac gtttagtcac agactctata ccaacggcgg cattaataac caacagtact gactcaacgg caggcaaagg taataaggct cgcccgaaaa agtcaggtaa acctggcgtg tcgataaaat tgatatgatg ctgttgatac tgaaggtgta aaaatgaagg ctctaaactg tgacggtggg atttttcttg ggcagtgaaa tcagcatgat ttgtgccctt gtcgaccctg ccttttaacg atattgcctt agctctatac agcaatgctt caagcaagga tgatttgcct gctccaacat gtccgagcac agccaaatta cgggtttgct cagtagtaaa ctcagccata atggcctcct gttttcacat tattaaactt tccatattct tgtctaactt tgtttacgtt tggctattta ttgcgcataa aaatagcata cggggctaac aactcagatg aattgaccta gatcagtgtt tacatcggca acgtttttta taacaaaatc acccattcgg cttacaagtg ttagctaatt ctggtcgtat cagtgattaa ttagtttcgg gtgattgtat cgacccgaaa cctcaggtac tctgcatgct cgattgtgct aaaacgctaa ttttgaagat gaacaaacgt taatcttcac gtttttatac cgagtcccaa cagattgtac ggagtattca tcgaactatg gcagtcctta aatgaccgca aatagaaaag ctcacgctgt aactcaaaca gccgctaaga aagccacatc agaaaccgat gttgcgatgg cccctgttcg ccatagcaat gcaacaacga ctcctgaaat gcgtcaattt attcagactt ctgatttcag tgttagtcaa ttggctaaga ttcttaatat ctcggaagcc actgtcagaa agtggcgcaa gcgcgactca atcagtgata cgcccaatac tccacatcat ttgaaaacca cgctttcacc aatggaagaa tacgtggttg tgggacttcg ttatcaatta aaaatgtcac tggatagatt gcttcacgtc acacaacaat ttatcaaccc taacgtctct cgctctggtt tagcccgatg tttaaagcgc tacggcatat caaaactaga tgaatttgaa agccctcatg tgcctgagtg ttattttaat cagctgccta ttgttcaggg tacagatgta gcgacttata cactgaaccc tgaaacgctc gctaaaaccc ttgcattacc tgaagcgaca ccagataacg ttgtacaggt tgtatcgtta acgattccac ctcaactcac tcaagcggac agttattcca ttttgctcgg tgtcgacttt gcaaccgact gggtgtatct cgacatatat caagacaatc acacacaagc gacaaatcgt tatatcgctt atgtgttaaa gcacggcccg tttcatttac gtaagttatt agtcaaaaat 8220 8280 8340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 .9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 408 200813222 taccacacct ttttagcccg ctttcctggc gcaacagttt tacaatccac ggaagcggca aaccaaaaaa ataaatcagc taaggatcag ctgaacactg gagactcaaa atgagccaag cccctacaaa tcctgagaca agctctcaag ataataacga gtcgcaagat acaagactga ataaacgtct taaagacatg cccattgcca ttgtcggcat ggccagtatc tttgccaact ctcgttacct gaataagttt tgggacttaa tcagcgaaaa aattgatgct attaccgaag tacctgatac ccactggcgc gctgaagatt actttgatgc tgacaagagc accccagata agagctactg taaacgcggt ggttttatcc ctgaagtgga ctttaaccca atggaatttg - gcctgccgcc aaatatccta gaactgaccg atacttcgca attattgtca ttagtgattg * ccaaagaagt gctagcagat gctggtgtca cttctgaata tgacactgat aaaatcggta v ttactttagg tgtgggcggt ggccaaaaaa ttaatgccag cctaacagca cgtctgcaat accctgtgct taaaaaagta tttaaaagca gcggcctaag cgatgccgac agcgacatgc ttatcaaaaa attccaagac caatacattc actgggaaga aaactcgttc ccaggatcgc ttggtaatgt tattgctggt cgtattgcta accgctttga cttaggcggc atgaactgtg f tggttgatgc ggcatgtgca ggttcacttg cggcaatgcg tatggcgtta accgaactgg ttgaaggccg cagcgaaatg atgatcactg gtggcgtatg taccgataac tcgccatcga tgtacatgag tttttcaaaa accccagcgt ttaccaccaa tgaaacgatt cagccatttg atatcgactc aaaaggcatg atgattggtg aaggcattgg catggtggca ttaaaacgtc ttgaagatgc tgagcgtgac ggtgaccgta tttactcagt cattaaaggg gtcggcgctt catctgatgg taagttcaaa tcaatttatg cacctcgacc tgaaggccaa gctaaagcgc tgaagcgtgc ttatgatgac gccggctttg cacctgaaac cgttggctta attgaagctc acggaacagg cactgcagcg ggtgatgtgg cagaatttaa tggtcttaaa tctgtatttg gtgagaatga ctcaacaaag caacacattg ctttaggttc agttaagtca caagtgggcc atactaaatc aactgcggga accgcgggtg tgattaaagc ggcgttagca ctgcatcata aagtgctgcc gccaaccatc aacgtctcta agcctaaccc taagcttaat gttgaggatt caccgttttt cattaacact gaaactcgcc cttggatgcc tcgccctgat ggcacaccac 、 gccgagctgg tataagttcg ttcggttttg gtggcacaaa cttccactta gtactagaag , aatacagccc agagcacagc cgtgatgaga aatatcgtca gcgccaagta gcacaaagct tattgattag cgctgacaat aaagctgagc tcattgcaga aatcaacaag cttaacgctg ^ acatcagcgc gcttaaaggc acagataaca gcagcatcga acaagctgaa cttgcccgca _ ttgctaaact atatgctgtt cgcactttag atacttcagc agcccgtttg ggtcttgtgg tctcaagcct taatgaatta accactcaac ttggtttagc gttaaagcag ctaagtaacg acgctgaagc atggcaatta ccatcaggta cgagctatcg ctcatctgcg ctcatcacga ttaatgccaa ccaaaagacg actaaaggta aaaaagcagc taacacaccg aaagtagcag cattatttgc aggtcaaggt tctcagtacg tcaacatggg gattgatgtt gcttgtcact tccctgaaat gcgccagcaa ttaatcaaag ccgacaaggt atttgcaagc tttgataaaa cgccattatc gcaagtgatg ttcccaattc cagcctttga aaaagcagat aaagatgcgc aagcagcttt actcaccagc actgataacg cgcaaagcgc cattggtgta atgagcatga gccaatacca actgtttact caatcaggtt ttagcgcaga tatgtttgca ggtcacagct 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 409 200813222 ttggtgagct tatcctatgc tagataaagg gcgataacat actacaactc ctaaagccat acacaccact tcacggcgag ctaaatcaat agctgaacaa ttctgcaaaa gtatcaatcc ttagcgtttt ctgcggtacc ctcgtgccaa caattgttga aagaagtcat acgttgcgcc gtttagaagc cgattccgca ttgctgcagg atcaagcgca aaaatgcatt caattgttaa tcgtaaacac tggccgctcc tagtaagtgc cacaaaaagt aaatgcttga ttgaaatatt atttagctga ccgcaggcgc ccgcttcagg aaacaggtta tcgattcaat cagagctaag tgggtagtaa ttcagctctt tcgcggcgct cacgatgtac cgctaaatta agccactcag tgccgcttta tgtggggcat caaagtcgac taaagccgct tatgtacgat actggttgaa aaaccctaag aggtgcgcca aaaaggcatg gatggaaaaa gaaagttatc taaaactgaa tcaagcaata gttctttaat gcaatatggt ccaagccatt aacgctacaa aaacatgcta ttcaccagta gccagtagta aaccccacct acctgtagtt tctggatact acttagcatg aggtactgtt gtgtcgtaca tatgaacagc tcttagcgca tccaactgaa taaacgtgtt ccctgaagat actacccgcc tgcgctgctg tcaatggccg gccattatct gaaagctgca ctagttattg ggctttaaag gcgcaaaagc ctgttctcaa ttcaagcaac gcgggagcgc gcgaccctag ggcaacagtg ctctcaagca aacgttaaac tcattagcaa gaaaaacctg tatgttgaag gcacctcatg gcacaacagc gacaccttta cctgaaagct agtcacaccc acgggtcaaa gttgaagcgg ccagcagtaa gttgaaccaa cctacccctg atgttagaag gacatggaag caagacgaac ttgggcgaaa gacactgcaa gaaacagtac atgcttgaac gaaatattag ttagctgagt gcaggcgcta gcgttatttc catcagcagt tgccagctaa ttagcgagtt caggcccaac ctatcgcgct catttgctaa atgccactgg atatgctgca gcgtatttgt gtaataaagc atgtgcaact ttgaccctta tcaatgcaac caggccaagt ttgaaaaagt ttgccacatc catcagctca aagccgctga ctcacttgat tgcaacgctc tgtttttaga cacctgttac tgaaagtagc aggccacacc ttaaagcacc ctggcttaag tggttgcaga cagacttagg taccaacact tcgttgacta atgcaactca tcaacactat taagcatgga gtactgttca gtcgtacact tgaactctaa taatgacgac tgataaagat tgaaaatgat tgaaggcgtt acaaagctgc acctgtttct agccattgat tgacaaacac atcagttcgt cgagttcggc tgaagcggta tcgtgttgca tcaagctgaa caaccacatc aacctctcaa agtagagaag tggcgcaaca ggctgctcct tctgcatcag ggcagagcaa gattgagtta acaacaagct tgctcctgtt acctcctgta tgtagctcaa tgctcctgta cgcacaaaca aaaaaccggt catcgattca gccagaactc tatgggtagt cacagccgtt gcttgaagtg catggaagcc agacgaactg gggtgaaatc acttcctgca tactaccaat ggcaatgaat gcagcaaata aaggtggcta gccgatgcag ggcgccttcc aaagctaagt ccaagtgacg tttactgatc cctaagaaca tccgttatca gctatgcaac atcgcagctc agtgcaccta gttgtcgaaa atcgtggaaa acagtgtcta gcttctggca caattcttag agtaaaatgg ttccatcagc caggcaagcc gttaacgcac caaactcctg cctgctgcga gccgctcctg gccctgagct tacccaactg attaaacgtg agtcctgaag aaactaccgg tccgcccctg gttgcagaaa gatttaggca ccaacaccgc gtatcttata agtgccgctg 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 410 200813222 aagtagctca accccaaacc gcgccagttc ttctgaatac catgctagaa gtcgttgcag aactcagcat ggacatggaa gccgatttag taggtactgt tcaagacgaa ctgccaacac agtgtcgtac tcttggtgaa atcgttgact ctgccccagt tgcatcacca gttcagtctg cagttttgaa taccatgcta gaagtcgttg - ttgaattaag catggatatg gaagccgatt * tattaggtac tgttcaagac gagctgccaa ctgagtgtcg tactcttggc gagatcgttg gcgctatgaa cactaagctt cctgctgaag ctcaagtagc agctactcaa acatcaggtt tgacagtggt tgctgagaag accggttacc # tggaagcgga tttaggcatc gattcaatca atgaacttcc gacgctacca gaacttaacc gtgagatcgt ttcgtacatg ggtggtaaac tacctgctga aggcgctaat acacaggccg ccgcagaaac agccctgagc getgageaag aaaaaaccgg ttacccaact gaaatgcttg gcatcgattc aatcaagcgt gttgaaattt tacctgaatt aaatcctgaa gatttagcag atatgggcgc taaactgcca gccgcaggcg ctcaatctgc acccgcagca gagttagcaa taaaaaagct accagcggcg gataagttag ttatcaatga tgacggccat aacgcaggtg :C ' ^ ’ taaccgtcgc cgttattcgt agccctgagt . gtgatattgc cagcttcact ttatctgcgg ctcaaattag caagcagcat aagatcgccg — cacaaggagc tttgccttta agtgatgctg % tggctaaaca cctacagaaa ccatttgctg tgactgtcag ccgcatcgat ggtggctttg cagagctaaa ccaagctgca ttatcaggtt ctgtgttctg tagageattg gatattaccc ccgttattgc agagetattt gatgttgata aaggtcgtca taetttatea getaeggeaa taaacagtga agatactgta ttggtgactg cccttactct tgccaaacaa actcagtcgc tagccggtaa tttaccgact tgggcaaaga aagctgcatc tggeettage gctgaaacag 14940 aaaaaaccgg ttacccaact gaaatgcttg 15000 gcatcgattc aattaaacgt gttgaaatat 15060 tgccagagct aagccctgaa gatttagctg 15120 acatgaactc taagctaccc gctgctggtt 15180 cgactccggt atctggtctt agcgctgaaa 15240 ctgaaaagac tggttatccg actgatatgc 15300 taggeatega ttcaatcaag cgtgttgaga 15360 cactacctga actcagccct gaagatttag 15420 actatatggg tagtaaacta cccgccgcag 15480 gcgctaatac acaggccgcc gcaggcgctg 15540 taagtgcgga acaagttcaa agcactatga 15600 cgactgaaat gettgaatta ageatggata 15660 agcgagttga gatettaggt acagttcaag 15720 ctgaagattt agctgagtgt cgtacacttg 15780 tacccgccgc aggegetatg aacactaagc 15840 cagcaggcgc ttctcaagta gctgcctcaa 15900 ttcaaagcac catgatgact gtggttgctg 15960 aattgageat ggatatggaa geggatttag 16020 tagggacggt tcaagacgag cttccgggct 16080 agtgtcgcac cctaggcgaa ategtatett 16140 ctatgaacaa aaagcaagcg agcgttgaaa 16200 ctgacttacc tcctcatcag gaagttgcgc 16260 ttgacggttt ttcaaaagac gcctgtatcg 16320 ttttagctga aaaattagta gcaacaggcc 16380 cagtgacatc tgcgcaatca ccgcttagca 16440 tcaatgacga egegattage gatgtcattg 16500 gttttgttca cctacaacct caactaacag 16560 gttttgtagc agtagagcaa gctttcttga 16620 agctagcaaa aactgagcgt gtcagcttta 16680 gttacttaaa cacggctgaa cttgccaaag 16740 taactaaaac attaggteat gagtggccaa 16800 caagctttga agctgtcgag ttagcacaag 16860 cagcaacagc tgaagtgggt attagcgacc 16920 ctgctcaaac ccgttaccaa accacatctt 16980 gcggtgctaa aggcgtcaca tttgaatgtg 17040 actttatttt agcgggtcgc agtgagcatt 17100 gtgtcatagc ggctgcgcct aacgttagtg 17160 411 200813222 aagtaaacac agccaacacc atcgctcatt tcagctcaga ttcatggtgc gccgtgtata gcaagttaaa aaagtgacta actacccgca gttcagcatt gcgcaaactt caagcatgca cggactcttc gtgttgtcaa ttgaagatca tgcgtgaaac tgaaaggcat ctgaatcagg tgctaagacc ctttaacaac tgattagcac aaggcatcaa cacatattag aagcatttgc atgctgcaag gcgataaagg atattgcact caattagcaa aggagtctgt agccttaaaa catattttca ccttgaaatt acaaacgctt tactgtgtta tgcagctaag tatgcaatgc cttggtcgat aagtcagtta taagcaaatt agcagcattt tgcagccatc aggtgtactc tggcactaaa actggttgct ctcaatgtct agctaaagta gaagaaaatg gtttgctcac gggctcaagc gcttaatgcc caacgcggtt ttgcatcgcg agcgcaacaa tattttcgag cttaaaagca tcagtatcaa acagccaact tgacagcgaa gcaagtcttg ttccgcagat tgaagatttg cttaccatcg ttacttggtg ttatcaccaa aagcttaaat gtgagcactc ctggtcgcga gccataaaac gatgtatcaa agctttagtg ctgagccatc catcgctgtc gctatgcaaa gtcactgagt aaagcagcag gatgccttag aaagctgtcg aagcaatctc gctgataaac gtgtcgggct atgttctcat aatgagatcc atgagcttta tttgttgagc agcctattgt tcagcagata gagggttcgc actgttgaac ggtaatccag ttgtgtggtc actaaagagc ctgatcgcga gcaaaccttg atcgttgcgg ctttattcaa attgctgatg tgcgcaggct ctactgcaag actattggta ttatctgtgc gatggtcgct gaggcatttc aactgactgc atgatcaaac cgtgttcatt gcttagatgc attattttgc cagcaatacc atccccatgc acgctttagc taacttgtta caatcggatt tttggccgat gtgcaagtgc ttgcaggtgt atattcaaga ttgcaggtat cagcagccgg tcaacaagac actggggccc gcggcgtata ctgagtcggg aaacaggcgc tgattctttc gtgtactaaa tactaccgac tgcctgtgac cgcaagtatt gtcgtatgca tgatcaatga atgcacaaca acggtagctt acacacaact ttgcgcctaa ccatgttagt agttaacgac ttaagagtac tgagttgcac ttgcccctgc aaaaacggct atcattcgca agcgcaggtc aggcatagat ccaagcgatt gtatcgagta ctatttaacg acaagctaaa taaagacaag tattcaatct taccagcagt tgagtacatc taaaccgatt caaaacctta catcaatgcg cttctatggc agcacttcaa ttgggatggc cgttattcca cgtacagtta agctgtaaaa ttttactact cccagtagca agtgtgcgcc tgttcaagat aacgctaaca tcgcgatcca agccgtcatt gttagcaagt atttcatgga ggtttgcaac tctgtccata gtgggcacga ttattcacca cagccgttcg tatgagcagt taaagcaatt gcaatcaata ccagcacaaa attggcgagt aaccttgcta gcccatattg ttgatgatgc ggtttgggag cgtgagcaca tttactcage caaggtaaca ttagaaattg agcatggatg acaggcatca gctgagttag attgatgcaa aatactggcc ettgeageta ggaatggtca ctcgataaag ttaattggtt aagcttaatg cctgctaacc atgcccttcc atacaatgga tataaattgc ttgacgcaaa atggataget aacggtcaaa gcaggtaaag ccacgcctgc gtggaattac ggtggcagcc attaaccatg tttgcatcag ttaacagctg gcaaaaacaa gctgacttgc gtattegtat atgctgatga ctgccattga cagcaagcca agcagcaaca cagcgattgt aagctgatga ttactcctac ttgtcatgtt 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18840 18900 18960 19020 19080 19140 19200 19260 19320 19380 412 200813222 gataagccgt attgctgcgc gtcgtttacc tgacactaca ttgcctactg tcactagtga caagcagaac aatagcaatc aagccaatgc caaatattgg tttacccaaa tgcaccaaaa ccgtgttgct agctttaact ttacagaaaa tggcaagcaa cacgctgccg tttttgttca aggtactgaa ctggcccagg ccagctcgat gcttgatgaa aacagactat tcttcccctt agcagccaat acatctgctt gcatgatcca atctttgcat gagctattag tggcgctcaa taggcttaat cagcaacaaa gcaatccgtt agacagccag cggcttctaa acaagcctag ccatgttatc tctttaatgc tcaattactt aaaggcattt gatcaaacca aatccttgtc • tgcagttatc atagccaact ctgtagtcac tgcaatcgca gaaattgagg ccatgttagc " caaaatcagt acagcaagtg atgacacctc tggatcgata aatgaacttg agtacaaaac gccttcgggt agttgtttaa ccatcactca tcatgaagcg cttggtcgca gcggcgtgtg ttttgtgtat ccgggtgtgg gtacggttta tccgcaaatg tttgcacaac tgccacagta cttccccgct ctgtttgctc aacttgaacg tgatggcgat gtaaaagcca tgcttcaagc tgattgtatt tatgcagaaa atgccaaaac ctcagacatg aatttaggcg agcttgctat [ tgctggggtt ggcgcaagtt atatattaac taaagtgctt accgaacact ttgccattaa gcctgatttt gcaatgggct attctatggg tgaagcatca atgtgggcca gccttaatgt ctggaaaacg cctcacaata tgattgaagc cactcaaact aatagtattt tcacctctga tatttcaggc cgactcgact gcgtccgtca agcatggcaa ctcgaacagg gtgaagatat tgtttggaat agctttgttg tgcgtgctgc gccgactgaa atagaagccg tgcttgccga ttaccctcgc gcatatttag cgattataca aggtgatacc tgtgtattag cgggttgtga gcaaagctgt aaagccttat tgaaacaaat cggtaaacgt ggcattgcag caaatcgtgt cacagccatg cacacgcaac ccgccatgct tattcgtgat aatgttcaag cgttttatca gcaagctttg cacgaccaag atgtgcttga tgcacaagca agtagcatca aattcattag tgctgcgagt caaataccta tttcattgac cagtcaggac atcgccaatt ccattgcaga tacattttgt cagccactga acttcactaa actggtgaat aatgctcgtc atttaggtgc acgtttattt gttgaaattg gcgcagatag gcaaaccagt accttgatag ataaaattgc i \ ^ * ccgcactgca gctaataccg attcacattt aaacgcgcca ctgtcagcca ttgcaatcaa , tgccaaaggt gatgatcaaa cagcgctgct taaatgtatc gctcagctta tctcgcataa agtgccttta tctctacaat atctaactga gaatttatcc catttgttga ccgctagcat _ tactcgcgaa aaccgtcagc aaagccaaac cgctcagtta gctccacaat tagaaggaga 〜 acaatcttga gttctcaatc aaacgttccc aaaattgcca tcgtcggttt agcgactcag taccccgatg ctgatacgcc agcaaagttc tggcaaaatt tattagataa aaaagactct cgcagcacca ttagtcagca aaagctcaat gcaaacccag ctgactttca aggtgttcaa ggccagtctg accgttttta ttgtgacaaa ggtggctaca ttcaagactt tagttttgat gccaatggtt accgtattcc agctgcgcag tttaatggtc ttgacgacag ttttttatgg gcaacagaca cggcgcgtaa agcactcaat gatgctggtg tggatatcac taacagtcaa gataatgcga tattaaatcg cactggtatt gtcatgggta ccttgtcgtt cccaacggca aaatctaacg aattgtttgt gccgatttat cacagcgccg ttgaaaaagc gctacaagat aagctgcaac aacccagttt cacattgcag ccttttgata gtgagggata tagcaagcaa 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980 20040 20100 20160 20220 20280 20340 20400 20460 20520 20580 20640 20700 20760 20820 20880 20940 21000 21060 21120 21180 21240 21300 21360 21420 21480 21540 21600 21660 413 200813222 acaacgccag cctctttgtc taatggcgcc attgcacata atgcatcaaa attagtggcc gatgccctag ggttaggcgc agcacaactc agccttgatg ccgcttgcgc gagctcagtt tactcattaa agctagcttg tgattacttg catacaggca aagctgacat gatgcttgct ggtgcggttt caggcgcaga tcccttcttt attaacatgg gtttttctat cttccatgct tacccagacc atggcatttc agcgcctttt gatagtaatt caaaagggtt atttgcaggt gaaggtgctg gcgttttagt gctcaaacgt cttgaagatg ctgagcgtga tggcgaccat atttatgcac tagttagcgg cattggctta tccaacgatg gtaaaggtca atttgtactg agcccaaaca gtgatggtca agtcaaagcc tttgagcgtg cctatgcaga tgcagccatg catgatgaac atttcggccc tgataatatt gaggtcatcg agtgtcatgc cactggcaca ccgctgggtg ataaagttga actgacctcg atggaacgtt tttttaacga caaactcaat ggtagccata cgccattgat tggctcagct aaatcaaact taggtcattt gctgacggct •gcgggtatgc ctgggatcat gaaaatgatt tttgccatgc gccaaggtat gttgccaccc agtatcaata ttagttcgcc aattacatca ccaaatcaga tgtttggccc tgctacatta cctaatgatg tattgccgtg gcctgataaa gcgggcaatc gtgctcgtca tgctggtgtc tcagtattcg gctttggtgg ttgtaatgcc cacttattga ttgagtcata tcacggacaa acgtcaacag ctccagctgc taataccatt aatgcacagt tgcctatgca tattacaggc atggcatcac actttgggcc gctgaataat attaaccgct ttgccaatgc aataaaccag caacaaacgg cctttactcc gctaccggca aaacgctgga aaggcttaga taaacatcct gagttattgc agcagcttgg tttggcgcaa acaccgccaa caggggctta tattgatcag tttgattttg acttcttgcg ttttaaagtg ccaccgaatg aagacgaccg cctgatttcg cagcagttat tgttgatgaa agttgcagac gaagcgattc atgatgccaa acttgcatct ggcagcaagg ttgctgtact ggttgcaatg gaaaccgagc ttgaactgca tcaattccgt gggcgagtta atttgcatac tcaaatcgca gccagcttaa atgcgcacgg tgtcagccta tctgacgatg agtaccaagc cctcgaaacc cttgcgatgg acagtgtttt agatgcggcc aagctgaacc aatacactag ctttattggt aatattatgg cgtcgcggat ctcatcgtta tgggatttta atggcccagc ctttacgatt tcagcaggcg agcagtcggt aaatcgttgt attgatgtgg cgcaaaacct attggctatg gagtcacgtc aagagccgct agatgccgtg atcatcgcag cagttgattt atctggcagt attgaaaata tcgtcctgaa aacggcaagt ctcgctaaaa caggtcaact acttccgctc agtattggtg aaggtgcggg tgcaatagta ctgcaggttg ccgaccaaac agccacagac tctgagccac tggatttaat tcatcaagca cttggtgctg tggacacacc atctgcggca atatcaggtt caacagaacg aatcagcagt gattccctta acagccacgg ggcgttaaac agctacgcta caatcaacag tttatcattt ggtcacatta gccaacttga agccatcagt gatgaattac tcacccctgc gggcttatct acaagtgata tcggcaagct agagctaaac caagctccag acttaaccca tattgattca gcgcaagcgc tatcacaact ttatagtcag tcagcaacaa ctcaagccaa atcatgtatc ggccatactt ttgccgcttc aggaatggca agcttgctgc acggactgct cattcaaaaa caagatgcgc attcaaacca aacggttcaa cccttaaata cccttgtcgc cacactcagt 21720 21780 21840 21900 21960 22020 22080 22140 22200 22260 22320 22380 22440 22500 22560 22620 22680 22740 22800 22860 22920 22980 23040 23100 23160 23220 23280 23340 23400 23460 23520 23580 23640 23700 23760 23820 23880 414 200813222 gagaaccagt gttcacagct actgatgagt caaactgctg aacagatctc ggctttaaac agtcgaatta atactgatat tgggcagcaa accgctaaaa aactgagcct tgttaaacaa gtgagettag gtggacatga tatttatcag catattgtcg atacgccact agctgacatt gacaatattc gcgctaaaac ggcaaatctt atccctgccg taaccaatac aacgacgaac atgettgage gaggtcagtt tgtgtctcca caactaactc ctttagcacc aatgttcgac aagaataacg ctatgacaac agagaettet atgccgtttt cagatcgttc tacccagttt aatccagctc ctaaagctgc agegettaat gccaaagata gtgccaaagc taatgccaac gttaaagcta aegtgaegae agcaaacgta acaacagcaa accaagtgcc accagcacat 一 ttaaeggett tcgagcaaaa tcaatggtta gcccataaag cgcaattagc atttttaaac x ^ ageegtgage aaggcttaaa agtcgctgat gcgcttttaa ageageaggt agcacaagca aatggtcagc cttatgttgc ccaaccgatt gcacaaccta ctgcagctgt acaagcagca aatgtgttag ccgagcctgt ageatetget ccaatcttgc gteeggatea tgcaaatgtg ccaccttaca cagcgccgac tcctgctgat aagccatgta tttggaatta cgctgattta gttgaatacg ctgaaggcga tategetaag gtatteggee ctgattacgc tgtgattgat aactactcgc gccgtgttcg cctaccgacc actgattatt tgctggtatc tcgcgtgact aaactcgatg cgaccatgaa tcaatataag ccgtgcagca tgacaacaga gtacgacatc cctgaagatg cgccgtacct tgtcgatggt caaattccat gggcggtcgc cgttgaatca ggccaatgtg atttaatgtt gatcagetac ttagggattg attttgaaaa caaaggtgaa cgtgtttatc gettaettga ctgtacctta accttcttag atgacttacc aegeggeggt gacacactgc gctacgacat caagattaat aaettegeta agaatggega caccttacta ttettettet cgtatgagtg ttttgttggc gacaagatga ttctgaaaat ggacggcggt tgtgcaggct tctttaccga ccaagaattg gatgacggta aaggcgttat tcgcaccgac gatgagatta agctgcgtga aactgcgcta aacaatccta ataagcctcg ctttgagcca ttattgeatt gcgcccaaac tgagtttgat tatggtcaaa ttcatcattt gttaaatgca gatataggtg gctgtttcgc gggegageat cacaaccatc aacaagcttc aggtaagcaa ;; ! gattcactgt gttttgcttc tgaaaagttc ttgatgattg agcaagtagg caaccttgat , gttcatggcg gcgcatgggg ettaggettt attgaaggtc ataagcaact ggcacctgat cattggtatt tcccatgtca ctttaaaggt gaccaagtca tggcggggtc attaatgget _ gaaggttgtg gtcaattact gcaattcttt atgctgcaca ttggtatgca cacgctcgtt 一 gaaaatggcc gtttccaacc acttgaaaat gcttcacaaa aagtgcgttg tcgtggtcaa gttctgccgc agcacggtga actgacttac cggatggaaa tcactgaaat tggcattcac cctcgcccat atgccaaagc gaatattgat attttgctta acggtaaagc ggttgtcgac ttccaaaact taggtgtcat gatcaaagaa gaaagcgaat gtaegegeta ccttaatgat acgcccgctg tcgatgcctc agetgatega attaattcag caaccaataa tattctatac ccagcggctt caaccaatgc gccactcatg gctcaactgc ctgatttgaa tgccccaacg aataaaggcg ttatcccact gcaacatgtt gaagegeega taattccaga ttatccaaat cgtactcctg ataccctgcc attcacggcg tatcacatgt tcgaatttgc cactggcaat attgaaaact gctttggacc ggactttagt atttaccgtg gtttcattcc accgcgcaca 23940 24000 24060 24120 24180 24240 24300 24360 24420 24480 24540 24600 24660 24720 24780 24840 24900 24960 25020 25080 25140 25200 25260 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 415 200813222 ccatgtggcg acttacagct aacgactcgt attgttgata ttcaaggtaa acgtggcgaa ttgaaaaagc catcatcgtg tatcgcagaa tatgaagtgc caactgatgc atggtatttc gctaaaaaca gccacgcctc ggtcatacct tattcagtgt tgatggaaat ttcactgcaa cctaacggct ttatttcagg ctacatgggc accacattag ggttccctgg tgaagagtta ttcttccgta acttagacgg tagtggtgaa ctattacgtg atgttgattt acgtggcaaa accatcgtta atgattcaaa gctattatca accgttattg ctggtagcaa catcattcaa agcttcacat ttgatttaag tgttgacggc gagcccttct acaaaggcag tgcggtattt ggctacttta aaggcgatgc gcttaaaaac cagttaggta ttgataacgg ccgtatcact caaccatggc atgttgaaaa taacgtccct gctgatatca ctgttgattt acttgataag caatctcgcg tgttccatgc tcccgctaat caaccacatt atcgcttagc tggcggtcaa cttaacttta tcgacaaagc tgaaatagtt gataaaggcg gtaaaaatgg cttaggttac ttgtcggcat ctcgcaccat tgacccaagt gattggttct tccaattcca tttccatcaa gatccagtga tgccaggttc attaggcgtt gaagccatta tcgagttaat gcaaacttac gccattagca aagacctagg taaaggtttc acaaacccga aatttggcca gattttatct gacatcaaat ggaagtaccg tggccaaatt aacccattga ataagcaaat gtcgttagat gtgcacatca gtgcagtcaa agatgaaaac ggcaaacgca tcatcgtagg cgacgccaac ctgagcaaag acgggttacg catttacgaa gtaaaagata tcgctatctg tatcgaagag gcataaagga ataataatga ctattagcac tcaaaacgaa aagctttctc catggccttg gcaagttgcg ccaagtgatg ccagctttga cactgccact atcggtaata aattaaaaga actcactcaa gcttgttatt tagtgagtca ccctgaaaaa ggcttaggta tttcgcaaaa cgcacaagta atgactgaaa gcataaacag ccaacaggat ttacctgtca gtgcatttgc ccctgcttta ggcactcaaa gcctaggcga cagtaacttc cgccgcgttc acggtgttaa atacgcctat tatgctggtg cgatggccaa tggtatttca tctgaagagt tagtgattgc attaggtcaa gcaggcattt tatgctcgtt cggcgcagct ggcttaattc catcacgcgt tgaacaagcc attaaccgca ttcaaaccgc acttccaaat ggcccgtaca tgtttaactt aatccatagt ccaagtgagc cagcactaga acgtggcagt gttgagctgt ttttaaaaca taaagtgcgc acggtagaag cttctgcatt tttaggctta accccgcaaa ttgtctatta ccgcgctgca ggtttaagcc gtgatgccca aggtgaagtg gtaattgcca acaaggttat tgccaaagtg agccgcacag aagtggcgag taagtttatg caaccagctc ctgctaaaat gctgcaaaaa ctggttgatg aaggcttaat caccccagag caaatggcgc ttgcccaatt agtgccaatg gctgatgacg tgactgcaga agccgattct ggcggtcata ctgataaccg tccattagtg acgctattgc caacaatttt ggcacttaaa gataaaatcc aagccgagta ccaatacaaa acacctattc gtgtcggttg tggcggcggt gtcggcaccc ctgatgcagc acttgcaacc tttaatatgg gcgcagctta tattgtgaca ggctcaatta accaagcttg tgttgaagcg ggtgccagtg aacacacgcg taaactactt gctacgactg aaatggccga tgtcaccatg gcgcctgctg ctgatatgtt cgagatgggc gttaagctac aagtagtaaa acgtggcacc ttattcccaa tgcgtgctaa taaactttat gaaatttata cccgttatga 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360 27420 27480 27540 27600 27660 27720 27780 27840 27900 27960 28020 28080 28140 28200 28260 28320 28380 416 200813222 gtcgattgaa gccatcccag ccgaagaacg tgaaaagctt gaaaaacaag tcttccgctc gacccttgat gatatttggg ctggcactgt ggcgcacttt aatgaacgcg atccaaaaca aatcgagcgc gcagaaggta accctaagcg taaaatggcg cttattttcc gttggtactt aggtttatca agccgttggt ctaattctgg tgaagctggc cgtgagatgg attatcaaat ttgggccggt ccagcactgg gcgcgttcaa cgaatgggca aaaggcagct atttagatga ttatacccag cgaaatgcgg tagacttagc aaaacacttg atgcacggcg cagcttatca agcgcgtgta aacttactta ccgctcaagg tgtggcactg cctgttgaat tacagcgttg 一 gagcccgctt gatcaggtta agtaagcctg ccaagcgtca tcaagctaag tcatttggat ** ataggtagcg gtaatgagcg aaacacaaaa acttgatttt tcagtggtta atggcacaac 二 - acttgagtcg ttcaaccaac aaaaaaatct gattaaacgc atgctaaaag gcaacagcgc aacatgtgct gaatgtaaca agccactaac gctgcaatta ccgcctaata ctaaaaatgc caaacctgcc gaaaaagcac ctgggatata ctgcgcaaaa ggctgcacag atattgaact ggatatggaa gctgtggcac ttttaaaata atacgatgaa ataacccata gattatttca r tcattaccat ttaaaaaagg catcgaaaga tgccttttta ttgcaattaa ttgaccactt tatcaagtgg cgacttacct aatcactcac caaaataagt tattcagaat agtgaattta gaattgagag tttagggaat gctgttactg atacggttca aattaggtaa ttaaaatata cttcattgct tcacggttcc.tgcacggttt ctgcacttta atcacataac attaaaaact cataatagcc attatcaact acgggttaac ttaggagttt acttatgttc agtccccttc tctattcgct ttttcaaacg ggatgtaaac catttcggca actattaatt ataccgctta ctagcttatg cctattaact gcttgtgata gctcagatga taccageage gaagagactg taataacagt acctgacact gaaattgaaa caccggttga ggagtataac gatactgatt ttgaagcaag cgattggacc gatgacaccc atagcaaaag tgeagatgee aactttgatg aagtatttgc tgacaatgaa gtaaaacgcc ttgatgtggt ggtcactgaa gatcgctgga ccatcatgct taacgatatg actgatactt atggcacttt tggtacaacg actaattcaa acaaccttgt agatacagat gacaacccca ttatggtgcc agetgatatt tattaegaag ^ gcaaacagtg gtatcgagtt ggtatccgtt ttaagggaaa ctcgtcactg caaaccagct , ggcaacaagg cgtactcaag ttatctttta agttagattt tgatgagttt gaagactact acccacaaat cgacaatcaa cgattttatg gctttaaaaa gttaagtett aaaaataatt aegatgatga gtcgcagtta cgtgaaaaag ttgccgccga tgtatttaaa gatgcaggtt _ tagccgtctc tcacaccgct ttttatactt tatatatega ccatggtgat ggccctgaat actttggctt atataccctt gtggaagaag tcgatgacac ggtaattgat actcaattta gcagtgatga tggtaactta tataagcctg aggatgatgg tgcgaccttt attgaaggat ctttcagtga agacagtttt gaaaagaaaa ccaatgaaga tgatgaagat tggtcagata ttttagcttt attegaegea ttacatgatg atacagcgac ttccgatcct gttacttggc gtgaaaacct tgaagetata tttgatgttg atgtgttctt gaaatatctc gcagtgaatg gegtaattea aaactgggat aettaeggat taatgcccca taattattat ctttacaacg atccagacac aaacaaatta acttggatcc catgggataa taatgaggea ttacaaacgg gtaaaatggg cggtgcatta gaaettaatt tctctgattt agactcaaat tcttggccat 28440 28500 28560 28620 28680 28740 28800 28860 28920 28980 29040 29100 29160 29220 29280 29340 29400 29460 29520 29580 29640 29700 29760 29820 29880 29940 30000 30060 30120 30180 30240 30300 30360 30420 30480 30540 30600 30660 417 200813222 tgatagccaa aatctatgct gatgacacat accgggaacg ctataaccag tatttatctg acgttattag cgatagctat gaaaccaata aaatgcaggc aatttatgac agttactcag cattaataga gccttatgcc acaacagagt taacaggtta ctcattttta gagtctgcaa atgactttta tcaagcagtt gatgatttat ctgaacatgc tgaaagtcga acagacgccg taatcgatta cttaaacacg caataggttg tagatttttt ctgtcatttt gcagatacaa tgaaaacgaa agcagcactg gctactttcg tttttgttgc tatcaattca aaaccgttta ctagcgcaca ctttcttatt aaaaaataac accttaacaa gtcattgacc taaatcaaac ataatgtgaa aaagctaagg cactatgcct ctttattttt tagtttggtt atttccaatg agtgatatca aggcaaacaa tatagagcaa ccgctgacgg acgagtgcat tttactttct accactgatt tgaatggtaa tatcaaatac gccaatcaag cctttgcaga tatctctgag ttcacgacag atgaactcca cggaaaacca cacaatattg ttcgtcaccc tgatatgcct aaagcagctt ttgaatcctt gtggcaacgg gtcaaagacg gaaaaccttg gtttggtatc gttaaaaata aaagcaaaac aggcaagtat tattgggtta atgcctatat atcgccagtc tttgaaaacg gcaaaatgca tgaactacag tctgttcgac gtaaaccttg tcgtgaacac atcaattccg ctgaaaaaat ttacaaacag ttaaatcaag gtaaagcccc cagagaaacc acagcaccac tgcttagctt tacgggttca ctttgccttt gggcaaccgt tatttctttg ataggggtag tgtcttcgct cttcatgcca actttggtcg ccgctttttt cattccctta atggctggat ttgtcatgta ttacttaacg aggccgttaa aagaacttga aaataaggcc acaaaaatta tcgacgaccc aattgcttgc gggat11111 catcgagtca acatgagttg ggcaaaattg aattagcctt aaactactta gtcactgaaa tgggtggtgt tgtcggcagg atggcagatt cagccacctc cattagcgaa gaaagccagc aacttaatca aactatatcg accactcgtg aacgggttaa agaacaaaca caccaaaccc gtcaggccgc aacagcaatg gagcaaatga cggcaagctt cactgaagtt aatcaaaata cccgcaatac agcacaagaa attaccacca gccaagaggc tgctagtaaa ggtcacgata gtatggacaa agtagtcaat gcaattggcg agcttagaaa agaagtggtt catttctcaa cggtggtcaa tacaattgaa aaagacagcc aatcaatcgc atcggtccta ggagagatta aaggcatcgc agaacaaact aatttattag cgttaaatgc tgccattgaa gcggctcgag caggtgaaac tggccgtggg tttgccgttg tggcggacga agtaaggcaa ttatcaattc gcaccagtga ttccacatca gaaattgaac acatagtcac gaactttcaa aaaaccacaa aggaagcgac tcaagcaatg gagtctggtc agttgcaagc cgatttatca gtatccttag cagaagaagc ggatgacacc tttgctcagc tccttaactc aattaatcgc atacacgaaa tggctgagct taactcttca gccatgaacc aacaaacagc ggtcgcagaa gaaattagcc aatctatttt acagatagat gagatttcaa acctgacctt aattcaaacc gatgacaccc aaaacaagtg tgaacaaatg agccgattag ccaataaaac tcgtcattta tcgagacaat tttggacgca aacaatcgaa cgcaccaaat aaatacctcc aatattaccc aaagcgtcat aacctacatg ttgattatga cgcaatcttg ctcaacactg attaacttcc ccatgtttgc agataacgcg agatttagcg gctgattgac tattgccccc tctttctgat tgtcattttt tcctgttgtg acagtttatt 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 31620 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 418 200813222 ttttgataag actttttaat ttaaaaaatg gccatgctta taaagccgtt taaagcgatt ttattccacc taaaaaatgg gtaatggaag accgtcctga ctctggtgcg cgctatgata agctttactc tatgggcacc ccaaacggcc tagccgcagg gatcactgac gcagaatatg atcaattctc atcaggtttt gttagcgtta ataacagtac ctcaacgcct attaatgtat " ctgaaaaatt tggctgcttc ttaccaacag / ggttgttttg gctgcagggc tcggctcctt cttacgcccc tgaaaagttt aaatacccta aacttgatgt acttgacaag caattagcta gtattgccga tattgcgaca tggccttggt aagcagcaga gtttttagat gttgaaagct ttgaacaacg tccagctgtc gcgcgtggca gggaacaact agcgaatcgt catagcgccg cataacactc acaatttctc aatccattgg ttacctttga tgtgattcac tctcattggg atcaagtgct tatcgcatta ttgctaacca gcttgttcca acaacataag cacgtcggct cacaatgcgg gcaaaaatcc ccaatattta tcagcatcgc tcttcttttc gattatattg tacagcaccc cttacacaaa caggctcacc cgcaatccat agctccatat cacgtattaa atgtgaccaa atacgttttc caagtagacc \ * tttcttgaaa aaatacaccc ccgaaatgtc tgttgcatac tcattaccct caaagtcata aagccatgct tgagatcaac tgatattagc aaaggtattc atctacgacc tcagcgcagt ^ tcaacttcga acttgttaca gcattatcac ttttaacagg cttaccaaat aacactcgag tacctagcat ctgatgttct tcagtttcta ccactggaat tttacggttt gcattgatga aaaagtcatc ccagccatgt tggccaggtg atgcatatat ttttcggtgt ggacgatcag tgaacaaagg cacttaatac acatgtgtat cgtactaagt acctttattg tttatttcaa aacgactttt ttattgattt cattgaattt ccctaatatc atatatacag ttaacgttaa 32940 caaagtgagg gtacacaatg acaaacgaat 33000 aggaaaatgg cggcaagttt gccagtataa 33060 aagatttacc ggttgggaag catgcactgc 33120 aaaaagtcac gattatgttg gaagagctgt 33180 atgctcactt gattagcatt ggtgatagcg 33240 atccaaattc aaaaataccg gcattattag 33300 ttgagtcagg cgctatttta ctttacctcg 33360 atttagctgc taaaacccaa gtcatgaatt 33420 atttaggtgg cggttttggt cacttttatg 33480 tcgacaggtt ctctatggag gccaagcgtc 33540 aacaccgctt cttgggtggt gatgagtata 33600 acggaaat11 ggtgcttgga aacctatatg 33660 accctaacct aatgcgctgg gcaaaagaca 33720 gaatcattaa tcgaacctgg ggggaagagt 33780 aagatattga taatgtgctt aaacgtcagc 33840 tagatcactc aattttgata atgtgagcct 33900 aatgaagttt gataaagcgg taggcacacc 33960 acaacccctt taccgattaa ccactttcaa 34020 gtacgtctgg cggtaaagta atgataaaac 34080 aacggacata agattgtgtt tgcttataca 34140 aggtgaatac atcgccatta gctgtgcttc 34200 atttagcgga ctaggtacag ttacgttagt 34260 ctcctcttta actaacctgc cagccgtacc 34320 actctcgccg acatataaaa cctgatctcc 34380 tcttggtaac agagaaaacc agtgctttct 34440 taagccataa gtttcgctat tacgattaac 34500 gatatgagta aatgtaatac tgcccatttt 34560 taaacccctg gtacatctgg ccatcaggcc 34620 taacaaactt ggtataaatt gtatctactc 34680 tatttcctcc gatagcagat accagtcgac 34740 tctcatctaa tatggccaca acttgataag 34800 cataaaccca atctcctttt gagattgaac 34860 ctaaatcgaa aaaagcattg ttaccaagcg 34920 ctatatttga tacaagaaat tttcgcataa 34980 atactaatta agtttcccta caaagtaaac 35040 tatagatcat attcaaataa cgctaatcat 35100 taggcgcaaa gttaactatg taaaccagct 35160 419 200813222 aattagaacg gccagtacta agtgacgagg actaaacttg agctaacgct ttttagcgta cccgcttaaa taacaaagcc aaccacaaca tgaaaaacat ataccgtact gcatatagag tatctcactt actaaacctt cactcgaaga tgcgatcctg catatggaca aaagaatctc ttagtcgtcg acaaatcaaa gcactatttt cattttcgaa tagcctctat taacttcaat cacctaaagc gaataaccat gtttgattgt cagtcacttg gaaattgaat cttttttacc taaattcttt tgaacctttt aaccttaatt tatcacaagg tgacggtcgt agaaatctag gactcaccca cttaaagagt tcagcacctt atttatgaca ttagcgacag aaaatcaaat catgcaacgg accgctttgc gcactttcgt gaagagcatt ttcttctttg tatgcccaag gcgaaacttg aaacggaaat ttgctacaga tgtttgcact aagactcatt agaaacattg gattaattcc acaaacttcc gcgctttata ttcgatagta taatttaaca cacgatttca atgacaacct gatattggcg attatctggg tgaaataaat tgagccctga tagtatgaat tgcaggagtc agacaaaccc atttcccaat aaatgttatt ttaaggtttt cagattcagt aattattcag gcttagactc aaaaagcgca catatgaggt ccttcaacct cgaatcacct cagcaagtat atgagcacct atttggagac ttgagttcgg taatgcaatc actgtcaaat tgataattaa tcacaattga agctcacatg agactttcca aatgtcatgg cgccctaaga gatttctatc agatggtgag taagaagcaa gggtttgagc ttgtcttgct ttacacactc atctgctctc gaaagtgaaa gttaaatctg aaattcaata gcgattacag gtaatgtact tgttcaggta acaatatcaa tctttagtat caaagattag catgtgcttg tgatgtaaaa cgcctcagcc cacagcatct tccagcgtta cactagcaac aaatatgaac ctgcaaaagc catcgctgca catcatttgt taacagtaca ttatttaggc ccagagaaat caataattta tgataatgat gcaacctgac tggcaagctg gaatttgaca ttcggagaat cgaaatgatg gagatattta tatttacagt gtattgcgca caaacagcca aagactattt cacctaagaa tggctttaat cctctgttaa catcggtgat tcaacacacg ccataatacg atgcctcatg ggctgtagcc gataaccgat tattgacagg tgatttgttt cacaagattt cacctcttgt cataaaagac gttgacataa atcgatcact gacgtattta acagataaaa aagctactaa acccacttta tgctttaaca tacttattta aggcatcttc ggacatagta agtcagcatg ctggaaaaca ttttatgtat atcaactttc ctcaatgtca caataagaga ctactcacgt ctttgatggt gcaatattac caactgggag ttattgataa tcaaactgca ttcagaaagc ctgacaacca ggtgaggttt ctcatctttt tttaacttgc tttggtcgaa agatggctga accttccact tcccaattta aaaaatggta cgtaccagcc tgtggtcatt aacatacaca atctagaggt attgcaccaa ggtaacggag tactttggtc ctgattttga gcaaaattgc tacttagagc ataccagcca gcaaaagtcc acggcattgt aaacgatttc caaatttagc tttgccatat ttaatttaag tatctaacca caatgtcgat ccagtggtga ttatttactg ttttaaagtt taatgtaaag gacgggatat tgataaatct ttcataccta tttataacaa agagctgtgt aactcgacac tcttgttctg ccaccttcac cattggttat cgtaaattgt ctcaaggttt aaaccacgaa tttgcatctg cgaaaacgcc aataagtatt ttaccttccc acagtgagtt ctatggtgaa acctgaatat ttaacatatg taccagcact tgtagcacgt 35220 35280 35340 35400 35460 35520 35580 35640 35700 35760 35820 35880 35940 36000 36060 36120 36180 36240 36300 36360 36420 36480 36540 36600 36660 36720 36780 36840 36900 36960 37020 37080 37140 37200 37260 37320 37380 420 200813222 cctattgtcg catgcattta caagaattgt gagcttttag caaatttcaa cacatgctag ttagccagaa ttctctaatg acaaatctca tgttagttgg ataagtctta gaagttgcta tcttgggtgc cacactttct cacatcggtt atctccttgg gattaatgac atcgaactct tttagcactc gtctcgaagt ataataagga ttcaaaaatt agcgatagga gtcacgcatg ccaggaaaca cttatttgga cgcaactaac tttacgtaat ctaataaatg ttgctcagct caccgcccct atccactaac taaatcgcta agctccggca gtcaaatgcc tctcttggtt acatagctct cgcagagtta ttgatgcatc tgagattagt ctgaccataa tcacagaagt cagccaaagt tcatcgatca aactcaatat cccattaatg ggtaagtgac ctttcttgtt gcttgatata ggtatgcaag gggatgccga tgctgtccgt gaacgcacac tagtggccta actaattgtc ctgcgattgt gtacgttcac attgctctcg aaacgattat cgcttagctt caagtcttac ttactgttgc cctgaaaagc aacgtcataa tttcccttta ttcctgtttg cattaaaccg aactgctctt aaagcaacct gtcataaatt tgaccgagtt gttaacgaca ttagctcgct aggtctaatc gtttcaaaat ggttttaaaa caccagcgca tgttgataag tttatttgtt gatggtgcca cagtgatata tgaattgcat gccaatagaa attttgccta gataaacctt caacaagctg gggccaaatc aagtaaaacc gttcggcaat aacaaataat atacctcagc agaaatcgtt gctctcttcg tcagccctgt gctcaataat ctttactcgt ggtattcatc tatgggcatc taacagaatg agtaaaaaac ttaataactc ttgattagcc gcaaaatgaa cctctcattt ctgtccacct gtgatgaata ggccaacgcc cattcaccga gcctgacttc atgaagataa cccatggtag ccacccctac gaatcggctc aaaccaccat gtggccacag aataataaat accgcgaaaa agagaagagc gtcaggcttt catatccgag atacatcaac aacgatataa attgaatata attatcgaaa cgctttttga taaactcaag tttcaaacga agcaaactct tattgcttgc ataagcttta tgctagattg taatgcatca cccaaaaagt aaagtaaagg gatacgtcct ttttaccgca ttgaagggta attactatta ttgataaagc actttgttca tcagcaaaac agctcaaaac atgttcgata atcgacattg tttaggtgta agctagaata accatcgatt actgacaaaa ctgttgtgat cccatgaaac ttgatgaaat atctgaaggc caataatcat ttttaggggt agctagacct tacaagcgtt tgcaacaaaa ggctgattgc ggccttcttt atcacggagc cgcagaaact gcaacacact ataatctctt gtgacgattt atatcttcag tcaccgccat gatacttgta aaacaatcaa ataataaagt agctttgaaa aattgtgcat atctcacctt aagcgcaagt atatttttat tttgagtcta tcttctaagt gtataatatt agctaaccat tactatgatt aatgtcgtta cacggcttta gcccaaagct cctgtcatca tcgtcagcac gtcaattgaa tcactaaata ttaagtttgg atcccattac gagatcagct acctcattac ggaacaaacc gataacgctg tactgtagat tgactatcaa taatttgcac agcgagtgac cagccaaatt cacttacctg agccttgctg gatttttacc tcgctgaggt tactttttga cgagttgcga aacggcatac ttaagcattg tatcacacat ccaattgaga gcttaaacaa ttccgcaatc ggttagcgtc cacagtaatc tgtaatcccc aagagaacat ctattagcca tttcaattcg tagtcactta atagaccctg ataaatgccg tttgggatac taatctcaaa caatgtcgcc tgtacatcat agcaaaatgt gagccgagcc actgcaattc gcactgaaaa gcgtggaaat ccagctcatg 37440 37500 37560 37620 37680 37740 37800 37860 37920 37980 38040 38100 38160 38220 38280 38340 38400 38460 38520 38580 38640 38700 38760 38820 38880 38940 39000 39060 39120 39180 39240 39300 39360 39420 39480 39540 39600 39660 421 200813222 39669 gatatgatc
<210> 70 <211> 2787 <212> PRT <213〉沙雷菌(Sh. japonica) <400〉 70
Met Ser Gin Ala Pro Thr Asn Pro Glu Thr Ser Ser Gin Asp Asn Asn 15 10 15
Glu Ser Gin Asp Thr Arg Leu Asn Lys Arg Leu Lys Asp Met Pro lie 20 25 30
Ala lie Val Gly Met Ala Ser lie Phe Ala Asn Ser Arg Tyr Leu Asn 35 40 45
Lys Phe Trp Asp Leu lie Ser Glu Lys lie Asp Ala lie Thr Glu Val 50 55 60
Pro Asp Thr His Trp Arg Ala Glu Asp Tyr Phe Asp Ala Asp Lys Ser 65 70 75 80
Thr Pro Asp Lys Ser Tyr Cys Lys Arg Gly Gly Phe lie Pro Glu Val 85 90 95
Asp Phe Asn Pro Met Glu Phe Gly Leu Pro Pro Asn lie Leu Glu Leu 100 105 110
Thr Asp Thr Ser Gin Leu Leu Ser Leu Val lie Ala Lys Glu Val Leu 115 120 125
Ala Asp Ala Gly Val Thr Ser Glu Tyr Asp Thr Asp Lys lie Gly lie 130 135 140
Thr Leu Gly Val Gly Gly Gly Gin Lys lie Asn Ala Ser Leu Thr Ala 145 150 155 160
Arg Leu Gin Tyr Pro Val Leu Lys Lys Val Phe Lys Ser Ser Gly Leu 165 170 175
Ser Asp Ala Asp Ser Asp Met Leu lie Lys Lys Phe Gin Asp Gin Tyr 180 185 190 lie His Trp Glu Glu Asn Ser Phe Pro Gly Ser Leu Gly Asn Val lie 195 200 205
Ala Gly Arg lie Ala Asn Arg Phe Asp Leu Gly Gly Met Asn Cys Val 210 215 220
Val Asp Ala Ala Cys Ala Gly Ser Leu Ala Ala Met Arg Met Ala Leu 225 230 235 240
Thr Glu Leu Val Glu Gly Arg Ser Glu Met Met lie Thr Gly Gly Val 245 250 255 422 200813222
Cys Thr Asp Asn Ser Pro Ser Met Tyr Met Ser Phe Ser Lys Thr Pro 260 265 270
Ala Phe Thr Thr Asn Glu Thr lie Gin Pro Phe Asp lie Asp Ser Lys 275 280 285
Gly Met Met lie Gly Glu Gly lie Gly Met Val Ala Leu Lys Arg Leu 290 295 300
Glu Asp Ala Glu Arg Asp Gly Asp Arg lie Tyr Ser Val lie Lys Gly 305 310 315 320
Val Gly Ala Ser Ser Asp Gly Lys Phe Lys Ser lie Tyr Ala Pro Arg 325 330 335
Pro Glu Gly Gin Ala Lys Ala Leu Lys Arg Ala Tyr Asp Asp Ala Gly 340 345 350
Phe Ala Pro Glu Thr Val Gly Leu lie Glu Ala His Gly Thr Gly Thr 355 360 365
Ala Ala Gly Asp Val Ala Glu Phe Asn Gly Leu Lys Ser Val Phe Gly 370 375 380
Glu Asn Asp Ser Thr Lys Gin His lie Ala Leu Gly Ser Val Lys Ser 385 390 395 400
Gin Val Gly His Thr Lys Ser Thr Ala Gly Thr Ala Gly Val lie Lys 405 410 415
Ala Ala Leu Ala Leu His His Lys Val Leu Pro Pro Thr lie Asn Val 420 425 430
Ser Lys Pro Asn Pro Lys Leu Asn Val Glu Asp Ser Pro Phe Phe lie 435 440 445
Asn Thr Glu Thr Arg Pro Trp Met Pro Arg Pro Asp Gly Thr Pro Arg 450 455 460
Arg Ala Gly lie Ser Ser Phe Gly Phe Gly Gly Thr Asn Phe His Leu 465 470 475 480
Val Leu Glu Glu Tyr Ser Pro Glu His Ser Arg Asp Glu Lys Tyr Arg 485 490 495
Gin Arg Gin Val Ala Gin Ser Leu Leu lie Ser Ala Asp Asn Lys Ala 500 505 510
Glu Leu lie Ala Glu lie Asn Lys Leu Asn Ala Asp lie Ser Ala Leu 515 520 525
Lys Gly Thr Asp Asn Ser Ser lie Glu Gin Ala Glu Leu Ala Arg lie 530 535 540
Ala Lys Leu Tyr Ala Val Arg Thr Leu Asp Thr Ser Ala Ala Arg Leu 545 550 555 560 423 200813222
Gly Leu Val Val Ser Ser Leu Asn Glu Leu Thr Thr Gin Leu Gly Leu 565 570 575
Ala Leu Lys Gin Leu Ser Asn Asp Ala Glu Ala Trp Gin Leu Pro Ser 580 585 590
Gly Thr Ser Tyr Arg Ser Ser Ala Leu lie Thr lie Asn Ala Asn Gin 595 600 605
Lys Thr Thr Lys Gly Lys Lys Ala Ala Asn Thr Pro Lys Val Ala Ala 610 615 620
Leu Phe Ala Gly Gin Gly Ser Gin Tyr Val Asn Met Gly lie Asp Val 625 630 635 640
Ala Cys His Phe Pro Glu Met Arg Gin Gin Leu lie Lys Ala Asp Lys 645 650 655
Val Phe Ala Ser Phe Asp Lys Thr Pro Leu Ser Gin Val Met Phe Pro 660 665 670 lie Pro Ala Phe Glu Lys Ala Asp Lys Asp Ala Gin Ala Ala Leu Leu 675 680 685
Thr Ser Thr Asp Asn Ala Gin Ser Ala lie Gly Val Met Ser Met Ser 690 695 700
Gin Tyr Gin Leu Phe Thr Gin Ser Gly Phe Ser Ala Asp Met Phe Ala 705 710 715 720
Gly His Ser Phe Gly Glu Leu Ser Ala Leu Cys Ala Ala Gly Val lie 725 730 735
Ser Asn Asp Asp Tyr Tyr Gin Leu Ser Tyr Ala Arg Gly Ala Ser Met 740 745 750
Ala Ala Ser Ala Val Asp Lys Asp Gly Asn Glu Leu Asp Lys Gly Thr 755 760 765
Met Tyr Ala lie lie Leu Pro Ala Asn Glu Asn Asp Ala Ala Asn Ser 770 775 780
Asp Asn lie Ala Lys Leu Glu Ser Cys lie Ser Glu Phe Glu Gly Val 785 790 795 800
Lys Val Ala Asn Tyr Asn Ser Ala Thr Gin Leu Val lie Ala Gly Pro 805 810 815
Thr Gin Ser Cys Ala Asp Ala Ala Lys Ala lie Ala Ala Leu Gly Phe 820 825 830
Lys Ala lie Ala Leu Pro Val Ser Gly Ala Phe His Thr Pro Leu Val 835 840 845
Gly His Ala Gin Lys Pro Phe Ala Lys Ala lie Asp Lys Ala Lys Phe 850 855 860 424 200813222
Thr Ala Ser Lys Val Asp Leu Phe Ser Asn Ala Thr Gly Asp Lys His 865 870 875 880
Pro Ser Asp Ala Lys Ser lie Lys Ala Ala Phe Lys Gin His Met Leu 885 890 895
Gin Ser Val Arg Phe Thr Asp Gin Leu Asn Asn Met Tyr Asp Ala Gly 900 905 910
Ala Arg Val Phe Val Glu Phe Gly Pro Lys Asn lie Leu Gin Lys Leu 915 920 925
Val Glu Ala Thr Leu Gly Asn Lys Ala Glu Ala Val Ser Val lie Ser 930 935 940 lie Asn Pro Asn Pro Lys Gly Asn Ser Asp Val Gin Leu Arg Val Ala 945 950 955 960
Ala Met Gin Leu Ser Val Leu Gly Ala Pro Leu Ser Ser lie Asp Pro 970 975
Tyr Gin Ala Glu lie Ala Ala Pro Ala Val Pro Lys Gly Met Asn Val 980 985 990
Lys Leu Asn Ala Thr Asn His lie Ser Ala Pro Thr Arg Ala Lys Met 995 1000 1005
Glu Lys Ser Leu Ala Thr Gly Gin Val Thr Ser Gin Val Val Glu 1010 1015 1020
Thr lie Val Glu Lys Val lie Glu Lys Pro Val Glu Lys Val Val 1025 1030 1035
Glu Lys lie Val Glu Lys Glu Val lie Lys Thr Glu Tyr Val Glu 1040 1045 1050 ^ Val Ala Thr Ser Gly Ala Thr Thr Val Ser Asn Val Ala Pro Gin 1055 1060 1065
Ala lie Ala Pro His Ala Ser Ala Gin Ala Ala Pro Ala Ser Gly 1070 1075 1080
Ser Leu Glu Ala Phe Phe Asn Ala Gin Gin Gin Ala Ala Asp Leu 1085 1090 1095
His Gin Gin Phe Leu Ala lie Pro Gin Gin Tyr Gly Asp Thr Phe 1100 1105 1110
Thr His Leu Met Ala Glu Gin Ser Lys Met Val Ala Ala Gly Gin 1115 1120 1125
Ala lie Pro Glu Ser Leu Gin Arg Ser lie Glu Leu Phe His Gin 1130 1135 1140
His Gin Ala Gin Thr Leu Gin Ser His Thr Leu Phe Leu Glu Gin 425 200813222 1145 1150 1155
Gin Ala Gin Ala Ser Gin Asn Ala Leu Asn Met Leu 1160 1165 1170
Thr Pro Val Thr Ala Pro Val Val Asn Ala Pro lie 1175 1180 1185
Pro Val Val Glu Ala Val Lys Val Ala Pro Pro Val 1190 1195 1200
Val Val Asn Thr Pro Val Val Pro Ala Val Lys Ala 1205 1210 1215
Ala Gin Pro Ala Ala Met Ala Ala Pro Thr Pro Pro 1220 1225 1230 lie Lys Ala Pro Ala Pro Val Ala Ala Pro Val Val 1235 1240 1245
Val Val Pro Thr Pro Ala Gly Leu Ser Ala Gin Thr 1250 1255 1260
Ser Gin Lys Val Leu Asp Thr Met Leu Glu Val Val 1265 1270 1275
Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser Met 1280 1285 1290
Ala Asp Leu Gly lie Asp Ser lie Lys Arg Val Glu 1295 1300 1305
Thr Val Gin Asp Glu Leu Pro Thr Leu Pro Glu Leu 1310 1315 1320
Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu lie Val 1325 1330 1335
Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn Ser 1340 1345 1350
Asn Ala Thr His Thr Ala Val Ser Ala Pro Ala Ala 1355 1360 1365
Ser Ala Glu Thr Val Leu Asn Thr Met Leu Glu Val 1370 1375 1380
Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu Leu Ser 1385 1390 1395
Glu Ala Asp Leu Gly lie Asp Ser lie Lys Arg Val 1400 1405 1410
Gly Thr Val Gin Asp Glu Leu Pro Thr Pro Pro Glu 1415 1420 1425
Thr Gly Gin Val Asn Ser Gin Thr Pro Thr Pro Val Val Glu Pro Ser Ala Pro Ala Leu Ser Ala Glu Lys Asp Met Glu lie Leu Gly Ser Pro Glu Asp Tyr Met Asp Thr Ala Ser Gly Leu Val Ala Glu Met Asp Met Glu lie Leu Leu Ser Pro 426 200813222
Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly Glu lie 1430 1435 1440
Met Gly Ser Lys Leu Pro Ala Ala Gly Ala Met Asn 1445 1450 1455
Pro Ala Ser Ala Ala Glu Val Ala Gin Pro Gin Thr 1460 1465 1470
Gin Ala Ala Ser Gly Leu Ser Ala Glu Thr Val Leu 1475 1480 1485
Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro Thr 1490 1495 1500
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly lie 1505 1510 1515
Lys Arg Val Glu lie Leu Gly Thr Val Gin Asp Glu 1520 1525 1530
Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys 1535 1540 1545
Gly Glu lie Val Asp Tyr Met Asn Ser Lys Leu Pro 1550 1555 1560
Ser Ala Pro Val Ala Ser Pro Val Gin Ser Ala Thr 1565 1570 1575
Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met Leu 1580 1585 1590
Ala Glu Lys Thr Gly Tyr Pro Thr Asp Met Leu Glu 1595 1600 1605
Asp Met Glu Ala Asp Leu Gly lie Asp Ser lie Lys 1610 1615 1620 lie Leu Gly Thr Val Gin Asp Glu Leu Pro Thr Leu 1625 1630 1635
Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly 1640 1645 1650
Asp Tyr Met Gly Ser Lys Leu Pro Ala Ala Gly Ala 1655 1660 1665
Lys Leu Pro Ala Glu Gly Ala Asn Thr Gin Ala Ala 1670 1675 1680
Ala Gin Val Ala Ala Thr Gin Thr Ser Gly Leu Ser 1685 1690 1695
Val Gin Ser Thr Met Met Thr Val Val Ala Glu Lys 1700 1705 1710
Val Ser Tyr Ser Lys Leu Ala Pro Val Asn Thr Met Glu Met Leu Asp Ser lie Leu Pro Thr Arg Thr Leu Ala Ala Gly Pro Val Ser Glu Val Val Leu Ser Met Arg Val Glu Pro Glu Leu Glu lie Val Met Asn Thr Ala Gly Ala Ala Glu Gin Thr Gly Tyr 427 200813222
Pro Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu 1715 1720 1725
Gly lie Asp Ser lie Lys Arg Val Glu lie Leu Gly 1730 1735 1740
Asp Glu Leu Pro Thr Leu Pro Glu Leu Asn Pro Glu 1745 1750 1755
Glu Cys Arg Thr Leu Gly Glu lie Val Ser Tyr Met 1760 1765 1770
Leu Pro Ala Ala Gly Ala Met Asn Thr Lys Leu Pro 1775 1780 1785
Ala Asn Thr Gin Ala Ala Ala Gly Ala Ser Gin Val 1790 1795 1800
Thr Ala Glu Thr Ala Leu Ser Ala Glu Gin Val Gin 1805 1810 1815
Met Thr Val Val Ala Glu Lys Thr Gly Tyr Pro Thr 1820 1825 1830
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly lie 1835 1840 1845
Lys Arg Val Glu lie Leu Gly Thr Val Gin Asp Glu 1850 1855 1860
Leu Pro Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys 1865 1870 1875
Gly Glu lie Val Ser Tyr Met Gly Ala Lys Leu Pro 1880 1885 1890
Ala Met Asn Lys Lys Gin Ala Ser Val Glu Thr Gin 1895 1900 1905
Ala Ala Glu Leu Ala Thr Asp Leu Pro Pro His Gin 1910 1915 1920
Leu Lys Lys Leu Pro Ala Ala Asp Lys Leu Val Asp 1925 1930 1935
Lys Asp Ala Cys lie Val lie Asn Asp Asp Gly His 1940 1945 1950
Val Leu Ala Glu Lys Leu Val Ala Thr Gly Leu Thr 1955 1960 1965 lie Arg Ser Pro Glu Ser Val Thr Ser Ala Gin Ser 1970 1975 1980
Ser Asp lie Ala Ser Phe Thr Leu Ser Ala Val Asn 1985 1990 1995
Ala Asp Leu Thr Val Gin Asp Leu Ala Gly Gly Lys Ala Glu Gly Ala Ala Ser Ser Thr Met Glu Met Leu Asp Ser lie Leu Pro Gly Arg Thr Leu Ala Ala Gly Ser Ala Pro Glu Val Ala Gly Phe Ser Asn Ala Gly Val Ala Val Pro Leu Ser Asp Asp Ala 428 200813222 lie Ser 2000
Asp Val lie Ala Gin lie Ser Lys Gin His Lys lie Ala 2005 2010
Gly Phe 2015
Val His Leu Gin Pro Gin Leu Thr Ala Gin Gly Ala Leu 2020 2025
Pro Leu 2030
Ser Asp Ala Gly Phe Val Ala Val Glu Gin Ala Phe Leu 2035 2040
Met Ala 2045
Lys His Leu Gin Lys Pro Phe Ala Glu Leu Ala Lys Thr 2050 2055
Glu Arg 2060
Val Ser Phe Met Thr Val Ser Arg lie Asp Gly Gly Phe 2065 2070
Gly Tyr 2075
Leu Asn Thr Ala Glu Leu Ala Lys Ala Glu Leu Asn Gin 2080 2085
Ala Ala 2090
Leu Ser Gly Leu Thr Lys Thr Leu Gly His Glu Trp Pro 2095 2100
Thr Val 2105
Phe Cys Arg Ala Leu Asp lie Thr Pro Ser Phe Glu Ala 2110 2115
Val Glu 2120
Leu Ala Gin Ala Val lie Ala Glu Leu Phe Asp Val Asp 2125 2130
Thr Ala 2135
Thr Ala Glu Val Gly lie Ser Asp Gin Gly Arg His Thr 2140 2145
Leu Ser 2150
Ala Thr Ala Thr Ala Gin Thr Arg Tyr Gin Thr Thr Ser 2155 2160
Leu Asn 2165
Ser Glu Asp Thr Val Leu Val Thr Gly Gly Ala Lys Gly 2170 2175 \ Val Thr 2180
Phe Glu Cys Ala Leu Thr Leu Ala Lys Gin Thr Gin Ser 2185 2190
His Phe 2195 lie Leu Ala Gly Arg Ser Glu His Leu Ala Gly Asn Leu 2200 2205
Pro Thr 2210
Trp Ala Lys Ser Val lie Ala Ala Ala Pro Asn Val Ser 2215 2220
Glu Val 2225
Asn Thr Ser Gin Leu Lys Ala Ala Ala lie Gly Phe lie 2230 2235
Gin Ser 2240
Gin Gly Asn Lys Pro Thr Pro Lys Gin lie Asp Ala Leu 2245 2250
Val Trp 2255
Pro lie Thr Ser Ser Leu Glu lie Asp Arg Ser Leu Ala 2260 2265
Ala Phe
Lys Ala Val Gly Ala Ser Ala Glu Tyr lie Ser Met Asp 429 200813222 2270 2275 2280
Val Ser Ser Asp Ala Ala lie Lys Gin Ser Leu Ala 2285 2290 2295
Pro lie Thr Gly lie lie His Gly Ala Gly Val Leu 2300 2305 2310
His lie Gin Asp Lys Thr Leu Ala Glu Leu Gly Arg 2315 2320 2325
Thr Lys Val Ser Gly Phe Ala Gly lie lie Asn Ala 2330 2335 2340
Ser Lys Leu Lys Leu Val Ala Met Phe Ser Ser Ala 2345 2350 2355
Tyr Gly Asn Thr Gly Gin Ser Asp Tyr Ser Met Ser 2360 2365 2370
Leu Asn Lys Thr Ala Leu Gin Leu Ala Ala Asn Tyr 2375 2380 2385
Lys Val Met Ser Phe Asn Trp Gly Pro Trp Asp Gly 2390 2395 2400
Ser Ser Ala Leu Lys Lys Met Phe Val Glu Arg Gly 2405 2410 2415 lie Pro Leu Asp Lys Gly Ala Asn Leu Phe Ala His 2420 2425 2430
Ser Glu Ser Gly Val Gin Leu Leu lie Gly Ser Ser 2435 2440 2445
Ser Ser Ser Ala Asp Lys Thr Gly Ala Ala Val Lys 2450 2455 2460
Ala Asp Ser Ser Leu Asn Ala Glu Gly Ser Leu lie 2465 2470 2475
Thr Thr Pro Ala Asn Arg Val Val Asn Asn Ala Val 2480 2485 2490
Arg Val Leu Asn Pro Val Ala Met Pro Phe Leu Glu 2495 2500 2505 lie Ala Gly Asn Pro Val Leu Pro Thr Val Cys Ala 2510 2515 2520
Met Arg Glu Thr Ala Gin Gin Leu Cys Gly Leu Pro 2525 2530 2535
Gin Asp Tyr Lys Leu Leu Lys Gly lie lie Phe Glu 2540 2545 2550
Gly Val Lys Ala Asp Lys Val Tyr Gly lie Asp Ala Ala Gly Phe Asn Glu lie Pro Gin Ala Gly Met Val Val Tyr Val Ser Leu Leu Met Gin Gly Lys Leu Asn Leu Ser Phe Thr Val Glu Asp His Cys lie Gin Trp Val Thr Val Thr Lys Glu 430 200813222
Pro Gin Val Leu Thr Leu Thr Leu Thr Gin Thr Glu Ser Gly Leu 2555 2560 2565
Lys Ala Leu lie Ala Ser Arg Met His Arg Asp Pro Met Asp Ser 2570 2575 2580
Leu Leu Arg Pro Gin Tyr Gin Ala Asn Leu Val lie Asn Glu Ala 2585 2590 2595
Val lie Asn Gly Gin Thr Leu Thr Thr Gin Pro Thr lie Val Ala 2600 2605 2610
Asp Ala Gin Gin Leu Ala Ser Ala Gly Lys Val lie Ser Thr Asp 2615 2620 2625
Ser Glu Leu Tyr Ser Asn Gly Ser Leu Phe His Gly Pro Arg Leu 2630 2635 2640
Gin Gly lie Lys Gin Val Leu lie Ala Asp Asp Thr Gin Leu Val 2645 2650 2655
Cys Asn Val Glu Leu Pro His lie Ser Ser Ala Asp Cys Ala Gly 2660 2665 2670
Phe Ala Pro Asn Leu Ser lie Gly Gly Ser Gin Ala Phe Ala Glu 2675 2680 2685
Asp Leu Leu Leu Gin Ala Met Leu Val Trp Ala Arg lie Asn His 2690 2695 2700
Asp Ala Ala Ser Leu Pro Ser Thr lie Gly Lys Leu Thr Thr Tyr 2705 2710 2715
Ser Pro Phe Ala Ser Gly Asp Lys Gly Tyr Leu Val Leu Ser Val 2720 2725 2730
Leu Lys Ser Thr Ser Arg Ser Leu Thr Ala Asp lie Ala Leu Tyr 2735 2740 2745
His Gin Asp Gly Arg Leu Ser Cys Thr Met Ser Ser Ala Lys Thr 2750 2755 2760
Thr lie Ser Lys Ser Leu Asn Glu Ala Phe Leu Ala Pro Ala Lys 2765 2770 2775
Ala lie Ala Asp Leu Gin Glu Ser Val 2780 2785
<210〉 71 <211> 759 <212> PRT <213> 沙雷菌(Sh. japonica) <400〉 71
Val Ser Thr Gin Leu Thr Ala Lys Thr Ala Ala lie Asn Ser lie Arg 15 10 15 431 200813222 lie Ala Leu Lys Leu Val Ala Asn Asp Gin Thr Ser Phe Ala Pro Ala 20 25 30
Gin Asn Ala Asp Asp lie Phe Ser Ala lie Lys Pro Cys Ser Leu Ala 35 40 45
Gin Val lie Gly Glu Ser Ala lie Asp Leu Glu lie Asp Val Ser Ser 50 55 60
Leu Asp Ala Gly lie Asp Asn Leu Ala Thr Ala Ser Gin Gin Thr Leu 65 70 75 80
Ser Phe Ser Asp Tyr Phe Ala Gin Ala lie Ala His lie Glu Gin Gin 85 90 95
His Thr Val Leu Leu Ser His Pro Ala lie Pro Tyr Arg Val Leu Met 100 105 110
Met Pro Ala lie Val Ala Ala Lys His Arg Cys His Pro His Ala Tyr 115 120 125
Leu Thr Gly Leu Gly Glu Ala Asp Asp Met Gin Cys Ala Met Gin Asn 130 135 140
Ala Leu Ala Gin Ala Lys Arg Glu His lie Thr Pro Thr Leu Val Asp 145 150 155 160
Val Thr Glu Leu Thr Cys Tyr Lys Asp Lys Phe Thr Gin Leu Val Met 165 170 175
Leu lie Ser Arg lie Ala Ala Arg Arg Leu Pro Asp Thr Thr Leu Pro 180 185 190
Thr Val Thr Ser Asp Lys Gin Asn Asn Ser Asn Gin Ala Asn Ala Lys 195 200 205
Tyr Trp Phe Thr Gin Met His Gin Asn Arg Val Ala Ser Phe Asn Phe 210 215 220
Thr Glu Asn Gly Lys Gin His Ala Ala Val Phe Val Gin Gly Thr Glu 225 230 235 240
Leu Ala Gin Ala Ser Ser Met Leu Asp Glu Asn Arg Leu Phe Phe Pro 245 250 255
Leu Ala Ala Asn Thr Ser Ala Cys Met lie Gin Ser Leu His Glu Leu 260 265 270
Leu Val Ala Leu Asn Arg Leu Asn Gin Gin Gin Ser Asn Pro Leu Asp 275 280 285
Ser Gin Arg Leu Leu Asn Lys Pro Ser His Val lie Ser Leu Met Leu 290 295 300
Asn Tyr Leu Lys Ala Phe Asp Gin Thr Lys Ser Leu Ser Ala Val lie 305 310 315 320 432 200813222
He Ala Asn Ser Val Val Thr Ala lie Ala Glu lie Glu Ala Met Leu 325 330 335
Ala Lys lie Ser Thr Ala Ser Asp Asp Thr Ser Gly Ser lie Asn Glu 340 345 350
Leu Glu Tyr Lys Thr Pro Ser Gly Ser Cys Leu Thr lie Thr His His 355 360 365
Glu Ala Leu Gly Arg Ser Gly Val Cys Phe Val Tyr Pro Gly Val Gly 370 375 380
Thr Val Tyr Pro Gin Met Phe Ala Gin Leu Pro Gin Tyr Phe Pro Ala 385 390 395 400
Leu Phe Ala Gin Leu Glu Arg Asp Gly Asp Val Lys Ala Met Leu Gin 405 410 415
Ala Asp Cys lie Tyr Ala Glu Asn Ala Lys Thr Ser Asp Met Asn Leu 420 425 430
Gly Glu Leu Ala lie Ala Gly Val Gly Ala Ser Tyr lie Leu Thr Lys 435 440 445
Val Leu Thr Glu His Phe Ala lie Lys Pro Asp Phe Ala Met Gly Tyr 450 455 460
Ser Met Gly Glu Ala Ser Met Trp Ala Ser Leu Asn Val Trp Lys Thr 465 470 475 480
Pro His Asn Met lie Glu Ala Thr Gin Thr Asn Ser lie Phe Thr Ser 485 490 495
Asp lie Ser Gly Arg Leu Asp Cys Val Arg Gin Ala Trp Gin Leu Glu 500 505 510
Gin Gly Glu Asp lie Val Trp Asn Ser Phe Val Val Arg Ala Ala Pro 515 520 525
Thr Glu lie Glu Ala Val Leu Ala Asp Tyr Pro Arg Ala Tyr Leu Ala 530 535 540 lie lie Gin Gly Asp Thr Cys Val Leu Ala Gly Cys Glu Gin Ser Cys 545 550 555 560
Lys Ala Leu Leu Lys Gin lie Gly Lys Arg Gly lie Ala Ala Asn Arg 565 570 575
Val Thr Ala Met His Thr Gin Pro Ala Met Leu lie Arg Asp Asn Val 580 585 590
Gin Ala Phe Tyr Gin Gin Ala Leu His Asp Gin Asp Val Leu Asp Ala 595 600 605
Gin Ala Ser Ser lie Lys Phe lie Ser Ala Ala Ser Gin lie Pro lie 610 615 620 433 200813222
Ser Leu Thr Ser Gin Asp lie Ala Asn Ser lie Ala Asp Thr Phe Cys 625 630 635 640
Gin Pro Leu Asn Phe Thr Lys Leu Val Asn Asn Ala Arg His Leu Gly 645 650 655
Ala Arg Leu Phe Val Glu lie Gly Ala Asp Arg Gin Thr Ser Thr Leu 660 665 670 lie Asp Lys lie Ala Arg Thr Ala Ala Asn Thr Asp Ser His Leu Asn 675 680 685
Ala Pro Leu Ser Ala lie Ala lie Asn Ala Lys Gly Asp Asp Gin Thr 690 695 700
Ala Leu Leu Lys Cys lie Ala Gin Leu lie Ser His Lys Val Pro Leu 705 710 715 720
Ser Leu Gin Tyr Leu Thr Glu Asn Leu Ser His Leu Leu Thr Ala Ser 725 730 735 lie Thr Arg Glu Asn Arg Gin Gin Ser Gin Thr Ala Gin Leu Ala Pro 740 745 750
Gin Leu Glu Gly Glu Gin Ser 755
<210〉 72 <211> 2019 <212〉 PRT <213〉沙雷菌(Sh. japonica) <400> 72
Leu Ser Ser Gin Ser Asn Val Pro Lys lie Ala lie Val Gly Leu Ala 15 10 15
Thr Gin Tyr Pro Asp Ala Asp Thr Pro Ala Lys Phe Trp Gin Asn Leu 20 25 30
Leu Asp Lys Lys Asp Ser Arg Ser Thr lie Ser Gin Gin Lys Leu Asn 35 40 45
Ala Asn Pro Ala Asp Phe Gin Gly Val Gin Gly Gin Ser Asp Arg Phe 50 55 60
Tyr Cys Asp Lys Gly Gly Tyr lie Gin Asp Phe Ser Phe Asp Ala Asn 65 70 75 80
Gly Tyr Arg lie Pro Ala Ala Gin Phe Asn Gly Leu Asp Asp Ser Phe 85 90 95
Leu Trp Ala Thr Asp Thr Ala Arg Lys Ala Leu Asn Asp Ala Gly Val 100 105 110
Asp lie Thr Asn Ser Gin Asp Asn Ala lie Leu Asn Arg Thr Gly lie 115 120 125 434 200813222
Val Met Gly Thr Leu Ser Phe Pro Thr Ala Lys Ser Asn Glu Leu Phe 130 135 140
Val Pro lie Tyr His Ser Ala Val Glu Lys Ala Leu Gin Asp Lys Leu 145 150 155 160
Gin Gin Pro Ser Phe Thr Leu Gin Pro Phe Asp Ser Glu Gly Tyr Ser 165 170 175
Lys Gin Thr Thr Pro Ala Ser Leu Ser Asn Gly Ala lie Ala His Asn 180 185 190
Ala Ser Lys Leu Val Ala Asp Ala Leu Gly Leu Gly Ala Ala Gin Leu 195 200 205
Ser Leu Asp Ala Ala Cys Ala Ser Ser Val Tyr Ser Leu Lys Leu Ala 210 215 220
Cys Asp Tyr Leu His Thr Gly Lys Ala Asp Met Met Leu Ala Gly Ala 225 230 235 240
Val Ser Gly Ala Asp Pro Phe Phe lie Asn Met Gly Phe Ser lie Phe 245 250 255
His Ala Tyr Pro Asp His Gly lie Ser Ala Pro Phe Asp Ser Asn Ser 260 265 270
Lys Gly Leu Phe Ala Gly Glu Gly Ala Gly Val Leu Val Leu Lys Arg 275 280 285
Leu Glu Asp Ala Glu Arg Asp Gly Asp His lie Tyr Ala Leu Val Ser 290 295 300
Gly lie Gly Leu Ser Asn Asp Gly Lys Gly Gin Phe Val Leu Ser Pro 305 310 315 320
Asn Ser Asp Gly Gin Val Lys Ala Phe Glu Arg Ala Tyr Ala Asp Ala 325 330 335
Ala Met His Asp Glu His Phe Gly Pro Asp Asn lie Glu Val lie Glu 340 345 350
Cys His Ala Thr Gly Thr Pro Leu Gly Asp Lys Val Glu Leu Thr Ser 355 360 365
Met Glu Arg Phe Phe Asn Asp Lys Leu Asn Gly Ser His Thr Pro Leu 370 375 380 lie Gly Ser Ala Lys Ser Asn Leu Gly His Leu Leu Thr Ala Ala Gly 385 390 395 400
Met Pro Gly lie Met Lys Met lie Phe Ala Met Arg Gin Gly Met Leu 405 410 415
Pro Pro Ser lie Asn lie Ser Ser Pro lie Thr Ser Pro Asn Gin Met 435 200813222 420 425 430
Phe Gly Pro Ala Thr Leu Pro Asn Asp Val Leu Pro Trp Pro Asp Lys 435 440 445
Ala Gly Asn Arg Ala Arg His Ala Gly Val Ser Val Phe Gly Phe Gly 450 455 460
Gly Cys Asn Ala His Leu Leu lie Glu Ser Tyr His Gly Gin Thr Ser 465 470 475 480
Thr Ala Pro Ala Ala Asn Thr lie Asn Ala Gin Leu Pro Met His lie 485 490 495
Thr Gly Met Ala Ser His Phe Gly Pro Leu Asn Asn lie Asn Arg Phe 500 505 510
Ala Asn Ala lie Asn Gin Gin Gin Thr Ala Phe Thr Pro Leu Pro Ala 515 520 525
Lys Arg Trp Lys Gly Leu Asp Lys His Pro Glu Leu Leu Gin Gin Leu 530 535 540
Gly Leu Ala Gin Thr Pro Pro Thr Gly Ala Tyr lie Asp Gin Phe Asp 545 550 555 560
Phe Asp Phe Leu Arg Phe Lys Val Pro Pro Asn Glu Asp Asp Arg Leu 565 570 575 lie Ser Gin Gin Leu Leu Leu Met Lys Val Ala Asp Glu Ala lie His 580 585 590
Asp Ala Lys Leu Ala Ser Gly Ser Lys Val Ala Val Leu Val Ala Met 595 600 605
Glu Thr Glu Leu Glu Leu His Gin Phe Arg Gly Arg Val Asn Leu His 610 615 620
Thr Gin lie Ala Ala Ser Leu Asn Ala His Gly Val Ser Leu Ser Asp 625 630 635 640
Asp Glu Tyr Gin Ala Leu Glu Thr Leu Ala Met Asp Ser Val Leu Asp 645 650 655
Ala Ala Lys Leu Asn Gin Tyr Thr Ser Phe lie Gly Asn lie Met Ala 660 665 670
Ser Arg lie Ser Ser Leu Trp Asp Phe Asn Gly Pro Ala Phe Thr lie 675 680 685
Ser Ala Gly Glu Gin Ser Val Asn Arg Cys lie Asp Val Ala Gin Asn 690 695 700
Leu Leu Ala Met Glu Ser Arg Gin Glu Pro Leu Asp Ala Val lie lie 705 710 715 720 436 200813222
Ala Ala Val Asp Leu Ser Gly Ser lie Glu Asn lie Val Leu Lys Thr 725 730 735
Ala Ser Leu Ala Lys Thr Gly Gin Leu Leu Pro Leu Ser lie Gly Glu 740 745 750
Gly Ala Gly Ala lie Val Leu Gin Val Ala Asp Gin Thr Ala Thr Asp 755 760 765
Ser Glu Pro Leu Asp Leu lie His Gin Ala Leu Gly Ala Val Asp Thr 770 775 780
Pro Ser Ala Ala lie Ser Gly Ser Thr Glu Arg lie Ser Ser Asp Ser 785 790 795 800
Leu Asn Ser His Gly Ala Leu Asn Ser Tyr Ala Thr lie Asn Ser Leu 805 810 815
Ser Phe Gly His lie Ser Gin Leu Glu Ala lie Ser Asp Glu Leu Leu 820 825 830
Thr Pro Ala Gly Leu Ser Thr Ser Asp lie Gly Lys Leu Glu Leu Asn 835 840 845
Gin Ala Pro Asp Leu Thr His lie Asp Ser Ala Gin Ala Leu Ser Gin 850 855 860
Leu Tyr Ser Gin Ser Ala Thr Thr Gin Ala Lys Ser Cys lie Gly His 865 870 875 880
Thr Phe Ala Ala Ser Gly Met Ala Ser Leu Leu His Gly Leu Leu lie 885 890 895
Gin Lys Gin Asp Ala His Ser Asn Gin Thr Val Gin Pro Leu Asn Thr 900 905 910
Leu Val Ala Thr Leu Ser Glu Asn Gin Cys Ser Gin Leu Leu Met Ser 915 920 925
Gin Thr Ala Glu Gin lie Ser Ala Leu Asn Ser Arg lie Asn Thr Asp 930 935 940 lie Gly Gin Gin Thr Ala Lys Lys Leu Ser Leu Val Lys Gin Val Ser 945 950 955 960
Leu Gly Gly His Asp lie Tyr Gin His lie Val Asp Thr Pro Leu Ala 965 970 975
Asp lie Asp Asn lie Arg Ala Lys Thr Ala Asn Leu lie Pro Ala Val 980 985 990
Thr Asn Thr Thr Thr Asn Met Leu Glu Arg Gly Gin Phe Val Ser Pro 995 1000 1005
Gin Leu Thr Pro Leu Ala Pro Met Phe Asp Lys Asn Asn Ala Met 1010 1015 1020 437 200813222
Thr Thr Glu Thr Ser Met Pro Phe Ser Asp Arg Ser 1025 1030 1035
Asn Pro Ala Pro Lys Ala Ala Ala Leu Asn Ala Lys 1040 1045 1050
Lys Ala Asn Ala Asn Val Lys Ala Asn Val Thr Thr 1055 1060 1065
Thr Thr Ala Asn Gin Val Pro Pro Ala His Leu Thr 1070 1075 1080
Gin Asn Gin Trp Leu Ala His Lys Ala Gin Leu Ala 1085 1090 1095
Ser Arg Glu Gin Gly Leu Lys Val Ala Asp Ala Leu 1100 1105 1110
Gin Val Ala Gin Ala Asn Gly Gin Pro Tyr Val Ala 1115 1120 1125
Ala Gin Pro Thr Ala Ala Val Gin Ala Ala Asn Val 1130 1135 1140
Pro Val Ala Ser Ala Pro lie Leu Arg Pro Asp His 1145 1150 1155
Pro Pro Tyr Thr Ala Pro Thr Pro Ala Asp Lys Pro 1160 1165 1170
Asn Tyr Ala Asp Leu Val Glu Tyr Ala Glu Gly Asp 1175 1180 1185
Val Phe Gly Pro Asp Tyr Ala Val lie Asp Asn Tyr 1190 1195 1200
Val Arg Leu Pro Thr Thr Asp Tyr Leu Leu Val Ser 1205 1210 1215
Lys Leu Asp Ala Thr Met Asn Gin Tyr Lys Pro Cys 1220 1225 1230
Thr Glu Tyr Asp lie Pro Glu Asp Ala Pro Tyr Leu 1235 1240 1245
Gin lie Pro Trp Ala Val Ala Val Glu Ser Gly Gin 1250 1255 1260
Met Leu lie Ser Tyr Leu Gly lie Asp Phe Glu Asn 1265 1270 1275
Arg Val Tyr Arg Leu Leu Asp Cys Thr Leu Thr Phe 1280 1285 1290
Leu Pro Arg Gly Gly Asp Thr Leu Arg Tyr Asp lie 1295 1300 1305
Thr Gin Phe Asp Ser Ala Ala Asn Val Ala Phe Glu Phe Leu Asn Leu Lys Gin Gin Pro lie Leu Ala Glu Ala Asn Val Cys lie Trp lie Ala Lys Ser Arg Arg Arg Val Thr Ser Met Thr Val Asp Gly Cys Asp Leu Lys Gly Glu Leu Asp Asp Lys lie Asn 438 200813222
Asn Phe Ala Lys Asn Gly Asp Thr Leu Leu Phe Phe 1310 1315 1320
Glu Cys Phe Val Gly Asp Lys Met lie Leu Lys Met 1325 1330 1335
Cys Ala Gly Phe Phe Thr Asp Gin Glu Leu Asp Asp 1340 1345 1350
Val lie Arg Thr Asp Asp Glu lie Lys Leu Arg Glu 1355 1360 1365
Asn Asn Pro Asn Lys Pro Arg Phe Glu Pro Leu Leu 1370 1375 1380
Gin Thr Glu Phe Asp Tyr Gly Gin lie His His Leu 1385 1390 1395
Asp lie Gly Gly Cys Phe Ala Gly Glu His His Asn 1400 1405 1410
Ala Ser Gly Lys Gin Asp Ser Leu Cys Phe Ala Ser 1415 1420 1425
Leu Met lie Glu Gin Val Gly Asn Leu Asp Val His 1430 1435 1440
Trp Gly Leu Gly Phe lie Glu Gly His Lys Gin Leu 1445 1450 1455
His Trp Tyr Phe Pro Cys His Phe Lys Gly Asp Gin 1460 1465 1470
Gly Ser Leu Met Ala Glu Gly Cys Gly Gin Leu Leu 1475 1480 1485 ^ Met Leu His lie Gly Met His Thr Leu Val Glu Asn 1490 1495 1500
Gin Pro Leu Glu Asn Ala Ser Gin Lys Val Arg Cys 1505 1510 1515
Val Leu Pro Gin His Gly Glu Leu Thr Tyr Arg Met 1520 1525 1530
Glu lie Gly lie His Pro Arg Pro Tyr Ala Lys Ala 1535 1540 1545 lie Leu Leu Asn Gly Lys Ala Val Val Asp Phe Gin 1550 1555 1560
Val Met lie Lys Glu Glu Ser Glu Cys Thr Arg Tyr 1565 1570 1575
Thr Pro Ala Val Asp Ala Ser Ala Asp Arg lie Asn
Phe Ser Tyr Asp Gly Gly Gly Lys Gly Thr Ala Leu His Cys Ala Leu Asn Ala His Gin Gin Glu Lys Phe Gly Gly Ala Ala Pro Asp Val Met Ala Gin Phe Phe Gly Arg Phe Arg Gly Gin Glu lie Thr Asn lie Asp Asn Leu Gly Leu Asn Asp Ser Ala Thr 439 200813222 1580 1585 1590
Asn Asn lie Leu Tyr Pro Ala Ala Ser Thr Asn Ala 1595 1600 1605
Ala Gin Leu Pro Asp Leu Asn Ala Pro Thr Asn Lys 1610 1615 1620
Pro Leu Gin His Val Glu Ala Pro lie lie Pro Asp 1625 1630 1635
Arg Thr Pro Asp Thr Leu Pro Phe Thr Ala Tyr His 1640 1645 1650
Phe Ala Thr Gly Asn lie Glu Asn Cys Phe Gly Pro 1655 1660 1665 lie Tyr Arg Gly Phe lie Pro Pro Arg Thr Pro Cys 1670 1675 1680
Gin Leu Thr Thr Arg lie Val Asp lie Gin Gly Lys 1685 1690 1695
Leu Lys Lys Pro Ser Ser Cys lie Ala Glu Tyr Glu 1700 1705 1710
Asp Ala Trp Tyr Phe Ala Lys Asn Ser His Ala Ser 1715 1720 1725
Tyr Ser Val Leu Met Glu lie Ser Leu Gin Pro Asn 1730 1735 1740
Ser Gly Tyr Met Gly Thr Thr Leu Gly Phe Pro Gly 1745 1750 1755
Phe Phe Arg Asn Leu Asp Gly Ser Gly Glu Leu Leu 1760 1765 1770
Asp Leu Arg Gly Lys Thr lie Val Asn Asp Ser Lys 1775 1780 1785
Thr Val lie Ala Gly Ser Asn lie lie Gin Ser Phe 1790 1795 1800
Leu Ser Val Asp Gly Glu Pro Phe Tyr Lys Gly Ser 1805 1810 1815
Gly Tyr Phe Lys Gly Asp Ala Leu Lys Asn Gin Leu 1820 1825 1830
Asn Gly Arg lie Thr Gin Pro Trp His Val Glu Asn 1835 1840 1845
Ala Asp lie Thr Val Asp Leu Leu Asp Lys Gin Ser 1850 1855 1860
Pro Leu Met Gly Val lie Tyr Pro Asn Met Phe Glu Asp Phe Ser Gly Asp Leu Arg Gly Glu Val Pro Thr Val lie Pro Gly Phe lie Glu Glu Leu Arg Asp Val Leu Leu Ser Thr Phe Asp Ala Val Phe Gly lie Asp Asn Val Pro Arg Val Phe 440 200813222
His Ala Pro Ala Asn Gin Pro His Tyr Arg Leu Ala Gly Gly Gin 1865 1870 1875
Leu Asn Phe lie Asp Lys Ala Glu lie Val Asp Lys Gly Gly Lys 1880 1885 1890
Asn Gly Leu Gly Tyr Leu Ser Ala Ser Arg Thr lie Asp Pro Ser 1895 1900 1905
Asp Trp Phe Phe Gin Phe His Phe His Gin Asp Pro Val Met Pro 1910 1915 1920
Gly Ser Leu Gly Val Glu Ala lie lie Glu Leu Met Gin Thr Tyr 1925 1930 1935
Ala lie Ser Lys Asp Leu Gly Lys Gly Phe Thr Asn Pro Lys Phe 1940 1945 1950
Gly Gin lie Leu Ser Asp lie Lys Trp Lys Tyr Arg Gly Gin lie 1955 1960 1965
Asn Pro Leu Asn Lys Gin Met Ser Leu Asp Val His lie Ser Ala 1970 1975 1980
Val Lys Asp Glu Asn Gly Lys Arg lie lie Val Gly Asp Ala Asn 1985 1990 1995
Leu Ser Lys Asp Gly Leu Arg lie Tyr Glu Val Lys Asp lie Ala 2000 2005 2010 lie Cys lie Glu Glu Ala 2015
<210> 73 <211> 542 <212> PRT <213> 沙雷菌(Sh. japonica) <400> 73
Met Thr lie Ser Thr Gin Asn Glu Lys Leu Ser Pro Trp Pro Trp Gin 15 10 15
Val Ala Pro Ser Asp Ala Ser Phe Asp Thr Ala Thr lie Gly Asn Lys 20 25 30
Leu Lys Glu Leu Thr Gin Ala Cys Tyr Leu Val Ser His Pro Glu Lys 35 40 45
Gly Leu Gly lie Ser Gin Asn Ala Gin Val Met Thr Glu Ser lie Asn 50 55 60
Ser Gin Gin Asp Leu Pro Val Ser Ala Phe Ala Pro Ala Leu Gly Thr 65 70 75 80
Gin Ser Leu Gly Asp Ser Asn Phe Arg Arg Val His Gly Val Lys Tyr 85 90 95 441 200813222
Ala Tyr Tyr Ala Gly Ala Met Ala Asn Gly lie Ser Ser Glu Glu Leu 100 105 110
Val lie Ala Leu Gly Gin Ala Gly lie Leu Cys Ser Phe Gly Ala Ala 115 120 125
Gly Leu lie Pro Ser Arg Val Glu Gin Ala lie Asn Arg lie Gin Thr 130 135 140
Ala Leu Pro Asn Gly Pro Tyr Met Phe Asn Leu lie His Ser Pro Ser 145 150 155 160
Glu Pro Ala Leu Glu Arg Gly Ser Val Glu Leu Phe Leu Lys His Lys 165 170 175
Val Arg Thr Val Glu Ala Ser Ala Phe Leu Gly Leu Thr Pro Gin lie 180 185 190
Val Tyr Tyr Arg Ala Ala Gly Leu Ser Arg Asp Ala Gin Gly Glu Val 195 2⑻ 205
Val lie Ala Asn Lys Val lie Ala Lys Val Ser Arg Thr Glu Val Ala 210 215 220
Ser Lys Phe Met Gin Pro Ala Pro Ala Lys Met Leu Gin Lys Leu Val 225 230 235 240
Asp Glu Gly Leu lie Thr Pro Glu Gin Met Ala Leu Ala Gin Leu Val 245 250 255
Pro Met Ala Asp Asp Val Thr Ala Glu Ala Asp Ser Gly Gly His Thr 260 265 270
Asp Asn Arg Pro Leu Val Thr Leu Leu Pro Thr lie Leu Ala Leu Lys 275 280 285
Asp Lys lie Gin Ala Glu Tyr Gin Tyr Lys Thr Pro lie Arg Val Gly 290 295 300
Cys Gly Gly Gly Val Gly Thr Pro Asp Ala Ala Leu Ala Thr Phe Asn 305 310 315 320
Met Gly Ala Ala Tyr lie Val Thr Gly Ser lie Asn Gin Ala Cys Val 325 330 335
Glu Ala Gly Ala Ser Glu His Thr Arg Lys Leu Leu Ala Thr Thr Glu 340 345 350
Met Ala Asp Val Thr Met Ala Pro Ala Ala Asp Met Phe Glu Met Gly 355 360 365
Val Lys Leu Gin Val Val Lys Arg Gly Thr Leu Phe Pro Met Arg Ala 370 375 380
Asn Lys Leu Tyr Glu lie Tyr Thr Arg Tyr Glu Ser lie Glu Ala lie 385 390 395 400 442 200813222
Pro Ala Glu Glu Arg Glu Lys Leu Glu Lys Gin Val Phe Arg Ser Thr 405 410 415
Leu Asp Asp lie Trp Ala Gly Thr Val Ala His Phe Asn Glu Arg Asp 420 425 430
Pro Lys Gin lie Glu Arg Ala Glu Gly Asn Pro Lys Arg Lys Met Ala 435 440 445
Leu lie Phe Arg Trp Tyr Leu Gly Leu Ser Ser Arg Trp Ser Asn Ser 450 455 460
Gly Glu Ala Gly Arg Glu Met Asp Tyr Gin lie Trp Ala Gly Pro Ala 465 470 475 480
Leu Gly Ala Phe Asn Glu Trp Ala Lys Gly Ser Tyr Leu Asp Asp Tyr 485 490 495
Thr Gin Arg Asn Ala Val Asp Leu Ala Lys His Leu Met His Gly Ala 500 505 510
Ala Tyr Gin Ala Arg Val Asn Leu Leu Thr Ala Gin Gly Val Ala Leu 515 520 525
Pro Val Glu Leu Gin Arg Trp Ser Pro Leu Asp Gin Val Lys 530 535 540
<210〉 74 <211> 303 <212> PRT <213> 沙雷菌(Sh. japonica) <400> 74
Met Ser Tyr Cys Tyr Tyr Lys Cys Glu Phe Gly Leu Ser Pro Leu Pro 15 10 15
Thr lie Gin Leu Phe Phe Cys Pro Leu Asp Thr Asn Leu Leu Asp Glu 20 25 30
Lys Thr Val Ser Thr Val Arg Ser Trp Leu Ser Asp Ala Glu He Asn 35 40 45
Lys Val Asp Arg Phe lie Gin Gin Ala Ala Gin Gin Gin Gly Leu Met 50 55 60
Val Arg Gly Tyr Leu Arg Ser Val Leu Ser Asn Phe Ala Asn lie Glu 65 70 75 80
Pro Asp Asp Trp Gin Phe Glu Tyr Gly Glu Lys Gly Lys Pro Arg Leu 85 90 95
Ser Ala Val Gin Tyr Lys Gin Thr Gly Leu Gin Phe Asn Leu Ser His 100 105 110
Ser Gly Asn Trp Leu Leu lie Gly Val lie His Ser Lys Glu Asp Ala 115 120 125 443 200813222
Ser Met Pro lie Gin Leu Gly Val Asp lie Glu Arg Arg Arg Glu Ser 130 135 140
Thr Asn lie His Ser lie Leu His His Tyr Phe Ser Lys Pro Glu Glu 145 150 155 160
Thr Ala Leu Leu Ala Leu Pro Glu Ser Gin Gin Arg Glu Arg Phe Phe 165 170 175
Asp Leu Trp Ala Leu Lys Glu Ser Tyr lie Lys Ala Lys Gly Leu Gly 180 185 190
Leu Ala Leu Ser Leu Lys Ser Phe Ala Phe Asp Leu Ser Ala Pro Ser 195 200 205
Leu Ala Asn Leu Thr lie Asp Asp Gin Leu Leu Pro lie Gin His Asp 210 215 220 lie Ser Leu Ser Leu Leu Lys Pro Thr Asp Val Asp Glu Leu Glu Gin 225 230 235 240
Thr Asn Asp Val Glu Ser Phe Tyr Glu Val Ser Pro Leu Trp Gin Cys 245 250 255
Cys Leu Gly Lys Leu Asn Asn Ser Tyr Arg Phe Ala Val Ser Val Gly 260 265 270
Glu Phe Ala Phe Gly Glu Lys Pro Leu Thr Leu Gin Leu Lys Ala Lys 275 280 285
Lys lie Ser Trp His Glu Gin lie Lys Met Phe lie Lys Thr Asn 290 295 300
<210> 75 <211〉 38794 <212〉 DNA <213〉沙雷菌(Sh. olleyana) <400> 75 gatccagtgt tattcaacca aattgaagca ttgaatactc cttatccttt tccaattcaa ggccatgctc aattcgccat cgtgttttgg cgagaagatg agataccgtt tatttggttt ttaaagcttc cgcttgatga acaagggtta ttgtctccag ctcaacgtag ccaattcatc aaaatgatcc tcgaagcctt aggccgagat cctaccaaag cgctttctga tgaagaacaa gagcgttatg ctaatcatcc gttcagcttc aaaccgagtc aggagaagct agccttattt aacgcattag taaaaaaaca gttaagccaa caagcctcgg cgcagtacga atatgctgct cagtactttg aaaatttgaa tgaaaaaaac gctcaagatg acagctggca gcaactgggt ttacaaggca tcgccgatgt ctgtgtccgc ttagataagt ttgaccatga taagcatatt aatacggcaa tgaagcttgc tcccttagaa gtacaagccg caatttgcca atgtttagaa catgttgctg tttcaaatac attagctgaa accttatacg ataatttgtc atctgctgaa gtggaacata aacatatcta ccttcgcgct cttgcttcac agcctgaatt gactcaaaaa gcgattcagc aactggttaa tttacagcaa ctcgatgaga atttattaat cactattgca 444 200813222 gcaagaagtt ggacggcttt aaaagatgat gcaactcgca aactttatct tgaagtctta gctaaccaac cacaaaactt ctttaatcaa gtttttgctg atatcgtagc tattccaagt ctacggaact cactgctact tgatttaaga agtgctgatc gtagtgaaaa actttcttcc gccatcggcg gattatttag ggccgttagc caatgatgtc agactttatt ttaatcgttg ctgttgtggt tgttgctgca ttcttttggc agttacgcca gatggctgaa atcagtcgcc gatatgctga gagatcttgt gccaatcaaa aagtacaatt actcgcgatt gcgatggaat cagctagacc tagtattggc ggttcaacag gtttatgttg gcgagcaaaa tttatgtttg aattcagcac cgatggtatt aaccaatacc gcggtcatat caacatgcac agcaaaaaaa tagagaaaat taattggcct attttccctg agcccgaatg gatggatgcg ccaatggcaa r aaggcaaatt cggtggttgt ggcggcgcat cgagctgtaa ctcaggtaag tgtcgttaag cctcaacaac tgcctaatca gtgagtcatt gtagagttaa tgtcactcgt atttactcaa ‘ aatatagtta caacaaaact gattattatc gtaataaaat aagcgctatt aggagaaatt cactcttaat ggcgtttttt attggctaag tgattttttg tacgattgtt ggaaaacaca < caagtcaaaa aatacttcac gtatggttat atatttagcc caaaagaaag accgcggcaa taaattgtcg cggcctcttg tacttttgtt aagccatcca gctatatctg tgctccctgc accatccatg cgtctaactt gctccgtgcg ctatccttat tctatccttg atgttccatg tacatttaag tactgtcctt cttactcgat tatcctttga ccgagcctgc tcaaatcctt aagcgtgtcc tttaattcgt ccgtggtttt cttccatgac atccttgatt caatttactg catccattgc aatcactgtt ttccttaaca gctcaaatcc attttattga tgtccaattt ataaaatcca tttaaccata aagtctttca tcatcttcga tgtcagtgtc atccataaac actatcgttt tccttaacga cgctttatcg tccacttaat taatgtgcct tagtcatcat cctgatgagc aacaacaata attaaggttc atcctgagca agccagcaca ataatctatt gtaacgctct gttgtaacaa tctcatgtta caaccacctg caaaaatcct attcagctgc agtctgaatt caaactgcta aacacttcct gtgcttattt gcttccttgt gattaatttt aatcgatatg tgagcaaata aatatgcaca aaacacacaa ttaacatcaa cccaacaaac x " aagcttggca cccataaaat taaactattt aaatacagta acttaaataa aaacacttca acatcgttat ggttaaagcg tttaatctca caacttttgt gagatatatc tcacaaagag tataggaaag acagaaggta agtcttttgg cctattcaca catttaacat ttgttaggta aaagtgcata aatattgatt tgaactgaac ataaaaaagc ccgaccttat aaataaggtc ” aggctcattt tactctttgt tagctatcct gctaaattgt gctccctgct ccatccatgc gactatatgt gcttcctgct ccatttatcc atttcaactc aatttccttg tattgcccca aatagagcat tacatgagtt ttcattcctt tgaatcagtc tatccatttg actgaaagtc ttactcctag atataccatc ctggtatttg cttcctgcaa tccttcatct tcctgatgag ggtcatcctt gtttcagtta atcattaact gagcttatgc ccattccttg agcgtgtcct tgtttcatcc tgaattggtt gttactcacc cagcatttac tcgataaata actaaattca cttaagcagc aatattcact taaaccaaat agttaattaa ctgttcttgt cttgcggcta cttcctgtaa ctcactaagt taatatattg attgcttaat gagttcattg taataaatgg atgaaataga gataggtaaa aaacgagcag aaacaaaaac ttcacaaacc tgaaattcag 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 18⑻ 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 445 200813222 accaaaaact atttgggcta ttagcttgaa atcagctaat aaaatggcca ctgctgatta cagccttcta gtcttggtat aagatgctaa ggataaatga ccttcacgag agttctggct ttactttgct aagctttcta cctaacacca gttatgacac tcttgttgcc ctagcttggt taaataattg tctaacgtgt aacaagttta agccaagtac ttgtttgaac cataccatca gcatttttag gacgttttgt cactctttga cgcagtgtca ttttgtggtc ttttttcggg cattaatata gttagtttgt atgaaataca ttttgttttc tgcttttgag tatacttttg atccatattg caagcacttg aacgaatacc taatttccca agactataaa acccacgcaa atgagcgtta caagtggcat tttttttcgc acagaactgt gaatttcacc caaataattc gctcatcaca caattggcga agatactgtg ttttcaaacg aggcgactcc aaagttccgt tagtagtagc atgcagccac tttgttccat aaacatattg acgataaatt agctaggatt aagcaagtac aagagagttt taaggcaata aacacattaa ccccaaccca ttgccgtcac ctttcggcgt gtgacttgat tgctgtgttt caaccactta atgatacttc atacgttata attttattga aggattttca ttttatatcc tacatcaatg acttaaactg acgggtactc aaccatagcc taacaatcaa cttgatgttg tcatcttatc agacaacata atcgacactg tgcatgctta ccaacttaac taaagcaata ctcttttttc ccaatgccaa aatgagcctt taactcctcg aagagcttca gcgtaaatct gtttacactc caattttaat ggggatgaaa ggattcatca aaatttaact aaaagatgac gccacaagct aaagtgacag ctagcttatt ctttactcca ctgcctgagt ctctcgccat cccaataaga atgtaaggct cttattatta atgttgtcta atattattta ccaattatga acaaattaat tgagataagt tttttttaac gaatgttgct aatcacgggt tattatgatt tgataaatag gtctccactt tggttcacaa ccaattgtta gggttattca actgcctgga aattgcaaaa atgagcgctt taacggctct tcaccatcga cgaatagagg ataaagaaag tctgcagtta tttactaaac gctgtcacct atggatacaa gatgctggaa gaggctgact gcccagtggt tttaataagg tgcttaatag atcactaatg ttgagtacga aacgtatgcc acccatagtg atcactatgg acttgcagcc aaatgattct ttatcattaa atgaacatta gtccaatcga aaaaaagtaa ctcacaaacg atttgtgcaa ggtcggtttt aaaagccaca aatccacttc aaagggtaaa atatattatt aatgacagtt attcagacaa cgaaaacacc tcagettage taccatactg gggtcgagtt cacctaatgg accagccaat cacgtagttt gatcatcatg aataaacagc caagttaata aggettaaag cttcagcaac taagcgtttt tttggaataa cagaactggt caattgccaa tttatttaaa acaaccggcg taaaagagta tcactaaaat agttttgata ttaccttcgc attaaaaatg cacgtaattt gctaaaaaca ataagtaagt acaagtcctc gatattgagt gaagtaacag acatcaccca tctcaaacac attgccacca caacataatg aagatttaaa gtttttgaga ttatttactt atgattaaag gataccatca gccattacct cttactcggc ccaaccggta cacttgatga taaaggttgt ctgctcgtaa gtaagcgtta tctgtgttct gttacaactt atatetegat acttgctcac tctatcgcaa tgctcaaaga agaccaactg aagcaaaggc ttttttgata tacactcatc cgtttacttc ctgcagttcc aattggctct tgccaccaac ctaaacccaa ctactcaaac tgccaaagtt attttcacta getgeagega 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 446 200813222 aaaccattgc gcaaagtgcc accaatggca acacagatac aatttgaaag aaatacataa attaaccact cccatgtttg gaaaaagcca gaatttgccg accagtctat gaagctaaat agtaattcag cctataagaa aatggcgatc caaatggctg agtgacttat ccgacttact gcctgccctc catttcagat gttatgaaat atcaactgat cgttgccaaa atcacgcgcg ggcttatcac tgatcgccat ataatcagat tgcaatagct ccataaaacg aaatttgagc tcatacttac cctaatacat caagacactt agactagatg tttaggtcaa tcgtaaactc tatctggacc tattgaagtt attgaatggc catgcctttg aactctgcct ccaagccata caaaatttcg ataactgtcg gcctaataac tcacagagct ttaaccatta tcgcatttaa cgactcgtca tacttgcccc aaacacctag gtggcgataa ataaacgggt cagccacaaa tcagacgagg attatctata gttgtggttc gtgagccttg ccaaataata taaattaaga tgcctgggtg gggttaatcc caggaatttc cacctaatac gaccaatcac caccttctcc catttatatc tatttttacg cttcaataca cctgataagc aagatgctcc acacacaatc acgacacaat aatcgtgatg ggctatgaat tacctcgcta catacaccga cttatccaag gacttaggtg gaacaaaagc ttattagaac ttagcgctgt gctgacgcat aagatttgaa cctcgaatct tgaaggtgag taatagtcct tcgtgaaaag ctggcaggtg cttgttgcct tatccgctgg agccgaattt ttgggacata ccgagtaggc taaagaatgg ccgcatagta aagccagaca cttcttacct cgcgacatag atcaataaac aatccacaca gccaacaaac attttgttgc ccaagttgaa ttggtgcaac tttaatcgct ggcggatcct ttgaaaataa aattttgggt acgatcccta atcaagcaga ccatagcatt tatcttggct tcgaaagtga cgatggcatt ggttacaaca attcacttga tactgactca aacgtattgc taatcattgg cgcgcttata tgttttgcgg ttgcgagcca tttaaagtta tggacgaaac tttattggcc ctttatacta attccgcttt caaacagaat gccgctttag cgcggtagag ggcgacagtt cgtttagatg tctaacatct tttgtctggc ttaatcaaat ttatcttcaa tcagctaaac ctgccatctt caagtgggtg aaagattcaa tcaaaatata ttaagctcta ttccaaaaaa tgcccaagtg cggctagaaa tataatataa tagtgatgca atatgatgct aaccgattcg aaatgccaaa taatttaatc agttaaaggt atttaaagct atcaaataag aatgcagcaa ccaacttgaa cacgattgac accccaaagt ataccacaat acggccaagc ggttattaat aagcgttaaa aagatatcaa gctacgttca atcagatccc ggcaagcttg aagagattac ttgaattcat tagctagtga aaccattact cttgggatca tttattataa cagcccacat caataggttc tgtcagcgag cgttatcaac cttgtttgag agtcttgctg aaggcgcaga aagcatgttc ccgcatcatc ggaaataacg aatgatccaa gtctattttg gatgcactta tcactgctac ctcccttttc ggcaaaccaa gaatctaaat aagctcggtg attccgaaag cctgcagcca atgaaaaccg aacaaagcgt tactagtacg taaacggaac caccgcagcc cttgggaaga gccagaaaaa ccagctcacc ctctgaagtc tatgtgctcg agccagcttt tgatgaatta ctcccataaa cactaagata aaaagagcgt cgatatgttc tcaataagtt ttaatcattc cattttcatg aacaggtggc tttatcttta agtaatcatt ctttttcttc attccaaact aaaatattcg tacattactg tgaatcaaga gggaaactcg tgaagttgaa acacggaaac aaggactgac aaggggttcc agggcgcaga tggttgccat cgtttaaact 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 6120 6180 6240 6300 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 447 200813222 gtatctcaac agtcactgac acattttaat tgaagtggat cgttgtcgaa agattggggt tcgctacttg atttactgac tcgacgtggc ccatcgttta ttatattgtt atcatctacc gctataagct acgggcaaat gtgacccagt gttaggtaca gagaacacgg aaactgttca ttgaaactca atcaacatag gcttagtaag tgctttggtg aagtattgcg cactgttggt gagaaatctg tctgagctac tgacttcatg atatagcctc ctgtttaacg aatatttaaa cttacttgca cgattccgaa caaaggcata atctctgtta ttgtaaagca cgatccaagg tcaaataaga agctttaacc ttaagccatt actcaacgta gactacgagt acagtcacat agtgtcatga atttctttcc ttaaaacgct ggtttagaca gcaagacagt tatagtcggc gtattggcaa gctgcaacag tgtgcatccg attgattcaa tcgtcatagc cgaatattat acaaccccct gcccacatgc agttgctgcc tacttaggca atatcaatat tctaatttca gtaaaaagtg gcgattaaaa ctgttaagtt agggttcagt attgaggttt gaattaaatc ccttatggat gagctctcaa ggcttactct gaaaaagagt caaaatgggg ttcaagctaa catgggccaa aagatgacag aaacacgttt gtgctaatgg ttgtcgaatt ttaatcctga ctaacttatt tccgttatca gccaacataa actgtaactg ttaatccttt aatgggtttc actaaaattt tatgatcagg aaatgacctt cttcatgatc cacatttcag caataatcgc tttgcgaatt taatgccgtc ttccagcttg aatttttagc agttttcgcc ttttcggtac ttgcatcatc gctcagatga taagcttcat tttactgctc gcatctcctg atagattaag aagagtcgct ttttgagcca acttccccga tgctcacaac attacgtgca ttgaaattgg acgcagagcc ccagttgggt cagcagtagg tgagtcagtt cgaagtgaca accaggtaat ctatctacaa gaaatcaaac agggcctaaa cgaattccat cactaaacta cagaagtgat taataataaa ttacgcataa tttaacatgc ggcatcgctg cccgatgtac gccgccgaat tttaaacggt ttgcgaacag aaatagcatg aagcatttca accatgatta agttaaatgc agaattgact tcattgttta atctcgttaa cgtgttaaaa gcgtcatcat caaatggacc agcaataaca caatgactct gtttgttcct aaaaaccatg agacggcatg agtggatggc catcaatggc aatgcttccc atcgatcacc ttttgcgacc gagcaggtac gttaaagtga tgtatcgacg gacagtactg tgtcttatta attaatcatg gagcagtgtg acggtatatg tttgaacaac aagcctgcaa tgcccaataa cagctttctg cctaattcta atcagtaagt gggtgtggtt gcaccaattt atcccgtgat acttctgttt ttttcagtta gcttcatggt ggtgcaacga agagttccat ataaacggta atacctttaa aacaactgtt cttaaaaaat atataataag ctactcatgc caagagcatc gaaacacgaa gcgattggtc atgagtcata gatattaacg acaaaatatc tcacgcggta ttatgtgaag ttaaggctag agcaaacatt ttgaacctaa aacttgatat aagataaaaa cctctcagcc agaagttgct ttgaacgtat cccgttatac cacctgaaac ttgcaggctt tagccgctaa gctctgattg attgcaaatt tactatttgc tttgattacc cattgctatt caaaatgaga cattcttttc acccatagta aattagcttc tagacagtat cataatccca ttaaggagta attatgtaac atcacctcag tggttaaaac gaaccgtata caaaaccaac agcactttaa agaaaaagca gcttagatca aagtaagaag atgaggctgt ttaccctgcc aaaaaattcg gtaaaaatcg taagagtcag 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 8280 8340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 9660 9720 448 200813222 aattggcgat attcatattg atgccatgca agcaggcgat gttatttctc tgagcaattt tgacgcggct attaatagcg ataattaacg gtcactttct agcaaataca ccttttccat tgctgtttca actaactcac gtaaccactt cgttgccggg tcttgttgat tacgggtcgg ccaaatgctg taaattgata tcaattggct ttcgaacggt aaatccatca aggttaaatt aaaagtagat tgatagtttt tagcataggt atatggcgca atgcagattg catcagattt gctgactccc gataacatgg tgagcaaaga tgatttttcg ccatacatat ggcgttcagg taaatgctct gtagaaataa tctctgctac tcgctgatta tgtcgatgta atcggtaaaa caaatgttta gccgtaaaat acgactgctc atcaatacca tttttaaatt gaggatggtt cgccctcgcg acacaaacga gcttttcggt agcaatttgt ttgctggaaa atgatgcttc gctcggcgcc acaatatcta acgctaaatc aatatgctgt ttttgaagcg cttgatataa attaccttca tcaataatcg cttcagtaaa gatgatttca acgcctttat cagccaccga * tttttcaata tcggcctcaa tcaaatcaat aattgattca tttgcactga catgaaaaac acgttttgat tgctgcgggt caaacacttt aacgctatta atacactgct ctatatcgat tf taaagatggt cctaaggttt ggtgcaaatg ttggcctatt gcggtaagag caatacctcg accttgcctg acaaataact ccgccccaac aagggtttta aagcggttaa ttgcattgct gacagaagat tgggttagtg aaaggtgctc tgctgcaagt gtaattgatt gataatcaca tacactacaa aataccctaa caagattaag atcgagctta tgcagctctt gttggctcct ttcttgttgc agttgttcta attgcaattg ccctaaacct tgcttcactt ttaccacctt aatacgtcat ttgaacaaat agatttccaa tacaaatgct cattcaagtc attgattctc gcctaataca ttcacacagt aaatgtatta actattctta gccatagtta tctttgccaa ttttgttgtt aacttatatt caacaacaat aaatcctaga ggcttacatg agaaaatcat tacttggttt agcgattacc ctaacgttta ccacccaagc ttttgcagct caacatgaac acgaccatat cactgttgat taccatggta agcccgcaac tcctatcact gctgaacata ataagtcagt agcaaaaacc ttaaactttg atgataaagc cgcttttgag cgatttagca aaaacaaaat cgcctcattt gatgaagcta cagccaaaat tctacgagca gaatttagct f 1 ttattagtga agagttaccg gactctgtaa acccatcatt atatcgtcaa gcacagctga atatggtgcc aaacggacta tataaagtca caggtggtat ctaccaagtc cgtggtacag acttatctaa cctaaccctt atccgaggca aaactggctg gattgcttat gatgtattac tcaccaaaga agcagcgcag caatcgttaa agtttgcttt tgctaactta ccagaaggtc 一 aggatttacc tgttgtcgcg atgatttact ctcatagcca tgccgaccac tttggcggtg cccgtggagt gcaggaacta tatcctgatg tgaaagtcta tggttcaaac aatatcacct cagaaattgt tgatgagaat gttcttgctg gtaacgtgat gagccgccgc gcagcatatc aatatggcgc cacactgggt aaacacgacc acggtattgt ggatgcagca cttgccaaag gtttatcaaa aggtgaaatc acttacgtta aacccgacta tgaacttaat cataaaggta aatgggaaac cttaaccatt gatggtcttg aaatggtatt tatggatgcc tctggcactg aagccgccag tgaaatgatc acctacattc cgtcaatgaa agcgctatgg tcaggtgaat taacttatga tggcatgcac aatgtataca ccttaagagg agctaaagta cgcgactctt taaaatggtc taaagacatt aatgaaatga ttaacgcctt tggtgaagac gtaaacgtat 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 449 200813222 tatttgcctc tcattcagcg ccagtttggg gcaataaaga ggttaatcat taccttcgca tgcagcgtga taactatggt ttagttcata accagtcaat gcgtttagcc aatgacggca tagttattca agatattggc gacgctatca tggagaccat acctcaaaac gttcaagacg aatggtacac caatggttat cacggcacct atagtcataa tgccaaagct gtatacaaca tgtacttagg ctactttgac atgaatccag ccaatttaaa tccattaacc actaaagcag aagcaacaaa atttgttgaa tatatgggcg gtgcagataa cgtggtgaaa aaatcaaaac atgattttag ccaaggagag tatcgctttg ttgccacagc acttaataaa gtcgttatgg cagatccaca acacgatgca gcccgagagt tacttgcaga cacctacgaa cagctaggtt atcaagctga aggggctggg tggcgtaata tttatctcac tggtgctcaa gagttacgag tgggtattaa gcctggcgcg ccaaagtcgg cctctgctga tgtgatcagc gaaatggaca tgtcgacctt atttgatttc ttagcagtaa aagtcgacag cattaaagct gcggcacttg gtaacattac cttgaatgta gtgacacaag atggaagcca aaccaacacc ttatttgttg agttaagtaa cggtaactta agcaatattg ctgtcgagtc tccaaaacaa gctgatgcaa ctctgactgt aaataaagct gatgtggttg gcatactatt aggcaagacg aatatgaaag cgctgatgca atcaggtgcg gcgacaatgg aaggtgacaa acaggctttc gctaaaatcg cttcgactct agtgcaattt aatcctgact ttgaaatcgt tccattaaag catgctcatt aattagggct tgttaaatga tgagagtcta gtggctcaga ataaacagtt ttaaaacgaa acagttttac ctatcagttg gtttgaaggc gtgatttaca acttcaagcc aactgatttt ttttgctttc agctccggag gtaactcgtc tgaatttgta gacgcacgac ccacactcac agcaaaacga tacaaatcat caagctttcc taaataacaa tgccactgcg gggcaatgac aaaatcctct aataaaccat cagagtcact cgcctttagt aagcttaact tgacattttg ttggatggtg attgtctcac tgttaacttg tagttcaccc acacttgagg cagataaatc aaacgcaaaa gattttagcg ataaagctag acctaagcct ttcgctttta tataagactc cttaagcgcc cataaatcaa aaaagcgttc tctgtgttta tcttcagcta aagccagtaa tgcactctct tctggttttg aaaaatagtg atttagaatc gaatgaatat tcgttgtttc acgacggcgt tcaatgtcta caccaagttc tatatctgtt tgttgttgag ctgttccata tgtgtttgcc accccgatta acaaccagtc accactgtga ctcagattaa actgcaaacc agtttgcgca aactgctccg ccgttaacct cggcttgccc ttctcaccat attcaaattg ccattgctgc ggctcaacac tagcaaagcg cgataacaca ctgcgtaaat agcctcgcac cattaaacct tgttctctag atgattgctg aataaaacga tcaacctttt tgacctcatc ttcaggcagc catgaacgca caatagacgc agtcgattca tctaataaat cagtattaag gggacagaaa aataattgaa tgacggttgg cggcttcaaa ctaggctcag gctaaattgg caatgtacca ttgtcgcttg ttttaggaag cgatttcaac aagcaaggtt acttatcgat atggttgcgg cgttaatacg ctgatgtgtc aacgccaaaa cgtgggttca ctgaactaaa acagtcttga actaacttta attaatccaa aacaaactta atttacctga tgaaaaaaag ggttgagcaa tgctcaaccc tctatgggtt ttatcctata acaggcattt aaaaattact ctgccagtgc ttttactgcc ttttgaggaa gcacatcgta gcggctgaaa tgcatcgaga 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 450 200813222 attgcccttc gtggcgcttc tacctcttga tttgcatatc aggctttttt catcaagcaa tggcttcgcg ccacttggga cttcgccaaa cagccataat ataaattttg cggtttgacc tatttaatac caaaaatagg cgtgaagcac gtaacgcttg taaacggctt acaagcggaa ctaaaacatg ctttaataaa ctaacaacga gccccattct cttgttctaa catctcttgc agcagtcaac agcatctgtg ttccatccat atgctcgttt caacaccagg tgaaattgat gatgagattt ttaaacttat ctgtgtgtcc cctcctttgt gataaaacac actctttaca ctctttctgg aggtactctg gccacctgtc aacactcact agaactaata aacgataggt gcccgccata agttaccttc tacacctttc gacaaactca ttggccagat ggtttcacgg cgctttctct ttcagcttcg ttccgatatt ttgcgggaat agctcccaca attgacatta gcgtccgcta aacccccata atcagaggct ttgcggcgga actgatgcca taacgctgtt ataaagctcc tgtagcggca cacatcatcg gccaaattga gtgatttatc tgtcacggat taatggtaat gtggtgagat ttcttgggca agcatcagcg gagcactgcc tcacattatt ccataaattc cccgcaacgt tcgtatcagt catgctcgat atcgacttaa tccactaaac tcccccgtaa tctaaaataa acaaaagcaa acatcctgta tcaacggctg aaaccttgtc ccacctgatt taagccacag aaggcaattt ttgcgactga ttctgctcat ttaagctcgg gataactctt atttgtttgt ccaatgaaca cgtccaaaga ttttgagtga ttcgcttcaa atatcttgct tccaatggcg attaaagctt ttgctaaaca accaaaccat tgttgaatat gcaatgatga tcaatgccaa agcgcacgtc tgataatcga gtgaaatcag ctaaagagta agattgcgga aaactatcca agtatagate tttttataac aattaattag tgtgataaaa gccgagtgga cattgctact tttcacccac ccggctgagc tctcctttga atgggtatcc gaatgtactg cacgcgctaa gctttttatg ccggcgtatc gaaggtgtaa tttgtaaact caccacggcg gtaaatggaa caagcttagc egeettgaag atttcattcc aeggatetat catcaatcgg gtggattcgg ctgcgctagt catgcagttg catcttcttc aagtattgaa cagctgtaac ccatcatcac ctgctttacc cacttgcgtt caaagaagtc gatttaaaaa catgatttgt acgcctcaag tttgctcagt tatctttgtc ggtaacattg aaaatcaccc tttcgggtga egetaataat gtaattactc tgcttgggta atggttttga cagttttacc atcgacactg acccatttcg ggttggcaca cggttcaact aegatatega agtttccata gtcaccttgt tggatetteg tttagctgat ttcatcttca aatggcgcaa tttcattaag cacagaaatc cgccacccta ettagettea cattaactta aaaacaaact ctctggcgta aagtacggta agtttcatca attgggtaaa atcaaacacc ttggcttcga caccactaac gggtaatcca tgaaggttct acccttatcg taaegaggat ggtaaactca ttactatgtt ttgaataatt attcagctta ttgtatcgac gaagatgaac acgttagcca ccgcaaacga gccacatgaa gcttccataa tgatgcttgc cccgctaaca gaaccgccca tttaattcaa tactctgcct tccacattaa ccttgcagca gccaccagct actgccagac tcatgactat atatcaccag tgagacactt gtaccttgat aatacatgcg tcaccgtagc accagaatct ggcaccaagt agtgattcgc tcaaccagct caatgtaagt ttaaccggta ttggcttcat gcagcttcaa aatacagatt ggagtatega aaactgtgac accctgcctt ttacctgcgc gccatgatgg tacatttgac gacacagatc caagtgttag ctgaaacctc aaacgttaat 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120 15180 15240 15300 15360 15420 15480 15540 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 451 200813222 cttcagtatt tccttaaatg ctcttccgat cgaaatgcgt gaacatatca caatacgcca cttacgttat caataaagat actcgatgaa tcagggtaca attgcctgaa actgactcaa gtatctcgac gttaaagcac agcccgtttt atcagctaag gagacctcat gacatgccta aagttttggg tggcgcgctg cgtggtggat attttagaac gcagatgcgg ggtggcggtc aaagtattta caagaccaat gctggtcgta tgtgcgggct gaaatgatga tctaaaacgc ggcatgatga cgtgatggcg tttaagagta gatgacgctg gctgcaggtg actaagcaac gctggtactg ttttagagag actgcaaacc tgtgatgtag caatttatcc gaagccacgg catcacttaa cagctgaaaa gtttctcgtt ttcgaaagcc gatgtagcga gccacaccag gcagacagct atttatcaag ggaccgttcc cctggtgcaa gatcagetga ctcaagataa ttgccatcgt acttaatcag aagattaett ttatcccaga tgactgatac gcgttacctc aaaagattaa agagcagtgg acattcactg ttgctaaccg ctcttgctgc tcacaggtgg ctgcgttcac ttggtgaagg accgtattta tttatgcacc gttttgcccc atgtageega acatcgcttt ctggcgtgat tcccaataga gacaagctaa cgagcacacc aaacttccga taagaaaatg aaaccaccct tgccgttaga caggacttgc cctatgttcc cttacacact acaatgtggt attccatttt acaaccacac atttacgtaa cagtgttgca acactggaga caacgagtcg eggeatggea egagaagatt tgatgeegat agttgatttc ttcgcaattg tgagtaegat tgcaagctta tetaagtgat ggaagaaaat cttcgatttg aatgcgtatg tgtgtgtacc caccaatgaa tateggeatg ttctgtgatt gcgccctgaa tgaaacagtt atttaaegge aggttcagtg taaagctgcc ttgtacggag atcagccact tgtgcgccat ctttagtgtc gcgcaaacgt ttcacctatg cagattgcta ccgctgctta agaaegetat gaaccctgaa gcaagtggta actcggtgtc acaagcaacc attactcgtc ctctgtggaa ctcaaaatga caagatacaa agtatctttg gatgccatca aaaagcaccc aacccaatgg ctatcattag accgacaaaa accgcgcgcc gctgacagcg tcattcccag ggcggcatga gcgttaactg gataactcac accattcagc gtageaetta aaaggtgtcg ggccaagcaa ggettaateg cttaaatctg aaatcacaag cttgccctgc tgttcattct aaaacagtgg egtaatgega agccagttgg gactccatca gaagagtatg aaagtcactc aaacgctacg ttcaaccaat actcttgcta tccctaacga gactttgcaa aategetata aaaaattatc gcggcgaacc gccaagcccc gactgaacaa etaatteteg cagaagtgcc cagataaaag aattcggcct tgattgccaa tcggtattac tacaataccc atatgetgat gctcactagg actgtgtagt agctagttga catcaatgta catttgatat agcgcctaga gcgcttcatc aagcattaaa aagctcacgg tatttggtga tgggtcacac accataaagt gctatggccg taaaaaaatc caacgacccc ctaaaattct gcgatacacc tggttgttgg aacagttcat gtgtatcgaa taccgattgt aaaccctgtc ttccacctca ccgactgggt tegettatgt atactttttt aaaaaaataa tacaaatcct aegtettaaa ttacctgaat tgatacccat ctactgtaaa gccaccaaat agaagtgett gctgggtgtg agtacttaaa caaaaagttc taatgttatt agatgetgea aggccgcagt tatgagtttc cgactcaaaa agatgetgag agacggtaaa aegagettat tacgggtact aaacgatcca gaaatcaacc attgccaccg 16560 16620 16680 16740 16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660 18720 452 200813222 accattaacg aataccgaaa agctcgttcg cacagccatg gataataaag aaaggcacag gctgttcgca gaattaacca caactgccat aaggcgacta caaggctctc cagcaattaa gtgatgttcc accagcactg tttactcagt gctttatgtg ggtgcagcta atgtacgcca aagctagaaa actcaattag gctttaggct gggcatgcgc gttgatttat gcggcgttca tatgatgctg gttgaagcaa cctaaaggca gctccgctta ggtatgaacg gaaaaatcat gttatcgaaa actgaatatg gtggctcaag ggcagcttag ttagccattc atggccgctg caacatcaag agccaaaacg tctctaagcc cacgcccatg gttttggtgg atgagaaata cagccttgat ataacagcag ccatagatac ctcagcttgg cagggactag aaggtaaaaa agtacgtcaa tcaaggccga cgattccagc ataacgcgca ctggtttcag ctgctggcgt tggcttcatc ttatcttgcc cctgtatctg tgattgctgg ttaaagccat aaaaaccttt tctctaatgc aacagcacat gtgcccgtgt cgctaggtaa atagcgatgt ctgaagttga tcaagttaac tagcaacagg tgccagttga ttgaagttgc cttctcaagt aagcgttctt cacaacagta ctggacatgc ctcaaacact cattaagcat aaaccctaag gatgcctcgc aactaacttc ccgtcaacgc tgcagaagtg cattgaacaa ttcagcagcc tttagcgtta ctaccgctct agcgactaac catgggtatt taaagtattc ctttgaaaaa aagcgccatt tgcggatatg tatctctaat agcagttgat agccaatgaa tgagtttgat cccaacggac tgcgcttcct tgcaaaggca gacaggtgaa gttgcaatca atttgttgag taaagctgaa gcaattacgt cccttaccaa tgcgtcaaac ccaagtcact aaaagtagta cgcatctggc aatagcacct taatgcacaa tggtgacacc tattcctgag acaaagtcat gctgactggc cttaatgttg cctgacggca cacttagtat caagtggctc aataagctaa gctgaacttg cgtttaggtc aagcagctta tcagcactca gcaccgaaag gaagtcgctt gcaagctttg gcagataaag ggtgtaatga tttgcaggtc gacgattact aaagatggca gctgatgctg ggcgtgaaag tcttgtgcaa gtatcaggtg attgataaag aagcatcctg gtgcgtttca ttcggaccta gctgtatctg gtcgctgcta gctgaaatcg cacatcagcg tcacaaatcg gagaaaatcg gcaacagcag caaatgcaag cagcaagccg tttacacacc agcctacaac actttgttcc caagcaccag aggattcacc ctcctcgccg tagaagaata aaagcttatt ctgcagacat ctcgcattgc ttgtggtatc ataatgatgt tcacgattaa ttgcagcatt gtcacttccc ataaaacccc atgcacaagc gcatgagcca acagctttgg accagttatc atgagctaga caaacagcga tcgctaacta atgcagccaa ccttccatac ctaaatttac ctgatgctaa ctgaccaatt agaatatttt tgattagcat tgcaacttag cagcccctgc caccaactcg ttgaaacgat tggaaaaaga tgcctaacgc ttcaggcaac ctgatttaca taatggccga gttcaatgga ttgagcagca ctacaacaac gtttttcgtt tgctggtatt cacccctgag aatgagtgct cagcgcgctt taaactatat aagccttaat tgatgcatgg tgcaaaccaa gtttgcaggt tgaaatgcgt gctgtctcag agctttactc ataccaattg tgaactgtcg atttgctcgt taaaggcacc taacatcgcc caactctgcg agccattagt tccacttgtt tgccagcaaa atcaattaaa aaacaatatg acaaaagctg taaccctaat cgtattaggc tgtaccaaaa tgccaagatg tgtagagaaa agttatcaaa cgctgcacca gcctgtagct tcagcaattc gcaaagtaaa gctattccac agcacaatca gccagctgtt 18780 18840 18900 18960 19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980 20040 20100 20160 20220 20280 20340 20400 20460 20520 20580 20640 20700 20760 20820 20880 20940 21000 453 200813222 aatgctccta gagttaatgc gcctatcact gaaaatccag tagttgctgc gccagtcgtt gaagctgtta aagtagccgc tacggttcaa actccgacgg cacaagctcc agctgttcaa gcgtcaatta ctcaaactgc tgccaaacca gccgctatgg ccgctccagc gccacgtatt gaaccagtaa aagcaactgc cccagttgca gctcctgtcg ttgcgccagc agttgcagca gcacctgcag gtttaagcgc agaaacagtt ctgaatacta tgttagaagt ggttgcagaa aaaacaggtt acccaactga aatgcttgaa ttaagcatgg atatggaagc tgatcttggt attgattcta tcaaacgtgt tgagatctta ggtactgttc aagacgaact gccaacacta cctgaactaa gccctgaaga tttagccgag tgtcgtacgc ttggtgaaat cgttgactac atgaactcta aacttcctaa aagtgacgct tcaggaactc aaacgcaagt cgcgccagtt caagcagcat caggccttag cgctgaaaca gttctgaata ccatgcttga agtggttgct gaaaagaccg gttacccaac tgaaatgctt gaattaagca tggatatgga ggctgatctt ggtattgatt ctatcaaacg tgttgagatc ttaggtactg ttcaagacga actgccaaca ctgccagaac taagccctga agatttagct gaatgtcgta ctcttggcga aatcgttgac tacatgaaca gcaagcttcc tgctgctggc tctactccag ttgcatcacc agttcagtct gcggctccgg tatctggcct tagcgctgaa acagttctga ataccatgtt agaagtggtt gctgaaaaga ctggttaccc aactgaaatg cttgaattaa gcatggatat ggaagccgat ttaggtatcg attcaatcaa gcgtgttgag attctaggaa ccgttcaaga tgaactgcca acactgccag agcttagccc tgaagattta gctgagtgtc gtactcttgg tgaaatcgtt gactacatga actctaagct tcctacaagt tcagccgcag gcgctaatac acaggctgta gctccagttg ctcaagaatc aggtttaagt gctgaaacag ccttgagcgc gcaagaagtt caaagcacta tgatgactgt agttgctgaa aaaaccggtt acccaactga aatgcttgaa ttaagcatgg atatggaagc cgatttaggc atcgattcaa tcaagcgagt tgaaattcta ggtacagttc aagacgaatt accaacacta cctgagctaa gtcctgaaga tctagctgaa tgtcgtactc ttggtgaaat cgtatcttat atgaattcta agttacccgc cgcaggcgct atgaacagca cagccgttgt agctcaagct tctggtttaa gtgctgaaac agccttgagc gcgcaagaag tacaaagcac catgatgact gtggttgctg aaaaaaccgg ttacccaact gaaatgcttg agctaagcat ggatatggaa gcggatttag gcatcgattc aatcaaacga gttgagatct taggtacagt tcaagatgaa ctaccaacgc taccagagct taaccctgaa gatttagctg agtgtcgtac ccttggcgaa atcgtgagct acatgaacag caagcttcct gctgtcagtg cgacaactgc cgcagggact caaacacaag cagccgcagg cgctactcaa gcttctggtt taagtgcaga gcaagtgcaa agcactatga tgacagtcgt tgctgaaaaa accggttacc caactgaaat gcttgagcta agcatggata tggaagcaga tttaggcatc gattcaatca aacgtgttga aattttaggg acggttcaag acgagcttcc aggcttacct gaattaaacc ctgaagattt agcagagtgt cgcaccctag gtgaaatcgt tagctatatg aacagcaaac tttcaacaag tgcagctgaa ggctctcagc caacgctaag ctcaactgac acttcaccag caacagccac agctgagtta gcaacagact tacctcctca tcaggaagtt gctctaaaaa agetaccage ggeggataag ttagttgacg ttttttcaaa agacgcatgt 21060 21120 21180 21240 21300 21360 21420 21480 21540 21600 21660 21720 21780 21840 21900 21960 22020 22080 22140 22200 22260 22320 22380 22440 22500 22560 22620 22680 22740 22800 22860 22920 22980 23040 23100 23160 23220 454 200813222 atcgttatca atgatgacgg ccataacgca ggcctaaccg tcgccgttat tcgtagccct agcagtgata ttgccagctt cactttatct attgctcaaa ttagcaagca acataagatc acagcacaag gtgctttgcc attaagtgat ttgatggcta aacacctaca gaaaccattt tttatgactg ttagccgcat tgatggcgga aaggctgagc taaaccaagc tgcattatct ccaactgtgt tctgtagagc attggatatt - caagccgtta ttgaagagtt atttgatctt gaccaaggtc gtcatacctt atctgctacc tcattaaaca atgaagatac agtgttggtg tgtgccctta cccttgcgaa acaaactcag # catttagccg gtaatttacc gacttgggct gctgcaattg gatttattca atctcaaggt ttagtttggc cgattaccag cagtttagaa gtcggtgcaa gtgctgaata catcagcatg tcacttgctg gcctcaaacc gattacaggc aaacacattc aagacaaaac attagctgag ggctttgccg gcatcatcaa tgcgattgat tcatcagcag cgggtttcta tggcaacact atcctaaaca agacagcact acaacttgca tttaactggg gaccttggga cggcggtatg gagcgcggcg tatacgttat tccactcgat ttgtctgaat ctggcgtaca gctattaatt ’ gctaaaacag gcgcagctgt aaaaaagctt tcgctgattc tttcttttac tgctccagat gaacgagtac taaacccagt tgcaatgccc ccagtactgc caacagtgtg cgctatacaa ^ ggcctacctg tgacggttca agattataaa gagccacaag tattaacgct gacattgacg gcgagtcgta tgcaaagtga tgccgttgat ctgattgtta acgagaagat tgttaacgag ctaccaactg cagcaaaaaa tgcgcagcaa gatagcgagc tatatagcaa tggcagctta cagttgttaa ttgccaacga tgagcaattg gctgtagatt gcgcaagctt tacaccgcaa gaagacttac ttttacaagc catgttagtg ggtgttttag ctgaaaaatt agtagcaaca 23280 gagtcagtga catctgcgca atcaccgctt 23340 gcggtcaatg acgacgcgat tagcgatgtc 23400 gccggctttg ttcacctgca acctcaacta 23460 gcaggttttg tagcagtgga gcaagctttc 23520 getgagetag ctaaaactga gegegtaage 23580 tttggttact taaacagtaa egaaettgea 23640 ggtttaacta aaacattagg tcatgagtgg 23700 accccaagct ttgaggcagt tgagttagca 23760 gatactgcaa ctgctgaagt gggtattagc 23820 actgcagctc aaacccgtta ccaaaccaca 23880 actggcggag caaaaggcgt cacattcgaa 23940 tcacacttta tettageggg tcgcagtgag 24000 caaggcaaac aggetaaaga attgaaaget 24060 aataagccaa caccaaagca aattgatgee 24120 attgateget cattagcagc atttaaagct 24180 gatgteaget cagatgcagc catcaagcaa 24240 atcattcatg gtgcgggggt actcgccgat 24300 ttaggccgtg tatatggeae taaagtctcg 24360 gcaagtaaat tgaagctagt tgctatgttc 24420 ggtcaaagtg attactcaat gtegaatgag 24480 gcgaactacc cgcaagcaaa agtgatgagc 24540 gtcagttcag cgttaaagaa aatgtttgtt 24600 aaaggcgcaa acttgtttgc tcacagccta 24660 ggttcaagta tgcagggctc aagctcagca 24720 aatgcggact ettegettaa tgccgagggt 24780 aaccgtgttg ttaacaacgc ggttactgtt 24840 ttccttgaag atcattgcat cgcgggtaat 24900 tggatgcgtg aaactgcgca aaaactgtgt 24960 ttgctgaaag gcattatttt cgagactaaa 25020 caaacagaat caggcttaaa agcactgatt 25080 agettgetta gacctcagta tcaagcaaac 25140 aaggttgcta aagaagcggt ttcaaccacg 25200 ttagcaagct caggtaaagt cattagcact 25260 ttccacggcc ctcgccttca aggaataaag 25320 gtttgctcag ttgagttgcc tcaaattacc 25380 acaggtttag gtggtagtca ggctttcgct 25440 tgggcgcgta tcaaacacga tgeagegage 25500 455 200813222 ttaccgtcaa tacttagtgt tatcatcaag agcttgaatg tgagtaatca tggttgcgaa gctttgcagc ttgaaattga ttagctttaa tactcagtca aacatcgttg gtgcaataaa atgcgactca gcattgccac actggttcac agcaacacag atgacaatcg tgcaagcatt ccgctatctc cagttgttat cgattggtaa ttgaacacaa ataatggcct aactgccgcg ccatgctgca gtgaactagc atttcggcat ccagtcttga tttttaccac atggcgaaga aagtattagc ttgcaggctg cagcgaatcg aagcctttta ttaaatttat catccattgc gtcatttagg ccattggtga taactgtgct atggccgctt aggccttttt actgcctcct tgagcaagtc gattaagcct tgtatcaagc tgactatttt ccctgaatta ccatcctcat tgcggcttta attaacttgt tcgcagtgtg tgaaatgcac tgcagtcttt actatttttg aagcagtcaa cttcatgctt ggcaaattca agctgaagcc aaccccgtca gtgttttgtt ctactttcca agcggatagt tattgcaggt taagcctaac tgtgtggaaa tgacatttcg cattgtttgg tgatttccca tgaggaaagc agtaaccgca tcagcagcct cagcgctgca tgataccttt cgcctcgctt attaaccaca taaaagtact aagctgcact agccccagcc tcaacgtctg tcattcgcaa tgctcattag ctagatgcga gctcaagcca ccgtatcgct gcctacttaa gttcaagcca tataaagata ccaaatacag caaaatcgcg gtccaaggca cctgtatcag ttggctgcgc agccagctaa gtgactaatg actgcggcaa ggaagctgct taccctggcg gcattatttg atttatgctg gtaggcgcaa tttgccatgg acaccccaca ggccgcttag aatagctttg cgtgcatacc tgtaaagcgc atgcacacta ttgcatgagc agccaatcgc tgtcagccgt tttgtcgaaa tacgccccat agccgttcat atgctaagcg aaagcattag ctattaaaag catcttcagg ctgaggccat gtttgagtga tcatccatat tattaatgat ccggtttggg agcgtgcaca agtttgccca tttcagaaaa ttgccagctt ctgagcttgc ccaatgacct tgcctgcaca agcaatttga cagtaagtga atgaagttca ttcatctcac tgggcacggt cccagctaga aaaatgctaa gttacatcct gttactcaat atatgattga actgcgttcg tggttcgtgc ttgctatcat tacttaaaca aacctgcgat aagatgttat cgattaattt tagattttac tcggcgctga tcgcctcggg tgactgctga caaaaacgac ctgatttgca catgcgaata caatgatttt tggcgcttca aaacgctgtt cgagcaacaa gccagcgatt tgaagctgat cattaaacct gttggttatg tcagtcagct taattttagt tcaagcaagt tggaatgatg acatgacaag tcagacccag aatcaatgtc agctaaaagc ttcagataaa atacccgcaa gcgcgatggt aaccactgac aaccaaagtg gggcgaggca agcaacgcaa tcaagcatgg agcgcctgct ccaaggtgat aattggtaaa gcttattcga tgcacctttc aaccagtgaa acaattagtc cagacaaacg tgataaaggt tattgcgctt catcagcaaa ggagtctgtg gccttaaaga agtgccaata gcaattgatc aataaagcac catacggttt gtggcggcta gatatgccaa actcatgtcg ctgataggca gatgctcaat gaaggcaata tctttggtag aaacagcagc agtgacagtt cctttatcgg atgcttagca aacttaagca gtacttggca atgtttgctc gatgtcaaag atgagettag ctcactgagc tcaatgtggg actaacagta cagctagaac gatategaaa acttgtgtgc cgtggcatag gacaacgtac gcaagccaaa gegattgeaa aataatgeae acaacactga 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360 27420 27480 27540 27600 27660 27720 456 200813222 ttgacaaaat ctcgcgtacc tctgaaatgg cgcaaacatg ccaagccatt tcagtgaatg caaaaggcga tgaccaaact gcgctactta aatgtattgc tcaactgatt actcataaaa ccccaatttc gctcgattat cttactgaga ccttgtcgag tttactgacg acaacattgg cggcagaaaa acgaagtaat caccacacag gcaatatgtt ggcccctcaa ttagaaggag aacaatcttg agttctcaat caactaatct aaatacaaca gtcccaaaga ttgccattgt aggtttagcg actcaatatc ccgatgcgga tacgcccgct aaattctggc aaaacttatt agacaaaaaa gactctcgaa gcacgattaa cagccaaaag ctcaatgcaa acccagctga ctatcaaggt gtgcaaggtg agtctgaccg tttttattgt gataaaggcg gctacattca aaacttcagt tttgatgcta atggctatcg tattcctgcc gagcaattta gcggccttga - tgacagtttt ttatgggcaa ccgatacagc acgtaaagca ttgaatgatg ctggtgttga tattacaaac ccacaaaaca atggcgcatt aaaccgcacc ggtattgtca tgggaacact ' atcgtttcca acggctaaat ccaatgaact gttcgtaccg atttatcaca gcgcagtaga aaaagcgttg caagataaac tgcaacaacc aagtttcaca ttgcagccat ttgatagtga : aggatatagt cagcaaacaa cgtcagcttc tttgtctaat ggcgccattg ctcacaatgc atctaaacta gtcgccgatg cgctaggctt aggtgcagcg caattaagcc ttgatgctgc ttgtgcaagt tctgtttact cattaaagct tgcctgtgat tatttgcata ctggcaaagc tgacatgatg ttagctggcg cagtttctgg cgctgaccca ttctttatta acatgggttt ctccattttc cacgcctacc ctgaccacgg tatttcagcg ccatttgata gtaattcaaa aggtttgttt gctggtgaag gtgctggtgt tttagtcctt aaacgccttg aagatgctga gcgcgatggc gaccatattt atgcactcgt tagcggtatc ggtttatcaa atgacggcaa aggccaattt gtattaagcc caaacagcga cggccaagtt aaagcattcg aacgtgctta tgctgatgct gctatgcatg atgaaaactt tggcccaaac aacatagaag tgcttgagtg tcacgcaaca ggtacgccat taggtgacaa agttgagctg acgtcaatgg agcgcttttt tagcgacaaa ctcaatggca gtaacacgcc gttaattggt tcagctaagt ctaacttagg ccacttgctg actgctgcag gtatgccagg gatcatgaaa atgatttttg cgatgcgcca 、 aggtgttctg ccgccaagta ttaatattag cgcaccgatt gcttcaccat cagaaatgtt tggccctgca accttaccta atgatgttct cccttggcct gataaagctg gcaatacagc ccgccatgcg ggtgtgtcag tatttggttt tggcggttgt aatgcccatt tattagttga gtcatacttt gcgaagagtc atggccagcc ttctagcaca gagttagtta aaccagcgac aacgaccatc aatgcgcaaa tgccaatgca cattaccggt atggcatcac actttggttc gttgtcgaac gtaaatgact ttgctgatgc ggtaaataac aatcaaaccg catttacctc attgccagct aaacgctgga aaggtttaga taaacaccca gagttattac aaaaattcgg actgagtcaa gctgcgccaa caggtgctta tattgatcaa tttgatttcg acttcttacg ctttaaagtg ccacccaatg aagatgaccg tttaatctcg cagcaattgt tattaatgaa agtagcagat gaagccattc atgatgccaa acttgagtca ggtagcaaag tggcggtttt ggttgcaatg gaaacagaac ttgaattaca tcagttccgt ggccgcgtta acttacatac ccaaatagct gccagcttaa cagcccatgg cgtgagctta tctgatagcg aataccaagc attagaaacc attgcgatgg acagcgtgtt agatgccgcc aagcttaacc aatacaccag 27780 27840 27900 27960 28020 28080 28140 28200 28260 28320 28380 28440 28500 28560 28620 28680 28740 28800 28860 28920 28980 29040 29100 29160 29220 29280 29340 29400 29460 29520 29580 29640 29700 29760 29820 29880 29940 30000 457 200813222 ctttattggt aatattatgg cgtcacgcat ctcatcatta tgggatttta atggccctgc ctttacgatt tcagcaggcg agcaatcagt taaccgctgt attgatgtgg cgcaaaacct actggcgatg gagtctcgtc aagagcctct agatgcagcg attattgccg cagtggattt atctggcagt attgaaaata tcgtgcttaa aacggcgaac attaataaaa caggctcaac tgaagcactc aatattggtg aaggggctgg cgcaattgta ttgcaagcag ccgctattga tagcgagcac tgcgacctaa tacatcaagg tttaggcgcg ttagatacgc tagattcagc aagcacccac agttatggca ccatcgacag tttggcattt ggtcatacag accagctttc aaccattagc gatgacgtgt taactcctgt tggattggct gcaactgata ttgatttatt agagttaaac caagcacctg atttgctcaa tattgataat gcgcaaatgc tatcgcagct atttaaccaa tcgagcacca gcaaagcgca atcttgtatc gggcacactt ttgccgcttc cggtattgcc agcttattgc atggcttatt gaaaactcga ttgaatgctt ctgtgcagaa cgctaactcg gatagcaaac tgagcaataa gcccaaccaa aaggccataa tcgctacttt gagcgaaaac cagtgttcgc agcttcttat cagccaaaac gctgaacaag caagcgcgat gagcactcgt attgacactg atatacaagc gcaaacggcc aagaaattga gcctagttaa gcaagtcagt ttaggtggtc gtgacatcta ccagcatatt gttgatgcgc cactggctaa cattgacagt attagagcga aagttgccaa gcttaaccct gttgcaccta caactgtgat gaacttacat gaccgcggcc aatttatcgc gccagctcat gccaattcag cgcctatgtc cgctaacaat aattcaatga ctacagagac ttctatgccg ttttctgatc gttcaaccca gtttaaccct acacctaaag tggctacgcc tactgcactt tccactcagg cagctcaggc aactcagtca gctcaaacgt cttcagtgac gagctctgtc gcagcaatta gccaagtgcc acctacgcat ttaagcgctt ttgagcaaaa ccaatggtta gcacatcaag cgcaattagc atttttaaag agccgcgaac aaggcttaaa agtcgctgat gcacttttaa agcaagagat tgcacaagca aatggtcagc cttatgttgc ccaatcgacg gcacaagctg tagcgcccgt ccaagcggca aacgtgttag cgcagccaat agcatctgcg tcaatcttgc gtccagatca tgcaaatgtg ccaccctaca cagcgcctat cccagcgaat aagccatgta tttggaacta cgctgattta gtagaatatg ccgaaggtga tattgccaaa gtatttggcc cagattacgc cgtgattgat aactactctc gccgcgtacg ccttcctaca actgattact tattggtatc tcgcgttact aaactcgatg caacaatgaa ccaatataag ccttgtagca tgaccacaga gtatgacatc ccagaagatg caccttactt agtcgatggc caaatccctt gggcggtagc cgttgaatca ggccagtgtg atttaatgct gatcagttat ttaggcattg attttgaaaa caaaggtgag cgtgtttacc gtttacttga ttgtacgctg accttcttag gcgacttacc tcgtggcggc gacacattgc gttacgacat taaaatcaat aacttcgcta agaatggcga gacactatta ttcttcttct cctacgaatg tttcgtcggc gataagatgg tcttaaaaat ggatggcggc tgtgctggct tctttaccga ccaagagtta gatgacggta aaggggttat ttacaccgaa gatgaaatca aaacccgtga agcggcgtta aatacgccaa acaaaccgcg ttttgaaccg ctattacatt gtgctcagac tcaatttgac tatggtcaaa tccatcattt actcaatgct gatattggca gctgttttgc tggcgaacac cataaccacc agcaagcatc 30060 30120 30180 30240 30300 30360 30420 30480 30540 30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 31620 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 458 200813222 aggtaagcaa gactcattat gttttgcctc tgaaaagttc ttgatgattg agcaagtggg caatttagaa gtccatggcg gcgcttgggg cttaggcttt atcgaaggcc ataaacaatt agcacctgat cattggtact tcccttgtca tttccaaggc gaccaagtaa tggctggctc attaatggct gaaggttgtg gccaattatt gcagttcttc atgctgcaca ttggtatgca caccttagtt gaaaacggac gtttccagcc tttagaaaat gcttcacaaa aagtacgttg tcgtggccaa gtactgccac aacatggtga actgacgtac cgcatggaag tcacagaaat tggtactcac cctcgcccat acgccaaagc caatattgaa atattgctca atggtaaagc ggtcgtggac ttccaaaatc ttggggtgat gattaaagaa gaaggtgaat gtactcgtta cactgccgac tctactgaaa cacatacaac ctcaggcaca gtccaaaaaa acaacagcca * caacacacca gcatcattaa atgcaccgtt aatggcacaa gtgccagact taagtgaacc agccaataaa ggcgttatcc cgctgcaaca tgttgaagcg cctatgctgc cagactaccc ' aaatcgaacc cctgatacgc tgccgttcac cgcgtaccat atgtttgagt ttgcaacagg tgacatcgaa aactgttttg gacctgactt tagtatttac cggggcttta ttccgccgcg ’ cacgccatgt ggtgacttac agctaacaac ccgtgttgtt gatattcaag gtaaacgtgg cgagcttaaa aaaccgtcat cgtgtatcgc tgaatatgaa gtgccaaccg atgcgtggta ttttgctaaa aacagtcacg cttcagtgat gccttactcg gtattaatgg aaatatcact gcaaccaaac ggatttattt cgggttacat gggcacaacc cttggtttcc cagggcaaga gctattcttc cgtaaccttg atggtagcgg tgagttattg tgtgatgtag atttacgcgg caaaaccatt gtcaatgatt ctaagctatt atctaccgtt attgccggca gtaacatcat ccaaagtttc agctttgatt taagtgttga tggcgagcct ttctatactg gtagcgctgt atttggttac tttaaaggtg atgcacttaa aaaccagcta ggtattgata atggccgtat tactcagcca tggcatgttg aaaataacgt agcggctgat atcaccgttg atttgcttga taagcagtcc cgcgtattcc atgcaccagc aaaccagcca cattatcgtt tagctggcgg tcaacttaac tttatcgaca aagctgaaat cgttgataaa ggcggtaaaa atggtttagg ttacttgtct gcctcacgca ccattgaccc aagtgattgg ttcttccagt tccacttcca ^ tcaagatcct gtgatgccag gttcattagg cgttgaagca attatcgagt taatgcaaac ttacgccatc agtaaagacc taggtaaagg tttcactaac ccgaaatttg gtcagatttt gtctgacatc aaatggaagt accgtggcca aatcaaccca ctaaataagc aaatgtcgct ggatgtgcac atcagtgcag tcaaagatga aaacggcaaa cgtatcattg tgggtgacgc . aaacctcagc aaagacggtt tacgtattta cgaagtaaaa gacatcgcta tctgtatcga agaggcataa aggaataata atgactatta gcactcaaaa cgaaaagctt tctccatggc cttggcaagt agccccaagt gatgccagct ttgagaatgc cgctatcggt aaaaaattaa aagaactgtc tcaggcgtgt tatttaatta accaccctga aaaaggctta ggtatttcgc aaaacgcaca agtaatgact gaaagcatga acagecagea agacttacca gttagtgcat ttgcacctgc tttaggcact caaagcttag gcgacagtaa tttccgccgc gttcacggag taaaatacgc ctactacgct ggcgcgatgg ccaatggtat ttcatctgaa gagttagtga ttgeattagg ccaagctggt attttgtgtt catttggcgc ageaggatta attccatctc gcgtagaaca agccattaat cgcattcaaa cggcgctacc caatggcccg tacatgttta 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540 33600 33660 33720 33780 33840 33900 33960 34020 34080 34140 34200 34260 34320 34380 34440 34500 459 200813222 acttaatcca cagcccaagt gagccagcat tagaacgtgg cagtgttgag ttatttttaa aacataaagt gcgcacggtt gaagcatcag catttttagg gttaaccccg caaattgtct attaccgcgc tgcaggttta agccgtgatg ctcaaggtga agtggttata gccaacaagg ttatcgctaa agtaagccgc acagaagtag cgagtaagtt catgcaacct gcacctgcta aaatgctgca aaagctggtt gatgaaggct taatcacacc tgagcaaatg gagctcgcac aattagtccc aatggcagat gatgtgacag cagaggctga ttctggtggt cataccgata accgtccatt agtgacgcta ttgccaacaa ttttggcgct taaagataaa attcaagccg agtaccaata caagacgcct attcgtgtcg gttgcggcgg cggcgtggga acacctgatg cagcattagc gacctttaac atgggcgcag cgtatatcgt taccggctca atcaaccaag cgtgtgttga agctggtgcc agtgaacata ctcgtaaatt attagcgaca acagaaatgg ccgatgtcac catggcacct gctgctgata tgtttgaaat gggcgttaaa ctacaagtgg ttaagcgcgg tacactattc ccaatgcgtg ccaacaagct ttatgagatt tacactcgtt atgaatcaat tgaagcgatt ccagctgaag aacgtgaaaa actagagaaa caagttttcc gttcaaccct tgatgatatt tgggcaggca ctgtggctca ctttaacgaa cgcgacccta agcaaatcga acgcgcagaa ggaaacccta agcgtaaaat ggcactgatt ttccgttggt acttaggttt atcaagccgc tggtcaaatt cgggcgaagt cggccgtgaa atggattacc aaatttgggc aggtcctgca cttggtgcgt tcaatgaatg ggcaaaaggc agctatttag atgattatac ccagcgaaat gcggtagact tggccaaaca cttgatgcat ggcgcagctt atcaagcccg cgttaactta ttaactgctc aaggcgtggc actgccggtt gaattgcaac gctggagccc gctagatcag gttaagtaac ggacgttgta gctttataac gtcagcagtg atactcgcca tattgcgatc aagttaacca ttactattgt gccactcact caacatgagt ggcacattga tatttagttt gcagttaggt aacagtatga gcgaaaccca aaagttagat ttttcagcgg taaatggcac aacactagcc tcgtttaatc agcataaaaa cttgatcaaa cgtatgctaa aaggcaacag cgctgaatgt agcgagtgta aaaaaccact cactttgcaa ttaccgccta acattaagaa cgctaaacca agtgataaag caccaggcat atattgcgca aaaggctgta ccgatatcga gctagatatg gaagcagtgg cattaatgaa gtagccgaag ataagaacac agttctttag gtataagcct ttataagcac aattacgaag caccttatgg gtgcttttac ttttcctatc ccaccaaaga tattgtttta actaacttaa gaagggttag tatgtggcat aactaactca gctaaccatt cataatattt ttcattccca tgaatccaat ccacttgtcc atttgaataa gttattgggc tgataaattc atgaaagtca taaccttctt cgataaaaat acgagcagca ttgacaaacg ttatatcaaa ttgtgctagt acgtaatcta tcgcctcaaa atatgcaaaa ataatatttg ccataggttt agcttcttca acaaatttac taaaaggagg atctgaaaca acaattactt tatggccaat acttttcaat ttgatcaaaa tagataattg atcctgaatg tcatcatgaa agtaatctac aaattcctta gtctcaatat tactaatccc ttgtggatat tgacgtttca cccagtctac aaatctagct gcactttgat gtgtctgtag acccacatta catataactg tagattgact aaccgtttta ttattttcat gtatagataa gttatttaat acatctttcc aaagtgttct agacgctgca ctttctaaag 34560 34620 34680 34740 34800 34860 34920 34980 35040 35100 35160 35220 35280 35340 35400 35460 35520 35580 35640 35700 35760 35820 35880 35940 36000 36060 36120 36180 36240 36300 36360 36420 36480 36540 36600 36660 36720 460 200813222 gcacgaatat ctcagtatca catatagcaa acttcttttg cgcgaaccct gatccattca ttatcattcc tcctgtatga ggaatattcc ttaatttcat tgcattagaa agttttccca tatgactatc accaaatatg gaaatggaat ccccgtcatt cgatagttgt ttagagttca actttctaga agcttgtaaa aactcttcat cgcaaactac ttcatcactt actgttttat caactttatc ggtaattgaa atatctttac ttaatgtttc accaaaatgc ttcatgacat aactgaccat ctctgctgta acagttctta gattttcctt aaatctatag tctgtagaaa tgggtaatgt aactaattca taagaaggaa aataactaaa tactgcctca tattcactta gttcacctgc aacagctcgt aatgtcgact tagagtattg gttagcgatt gctatatgat ttgacgtagc tgtagctgtt aatggtacgg gtgagacagt gagtacaatc tgaatgttag 二 gatttataca ttctacaact ttagctattt ctttaagatc attttgaatt tcagcgaatg taaaattatg aaaattataa tttttttgtt tatattctcc ttggataacc ccgggacaac • taggatagca aaccccattt atatcaaacc atgcttctgt taatcccaat gtaaaaatta acacatcagt cttcgcaatt gtttgcttca tttcatcaac ggcagctttt cttgcctgaa ’ I ttaaagcact ctcggatgag taacctaact cgttatataa aggtcttagc aaatcataga atcttgtttc attgtgataa attgagtgat ctgtcttgaa gctctgatta tcacaattaa gccactgtaa aaaacacctt ggcgtataaa catttccaaa agcaaaacta gatacattag cttcgtctaa ttcactttga ttaaaattaa aattattgtc atttagccac ttaccgacat gctgagcaaa acatgaacca actgacgata ttctgggcac attagttttg aaatttatat caaccaaatt agatattgtt tcttcaaaat agttttgaga aacaacgcca gttttccaaa agtgctggga agctttatgt gtataaggtg tcaatttaaa ctccaaaaat gatatggtta agctcatagt caaattagtg actttcatta aagtaagcat tatatatgcc atttaaatac taactataaa actgaaattc gacttgccac tcacccacca aatagccttg ctaaatctat tcctctcgtc ataaagtctc atttttacca acaaaaataa tgcgttaaca tttttttgac ctgtatcaat aataagtctt attagctaag gcactatgcc tcattatttt taatgtggtt atatttttta tgagtcaaat caaggctaac aacaatattg agcaagcgct aactgacaat / \ tgcattcttt tgtcgaccac agatctgaat ggcaacataa aatacgccaa taaagcattt gccgatattt cagaatacag cactgaagag ctacatggac agcctcataa tattgttcgt caccctgata tgcctaaagc tgcatttaaa gcactttggg atcgtgtaaa agatggcaaa ccatggtgtg gcatcgttaa aaataaaacc aaatctggca aatattactg ggtgaatgcg _ tatatttcgc cagtttttga aaatggccgt ttacatgaac ttcaatcaat cagacgtaaa ccatgtcagg cacatatcaa atcagctgaa agcatctacc aacaacttaa tgaaggtaaa gaacctgctg cgatatcacc accactcttt agcttcacgg gtgcactctg cctatgggca gtgtttatct cgttaattgg cgttatttct tcgttattaa tgcctacgct agttgcagca ttttttatcc cgttactggc aggttttggt atttactttc taacaagacc ccttaaagaa cttgaaacta aagccaccaa tattattgat gate
<210> 76 <211> 2768 <212〉 PRT <213> 沙雷菌(Sh. olleyana) 36780 36840 36900 36960 37020 37080 37140 37200 37260 37320 37380 37440 37500 37560 37620 37680 37740 37800 37860 37920 37980 38040 38100 38160 38220 38280 38340 38400 38460 38520 38580 38640 38700 38760 38794 461 200813222 <400> 76
Met Ser Gin Ala Pro Thr Asn Pro Glu Thr Ser Ser Gin Asp Asn Asn 15 10 15
Glu Ser Gin Asp Thr Arg Leu Asn Lys Arg Leu Lys Asp Met Pro lie 20 25 30
Ala lie Val Gly Met Ala Ser lie Phe Ala Asn Ser Arg Tyr Leu Asn 35 40 45
Lys Phe Trp Asp Leu lie Ser Glu Lys lie Asp Ala lie Thr Glu Val 50 55 60
Pro Asp Thr His Trp Arg Ala Glu Asp Tyr Phe Asp Ala Asp Lys Ser 65 70 75 80
Thr Pro Asp Lys Ser Tyr Cys Lys Arg Gly Gly Phe lie Pro Glu Val 85 90 95
Asp Phe Asn Pro Met Glu Phe Gly Leu Pro Pro Asn lie Leu Glu Leu 100 105 110
Thr Asp Thr Ser Gin Leu Leu Ser Leu Val lie Ala Lys Glu Val Leu 115 120 125
Ala Asp Ala Gly Val Thr Ser Glu Tyr Asp Thr Asp Lys lie Gly lie 130 135 140
Thr Leu Gly Val Gly Gly Gly Gin Lys lie Asn Ala Ser Leu Thr Ala 145 150 155 160
Arg Leu Gin Tyr Pro Val Leu Lys Lys Val Phe Lys Ser Ser Gly Leu 165 170 175
Ser Asp Ala Asp Ser Asp Met Leu lie Lys Lys Phe Gin Asp Gin Tyr 180 185 190 lie His Trp Glu Glu Asn Ser Phe Pro Gly Ser Leu Gly Asn Val lie 195 200 205
Ala Gly Arg lie Ala Asn Arg Phe Asp Leu Gly Gly Met Asn Cys Val 210 215 220
Val Asp Ala Ala Cys Ala Gly Ser Leu Ala Ala Met Arg Met Ala Leu 225 230 235 240
Thr Glu Leu Val Glu Gly Arg Ser Glu Met Met lie Thr Gly Gly Val 245 250 255
Cys Thr Asp Asn Ser Pro Ser Met Tyr Met Ser Phe Ser Lys Thr Pro 260 265 270
Ala Phe Thr Thr Asn Glu Thr lie Gin Pro Phe Asp lie Asp Ser Lys 275 280 285 462 200813222
Gly Met Met lie Gly Glu Gly lie Gly Met Val Ala Leu Lys Arg Leu 290 295 300
Glu Asp Ala Glu Arg Asp Gly Asp Arg lie Tyr Ser Val lie Lys Gly 305 310 315 320
Val Gly Ala Ser Ser Asp Gly Lys Phe Lys Ser lie Tyr Ala Pro Arg 325 330 335
Pro Glu Gly Gin Ala Lys Ala Leu Lys Arg Ala Tyr Asp Asp Ala Gly 340 345 350
Phe Ala Pro Glu Thr Val Gly Leu lie Glu Ala His Gly Thr Gly Thr 355 360 365
Ala Ala Gly Asp Val Ala Glu Phe Asn Gly Leu Lys Ser Val Phe Gly 370 375 380
Glu Asn Asp Pro Thr Lys Gin His lie Ala Leu Gly Ser Val Lys Ser 385 390 395 400
Gin Val Gly His Thr Lys Ser Thr Ala Gly Thr Ala Gly Val lie Lys 405 410 415
Ala Ala Leu Ala Leu His His Lys Val Leu Pro Pro Thr lie Asn Val 420 425 430
Ser Lys Pro Asn Pro Lys Leu Asn Val Glu Asp Ser Pro Phe Phe Val 435 440 445
Asn Thr Glu Thr Arg Pro Trp Met Pro Arg Pro Asp Gly Thr Pro Arg 450 455 460
Arg Ala Gly lie Ser Ser Phe Gly Phe Gly Gly Thr Asn Phe His Leu 465 470 475 480
Val Leu Glu Glu Tyr Thr Pro Glu His Ser His Asp Glu Lys Tyr Arg 485 490 495
Gin Arg Gin Val Ala Gin Ser Leu Leu Met Ser Ala Asp Asn Lys Ala 500 505 510
Ala Leu lie Ala Glu Val Asn Lys Leu Thr Ala Asp lie Ser Ala Leu 515 520 525
Lys Gly Thr Asp Asn Ser Ser lie Glu Gin Ala Glu Leu Ala Arg lie 530 535 540
Ala Lys Leu Tyr Ala Val Arg Thr lie Asp Thr Ser Ala Ala Arg Leu 545 550 555 560
Gly Leu Val Val Ser Ser Leu Asn Glu Leu Thr Thr Gin Leu Gly Leu 565 570 575
Ala Leu Lys Gin Leu Asn Asn Asp Val Asp Ala Trp Gin Leu Pro Ser 580 585 590 463 200813222
Gly Thr Ser Tyr Arg Ser Ser Ala Leu lie Thr lie Asn Ala Asn Gin 595 600 605
Lys Ala Thr Lys Gly Lys Lys Ala Thr Asn Ala Pro Lys Val Ala Ala 610 615 620
Leu Phe Ala Gly Gin Gly Ser Gin Tyr Val Asn Met Gly lie Glu Val 625 630 635 640
Ala Cys His Phe Pro Glu Met Arg Gin Gin Leu lie Lys Ala Asp Lys 645 650 655
Val Phe Ala Ser Phe Asp Lys Thr Pro Leu Ser Gin Val Met Phe Pro 660 665 670 lie Pro Ala Phe Glu Lys Ala Asp Lys Asp Ala Gin Ala Ala Leu Leu 675 680 685
Thr Ser Thr Asp Asn Ala Gin Ser Ala lie Gly Val Met Ser Met Ser 690 695 700
Gin Tyr Gin Leu Phe Thr Gin Ser Gly Phe Ser Ala Asp Met Phe Ala 705 710 715 720
Gly His Ser Phe Gly Glu Leu Ser Ala Leu Cys Ala Ala Gly Val lie 725 730 735
Ser Asn Asp Asp Tyr Tyr Gin Leu Ser Phe Ala Arg Gly Ala Ala Met 740 745 750
Ala Ser Ser Ala Val Asp Lys Asp Gly Asn Glu Leu Asp Lys Gly Thr 755 760 765
Met Tyr Ala lie lie Leu Pro Ala Asn Glu Ala Asp Ala Ala Asn Ser 770 775 780
Asp Asn lie Ala Lys Leu Glu Thr Cys lie Cys Glu Phe Asp Gly Val 785 790 795 800
Lys Val Ala Asn Tyr Asn Ser Ala Thr Gin Leu Val lie Ala Gly Pro 805 810 815
Thr Asp Ser Cys Ala Asn Ala Ala Lys Ala lie Ser Ala Leu Gly Phe 820 825 830
Lys Ala lie Ala Leu Pro Val Ser Gly Ala Phe His Thr Pro Leu Val 835 840 845
Gly His Ala Gin Lys Pro Phe Ala Lys Ala lie Asp Lys Ala Lys Phe 850 855 860
Thr Ala Ser Lys Val Asp Leu Phe Ser Asn Ala Thr Gly Glu Lys His 865 870 875 880
Pro Ala Asp Ala Lys Ser lie Lys Ala Ala Phe Lys Gin His Met Leu 885 890 895 464 200813222
Gin Ser Val Arg Phe Thr Asp Gin Leu Asn Asn Met Tyr Asp Ala Gly 900 905 910
Ala Arg Val Phe Val Glu Phe Gly Pro Lys Asn lie Leu Gin Lys Leu 915 920 925
Val Glu Ala Thr Leu Gly Asn Lys Ala Glu Ala Val Ser Val lie Ser 930 935 940 lie Asn Pro Asn Pro Lys Gly Asn Ser Asp Val Gin Leu Arg Val Ala 945 950 955 960
Ala Met Gin Leu Ser Val Leu Gly Ala Pro Leu Thr Glu Val Asp Pro 965 970 975
Tyr Gin Ala Glu lie Ala Ala Pro Ala Val Pro Lys Gly Met Asn Val 980 985 990
Lys Leu Thr Ala Ser Asn His lie Ser Ala Pro Thr Arg Ala Lys Met 995 1000 1005
Glu Lys Ser Leu Ala Thr Gly Gin Val Thr Ser Gin lie Val Glu 1010 1015 1020
Thr lie Val Glu Lys Val lie Glu Met Pro Val Glu Lys Val Val 1025 1030 1035
Glu Lys lie Val Glu Lys Glu Val lie Lys Thr Glu Tyr Val Glu 1040 1045 1050
Val Ala Ala Ser Gly Ala Thr Ala Val Pro Asn Ala Ala Ala Pro 1055 1060 1065
Val Ala Gin Ala Ser Gin Val lie Ala Pro Gin Met Gin Val Gin 1070 1075 1080
Ala Thr Pro Val Ala Gly Ser Leu Glu Ala Phe Phe Asn Ala Gin 1085 1090 1095
Gin Gin Ala Ala Asp Leu His Gin Gin Phe Leu Ala lie Pro Gin 1100 1105 1110
Gin Tyr Gly Asp Thr Phe Thr His Leu Met Ala Glu Gin Ser Lys 1115 1120 1125
Met Ala Ala Ala Gly His Ala lie Pro Glu Ser Leu Gin Arg Ser 1130 1135 1140
Met Glu Leu Phe His Gin His Gin Ala Gin Thr Leu Gin Ser His 1145 1150 1155
Thr Leu Phe Leu Glu Gin Gin Ala Gin Ser Ser Gin Asn Ala Leu 1160 1165 1170
Ser Met Leu Thr Gly Gin Ala Pro Ala Thr Thr Thr Pro Ala Val 465 200813222 1175 1180 1185
Asn Ala Pro Arg Val Asn Ala Pro lie Thr Glu Asn 1190 1195 1200
Ala Ala Pro Val Val Glu Ala Val Lys Val Ala Ala 1205 1210 1215
Thr Pro Thr Ala Gin Ala Pro Ala Val Gin Ala Ser 1220 1225 1230
Thr Ala Ala Lys Pro Ala Ala Met Ala Ala Pro Ala 1235 1240 1245
Glu Pro Val Lys Ala Thr Ala Pro Val Ala Ala Pro 1250 1255 1260
Pro Ala Val Ala Ala Ala Pro Ala Gly Leu Ser Ala 1265 1270 1275
Leu Asn Thr Met Leu Glu Val Val Ala Glu Lys Thr 1280 1285 1290
Thr Glu Met Leu Glu Leu Ser Met Asp Met Glu Ala 1295 1300 1305 lie Asp Ser lie Lys Arg Val Glu lie Leu Gly Thr 1310 1315 1320
Glu Leu Pro Thr Leu Pro Glu Leu Ser Pro Glu Asp 1325 1330 1335
Cys Arg Thr Leu Gly Glu lie Val Asp Tyr Met Asn 1340 1345 1350
Pro Lys Ser Asp Ala Ser Gly Thr Gin Thr Gin Val 1355 1360 1365
Gin Ala Ala Ser Gly Leu Ser Ala Glu Thr Val Leu 1370 1375 1380
Leu Glu Val Val Ala Glu Lys Thr Gly Tyr Pro Thr 1385 1390 1395
Glu Leu Ser Met Asp Met Glu Ala Asp Leu Gly lie 1400 1405 1410
Lys Arg Val Glu lie Leu Gly Thr Val Gin Asp Glu 1415 1420 1425
Leu Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys 1430 1435 1440
Gly Glu lie Val Asp Tyr Met Asn Ser Lys Leu Pro 1445 1450 1455
Pro Val Val Thr Val Gin lie Thr Gin Pro Arg lie Val Val Ala Glu Thr Val Gly Tyr Pro Asp Leu Gly Val Gin Asp Leu Ala Glu Ser Lys Leu Ala Pro Val Asn Thr Met Glu Met Leu Asp Ser lie Leu Pro Thr Arg Thr Leu Ala Ala Gly 466 200813222
Ser Thr Pro Val Ala Ser Pro Val Gin Ser Ala Ala 1460 1465 1470
Gly Leu Ser Ala Glu Thr Val Leu Asn Thr Met Leu 1475 1480 1485
Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met Leu Glu 1490 1495 1500
Asp Met Glu Ala Asp Leu Gly lie Asp Ser lie Lys 1505 1510 1515 lie Leu Gly Thr Val Gin Asp Glu Leu Pro Thr Leu 1520 1525 1530
Ser Pro Glu Asp Leu Ala Glu Cys Arg Thr Leu Gly 1535 1540 1545
Asp Tyr Met Asn Ser Lys Leu Pro Thr Ser Ser Ala 1550 1555 1560
Asn Thr Gin Ala Val Ala Pro Val Ala Gin Glu Ser 1565 1570 1575
Ala Glu Thr Ala Leu Ser Ala Gin Glu Val Gin Ser 1580 1585 1590
Thr Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu 1595 1600 1605
Leu Ser Met Asp Met Glu Ala Asp Leu Gly lie Asp 1610 1615 1620
Arg Val Glu lie Leu Gly Thr Val Gin Asp Glu Leu 1625 1630 1635
Pro Glu Leu Ser Pro Glu Asp Leu Ala Glu Cys Arg 1640 1645 1650
Glu lie Val Ser Tyr Met Asn Ser Lys Leu Pro Ala 1655 1660 1665
Met Asn Ser Thr Ala Val Val Ala Gin Ala Ser Gly 1670 1675 1680
Glu Thr Ala Leu Ser Ala Gin Glu Val Gin Ser Thr 1685 1690 1695
Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met 1700 1705 1710
Ser Met Asp Met Glu Ala Asp Leu Gly lie Asp Ser 1715 1720 1725
Val Glu lie Leu Gly Thr Val Gin Asp Glu Leu Pro 1730 1735 1740
Pro Val Ser Glu Val Val Leu Ser Met Arg Val Glu Pro Glu Leu Glu lie Val Ala Gly Ala Gly Leu Ser Thr Met Met Met Leu Glu Ser lie Lys Pro Thr Leu Thr Leu Gly Ala Gly Ala Leu Ser Ala Met Met Thr Leu Glu Leu lie Lys Arg Thr Leu Pro 467 200813222
Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr 1745 1750 1755 lie Val Ser Tyr Met Asn Ser Lys Leu Pro Ala Val 1760 1765 1770
Thr Ala Ala Gly Thr Gin Thr Gin Ala Ala Ala Gly 1775 1780 1785
Ala Ser Gly Leu Ser Ala Glu Gin Val Gin Ser Thr 1790 1795 1800
Val Val Ala Glu Lys Thr Gly Tyr Pro Thr Glu Met 1805 1810 1815
Ser Met Asp Met Glu Ala Asp Leu Gly lie Asp Ser 1820 1825 1830
Val Glu lie Leu Gly Thr Val Gin Asp Glu Leu Pro 1835 1840 1845
Glu Leu Asn Pro Glu Asp Leu Ala Glu Cys Arg Thr 1850 1855 1860 lie Val Ser Tyr Met Asn Ser Lys Leu Ser Thr Ser 1865 1870 1875
Gly Ser Gin Pro Thr Leu Ser Ser Thr Asp Thr Ser 1880 1885 1890
Ala Thr Ala Glu Leu Ala Thr Asp Leu Pro Pro His 1895 1900 1905
Ala Leu Lys Lys Leu Pro Ala Ala Asp Lys Leu Val 1910 1915 1920
Ser Lys Asp Ala Cys lie Val lie Asn Asp Asp Gly 1925 1930 1935
Gly Val Leu Ala Glu Lys Leu Val Ala Thr Gly Leu 1940 1945 1950
Val lie Arg Ser Pro Glu Ser Val Thr Ser Ala Gin 1955 1960 1965
Ser Ser Asp lie Ala Ser Phe Thr Leu Ser Ala Val 1970 1975 1980
Ala lie Ser Asp Val lie Ala Gin lie Ser Lys Gin 1985 1990 1995
Ala Gly Phe Val His Leu Gin Pro Gin Leu Thr Ala 2000 2005 2010
Leu Pro Leu Ser Asp Ala Gly Phe Val Ala Val Glu 2015 2020 2025
Leu Gly Glu Ser Ala Thr Ala Thr Gin Met Met Thr Leu Glu Leu lie Lys Arg Gly Leu Pro Leu Gly Glu Ala Ala Glu Pro Ala Thr Gin Glu Val Asp Val Phe His Asn Ala Thr Val Ala Ser Pro Leu Asn Asp Asp His Lys lie Gin Gly Ala Gin Ala Phe 468 200813222
Leu Met Ala Lys His Leu Gin Lys Pro Phe Ala Glu 2030 2035 2040
Thr Glu Arg Val Ser Phe Met Thr Val Ser Arg lie 2045 2050 2055
Phe Gly Tyr Leu Asn Ser Asn Glu Leu Ala Lys Ala 2060 2065 2070
Gin Ala Ala Leu Ser Gly Leu Thr Lys Thr Leu Gly 2075 2080 2085
Pro Thr Val Phe Cys Arg Ala Leu Asp lie Thr Pro 2090 2095 2100
Ala Val Glu Leu Ala Gin Ala Val lie Glu Glu Leu 2105 2110 2115
Asp Thr Ala Thr Ala Glu Val Gly lie Ser Asp Gin 2120 2125 2130
Thr Leu Ser Ala Thr Thr Ala Ala Gin Thr Arg Tyr 2135 2140 2145
Ser Leu Asn Asn Glu Asp Thr Val Leu Val Thr Gly 2150 2155 2160
Gly Val Thr Phe Glu Cys Ala Leu Thr Leu Ala Lys 2165 2170 2175
Ser His Phe lie Leu Ala Gly Arg Ser Glu His Leu 2180 2185 2190
Leu Pro Thr Trp Ala Gin Gly Lys Gin Ala Lys Glu 2195 2200 2205
Ala Ala lie Gly Phe lie Gin Ser Gin Gly Asn Lys 2210 2215 2220
Lys Gin lie Asp Ala Leu Val Trp Pro lie Thr Ser 2225 2230 2235 lie Asp Arg Ser Leu Ala Ala Phe Lys Ala Val Gly 2240 2245 2250
Glu Tyr lie Ser Met Asp Val Ser Ser Asp Ala Ala 2255 2260 2265
Ser Leu Ala Gly Leu Lys Pro lie Thr Gly lie lie 2270 2275 2280
Gly Val Leu Ala Asp Lys His lie Gin Asp Lys Thr 2285 2290 2295
Leu Gly Arg Val Tyr Gly Thr Lys Val Ser Gly Phe
Leu Ala Lys Asp Gly Gly Glu Leu Asn His Glu Trp Ser Phe Glu Phe Asp Leu Gly Arg His Gin Thr Thr Gly Ala Lys Gin Thr Gin Ala Gly Asn Leu Lys Ala Pro Thr Pro Ser Leu Glu Ala Ser Ala lie Lys Gin His Gly Ala Leu Ala Glu Ala Gly lie 469 200813222 2300 2305 2310 lie Asn Ala lie Asp Ala Ser Lys Leu Lys Leu Val 2315 2320 2325
Ser Ser Ala Ala Gly Phe Tyr Gly Asn Thr Gly Gin 2330 2335 2340
Ser Met Ser Asn Glu lie Leu Asn Lys Thr Ala Leu 2345 2350 2355
Ala Asn Tyr Pro Gin Ala Lys Val Met Ser Phe Asn 2360 2365 2370
Trp Asp Gly Gly Met Val Ser Ser Ala Leu Lys Lys 2375 2380 2385
Glu Arg Gly Val Tyr Val lie Pro Leu Asp Lys Gly 2390 2395 2400
Phe Ala His Ser Leu Leu Ser Glu Ser Gly Val Gin 2405 2410 2415
Gly Ser Ser Met Gin Gly Ser Ser Ser Ala Ala Lys 2420 2425 2430
Ala Val Lys Lys Leu Asn Ala Asp Ser Ser Leu Asn 2435 2440 2445
Ser Leu lie Leu Ser Phe Thr Ala Pro Asp Asn Arg 2450 2455 2460
Asn Ala Val Thr Val Glu Arg Val Leu Asn Pro Val 2465 2470 2475
Phe Leu Glu Asp His Cys lie Ala Gly Asn Pro Val 2480 2485 2490
Val Cys Ala lie Gin Trp Met Arg Glu Thr Ala Gin 2495 2500 2505
Gly Leu Pro Val Thr Val Gin Asp Tyr Lys Leu Leu 2510 2515 2520 lie Phe Glu Thr Lys Glu Pro Gin Val Leu Thr Leu 2525 2530 2535
Gin Thr Glu Ser Gly Leu Lys Ala Leu lie Ala Ser 2540 2545 2550
Ser Asp Ala Val Asp Ser Leu Leu Arg Pro Gin Tyr 2555 2560 2565
Leu lie Val Asn Glu Lys lie Val Asn Glu Lys Val 2570 2575 2580
Ala Met Phe Ser Asp Tyr Gin Leu Ala Trp Gly Pro Met Phe Val Ala Asn Leu Leu Leu lie Thr Gly Ala Ala Glu Gly Val Val Asn Ala Met Pro Leu Pro Thr Lys Leu Cys Lys Gly lie Thr Leu Thr Arg Met Gin Gin Ala Asn Ala Lys Glu 470 200813222
Ala Val Ser Thr Thr Leu Pro Thr Ala Ala Lys Asn Ala Gin Gin 2585 2590 2595
Leu Ala Ser Ser Gly Lys Val lie Ser Thr Asp Ser Glu Leu Tyr 2600 2605 2610
Ser Asn Gly Ser Leu Phe His Gly Pro Arg Leu Gin Gly lie Lys 2615 2620 2625
Gin Leu Leu lie Ala Asn Asp Glu Gin Leu Val Cys Ser Val Glu 2630 2635 2640
Leu Pro Gin lie Thr Ala Val Asp Cys Ala Ser Phe Thr Pro Gin 2645 2650 2655
Thr Gly Leu Gly Gly Ser Gin Ala Phe Ala Glu Asp Leu Leu Leu 2660 2665 2670
Gin Ala Met Leu Val Trp Ala Arg lie Lys His Asp Ala Ala Ser 2675 2680 2685
Leu Pro Ser Thr lie Gly Glu Leu Thr Thr Tyr Ala Pro Phe Ala 2690 2695 2700
Ser Gly Asp Lys Gly Tyr Leu Val Leu Thr Val Leu Lys Ser Thr 2705 2710 2715
Ser Arg Ser Leu Thr Ala Asp lie Ala Leu Tyr His Gin Asp Gly 2720 2725 2730
Arg Leu Ser Cys Thr Met Leu Ser Ala Lys Thr Thr lie Ser Lys 2735 2740 2745
Ser Leu Asn Glu Ala Phe Leu Ala Pro Ala Lys Ala Leu Ala Asp 2750 2755 2760
Leu Gin Glu Ser Val 2765
<210> 77 <211> 743 <212> PRT <213〉沙雷菌(Sh. olleyana) <400> 77
Val Ser Asn Gin Leu Pro Pro Ser Thr Ser Ala lie Lys Ser Met Arg 15 10 15 lie Ala Leu Lys Met Val Ala Asn Glu Gin Val Ser Phe Ala Thr Ser 20 25 30
Ser Gly Asn Asp Phe Ser Ala Asn Ser Phe Ala Ala lie Lys Pro Cys 35 40 45
Ser Leu Ala Glu Ala lie Gly Ala Ser Ala lie Asp Leu Glu lie Asp 50 55 60 471 200813222
Val Ser Ser Leu Asp Ala Ser Leu Ser Glu Asn Ala Val Asn Lys Ala 65 70 75 80
Leu Ser Phe Asn Asp Tyr Phe Ala Gin Ala lie lie His lie Glu Gin 85 90 95
Gin His Thr Val Leu Leu Ser His Pro Glu Leu Pro Tyr Arg Leu Leu 100 105 110
Met Met Pro Ala lie Val Ala Ala Lys His Arg Cys His Pro His Ala 115 120 125
Tyr Leu Thr Gly Leu Gly Glu Ala Asp Asp Met Pro Ser Ala lie Asn 130 135 140
Ala Ala Leu Val Gin Ala Lys Arg Ala His lie Lys Pro Thr His Val 145 150 155 160
Asp Ala Thr Gin Leu Thr Cys Tyr Lys Asp Lys Phe Ala Gin Leu Val 165 170 175
Met Leu lie Gly Ser lie Ala Thr Arg Ser Val Pro Asn Thr Val Ser 180 185 190
Glu Asn Gin Ser Ala Asp Ala Gin Tyr Trp Phe Thr Glu Met His Gin 195 200 205
Asn Arg Val Ala Ser Phe Asn Phe Ser Glu Gly Asn Lys Gin His Ser 210 215 220
Ala Val Phe Val Gin Gly Thr Glu Leu Ala Gin Ala Ser Ser Leu Val 225 230 235 240
Asp Asp Asn Arg Leu Phe Leu Pro Val Ser Ala Asn Asp Leu Gly Met 245 250 255
Met Lys Gin Gin Leu Gin Ala Leu Ser Ser Gin Leu Ala Ala Leu Pro 260 265 270
Ala Gin His Asp Lys Ser Asp Ser Ser Ala lie Ser Phe Met Leu Ser 275 280 285
Gin Leu Lys Gin Phe Asp Gin Thr Gin Pro Leu Ser Ala Val Val Met 290 295 300
Ala Asn Ser Val Thr Asn Ala Val Ser Glu lie Asn Val Met Leu Ser 305 310 315 320
Thr lie Gly Lys Ala Glu Ala Thr Ala Ala Asn Glu Val Gin Ala Lys 325 330 335
Ser Asn Leu Ser lie Glu His Lys Thr Pro Ser Gly Ser Cys Phe His 340 345 350
Leu Thr Ser Asp Lys Val Leu Gly Asn Asn Gly Leu Cys Phe Val Tyr 355 360 365 472 200813222
Pro Gly Val Gly Thr Val Tyr Pro Gin Met Phe Ala Gin Leu Pro Arg 370 375 380
Tyr Phe Pro Ala Leu Phe Ala Gin Leu Glu Arg Asp Gly Asp Val Lys 385 390 395 400
Ala Met Leu Gin Ala Asp Ser lie Tyr Ala Glu Asn Ala Lys Thr Thr 405 410 415
Asp Met Ser Leu Gly Glu Leu Ala lie Ala Gly Val Gly Ala Ser Tyr 420 425 430 lie Leu Thr Lys Val Leu Thr Glu His Phe Gly lie Lys Pro Asn Phe 435 440 445
Ala Met Gly Tyr Ser Met Gly Glu Ala Ser Met Trp Ala Ser Leu Asp 450 455 460
Val Trp Lys Thr Pro His Asn Met lie Glu Ala Thr Gin Thr Asn Ser 465 470 475 480 lie Phe Thr Thr Asp lie Ser Gly Arg Leu Asp Cys Val Arg Gin Ala 485 490 495
Trp Gin Leu Glu His Gly Glu Asp lie Val Trp Asn Ser Phe Val Val 500 505 510
Arg Ala Ala Pro Ala Asp lie Glu Lys Val Leu Ala Asp Phe Pro Arg 515 520 525
Ala Tyr Leu Ala lie lie Gin Gly Asp Thr Cys Val Leu Ala Gly Cys 530 535 540
Glu Glu Ser Cys Lys Ala Leu Leu Lys Gin lie Gly Lys Arg Gly lie 545 550 555 560
Ala Ala Asn Arg Val Thr Ala Met His Thr Lys Pro Ala Met Leu lie 565 570 575
Arg Asp Asn Val Gin Ala Phe Tyr Gin Gin Pro Leu His Glu Gin Asp 580 585 590
Val lie Ala Pro Phe Ala Ser Gin lie Lys Phe lie Ser Ala Ala Ser 595 600 605
Gin Ser Pro lie Asn Leu Thr Ser Glu Ala lie Ala Thr Ser lie Ala 610 615 620
Asp Thr Phe Cys Gin Pro Leu Asp Phe Thr Gin Leu Val Asn Asn Ala 625 630 635 640
Arg His Leu Gly Ala Ser Leu Phe Val Glu lie Gly Ala Asp Arg Gin 645 650 655
Thr Thr Thr Leu lie Asp Lys lie Ser Arg Thr Ser Glu Met Ala Gin 660 665 670 473 200813222
Thr Cys Gin Ala lie Ser Val Asn Ala Lys Gly Asp Asp Gin Thr Ala 675 680 685
Leu Leu Lys Cys lie Ala Gin Leu lie Thr His Lys Thr Pro lie Ser 690 695 700
Leu Asp Tyr Leu Thr Glu Thr Leu Ser Ser Leu Leu Thr Thr Thr Leu 705 710 715 720
Ala Ala Glu Lys Arg Ser Asn His His Thr Gly Asn Met Leu Ala Pro 725 730 735
Gin Leu Glu Gly Glu Gin Ser 740
<210> 78 <211> 2020 <212> PRT <213> 沙雷菌(Sh· olleyana) <400> 78
Leu Ser Ser Gin Ser Thr Asn Leu Asn Thr Thr Val Pro Lys lie Ala 15 10 15 lie Val Gly Leu Ala Thr Gin Tyr Pro Asp Ala Asp Thr Pro Ala Lys 20 25 30
Phe Trp Gin Asn Leu Leu Asp Lys Lys Asp Ser Arg Ser Thr lie Asn 35 40 45
Ser Gin Lys Leu Asn Ala Asn Pro Ala Asp Tyr Gin Gly Val Gin Gly 50 55 60
Glu Ser Asp Arg Phe Tyr Cys Asp Lys Gly Gly Tyr lie Gin Asn Phe 65 70 75 80
Ser Phe Asp Ala Asn Gly Tyr Arg lie Pro Ala Glu Gin Phe Ser Gly 85 90 95
Leu Asp Asp Ser Phe Leu Trp Ala Thr Asp Thr Ala Arg Lys Ala Leu 100 105 110
Asn Asp Ala Gly Val Asp lie Thr Asn Pro Gin Asn Asn Gly Ala Leu 115 120 125
Asn Arg Thr Gly lie Val Met Gly Thr Leu Ser Phe Pro Thr Ala Lys 130 135 140
Ser Asn Glu Leu Phe Val Pro lie Tyr His Ser Ala Val Glu Lys Ala 145 150 155 160
Leu Gin Asp Lys Leu Gin Gin Pro Ser Phe Thr Leu Gin Pro Phe Asp 165 170 175
Ser Glu Gly Tyr Ser Gin Gin Thr Thr Ser Ala Ser Leu Ser Asn Gly 180 185 190 474 200813222
Ala lie Ala His Asn Ala Ser Lys Leu Val Ala Asp Ala Leu Gly Leu 195 2⑻ 205
Gly Ala Ala Gin Leu Ser Leu Asp Ala Ala Cys Ala Ser Ser Val Tyr 210 215 220
Ser Leu Lys Leu Ala Cys Asp Tyr Leu His Thr Gly Lys Ala Asp Met 225 230 235 240
Met Leu Ala Gly Ala Val Ser Gly Ala Asp Pro Phe Phe lie Asn Met 245 250 255
Gly Phe Ser lie Phe His Ala Tyr Pro Asp His Gly lie Ser Ala Pro 260 265 270
Phe Asp Ser Asn Ser Lys Gly Leu Phe Ala Gly Glu Gly Ala Gly Val 275 280 285
Leu Val Leu Lys Arg Leu Glu Asp Ala Glu Arg Asp Gly Asp His lie 290 295 300
Tyr Ala Leu Val Ser Gly lie Gly Leu Ser Asn Asp Gly Lys Gly Gin 305 310 315 320
Phe Val Leu Ser Pro Asn Ser Asp Gly Gin Val Lys Ala Phe Glu Arg 325 330 335
Ala Tyr Ala Asp Ala Ala Met His Asp Glu Asn Phe Gly Pro Asn Asn 340 345 350 lie Glu Val Leu Glu Cys His Ala Thr Gly Thr Pro Leu Gly Asp Lys 355 360 365
Val Glu Leu Thr Ser Met Glu Arg Phe Phe Ser Asp Lys Leu Asn Gly 370 375 380
Ser Asn Thr Pro Leu lie Gly Ser Ala Lys Ser Asn Leu Gly His Leu 385 390 395 400
Leu Thr Ala Ala Gly Met Pro Gly lie Met Lys Met lie Phe Ala Met 405 410 415
Arg Gin Gly Val Leu Pro Pro Ser lie Asn lie Ser Ala Pro lie Ala 420 425 430
Ser Pro Ser Glu Met Phe Gly Pro Ala Thr Leu Pro Asn Asp Val Leu 435 440 445
Pro Trp Pro Asp Lys Ala Gly Asn Thr Ala Arg His Ala Gly Val Ser 450 455 460
Val Phe Gly Phe Gly Gly Cys Asn Ala His Leu Leu Val Glu Ser Tyr 465 470 475 480
Phe Ala Lys Ser His Gly Gin Pro Ser Ser Thr Glu Leu Val Lys Pro 475 200813222 485 490 495
Ala Thr Thr Thr lie Asn Ala Gin Met Pro Met His lie Thr Gly Met 500 505 510
Ala Ser His Phe Gly Ser Leu Ser Asn Val Asn Asp Phe Ala Asp Ala 515 520 525
Val Asn Asn Asn Gin Thr Ala Phe Thr Ser Leu Pro Ala Lys Arg Trp 530 535 540
Lys Gly Leu Asp Lys His Pro Glu Leu Leu Gin Lys Phe Gly Leu Ser 545 550 555 560
Gin Ala Ala Pro Thr Gly Ala Tyr lie Asp Gin Phe Asp Phe Asp Phe 565 570 575
Leu Arg Phe Lys Val Pro Pro Asn Glu Asp Asp Arg Leu lie Ser Gin 580 585 590
Gin Leu Leu Leu Met Lys Val Ala Asp Glu Ala lie His Asp Ala Lys 595 600 605
Leu Glu Ser Gly Ser Lys Val Ala Val Leu Val Ala Met Glu Thr Glu 610 615 620
Leu Glu Leu His Gin Phe Arg Gly Arg Val Asn Leu His Thr Gin lie 625 630 635 640
Ala Ala Ser Leu Thr Ala His Gly Val Ser Leu Ser Asp Ser Glu Tyr 645 650 655
Gin Ala Leu Glu Thr lie Ala Met Asp Ser Val Leu Asp Ala Ala Lys 660 665 670
Leu Asn Gin Tyr Thr Ser Phe lie Gly Asn lie Met Ala Ser Arg lie 675 680 685
Ser Ser Leu Trp Asp Phe Asn Gly Pro Ala Phe Thr lie Ser Ala Gly 690 695 700
Glu Gin Ser Val Asn Arg Cys lie Asp Val Ala Gin Asn Leu Leu Ala 705 710 715 720
Met Glu Ser Arg Gin Glu Pro Leu Asp Ala Ala lie lie Ala Ala Val 725 730 735
Asp Leu Ser Gly Ser lie Glu Asn lie Val Leu Lys Thr Ala Asn lie 740 745 750
Asn Lys Thr Gly Ser Thr Glu Ala Leu Asn lie Gly Glu Gly Ala Gly 755 760 765
Ala lie Val Leu Gin Ala Ala Ala lie Asp Ser Glu His Cys Asp Leu 770 775 780 476 200813222 lie His Gin Gly Leu Gly Ala Leu Asp Thr Leu Asp Ser Ala Ser Thr 785 790 795 800
His Ser Tyr Gly Thr lie Asp Ser Leu Ala Phe Gly His Thr Asp Gin 805 810 815
Leu Ser Thr lie Ser Asp Asp Val Leu Thr Pro Val Gly Leu Ala Ala 820 825 830
Thr Asp lie Asp Leu Leu Glu Leu Asn Gin Ala Pro Asp Leu Leu Asn 835 840 845 lie Asp Asn Ala Gin Met Leu Ser Gin Leu Phe Asn Gin Ser Ser Thr 850 855 860
Ser Lys Ala Gin Ser Cys lie Gly His Thr Phe Ala Ala Ser Gly lie 865 870 875 880
Ala Ser Leu Leu His Gly Leu Leu Lys Thr Arg Leu Asn Ala Ser Val 885 890 895
Gin Asn Ala Asn Ser Asp Ser Lys Leu Ser Asn Lys Pro Asn Gin Lys 900 905 910
Ala lie lie Ala Thr Leu Ser Glu Asn Gin Cys Ser Gin Leu Leu lie 915 920 925
Ser Gin Asn Ala Glu Gin Ala Ser Ala Met Ser Thr Arg lie Asp Thr 930 935 940
Asp lie Gin Ala Gin Thr Ala Lys Lys Leu Ser Leu Val Lys Gin Val 945 950 955 960
Ser Leu Gly Gly Arg Asp lie Tyr Gin His lie Val Asp Ala Pro Leu 965 970 975
Ala Asn lie Asp Ser lie Arg Ala Lys Val Ala Lys Leu Asn Pro Val 980 985 990
Ala Pro Thr Thr Val Met Asn Leu His Asp Arg Gly Gin Phe lie Ala 995 1000 1005
Pro Ala His Ala Asn Ser Ala Pro Met Ser Ala Asn Asn Asn Ser 1010 1015 1020
Met Thr Thr Glu Thr Ser Met Pro Phe Ser Asp Arg Ser Thr Gin 1025 1030 1035
Phe Asn Pro Thr Pro Lys Val Ala Thr Pro Thr Ala Leu Ser Thr 1040 1045 1050
Gin Ala Ala Gin Ala Thr Gin Ser Ala Gin Thr Ser Ser Val Thr 1055 1060 1065
Ser Ser Val Ala Ala lie Ser Gin Val Pro Pro Thr His Leu Ser 1070 1075 1080 477 200813222
Ala Phe Glu Gin Asn Gin Trp Leu Ala His Gin Ala 1085 1090 1095
Phe Leu Lys Ser Arg Glu Gin Gly Leu Lys Val Ala 1100 1105 1110
Leu Lys Gin Glu lie Ala Gin Ala Asn Gly Gin Pro 1115 1120 1125
Gin Ser Thr Ala Gin Ala Val Ala Pro Val Gin Ala 1130 1135 1140
Leu Ala Gin Pro lie Ala Ser Ala Ser lie Leu Arg 1145 1150 1155
Ala Asn Val Pro Pro Tyr Thr Ala Pro lie Pro Ala 1160 1165 1170
Cys lie Trp Asn Tyr Ala Asp Leu Val Glu Tyr Ala 1175 1180 1185 lie Ala Lys Val Phe Gly Pro Asp Tyr Ala Val lie 1190 1195 1200
Ser Arg Arg Val Arg Leu Pro Thr Thr Asp Tyr Leu 1205 1210 1215
Arg Val Thr Lys Leu Asp Ala Thr Met Asn Gin Tyr 1220 1225 1230
Ser Met Thr Thr Glu Tyr Asp lie Pro Glu Asp Ala 1235 1240 1245
Val Asp Gly Gin lie Pro Trp Ala Val Ala Val Glu 1250 1255 1260
Cys Asp Leu Met Leu lie Ser Tyr Leu Gly lie Asp 1265 1270 1275
Lys Gly Glu Arg Val Tyr Arg Leu Leu Asp Cys Thr 1280 1285 1290
Leu Gly Asp Leu Pro Arg Gly Gly Asp Thr Leu Arg 1295 1300 1305
Lys lie Asn Asn Phe Ala Lys Asn Gly Glu Thr Leu 1310 1315 1320
Phe Ser Tyr Glu Cys Phe Val Gly Asp Lys Met Val 1325 1330 1335
Asp Gly Gly Cys Ala Gly Phe Phe Thr Asp Gin Glu 1340 1345 1350
Gly Lys Gly Val lie Tyr Thr Glu Asp Glu lie Lys 1355 1360 1365
Gin Leu Ala Asp Ala Leu Tyr Val Ala Ala Asn Val Pro Asp His Asn Lys Pro Glu Gly Asp Asp Asn Tyr Leu Val Ser Lys Pro Cys Pro Tyr Leu Ser Gly Gin Phe Glu Asn Leu Thr Phe Tyr Asp lie Leu Phe Phe Leu Lys Met Leu Asp Asp Thr Arg Glu 478 200813222
Ala Ala Leu Asn Thr Pro Asn Lys Pro Arg Phe Glu 1370 1375 1380
His Cys Ala Gin Thr Gin Phe Asp Tyr Gly Gin lie 1385 1390 1395
Leu Asn Ala Asp lie Gly Ser Cys Phe Ala Gly Glu 1400 1405 1410
His Gin Gin Ala Ser Gly Lys Gin Asp Ser Leu Cys 1415 1420 1425
Glu Lys Phe Leu Met lie Glu Gin Val Gly Asn Leu 1430 1435 1440
Gly Gly Ala Trp Gly Leu Gly Phe lie Glu Gly His 1445 1450 1455
Ala Pro Asp His Trp Tyr Phe Pro Cys His Phe Gin 1460 1465 1470
Val Met Ala Gly Ser Leu Met Ala Glu Gly Cys Gly 1475 1480 1485
Gin Phe Phe Met Leu His lie Gly Met His Thr Leu 1490 1495 1500
Gly Arg Phe Gin Pro Leu Glu Asn Ala Ser Gin Lys 1505 1510 1515
Arg Gly Gin Val Leu Pro Gin His Gly Glu Leu Thr 1520 1525 1530
Glu Val Thr Glu lie Gly Thr His Pro Arg Pro Tyr 1535 1540 1545
Asn lie Glu lie Leu Leu Asn Gly Lys Ala Val Val 1550 1555 1560
Asn Leu Gly Val Met lie Lys Glu Glu Gly Glu Cys 1565 1570 1575
Thr Ala Asp Ser Thr Glu Thr His Thr Thr Ser Gly 1580 1585 1590
Lys Asn Asn Ser His Asn Thr Pro Ala Ser Leu Asn 1595 1600 1605
Met Ala Gin Val Pro Asp Leu Ser Glu Pro Ala Asn 1610 1615 1620 lie Pro Leu Gin His Val Glu Ala Pro Met Leu Pro 1625 1630 1635
Asn Arg Thr Pro Asp Thr Leu Pro Phe Thr Ala Tyr
Pro Leu Leu His His Leu His His Asn Phe Ala Ser Glu Val His Lys Gin Leu Gly Asp Gin Gin Leu Leu Val Glu Asn Val Arg Cys Tyr Arg Met Ala Lys Ala Asp Phe Gin Thr Arg Tyr Thr Val Gin Ala Pro Leu Lys Gly Val Asp Tyr Pro His Met Phe 479 200813222 1640 1645 1650
Glu Phe Ala Thr Gly Asp lie Glu Asn Cys Phe Gly 1655 1660 1665
Ser lie Tyr Arg Gly Phe lie Pro Pro Arg Thr Pro 1670 1675 1680
Leu Gin Leu Thr Thr Arg Val Val Asp lie Gin Gly 1685 1690 1695
Glu Leu Lys Lys Pro Ser Ser Cys lie Ala Glu Tyr 1700 1705 1710
Thr Asp Ala Trp Tyr Phe Ala Lys Asn Ser His Ala 1715 1720 1725
Pro Tyr Ser Val Leu Met Glu lie Ser Leu Gin Pro 1730 1735 1740 lie Ser Gly Tyr Met Gly Thr Thr Leu Gly Phe Pro 1745 1750 1755
Leu Phe Phe Arg Asn Leu Asp Gly Ser Gly Glu Leu 1760 1765 1770
Val Asp Leu Arg Gly Lys Thr lie Val Asn Asp Ser 1775 1780 1785
Ser Thr Val lie Ala Gly Ser Asn lie lie Gin Ser 1790 1795 1800
Asp Leu Ser Val Asp Gly Glu Pro Phe Tyr Thr Gly 1805 1810 1815
Phe Gly Tyr Phe Lys Gly Asp Ala Leu Lys Asn Gin 1820 1825 1830
Asp Asn Gly Arg lie Thr Gin Pro Trp His Val Glu 1835 1840 1845
Ala Ala Asp lie Thr Val Asp Leu Leu Asp Lys Gin 1850 1855 1860
Phe His Ala Pro Ala Asn Gin Pro His Tyr Arg Leu 1865 1870 1875
Gin Leu Asn Phe lie Asp Lys Ala Glu lie Val Asp 1880 1885 1890
Lys Asn Gly Leu Gly Tyr Leu Ser Ala Ser Arg Thr 1895 1900 1905
Ser Asp Trp Phe Phe Gin Phe His Phe His Gin Asp 1910 1915 1920
Pro Asp Phe Cys Gly Asp Lys Arg Gly Glu Val Pro Ser Val Met Asn Gly Phe Gly Gin Glu Leu Cys Asp Lys Leu Leu Phe Ser Phe Ser Ala Val Leu Gly lie Asn Asn Val Ser Arg Val Ala Gly Gly Lys Gly Gly lie Asp Pro Pro Val Met 480 200813222
Pro Gly Ser Leu Gly Val Glu Ala lie lie Glu Leu Met Gin Thr 1925 1930 1935
Tyr Ala lie Ser Lys Asp Leu Gly Lys Gly Phe Thr Asn Pro Lys 1940 1945 1950
Phe Gly Gin lie Leu Ser Asp lie Lys Trp Lys Tyr Arg Gly Gin 1955 1960 1965 lie Asn Pro Leu Asn Lys Gin Met Ser Leu Asp Val His lie Ser 1970 1975 1980
Ala Val Lys Asp Glu Asn Gly Lys Arg lie lie Val Gly Asp Ala 1985 1990 1995
Asn Leu Ser Lys Asp Gly Leu Arg lie Tyr Glu Val Lys Asp lie 2000 2005 2010
Ala lie Cys lie Glu Glu Ala 2015 2020
<210〉 79 <211> 542 <212> PRT <213〉沙雷菌(Sh. olleyana) <400> 79
Met Thr lie Ser Thr Gin Asn Glu Lys Leu Ser Pro Trp Pro Trp Gin 15 10 15
Val Ala Pro Ser Asp Ala Ser Phe Glu Asn Ala Ala lie Gly Lys Lys 20 25 30
Leu Lys Glu Leu Ser Gin Ala Cys Tyr Leu lie Asn His Pro Glu Lys 35 40 45
Gly Leu Gly lie Ser Gin Asn Ala Gin Val Met Thr Glu Ser Met Asn 50 55 60
Ser Gin Gin Asp Leu Pro Val Ser Ala Phe Ala Pro Ala Leu Gly Thr 65 70 75 80
Gin Ser Leu Gly Asp Ser Asn Phe Arg Arg Val His Gly Val Lys Tyr 85 90 95
Ala Tyr Tyr Ala Gly Ala Met Ala Asn Gly lie Ser Ser Glu Glu Leu 100 105 110
Val lie Ala Leu Gly Gin Ala Gly lie Leu Cys Ser Phe Gly Ala Ala 115 120 125
Gly Leu lie Pro Ser Arg Val Glu Gin Ala lie Asn Arg lie Gin Thr 130 135 140
Ala Leu Pro Asn Gly Pro Tyr Met Phe Asn Leu lie His Ser Pro Ser 145 150 155 160 481 200813222
Glu Pro Ala Leu Glu Arg Gly Ser Val Glu Leu Phe Leu Lys His Lys 165 170 175
Val Arg Thr Val Glu Ala Ser Ala Phe Leu Gly Leu Thr Pro Gin lie 180 185 190
Val Tyr Tyr Arg Ala Ala Gly Leu Ser Arg Asp Ala Gin Gly Glu Val 195 200 205
Val lie Ala Asn Lys Val lie Ala Lys Val Ser Arg Thr Glu Val Ala 210 215 220
Ser Lys Phe Met Gin Pro Ala Pro Ala Lys Met Leu Gin Lys Leu Val 225 230 235 240
Asp Glu Gly Leu lie Thr Pro Glu Gin Met Glu Leu Ala Gin Leu Val 245 250 255
Pro Met Ala Asp Asp Val Thr Ala Glu Ala Asp Ser Gly Gly His Thr 260 265 270
Asp Asn Arg Pro Leu Val Thr Leu Leu Pro Thr lie Leu Ala Leu Lys 275 280 285
Asp Lys lie Gin Ala Glu Tyr Gin Tyr Lys Thr Pro lie Arg Val Gly 290 295 300
Cys Gly Gly Gly Val Gly Thr Pro Asp Ala Ala Leu Ala Thr Phe Asn 305 310 315 320
Met Gly Ala Ala Tyr lie Val Thr Gly Ser lie Asn Gin Ala Cys Val 325 330 335
Glu Ala Gly Ala Ser Glu His Thr Arg Lys Leu Leu Ala Thr Thr Glu 340 345 350
Met Ala Asp Val Thr Met Ala Pro Ala Ala Asp Met Phe Glu Met Gly 355 360 365
Val Lys Leu Gin Val Val Lys Arg Gly Thr Leu Phe Pro Met Arg Ala 370 375 380
Asn Lys Leu Tyr Glu lie Tyr Thr Arg Tyr Glu Ser lie Glu Ala lie 385 390 395 400
Pro Ala Glu Glu Arg Glu Lys Leu Glu Lys Gin Val Phe Arg Ser Thr 405 410 415
Leu Asp Asp lie Trp Ala Gly Thr Val Ala His Phe Asn Glu Arg Asp 420 425 430
Pro Lys Gin lie Glu Arg Ala Glu Gly Asn Pro Lys Arg Lys Met Ala 435 440 445
Leu lie Phe Arg Trp Tyr Leu Gly Leu Ser Ser Arg Trp Ser Asn Ser 450 455 460 482 200813222
Gly Glu Val Gly Arg Glu Met Asp Tyr Gin lie Trp Ala Gly Pro Ala 465 470 475 480
Leu Gly Ala Phe Asn Glu Trp Ala Lys Gly Ser Tyr Leu Asp Asp Tyr 485 490 495
Thr Gin Arg Asn Ala Val Asp Leu Ala Lys His Leu Met His Gly Ala 500 505 510
Ala Tyr Gin Ala Arg Val Asn Leu Leu Thr Ala Gin Gly Val Ala Leu 515 520 525
Pro Val Glu Leu Gin Arg Trp Ser Pro Leu Asp Gin Val Lys 530 535 540
<210> 80 <211〉 290 <212〉 PRT <213〉沙雷菌(Sh. olleyana) <400> 80
Leu Lys Pro Pro Thr Val lie Gin Leu Phe Phe Cys Pro Leu Asn Thr 1 5 10 15
Asp Leu Leu Asp Glu Ser Thr Ala Ser lie Val Arg Ser Trp Leu Pro 20 25 30
Glu Asp Glu Val Lys Lys Val Asp Arg Phe lie Gin Gin Ser Ser Arg 35 40 45
Glu Gin Gly Leu Met Val Arg Gly Tyr Leu Arg Ser Val Leu Ser Arg 50 55 60
Phe Ala Ser Val Glu Pro Gin Gin Trp Gin Phe Glu Tyr Gly Glu Lys 65 70 75 80
Gly Lys Pro Arg Leu Thr Ala Glu Gin Phe Ala Gin Thr Gly Leu Gin 85 90 95
Phe Asn Leu Ser His Ser Gly Asp Trp Leu Leu lie Gly Val Ala Asn 100 105 110
Thr Tyr Gly Thr Ala Gin Gin Gin Thr Asp lie Glu Leu Gly Val Asp 115 120 125 lie Glu Arg Arg Arg Glu Thr Thr Asn lie His Ser lie Leu Asn His 130 135 140
Tyr Phe Ser Lys Pro Glu Glu Ser Ala Leu Leu Ala Leu Ala Glu Asp 145 150 155 160
Lys His Arg Glu Arg Phe Phe Asp Leu Trp Ala Leu Lys Glu Ser Tyr 165 170 175 lie Lys Ala Lys Gly Leu Gly Leu Ala Leu Ser Leu Lys Ser Phe Ala 180 185 190 483 200813222
Phe Asp Leu Ser Ala Ser Ser Val Gly Glu Leu Gin Val Asn Ser Glu 195 200 205
Thr lie Thr lie Gin Gin Asn Val Lys Leu Ser Leu Leu Lys Ala Ser 210 215 220
Asp Ser Asp Gly Leu Leu Glu Asp Phe Val lie Ala Pro Gin Trp His 225 230 235 240
Cys Tyr Leu Gly Lys Leu Asp Asp Leu Tyr Arg Phe Ala Val Ser Val 245 250 255
Gly Arg Ala Ser Thr Asn Ser Asp Glu Leu Pro Pro Glu Leu Lys Ala 260 265 270
Lys Lys lie Ser Trp Leu Glu Val Val Asn His Ala Phe Lys Pro Thr 275 280 285
Asp Arg 290
<210> 81 <211> 35 <212> PRT <213〉甘藍型油菜(brassica napus) <400> 81
Met Leu Lys Leu Ser Cys Asn Val Thr Asn His Leu His Thr Phe Ser 15 10 15
Phe Phe Ser Asp Ser Ser Leu Phe lie Pro Val Asn Arg Arg Thr Leu 20 25 30
Ala Val Ser 35
<210〉 82 <211> 2004 <212〉 DNA <213〉裂殖壺菌(Schizochytrium sp.) <400> 82 atggctaccg gcggcaagat gagcatcgag gtgcccggat cggcacggcc cgacctgggc 60 tttggcgcga tccggagatc gatcatcgag accggcccgc agaccacgtt gaacggacat 120 cgtagcctct acgaggtctt tcgcctggct gcagagacgc acggctcgcg aaagtgtctt 180 ggacgcaggg tcacgctccc gaacggccag ctcggcggct tcgacgagtg gaccacatac 240 ggagaagctc tcgaccgcgc gcacaacttt ggcgccggtc ttaccaacct tgggctgtgc 300 acgcccaaca ccgacggtct ccagctcctt ggctttttcg gcaagaaccg tcccgaatgg 360 gttattggcg acattggctg ctactcgcag ggaattgtcc ccgtgcccat gtacgacacg 420 ctcggcgcag atagcgtcga gtacgtggtg cgccagacgg agctcaagac catgttttgc 480 acgatggaag agctcgagcg cgtctgcgag gtcgcgcaaa aggatctcct tggcgcagcc 540 attctcatgg acggcgaatt tttcgacgag gctgacgtga tgcgcgcacg ccagcaggcc 600 gaggcaagtg gtctcaagct ctacacggta cgcgaggtcg aggccgtcgg caaggagaac 660 484 200813222 ccggcgccct tggtccttcc gcggggcgaa gacgtggcct tcttttgcta cacgagtggc 720 accacgggcg accccaaggg cgccctcatc cggcattcgg gtctcctgag ctgcatggcc 780 tcctttcgcg atgtgggcct catcatgacc catgaggatg tctacctttc gtacctcccg 840 ctcccgcatg tctttgagcg cggatgcctg tacacggcgc tgagtggcgg tgccgcggtc 900 ggcttttacg gcggtgacac gcagctcatc gtcgaggacc tcgtggctct gcgccccacg 960 ctcttcccct cggtaccgcg tctctacaac cgcatctacg acaagcttcg cgccggcgtt 1020 gatgaggccg gcggcgtcaa gaagtggctc tttgagaagg ctctcgctgc caaaaaggag 1080 ggtttgcgcg ctgggcgtta cacgcacccg gtatgggatc gtcttgtctt caactcggtc 1140 _ aaggccaagg tcggtctcga ccgtgcgcgc atcatgtgca cgggctctgc tccgatctca 1200 agccacgttc tcgagttcct ccgtgccgtc tttggctgcc ccgtcctcga gggctatggg 1260 ^ cagaccgagt cctcgcttct catttcggtg ccccttatga acgatactac actcaaccac 1320 gtcggcattc cggccccctg ctgcgagatt cgtctcgagg atgtcgctga catgggctac 1380 cgcgccactg acaagaagca taatggcgag gcttgcgagg gtcgcggcga aatctgcttt 1440 cgtgggccca acaactttaa ggagtactac CRcatgccRR aaaaRacRRC CRaRaccatt 1500 gacgaggacg gctgggtgca cacgggagac attggtctct ggaccccaga gggtcgactc 1560 cgtatcattg accgcaagaa gaacatcttc aagcttgcgc agggcgagta cgttgctgct 1620 gagaagatcg agaacattat gcttcgctcg ccgctcgccg cccaaatctt tgtctacggc 1680 gactctcttc agagctgcct tgtggccatt gttgttccgg atgcggatgc gcttcaaacg 1740 cgcggcatgg ctgtcgacga tccggccacc aagcaggcca tttttgacag tgtggtcaag 1800 gaggcgcgcg acgccgcgct caatggctac gagatcccca agcgcattca cattagcccg 1860 caggagctga acatgttgcc tgagcgcaac ggcctcacca cgctgcttac gccgaccttt 1920 aagcttgtgc gcaacaaggc caaggactac tttgctccgg agatcgacgc catgtacgcc 1980 gacatcaact ccacttccaa gctc 2004 <210〉 83 r <211> 668
1 <212> PRT <213〉裂殖壺菌(Schizochytrium sp.) <400> 83 。 Met Ala Thr Gly Gly Lys Met Ser lie Glu Val Pro Gly Ser Ala Arg 15 10 15 " Pro Asp Leu Gly Phe Gly Ala lie Arg Arg Ser lie lie Glu Thr Gly 20 25 30
Pro Gin Thr Thr Leu Asn Gly His Arg Ser Leu Tyr Glu Val Phe Arg 35 40 45
Leu Ala Ala Glu Thr His Gly Ser Arg Lys Cys Leu Gly Arg Arg Val 50 55 60
Thr Leu Pro Asn Gly Gin Leu Gly Gly Phe Asp Glu Trp Thr Thr Tyr 485 200813222
Gly Glu Ala Leu Asp Arg Ala His Asn Phe Gly Ala Gly Leu Thr Asn 85 90 95
Leu Gly Leu Cys Thr Pro Asn Thr Asp Gly Leu Gin Leu Leu Gly Phe 100 105 110
Phe Gly Lys Asn Arg Pro Glu Trp Val lie Gly Asp lie Gly Cys Tyr 115 120 125
Ser Gin Gly lie Val Pro Val Pro Met Tyr Asp Thr Leu Gly Ala Asp 130 135 140
Ser Val Glu Tyr Val Val Arg Gin Thr Glu Leu Lys Thr Met Phe Cys 145 150 155 160
Thr Met Glu Glu Leu Glu Arg Val Cys Glu Val Ala Gin Lys Asp Leu 165 170 175
Leu Gly Ala Ala lie Leu Met Asp Gly Glu Phe Phe Asp Glu Ala Asp 180 185 190
Val Met Arg Ala Arg Gin Gin Ala Glu Ala Ser Gly Leu Lys Leu Tyr 195 200 205
Thr Val Arg Glu Val Glu Ala Val Gly Lys Glu Asn Pro Ala Pro Leu 210 215 220
Val Leu Pro Arg Gly Glu Asp Val Ala Phe Phe Cys Tyr Thr Ser Gly 225 230 235 240
Thr Thr Gly Asp Pro Lys Gly Ala Leu lie Arg His Ser Gly Leu Leu 245 250 255
Ser Cys Met Ala Ser Phe Arg Asp Val Gly Leu lie Met Thr His Glu 260 265 270
Asp Val Tyr Leu Ser Tyr Leu Pro Leu Pro His Val Phe Glu Arg Gly 275 280 285
Cys Leu Tyr Thr Ala Leu Ser Gly Gly Ala Ala Val Gly Phe Tyr Gly 290 295 300
Gly Asp Thr Gin Leu lie Val Glu Asp Leu Val Ala Leu Arg Pro Thr 305 310 315 320
Leu Phe Pro Ser Val Pro Arg Leu Tyr Asn Arg lie Tyr Asp Lys Leu 325 330 335
Arg Ala Gly Val Asp Glu Ala Gly Gly Val Lys Lys Trp Leu Phe Glu 340 345 350
Lys Ala Leu Ala Ala Lys Lys Glu Gly Leu Arg Ala Gly Arg Tyr Thr 355 360 365
His Pro Val Trp Asp Arg Leu Val Phe Asn Ser Val Lys Ala Lys Val 370 375 380 486 200813222
Gly Leu Asp Arg Ala Arg lie Met Cys Thr Gly Ser Ala Pro lie Ser 385 390 395 400
Ser His Val Leu Glu Phe Leu Arg Ala Val Phe Gly Cys Pro Val Leu 405 410 415
Glu Gly Tyr Gly Gin Thr Glu Ser Ser Leu Leu lie Ser Val Pro Leu 420 425 430
Met Asn Asp Thr Thr Leu Asn His Val Gly lie Pro Ala Pro Cys Cys 435 440 445
Glu lie Arg Leu Glu Asp Val Ala Asp Met Gly Tyr Arg Ala Thr Asp 450 455 460
Lys Lys His Asn Gly Glu Ala Cys Glu Gly Arg Gly Glu lie Cys Phe 465 470 475 480
Arg Gly Pro Asn Asn Phe Lys Glu Tyr Tyr Arg Met Pro Glu Lys Thr 485 490 495
Ala Glu Thr lie Asp Glu Asp Gly Trp Val His Thr Gly Asp lie Gly 500 505 510
Leu Trp Thr Pro Glu Gly Arg Leu Arg lie lie Asp Arg Lys Lys Asn 515 520 525 lie Phe Lys Leu Ala Gin Gly Glu Tyr Val Ala Ala Glu Lys lie Glu 530 535 540
Asn lie Met Leu Arg Ser Pro Leu Ala Ala Gin lie Phe Val Tyr Gly 545 550 555 560
Asp Ser Leu Gin Ser Cys Leu Val Ala lie Val Val Pro Asp Ala Asp 565 570 575
Ala Leu Gin Thr Arg Gly Met Ala Val Asp Asp Pro Ala Thr Lys Gin 580 585 590
Ala lie Phe Asp Ser Val Val Lys Glu Ala Arg Asp Ala Ala Leu Asn 595 600 605
Gly Tyr Glu lie Pro Lys Arg lie His lie Ser Pro Gin Glu Leu Asn 610 615 620
Met Leu Pro Glu Arg Asn Gly Leu Thr Thr Leu Leu Thr Pro Thr Phe 625 630 635 640
Lys Leu Val Arg Asn Lys Ala Lys Asp Tyr Phe Ala Pro Glu lie Asp 645 650 655
Ala Met Tyr Ala Asp lie Asn Ser Thr Ser Lys Leu 660 665 <210> 84 <211> 2343 487 60 200813222
<212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 84 atgcccactc ccgacgccac cgcgcctctg aacaagccga gcgactatgc cgtctaccac gaggaagacg gccccttctg gaccgccgat tccagcggcg tctcgcgcgt gaactttagc gagaccggcg tgggatccga gggcgtcatc cctgcgctca cgctcatcga cgtcttcgag agggccgtca agcgcggcgg aaacaggatc gccttccgca cggaaaacat gcccacgctc cgccgcggcg aagaggcccc ggacgcgctg ccgctcaagg actggaagtc ctggtcctgg aaacagtaca aggccgacgt ccaccgcatc gccagggctc tcatggacct cggcgttgag cagcatgacg ccgtctccat ttttggcttt aactcgcccg aatggtttct cagtgccgtc ggcgccgtgc acgcaggtgc caagattgcc ggcatttacc cctcagacac gcccgcccag gtccagtaca aggccttcca cagtgacacc gctgttgccg ttgtcgaaaa cgagcagtgc ttcaagaagt tcgccgaggt cgtcgaggac cttccttacc tcaaggccat tgtttgctgg gactatgaag ccacagacat cacgcgcgag gacggctccg tcgtcgaggt cctcaccttt gccgagttcc tcaagcgcgg cgacaccgtc gaggcggccg cccttgacga gcgcatctcc aagatcgagc ccaccatgtg cgctgccctt atttacacca gcggtactac cggccgcccc aaggccgtta tgatttcgca cgacaacctt gttttcgagg ccagcgccgt cgtccccaac ctcggaggag cctgtacgac cactgetgag gagcgcattc tctcgtacct gcctctctcg cacgtcgctg gtatgatggt tgatattatt gcccccatca ttgccaccgc cttccacaag ggccgcatct gegtetgett tgctcgcccg tacgatttgc gcaccggcac gctgggccag cgcctcaacg ccgtggagcc caccatcttc cttggcgtgc cccgtgtgtg ggaaaagatt caggaaaagc tcatggccgt cggtgccaaa accaccggcc tcaagaagaa gctctctacg gccgccaaga agcgtggtct tgaattccag gaggageage aaatcggccg ctccggtgcc aaccctggct ttggccccct tggcatctac aagaagctcc tcggcctcat caagggcaag ctgggcctca ccaagtgcaa gtttgccttt gctggtgccg cgcccatgac ccgtgagacc cttcagtact ttggcgcgct gaacatcaac attaaegagg tetaeggeat gtccgagtgc tccggtgccg ccacctggtc cacggacaag gcccacgagt ggggcactgt tggetaegag atgcccagtt gcgaggtccg cgtcttcaag attgeegagg acggtaccaa gaccgagtgc ccgcgcgccg ccgacattat gcatgctacc gaggaggage agggcgaagt ttgcttccgc ggccgtaaca tcatgatggg ctaccttgcc aaccccaagc ttggcgacga ccacgttgcc gagategagg agaagaaege tgccgctatc gactccgagg gctggctcca cagtggtgat aagggcgcca tttctacccg cggcatgctc aagatcacgg gccgctacaa ggagctcatc atcggcgccg gtggcgagaa cgtggcgccc gtccctattg aggacgccat caaggcgcgc atgccttttg tttccaacgc catgatggtc ggagataage gcaagttcat ggctgtcctc cttaccctca agacggttgg cgccacgggc gagcttcccg gtacgaacaa gctcatgggc gctgccgccg actatggtga gaccatcgag gacgcctgcg acaacgaggc gctcattgag gagatcacgc agcagctcaa ggagatcggt gatgatggcg atgtcacgcc ctcgaacgcg gctcgcatcc aaaagttcac cattctcccg ctcgactttt ccgtctccac ggacgagctc acggccacgc tcaagctcaa gcgctccgtg gtcgcagaca agtaegaaga catcatcgag 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 488 200813222 2220 2280 2340 2343 gccttttacg agtccaagag cgtttttgtg ccgtactcga ccgttggcgc ctacgccacg ggcggcccgg tcgacgactc cgttgtcgat ggctccttca agggcgactt tagcatgatt ggcgacgatg atccggatct tcaaaacgtc gatgtcctcg aggcgattga cgaggacaat taa
<210> 85 <211> 780 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 85
Met Pro Thr Pro Asp Ala Thr Ala Pro Leu Asn Lys Pro Ser Asp Tyr 15 10 15
Ala Val Tyr His Glu Glu Asp Gly Pro Phe Trp Thr Ala Asp Ser Ser 20 25 30
Gly Val Ser Arg Val Asn Phe Ser Glu Thr Gly Val Gly Ser Glu Gly 35 40 45
Val lie Pro Ala Leu Thr Leu lie Asp Val Phe Glu Arg Ala Val Lys 50 55 60
Arg Gly Gly Asn Arg lie Ala Phe Arg Thr Glu Asn Met Pro Thr Leu 65 70 75 80
Arg Arg Gly Glu Glu Ala Pro Asp Ala Leu Pro Leu Lys Asp Trp Lys 85 90 95
Ser Trp Ser Trp Lys Gin Tyr Lys Ala Asp Val His Arg lie Ala Arg 100 105 110
Ala Leu Met Asp Leu Gly Val Glu Gin His Asp Ala Val Ser lie Phe 115 120 125
Gly Phe Asn Ser Pro Glu Trp Phe Leu Ser Ala Val Gly Ala Val His 130 135 140
Ala Gly Ala Lys lie Ala Gly lie Tyr Pro Ser Asp Thr Pro Ala Gin 145 150 155 160
Val Gin Tyr Lys Ala Phe His Ser Asp Thr Ala Val Ala Val Val Glu 165 170 175
Asn Glu Gin Cys Phe Lys Lys Phe Ala Glu Val Val Glu Asp Leu Pro 180 185 190
Tyr Leu Lys Ala lie Val Cys Trp Asp Tyr Glu Ala Thr Asp lie Thr 195 200 205
Arg Glu Asp Gly Ser Val Val Glu Val Leu Thr Phe Ala Glu Phe Leu 210 215 220
Lys Arg Gly Asp Thr Val Glu Ala Ala Ala Leu Asp Glu Arg lie Ser 225 230 235 240 489 200813222
Lys lie Glu Pro Thr Met Cys Ala Ala Leu lie Tyr Thr Ser Gly Thr 245 250 255
Thr Gly Arg Pro Lys Ala Val Met lie Ser His Asp Asn Leu Val Phe 260 265 270
Glu Ala Ser Ala Val Val Pro Asn Leu Gly Gly Ala Cys Thr Thr Thr 275 280 285
Ala Glu Glu Arg lie Leu Ser Tyr Leu Pro Leu Ser His Val Ala Gly 290 295 300
Met Met Val Asp lie lie Ala Pro lie lie Ala Thr Ala Phe His Lys 305 310 315 320
Gly Arg lie Cys Val Cys Phe Ala Arg Pro Tyr Asp Leu Arg Thr Gly 325 330 335
Thr Leu Gly Gin Arg Leu Asn Ala Val Glu Pro Thr lie Phe Leu Gly 340 345 350
Val Pro Arg Val Trp Glu Lys lie Gin Glu Lys Leu Met Ala Val Gly 355 360 365
Ala Lys Thr Thr Gly Leu Lys Lys Lys Leu Ser Thr Ala Ala Lys Lys 370 375 380
Arg Gly Leu Glu Phe Gin Glu Glu Gin Gin lie Gly Arg Ser Gly Ala 385 390 395 400
Asn Pro Gly Phe Gly Pro Leu Gly lie Tyr Lys Lys Leu Leu Gly Leu 405 410 415 lie Lys Gly Lys Leu Gly Leu Thr Lys Cys Lys Phe Ala Phe Ala Gly 420 425 430
Ala Ala Pro Met Thr Arg Glu Thr Leu Gin Tyr Phe Gly Ala Leu Asn 435 440 445 lie Asn lie Asn Glu Val Tyr Gly Met Ser Glu Cys Ser Gly Ala Ala 450 455 460
Thr Trp Ser Thr Asp Lys Ala His Glu Trp Gly Thr Val Gly Tyr Glu 465 470 475 480
Met Pro Ser Cys Glu Val Arg Val Phe Lys lie Ala Glu Asp Gly Thr 485 490 495
Lys Thr Glu Cys Pro Arg Ala Ala Asp lie Met His Ala Thr Glu Glu 500 505 510
Glu Gin Gly Glu Val Cys Phe Arg Gly Arg Asn lie Met Met Gly Tyr 515 520 525
Leu Ala Asn Pro Lys Leu Gly Asp Asp His Val Ala Glu lie Glu Glu 490 200813222 530 535 540
Lys Asn Ala Ala Ala lie Asp Ser Glu Gly Trp Leu His Ser Gly Asp 545 550 555 560
Lys Gly Ala lie Ser Thr Arg Gly Met Leu Lys lie Thr Gly Arg Tyr 565 570 575
Lys Glu Leu lie lie Gly Ala Gly Gly Glu Asn Val Ala Pro Val Pro 580 585 590 lie Glu Asp Ala lie Lys Ala Arg Met Pro Phe Val Ser Asn Ala Met 595 600 605
Met Val Gly Asp Lys Arg Lys Phe Met Ala Val Leu Leu Thr Leu Lys 610 615 620
Thr Val Gly Ala Thr Gly Glu Leu Pro Gly Thr Asn Lys Leu Met Gly 625 630 635 640
Ala Ala Ala Asn Tvr Glv Glu Thr Tie Glu Asd Ala Cvs Asd Asn Glu 645 ‘ 650 * ' ' 655
Ala Leu lie Glu Glu lie Thr Gin Gin Leu Lys Glu lie Gly Asp Asp 660 665 670
Gly Asp Val Thr Pro Ser Asn Ala Ala Arg lie Gin Lys Phe Thr lie 675 680 685
Leu Pro Leu Asp Phe Ser Val Ser Thr Asp Glu Leu Thr Ala Thr Leu 690 695 700
Lys Leu Lys Arg Ser Val Val Ala Asp Lys Tyr Glu Asp lie lie Glu 705 710 715 720
Ala Phe Tyr Glu Ser Lys Ser Val Phe Val Pro Tyr Ser Thr Val Gly 725 730 735
Ala Tyr Ala Thr Gly Gly Pro Val Asp Asp Ser Val Val Asp Gly Ser 740 745 750
Phe Lys Gly Asp Phe Ser Met lie Gly Asp Asp Asp Pro Asp Leu Gin 755 760 765
Asn Val Asp Val Leu Glu Ala lie Asp Glu Asp Asn 770 775 780
<210> 86 <211> 2529 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 86 60 120 atggggtgct cggggtcgaa gcccgcggcg ccgggcgagg tcccggccgt gcaggggtac gaggtgacgg aggaggtcgc gcccgggccg tatgacccgg agaaggggcc gtactatgtg agcaacaagg cggagcgcag ggagatcatc ttcgcggcca agggcgtcgc gagcgaagca 491 180 200813222 acgacgcccg ccatgacgct ctcgaaaatg ttccgcaagg ccgccgaggc ctccaaggac 240 gaagtcgcgc tcgccgtcga gtggcccgtg cccgagatcg gcgccgacgg caagatcccc 300 gactccctgc ccctcgacaa gtggcgcacc tggacctttg gccagtacta cgcagactct 360 cacgccatgg cgcgcgccat cgtcgccctc ggcgccgagc gcttcgacgg cgtgaccatc 420 ttcggcttca actctccctt ttggctcatg gcccaaatgg ccgcaacgct ctccacgacc 480 ctccccgccg gcatctaccc cacggacacc gccgagcagg ttcgctacaa gctccgctac 540 acggacactg ccgtggcctt ttgcggcgtg gaaaaggagt tcaccatgct ccgcgccgcc 600 gtcgaggacg ccccggacct caaggccatc gtctgctggg cccacctgcc catggtcaag 660 accatcacgc gcgaggacgg ttccaaggtc aaggtcatgt cctggcagga ggccctcgcg 720 ctcggtgaaa tcacgccccc cgccgaggtc gacgcccgga tcgaggccca gaacccgggc 780 gactgtgccg agctcgtctt taccagtggc accaccgggc ttcccaaggc cgtcatgctc 840 agccatgaca acctctgctt cgcgatcacc agcatcgtca gcaccctcga ggactttggc 900 cgctctggcc cggagagcca cctctcgtat ctcccgctct cccatatcgc gggccaggag 960 atggacgttc tccttcccct cgtcgtgacc gcctttcgcg agagtcaeca cgccgtctac 1020 tttgtgcgtc cctacgatct caagaccgga acgctcattg accgtgtcaa gacggtgcag 1080 ccgaccgctt ttctgggcgt tccccgcgtc tacgaaaaga tcatggccaa gatgcgcgcc 1140 aagggagcct ccgtcaaggg cctcaagaag aagatcgttc agtacagcaa aaagaagggc 1200 ctcgaatacc agcgcaacct egaggtegge ggctccggcg gtaagccctc caactacggc 1260 tttgeegaga agaaggtcct gagcaaggtc aaggaggccc tcggtttcac ccgtctcaag 1320 tttgccatct ctggcgccgc gcccatgtct cgcgaggtcc aagagtactt tgctggcatc 1380 ggeattgega teettgaegt ctacggcgcc agegagagea cgggaggcgt caccggcaac 1440 tccatcaagg cccaccaatt cggtacggtc ggccacactc tgcccggcat ggacgttcgg 1500 gtcttccaaa aggeegaggg cggcgacagt agtgccgaga cgggtctcgg cgagctccgt 1560 gagccggcgc gggccaagga catcttccat ccctccgagg aggageaggg cgaagtctgc 1620 ttccgcggac gctccgtcat gctcggctac atggccaatc ccaagcttgg cgaggaacac 1680 gtegeegagg tcgagcgcaa aaacgcatcg gccatcgatc gccacggatg gtaccattcc 1740 ggtgacaagg gcgcctgttc caagaagaac atgtttgtca tcaccggtcg ctacaaggag 1800 atcattattg gcgccggtgg cgaaaacatt gcgcccctgc ccatggaaga tgccgtcaag 1860 tcccttgccc ccggcgttgc gaacgcaatc atgateggeg acaagcgcaa gttcaatatt 1920 atgctcatca cgcttcgcgc cgagggcgcc actggcgagt tcccgggctc ggacaacctc 1980 gaccccgatg tgeggageat tggctccgat tccacgcgca cgattcaaaa ggcaatggcc 2040 gactccaagt ggategagea tgtccgtgac gccatctcca agaccaacgc caatggcgac 2100 gcctgccaga gcaacgcctg gaagattggc agattcacca ttctccctta cgacatctcc 2160 atcgttggtg gcgagctcac gccgacgctc aagctcaagc gcaactttgt cgacgaaaag 2220 tacaaggctg tcattgacca tgtctatgcg cacgagggcg acagcaagga tctcacatac 2280 gtcccttgcc ccatcgaccg ggtgccgcgc aagatctctg gegaegagag cgctgctgga 2340 gctgcgagcc cggaggccaa tgtegeegag cctgtcacgg ccgagagcgg ttcaccttcg 2400 gaggtaaega ctgaggccaa gcctgccaac gaaaccgacg aegeegagag caaggacgcc 2460 492 200813222 2520 2529 gctgcgcccc ttgcggccaa ggtcgacacg acagttcctg acgtggcgca gcctcaggcc gccagetag
<210〉 87 <211〉 842 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 87
Met Gly Cys Ser Gly Ser Lys Pro Ala Ala Pro Gly Glu Val Pro Ala 15 10 15
Val Gin Gly Tyr Glu Val Thr Glu Glu Val Ala Pro Gly Pro Tyr Asp 20 25 30
Pro Glu Lys Gly Pro Tyr Tyr Val Ser Asn Lys Ala Glu Arg Arg Glu 35 40 45 lie lie Phe Ala Ala Lys Gly Val Ala Ser Glu Ala Thr Thr Pro Ala 50 55 60
Met Thr Leu Ser Lys Met Phe Arg Lys Ala Ala Glu Ala Ser Lys Asp 65 70 75 80
Glu Val Ala Leu Ala Val Glu Trp Pro Val Pro Glu lie Gly Ala Asp 85 90 95
Gly Lys lie Pro Asp Ser Leu Pro Leu Asp Lys Trp Arg Thr Trp Thr 100 105 110
Phe Gly Gin Tyr Tyr Ala Asp Ser His Ala Met Ala Arg Ala lie Val 115 120 125
Ala Leu Gly Ala Glu Arg Phe Asp Gly Val Thr lie Phe Gly Phe Asn 130 135 140
Ser Pro Phe Trp Leu Met Ala Gin Met Ala Ala Thr Leu Ser Thr Thr 145 150 155 160
Leu Pro Ala Gly lie Tyr Pro Thr Asp Thr Ala Glu Gin Val Arg Tyr 165 170 175
Lys Leu Arg Tyr Thr Asp Thr Ala Val Ala Phe Cys Gly Val Glu Lys 180 185 190
Glu Phe Thr Met Leu Arg Ala Ala Val Glu Asp Ala Pro Asp Leu Lys 195 200 205
Ala lie Val Cys Trp Ala His Leu Pro Met Val Lys Thr lie Thr Arg 210 215 220
Glu Asp Gly Ser Lys Val Lys Val Met Ser Trp Gin Glu Ala Leu Ala 225 230 235 240
Leu Gly Glu lie Thr Pro Pro Ala Glu Val Asp Ala Arg lie Glu Ala 245 250 255 493 200813222
Gin Asn Pro Gly Asp Cys Ala Glu Leu Val Phe Thr Ser Gly Thr Thr 260 265 270
Gly Leu Pro Lys Ala Val Met Leu Ser His Asp Asn Leu Cys Phe Ala 275 280 285 lie Thr Ser lie Val Ser Thr Leu Glu Asp Phe Gly Arg Ser Gly Pro 290 295 300
Glu Ser His Leu Ser Tyr Leu Pro Leu Ser His lie Ala Gly Gin Glu 305 310 315 320
Met Asp Val Leu Leu Pro Leu Val Val Thr Ala Phe Arg Glu Ser His 325 330 335
His Ala Val Tyr Phe Val Arg Pro Tyr Asp Leu Lys Thr Gly Thr Leu 340 345 350 lie Asp Arg Val Lys Thr Val Gin Pro Thr Ala Phe Leu Gly Val Pro 355 360 365
Arg Val Tyr Glu Lys lie Met Ala Lys Met Arg Ala Lys Gly Ala Ser 370 375 380
Val Lys Gly Leu Lys Lys Lys lie Val Gin Tyr Ser Lys Lys Lys Gly 385 390 395 400
Leu Glu Tyr Gin Arg Asn Leu Glu Val Gly Gly Ser Gly Gly Lys Pro 405 410 415
Ser Asn Tyr Gly Phe Ala Glu Lys Lys Val Leu Ser Lys Val Lys Glu 420 425 430
Ala Leu Gly Phe Thr Arg Leu Lys Phe Ala lie Ser Gly Ala Ala Pro 435 440 445
Met Ser Arg Glu Val Gin Glu Tyr Phe Ala Gly lie Gly lie Ala lie 450 455 460
Leu Asp Val Tyr Gly Ala Ser Glu Ser Thr Gly Gly Val Thr Gly Asn 465 470 475 480
Ser lie Lys Ala His Gin Phe Gly Thr Val Gly His Thr Leu Pro Gly 485 490 495
Met Asp Val Arg Val Phe Gin Lys Ala Glu Gly Gly Asp Ser Ser Ala 500 505 510
Glu Thr Gly Leu Gly Glu Leu Arg Glu Pro Ala Arg Ala Lys Asp lie 515 520 525
Phe His Pro Ser Glu Glu Glu Gin Gly Glu Val Cys Phe Arg Gly Arg 530 535 540
Ser Val Met Leu Gly Tyr Met Ala Asn Pro Lys Leu Gly Glu Glu His 494 200813222 545 550 555 560
Val Ala Glu Val Glu Arg Lys Asn Ala Ser Ala lie Asp Arg His Gly 565 570 575
Trp Tyr His Ser Gly Asp Lys Gly Ala Cys Ser Lys Lys Asn Met Phe 580 585 590
Val lie Thr Gly Arg Tyr Lys Glu lie lie lie Gly Ala Gly Gly Glu 595 600 605
Asn lie Ala Pro Leu Pro Met Glu Asp Ala Val Lys Ser Leu Ala Pro 610 615 620
Gly Val Ala Asn Ala lie Met lie Gly Asp Lys Arg Lys Phe Asn lie 625 630 635 640
Met Leu He Thr Leu Arg Ala Glu Gly Ala Thr Gly Glu Phe Pro Gly
Ser Asp Asn Leu Asp Pro Asp Val Arg Ser lie Gly Ser Asp Ser Thr 660 665 670
Arg Thr lie Gin Lys Ala Met Ala Asp Ser Lys Trp lie Glu His Val 675 680 685
Arg Asp Ala lie Ser Lys Thr Asn Ala Asn Gly Asp Ala Cys Gin Ser 690 695 700
Asn Ala Trp Lys lie Gly Arg Phe Thr lie Leu Pro Tyr Asp lie Ser 705 710 715 720 lie Val Gly Gly Glu Leu Thr Pro Thr Leu Lys Leu Lys Arg Asn Phe 725 730 735
Val Asp Glu Lys Tyr Lys Ala Val lie Asp His Val Tyr Ala His Glu 740 745 750
Gly Asp Ser Lys Asp Leu Thr Tyr Val Pro Cys Pro lie Asp Arg Val 755 760 765
Pro Arg Lys lie Ser Gly Asp Glu Ser Ala Ala Gly Ala Ala Ser Pro 770 775 780
Glu Ala Asn Val Ala Glu Pro Val Thr Ala Glu Ser Gly Ser Pro Ser 785 790 795 800
Glu Val Thr Thr Glu Ala Lys Pro Ala Asn Glu Thr Asp Asp Ala Glu 805 810 815
Ser Lys Asp Ala Ala Ala Pro Leu Ala Ala Lys Val Asp Thr Thr Val 820 825 830
Pro Asp Val Ala Gin Pro Gin Ala Ala Ser 835 840 495 60 200813222
<210〉 88 <211> 2040 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 88 atgcaggccc tgctgggcct cgtcatgaac caggaactcg aaggtggatc catgaagggc tgcatggccg tgcccgtggg caacgacacc taccgcaacg ctcgcgtcaa ggacgagctc tttacccagc cagacccgtc tattcagacc atgggcgaca tctggcgcga tacctgcgaa aaacacgccc agaacaactg catgggctgg cgtgacatcc tcagcatgac caaggacggc aacaaggaaa agtacgtcct tggcggctac aactggatca cctaccgcca ggctcagcgc cgcgcgcgca actttggcgc tggtctcgct gcccttggtg tgaaaaaggg cgaaatggtc aacttctttg ccgatacaaa ggccgagtgg cagctcggct gccagggctg ccttgagcgc ggcatcgtcg tggccaccag ctacgccaat cttggtcccg aggccgtcgc ctacggcctc aagcagacca agtgctcggt tgtctttacc gacgctgacc ttatcccgac gctcaacaag gttctcggcg actgccccga cgtcaagcac gtcgtcttct cgcgcgacaa gcgcccggcg aaccatccgg cccacaactc cgacgagaag gtgcgcgaca tgatcacgca cagcggcatc caggcgcaca gctttgaaga ggttgagcag ctcggcgagg gcgccaccaa ggaggacctt ccttcggtta agcccgatga caccggtgtc atcatgtaca cctcgggctc caccggcaac cccaagggcg tcatcatctc ccaccgcaac cttgttgccg gcattgccgg ttgcgccgat gccatttgcg gcatgagcac cgacgatgtc taccttgcct acctcccgct cgcgcacatt ctcgagctca tcgccgagag ctccctctac tttcgcggtg tcgccgtcgg ctacggctcc accaagacca tcaccgacgc atccgtgtgt atcgaggccg gcaagtgcgt cggtgacgcc aacgagctcc gccccacgct catggctgcc gtgcccatga ttatggacaa gatccgggcc ggtgtcatga acaagatcaa ctccactggc ggtatcacca agcagctctt cgagcttggc tttagccgca aaaaggctgc ccttgccgaa ggcaaagaat ctcccttctg gaacaagatc ctctttgaca acattcgcgc gcgcctcctt ggcggccgcg tccgctacat gctcagtggt ggcggcccgc tctccaagga cacgcaggac ttcatgaacg ttgtcttttg ctgccccgtc ggccagggat ggggtctcac tgagtccgtc ggcgtcgcca ccatttgctg gcccaacgac cgcaccgctg gccgtgtggg tgcccccatt tgctccatgc aaatcaagct cgaagactgg gaagagggcg gctactacgc tgaccctgct cgggctccgg aggacaacaa gcacccgcac ccgcgcggcg agctccttct tggcgggccc cagatcacca tgggctactt tgaggagccg gaaaagaccg aagaggccta ctttaccgac gaaaacggca cgcgctggct tcgcacgggc gacatcggcg aggtctaccc agatggcgcc tttgccatca tcgaccgcaa aaaggatctt gtcaagcttt ctggcggcga atacgtttcc tttggcaagc tcgagcccat gatccgcgac tcggaccatg ttgataacgc tatggtctac tgtgattctg aaaagtccta ttcggttgcc gtcattcaag tggcgtccga atccaaggac gtcgatgacg agcgcattca caaggacatc acttccatcc tcaagcgtgc gggctgcgca aagttcgaga tcccccaaaa catctacgtc gagcgcgacc tcgtctgggg ccctgataat gacctttgca cggctgctct caagctcaaa cgccgcaacc ttgtcaaaca ttacgacaag gagctcaagg agctctacaa tgagagctag 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 496 200813222
<210〉 89 <211〉 679 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 89
Met Gin Ala Leu Leu Gly Leu Val Met Asn Gin Glu Leu Glu Gly Gly 15 10 15
Ser Met Lys Gly Cys Met Ala Val Pro Val Gly Asn Asp Thr Tyr Arg 20 25 30
Asn Ala Arg Val Lys Asp Glu Leu Phe Thr Gin Pro Asp Pro Ser lie 35 40 45
Gin Thr Met Gly Asp lie Trp Arg Asp Thr Cys Glu Lys His Ala Gin 50 55 60
Asn Asn Cys Met Gly Trp Arg Asp lie Leu Ser Met Thr Lys Asp Gly 65 70 75 80
Asn Lys Glu Lvs Tvr Val Leu Glv Glv Tvr Asn Tro lie Thr Tvr Are 85 90 95
Gin Ala Gin Arg Arg Ala Arg Asn Phe Gly Ala Gly Leu Ala Ala Leu 100 105 110
Gly Val Lys Lys Gly Glu Met Val Asn Phe Phe Ala Asp Thr Lys Ala 115 120 125
Glu Trp Gin Leu Gly Cys Gin Gly Cys Leu Glu Arg Gly lie Val Val 130 135 140
Ala Thr Ser Tyr Ala Asn Leu Gly Pro Glu Ala Val Ala Tyr Gly Leu 145 150 155 160
Lys Gin Thr Lys Cys Ser Val Val Phe Thr Asp Ala Asp Leu lie Pro 165 170 175
Thr Leu Asn Lys Val Leu Gly Asp Cys Pro Asp Val Lys His Val Val 180 185 190
Phe Ser Arg Asp Lys Arg Pro Ala Asn His Pro Ala His Asn Ser Asp 195 200 205
Glu Lys Val Arg Asp Met lie Thr His Ser Gly lie Gin Ala His Ser 210 215 220
Phe Glu Glu Val Glu Gin Leu Gly Glu Gly Ala Thr Lys Glu Asp Leu 225 230 235 240
Pro Ser Val Lys Pro Asp Asp Thr Gly Val lie Met Tyr Thr Ser Gly 245 250 255
Ser Thr Gly Asn Pro Lys Gly Val lie lie Ser His Arg Asn Leu Val 260 265 270 497 200813222
Ala Gly lie Ala Gly Cys Ala Asp Ala lie Cys Gly Met Ser Thr Asp 275 280 285
Asp Val Tyr Leu Ala Tyr Leu Pro Leu Ala His lie Leu Glu Leu lie 290 295 300
Ala Glu Ser Ser Leu Tyr Phe Arg Gly Val Ala Val Gly Tyr Gly Ser 305 310 315 320
Thr Lys Thr lie Thr Asp Ala Ser Val Cys lie Glu Ala Gly Lys Cys 325 330 335
Val Gly Asp Ala Asn Glu Leu Arg Pro Thr Leu Met Ala Ala Val Pro 340 345 350
Met lie Met Asp Lys lie Arg Ala Gly Val Met Asn Lys lie Asn Ser 355 360 365
Thr Gly Gly lie Thr Lys Gin Leu Phe Glu Leu Gly Phe Ser Arg Lys 370 375 380
Lys Ala Ala Leu Ala Glu Gly Lys Glu Ser Pro Phe Trp Asn Lys lie 385 390 395 400
Leu Phe Asp Asn lie Arg Ala Arg Leu Leu Gly Gly Arg Val Arg Tyr 405 410 415
Met Leu Ser Gly Gly Gly Pro Leu Ser Lys Asp Thr Gin Asp Phe Met 420 425 430
Asn Val Val Phe Cys Cys Pro Val Gly Gin Gly Trp Gly Leu Thr Glu 435 440 445
Ser Val Gly Val Ala Thr lie Cys Trp Pro Asn Asp Arg Thr Ala Gly 450 455 460
Arg Val Gly Ala Pro lie Cys Ser Met Gin lie Lys Leu Glu Asp Trp 465 470 475 480
Glu Glu Gly Gly Tyr Tyr Ala Asp Pro Ala Arg Ala Pro Glu Asp Asn 485 490 495
Lys His Pro His Pro Arg Gly Glu Leu Leu Leu Gly Gly Pro Gin lie 500 505 510
Thr Met Gly Tyr Phe Glu Glu Pro Glu Lys Thr Glu Glu Ala Tyr Phe 515 520 525
Thr Asp Glu Asn Gly Thr Arg Trp Leu Arg Thr Gly Asp lie Gly Glu 530 535 540
Val Tyr Pro Asp Gly Ala Phe Ala lie lie Asp Arg Lys Lys Asp Leu 545 550 555 560
Val Lys Leu Ser Gly Gly Glu Tyr Val Ser Phe Gly Lys Leu Glu Pro 565 570 575 498 200813222
Met lie Arg Asp Ser Asp His Val Asp Asn Ala Met Val Tyr Cys Asp 580 585 590
Ser Glu Lys Ser Tyr Ser Val Ala Val lie Gin Val Ala Ser Glu Ser 595 600 605
Lys Asp Val Asp Asp Glu Arg lie His Lys Asp lie Thr Ser lie Leu 610 615 620
Lys Arg Ala Gly Cys Ala Lys Phe Glu lie Pro Gin Asn lie Tyr Val 625 630 635 640 ^ Glu Arg Asp Leu Val Trp Gly Pro Asp Asn Asp Leu Cys Thr Ala Ala 一 645 650 655 ~、 Leu Lys Leu Lys Arg Arg Asn Leu Val Lys His Tyr Asp Lys Glu Leu f 660 665 670
Lys Glu Leu Tyr Asn Glu Ser f 675
<210〉 90 <211〉 1737 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 90 atgctggaga tgcgcgagga ggtggtcaag cacgagggcg aggcggcgca cttcaagggc 60 gtcaagatga aggtgttccc gaacgggttc cagaccatgg tggatatctt caaggtgccc 120 tttgagaagc aggtcatgaa gaacgacttg ctcgtcgacg agaccggacg catgaccttt 180 caggaggtct ttgacaccgc cgccgcgctc ggcgacgccc tcgtcaacga gtacggcgtg 240 gaaaagggcg atcgcgtcgt cgctctctcc aagaaccgca acgagtacat tgtcaccatg 300 atcgcggcga cctcggtcgg cgccatcttt gcacccctca actcgtactg gaagacggag 360 cagctctcgt acggtctcga tgattcgggc gccaaggtcg tcgtctgcga cgccgaccgc 420 f tacgtgcagc tcgagcctct cctggacggc cgcgcctccg cactggagcg cgttcttctc 480 % ,/ ctccgtggcc ccggcactga aaagttccgc cccaacgcca agaccaccgc ctttgacgag 540 gtcattagca agcacgccgg cgccagaatg ccgccctttc cctgccaaaa ggatgaccct 600 : gccatgatca tgtacacctc gggaaccacc ggcaacccca agggcgtcgt gctcacgcac 660 cgcagcattg gcgaagccat gacgggcgcc gttgcagcca tgacgtacga gaagacgctt 720 gccgccacca gagctggcga gaccttgccc gagccggaag acccgtcgct gtcggccttc 780 ttgctcgccg tccctctctt ccacgtgacg ggccaccact gcgtcggtct gctctctatc 840 attagctgcc gcaagatcgt gctcatgagc aagtgggatc ccaagcttgc cctggagctc 900 attgagagcg agcgcattac aaactttact ggcgtgccca ccatggctct cgacctgatg 960 acccacccgg actttaagaa gcgggacacg agcacgctca agtctctcgg cggcggtggc 1020 gcagcgcctc cgagcaccat ggtgaacgac attgacaaga actttaaaca agcgtctccg 1080 ctgcaggcct ggggcatgac tgagaccaat ggcatcgcca ccctcaccga aggcgacatg 1140 taccggcgca agccggaaag ctgcggcaag gccatcccca atgtcgagat tgccatctgg 1200 499 1260 200813222 1320 1380 1440 1500 1560 1620 1680 1737 aatgctcgcg atgagcccgt gcccgccggc gccgagggag agcttgtcat tcgtgggtcc acctgcctca aagagtactg gaacaagccc gaggctacgg ccaagagcat cacggccgag ggctggttcc gaaccggtga cattggcgtc attgacgagg aaggctttct ccagctcaag ggtcgtagca aagagatcat cattcgcgga ggcgagaata tttcctgcgt cgttgtcgaa aacgcagtct acaatcacga tgatatcaat gaagtggcgg ctatcccagt cccccatccc acgcttggcg aggaggtcgg cattgccgtc tttagccagt ctggcgcgcg accctcgctc cagagcattc gcgatgtctg cgggaacctc gcgcgctatg aaatgcctac gcatatttat tattggcccg agcagctccc gcgtggagac acgggcaaga ttcataagcg caccattttg gccgacatca aggccggcaa ggtcaaggac gaggctgtgc ctgcctccaa gctctga
<210〉 91 <211〉 578 <212> PRT <213> 致殖壺菌(Schizochytrium sp.) <400> 91
Met Leu Glu Met Arg Glu Glu Val Val Lys His Glu Gly Glu Ala Ala 15 10 15
His Phe Lys Gly Val Lys Met Lys Val Phe Pro Asn Gly Phe Gin Thr 20 25 30
Met Val Asp lie Phe Lys Val Pro Phe Glu Lys Gin Val Met Lys Asn 35 40 45
Asp Leu Leu Val Asp Glu Thr Gly Arg Met Thr Phe Gin Glu Val Phe 50 55 60
Asp Thr Ala Ala Ala Leu Gly Asp Ala Leu Val Asn Glu Tyr Gly Val 65 70 75 80
Glu Lys Gly Asp Arg Val Val Ala Leu Ser Lys Asn Arg Asn Glu Tyr 85 90 95 lie Val Thr Met lie Ala Ala Thr Ser Val Gly Ala lie Phe Ala Pro 100 105 110
Leu Asn Ser Tyr Trp Lys Thr Glu Gin Leu Ser Tyr Gly Leu Asp Asp
Ser Gly Ala Lys Val Val Val Cys Asp Ala Asp Arg Tyr Val Gin Leu 130 135 140
Glu Pro Leu Leu Asp Gly Arg Ala Ser Ala Leu Glu Arg Val Leu Leu 145 150 155 160
Leu Arg Gly Pro Gly Thr Glu Lys Phe Arg Pro Asn Ala Lys Thr Thr
Ala Phe Asp Glu Val He Ser Lys His Ala Gly Ala Arg Met Pro Pro
Phe Pro Cys Gin Lys Asp Asp Pro Ala Met lie Met Tyr Thr Ser Gly 500 200813222 195 200 205
Thr Thr Gly Asn Pro Lys Gly Val Val Leu Thr His Arg Ser lie Gly 210 215 220
Glu Ala Met Thr Gly Ala Val Ala Ala Met Thr Tyr Glu Lys Thr Leu 225 230 235 240
Ala Ala Thr Arg Ala Gly Glu Thr Leu Pro Glu Pro Glu Asp Pro Ser 245 250 255
Leu Ser Ala Phe Leu Leu Ala Val Pro Leu Phe His Val Thr Gly His 260 265 270
His Cys Val Gly Leu Leu Ser lie lie Ser Cys Arg Lys lie Val Leu 275 280 285
Met Ser Lys Trp Asp Pro Lys Leu Ala Leu Glu Leu lie Glu Ser Glu 290 295 300
Arg lie Thr Asn Phe Thr Glv Val Pro Thr Met Ala Leu Asp Leu Met 305 310 315 320
Thr His Pro Asp Phe Lys Lys Arg Asp Thr Ser Thr Leu Lys Ser Leu 325 330 335
Gly Gly Gly Gly Ala Ala Pro Pro Ser Thr Met Val Asn Asp lie Asp 340 345 350
Lys Asn Phe Lys Gin Ala Ser Pro Leu Gin Ala Trp Gly Met Thr Glu 355 360 365
Thr Asn Gly lie Ala Thr Leu Thr Glu Gly Asp Met Tyr Arg Arg Lys 370 375 380
Pro Glu Ser Cys Gly Lys Ala lie Pro Asn Val Glu lie Ala lie Trp 385 390 395 400
Asn Ala Arg Asp Glu Pro Val Pro Ala Gly Ala Glu Gly Glu Leu Val 405 410 415 lie Arg Gly Ser Thr Cys Leu Lys Glu Tyr Trp Asn Lys Pro Glu Ala 420 425 430
Thr Ala Lys Ser lie Thr Ala Glu Gly Trp Phe Arg Thr Gly Asp lie 435 440 445
Gly Val lie Asp Glu Glu Gly Phe Leu Gin Leu Lys Gly Arg Ser Lys 450 455 460
Glu lie lie lie Arg Gly Gly Glu Asn lie Ser Cys Val Val Val Glu 465 470 475 480
Asn Ala Val Tyr Asn His Asp Asp lie Asn Glu Val Ala Ala lie Pro 485 490 495 501 200813222
Val Pro His Pro Thr Leu Gly Glu Glu Val Gly lie Ala Val Phe Ser 500 505 510
Gin Ser Gly Ala Arg Pro Ser Leu Gin Ser lie Arg Asp Val Cys Gly 515 520 525
Asn Leu Ala Arg Tyr Glu Met Pro Thr His lie Tyr Tyr Trp Pro Glu 530 535 540
Gin Leu Pro Arg Gly Asp Thr Gly Lys lie His Lys Arg Thr lie Leu 545 550 555 560
Ala Asp lie Lys Ala Gly Lys Val Lys Asp Glu Ala Val Pro Ala Ser 565 570 575
Lys Leu
<210〉 92 <211> 1809 <212〉 DNA <213〉裂殖壺菌(Schizochytrium sp.) <400> 92 atgccggcgc tgaccaagga gcaggaagcg gcgatcgacg cggcgctgca cgcgcccggg 60 acgctgctgg agctgcgcga ggaggtcatc gcgtacgagg agaaccatgc cccgcatcac 120 aagggcgtca agtaccaggt gtacccgaac ggcccccaga cgcttgtaga cctcttcagc 180 ttccccaagg cgaccggaaa cctcgacaac ccgttcctca tctacgagga caaacgatac 240 acctttcgcg aggccgacga ggaggcctcc gccctcggat ccgcgctcat taacgatttt 300 ggcgtcaaga ctctcgatcg cgtctgcatc gtctccaaaa accgacccga gtacgccatc 360 ggcgtcatgg cgtccacctc ggtcggagcc acctgcgtgc ccatgaactc gtggtggaag 420 accaaggagc tcgagtacgg cctcgacaac tcgggcacca agatcgtgct ttgcgatctc 480 gaccgctaca agctcctcgt ccccattctc gacaagctca ccaacctcga aaaggtcatc 540 ctcttcgacg acgccaacgc cggaagcgtc gagccccacc ccaagctcct catgtacaag 600 gacgtcgtgt ctaagcgccg cggcgacgcc atgccgcctc ttactgccgg caaggacgac 660 aatgccctca tcatgtacac ctcgggcacg acgggccatc ccaagggtgt cgtgctcacc 720 caccgcagca tctgccacgc catcacttgc gccgtggcgc acagtatccg ccaaaagatg 780 atggctgccg ccaaggccgg gaaaaccttc acgccggagg aggtcgaccc taaacacttt 840 gccgtcctgc tcaacgtacc tcttttccac gccacgggcc tccactcggt cttcttcctc 900 tccttcgtca ttggccgcaa gatggtcatg atggacaagt ggaacatcga gcaggccctc 960 cagctcatcg agcgcgagcg cgttaccaat tttaccggtg tgcccaccat ggtcctcgac 1020 atgatgaacc atcctaactt taaaaagtac gacaccagct ctctcgaggc tgttggcggt 1080 ggtggtgctg cccccccctc gactatggtc aaggacgtgc agagcaactt caagagcgct 1140 gcccctctgc agggttttgg catgaccgag accaacgccc tcacctgcct caacgatggt 1200 gatacgtatg ccgagcgccc caccagctgc ggtcgtgcta ccccgagcat ccagattgcc 1260 gtttgggacg acaacgacaa gcccctgccc gctggccaaa agggtaacgt catggtcaag 1320 ggcgccgcca acctcaagga gtactggcgt aagcccgagg ccaccgcgga taccatgact 1380 502 1440 200813222 1500 1560 1620 1680 1740 1800 1809 gccgatggat ggctgcgcac cggcgatgtt ggccacattg acgagggagg ttacctgcat ctgggcggcc gcaccaagga gattatcatc cgtggaggtg agaacatttc ttgcgtcgcc gtcgaggacg gtgtctacca gcattctggt gtcgccgagt gcgccgccat tcccgtcccc caccccactc tcggcgagga ggtcggtatc gtcgtcttcc ccaagaacgg tgccaagctg acgctcgagg agatcgttgc caagtgcgag gacctcgcca agttcgagtg ccccacgcac ttgtacattt ggcccgagca gcttcctcgc ggcgccacag gcaagatcgt caagcgtgat atccgtcaga tcatcgagga caacaagatc ctctccgagc agcaaaagaa tcccaagtcc aagctctaa
<210> 93 <211〉 602 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 93
Met Pro Ala Leu Thr Lys Glu Gin Glu Ala Ala lie Asp Ala Ala Leu 15 10 15
His Ala Pro Gly Thr Leu Leu Glu Leu Arg Glu Glu Val lie Ala Tyr 20 25 30
Glu Glu Asn His Ala Pro His His Lys Gly Val Lys Tyr Gin Val Tyr 35 40 45
Pro Asn Gly Pro Gin Thr Leu Val Asp Leu Phe Ser Phe Pro Lys Ala 50 55 60
Thr Gly Asn Leu Asp Asn Pro Phe Leu He Tyr Glu Asp Lys Arg Tyr 65 70 75 80
Thr Phe Arg Glu Ala Asp Glu Glu Ala Ser Ala Leu Gly Ser Ala Leu 85 90 95 lie Asn Asp Phe Gly Val Lys Thr Leu Asp Arg Val Cys lie Val Ser 100 105 110
Lys Asn Arg Pro Glu Tyr Ala lie Gly Val Met Ala Ser Thr Ser Val 115 120 125
Gly Ala Thr Cys Val Pro Met Asn Ser Trp Trp Lys Thr Lys Glu Leu 130 135 140
Glu Tyr Gly Leu Asp Asn Ser Gly Thr Lys lie Val Leu Cys Asp Leu 145 150 155 160
Asp Arg Tyr Lys Leu Leu Val Pro lie Leu Asp Lys Leu Thr Asn Leu 165 170 175
Glu Lys Val lie Leu Phe Asp Asp Ala Asn Ala Gly Ser Val Glu Pro 180 185 190
His Pro Lys Leu Leu Met Tyr Lys Asp Val Val Ser Lys Arg Arg Gly 195 200 205 503 200813222
Asp Ala Met Pro Pro Leu Thr Ala Gly Lys Asp Asp Asn Ala Leu lie 210 215 220
Met Tyr Thr Ser Gly Thr Thr Gly His Pro Lys Gly Val Val Leu Thr 225 230 235 240
His Arg Ser lie Cys His Ala lie Thr Cys Ala Val Ala His Ser lie 245 250 255
Arg Gin Lys Met Met Ala Ala Ala Lys Ala Gly Lys Thr Phe Thr Pro 260 265 270
Glu Glu Val Asp Pro Lys His Phe Ala Val Leu Leu Asn Val Pro Leu 275 280 285
Phe His Ala Thr Gly Leu His Ser Val Phe Phe Leu Ser Phe Val lie 290 295 300
Gly Arg Lys Met Val Met Met Asp Lys Trp Asn lie Glu Gin Ala Leu 305 310 315 320
Gin Leu lie Glu Arg Glu Arg Val Thr Asn Phe Thr Gly Val Pro Thr 325 330 335
Met Val Leu Asp Met Met Asn His Pro Asn Phe Lys Lys Tyr Asp Thr 340 345 350
Ser Ser Leu Glu Ala Val Gly Gly Gly Gly Ala Ala Pro Pro Ser Thr 355 360 365
Met Val Lys Asp Val Gin Ser Asn Phe Lys Ser Ala Ala Pro Leu Gin 370 375 380
Gly Phe Gly Met Thr Glu Thr Asn Ala Leu Thr Cys Leu Asn Asp Gly 385 390 395 400
Asp Thr Tyr Ala Glu Arg Pro Thr Ser Cys Gly Arg Ala Thr Pro Ser 405 410 415 lie Gin lie Ala Val Trp Asp Asp Asn Asp Lys Pro Leu Pro Ala Gly 420 425 430
Gin Lys Gly Asn Val Met Val Lys Gly Ala Ala Asn Leu Lys Glu Tyr 435 440 445
Trp Arg Lys Pro Glu Ala Thr Ala Asp Thr Met Thr Ala Asp Gly Trp 450 455 460
Leu Arg Thr Gly Asp Val Gly His lie Asp Glu Gly Gly Tyr Leu His 465 470 475 480
Leu Gly Gly Arg Thr Lys Glu lie lie lie Arg Gly Gly Glu Asn lie 485 490 495
Ser Cys Val Ala Val Glu Asp Gly Val Tyr Gin His Ser Gly Val Ala 504 200813222 500 505 510
Glu Cys Ala Ala lie Pro Val Pro His Pro Thr Leu Gly Glu Glu Val 515 520 525
Gly lie Val Val Phe Pro Lys Asn Gly Ala Lys Leu Thr Leu Glu Glu 530 535 540 lie Val Ala Lys Cys Glu Asp Leu Ala Lys Phe Glu Cys Pro Thr His 545 550 555 560
Leu Tyr lie Trp Pro Glu Gin Leu Pro Arg Gly Ala Thr Gly Lys lie 565 570 575
Val Lys Arg Asp lie Arg Gin lie lie Glu Asp Asn Lys lie Leu Ser 580 585 590
Glu Gin Gin Lys Asn Pro Lys Ser Lys Leu 595 600
<210〉 94 <211> 1923 <212> DNA <213> 裂殖壺菌(Schizochytrium sp_) <400〉 94 atgcggcgaa cgagcttcgc actcgcgagc aggcgcctgc ggctgcaaga gagactcagg ctgggcgcga gaagcgcgac ccagcggatg caaagcacgg acgcgcgatt ttaccgagca agcgctgcgt tttcgtccca ggccagcttc cccgacgacc tcggcacgac ctacctcgtc ggggaccagc ggctcgcaca cgccaaaggg ccgaccggac tcacgctgta cgagcgcacc attgatgage atttccgggc ggeagtegag gctcgaccgg acaagcaagc agctgtcgtc tgtgacggcg cagaccatgt cgacgcccga cactcatacg cgtctctcga cgccaaggtg gaegatetag ctcgcggact cttgcgactc ggegtegage gcggagaccg cgtcggcgtg tggatgccaa acaatgaggc atggcttttg acgcagcttg cgacggcgcg catcggagcc atccttgtct gtattaatcc gaattacagg cttcgcgagc tgacgcacgc tctcaacctc gtcgaactca gcgtgctcat catgaaccct cacgtttcgc gctcaaacta cattgaaatg cttcacactc tcgttccctc ettgegegaa aggacgcaaa gcacgtgccg ggaccccgta caaagtgaca aagtgcctca ccttcgccac gttgtcctgg cagaggcaga cggctccgac ggcgaggaca cctttatccg ettegaggae ettetegaaa aggaeggage tgcggccgtt cctacgggcc agggcctttt gcaacccgac gacccaatta acattcagtt cacaagtgga accacaggag ctcctaaggg agctctgctg tcgagccgca atattgtcaa caatggtaac tttgtgggcg cctgcatccg tcttacgcca gacgacatta tcaatgtccc cgtgcccttg taccactgct ttggagtcgt catgggcaac ttggcgtcca tttcgcatgg cgcttctgtg gtgtatccgg cgcgtgtatt ctccgcgagc aaaacgctca gtgtggtcga gteggagege tgtactgcgc tttacggagt gcctaccatg ttttctgcca tgcttgcgta ccagcaagag gccaaacacg acgtttcgac gctgcggacg ggcattatgg caggaagcaa ctgtccgcgt gaaatgatgc gtcgggttgt tgccgagttg aacatgaccg acacctgcat tggctacggt 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 505 1260 1320 200813222 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1923 cagaccgagt cttctcccgt gagtttcatg tcgcgcatcg tcgatgacga ggatcaccgc tgcgagaccg tgggtcgcat cactccgcac atagaagcca aggttgtgga tgaggatgga gagactcttc cggttggtgt tccgggtgag ctttacgtga gaggctatca catctttaag ggctacataa atgctccgga gcagaccaag gctaccttga cggacgatgg ctggctgcgt acgggcgacc tcgttgactt ggaccgcgat ggttacctac gcgtagatgg ccgcctcaag gacgtgatta ttcgaggcgg cgagaatatc gccccgcgcg aatgcgaaga gctcattctc gagctccccg gcgttcttac cgtggccgtc gtgggtgtgc ccgacgaggt ctttggcgag caagtctgcg cagtggtggt gccgaacatg gacacatccg aaggcaaggc gctcgatggc gatgctgtgc gcgattttgt ccgggctgag ctctctcatc aaaaggtgcc aaagttcgtc ctttttcgcc actcctttga cgaattcatg actgtcactg gcaagctgcg aaagtttcaa gtgcgagact gggcgaccaa ggagacatct gcgcagaagg aagctgctgc caaagctgct taa
<210> 95 <211> 640 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 95
Met Arg Arg Thr Ser Phe Ala Leu Ala Ser Arg Arg Leu Arg Leu Gin 15 10 15
Glu Arg Leu Arg Leu Gly Ala Arg Ser Ala Thr Gin Arg Met Gin Ser 20 25 30
Thr Asp Ala Arg Phe Tyr Arg Ala Ser Ala Ala Phe Ser Ser Gin Ala 35 40 45
Ser Phe Pro Asp Asp Leu Gly Thr Thr Tyr Leu Val Gly Asp Gin Arg 50 55 60
Leu Ala His Ala Lys Gly Pro Thr Gly Leu Thr Leu Tyr Glu Arg Thr 65 70 75 80 lie Asp Glu His Phe Arg Ala Ala Val Glu Ala Arg Pro Asp Lys Gin 85 90 95
Ala Ala Val Val Cys Asp Gly Ala Asp His Val Asp Ala Arg His Ser 100 105 110
Tyr Ala Ser Leu Asp Ala Lys Val Asp Asp Leu Ala Arg Gly Leu Leu 115 120 125
Arg Leu Gly Val Glu Arg Gly Asp Arg Val Gly Val Trp Met Pro Asn 130 135 140
Asn Glu Ala Trp Leu Leu Thr Gin Leu Ala Thr Ala Arg lie Gly Ala 145 150 155 160 lie Leu Val Cys lie Asn Pro Asn Tyr Arg Leu Arg Glu Leu Thr His 165 170 175 506 200813222
Ala Leu Asn Leu Val Glu Leu Ser Val Leu lie Met Asn Pro His Val 180 185 190
Ser Arg Ser Asn Tyr lie Glu Met Leu His Thr Leu Val Pro Ser Leu 195 200 205
Arg Glu Arg Thr Gin Ser Thr Cys Arg Asp Pro Val Gin Ser Asp Lys 210 215 220
Val Pro His Leu Arg His Val Val Leu Ala Glu Ala Asp Gly Ser Asp 225 230 235 240
Gly Glu Asp Thr Phe lie Arg Phe Glu Asp Leu Leu Glu Lys Asp Gly 245 250 255
Ala Ala Ala Val Pro Thr Gly Gin Gly Leu Leu Gin Pro Asp Asp Pro 260 265 270 lie Asn lie Gin Phe Thr Ser Gly Thr Thr Gly Ala Pro Lys Gly Ala 275 280 285
Leu Leu Ser Ser Arg Asn lie Val Asn Asn Gly Asn Phe Val Gly Ala 290 295 300
Cys lie Arg Leu Thr Pro Asp Asp lie lie Asn Val Pro Val Pro Leu 305 310 315 320
Tyr His Cys Phe Gly Val Val Met Gly Asn Leu Ala Ser lie Ser His 325 330 335
Gly Ala Ser Val Val Tyr Pro Ala Arg Val Phe Ser Ala Ser Lys Thr 340 345 350
Leu Ser Val Val Glu Ser Glu Arg Cys Thr Ala Leu Tyr Gly Val Pro 355 360 365
Thr Met Phe Ser Ala Met Leu Ala Tyr Gin Gin Glu Ala Lys His Asp 370 375 380
Val Ser Thr Leu Arg Thr Gly lie Met Ala Gly Ser Asn Cys Pro Arg 385 390 395 400
Glu Met Met Arg Arg Val Val Ala Glu Leu Asn Met Thr Asp Thr Cys 405 410 415 lie Gly Tyr Gly Gin Thr Glu Ser Ser Pro Val Ser Phe Met Ser Arg 420 425 430 lie Val Asp Asp Glu Asp His Arg Cys Glu Thr Val Gly Arg lie Thr 435 440 445
Pro His lie Glu Ala Lys Val Val Asp Glu Asp Gly Glu Thr Leu Pro 450 455 460
Val Gly Val Pro Gly Glu Leu Tyr Val Arg Gly Tyr His lie Phe Lys 465 470 475 480 507 200813222
Gly Tyr lie Asn Ala Pro Glu Gin Thr Lys Ala Thr Leu Thr Asp Asp 485 490 495
Gly Trp Leu Arg Thr Gly Asp Leu Val Asp Leu Asp Arg Asp Gly Tyr 500 505 510
Leu Arg Val Asp Gly Arg Leu Lys Asp Val lie lie Arg Gly Gly Glu 515 520 525
Asn lie Ala Pro Arg Glu Cys Glu Glu Leu lie Leu Glu Leu Pro Gly 530 535 540
Val Leu Thr Val Ala Val Val Gly Val Pro Asp Glu Val Phe Gly Glu 545 550 555 560
Gin Val Cys Ala Val Val Val Pro Asn Met Asp Thr Ser Glu Gly Lys 565 570 575
Ala Leu Asp Gly Asp Ala Val Arg Asp Phe Val Arg Ala Glu Leu Ser 580 585 590
His Gin Lys Val Pro Lys Phe Val Leu Phe Arg His Ser Phe Asp Glu 595 600 605
Phe Met Thr Val Thr Gly Lys Leu Arg Lys Phe Gin Val Arg Asp Trp 610 615 620
Ala Thr Lys Glu Thr Ser Ala Gin Lys Glu Ala Ala Ala Lys Ala Ala 625 630 635 640
<210> 96 <211> 1893 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 96 atggatgcag aaaaggtcat caaggcgggc gccgccgcgg gcgcagcgta cctgggatgg aagtatctcg acgagaagca cggcatcagc cacgacctgg agctggcgcg gcgcctgctc aagctcaaga aagagatcaa cgagcgcaac acgaaacgcg tctttaatgt gaccaacatg tggtacgagg cgtacgccaa gaacccgaaa aagccggcgc tcctctacct cgacgaggtc gtcacgtacc aggacatgga ggaccgctca aaccaggtgg ccaactggct cctgagcaag gggctcaagc gcggcgacac cgtggccctt ctcatggaga accgtcccga gttcgtcatc tcgtggctcg gcatgaccaa gatcggcgtc aaggtcgcgc tcatcaacac gagcatcaaa cagaagcctc tcttgcattg cctgaaaatc tcggggtgca aaatcgttct ctttggaagc gagctcgcgg agcccatcct cgacatcaag gacgagctcg ccgacctcgg catcgagctt gccgccgagg gcgcgcgtga agcctctccc gactggatcg aggtcgtcaa cccggaaatc gaggcctcgc ccaagaccgc gacctcgccc aagcttcgcg aaggcatcgg tatgcaggac gtctttggct tcatttacac ctcgggcacc acgggtctgc ccaaggcggc tgtcattctt caccaaaaaa tgtttagctt tggcgccctc atgaccaacg ccttccagtg cactcaggac gatattgtct acacctgcct tccgctcttc cacagcgcgg gcggcggtct cggcatcggc 508 200813222 atcatgctct acaccggagc caccgtggtc atcaagcgca agttcagcgt cacggacttt tggagcgatt gcgtcaagta caagtgcact gtcgtacagt acattggtga actctgccgg tacctcgtca tggccgagtc gcggcccgag gagacccagc acaaggtccg ccttgccatc ggcaacggcc tgcggcccga gatctgggcc gagtttcagg agcgcttcca gattccgcaa attggcgagt tctatggcgc caccgagggc aatggcgccc tcgtacagca ctgcaccaag cccgaagacc gcggtgccgt cgggcgcatg ggttcgctgc tcatgcgcgt tacgggcgtc aagtttgctc gcttcgatgt cctcgaggag gcaccggtgc gcggcgctga cggcttttgc atcgaatgtg acgtcgacga gcctggcgag ctcctttttc ctattcgcga caacgacccc agctctgcct ttgccggcta caacgacccc aaggccacag caaagaagat catcacggac gcctttacca agggcgacaa gtactttcgc accggcgact tgctcagtcg tgatgcccgc ggccgcatct actttcgcga ccgcatcggc gacacctttc gctgtaaggg cgaaaacgtt tccaccagcg aggtcgccga agtcctttct acctatccgg gtatcgagga gctcaacatc tatggcgttc agatccccaa caatgaagat ggccgctttc cctgtgctgc tcttacgccc aaggatagcg acctttccaA cgttgatrtr aaaggatttt acgagrargr raagaagaat cttccgagtt actcgatccc gatgttcatt cgcgtacagc cggtcatgcc tgtgactgcc acgatgaagc atcaaaaggt gcagcttcgc aaggaaggca tggacattca cgtcatcaag gaccctatgt actggctcca tgacgtaaag aaggagtatg atcccttgac ggaggaggac tacgcgcgca tcatcggaca acgcgcgcgt ctt
<210〉 97 <211> 631 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 97
Met Asp Ala Glu Lys Val lie Lys Ala Gly Ala Ala Ala Gly Ala Ala 15 10 15
Tyr Leu Gly Trp Lys Tyr Leu Asp Glu Lys His Gly lie Ser His Asp 20 25 30
Leu Glu Leu Ala Arg Arg Leu Leu Lys Leu Lys Lys Glu lie Asn Glu 35 40 45
Arg Asn Thr Lys Arg Val Phe Asn Val Thr Asn Met Trp Tyr Glu Ala 50 55 60
Tyr Ala Lys Asn Pro Lys Lys Pro Ala Leu Leu Tyr Leu Asp Glu Val 65 70 75 80
Val Thr Tyr Gin Asp Met Glu Asp Arg Ser Asn Gin Val Ala Asn Trp 85 90 95
Leu Leu Ser Lys Gly Leu Lys Arg Gly Asp Thr Val Ala Leu Leu Met 100 105 110
Glu Asn Arg Pro Glu Phe Val lie Ser Trp Leu Gly Met Thr Lys lie 115 120 125 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1893 509 200813222
Gly Val Lys Val Ala Leu lie Asn Thr Ser lie Lys Gin Lys Pro Leu 130 135 140
Leu His Cys Leu Lys lie Ser Gly Cys Lys lie Val Leu Phe Gly Ser 145 150 155 160
Glu Leu Ala Glu Pro lie Leu Asp lie Lys Asp Glu Leu Ala Asp Leu 165 170 175
Gly lie Glu Leu Ala Ala Glu Gly Ala Arg Glu Ala Ser Pro Asp Trp 180 185 190 lie Glu Val Val Asn Pro Glu lie Glu Ala Ser Pro Lys Thr Ala Thr 195 200 205
Ser Pro Lys Leu Arg Glu Gly lie Gly Met Gin Asp Val Phe Gly Phe 210 215 220 lie Tyr Thr Ser Gly Thr Thr Gly Leu Pro Lys Ala Ala Val lie Leu 225 230 235 240
His Gin Lys Met Phe Ser Phe Gly Ala Leu Met Thr Asn Ala Phe Gin 245 250 255
Cys Thr Gin Asp Asp lie Val Tyr Thr Cys Leu Pro Leu Phe His Ser 260 265 270
Ala Gly Gly Gly Leu Gly lie Gly lie Met Leu Tyr Thr Gly Ala Thr 275 280 285
Val Val lie Lys Arg Lys Phe Ser Val Thr Asp Phe Trp Ser Asp Cys 290 295 300
Val Lys Tyr Lys Cys Thr Val Val Gin Tyr lie Gly Glu Leu Cys Arg 305 310 315 320
Tyr Leu Val Met Ala Glu Ser Arg Pro Glu Glu Thr Gin His Lys Val 325 330 335
Arg Leu Ala lie Gly Asn Gly Leu Arg Pro Glu lie Trp Ala Glu Phe 340 345 350
Gin Glu Arg Phe Gin lie Pro Gin lie Gly Glu Phe Tyr Gly Ala Thr 355 360 365
Glu Gly Asn Gly Ala Leu Val Gin His Cys Thr Lys Pro Glu Asp Arg 370 375 380
Gly Ala Val Gly Arg Met Gly Ser Leu Leu Met Arg Val Thr Gly Val 385 390 395 400
Lys Phe Ala Arg Phe Asp Val Leu Glu Glu Ala Pro Val Arg Gly Ala 405 410 415
Asp Gly Phe Cys lie Glu Cys Asp Val Asp Glu Pro Gly Glu Leu Leu 510 200813222 420 425 430
Phe Pro lie Arg Asp Asn Asp Pro Ser Ser Ala Phe Ala Gly Tyr Asn 435 440 445
Asd Pro Lvs Ala Thr Ala Lys Lys lie lie Thr Asp Ala Phe Thr Lys 450 455 460
Glv Asd Lvs Tyr Phe Arg Thr Gly Asp Leu Leu Ser Arg Asp Ala Arg 465 470 475 480
Glv Are lie Tyr Phe Arg Asp Arg lie Gly Asp Thr Phe Arg Cys Lys 485 490 495
Gly Glu Asn Val Ser Thr Ser Glu Val Ala Glu Val Leu Ser Thr Tyr 500 505 510
Pro Gly lie Glu Glu Leu Asn lie Tyr Gly Val Gin lie Pro Asn Asn 515 520 525
Gin A^d Glv Ar? Phe Pro Cvs Ala Ala Leu Thr Pro Lvs Asp Ser Asd 530 ^ 535 540
Leu Ser Asn Val Asp Leu Lys Gly Phe Tyr Glu His Ala Lys Lys Asn 545 550 555 560
Leu Pro Ser Tyr Ser lie Pro Met Phe lie Arg Val Gin Pro Val Met 565 570 575
Pro Val Thr Ala Thr Met Lys His Gin Lys Val Gin Leu Arg Lys Glu 580 585 590
Gly Met Asp He His Val lie Lys Asp Pro Met Tyr Trp Leu His Asp 595 600 605
Val Lys Lys Glu Tyr Asp Pro Leu Thr Glu Glu Asp Tyr Ala Arg lie 610 615 620
lie Gly Gin Arg Ala Arg Leu 625 630 <210> 98 <211> 2950 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 98 atgcgatgcg gacgcatctc tacagcctcc tcagcgctag ccggcctttg gaccatcttc catgcaaaca aactgctgcg cttgcttcag cctgctgcag ctgcacgagg ccggcgcgga ccgctcgtct cagttgttct cgagctcgga cttcctcttc cttctttctg cctgcctgct gccattctta cgtgcgtacg catagtatac tactttggca acaactgcaa gtgcagcaaa gcacaatgcc gttctgtaca gaacgggaac gctcggcgcc gacctcgact cggactcgga cgccgagagc ttcaagttca accgcagtgc ggttgcggtg gccgatgaag aggaggccga gagcctcacc gagagcagga cggagaggga agcggtccgg aggggctgca ctgggcaagc 511 480 200813222 aagctgggct aacaggaaga gctgagcaga gccaagctac gctgagcgcc gctcgggcag catgccatcc atggcttcaa ggtggtgagg ctgggccggc aaagcccgaa ctcgagagac agctcgcgag cgcgtgcgtc ccctgggcag gccgagaaga ccgcagcgga gggcaaggat cgaggtatcg tcggagaccg ggaggaccgg gagcgcgcga tgggcagcgg aggcaaggat gacgccggat cgggcgccag ggcagcagca gcagccaaga aggacaaacc ccttgcgacg gttgaggtgc tggattctgg gcggcctgac ctgggtctgg gtccaatccg gcgctgcgcg atgccgttcg ggcctgagct ctctgtcgag gggatgcgca cgctgtttga ggtttttcga cgctcggtcg ataaacacgg ggaccgccca tgcctgggta gccgcccagt tggcgaggat ggcgaacctg ggccgttctc gttcatgacc tacaatgaag tgcacaagca cgccatggcc ttttcgcacg gcctcgtgca ccttgacgtg gtccacgcca acgacgaggg ccacaagctg cttggcttct ttgcagtaaa ccgccctggc gtcgtcatgt gtgagatcgg cgccatggcc cagcgcatcg tgcccgtgcc cctgtacgcg accctcggca ccgaggccgt cgagcacatc atcgaccaga cccagatgga ggtcattgtc tgcacgagca gcgagctcga ggacacgctg tccaagtccg aggaggtcat gaagcagctc agcactatca ttctcctcga tgaggacctt ggcgacgccc gccttgatga gctccgcaag atcggcgctg acgccgaggt caaggtgtac acgattgccg atgtcgagga gcttggcgag gcgcatgaag gcccgcttga tctcccgagc ggcgacgacc tcgcggtact ctgctacacg agcgggtcca cgggaacacc caagggcgtc ctcattacgc acagcagcat catctcggcg gtggccagtc tgcgccgctt tggtatcgat gtgcacgaag acgacgtgca cctttcatac ttgccattgg cgcatatttt cgagcgcgca ctcatgtacg ccatgctgta cggcggcgcc tccgtggggt ttttccgggg ttcctccaag gctatcttgg cagacctcaa ggccctgcgg cccaccattt tccccacggt gccccgtctg ctcaacaaga tgcacgactc gatctggtcc aaggtccggg agacgggcgg cgccaagcag gtcatctttg agaatgcgct ccaggccaag ttggagaacc ttcacggcgt gacgacgcgc gacaagctca atgccctgct cgaggactca accgtgacct cgtggctgtt ccagcgcact gtcaaggaca aggtcgagga cctgcgcacg ggccgcatca tccggcaaat tgctgggggc agcgacgagg acgtggagcg cgccgggggt ctccaacagt ggctctttga aaaggcgctg cgcgccaagt cgcaccagga gcccagcgtg gactttagca gctccgaggg ggaggtgact gcgcgctcca agaagccgct ttcggatcaa gtctttgacc ggatcgtttt cgacgcgctc aagaagaaga ttggccttga ccgcacgcgc attattgctg tcggatcagc gcccattaca ggcgaggttc ttgacttttt ccgctgcatg ctgggcattc ccgtgctcaa tgcctttgga tcgaccgaga gctcatgcgt gatttccctt acccacccgg aagatctttc gagcggccac gtgggtattc ctgcgccctg caacgaggta cgtctcacca atgtcgacga catgggctac aaggccaccg acacggagca caatggcgtt ccgtgcctgg gacggggcga gatctgcttc cggggcccga acgccttcaa ggggtactac aagatgaagg agaagacgga agagactctc accaaggacg gctggtgtct gacgggcgac attggtatgt ggaccgagga tggaatgctc aagattattg accgcaagaa gaatcttttc aagctggccc aaggcgagta cgtggcgcct gaaaaggtcg agaacgctta ctgccgcgcc gatctgctcg agtccatgtt cgtgtacggt gactctgaaa agtccaacct tgttgccatc attcaccctg acgcggacgt cgtctctgag 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 512 200813222 2760 2820 2880 2940 2950 gttggattgc agatggagga ctcgaaggag ctccacgacc gcatccagga tgagctcgac cagcaggctg acgccgcggg tctcaagggc tttgagcgcg tgcgtgcttt tcacattgaa accacgcctt ttacggaggt tgagggcatc actacggcca cgcagaagat caagcgtgcg gcagccaagg agcactacga ggacgtcatc gagaagctct acaaggagat cgacgagtaa atagacaata
<210> 99 <211> 766 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 99
Met Gly Ser Gly Gly Lys Asp Asp Ala Gly Ser Gly Ala Arg Ala Ala 15 10 15
Ala Ala Ala Lys Lys Asp Lys Pro Leu Ala Thr Val Glu Val Leu Asp 20 25 30
Ser Glv Ar? Pro Asd Leu Glv Leu Glv Pro lie Arg Arg Cvs Ala Met 35^ 40 ~ 45
Pro Phe Gly Pro Glu Leu Ser Val Glu Gly Met Arg Thr Leu Phe Glu 50 55 60
Val Phe Arg Arg Ser Val Asp Lys His Gly Asp Arg Pro Cys Leu Gly 65 70 75 80
Ser Arg Pro Val Gly Glu Asp Gly Glu Pro Gly Pro Phe Ser Phe Met 85 90 95
Thr Tyr Asn Glu Val His Lys His Ala Met Ala Phe Ser His Gly Leu 100 105 110
Val His Leu Asp Val Val His Ala Asn Asp Glu Gly His Lys Leu Leu 115 120 125
Gly Phe Phe Ala Val Asn Arg Pro Gly Val Val Met Cys Glu lie Gly 130 135 140
Ala Met Ala Gin Arg lie Val Pro Val Pro Leu Tyr Ala Thr Leu Gly 145 150 155 160
Thr Glu Ala Val Glu His lie lie Asp Gin Thr Gin Met Glu Val lie 165 170 175
Val Cys Thr Ser Ser Glu Leu Glu Asp Thr Leu Ser Lys Ser Glu Glu 180 185 190
Val Met Lys Gin Leu Ser Thr lie lie Leu Leu Asp Glu Asp Leu Gly 195 200 205
Asp Ala Arg Leu Asp Glu Leu Arg Lys lie Gly Ala Asp Ala Glu Val 210 215 220 513 200813222
Lys Val Tyr Thr lie Ala Asp Val Glu Glu Leu Gly Glu Ala His Glu 225 230 235 240
Gly Pro Leu Asp Leu Pro Ser Gly Asp Asp Leu Ala Val Leu Cys Tyr 245 250 255
Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Val Leu lie Thr His Ser 260 265 270
Ser lie lie Ser Ala Val Ala Ser Leu Arg Arg Phe Gly lie Asp Val 275 280 285
His Glu Asp Asp Val His Leu Ser Tyr Leu Pro Leu Ala His lie Phe 290 295 300
Glu Arg Ala Leu Met Tyr Ala Met Leu Tyr Gly Gly Ala Ser Val Gly 305 310 315 320
Phe Phe Arg Gly Ser Ser Lys Ala lie Leu Ala Asp Leu Lys Ala Leu 325 330 335
Arg Pro Thr lie Phe Pro Thr Val Pro Arg Leu Leu Asn Lys Met His 340 345 350
Asp Ser lie Trp Ser Lys Val Arg Glu Thr Gly Gly Ala Lys Gin Val 355 360 365 lie Phe Glu Asn Ala Leu Gin Ala Lys Leu Glu Asn Leu His Gly Val 370 375 380
Thr Thr Arg Asp Lys Leu Asn Ala Leu Leu Glu Asp Ser Thr Val Thr 385 390 395 400
Ser Trp Leu Phe Gin Arg Thr Val Lys Asp Lys Val Glu Asp Leu Arg 405 410 415
Thr Gly Arg lie lie Arg Gin lie Ala Gly Gly Ser Asp Glu Asp Val 420 425 430
Glu Arg Ala Gly Gly Leu Gin Gin Trp Leu Phe Glu Lys Ala Leu Arg 435 440 445
Ala Lys Ser His Gin Glu Pro Ser Val Asp Phe Ser Ser Ser Glu Gly 450 455 460
Glu Val Thr Ala Arg Ser Lys Lys Pro Leu Ser Asp Gin Val Phe Asp 465 470 475 480
Arg lie Val Phe Asp Ala Leu Lys Lys Lys lie Gly Leu Asp Arg Thr 485 490 495
Arg lie lie Ala Val Gly Ser Ala Pro lie Thr Gly Glu Val Leu Asp 500 505 510
Phe Phe Arg Cys Met Leu Gly lie Pro Val Leu Asn Ala Phe Gly Ser 515 520 525 514 200813222
Thr Glu Ser Ser Cys Val lie Ser Leu Thr His Pro Glu Asp Leu Ser 530 535 540
Ser Gly His Val Gly lie Pro Ala Pro Cys Asn Glu Val Arg Leu Thr 545 550 555 560
Asn Val Asp Asp Met Gly Tyr Lys Ala Thr Asp Thr Glu His Asn Gly 565 570 575
Val Pro Cys Leu Gly Arg Gly Glu lie Cys Phe Arg Gly Pro Asn Ala 580 585 590
Phe Lys Gly Tyr Tyr Lys Met Lys Glu Lys Thr Glu Glu Thr Leu Thr 595 600 605
Lys Asp Gly Trp Cys Leu Thr Gly Asp lie Gly Met Trp Thr Glu Asp 610 615 620
Gly Met Leu Lys lie lie Asp Arg Lys Lys Asn Leu Phe Lys Leu Ala 625 630 635 640
Gin Gly Glu Tyr Val Ala Pro Glu Lys Val Glu Asn Ala Tyr Cys Arg 645 650 655
Ala Asp Leu Leu Glu Ser Met Phe Val Tyr Gly Asp Ser Glu Lys Ser 660 665 670
Asn Leu Val Ala lie lie His Pro Asp Ala Asp Val Val Ser Glu Val 675 680 685
Gly Leu Gin Met Glu Asp Ser Lys Glu Leu His Asp Arg lie Gin Asp 690 695 700
Glu Leu Asp Gin Gin Ala Asp Ala Ala Gly Leu Lys Gly Phe Glu Arg 705 710 715 720
Val Arg Ala Phe His lie Glu Thr Thr Pro Phe Thr Glu Val Glu Gly 725 730 735 lie Thr Thr Ala Thr Gin Lys lie Lys Arg Ala Ala Ala Lys Glu His 740 745 750
Tyr Glu Asp Val lie Glu Lys Leu Tyr Lys Glu lie Asp Glu 755 760 765
<210〉 100 <211> 5341 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <400〉 100 ttcggctctt cgaacacttc gtcatcttcc accaccgcga ctgcaggaaa taccgctggc agcagtggag gcagcctctt cgggtcttcg ggcgggacaa gcaccggtgg gggcacatcc ggctctcttt tcggcagcag cagcagtagc agcagcaacg gtgcgaccgg gacggccagc tcgagcgccg gggacaattc tagcacgtct ttattttctg gcccatcaac gccgctgcag 515 300 200813222 tctggatcct cagggcttgg cagcaatgca ggtaccactg cccctcgcaa gaagtcgagc aggcgcaact ctcgccgcaa gtaaagaaaa aggtttttac cattatatac cactacacat ttgttccttc gactctcatg tttctacatt tcgctcacat gtcagcttgg ttactcgctc cattttccat cttgctgacg acagcgacgc ccactcttgc tgccacgcac actacactac ctggcagtcg gcactggtac ggcgagcctc cactccatcc agctcgactc ctccctcacc cgaaccgcaa cgcgtatggt ctccgaggcc gtcgtccgtc gcagcatctt cgccagtcaa gatcgccctc gccaaccatg cgcatcctct gcgcatttcc gcgctcgctg ccgttatccg aggcgagctc gcgagtccca accgttcgtt gttgacgccc ccctctgcca gagagcagaa gaagctcacg ggcctccctc gatcgatcga tctcttaacc gcgacgaggg agccgccctg ccgccagagg gcctcgagaa gccccccggc cgcggcggtt ggcggcggag atcggtatct tcctcgcaga aagtagcgca tccgttcatg gcgaactgta aagtacgcat acgtctacgc gcgggcggct gcggctgcga aagtaagagg actggagtgc acacgagccg cgagctgcga aagctcggcc tggccttgcc tggtcctgct ttcaagttct ttcctctcct cgcatttcaa gttcgcgcag gataggatag gatccaaact gacagacaaa ccgagacaga catgcgtata aacagacaca gacagcgtct ccctcgtctc tcgggcggca gatcgcgatc gagggagagc gaggccccgc gaggctgcac gaggcgcgcg accgcgactc gccgcggcag gagcgcggca gcggcggcgc gcggcgcggg gaggaggcgc ggagcgaggc ggcggcgagg cagggcgagg cagggcaagg ccccgctcgc atcgcgtcgc atcgcgccgc accgcccgcg gcacgtcgtc atcgaggggc gcgcgacgac gccgttggcg ccggaggacg cgcagacgca gacgcaaagc gcgacgcggc gcgcggacag cagcgcagag caaggcggaa agcgcgcgag agcggcgcag cgggcagcgg cgaggcgagg cgaggtccgg ctcgggcgcg ggcgcgggcg cgagaccggg agaaggagaa gcgcgaggct caagaagccg cgagatcagc gattcctctc ctaacctctt tctttcctcc tcggacttga gcggcagaag cgcagctcgg acgcagagcg cagcgcagcg ccgcgcagcg ccgcgcagcg acacggcaga ggcgacggcg ggcgggcggg cgggcgggcg ggcgggcaga cgcgcgcaag ctctcggaca gtctcggtcg ctcgcgagcc ccagggcgga gggcgtggac ccgtgctccg cggaggaagg aagtaaaaaa aaagggcaga acagcatgga gcggcctcag gcgcaggcct cgcccgcacg gtccgaggcg cggcggcgac gcggcgacag gtccaagggg ttcgccgacg aggatggaga gaccagcgtg aacaccccga acgggatgca gacaccgtac agcacgtcga tgggctccgt ctcgagctac tcgtcgtctg gcgactacgc catgtccgaa gcggagggct ccgaagtgga ccctgccgat gacaggatgg gcgactcaat cggatcgaaa ccaagctcct cgtccgtgac cggacgccgg cgactcacgc aagaagagcg cgactacttt ttgcgtcttg aaaaggaatg gcgcgaggag gacgcatggg ctgaccaacc cgggtcctgg tactcaatgc tggcctggat gccggtcctc attggcctgc gcgtcttcaa cgtgctgctt tccatcgcct tttggcctgt ctcctttgtg gcgcgggtct tcttcggcaa aaagattcac acggtcagtt tctgggacgt tccgctttcc cgccgtaaac aaactgccgt ggtgctcttg ttcgtcatgc tcctgcccat ggtcgtcgtg gtgtactcgt ggacgctcgt tctgcttctc ttcccgctca cgacctttcc cacactgtgc tacatggtgt ggatcattta cgtggacaag agtcccgaaa caggctcgcg ccgacccttt ttgcgctatt ggaagatgtg 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 516 200813222 gcgccatttc gcgaactatt tcccgcttcg actcattcgc accacgccgc tcgactcccg tcgcaagtac gtcttttgct accatccgca cggaatcatc tcgctcggtg cctttggcaa ctttgcgacg gactcgaccg gattctcgcg caaattcccc ggtatcgatt tgcgcgtgct cacgcttgcg ctcaactttt actgccccct tttgcgcgag tttctgcttt acctgggcct ttgcagcgcc gcaaagaagt cctgcaacca aattttgcag cgcgggcctg gatccgccat catgctcgtc gttggcggcg ccgccgagtc tctcgactcc cagccaggca cctatcgatt gacgctcggc cgaaaggggt tcgtgcgcgt tgcccttgac aatggtgccg atctagtgcc ggtgcttgcc tttggcgaga atgacgtatt tgacaccgtg tacctcccac cgaactcgtg ggcacgaaac gtgcaagagt ttgtgcgcaa gaagcttggt ttcgccacac caattttcag tggccgcggt atcttccagt acaacatggg gctcatgcct caccgccgtc ccattattgt cgttgttgga aaacccatca aaatgcccaa aattcccgat gagctcaagg gccgcgcgct ttccaccacg gccgagggcg ttgccctcgt tgacaagtac cacgaaaagt atgtcaaggc gcttcgcgag ctctggaact tgtacaagga gcgctgggcc gtgcaccgtc aaggttcgct gctcattcaa aagtaaaaaa cctaatgaac aacccaasca acttgcttct tttcttttct tttcttttca ttttcggcct tgctgtttga ttgtgttgcg cagatgtctg tgtgaatgca aacaagaaaa ggtcaaaagt ttcaagaagc aaaaaaaacc gaagaaatga atgaatgacc aaaaagtttt caataaatgc gtatgacacg aggcaacgtg cgtgcgcagg gtcttatttc ttactactgt tgttgttgtt gttgttgttg tcgttgttgt tgtttgtgga gagcaactac gttgcaaagt catattgtgt cgcggatgtg gtgccatgtc tgtttctctg tctcttttgt ctgtatgtct acttgtcgtc gccttcttcg tccgaagcgg attctgcgtc ctcacgttca gcctcttcag cagcttcttt gagcgcagcc gcagcgtcga gatcatgcac atactctgga agtctgaaaa tgtgcagcgt gttacggcct ccagactttc gttcccagcg acccaagcgg tgctcctgac cacagcccgc aaggagaacg cgacccgaag cgccaaaggc cagcgcgttt acgtatccgg gcactggcag actcatcagc gagggagcct tgatccgacg cacagtcgtg tccacattcc aaagcttgac gtacccgtcc gcggcgcccg aagctgcaat atctgcgttg ggcatagcag ccacggagca aatccacgag tcgccatgcg cgcggcgaac aatggagctt ggcttcttct tcgctgtgct ccacagcgcg agagtgcctt cctgcgaacc actgacaaag tgcgtctcgt cggccatggc aatcgtgtcg attgacgact tgtgcacacc ttgcaacacg agctgcgact cctcggggaa tttccaaaag cgcacggaac ggtccatgga gcacgtgact gcgcgctccc tatacaagca gtcaatgcca agaatcgggg cctggtggcc aaaaagcgac tctatataag ccatctcgtc cacgttccat gcgcggacac tgcggtcaaa agacgaagag tacaaggtgt gcttgccatt caaaaaggta aggcctgaga cggcgtcacg atggccggaa aagctgtcga ccagcgtgtt cgatcgtgca tcccaaatat gaatcacctt gtccttgccg ccgctcgcaa ggtacctgcc gtcagtgctg accgcaaccg ctaagatctc gtcgtgatga cctttgatgc tcgaagcagc gatttgcttg gtggcaggcc gccctggaaa ccgcgtgacc ctttttccag tctccacatc ccagcgcacg attgaacaat cctttgaccc agtgtatgcc acgtcctccg cgcctgtcag tgcaatgcac gtcacagaca gacgatgcgt tcgaggacac 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 517 200813222 4800 4860 4920 4980 5040 5100 5160 5220 5280 5340 5341 ttatggtagc taatatcctc ttgcttgaga gccgcggcca caggtcgtcg cagtcggcct tcggcgcgga gaagatcgtg gtgaagtttt tgcgttacag ggtctaaccc gttgttaagt ttggccgtgt catcatcgtc gtcctcatcg gagcccgagc cgtcctcatc ggagcccgtc tcgcctgcgc gtcgttgcga ggcctgcacc ttggcaagaa tttctcgtgc aacacgaagt cgtttttctg ctggggtctc tgcatgttcc tgagcatcgg caagcgtatc ctcttgtgaa ttgcgacgat catctacatc ggattcctca tcgttgctgt cgagatccca gtcgacgttg agttttgctt cgcggcgggg gcgcttcgtc ccgtttgcct gtcgatcaca tcgagagcat tagttcgtca gtcgatcacc tcctcatttt atccaatcat tccccagcat catgtagaac aaaaaaagag ggccaatctc gttgagcaat gggctgttca aagtcatgcc tcagttggcg atcaagccta ggttcggaca gtctcacctt ctcccgagag agaatcggaa acgaggaatt c
<210〉 101 <211> 506 <212〉 PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 101
Met Glu Arg Pro Gin Ala Gin Ala Ser Pro Ala Arg Ser Glu Ala Arg 15 10 15
Arg Arg Arg Gly Asp Arg Ser Lys Gly Phe Ala Asp Glu Asp Gly Glu 20 25 30
Thr Ser Val Asn Thr Pro Asn Gly Met Gin Thr Pro Tyr Ser Thr Ser 35 40 45
Met Gly Ser Val Ser Ser Tyr Ser Ser Ser Gly Asp Tyr Ala Met Ser 50 55 60
Glu Ala Glu Gly Ser Glu Val Asp Pro Ala Asp Asp Arg Met Gly Asp 65 70 75 80
Ser lie Gly Ser Lys Pro Ser Ser Ser Ser Val Thr Gly Arg Arg Arg 85 90 95
Leu Thr Gin Glu Glu Arg Asp Tyr Phe Leu Arg Leu Glu Lys Glu Trp 100 105 110
Arg Glu Glu Asp Ala Trp Ala Asp Gin Pro Gly Ser Trp Tyr Ser Met 115 120 125
Leu Ala Trp Met Pro Val Leu lie Gly Leu Arg Val Phe Asn Val Leu 130 135 140
Leu Ser lie Ala Phe Trp Pro Val Ser Phe Val Ala Arg Val Phe Phe 145 150 155 160
Gly Lys Lys lie His Thr Val Ser Phe Trp Asp Val Pro Leu Ser Arg 165 170 175
Arg Lys Gin Thr Ala Val Val Leu Leu Phe Val Met Leu Leu Pro Met 518 200813222 180 185 190
Val Val Val Val Tyr Ser Trp Thr Leu Val Leu Leu Leu Phe Pro Leu 195 200 205
Thr Thr Phe Pro Thr Leu Cys Tyr Met Val Trp lie lie Tyr Val Asp 210 215 220
Lys Ser Pro Glu Thr Gly Ser Arg Arg Pro Phe Leu Arg Tyr Trp Lys 225 230 235 240
Met Trp Arg His Phe Ala Asn Tyr Phe Pro Leu Arg Leu lie Arg Thr 245 250 255
Thr Pro Leu Asp Ser Arg Arg Lys Tyr Val Phe Cys Tyr His Pro His 260 265 270
Gly lie lie Ser Leu Gly Ala Phe Gly Asn Phe Ala Thr Asp Ser Thr 275 280 285
Gly Phe Ser Arg Lys Phe Pro Gly lie Asp Leu Arg Val Leu Thr Leu 290 295 300
Ala Leu Asn Phe Tyr Cys Pro Leu Leu Arg Glu Phe Leu Leu Tyr Leu 305 310 315 320
Gly Leu Cys Ser Ala Ala Lys Lys Ser Cys Asn Gin lie Leu Gin Arg 325 330 335
Gly Pro Gly Ser Ala lie Met Leu Val Val Gly Gly Ala Ala Glu Ser 340 345 350
Leu Asp Ser Gin Pro Gly Thr Tyr Arg Leu Thr Leu Gly Arg Lys Gly 355 360 365
Phe Val Arg Val Ala Leu Asp Asn Gly Ala Asp Leu Val Pro Val Leu 370 375 380
Ala Phe Gly Glu Asn Asp Val Phe Asp Thr Val Tyr Leu Pro Pro Asn 385 390 395 400
Ser Trp Ala Arg Asn Val Gin Glu Phe Val Arg Lys Lys Leu Gly Phe 405 410 415
Ala Thr Pro lie Phe Ser Gly Arg Gly lie Phe Gin Tyr Asn Met Gly 420 425 430
Leu Met Pro His Arg Arg Pro lie lie Val Val Val Gly Lys Pro lie 435 440 445
Lys Met Pro Lys lie Pro Asp Glu Leu Lys Gly Arg Ala Leu Ser Thr 450 455 460
Thr Ala Glu Gly Val Ala Leu Val Asp Lys Tyr His Glu Lys Tyr Val 465 470 475 480 519 200813222
Lys Ala Leu Arg Glu Leu Trp Asn Leu Tyr Lys Glu Arg Trp Ala Val 485 490 495
His Arg Gin Gly Ser Leu Leu lie Gin Lys 500 505
<210〉 102 <211> 1478 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 102 tgagggtagc taagcgacaa tcgtggagta taagacctga tgtcatgatg atgtgacgaa caacgaacgt aaaaacgcag cacgaggcgc aagaagggac acctgcggca accaagtagg aacggcagac aggagattgc gctcctgtgc cacgggctgc cagctacaaa cgcactcgca gcagcgacgg cagagcaaac acgagtgacc cacggacctc tcttcatgcg tcgacgtggg ggccaagatg agcacggcgc gagtcaagag cgtgaaactc acgagaacga cgacgacact gtagcgtcag agatagctcc tttccagcgt gtggacgcga atatggacgc gtggacgcga ctgaaaactg ccattgcgct cgtgacgctg gtccctgtga ggatcgctct cttgacaacg ctgctcggaa cgtacggctt ggcgctcgca gcgagtgcac gttttggcat tccgcagcgc tacaagctcg ctgtgacccg ccacgtgacg cgctggaccc tatggatcct tggtttttat catattgaag tcgagggcga tgcacaaggc ttgcaagaac gaccgcgtgt gattgttgca aatcacattt cgtatcttga gattttgtac tttatgtcga cagcgcattg cccttcgttc gtcatgaaaa agacctgttt aaaagtcccc ctcgttggct acgtcgccat ggagcttgga ggtctcttgg tagaccgcga gggtggcggt ccgagcgctt cggaggcaat cttctcgagg gtgaagagtc ctcgcaaaga cgagaaacag ccactgcttg tgtttcctga aggaacgact tcaaatggga cgtgtctttt gcagttcaaa acaggagctt ttcgcccggg cgtcccggtt ctccctgtgg ttctcgagtt ccccattgat gcttctcgcg gagatttttc gccagcatat gaatcggtgc acacgccgac acacctttta cgcatgcttg cgcagtggcg acaccgcttg cgcgtgcgct atcttccact cttcgagccc aatgagatgg agaaagctga tgcggcgctt tttgcgcgca atgttcgaaa ggagatggca agcgcgcttc atgtgcctac ggtcgagcaa acctacagcg ataagctcgc atatcatgca gagctcatgc ctcactacaa gcgagctggt cctggtgcgc tttatctcta tgtgcgtccg gacatcctac cacatgcacg caacacagtg tcatcatgaa cgtattttgg ttaacggaag tatgcacatg catgggagag aggaaagtat gctcaaagat gcacttgcac accatttgta ggtaacccga ttcgaagagg ggaaaagggt tatataaaat gaaagaggat tcatctaaca atctagcatc atttgttctc cttgacatgc accctccgag aggaagaaaa cctttcactt gggcacta
<210〉 103 <211〉 927 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 103 atggacgcgt ggacgcgact gaaaactgcc attgcgctcg tgacgctggt ccctgtgagg atcgctctct tgacaacgct gctcggaacg tacggcttgg cgctcgcagc gagtgcacgt 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1478 60 520 120 200813222 tttggcattc tggatccttg ccgcgtgtga gcgcattgcc gtcgccatgg gaggcaatct tttcctgaag cgcccgggcg gatttttcgc cagtggcgac aaagctgatg gtgcctacgg cactacaagc catgcacgca cgcagcgcta gtttttatca ttgttgcaaa cttcgttcgt agcttggagg tctcgagggt gaacgacttc tcccggttct cagcatatga accgcttgcg cggcgctttt tcgagcaaac gagctggtcc acacagtgtc caagctcgct tattgaagtc tcacatttcg catgaaaaag tctcttggta gaagagtcct aaatgggacg ccctgtggtt atcggtgcac cgtgcgctat tgcgcgcaat ctacagcgat tggtgcgctt atcatga gtgacccgcc gagggcgatg tatcttgaga acctgtttaa gaccgcgagg cgcaaagacg tgtcttttgc ctcgagttcc acgccgacac cttccactct gttcgaaagg aagctcgcat tatctctatg acgtgacgcg cacaaggctt ttttgtactt aagtccccct gtggcggtcc agaaacagcc agttcaaaac ccattgatgc accttttacg tcgagcccaa agatggcaag atcatgcaga tgcgtccgga ctggacccta gcaagaacga tatgtcgaca cgttggctac gagcgcttcg actgcttgtg aggagctttt ttctcgcgga catgcttgcg tgagatggag cgcgcttcat gctcatgcct catcctacca 180 240 300 360 420 480 540 600 660 720 780 840 900 927 sp.)
<210> 104 <211> 308 <212> PRT <213> 裂?直壺菌(Schizochytr ii <400> 104
Met Asp Ala Trp Thr Arg Leu Lys Thr Ala lie Ala Leu Val Thr Leu 15 10 15
Val Pro Val Arg lie Ala Leu Leu Thr Thr Leu Leu Gly Thr Tyr Gly 20 25 30
Leu Ala Leu Ala Ala Ser Ala Arg Phe Gly lie Pro Gin Arg Tyr Lys 35 40 45
Leu Ala Val Thr Arg His Val Thr Arg Trp Thr Leu Trp lie Leu Gly 50 55 60
Phe Tyr His lie Glu Val Glu Gly Asp Ala Gin Gly Leu Gin Glu Arg 65 70 75 80
Pro Arg Val lie Val Ala Asn His lie Ser Tyr Leu Glu lie Leu Tyr 85 90 95
Phe Met Ser Thr Ala His Cys Pro Ser Phe Val Met Lys Lys Thr Cys 100 105 110
Leu Lys Val Pro Leu Val Gly Tyr Val Ala Met Glu Leu Gly Gly Leu 115 120 125
Leu Val Asp Arg Glu Gly Gly Gly Pro Ser Ala Ser Glu Ala lie Phe 130 135 140
Ser Arg Val Lys Ser Pro Arg Lys Asp Glu Lys Gin Pro Leu Leu Val 145 150 155 160 521 200813222
Phe Pro Glu Gly Thr Thr Ser Asn Gly Thr Cys Leu Leu Gin Phe Lys 165 170 175
Thr Gly Ala Phe Arg Pro Gly Val Pro Val Leu Pro Val Val Leu Glu 180 185 190
Phe Pro lie Asp Ala Ser Arg Gly Asp Phe Ser Pro Ala Tyr Glu Ser 195 200 205
Val His Thr Pro Thr His Leu Leu Arg Met Leu Ala Gin Trp Arg His 210 215 220
Arg Leu Arg Val Arg Tyr Leu Pro Leu Phe Glu Pro Asn Glu Met Glu 225 230 235 240
Lys Ala Asp Ala Ala Leu Phe Ala Arg Asn Val Arg Lys Glu Met Ala 245 250 255
Ser Ala Leu His Val Pro Thr Val Glu Gin Thr Tyr Ser Asp Lys Leu 260 265 270
Ala Tyr His Ala Glu Leu Met Pro His Tyr Lys Arg Ala Gly Pro Gly 275 280 285
Ala Leu Tyr Leu Tyr Val Arg Pro Asp lie Leu Pro His Ala Arg Asn 290 295 300
Thr Val Ser Ser 305 <210〉 105 <211〉 2111 <212> DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 105 cccacgcatc cgagacggac gaccgaccga ccgaccgtgc cggcagcgga gcaggcgcac ggcatcgcgc gcgaggcctc gcggggcgaa ggactgactg agagagagag agtcagacag gcagacaggc agacagagag accctaggcg cagaacccga acggggagag ggaccgcgac cgcaagacgg gagaggcccg acgcggctcg acgtggcgtg gcctgcgtag gagtgggcgg gcgagctcgg ccggctggcg ttgttgttgc tgtcgctgtc gttgtcgtcg tcggtgctgc cgtcgtcgtt gttgtggtta ttgacgcggt tgttgggtgg gagaaaaaga gaacaccaca ccatgtgggc gccacagacg gtcgtggagc tgatgcgcag caagctgggc ggcgcggaga ccgacgcgac agtgagcatg cccaagtcga aaagcgccgc gaagtcgacc acggcgagcg tgatctcgca gttctcgcag tatgtggccg caggcagcgc caccatggcg cgcgaggaaa ccgagaaaaa ggcgaaccca ttccagacca tggagcacat caacgtccgc gagtggatca aactcgtcgt cggcgcgctc atcgtcgcgc cactgcgctt cctcatcatt ctcctcgtca tcggcatcgg cacgatcttc atgatgctca ccgtcgcagg ggcggacatc tccaagccgc tctccccgcg aagaggcttt gcgcagcaaa tcatcaccgc catctgcggc tacctcatct gcgcctgcat gggtgtctac cgcatccgca ccaagggcac gcacgcgtcc gccgaggagt 522 200813222 gcaagatgat catcgccgcc ccgcactcaa ccgtcatgga cgccgtcatc ctcgcctacg 900 cttgccgcgg accctctact gtgggcaaaa ttgaaatctc caagaccttt ctcggaccct 960 tcatgaacgc cttgcaaacc atctacgtcg accgttccga caagttcaac cgctccagcg 1020 tggcagcgca gatccgcgcg cgtgtgggcg ccgcctcgcc ctggcgtagg caactcatga 1080 tcttccccga aggcacctgc accaaccgga ccagcctcat ctcttttcgc cgcggtgctt 1140 tcgagccttg tgcacctgtg cagccagtcg tgctccattg gtcgtacacc aactttgacc 1200 cgacctggtg cgccggcgcg ccctcgcgca ccctcatcgc cctccgtacg ctctcgcagt 1260 tcttccacga ggtcactgtt gagtttctgc ccgtgtacaa gccctcggaa gaggaacgcg 1320 cggattccgc cctgtacagc gagaatgtgc gcaagcttat ggctgtctcg ctcggcatcc 1380 * cgacctcgga ccactcgtac gaggacatgt ttctcgccca aatcgccgcc aaaaacaagc 1440 tcaagcctag cgctgtgctc ccctttacat acgcctccct ccggagcaag cttccgcccg 1500 cagctgcctc gagcccgcgc ctctttgagc gtgtgcgggg cctgctcttg tgctttgcca 1560 aggctcctct catgacaaag gagcgccctc gtctcgatcg tgcccagttt gatgtcgtgt 1620 f ctcctgtggc ggccacatcg ctcgacatta agatttcgct tacctggacc caggtcgctt 1680 tggagagctc cgtcgccggt gcgccttcgt cggccgatac cttttccttt tacgagtttg 1740 cactcgccca gctcaaggct gcatcatggg actagcgact ctgctttggc caagttcctt 1800 gcatgttaga ctctacaggc aacaaagacg gacaatcacg gcgcaggacg accgcacgag 1860 ctgtctttgc cttttatata cacacacact tcacccactc acgacgagac tgaacatcat 1920 ctgacccttt tctcacgcat tcatttgcgc gagagcgcac acacacacat ggacatgtga 1980 tggtgttggc ctctttttct ttcttttggc atatttgccc atgcacaaaa agacttttgc 2040 caccaccttt acattgtatt gtagttacta cagttagcca aagtagccta gttgcaactt 2100 ttccccaaaa a 2111
<210〉 106 <211> 1140 <212> DNA <213〉裂殖壺菌(Schizochytrium sp·) / 1 <400> 106 cgcttcctca tcattctcct cgtcatcggc atcggcacga tcttcatgat gctcaccgtc 60 gcaggggcgg acatctccaa gccgctctcc ccgcgaagag gctttgcgca gcaaatcatc 120 accgccatct gcggctacct catctgcgcc tgcatgggtg tctaccgcat ccgcaccaag 180 ggcacgcacg cgtccgccga ggagtgcaag atgatcatcg ccgccccgca ctcaaccgtc 240 atggacgccg tcatcctcgc ctacgcttgc cgcggaccct ctactgtggg caaaattgaa 300 atctccaaga cctttctcgg acccttcatg aacgccttgc aaaccatcta cgtcgaccgt 360 tccgacaagt tcaaccgctc cagcgtggca gcgcagatcc gcgcgcgtgt gggcgccgcc 420 tcgccctggc gtaggcaact catgatcttc cccgaaggca cctgcaccaa ccggaccagc 480 ctcatctctt ttcgccgcgg tgctttcgag ccttgtgcac ctgtgcagcc agtcgtgctc 540 cattggtcgt acaccaactt tgacccgacc tggtgcgccg gcgcgccctc gcgcaccctc 600 atcgccctcc gtacgctctc gcagttcttc cacgaggtca ctgttgagtt tctgcccgtg 660 tacaagccct cggaagagga acgcgcggat tccgccctgt acagcgagaa tgtgcgcaag 720 523 780 200813222 840 900 960 1020 1080 1140 cttatggctg tctcgctcgg catcccgacc tcggaccact cgtacgagga catgtttctc gcccaaatcg ccgccaaaaa caagctcaag cctagcgctg tgctcccctt tacatacgcc tccctccgga gcaagcttcc gcccgcagct gcctcgagcc cgcgcctctt tgagcgtgtg cggggcctgc tcttgtgctt tgccaaggct cctctcatga caaaggagcg ccctcgtctc gatcgtgccc agtttgatgt cgtgtctcct gtggcggcca catcgctcga cattaagatt tcgcttacct ggacccaggt cgctttggag agctccgtcg ccggtgcgcc ttcgtcggcc gatacctttt ccttttacga gtttgcactc gcccagctca aggctgcatc atgggactag
<210> 107 <211> 379 <212> PRT <213> S殖壺菌(Schizochytrium sp.) <400> 107
Arg Phe Leu lie lie Leu Leu Val lie Gly lie Gly Thr lie Phe Met 15 10 15
Met Leu Thr Val Ala Gly Ala Asp lie Ser Lys Pro Leu Ser Pro Arg 20 25 30
Arg Gly Phe Ala Gin Gin lie lie Thr Ala lie Cys Gly Tyr Leu lie 35 40 45
Cys Ala Cys Met Gly Val Tyr Arg lie Arg Thr Lys Gly Thr His Ala 50 55 60
Ser Ala Glu Glu Cys Lys Met lie lie Ala Ala Pro His Ser Thr Val 65 70 75 80
Met Asp Ala Val lie Leu Ala Tyr Ala Cys Arg Gly Pro Ser Thr Val 85 90 95
Gly Lys lie Glu lie Ser Lys Thr Phe Leu Gly Pro Phe Met Asn Ala 100 105 110
Leu Gin Thr lie Tyr Val Asp Arg Ser Asp Lys Phe Asn Arg Ser Ser 115 120 125
Val Ala Ala Gin lie Arg Ala Arg Val Gly Ala Ala Ser Pro Trp Arg 130 135 140
Arg Gin Leu Met lie Phe Pro Glu Gly Thr Cys Thr Asn Arg Thr Ser 145 150 155 160
Leu lie Ser Phe Arg Arg Gly Ala Phe Glu Pro Cys Ala Pro Val Gin 165 170 175
Pro Val Val Leu His Trp Ser Tyr Thr Asn Phe Asp Pro Thr Trp Cys 180 185 190
Ala Gly Ala Pro Ser Arg Thr Leu lie Ala Leu Arg Thr Leu Ser Gin 195 200 205
Phe Phe His Glu Val Thr Val Glu Phe Leu Pro Val Tyr Lys Pro Ser 524 200813222 210 215 220
Glu Glu Glu Arg Ala Asp Ser Ala Leu Tyr Ser Glu Asn Val Arg Lys 225 230 235 240
Leu Met Ala Val Ser Leu Gly lie Pro Thr Ser Asp His Ser Tyr Glu 245 250 255
Asp Met Phe Leu Ala Gin lie Ala Ala Lys Asn Lys Leu Lys Pro Ser 260 265 270
Ala Val Leu Pro Phe Thr Tyr Ala Ser Leu Arg Ser Lys Leu Pro Pro 275 280 285
Ala Ala Ala Ser Ser Pro Arg Leu Phe Glu Arg Val Arg Gly Leu Leu 290 295 300
Leu Cys Phe Ala Lys Ala Pro Leu Met Thr Lys Glu Arg Pro Arg Leu 305 310 315 320 /
Asp Arg Ala Gin Phe Asp Val Val Ser Pro Val Ala Ala Thr Ser Leu 325 330 335
Asp lie Lys lie Ser Leu Thr Trp Thr Gin Val Ala Leu Glu Ser Ser 340 345 350
Val Ala Gly Ala Pro Ser Ser Ala Asp Thr Phe Ser Phe Tyr Glu Phe 355 360 365
Ala Leu Ala Gin Leu Lys Ala Ala Ser Trp Asp 370 375
<210> 108 <211〉 1861 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 108 atggcacgct agacagcgta gcgcacagac ggcagacgat accaccgcgc gcatacgcac acacacacag acgcgcgcac gtgcgcgccc ctgcgtctct ttgttagtcg acgcgcgcgc gcgcgcgcac gttggcagac aagcaaacaa gaaggtgagt gagctaacca gcaagcaagc aagcaagcat ggcgaccgag cagccgtctt tgcggcgact ctccgctaaa gagacgcgac gcatcgaacg ccgcctctcc acaacacgca ggagacgcag gtcgcacctc gaactcaaag aggtcaatcc atttcagacg gatgaggcca tggacgcaca agaatgggtc ctcttcgtga ccggcctcgt cgtgcttgcg ccgttccgca ttctcatctt tctcgtcacc attcccgtcg ccactggact cgtcctgctc tccgtcattg gatgcgacgt caacgagcca ctcccagcat ctcgcgctcg cattcaggca catattgttt acgccacggc tcgcatcctc ctctcctgct ttggtgtcta caccgtcgag acggttggca agcttgcgcc tgcaagcaag gcccgcgtcg ccgtcgttgg gcctcactcc actccctttg acgctctcct cgcagccgca ttcatggacg cccccagctt tgttgcaaaa gctgatctca cagagacctt tgtcggaccc gttctcaagg ccatgcagac cattctcgtc gaccgcgaaa atatttccag caggcacctc gctgcggagg 525 200813222 ccatcctaca gcgcgccgat cgcacaggaa cttggcgccg acgtcttgcc gtttaccccg 840 aaggcacgtg cacgaatcga accagtctca ttcagttcag acgtggcgcc tttgagcccc 900 tcgcacccgt acagcctgca gttctccagt ggaacgtcgg ggcctttgac cccgcatgga 960 ccgtcggatc cccccgacgt ggactcattg ttctccgctg ccttgctcga ctccagcttc 1020 acgtgaccgt acaatttctg cccgtcatgg agcccctaaa aaatgaggac gccgctgcat 1080 tttgcgaccg cgtgcgcagc gccatggccg acgcgctcgg cgtccccacc accgagtaca 1140 cctatcctga tctctttctt gcaaagattg ccgcaaagcg caaagtcaag cccgcaatcg 1200 tactcccatg gcccttcgtc gatgtccagc gcgcctttcc tgacgttcct ggcatttttg 1260 aaatcacaag agccctcttg cttcgctacc tcgcagctcc tggcgtacaa gccaacaatg 1320 gacgcatgga ccactcggca ttcaaggctg tcgctgtaaa ggcggctcgt gatgccggaa 1380 tcgagggtga gcctcctacc tgggatcagg tcgcgcgtga aacccacacc gacaagaccg 1440 tctcctttac agacttcctt caagctcatc tcgagtgcct cgtttccaat ccaacttcct 1500 catcttcata acgagccatt ttctttccat ctgggatctc acatcgcgca ccaagaaaac 1560 cttgacggac aacactgtgt ccttttttaa acgaacttgc tccaagacca tcccaaaagt 1620 ctcgttttca tgctcatcgt gacgtgcttt attgtttctc aattttgggt ctcatctcag 1680 cccgcacacg aaacccatac ggacaacacc gtctctcttt cttcgtatat actccaagct 1740 catctcgacg tcctcacaag gggacgtgaa tcttcctcct catgaggaaa gaagatggcc 1800 ttgtagcaca acattgaata acatacgaac gtattttcac gcttccccta gaaaaaaaaa 1860 a 1861
<210> 109 <211〉 1323 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400〉 109 atggcgaccg agcagccgtc tttgcggcga ctctccgcta aagagacgcg acgcatcgaa 60 cgccgcctct ccacaacacg caggagacgc aggtcgcacc tcgaactcaa agaggtcaat 120 ccatttcaga cggatgaggc catggacgca caagaatggg tcctcttcgt gaccggcctc 180 gtcgtgcttg cgccgttccg cattctcatc tttctcgtca ccattcccgt cgccactgga 240 ctcgtcctgc tctccgtcat tggatgcgac gtcaacgagc cactcccagc atctcgcgct 300 cgcattcagg cacatattgt ttacgccacg gctcgcatcc tcctctcctg ctttggtgtc 360 tacaccgtcg agacggttgg caagcttgcg cctgcaagca aggcccgcgt cgccgtcgtt 420 gggcctcact ccactccctt tgacgctctc ctcgcagccg cattcatgga cgcccccagc 480 tttgttgcaa aagctgatct cacagagacc tttgtcggac ccgttctcaa ggccatgcag 540 accattctcg tcgaccgcga aaatatttcc agcaggcacc tcgctgcgga ggccatccta 600 cagcgcgccg atcgcacagg aacttggcgc cgacgtcttg ccgtttaccc cgaaggcacg 660 tgcacgaatc gaaccagtct cattcagttc agacgtggcg cctttgagcc cctcgcaccc 720 gtacagcctg cagttctcca gtggaacgtc ggggcctttg accccgcatg gaccgtcgga 780 tccccccgac gtggactcat tgttctccgc tgccttgctc gactccagct tcacgtgacc 840 gtacaatttc tgcccgtcat ggagccccta aaaaatgagg acgccgctgc attttgcgac 900 526 960 200813222 1020 1080 1140 1200 1260 1320 1323 cgcgtgcgca gcgccatggc cgacgcgctc ggcgtcccca ccaccgagta cacctatcct gatctctttc ttgcaaagat tgccgcaaag cgcaaagtca agcccgcaat cgtactccca tggcccttcg tcgatgtcca gcgcgccttt cctgacgttc ctggcatttt tgaaatcaca agagccctct tgcttcgcta cctcgcagct cctggcgtac aagccaacaa tggacgcatg gaccactcgg cattcaaggc tgtcgctgta aaggcggctc gtgatgccgg aatcgagggt gagcctccta cctgggatca ggtcgcgcgt gaaacccaca ccgacaagac cgtctccttt acagacttcc ttcaagctca tctcgagtgc ctcgtttcca atccaacttc ctcatcttca taa
<210> 110 <211> 440 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 110
Met Ala Thr Glu Gin Pro Ser Leu Arg Arg Leu Ser Ala Lys Glu Thr 15 10 15
Arg Arg lie Glu Arg Arg Leu Ser Thr Thr Arg Arg Arg Arg Arg Ser 20 25 30
His Leu Glu Leu Lys Glu Val Asn Pro Phe Gin Thr Asp Glu Ala Met 35 40 45
Asp Ala Gin Glu Trp Val Leu Phe Val Thr Gly Leu Val Val Leu Ala 50 55 60
Pro Phe Arg lie Leu lie Phe Leu Val Thr lie Pro Val Ala Thr Gly 65 70 75 80
Leu Val Leu Leu Ser Val lie Gly Cys Asp Val Asn Glu Pro Leu Pro 85 90 95
Ala Ser Arg Ala Arg lie Gin Ala His lie Val Tyr Ala Thr Ala Arg 100 105 110 lie Leu Leu Ser Cys Phe Gly Val Tyr Thr Val Glu Thr Val Gly Lys 115 120 125
Leu Ala Pro Ala Ser Lys Ala Arg Val Ala Val Val Gly Pro His Ser 130 135 140
Thr Pro Phe Asp Ala Leu Leu Ala Ala Ala Phe Met Asp Ala Pro Ser 145 150 155 160
Phe Val Ala Lys Ala Asp Leu Thr Glu Thr Phe Val Gly Pro Val Leu 165 170 175
Lys Ala Met Gin Thr lie Leu Val Asp Arg Glu Asn lie Ser Ser Arg 180 185 190
His Leu Ala Ala Glu Ala lie Leu Gin Arg Ala Asp Arg Thr Gly Thr 195 200 205 527 200813222
Trp Arg Arg Arg Leu Ala Val Tyr Pro Glu Gly Thr Cys Thr Asn Arg 210 215 220
Thr Ser Leu lie Gin Phe Arg Arg Gly Ala Phe Glu Pro Leu Ala Pro 225 230 235 240
Val Gin Pro Ala Val Leu Gin Trp Asn Val Gly Ala Phe Asp Pro Ala 245 250 255
Trp Thr Val Gly Ser Pro Arg Arg Gly Leu lie Val Leu Arg Cys Leu 260 265 270
Ala Arg Leu Gin Leu His Val Thr Val Gin Phe Leu Pro Val Met Glu 275 280 285
Pro Leu Lys Asn Glu Asp Ala Ala Ala Phe Cys Asp Arg Val Arg Ser 290 295 300
Ala Met Ala Asp Ala Leu Gly Val Pro Thr Thr Glu Tyr Thr Tyr Pro 305 310 315 320
Asp Leu Phe Leu Ala Lys lie Ala Ala Lys Arg Lys Val Lys Pro Ala 325 330 335 lie Val Leu Pro Trp Pro Phe Val Asp Val Gin Arg Ala Phe Pro Asp 340 345 350
Val Pro Gly lie Phe Glu lie Thr Arg Ala Leu Leu Leu Arg Tyr Leu 355 360 365
Ala Ala Pro Gly Val Gin Ala Asn Asn Gly Arg Met Asp His Ser Ala 370 375 380
Phe Lys Ala Val Ala Val Lys Ala Ala Arg Asp Ala Gly lie Glu Gly 385 390 395 400
Glu Pro Pro Thr Trp Asp Gin Val Ala Arg Glu Thr His Thr Asp Lys 405 410 415
Thr Val Ser Phe Thr Asp Phe Leu Gin Ala His Leu Glu Cys Leu Val 420 425 430
Ser Asn Pro Thr Ser Ser Ser Ser 435 440
<210> 111 <211> 794 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 111 catgtggcct gtgcggattt tgtgcagact cttcatcttt tgctttggtg tgtactggat ttctgtcaag ggtaaaaagg cgagtcatgc tgaagcagcg gtggccgtgg tggccccgca ttccacattt ctggacacca tgacgtacta tgccgtttat ggccggtggt cgggtttggg taaaaaggaa gtgaccaaga ctccgttttt tggcacgatt ttccgcggtc tgcaaatgat 528 200813222 tgcggtggac cgcgagaatc cggagggtcg caaggccgcg ctcgacgagt ttgtgcggcg 3⑻ cgcacaagat aacaaagggt ggcctcagct tgttgtcttt ccagaaggta cttgcaccaa 360 tcggcgtgcc ctcatccaat tcaagcgcgg gcccttcgtc cccggcgttc ccattcagcc 420 tgtcgtgatg cgctggccat attatttctt tgacccggca tggacctcga gcgggccgaa 480 ccggatcgca ctcgtgttcc gtctcatgac acaaatcttt acgcgtgtcg aggtggagtt 540 tctccccgtg tacacgccga gcgacgaaga aaaggaagat ccagagcttt tcgcgcacaa 600 cgtacgcaat accatggccc aggcgcttgg cgtgccaacc acggagcact cttacgagga 660 tacgtttttg agcatggcgg caaagaaggc caagtttaat ccggatgaaa ttgtcgattt 720 cgagttcacc aaggtgaaaa gagctcttgg atattgacct caaggaagcg cgccggcttc 780 tgaagcgatt cggg 794 <210> 112 <211> 756 <212〉 DNA <213> 裂殖壺菌(Schizochytrium sp.) <400> 112 atgtggrr.tg tgr.ggatttt gtgcagactc ttcatctttt gctttggtgt gtactggatt 60 tctgtcaagg gtaaaaaggc gagtcatgct gaagcagcgg tggccgtggt ggccccgcat 120 tccacatttc tggacaccat gacgtactat gccgtttatg gccggtggtc gggtttgggt 180 aaaaaggaag tgaccaagac tccgtttttt ggcacgattt tccgcggtct gcaaatgatt 240 gcggtggacc gcgagaatcc ggagggtcgc aaggccgcgc tcgacgagtt tgtgcggcgc 300 gcacaagata acaaagggtg gcctcagctt gttgtctttc cagaaggtac ttgcaccaat 360 cggcgtgccc tcatccaatt caagcgcggg cccttcgtcc ccggcgttcc cattcagcct 420 gtcgtgatgc gctggccata ttatttcttt gacccggcat ggacctcgag cgggccgaac 480 cggatcgcac tcgtgttccg tctcatgaca caaatcttta cgcgtgtcga ggtggagttt 540 ctccccgtgt acacgccgag cgacgaagaa aaggaagatc cagagctttt cgcgcacaac 600 gtacgcaata ccatggccca ggcgcttggc gtgccaacca cggagcactc ttacgaggat 660 acgtttttga gcatggcggc aaagaaggcc aagtttaatc cggatgaaat tgtcgatttc 720 gagttcacca aggtgaaaag agctcttgga tattga 756
<210> 113 <211> 251 <212> PRT <213> 裂殖壺菌(Schizochytrium sp.) <400> 113
Met Trp Pro Val Arg lie Leu Cys Arg Leu Phe lie Phe Cys Phe Gly 15 10 15
Val Tyr Trp lie Ser Val Lys Gly Lys Lys Ala Ser His Ala Glu Ala 20 25 30
Ala Val Ala Val Val Ala Pro His Ser Thr Phe Leu Asp Thr Met Thr 35 40 45
Tyr Tyr Ala Val Tyr Gly Arg Trp Ser Gly Leu Gly Lys Lys Glu Val 50 55 60 529 200813222
Thr Lys Thr Pro Phe Phe Gly Thr lie Phe Arg Gly Leu Gin Met lie 65 70 75 80
Ala Val Asp Arg Glu Asn Pro Glu Gly Arg Lys Ala Ala Leu Asp Glu 85 90 95
Phe Val Arg Arg Ala Gin Asp Asn Lys Gly Trp Pro Gin Leu Val Val 100 105 110
Phe Pro Glu Gly Thr Cys Thr Asn Arg Arg Ala Leu lie Gin Phe Lys 115 120 125
Arg Gly Pro Phe Val Pro Gly Val Pro lie Gin Pro Val Val Met Arg 130 135 140
Trp Pro Tyr Tyr Phe Phe Asp Pro Ala Trp Thr Ser Ser Gly Pro Asn 145 150 155 160
Arg lie Ala Leu Val Phe Arg Leu Met Thr Gin lie Phe Thr Arg Val 165 170 175
Glu Val Glu Phe Leu Pro Val Tyr Thr Pro Ser Asp Glu Glu Lys Glu 180 185 190
Asp Pro Glu Leu Phe Ala His Asn Val Arg Asn Thr Met Ala Gin Ala 195 200 205
Leu Gly Val Pro Thr Thr Glu His Ser Tyr Glu Asp Thr Phe Leu Ser 210 215 220
Met Ala Ala Lys Lys Ala Lys Phe Asn Pro Asp Glu lie Val Asp Phe 225 230 235 240
Glu Phe Thr Lys Val Lys Arg Ala Leu Gly Tyr 245 250
<210〉 114 <211> 817 <212〉 DNA <213> Crypthecodinium cohnii <400> 114 cactccaacg tacgacagct tcctcatatt ctttccaaca tgtcgaacga tgctggaaag actgcagggc ccctgacgaa gcccacacgc agctacttgg agtcgacagc ggtcgagcga ctggcaggat ggctgtcggc ttccatcttt tccatcgtct actttgcggc accgatctac ttgacaggca cagctcttct tctggcacgg gctccccgct cgaagttcac ctggggtttg gctgcgcccg tctgcctcgc agcgcttttg ccctgcgacc tcagcgcgcg cgtcggccca tcgatcttca ggacttggtt catgaagcaa attgtcaagt acttcaagta tgaggaatat cttgagttca cggacaagga tattgcggat tcgcacaaag aggggaagcg cttcatcttc gctagccacc ctcacggtgt cgtgagcttc tgcggcatgt gcgctgctat cagcagtcat agtgctgttg atggcttctc aaccttcggc atcatggatc tgccgacggc agtggcctcg gtgatcaaga tggttccatt cttgaaaaac gttctcggcg ttttcggcct catcgatgcc 530 200813222 agcaagcagg tgctcgtgaa gcgattgaag cgcgctggcg gatccgtggt gatctacatc 660 ggaggcatgg tggaactctt catgtccagc ccgaagcagg aggttgtctt cttgaagaag 720 aggaagggct tcatcaggct cgctctgagc acaggtgccg atgttgtgcc aatctacttg 780 ttcggcaaca ccaccgtgct ctcggttttg acttctg 817 <210> 115 <211> 850 <212> DNA <213> Crypthecodinium cohnii <400> 115 ctgccagcga gatagcagat atcgtcgtat tgtcgtgcaa tcgagtgatt gagtcaaatc 60 tagcgatatc tgccttgttt tttttggggg ggcgccttgc caatcacccg cagcaaccat 120 ggctacacct gctgcttctc catcggtgaa gaagtcggct ccgaccacat ttggcccaga 180 ttgttgcgag ggtccgacag tgctcatgca gattttggca gttctgctga tatccgcagt 240 ccccttgatc ttcactctgg cactcacaaa cgggtctctg tttgctggcc tccttgtggt 300 cggtgtggtg gcgctgccac ggatcctttg gcagcctgga gggaatgaag gtttcgcttt 360 tcagttcgct ttgggcctct actggaactt ggtcaatgct gcgtgctttg ggtcagtgtt 420 ccttctcgga gctgcttgct attttgctcc cagaacagtt ctgcctttga tggcagtcta 480 cgtgctgtgg atgcaggtca cacacttcga gttgaaggat gggcgagcgt gggcttcttt 540 tgccatgcga gagtggggtt tccaggcatt ccgtcatttc atccaccttc aagttgttct 600 accagaggcg attttgcaga aaccggcaga cgaacctctt tttttcgctg tccatcccca 660 tggtgtggcc agtgattttc gacttctgat ggatggcatg cttcacaagg caatgccctc 720 acgtgaaatt ctcgttctgg ccgcatcggt tctcttcaag ctccccttgg tgcgggagct 780 ctgcctgtgg tctcgatgca tcgatgctag caggccagtg gcagagcgtg ccttgcgccg 840 aggtcatagt 850 <210〉 116 <211> 663 <212〉 DNA <213> Crypthecodinium cohnii <400> 116 caggtcagcg gcgtgcaggc gccgatccta ttcaggatac ccatcctaag acaagttttg 60 ctctctttcg gttgcacaat gccagccacc aaggacggaa tgttcaaact cttccgaaaa 120 aagatgccct tcggtataat tgtcgggggg agcgaggatg ttgccatcca aatcaccggt 180 cgcgagcgta tctacctcag acaccgcgct ggttttttga agtacgctct ccagttcggt 240 tacaaagtcg tggtagccta caacttcggt gagagcgatt tgtacaggtc cttcagcatc 300 ttagcgcctc tgaacttgtg gctcgtgaag cgatttggct tcgttttgcc gctgttctac 360 gggcagtggt ggtgtccact cctcccacgt agcgacgtta ccttgaacac cgtctatggg 420 gcggtcttgg agcttcccag aatagatttc cccagcgacg aagaggtcgc ccattggcac 480 ggcaagtaca tcgaggctgt gaccgacgtg ttcgaaacac acaaggagcg attcggcttc 540 gcttcgagaa cgctggagat tttgtaaggt ctcgaagaac aaaaaatcct cgaccgttga 600 agagacacta tcgtcgacga aaggttcgaa gatcaaatct cctcgattgt tgaagacact 660 531 200813222 atg 663 <210〉 117 <211> 807 <212> DNA <213> Crypthecodinium cohnii <400> 117 tcacactgaa agtcctcact gtttttgctg ctcggtttcc tgaacttgcg aactcctcac 60 tagttcgact tttcctcggg gacaagtgta gcagcacgga tcacgcgcgc gaagctccgc 120 tgtgtgtttt tgcgtatata atcatcgatt caacagagtc tctcctccgc tccactcgac 180 tccactcaac ttcacctgtc tggtttggac tttttcgttc gccccacttg actgggaatg 240 actgtggaga agaacatgga cagcatcaaa ccagtcgatg atgccaagcc acttgacgcc 300 aagcttggcc acaacttgca tgcggcgagt cctgcagctg ctaccgaaag gcctggctcc 360 agagggctcg accgatgtgc cttgatgctt tacttgactt tcccgctggc gaacatcgcc 420 gcggctggct gcctcacctt ctgggctttg cttcgtggcg gactcaaagt gcggtcgggc 480 atgttggcct acctgtgctg gatctgtttc ttcgatcgaa ctccggagcg gggaggctac 540 aacttttgct ggcgaaccgg aatcacccag aaattgcgag catccttctt ctggaaatgg 600 gcagcaagat actttcctgt ccggctacat gcagtggctc ctcttccccc agatcaaggc 660 ccctacattt ttgtgtgcca cccacacggc atcttcggca tctcgccgat gactcacttt 720 gggaccgatg ccacagactt ctccaagata tttccgggaa tccaagtgca ccttctcggc 780 catagtgcga tcttcagaat ccgttct 807 <210〉 118 <211> 765 <212> DNA <213> Crypthecodinium cohnii <400> 118 gtccttcttc tgtgctcgac tataaattac ttgtttggca gctttcaccc acccacccac 60 ccagccatct ataatagctt ttgatctttt ccttcccatc catacacttc tctacctgtg 120 cttgtactgt gtacgtaatc acgcacgcac gcagtgcgtg cgaccaatgg cttccaaatg 180 gatgctcttc agtggtggtg ctgcagctgc agcattggcg ctcttggagg ctgcccaaca 240 tcgtttgccg acatcggtgc gcgctcggat aatgctagct tcgttggccg catatctgcc 300 catgtatctc gatggaagcg agtaccgggc tgcaccccgg agaagtgagc gagcctcgag 360 ggttcttcgg cagctgttca agatgatggt ggaccgtctc ttcattgtca aaaagccgat 420 tatcgaggcg gccgaagagc taacatcctg cagccagtgc atcttgtcgg ttcatcctca 480 tggggttctg tccctggatc atctcctgac agtcatcgcc tatgaccccg agctggaaag 540 ggtgctgccc cagggccgac gaagtgccct gagtgcaggt gtcctcttca aaatccccat 600 cttgcgagag gtgctgttgt ggaccggttg cgttgatgcc ggggggcgga cagtggattc 660 gtgtctgaag gctggcttaa gcctctctgt ggtgcctggg ggtgagcgcg aacagctcct 720 agcccaacgt ggcaacacag aaacgcttgt gctcaaaaac aggaa 765
<210> 119 <211> 782 <212> DNA <213〉隱甲藻(Crypthecodinium cohnii) 532 200813222 <400〉 119 ttcctgagct ttcatcctct gccggacctc tcggagaccc tctgcgagtc ctggttcacc 60 atcgccctct acaagtactt ctcctaccgc ttcatctgga gcgacgacga caacgagaag 120 gtgcgaacag ctccggcctg gttcggcgca tctcctcccc acggtgtcct gccgctggcc 180 aacttgctgt gtattcccgc gataaacaac tttgggttca gggagttcgt tggggctcct 240 gcctcggtcg tctttcgaac tccctttctc agatacatga cgatgctggg ctgcgtcgat 300 gtcagcggca agtcgatgac caaggcggtc aatgctggtc agtgtgttgg cctcgtgccc 360 gacggcatcg caggcatctt taagacgaag gaaaaggacg aagttgtctt cctcaagaac 420 agaaaaggcc tcgcaaagct ggctctgaag acaggcaccc cactgcttcc tgcctacagc 480 ctgggcaaca cagcagtttt cggcgcctgg ttcgacccct tcggaatcat ggaggctctg 540 tccagaaaag ctcagacatc cgtcttcgtg ttttggggtc gcttctacct cccgcttccc 600 aggcgcgtca acatcacgat ggtctatggc aagcccatca ttgttgagaa ggtggaggat 660 cccagcaccg agcaaatcga ccagctgcat gcggagtacc tccaagagct ggaggccttg 720 ttcaacaggc acaaggcaag tgtttgggtg gggtcacaag aacattcgct tcgtctgagc 780 at 782 <210> 120 <211> 793 <212> DNA <213〉隱甲藻(Crypthecodinium cohnii) <400> 120 cgtgcttgaa gctcttgtct gtgtgtgtaa tcaatgtatc tttatcttcc cggtgcagct 60 ccagctagct gcactgcccc ctccaattga tctggcggtg gccctgagct gccgtcttgc 120 atgccgacga ctcgattttc ctctgccaaa gcctgggttt caaagcaagc gatggccgtc 180 acgtcagcgc tctgcagtgg cgtcggcgca gggctcttga tccacacagc tgtcgtggcc 240 tatctgtacc cactcttctt tgcgccagtg ctgctgttgg ttccctcccg cagaacgagg 300 gcgatgttca gatcgtattg tcagttctgg caggacatgt ggatggcttc ttcttgcgtg 360 gtgctggagt acgtgattgg tgtccgcttg ttcatacatt ccccaacagc cttgaagggg 420 ttgcgtggca tcaaaaccat gtgcaacggc cacgatgtga ttctcatcaa gaaccaccgc 480 actcgaattg attggatgtt cacctggggg ctctgtctag ctctcgaccg cctgggtagc 540 ctgaagatag taatgaaaga ctccttgaag aaagttccct ttttcggttg ggcgatgcag 600 cacttcggct ttaccttcct ttccaggaaa aaccgagatc atgacctggc caccctgaag 660 tggtcgagct cctaccagag tcacgagcct ggcagccgca tgacgatgct gatcttccca 720 gagggaacgg acctaagctc atcgaacctg gaaaaaagca aggctttcgc caccaaagca 780 ggactgccgg tct 793
<210> 121 <211> 744 <212> DNA <213> 隱甲藻(Crypthecodinium cohnii) <400> 121 cgagccggtc gtagacagat agacagatag atagacacgt agataggttt tgtcgcatct 60 ttcgccaact ctgcccgggg ggccaaacct tcttgctggg gtttctgctc tcttctcttc 120 533 180 200813222 ttgctggggc ggcatgggga agcaccctcc tgccaattat ggcatcacgg ctgtgatcgc cctcctcctc tccgtgggcc ttatattggc gggcgtcatt cagataatca ctgcgctgct gacactcccc gtactcgcct gcaagggccg caacgccttc cacagcatcc agagcgcggt gtggcgcagc atcgtcacct tcctctccgt ggggctcaac ccgttctggt gcgcacgaat ggtgtgggtg ggtgacaacc ctggccctcc gaagggaaag atggggtcag tcttcttcat caaccatcgc tcaaatgctg acgcctggtt cagcgcctgg ggaatcaccc gaatgtgtca tgaagcgcgg tacgtctaca agagtagcct aaagaagatt cccttcttcg gctggaactt gcagcttgct ggcgacctcg ctgtggagtt cggagacaag tccaagatcg tagcgatgat ggagaacgcg aaagaggcat tgaggcaggg ctacaatgtg gcggtctttc cggaaggtac gagaagtcct agtggtatgt tgcaggaatt caagcctgga ttcttcaaga tcttgtgcag agcttggctg cccagcggtc ccca <210〉 122 <211> 2361 <212> DNA <213〉人造 <220> <223>合成 <400> 122 gccgggctct ttcacaaagg aataatgatc ccacaaaagc ttcacgtcct tgggatacca atcgagatgg tttcgtgatg ggagagggag ctggagttct acttttggaa gaactcgagc atgctaagaa aagaggtgca actatctacg cagagttcct cggtgggagt ttcacatgtg atgcctatca catgaccgag cctcaccctg atggggctgg tgttattctc tgtattgaga gagcgttagc tagtgctggg atttccaagg aacaaataaa ttacataaat gcacatgcaa cctcaacgca tgctggagat attaaggaat accaagccct tgctcactgt tttggccaaa atcctgagct taaggtaaat tccacaaaat ctatgattgg acacttgctg ggagctgctg gggccgtgga ggctgttgca actgtgcagg cgatacggac cggatgggtt catccaaata tcaacctcga gaatccagac atttaaatgt aagaatttct tatgttacat tattacattc aacgttttat cttaattggc tcttcatttg attgaaattt gacaattatt tcttgttttt tttttgtcac actctttttg ggtttggggt ggccgacgaa ttgtgggaag gtagaaagag gggaggactt tgttatactc cattagattt tactgtttcc gtttcaattt atgtgacata tttccttttt agtcggttcc aaaagaaaat gtcagcatta taaacaattt aattttgaaa ttacaatttt gccattaata aaatgattta caaccacaaa agtatctatg agcctgtttg ggtgggctta taagcagctt attttaagtg gcttataagt caaaaagtga caatttttga gaagttagaa aatcctaact tctcaaaaag tagcttttaa gccacttatg acttataagt ccaaaaattt ttaagttacc aaacatatat taatgggttt ataagcttat aagccacttt taagctcacc caaacgggtt ctatgtctca ctttagacta caaattttaa aagtcttcat ttatttctta atctccgtgg cgagtaaaac tataacacat aaagtgaaac gtagggagta agatggagtc ataaactaat ccaaatctat actctctccg ttaatttgtt ttttagtttg atttggtaca ttaataaaac agatttttcg aaggttataa acacagacag atgtttccca 240 300 360 420 480 540 600 660 720 744 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 534 1260 1320 200813222 gcgagctagc aaaattccaa gatttctgtc gaaaattcgt gtgtttctag ctagtacttg atgttatctt taacctttta gtaatttttt gtccttttct ttctattttt catcttacaa tgaattatga gcaagttcct taagtagcat cacacgtgag atgtttttta tgatattgac taaatccaat ctttaccatt ccttaactag taaaatacaa cacatgttaa ttgatacatt gcttaacact gaggttagaa aattttagaa attagttgtc caaatgcttt gaaattagaa atctttaatc ccttattttt ttttaaaatg ttttttctcg ctccaaagaa agagaaactg acatgaaagc tcaaaagatc atgaatctta ctaactttgt ggaactaaat gtacatcaga atgtttctga catgtgaaaa tgaaagctct taattttctt cttttattta ttgagggttt ttgcatgcta tgcattcaat ttgagtactt taaagcacct ataaacactt acttacactt gccttggagt ttatgtttta gtgttttctt cacatctttt ttggtcaatt tgcagggatc cgtctggatt ctcgaggttg atatttggat gaacccatcc ggtccgtatc gcctgcacag ttgcaacagc ctccacggcc ccagcagctc ccagcaagtg tccaatcata gattttgtgg aatttacctt aagctcagga ttttggccaa aacagtgagc aagggcttgg tattccttaa tatctccagc atgcgttgag gttgcatgtg catttatgta atttatttgt tccttggaaa tcccagcact agctaacgct ctctcaatac agagaataac accagcccca tcagggtgag gctcggtcat gtgataggca tcacatgtga aactcccacc gaggaactct gcgtagatag ttgcacctct tttcttagca tgctcgagtt cttccaaaag tagaactcca gctccctctc ccatcacgaa accatctcga ttggtatccc aaggacgtga agcttttgtg ggatcattat tcctttgtga aagagcccgg c <210> 123 <211> 1380 <212> DNA <213>人造 <220> <223>合成 <400> 123 cgatagaggc aaagagcaaa gatgcatttg ttcctccaaa gccaaacgaa ttcgacattg ctgtcctaac taacatcttt ttcgaagtgg ttaaaggcat gaacctcttg tcgaagatgg gatctggatt cttgacattc agcgtcatag gagcaacccc gtgatgtata gcaaggatac tgaaaatagc ttccactgct ccagctgctc caagaagatg accagtagcc cccttggtgg aggagaatgc caaggtgcct gaagtagcat gttcagagaa taccgtcttg atagctctcg cttccacggc atcgcctatt ggggttgatg ttgcatgtgc gtttacataa tcaatttggt ttggacacag accagactgt cttaaggcac gcgtcatggc caaaacagct ccttttccat cttcaggagg ttgagtaata tggtgtgcat cgcctgacat cccatatcca caaagctcag cataaatttt tgctcctcgt ctttttgcat gctcatattc ctctaatact ataacccctg aaccttcccc tatcacaaaa ccatcccggt cacaatcaaa aggccgtgaa gcttcttgtg gagaagaatt gaatttagtt gacaaagccc ttgatctaga gaatccagct acggacagag catcaatgct agactcagtt ccaccagcca ccataacatc tgcatctcca aattgaatca tcctagtggc atcgcctata gaatgtgcac cagttgcgca agctgtcaca gcagcatgat ttggcccctg aaatccatac ttcatgctca catgaccaga tgccatgttt accaatattt 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2361 60 120 180 240 300 360 420 480 540 600 660 720 780 535 840 900 200813222 ttggaatgaa aaacggacta agccgccgca gcctcttttc acaaatcagc tgcgctgcct ccacaatatc acatatactt ccaattccac caccaataga gactcctgtt ctctcttttt cttcttcttc agttggtaac cactctgcat ctctcaaagc ttcatcggca gcacatacag catatccgat aaaattcgca actgccttag agtttagcca aagggcttca tcaaattcac cagggtttga tccataaggc acaaaagcag caactttaga agaaagctga tcaaaagtat ataactttgt ctcttcatca aaagacttca tcttgagatc atcaagagtc aatcctctaa tcccacattc tccatcaatt aaacgcctcc acgttgtttc aacgcctcta ccaagtggag tcaccatgcc tagaccagtg acaacaacac ggcgatgtga atgataagaa gaagaagtag agatgaagcg gtttaagcgg aggcgacttg cgctcaagtg tctacggaga ttagatgtcg <210> 124 <211〉 1052 <212〉 DNA <213>人造 <220> <223>合成 <400〉 124 gcgcgccgat ttctaatgat gatctcgcta aaatagttga tactaatgat gaatggattg ctactcgtac tggtattcgc aaccgtcgag ttgtctcagg caaagatagc ttggttggct tagcagtaga agcagcaacc aaagctcttg aaatggctga ggttgttcct gaagatattg acttagtctt gatgtgtact tccactcctg atgatctatt tggtgctgct ccacagattc aaaaggcact tggttgcaca aagaacccat tggcttatga tatcacagct gcttgtagtg gatttgtttt gggtctagtt tcagctgctt gtcatataag gggaggcggt tttaagaacg ttttagtgat cggagctgat tctttgtctc ggtttgttga ttggacggat agagggactt gcattctatt tggagatgct gctggtgctg tggttgttca ggcttgtgat attgaagatg atggtttgtt cagttttgat gtgcacagca tttaaatgtg tatttggatc cgctgtgcac atcaaaactg aacaaaccat catcttcaat atcacaagcc tgaacaacca cagcaccagc agcatctcca aatagaatgc aagtccctct atccgtccaa tcaacaaacc gagacaaaga atcagctccg atcactaaaa cgttcttaaa accgcctccc cttatatgac aagcagctga aactagaccc aaaacaaatc cactacaagc agctgtgata tcataagcca atgggttctt tgtgcaacca agtgcctttt gaatctgtgg agcagcacca aatagatcat caggagtgga agtacacatc aagactaagt caatatcttc aggaacaacc tcagccattt caagagcttt ggttgctgct tctactgcta agccaaccaa gctatctttg cctgagacaa ctcgacggtt gcgaatacca gtacgagtag caatccattc atcattagta tcaactattt tagcgagatc atcattagaa atctctagag agttaattaa ga <210> 125 <211〉 1208 <212> DNA <213〉人造 <220〉 <223>合成 <400> 125 960 1020 1080 1140 1200 1260 1320 1380 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 536 1052 200813222 cctccatcgc ataattgctg atccccacgt taaaccggct ccaaaaccgg atgtcgctat 60 ggtatgtcct ggtttaactt ttccgcttct cactgcctca tcaagagcca gcggaatcga 120 agcagcgctc gtgttaccat aattagccaa attcgatatg actctctctg gtgggaaatg 180 cagccttgta gccacagagt ctattattct ctggttcgcc tggtggagga ggagccagtc 240 gatggcagaa gcaggaagac cagctttttg taaagcagat tcaatagatt gaggaacaca 300 tttgacagca aagcgaaaga cctcttttcc attcatctga atacaagaat atgaagattg 360 ttttggtgga aagtctccaa acaccgagcc attggagctt gattcaccat cgttttggga 420 ttctttaaca gaagcattca aatgtcttcg accatcccca tcgctgtgca catcaaaact 480 gaacaaacca tcatcttcaa tatcacaagc ctgaacaacc acagcaccag cagcatctcc 540 " aaatagaatg caagtccctc tatccgtcca atcaacaaac cgagacaaag aatcagctcc 600 gatcactaaa acgttcttaa aaccgcctcc ccttatatga caagcagctg aaactagacc 660 caaaacaaat ccactacaag cagctgtgat atcataagcc aatgggttct ttgtgcaacc 720 aagtgccttt tgaatctgtg gagcagcacc aaatagatca tcaggagtgg aagtacacat 780 /: caagactaag tcaatatctt caggaacaac ctcagccatt tcaagagctt tggttgctgc 840 ttctactgct aagccaacca agctatcttt gcctgagaca actcgacggt tgcgaatacc 900 agtacgagta gcaatccatt catcattagt atcaactatt ttagcgagat catcattaga 960 aatcagaaga cttggaactg ctgatccaca tccaatcaat ttgcagccac tcggcactag 1020 cctgggtcgt tgatattgag aaggagaaga cgaagcatcc ttatcgacgg agctgacgct 1080 agagcacaaa accctcttag agaatcgatt ggaaacgcaa aacccagatc cagaaactct 1140 aaccggaaca tggattctgc ttcgcaagtt aggaattgaa ggatgagtga agaacccaga 1200 tgcattag 1208 / % 537

Claims (1)

  1. 200813222 十、申請專利範圍·· 1·種經基因修飾之植物、植物部分或植物細胞,其中該 植物、植物部分或植物細胞係經PUFA合成酶基因與磷 酸泛醯巯基轉移酶(PPTase)修飾,該puFA合成酶可製造 至少一多不飽和脂肪酸(PUFA),以及其中該植物或植物 細胞含有一基因修飾俾以抑制一選自於由KASII與 KASIII組成之族群之蛋白質的表現或活性。 種、、、二基因修飾之植物、植物部分或植物細胞,其中該 植物或植物細胞係經P U F A合成酶基因與磷酸泛醯巯基 轉移酶(PPTase)修飾,該合成酶可製造至少一多不飽和 脂肪酸(PUFA),以及其中至少一編碼PUFA合成酶或 PPTase之核酸分子係操作性地與一由SEQIDNO : 81表 不之編碼一色素體(Plastid)-標的序列的核酸序列聯結。 3.如申請專利範圍第2項之經基因修飾之植物、植物部分 或植物細胞,其中該植物係含有一基因修飾,以抑制一 選自於由KASII與KASIII組成之族群之蛋白質的表現或 活性。 4·如申請專利範圍第1項或第3項之經基因修飾之植物、植 物部分或植物細胞,其中與無此KASII或KASIII抑制者 相較’該植物或植物細胞係製造增加量之該至少— PUFA。 5·如申請專利範圍第1項至3項中任一項之經基因修錦之 楂物、植物部分或植物細胞,其中該植物或植物細胞經 基因修飾,以抑制KASII之表現或活性。 538 200813222 6.如申請專利範圍第5項之經基因修飾之植物、植物部分 或植物細胞,其中該基因修倚包含以可抑制KASII之表 現或活性之RNAi構築物將植物或植物細胞轉型。 7·如申請專利範圍第6項之經基因修飾之植物、植物部分 或植物細胞,其中該RNAi構築物包含一在此由SEQ ID NO : 122所表示之核酸序列。 8 ·如申请專利範圍第5項之經基因修飾之植物、植物部分 或植物細胞,其中該基因修飾包含以可抑制KASII之表 現或活性之反義股核酸分子將植物或植物細胞轉型。 9·如申請專利範圍第8項之經基因修飾之植物、植物部分 或植物細胞,其中該反義股核酸分子包含一在此由SEQ ID NO : 123所表示之核酸序列。 10·如申請專利範圍第1至3項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物係經基因修飾, 以抑制KASIII之表現或活性。 11·如申請專利範圍第10項之經基因修飾之植物、植物部分 或植物細胞,其中該基因修飾包含以可抑制KASIII之表 現或活性的RNAi構築物將植物或植物細胞轉型。 12·如申請專利範圍第11項之經基因修飾之植物、植物部分 或植物細胞,其中該RNAi構築物包含一在此由SEq m NO : 124所表示的核酸序列。 13 ·如申请專利範圍第1 〇項之經基因修_之植物、植物部分 或植物細胞,其中該基因修飾包含以可抑制KASIII之表 現或活性的反義股核酸分子將植物或植物細胞轉型。 539 200813222 14·如申請專利範圍第13項之經基因修飾之植物、植物部分 或植物細胞,其中該反義股核酸分子包含一在此由SEq ID NO : 125所表示的核酸序列。 15·如申請專利範圍第1至14項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物或植物細胞包含 一額外之基因修飾,以表現一或多種會催化長鏈pUFA 自由脂肪酸(FFA)轉換為醢基-CoA之異源性醯基_c〇A 合成酶(ACoAS)或其同源物。 16·如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一核酸 序列之核酸分子轉型,該核酸序列編碼一得自隱甲藻 (Crypthecodinium cohnii)之醯基-CoA合成酶(ACoAS)或 其同源物,其中該ACoAS或其同源物催化長鏈PUFA自 由脂肪酸(FFA)轉換為醯基-CoA。 17.如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞’其中該植物或植物細胞係經一包—核酸 序列之核酸分子轉型,該核酸序列編碼一得自分裂殖壺 菌(Schizochytrium)之醯基-CoA合成酶(ACoAS)或其同 源物,該同源物至少60%等同於編碼裂殖壺菌 (Schizochytrium)ACoAS之胺基酸序列,其中該ACoAS 或其同源物催化長鏈PUFA自由脂肪酸(ffA)轉換為醯 基-CoA 〇 18·如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一編碼 540 200813222 一醯基-CoA合成酶(ACoAS)之核酸序列的核酸分子轉 型,該醯基-CoA合成酶至少60%等同於一具有選自於 由:SEQ ID NO : 83、SEQ ID NO : 85、SEQ ID NO : 87、SEQ ID NO : 89、SEQ ID NO : 91、SEQ ID NO : 93、SEQ ID NO : 95、SEQ ID NO : 97與 SEQ ID NO : 99所組成的組群之胺基酸序列的ACoAS。 19.如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一編碼 一醯基-CoA合成酶(ACoAS)之核酸序列的核酸分子轉 型,該醯基-CoA合成酶具有一選自於由:SEQ ID NO : 83、SEQ ID NO : 85、SEQ ID NO : 87、SEQ ID NO : 89、SEQ ID NO : 91、SEQ ID NO : 93、SEQ ID NO : 95、SEQ ID NO : 97與SEQ ID NO : 99組成之組群的胺 基酸序列。 20·如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一編碼 一酿基-CoA合成酶(ACoAS)之核酸序列的核酸分子轉 型’該醯基_coA合成酶具有選自於由:SEQ IDNO: 83、 SEQ ID NO: 85與SEQ ID NO: 97組成之組群的胺基酸 序列。 21.如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含編碼一 醯基-CoA合成酶(ACoAS)之核酸序列的核酸分子轉 型,該核酸序列具有SEQ ID NO : 83或SEQ ID NO : 85 541 200813222 之胺基酸序列,以及經一包含編碼一具有SEQ ID NO: 97之胺基酸序列之醯基-CoA合成酶(ACoAS)之核酸序 列的核酸分子轉型。 22.如申請專利範圍第15項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一核酸 序列之核酸分子轉型,該核酸序列係選自於由:Seq id NO · 82、SEQ ID NO : 84、SEQ ID NO ·· 86、SEQ ID NO : 88、SEQ ID NO : 90、SEQ ID NO : 92、SEQ ID NO : 94、SEQ ID NO ·· 96與SEQ ID NO ·· 98組成之組群。 23·如申請專利範圍第1至22項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物或植物細胞包含 一額外之基因修飾,以表現來自會内生性製造puFAsi 生物體的一或多種異源性蛋白質,其中該蛋白質利用 PUFA-CoA作為受質,形成磷脂質(pL)或三醯基甘油 (TAG) 〇 24·如申請專利範圍第23項之經基因修飾之植物、植物部分 或植物細胞,其中該生物體内生性地表現一pUFA合成 酶。 25·如申請專利範圍第23項之經基因修飾之植物、植物部分 或植物細胞,其中該蛋白質為一dagat或一LpAAT。 26·如申請專利範圍第23項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一核酸 序列的核酸分子轉型,該核酸序列編碼得自破囊壺菌 (Thraustochytrid)或網黏菌(Labyrimhulid)之一蛋白質, 542 200813222 該蛋白質係利用PUFA-CoA為受質,形成磷脂質(pL) 或三醯基甘油(TAG)。 27·如申請專利範圍第23項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包一含核酸 序列之核酸分子轉型,該核酸序列編碼得自裂殖壺菌 (Schizochytrixmi)之一蛋白質,該蛋白質係利用 PUFA-CoA為受質,形成磷脂質(PL)或三醯基甘油 (TAG)。 28·如申請專利範圍第27項之經基因修飾之植物、植物部分 或植物細胞,其中該核酸序列編碼一包含一胺基酸序列 之蛋白質,該胺基酸序列至少60%等同於選自於由:SEq ID NO : 102、SEQ ID NO : 104、SEQ ID NO : 107、SEQ ID NO : 110與SEQ Π) NO ·· 113所組成之組群的胺基酸 序列。 29·如申請專利範圍第27項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一編碼 一蛋白質之核酸序列的核酸分子轉型,該蛋白質包含選 自於由 SEQ ID NO : 102、SEQ ID NO : 104、SEQ ID NO : 107、SEQ ID NO : 110與SEQ ID NO : 113所組成 之組群的一胺基酸序列。 30·如申請專利範圍第27項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一編碼 一蛋白質之核酸序列的核酸分子轉型,該蛋白質包含選 自於由SEQIDNO ·· 102與SEQIDNO : 104所組成之 543 200813222 組群之一胺基酸序列。 31.如申請專利範圍第27項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一包含一編碼 一蛋白之核酸序列的核酸分子轉型,該蛋白質包含SEq ID NO : 102之胺基酸序列,且經一編碼一包含seq ID NO : 104之胺基酸序列之蛋白質的核酸序列,轉型。 32·如申晴專利範圍弟27項之經基因修飾之植物、植物部分 或植物細胞,其中該植物或植物細胞係經一核酸分子轉 型,該核酸分子包含選自於由SEQ ID NO: 100、SEQ ID NO : 102、SEQ ID NO : 103、SEQ ID NO : 105、SEQ ID NO · 106、SEQ ID NO : 108、SEQ ID NO : 109、SEQ ID NO: 111與SEQ ID NO: 112所組成之組群的一核酸序 列。 33·如申請專利範圍第23項之經基因修飾之植物、植物部分 或植物細胞’其中該植物或植物細胞係經一包含一核酸 序列之核酸分子轉型,該核酸序列編碼得自隱甲藻 (Crypthecodinium cohnii)之一蛋白質,該蛋白質係利用 PUFA-CoA為受質,形成磷脂質(PL)或三醯基甘油 (TAG) 〇 34·如申請專利範圍第33項之經基因修飾之植物、植物部分 或植物細胞’其中該植物或植物細胞係經一包含一核酸 序列之核酸分子轉型,該核酸序列至少90%等同選自於 由 SEQ ID NO : 114、SEQ ID NO : 115、SEQ ID NO : 116、SEQ ID NO : 117、SEQ ID NO: 118、SEQ ID NO : 544 200813222 119、SEQ ID NO : 120與SEQ ID NO : 121 所組成之組群 之'^核酸序列。 35.如申请專利範圍第1至34項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物或植物細胞係包 含一額外之基因修飾,以剔除或使一内生性脂肪酸合成 酶(FAS)或一與由該植物表現之FAS結合之蛋白質失去 活性。 36·如申請專利範圍第1至35項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物或植物細胞係包 含一額外之基因修飾,以降低丙二醯C 〇 A與P U F A合成酶 之只兄爭’或增加丙二酿CoA在該植物或植物細胞中之含 量。 37·如申請專利範圍第丨至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少一知自破囊壺菌(Thraustochytrid)或網黏菌 (Labyrinthulid)之PUFA合成酶的功能性區域。 38·如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少一得自破囊壺菌(thraustochytrid)微生物體之PUFA合 成酶的功能性區塊。 39·如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少一功能性區塊,該功能性區塊係得自選自於由裂殖壺 囷(Schizochytrium)、破囊壺菌(thraustochytrium)、巫肯 545 200813222 足亞菌(Ulkenia),以及網黏菌(Labyrinthula)所組成之組 婵之一微生物體之PUFA合成酶。 4〇.如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少,得自裂殖壺菌(Schizochytrium)之PUFA合成酶的功 能性區塊。 41.如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少,功能性區塊,該功能性區塊係得自選自於由美國菌 種中心(ATCC)No· 20888 之裂殖壺菌(Schizochytrium sp·)、破囊壺菌(thraustochytrium)23B ATCC No. 20892, 及該專微生物體之任一突變株所組成之組群之一生物 體的PUFA合成酶。 42·如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少一得自海洋細菌之PUFA合成酶的功能性區塊。 43·如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶包含至 少一功能性區塊,該功能性區塊係得自選自於由沙雷菌 (Shewanella)、嗜壓菌(Moritella)以及發光菌 (Photobacterium)所組成之組群之一生物體的PUFA合成 酶。 44·如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶係由一 546 200813222 或多種蛋白質組成,其包含: (a) 至少一烯酯-ACP還原酶(ER)區塊; (b) 至少四醯基載體蛋白質(ACP)區塊; (c) 至少二β-酮基醯基-ACP合成酶(KS)區塊; (d) 至少一醯基轉移酶(AT)區塊; (e) 至少一 β-酮基醯基-ACP還原酶(KR)區塊; ⑴至少二FabΑ-類似β-羥基醯基-ACP脫氫酶(DH) 區塊;以及 (g) 至少一鏈長度因子(CLF)區塊; (h) 至少一丙二醯-CoA: ACP醯基轉移酶(MAT)區 塊。 45. 如申請專利範圍第1至36項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該PUFA合成酶係由一 或多種蛋白質組成,其包含: (a) 二烯酯ACP-還原酶(ER)區塊; (b) 八或九個醯基載體蛋白質(ACP)區塊; (c) 二β-酮基醯基-ACP合成酶(KS)區塊; (d) —醯基轉移酶(AT)區塊; (e) — S同基還原酶(KR)區塊; (f) 二FabA-類似β-羥基醯基-ACP脫氫酶(DH) 區塊; (g) —鏈長度因子(CLF)區塊;以及 (h) 一丙二醯-Co A: ACP醯基轉移酶(MAT)區塊。 46. 如申請專利範圍第1至36項中任一項之經基因修飾之植 547 ,13222 物、植物部分或植物細胞,其中該PUFA合成酶為一細 菌性PUFA合成酶,其可於溫度至少約25 °C下製造 P^FAs,且其中該puFA合成酶係由一或多種蛋白質組 成,其包含: (a) 至少一烯酯ACP-還原酶(ER)區塊; (b) 至少六醯基載體蛋白質(ACP)區塊; (c) 至少二卜酮基醯基_acp合成酶(KS)區塊; (d) 至少一醯基轉移酶(ΑΤ)區塊; (e) 至少一酮基還原酶(KR)區塊; (f) 至少二FabA-類似β-羥基醯基-ACP脫氫酶(DH) 區塊; (g) 至少一鏈長度因子(CLF)區塊; (h) 至少一丙二醯_c〇A : ACP醯基轉移酶(MAT)區 塊;以及 1)至少一 4’-磷酸泛醯巯基轉移酶(PPTase)區塊。 申請專利範圍第1至36項中任一項之經基因修飾之植 、植物部分或植物細胞,其中該puFA合成酶包含一 47·如 物 或多個選自於由:SEQIDNOs : 1-32任一項,以及SEQ 如1DN〇s :35-80任一項所組成之組群的序列,。 申凊專利範圍第1至47項中任一項之經基因修飾之植 2、植物部分或植物細胞,其中一或多個編碼該pufa 合成酶之核酸序列已經最佳化,以增進植物或植物細胞 中5亥PUFA合成酶之表現。 49.如申請專利範圍第丨至47項中任一項之經基因修飾之植 548 200813222 物、植物部分或植物細胞,其中該PUFA合成酶與 PPTase之表現係以植物或植物細胞之色素體為標的。 50.如申請專利範圍第丨至49項任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物為一油類種子植 物。 51·如申請專利範圍第1至5〇項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物為雙子葉 (dicotyledonous)植物。 52·如申請專利範圍第1至49項中任一項之經基因修飾之楂 物、植物部分或植物細胞,其中該植物係選自於由:油 菜(canola)、大豆、油菜(rapeseed)、亞麻子(linseed)、玉 米、紅花(safflower)、葵花與煙草(t〇bacco)所組成之組 群。 53.如申請專利範圍第1至52項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物或植物細胞製造 至少一選自於由:EPA(C20 : 5, n-3)、DHA(C22 : 6, n_”、 DPA(C22 : 5, n-6或n-3)、ARA(C20 : 4, n-6)、GLA(C18 : 3, n-6),及/或SDA(C18 : 4, n-3))所組成之組群的多不飽 和脂肪酸(PUFA)。 54·如申請專利範圍第1至52項中任一項之經基因修錦之植 物、植物部分或植物細胞,其中該植物或植物細胞係製 造至少一選自於由:DHA、EPA與DPAn_6所組成之組群 的多不飽和脂肪酸(PUFA)。 55·如申請專利範圍第1至52項中任一項之經基因修飾之植 549 200813222 物、植物部分或植物細胞,其中該植物或植物細胞係製 造DHA 與DPAn-6。 56·如申請專利範圍第1至52項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物或植物細胞係製 造 ARA。 57·如申請專利範圍第1至56項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物、植物部分或植 物細胞中之總脂肪酸分佈(pr〇file)包含至少以重量計 0.5%之該至少一 pufa。 58·如申明專利範圍第1至56項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中由該puFA合成酶製造 之總脂肪酸,除了該至少一PUFA之外,尚包含少於以 重里计約10%重之由該植物或植物細胞所製造之總脂 肪酸。 59·如申明專利範圍第1至56項中任一項之經基因修飾之植 物植物部分或楂物細胞,其中由該PUFA合成酶製造 之總脂肪酸’除了該至少-PUFA之外,尚包含少於以 重置計約5 〇/〇之由該植物或植物細胞所製造之總脂肪 酸。 60·如申Μ專利範圍第1至56項中任-項之經基因修飾之植 物、植物部分或植物細胞,其中該植物、植物部分或植 物、胞中之總脂肪酸分佈(pr〇file)包含以重量計至少約 〇·5/°之至少一多不飽和脂肪酸(PUFA),該多不飽和脂肪 酸具有至少20個碳與4或更多個碳_碳雙鍵,且其中該植 550 200813222 物或植物部分之總脂肪酸分佈包含少於約5%之下列 PUFAs的總和:I次亞麻油酸(GLA ; 18 : 3, n-6)、具有 18個碳與4個碳-碳雙鍵之PUFAs、具有2〇個碳與3個碳_ 碳雙鍵之PUFAs,以及具有22個碳與2或3個碳-碳雙鍵之 PUFAs。 61·如申請專利範圍第1至56項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物、植物部分或植 物細胞中之總脂肪酸分佈(profile)包含以重量計至少約 0.5%之至少一多不飽和脂肪酸(PUFA),該多不飽和脂肪 酸具有至少20個碳與4或更多個碳-碳雙鍵,且其中該植 物或植物部分之總脂肪酸分佈(profile)包含少於丨%之下 列PUFAs之總和:γ_次亞麻油酸(GLA ; 18 : 3, n-6)、具 有18個碳與4個碳-碳雙鍵之PUFAs、具有20個碳與3個碳 -碳雙鍵之PUFAs,以及具有22個碳與2或3個碳-碳雙鍵 之 PUFAs。 62·如申請專利範圍第1至56項中任一項之經基因修飾之植 物、植物部分或植物細胞,其中該植物、植物部分或植 物細胞中之總脂肪酸分佈包含以重量計至少約0.5%重 之至少一多不飽和脂肪酸(PUFA),該多不飽和脂肪酸具 有至少20個碳與4或更多個碳-碳雙鍵,且其中該植物或 植物部分中之總脂肪酸分佈包含少於2%之γ-次亞麻油 酸(GLA ; 18 : 3, n-6),以及二高个次亞麻油酸(DGLA 或HGLA ; 20 : 3, n-6) 0 63.如申請專利範圍第63項之經基因修飾之植物、植物部分 551 200813222 或植物細胞’其中該植物、植物部分或植物細胞中之總 脂肪酸分佈包含以重量計少於1%之丫_次亞麻油酸 ( 3’ 11 6),以及—咼_丫_次亞麻油酸(〇〇[八或 HGLA ; 20 : 3, η-6) 〇 64.如申請專利範圍第m項中任一項之經基因修飾之植 物、植物部分或植物細胞,其巾該㈣、㈣部分或植 物細胞之總脂肪酸分佈,包含以重量計至少約〇5%之至 少-多不飽和脂肪酸(PUFA),該多不飽和脂肪酸具有至 少20個碳與4或更多個碳_碳雙鍵,且其中該植物或植物 部分中之總脂肪酸分佈包含少於1%々次亞麻油酸 (GLA,18 : 3,n_6) 〇 65·如申請專利範’ 64項之經基因修飾之植物、植物部分 或植物、、讀其巾4植物、植物部分或植物細胞之總脂 肪酸分佈包含以重量計至少〇5%之卜欠亞麻油酸 (GLA ; 18 : 3, n_6) 〇 66. -種油類,其得自如申請專利範圍第ay項中任一項 之植物、植物部分或植物細胞。 67. -種植物油,其包含可_量之Μα(三忙烧六稀酸 (C22 : 6, n-3)),以及DPA(二十二烷五烯酸(C22 : 5, n_6), 其中該DPAn-6與DHA之比例為i : !或大於i : i,其中 該植物油係得自如申請專利範圍第丨至65項中任一項之 植物、植物部分或植物細胞。 队-種種子,其得自如巾請專利範圍第β65項任一項之 植物。 552 200813222 69.—種食物產品,其包含如申請專利範圍第的或”項之油 類,或如申睛專利範圍第68項之種子。 70· -種醫療用產品,包含如申請專利範圍第66或67項之油 類。 71· 一種製造包含至少一 PUFA之油類之方法,其包含自如 申請專利範圍第68項之種子中回收一油類。 72·—種製造包含至少一puFA之油類之方法,其包含自如 申睛專利範圍第1至65項中任—項之植物、植物部分或 植物細胞中回收一油類。 73·種製造至少一多不飽和脂肪酸(pUFA)之方法,其包含 種植如申請專利範圍第1至65項中任一項之植物。 74· -種提供包含至少一PUFA之營養補充或醫療用產品至 個體之方法,其包含提供該個體如申請專利範圍第^ 至65項中任一項之植物、植物部分或植物細胞、如申請 專利範圍第68項之種子、如巾請專利範圍第66或67項之 油類、如中請專利範圍⑽項之食物產品,或如申請專 利範圍第70項之醫療用產品。 玎-種製造如申請專利範圍第_項之經基因修飾之植 物、植物部分或植物細胞之方法,其包含使用編碼puFA 合成酶與PPTase之一或多個核酸分子以使一植物或植 物細胞轉型,其中該植物或植物細胞包含—基因修飾以 抑制-選自於由KASN與KASIII組成之組群的蛋白質之 表現或活性。 、 %-種製造如申請專利範圍第_項之經基因修飾之植 553 200813222 物、植物部分或植物細胞之方法,包含使用編碼PUFA 合成酶與PPTase之一或多個核酸分子以使一植物或植 物細胞轉型,並更進一步基因地修飾該植物或植物細胞 以抑制一選自於由KASII與KASIII所組成之組群的蛋白 質之表現或活性。 554
TW096108937A 2006-03-15 2007-03-15 Polyunsaturated fatty acid production in heterologous organisms using PUFA polyketide synthase systems TW200813222A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78320506P 2006-03-15 2006-03-15
US78461606P 2006-03-21 2006-03-21

Publications (1)

Publication Number Publication Date
TW200813222A true TW200813222A (en) 2008-03-16

Family

ID=38510298

Family Applications (2)

Application Number Title Priority Date Filing Date
TW096108936A TWI504748B (zh) 2006-03-15 2007-03-15 於異源性生物體中使用多不飽和脂肪酸(pufa)聚酮合成酶系統來製造多不飽和脂肪酸之技術(一)
TW096108937A TW200813222A (en) 2006-03-15 2007-03-15 Polyunsaturated fatty acid production in heterologous organisms using PUFA polyketide synthase systems

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW096108936A TWI504748B (zh) 2006-03-15 2007-03-15 於異源性生物體中使用多不飽和脂肪酸(pufa)聚酮合成酶系統來製造多不飽和脂肪酸之技術(一)

Country Status (14)

Country Link
US (5) US20070220634A1 (zh)
EP (3) EP2004835A4 (zh)
JP (4) JP5227302B2 (zh)
KR (3) KR101524398B1 (zh)
CN (1) CN104073505A (zh)
AU (2) AU2007226510B2 (zh)
BR (1) BRPI0709317A2 (zh)
CA (2) CA2646317A1 (zh)
ES (1) ES2527875T3 (zh)
HK (1) HK1126253A1 (zh)
IL (2) IL194078A (zh)
MX (3) MX339812B (zh)
TW (2) TWI504748B (zh)
WO (3) WO2007106904A2 (zh)

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6566583B1 (en) * 1997-06-04 2003-05-20 Daniel Facciotti Schizochytrium PKS genes
US7217856B2 (en) * 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US7211418B2 (en) 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US20070244192A1 (en) * 1999-01-14 2007-10-18 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
US7247461B2 (en) * 1999-01-14 2007-07-24 Martek Biosciences Corporation Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof
US8003772B2 (en) 1999-01-14 2011-08-23 Martek Biosciences Corporation Chimeric PUFA polyketide synthase systems and uses thereof
TWI324181B (en) 2001-04-16 2010-05-01 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
PL1756280T3 (pl) 2004-04-22 2015-04-30 Commw Scient Ind Res Org Synteza długołańcuchowych wielonienasyconych kwasów tłuszczowych w komórkach rekombinowanych
CN102559364B (zh) 2004-04-22 2016-08-17 联邦科学技术研究组织 用重组细胞合成长链多不饱和脂肪酸
CN104073505A (zh) * 2006-03-15 2014-10-01 Dsmip资产公司 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法
WO2008025068A1 (en) 2006-08-29 2008-03-06 Commonwealth Scientific And Industrial Research Organisation Synthesis of fatty acids
US20100210017A1 (en) * 2007-01-12 2010-08-19 Gill Ryan T Compositions and methods for enhancing tolerance for the production of organic chemicals produced by microorganisms
EP2152849B1 (en) 2007-06-01 2013-02-20 Solazyme, Inc. Production of oil in microorganisms
US8048624B1 (en) 2007-12-04 2011-11-01 Opx Biotechnologies, Inc. Compositions and methods for 3-hydroxypropionate bio-production from biomass
EP2245166A4 (en) * 2008-01-28 2012-12-05 Univ Oklahoma VERY LONG CHAIN POLYUNSATURATED FATTY ACIDS, METHODS OF MAKING THE SAME AND USES THEREOF
WO2010019813A2 (en) * 2008-08-13 2010-02-18 Sapphire Energy, Inc. Production of fatty actds by genetically modified photosynthetic organisms
WO2010033921A2 (en) * 2008-09-19 2010-03-25 President And Fellows Of Harvard College Photoautotrophic adipogenesis technology (phat)
AU2009317860B2 (en) 2008-11-18 2014-03-27 Commonwealth Scientific And Industrial Research Organisation Enzymes and methods for producing omega-3 fatty acids
EP3098321B1 (en) * 2008-11-28 2018-12-19 Corbion Biotech, Inc. Production of tailored oils in heterotrophic microorganisms
JP2012512655A (ja) * 2008-12-19 2012-06-07 アルファ−ジェイ リサーチ リミテッド パートナーシップ 細胞増殖および藻類生成物生成の切り離しを通じた藻類生成物生成の最適化
TW201028472A (en) * 2009-01-13 2010-08-01 Alpha J Res Ltd Partnership Use of plant growth regulators to enhance algae growth for the production of added value products
JP2012520676A (ja) * 2009-03-16 2012-09-10 マーテック バイオサイエンシーズ コーポレーション ラビリンチュラ菌門の微生物におけるタンパク質作製
CN102741267B (zh) 2009-03-19 2020-06-23 帝斯曼知识产权资产有限公司 多不饱和脂肪酸合酶核酸分子和多肽,及其组合物、制备方法和用途
CN102597242B (zh) 2009-06-08 2016-03-02 罗特哈姆斯泰德研究有限公司 新脂肪酸延伸组合物及其用途
US20120107478A1 (en) * 2009-06-30 2012-05-03 Solae, Llc Omega-3 Fatty Acid Enriched Baked Foods and Bar Composition
US8809027B1 (en) 2009-09-27 2014-08-19 Opx Biotechnologies, Inc. Genetically modified organisms for increased microbial production of 3-hydroxypropionic acid involving an oxaloacetate alpha-decarboxylase
CN102695799A (zh) 2009-09-27 2012-09-26 Opx生物工艺学公司 用于制备3-羟基丙酸和其它产物的方法
CA2785867C (en) * 2009-12-28 2018-03-27 Dsm Ip Assets B.V. Production of hemagglutinin-neuraminidase protein in microalgae
EP3505632B1 (en) * 2009-12-28 2022-08-03 Sanofi Vaccine Technologies, S.A.S. Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof
CN104974030A (zh) 2009-12-30 2015-10-14 巴斯夫制药(卡兰尼什)公司 用于纯化多不饱和脂肪酸的模拟移动床色谱分离方法
AR079852A1 (es) 2010-01-07 2012-02-22 Aedenswil Basf Agro B V Arnhem Nl Zweigniederlassung W Plantas tolerantes a herbicidas
GB2492256A (en) * 2010-01-27 2012-12-26 Opx Biotechnologies Inc Microorganism production of high-valve chemical products, and related compositions, methods and systems
CN104388439B (zh) 2010-02-01 2018-02-23 三得利控股株式会社 编码酰基‑CoA合成酶同源物的多核苷酸及其用途
US8372465B2 (en) 2010-02-17 2013-02-12 Bunge Oils, Inc. Oil compositions of stearidonic acid
US11236351B2 (en) 2010-05-17 2022-02-01 Dow Agrosciences Llc Production of DHA and other LC PUFAs in plants
TW201144442A (en) * 2010-05-17 2011-12-16 Dow Agrosciences Llc Production of DHA and other LC-PUFAs in plants
SG10201504197SA (en) 2010-05-28 2015-06-29 Solazyme Inc Food Compositions Comprising Tailored Oils
AU2013202057B2 (en) * 2010-06-25 2016-01-28 Basf Plant Science Company Gmbh Acyltransferases and uses therof in fatty acid production
WO2011161093A1 (en) * 2010-06-25 2011-12-29 Basf Plant Science Company Gmbh Acyltransferases and uses therof in fatty acid production
KR101964886B1 (ko) 2010-11-03 2019-04-03 테라비아 홀딩스 인코포레이티드 유동점이 낮은 미생물 오일, 이 오일로 제조된 유전성 유체 및 관련 방법
KR101964965B1 (ko) 2011-02-02 2019-04-03 테라비아 홀딩스 인코포레이티드 재조합 유지성 미생물로부터 생산된 맞춤 오일
CN102250864B (zh) * 2011-05-03 2013-03-20 中国农业大学 亚油酸异构酶在脱氢和异构方面的双重用途
KR20140033378A (ko) 2011-05-06 2014-03-18 솔라짐, 인코포레이티드 자일로오스를 대사시키는 유전자 조작된 미생물
GB201111595D0 (en) 2011-07-06 2011-08-24 Equateq Ltd Improved process
GB201111594D0 (en) 2011-07-06 2011-08-24 Equateq Ltd New improved process
TW201307553A (zh) * 2011-07-26 2013-02-16 Dow Agrosciences Llc 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術
US8980591B2 (en) * 2011-08-04 2015-03-17 Suntory Holdings Limited Protein having activity to promote fatty acid chain elongation, gene encoding same and use thereof
WO2013077420A1 (ja) * 2011-11-25 2013-05-30 独立行政法人農業生物資源研究所 植物の形質転換体、植物の形質転換方法、並びに該方法に用いられるベクター
US9719114B2 (en) 2012-04-18 2017-08-01 Terravia Holdings, Inc. Tailored oils
JP6499577B2 (ja) 2012-04-18 2019-04-10 テラヴィア ホールディングス, インコーポレイテッド 調整油
DE102012207921A1 (de) 2012-05-11 2013-11-14 Evonik Industries Ag Mehrstufiges Syntheseverfahren mit Synthesegas
KR102197208B1 (ko) 2012-06-15 2021-01-04 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 식물 세포에서 장쇄 다중불포화 지방산의 생성
CN104718282A (zh) 2012-08-10 2015-06-17 Opx生物工艺学公司 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法
GB201300354D0 (en) 2013-01-09 2013-02-20 Basf Pharma Callanish Ltd Multi-step separation process
US10184140B2 (en) 2013-01-23 2019-01-22 Iowa State University Research Foundation, Inc. Materials and methods for production of bi-functional fatty acids in recombinant bacteria
WO2014116754A1 (en) 2013-01-23 2014-07-31 Iowa State University Research Foundation, Inc. Materials and methods for characterizing and using kasiii for production of bi-functional fatty acids
US9816079B2 (en) 2013-01-29 2017-11-14 Terravia Holdings, Inc. Variant thioesterases and methods of use
US9567615B2 (en) 2013-01-29 2017-02-14 Terravia Holdings, Inc. Variant thioesterases and methods of use
US9290749B2 (en) 2013-03-15 2016-03-22 Solazyme, Inc. Thioesterases and cells for production of tailored oils
WO2014145096A1 (en) 2013-03-15 2014-09-18 Cindy Hoppe Flash evaporation for production purification and recovery
US9783836B2 (en) 2013-03-15 2017-10-10 Terravia Holdings, Inc. Thioesterases and cells for production of tailored oils
US20150057465A1 (en) 2013-03-15 2015-02-26 Opx Biotechnologies, Inc. Control of growth-induction-production phases
US11408013B2 (en) 2013-07-19 2022-08-09 Cargill, Incorporated Microorganisms and methods for the production of fatty acids and fatty acid derived products
BR112016001026A2 (pt) 2013-07-19 2017-10-24 Cargill Inc organismo geneticamente modificado
US10053715B2 (en) 2013-10-04 2018-08-21 Corbion Biotech, Inc. Tailored oils
MX2016005718A (es) 2013-11-01 2016-12-08 Conagen Inc Metodos de uso de acil-coa sintetasa para produccion biosintetica de acil-coas.
TW201525136A (zh) * 2013-11-26 2015-07-01 Dow Agrosciences Llc 利用破囊壺菌PUFA合成酶於油籽作物中生成ω-3長鏈多不飽和脂肪酸
EP3077526B8 (en) * 2013-12-05 2020-01-08 Genomatica, Inc. Microbial production of fatty amines
EA037817B1 (ru) 2013-12-18 2021-05-25 Коммонвелт Сайнтифик Энд Индастриэл Рисерч Организэйшн Экстрагированный растительный липид, содержащий длинноцепочечные полиненасыщенные жирные кислоты
EP3099782B1 (en) * 2014-01-28 2019-03-20 DSM IP Assets B.V. Factors for the production and accumulation of polyunsaturated fatty acids (pufas) derived from pufa synthases
KR102527795B1 (ko) 2014-06-27 2023-05-02 커먼웰쓰 사이언티픽 앤 인더스트리알 리서치 오거니제이션 도코사펜타에노산을 포함하는 지질
WO2016007862A2 (en) 2014-07-10 2016-01-14 Solazyme, Inc. Novel ketoacyl acp synthase genes and uses thereof
WO2016014968A1 (en) 2014-07-24 2016-01-28 Solazyme, Inc. Variant thioesterases and methods of use
EP2993228B1 (en) 2014-09-02 2019-10-09 Cargill, Incorporated Production of fatty acid esters
BR112017005370A2 (pt) 2014-09-18 2017-12-12 Terravia Holdings Inc acil-acp tioesterases e mutantes das mesmas
US10570427B2 (en) * 2014-10-31 2020-02-25 Lanzatech New Zealand Limited Fermentation process for the production of lipids
US10851393B2 (en) * 2015-02-24 2020-12-01 William Marsh Rice University KAS-III free FA synthesis
CN107846857B (zh) 2015-06-06 2021-07-02 帝斯曼知识产权资产管理有限公司 使用新模块二十二碳六烯酸(dha)合酶生成多不饱和脂肪酸(pufas)
US20170191094A1 (en) * 2015-12-31 2017-07-06 Synthetic Genomics, Inc. Expression of type i fatty acid synthase genes in eukaryotic algae
CN108472279A (zh) 2016-01-07 2018-08-31 科纳根公司 通过生物合成方法制造辣椒酯类物质的方法
WO2018017772A1 (en) 2016-07-19 2018-01-25 Conagen Inc. Method for the microbial production of specific natural capsaicinoids
JP2020506702A (ja) 2017-02-02 2020-03-05 カーギル インコーポレイテッド C6−c10脂肪酸誘導体を生成する遺伝子組み換え細胞
US11352601B2 (en) 2017-07-27 2022-06-07 University Of Florida Research Foundation, Incorporated Cyanobacterial hosts and methods for producing chemicals
KR102318983B1 (ko) * 2018-02-21 2021-11-01 경상북도 신규한 1-octen-3-ol을 생산하는 형질전환 효모 및 그 제조방법
WO2019164294A1 (ko) * 2018-02-21 2019-08-29 경상북도 신규한 1-octen-3-ol을 생산하는 형질전환 효모 및 그 제조방법
CN112661821B (zh) * 2021-01-21 2022-04-12 江南大学 一种柠檬酸转运蛋白及其在脂质合成中的应用
WO2023076901A2 (en) * 2021-10-25 2023-05-04 Purdue Research Foundation Heterodimeric benzaldehyde synthase, methods of producing, and uses thereof
WO2023144707A1 (en) 2022-01-25 2023-08-03 Dsm Ip Assets B.V. Media refinement and nutrient feeding approaches to increase polyunsaturated fatty acid production

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8317248D0 (en) 1983-06-24 1983-07-27 Wyeth John & Brother Ltd Fat compositions
US5246841A (en) 1986-12-26 1993-09-21 Sagami Chemical Research Center Microbial process for production of eicosapentaenoic acid
US5130242A (en) 1988-09-07 1992-07-14 Phycotech, Inc. Process for the heterotrophic production of microbial products with high concentrations of omega-3 highly unsaturated fatty acids
US5340742A (en) * 1988-09-07 1994-08-23 Omegatech Inc. Process for growing thraustochytrium and schizochytrium using non-chloride salts to produce a microfloral biomass having omega-3-highly unsaturated fatty acids
US5601860A (en) 1990-11-30 1997-02-11 American Home Products Corporation Corandomized fat compositions for infant formulas
US5639790A (en) * 1991-05-21 1997-06-17 Calgene, Inc. Plant medium-chain thioesterases
DK0616644T3 (da) 1991-12-04 2003-10-27 Du Pont Fedtsyredesaturase-gener fra planter
WO1993023545A1 (en) 1992-05-15 1993-11-25 Sagami Chemical Research Center Gene which codes for eicosapentaenoic acid synthetase group and process for producing eicosapentaenoic acid
US5798259A (en) 1992-05-15 1998-08-25 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
US5683898A (en) * 1992-05-15 1997-11-04 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
US5310242A (en) 1992-09-28 1994-05-10 Golder Kimberly A Portable infant seat
US6372965B1 (en) 1992-11-17 2002-04-16 E.I. Du Pont De Nemours And Company Genes for microsomal delta-12 fatty acid desaturases and hydroxylases from plants
DE4323727A1 (de) * 1993-07-15 1995-03-09 Boehringer Mannheim Gmbh Verfahren zur Identifizierung von menschlichen und tierischen Zellen mit der Fähigkeit zu unbegrenzter Proliferation oder zur Tumorbildung
US5672491A (en) 1993-09-20 1997-09-30 The Leland Stanford Junior University Recombinant production of novel polyketides
CA2209987A1 (en) 1995-01-13 1996-07-18 Sagami Chemical Research Center Gene coding for eicosapentaenoic acid synthesizing enzymes and process for production of eicosapentaenoic acid
EP0823475B1 (en) 1995-04-17 2009-06-17 National Institute of Advanced Industrial Science and Technology Novel microorganisms capable of producing highly unsaturated fatty acids and process for producing highly unsaturated fatty acids by using the microorganisms
ZA973565B (en) 1996-04-26 1998-10-26 Du Pont Soybean oil having high oxidative stability
WO1998001565A1 (fr) 1996-07-10 1998-01-15 Sagami Chemical Research Center Procede de production d'acide icosapentaenoique par recombinaison genetique
US6033883A (en) * 1996-12-18 2000-03-07 Kosan Biosciences, Inc. Production of polyketides in bacteria and yeast
SA98190002B1 (ar) 1997-03-28 2006-06-20 ذي يونيفيرسيتي اوف تننيسي ريسيرش كوربوريشن استخدام أحماض دهنية تحتوي على عدة روابط غير مشبعة polyunsaturated fatty acids لتقليل حدوث الالتهاب المعوي القولوني الناخر incidence of necrotizing enterocolitis
US6432684B1 (en) 1997-04-11 2002-08-13 Abbott Laboratories Human desaturase gene and uses thereof
ATE297994T1 (de) 1997-04-11 2005-07-15 Calgene Llc Verfahren und zusammensetzungen für die synthese von langkettigen, mehrfach ungesättigten fettsäuren in pflanzen.
US6051754A (en) 1997-04-11 2000-04-18 Abbott Laboratories Methods and compositions for synthesis of long chain poly-unsaturated fatty acids in plants
US6566583B1 (en) 1997-06-04 2003-05-20 Daniel Facciotti Schizochytrium PKS genes
BR9809946A (pt) * 1997-06-04 2000-08-01 Calgene Llc Produção de ácidos graxos poliinsaturados por expressão de genes de sìntese semelhantes a policetìdeo em plantas
US6013665A (en) 1997-12-16 2000-01-11 Abbott Laboratories Method for enhancing the absorption and transport of lipid soluble compounds using structured glycerides
US6677145B2 (en) * 1998-09-02 2004-01-13 Abbott Laboratories Elongase genes and uses thereof
US7247461B2 (en) 1999-01-14 2007-07-24 Martek Biosciences Corporation Nucleic acid molecule encoding ORFA of a PUFA polyketide synthase system and uses thereof
US7211418B2 (en) * 1999-01-14 2007-05-01 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US7217856B2 (en) * 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US8003772B2 (en) 1999-01-14 2011-08-23 Martek Biosciences Corporation Chimeric PUFA polyketide synthase systems and uses thereof
US7271315B2 (en) 1999-01-14 2007-09-18 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US20070244192A1 (en) 1999-01-14 2007-10-18 Martek Biosciences Corporation Plant seed oils containing polyunsaturated fatty acids
EP1294898B1 (en) * 2000-06-08 2006-08-30 Miami University FATTY ACID ELONGASE 3-KETOACYL CoA SYNTHASE POLYPEPTIDES
US20040010817A1 (en) * 2000-07-21 2004-01-15 Washington State University Research Foundation Plant acyl-CoA synthetases
EP1322752B2 (en) 2000-09-28 2015-02-11 Bioriginal Food & Science Corp. Fad4, fad5, fad5-2, and fad6, fatty acid desaturase family members and uses thereof
TWI324181B (en) 2001-04-16 2010-05-01 Martek Biosciences Corp Product and process for transformation of thraustochytriales microorganisms
TWI337619B (en) 2001-04-16 2011-02-21 Martek Biosciences Corp Pufa polyketide synthase systems and uses thereof
EP1390507A2 (en) 2001-05-21 2004-02-25 Ecopia Biosciences Inc. Genes and proteins involved in the biosynthesis of enediyne ring structures
US20040005672A1 (en) * 2002-02-22 2004-01-08 Santi Daniel V. Heterologous production of polyketides
GB2385852A (en) 2002-02-27 2003-09-03 Rothamsted Ex Station Delta 6-desaturases from Primulaceae
WO2003078639A2 (en) * 2002-03-16 2003-09-25 The University Of York Transgenic plants expressing enzymes involved in fatty acid biosynthesis
US20040172682A1 (en) 2003-02-12 2004-09-02 Kinney Anthony J. Production of very long chain polyunsaturated fatty acids in oilseed plants
JP2007524377A (ja) 2003-03-26 2007-08-30 マーテック・バイオサイエンシーズ・コーポレーション Pufaポリケチドシンターゼ系およびこれらの使用
WO2004087902A2 (de) 2003-03-31 2004-10-14 University Of Bristol Neue pflanzliche acyltransferasen spezifisch für langkettige mehrfach ungesättigte fettsäuren
US7125672B2 (en) 2003-05-07 2006-10-24 E. I. Du Pont De Nemours And Company Codon-optimized genes for the production of polyunsaturated fatty acids in oleaginous yeasts
US7208590B2 (en) * 2003-07-15 2007-04-24 Abbott Laboratories Genes involved in polyketide synthase pathways and uses thereof
DE102004017370A1 (de) 2004-04-08 2005-10-27 Nutrinova Nutrition Specialties & Food Ingredients Gmbh PUFA-PKS Gene aus Ulkenia
DE102004060340A1 (de) 2004-07-16 2006-02-09 Basf Plant Science Gmbh Verfahren zur Erhöhung des Gehalts an mehrfach ungesättigten langkettigen Fettsäuren in transgenen Organismen
WO2006034228A2 (en) 2004-09-20 2006-03-30 Basf Plant Science Gmbh Arabidopsis genes encoding proteins involved in sugar and lipid metabolism and methods of use
GB0421937D0 (en) * 2004-10-02 2004-11-03 Univ York Acyl CoA synthetases
WO2006135866A2 (en) * 2005-06-10 2006-12-21 Martek Biosciences Corporation Pufa polyketide synthase systems and uses thereof
CN104073505A (zh) * 2006-03-15 2014-10-01 Dsmip资产公司 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法
FR2904328B1 (fr) * 2006-07-27 2008-10-24 St Microelectronics Sa Depot par adsorption sous un champ electrique

Also Published As

Publication number Publication date
US9382521B2 (en) 2016-07-05
CN104073505A (zh) 2014-10-01
BRPI0709317A2 (pt) 2013-09-24
KR101524398B1 (ko) 2015-06-04
WO2007106904A2 (en) 2007-09-20
JP2013116104A (ja) 2013-06-13
JP5227302B2 (ja) 2013-07-03
EP2004835A2 (en) 2008-12-24
WO2007106904A3 (en) 2008-01-24
TWI504748B (zh) 2015-10-21
EP2001277A4 (en) 2011-06-22
MX2008011783A (es) 2009-03-20
AU2007226511A1 (en) 2007-09-20
JP2014087338A (ja) 2014-05-15
US8426686B2 (en) 2013-04-23
MX339812B (es) 2016-06-08
US20070270494A1 (en) 2007-11-22
US20070245431A1 (en) 2007-10-18
JP2009529890A (ja) 2009-08-27
US7759548B2 (en) 2010-07-20
IL194078A0 (en) 2011-08-01
EP2001277B1 (en) 2014-10-15
IL194077A (en) 2016-02-29
ES2527875T3 (es) 2015-02-02
JP2009529891A (ja) 2009-08-27
EP2004835A4 (en) 2011-02-23
KR20130103832A (ko) 2013-09-24
WO2007106903A2 (en) 2007-09-20
WO2007106905A3 (en) 2008-11-27
EP2653557A1 (en) 2013-10-23
US20140289904A1 (en) 2014-09-25
IL194078A (en) 2015-10-29
IL194077A0 (en) 2011-08-01
KR20090004971A (ko) 2009-01-12
MX340759B (es) 2015-03-11
TW200806792A (en) 2008-02-01
US20100313309A1 (en) 2010-12-09
CA2647150A1 (en) 2007-09-20
US20070220634A1 (en) 2007-09-20
EP2001277A2 (en) 2008-12-17
CA2646317A1 (en) 2007-09-20
KR101506347B1 (ko) 2015-03-26
AU2007226510A1 (en) 2007-09-20
KR101517243B1 (ko) 2015-05-28
KR20080104374A (ko) 2008-12-02
AU2007226510B2 (en) 2013-09-19
MX2008011784A (es) 2008-11-27
WO2007106903A3 (en) 2009-04-09
EP2001277B9 (en) 2014-11-26
HK1126253A1 (zh) 2009-08-28
WO2007106905A2 (en) 2007-09-20

Similar Documents

Publication Publication Date Title
KR101524398B1 (ko) Pufa 폴리케티드 신타제 시스템을 이용한 이종 생물체내 다불포화 지방산의 제조
KR101539470B1 (ko) 키메라 pufa 폴리케타이드 신테이즈 시스템 및 이의 용도
KR102184432B1 (ko) 식물체에서 dha 및 다른 lc-pufa의 생산
KR20070084187A (ko) Pufa 폴리케티드 신타제 시스템 및 그의 용도
US7897844B2 (en) PUFA polyketide synthase systems and uses thereof
JP6432867B2 (ja) 多価不飽和脂肪酸シンターゼの核酸分子およびポリペプチド、組成物、ならびにそれらの作製方法および使用
KR102197208B1 (ko) 식물 세포에서 장쇄 다중불포화 지방산의 생성
US7271315B2 (en) PUFA polyketide synthase systems and uses thereof
KR20180127526A (ko) 식물에서 dha 및 다른 lc-pufas의 생산
US20070244192A1 (en) Plant seed oils containing polyunsaturated fatty acids
TWI337619B (en) Pufa polyketide synthase systems and uses thereof
US20080005811A1 (en) Pufa polyketide synthase systems and uses thereof
CN107208043A (zh) 具有改进的光合活性的蓝细菌
RU2728854C2 (ru) Получение омега 3 длинноцепочечных полиненасыщенных жирных кислот из масличных культур при использовании синтаз pufa траустохидридов
AU2018250483A1 (en) Processes for producing lipids
AU2013251201A1 (en) Polyunsaturated fatty acid production in heterologous organisms using pufa polyketide synthase systems