KR101227432B1 - 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 - Google Patents

향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 Download PDF

Info

Publication number
KR101227432B1
KR101227432B1 KR1020097018675A KR20097018675A KR101227432B1 KR 101227432 B1 KR101227432 B1 KR 101227432B1 KR 1020097018675 A KR1020097018675 A KR 1020097018675A KR 20097018675 A KR20097018675 A KR 20097018675A KR 101227432 B1 KR101227432 B1 KR 101227432B1
Authority
KR
South Korea
Prior art keywords
plant
nucleic acid
plants
sequence
delete delete
Prior art date
Application number
KR1020097018675A
Other languages
English (en)
Other versions
KR20090119884A (ko
Inventor
최양도
박연일
정석원
황인규
오종희
Original Assignee
재단법인 작물유전체기능연구사업단
크롭디자인 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 작물유전체기능연구사업단, 크롭디자인 엔.브이. filed Critical 재단법인 작물유전체기능연구사업단
Publication of KR20090119884A publication Critical patent/KR20090119884A/ko
Application granted granted Critical
Publication of KR101227432B1 publication Critical patent/KR101227432B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/827Flower development or morphology, e.g. flowering promoting factor [FPF]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8273Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physiology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 식물에 있어 다양한 경제적으로 중요한 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 HpaG (Harpin-associated Factor G) 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 HpaG 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 향상된 수확량 관련 형질을 가진다. 또한, 본 발명은 본 발명의 방법을 수행하는데 유용한, HpaG 암호화 핵산을 포함하는 구축물을 제공한다. 본 발명은 또한 식물에서 SWITCH 2/SUCROSE NON-FERMENTING 2(SWI2/SNF2) 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현을 조절 (바람직하게는 증가)함으로써, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다. 본 발명은 또한 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법을 수행하는데 유용한 구축물을 제공한다.
HpaG 폴리펩티드, SWI2/SNF2 폴리펩티드, 수확량, 발현 조절

Description

향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법{Plants having enhanced yield-related traits and a method for making the same}
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 식물에 있어 다양한 경제적으로 중요한 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 Harpin-associated Factor G 폴리펩티드 (이후부터 "HpaG"라 명명함)를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 HpaG 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 향상된 수확량 관련 형질을 가진다. 또한, 본 발명은 본 발명의 방법을 수행하는데 유용한, HpaG 암호화 핵산을 포함하는 구축물을 제공한다. 본 발명은 또한 SWITCH 2/SUCROSE NON-FERMENTING 2 (SWI2/SNF2) 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현을 조절 (바람직하게는 증가)함으로써, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법을 수행하는데 유용한 구축물을 제공한다.
세계 인구의 증가와 농업에 유용한 경작지의 감소는 농업의 효율성을 증가시키는 연구에 박차를 가하게 만들었다. 작물 및 원예농업 향상을 위한 전통적인 방식은 바람직한 특성을 가진 식물체를 동정하기 위하여 선택적 육종기법을 이용한다. 그러나, 상기 선택적 육종기법에는 몇가지 약점이 있는데, 즉 노동집약적이며 양친으로부터 원하는 형질이 항상 전해지는 것이 아닌 이종의 유전적 요소를 가진 식물로 귀착된다는 것이다. 분자생물학의 진보로 인간이 동물 및 식물의 생식질 (germplasm)을 변형시키게 되었다. 식물유전공학은 유전물질 (전형적으로 DNA 또는 RNA 형태)의 분리와 조작 및 이 유전물질을 식물체 내로 도입하게 했다. 그런 기술은 다양한 향상된 경제적, 농업적, 원예적 형질을 가진 작물 또는 식물을 제공할 수 있다.
특히 경제적으로 중요한 형질은 증가된 수확량이다. 수확량은 보통 작물로부터 경제적 가치의 측정할 수 있는 산물로 정의된다. 이는 양 및/또는 질의 면에서 정의될 수 있다. 수확량은 몇가지 요인에 직접적으로 의존하는데, 예를 들면 기관의 수와 크기, 식물체 형상 (예를 들면, 가지의 수), 종자 생산, 잎의 노화 등이다. 뿌리 발달, 양분 흡수, 스트레스 내성, 및 초기 활력 또한 수확량 결정에 중요한 요인일 수 있다. 상기 요인들의 최적화는 작물의 수확량 증가에 기여할 수 있다.
많은 식물의 종자는 인간과 동물의 영양에 중요하므로 종자 수확량이 특히 중요한 형질이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물이 종자 자체의 직접적인 소비, 또는 가공종자로 사육된 육류 소비를 통해서 전체 인간 칼로리 흡수 량의 절반 이상을 차지한다. 상기 작물들은 설탕, 기름 및 산업적 가공공정에 사용되는 많은 종류의 대사물의 재료이기도 하다. 종자는 배 (어린 줄기와 뿌리의 근원) 및 배유 (발아 동안 및 실생의 초기 생장 동안 배 생장 양분의 공급원)를 포함한다. 종자 발달에는 많은 유전자가 관여되며, 뿌리, 잎 및 줄기로부터 생장하는 종자로 대사물의 이동이 필요하다. 특히 배유는 탄수화물, 오일 및 단백질의 대사 전구물질을 동화하여, 이 물질들을 알곡을 채우기 위한 저장성 고분자로 합성한다.
지상부 건조 중량에 대한 종자 수확량의 비율인 수확지수는 많은 환경 조건하에서 비교적 안정되어 있어, 식물 크기 및 곡물 수확량 간에 강한 상관관계가 얻어질 수 있다 (예를 들면, Rebetzke 등 (2002) Crop Science 42:739). 곡물 생물량의 대부분은 식물체의 잎 및 줄기에 의한 현재의 또는 저장된 광합성 생산성에 의존하므로 상기 과정들은 본질적으로 연결되어 있다 (Gardener 등 (1985) Physiology of Crops. Iowa State University Press, pp 68-73). 따라서, 발달 초기 단계에 식물체의 크기에 대한 선발은 미래의 잠재적인 수확량에 대한 지표로 사용되어 왔다 (예를 들면, Tittonell 등 (2005) Agric Ecosys & Environ 105: 213). 유전적 차이가 스트레스 내성에 미치는 영향을 점검 시, 토양 특성, 온도, 수분 및 양분 이용성 및 광 강도를 표준화하는 능력이 필드와 비교하여 온실 또는 식물 생장상(growth chamber) 환경의 본질적인 이점이다. 그러나, 바람 또는 곤충의 부재로 인한 빈약한 수분(pollination), 또는 뿌리 생장 또는 수관(canopy) 생장을 위한 불충분한 공간으로 인한 수확량의 인위적인 제한은 수확량 차이의 점검을 위한 상기 통제된 환경의 사용을 제한할 수 있다. 따라서, 생장상 또는 온실의 표준화된 조건하에서 발달 초기에 식물체의 크기를 측정하는 것이 잠재적인 유전적 수확량 이점을 표시하는 표준 방식이다.
특별한 경제적인 관심의 대상인 또 다른 형질은 비생물적 스트레스 조건하에서 자란 식물의 향상된 수확량 관련 형질이다. 비생물적 스트레스가 전세계적으로 작물 손실의 일차적인 원인이며, 대부분의 주요 작물에 대해 평균 수확량을 50% 이상 감소시켰다 (Wang 등, Planta (2003) 218: 1-14). 비생물적 스트레스는 가뭄, 염분, 극단적인 온도, 화학적 독성 및 산화적 스트레스에 의해 야기될 수 있다. 비생물적 스트레스 조건하에서 자란 식물의 수확량 관련 형질을 향상시키는 능력은 전세계적으로 농업가에게 큰 경제적인 이점이 있으며, 불리한 조건에서 및 작물 재배가 불가능한 지역에서 작물 재배를 가능하게 한다.
식물 수확량을 증가시키는 능력은 관상식물 생산을 포함한 농업, 수목재배, 원예 및 삼림과 같은 영역에 많이 적용된다. 수확량 증가는 (제약, 항체 또는 백신과 같은 물질의 생물공학적 생산, 또는 유기 폐기물의 생물학적 전환을 위한) 생물반응기에 사용을 위한 조류(algae)의 생산 및 다른 영역에도 사용 가능하다.
I. 하핀( HARPlN )
TTSS (Type III Secretion System)는 그람음성균에 특이적인 분비 기구이고, 식물 및 동물 병원균뿐 아니라, 내부공생 리조비아(Rhizobia)에서도 발견된다. TTSS는 세균이 관련된 숙주 세포로 단백질을 전달하는 것으로 추론된다. 식물 병원성 세균에 있어, TTSS는 과민성 반응의 집단(cluster)이며, 약 20 개의 유전자를 포함하는 병원성 유전자, Hrp 집단이다. 상기 유전자들 중 9 개 (보존된 harpin 또 는 hrc)는 식물 및 동물 병원균 양자에서 보존되어 있으며, 이들 중 8 개는 편모 장치를 암호화하는 유전자와 상동성이 있으며 (Bogdanove 등, MoI. Microbiol. 20, 681-683, 1996), 9 번째인 hrcC는 GSP 외막 세크레틴(secretin)에 상동성이 있다 (Deng 및 Huang, J. Bacteriol. 180, 4523-4531, 1999). Hpa (hrp-associated) 유전자는 병원성 및 비기주 식물에서의 과민성 반응 (HR)의 유도에 기여하나, 식물과 세균의 병원성 상호작용에 필수적인 것은 아니다. 편모 장치 및 TTSS는 공통적인 기원으로부터 진화된 것으로 추론되며 (Gophna 등, Gene 312, 151-163, 2003); TTSS는 다수의 수평적인 전달을 거쳐 진화적으로 거리가 먼 세균 종간에 더 퍼졌다 (Nguyen 등, J. MoI. Microbiol. Biotechnol. 2, 125-144, 2000).
많은 그람음성 식물-병원성 세균은 식물과의 상호작용을 조절하는 2 세트의 유전자를 가지고 있다. 비병원성 유전자는 유전자 대 유전자 상호작용에 근거하여 기주 특이성을 결정하며, hrp (hypersensitive reaction and pathogenicity) 유전자는 비기주 식물에서 병원성 및 과민성 반응 (HR)의 유도에 관여된다. HR은 비기주 식물 또는 기주 식물의 저항성 재배종이 식물 병원균 또는 Avr 단백질 및 하핀(harpin)과 같은 HR 유도인자 분자의 침입을 받았을 때 발생하는 고도의 국부적인 식물 세포 사멸이다. HR은 미생물 병원균에 대한 식물의 저항성 반응으로 생각되고 있다.
하핀은 HR 유도인자의 집단이며, TTSS (type III secretion pathway)에 의해 분비되어 비기주 식물 잎의 아포플라스트(apoplast)로 침투 시 HR을 유도한다. 기능을 하기 위해 세포 내부로 전달되어야만 하는 Avr 단백질과는 달리, 하핀은 식물 세포의 세포 간 공간으로 전달 시 HR을 유도할 수 있다. 첫 번째 하핀인 HrpN이 어위니아 아밀로보라(Erwinia amylovora)로부터 동정된 이래, 많은 하핀이 슈도모나스(Pseudomonas), 랄스토니아(Ralstonia), 및 잔토모나스(Xanthomonas)를 포함하여 다양한 종으로부터 보고되었다. 하핀(harpins)은 글리신(glycin)이 풍부하며, 열에 안정적인 단백질이고, 시스테인(cysteine)이 없으며, TTSS를 가지는 모든 식물 병원성 세균에 존재하는 것으로 추론된다 (Alfano 및 Colmer, Annu. Rev. Phytopathol. 42, 385-414, 2004). 비기주 식물에서 하핀에 의한 HR 유도의 생화학적 기작은 불분명하다. 슈도모나스 시린개 피브이. 시린개(Pseudomonas syringae pv. syringae)의 HrpZ는 식물 세포막보다 오히려 세포벽과 연관되며, 단백질은 세포벽이 없는 원형질체로부터는 반응을 유도하지 않는다 (Hoyos 등 Mol. Plant-Microbe Interact. 9, 608-616, 1996). 그러나, 슈도모나스 시린개 피브이. 파세오리콜라(P. syringae pv. phaseolicola)의 HrpZ은 지질 이중층에 결합하여, 이온 통도 구(ion-conducting pore)를 형성한다 (Lee 등, Proc. Natl. Acad. Sci. USA 98, 289-294, 2001). HrpZ의 N-말단 109 개 아미노산 및 C-말단 216 개의 아미노산은 전장 HrpZ와 비슷한 수준으로 HR을 유도할 수 있다 (Alfano 등, Mol. Microbiol. 19, 715-728, 1996). Kim 등 및 Charkowski 등은 어위니아 아밀로보라(E. amylovora) 및 슈도모나스 시린개 피브이. 토마토(P. syringae pv. tomato)의 HrpW 하핀이 2 개의 도메인 - N-말단 하핀 도메인 및 C-말단 Pel(pectate lyase) 도메인 -으로 구성되어 있음을 보여주었으며, HrpW이 세포벽에서 작용함을 제안하였다 (Charkowski 등, J. Bacteriol. 180, 5211-5217, 1998; Kim 및 Beer, J. Bacteriol. 180, 5203-5210, 1998).
하핀 외에도, 세균의 TTSS 집단은 하핀 관련 인자(Harpin associated Factors)를 암호화하는 유전자도 포함한다. HpaG 폴리펩티드는 하핀 보다 작으며, 둘 간의 서열 상동성은 거의 없다. 하핀과의 서열 차이로 인해 식물에 있어서 HpaG 폴리펩티드 및 하핀 간에 HR을 유도하는 능력상의 차이가 생기는 것으로 추론된다 (Kim 등, J. Bacteriol. 186, 6239-6247, 2004).
한국특허출원 KR20030068302에는 잔토모나스(Xanthomonas) HpaG 단백질이 개시되어 있으며, 상기 단백질을 식물 또는 식물 종자에 적용 시, 질병 저항성 특히 잔토모나스 악소노포디스(Xanthomonas axonopodis) 감염에 대한 저항성을 부여한다. 하핀 관련 인자는 식물에 질병 저항성을 부여하는 데 사용되어 왔으며; 상기 생물적 스트레스 저항성의 결과, 식물은 생물적 스트레스 조건하에서 대조구 식물에 비해 보다 나은 수확량을 나타낸다.
놀랍게도 Harpin-associated Factors G 폴리펩티드 (HpaG)를 암호화하는 핵산을 식물에서 발현을 조절하면 대조구 식물에 비해 향상된 수확량 관련 형질을 가지게 된다는 것이 발견되었다. 상기 향상된 수확량 관련 형질은 스트레스에 노출되지 않았던 식물에서 얻어졌다.
II . SNF2
본 발명은 SWITCH 2/SUCROSE NON-FERMENTING 2 (SWI2/SNF2) 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현 증가에 의한 대조구 식물에 비하여 수확량 관련 형질을 향상시키는 방법에 관한 것이다.
복제, 전사, DNA 복구, 또는 재조합과 같은 많은 염색체와 관련된 세포내 과정에서는 DNA에 접근이 되어야 한다. 이를 위해, 세포는 진핵세포의 경우 염색질을 개조하거나 또는 원핵 및 진핵세포 양자의 경우 ATP 가수분해를 사용하여 DNA:단백질 복합체를 파괴하는 활성을 가진다. 상기 활성 중 가장 잘 연구된 예 중의 하나는 많은 다른 개조(remodeling) 유사 과정에 관련된 큰 단백질 집단인 ATPases의 SWI2/SNF2 패밀리에 의해 수행된다.
SWI2/SNF2 패밀리 단백질은 세균, 고세균 및 진핵세포에서 발견되는 것처럼 편재한다. 상기 단백질은 7 개의 보존된 서열 모티프 (I, Ia, II, III, IV, V, 및 VI)를 포함하는 SWI2/SNF2 ATPase 도메인의 다중 서열 정렬(alignment) 후에 최근에 24 개의 서브패밀리로 분류되었다 (Flaus 등 (2006) Nucleic Acids Res. 2006; 34(10): 2887-2905). 상기 서브패밀리는 전통적으로 고세균 구성원의 명칭을 따른다. 한 서브패밀리는 유일한 SWI2/SNF2 패밀리 구성원인 고세균 술포로부스 솔파타리쿠스(Sulfolobus solfataricus)(Flaus 등, supra; Duur 등 (2005) Cell 121 (3): 363-373)의 명칭에 따라 SSO1653로 명명되며, 유일하게 고세균 및 진정세균 서브패밀리는 진핵성 SWI2/SNF2 단백질에 가장 비슷하다. SSO1653 서브패밀리는 모든 SWI2/SNF2 패밀리 서열 및 구조적 특징을 가진다.
미국특허출원 US2003/233670는 폴리뉴클레오티드 및 폴리뉴클레오티드에 의해 암호화되는 단백질을 기재하고 있다. 서열번호 125는 시네코시스티스(Synechocystis) sp. PCC 6803으로부터 SSO1653 서브패밀리의 SWI2/SNF2 폴리펩 티드를 암호화하는 폴리뉴클레오티드 서열이다. 미국특허출원 US2005/108791는 24149 개의 핵산 및 폴리펩티드 서열을 기재하고 있으며, 이 중 서열번호 57로 표시된 핵산 서열은, 서열번호 396으로 표시된 시네코시스티스(Synechocystis) sp. PCC 6803으로부터 SSO1653 서브패밀리의 SWI2/SNF2 폴리펩티드를 암호화한다.
놀랍게도, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현 증가는 대조구 식물에 비해 향상된 수확량 관련 형질을 가지는 식물을 제공한다는 것을 밝혔다.
폴리펩티드(들)/단백질(들)
용어 "폴리펩티드" 및 "단백질"은 본 발명에서 상호 교체 사용되며, 임의의 길이의 아미노산의 중합형을 말한다.
폴리뉴클레오티드(들)/핵산(들)/핵산 서열(들)/뉴클레오티드 서열(들)
용어 "폴리뉴클레오티드(들)", "핵산 서열(들)", "뉴클레오티드 서열(들)"은 본 발명에서 상호 교체 사용되며, 임의의 길이의 중합형인, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 양자의 조합인 뉴클레오티드를 말한다.
대조구 식물(들)
적절한 대조구 식물의 선택은 실험 셋업에서는 통상적인 부분이며, 해당 식물의 야생형 또는 목적 유전자가 없는 해당 식물을 포함할 수 있다. 대조구 식물은 전형적으로 평가되는 식물과 동일한 식물 종 또는 동일한 변종이다. 대조구 식물은 또한 평가되는 식물의 공접합자(nullizygote)일 수 있다. 본 발명에서 사용된 "대조구 식물"은 전체 식물뿐 아니라 종자 및 종자의 일부분을 포함한 식물의 일부분을 말한다.
상동체 (들)
단백질의 "상동체"는 문제의 변형되지 않은 단백질에 대해 아미노산 치환, 결실 및/또는 삽입을 가지며, 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 가진 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.
결실은 단백질로부터 하나 이상의 아미노산의 제거를 말한다.
삽입은 단백질 내의 예정된 위치에 하나 이상의 아미노산 잔기가 도입되는 것을 말한다. 삽입은 하나 또는 다수 아미노산의 서열 내 삽입뿐 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로 아미노산 서열 내 삽입은 N- 또는 C-말단 융합보다 작을 것이며, 약 1 내지 10 개 정도의 잔기이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예는 효모 투 하이브리드(two-hybrid) 시스템에 사용된 전사 활성제의 결합 도메인 또는 활성화 도메인, 파아지 외피 단백질, (히스티딘)-6-태그, 글루타치온 S-전달효소-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 환원효소, Tag·100 에피토프, c-myc 에피토프, FLAG
Figure 112009054915603-pct00001
-에피토프, lacZ, CMP (칼모둘린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프를 포함한다.
치환은 유사한 성질 (유사한 소수성, 친수성, 항원성, 알파 나선 구조 또는 베타 병풍 구조를 형성하거나 파괴하는 경향 같은)을 가진 다른 아미노산으로 단백질의 아미노산의 치환을 말한다. 아미노산 치환은 전형적으로 한 잔기의 치환이나, 폴리펩티드에 부여된 기능적 제약에 따라 클러스터될(clustered) 수도 있으며; 삽입은 보통 약 1 내지 10 개 정도의 아미노산 잔기가 삽입된다. 아미노산 치환은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환 표는 당업계에 주지되어 있다 (예를 들면, Creighton (1984) Proteins. W.H. Freeman and Company (Eds) 및 하기 표 1 참고).
표 1: 보존된 아미노산 치환의 예
잔기 보존적 치환 잔기 보존적 치환
Ala Ser Leu Ile; Val
Arg Lys Lys Arg; Gln
Asn Gln; His Met Leu; Ile
Asp Glu Phe Met; Leu; Tyr
Gln Asn Ser Thr; Gly
Cys Ser Thr Ser; Val
Glu Asp Trp Tyr
Gly Pro Tyr Trp; Phe
His Asn; Gln Val Ile; Leu
Ile Leu, Val
아미노산 치환, 결실 및/또는 삽입은 고체상 펩티드 합성 등과 같은 당업계에 주지된 펩티드 합성 기술을 이용하거나 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 제조하기 위한 DNA 서열 조작 방법은 당업계에 주지되어 있다. 예를 들면, DNA 상의 예정된 위치에 치환 돌연변이를 제조하기 위한 기술은 당업자에게 주지되어 있으며, M13 돌연변이유발, T7-Gen 시험관 내 돌연변이유발 (USB, Cleveland, OH), QuickChange 자리지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 자리지정 돌연변이유발 또는 기타 자리지정 돌연변이유발 프로토콜을 포함한다.
유도체
"유도체"는 서열번호 2에 제시된 것과 같은 자연발생 형태의 단백질의 아미노산 서열과 비교하여, 자연적으로 발생하지 않는 아미노산 잔기로 아미노산의 치환 또는 자연적으로 발생하지 않는 아미노산 잔기의 첨가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연발생 형인 폴리펩티드의 아미노산 서열과 비교하여 자연적으로 발생하는 변형된 (글리코실화, 아실화, 프레닐화, 인산화, 미리스토일화, 황화 등) 또는 자연적으로 발생하지 않는 변형된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 유래되는 아미노산 서열과 비교하여 하나 이상의 비아미노산의 치환 또는 첨가를 포함할 수 있는데, 예를 들면, 이의 검출을 용이하게 하기 위해 결합되는 리포터 분자와 같은 아미노산 서열에 공유적으로 또는 비공유적으로 결합한 리포터 분자나 다른 리간드, 및 자연적으로 발생하는 단백질의 아미노산 서열에 대해 비자연적으로 발생하는 아미노산 잔기이다.
오쏘로그 (들)/ 패럴로그 (들)
오쏘로그 및 패럴로그는 유전자의 조상관계를 기재하는데 사용되는 진화적 개념을 포함한다. 패럴로그는 조상 유전자의 복제로 생긴 동일한 종 내의 유전자이고, 오쏘로그는 종분화를 통해 유래된 다른 생물체의 유전자이다.
도메인
용어 "도메인"은 진화적으로 연관된 단백질의 서열정렬 시 특정 위치에서 보존된 아미노산의 세트이다. 다른 위치의 아미노산은 상동체들 간에 다양할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적일 것 같은 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열상에서 고도로 보존된 부분은 임의의 문제되는 폴리펩티드가 이전에 동정된 폴리펩티드 패밀리에 속하는지를 결정하는 동정부위로 사용될 수 있다.
모티프/일치 서열( consensus sequence )/시그너처( Signature )
용어 "모티프", "일치 서열" 또는 "시그너처"는 진화적으로 연관된 단백질의 서열에 있어 짧은 보존된 영역을 말한다. 모티프는 흔히 도메인의 고도로 보존된 부분뿐만 아니라, 도메인의 일부만을 포함할 수도 있거나 또는 보존된 도메인 외부에 있을 수도 있다 (만일 모티프의 아미노산 모두가 지정된 도메인 외부에 있으면).
혼성화
본 발명에 정의된 용어 "혼성화"는 실질적으로 상동인 상보적인 뉴클레오티드 서열이 서로 어닐링하는 과정이다. 혼성화 과정은 전적으로 용액 내에서, 즉 상보적인 양 핵산이 용액 내에 있을 때 일어날 수 있다. 혼성화 과정은 또한 상보적인 핵산의 하나가 자성 비드, Sepharose 비드 또는 어떤 다른 수지(resin) 같은 기질에 고정되었을 때도 일어날 수 있다. 혼성화 과정은 더욱이 상보적인 핵산 중의 하나가 니트로셀룰로스 또는 나일론 막 같은 고체 지지체에 고정되었거나 또는 포토리쏘그래피에 의하여 규산질의 유리 지지체 (핵산 어레이, 마이크로어레이 또는 핵산 칩이라 알려짐)에 고정되었을 때에도 일어날 수 있다. 혼성화가 일어나게 하기 위하여, 핵산분자는 일반적으로 열적으로 또는 화학적으로 변성되어 하나의 이중가닥을 2개의 단일가닥으로 녹이고/녹이거나 단일가닥 핵산으로부터 헤어핀 또는 기타 이차 구조를 제거한다.
용어 "스트린전시"는 혼성화가 일어나는 조건을 말한다. 혼성화의 스트린전시는 온도, 염 농도, 이온 강도 및 혼성화 완충액 조성 같은 조건의 영향을 받는다. 일반적으로 낮은 스트린전시 조건은 정해진 이온강도 및 pH에서 특정 서열에 대한 용해점 (Tm) 보다 약 30℃ 낮은 온도가 선택된다. 중간 스트린전시 조건은 Tm 보다 20℃ 낮은 온도일 때, 높은 스트린전시 조건은 Tm 보다 10℃ 낮은 온도이다. 높은 스트린전시 혼성화 조건은 전형적으로 표적 핵산 서열에 높은 서열 유사성을 가진 혼성화 서열을 분리하기 위해 사용된다. 그러나, 핵산은 서열 상의 차이가 있더라도 유전암호의 축퇴로 인하여 실제로는 동일한 폴리펩티드를 암호화할 수 있다. 그러므로, 중간 스트린전시 혼성화 조건은 종종 상기 핵산분자를 동정하는데 필요할 수 있다.
Tm은 정해진 이온 강도 및 pH 하에서 표적 서열의 50%가 완벽하게 매치된 탐침에 혼성화하는 온도이다. Tm은 용액 조건, 염기 조성 및 탐침의 길이에 의존적이다. 예를 들면, 보다 긴 서열일수록 보다 높은 온도에서 특이적으로 혼성화한다. 최대 혼성화율은 Tm보다 약 16℃에서 32℃까지 낮을 때 얻어진다. 1가 양이온이 혼성액에 있으면 두 핵산 가닥 간에 정전기적 반발이 감소하여 혼성화가 촉진되고; 이 효과는 0.4M (보다 높은 농도에서는 이 효과가 무시될 수 있다)까지의 나트륨 농도에서 보여진다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중가닥의 용해 온도를 포름아미드 퍼센트당 0.6 내지 0.7℃ 내리며, 50% 포름아미드의 첨가는 혼성화율은 낮아지더라도 혼성화가 30 내지 45℃에서 일어나게 한다. 염기쌍 미스매치는 혼성화율 및 이중가닥의 온도 안정성을 감소시킨다. 평균적으로 그리고 큰 탐침에 대하여, Tm은 염기 미스매치 %당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기의 식으로 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1 -0.61x%포름아미드
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8 + 18.5 (log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
20개 뉴클레오티드 미만에 대해: Tm=2(In)
20-35개 뉴클레오티드에 대해: Tm=22+1.46(In)
a 또는 다른 1가 양이온에 대하여, 0.01-0.4 M 범위 내에서만 정확.
b 30% 내지 75% 범위 내에서 %GC에 대하여만 정확.
c L = bp으로 표시된 이중가닥의 길이.
d 올리고, 올리고뉴클레오티드; In, 효과적인 프라이머 길이 = 2x(G/C의 수)+(A/T의 수)
비특이적 결합은 예를 들면, 단백질 함유 용액으로 막을 차단하고, 혼성화 완충액에 이종의 RNA, DNA, 및 SDS를 첨가하고, RNAse 처리하는 것과 같은 많은 알려진 기술 중 임의의 하나를 사용하여 조절할 수 있다. 비상동 탐침에 대하여, 일련의 혼성화 과정은 (i) 점차적으로 어닐링 온도를 낮추거나 (예를 들면 68℃에서 42℃까지) (ii) 점차적으로 포름아미드 농도를 낮추거나 (예를 들면 50%에서 0%까지) 중 하나를 변화시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
혼성화 조건 외에, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척 기능에 의존한다. 비특이적 혼성화로 생기는 백그라운드를 제거하기 위하여, 시료를 묽은 염 용액으로 세척한다. 이런 세척의 결정적인 요인은 최종 세척액의 이온 강도 및 온도를 포함하며: 염 농도가 낮고 세척 온도가 높을수록 세척의 스트린전시는 높아진다. 세척 조건은 전형적으로 혼성화 스트린전시에서 또는 보다 낮게 수행된다. 양성 혼성화는 적어도 백그라운드의 2 배의 신호로 나타난다. 일반적으로 핵산 혼성화 분석이나 유전자 증폭 검출 과정에 적절한 스트린전트 조건은 상기와 같다. 다소 스트린전트한 조건 또한 선택될 수 있다. 당업자는 세척 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
예를 들면, 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 스트린전시 혼성화 조건은 65℃, 1x SSC에서 또는 42℃, 1x SSC 및 50% 포름아미드에서 혼성화 후 65℃, 0.3x SSC에서 세척하는 것이다. 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 스트린전시 혼성화 조건은 50℃, 4x SSC 또는 40℃, 6x SSC 및 50% 포름아미드에서 혼성화 후, 50℃, 2x SSC에서 세척하는 것이다. 혼성체의 길이는 혼성화하는 핵산에 대해 예측된 길이이다. 알려진 서열의 핵산이 혼성화될 때 혼성체의 길이는 서열을 정렬하고 본 발명에서 기재된 보존된 영역을 동정하면 결정될 수 있다. 1X SSC는 0.15M NaCl 및 15mM 소듐 시트레이트이며; 혼성액 및 세척액에는 부가적으로 5x Denhardt's reagent, 0.5-1.0% SDS, 100 ㎍/ml 변성된, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트가 포함된다.
스트린전시 수준을 결정하기 위해서는 [Sambrook 등 (2001) Molecular Cloning: laboratory manual, 3rdEdition, Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989, 매년 개정됨)]을 참조하면 된다.
유전자 셔플링 ( shuffling )/방향진화( directed evolution )
유전자 셔플링 또는 방향진화는 DNA 셔플링의 반복에 이은 변형된 생물학적 활성을 가진 단백질을 암호화하는 핵산이나 그 일부분의 변이체 생성을 위해 적절한 탐색 및/또는 선발로 구성된다 (Castle 등, (2004) Science 304(5674): 1151-4; 미국 특허 제5,811,238호 및 제6,395,547호).
조절 인자/조절 서열/프로모터
용어 "조절 인자", "조절 서열" 및 "프로모터"는 본 발명에서 상호 호환적으로 사용되며, 결합되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 말하는 것으로 사용된다. 용어 "프로모터"는 전형적으로 유전자의 전사개시점의 업스트림에 있으며, RNA 중합효소 및 다른 단백질의 인지 및 결합에 관여하여 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열을 말한다. 상기 언급한 용어에는 전형적인 진핵세포 게놈 유전자 (CCAAT 박스 서열이 있거나 없이 정확한 전사 개시에 필요한 TATA 박스를 포함) 및 발달 및/또는 외부 자극에 반응하여 또는 조직 특이적 방식으로 유전자 발현을 변경하는 부가적인 조절 인자 (즉, 업스트림 활성화 서열, 인핸서 및 사일런서)로부터 유래한 전사 조절 서열이 포함된다. 또한 상기 용어에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함하는 전형적인 원핵생물 유전자의 전사 조절 서열이 포함된다. 용어 "조절인자"는 또한 세포, 조직 또는 기관에 핵산분자의 발현을 하게 하거나 활성화 또는 증가시키는 합성 융합 분자 또는 유도체를 포함한다.
"식물 프로모터"는 식물 세포에 암호화 서열 단편의 발현을 중재하는 조절 인자를 포함한다. 따라서, 식물 프로모터는 식물에서 유래해야 하는 것은 아니며, 예를 들면 식물 세포에 침범하는 바이러스 또는 미생물 기원일 수도 있다. "식물 프로모터"는 식물 세포, 예를 들면, 본 발명의 방법에서 발현되며, 본 발명에 기재된 핵산 서열로 형질전환된 식물 기원일 수 있다. 이는 또한 "식물" 종결신호 같은 "식물" 조절 신호에도 해당된다. 본 발명의 방법에 유용한 뉴클레오티드 서열의 프로모터 업스트림은 프로모터, 개방형해독틀 (ORF) 또는 종결신호 또는 ORF로부터 떨어져 있는 다른 3' 조절 영역 같은 3'-조절 영역의 기능성 또는 활성을 방해하지 않고 하나 이상의 뉴클레오티드 치환(들), 삽입(들) 및/또는 결실(들)에 의하여 변형될 수 있다. 더욱이 서열의 변형에 의하여 프로모터 활성은 증가될 수 있거나, 또는 보다 활성이 큰 프로모터, 심지어 이종 생물체의 프로모터로 완전히 대체되는 것도 가능하다. 식물체에서의 발현을 위해서는 상기 언급된 것처럼 핵산분자는 올바른 시점에 요구되는 공간적 발현 양상으로 유전자를 발현하는 적절한 프로모터에 작동가능하게 연결되거나 프로모터를 포함해야 한다.
작동가능하게 연결된
본 발명에서 사용된 용어 "작동가능하게 연결된"은 프로모터 서열과 해당 유전자 간의 기능적 연관을 말하는 것으로, 그럼으로써 프로모터 서열이 해당 유전자의 전사를 개시할 수 있다.
구성적 프로모터
"구성적 프로모터"는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 하기 표 2a가 구성적 프로모터의 예이다.
표 2a: 구성적 프로모터의 예
Figure 112009054915603-pct00002
편재하는 프로모터
편재하는 프로모터는 생물체의 실질적으로 모든 조직이나 세포에서 활성을 가진 것이다.
발달적으로 조절된 프로모터
발달적으로 조절된 프로모터는 특정 발달 단계 중에 또는 발달적 변화가 일어나는 식물체의 부위에서 활성을 가진 것이다.
유도성 프로모터
유도성 프로모터는 화학적 (Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되거나 또는 식물이 다양한 스트레스 환경에 노출될 때 "스트레스 유도성", 즉 활성화될 수 있거나 또는, 식물이 다양한 병원균에 노출될 때 "병원균 유도성", 즉 활성화될 수 있다.
기관 특이적/조직 특이적 프로모터
기관 특이적 또는 조직 특이적 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 발현 개시가 가능한 것이다. 예를 들면, "뿌리 특이적 프로모터"는 식물의 다른 부위에 약간 누설된(leaky) 발현을 허용하지만, 실질적으로 식물의 다른 부위를 제외하고 식물 뿌리에서 우세하게 전사적으로 활성이 있는 프로모터이다. 특정 세포에서만 전사를 개시할 수 있는 프로모터는 본 발명에서 "세포 특이적"이라 한다.
뿌리 특이적 프로모터의 예는 하기 표 2b에 열거된다:
표 2b: 뿌리 특이적 프로모터의 예
Figure 112009054915603-pct00003
종자 특이적 프로모터는 종자 조직에서만 반드시 배타적으로는 아니지만 (누설 발현의 경우) 종자조직에서 우세하게 전사적으로 활성인 것이다. 종자 특이적 프로모터는 종자발달 및/또는 발아 중에 활성일 것이다. 종자 특이적 프로모터는 배유 및/또는 호분층 및/또는 배(embryo) 특이적일 수 있다. 종자 특이적 프로모터 (배유/호분층/배 특이적)의 예는 하기 표 2c, d, e, f에 제시된다. 종자 특이적 프로모터의 추가적인 예는 Qing Qu 및 Takaiwa (Plant Biotechnol. J. 2, 1 13-125, 2004)에 제시되며, 이의 개시는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다.
표 2c: 종자 특이적 프로모터의 예
Figure 112009054915603-pct00004
Figure 112009054915603-pct00005
표 2d: 배유 특이적 프로모터의 예
Figure 112009054915603-pct00006
표 2e: 배(embryo) 특이적 프로모터의 예
Figure 112009054915603-pct00007
표 2f: 호분층 특이적 프로모터의 예
Figure 112009054915603-pct00008
본 발명에서 정의된 녹색 조직 특이적 프로모터는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 실질적으로 식물의 다른 부위를 제외하고 녹색 조직에서 우세하게 전사적으로 활성이 있는 프로모터이다.
본 발명의 방법을 수행하는데 사용될 수 있는 녹색 조직 특이적 프로모터의 예는 하기의 표 2g에 있다.
표 2g: 녹색 조직 특이적 프로모터의 예
Figure 112009054915603-pct00009
조직 특이적 프로모터의 다른 예는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 실질적으로 식물의 다른 부위를 제외하고 분열조직에서 우세하게 전사적으로 활성이 있는 분열조직 특이적 프로모터이다. 본 발명의 방법을 수행하는데 사용될 수 있는 녹색 분열조직 특이적 프로모터의 예는 하기의 표 2h에 있다.
표 2h: 분열조직 특이적 프로모터의 예
Figure 112009054915603-pct00010
종결신호(Term inator )
용어 "종결신호"는 일차 전사체의 3' 프로세싱 및 폴리아데닐화와 전사 종결의 신호가 되는 전사 단위의 말단에 있는 DNA 서열인 조절 서열이다. 종결신호는 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가된 종결신호는 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
선발 마커 (유전자)/리포터 유전자
"선발 마커", "선발 마커 유전자" 또는 "리포터 유전자"는 본 발명의 핵산 구축물로 감염되거나 형질전환된 세포의 동정 및/또는 선발을 촉진하기 위하여 발현된 세포에 표현형을 부여하는 임의의 유전자를 포함한다. 이들 마커 유전자는 일련의 상이한 원리를 통해 핵산 분자의 성공적인 전달을 확인 가능하게 한다. 적절한 마커는 항생제나 제초제 저항성을 주거나 새로운 대사 형질을 도입하거나 또는 시각적인 선발을 가능하게 하는 마커로부터 선택된다. 선발 마커 유전자의 예는 항생제 (네오마이신 및 카나마이신을 인산화하는 nptII, 하이그로마이신을 인산화하는 hpt, 또는 예를 들면, 블레오마이신, 스트렙토마이신, 테트라사이클린, 클로람페니콜, 앰피실린, 겐타마이신, 제네티신 (G418), 스펙티노마이신, 블라스티시딘에 저항성을 주는 유전자), 제초제 (예를 들면, Basta
Figure 112009054915603-pct00011
에 저항성을 제공하는 bar; 글리포제이트에 대한 저항성을 제공하는 aroA 또는 gox, 또는 예를 들면, 이미다졸리논, 포스피노트리신, 설포닐우레아에 저항성을 주는 유전자)에 저항성을 주는 유전자 또는 대사적 형질을 제공하는 유전자 (식물이 유일한 탄소원으로 만노즈를 이용하게 하는 manA 또는 자일로스 이용을 위한 자일로스 이성화효소, 또는 2-데옥시글루코스에 대한 저항성 같은 반영양적 마커)를 포함한다. 가시적 마커 유전자의 발현으로 발색 (예를 들면 베타-글루쿠로니다제, GUS, 또는 발색된 기질, 예를 들면 X-Gal을 가진 베타-갈락토시다제), 발광 (루시페린/루시파라제 시스템 같은) 또는 형광 (녹색 형광 단백질, GFP, 및 이의 유도체)이 형성된다. 이 목록은 소수의 가능한 마커만을 나타낸다. 당업자는 상기 마커에 친숙하다. 생물체 및 선발 방법에 따라 다른 마커가 선호된다.
형질전환된( Transgenic )/외래도입유전자( Transgene )/재조합
본 발명에서 "형질전환된", "외래도입유전자" 또는 "재조합"은 예를 들면, 핵산 서열, 발현카세트, 핵산 서열을 포함하는 유전자 구축물 또는 벡터, 또는 본 발명에 따른 핵산 서열, 발현 카세트나 벡터로 형질전환된 생물체, 하기에 기재된 재조합 방법에 의해 생성된 모든 구조물에 관한 의미이며:
(a) 본 발명의 방법에 유용한 단백질을 암호화하는 핵산서열, 또는
(b) 본 발명에 따른 핵산 서열에 작동가능하게 연결된 유전자 조절 서열(들), 예를 들면 프로모터, 또는
(c) a) 및 b)
자연적인 유전적 환경에 있지 않거나, 재조합 방법으로 변형되어 왔으므로 예를 들면, 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입의 유형의 변형이 가능하다. 자연적인 유전적 환경은 원래의 식물에서 자연적인 게놈 또는 염색체상의 위치나 게놈 라이브러리에서의 존재를 의미하는 것으로 이해된다. 게놈 라이브러리의 경우, 핵산 서열의 자연적인 유전적 환경은 바람직하게는 적어도 부분적으로는 보유된다. 환경은 적어도 한 쪽의 핵산서열을 플랭킹하며 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp 길이의 서열을 갖는다. 자연적으로 발생하는 발현 카세트, 예를 들면 본 발명의 방법에 유용한 폴리펩티드를 암호화하는 해당 핵산 서열과 핵산 서열의 자연적 프로모터의 자연적으로 생긴 조합은 이 발현 카세트가 예를 들면 돌연변이 처리 같은 비자연적인 합성 ("인위적") 방법으로 변형될 때 형질 전환 발현카세트가 된다. 적절한 방법이 예를 들면 US 5,565,350 또는 WO 00/15815에 기재되어 있다.
본 발명의 목적상, 형질전환된 식물은 상기처럼 본 발명의 방법에서 사용된 핵산은 상기 식물의 게놈상의 자연적 위치에 있지 않아 핵산이 동종에서 또는 이종에서 발현될 수 있다는 의미로 이해된다. 그러나, 언급된 바와 같이, "형질전환된"은 또한 본 발명에 있어 또는 본 발명 방법에 사용된 핵산은 식물 게놈 내의 자연적 위치에 있는 반면, 그 서열이 자연적 서열에 대하여 변형되었고 및/또는 자연적 서열의 조절 서열이 변형되었음을 의미한다. "형질전환된"은 핵산의 동종 또는 바람직하게는 이종 발현이 일어나는 게놈 내의 비자연적 위치에서 본 발명에 따른 핵산의 발현을 의미하는 것으로 바람직하게는 이해된다. 바람직한 형질전환된 식물이 본 발명에서 언급된다.
형질전환
본 발명에 언급된 용어 "도입" 또는 "형질전환"은 전달에 사용된 방법에 관계 없이 외래 폴리뉴클레오티드의 숙주 세포로의 전달을 포함한다. 기관 발생이나 배발생에 의하여 연이은 클론 번식이 가능한 식물 조직은 본 발명의 유전자 구축물로 형질전환될 수 있으며, 전체 식물체가 이로부터 재분화된다. 선택된 특정 조직은 형질전환될 특정 종에 이용 가능하며 가장 잘 맞는 클론 번식 시스템에 따라 다양할 것이다. 전형적인 조직 표적은 잎 디스크, 화분, 배, 자엽, 하배축, 대배우체, 캘러스 조직, 기존의 분열조직 (예를 들면, 정단 분열조직, 액아, 및 뿌리 분열조직), 및 유도된 분열조직 (예를 들면, 자엽 분열조직 및 하배축 분열조직)을 포함한다. 폴리뉴클레오티드는 일시적으로 또는 안정적으로 숙주 세포에 도입되며, 예를 들면, 플라스미드처럼 비통합적으로 유지된다. 다르게는, 숙주 게놈으로 통합된다. 결과적인 형질전환 식물 세포는 당업자에게 주지된 방식으로 형질전환 식물을 재분화하는데 사용된다.
외래 유전자의 식물 게놈으로 전달을 형질전환이라 부른다. 식물 종의 형질전환은 지금 꽤 통상적인 기술이다. 유리하게도, 임의의 몇 가지 형질전환 방법이 목적 유전자를 적절한 조상 세포로의 도입에 사용될 수 있다. 식물 조직 또는 식물 세포로부터 식물의 형질전환 및 재분화에 관하여 기재된 방법은 일시적인 또는 안정한 형질전환에 이용될 수 있다. 형질전환 방법은 리포좀, 전기천공법, 유리 DNA 흡수를 증가시키는 화학물질, 식물체 내로 DNA의 직접적인 주입, 입자총 충격법, 바이러스 또는 화분을 이용한 형질전환 및 미세주입(microprojection)을 포함한다. 방법은 원형질에 대한 칼슘/폴리에틸렌 글리콜법 (Krens, F.A. 등, (1982) Nature 296, 72-74; Negrutiu I 등 (1987) Plant Mol Biol 8: 363-373); 원형질의 전기천공법 (Shillito R.D. 등 (1985) Bio/Technol 3, 1099-1102); 식물로 미세주사(microinjection) (Crossway 등, (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA 코팅된 입자 충격법 (Klein TM 등, (1987) Nature 327: 70) (비통합적) 바이러스로 감염 등으로부터 선택할 수도 있다. 형질전환 작물을 포함한 형질전환 식물은 바람직하게는 아그로박테리움-매개된 형질전환을 통해 제조된다. 유리한 형질전환방법은 식물체에서의 형질전환이다. 이를 위해, 예를 들면, 아그로박테리아를 식물 종자 상에 작용하게 하거나 식물 분열조직을 아그로박테리아로 접종하는 것이 가능하다. 형질전환된 아그로박테리아의 현탁액을 손상되지 않은 식물이나 적어도 꽃 원기에 작용하게 하는 것이 본 발명에 따라 특히 편리하다는 것이 입증되었다. 처리된 식물의 종자를 얻을 때까지 식물체를 키운다 (Clough and Bent, Plant J. (1998) 16, 735-743). 벼의 아그로박테리움 매개된 형질전환 방법은 하기 임의의 것에 기재된 것처럼 벼 형질전환에 관한 잘 알려진 방법들을 포함한다: 유럽특허출원 EP 1198985 A1, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan 등 (Plant Mol Biol 22 (3): 491-506, 1993), Hiei 등 (Plant J 6 (2): 271-282, 1994), 상기 명세서는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다. 옥수수 형질전환의 경우에, 바람직한 방법은 Ishida 등 (Nat. Biotechnol 14(6): 745-50, 1996) 또는 Frame 등 (Plant Physiol 129(1): 13-22, 2002)에 기재된 것이며, 상기 명세서는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다. 상기 방법들은 [B. Jenes 등, Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143] 및 [Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225]에 예로서 기재되어 있다. 핵산 또는 발현될 구축물은 바람직하게는 아그로박테리움 투머파시엔스 형질전환에 적절한 벡터, 예를 들면 pBin19 내로 클로닝된다 (Bevan 등, Nucl. Acids Res. 12 (1984) 8711). 상기 벡터로 형질전환된 아그로박테리아가 아라비돕시스처럼 모델로 사용된 식물 (본 발명의 범위 내의 아라비돕시스 탈리아나는 작물로 고려되지 않는다)이나 담배 같은 작물의 예를 들면, 상처 내거나 잘게 썬 잎을 아그로박테리아 용액에 적신 후 적절한 배지에 배양하는 것과 같은 작물 형질전환을 위해 알려진 방식으로 사용될 수 있다. 아그로박테리움 투머파시엔스에 의한 식물의 형질전환은 예를 들면, [Hofgen and Willmitzer in Nucl. Acid Res. (1988) 16, 9877]에 의하여 기재되었거나, 특히 [F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38]에 알려져 있다.
온전한 식물로 재생되는 체세포의 형질전환 외에, 식물의 분열조직 특히 배우자로 발달하는 세포의 형질전환이 가능하다. 이 경우에, 형질전환된 배우자는 자연적인 식물 발달 과정을 거쳐 형질전환 식물이 된다. 따라서 예를 들면, 아라비돕시스의 종자가 아그로박테리아로 처리되고, 발달하는 식물체로부터 취한 종자 중의 일부분이 형질전환되어 형질전환 식물체로 된다 [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. 또 다른 방법은 화서의 반복적인 제거에 근거하며 근생엽 중앙의 절단 부위를 형질전환된 아그로박테리아와 함께 배양하면 형질전환된 종자를 이후에 얻을 수 있다 (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). 그러나, 특히 효과적인 방법은 "화서 담그기 (floral dip)" 방법의 변형인 진공 침윤 (vacuum infiltration)이다. 아라비돕시스의 진공 침윤의 경우, 감압 하에 온전한 식물체를 아그로박테리아 현탁액으로 처리하는 것이고 [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], "화서 담그기법"에서는 발달 중인 화서 조직을 계면활성제가 처리된 아그로박테리아 현탁액과 잠깐 배양하는 것이다 [Clough, SJ and Bent AF (1998) Plant J. 16, 735-743]. 양자의 경우에 특정 비율의 형질전환 종자가 수확되며, 이들 종자는 상기 기재된 선발 조건하에서 재배함으로써 형질전환되지 않은 종자와 구분된다. 색소체는 모계로 유전되기 때문에 색소체의 안정적인 형질전환의 잇점은 대부분의 작물에서 화분을 통한 외래도입유전자의 유전이 감소되거나 제거된다는 점이다. 엽록체 게놈의 형질전환은 일반적으로 Klaus 등, 2004 [Nature Biotechnology 22 (2), 225-229]에 도식적으로 표시된 과정에 의하여 수행된다. 간단히, 형질전환될 서열을 선발 마커 유전자와 함께 엽록체 게놈에 상동인 플랭킹 서열 사이에 클론한다. 이들 상동 플랭킹 서열이 플라스톰(plastome) 내로 자리 특이적으로 통합된다. 색소체 형질전환은 많은 다른 식물 종에 대해 기술되어 왔으며, 개관은 [Bock (2001) Transgenic plastids in basic Research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38] 또는 [Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28]에 있다. 추가의 생물공학적 진보는 마커 없는 색소체 형질전환체의 형태로 최근 보고되었으며, 이는 일시적인 동시통합된(co-integrated) 마커 유전자에 의해 생성될 수 있다 (Klaus 등, 2004, Nature Biotechnology 22(2), 225-229).
TILLING
TILLING (Targeted Induced Local Lesions In Genomes)은 변형된 발현 및/또는 활성을 가진 단백질을 암호화하는 핵산을 생성 및/또는 동정하는데 유용한 돌연변이 기술을 말한다. TILLING은 또한 상기 돌연변이체를 가진 식물의 선발을 가능하게 한다. 이들 돌연변이체는 강도나 위치 또는 시기상의 변형된 발현을 보인다 (만일 돌연변이가 프로모터에 영향을 준다면). 이들 돌연변이체는 자체의 자연적 형태의 유전자에 비하여 훨씬 높은 활성을 나타낸다. TILLING은 고밀도 돌연변이 유발과 고속처리 탐색 방법을 조합한 것이다. TILLING의 전형적인 단계는 하기와 같다: (a) EMS 돌연변이유발 (Redei GP 및 Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chu NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 1682; Feldmann 등, (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA 준비 및 개체의 풀링(pooling); (c) 관심 영역의 PCR 증폭; (d) 이형 이중가닥 (heteroduplexes)이 되게 변성 및 어닐링; (e) DHPLC로 풀(pool)에 이형 이중가닥이 있는지를 크로마토그램 상의 여분의 피크로 검출; (f) 돌연변이체 개체의 동정; (g) 돌연변이 PCR 산물의 염기서열결정. TILLING의 방법은 당업계에 주지되어 있다 (McCallum 등, (2000) Nat Biotechnol 18: 455-457; Stemple (2004) Nat Rev Genet 5(2): 145-50).
수확량
일반적인 의미에서의 용어 "수확량"은 경제적 가치 있는 측정 가능한 생산량을 말하며, 전형적으로 특정 작물, 면적, 및 기간에 관련이 있다. 개개 식물체 부분이 직접적으로 수, 크기 및/또는 중량에 근거한 수확량에 기여하거나, 또는 실제 수확량은 작물 에이커 및 년당 수확량이고, 이는 총생산량 (수확된 및 평가된 생산량을 포함)을 재배된 에이커로 나눔으로써 결정된다.
증가/향상/강화
용어 "증가", "향상", 또는 "강화"는 서로 호환성 있게 사용할 수 있으며, 본 발명에서 정의된 대조구 식물과 비교하여 적어도 5%, 6%, 7%, 8%, 9% 또는 10%, 바람직하게는 적어도 15% 또는 20%, 더욱 바람직하게는 25%, 30%, 35% 또는 40% 이상의 수확량 및/또는 생장을 의미한다.
종자 수확량
증가된 종자 수확량은 다음 중 하나 이상으로 나타난다: a) 개별 종자당 및/또는 식물체당 및/또는 헥타르 또는 에이커당 종자 생물량 (총 종자 중량)의 증가; b) 식물체당 꽃 수의 증가; c) 증가된 수의 (충만된(filled)) 종자; d) 증가된 종자 충만도 (충만된 종자 수를 총 종자 수로 나눈 비로 나타냄); e) 증가된 수확 지수 (종자 같은 수확할 수 있는 부분의 수확량을 총 생물량으로 나눈 비율); 및 f) 증가된 천 개 낱알 중량 (TKW) (카운트한 충만된 종자 및 이의 총 중량으로부터 외삽됨). 증가된 TKW는 증가된 종자 크기 및/또는 종자 중량, 및 배 및/또는 배유 크기의 증가에 기인한다.
증가된 종자 수확량은 또한 종자 크기 및/또는 종자 부피의 증가로 나타낼 수 있다. 더욱이, 종자 수확량의 증가는 또한 종자 면적 및/또는 종자 길이 및/또는 종자 폭 및/또는 종자 주계의 증가로 나타난다. 증가된 수확량으로 외형이 변형되거나, 또는 변형된 외형으로 인해 수확량이 증가할 수도 있다.
식물
본 발명에서 사용된 용어 "식물"은 전체식물, 식물 및 종자, 어린 줄기, 줄기, 잎, 뿌리 (괴경 포함), 꽃, 및 조직과 기관을 포함하는 식물 부분의 조상 및 자손을 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁 배양액, 캘러스 조직, 배, 분열 영역, 배우체, 포자체, 화분 및 소포자를 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다.
본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 하기를 포함하는 목록에서 선택된 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다: 에이서 (Acer spp.), 악티니디아 (Actinidia spp.), 아벨모스쿠스 ( Abelmoschus spp.), 아가베 시살라나 ( Agave sisalana ), 아그로피론 (Agropyron spp.), 아그로스티스 스톨로니페라 ( Agrostis stolonifera ), 알리움 (Allium spp.), 아마란투스 ( Amaranthus spp.), 암모필라 아레나리아 ( Ammophila arenaria), 아나나스 코모수스 ( Ananas comosus ), 안노나 (Annona spp.), 아피움 그라베오렌스 (Apium graveolens ), 아라키스 ( Arachis spp.), 알토칼푸스 ( Artocarpus spp.), 아스파라거스 오피시날리스 ( Asparagus officinalis), 아베나 (Avena spp.) (예를 들면, 아베나 사티바 ( Avena sativa ), 아베나 파투아 ( Avena fatua), 아베나 비잔티나 ( Avena byzantina ), 아베나 파투아 var . 사티바 ( Avena fatua var . sativa ), 아베나 하이브리다 ( Avena hybrida )), 아베로아 카람볼라 (Averrhoa carambola ), 뱀부사 ( Bambusa sp .), 베닌카사 히스피다 (Benincasa hispida), 벨톨레티아 엑셀세아 ( Bertholletia excelsea ), 베타 불가리스 (Beta vulgaris), 브라시카 ( Brassica spp.) (예를 들면, 브라시카 나푸스 ( Brassica napus ), 브라시카 라파 ( Brassica rapa ssp.) [캐놀라, 유채, 순무]), 카다바 파리노사 (Cadaba farinosa ), 카멜리아 시넨시스 (Camellia sinensis ), 칸나 인디카 ( Canna indica ), 칸나비스 사티바 (Cannabis sativa ), 캡시쿰 ( Capsicum spp.), 카렉스 엘라타 (Carex elata ), 카리카 파파야 (Carica papaya ), 카리사 마크로칼파 (Carissa macrocarpa ), 카리야 (Carya spp .), 카르타무스 팅크토리우스 (Carthamus tinctorius), 카스타네아 (Castanea spp.), 케이바 펜탄드라 (Ceiba pentandra), 키코리움 엔디비아 (Cichorium endivia ), 신나모뭄 ( Cinnamomum spp .), 시트룰루스 라나투스 (Citrullus lanatus), 시트루스 (Citrus spp.), 코코스 (Cocos spp .), 코페아 ( Coffea spp.), 콜로카시아 에스쿨렌타 (Colocasia esculenta), 콜라 (Cola spp.), 콜코루스 (Corchorus sp.), 코리안드룸 사티붐 (Coriandrum sativum), 코리루스 (Corylus spp.), 크라태구스 (Crataegus spp.), 크로쿠스 사티부스 (Crocus sativus), 쿠쿨비타 (Cucurbita spp .), 쿠쿠미스 ( Cucumis spp.), 키나라 ( Cynara spp.), 다우쿠스 카로타 (Daucus carota ), 데스모디움 ( Desmodium spp.), 디모칼푸스 론간 (Dimocarpus longan ), 디오스코레아 ( Dioscorea spp.), 디오스피로스 (Diospyros spp.), 에키노크로아 (Echinochloa spp .), 엘래이스 ((Elaeis (예를 들면, 엘래이스 귀넨시스 (Elaeis guineensis), 엘레이스 올레이페라 (Elaeis oleifera )), 엘레우신 코라카나 ( Eleusine coracana), 에리안투스 (Erianthus sp .), 에리오보트리아 야포니카 (Eriobotrya japonica), 유카립투스 ( Eucalyptus spp.), 유게니아 유니플로라 ( Eugenia uniflora), 파고피룸 ( Fagopyrum spp.), 파구스 (Fagus spp.), 페스투카 아룬디나케이 (Festuca arundinacea), 피쿠스 카리카 (Ficus carica ), 폴투넬라 ( Fortunella spp.), 프라가리아 ( Fragaria spp.), 깅코 빌로바 ( Ginkgo biloba ), 글라이신 (Glycine spp.) (예를 들면, 글라이신 맥스 (Glycine max ), 소야 히스피다 (Soja hispida ) 또는 소야 맥스 ( Soja max )), 고시피움 힐수툼 ( Gossypium hirsutum), 헬리안투스 ( Helianthus spp.) (예를 들면, 헤리안투스 안누스 (Helianthus annuus)), 헤메로칼리스 풀바 ( Hemerocallis fulva ), 히비스쿠스 (Hibiscus spp.) 홀데움 ( Hordeum spp.) (예를 들면, 홀데움 불가레 ( Hordeum vulgare)), 이포모에아 바타타스 ( Ipomoea batatas ), 주글란스 ( Juglans spp.), 락투카 사티바 (Lactuca sativa), 라티루스 (Lathyrus spp.), 렌스 쿨리나리스 (Lens culinaris), 리눔 우시타티시뭄 (Linum usitatissimum), 리치 키넨시스 (Litchi chinensis), 로투스 ( Lotus spp.), 루파 아쿠탄굴라 ( Luffa acutangula ), 루피누스 ( Lupinus spp.), 루줄라 실바티카 (Luzula sylvatica ), 라이코펠시콘 ( Lycopersicon spp.) (예를 들면, 라이코펠시콘 에스쿨렌툼 (Lycopersicon esculentum ), 라이코펠시콘 라이코펠시쿰 ( Lycopersicon lycopersicum ), 라이코펠시콘 피리폴메 ( Lycopersicon pyriforme)), 마크로틸로마 (Macrotyloma spp.), 말루스 (Malus spp.), 말피기아 에말기나타 ( Malpighia emarginata), 맘메아 아메리카나 (Mammea americana ), 망기페라 인디카 ( Mangifera indica ), 마니호트 ( Manihot spp.), 마닐카라 자포타 (Manilkara zapota), 메디카고 사티바 (Medicago sativa), 메릴로투스 ( Melilotus spp.), 멘타 ( Mentha spp.), 미스칸투스 시넨시스 ( Miscanthus sinensis ), 모몰디카 ( Momordica spp.), 모루스 니그라 (Morus nigra), 무사 (Musa spp.), 니코티아나 ( Nicotiana spp.), 올레아 ( Olea spp.), 오푼티아 (Opuntia spp.), 오르니토푸스 (Ornithopus spp.), 오리자 (Oryza spp.) (예를 들면, 오리자 사티바 (Oryza sativa ), 오리자 라티포리아 (Oryza latifolia )), 패니쿰 미리아케움 ( Panicum miliaceum ), 패니쿰 벌가툼 ( Panicum virgatum ), 파시플로라 에둘리스 ( Passiflora edulis), 파스티나카 사티바 ( Pastinaca sativa ), 페니세툼 (Pennisetum sp .), 펠세아 ( Persea spp.), 페트로셀리눔 크리스품 (Petroselinum crispum), 파라리스 아룬디나케아 (Phalaris arundinacea), 파세올루스 ( Phaseolus spp.), 플레움 프라텐세 ( Phleum pratense), 피닉스 ( Phoenix spp .), 프라그미테스 오스트라리스 (Phragmites australis), 피사리스 (Physalis spp.), 피누스 ( Pinus spp.,) 피스타키아 베라 (Pistacia vera ), 피숨 (Pisum spp.), 포아 ( Poa spp.), 포푸러스 ( Populus spp.), 프로소피스 ( Prosopis spp.), 프루누스 (Prunus spp.), 프시디움 ( Psidium spp.), 푸니카 그라나툼 ( Punica granatum ), 피루스 코무니스 ( Pyrus communis ), 켈쿠스 (Quercus spp.), 라파누스 사티부스 (Raphanus sativus), 레움 라발바룸 (Rheum rhabarbarum), 리베스 (Ribes spp.), 리키누스 콤무니스 ( Ricinus communis ), 루부스 (Rubus spp.), 사카룸 (Saccharum spp.), 살릭스 ( Salix spp.), 삼부쿠스 (Sambucus spp.), 세카레 세레알레 ( Secale cereale ), 세사뭄 ( Sesamum spp.), 시나피스 ( Sinapis sp .), 솔라눔 ( Solanum spp.) (예를 들면, 솔라눔 투베로숨 (Solanum tuberosum ), 솔라눔 인테그리폴리움 ( Solanum integrifolium ) 또는 솔라눔 라이코펠시쿰 (Solanum lycopersicum )), 솔굼 바이칼라 ( Sorghum bicolor ), 스피나시아 ( Spinacia spp.), 시지기움 ( Syzygium spp.), 타게테스 ( Tagetes spp.), 타마린두스 인디카 ( Tamarindus indica ), 테오브로마 카카오 (Theobroma cacao ), 트리폴리움 (Trifolium spp.), 트리티코세칼레 림파우이 (Triticosecale rimpaui ), 트리티쿰 (Triticum spp. (예를 들면, 트리티쿰 아에스티붐 (Triticum aestivum ), 트리티쿰 두룸 (Triticum durum ), 트리티쿰 툴기둠 (Triticum turgidum ), 트리티쿰 하이베르눔 ( Triticum hybernum ), 트리티쿰 마차 (Triticum macha ), 트리티쿰 사티붐 (Triticum sativum ) 또는 트리티쿰 불가레 (Triticum vulgare)), 트로패오룸 미누스 ( Tropaeolum minus ), 트로패오룸 마주스 ( Tropaeolum majus ), 박시니움 ( Vaccinium spp.), 비시아 ( Vicia spp.), 비그나 (Vigna spp.), 비올라 오도라타 ( Viola odorata ), 비티스 ( Vitis spp.), 제아 메이즈 ( Zea mays ), 지자니아 팔루스트리스 (Zizania palustris ), 지지푸스 ( Ziziphus spp.).
발명의 상세한 설명
I. HARPlN
첫 번째 구현예에 따라, 본 발명은 HpaG(Harpin-associated Factor G) 폴리펩티드를 암호화하는 핵산의 식물에서 발현의 조절을 포함하는 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
HpaG 폴리펩티드를 암호화하는 핵산의 발현을 조절하는 (바람직하게는, 증가) 바람직한 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 HpaG 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 HpaG 폴리펩티드를 암호화하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산은 (따라서 본 발명의 방법 수행에 유용한) 하기에 기술될 유형의 단백질을 암호화하는 임의의 핵산이며, 이후 또한 "HpaG 핵산" 또는 "HpaG 유전자"라 칭한다.
본 발명에서 정의된 HpaG 폴리펩티드는 하기 특징을 가지는 폴리펩티드를 포함한다:
(i) 서열번호 2로 표시된 HpaG 폴리펩티드 서열에 증가하는 순으로 선호되는, 적어도 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 그 이상의 서열 동일성; 및
(ii) 글리신(glycine) 함량은 약 13% 내지 약 25%, 글루타민(glutamine) 함량은 약 13% 내지 약 20%, 시스테인(cysteine) 함량은 약 0% 내지 약 1 %, 히스티딘(histidine) 함량은 약 0% 내지 약 1 %의 범위이며, 트립토판(tryptophan)은 없는 아미노산 조성.
바람직하게는, HpaG 폴리펩티드의 길이는 약 121 내지 약 143 아미노산의 범위이다.
바람직하게는, HpaG 단백질은 또한 보존된 모티프 1 (서열번호 3):
G (G/E/D) (N/E) X (Q/R/P) Q (A/S) GX (N/D) G
상기에서 4 번째 위치의 X는 임의의 아미노산일 수 있으며, 바람직하게는 S, N, P, R, 또는 Q 중의 하나이며, 상기에서 9 번째 위치의 X는 임의의 아미노산일 수 있으며, 바람직하게는 Q, E, S, 또는 P중의 하나이고;
및/또는 보존된 모티프 2 (서열번호 4)을 포함한다:
(P/A/V) S (P/Q/A) (F/L/Y) TQ (M/A) LM (H/N/Q) IV (G/M) (E/D/Q)
선택적으로, HpaG 단백질은 또한 보존된 모티프 3:
QGISEKQLDQLL
및/또는 보존된 모티프 4를 가진다:
ILQAQN
더욱이, HpaG 폴리펩티드 (적어도 천연 형태에서)는 아라비돕시스 탈리아나 생태형 (Arabidopsis thaliana ecotype) Cvi-0에서 과민성 반응을 유도한다 (Kim 등, J. Bacterid. 185, 3155-3166, 2003).
다르게는, HpaG 단백질의 상동체는 서열번호 2로 표시된 아미노산에 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체적인 서열 동일성을 가지며, 단, 상기 상동 단백질은 상기 기재된 보존된 모티프를 포함한다. 전체적인 서열 동일성은 프로그램 GAP (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은 총체적인 정렬 알고리즘(global alignment algorithm)을 사용하여, 바람직하게는 디폴트 매개변수(default parameters)를 이용하여 결정되었다. 서열 동일성은 전체적인 서열 동일성에 비해 일반적으로 보존된 도메인 또는 모티프만이 고려되었을 때 더 높을 것이다.
용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의된 바 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002))이 존재한다. 단백질 서열의 인 실리코 분석용 도구 세트가 ExPASY 프로테오믹스 서버에서 유용하다 (hosted by the Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788 (2003)). 도메인은 또한 서열정렬과 같은 상투적인 기술을 사용하여서도 동정될 수 있다.
비교를 위한 서열정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는(matches) 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 변수(default pairwise alignment parameters) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell et al., BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 핵산 또는 아미노산 전체 서열에 걸쳐, 또는 선정된 도메인 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정될 수 있다.
본 발명은 서열번호 2의 폴리펩티드 서열을 암호화하는 서열번호 1로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 HpaG 암호화 핵산 또는 HpaG 유사 폴리펩티드를 사용하여 수행될 수 있다.
HpaG 폴리펩티드를 암호화하는 핵산의 예는 본 발명의 실시예 1의 표 A에 제시되어 있다. 제시된 핵산이 본 발명의 방법의 수행에 유용하다. 실시예 1의 표 A에 제시된 아미노산 서열은 서열번호 2로 표시된 HpaG 폴리펩티드의 오쏘로그(orthologue) 및 패럴로그(paralogue)의 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에서 정의된 바 있다. 오쏘로그 및 패럴로그는 소위 상호간 블라스트(Reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있다. 전형적으로 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 A에 열거된 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열 (조회 서열은 서열번호 1 또는 서열번호 2, 두 번째 BLAST는 따라서 잔토모나스(Xanthomonas)서열과 대조하는 것이다)이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다.
핵산 변이체도 본 발명의 방법 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 HpaG 폴리펩티드를 암호화하는 핵산의 일부, HpaG 폴리펩티드를 암호화하는 핵산에 혼성화 되는 핵산, 및 유전자 셔플링에 의해 얻은 HpaG 폴리펩티드를 암호화하는 핵산의 변이체를 포함한다. 용어 혼성화 되는 서열 및 유전자 셔플링은 본 발명에 기재된 바 있다.
본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, HpaG 폴리펩티드를 암호화하는 핵산은 전장 핵산일 필요는 없다. 본 발명에서는, 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 1의 표 A에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은 본 발명에 정의된 HpaG 폴리펩티드를 암호화하며, 실시예 1의 표 A에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 1의 표 A에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 증가하는 순으로 선호되는 적어도 길이 70, 90, 110, 130 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 1의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 2에 도시된 바와 같이 계통수 구축에 사용 시, 임의의 다른 그룹과 보다는 서열번호 2로 표시된 아미노산 서열을 포함하는 HpaG 폴리펩티드 그룹과 클러스터되는 경향이 있는 아미노산 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건하에서, 바람직하게는 스트린전트 조건하에서, 본 발명에서 정의된 HpaG 폴리펩티드를 암호화하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나와 혼성화가 가능한 핵산, 또는 실시예 1의 표 A에 제시된 임의의 핵산 서열의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체를 암호화하는 핵산과 혼성화가 가능한 핵산의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 HpaG 폴리펩티드를 암호화하며, 실시예 1의 표 A에에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 1의 표 A에 제시된 핵산 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 1의 표 A에에 제시된 임의의 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산과 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 1로 표시된 핵산에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 도 2에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 HpaG 폴리펩티드의 그룹과 클러스터되는 경향이 있는 아미노산 서열을 암호화한다.
유전자 셔플링 또는 방향진화는 또한 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에서 정의된 바 있다.
본 발명에 따라, 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나의 변이체를 식물에의 도입 및 발현, 또는 실시예 1의 표 A에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 변이체를 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체는 유전자 셔플링으로 얻어진다.
바람직하게는, 유전자 셔플링으로 얻어진 변이체 핵산에 의해 암호화되는 아미노산 서열은 도 2에 도시된 바와 같은 계통수 구축에 사용 시, 임의의 다른 그룹보다는 서열번호 2로 표시된 아미노산 서열을 포함하는 HpaG 폴리펩티드 그룹과 클러스터되는 경향이 있다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이를 유발하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
HpaG 폴리펩티드를 암호화하는 핵산은 임의의 자연적 또는 인위적 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작을 통하여 조성 및/또는 게놈 환경에 있어 자연적 형태로부터 변형될 수 있다. 바람직하게는 HpaG 폴리펩티드를 암호화하는 핵산은 원핵생물로부터, 바람직하게는 TTSS를 가진 그람음성 세균으로부터, 더욱 바람직하게는 슈도모나스 과(Pseudomonaceae)로부터, 더더욱 바람직하게는 잔토모나스 속 (Xanthomonas)으로부터, 가장 바람직하게는 잔토모나스 악소노포디스(Xanthomonas axonopodis)로부터의 핵산이다.
본 발명의 방법의 수행으로 수확량 관련 형질이 향상된 식물을 제공한다. 특히 본 발명의 방법의 수행으로 대조구 식물에 비해 수확량이 증가된 식물, 특히 생물량(biomass)이 증가된 및/또는 종자 수확량이 증가된 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재된 바 있다.
본 발명에서 향상된 수확량 관련 형질은 식물체의 한 부분 이상의 생물량 (중량)에 있어서의 증가를 의미하며, 상기 한 부분은 지상부 (수확 가능한) 일부분 및/또는 (수확 가능한) 지하부의 일부분을 포함한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 적절한 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 가진 식물을 제공한다.
옥수수를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체의 수 증가; 식물체당 이삭 (열매) 수의 증가; 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립중량, 열매 길이/직경의 증가; 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서에 대한 충만된 종자의 수의 비율로 표시된다); 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가; 천립중량의 증가.
본 발명은 대조구 식물에 비하여 수확량을, 특히 식물의 생물량 및/또는 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절하여, 바람직하게는 발현을 증가시키는 것을 포함한다. 관찰된 수확량 증가는 증가된 생물적 스트레스 저항성의 결과는 아니라는 것을 주목해야 한다.
본 발명에 따른 형질전환 식물은 수확량이 증가하므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 증가된 생장 속도를 나타낼 것 같다 (생활사 중 적어도 일부에서). 증가된 수확량 외에, 증가된 양분 흡수 효율도 수확량 증가에 기여할 수 있다. 본 발명에 따른 식물이 양분 흡수에서 더 높은 효율을 보여준다는 것이 관찰되었다. 증가된 양분 흡수 효율은 식물이 보다 나은 생장을 하게 한다.
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 성숙된 종자로부터 식물체가 출발 물질과 유사한 성숙한 종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 생활사 중의 하나 이상의 단계에서 또는 실질적으로 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 년간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에(초기 시기) 또는 수확기에(후기 시기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다. 관찰된 생장 속도의 증가는 생물적 스트레스 저항성의 결과는 아니라는 것을 주목해야 한다.
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 비생물적 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 비생물적 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하의 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 용어 "순한 스트레스"는 식물이 노출되는 매일의 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염 스트레스, 산화적 스트레스 또는 이온 스트레스이다.
본 발명에서 정의된 용어 "비생물적 스트레스"는 하기 중 임의의 하나 이상을 의미하는 것이다: 수분 스트레스 (가뭄 또는 과도한 수분으로 인한), 혐기적 스트레스, 염분 스트레스, 온도 스트레스 (더운, 추운 또는 결빙 온도에 의한), 화학적 독성 스트레스 및 산화적 스트레스. 본 발명의 한 양상에 있어서, 비생물적 스트레스는 수분 스트레스, 염분 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스이다. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, 무엇보다도 NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상이다.
비생물적 환경 스트레스의 또 다른 예는 생장 및 발달을 위해 식물에 의해 동화되는 하나 이상의 양분의 감소된 이용능력이다. 식물의 수확량 및 생산품의 품질에 미치는 양분 이용 효율의 강력한 영향으로 인해, 식물 생장 및 품질을 최적화하기 위해 다량의 비료가 필드에 뿌려진다. 식물의 생산성은 보통 3 가지 주요 양분, 인, 칼륨 및 질소에 인해 제한되며, 질소가 상기 3 가지 중 식물 생장에 있어 속도 제한 요소이다. 따라서 식물 생장에 필요한 주요 양분 요소는 질소 (N) 이다. 질소는 살아있는 세포에서 발견되는 아미노산, 단백질 (효소), 핵산, 및 엽록소를 포함한 수많은 중요한 화합물의 구성성분이다. 식물 건량의 1.5% 내지 2%가 질소이며, 총 식물 단백질의 약 16%이다. 따라서, 질소 이용능력이 작물 생장 및 생산에 있어 주요 제한 요인이며 (Frink 등 (1999) Proc Natl Acad Sci USA 96(4): 1175-1180), 단백질 축적 및 아미노산 조성에 주요한 영향을 미친다. 따라서, 질소 제한 조건하에서 자랄 때 수확량이 증가된 작물은 관심의 대상이 된다.
생물적 스트레스는 전형적으로 병원균, 예를 들면, 세균, 바이러스, 균류, 선충류 및 곤충에 의한 스트레스이다.
특히, 본 발명의 방법은 대조구 식물에 비하여 증가된 수확량을 갖는 식물을 제공하기 위하여, 스트레스가 없는 조건하에서 또는 가뭄 조건하에서 수행될 수 있다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다.
본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다.
본 발명의 방법의 수행으로 스트레스가 없는 조건하에서 또는 가뭄 스트레스 조건하에서 자란 식물이 비교되는 조건하에서 자란 적절한 대조구 식물에 비해 수확량이 증가된 식물로 된다. 따라서, 본 발명에 따라 스트레스가 없는 조건하에서 또는 가뭄 스트레스 조건하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 상기 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 증가를 포함한다.
더욱이, 본 발명의 방법 수행은 양분결핍 조건하에서, 특히 질소 결핍 조건하에서 키운 식물이 동등한 조건하에서 키운 대조구 식물에 비하여 증가된 수확량을 갖게 한다. 따라서, 본 발명에 따라, 양분결핍 조건하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 그 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 증가시키는 것을 포함한다.
본 발명의 방법 수행은 초기 활력으로 이끄는 특히 식물 발달의 초기 단계 (전형적으로 벼 및 옥수수의 경우에 발아 후 3, 4 주, 그러나 이는 종에 따라 다르다) 중에 대조구 식물에 비하여 활력이 증가된 식물을 제공한다. 따라서, 본 발명에 따라, 식물의 초기 활력을 증가시키는 방법이 제공되며, 상기 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다. 바람직하게는 실생 활력의 증가는 신초(shoot) 특이적 프로모터의 통제 하에서 HpaG 폴리펩티드를 암호화하는 핵산의 발현에 의해 얻어진다. 본 발명은 또한 대조구 식물에 비하여 초기 활력을 가진 식물을 생산하는 방법을 제공하며, 상기 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다.
초기 활력은 또한 예를 들면, 식물이 환경에 보다 잘 적응 (즉, 에너지 자원 사용의 최적화, 및 신초 및 뿌리간의 분배)함으로 인한 식물 적응성의 증가의 결과일 수 있다. 초기 활력을 가진 식물은 실생 생존력의 증가 및 매우 균일한 필드 (균일한 양상으로 자라는 작물, 즉 대다수의 식물이 다양한 발달단계에 실질적으로 거의 동시에 도달함)를 초래하는 작물의 보다 나은 확립, 및 보다 양호한 생장 및 흔히 보다 양호한 수확량을 보여준다. 초기 활력은 천립중량, 발아율, 출현율, 실생 생장, 실생 높이, 뿌리 길이, 뿌리 및 신초(shoot) 생물량 등과 같은 다양한 요인들을 측정함으로써 결정될 수 있다.
본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그 일부분 (종자 포함)을 포함한다. 상기 식물 또는 그 일부분은 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산 외래도입유전자(transgene)를 포함한다.
본 발명은 또한 HpaG 폴리펩티드를 암호화하는 핵산의 식물에의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물에의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산;
(b) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, 상기 HpaG를 암호화하는 핵산은
(i) 서열번호 1로 표시된 핵산 또는 그의 상보체,
(ii) 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산.
용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 잘 알고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 구성적 프로모터 또는 녹색 조직 특이적 프로모터가 본 발명의 방법에 특히 유용하다. 다양한 유형의 프로모터에 관해 "정의" 섹션에 정의되어 있다.
바람직하게는, HpaG 핵산 또는 그 변이체는 구성적 프로모터에 작동가능하게 연결된다. 바람직한 구성적 프로모터는 실질적으로 어디에서나 발현된다. 더욱 바람직하게는, 프로모터는 식물 유래이며, 보다 더 바람직하게는 단자엽 식물 유래이다. 가장 바람직한 것은 (벼의) GOS2 프로모터 (서열번호 5)의 사용이다. 본 발명의 적용범위가 서열번호 1로 표시된 HpaG 핵산에만 제한된 것이 아니며, 본 발명의 적용범위가 GOS2 프로모터에 의한 구동 시의 HpaG 핵산의 발현에 제한된 것이 아님은 분명하다. HpaG 핵의 추진에 사용될 수 있는 다른 구성적 프로모터의 예는 본 발명의 "정의" 섹션의 표 2a에 제시되어 있다.
바람직하게는, 연속적인 프로모터는 중간 강도이며, CaMV 35S 프로모터보다 더 약한 활성을 가질 수 있다.
다르게는, HpaG 핵산 또는 그의 변이체는 녹색 조직 특이적 프로모터에 작동가능하게 연결된다. 본 발명에서 정의된 어린 녹색 조직 특이적 프로모터는 사실상 식물체의 임의의 다른 부분은 제외하고, 이들 다른 식물 부분에 어떤 누설된 발현은 있더라도 녹색 조직에서 우세하게 전사적으로 활성인 프로모터이다. 녹색 조직 특이적 프로모터는 바람직하게는 프로토클로로필리드 환원효소(protochlorophylid reductase) 프로모터, 더욱 바람직하게는 서열번호 6에 실질적으로 유사한 핵산 서열로 표시된 프로토클로로필리드 환원효소 프로모터, 가장 바람직하게는 서열번호 6으로 표시된 프로모터이다. 본 발명의 적용범위가 서열번호 1로 표시된 HpaG 암호화 핵산에만 제한된 것이 아니며, 본 발명의 적용범위가 프로토클로로필리드 환원효소 프로모터에 의한 구동 시의 HpaG 암호화 핵산의 발현에 제한된 것이 아님은 분명하다. 본 발명의 방법 수행에 사용될 수 있는 다른 녹색 조직 특이적 프로모터의 예는 본 발명의 "정의" 섹션에 제시되어 있다.
기능적으로 동등한 프로모터의 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제(beta-glucuronidase) 또는 베타-갈락토시다제(beta-galactosidase)를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터 (본 발명의 방법에 사용된 것과 같은 것)의 것에 비교된다. 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid 등, 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 암호화 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,0000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 암호화 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1000 전사체로 이끄는 것이다.
선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. 상기 서열은 알려져 있거나, 당업자는 쉽게 얻을 수 있다.
세포질 내에 축적되는 성숙한 메세지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 식물 및 동물 양자의 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 수준에서 유전자 발현이 1000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다. 더욱이, 구축물에 도입될 수 있는 암호화 서열의 코돈 이용성(codon usage)은 구축물이 도입될 숙주 세포에 맞게 최적화될 수 있다. 유전자 암호는 축퇴되어 있으며, 생물체는 한 아미노산에 대해 동일 아미노산에 대한 다른 코돈보다 특정 코돈을 사용하는 경향이 있다. 다양한 생물체에 대한 바람직한 코돈 사용의 표는 당업계에 주지되어 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제 서열의 원점을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다.
식물 세포로 핵산의 안정적인 또는 일시적인 통합시, 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산분자는 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 도입을 위한 본 발명의 방법에서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 트랜스포존(transposon)에 통합되는 마커 유전자는 원하는 핵산과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포사제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포사제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 영역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 더욱 유리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로; 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면, 형질전환이 성공적으로 일어나면, 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
본 발명은 상기에서 정의된 HpaG 폴리펩티드를 암호화하는 임의의 핵산의 식물에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 증가된 향상된 수확량, 특히 증가된 생물량 및/또는 종자 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공하며, 상기 방법은 하기를 포함한다:
(i) HpaG 폴리펩티드를 암호화하는 핵산을 식물 또는 식물 세포에의 도입 및 발현; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양.
상기 (i)의 핵산은 본 발명에서 정의된 HpaG 폴리펩티드를 암호화할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다.
생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 HpaG 폴리펩티드를 암호화하는 분리된 핵산을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 따라 사용된 핵산 또는 벡터, 발현 카세트(cassette) 또는 구축물 또는 벡터에 대한 기주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용될 수 있다.
본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직일 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서서 인자로 작용하는 분리된 핵산은 비 이질성(non-heterologous) 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, U.S. Pat. No. 5,565,350; Zarling et al., PCT/US93/03868 참고), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 암호화 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 천연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
본 발명은 또한 본 발명에 기재된 HpaG 폴리펩티드를 암호화하는 핵산의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 HpaG 폴리펩티드의 용도를 포함한다.
본 발명에 따른 방법은 본 발명에서 기재된 바와 같이 수확량 관련 형질이 향상된 식물을 초래한다. 상기 형질은 또한 추가적인 수확량 증가 형질, 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.
II . SNF2
첫 번째 구현예에 따라, 본 발명은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서 발현의 증가를 포함하는, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
SWI2/SNF2 폴리펩티드를 암호화하는 핵산의 발현을 증가시키는 바람직한 방법은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산 서열"은 상기 SWI2/SNF2 폴리펩티드를 암호화하는 것이 가능한 핵산 서열을 의미한다. 식물에 도입되는 핵산 서열은 (따라서 본 발명의 방법 수행에 유용한) 하기에 기술될 유형의 단백질을 암호화하는 임의의 핵산 서열이며, 이후 또한 "SWI2/SNF2 핵산 서열" 또는 "SWI2/SNF2 유전자"라 칭한다.
본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 N-말단으로부터 C-말단으로 하기 모티프 중 적어도 5 개, 바람직하게는 6 개, 보다 바람직하게는 7 개, 가장 바람직하게는 8 개의 ATPase 도메인을 포함하는 임의의 폴리펩티드를 말한다:
(i) 서열번호 103으로 표시된 모티프 I LADDMGLGK(T/S), 또는 모티프 I의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(ii) 서열번호 104로 표시된 모티프 Ia L(L/V/I)(V/I/L)(A/C)P(T/M/V)S(V/I/L)(V/I/L)XNW, 또는 모티프 Ia의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iii) 서열번호 105로 표시된 모티프 II DEAQ(N/A/H)(V/I/L)KN, 또는 모티프 II의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iv) 서열번호 106으로 표시된 모티프 III A(L/M)TGTPXEN, 또는 모티프 III의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(v) 서열번호 107로 표시된 모티프 IV (L/I)XF(T/S)Q(F/Y), 또는 모티프 IV의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vi) 서열번호 108로 표시된 모티프 V S(L/V)KAGG(V/T/L)G(L/I)(N/T)LTXA(N/S/T)HV, 또는 모티프 V의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vii) 서열번호 109로 표시된 모티프 Va DRWWNPAVE, 또는 모티프 Va의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프; 및
(viii) 서열번호 110으로 표시된 모티프 VI QA(T/S)DR(A/T/V)(F/Y)R(I/L)GQ, 또는 모티프 VI의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프,
모티프 Ia, 모티프 III, 모티프 IV, 및 모티프 V에서 상기 X는 임의의 아미노산이다.
다르게는 또는 부가적으로, 본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 도 7 (Flaus 등 (2006)에 기재된, supra)에 도시된 것과 같은 계통수 구축에 사용 시, 임의의 다른 SWI2/SNF2 집단(clade)보다는 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 집단(clade)과 클러스터링(clustering)되는 경향이 있는 임의의 폴리펩티드 서열을 의미한다.
다르게는 또는 부가적으로, 본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 서열번호 30에 포함된, 서열번호 111로 표시된 ATPase 도메인에 증가하는 순으로 선호되는 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 ATPase 도메인을 포함하는 임의의 폴리펩티드 서열을 의미한다.
다르게는 또는 부가적으로, 본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 서열번호 30으로 표시된 SWI2/SNF2 폴리펩티드 또는 본 발명 표 E에 제시된 임의의 폴리펩티드 서열에 증가하는 순으로 선호되는 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 임의의 폴리펩티드를 의미한다.
용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의된 바 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz 등 (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic 등 (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder 등, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher 및 Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo 등, Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman 등, Nucleic Acids Research 30(1): 276-280 (2002))가 존재한다. 단백질 서열의 인 실리코(in silico) 분석을 위한 도구 세트는 ExPASY 단백질체 서버 (hosted by the Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31 :3784-3788(2003))에서 이용할 수 있다. 도메인은 또한 서열 정렬과 같은 통상적인 기술을 사용하여서도 동정될 수 있다. 서열번호 30의 폴리펩티드 서열의 분석은 하기 실시예 9 및 11에 기재되어 있다.
비교를 위한 서열 정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는(matches) 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘(algorithm)을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열 정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트값 페어와이즈 정렬방식(default pairwise alignment parameters) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell et al., BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 하기 실시예 3에 백분율로 표시된 서열 동일성 값은 핵산 또는 폴리펩티드 전체 서열 (표 F)에 걸쳐, 및/또는 선정된 도메인 (서열번호 30에 포함된, 서열번호 111로 표시된 ATPase 도메인과 같은; 표 F1) 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정될 수 있다.
본 발명은 서열번호 30의 폴리펩티드 서열을 암호화하는, 서열번호 29로 표시된 핵산 서열로 식물체를 형질전환하는 것에 의해 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 것과 같은 임의의 SWI2/SNF2 암호화 핵산 서열 또는 SWI2/SNF2 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
식물의 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 예는 본 발명의 실시예 8의 표 E에 제시되어 있다. 상기 핵산 서열은 본 발명의 방법의 수행에 유용하다. 실시예 8의 표 E에 제시된 폴리펩티드 서열은 서열번호 30으로 표시된 SWI2/SNF2 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에서 정의된 바 있다. 오쏘로그 및 패럴로그는 소위 상호간 블라스트(Reciprocal blast) 탐색을 수행하면 용이하게 동정된다. 전형적으로 상기 과정은 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열(예를 들면, 실시예 8의 표 E에 열거된 임의의 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열 (조회 서열은 서열번호 29 또는 서열번호 30, 두 번째 BLAST는 따라서 시네코시스티스(Synechocystis) 서열과 대조하는 것이다)이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에 부가적으로, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 후에 neighbour joining tree가 사용된다 (도 7 참고).
핵산 변이체도 본 발명의 방법 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산 서열을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의된다. 본 발명의 방법에는 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다
본 발명의 방법 수행에 유용한 추가적인 핵산 변이체는 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 일부분, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열에 혼성화되는 핵산 서열, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 스플라이스 변이체, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 대립인자 변이체 및 유전자 셔플링에 의해 얻은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 변이체를 포함한다. 용어 혼성화되는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재된 것과 같다.
본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 전장 핵산 서열일 필요는 없다. 본 발명에서는, 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 일부를 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산 서열의 일부분은 예를 들면, 핵산 서열에 하나 이상의 결실을 만들어서 제조될 수 있다. 상기 일부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 일부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은 본 발명에 정의된 SWI2/SNF2 폴리펩티드를 암호화하며, 실시예 8의 표 E에 제시된 폴리펩티드 서열과 실질적으로 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 가진다. 바람직하게는, 상기 일부분은 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나의 일부분, 또는 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열의 일부분이다. 바람직하게는 상기 일부분은 증가하는 순으로 선호되는 적어도 길이 1000, 1100, 1200, 1300 또는 1400 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열이다. 가장 바람직하게는 상기 일부분은 서열번호 29의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함하는 폴리펩티드 서열을 암호화한다. 바람직하게는, 상기 일부분은 도 7에 도시된 바와 같은 계통수 구축에 사용 시, 임의의 다른 SWI2/SNF2 그룹보다는 서열번호 30로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있는 폴리펩티드 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건하에서, 바람직하게는 스트린전트 조건하에서, 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열, 또는 본 발명에서 정의된 그 일부와 혼성화가 가능한 핵산 서열이다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나와 혼성화가 가능한 핵산 서열, 또는 실시예 8의 표 E에 제시된 임의의 핵산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열과 혼성화가 가능한 핵산 서열의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하며, 실시예 8의 표 E에에 제시된 폴리펩티드 서열과 실질적으로 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 8의 표 E에에 제시된 폴리펩티드 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열과 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 29로 표시된 핵산 서열 또는 그 일부에 혼성화가 가능하다. 바람직하게는, 상기 혼성화 서열은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함하는 폴리펩티드 서열을 암호화한다. 바람직하게는, 상기 혼성화 서열은 도 7에 도시된 바와 같은 계통수 구축에 사용 시 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있는 폴리펩티드 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 스플라이스 변이체이며, 상기 스플라이스 변이체는 본 발명에서 정의된 바 있다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나의 스플라이스 변이체의, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 스플라이스 변이체의 식물에의 도입 및 발현을 포함하는, 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 스플라이스 변이체는 서열번호 30의 SWI2/SNF2 폴리펩티드 및 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열과 실질적으로 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 가진다. 바람직하게는, 스플라이스 변이체에 의해 암호화되는 폴리펩티드 서열은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함한다. 바람직하게는 스플라이스 변이체에 의해 암호화되는 폴리펩티드 서열은 도 7에 도시된 바와 같은 계통수 구축에 사용 시 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기에 정의된 것과 같은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 대립인자 변이체이며, 대립인자 변이체는 본 발명에서 정의된 바 있다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는, 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 대립인자 변이체는 서열번호 30의 SWI2/SNF2 폴리펩티드 및 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열과 사실상 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 갖는다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법 내에 포함된 것은 이들 자연적인 대립인자의 용도이다. 바람직하게는 대립인자 변이체는 서열번호 29의 대립인자 변이체 또는 서열번호 30의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열의 대립인자 변이체이다. 바람직하게는, 대립인자 변이체에 의해 암호화되는 폴리펩티드 서열은 본 발명에서 정의된 도메인 또는 모티프 중 임의의 하나 이상을 포함한다. 바람직하게는 대립인자 변이체에 의해 암호화되는 폴리펩티드 서열은 도 7에 도시된 것과 같은 계통수 구축에 사용 시, 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있다.
유전자 셔플링 또는 방향진화는 또한 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에서 정의된 바 있다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나의 변이체의 식물에의 도입 및 발현을 포함하는, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산 서열은 유전자 셔플링에 의해 얻어진다.
본 발명의 방법에 유용한 유전자 셔플링에 의해 얻어진 변이체 핵산 서열은 서열번호 30의 SWI2/SNF2 폴리펩티드 및 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열과 사실상 동일한 생물학적 활성을 갖는다. 바람직하게는, 유전자 셔플링에 의해 얻어진 변이체 핵산 서열은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함하는 폴리펩티드 서열을 암호화한다. 바람직하게는 유전자 셔플링에 의해 얻어진 변이체 핵산 서열에 의해 암호화되는 폴리펩티드 서열은 도 7에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있다.
더욱이, 핵산 서열 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이유발에 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biolog. Wiley Eds).
SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 임의의 자연적 또는 인위적 출처로부터 유래될 수 있다. 핵산 서열은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연적인 형태로부터 변형될 수 있다. 바람직하게는 SWI2/SNF2 폴리펩티드 암호화 핵산 서열은 미생물 게놈으로부터, 더욱 바람직하게는 고세균(archea) (하기와 같은 문으로부터: 크레나케오타(Crenarcheaota), 유리아케오타(Euryarchaeota) (할로박테리아(Halobacteria), 메타노박테리아(Methanobacteria), 메타노코키(Methanococci), 메타노피리(Methanopyri), 알케오글로비(Archaeoglobi), 써모플라스마타(Thermoplasmata), 및 써모코키(Thermococci) 강을 포함), 코라케오타(Korarchaeota), 또는 나노알케오타(Nanoarchaeota)) 또는 세균 (하기와 같은 문으로부터: 악티노박테리아(Actinobacteria), 아퀴피카에(Aquificae), 박테로이데테스/클로로비(Bacteroidetes/Chlorobi), 클라미디에(Chlamydiae), 클로로플렉시(Chloroflexi), 크리시오게네테스(Chrysiogenetes), 남세균, 데페리박테레스(Deferribacteres), 데이노코쿠스-써무스(Deinococcus-Thermus), 딕티오글로미(Dictyoglomi), 피브로박테레스/아시도박테리아(Fibrobacteres/Acidobacteria), 퍼미쿠테스(Firmicutes), 푸소박테리아(Fusobacteria), 겜마티모나데테스(Gemmatimonadetes), 렌티스페레(Lentisphaerae), 니트로스피레(Nitrospirae), 플란크토미세테스(Planctomycetes), 프로테오박테리아(Proteobacteria), 스피로케테스(Spirochaetes), 써모데술포박테리아(Thermodesulfobacteria), 써모미크로비아(Thermomicrobia), 써모토게(Thermotogae), 베루코미크로비아(Verrucomicrobia)으로부터), 보다 더 바람직하게는 시네코시스티스 (Synechocystis sp.), 노스톡(Nostoc sp.), 시네코코쿠스(Synechococcus sp.), 프로클로로코쿠스(Prochlorococcus sp.), 아나베나(Anaebena sp.), 글로에오박터(Gloeobacter sp.), 또는 써모시네코코쿠스(Thermosynechococcus sp.) 속의 종과 같은 남세균으로부터, 보다 더 바람직하게는 시네코시스티스(Synechocystis sp.)로부터, 가장 바람직하게는 시네코시스티스(Synechocystis) sp. PCC6803 유래이다.
본 발명의 방법의 수행은 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 식물을 제공한다.
본 발명의 "향상된 수확량 관련 형질"은 지상부 (수확 가능한)의 일부분 및/또는 지하부 (수확 가능한)의 일부분을 포함하는, 식물체의 한 부분 이상에 있어 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 일부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물에 비해 종자 수확량이 향상된 식물이 초래된다.
옥수수를 예로 들면, 수확량 증가는 하기 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체 수의 증가; 식물체당 이삭 (열매) 수의 증가; 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립중량, 열매 길이/직경의 증가; 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 하기 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서 수에 대한 충만된 종자의 수의 비율로 표시된다); 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가; 천립중량의 증가.
본 발명은 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 증가를 포함한다. 바람직하게는 향상된 수확량 관련 형질은 하기 중 하나 이상이다: (i) 원추화서당 증가된 꽃의 수; (ii) 식물체당 증가된 총 종자 중량; (iii) (충만된) 종자의 증가된 수; 또는 (iv) 증가된 수확 지수.
본 발명에 따른 형질전환 식물은 향상된 수확량 관련 형질을 가지므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 증가된 생장 속도 (생활사 중 적어도 일부에서)를 나타낼 것 같다. 증가된 수확량 외에, 증가된 양분 흡수 효율도 수확량 증가에 기여할 수 있다. 본 발명에 따른 식물이 양분 흡수에서 더 높은 효율을 보여준다는 것이 관찰되었다. 증가된 양분 흡수 효율은, 스트레스 하에서 자라든 또는 스트레스가 없는 조건에서 자라든, 식물이 보다 나은 생장을 하게 한다.
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 건조된 성숙된 종자로부터 식물체가 출발 물질과 유사한 건조된 성숙된 종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 생장 속도의 증가는 식물의 생활사 중의 하나 이상 단계에 또는 실질적으로 전체 식물 생활사 중에 일어날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가되면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가되면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 일년 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 어떤 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에(초기 시기) 또는 수확기에(후기 시기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라, 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현의 증가를 포함한다.
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하에서 키운 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염 스트레스, 산화적 스트레스 또는 이온 스트레스이다. 생물적 스트레스는 전형적으로 병원균, 예를 들면, 세균, 바이러스, 균류, 선충 및 곤충에 의한 스트레스이다. 본 발명에서 정의된 용어 "스트레스가 없는" 조건은 바람직하게는 식물이 마주치는 일상적인 기후 및 다른 비생물적 조건의 범위를 크게 벗어나지 않는 환경 조건이며, 가장 바람직하게는 식물의 최적 생장을 허용하는 조건이다. 당업자는 소정의 입지에 대한 정상적인 토양 조건 및 기후 조건을 주지하고 있다 .
본 발명의 방법의 수행으로 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 자란 식물이 비교되는 스트레스 조건하에서 자란 적절한 대조구 식물에 비해 수확량 관련 형질의 향상을 가진다. 따라서, 본 발명에 따라 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 키운 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현의 증가를 포함한다.
본 발명의 방법 수행으로 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 비생물적 스트레스 조건하에서 자란 식물을 제공한다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 상기 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 다양한 환경 스트레스는 비슷한 경로를 활성화시키므로, 가뭄 스트레스로 수행한 본 발명의 실시예는, 일반적으로 비생물적 스트레스에 있어서 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 수확량 관련 형질의 향상에 있어, 가뭄 스트레스에 대한 제한으로 보여지지 않아야 하며, 상기 정의된 SWI2/SNF2 폴리펩티드가 관여됨을 나타내는 스크린으로서이다.
가뭄 스트레스와 고염도 스트레스 간에 특히 고도의 "혼선"이 보고된 바 있다 (Rabbani 등, Plant Physiol (2003) 133: 1755-1767). 따라서, SWI2/SNF2 폴리펩티드는 가뭄 스트레스 조건하에서 자란 대조구 식물에 비해 식물의 수확량 관련 형질의 향상에 있어서의 유용성과 함께, 다양한 다른 비생물적 스트레스 조건하에서 자란 대조구 식물에 비해 식물의 수확량 관련 형질의 향상에도 용도가 있음은 명백하다.
본 발명에서 정의된 용어 "비생물적 스트레스"는 하기 중 임의의 하나 이상을 의미하는 것이다: 수분 스트레스 (가뭄 또는 과도한 수분으로 인한), 혐기적 스트레스, 염분 스트레스, 온도 스트레스 (더운, 추운 또는 결빙 온도에 의한), 화학적 독성 스트레스 및 산화적 스트레스. 본 발명의 한 양상에 있어서, 비생물적 스트레스는 수분 스트레스, 염분 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스이다. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, 무엇보다도 NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상이다.
특히, 비생물적 스트레스 조건 (바람직하게는 가뭄 스트레스 조건) 하에서 자란 식물의, 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 향상된 수확량 관련 형질은 하기 중 하나 이상을 포함한다: (i) 증가된 지상부 면적; (ii) 증가된 총 뿌리 생물량; (iii) 증가된 굵은 뿌리 생물량; (iv) 증가된 가는 뿌리 생물량; (v) 증가된 원추화서당 꽃의 수; (vi) 증가된 종자 충만도; (vii) 식물체당 증가된 총 종자 중량; (viii) 증가된 (충만된) 종자 수; 또는 (ix) 증가된 수확 지수.
본 발명의 방법의 수행으로 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 비생물적 스트레스 조건하에서 향상된 수확량 관련 형질을 가진 식물을 제공한다. 따라서, 본 발명에 따라, 비생물적 스트레스 조건하에서 키운 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현의 증가를 포함한다. 본 발명의 한 양상에 따라, 비생물적 스트레스는 하기 중 하나 이상으로부터 선택된 삼투 스트레스이다: 수분 스트레스, 염 스트레스, 산화적 스트레스 및 이온 스트레스. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다.
비생물적 환경 스트레스의 또 다른 예는 생장 및 발달을 위해 식물에 의한 동화에 필요한 하나 이상의 양분의 감소된 이용능력이다. 식물의 수확량 및 생산품의 품질에 미치는 양분 이용 효율의 강력한 영향으로 인해, 식물 생장 및 품질을 최적화하기 위해 다량의 비료가 필드에 뿌려진다. 식물의 생산성은 보통 3 가지 주요 양분, 인, 칼륨 및 질소에 인해 제한되며, 질소가 상기 3 가지 중 식물 생장에 있어 속도 제한 요소이다. 따라서 식물 생장에 필요한 주요 양분 요소는 질소 (N) 이다. 질소는 살아있는 세포에서 발견되는 아미노산, 단백질 (효소), 핵산, 및 엽록소를 포함한 수많은 중요한 화합물의 구성성분이다. 식물 건량의 1.5% 내지 2%는 질소이며 및 총 식물 단백질의 약 16%이다. 따라서, 질소 이용능력이 작물 생장 및 생산에 있어 주요 제한 요인이며 (Frink 등 (1999) Proc Natl Acad Sci USA 96(4): 1175-1180), 단백질 축적 및 아미노산 조성에 주요한 영향을 미친다. 따라서, 질소 제한 조건하에서 자랄 때 수확량이 증가된 작물은 관심의 대상이 된다.
본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그 일부분 (종자 포함), 또는 식물 세포를 포함한다. 상기 식물, 그 일부분 또는 식물 세포는 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 분리된 핵산 외래도입유전자를 포함한다.
본 발명은 또한 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및/또는 발현을 추진하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물에의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(d) 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열;
(e) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(f) 전사 종결 서열.
용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.
일 구현예에 있어서, 구축물의 조절 서열 중의 하나는 조직 특이적 프로모터이며, 바람직하게는 어린 확장성 조직에서의 발현을 위한 프로모터이다. 어린 확장성 조직에서의 발현을 위한 조직 특이적 프로모터의 예는 베타 익스팬신(beta-expansin) 프로모터, 예를 들면 서열번호 112로 표시된 벼 베타 익스팬신 프로모터이다.
식물은 상기 기재된 임의의 핵산 서열을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 포함하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
유리하게, 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 상기 프로모터는 구성적 프로모터일 수 있으며, 상기 구성적 프로모터는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 다르게는, 상기 프로모터는 화학적 (검토 위해 Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108 참고), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되는 유도성 프로모터일 수 있다. 유도성 프로모터의 또 다른 예는 식물이 다양한 스트레스 조건에 노출될 때 활성화되는 프로모터인 스트레스-유도성 프로모터, 또는 병원균 유도성 프로모터이다.
부가적으로 또는 다르게는, 상기 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 전사의 개시가 가능한, 기관 특이적 또는 조직 특이적 프로모터일 수 있으며; 또는 상기 프로모터는 생물체의 모든 조직 또는 세포에서 실질적으로 활성이 있는 편재하는 프로모터일 수 있으며, 또는 발달적으로 조절되어, 그로 인해 임의의 발달 단계 중에 또는 발달적 변화의 수행 중에 식물체의 일부분에서 활성으로 되는 프로모터일 수 있다. 임의의 기관 또는 조직에서만 전사를 개시할 수 있는 프로모터를 본 발명에서는 각각 "기관 특이적" 또는 "조직 특이적"이라 칭하며, 비슷하게, 임의의 세포에서만 전사를 개시할 수 있는 프로모터를 "세포 특이적"이라 칭한다.
일 구현예에 있어, 서열번호 29로 표시된 핵산 서열과 같은, 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 조직 특이적 프로모터에, 바람직하게는 어린 확장성 조직, 또는 정단 분열조직에서 핵산 서열을 우선적으로 발현시키는 것이 가능한 프로모터에 작동가능하게 연결된다. 바람직하게는, 어린 확장성 조직에서 핵산 서열을 우선적으로 발현시키는 것이 가능한 프로모터는 베타 익스팬신(beta-expansin) 프로모터와 동등한 발현 프로파일(profile)을 가진다. 더욱 상세하게는, 어린 확장성 조직에서 핵산 서열을 우선적으로 발현하는 것이 가능한 프로모터는 신초 또는 뿌리의 세포 신장 구간(expansion zone)에서 발현을 추진하는 것이 가능한 프로모터이다. 가장 바람직하게는, 어린 확장성 조직에서 핵산 서열을 우선적으로 발현하는 것이 가능한 프로모터는 베타 익스팬신 프로모터, 예를 들면 서열번호 112로 표시된 벼 베타 익스팬신 프로모터이다.
기능적으로 동등한 프로모터 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제 또는 베타-갈락토시다제를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터의 것에 비교된다 (본 발명의 방법에 사용된 것과 같은 것). 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid et al., 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 암호화 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 암호화 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1,000 전사체로 이끄는 것이다.
선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 용도에 적절한 종결신호 및 인핸서 서열이 당업계에 공지되어 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
세포질 내에 축적하는 성숙한 메세지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 식물 및 동물 양자의 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 양자의 수준에서 유전자 발현이 1,000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제 서열의 원점을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산 서열을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다.
식물 세포로 핵산 서열의 안정적인 또는 일시적인 통합시, 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산 서열은 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산 서열로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산 서열이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 서열 도입을 위한 본 발명의 방법에서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 트랜스포존에 통합된 마커 유전자는 원하는 핵산 서열과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포사제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포사제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 영역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 더욱 유리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로; 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면, 형질전환이 성공적으로 일어나면, 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
본 발명은 상기에서 정의된 것과 같은 SWI2/SNF2 폴리펩티드를 암호화하는 임의의 핵산 서열의 식물에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공하며, 상기 방법은 하기를 포함한다:
(i) SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열을 식물 또는 식물 세포에의 도입 및 발현; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양.
핵산 서열은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따라, 핵산 서열은 바람직하게는 형질전환에 의해 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석 또는 정량 PCR을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 양 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다.
생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법에서 양친에 의해 생산된 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 것과 같은 분리된 SWI2/SNF2 폴리펩티드를 암호화하는 분리된 핵산 서열을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 따라 사용된 핵산 서열 또는 벡터, 발현 카세트(cassette) 또는 구축물 또는 벡터에 대한 기주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용할 수 있다.
본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직일 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
핵산 서열 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서 인자로서 작용하는 분리된 핵산 서열은 비이질성(non-heterologous) 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, U.S. Pat. No. 5,565,350; Zarling et al., PCT/US93/03868), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 암호화 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래할 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
상기에 언급된 바와 같이, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 발현을 증가시키는 바람직한 방법은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및 발현이나; 상기 방법의 수행, 즉 수확량 관련 형질의 향상 효과는 또한 다른 잘 알려진 기술을 사용하여서도 얻을 수 있다. 상기 기술의 일부의 기재는 하기에 있다.
상기 기술 중 하나는, 보통 프로모터 (또한 해독 인핸서 또는 인트론)를 함유하는 T-DNA를, 프로모터가 표적 유전자의 발현을 지시하게 배치되어 관심 유전자의 게놈 영역 내로 또는 유전자 암호화 영역의 10 kb 업스트림 또는 다운스트림으로 삽입하는 것을 포함하는 T-DNA 활성화 태깅 (Hayashi et al. Science (1992) 1350-1353)이다. 전형적으로, 자체의 자연 프로모터에 의한 표적 유전자 발현의 조절은 붕괴되어 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 프로모터는 전형적으로 T-DNA 내에 끼워져 있다. 이 T-DNA는 식물 게놈 내에 예를 들면, 아그로박테리움 감염을 통하여 무작위로 삽입되며 삽입된 T-DNA 인근의 유전자의 발현이 변형되게 된다. 결과적인 형질전환 식물은 도입된 프로모터에 가까운 유전자의 변형된 발현으로 인하여 우성 표현형을 보인다.
본 발명의 효과는 또한 TILLING (Targeted Induced Local Lesions In Genomes) 기술을 이용하여 재현될 수 있으며; 동일 내용에 대해 "정의" 섹션에 기재되어 있다.
본 발명의 효과는 또한 상동 재조합을 이용하여 재현될 수 있으며; 동일 내용에 대해 "정의" 섹션에 기재되어 있다.
본 발명은 또한 본 발명에 기재된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 용도 및 대조구 식물에 비해 식물의 수확량 관련 형질의 향상에 상기 SWI2/SNF2 폴리펩티드의 용도를 포함한다. 바람직하게는, 향상된 수확량 관련 형질은 하기 중 하나 이상이다: (i) 원추화서당 증가된 꽃의 수; (ii) 식물체당 증가된 총 종자 중량; (iii) 증가된 (충만된) 종자 수; 또는 (iv) 증가된 수확 지수.
본 발명은 또한 본 발명에 기재된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 용도 및 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 비생물적 스트레스 조건 (바람직하게는 가뭄 스트레스 조건) 하에서 자란 식물의 수확량 관련 형질의 향상에 상기 SWI2/SNF2 폴리펩티드의 용도를 포함한다. 바람직하게는, 향상된 수확량 관련 형질은 하기 중 하나 이상이다: (i) 증가된 지상부 면적; (ii) 증가된 총 뿌리 생물량; (iii) 증가된 굵은 뿌리 생물량; (iv) 증가된 가는 뿌리 생물량; (v) 원추화서당 증가된 꽃의 수; (vi) 증가된 종자 충만도; (vii) 식물체당 증가된 총 종자 중량; (viii) 증가된 (충만된) 종자의 수; 또는 (ix) 증가된 수확 지수.
본 발명에서 기재된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열, 또는 SWI2/SNF2 폴리펩티드 그 자체는, SWI2/SNF2 폴리펩티드를 암호화하는 유전자에 유전적으로 연결될 수 있는, DNA 마커가 동정된 육종 프로그램에 사용된다. 유전자/핵산 서열 또는 SWI2/SNF2 폴리펩티드 그 자체는 분자 마커의 정의에 사용될 수 있다. 상기 DNA 또는 단백질 마커는 본 발명의 방법에서 정의된 향상된 수확량 관련 형질을 가진 식물체를 선발하는 육종 프로그램에 사용될 수 있다.
SWI2/SNF2 폴리펩티드를 암호화하는 유전자/핵산 서열의 대립인자 변이체 또한 마커 보조 육종 프로그램에 사용된다. 상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며; 다르게는, 상기 프로그램은 자연발생적으로 생성된 "자연적인" 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 예를 들면, PCR로 대립인자 변이체를 동정한다. 문제되는 서열의 우수한 대립인자 변이체의 선발 단계로 증가된 수확량 관련 형질을 얻는다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가의 선택적인 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 흥미로운 표현형적 특징의 조합을 만드는데 사용될 수 있다.
SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 또한 이 유전자를 유전적으로 및 물리적으로 맵핑하기 위한 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다. 상기 SWI2/SNF2 폴리펩티드 암호화 핵산 서열의 사용에는 적어도 길이 15 뉴클레오티드의 핵산 서열만이 필요하다. SWI2/SNF2 폴리펩티드 암호화 핵산 서열은 RFLP(restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)은 SWI2/SNF2 폴리펩티드 암호화 핵산 서열이 프로브로 사용된다. 결과로 나온 밴드 분포 양상으로 유전자지도 제작을 위하여 MapMaker (Lander et al. (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산 서열은 지정된 유전적 교배의 양친 및 자손을 나타내는 개체들의 제한 효소 처리된 게놈 DNAs를 포함하는 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형의 분리를 기록하여, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 SWI2/SNF2 폴리펩티드 암호화 핵산 서열의 위치 계산에 사용한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.
핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치; Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참조).
또 다른 구현예에 있어서, 핵산 탐침은 직접적인 FISH(fluorescence in situ hybridisation) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇 백 kb; Laan et al. (1995) Genome Res. 5:13-20 참고), 감도가 향상되면 보다 짧은 탐침으로 FISH 지도 제작이 가능해진다.
유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter et al. (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.
본 발명의 방법에 따라, 대조구 식물에 비해 상기에서 기재된 수확량 관련 형질이 향상된 식물이 초래된다. 상기 형질은 또한 추가적인 수확량 향상 형질 (정상적인 또는 스트레스 생장 조건하에서), 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.
도 1은 서열번호 2에 볼드체 및 밑줄로 표시된 모티프 1 및 2를 가진 HpaG 폴리펩티드의 정렬을 보여준다.
도 2는 세균 및 식물 단백질 유래의 HpaG 폴리펩티드의 계통수를 보여준다 (다양한 서열은 GenBank 등록번호 및/또는 gi 번호로 표시되었다).
도 3은 벼 GOS2 프로모터 (pGOS2)의 제어하에서 잔토모나스(Xanthomonas)유래의 HpaG 단백질 암호화 핵산의 벼(Oryza sativa)에서의 발현 증가를 위한 바이너리 벡터를 보여준다.
도 4는 본 발명에 따른 방법의 수행에 유용한 Harpin 서열의 예를 보여준다.
도 5는 본 발명에 따른 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드의 구조를 보여준다. 본 발명에 따른 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드는 속이 빈 박스로 표시된 N-말단 도메인 및 ATPase 도메인을 포함한다. 본 발명에 따른 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드의 ATPase 도메인에 포함된 전형적인 8 개의 모티프, I, Ia, II, III, IV, V, Va 및 VI는 검은 수직선으로 표시되었다.
도 6은 149 SWI2/SNF2 SSO1653 서브패밀리 구성원 (Flaus 등, 2006)의 ATPase 도메인의 서열 로고(logo)를 보여준다. 서열번호 111로 표시되며, 서열번호 30에 포함된 ATPase 도메인은 상기 서열 로고(logo)와 일치한다.
도 7은 Flaus 등 (2006)에 의해 제작된 수많은 SWI2/SNF2 서브패밀리 (149 개의 SWI2/SNF2 SSO1653 서브패밀리 구성원을 포함하여)에 속하는 SWI2/SNF2 폴리펩티드의 unrooted radial neighbor-joining tree를 보여준다. 서열번호 30으로 표시된 폴리펩티드는, 모든 고세균(archea)성 및 세균성 (집합적으로 미생물로 불림) SWI2/SNF2 폴리펩티드와 함께, SSO1653 집단 (그림에서 원으로 둘러쳐짐)내에 포함된다.
도 8은 디폴트값(default values)을 사용한, 다양한 미생물 유래의 SWI2/SNF2 폴리펩티드의 CLUSTAL W (1;83) 복수 서열 정렬을 보여준다. SWI2/SNF2 폴리펩티드는 ATPase 도메인에 포함된, 모티프 I, Ia, II, III, IV, V, Va 및 VI에 필수적인 보존 서열을 공유한다. 이들 부위는 상자로 표시되었다. 강조된 또 다른 특징은, 예를 들어 서열번호 30에 포함되며, 서열번호 111로 표시된 ATPase 도메인이다. ATPase 도메인은 모티프 1의 첫 번째 아미노산 잔기 및 SWI2/SNF2 폴리펩티드 C-말단의 마지막 아미노산 잔기 사이 (N에서 C-말단으로)에 포함된다. ATPase 도메인의 시작점과 종결점이 표시되었으며, ATPase 도메인 그 자체는 정렬된 폴리 펩티드 위에 검은 상자로 표시되었다.
도 9는 베타 익스팬신(beta-expansin) 프로모터의 제어하에서 SWI2/SNF2 폴리펩티드를 암호화하는 시네코시스티스(Synechocystis) sp. PCC6803 핵산 서열의 벼(Oryza sativa)에서의 발현 증가를 위한 바이너리 벡터를 보여준다.
도 10은 본 발명에 따른 방법의 수행에 유용한 SNF2 서열의 예를 보여준다.
본 발명은 단지 예시인 하기 실시예를 참고하여 기재될 것이다. 하기 실시예는 본 발명의 범위를 완전히 한정하거나 제한할 의도는 아니다.
실시예 1: HpaG 서열의 동정
서열번호 1에 관련된 서열 (전장 cDNA, ESTs 또는 게놈) 및/또는 서열번호 2에 관련된 단백질 서열이 Basic Local Alignment Tool (BLAST) 같은 데이터베이스 서열 탐색 도구를 사용하여 National Center for Biotechnology Information (NCBI)의 Entrez 뉴클레오티드 데이터베이스 (Altschul et al . (1990) J. Mol. Biol. 215:403-410; 및 Altschul et al . (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하거나 필적하는 것의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 서열번호 1에 의해 암호화되는 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교 로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다.
표 A는 서열번호 1로 표시된 핵산 서열 및 서열번호 2로 표시된 단백질 서열에 연관있는 핵산 및 단백질 서열의 목록이다.
표 A: 본 발명의 방법에 유용한 HpaG 암호화 핵산 서열 및 HpaG 폴리펩티드.
Figure 112009054915603-pct00012
실시예 2: HpaG 폴리펩티드 서열의 정렬( alignment )
폴리펩티드 서열의 정렬 (도 1)은 점진적 정렬의 대중적인 Clustal 알고리즘에 근거한 ClustlW 프로그램을 사용하여 수행되었다 (Thompson et al . (1997) Nucleic Acids Res 25:4876-4882; Chenna et al . (2003). Nucleic Acids Res 31:3497-3500). Gap open penalty에 대한 디폴트 값은 10, gap extension penalty에 대한 디폴트 값은 0.1이고, 선택된 가중치 행렬은 Blosum 62 (만일 폴리펩티드가 정렬되면)이다. 정렬(alignment)을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다.
HpaG 폴리펩티드의 계통수 (도 2)는 벡터 NTI (Invitrogen)의 AlignX 프로그램에 제공된 neighbour-joining clustering algorithm을 이용하여 구축되었다 .
실시예 3: 본 발명의 방법 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.
비교에 사용된 매개변수는:
Scoring matrix: Blosum62
첫째 갭: 12
연장 갭: 2
소프트웨어 분석의 결과는 전장 폴리펩티드 서열 (부분적인 폴리펩티드 서열 제외하고)에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 B에 보여진다. 동일성 백분율은 대각선 상부에 볼드체로, 유사성 백분율은 대각선 하부에 있다.
본 발명의 방법을 수행하는데 유용한 HpaG 폴리펩티드 서열 간의 동일성 백분율은 서열번호 9에 비교 시 37% 아미노산 동일성만큼 낮을 수도 있다.
표 B: 폴리펩티드 서열 전장에 걸친 전체적인 유사성 및 동일성에 대한 MatGAT 결과
Figure 112009054915603-pct00013
실시예 4: 클로닝 및 벡터 구축
달리 기술되지 않는 한, 재조합 DNA 기술은 (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 [Ausubel 등 (1994), Current Protocols in Molecular Biology, Current Protocols]의 Volumes 1 및 2에 기재된 표준 프로토콜에 따라 수행된다. 식물 분자 연구에 대한 표준 재료 및 방법은 BIOS Scientific Publications Ltd (UK) 및 BIOS Scientific Publications (UK)에서 출판된 R.D.D. Croy의 Plant Molecular Biology Labfax (1993)에 기재되어 있다.
잔토모나스(Xanthomonas) HpaG 암호화 서열은 잔토모나스 악소노포디스 DNA 라이브러리로부터 PCR에 의해 증폭되었다. 기대된 길이의 PCR 단편이 정제되어, 표준 기술을 사용하여 연이어 Gateway?벡터로 클론되었다. 서열번호 1을 포함하는 엔트리 클론이 오리자 사티바 형질전환에 사용된 destination 벡터와의 LR 반응에 사 용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클론된 목적 핵산 서열과 LR 생체 내 재조합 의도된 Gateway 카세트. 구성적 발현을 위한 벼 GOS2 프로모터 (서열번호 5)는 이 Gateway 카세트의 업스트림에 위치한다. 다르게는, 프로토클로로필리드 환원효소 프로모터 (서열번호 6)와 같은 녹색 조직 특이적 프로모터가 동일하게 유용하다.
LR 재조합 단계 후, 생성된 발현벡터 pGOS2::HpaG로 당업계에 주지되어 있는 방법에 따라 아그로박테리움 균주 LBA4044를 형질전환하였다.
실시예 5: 식물 형질전환
벼 형질전환
발현 벡터를 함유하는 아그로박테리움이 오리자 사티바 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1 분, 0.2% HgCl2에 30 분, 멸균된 증류수로 6 회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15 분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
약 35 개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5 개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
옥수수 형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/ 캐놀라 형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전 환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물절편을 3 mg/l BAP, 3 % 수크로스, 0.7 % Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16 시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지(MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파 형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65:654-659). 엽병 식물절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100μM 아세토시링원을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시링원은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화는 US 5,159,135에 기재된 방법에 따라 아그로박테리움 투머파시엔스(Agrobacterium tumefaciens)를 사용하여 형질전환된다. 목화 종자는 3% 차아염소산나트륨(sodium hypochlorite) 용액에서 20 분간 표면 살균되어, 500 ㎍/ml 세포탁심(cefotaxime)이 함유된 증류수로 수세되었다. 상기 종자는 발아를 위해 50㎍/ml 베노밀(benomyl)이 함유된 SH 배지로 옮겼다. 4 내지 6일 된 실생의 상배축을 제거하여, 0.5 cm 조각으로 잘라 0.8% 아가에 두었다. 아그로박테리움 현탁액 (목 적 유전자 및 적절한 선발 마커로 형질전환되어 밤새 배양된 것으로부터 약 108 세포/ml로 희석된)이 상배축 절편체의 접종에 사용되었다. 상온 및 명소에서 3일 후, 조직을 비타민 B5가 든 Murashige 및 Skoog 염 (Gamborg 등, Exp. Cell Res. 50:151-158 (1968)), 0.1 mg/l 2,4-D, 0.1 mg/l 키네틴(6-furfurylaminopurine) 및 750 ㎍/ml MgCL2, 그리고 잔존 세균을 죽이기 위해 50 내지 100 ㎍/ml 세포탁심 및 400-500 ㎍/ml 카르베니실린이 포함된 고체 배지 (1.6 g/l Gelrite) 로 옮겼다. 개개 세포 라인은 2 내지 3달 후에 (4 내지 6주마다 계대배양) 분리되어 조직 증식을 위해 선발 배지에 배양되었다 (30℃, 16 시간 광주기). 형질전환된 조직은 체세포배를 얻기 위해 2 내지 3 달간 비선발배지에서 연이어 배양되었다. 적어도 4 mm 길이의 건강해 보이는 배를 0.1 mg/l 인돌초산, 키네틴(6-furfurylaminopurine) 및 지베렐린산이 함유된, 미세한 질석의 SH 배지가 든 관상 용기로 옮겼다. 배를 30℃에서 16 시간의 광주기로 배양하여, 및 2 내지 3 장의 잎이 달린 단계에서 식물체를 질석 및 양분이 든 화분으로 옮겼다. 식물체가 튼튼해 지면 재배를 위해 온실로 옮겼다.
실시예 6: 표현형 평가 절차
6.1 평가 셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자(이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.
4 개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event당 더 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
가뭄 스크린
6 events (T2 종자)로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
질소 이용 효율 스크린
T2 종자로부터의 벼 식물체를 양분액을 제외하고는 정상적인 조건하에서 화 분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배 (식물 성숙, 종자 수학)의 나머지 부분은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
염 스트레스 스크린
식물체를 코코넛 섬유(coco fibers) 및 아르젝스(argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 식물을 수확할 때까지 25 mM 염 (NaCl)를 양분액에 첨가하였다. 종자 관련 매개변수를 측정하였다.
6.2 통계적 분석: F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
중복적인 events의 2 회 실험이 수행되었으므로, 조합된 분석이 수행되었다. 이는 두 실험에 걸친 효과의 일관성을 확인하기에 유용하며, 그렇다면 결론에 대한 자신감을 증가시키기에 양 실험으로부터의 증거를 축적하기에 유용하다. 사용된 방법은 자료의 다층구조를 고려하는 혼합모델 접근(mixed-model approach)이다. P 값은 우도비 검정 (likelihood ratio test)을 카이 제곱 분포에 비교함으로써 구했다.
6.3 측정된 매개변수
생물량 관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물의 수명 중에 관찰된 뿌리의 최대 생물량으로 측정됨)의 증가; 또는 뿌리/어린 줄기 지수 (뿌리 및 어린 줄기의 활발한 생장기간 중에 뿌리 야과 어린 줄기 양 간의 비율로 측정됨)의 증가로 표현된다.
초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 하기 기재된 결과는 발아 후 3 주된 식물체에 대한 것이다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 총 종자 수확량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충만도(fill rate)는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.
실시예 7: 형질전환된 식물의 표현형 평가 결과
스트레스가 없는 조건하에서 HpaG 핵산을 발현하는 형질전환된 벼 식물의 평가결과는 하기와 같다. 지상부 생물량 (AreaMax), 출현 활력 (초기 활력), 총 종자 수확량, 충만된 종자의 수, 충만도, 원추화서당 꽃의 수, 수확 지수, 및 천립중량에 대해 증가가 관찰되었다 (표 C 참고).
표 C: 스트레스가 없는 조건하에서 수확량 증가에 대한 측정 결과
매개변수 전체 증가(%) F-검정의 p-값
AreaMax 13 0.0000
초기 활력 25 0.0041
총 종자 중량 30 0.0000
충만된 종자 수 26 0.0000
충만도(fill rate) 9 0.0000
원추화서당 꽃 12 0.0371
수확 지수 18 0.0000
천립중량 4 0.0000
가뭄 스트레스 조건 하에서 HpaG 핵산을 발현하는 형질전환된 벼 식물의 평가결과는 하기에 기재되었다. 총 종자 중량, 충만된 종자의 수, 충만도, 수확 지수 및 천립중량에 대해 증가가 관찰되었다 (표 D).
표 D: 가뭄 스트레스 조건하에서 수확량 증가 측정 결과
매개변수 전체 증가(%) F-검정의 p-값
총 종자 중량 40 0.0000
충만된 종자 수 37 0.0000
충만도(fill rate) 30 0.0000
수확 지수 37 0.0000
천립중량 3 0.0001
실시예 8: 서열번호 29 및 서열번호 30에 관련된 서열 동정
서열번호 29에 관련된 서열 (전장 cDNA, ESTs 또는 게놈) 및/또는 서열번호 30에 관련된 단백질 서열은 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul et al. (1990) J. Mol. Biol. 215:403-410; 및 Altschul et al . (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하고 필적하는 것의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는데 사용된다. 서열번호 29에 의해 암호화되는 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다.
표 E. 서열번호 29로 표시된 핵산 서열 및 서열번호 30으로 표시된 폴리펩티드 서열에 연관 있는 핵산 및 폴리펩티드 서열의 목록
Figure 112009054915603-pct00014
Figure 112009054915603-pct00015
본 발명의 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드의 부가적인 출처는 Flaus 등 (2006)의 부록 표 S1C에 제시된다. 저자는 24 개의 완전한 고세균(archea) 및 269 개의 세균 게놈을 스캔하였으며, SSO1653 서브패밀리 형의 149 개의 SWI2/SNF2를 동정하였다.
실시예 9: SWI2 / SNF2 폴리펩티드 서열의 정렬
폴리펩티드 서열의 정렬은 점진적 정렬의 Clustal 알고리즘 (1.83)으로 디폴트 값(default values)을 사용하여 수행되었다 (Thompson et al . (1997) Nucleic Acids Res 25:4876-4882; Chenna et al . (2003). Nucleic Acids Res 31:3497-3500). 도 8에 도시된 결과는 SWI2/SNF2 폴리펩티드가 하기에 제시된 모티프 I, Ia, II, III, IV, V, Va 및 VI (박스로 표시)에 필수적인 보존서열을 공유하는 것을 보여준다:
(i) 서열번호 103으로 표시된 모티프 I LADDMGLGK(T/S), 또는 모티프 I의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(ii) 서열번호 104로 표시된 모티프 Ia L(L/V/I)(V/I/L)(A/C)P(T/M/V)S(V/I/L)(V/I/L)XNW, 또는 모티프 Ia의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iii) 서열번호 105로 표시된 모티프 II DEAQ(N/A/H)(V/I/L)KN, 또는 모티프 II의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iv) 서열번호 106으로 표시된 모티프 III A(L/M)TGTPXEN, 또는 모티프 III의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(v) 서열번호 107로 표시된 모티프 IV (L/I)XF(T/S)Q(F/Y), 또는 모티프 IV의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vi) 서열번호 108로 표시된 모티프 V S(L/V)KAGG(V/T/L)G(L/I)(N/T)LTXA(N/S/T)HV, 또는 모티프 V의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vii) 서열번호 109로 표시된 모티프 Va DRWWNPAVE, 또는 모티프 Va의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프; 및
(viii) 서열번호 110으로 표시된 모티프 VI QA(T/S)DR(A/T/V)(F/Y)R(I/L)GQ, 또는 모티프 VI의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프,
상기 모티프 Ia, 모티프 III, 모티프 IV, 및 모티프 V에서 X는 임의의 아미 노산이다.
상기 8 개 모티프는 ATPase 도메인 내에 포함된다. ATPase 도메인은 모티프 1의 첫 번째 아미노산 잔기 및 SWI2/SNF2 폴리펩티드 C-말단의 마지막 아미노산 잔기 사이 (N에서 C-말단으로)에 포함된다. ATPase 도메인의 시작점과 종결점이 도 8에 표시되었으며, ATPase 도메인 그 자체는 정렬된 폴리펩티드 위에 검은 상자로 표시되었다. ATPase 도메인의 예는 서열번호 30의 ATPase 도메인이며, 서열번호 111로 나타내었다.
149 개의 SWI2/SNF2 SSO1653 서브패밀리 구성원의 ATPase 도메인의 서열 로고(logo)는 Flaus 등 (2006)에 제시되어 있으며, 도 6에 도시되었다. 서열 로고는 아미노산 또는 핵산의 다중 서열 정렬의 그래픽 표현이다. 각 로고는 기호의 더미(stack)로 이루어지며, 서열상의 각 위치에 대해 하나의 더미로 구성된다. 더미의 전체 높이는 해당 위치에서의 서열이 보존되어 있음을 나타내며, 더미 내에서 기호의 높이는 해당 위치에서 각 아미노산 또는 핵산의 상대 빈도를 나타낸다. 일반적으로, 서열 로고가 일치(consensus) 서열 보다 예를 들면, 결합위치(binding site)의 보다 더 풍부하며 자세한 기재를 제공한다. 이와 같은 로고를 생산하는 알고리즘 (WebLogo)은 California 대학교 (Berkeley)의 서버에서 가능하다. 서열번호 111로 표시되며, 서열번호 30에 포함된 ATPase 도메인은 도 6에 도시된 서열 로고와 일치한다.
수많은 SWI2/SNF2 서브패밀리 (SSO1653 포함)로부터 SWI2/SNF2 폴리펩티드의 unrooted radial neighbor-joining tree가 도 7에 도시된 바와 같이 Flaus 등, (2006)에 의해 구축되었다. 서열번호 30으로 표시된 폴리펩티드는 모든 고세균(archea) 및 세균 (집합적으로 미생물) SWI2/SNF2 폴리펩티드와 함께 SSO1653 집단 (그림에서 원으로 표시)에 포함된다.
실시예 10: 본 발명의 방법 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타를 사전 정렬할 필요 없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.
비교에 사용된 매개변수는 하기와 같다:
Scoring matrix: Blosum62
첫째 갭: 12
연장 갭: 2
소프트웨어 분석의 결과는 전장 폴리펩티드 서열 (부분적인 폴리펩티드 서열 제외)에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 F에 보여진다. 동일성 백분율은 대각선 상부에, 유사성 백분율은 대각선 하부에 있다.
본 발명의 방법을 수행하는데 유용한 SSO1653 서브패밀리의 전장 SWI2/SNF2 폴리펩티드 서열 간의 동일성 백분율은 서열번호 30에 비교 시 33% 내지 52% 범위의 아미노산 동일성이다 (표 F).
본 발명의 방법을 수행하는데 유용한 SSO1653 서브패밀리의 SWI2/SNF2 폴리펩티드 서열의 ATPase 도메인 간의 동일성 백분율은 서열번호 111로 표시되고, 서열번호 30에 포함된 ATPase 도메인에 비교 시 45% 내지 70% 범위의 아미노산 동일성이다 (표 F1).
표 F: 전장 SWI2/SNF2 폴리펩티드 서열에 걸쳐 전체적인 유사성 및 동일성에 대한 MatGAT 결과
Figure 112009054915603-pct00016
Figure 112009054915603-pct00017
표 F1: SWI2/SNF2 폴리펩티드 서열의 ATPase 도메인 간 전체적인 유사성 및 동일성에 대한 MatGAT 결과
Figure 112009054915603-pct00018
Figure 112009054915603-pct00019
실시예 11: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 텍스트 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Interpro는 영국에 있는 European Bioinformatics Institute에서 호스팅된다.
서열번호 30으로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과가 표 G에 제시되어 있다. SWI2/SNF2 폴리펩티드 (또는 리모델링 효소)는 ATP 가수분해를 이용하여 DNA 가닥의 분리를 촉매하는 효소인 헬리카아제 (특히 SF2 헬리카아제)와 서열 유사성을 공유한다. 상기 서열 유사성은 양 유형의 효소의 ATPase 도메인에 제한된다.
표 G: 서열번호 2로 표시된 폴리펩티드 서열의 InterPro scan 결과 (주요 등록번호).
Figure 112009054915603-pct00020
실시예 12: 서열번호 29로 표시된 핵산 서열의 클로닝
달리 기술되지 않는 한, 재조합 DNA 기술은 (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 Ausubel 등 (1994)의 Current Protocols in Molecular Biology, Current Protocols의 Volumes 1 및 2에 기재된 표준 프로토콜에 따라 수행된다. 식물 분자 연구에 대한 표준 재료 및 방법은 BIOS Scientific Publications Ltd (UK) 및 BIOS Scientific Publications (UK)에서 출판된 R.D.D. Croy의 Plant Molecular Biology Labfax (1993)에 기재되어 있다.
시네코시스티스(Synechocystis) sp. PCC6803 SWI2/SNF2 유전자는 시네코시스티스(Synechocystis) sp. PCC6803 게놈 DNA를 주형으로 하여 PCR로 증폭되었다. Gateway 재조합을 위한 AttB 부위를 포함하는 프라이머 prmO8774 (서열번호 113; 센스,: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgactatccacggtaattgg-3') 및 prmO8779 (서열번호 114; 역방향, 상보적,: 5'-ggggaccactttgtacaagaaagctgggttcaatcggacgcttcggctt- 3')가 PCR 증폭에 사용되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여 수행되었다. 예상된 길이의 PCR 단편이 (attB 부위 포함) 증폭되어, 표준 방법으로 정제되었다. Gateway 용어로 "entry clone"을 생성하기 위해, PCR 단편이 pDONR201 플라스미드로 생체 내(in vivo) 재조합되는 중에 Gateway 과정의 첫 단계인 BP 반응이 수행되었다. 플라스미드 pDONR201는 Gateway?기술의 일부로, Invitrogen으로부터 구입하였다.
실시예 13: 서열번호 29로 표시된 핵산 서열을 사용한 발현 벡터 구축
서열번호 29를 포함하는 엔트리(entry) 클론을 벼 형질전환에 사용된 destination 벡터와의 LR 반응에 사용하였다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 식물 선발 마커, 스크린가능한 마커 발현 카세트, 및 이미 엔트리 클론으로 클론된 목적 핵산 서열과 LR 생체 내 재조합에 계획된 Gateway 카세트를 포함한다. 어린 확장성 조직에서의 발현을 위해 벼 베타 익스팬신(beta-expansin) 프로모터 (서열번호 112)를 상기 Gateway 카세트의 업스트림에 두었다.
LR 재조합 단계 후, 생성된 발현 벡터 pExp::SWI2/SNF2 (도 8)는 당업계에 주지된 방법에 따라 아그로박테리움 균주(Agrobacterium strain) LBA4044로 형질전 환되었다.
실시예 14: 식물 형질전환
벼 형질전환에 대해 상기 실시예 5 참고
실시예 15: 표현형 평가 절차
15.1 평가 셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자(이형접합자 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.
5 개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event당 보다 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
가뭄 스크린
5 events (T2 종자)로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
염 스트레스 스크린
벼 식물체를 코코넛 섬유(coco fibers) 및 아르젝스(argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 25 mM 염 (NaCl)을 하기 목록의 구성분을 포함하는 양분액에 첨가하였다.
- NPK 양분 혼합물, 1 kg/m3의 농도로 20-20-20 Peters professional (Scotts, Marysville, OH, USA).
- 마그네슘 킬레이트(Magnesium chelate), 333.33 ml/m3로 Chelal Mg (BMS, Bornem, Belgium)
- 철 킬레이트(Iron chelate), 21.67 g/m3로 Libfer (CIBA, Bradford, UK)
- NaCl 1.425 kg/m3
염 농도를 매주 모니터링하여, 필요 시 첨가 하였다. 등숙(grain filling)이 시작될 때까지 상기 조건하에서 식물체를 키웠다. 종자 수확할 때까지, 신선한 물이 매일 급수되는 온실의 다른 구획으로 옮겼다. 생장 및 수확량 매개변수를 정상적인 조건의 생장에서와 같이 기록하였다.
감소된 양분 (질소) 이용률 스크린
벼 식물체를 양분액을 제외하고는 정상적인 조건하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배의 나머지 부분 (식물 성숙, 종자 수학)은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 처럼 기록하였다.
15.2 통계적 분석: F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유 의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
15.3 측정된 매개변수
생물량 관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다.
뿌리 관련 매개변수를 측정하기 위해, 뿌리가 보일 수 있게 하부가 투명하게 특별히 고안된 화분에서 식물체를 키웠다. 식물체 생장 중에 화분의 하부의 이미지를 디지털 카메라로 기록하였다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 중에 관찰된 뿌리의 최대 생물량으로서 측정된)의 증가로; 또는 뿌리/신초 지수 (뿌리 및 신초의 활발한 생장기간에 뿌리 양 및 신초 양 간의 비율로서 측정된) 의 증가로 표현된다. 더욱이, 특정 두께 역치 이하의 뿌리(가는 뿌리)의 최대 생물량 뿐만 아니라, 식물체의 수명 중에 관찰된 임의의 두께 역치 이상의 뿌리(굵은 뿌리)의 최대 생물량이 계산된다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 식물체당 총 종자 중량은 하나의 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 하나의 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 식물체당 총 종자 중량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충만도는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.
실시예 16: 정상적인 조건하에서 자란, SWI2 / SNF2 핵산 서열을 발현하는 형질전환된 벼 식물체의 표현형 평가 결과
정상적인 생장 조건하에서 자란, SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물의 평가 결과는 하기 표 H에 제시된다.
해당 공접합자 (대조구)에 비해 형질전환체의 원추화서당 꽃의 수, 식물체당 총 종자 중량, 총 종자 수, 충만된 종자의 수 및 수확 지수에 있어서의 증가가 있었다.
표 H. 정상적인 생장 조건하에서 자란, SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물의 평가 결과.
T1 세대에서 best performing events의 평균 증가(%) T2 세대에서 best performing events의 평균 증가(%)
원추화서당 꽃 수 11% 3%
식물체당 총 종자 중량 13% 28%
총 종자 수 14% 6%
충만된 종자 수 14% 25%
수확 지수 10% 25%
실시예 17: 가뭄 스트레스 조건하에서 자란 형질전환된 벼 식물체의 표현형 평가결과
가뭄 스트레스 생장 조건하에서 자란, SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물체의 평가 결과는 표 I에 제시된다.
해당 공접합자(nullizygotes; 대조구)에 비해 형질전환체의 지상부 면적, 총 뿌리 생물량, 원추화서당 꽃의 수, 종자 충만도, 식물체당 총 종자 중량, 총 종자 수, 충만된 종자의 수 및 수확 지수에 있어서의 증가가 있었다.
표 I. 가뭄 스트레스 생장 조건하에서 SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물체의 평가 결과
T2 세대에서 best performing events의 평균 증가(%)
지상부 면적 16%
총 뿌리 생물량 13%
굵은 뿌리 생물량 10%
가는 뿌리 생물량 13%
원추화서당 꽃의 수 7%
종자 충만도 28%
식물체당 총 종자 중량 57%
총 종자 수 44%
충만된 종자의 수 54%
수확 지수 31%
실시예 18: 옥수수, 알팔파 , 목화, 대두, 유채/ 캐놀라 , 밀의 형질전환의 예
상기 실시예 5 참고
<110> Cropdesign N.V. Crop Functional Genomics Center <120> Plants having enhanced yield-related traits and a method for making the same <130> PF58891 <160> 114 <170> PatentIn version 3.3 <210> 1 <211> 402 <212> DNA <213> Xanthomonas axonopodis <400> 1 atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60 cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120 cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180 cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240 cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacatt 300 ctccaggcgc agaatggtgg cggcttcggc ggcggctttg gtggtggctt cggtggcatc 360 ctcgtcacca gccttgcgag cgacaccgga tcgatgcagt aa 402 <210> 2 <211> 133 <212> PRT <213> Xanthomonas axonopodis <400> 2 Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln 1 5 10 15 Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln 20 25 30 Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met 35 40 45 Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly 50 55 60 Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly 65 70 75 80 Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile 85 90 95 Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly 100 105 110 Phe Gly Gly Gly Phe Gly Gly Ile Leu Val Thr Ser Leu Ala Ser Asp 115 120 125 Thr Gly Ser Met Gln 130 <210> 3 <211> 11 <212> PRT <213> Artificial sequence <220> <223> conserved motif 1 <220> <221> VARIANT <222> (2)..(2) <223> /replace = "Glu" /replace = "Asp" <220> <221> VARIANT <222> (3)..(3) <223> /replace = "Glu" <220> <221> UNSURE <222> (4)..(4) <223> Xaa can e any naturally occurring amino acid <220> <221> VARIANT <222> (5)..(5) <223> /replace = "Arg" /replace = "Pro" <220> <221> VARIANT <222> (7)..(7) <223> /replace = "Ser" <220> <221> UNSURE <222> (9)..(9) <223> Xaa can e any naturally occurring amino acid <220> <221> VARIANT <222> (10)..(10) <223> /replace = "Asp" <400> 3 Gly Gly Asn Xaa Gln Gln Ala Gly Xaa Asn Gly 1 5 10 <210> 4 <211> 14 <212> PRT <213> Artificial sequence <220> <223> conserved motif 2 <220> <221> VARIANT <222> (1)..(1) <223> /replace = "Ala" /replace = "Val" <220> <221> VARIANT <222> (3)..(3) <223> /replace = "Gln" /replace = "Ala" <220> <221> VARIANT <222> (4)..(4) <223> /replace = "Leu" /replace = "Tyr" <220> <221> VARIANT <222> (7)..(7) <223> /replace = "Ala" <220> <221> VARIANT <222> (10)..(10) <223> /replace = "Asn" /replace = "Gln" <220> <221> VARIANT <222> (13)..(13) <223> /replace = "Met" <220> <221> VARIANT <222> (14)..(14) <223> /replace = "Asp" /replace = "Gln" <400> 4 Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val Gly Glu 1 5 10 <210> 5 <211> 2194 <212> DNA <213> Oryza sativa <400> 5 aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60 aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140 acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200 tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260 tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320 atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380 gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440 gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500 gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560 gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620 tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680 ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740 actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800 agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860 atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920 gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980 ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040 acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100 aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160 ttggtgtagc ttgccacttt caccagcaaa gttc 2194 <210> 6 <211> 1179 <212> DNA <213> Oryza sativa <400> 6 ttgcagttgt gaccaagtaa gctgagcatg cccttaactt cacctagaaa aaagtatact 60 tggcttaact gctagtaaga catttcagaa ctgagactgg tgtacgcatt tcatgcaagc 120 cattaccact ttacctgaca ttttggacag agattagaaa tagtttcgta ctacctgcaa 180 gttgcaactt gaaaagtgaa atttgttcct tgctaatata ttggcgtgta attcttttat 240 gcgttagcgt aaaaagttga aatttgggtc aagttactgg tcagattaac cagtaactgg 300 ttaaagttga aagatggtct tttagtaatg gagggagtac tacactatcc tcagctgatt 360 taaatcttat tccgtcggtg gtgatttcgt caatctccca acttagtttt tcaatatatt 420 cataggatag agtgtgcata tgtgtgttta tagggatgag tctacgcgcc ttatgaacac 480 ctacttttgt actgtatttg tcaatgaaaa gaaaatctta ccaatgctgc gatgctgaca 540 ccaagaagag gcgatgaaaa gtgcaacgga tatcgtgcca cgtcggttgc caagtcagca 600 cagacccaat gggcctttcc tacgtgtctc ggccacagcc agtcgtttac cgcacgttca 660 catgggcacg aactcgcgtc atcttcccac gcaaaacgac agatctgccc tatctggtcc 720 cacccatcag tggcccacac ctcccatgct gcattatttg cgactcccat cccgtcctcc 780 acgcccaaac accgcacacg ggtcgcgata gccacgaccc aatcacacaa cgccacgtca 840 ccatatgtta cgggcagcca tgcgcagaag atcccgcgac gtcgctgtcc cccgtgtcgg 900 ttacgaaaaa atatcccacc acgtgtcgct ttcacaggac aatatctcga aggaaaaaaa 960 tcgtagcgga aaatccgagg cacgagctgc gattggctgg gaggcgtcca gcgtggtggg 1020 gggcccaccc ccttatcctt agcccgtggc gctcctcgct cctcgggtcc gtgtataaat 1080 accctccgga actcactctt gctggtcacc aacacgaagc aaaaggacac cagaaacata 1140 gtacacttga gctcactcca aactcaaaca ctcacacca 1179 <210> 7 <211> 402 <212> DNA <213> Artificial sequence <220> <223> synthetic construct mutant elicitor of hypersensitive response HpaG_T44C gene <400> 7 atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60 cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120 cagctgctgt gccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180 cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240 cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacatt 300 ctccaggcgc agaatggtgg cggcttcggc ggcggctttg gtggtggctt cggtggcatc 360 ctcgtcacca gccttgcgag cgacaccgga tcgatgcagt aa 402 <210> 8 <211> 133 <212> PRT <213> Artificial sequence <220> <223> mutant elicitor of hypersensitive response HpaG_T44C <400> 8 Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln 1 5 10 15 Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln 20 25 30 Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile Met 35 40 45 Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly 50 55 60 Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly 65 70 75 80 Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile 85 90 95 Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly 100 105 110 Phe Gly Gly Gly Phe Gly Gly Ile Leu Val Thr Ser Leu Ala Ser Asp 115 120 125 Thr Gly Ser Met Gln 130 <210> 9 <211> 378 <212> DNA <213> Artificial sequence <220> <223> synthetic construct mutant elicitor of hypersensitive response HpaG-T gene <400> 9 atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60 cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120 cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180 cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240 cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacggc 300 ttcggcggcg gctttggtgg tggcttcggt ggcatcctcg tcaccagcct tgcgagcgac 360 accggatcga tgcagtaa 378 <210> 10 <211> 125 <212> PRT <213> Artificial sequence <220> <223> mutant elicitor of hypersensitive response HpaG-T <400> 10 Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln 1 5 10 15 Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln 20 25 30 Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met 35 40 45 Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly 50 55 60 Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly 65 70 75 80 Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile 85 90 95 Val Gly Asp Gly Phe Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Ile 100 105 110 Leu Val Thr Ser Leu Ala Ser Asp Thr Gly Ser Met Gln 115 120 125 <210> 11 <211> 414 <212> DNA <213> Xanthomonas axonopodis pv. citri <400> 11 ttactgcatc gatccggtgt cgctcgcaag gctggtgccg aggctggtgc cgaggccgcc 60 gccgaagcca ccaccaaagc cgccgccgaa gccaccacca ttctgcgcct ggagaatgtc 120 tccgacgata ttcatcagca tctgggtgta ttgcgagggg gagccgttgg actgaccggc 180 ctgctgccga ttgccgccct gaccaccaga gtcaccaccc tggccttgac cctgaccctg 240 ctcggcattg ttgctctgct gaagcagggc catgatgagc tgggtcagca gctggtccag 300 ttgcttttcc gagatgccct ggttgccctg gttcgaacca gattgcgtgt tctggctggg 360 gtcaacctga aagaaggacg agttggcgcc gagctgtgtg ttcaaagaat tcat 414 <210> 12 <211> 137 <212> PRT <213> Xanthomonas axonopodis pv. citri <400> 12 Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln 1 5 10 15 Val Asp Pro Ser Gln Asn Thr Gln Ser Gly Ser Asn Gln Gly Asn Gln 20 25 30 Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met 35 40 45 Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly 50 55 60 Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Arg Gln Gln Ala Gly 65 70 75 80 Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Met Leu Met Asn Ile 85 90 95 Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly 100 105 110 Phe Gly Gly Gly Phe Gly Gly Gly Leu Gly Thr Ser Leu Gly Thr Ser 115 120 125 Leu Ala Ser Asp Thr Gly Ser Met Gln 130 135 <210> 13 <211> 366 <212> DNA <213> Artificial sequence <220> <223> synthetic construct mutant elicitor of hypersensitive response HpaG-N gene <400> 13 atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60 cagaacacgc aatctagtcc gaaccagggc aacacccagc tcatcatggc cctgcttcag 120 cagagcaaca atgccgagca gggtcagggt caaggccagg gtggtgactc tggcggtcag 180 ggcggcaatc cgcggcaggc cgggcagtcc aacggctccc cctcgcaata cacccaggcg 240 ctgatgaata tcgtcggaga cattctccag gcgcagaatg gtggcggctt cggcggcggc 300 tttggtggtg gcttcggtgg catcctcgtc accagccttg cgagcgacac cggatcgatg 360 cagtaa 366 <210> 14 <211> 121 <212> PRT <213> Artificial sequence <220> <223> mutant elicitor of hypersensitive response HpaG-N <400> 14 Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln 1 5 10 15 Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Thr 20 25 30 Gln Leu Ile Met Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly 35 40 45 Gln Gly Gln Gly Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro 50 55 60 Arg Gln Ala Gly Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala 65 70 75 80 Leu Met Asn Ile Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly 85 90 95 Phe Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Ile Leu Val Thr Ser 100 105 110 Leu Ala Ser Asp Thr Gly Ser Met Gln 115 120 <210> 15 <211> 366 <212> DNA <213> Xanthomonas axonopodis <400> 15 atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60 cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120 cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180 cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240 cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacatt 300 ctccaggcgc agaatggctt tatcctcgtc accagccttg cgagcgacac cggatcgatg 360 cagtaa 366 <210> 16 <211> 121 <212> PRT <213> Xanthomonas axonopodis <400> 16 Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln 1 5 10 15 Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln 20 25 30 Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met 35 40 45 Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly 50 55 60 Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly 65 70 75 80 Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile 85 90 95 Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Phe Ile Leu Val Thr Ser 100 105 110 Leu Ala Ser Asp Thr Gly Ser Met Gln 115 120 <210> 17 <211> 402 <212> DNA <213> Xanthomonas smithii subsp. smithii <400> 17 atgaattctt tgaacacaca gatcggcgcc aactcgtcct tcttgcaggt cgacccgagc 60 cagaacacgc aattcggtcc gaaccagggc aatcaaggca tctcggaaaa gcagctggac 120 cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgaccagggt 180 cagggtggtg actctggtgg tcaaggcggc aattcgcggc aggccgggca gcccaatggt 240 tccccctcgg catacaccca gatgctgatg aatatcgtcg gagacattct ccaggcgcag 300 aatggtggtg gcttcggcgg cgggttcggc ggtggctttg gtggcgggct cggcaccagc 360 ctcggcagca gccttgcgag cgacaccgga tcgatgcagt aa 402 <210> 18 <211> 133 <212> PRT <213> Xanthomonas smithii subsp. smithii <400> 18 Met Asn Ser Leu Asn Thr Gln Ile Gly Ala Asn Ser Ser Phe Leu Gln 1 5 10 15 Val Asp Pro Ser Gln Asn Thr Gln Phe Gly Pro Asn Gln Gly Asn Gln 20 25 30 Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met 35 40 45 Ala Leu Leu Gln Gln Ser Asn Asn Ala Asp Gln Gly Gln Gly Gly Asp 50 55 60 Ser Gly Gly Gln Gly Gly Asn Ser Arg Gln Ala Gly Gln Pro Asn Gly 65 70 75 80 Ser Pro Ser Ala Tyr Thr Gln Met Leu Met Asn Ile Val Gly Asp Ile 85 90 95 Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Gly 100 105 110 Phe Gly Gly Gly Leu Gly Thr Ser Leu Gly Ser Ser Leu Ala Ser Asp 115 120 125 Thr Gly Ser Met Gln 130 <210> 19 <211> 420 <212> DNA <213> Xanthomonas oryzae pv. oryzae <400> 19 atgaactctt tgaacacaca attcggcggc agcacgtcca accttcaggt tggcccaagc 60 caggacacaa cgttcggttc gaaccagggc ggcaaccagg gcatctcgga aaagcaactg 120 gaccagttgc tgtgccagct catctcggcc ctgcttcagt cgagcaaaaa tgctgaggag 180 ggtaagggtc agggtggcga taatggcggt ggccagggcg gcaattcgca gcaggccggg 240 cagcagaatg gcccctcgcc attcacccag atgctgatgc atatcgtcgg agagattctc 300 caggcgcaga atggtggtgg tgctggtggc ggcggtttcg gcggcgggtt cggcggcgac 360 tttagtggcg acctcggcct cggcaccaac ctctcgagcg acagcgcatc aatgcagtaa 420 <210> 20 <211> 139 <212> PRT <213> Xanthomonas oryzae pv. oryzae <400> 20 Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Thr Ser Asn Leu Gln 1 5 10 15 Val Gly Pro Ser Gln Asp Thr Thr Phe Gly Ser Asn Gln Gly Gly Asn 20 25 30 Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile 35 40 45 Ser Ala Leu Leu Gln Ser Ser Lys Asn Ala Glu Glu Gly Lys Gly Gln 50 55 60 Gly Gly Asp Asn Gly Gly Gly Gln Gly Gly Asn Ser Gln Gln Ala Gly 65 70 75 80 Gln Gln Asn Gly Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val 85 90 95 Gly Glu Ile Leu Gln Ala Gln Asn Gly Gly Gly Ala Gly Gly Gly Gly 100 105 110 Phe Gly Gly Gly Phe Gly Gly Asp Phe Ser Gly Asp Leu Gly Leu Gly 115 120 125 Thr Asn Leu Ser Ser Asp Ser Ala Ser Met Gln 130 135 <210> 21 <211> 420 <212> DNA <213> Xanthomonas oryzae pv. oryzae <400> 21 atgaattctt tgaacacaca attcggcggc agcacgtcca accttcaggt tggcccaagc 60 caggacacaa cgttcggttc gaaccagggc ggcaaccagg gcatctcgga aaagcaactg 120 gaccagttgc tgtgccagct catctcggcc ctgcttcagt cgagcaaaaa tgctgaggag 180 ggtaagggtc agggtggcga taatggcggt ggccagggcg gcaattcgca gcaggctggg 240 cagcagaatg gcccctcgcc attcacccag atgctgatgc atatcgtcgg agagattctc 300 caggcgcaga atggtggtgg tgctggtggc ggcgggttcg gcggcgggtt cggcggtgac 360 tttagtggcg acctcggcct cggcaccaac ctctcgagcg acagcgcatc gatgcagtaa 420 <210> 22 <211> 139 <212> PRT <213> Xanthomonas oryzae pv. oryzae <400> 22 Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Thr Ser Asn Leu Gln 1 5 10 15 Val Gly Pro Ser Gln Asp Thr Thr Phe Gly Ser Asn Gln Gly Gly Asn 20 25 30 Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile 35 40 45 Ser Ala Leu Leu Gln Ser Ser Lys Asn Ala Glu Glu Gly Lys Gly Gln 50 55 60 Gly Gly Asp Asn Gly Gly Gly Gln Gly Gly Asn Ser Gln Gln Ala Gly 65 70 75 80 Gln Gln Asn Gly Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val 85 90 95 Gly Glu Ile Leu Gln Ala Gln Asn Gly Gly Gly Ala Gly Gly Gly Gly 100 105 110 Phe Gly Gly Gly Phe Gly Gly Asp Phe Ser Gly Asp Leu Gly Leu Gly 115 120 125 Thr Asn Leu Ser Ser Asp Ser Ala Ser Met Gln 130 135 <210> 23 <211> 420 <212> DNA <213> Xanthomonas oryzae pv. oryzae <400> 23 atgaattctt tgaacacaca attcggcggc agcacgtcca accttcaggt tggcccaagc 60 caggacacaa cgttcggttc gaaccagggc ggcaaccagg gcatctcgga aaagcaactg 120 gaccagttgc tgtgccagct catctcggcc ctgcttcagt cgagcaaaaa tgctgaggag 180 ggtaagggtc agggtggcga taatggcggt ggccagggcg gcaattcgca gcaggccggg 240 cagcagaatg gcccctcgcc attcacccag atgctgatgc atatcgtcgg agagattctc 300 caggcgcaga atggtggtgg tgctggtggc ggcgggttcg gcggcgggtt cggcggtgac 360 tttagtggcg acctcggcct cggcaccaac ctctcgagcg acagcgcatc gatgcagtaa 420 <210> 24 <211> 139 <212> PRT <213> Xanthomonas oryzae pv. oryzae <400> 24 Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Thr Ser Asn Leu Gln 1 5 10 15 Val Gly Pro Ser Gln Asp Thr Thr Phe Gly Ser Asn Gln Gly Gly Asn 20 25 30 Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile 35 40 45 Ser Ala Leu Leu Gln Ser Ser Lys Asn Ala Glu Glu Gly Lys Gly Gln 50 55 60 Gly Gly Asp Asn Gly Gly Gly Gln Gly Gly Asn Ser Gln Gln Ala Gly 65 70 75 80 Gln Gln Asn Gly Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val 85 90 95 Gly Glu Ile Leu Gln Ala Gln Asn Gly Gly Gly Ala Gly Gly Gly Gly 100 105 110 Phe Gly Gly Gly Phe Gly Gly Asp Phe Ser Gly Asp Leu Gly Leu Gly 115 120 125 Thr Asn Leu Ser Ser Asp Ser Ala Ser Met Gln 130 135 <210> 25 <211> 378 <212> DNA <213> Xanthomonas oryzae pv. oryzicola <400> 25 atgaattctt tgaacacaca attcggcggc agcgcgtcca acttccaggt tgaccaaagc 60 cagaacgcgc aatccgattc gagccagggc agcaatggca gccagggtat ctcggaaaag 120 caactggacc agttgctgtg ccagctcatc caggccctgc ttcagccgaa caaaaatgct 180 gaggaaggta agggtcagca gggtggcgag aataatcagc aggccgggaa ggagaatggc 240 gcctcgccac tcacccagat gctgatgaat atcgtcggag agattctcca ggcgcagaat 300 gccggcggca gcagcggcgg cgactttggt ggcagtttcg ccagcagctt ctcgaacgac 360 agcggatcga tgcagtaa 378 <210> 26 <211> 125 <212> PRT <213> Xanthomonas oryzae pv. oryzicola <400> 26 Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Ala Ser Asn Phe Gln 1 5 10 15 Val Asp Gln Ser Gln Asn Ala Gln Ser Asp Ser Ser Gln Gly Ser Asn 20 25 30 Gly Ser Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln 35 40 45 Leu Ile Gln Ala Leu Leu Gln Pro Asn Lys Asn Ala Glu Glu Gly Lys 50 55 60 Gly Gln Gln Gly Gly Glu Asn Asn Gln Gln Ala Gly Lys Glu Asn Gly 65 70 75 80 Ala Ser Pro Leu Thr Gln Met Leu Met Asn Ile Val Gly Glu Ile Leu 85 90 95 Gln Ala Gln Asn Ala Gly Gly Ser Ser Gly Gly Asp Phe Gly Gly Ser 100 105 110 Phe Ala Ser Ser Phe Ser Asn Asp Ser Gly Ser Met Gln 115 120 125 <210> 27 <211> 366 <212> DNA <213> Xanthomonas campestris pv. campestris <400> 27 tcaggcttgg ccggtgatgc tcgacaggtt ggcattgaag ccgccaccca agctggtgcc 60 gcccatgccg gcgccgcctt ggttctgcat cagctgcatc acgatctgca tcagcatctg 120 cgtcaacgga ctcacaccgt cctgttgacc gctctgcggt tgttcgtctc cgcactcctg 180 atcggcatcg ctgccctggc tctgttggag catcatcatg atgaacatgg cgagcagctg 240 atccagctgc tgctcggagt cagccgaagg cgagcgctga ctggagttct gggtttgctg 300 gggcccgatg cccatcgtct gcaggttgat gaagttggaa aatttgtttc cgatagatga 360 gtccat 366 <210> 28 <211> 121 <212> PRT <213> Xanthomonas campestris pv. campestris <400> 28 Met Asp Ser Ser Ile Gly Asn Lys Phe Ser Asn Phe Ile Asn Leu Gln 1 5 10 15 Thr Met Gly Ile Gly Pro Gln Gln Thr Gln Asn Ser Ser Gln Arg Ser 20 25 30 Pro Ser Ala Asp Ser Glu Gln Gln Leu Asp Gln Leu Leu Ala Met Phe 35 40 45 Ile Met Met Met Leu Gln Gln Ser Gln Gly Ser Asp Ala Asp Gln Glu 50 55 60 Cys Gly Asp Glu Gln Pro Gln Ser Gly Gln Gln Asp Gly Val Ser Pro 65 70 75 80 Leu Thr Gln Met Leu Met Gln Ile Val Met Gln Leu Met Gln Asn Gln 85 90 95 Gly Gly Ala Gly Met Gly Gly Thr Ser Leu Gly Gly Gly Phe Asn Ala 100 105 110 Asn Leu Ser Ser Ile Thr Gly Gln Ala 115 120 <210> 29 <211> 3282 <212> DNA <213> Synechocystis sp. <400> 29 tgttcgttgc acaaattgat gagcaatgct tttttataat gccaactttg tacaaaaaag 60 caggcttaaa caatggcgac tatccacggt aattggcaac cctcccacgg ggaaaacggc 120 ggcaaactgt ttctttgggc ggatacctgg ggtcatcctt tgccagaaac cattggcgat 180 cgccatccct ttgcgttgga tctgccggat ttgctacagg cctggtcgaa tttgcccctg 240 gccttcccca aggcggatgg ggtgacagag gcagccctta ctctgcattt acccagccat 300 cgccagcaaa aaattcccct accctttgtc acagggcaag atccggtggc catggatgcg 360 aaatatctcc actggcgatc gtggcaggta accggggtaa atctgacccc aagccaaacg 420 ttaacgttgc tccaatctat tcccctgggg ggccaagcct tagctaactt aggatcagag 480 ttttactttt acggtcaact gcaccgctgg tgtttagatt tggtgctacg gggtaaattt 540 gtgccgggac tggagcaaag gggggaagac ggtaattact atgcccaatg gattcctatc 600 ctcgatagca tccaagacca aacccattta gcccaattta gccagagagt acctgcctgc 660 gccctggcca acctgactga ctcccaggag ccccaaatgt tggtggtgga tttactacaa 720 aaattattgc aagcccaaat tggtgccgtc agtcccagcc tagccaacgt taaagaagtc 780 tggttgaatg attggctccg gggattaacc catggggggc aaacctccct cggcacaagc 840 aaagctctac aacgattagc cacatcctta gaccattggt atttaccagt ccagaattat 900 ttgggccaaa aaaataacca agctttagcc caacggcaat ggcggggggc tctgcggtta 960 caacctccag cggacgatgg ggggggaacc tggcaactgg attatggttt acaagccctg 1020 gatgacgggg aattttggct cccggcggct tccctctggg ccatggccgg cgatcgcctg 1080 gtgtggcagg gaaggagggt tgaccagggg gcggaaagtt tactgcgggg cttaggggta 1140 gctgcccaaa tttacgaacc cattgctgca agtttgacgg aaaggtgtcc cacgggctgt 1200 gggctagatg ccatccaagc ctacgaattt atcctggcaa tcgcccatca attgcgggat 1260 cgggggttag gggtaatcct cccgccgggg ttagaacggg gcggcaccgc caaacggtta 1320 ggggtaaaag tggtggggga agtgcaacgg caaaggggcc agcggctaac tctgcaaagt 1380 ttaattaatt acgacttgca actaatgatg gggagcgggg acaatgcccg gttattgacg 1440 gccaaggact ttgaagcgtt actagcccaa aaatctcccc tggtggtgct ggacggagaa 1500 tggattaccc tgcaaccggc ggacgtgcgg gcggccaagg tcattttaca gcagcaacaa 1560 tctgccccgc ccctcacagt ggaggatgct ctgcgcctca gcattggtga tttacaaacc 1620 gtctctaaac tgccggtgac ccagtttgct gctcggggca tattacagga attgatcgac 1680 accctccgta acccggaagg agtgaaagcc attgctgacc caccgggctt tcagggtact 1740 ttacggccct accaagctcg gggagtgggc tggttagctt ttctggaacg gtgggggctg 1800 ggggcctgtt tggcagacga tatgggtttg ggaaaaacac cccagttgct ggcttttctg 1860 ctccatttag ccgcggagga tatgttagtt aagccggtgt tgattgtttg tcctacgtcg 1920 gtgctgagca attggggtca tgaaattaat aagtttgcgc cccaacttaa aaccctattg 1980 caccatggcg atcgccggaa aaaagggcaa ccgttggtta aacaggtcaa agaccagcaa 2040 attgtcctca ccagttacgc tttactgcaa cgggatttta gtagtttgaa attggtggac 2100 tggcagggga tcgtgctgga cgaagcccaa aatatcaaaa atccccaagc taaacagtcc 2160 caggcggccc ggcaattgcc agcgggtttt cgcattgccc tcacggggac tccggtggaa 2220 aatcgcctga cggaattgtg gtcaatttta gaatttttaa atcccggttt cctgggtaat 2280 cagagctttt tccaacggcg ctttgccaat cccatcgaaa aatttggcga tcgccagtcg 2340 ttgttaattt tgcggaattt agtgcggccg tttattttgc ggcggttaaa aaccgaccaa 2400 accattattc aagatttacc agaaaaacaa gaaatgaccg tcttctgtga cctttcccaa 2460 gagcaagctg gtttatatca acaattggtg gaggaatccc tccaggcgat cgccgacagc 2520 gaaggcattc aaaggcacgg tttagtttta accctattaa ccaaactcaa acaggtttgt 2580 aaccatcccg atctattgct gaaaaagccc gccatcaccc acgggcacca gtccggcaag 2640 ctaattcgtc tggcggaaat gctggaagaa atcatcagcg aaggcgatcg ggtgttaatt 2700 ttcacccaat ttgccagttg gggtcattta ctcaaaccct atctggaaaa atactttaac 2760 caagaggtgc tctatctcca cgggggcact ccagcagagc aacggcaagc tctggtggaa 2820 cgattccaac aggaccccaa cagtccctat ttatttatcc tttctctcaa ggctggcggc 2880 acagggttga acctcacgag ggctaaccat gtgttccatg tggaccggtg gtggaatccg 2940 gcggtggaaa atcaggctac cgatcgtgct tttcgcattg gccaaactcg caacgtccag 3000 gtgcacaaat ttgtctgtac aggcaccttg gaagaaaaaa ttaacgccat gatggcggat 3060 aaacaacaat tggcagaaca aaccgtggat gccggggaaa attggctcac ccgcctagac 3120 accgataaac tccgtcagtt gcttaccctc tccgccaccc cggtggatta ccaagccgaa 3180 gcgtccgatt gaacccagct ttcttgtaca aagttggcat gataagaaag cattgcttat 3240 caatttgttg caacgaacag gtcactatca gtcaaaataa at 3282 <210> 30 <211> 1039 <212> PRT <213> Synechocystis sp. <400> 30 Met Ala Thr Ile His Gly Asn Trp Gln Pro Ser His Gly Glu Asn Gly 1 5 10 15 Gly Lys Leu Phe Leu Trp Ala Asp Thr Trp Gly His Pro Leu Pro Glu 20 25 30 Thr Ile Gly Asp Arg His Pro Phe Ala Leu Asp Leu Pro Asp Leu Leu 35 40 45 Gln Ala Trp Ser Asn Leu Pro Leu Ala Phe Pro Lys Ala Asp Gly Val 50 55 60 Thr Glu Ala Ala Leu Thr Leu His Leu Pro Ser His Arg Gln Gln Lys 65 70 75 80 Ile Pro Leu Pro Phe Val Thr Gly Gln Asp Pro Val Ala Met Asp Ala 85 90 95 Lys Tyr Leu His Trp Arg Ser Trp Gln Val Thr Gly Val Asn Leu Thr 100 105 110 Pro Ser Gln Thr Leu Thr Leu Leu Gln Ser Ile Pro Leu Gly Gly Gln 115 120 125 Ala Leu Ala Asn Leu Gly Ser Glu Phe Tyr Phe Tyr Gly Gln Leu His 130 135 140 Arg Trp Cys Leu Asp Leu Val Leu Arg Gly Lys Phe Val Pro Gly Leu 145 150 155 160 Glu Gln Arg Gly Glu Asp Gly Asn Tyr Tyr Ala Gln Trp Ile Pro Ile 165 170 175 Leu Asp Ser Ile Gln Asp Gln Thr His Leu Ala Gln Phe Ser Gln Arg 180 185 190 Val Pro Ala Cys Ala Leu Ala Asn Leu Thr Asp Ser Gln Glu Pro Gln 195 200 205 Met Leu Val Val Asp Leu Leu Gln Lys Leu Leu Gln Ala Gln Ile Gly 210 215 220 Ala Val Ser Pro Ser Leu Ala Asn Val Lys Glu Val Trp Leu Asn Asp 225 230 235 240 Trp Leu Arg Gly Leu Thr His Gly Gly Gln Thr Ser Leu Gly Thr Ser 245 250 255 Lys Ala Leu Gln Arg Leu Ala Thr Ser Leu Asp His Trp Tyr Leu Pro 260 265 270 Val Gln Asn Tyr Leu Gly Gln Lys Asn Asn Gln Ala Leu Ala Gln Arg 275 280 285 Gln Trp Arg Gly Ala Leu Arg Leu Gln Pro Pro Ala Asp Asp Gly Gly 290 295 300 Gly Thr Trp Gln Leu Asp Tyr Gly Leu Gln Ala Leu Asp Asp Gly Glu 305 310 315 320 Phe Trp Leu Pro Ala Ala Ser Leu Trp Ala Met Ala Gly Asp Arg Leu 325 330 335 Val Trp Gln Gly Arg Arg Val Asp Gln Gly Ala Glu Ser Leu Leu Arg 340 345 350 Gly Leu Gly Val Ala Ala Gln Ile Tyr Glu Pro Ile Ala Ala Ser Leu 355 360 365 Thr Glu Arg Cys Pro Thr Gly Cys Gly Leu Asp Ala Ile Gln Ala Tyr 370 375 380 Glu Phe Ile Leu Ala Ile Ala His Gln Leu Arg Asp Arg Gly Leu Gly 385 390 395 400 Val Ile Leu Pro Pro Gly Leu Glu Arg Gly Gly Thr Ala Lys Arg Leu 405 410 415 Gly Val Lys Val Val Gly Glu Val Gln Arg Gln Arg Gly Gln Arg Leu 420 425 430 Thr Leu Gln Ser Leu Ile Asn Tyr Asp Leu Gln Leu Met Met Gly Ser 435 440 445 Gly Asp Asn Ala Arg Leu Leu Thr Ala Lys Asp Phe Glu Ala Leu Leu 450 455 460 Ala Gln Lys Ser Pro Leu Val Val Leu Asp Gly Glu Trp Ile Thr Leu 465 470 475 480 Gln Pro Ala Asp Val Arg Ala Ala Lys Val Ile Leu Gln Gln Gln Gln 485 490 495 Ser Ala Pro Pro Leu Thr Val Glu Asp Ala Leu Arg Leu Ser Ile Gly 500 505 510 Asp Leu Gln Thr Val Ser Lys Leu Pro Val Thr Gln Phe Ala Ala Arg 515 520 525 Gly Ile Leu Gln Glu Leu Ile Asp Thr Leu Arg Asn Pro Glu Gly Val 530 535 540 Lys Ala Ile Ala Asp Pro Pro Gly Phe Gln Gly Thr Leu Arg Pro Tyr 545 550 555 560 Gln Ala Arg Gly Val Gly Trp Leu Ala Phe Leu Glu Arg Trp Gly Leu 565 570 575 Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Leu 580 585 590 Leu Ala Phe Leu Leu His Leu Ala Ala Glu Asp Met Leu Val Lys Pro 595 600 605 Val Leu Ile Val Cys Pro Thr Ser Val Leu Ser Asn Trp Gly His Glu 610 615 620 Ile Asn Lys Phe Ala Pro Gln Leu Lys Thr Leu Leu His His Gly Asp 625 630 635 640 Arg Arg Lys Lys Gly Gln Pro Leu Val Lys Gln Val Lys Asp Gln Gln 645 650 655 Ile Val Leu Thr Ser Tyr Ala Leu Leu Gln Arg Asp Phe Ser Ser Leu 660 665 670 Lys Leu Val Asp Trp Gln Gly Ile Val Leu Asp Glu Ala Gln Asn Ile 675 680 685 Lys Asn Pro Gln Ala Lys Gln Ser Gln Ala Ala Arg Gln Leu Pro Ala 690 695 700 Gly Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Thr 705 710 715 720 Glu Leu Trp Ser Ile Leu Glu Phe Leu Asn Pro Gly Phe Leu Gly Asn 725 730 735 Gln Ser Phe Phe Gln Arg Arg Phe Ala Asn Pro Ile Glu Lys Phe Gly 740 745 750 Asp Arg Gln Ser Leu Leu Ile Leu Arg Asn Leu Val Arg Pro Phe Ile 755 760 765 Leu Arg Arg Leu Lys Thr Asp Gln Thr Ile Ile Gln Asp Leu Pro Glu 770 775 780 Lys Gln Glu Met Thr Val Phe Cys Asp Leu Ser Gln Glu Gln Ala Gly 785 790 795 800 Leu Tyr Gln Gln Leu Val Glu Glu Ser Leu Gln Ala Ile Ala Asp Ser 805 810 815 Glu Gly Ile Gln Arg His Gly Leu Val Leu Thr Leu Leu Thr Lys Leu 820 825 830 Lys Gln Val Cys Asn His Pro Asp Leu Leu Leu Lys Lys Pro Ala Ile 835 840 845 Thr His Gly His Gln Ser Gly Lys Leu Ile Arg Leu Ala Glu Met Leu 850 855 860 Glu Glu Ile Ile Ser Glu Gly Asp Arg Val Leu Ile Phe Thr Gln Phe 865 870 875 880 Ala Ser Trp Gly His Leu Leu Lys Pro Tyr Leu Glu Lys Tyr Phe Asn 885 890 895 Gln Glu Val Leu Tyr Leu His Gly Gly Thr Pro Ala Glu Gln Arg Gln 900 905 910 Ala Leu Val Glu Arg Phe Gln Gln Asp Pro Asn Ser Pro Tyr Leu Phe 915 920 925 Ile Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Arg Ala 930 935 940 Asn His Val Phe His Val Asp Arg Trp Trp Asn Pro Ala Val Glu Asn 945 950 955 960 Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln Thr Arg Asn Val Gln 965 970 975 Val His Lys Phe Val Cys Thr Gly Thr Leu Glu Glu Lys Ile Asn Ala 980 985 990 Met Met Ala Asp Lys Gln Gln Leu Ala Glu Gln Thr Val Asp Ala Gly 995 1000 1005 Glu Asn Trp Leu Thr Arg Leu Asp Thr Asp Lys Leu Arg Gln Leu 1010 1015 1020 Leu Thr Leu Ser Ala Thr Pro Val Asp Tyr Gln Ala Glu Ala Ser 1025 1030 1035 Asp <210> 31 <211> 3237 <212> DNA <213> Anaebena variabilis <400> 31 atggcaattt tacacggtag ttggatatta agtgagcagg atagttattt atttatttgg 60 ggggaaactt ggcgatcgcc acaagtaaat tttagttttg aggaaatagc cctcaatccc 120 ttggctctgt ctgcatctga attaagcgag tggttgcagt ctcaacatca ggcgatcgct 180 cagattttac cacaacagtt ggcaaaaaaa acctccaaag cagcaagttc cccaacaaca 240 aatttaccaa ttcactcgca aataattgtt ctgccaacgg aaatttctca acctcgtaag 300 aaagaaacaa ttttcatttc tcctgtgcat tctgccgctt tagaatctga tgcagactct 360 gaagtttatt tacaaccttg gcgtgtagaa ggtttttgtc ttcctcctag tgcagcagtt 420 aaatttctaa cttctttacc tttaaatatc actagcacag agaatgcttt tttaggtgga 480 gatttacgtt tttggtcaca aattgcccgt tggagtttag atttaatttc taggtctaag 540 tttctcccaa ttatccaacg acaacctaat aattctgtaa gtgccaaatg gcaagtactg 600 ttagatagtg ctgtagatgg aactcgttta gaaaagttcg ccgcgaagat gcctttggtt 660 tgtcggactt atcagagatt agggaacgag gaattatctc catctcctat atatatagat 720 tttcctagtc agccgcagga attaatattg ggttttctca atagtgcaat agatacgcaa 780 ttacgggaaa tggtggggaa tcagcctgtg gtggaaactc gcttgatggc atctttaccg 840 tcggcggtac gacagtggct gcaagggtta agtggtgcat ctaattcagt tgatgcagat 900 gcagttggtt tggaaaggct ggaagcagcg ctcaaggctt ggacgatgcc gctacaatat 960 caactagcaa gtaaaaatca atttcgcacc tgttttgaat tacgttctcc agaaccagga 1020 gaaactgaat ggacactagc ctatttcctg caagcagccg ataatccaga atttctagta 1080 gatgcgggca ctatttggca acatcctgtt gaacagctaa tttatcaaca gcgatcgatt 1140 caagaacccc aggaaacatt tttacgaggt ttggggttag cttctcgatt gtatccggtc 1200 attgccccca ctttagatac agaatcaccg caattttgtc atctcaaccc catgcaggct 1260 tatgaattta tcaaggctgt ggcttggcga tttgaagata gcggtttagg ggtgatttta 1320 cctcctagtt tggcgaaccg ggaaggctgg gcaaaccgct tgggattgaa aatctccgcc 1380 gaaaccccaa agaaaaagcc aggacgcttg ggattgcaga gtttgcttaa ttttcaatgg 1440 cacttagcaa ttggtgggca aactatttct aaaggggaat ttgacagact agtagcttta 1500 aaaagcccat tggtagaaat aaatggcgaa tgggtggagt tgcgtcccca agatatcaag 1560 acagccgaag ccttttttgc tgcacgtaaa gaccaaatgg ccttatcttt agaagatgct 1620 ttacgtctga gtagtgggga tactcaagta attgagaaat taccagtagt cagctttgaa 1680 gcctctggcg cattacaaga attaattggg gcgctgacaa ataatcaagc agttgcacca 1740 ttacctacgc caaagaactt ccaaggaaag ttgcgtcctt atcaagaaag gggtgcggct 1800 tggttggcat tcctcgaacg ctggggttta ggtgcttgtc tcgccgacga catgggactg 1860 ggaaaaacga tacagttcat tgctttcctt ctccatctta aagaacagga tgtattagaa 1920 aaaccaactt tactagtgtg tcctacttct gttttaggta actgggaacg agaagtgaaa 1980 aaatttgcac ctacacttaa agttctccaa tatcatggtg ataaacgtcc taaaggtaaa 2040 gcttttccag aagcagtaaa aaatcatgat ttagttatca ccagttactc actaattcat 2100 agagacatca aatcattgca gggtctttct tggcagataa ttgttttaga tgaagcccag 2160 aatgtgaaga atgcggaagc caaacaatca caagcagtcc gacaattaga cacaaccttt 2220 cgcattgctt taacggggac accagtcgaa aatagactac aggaactttg gtcaatttta 2280 gatttcctca accctggtta tttaggtaat aagcaattct tccaaagacg ctttgccatg 2340 ccaattgaaa agtatggtga tgcagcatct ttaaatcaat tgcgtgcctt agtacaacca 2400 tttattctgc gtcgcctgaa aacagaccgt gatattattc aagacttgcc agataagcaa 2460 gaaatgacag tattttgcgg tttgactgga gaacaagctg cactttatca aaaagtggta 2520 gaaacatctt tagcagaaat tgaatcggcc gaaggattgc aacgccgagg gatgatttta 2580 gctttattaa ttaaactcaa acaaatctgc aatcatccag cccaatatct gaaaacaaat 2640 accttagaac aatacagttc aggaaaactg caacgattag aagaaatgtt agaagaggtg 2700 ttagcggaga gtaatactta tggtgttgct ggtgcgggac gtgctttaat cttcacccag 2760 tttgcagaat ggggtaagtt actcaaacca catttagaaa aacaactagg gcgggaagta 2820 tttttcttat atggtagtac cagtaaaaag caacgtgaag aaatgattga ccgttttcaa 2880 cacgaccctc aggggccacc aattatgatt ctctctctca aagcaggtgg tgtagggttg 2940 aacttaacca gagcaaatca tgtatttcac tttgatagat ggtggaatcc agccgtagag 3000 aaccaagcca cagaccgcgt atttcgtatt ggtcaaaccc gcaatgtaca ggtgcataaa 3060 tttgtttgca atggtacctt agaagaaaaa atccacgaca tgattgaaag taaaaaacaa 3120 ctagcggaac aggttgttgg tgcaggcgaa gagtggttaa ctgaattaga tacagatcaa 3180 ctccgcaact tactgatact tgatcgtagt gcagtaattg atgaagaagc agagtaa 3237 <210> 32 <211> 1078 <212> PRT <213> Anaebena variabilis <400> 32 Met Ala Ile Leu His Gly Ser Trp Ile Leu Ser Glu Gln Asp Ser Tyr 1 5 10 15 Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Pro Gln Val Asn Phe Ser 20 25 30 Phe Glu Glu Ile Ala Leu Asn Pro Leu Ala Leu Ser Ala Ser Glu Leu 35 40 45 Ser Glu Trp Leu Gln Ser Gln His Gln Ala Ile Ala Gln Ile Leu Pro 50 55 60 Gln Gln Leu Ala Lys Lys Thr Ser Lys Ala Ala Ser Ser Pro Thr Thr 65 70 75 80 Asn Leu Pro Ile His Ser Gln Ile Ile Val Leu Pro Thr Glu Ile Ser 85 90 95 Gln Pro Arg Lys Lys Glu Thr Ile Phe Ile Ser Pro Val His Ser Ala 100 105 110 Ala Leu Glu Ser Asp Ala Asp Ser Glu Val Tyr Leu Gln Pro Trp Arg 115 120 125 Val Glu Gly Phe Cys Leu Pro Pro Ser Ala Ala Val Lys Phe Leu Thr 130 135 140 Ser Leu Pro Leu Asn Ile Thr Ser Thr Glu Asn Ala Phe Leu Gly Gly 145 150 155 160 Asp Leu Arg Phe Trp Ser Gln Ile Ala Arg Trp Ser Leu Asp Leu Ile 165 170 175 Ser Arg Ser Lys Phe Leu Pro Ile Ile Gln Arg Gln Pro Asn Asn Ser 180 185 190 Val Ser Ala Lys Trp Gln Val Leu Leu Asp Ser Ala Val Asp Gly Thr 195 200 205 Arg Leu Glu Lys Phe Ala Ala Lys Met Pro Leu Val Cys Arg Thr Tyr 210 215 220 Gln Arg Leu Gly Asn Glu Glu Leu Ser Pro Ser Pro Ile Tyr Ile Asp 225 230 235 240 Phe Pro Ser Gln Pro Gln Glu Leu Ile Leu Gly Phe Leu Asn Ser Ala 245 250 255 Ile Asp Thr Gln Leu Arg Glu Met Val Gly Asn Gln Pro Val Val Glu 260 265 270 Thr Arg Leu Met Ala Ser Leu Pro Ser Ala Val Arg Gln Trp Leu Gln 275 280 285 Gly Leu Ser Gly Ala Ser Asn Ser Val Asp Ala Asp Ala Val Gly Leu 290 295 300 Glu Arg Leu Glu Ala Ala Leu Lys Ala Trp Thr Met Pro Leu Gln Tyr 305 310 315 320 Gln Leu Ala Ser Lys Asn Gln Phe Arg Thr Cys Phe Glu Leu Arg Ser 325 330 335 Pro Glu Pro Gly Glu Thr Glu Trp Thr Leu Ala Tyr Phe Leu Gln Ala 340 345 350 Ala Asp Asn Pro Glu Phe Leu Val Asp Ala Gly Thr Ile Trp Gln His 355 360 365 Pro Val Glu Gln Leu Ile Tyr Gln Gln Arg Ser Ile Gln Glu Pro Gln 370 375 380 Glu Thr Phe Leu Arg Gly Leu Gly Leu Ala Ser Arg Leu Tyr Pro Val 385 390 395 400 Ile Ala Pro Thr Leu Asp Thr Glu Ser Pro Gln Phe Cys His Leu Asn 405 410 415 Pro Met Gln Ala Tyr Glu Phe Ile Lys Ala Val Ala Trp Arg Phe Glu 420 425 430 Asp Ser Gly Leu Gly Val Ile Leu Pro Pro Ser Leu Ala Asn Arg Glu 435 440 445 Gly Trp Ala Asn Arg Leu Gly Leu Lys Ile Ser Ala Glu Thr Pro Lys 450 455 460 Lys Lys Pro Gly Arg Leu Gly Leu Gln Ser Leu Leu Asn Phe Gln Trp 465 470 475 480 His Leu Ala Ile Gly Gly Gln Thr Ile Ser Lys Gly Glu Phe Asp Arg 485 490 495 Leu Val Ala Leu Lys Ser Pro Leu Val Glu Ile Asn Gly Glu Trp Val 500 505 510 Glu Leu Arg Pro Gln Asp Ile Lys Thr Ala Glu Ala Phe Phe Ala Ala 515 520 525 Arg Lys Asp Gln Met Ala Leu Ser Leu Glu Asp Ala Leu Arg Leu Ser 530 535 540 Ser Gly Asp Thr Gln Val Ile Glu Lys Leu Pro Val Val Ser Phe Glu 545 550 555 560 Ala Ser Gly Ala Leu Gln Glu Leu Ile Gly Ala Leu Thr Asn Asn Gln 565 570 575 Ala Val Ala Pro Leu Pro Thr Pro Lys Asn Phe Gln Gly Lys Leu Arg 580 585 590 Pro Tyr Gln Glu Arg Gly Ala Ala Trp Leu Ala Phe Leu Glu Arg Trp 595 600 605 Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile 610 615 620 Gln Phe Ile Ala Phe Leu Leu His Leu Lys Glu Gln Asp Val Leu Glu 625 630 635 640 Lys Pro Thr Leu Leu Val Cys Pro Thr Ser Val Leu Gly Asn Trp Glu 645 650 655 Arg Glu Val Lys Lys Phe Ala Pro Thr Leu Lys Val Leu Gln Tyr His 660 665 670 Gly Asp Lys Arg Pro Lys Gly Lys Ala Phe Pro Glu Ala Val Lys Asn 675 680 685 His Asp Leu Val Ile Thr Ser Tyr Ser Leu Ile His Arg Asp Ile Lys 690 695 700 Ser Leu Gln Gly Leu Ser Trp Gln Ile Ile Val Leu Asp Glu Ala Gln 705 710 715 720 Asn Val Lys Asn Ala Glu Ala Lys Gln Ser Gln Ala Val Arg Gln Leu 725 730 735 Asp Thr Thr Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg 740 745 750 Leu Gln Glu Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr Leu 755 760 765 Gly Asn Lys Gln Phe Phe Gln Arg Arg Phe Ala Met Pro Ile Glu Lys 770 775 780 Tyr Gly Asp Ala Ala Ser Leu Asn Gln Leu Arg Ala Leu Val Gln Pro 785 790 795 800 Phe Ile Leu Arg Arg Leu Lys Thr Asp Arg Asp Ile Ile Gln Asp Leu 805 810 815 Pro Asp Lys Gln Glu Met Thr Val Phe Cys Gly Leu Thr Gly Glu Gln 820 825 830 Ala Ala Leu Tyr Gln Lys Val Val Glu Thr Ser Leu Ala Glu Ile Glu 835 840 845 Ser Ala Glu Gly Leu Gln Arg Arg Gly Met Ile Leu Ala Leu Leu Ile 850 855 860 Lys Leu Lys Gln Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Thr Asn 865 870 875 880 Thr Leu Glu Gln Tyr Ser Ser Gly Lys Leu Gln Arg Leu Glu Glu Met 885 890 895 Leu Glu Glu Val Leu Ala Glu Ser Asn Thr Tyr Gly Val Ala Gly Ala 900 905 910 Gly Arg Ala Leu Ile Phe Thr Gln Phe Ala Glu Trp Gly Lys Leu Leu 915 920 925 Lys Pro His Leu Glu Lys Gln Leu Gly Arg Glu Val Phe Phe Leu Tyr 930 935 940 Gly Ser Thr Ser Lys Lys Gln Arg Glu Glu Met Ile Asp Arg Phe Gln 945 950 955 960 His Asp Pro Gln Gly Pro Pro Ile Met Ile Leu Ser Leu Lys Ala Gly 965 970 975 Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His Val Phe His Phe Asp 980 985 990 Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Val Phe 995 1000 1005 Arg Ile Gly Gln Thr Arg Asn Val Gln Val His Lys Phe Val Cys 1010 1015 1020 Asn Gly Thr Leu Glu Glu Lys Ile His Asp Met Ile Glu Ser Lys 1025 1030 1035 Lys Gln Leu Ala Glu Gln Val Val Gly Ala Gly Glu Glu Trp Leu 1040 1045 1050 Thr Glu Leu Asp Thr Asp Gln Leu Arg Asn Leu Leu Ile Leu Asp 1055 1060 1065 Arg Ser Ala Val Ile Asp Glu Glu Ala Glu 1070 1075 <210> 33 <211> 3129 <212> DNA <213> uncultured methanogenic archaeon <400> 33 atgattacac ttcacggaac ctggactact gtcgatcccc tgaatggcac atttttcctc 60 tggggagaga gtgatccggc cacgcagcat aaaagaagag gcaggcctcg gaaaagtgca 120 ggggagaaac agcacccgtt tcacgccggc atcaaagagc tggaagctgg agcgggggct 180 atcaattcat cgtgtataag acatatagca gatgcgggag cacgggcgga gcaggtttta 240 attttgccgt cagctacgga caggcccctg agatctgcga gcccttcagc actggagtca 300 ggtgaagaaa ccaaccctga cagcagttta caatttcttc cgtggacggt gaccggcatc 360 aacattaagc ccgggaatgc tctggtactt ctatcctcta tagccgaatc acaaaagcgg 420 atcggagata tggcgatagg cccagacctg ctttactgga gtaaggtagc caagtttacg 480 cttaagctcc tgataagcca gcagttcagg ccggaggttg tcgaagtaat gagcggaaaa 540 gcatatagcc gttggagatt tgcgctcacc gatgaaactg accggaaaca ctatgcctcg 600 ctcgaaaact ccatgccgct ggcatgtatt gcggtttcag gaaaggctgg catttataat 660 cgaaaagaag ccttagattt gttcattaat accgcccttg acacatttat ccgggaccag 720 attgccctgc ccgctgacag caggatgacg aacctgctat cgcaagcatg gctagattcg 780 ctcggcaccg gagagagtat ccgcctgtcg gctcctgaga tgaagaaact caaagattcg 840 gcaggccgct ggacatcccg catgaaaaca gagagcaaac aagctttaaa gacctgcttc 900 atcctggagc cgccagcccc ggatacagag tatcctgaag cgccgtggaa cctacggtac 960 tgcttgcagg catccgatga ccccagtctg gtaattccgg ctgagactgt gtggaaagag 1020 ttgaagaaga cgctgaagta cctgaataag agatacgata accctcagga gcaattgtta 1080 caggatctcg gaaaagcgat gcagatgttt cccgaaatcg agcccagcct caacacgtca 1140 aaacctctgt ccgcaacgct gagcaccagt gaagcctaca agttcctgac agaagcggcg 1200 cctctgctgc aggacagcgg gtatagcatt atcctaccgg aatggtggcg caacagcact 1260 ggcaggctca agctcggcgc caggcttcgc ttcaagccga aagccgaagg taaagcgggt 1320 aaaagccagt tcaccatgga taccctcgtc agctacgact ggcgcctggc gctgggcgat 1380 caggagatca ccgaaacaga gttcaggaag ctggcagccc tgaaagagcc gcttctgcag 1440 ataggcggga aatggtttgc gctgaaaaag gaagacatag acagcatcat gaaagcattc 1500 agggcgaaga agactggaga gatggcttta tcggaggcac tgcgcctcaa cggcgggctg 1560 gaagacttca acggcatccc cgtcagcggc atgaaatcgt caggatggct ggcagaactt 1620 ttcgacaggc tggcagccgg cgaaaaaata acgagccttg ccccgccgga cggtttcaac 1680 ggggagctta gagattacca ggttaaaggc tactcctggc tggccttcat gaaaaagtat 1740 ggcctgggct ccattctggc tgacgacatg ggcctgggta agacgataca gctgctggcg 1800 ttgctcctga aagagaagga aagaggcact aaaggcccta ctctgttgat ctgccccacc 1860 tcgattctcg gaaactggca gcgggaggcg aagaaatttg ccccggccct gaaagtccac 1920 atacaccatg gggcaggaag ggctgataaa gagcagttcg gaaaaatcgt caaggctcac 1980 gacctgatcc tgagcactta cgctcacgcc taccgggacg aggaactgct taaagaggtg 2040 aactggaagc tggtagtgct cgacgaggct cagaatatca agaatcatca tacccggcag 2100 gccagagcta tccgggctct taaggccgat caccgaatag ccatgacggg aacgccgata 2160 gagaacagac tctcggagct gtggtcgatc gtggacttcc tgaaccccgg ctacctgggc 2220 aaggcggaga cattcaggaa acaattcgcc atacctatcg agagatacga tgacgctgcc 2280 cggtcggaaa aattgaagca ggccatcaag cccctggtgc tgcgcagagt gaagacggat 2340 ccggccatca tcaaagacct gccggacaag atcgagatca aggagccctg caacctcacc 2400 aaagaacagg ccacgctcta cgaggccatc gtagagaaca tgctgaaaag tatagataag 2460 gccacggcaa tgcagagacg gggaatcgtc ttagcgtccc tgatgaagct caaacaggtc 2520 tgcgatcacc cgtcgctgta catcaaaacg ggcgctgtga ccgacgataa gacgctgatc 2580 aggtctggca agctgaagcg cctcacggag ctgctcgaag aagcgctggc cgaaggcgac 2640 agcgtgctga tcttcaccca gttcgtggaa atgggggaga tgctgaaagc ctacctgcag 2700 agcacgttcg acgaagaagc cctctttttg cacggcggag taccgcagaa ggccagagac 2760 aagatggtcc tccgtttcgg ggaaaaggac gggccacgga tctttatcgt ctcgctgaaa 2820 gccggcggcg tcggcctcaa cctgacgaag gcaagccacg tgttccactt cgatcgctgg 2880 tggaacccgg cggtcgagaa ccaggcgaca gatcgagctt acaggatagg ccagagcaaa 2940 aatgtactgg tccataaatt cgtctgcgcc ggcacgctgg aagaaaagat cgacgagctg 3000 atcgagagca aaaaggcgct gtcggcgaac atcctcggca cgggagaaga ctggatcacg 3060 gagttgtcga ccgaacagct gagggacatg gtcatgctga gatgggacga ggtagccgat 3120 gatggctaa 3129 <210> 34 <211> 1042 <212> PRT <213> uncultured methanogenic archaeon <400> 34 Met Ile Thr Leu His Gly Thr Trp Thr Thr Val Asp Pro Leu Asn Gly 1 5 10 15 Thr Phe Phe Leu Trp Gly Glu Ser Asp Pro Ala Thr Gln His Lys Arg 20 25 30 Arg Gly Arg Pro Arg Lys Ser Ala Gly Glu Lys Gln His Pro Phe His 35 40 45 Ala Gly Ile Lys Glu Leu Glu Ala Gly Ala Gly Ala Ile Asn Ser Ser 50 55 60 Cys Ile Arg His Ile Ala Asp Ala Gly Ala Arg Ala Glu Gln Val Leu 65 70 75 80 Ile Leu Pro Ser Ala Thr Asp Arg Pro Leu Arg Ser Ala Ser Pro Ser 85 90 95 Ala Leu Glu Ser Gly Glu Glu Thr Asn Pro Asp Ser Ser Leu Gln Phe 100 105 110 Leu Pro Trp Thr Val Thr Gly Ile Asn Ile Lys Pro Gly Asn Ala Leu 115 120 125 Val Leu Leu Ser Ser Ile Ala Glu Ser Gln Lys Arg Ile Gly Asp Met 130 135 140 Ala Ile Gly Pro Asp Leu Leu Tyr Trp Ser Lys Val Ala Lys Phe Thr 145 150 155 160 Leu Lys Leu Leu Ile Ser Gln Gln Phe Arg Pro Glu Val Val Glu Val 165 170 175 Met Ser Gly Lys Ala Tyr Ser Arg Trp Arg Phe Ala Leu Thr Asp Glu 180 185 190 Thr Asp Arg Lys His Tyr Ala Ser Leu Glu Asn Ser Met Pro Leu Ala 195 200 205 Cys Ile Ala Val Ser Gly Lys Ala Gly Ile Tyr Asn Arg Lys Glu Ala 210 215 220 Leu Asp Leu Phe Ile Asn Thr Ala Leu Asp Thr Phe Ile Arg Asp Gln 225 230 235 240 Ile Ala Leu Pro Ala Asp Ser Arg Met Thr Asn Leu Leu Ser Gln Ala 245 250 255 Trp Leu Asp Ser Leu Gly Thr Gly Glu Ser Ile Arg Leu Ser Ala Pro 260 265 270 Glu Met Lys Lys Leu Lys Asp Ser Ala Gly Arg Trp Thr Ser Arg Met 275 280 285 Lys Thr Glu Ser Lys Gln Ala Leu Lys Thr Cys Phe Ile Leu Glu Pro 290 295 300 Pro Ala Pro Asp Thr Glu Tyr Pro Glu Ala Pro Trp Asn Leu Arg Tyr 305 310 315 320 Cys Leu Gln Ala Ser Asp Asp Pro Ser Leu Val Ile Pro Ala Glu Thr 325 330 335 Val Trp Lys Glu Leu Lys Lys Thr Leu Lys Tyr Leu Asn Lys Arg Tyr 340 345 350 Asp Asn Pro Gln Glu Gln Leu Leu Gln Asp Leu Gly Lys Ala Met Gln 355 360 365 Met Phe Pro Glu Ile Glu Pro Ser Leu Asn Thr Ser Lys Pro Leu Ser 370 375 380 Ala Thr Leu Ser Thr Ser Glu Ala Tyr Lys Phe Leu Thr Glu Ala Ala 385 390 395 400 Pro Leu Leu Gln Asp Ser Gly Tyr Ser Ile Ile Leu Pro Glu Trp Trp 405 410 415 Arg Asn Ser Thr Gly Arg Leu Lys Leu Gly Ala Arg Leu Arg Phe Lys 420 425 430 Pro Lys Ala Glu Gly Lys Ala Gly Lys Ser Gln Phe Thr Met Asp Thr 435 440 445 Leu Val Ser Tyr Asp Trp Arg Leu Ala Leu Gly Asp Gln Glu Ile Thr 450 455 460 Glu Thr Glu Phe Arg Lys Leu Ala Ala Leu Lys Glu Pro Leu Leu Gln 465 470 475 480 Ile Gly Gly Lys Trp Phe Ala Leu Lys Lys Glu Asp Ile Asp Ser Ile 485 490 495 Met Lys Ala Phe Arg Ala Lys Lys Thr Gly Glu Met Ala Leu Ser Glu 500 505 510 Ala Leu Arg Leu Asn Gly Gly Leu Glu Asp Phe Asn Gly Ile Pro Val 515 520 525 Ser Gly Met Lys Ser Ser Gly Trp Leu Ala Glu Leu Phe Asp Arg Leu 530 535 540 Ala Ala Gly Glu Lys Ile Thr Ser Leu Ala Pro Pro Asp Gly Phe Asn 545 550 555 560 Gly Glu Leu Arg Asp Tyr Gln Val Lys Gly Tyr Ser Trp Leu Ala Phe 565 570 575 Met Lys Lys Tyr Gly Leu Gly Ser Ile Leu Ala Asp Asp Met Gly Leu 580 585 590 Gly Lys Thr Ile Gln Leu Leu Ala Leu Leu Leu Lys Glu Lys Glu Arg 595 600 605 Gly Thr Lys Gly Pro Thr Leu Leu Ile Cys Pro Thr Ser Ile Leu Gly 610 615 620 Asn Trp Gln Arg Glu Ala Lys Lys Phe Ala Pro Ala Leu Lys Val His 625 630 635 640 Ile His His Gly Ala Gly Arg Ala Asp Lys Glu Gln Phe Gly Lys Ile 645 650 655 Val Lys Ala His Asp Leu Ile Leu Ser Thr Tyr Ala His Ala Tyr Arg 660 665 670 Asp Glu Glu Leu Leu Lys Glu Val Asn Trp Lys Leu Val Val Leu Asp 675 680 685 Glu Ala Gln Asn Ile Lys Asn His His Thr Arg Gln Ala Arg Ala Ile 690 695 700 Arg Ala Leu Lys Ala Asp His Arg Ile Ala Met Thr Gly Thr Pro Ile 705 710 715 720 Glu Asn Arg Leu Ser Glu Leu Trp Ser Ile Val Asp Phe Leu Asn Pro 725 730 735 Gly Tyr Leu Gly Lys Ala Glu Thr Phe Arg Lys Gln Phe Ala Ile Pro 740 745 750 Ile Glu Arg Tyr Asp Asp Ala Ala Arg Ser Glu Lys Leu Lys Gln Ala 755 760 765 Ile Lys Pro Leu Val Leu Arg Arg Val Lys Thr Asp Pro Ala Ile Ile 770 775 780 Lys Asp Leu Pro Asp Lys Ile Glu Ile Lys Glu Pro Cys Asn Leu Thr 785 790 795 800 Lys Glu Gln Ala Thr Leu Tyr Glu Ala Ile Val Glu Asn Met Leu Lys 805 810 815 Ser Ile Asp Lys Ala Thr Ala Met Gln Arg Arg Gly Ile Val Leu Ala 820 825 830 Ser Leu Met Lys Leu Lys Gln Val Cys Asp His Pro Ser Leu Tyr Ile 835 840 845 Lys Thr Gly Ala Val Thr Asp Asp Lys Thr Leu Ile Arg Ser Gly Lys 850 855 860 Leu Lys Arg Leu Thr Glu Leu Leu Glu Glu Ala Leu Ala Glu Gly Asp 865 870 875 880 Ser Val Leu Ile Phe Thr Gln Phe Val Glu Met Gly Glu Met Leu Lys 885 890 895 Ala Tyr Leu Gln Ser Thr Phe Asp Glu Glu Ala Leu Phe Leu His Gly 900 905 910 Gly Val Pro Gln Lys Ala Arg Asp Lys Met Val Leu Arg Phe Gly Glu 915 920 925 Lys Asp Gly Pro Arg Ile Phe Ile Val Ser Leu Lys Ala Gly Gly Val 930 935 940 Gly Leu Asn Leu Thr Lys Ala Ser His Val Phe His Phe Asp Arg Trp 945 950 955 960 Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile 965 970 975 Gly Gln Ser Lys Asn Val Leu Val His Lys Phe Val Cys Ala Gly Thr 980 985 990 Leu Glu Glu Lys Ile Asp Glu Leu Ile Glu Ser Lys Lys Ala Leu Ser 995 1000 1005 Ala Asn Ile Leu Gly Thr Gly Glu Asp Trp Ile Thr Glu Leu Ser 1010 1015 1020 Thr Glu Gln Leu Arg Asp Met Val Met Leu Arg Trp Asp Glu Val 1025 1030 1035 Ala Asp Asp Gly 1040 <210> 35 <211> 2757 <212> DNA <213> Bacillus cereus <400> 35 atgatcaatc aaactgaagt aacaattagg ctccagcacg ttagtcacgg ttggttcctt 60 tggggagaag atgatagcgg tactccatta tccgtaacaa gttggaaacg aaatgcattt 120 acatggcact ccacttcctt ctacggcacg tttctaaaag aagcaagctt tgaaggaaga 180 caaggtgtta tgctaacaaa cgcacaagca tttgaataca tcgcgaataa accgatgaac 240 tcctttgccc gtattcaaat gaacggccct attacagcac ttacggaaga tgcgaacgaa 300 ttgtgggatg ccttcacaag cggtagcttc gtacctgata tggagcgttg gcctaaacaa 360 ccatcttgga aagttcaaaa tactccaatc gaagatgaaa cattggcatc tcttttctcg 420 gctgcagtaa atgaaagcat attacaagat aaccgttcaa atgacggatg ggaagatgca 480 aagagacttt atgaacatta cgactttacg aaaagacaat tagacgcagc actacatgaa 540 gaagattggc ttcgaaaaat tggttacatt gaagatgacc ttccctttac aatcggacta 600 cgactacaag agccgcaaga agaatttgaa atgtggaagc ttgaaacaat tgttacgcca 660 aagcgcgggg cacatcgcat atatgtatat gagagtatcg attctttacc aaaacgatgg 720 cacgattatg aagaacgtat tctggaaaca caagaaagct tcagtaagct cgtaccgtgg 780 ctaaaagatg gtgatacatt ccgaagtgaa ctctttgaaa cagaagcgtg gaacttctta 840 acagaagcaa gtaacgaatt actcgccgca ggtattacaa tcttattacc atcgtggtgg 900 caaaatttaa aagcgacaaa accaaaatta cgtgtgcaac tgaagcaaaa tgctacacaa 960 acgcaatctt tcttcggcat gaatacactc gttaattttg actggcgcat ttcaacgaac 1020 ggcattgatt tatcagaaag cgaatttttt gaactcgttg aacaaaacaa gcggttattc 1080 aatataaatg gtcaatggat gcgactagat ccagccttta ttgaagaagt acgaaagctc 1140 atgaatcgtg ctgataagta tggacttgaa atgaaagatg tcctgcagca acatttatca 1200 aacacggctg aaacagaaat tgtagaagag gatagtccgt ttacagatat tgaaattgaa 1260 ctagatggat attatgaaga cttattccaa aaactattgc acattggaga tattccgaaa 1320 gtagatgtcc cttcatcact aaacgccaca ctccgtccgt atcaacaaca tggcattgag 1380 tggttattat atttaagaaa gcttggattc ggcgcattgt tagctgacga catgggactt 1440 ggaaagagta ttcaaacgat cacttactta ctatatataa aagaaaacaa tctccaaaca 1500 ggtcctgctt taatcgtggc tccgacatct gttcttggaa attggcaaaa agaatttgag 1560 cgtttcgcac cgaatttacg tgttcagtta cattatggaa gtaaccgagc taaaggggaa 1620 ccctttaaag atttccttca atcagcagat gttgtattaa catcttatgc attagctcag 1680 cttgatgagg aagaacttag tacgttatgc tgggatgctg ttattttgga tgaagcacaa 1740 aatattaaaa acccacatac gaaacagtct aaagcagtac gaaacttaca agcaaatcac 1800 aaaatcgcat taactgggac accgatggaa aaccgccttg ccgagctttg gtctattttc 1860 gacttcatta atcatggata tcttggcagc ttaggacaat tccagcgccg cttcgtctca 1920 ccaattgaaa aggaccgtga cgaaggaaaa atccaacaag ttcaacgttt tatctcaccg 1980 tttttactgc gtcgtacgaa gaaagatcaa acagtcgcat taaacttacc agataaacaa 2040 gaacagaaag cttactgtcc actaactggt gaacaagctt ccttatatga acaacttgtt 2100 caagatacgt tgcaaaatgt agaaggatta agcggaattg aacgacgcgg atttatatta 2160 ctcatgctga acaaacttaa acaaatttgt aatcatcccg ctctttattt aaaagaaaca 2220 gaaccgaaag acatcatcga gcgttccatg aaaacgagca cgctcatgga actcattgaa 2280 aatataaaag atcaaaatga aagttgctta atcttcacgc aatacatcgg tatggggaac 2340 atgctaaaag atgtgttaga agaacatttc ggtcagcgcg tcctcttctt aaacggtagt 2400 gtaccgaaga aagaacgtga caaaatgatc gaacagttcc aaaacggaac gtatgacatc 2460 ttcattttat cgttaaaagc aggtggtaca ggattaaact taacagctgc caaccatgtc 2520 attcactacg atcgttggtg gaatccagcg gtagaaaacc aagcaacaga ccgtgcatat 2580 cgcattggtc aaaagcgctt cgttcacgtt cataaactga ttacaacggg gacacttgaa 2640 gagaaaatcg atgaaatgtt agaaagaaaa caatcattaa acaacgccgt cattacaagc 2700 gatagttgga tgacagaact atctacagat gaactaaaag aattacttgg tgtataa 2757 <210> 36 <211> 918 <212> PRT <213> Bacillus cereus <400> 36 Met Ile Asn Gln Thr Glu Val Thr Ile Arg Leu Gln His Val Ser His 1 5 10 15 Gly Trp Phe Leu Trp Gly Glu Asp Asp Ser Gly Thr Pro Leu Ser Val 20 25 30 Thr Ser Trp Lys Arg Asn Ala Phe Thr Trp His Ser Thr Ser Phe Tyr 35 40 45 Gly Thr Phe Leu Lys Glu Ala Ser Phe Glu Gly Arg Gln Gly Val Met 50 55 60 Leu Thr Asn Ala Gln Ala Phe Glu Tyr Ile Ala Asn Lys Pro Met Asn 65 70 75 80 Ser Phe Ala Arg Ile Gln Met Asn Gly Pro Ile Thr Ala Leu Thr Glu 85 90 95 Asp Ala Asn Glu Leu Trp Asp Ala Phe Thr Ser Gly Ser Phe Val Pro 100 105 110 Asp Met Glu Arg Trp Pro Lys Gln Pro Ser Trp Lys Val Gln Asn Thr 115 120 125 Pro Ile Glu Asp Glu Thr Leu Ala Ser Leu Phe Ser Ala Ala Val Asn 130 135 140 Glu Ser Ile Leu Gln Asp Asn Arg Ser Asn Asp Gly Trp Glu Asp Ala 145 150 155 160 Lys Arg Leu Tyr Glu His Tyr Asp Phe Thr Lys Arg Gln Leu Asp Ala 165 170 175 Ala Leu His Glu Glu Asp Trp Leu Arg Lys Ile Gly Tyr Ile Glu Asp 180 185 190 Asp Leu Pro Phe Thr Ile Gly Leu Arg Leu Gln Glu Pro Gln Glu Glu 195 200 205 Phe Glu Met Trp Lys Leu Glu Thr Ile Val Thr Pro Lys Arg Gly Ala 210 215 220 His Arg Ile Tyr Val Tyr Glu Ser Ile Asp Ser Leu Pro Lys Arg Trp 225 230 235 240 His Asp Tyr Glu Glu Arg Ile Leu Glu Thr Gln Glu Ser Phe Ser Lys 245 250 255 Leu Val Pro Trp Leu Lys Asp Gly Asp Thr Phe Arg Ser Glu Leu Phe 260 265 270 Glu Thr Glu Ala Trp Asn Phe Leu Thr Glu Ala Ser Asn Glu Leu Leu 275 280 285 Ala Ala Gly Ile Thr Ile Leu Leu Pro Ser Trp Trp Gln Asn Leu Lys 290 295 300 Ala Thr Lys Pro Lys Leu Arg Val Gln Leu Lys Gln Asn Ala Thr Gln 305 310 315 320 Thr Gln Ser Phe Phe Gly Met Asn Thr Leu Val Asn Phe Asp Trp Arg 325 330 335 Ile Ser Thr Asn Gly Ile Asp Leu Ser Glu Ser Glu Phe Phe Glu Leu 340 345 350 Val Glu Gln Asn Lys Arg Leu Phe Asn Ile Asn Gly Gln Trp Met Arg 355 360 365 Leu Asp Pro Ala Phe Ile Glu Glu Val Arg Lys Leu Met Asn Arg Ala 370 375 380 Asp Lys Tyr Gly Leu Glu Met Lys Asp Val Leu Gln Gln His Leu Ser 385 390 395 400 Asn Thr Ala Glu Thr Glu Ile Val Glu Glu Asp Ser Pro Phe Thr Asp 405 410 415 Ile Glu Ile Glu Leu Asp Gly Tyr Tyr Glu Asp Leu Phe Gln Lys Leu 420 425 430 Leu His Ile Gly Asp Ile Pro Lys Val Asp Val Pro Ser Ser Leu Asn 435 440 445 Ala Thr Leu Arg Pro Tyr Gln Gln His Gly Ile Glu Trp Leu Leu Tyr 450 455 460 Leu Arg Lys Leu Gly Phe Gly Ala Leu Leu Ala Asp Asp Met Gly Leu 465 470 475 480 Gly Lys Ser Ile Gln Thr Ile Thr Tyr Leu Leu Tyr Ile Lys Glu Asn 485 490 495 Asn Leu Gln Thr Gly Pro Ala Leu Ile Val Ala Pro Thr Ser Val Leu 500 505 510 Gly Asn Trp Gln Lys Glu Phe Glu Arg Phe Ala Pro Asn Leu Arg Val 515 520 525 Gln Leu His Tyr Gly Ser Asn Arg Ala Lys Gly Glu Pro Phe Lys Asp 530 535 540 Phe Leu Gln Ser Ala Asp Val Val Leu Thr Ser Tyr Ala Leu Ala Gln 545 550 555 560 Leu Asp Glu Glu Glu Leu Ser Thr Leu Cys Trp Asp Ala Val Ile Leu 565 570 575 Asp Glu Ala Gln Asn Ile Lys Asn Pro His Thr Lys Gln Ser Lys Ala 580 585 590 Val Arg Asn Leu Gln Ala Asn His Lys Ile Ala Leu Thr Gly Thr Pro 595 600 605 Met Glu Asn Arg Leu Ala Glu Leu Trp Ser Ile Phe Asp Phe Ile Asn 610 615 620 His Gly Tyr Leu Gly Ser Leu Gly Gln Phe Gln Arg Arg Phe Val Ser 625 630 635 640 Pro Ile Glu Lys Asp Arg Asp Glu Gly Lys Ile Gln Gln Val Gln Arg 645 650 655 Phe Ile Ser Pro Phe Leu Leu Arg Arg Thr Lys Lys Asp Gln Thr Val 660 665 670 Ala Leu Asn Leu Pro Asp Lys Gln Glu Gln Lys Ala Tyr Cys Pro Leu 675 680 685 Thr Gly Glu Gln Ala Ser Leu Tyr Glu Gln Leu Val Gln Asp Thr Leu 690 695 700 Gln Asn Val Glu Gly Leu Ser Gly Ile Glu Arg Arg Gly Phe Ile Leu 705 710 715 720 Leu Met Leu Asn Lys Leu Lys Gln Ile Cys Asn His Pro Ala Leu Tyr 725 730 735 Leu Lys Glu Thr Glu Pro Lys Asp Ile Ile Glu Arg Ser Met Lys Thr 740 745 750 Ser Thr Leu Met Glu Leu Ile Glu Asn Ile Lys Asp Gln Asn Glu Ser 755 760 765 Cys Leu Ile Phe Thr Gln Tyr Ile Gly Met Gly Asn Met Leu Lys Asp 770 775 780 Val Leu Glu Glu His Phe Gly Gln Arg Val Leu Phe Leu Asn Gly Ser 785 790 795 800 Val Pro Lys Lys Glu Arg Asp Lys Met Ile Glu Gln Phe Gln Asn Gly 805 810 815 Thr Tyr Asp Ile Phe Ile Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu 820 825 830 Asn Leu Thr Ala Ala Asn His Val Ile His Tyr Asp Arg Trp Trp Asn 835 840 845 Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln 850 855 860 Lys Arg Phe Val His Val His Lys Leu Ile Thr Thr Gly Thr Leu Glu 865 870 875 880 Glu Lys Ile Asp Glu Met Leu Glu Arg Lys Gln Ser Leu Asn Asn Ala 885 890 895 Val Ile Thr Ser Asp Ser Trp Met Thr Glu Leu Ser Thr Asp Glu Leu 900 905 910 Lys Glu Leu Leu Gly Val 915 <210> 37 <211> 3141 <212> DNA <213> Crocosphaera watsonii <400> 37 atgacaatat tacatggaac ttggattgaa aatacctctg aaaaacattt ttttatttgg 60 ggggaaactt ggcgttcttt atcctctgat atttcctcag atgattctat tttaatgtat 120 ccattttctg tagataaaca gggaattatt gaacaattaa actcgaataa gattaagatt 180 gaaaaaaaca aaaatattga atctgtttct caaatatttt atttgcctag taaatttatt 240 gctaaatcga agcaaagtat ccctttacta tcaacagaat taaaagataa agattttgaa 300 caaggggata ttcagttaat tgcttggaaa atcgaaggga taaaattaaa tgttgatgat 360 acaattaata ttttaagtca gttaccgttg ggattaacca ataatgacga aaattacata 420 ggcgataatt taaaattttg gacacatatt tatcgttgga gtctagattt attaactaga 480 ggtaaatatt taccgcaaat ggaagaacaa gataataact gttatggaca atgggaacct 540 ttactagata gtttagttga tcagcaacgg ttctctaaat ttatacaaac tatgccaaat 600 agttctcttg cttatcataa tttaatggag ggtgaattat cctcttcttt actcaaacaa 660 actactattc ttgatttttt atctactatc attaatcaac aagtacgtca atttattgat 720 gttgctatta cccctagttc atttatccaa aagtggttat actctttaac acaagactta 780 tctaaatttg aagcatcaga agttgaaaga aagggattaa agaatgctat taataattgg 840 aaatcttctt taagtgaata tattataaag tctgataatc aaccattagg aattaaccag 900 tttcgtgttt gttttaaact agaaaatcca gctaaaagtg gtaagaaatt agaacaaagt 960 aattggcagt tacactacta tctccaagct ttagatgatc ctaattttct gatctctgcc 1020 aaggttattt gggaaaatcc tgttactaga ttaatctgca ataatagaac aattaatcat 1080 cctcaagaaa ccttgctaaa aggactaggt ttagcttcac gtctatatta tctaattgaa 1140 gaaagtttac aagacaataa gcctagtttt tctgagttag atcccataca agtctatgaa 1200 tttttacgtt caattgctaa tattcttaaa gataatggct taggggttat cttaccagct 1260 agtctagagc aaggagtcga agaaaaacgc ttaggaatta gtctaaccgc agaagttaag 1320 tcgaaaaaag gacaaagact tagcttacaa agtttgttaa gttataagct aaatttagca 1380 attggtgata aaacaatatc gaaaaaagac tttgaaaaac tattagcgca aaagtcacct 1440 ttagttgaag taaaaggaga atggatagca ttacaacctg ctgatgtcaa ggccgcacaa 1500 caaattttaa ataagtccta tgatccccta gaactttctg tagaagatgc tttacgcttc 1560 agcacaggag atatttcaac tgttgccaaa ctgccgatta ctaactttga agcaaaaggg 1620 gaattagcca atctaattaa tgctataaat aataatgaat caatccctat gatcgaaaat 1680 cccagaggat ttaaaggtca attacgtccc tatcaacagc gaggagtcgg ttggttatcg 1740 ttcttagaaa aatggggttt aggggcttgt cttgccgatg atatgggatt aggaaaaaca 1800 ccacaattaa ttgggtttct cttacattta agaagcgaag gaatgttaga tcaacctacc 1860 ttagttattt gtcctacatc tgttttaaat aactgggaaa gagaagttca aaaatttgcc 1920 ccaacccttt ctactttgat tcatcatgga gataaacgta gtaaagggaa agcttttgtt 1980 aaagcagtta gtaaaaaaaa tgttatcatt actagctatt ctttaattta tcgagatatt 2040 aaaagctttg aacaggtaga atggcaaggt attgtcttag atgaagcaca aaatataaaa 2100 aatccccagg caaaacaatc ccaagcagtg cgtcaaattt ccacacagtt tcgtattgct 2160 ttaacaggaa ctcctgtaga aaatcgccta acagaattat ggtcaattct tgactttctt 2220 aacccaggat ttttagggac acagcagttt ttccgtcgtc gttttgccac tcctatcgaa 2280 aaatatgggg ataaagaatc actgcaaatt atgcgttctt tggtacgtcc tttcattctc 2340 agacgattga aaacagataa aactattatt caagatttac ccgaaaaaca agaaatgacc 2400 attttttgtg ggttatcctc agaacaagga aaactttatc aacaattagt agataattct 2460 ctggtagcaa tagaagagaa aacaggaatt gaacgcaaag gcttaatttt aagcttactg 2520 ctaaaactca aacaaatttg taaccatcct gctcattttc tcaagcaaaa gagcttaaaa 2580 acagcagaac aatctggtaa attattaaga ctagaagaaa tgctagaaga attaatcgaa 2640 gaaggagatc atgctttaat ctttacccaa ttttctgaat ggggtaaact gctgcaacct 2700 tatttacaga aaaaatttca gcaagacgtt ctctttttgt atggtgctac tcgcagagtt 2760 caaagacaag aaatgatcga tcgctttcaa caggatccca acggacccag aatttttatt 2820 ctctccttaa aagcaggggg aaccggatta aatttaaccc gcgctaacca tgtatttcat 2880 attgatcgtt ggtggaaccc agcagtagaa aatcaagcaa ccgatcgcgc gtttcgttta 2940 ggacaaaaac gcaatgttca agtacataaa tttgtctgta caggaaccct agaagaaaaa 3000 attaacgaaa tgttagaaag taaacaaaaa ttagccgaac aaaccgttga cgcaggggaa 3060 caatggttga cagaattaga tacagatcaa ctgcgtaacc tcttattatt ggatcgagat 3120 accattattg acgaacaata a 3141 <210> 38 <211> 1046 <212> PRT <213> Crocosphaera watsonii <400> 38 Met Thr Ile Leu His Gly Thr Trp Ile Glu Asn Thr Ser Glu Lys His 1 5 10 15 Phe Phe Ile Trp Gly Glu Thr Trp Arg Ser Leu Ser Ser Asp Ile Ser 20 25 30 Ser Asp Asp Ser Ile Leu Met Tyr Pro Phe Ser Val Asp Lys Gln Gly 35 40 45 Ile Ile Glu Gln Leu Asn Ser Asn Lys Ile Lys Ile Glu Lys Asn Lys 50 55 60 Asn Ile Glu Ser Val Ser Gln Ile Phe Tyr Leu Pro Ser Lys Phe Ile 65 70 75 80 Ala Lys Ser Lys Gln Ser Ile Pro Leu Leu Ser Thr Glu Leu Lys Asp 85 90 95 Lys Asp Phe Glu Gln Gly Asp Ile Gln Leu Ile Ala Trp Lys Ile Glu 100 105 110 Gly Ile Lys Leu Asn Val Asp Asp Thr Ile Asn Ile Leu Ser Gln Leu 115 120 125 Pro Leu Gly Leu Thr Asn Asn Asp Glu Asn Tyr Ile Gly Asp Asn Leu 130 135 140 Lys Phe Trp Thr His Ile Tyr Arg Trp Ser Leu Asp Leu Leu Thr Arg 145 150 155 160 Gly Lys Tyr Leu Pro Gln Met Glu Glu Gln Asp Asn Asn Cys Tyr Gly 165 170 175 Gln Trp Glu Pro Leu Leu Asp Ser Leu Val Asp Gln Gln Arg Phe Ser 180 185 190 Lys Phe Ile Gln Thr Met Pro Asn Ser Ser Leu Ala Tyr His Asn Leu 195 200 205 Met Glu Gly Glu Leu Ser Ser Ser Leu Leu Lys Gln Thr Thr Ile Leu 210 215 220 Asp Phe Leu Ser Thr Ile Ile Asn Gln Gln Val Arg Gln Phe Ile Asp 225 230 235 240 Val Ala Ile Thr Pro Ser Ser Phe Ile Gln Lys Trp Leu Tyr Ser Leu 245 250 255 Thr Gln Asp Leu Ser Lys Phe Glu Ala Ser Glu Val Glu Arg Lys Gly 260 265 270 Leu Lys Asn Ala Ile Asn Asn Trp Lys Ser Ser Leu Ser Glu Tyr Ile 275 280 285 Ile Lys Ser Asp Asn Gln Pro Leu Gly Ile Asn Gln Phe Arg Val Cys 290 295 300 Phe Lys Leu Glu Asn Pro Ala Lys Ser Gly Lys Lys Leu Glu Gln Ser 305 310 315 320 Asn Trp Gln Leu His Tyr Tyr Leu Gln Ala Leu Asp Asp Pro Asn Phe 325 330 335 Leu Ile Ser Ala Lys Val Ile Trp Glu Asn Pro Val Thr Arg Leu Ile 340 345 350 Cys Asn Asn Arg Thr Ile Asn His Pro Gln Glu Thr Leu Leu Lys Gly 355 360 365 Leu Gly Leu Ala Ser Arg Leu Tyr Tyr Leu Ile Glu Glu Ser Leu Gln 370 375 380 Asp Asn Lys Pro Ser Phe Ser Glu Leu Asp Pro Ile Gln Val Tyr Glu 385 390 395 400 Phe Leu Arg Ser Ile Ala Asn Ile Leu Lys Asp Asn Gly Leu Gly Val 405 410 415 Ile Leu Pro Ala Ser Leu Glu Gln Gly Val Glu Glu Lys Arg Leu Gly 420 425 430 Ile Ser Leu Thr Ala Glu Val Lys Ser Lys Lys Gly Gln Arg Leu Ser 435 440 445 Leu Gln Ser Leu Leu Ser Tyr Lys Leu Asn Leu Ala Ile Gly Asp Lys 450 455 460 Thr Ile Ser Lys Lys Asp Phe Glu Lys Leu Leu Ala Gln Lys Ser Pro 465 470 475 480 Leu Val Glu Val Lys Gly Glu Trp Ile Ala Leu Gln Pro Ala Asp Val 485 490 495 Lys Ala Ala Gln Gln Ile Leu Asn Lys Ser Tyr Asp Pro Leu Glu Leu 500 505 510 Ser Val Glu Asp Ala Leu Arg Phe Ser Thr Gly Asp Ile Ser Thr Val 515 520 525 Ala Lys Leu Pro Ile Thr Asn Phe Glu Ala Lys Gly Glu Leu Ala Asn 530 535 540 Leu Ile Asn Ala Ile Asn Asn Asn Glu Ser Ile Pro Met Ile Glu Asn 545 550 555 560 Pro Arg Gly Phe Lys Gly Gln Leu Arg Pro Tyr Gln Gln Arg Gly Val 565 570 575 Gly Trp Leu Ser Phe Leu Glu Lys Trp Gly Leu Gly Ala Cys Leu Ala 580 585 590 Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Leu Ile Gly Phe Leu Leu 595 600 605 His Leu Arg Ser Glu Gly Met Leu Asp Gln Pro Thr Leu Val Ile Cys 610 615 620 Pro Thr Ser Val Leu Asn Asn Trp Glu Arg Glu Val Gln Lys Phe Ala 625 630 635 640 Pro Thr Leu Ser Thr Leu Ile His His Gly Asp Lys Arg Ser Lys Gly 645 650 655 Lys Ala Phe Val Lys Ala Val Ser Lys Lys Asn Val Ile Ile Thr Ser 660 665 670 Tyr Ser Leu Ile Tyr Arg Asp Ile Lys Ser Phe Glu Gln Val Glu Trp 675 680 685 Gln Gly Ile Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro Gln Ala 690 695 700 Lys Gln Ser Gln Ala Val Arg Gln Ile Ser Thr Gln Phe Arg Ile Ala 705 710 715 720 Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Thr Glu Leu Trp Ser Ile 725 730 735 Leu Asp Phe Leu Asn Pro Gly Phe Leu Gly Thr Gln Gln Phe Phe Arg 740 745 750 Arg Arg Phe Ala Thr Pro Ile Glu Lys Tyr Gly Asp Lys Glu Ser Leu 755 760 765 Gln Ile Met Arg Ser Leu Val Arg Pro Phe Ile Leu Arg Arg Leu Lys 770 775 780 Thr Asp Lys Thr Ile Ile Gln Asp Leu Pro Glu Lys Gln Glu Met Thr 785 790 795 800 Ile Phe Cys Gly Leu Ser Ser Glu Gln Gly Lys Leu Tyr Gln Gln Leu 805 810 815 Val Asp Asn Ser Leu Val Ala Ile Glu Glu Lys Thr Gly Ile Glu Arg 820 825 830 Lys Gly Leu Ile Leu Ser Leu Leu Leu Lys Leu Lys Gln Ile Cys Asn 835 840 845 His Pro Ala His Phe Leu Lys Gln Lys Ser Leu Lys Thr Ala Glu Gln 850 855 860 Ser Gly Lys Leu Leu Arg Leu Glu Glu Met Leu Glu Glu Leu Ile Glu 865 870 875 880 Glu Gly Asp His Ala Leu Ile Phe Thr Gln Phe Ser Glu Trp Gly Lys 885 890 895 Leu Leu Gln Pro Tyr Leu Gln Lys Lys Phe Gln Gln Asp Val Leu Phe 900 905 910 Leu Tyr Gly Ala Thr Arg Arg Val Gln Arg Gln Glu Met Ile Asp Arg 915 920 925 Phe Gln Gln Asp Pro Asn Gly Pro Arg Ile Phe Ile Leu Ser Leu Lys 930 935 940 Ala Gly Gly Thr Gly Leu Asn Leu Thr Arg Ala Asn His Val Phe His 945 950 955 960 Ile Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg 965 970 975 Ala Phe Arg Leu Gly Gln Lys Arg Asn Val Gln Val His Lys Phe Val 980 985 990 Cys Thr Gly Thr Leu Glu Glu Lys Ile Asn Glu Met Leu Glu Ser Lys 995 1000 1005 Gln Lys Leu Ala Glu Gln Thr Val Asp Ala Gly Glu Gln Trp Leu 1010 1015 1020 Thr Glu Leu Asp Thr Asp Gln Leu Arg Asn Leu Leu Leu Leu Asp 1025 1030 1035 Arg Asp Thr Ile Ile Asp Glu Gln 1040 1045 <210> 39 <211> 3027 <212> DNA <213> Gloeobacter violaceus <400> 39 atggctatct tgcacggtat ctgggttcac caaccccccc gggccgggct tttcctttgg 60 ggagaaacct ggaggcaggt cgcaaagcgg cgcaagcgct ccgaagcacc cgctccgcat 120 ccctatgtcc agcaaccggc cgagttgtcc ccccgcctgg ctgcccagtt tccccagata 180 ccgctcagct tgctggtacc cgagacgctt gcactccagt tgcccgccac ggtcgaaaac 240 gtggtctact ccgcaagcat tgctcccgag ggcaagcttt tggagttgga accgtggctg 300 gtggaaggtt tctggctcga cggtcaccag gcttttgaac tgttgctcgg ggtacccctg 360 ggcggcgggg acgcatcgat tggcgacgac ctgcgcttct ggtcgcagtg cgcccgctgg 420 gtgcttgact tgctggtgcg cgccaagtac ctgcccgacc tggagagcgg cgacggccag 480 gaaatcccca cagcccgctg ggtgcccctg ctcgacagcg ccgtcgatca agcccgcctc 540 aaagaatttg ccgcccgttt gccgggcgcc tgccgcgccg ctacccccga actatctccg 600 caccagattc tcaagagttt cctgagcgcc atgctcgacg cgcgggtgcg cacgctgctc 660 gcttgcgagc ctcccgatcc gcgcacgctg cctgccggag cggtgcgccc ctggcttctg 720 gccctggccc atgcccagcc ccagctcaaa tctccggacc cggagacgcc ggctctggcg 780 gaagccctgg ccacctggcg cgcccccctg agctatcagg ttcgctcgcg cacctgcttc 840 cgtctgcagc cgcccgagga gagccagggc gagtggaagc tgcactttct attgcaaaca 900 ggcgacgatc ccgattcgct gatggctgcc cagcaagtct ggagcagcgc gggtgagctg 960 caggaggtgt ttctcgcggg cttgggcctc gcctcgcgta tctttgtgcc cgtcgagcgg 1020 ggattgctcg tcccccagcc cacctgctgc accatgagca ccgtcgaggc gtttcagttt 1080 ctcaaagccg ccacctggcg gttgcgcgac agcggcttcg gggtgttgtt gcccgagagc 1140 ctcgcggacg cgggcagcct gcgcaaccgc ctgggcctca aactcgaagc gaacgcgccg 1200 gggcgcaacg gttcgggcct cggcatgcag agcttgctcg cttttaaatg ggagctgtcg 1260 ctcgcgggca agaccctgag ccgcgccgag ttcgaccgcc tcgccgctag ttctgaaccc 1320 ctggtcaaag tcaacgacaa ctgggtcgaa ttgcgccccc aggacgtgcg cgccgcccac 1380 agctttttgc agtcgcgcaa agatcaggtc ggactctcgt tggaggatgt gctgcgcctc 1440 aacttcggcg acacccccaa aatcgacggt ctccccatcg tcaacttcga cagctccggc 1500 cccattcagc aactgctgga gaccctcacc gatcagcgca aactcacccc catcgacgaa 1560 ccgccggggt tcaagggcac cctgcggccc tatcaaaaaa ttggcgtcgg ctggctcgcc 1620 tttttgcaga agtggggcct gggtgcttgc ctagccgacg acatgggact cgggaagacc 1680 gtagagttga tagcatttct tctttttctc aaatccaaaa atgagctgga cggccctata 1740 ttgttaattt gtccgacttc agtgatggga aactgggaaa gagaaataaa gaaattttct 1800 cctagtttat ctgtacatgt ccatcatggg gcgcggcggc cgaaggggcg caattttgtc 1860 gagacggccc agaaaaagca aatcatcgtc agcagctacg ccctggtaca gcgcgacagc 1920 aaagatctca agcgcgtcga atggttgggc ctggtgctcg acgaagccca gaacatcaaa 1980 aaccccgacg ccaagcagac ccagtcgatt cgggaactga cagcgcgctt tcgcatcgcc 2040 ctcaccggca caccggtcga gaatcgcctc gcggaactgt ggtcgatcct cgattttctc 2100 aatcccggct atctgggggc gcgcaacttc tttcagcgcc gcttcgcagt tccgatcgaa 2160 aagtacgggg atcgctcctc ggcgaacgcc ctcaaagctc tggtgcagcc gtttatcctg 2220 cggcggctca aatccgaccc gcagattatt caagatctgc ccgagaagca ggagacgaat 2280 gtcttctgtc cgctcacacc cgagcaggcg gccctctacg agcgggtggt gaacgaatcg 2340 ctcgccaaga tcgagcagag caccggcatc cagcggcgcg ggacggtgct ggccaccttg 2400 gtcaaactca agcagatctg caaccacccg agccactacc tgggtgacga cggaccgctc 2460 gccaaccgct cgggcaaact cagccgcctg ggcgagatgc tcgaagaagt gctcgccgac 2520 gaggagcggg cgctgatttt tacccagttc gccgagtggg gccacctgct gcaggcgcac 2580 ctgagccgcc agttgggttc agaagtgttt ttcctctacg gcggcaccag caaaaaccag 2640 cgcgaggcga tgatcgagcg cttccagagc gatccgcagg ggccgcggat ttttattctt 2700 tcgctgaagg cagggggtgt cggcctcaac ctcacccgcg ccaaccacgt cttccacttc 2760 gaccgctggt ggaacccggc ggtcgagaat caggccaccg accgcgtctt ccgcatcggc 2820 caaaccaaga acgtacaagt ctacaagtac gtgtgcaccg gcacgctcga agagcgcatc 2880 aacgccctga tcgaaagcaa aaaggccctg gctgagcagg tggtgagcgc cggtgagaac 2940 tggctgtcgg atctaaatac cgatcaactg cggcaactgt tggtactcga tcgctcggag 3000 attatcgaca cggaggacac cgcgtga 3027 <210> 40 <211> 1008 <212> PRT <213> Gloeobacter violaceus <400> 40 Met Ala Ile Leu His Gly Ile Trp Val His Gln Pro Pro Arg Ala Gly 1 5 10 15 Leu Phe Leu Trp Gly Glu Thr Trp Arg Gln Val Ala Lys Arg Arg Lys 20 25 30 Arg Ser Glu Ala Pro Ala Pro His Pro Tyr Val Gln Gln Pro Ala Glu 35 40 45 Leu Ser Pro Arg Leu Ala Ala Gln Phe Pro Gln Ile Pro Leu Ser Leu 50 55 60 Leu Val Pro Glu Thr Leu Ala Leu Gln Leu Pro Ala Thr Val Glu Asn 65 70 75 80 Val Val Tyr Ser Ala Ser Ile Ala Pro Glu Gly Lys Leu Leu Glu Leu 85 90 95 Glu Pro Trp Leu Val Glu Gly Phe Trp Leu Asp Gly His Gln Ala Phe 100 105 110 Glu Leu Leu Leu Gly Val Pro Leu Gly Gly Gly Asp Ala Ser Ile Gly 115 120 125 Asp Asp Leu Arg Phe Trp Ser Gln Cys Ala Arg Trp Val Leu Asp Leu 130 135 140 Leu Val Arg Ala Lys Tyr Leu Pro Asp Leu Glu Ser Gly Asp Gly Gln 145 150 155 160 Glu Ile Pro Thr Ala Arg Trp Val Pro Leu Leu Asp Ser Ala Val Asp 165 170 175 Gln Ala Arg Leu Lys Glu Phe Ala Ala Arg Leu Pro Gly Ala Cys Arg 180 185 190 Ala Ala Thr Pro Glu Leu Ser Pro His Gln Ile Leu Lys Ser Phe Leu 195 200 205 Ser Ala Met Leu Asp Ala Arg Val Arg Thr Leu Leu Ala Cys Glu Pro 210 215 220 Pro Asp Pro Arg Thr Leu Pro Ala Gly Ala Val Arg Pro Trp Leu Leu 225 230 235 240 Ala Leu Ala His Ala Gln Pro Gln Leu Lys Ser Pro Asp Pro Glu Thr 245 250 255 Pro Ala Leu Ala Glu Ala Leu Ala Thr Trp Arg Ala Pro Leu Ser Tyr 260 265 270 Gln Val Arg Ser Arg Thr Cys Phe Arg Leu Gln Pro Pro Glu Glu Ser 275 280 285 Gln Gly Glu Trp Lys Leu His Phe Leu Leu Gln Thr Gly Asp Asp Pro 290 295 300 Asp Ser Leu Met Ala Ala Gln Gln Val Trp Ser Ser Ala Gly Glu Leu 305 310 315 320 Gln Glu Val Phe Leu Ala Gly Leu Gly Leu Ala Ser Arg Ile Phe Val 325 330 335 Pro Val Glu Arg Gly Leu Leu Val Pro Gln Pro Thr Cys Cys Thr Met 340 345 350 Ser Thr Val Glu Ala Phe Gln Phe Leu Lys Ala Ala Thr Trp Arg Leu 355 360 365 Arg Asp Ser Gly Phe Gly Val Leu Leu Pro Glu Ser Leu Ala Asp Ala 370 375 380 Gly Ser Leu Arg Asn Arg Leu Gly Leu Lys Leu Glu Ala Asn Ala Pro 385 390 395 400 Gly Arg Asn Gly Ser Gly Leu Gly Met Gln Ser Leu Leu Ala Phe Lys 405 410 415 Trp Glu Leu Ser Leu Ala Gly Lys Thr Leu Ser Arg Ala Glu Phe Asp 420 425 430 Arg Leu Ala Ala Ser Ser Glu Pro Leu Val Lys Val Asn Asp Asn Trp 435 440 445 Val Glu Leu Arg Pro Gln Asp Val Arg Ala Ala His Ser Phe Leu Gln 450 455 460 Ser Arg Lys Asp Gln Val Gly Leu Ser Leu Glu Asp Val Leu Arg Leu 465 470 475 480 Asn Phe Gly Asp Thr Pro Lys Ile Asp Gly Leu Pro Ile Val Asn Phe 485 490 495 Asp Ser Ser Gly Pro Ile Gln Gln Leu Leu Glu Thr Leu Thr Asp Gln 500 505 510 Arg Lys Leu Thr Pro Ile Asp Glu Pro Pro Gly Phe Lys Gly Thr Leu 515 520 525 Arg Pro Tyr Gln Lys Ile Gly Val Gly Trp Leu Ala Phe Leu Gln Lys 530 535 540 Trp Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr 545 550 555 560 Val Glu Leu Ile Ala Phe Leu Leu Phe Leu Lys Ser Lys Asn Glu Leu 565 570 575 Asp Gly Pro Ile Leu Leu Ile Cys Pro Thr Ser Val Met Gly Asn Trp 580 585 590 Glu Arg Glu Ile Lys Lys Phe Ser Pro Ser Leu Ser Val His Val His 595 600 605 His Gly Ala Arg Arg Pro Lys Gly Arg Asn Phe Val Glu Thr Ala Gln 610 615 620 Lys Lys Gln Ile Ile Val Ser Ser Tyr Ala Leu Val Gln Arg Asp Ser 625 630 635 640 Lys Asp Leu Lys Arg Val Glu Trp Leu Gly Leu Val Leu Asp Glu Ala 645 650 655 Gln Asn Ile Lys Asn Pro Asp Ala Lys Gln Thr Gln Ser Ile Arg Glu 660 665 670 Leu Thr Ala Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn 675 680 685 Arg Leu Ala Glu Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr 690 695 700 Leu Gly Ala Arg Asn Phe Phe Gln Arg Arg Phe Ala Val Pro Ile Glu 705 710 715 720 Lys Tyr Gly Asp Arg Ser Ser Ala Asn Ala Leu Lys Ala Leu Val Gln 725 730 735 Pro Phe Ile Leu Arg Arg Leu Lys Ser Asp Pro Gln Ile Ile Gln Asp 740 745 750 Leu Pro Glu Lys Gln Glu Thr Asn Val Phe Cys Pro Leu Thr Pro Glu 755 760 765 Gln Ala Ala Leu Tyr Glu Arg Val Val Asn Glu Ser Leu Ala Lys Ile 770 775 780 Glu Gln Ser Thr Gly Ile Gln Arg Arg Gly Thr Val Leu Ala Thr Leu 785 790 795 800 Val Lys Leu Lys Gln Ile Cys Asn His Pro Ser His Tyr Leu Gly Asp 805 810 815 Asp Gly Pro Leu Ala Asn Arg Ser Gly Lys Leu Ser Arg Leu Gly Glu 820 825 830 Met Leu Glu Glu Val Leu Ala Asp Glu Glu Arg Ala Leu Ile Phe Thr 835 840 845 Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala His Leu Ser Arg Gln 850 855 860 Leu Gly Ser Glu Val Phe Phe Leu Tyr Gly Gly Thr Ser Lys Asn Gln 865 870 875 880 Arg Glu Ala Met Ile Glu Arg Phe Gln Ser Asp Pro Gln Gly Pro Arg 885 890 895 Ile Phe Ile Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr 900 905 910 Arg Ala Asn His Val Phe His Phe Asp Arg Trp Trp Asn Pro Ala Val 915 920 925 Glu Asn Gln Ala Thr Asp Arg Val Phe Arg Ile Gly Gln Thr Lys Asn 930 935 940 Val Gln Val Tyr Lys Tyr Val Cys Thr Gly Thr Leu Glu Glu Arg Ile 945 950 955 960 Asn Ala Leu Ile Glu Ser Lys Lys Ala Leu Ala Glu Gln Val Val Ser 965 970 975 Ala Gly Glu Asn Trp Leu Ser Asp Leu Asn Thr Asp Gln Leu Arg Gln 980 985 990 Leu Leu Val Leu Asp Arg Ser Glu Ile Ile Asp Thr Glu Asp Thr Ala 995 1000 1005 <210> 41 <211> 3186 <212> DNA <213> Lyngbya sp. <400> 41 atggcaattt tacacggaag ttggctccag caccccaaaa attatttgtt tatttgggga 60 gaaacctggc gtcgcattac acccaatgaa tttaatccgg ctgatggtgt tttgggttat 120 ccttttgctt taagccctgt tgaattggaa aagtggtgca gtgaaaagca gttatctata 180 gagagtaaag ttgtcgttac agaaactctc gcccttccca ctaaactctc cccaaaaata 240 ggactatatc cccttcaatc tacgcctcaa actgattctg aaactgattc tgagtcgatc 300 tgtctttatc cctggaaaat tgaaggtatt tgtctcaaca gtacagaagc ctttgacttt 360 ttacaatccc ttcctctggg aaacctgacc acagaaaact catttattgg ctcagattta 420 cagttttggt ctcatctttc ccgttggagt ttagacttac tcgcccggag taaattttta 480 cccagtctca cttttaaccc ctcaaaagat cactttatcg ctgaatggaa acctttactc 540 gatagtgcga cagatcaagc cagattaatt cgtttttcta aacaaatacc ctctgcttgt 600 cggatctatc aactctggtc aaaagaggct caaaatcaat ttgaaaattt agccctagat 660 ttacctcaaa atccccaaaa cttaattgat gattttttaa cggcaattat tgatagtcaa 720 gtcaagaaag ttgcagaaga aagtgaaaaa aaagcgatta caaatctaac cgctattcaa 780 ccgattgttc agagttggtt acacgcttta gccagtgaat ctaatctagc aaaatccaaa 840 aaatctgaat caaaaaccct agaaaaaatt ctttccaatt ggacggctcc tcttcaacaa 900 actctcgctg aacataattt gtttagaacg ggatttcgac tctctcctcc ggaaaataat 960 caaaaaaatt ggacgctaga ttattgttta caagcaattg atgaacccga atttttagtg 1020 gatgctcaaa ctatttggac tcatccagtc gaagcctttg ttcacaatgg acgtatgatt 1080 aaacgtcctc aagaaaccct cctcaaaggt ttaggtttag cctcaaaact atatcctctc 1140 ctagaaccca gtttacaaga agcccgtcct caaacttgct tattaacgcc cctacaagcc 1200 tatgaattta ttaaaagtat taattggcgg tttacagata gcggtttagg agtgatttta 1260 cccccgagtt tagtcagtca aaatggatgg gcgaaccgtt taggtttaag tgttcaagcg 1320 gcgacatcaa aatccaaaca aaatgttagc ttgggattag atagtctgct gaattttaaa 1380 tgggaattgt caattggggg tcaaacctta tcaaaaacag aatttaaccg tttagtcgct 1440 caagaaagtc cgttagttga aattaatggc gaatgggtgg aattacgtcc tactgatatt 1500 aaagccgcta aagccttctt ttcgagtcgc aaagatcaac tttcacttac ccttgaagat 1560 gctttacgtt tatcgacggg tgactcgcaa atggtggaaa agttaccgat tgttaacttt 1620 gaagcgggtg gaaaattaga agaacttctc aatactttaa cgaataaccg ttcgctcgat 1680 gagatcaaaa ctcctagtaa ttttcaagga gaactacgcc cctatcaagc ccgaggggtg 1740 agttggttag cctttttaga agaatggggt ttaggggctt gtttagctga tgatatgggg 1800 ctaggaaaaa ccatagaatt aattgctttt ctcttgtatt tgcaggaaaa agaaacctta 1860 gacgctcctg ttttactggt ttgtccgaca tcagttttag gaaactggga acgagaagtt 1920 aaacgattta gtccgagttt aaaagttact gttcatcacg gggataaacg ccagaaaggg 1980 aaaaactttg ctcaatttgc ccagaaatat aatttaatta ttaccagtta tccgttaact 2040 tttcgagatg agaaagaact caaaacggta aattggaaag gattagtttt agacgaagct 2100 caaaatatta aaaatcccga ggctaaacaa tcaaaaacgg tgagaaatct acaggcgagt 2160 tttaaaattg ctctgactgg aacacctgtc gaaaaccgtc tgtctgaatt atggtcaatt 2220 atggattttc tcaacccagg ttatttagga cagcgacaat tttttcagcg aagatttgct 2280 attccgattg aaaaatacgg cgatacagac tccttaaaaa cattgcgatc tttggttcaa 2340 ccgtttattt tacggcgctt aaaaacagat agagagatta tccaagactt acccgaaaaa 2400 caggaaaata cgatcttttg ttctctgtct acagaacaag caacgcttta tcaaaagatt 2460 gttgatcagt ctttagctga catagactca gccgcaggaa ttcaacgtcg agggatgatt 2520 ttagcgttgt tagtgaaatt aaaacaggtt tgtaatcatc ccattttatt gaatggaaaa 2580 gcgacaaaaa ctggaaagaa aaaggtcgag actcagggtt taagcctgca aagttcaggg 2640 aagttacaac gcttcaaaga aatgctggaa gaattgttgt cagaaggaga tcgcgccatt 2700 gtatttaccc agtttgcaga atggggaaaa gttttacaac cttatttaga acagcaatta 2760 aaccgagagg tattattttt gtatggcgca actcgtaaaa ataaacgaga agaaatgatt 2820 gatcgttttc aacaagatcc tcaagggcca ccgattttta ttctatcttt aaaagcggga 2880 ggtgtgggtt taaatttgac tcgtgctaat catgtttttc actttgatcg ttggtggaac 2940 cctgcggttg aaaatcaagc aacagatcgg gtgtttagaa ttggtcaaac gcgcaatgtt 3000 caggttcata agtttgtctg taccggaacg ttggaagaaa aaatccatga tttaattgaa 3060 agtaaaaaag tgttggctga acaagttgtg ggttcaggag aaaattggtt aactgaattg 3120 gatacggatc aactcagaaa cttactcatt attgaccgaa atgcggtgat tgatgaagaa 3180 gaataa 3186 <210> 42 <211> 1061 <212> PRT <213> Lyngbya sp. <400> 42 Met Ala Ile Leu His Gly Ser Trp Leu Gln His Pro Lys Asn Tyr Leu 1 5 10 15 Phe Ile Trp Gly Glu Thr Trp Arg Arg Ile Thr Pro Asn Glu Phe Asn 20 25 30 Pro Ala Asp Gly Val Leu Gly Tyr Pro Phe Ala Leu Ser Pro Val Glu 35 40 45 Leu Glu Lys Trp Cys Ser Glu Lys Gln Leu Ser Ile Glu Ser Lys Val 50 55 60 Val Val Thr Glu Thr Leu Ala Leu Pro Thr Lys Leu Ser Pro Lys Ile 65 70 75 80 Gly Leu Tyr Pro Leu Gln Ser Thr Pro Gln Thr Asp Ser Glu Thr Asp 85 90 95 Ser Glu Ser Ile Cys Leu Tyr Pro Trp Lys Ile Glu Gly Ile Cys Leu 100 105 110 Asn Ser Thr Glu Ala Phe Asp Phe Leu Gln Ser Leu Pro Leu Gly Asn 115 120 125 Leu Thr Thr Glu Asn Ser Phe Ile Gly Ser Asp Leu Gln Phe Trp Ser 130 135 140 His Leu Ser Arg Trp Ser Leu Asp Leu Leu Ala Arg Ser Lys Phe Leu 145 150 155 160 Pro Ser Leu Thr Phe Asn Pro Ser Lys Asp His Phe Ile Ala Glu Trp 165 170 175 Lys Pro Leu Leu Asp Ser Ala Thr Asp Gln Ala Arg Leu Ile Arg Phe 180 185 190 Ser Lys Gln Ile Pro Ser Ala Cys Arg Ile Tyr Gln Leu Trp Ser Lys 195 200 205 Glu Ala Gln Asn Gln Phe Glu Asn Leu Ala Leu Asp Leu Pro Gln Asn 210 215 220 Pro Gln Asn Leu Ile Asp Asp Phe Leu Thr Ala Ile Ile Asp Ser Gln 225 230 235 240 Val Lys Lys Val Ala Glu Glu Ser Glu Lys Lys Ala Ile Thr Asn Leu 245 250 255 Thr Ala Ile Gln Pro Ile Val Gln Ser Trp Leu His Ala Leu Ala Ser 260 265 270 Glu Ser Asn Leu Ala Lys Ser Lys Lys Ser Glu Ser Lys Thr Leu Glu 275 280 285 Lys Ile Leu Ser Asn Trp Thr Ala Pro Leu Gln Gln Thr Leu Ala Glu 290 295 300 His Asn Leu Phe Arg Thr Gly Phe Arg Leu Ser Pro Pro Glu Asn Asn 305 310 315 320 Gln Lys Asn Trp Thr Leu Asp Tyr Cys Leu Gln Ala Ile Asp Glu Pro 325 330 335 Glu Phe Leu Val Asp Ala Gln Thr Ile Trp Thr His Pro Val Glu Ala 340 345 350 Phe Val His Asn Gly Arg Met Ile Lys Arg Pro Gln Glu Thr Leu Leu 355 360 365 Lys Gly Leu Gly Leu Ala Ser Lys Leu Tyr Pro Leu Leu Glu Pro Ser 370 375 380 Leu Gln Glu Ala Arg Pro Gln Thr Cys Leu Leu Thr Pro Leu Gln Ala 385 390 395 400 Tyr Glu Phe Ile Lys Ser Ile Asn Trp Arg Phe Thr Asp Ser Gly Leu 405 410 415 Gly Val Ile Leu Pro Pro Ser Leu Val Ser Gln Asn Gly Trp Ala Asn 420 425 430 Arg Leu Gly Leu Ser Val Gln Ala Ala Thr Ser Lys Ser Lys Gln Asn 435 440 445 Val Ser Leu Gly Leu Asp Ser Leu Leu Asn Phe Lys Trp Glu Leu Ser 450 455 460 Ile Gly Gly Gln Thr Leu Ser Lys Thr Glu Phe Asn Arg Leu Val Ala 465 470 475 480 Gln Glu Ser Pro Leu Val Glu Ile Asn Gly Glu Trp Val Glu Leu Arg 485 490 495 Pro Thr Asp Ile Lys Ala Ala Lys Ala Phe Phe Ser Ser Arg Lys Asp 500 505 510 Gln Leu Ser Leu Thr Leu Glu Asp Ala Leu Arg Leu Ser Thr Gly Asp 515 520 525 Ser Gln Met Val Glu Lys Leu Pro Ile Val Asn Phe Glu Ala Gly Gly 530 535 540 Lys Leu Glu Glu Leu Leu Asn Thr Leu Thr Asn Asn Arg Ser Leu Asp 545 550 555 560 Glu Ile Lys Thr Pro Ser Asn Phe Gln Gly Glu Leu Arg Pro Tyr Gln 565 570 575 Ala Arg Gly Val Ser Trp Leu Ala Phe Leu Glu Glu Trp Gly Leu Gly 580 585 590 Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Glu Leu Ile 595 600 605 Ala Phe Leu Leu Tyr Leu Gln Glu Lys Glu Thr Leu Asp Ala Pro Val 610 615 620 Leu Leu Val Cys Pro Thr Ser Val Leu Gly Asn Trp Glu Arg Glu Val 625 630 635 640 Lys Arg Phe Ser Pro Ser Leu Lys Val Thr Val His His Gly Asp Lys 645 650 655 Arg Gln Lys Gly Lys Asn Phe Ala Gln Phe Ala Gln Lys Tyr Asn Leu 660 665 670 Ile Ile Thr Ser Tyr Pro Leu Thr Phe Arg Asp Glu Lys Glu Leu Lys 675 680 685 Thr Val Asn Trp Lys Gly Leu Val Leu Asp Glu Ala Gln Asn Ile Lys 690 695 700 Asn Pro Glu Ala Lys Gln Ser Lys Thr Val Arg Asn Leu Gln Ala Ser 705 710 715 720 Phe Lys Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Ser Glu 725 730 735 Leu Trp Ser Ile Met Asp Phe Leu Asn Pro Gly Tyr Leu Gly Gln Arg 740 745 750 Gln Phe Phe Gln Arg Arg Phe Ala Ile Pro Ile Glu Lys Tyr Gly Asp 755 760 765 Thr Asp Ser Leu Lys Thr Leu Arg Ser Leu Val Gln Pro Phe Ile Leu 770 775 780 Arg Arg Leu Lys Thr Asp Arg Glu Ile Ile Gln Asp Leu Pro Glu Lys 785 790 795 800 Gln Glu Asn Thr Ile Phe Cys Ser Leu Ser Thr Glu Gln Ala Thr Leu 805 810 815 Tyr Gln Lys Ile Val Asp Gln Ser Leu Ala Asp Ile Asp Ser Ala Ala 820 825 830 Gly Ile Gln Arg Arg Gly Met Ile Leu Ala Leu Leu Val Lys Leu Lys 835 840 845 Gln Val Cys Asn His Pro Ile Leu Leu Asn Gly Lys Ala Thr Lys Thr 850 855 860 Gly Lys Lys Lys Val Glu Thr Gln Gly Leu Ser Leu Gln Ser Ser Gly 865 870 875 880 Lys Leu Gln Arg Phe Lys Glu Met Leu Glu Glu Leu Leu Ser Glu Gly 885 890 895 Asp Arg Ala Ile Val Phe Thr Gln Phe Ala Glu Trp Gly Lys Val Leu 900 905 910 Gln Pro Tyr Leu Glu Gln Gln Leu Asn Arg Glu Val Leu Phe Leu Tyr 915 920 925 Gly Ala Thr Arg Lys Asn Lys Arg Glu Glu Met Ile Asp Arg Phe Gln 930 935 940 Gln Asp Pro Gln Gly Pro Pro Ile Phe Ile Leu Ser Leu Lys Ala Gly 945 950 955 960 Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His Val Phe His Phe Asp 965 970 975 Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Val Phe 980 985 990 Arg Ile Gly Gln Thr Arg Asn Val Gln Val His Lys Phe Val Cys Thr 995 1000 1005 Gly Thr Leu Glu Glu Lys Ile His Asp Leu Ile Glu Ser Lys Lys 1010 1015 1020 Val Leu Ala Glu Gln Val Val Gly Ser Gly Glu Asn Trp Leu Thr 1025 1030 1035 Glu Leu Asp Thr Asp Gln Leu Arg Asn Leu Leu Ile Ile Asp Arg 1040 1045 1050 Asn Ala Val Ile Asp Glu Glu Glu 1055 1060 <210> 43 <211> 3237 <212> DNA <213> Methanosarcina acetivorans <400> 43 atgataattt tgcatgcagg aagagtcgga aaacagttct ttctgtgggg cgaaagcccg 60 gctgaaaatg aaactccgcc tgtccggcgc gggagaaagc ctaagaagcc ggttgcaaaa 120 ccttatcctt acgattcggg tgttgaaaac ctgtcttctg ctcttgagct gctgctgggc 180 agtactggcc ggaaaaaggc agaggaaatc aatgtctgga tcccgacagc aggctggaat 240 ccaatcccct ccagtcctct cgttgctgaa attccggctt cgaaagcaga actttcccta 300 gctccctgga ctgttcacgc atatcctctg gaagctgaag aagctattgt tctcctctgc 360 gcctgtatgg gaaaaaaggt tcttgctccc ggcataatct cgggaaatga tcttctctgg 420 tgggcggatg ccctgaaatt tgcaggctcg ctggtagcag gacagaaata cctgcctggc 480 gtcaggggcg gggaaggaga gtacaaggct ttctgggaac ccgtattttc cggagaagat 540 gcgggggagc tggcaagact tgcaaagcaa atgcctccgg ctgcaaaggc tcttgctctt 600 gaaacctctt ccgtgcagcc ggaaatactt gctgctgtag cggcaaggca gtttatcgaa 660 gaggctcttg actggatagt ccggtccgag atcggggaaa aagagcttgc aaaagaggcg 720 cgtaaaagaa aatcctttga tagcgtccat gacgcctggg tttccgctct taaaagccct 780 gacgggttga tccacggaga agaaaaagaa ctcctgcagc ttgcgttccg gacccgtgaa 840 tggcagcgcc cccttactgt acttacaact tctcccttca ggttctgttt ccggcttgaa 900 gagccagctg cggaagaaga actcgaagaa accgaggaat ccgaagccgg aaaaatggat 960 actaaaaaag gcaggaaagg gatagctgac atagaagttc ccgaagaact ctggtacgtc 1020 cgctatatgc ttcagtccta cgaagaccca agccttctga ttcctgtaaa agaggcctgg 1080 aaaccaaaga agggcagccc gttgaaaaga tatgatgtaa aaaacattcg ccaatttctg 1140 ttatcttccc ttggacaggc tgctggcatc agtgcaggaa ttgcttccag ccttgaagct 1200 cccaacccgt ccggatattc ccttgatacg aaagaagctt accgcttcct gactgaaagt 1260 gcagcggatt taagccaggc gggcttcggg ttacttctcc ccggctggtg gacccgtaaa 1320 ggtacaaaga cccacttaaa agcccaggct aatgttaagg gcaagaagtt gaaggccgga 1380 tacgggctta cactcgataa aatcgtcagc tttgactggg aaattgccct tggagaccgt 1440 gcactcacag tcagggaact gcaggctctt gcaaagctca aagctccgct tgtgaaattc 1500 cgcgggcagt gggtcgaggt caacgatgcg gaaatccggg ctgcccttga gttctggaag 1560 aaaaaccccc acggggaagc aagtctgcgc gaagttctaa aactggctgt gggagtctcc 1620 gaaaaagccg atggtgtaga cgttgaaggg cttaatgcag ccggctggat cgaagaatta 1680 atccgccgcc tgaaggacaa aaccgggttt gaagaacttc cggctcctga cggtttttca 1740 ggcaccctca ggccctacca gttcagaggt tactcctggc tggctttcct gaggcagtgg 1800 ggcataggag cctgccttgc agacgacatg gggcttggta aaaccatcca gacccttgcc 1860 cttatccagc acgacctgga acaggttaaa gggcaggttg aagaaaaggt tatagaaaat 1920 gctgaagaaa aagttgaagg acttaaagct gcaaaaccgg ttcttctggt ctgtccgacc 1980 tctgtcatca acaactggaa aaaagaggcg gctcgcttta ccccggaact ttcggtaatg 2040 gtccaccacg ggaccagccg gaaaaaggaa gaggaattca aaaaggaagc cacgaatcat 2100 tctattgtcg tctcaagcta cgggcttttg cagcgggatc ttaagttttt aaaaggggtt 2160 tcctgggccg gagtggtact tgacgaagcc cagaatatca aaaacccgga aaccaaacag 2220 gcaaaggcag ccagagctct tgaagccgat taccgcatag ctcttacggg gactccggtt 2280 gaaaacaacg tgggagacct ctggtctatc atggagtttt taaaccccgg cttcctaggc 2340 aaccaggcag gtttcaagcg gaatttcttt attcccattc aggccgaaag ggatcaggaa 2400 gctgcaagga ggttaaaaga aattacgggc ccctttatcc tgcgccgtct gaagaccgat 2460 acttcgatta tctccgacct gccggaaaag atggaaatga aaacctattg tacgctgaca 2520 aaagaacagg cttccctcta tgccgcagtc ctcgaagaca tcgaagagac gatggaagag 2580 gctgaagaag gcatccagag aaaaggtata atcctgtccg cccttaccag gctcaaacag 2640 gtctgcaacc atccggcgca gtttttgaag gataactctg ctgtacccgg caggtcagga 2700 aaacttgcaa ggcttaccga aatgctggat gtaatcctgg aaaatgggga aaaagccctt 2760 gtgttcaccc agtttgcgga gatgggaaaa atgctaaaag aacacctgca ggcaagtttt 2820 ggctgtgaag tccttttcct gcacggcggg gtccccagaa agcagaggga tcggatgctt 2880 gagcgtttcc aggagggaaa agaatacctc cctatctttg tcctctccct taaagctgga 2940 ggcacggggc ttaaccttac aggagcgaac cacgttttcc attttgaccg ctggtggaac 3000 cctgctgttg aaaaccaggc tacggacagg gctttccgta taggccagac gaaaaatgta 3060 gaggtgcata agttcatctg tgcgggtacg cttgaagaaa aaatcgatga gattatcgag 3120 cgcaaagtgc aggttgcaga gaacgttgtc ggaacaggtg aaggttggct gacagaactt 3180 tccaacgagg aattgaagga tattcttgct ctccgagaag aagcggtagg tgaataa 3237 <210> 44 <211> 1078 <212> PRT <213> Methanosarcina acetivorans <400> 44 Met Ile Ile Leu His Ala Gly Arg Val Gly Lys Gln Phe Phe Leu Trp 1 5 10 15 Gly Glu Ser Pro Ala Glu Asn Glu Thr Pro Pro Val Arg Arg Gly Arg 20 25 30 Lys Pro Lys Lys Pro Val Ala Lys Pro Tyr Pro Tyr Asp Ser Gly Val 35 40 45 Glu Asn Leu Ser Ser Ala Leu Glu Leu Leu Leu Gly Ser Thr Gly Arg 50 55 60 Lys Lys Ala Glu Glu Ile Asn Val Trp Ile Pro Thr Ala Gly Trp Asn 65 70 75 80 Pro Ile Pro Ser Ser Pro Leu Val Ala Glu Ile Pro Ala Ser Lys Ala 85 90 95 Glu Leu Ser Leu Ala Pro Trp Thr Val His Ala Tyr Pro Leu Glu Ala 100 105 110 Glu Glu Ala Ile Val Leu Leu Cys Ala Cys Met Gly Lys Lys Val Leu 115 120 125 Ala Pro Gly Ile Ile Ser Gly Asn Asp Leu Leu Trp Trp Ala Asp Ala 130 135 140 Leu Lys Phe Ala Gly Ser Leu Val Ala Gly Gln Lys Tyr Leu Pro Gly 145 150 155 160 Val Arg Gly Gly Glu Gly Glu Tyr Lys Ala Phe Trp Glu Pro Val Phe 165 170 175 Ser Gly Glu Asp Ala Gly Glu Leu Ala Arg Leu Ala Lys Gln Met Pro 180 185 190 Pro Ala Ala Lys Ala Leu Ala Leu Glu Thr Ser Ser Val Gln Pro Glu 195 200 205 Ile Leu Ala Ala Val Ala Ala Arg Gln Phe Ile Glu Glu Ala Leu Asp 210 215 220 Trp Ile Val Arg Ser Glu Ile Gly Glu Lys Glu Leu Ala Lys Glu Ala 225 230 235 240 Arg Lys Arg Lys Ser Phe Asp Ser Val His Asp Ala Trp Val Ser Ala 245 250 255 Leu Lys Ser Pro Asp Gly Leu Ile His Gly Glu Glu Lys Glu Leu Leu 260 265 270 Gln Leu Ala Phe Arg Thr Arg Glu Trp Gln Arg Pro Leu Thr Val Leu 275 280 285 Thr Thr Ser Pro Phe Arg Phe Cys Phe Arg Leu Glu Glu Pro Ala Ala 290 295 300 Glu Glu Glu Leu Glu Glu Thr Glu Glu Ser Glu Ala Gly Lys Met Asp 305 310 315 320 Thr Lys Lys Gly Arg Lys Gly Ile Ala Asp Ile Glu Val Pro Glu Glu 325 330 335 Leu Trp Tyr Val Arg Tyr Met Leu Gln Ser Tyr Glu Asp Pro Ser Leu 340 345 350 Leu Ile Pro Val Lys Glu Ala Trp Lys Pro Lys Lys Gly Ser Pro Leu 355 360 365 Lys Arg Tyr Asp Val Lys Asn Ile Arg Gln Phe Leu Leu Ser Ser Leu 370 375 380 Gly Gln Ala Ala Gly Ile Ser Ala Gly Ile Ala Ser Ser Leu Glu Ala 385 390 395 400 Pro Asn Pro Ser Gly Tyr Ser Leu Asp Thr Lys Glu Ala Tyr Arg Phe 405 410 415 Leu Thr Glu Ser Ala Ala Asp Leu Ser Gln Ala Gly Phe Gly Leu Leu 420 425 430 Leu Pro Gly Trp Trp Thr Arg Lys Gly Thr Lys Thr His Leu Lys Ala 435 440 445 Gln Ala Asn Val Lys Gly Lys Lys Leu Lys Ala Gly Tyr Gly Leu Thr 450 455 460 Leu Asp Lys Ile Val Ser Phe Asp Trp Glu Ile Ala Leu Gly Asp Arg 465 470 475 480 Ala Leu Thr Val Arg Glu Leu Gln Ala Leu Ala Lys Leu Lys Ala Pro 485 490 495 Leu Val Lys Phe Arg Gly Gln Trp Val Glu Val Asn Asp Ala Glu Ile 500 505 510 Arg Ala Ala Leu Glu Phe Trp Lys Lys Asn Pro His Gly Glu Ala Ser 515 520 525 Leu Arg Glu Val Leu Lys Leu Ala Val Gly Val Ser Glu Lys Ala Asp 530 535 540 Gly Val Asp Val Glu Gly Leu Asn Ala Ala Gly Trp Ile Glu Glu Leu 545 550 555 560 Ile Arg Arg Leu Lys Asp Lys Thr Gly Phe Glu Glu Leu Pro Ala Pro 565 570 575 Asp Gly Phe Ser Gly Thr Leu Arg Pro Tyr Gln Phe Arg Gly Tyr Ser 580 585 590 Trp Leu Ala Phe Leu Arg Gln Trp Gly Ile Gly Ala Cys Leu Ala Asp 595 600 605 Asp Met Gly Leu Gly Lys Thr Ile Gln Thr Leu Ala Leu Ile Gln His 610 615 620 Asp Leu Glu Gln Val Lys Gly Gln Val Glu Glu Lys Val Ile Glu Asn 625 630 635 640 Ala Glu Glu Lys Val Glu Gly Leu Lys Ala Ala Lys Pro Val Leu Leu 645 650 655 Val Cys Pro Thr Ser Val Ile Asn Asn Trp Lys Lys Glu Ala Ala Arg 660 665 670 Phe Thr Pro Glu Leu Ser Val Met Val His His Gly Thr Ser Arg Lys 675 680 685 Lys Glu Glu Glu Phe Lys Lys Glu Ala Thr Asn His Ser Ile Val Val 690 695 700 Ser Ser Tyr Gly Leu Leu Gln Arg Asp Leu Lys Phe Leu Lys Gly Val 705 710 715 720 Ser Trp Ala Gly Val Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro 725 730 735 Glu Thr Lys Gln Ala Lys Ala Ala Arg Ala Leu Glu Ala Asp Tyr Arg 740 745 750 Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Asn Val Gly Asp Leu Trp 755 760 765 Ser Ile Met Glu Phe Leu Asn Pro Gly Phe Leu Gly Asn Gln Ala Gly 770 775 780 Phe Lys Arg Asn Phe Phe Ile Pro Ile Gln Ala Glu Arg Asp Gln Glu 785 790 795 800 Ala Ala Arg Arg Leu Lys Glu Ile Thr Gly Pro Phe Ile Leu Arg Arg 805 810 815 Leu Lys Thr Asp Thr Ser Ile Ile Ser Asp Leu Pro Glu Lys Met Glu 820 825 830 Met Lys Thr Tyr Cys Thr Leu Thr Lys Glu Gln Ala Ser Leu Tyr Ala 835 840 845 Ala Val Leu Glu Asp Ile Glu Glu Thr Met Glu Glu Ala Glu Glu Gly 850 855 860 Ile Gln Arg Lys Gly Ile Ile Leu Ser Ala Leu Thr Arg Leu Lys Gln 865 870 875 880 Val Cys Asn His Pro Ala Gln Phe Leu Lys Asp Asn Ser Ala Val Pro 885 890 895 Gly Arg Ser Gly Lys Leu Ala Arg Leu Thr Glu Met Leu Asp Val Ile 900 905 910 Leu Glu Asn Gly Glu Lys Ala Leu Val Phe Thr Gln Phe Ala Glu Met 915 920 925 Gly Lys Met Leu Lys Glu His Leu Gln Ala Ser Phe Gly Cys Glu Val 930 935 940 Leu Phe Leu His Gly Gly Val Pro Arg Lys Gln Arg Asp Arg Met Leu 945 950 955 960 Glu Arg Phe Gln Glu Gly Lys Glu Tyr Leu Pro Ile Phe Val Leu Ser 965 970 975 Leu Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Gly Ala Asn His Val 980 985 990 Phe His Phe Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr 995 1000 1005 Asp Arg Ala Phe Arg Ile Gly Gln Thr Lys Asn Val Glu Val His 1010 1015 1020 Lys Phe Ile Cys Ala Gly Thr Leu Glu Glu Lys Ile Asp Glu Ile 1025 1030 1035 Ile Glu Arg Lys Val Gln Val Ala Glu Asn Val Val Gly Thr Gly 1040 1045 1050 Glu Gly Trp Leu Thr Glu Leu Ser Asn Glu Glu Leu Lys Asp Ile 1055 1060 1065 Leu Ala Leu Arg Glu Glu Ala Val Gly Glu 1070 1075 <210> 45 <211> 3147 <212> DNA <213> Methanospirillum hungatei <400> 45 gtgaccgcga aacgaccagc accaatccac gataaagaag aagagaccat acccgatact 60 tcgcttccgg tctttcatgc cctgatttac ccggccgttg aaggggtagc gatatgtgcc 120 gaatatataa ctgataaacc tgcaccggtc aggaaaaaag gctacgcaaa ggataaacct 180 ggcgaatatc catattccct ggatcatacc gcccttaaaa cgctcataga gaactgtttt 240 ggagcatatg atgacctgaa ggctaccaga tggattatct atctccccgc tgaagaaacg 300 gttcctcctt cctctcagtt ctcatcaaaa aagaagccat caccaaagga gaaaaaactc 360 ccccttgttc cgatgtatat ccccgttctt ctctgcccgt atgaaacctt ttttcaaatc 420 tggaaagccg ctcagaatac agataaaaat tatattgctg gcgattcctt ccagtacatc 480 tccattctga tggagagtac cgtccggctc atacaaaacg gacggttcaa accatctcta 540 gaacggacct ttgccggata tcatgccgta tgggtacctg ccctttctcc tcaggatatg 600 gaatgggtat cagatttttc aagccggatg ccaacggtct gcaagtacgc tatcccccgg 660 gtcgcaaaag atccctacat ttataaacct gagaccagat tagagaaatt catcgttgag 720 atgatgcggg tgatcatccg tactgccctt ggtggttata cactgaaaga agagacagat 780 cccttttatg aaccctcaga aaacgagatg cagttcatga ctgaccttct cggggtaacc 840 gacccaataa ggaacaaagg atttgagaga actttcttac gggcgatgca ggactggctg 900 accttctcaa gttcaggacg gtttgctccc tttgagttct gcatgatcat aaaagatcca 960 ccagaaggac agacagaacc atgggatttc actctcgcgg tcagatcaga ggcagaacca 1020 tctcttctca tcccggcaga aataatctgg gaattgcctg atcaccagag cgggctcttc 1080 ccccaggcag cctatctcaa acatatcctc cttgctggta tcgggctctt gacctcatca 1140 tcatcggcat tatggcgtcc cctgtccgga tcgaaaccca ccgggggaag tatgaccctg 1200 aaagaggctg caacgttctt gggttcagac ctcgcaagag ccaggaggaa gggagtaacg 1260 gtgctcctgc cagactggtg gactgatacg acctatacac cacgggttga aatccatgca 1320 aggcggcggg atcccaccca tacgcagaca cggataggac tgcaggaact cctttctttt 1380 gattaccgga ttgcaatcgg tgatgagtca ttttcaccgg atgagttctg ggaaaaggta 1440 aaagaaaagg ctccctttat ctggctgggg aaccggtgga tatcctttca tccggatgcg 1500 atacaacatg ccctggattc tttcagcagg catcagagca aaggagggga tacaatagga 1560 gatctgctcc ggctctccct gaaaaaaatg gaggattccg cggtaccggt atcgattcat 1620 gcaaaagatg actgggttgc ggatcttctg gattttttca ggaccgaaac aaatcaggca 1680 gttccagtcc caaagaaatt taaagggata ctcaggccat accaggaaga ggggttctcc 1740 ttcctttgtc aatgtaccag aaggggcttt ggagcctgcc ttgcagatga catggggctt 1800 ggaaaaactc cccagacact tgcatggctg gtctatctca aggagaaaga aaaacccacg 1860 actccgtccc tccttatatg cccgatgtcg gttgttggga actgggagcg ggagatacag 1920 cggtttgcgc catcactccg ttcatgggtg catcatggga ctgaccgatg caaaggcgat 1980 gattttgtga gacatgtcgg ttcatatgac ctggtcctga ccacctatca tctggcagca 2040 cgggacgtag accacctcaa aaccgttccc tggtctgcaa tcattcttga cgaggcacaa 2100 aatatcaaga acctccatgc aaaccagacc gtagcagtca aatctctcac cggtgagaga 2160 cgggttgctc tgaccggaac cccggtggag aaccggttac tcgaactctg gtctatcatg 2220 gactttttaa atccaggata ccttggttca cagagtgcat ttacaaaccg ctattcccgc 2280 ccgattgagc aggaaaaaaa tacggaactg atacaggaat taaggtccct catccgtccg 2340 ttcctgctca ggcggatgaa aacagacaag catgttatcg atgatcttcc ggaaaagatg 2400 gagaaccggg tatattgcac cctcacaccc gaacaggcaa ccttatatca ggctgttgtg 2460 cttgatatgg caaagaacct tgataaagtg gagggtattg ccaggaaagg ggcaatcctt 2520 gctgcgatca cacgactgaa acagatctgt aaccatccgg gacgtgttgg cagggataaa 2580 acaataaagg ctgagcggtc cgggaaggtg agccggctgc ttgagatgat tgaggagatc 2640 acttccgaag gggactcagc actcatattc agtcagtatg caacatttgc tgaggaactg 2700 gcagggatga tagagaaaca gggagatacg cccgttcttc tcctgaccgg gtcaacacca 2760 cggaaaaaac gggaacagat gatagaggag tttcaggcct caaccacccc gataatcttt 2820 gttatttctc tgaaagccgg gggaacgggt ctgaacctga cgaaagcgac tcatgtgttt 2880 catgtagacc ggtggtggaa tccggcggtt gaagaccagg ctactgaccg gacgtaccgg 2940 atcggacaaa agagaaatgt ccaagttcac ctgatgataa ccgccggaac cctggaggaa 3000 cggatagatc tgataaacca ggagaaacgg acgcttgcaa aggaagtcct tgcacagagt 3060 gatgagtatc tgacaaatct ctcaacaaaa gaacttctgg agattgtatc acttcgtgac 3120 agtctctttc gcggggagga tgcatga 3147 <210> 46 <211> 1048 <212> PRT <213> Methanospirillum hungatei <400> 46 Val Thr Ala Lys Arg Pro Ala Pro Ile His Asp Lys Glu Glu Glu Thr 1 5 10 15 Ile Pro Asp Thr Ser Leu Pro Val Phe His Ala Leu Ile Tyr Pro Ala 20 25 30 Val Glu Gly Val Ala Ile Cys Ala Glu Tyr Ile Thr Asp Lys Pro Ala 35 40 45 Pro Val Arg Lys Lys Gly Tyr Ala Lys Asp Lys Pro Gly Glu Tyr Pro 50 55 60 Tyr Ser Leu Asp His Thr Ala Leu Lys Thr Leu Ile Glu Asn Cys Phe 65 70 75 80 Gly Ala Tyr Asp Asp Leu Lys Ala Thr Arg Trp Ile Ile Tyr Leu Pro 85 90 95 Ala Glu Glu Thr Val Pro Pro Ser Ser Gln Phe Ser Ser Lys Lys Lys 100 105 110 Pro Ser Pro Lys Glu Lys Lys Leu Pro Leu Val Pro Met Tyr Ile Pro 115 120 125 Val Leu Leu Cys Pro Tyr Glu Thr Phe Phe Gln Ile Trp Lys Ala Ala 130 135 140 Gln Asn Thr Asp Lys Asn Tyr Ile Ala Gly Asp Ser Phe Gln Tyr Ile 145 150 155 160 Ser Ile Leu Met Glu Ser Thr Val Arg Leu Ile Gln Asn Gly Arg Phe 165 170 175 Lys Pro Ser Leu Glu Arg Thr Phe Ala Gly Tyr His Ala Val Trp Val 180 185 190 Pro Ala Leu Ser Pro Gln Asp Met Glu Trp Val Ser Asp Phe Ser Ser 195 200 205 Arg Met Pro Thr Val Cys Lys Tyr Ala Ile Pro Arg Val Ala Lys Asp 210 215 220 Pro Tyr Ile Tyr Lys Pro Glu Thr Arg Leu Glu Lys Phe Ile Val Glu 225 230 235 240 Met Met Arg Val Ile Ile Arg Thr Ala Leu Gly Gly Tyr Thr Leu Lys 245 250 255 Glu Glu Thr Asp Pro Phe Tyr Glu Pro Ser Glu Asn Glu Met Gln Phe 260 265 270 Met Thr Asp Leu Leu Gly Val Thr Asp Pro Ile Arg Asn Lys Gly Phe 275 280 285 Glu Arg Thr Phe Leu Arg Ala Met Gln Asp Trp Leu Thr Phe Ser Ser 290 295 300 Ser Gly Arg Phe Ala Pro Phe Glu Phe Cys Met Ile Ile Lys Asp Pro 305 310 315 320 Pro Glu Gly Gln Thr Glu Pro Trp Asp Phe Thr Leu Ala Val Arg Ser 325 330 335 Glu Ala Glu Pro Ser Leu Leu Ile Pro Ala Glu Ile Ile Trp Glu Leu 340 345 350 Pro Asp His Gln Ser Gly Leu Phe Pro Gln Ala Ala Tyr Leu Lys His 355 360 365 Ile Leu Leu Ala Gly Ile Gly Leu Leu Thr Ser Ser Ser Ser Ala Leu 370 375 380 Trp Arg Pro Leu Ser Gly Ser Lys Pro Thr Gly Gly Ser Met Thr Leu 385 390 395 400 Lys Glu Ala Ala Thr Phe Leu Gly Ser Asp Leu Ala Arg Ala Arg Arg 405 410 415 Lys Gly Val Thr Val Leu Leu Pro Asp Trp Trp Thr Asp Thr Thr Tyr 420 425 430 Thr Pro Arg Val Glu Ile His Ala Arg Arg Arg Asp Pro Thr His Thr 435 440 445 Gln Thr Arg Ile Gly Leu Gln Glu Leu Leu Ser Phe Asp Tyr Arg Ile 450 455 460 Ala Ile Gly Asp Glu Ser Phe Ser Pro Asp Glu Phe Trp Glu Lys Val 465 470 475 480 Lys Glu Lys Ala Pro Phe Ile Trp Leu Gly Asn Arg Trp Ile Ser Phe 485 490 495 His Pro Asp Ala Ile Gln His Ala Leu Asp Ser Phe Ser Arg His Gln 500 505 510 Ser Lys Gly Gly Asp Thr Ile Gly Asp Leu Leu Arg Leu Ser Leu Lys 515 520 525 Lys Met Glu Asp Ser Ala Val Pro Val Ser Ile His Ala Lys Asp Asp 530 535 540 Trp Val Ala Asp Leu Leu Asp Phe Phe Arg Thr Glu Thr Asn Gln Ala 545 550 555 560 Val Pro Val Pro Lys Lys Phe Lys Gly Ile Leu Arg Pro Tyr Gln Glu 565 570 575 Glu Gly Phe Ser Phe Leu Cys Gln Cys Thr Arg Arg Gly Phe Gly Ala 580 585 590 Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Thr Leu Ala 595 600 605 Trp Leu Val Tyr Leu Lys Glu Lys Glu Lys Pro Thr Thr Pro Ser Leu 610 615 620 Leu Ile Cys Pro Met Ser Val Val Gly Asn Trp Glu Arg Glu Ile Gln 625 630 635 640 Arg Phe Ala Pro Ser Leu Arg Ser Trp Val His His Gly Thr Asp Arg 645 650 655 Cys Lys Gly Asp Asp Phe Val Arg His Val Gly Ser Tyr Asp Leu Val 660 665 670 Leu Thr Thr Tyr His Leu Ala Ala Arg Asp Val Asp His Leu Lys Thr 675 680 685 Val Pro Trp Ser Ala Ile Ile Leu Asp Glu Ala Gln Asn Ile Lys Asn 690 695 700 Leu His Ala Asn Gln Thr Val Ala Val Lys Ser Leu Thr Gly Glu Arg 705 710 715 720 Arg Val Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Leu Glu Leu 725 730 735 Trp Ser Ile Met Asp Phe Leu Asn Pro Gly Tyr Leu Gly Ser Gln Ser 740 745 750 Ala Phe Thr Asn Arg Tyr Ser Arg Pro Ile Glu Gln Glu Lys Asn Thr 755 760 765 Glu Leu Ile Gln Glu Leu Arg Ser Leu Ile Arg Pro Phe Leu Leu Arg 770 775 780 Arg Met Lys Thr Asp Lys His Val Ile Asp Asp Leu Pro Glu Lys Met 785 790 795 800 Glu Asn Arg Val Tyr Cys Thr Leu Thr Pro Glu Gln Ala Thr Leu Tyr 805 810 815 Gln Ala Val Val Leu Asp Met Ala Lys Asn Leu Asp Lys Val Glu Gly 820 825 830 Ile Ala Arg Lys Gly Ala Ile Leu Ala Ala Ile Thr Arg Leu Lys Gln 835 840 845 Ile Cys Asn His Pro Gly Arg Val Gly Arg Asp Lys Thr Ile Lys Ala 850 855 860 Glu Arg Ser Gly Lys Val Ser Arg Leu Leu Glu Met Ile Glu Glu Ile 865 870 875 880 Thr Ser Glu Gly Asp Ser Ala Leu Ile Phe Ser Gln Tyr Ala Thr Phe 885 890 895 Ala Glu Glu Leu Ala Gly Met Ile Glu Lys Gln Gly Asp Thr Pro Val 900 905 910 Leu Leu Leu Thr Gly Ser Thr Pro Arg Lys Lys Arg Glu Gln Met Ile 915 920 925 Glu Glu Phe Gln Ala Ser Thr Thr Pro Ile Ile Phe Val Ile Ser Leu 930 935 940 Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Lys Ala Thr His Val Phe 945 950 955 960 His Val Asp Arg Trp Trp Asn Pro Ala Val Glu Asp Gln Ala Thr Asp 965 970 975 Arg Thr Tyr Arg Ile Gly Gln Lys Arg Asn Val Gln Val His Leu Met 980 985 990 Ile Thr Ala Gly Thr Leu Glu Glu Arg Ile Asp Leu Ile Asn Gln Glu 995 1000 1005 Lys Arg Thr Leu Ala Lys Glu Val Leu Ala Gln Ser Asp Glu Tyr 1010 1015 1020 Leu Thr Asn Leu Ser Thr Lys Glu Leu Leu Glu Ile Val Ser Leu 1025 1030 1035 Arg Asp Ser Leu Phe Arg Gly Glu Asp Ala 1040 1045 <210> 47 <211> 3270 <212> DNA <213> Methanosarcina mazei <400> 47 atgataattc ttcatgcagg aagagttgga aaacagttct tcttatgggg tgaaagcccg 60 gcagaaaatg aaactccggt tgttcggcgc gggagaaagc ctaaaacccc tatcgtaaaa 120 ccttaccctt acgattcggg ctttgaaaac ctgtcttctg cccttgagct gctgctgggc 180 agtactgacc ggaaaaaggc ggagaaaatc aacgtctgga ccccaactat cggagggaat 240 cctgtccctt ccagccctct tgttgctgaa atttcggatt cgaaagcaga acctgcactg 300 gctccctgta ctgttcacgc atatcctctg gaagctgaag aagctattgt tctcctctgc 360 acctgtatgg aaaaaaaggt tctggctccc ggtatcatct cgggaaatga ccttctctgg 420 tgggcagatg ccctgaaatt tgcaggctcg ctggtagcag ggcagaaata tttgcctggc 480 gtcaggggcg gggaaggaga gtacagggct ttctgggaac ccgtattttc cggcgaagat 540 gccggaaagc tggcaaaact tgcaaagcaa atgcctcctg ctgcaagggc tcttgctcct 600 gaagcctctt ccatgccgcc ggaaatgcct gctgctttag cggcaaagca gtttattgaa 660 gactctctcg actggatagt ccggtccgag atcggggaaa aaaagcttgc aaaagagacg 720 cgcaaaagaa aatcctttga tagcgtccat gatgcctggg tttctgctct tagaagccct 780 gaagggctga tctatggaga cgaaaacgaa cttctgcagc ttgcggcccg gacccgcgaa 840 tggcagcgcc cactcaccat ccttaccact tctcctttca ggttctgttt ccgtcttgaa 900 gaaccggctt tagaagaaga gatcgaagaa actgaagaaa ccgaagaaat agaagaaaat 960 gaagccggga aaagagatac taaaaaaggc agggaaggga tagctgatat agaagttccc 1020 gaagggctct ggtacgtccg ttatatgctt cagtcctacg aagacccgag ccttctgatc 1080 cctgtaaaag aagcctggaa gccaaaaaaa ggcagcccgt tgaaaaaata cgatgtgaaa 1140 aacattcgcc aattcctgtt atcttccctt ggacaggctt ccagtataag tgcaggaatt 1200 gcttcgagtc ttgaagctcc caacccatct ggatattccc ttgatactaa agaggcttac 1260 cgctttctga ctgaaagtgc agcgaattta agtcaggccg gtttcggggt acttctccct 1320 ggctggtgga cccgtaaagg tacaaagaca cacttaaaag cccaggctaa tgttaagggc 1380 aagaagaagt tgcaggccgg atacgggctt acactcgatg aaatcgtcag ctttgactgg 1440 gaaatcgccc ttggagacag ggtactgaca gtcagagaac tgcaggctct tgcaaagctt 1500 aaagctccgc ttgtgaaatt ccgcgggcag tgggttgagg taaacgatgc ggaaatcagg 1560 gctgcccttg agttctggaa gaaaaatccc aacggtgaag caagtctgcg tgaagttcta 1620 aaactggcag tgggagtttc cgaaaaagcc gatggtgtga acgttgaagg gctcaatgca 1680 accggatgga ttggagaatt aatcagccgc ttaaaagaca aaaccgggtt tgaagaactt 1740 cctgctccca acggcttttc aggcaccctt cggccatatc agttcagagg ttactcctgg 1800 ctggcttttc tgaggcagtg gggtatagga gcctgccttg cagacgatat ggggcttggt 1860 aaaaccgtcc agactcttgc tcttattcag cacgatctgg aacaggctaa agagaaagct 1920 gaagaaaaga ttgaagaacc ggctgaagaa aagattgaag aaaaagttga cggacgtaag 1980 gccccaaaac ctgttcttct ggtttgtcct acctctgtta tcaacaactg gaaaaaagag 2040 gcttcccgct ttacgccaga actttcggta atggtccacc acgggaccag ccggaaaaag 2100 gaagaggaat tcaagaagga agccatgaat catgctattg tcatctcaag ctatggcctt 2160 gtgcagcggg atcttaaatt tttaaaagag gttcattggg caggagttgt acttgacgaa 2220 gcccagaaca tcaaaaaccc ggaaaccaaa caggcaaagg cagccagggc tcttgaatcc 2280 gattaccgct tagctcttac agggactccg gttgaaaata acgtgggaga cctctggtcc 2340 ataatggagt ttttaaaccc cggcttcctc ggaagtcagg cgggtttcaa gcggaatttc 2400 tttatcccca ttcaggcaga aagggatcag gaggctgcaa ggaggctgaa agaaattaca 2460 ggtcccttca tccttcgccg tttgaagact gacacttcga ttatctccga cctgccggaa 2520 aaaatggaga tgaagaccta ttgtacgctg acaaaagaac aggcctccct ctatgctgca 2580 gtccttgaag acatcagaga agcgattgaa ggagccgaag aaggcatcca gaggaaaggt 2640 ataatcctgt ctgccctttc caggctcaag caggtctgca accaccctgc gcagtttttg 2700 aaggacaact ccactatccc cggcaggtcc ggaaaactcg caaggcttac cgaaatgctg 2760 gatgtagtcc tggaaaacgg ggaaaaagcc cttgttttta cccagtttgc ggagatgggc 2820 aaaatggtga aagaacacct gcaagcaagc tttggctgtg aagtcctttt cctgcacggc 2880 ggggtcccca ggaagcagag agaccggatg cttgagaggt tccaggaagg aaaagaatac 2940 ctccctattt ttgtcctctc ccttaaagcc ggcggcacgg ggcttaacct cacaggggca 3000 aaccacgttt tccactttga tcgctggtgg aacccggctg ttgaaaacca ggctacagac 3060 agggcattcc gtataggcca gaagaaaaac gttgaggtcc ataaattcat ctgcgcaggt 3120 acgcttgaag aaaaaatcga tgagattatc gaacgcaaag tgcaggtcgc agagaacgtt 3180 gttgggacag gtgaagactg gctgacagag ctttccaacg atgaactgaa ggatattctt 3240 gctcttagag aagaagcggt aggtgaataa 3270 <210> 48 <211> 1089 <212> PRT <213> Methanosarcina mazei <400> 48 Met Ile Ile Leu His Ala Gly Arg Val Gly Lys Gln Phe Phe Leu Trp 1 5 10 15 Gly Glu Ser Pro Ala Glu Asn Glu Thr Pro Val Val Arg Arg Gly Arg 20 25 30 Lys Pro Lys Thr Pro Ile Val Lys Pro Tyr Pro Tyr Asp Ser Gly Phe 35 40 45 Glu Asn Leu Ser Ser Ala Leu Glu Leu Leu Leu Gly Ser Thr Asp Arg 50 55 60 Lys Lys Ala Glu Lys Ile Asn Val Trp Thr Pro Thr Ile Gly Gly Asn 65 70 75 80 Pro Val Pro Ser Ser Pro Leu Val Ala Glu Ile Ser Asp Ser Lys Ala 85 90 95 Glu Pro Ala Leu Ala Pro Cys Thr Val His Ala Tyr Pro Leu Glu Ala 100 105 110 Glu Glu Ala Ile Val Leu Leu Cys Thr Cys Met Glu Lys Lys Val Leu 115 120 125 Ala Pro Gly Ile Ile Ser Gly Asn Asp Leu Leu Trp Trp Ala Asp Ala 130 135 140 Leu Lys Phe Ala Gly Ser Leu Val Ala Gly Gln Lys Tyr Leu Pro Gly 145 150 155 160 Val Arg Gly Gly Glu Gly Glu Tyr Arg Ala Phe Trp Glu Pro Val Phe 165 170 175 Ser Gly Glu Asp Ala Gly Lys Leu Ala Lys Leu Ala Lys Gln Met Pro 180 185 190 Pro Ala Ala Arg Ala Leu Ala Pro Glu Ala Ser Ser Met Pro Pro Glu 195 200 205 Met Pro Ala Ala Leu Ala Ala Lys Gln Phe Ile Glu Asp Ser Leu Asp 210 215 220 Trp Ile Val Arg Ser Glu Ile Gly Glu Lys Lys Leu Ala Lys Glu Thr 225 230 235 240 Arg Lys Arg Lys Ser Phe Asp Ser Val His Asp Ala Trp Val Ser Ala 245 250 255 Leu Arg Ser Pro Glu Gly Leu Ile Tyr Gly Asp Glu Asn Glu Leu Leu 260 265 270 Gln Leu Ala Ala Arg Thr Arg Glu Trp Gln Arg Pro Leu Thr Ile Leu 275 280 285 Thr Thr Ser Pro Phe Arg Phe Cys Phe Arg Leu Glu Glu Pro Ala Leu 290 295 300 Glu Glu Glu Ile Glu Glu Thr Glu Glu Thr Glu Glu Ile Glu Glu Asn 305 310 315 320 Glu Ala Gly Lys Arg Asp Thr Lys Lys Gly Arg Glu Gly Ile Ala Asp 325 330 335 Ile Glu Val Pro Glu Gly Leu Trp Tyr Val Arg Tyr Met Leu Gln Ser 340 345 350 Tyr Glu Asp Pro Ser Leu Leu Ile Pro Val Lys Glu Ala Trp Lys Pro 355 360 365 Lys Lys Gly Ser Pro Leu Lys Lys Tyr Asp Val Lys Asn Ile Arg Gln 370 375 380 Phe Leu Leu Ser Ser Leu Gly Gln Ala Ser Ser Ile Ser Ala Gly Ile 385 390 395 400 Ala Ser Ser Leu Glu Ala Pro Asn Pro Ser Gly Tyr Ser Leu Asp Thr 405 410 415 Lys Glu Ala Tyr Arg Phe Leu Thr Glu Ser Ala Ala Asn Leu Ser Gln 420 425 430 Ala Gly Phe Gly Val Leu Leu Pro Gly Trp Trp Thr Arg Lys Gly Thr 435 440 445 Lys Thr His Leu Lys Ala Gln Ala Asn Val Lys Gly Lys Lys Lys Leu 450 455 460 Gln Ala Gly Tyr Gly Leu Thr Leu Asp Glu Ile Val Ser Phe Asp Trp 465 470 475 480 Glu Ile Ala Leu Gly Asp Arg Val Leu Thr Val Arg Glu Leu Gln Ala 485 490 495 Leu Ala Lys Leu Lys Ala Pro Leu Val Lys Phe Arg Gly Gln Trp Val 500 505 510 Glu Val Asn Asp Ala Glu Ile Arg Ala Ala Leu Glu Phe Trp Lys Lys 515 520 525 Asn Pro Asn Gly Glu Ala Ser Leu Arg Glu Val Leu Lys Leu Ala Val 530 535 540 Gly Val Ser Glu Lys Ala Asp Gly Val Asn Val Glu Gly Leu Asn Ala 545 550 555 560 Thr Gly Trp Ile Gly Glu Leu Ile Ser Arg Leu Lys Asp Lys Thr Gly 565 570 575 Phe Glu Glu Leu Pro Ala Pro Asn Gly Phe Ser Gly Thr Leu Arg Pro 580 585 590 Tyr Gln Phe Arg Gly Tyr Ser Trp Leu Ala Phe Leu Arg Gln Trp Gly 595 600 605 Ile Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Val Gln 610 615 620 Thr Leu Ala Leu Ile Gln His Asp Leu Glu Gln Ala Lys Glu Lys Ala 625 630 635 640 Glu Glu Lys Ile Glu Glu Pro Ala Glu Glu Lys Ile Glu Glu Lys Val 645 650 655 Asp Gly Arg Lys Ala Pro Lys Pro Val Leu Leu Val Cys Pro Thr Ser 660 665 670 Val Ile Asn Asn Trp Lys Lys Glu Ala Ser Arg Phe Thr Pro Glu Leu 675 680 685 Ser Val Met Val His His Gly Thr Ser Arg Lys Lys Glu Glu Glu Phe 690 695 700 Lys Lys Glu Ala Met Asn His Ala Ile Val Ile Ser Ser Tyr Gly Leu 705 710 715 720 Val Gln Arg Asp Leu Lys Phe Leu Lys Glu Val His Trp Ala Gly Val 725 730 735 Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro Glu Thr Lys Gln Ala 740 745 750 Lys Ala Ala Arg Ala Leu Glu Ser Asp Tyr Arg Leu Ala Leu Thr Gly 755 760 765 Thr Pro Val Glu Asn Asn Val Gly Asp Leu Trp Ser Ile Met Glu Phe 770 775 780 Leu Asn Pro Gly Phe Leu Gly Ser Gln Ala Gly Phe Lys Arg Asn Phe 785 790 795 800 Phe Ile Pro Ile Gln Ala Glu Arg Asp Gln Glu Ala Ala Arg Arg Leu 805 810 815 Lys Glu Ile Thr Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Thr 820 825 830 Ser Ile Ile Ser Asp Leu Pro Glu Lys Met Glu Met Lys Thr Tyr Cys 835 840 845 Thr Leu Thr Lys Glu Gln Ala Ser Leu Tyr Ala Ala Val Leu Glu Asp 850 855 860 Ile Arg Glu Ala Ile Glu Gly Ala Glu Glu Gly Ile Gln Arg Lys Gly 865 870 875 880 Ile Ile Leu Ser Ala Leu Ser Arg Leu Lys Gln Val Cys Asn His Pro 885 890 895 Ala Gln Phe Leu Lys Asp Asn Ser Thr Ile Pro Gly Arg Ser Gly Lys 900 905 910 Leu Ala Arg Leu Thr Glu Met Leu Asp Val Val Leu Glu Asn Gly Glu 915 920 925 Lys Ala Leu Val Phe Thr Gln Phe Ala Glu Met Gly Lys Met Val Lys 930 935 940 Glu His Leu Gln Ala Ser Phe Gly Cys Glu Val Leu Phe Leu His Gly 945 950 955 960 Gly Val Pro Arg Lys Gln Arg Asp Arg Met Leu Glu Arg Phe Gln Glu 965 970 975 Gly Lys Glu Tyr Leu Pro Ile Phe Val Leu Ser Leu Lys Ala Gly Gly 980 985 990 Thr Gly Leu Asn Leu Thr Gly Ala Asn His Val Phe His Phe Asp Arg 995 1000 1005 Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Phe 1010 1015 1020 Arg Ile Gly Gln Lys Lys Asn Val Glu Val His Lys Phe Ile Cys 1025 1030 1035 Ala Gly Thr Leu Glu Glu Lys Ile Asp Glu Ile Ile Glu Arg Lys 1040 1045 1050 Val Gln Val Ala Glu Asn Val Val Gly Thr Gly Glu Asp Trp Leu 1055 1060 1065 Thr Glu Leu Ser Asn Asp Glu Leu Lys Asp Ile Leu Ala Leu Arg 1070 1075 1080 Glu Glu Ala Val Gly Glu 1085 <210> 49 <211> 3042 <212> DNA <213> Mycobacterium bovis <400> 49 atgctggttt tgcacggctt ctggtccaac tccggcggga tgcggctgtg ggcggaggac 60 tccgatctgc tggtgaagag cccgagtcag gcgctgcgct ccgcgcggcc acacccgttc 120 gcggcgcccg ctgacctgat cgccggcata catccgggca aacccgcaac cgccgttttg 180 ctgttgccgt cgttgcgatc ggcgccgctg gactcgccgg agctgatccg gctcgccccg 240 cgcccggccg cgcgaaccga tccgatgctg ttggcgtgga cggtaccggt ggtggacctg 300 gaccccaccg cggcgttggc cgccttcgac cagcccgccc ccgacgtccg ctacggcgcg 360 tccgtcgact acctggccga gctggccgtt ttcgcgcgcg agttggtcga gcgtggtcgc 420 gtgctgcccc agctgcgccg cgacacccac ggcgcggccg cctgctggcg tccggtgttg 480 cagggacgcg acgtggtcgc gatgacctcg ctggtctcgg cgatgccgcc ggtctgccgc 540 gccgaagttg gtgggcacga cccgcacgaa ctggcaacct cggctctgga cgcgatggtc 600 gacgccgccg tgcgcgcggc gctgtcaccg atggacctgc tgcccccgcg acggggtcgc 660 tccaaacggc atcgggccgt ggaggcttgg ctgaccgcgt tgacctgccc ggacggccgg 720 ttcgacgcgg agcccgacga actcgacgcg ctggccgagg cgttgcggcc atgggacgac 780 gtcggtatcg gcaccgtcgg cccggcgcgg gcgacgtttc ggctgtccga agtcgagacc 840 gaaaacgagg agacgcccgc gggctcgttg tggaggctgg agttcttatt gcagtcgacg 900 caggacccca gcctgctggt ccccgccgag caggcatgga acgacgacgg cagcctgcgc 960 cgctggctgg accggccgca ggagctgctg ctgaccgaac tgggccgggc ctctcggatt 1020 ttccccgagc tcgtcccggc gctgcgcacc gcgtgcccgt ccgggcttga gctcgacgcc 1080 gacggcgcct accgattcct gtcgggtacg gccgcggtgc tcgacgaggc tgggtttggc 1140 gtgctgctgc cgtcctggtg ggaccgccgc cgcaagctgg gcttggtcct gtccgcatat 1200 accccggtcg acggcgtggt gggcaaggcc agcaagttcg gccgcgagca gctcgtcgag 1260 ttccgctggg agctggccgt gggcgacgat ccgctcagcg aggaggagat cgcggcgctg 1320 accgaaacca agtccccgct gatccggctg cgtggccagt gggtggcgct cgataccgaa 1380 cagctgcgcc gcgggctgga gtttttggag cgtaagccaa ccggccgcaa gaccaccgcc 1440 gagatcctcg cgctggccgc cagccacccc gacgacgtgg acaccccgct cgaggtcacc 1500 gccgtacgcg ccgacggctg gctcggggac ctgctcgccg gggccgccgc ggcgtcgctg 1560 cagccgttgg acccgcccga cggattcacc gcgacgctgc gtccctacca gcagcgcggt 1620 ctggcgtggc tggcgttttt gtcctcgctc ggtttgggca gctgcctggc cgacgacatg 1680 ggcctgggca agacggtgca gctattggcc ctggaaacct tggaatccgt tcagcgccac 1740 caggatcgcg gcgtcggacc cacactgcta ctgtgcccga tgtcgttggt gggcaactgg 1800 cagcaggaag cggccaggtt tgcacccaac ctgcgggtgt acgcccacca cgggggcgcc 1860 cggctgcacg gcgaggcgtt gcgcgaccac ctcgagcgca ccgacctggt cgtgagcacc 1920 tataccaccg ccacccgcga catcgacgag ctgtcggaat acgaatggaa ccgggtggtg 1980 ctggacgagg cccaggcggt gaagaacagc ctgtcccggg cggccaaggc ggtgcgacgg 2040 ctacgcgcgg cgcaccgggt cgcgctgacc gggacaccga tggagaaccg gctcgccgag 2100 ctgtggtcga tcatggactt cctcaacccg ggcctgctcg gatcctccga acgcttccgc 2160 acccgctacg cgatcccgat cgagcggcac gggcacaccg aaccggccga acggctgcgc 2220 gcatcgacgc ggccctacat cctgcgccgg ctcaagaccg acccggcgat catcgacgat 2280 ctgccggaga agatcgagat caagcagtac tgccaactca ccaccgagca ggcgtcgctg 2340 tatcaggccg tcgtcgccga catgatggaa aagatcgaaa acaccgaagg gatcgagcgg 2400 cgcggcaacg tgctggccgc gatggccaag ctcaaacagg tgtgcaacca ccccgcccag 2460 ctgctgcacg atcgctcccc ggtcggtcgg cggtccggga aggtgatccg gctcgaggag 2520 atcctggaag agatcctggc cgagggcgac cgggtgctgt gttttaccca gttcaccgag 2580 ttcgccgagc tgctggtgcc gcacctggcc gcacgcttcg gccgtgccgc ccgagacatt 2640 gcctacctgc acggtggcac cccgaggaag cggcgtgacg agatggtggc ccggttccag 2700 tccggtgacg gcccgcccat ttttctgctg tcgttgaagg cgggcggtac cgggctgaac 2760 ctcaccgccg ccaatcatgt tgtgcacctg gaccgctggt ggaacccggc ggtcgagaac 2820 caggcgacgg accgggcgtt tcggatcggg cagcggcgca cggtgcaggt ccgcaagttc 2880 atctgcaccg gcaccctcga ggagaagatc gacgaaatga tcgaggagaa aaaggcgctg 2940 gccgacttgg tggtcaccga cggcgaaggc tggctgaccg aactgtccac ccgcgatctg 3000 cgcgaggtgt tcgcgctgtc cgaaggcgcc gtcggtgagt ag 3042 <210> 50 <211> 1013 <212> PRT <213> Mycobacterium bovis <400> 50 Met Leu Val Leu His Gly Phe Trp Ser Asn Ser Gly Gly Met Arg Leu 1 5 10 15 Trp Ala Glu Asp Ser Asp Leu Leu Val Lys Ser Pro Ser Gln Ala Leu 20 25 30 Arg Ser Ala Arg Pro His Pro Phe Ala Ala Pro Ala Asp Leu Ile Ala 35 40 45 Gly Ile His Pro Gly Lys Pro Ala Thr Ala Val Leu Leu Leu Pro Ser 50 55 60 Leu Arg Ser Ala Pro Leu Asp Ser Pro Glu Leu Ile Arg Leu Ala Pro 65 70 75 80 Arg Pro Ala Ala Arg Thr Asp Pro Met Leu Leu Ala Trp Thr Val Pro 85 90 95 Val Val Asp Leu Asp Pro Thr Ala Ala Leu Ala Ala Phe Asp Gln Pro 100 105 110 Ala Pro Asp Val Arg Tyr Gly Ala Ser Val Asp Tyr Leu Ala Glu Leu 115 120 125 Ala Val Phe Ala Arg Glu Leu Val Glu Arg Gly Arg Val Leu Pro Gln 130 135 140 Leu Arg Arg Asp Thr His Gly Ala Ala Ala Cys Trp Arg Pro Val Leu 145 150 155 160 Gln Gly Arg Asp Val Val Ala Met Thr Ser Leu Val Ser Ala Met Pro 165 170 175 Pro Val Cys Arg Ala Glu Val Gly Gly His Asp Pro His Glu Leu Ala 180 185 190 Thr Ser Ala Leu Asp Ala Met Val Asp Ala Ala Val Arg Ala Ala Leu 195 200 205 Ser Pro Met Asp Leu Leu Pro Pro Arg Arg Gly Arg Ser Lys Arg His 210 215 220 Arg Ala Val Glu Ala Trp Leu Thr Ala Leu Thr Cys Pro Asp Gly Arg 225 230 235 240 Phe Asp Ala Glu Pro Asp Glu Leu Asp Ala Leu Ala Glu Ala Leu Arg 245 250 255 Pro Trp Asp Asp Val Gly Ile Gly Thr Val Gly Pro Ala Arg Ala Thr 260 265 270 Phe Arg Leu Ser Glu Val Glu Thr Glu Asn Glu Glu Thr Pro Ala Gly 275 280 285 Ser Leu Trp Arg Leu Glu Phe Leu Leu Gln Ser Thr Gln Asp Pro Ser 290 295 300 Leu Leu Val Pro Ala Glu Gln Ala Trp Asn Asp Asp Gly Ser Leu Arg 305 310 315 320 Arg Trp Leu Asp Arg Pro Gln Glu Leu Leu Leu Thr Glu Leu Gly Arg 325 330 335 Ala Ser Arg Ile Phe Pro Glu Leu Val Pro Ala Leu Arg Thr Ala Cys 340 345 350 Pro Ser Gly Leu Glu Leu Asp Ala Asp Gly Ala Tyr Arg Phe Leu Ser 355 360 365 Gly Thr Ala Ala Val Leu Asp Glu Ala Gly Phe Gly Val Leu Leu Pro 370 375 380 Ser Trp Trp Asp Arg Arg Arg Lys Leu Gly Leu Val Leu Ser Ala Tyr 385 390 395 400 Thr Pro Val Asp Gly Val Val Gly Lys Ala Ser Lys Phe Gly Arg Glu 405 410 415 Gln Leu Val Glu Phe Arg Trp Glu Leu Ala Val Gly Asp Asp Pro Leu 420 425 430 Ser Glu Glu Glu Ile Ala Ala Leu Thr Glu Thr Lys Ser Pro Leu Ile 435 440 445 Arg Leu Arg Gly Gln Trp Val Ala Leu Asp Thr Glu Gln Leu Arg Arg 450 455 460 Gly Leu Glu Phe Leu Glu Arg Lys Pro Thr Gly Arg Lys Thr Thr Ala 465 470 475 480 Glu Ile Leu Ala Leu Ala Ala Ser His Pro Asp Asp Val Asp Thr Pro 485 490 495 Leu Glu Val Thr Ala Val Arg Ala Asp Gly Trp Leu Gly Asp Leu Leu 500 505 510 Ala Gly Ala Ala Ala Ala Ser Leu Gln Pro Leu Asp Pro Pro Asp Gly 515 520 525 Phe Thr Ala Thr Leu Arg Pro Tyr Gln Gln Arg Gly Leu Ala Trp Leu 530 535 540 Ala Phe Leu Ser Ser Leu Gly Leu Gly Ser Cys Leu Ala Asp Asp Met 545 550 555 560 Gly Leu Gly Lys Thr Val Gln Leu Leu Ala Leu Glu Thr Leu Glu Ser 565 570 575 Val Gln Arg His Gln Asp Arg Gly Val Gly Pro Thr Leu Leu Leu Cys 580 585 590 Pro Met Ser Leu Val Gly Asn Trp Gln Gln Glu Ala Ala Arg Phe Ala 595 600 605 Pro Asn Leu Arg Val Tyr Ala His His Gly Gly Ala Arg Leu His Gly 610 615 620 Glu Ala Leu Arg Asp His Leu Glu Arg Thr Asp Leu Val Val Ser Thr 625 630 635 640 Tyr Thr Thr Ala Thr Arg Asp Ile Asp Glu Leu Ser Glu Tyr Glu Trp 645 650 655 Asn Arg Val Val Leu Asp Glu Ala Gln Ala Val Lys Asn Ser Leu Ser 660 665 670 Arg Ala Ala Lys Ala Val Arg Arg Leu Arg Ala Ala His Arg Val Ala 675 680 685 Leu Thr Gly Thr Pro Met Glu Asn Arg Leu Ala Glu Leu Trp Ser Ile 690 695 700 Met Asp Phe Leu Asn Pro Gly Leu Leu Gly Ser Ser Glu Arg Phe Arg 705 710 715 720 Thr Arg Tyr Ala Ile Pro Ile Glu Arg His Gly His Thr Glu Pro Ala 725 730 735 Glu Arg Leu Arg Ala Ser Thr Arg Pro Tyr Ile Leu Arg Arg Leu Lys 740 745 750 Thr Asp Pro Ala Ile Ile Asp Asp Leu Pro Glu Lys Ile Glu Ile Lys 755 760 765 Gln Tyr Cys Gln Leu Thr Thr Glu Gln Ala Ser Leu Tyr Gln Ala Val 770 775 780 Val Ala Asp Met Met Glu Lys Ile Glu Asn Thr Glu Gly Ile Glu Arg 785 790 795 800 Arg Gly Asn Val Leu Ala Ala Met Ala Lys Leu Lys Gln Val Cys Asn 805 810 815 His Pro Ala Gln Leu Leu His Asp Arg Ser Pro Val Gly Arg Arg Ser 820 825 830 Gly Lys Val Ile Arg Leu Glu Glu Ile Leu Glu Glu Ile Leu Ala Glu 835 840 845 Gly Asp Arg Val Leu Cys Phe Thr Gln Phe Thr Glu Phe Ala Glu Leu 850 855 860 Leu Val Pro His Leu Ala Ala Arg Phe Gly Arg Ala Ala Arg Asp Ile 865 870 875 880 Ala Tyr Leu His Gly Gly Thr Pro Arg Lys Arg Arg Asp Glu Met Val 885 890 895 Ala Arg Phe Gln Ser Gly Asp Gly Pro Pro Ile Phe Leu Leu Ser Leu 900 905 910 Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Ala Ala Asn His Val Val 915 920 925 His Leu Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp 930 935 940 Arg Ala Phe Arg Ile Gly Gln Arg Arg Thr Val Gln Val Arg Lys Phe 945 950 955 960 Ile Cys Thr Gly Thr Leu Glu Glu Lys Ile Asp Glu Met Ile Glu Glu 965 970 975 Lys Lys Ala Leu Ala Asp Leu Val Val Thr Asp Gly Glu Gly Trp Leu 980 985 990 Thr Glu Leu Ser Thr Arg Asp Leu Arg Glu Val Phe Ala Leu Ser Glu 995 1000 1005 Gly Ala Val Gly Glu 1010 <210> 51 <211> 3042 <212> DNA <213> Mycobacterium tuberculosis <400> 51 atgctggttt tgcacggctt ctggtccaac tccggcggga tgcggctgtg ggcggaggac 60 tccgatctgc tggtgaagag cccgagtcag gcgctgcgct ccgcgcggcc acacccgttc 120 gcggcgcccg ctgacctgat cgccggcata catccgggca aacccgcaac cgccgttttg 180 ctgttgccgt cgttgcgatc ggcgccgctg gactcgccgg agctgatccg gctcgccccg 240 cgcccggccg cgcgaaccga tccgatgctg ttggcgtgga cggtaccggt ggtggacctg 300 gaccccaccg cggcgttggc cgccttcgac cagcccgccc ccgacgtccg ctacggcgcg 360 tccgtcgact acctggccga gctggccgtt ttcgcgcgcg agttggtcga gcgtggtcgc 420 gtgctgcccc agctgcgccg cgacacccac ggcgcggccg cctgctggcg tccggtgttg 480 cagggacgcg acgtggtcgc gatgacctcg ctggtctcgg cgatgccgcc ggtctgccgc 540 gccgaagttg gtgggcacga cccgcacgaa ctggcaacct cggctctgga cgcgatggtc 600 gacgccgccg tgcgcgcggc gctgtcaccg atggacctgc tgcccccgcg acggggtcgc 660 tccaaacggc atcgggccgt ggaggcttgg ctgaccgcgt tgacctgccc ggacggccgg 720 ttcgacgcgg agcccgacga actcgacgcg ctggccgagg cgttgcggcc atgggacgac 780 gtcggtatcg gcaccgtcgg cccggcgcgg gcgacgtttc ggctgtccga agtcgagacc 840 gaaaacgagg agacgcccgc gggctcgttg tggaggctgg agttcttatt gcagtcgacg 900 caggacccca gcctgctggt ccccgccgag caggcatgga acgacgacgg cagcctgcgc 960 cgctggctgg accggccgca ggagctgctg ctgaccgaac tgggccgggc ctctcggatt 1020 ttccccgagc tcgtcccggc gctgcgcacc gcgtgcccgt ccgggcttga gctcgacgcc 1080 gacggcgcct accgattcct gtcgggtacg gccgcggtgc tcgacgaggc tgggtttggc 1140 gtgctgctgc cgtcctggtg ggaccgccgc cgcaagctgg gcttggtcct gtccgcatat 1200 accccggtcg acggcgtggt gggcaaggcc agcaagttcg gccgcgagca gctcgtcgag 1260 ttccgctggg agctggccgt gggcgacgat ccgctcagcg aggaggagat cgcggcgctg 1320 accgaaacca agtccccgct gatccggctg cgtggccagt gggtcgcgct cgataccgaa 1380 cagatgcgcc gcgggctgga gtttttggag cgtaagccaa ccggccgcaa gaccaccgcc 1440 gagatcctcg cgctggccgc cagccacccc gacgacgtgg acaccccgct cgaggtcacc 1500 gccgtacgcg ccgacggctg gctcggggac ctgctcgccg gggccgccgc ggcgtcgctg 1560 cagccgttgg acccgcccga cggattcacc gcgacgctgc gtccctacca gcagcgcggt 1620 ctggcgtggc tggcgttttt gtcctcgctc ggtttgggca gctgcctggc cgacgacatg 1680 ggcctgggca agacggtgca gctattggcc ctggaaacct tggaatccgt tcagcgccac 1740 caggatcgcg gcgtcggacc cacactgcta ctgtgcccga tgtcgttggt gggcaactgg 1800 ccgcaggaag cggccaggtt tgcacccaac ctgcgggtgt acgcccacca cgggggcgcc 1860 cggctgcacg gcgaggcgtt gcgcgaccac ctcgagcgca ccgacctggt cgtgagcacc 1920 tataccaccg ccacccgcga catcgacgag ctggcggaat acgaatggaa ccgggtggtg 1980 ctggacgagg cccaggcggt gaagaacagc ctgtcccggg cggccaaggc ggtgcgacgg 2040 ctacgcgcgg cgcaccgggt cgcgctgacc gggacaccga tggagaaccg gctcgccgag 2100 ctgtggtcga tcatggactt cctcaacccg ggcctgctcg gatcctccga acgcttccgc 2160 acccgctacg cgatcccgat cgagcggcac gggcacaccg aaccggccga acggctgcgc 2220 gcatcgacgc ggccctacat cctgcgccgg ctcaagaccg acccggcgat catcgacgat 2280 ctgccggaga agatcgagat caagcagtac tgccaactca ccaccgagca ggcgtcgctg 2340 tatcaggccg tcgtcgccga catgatggaa aagatcgaaa acaccgaagg gatcgagcgg 2400 cgcggcaacg tgctggccgc gatggccaag ctcaaacagg tgtgcaacca ccccgcccag 2460 ctgctgcacg atcgctcccc ggtcggtcgg cggtccggga aggtgatccg gctcgaggag 2520 atcctggaag agatcctggc cgagggcgac cgggtgctgt gttttaccca gttcaccgag 2580 ttcgccgagc tgctggtgcc gcacctggcc gcacgcttcg gccgtgccgc ccgagacatt 2640 gcctacctgc acggtggcac cccgaggaag cggcgtgacg agatggtggc ccggttccag 2700 tccggtgacg gcccgcccat ttttctgctg tcgttgaagg cgggcggtac cgggctgaac 2760 ctcaccgccg ccaatcatgt tgtgcacctg gaccgctggt ggaacccggc ggtcgagaac 2820 caggcgacgg accgggcgtt tcggatcggg cagcggcgca cggtgcaggt ccgcaagttc 2880 atctgcaccg gcaccctcga ggagaagatc gacgaaatga tcgaggagaa aaaggcgctg 2940 gccgacttgg tggtcaccga cggcgaaggc tggctgaccg aactgtccac ccgcgatctg 3000 cgcgaggtgt tcgcgctgtc cgaaggcgcc gtcggtgagt ag 3042 <210> 52 <211> 1013 <212> PRT <213> Mycobacterium tuberculosis <400> 52 Met Leu Val Leu His Gly Phe Trp Ser Asn Ser Gly Gly Met Arg Leu 1 5 10 15 Trp Ala Glu Asp Ser Asp Leu Leu Val Lys Ser Pro Ser Gln Ala Leu 20 25 30 Arg Ser Ala Arg Pro His Pro Phe Ala Ala Pro Ala Asp Leu Ile Ala 35 40 45 Gly Ile His Pro Gly Lys Pro Ala Thr Ala Val Leu Leu Leu Pro Ser 50 55 60 Leu Arg Ser Ala Pro Leu Asp Ser Pro Glu Leu Ile Arg Leu Ala Pro 65 70 75 80 Arg Pro Ala Ala Arg Thr Asp Pro Met Leu Leu Ala Trp Thr Val Pro 85 90 95 Val Val Asp Leu Asp Pro Thr Ala Ala Leu Ala Ala Phe Asp Gln Pro 100 105 110 Ala Pro Asp Val Arg Tyr Gly Ala Ser Val Asp Tyr Leu Ala Glu Leu 115 120 125 Ala Val Phe Ala Arg Glu Leu Val Glu Arg Gly Arg Val Leu Pro Gln 130 135 140 Leu Arg Arg Asp Thr His Gly Ala Ala Ala Cys Trp Arg Pro Val Leu 145 150 155 160 Gln Gly Arg Asp Val Val Ala Met Thr Ser Leu Val Ser Ala Met Pro 165 170 175 Pro Val Cys Arg Ala Glu Val Gly Gly His Asp Pro His Glu Leu Ala 180 185 190 Thr Ser Ala Leu Asp Ala Met Val Asp Ala Ala Val Arg Ala Ala Leu 195 200 205 Ser Pro Met Asp Leu Leu Pro Pro Arg Arg Gly Arg Ser Lys Arg His 210 215 220 Arg Ala Val Glu Ala Trp Leu Thr Ala Leu Thr Cys Pro Asp Gly Arg 225 230 235 240 Phe Asp Ala Glu Pro Asp Glu Leu Asp Ala Leu Ala Glu Ala Leu Arg 245 250 255 Pro Trp Asp Asp Val Gly Ile Gly Thr Val Gly Pro Ala Arg Ala Thr 260 265 270 Phe Arg Leu Ser Glu Val Glu Thr Glu Asn Glu Glu Thr Pro Ala Gly 275 280 285 Ser Leu Trp Arg Leu Glu Phe Leu Leu Gln Ser Thr Gln Asp Pro Ser 290 295 300 Leu Leu Val Pro Ala Glu Gln Ala Trp Asn Asp Asp Gly Ser Leu Arg 305 310 315 320 Arg Trp Leu Asp Arg Pro Gln Glu Leu Leu Leu Thr Glu Leu Gly Arg 325 330 335 Ala Ser Arg Ile Phe Pro Glu Leu Val Pro Ala Leu Arg Thr Ala Cys 340 345 350 Pro Ser Gly Leu Glu Leu Asp Ala Asp Gly Ala Tyr Arg Phe Leu Ser 355 360 365 Gly Thr Ala Ala Val Leu Asp Glu Ala Gly Phe Gly Val Leu Leu Pro 370 375 380 Ser Trp Trp Asp Arg Arg Arg Lys Leu Gly Leu Val Leu Ser Ala Tyr 385 390 395 400 Thr Pro Val Asp Gly Val Val Gly Lys Ala Ser Lys Phe Gly Arg Glu 405 410 415 Gln Leu Val Glu Phe Arg Trp Glu Leu Ala Val Gly Asp Asp Pro Leu 420 425 430 Ser Glu Glu Glu Ile Ala Ala Leu Thr Glu Thr Lys Ser Pro Leu Ile 435 440 445 Arg Leu Arg Gly Gln Trp Val Ala Leu Asp Thr Glu Gln Met Arg Arg 450 455 460 Gly Leu Glu Phe Leu Glu Arg Lys Pro Thr Gly Arg Lys Thr Thr Ala 465 470 475 480 Glu Ile Leu Ala Leu Ala Ala Ser His Pro Asp Asp Val Asp Thr Pro 485 490 495 Leu Glu Val Thr Ala Val Arg Ala Asp Gly Trp Leu Gly Asp Leu Leu 500 505 510 Ala Gly Ala Ala Ala Ala Ser Leu Gln Pro Leu Asp Pro Pro Asp Gly 515 520 525 Phe Thr Ala Thr Leu Arg Pro Tyr Gln Gln Arg Gly Leu Ala Trp Leu 530 535 540 Ala Phe Leu Ser Ser Leu Gly Leu Gly Ser Cys Leu Ala Asp Asp Met 545 550 555 560 Gly Leu Gly Lys Thr Val Gln Leu Leu Ala Leu Glu Thr Leu Glu Ser 565 570 575 Val Gln Arg His Gln Asp Arg Gly Val Gly Pro Thr Leu Leu Leu Cys 580 585 590 Pro Met Ser Leu Val Gly Asn Trp Pro Gln Glu Ala Ala Arg Phe Ala 595 600 605 Pro Asn Leu Arg Val Tyr Ala His His Gly Gly Ala Arg Leu His Gly 610 615 620 Glu Ala Leu Arg Asp His Leu Glu Arg Thr Asp Leu Val Val Ser Thr 625 630 635 640 Tyr Thr Thr Ala Thr Arg Asp Ile Asp Glu Leu Ala Glu Tyr Glu Trp 645 650 655 Asn Arg Val Val Leu Asp Glu Ala Gln Ala Val Lys Asn Ser Leu Ser 660 665 670 Arg Ala Ala Lys Ala Val Arg Arg Leu Arg Ala Ala His Arg Val Ala 675 680 685 Leu Thr Gly Thr Pro Met Glu Asn Arg Leu Ala Glu Leu Trp Ser Ile 690 695 700 Met Asp Phe Leu Asn Pro Gly Leu Leu Gly Ser Ser Glu Arg Phe Arg 705 710 715 720 Thr Arg Tyr Ala Ile Pro Ile Glu Arg His Gly His Thr Glu Pro Ala 725 730 735 Glu Arg Leu Arg Ala Ser Thr Arg Pro Tyr Ile Leu Arg Arg Leu Lys 740 745 750 Thr Asp Pro Ala Ile Ile Asp Asp Leu Pro Glu Lys Ile Glu Ile Lys 755 760 765 Gln Tyr Cys Gln Leu Thr Thr Glu Gln Ala Ser Leu Tyr Gln Ala Val 770 775 780 Val Ala Asp Met Met Glu Lys Ile Glu Asn Thr Glu Gly Ile Glu Arg 785 790 795 800 Arg Gly Asn Val Leu Ala Ala Met Ala Lys Leu Lys Gln Val Cys Asn 805 810 815 His Pro Ala Gln Leu Leu His Asp Arg Ser Pro Val Gly Arg Arg Ser 820 825 830 Gly Lys Val Ile Arg Leu Glu Glu Ile Leu Glu Glu Ile Leu Ala Glu 835 840 845 Gly Asp Arg Val Leu Cys Phe Thr Gln Phe Thr Glu Phe Ala Glu Leu 850 855 860 Leu Val Pro His Leu Ala Ala Arg Phe Gly Arg Ala Ala Arg Asp Ile 865 870 875 880 Ala Tyr Leu His Gly Gly Thr Pro Arg Lys Arg Arg Asp Glu Met Val 885 890 895 Ala Arg Phe Gln Ser Gly Asp Gly Pro Pro Ile Phe Leu Leu Ser Leu 900 905 910 Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Ala Ala Asn His Val Val 915 920 925 His Leu Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp 930 935 940 Arg Ala Phe Arg Ile Gly Gln Arg Arg Thr Val Gln Val Arg Lys Phe 945 950 955 960 Ile Cys Thr Gly Thr Leu Glu Glu Lys Ile Asp Glu Met Ile Glu Glu 965 970 975 Lys Lys Ala Leu Ala Asp Leu Val Val Thr Asp Gly Glu Gly Trp Leu 980 985 990 Thr Glu Leu Ser Thr Arg Asp Leu Arg Glu Val Phe Ala Leu Ser Glu 995 1000 1005 Gly Ala Val Gly Glu 1010 <210> 53 <211> 3282 <212> DNA <213> Myxococcus xanthus <400> 53 gtgcgagcct ggaggggcgt cctccgctgg gctgccgctg gcctctccct gtccgcggct 60 cggagtccga ccggccacct cccagtgttt tcaggttttt ccgtggcgac cgatggcgtc 120 gggctgttcg cgggtctgtc tgttcgggcc cttgtccatc aagggcctgg aggaggaccg 180 ctacgagcgc ctcacggaca acccggcagg cctgcggctc acggagccgg caatcccgtg 240 caggggcgct cgcaggcctg cttgcgtgtg ccgcttgccc ggacggagtt tacattcgca 300 gcgatgcccc tcgtgttcct gcccgacgcc gagacgctgt tcctctgggg gcccgaccgg 360 ctgccacgtg agctcgccgg cctgccggag acgggggacc gcgcctccgc gctgctcgtg 420 acgcccgagg gattgcgtga atgcgagggg cacgggctgc ccctggccgc caccgtcgag 480 cggctcgcgg tggtgcaaac ctccgaggcc gagtcctttc ctggctccat cgccctgtgg 540 acgctggcca gcaagctcgc gctggagttg gtggcgcgcg agcgcgtggt gcccacgctc 600 ctgcggcggg gcgagcgcat cgaggctcgc tgggcggcgg ccctctccgc caccgaggac 660 gccggccgcg tcgccgcgct cgcccggagc atgccgcccg gcgcgcacgc cgtccccgca 720 ggcgccaggc caggccgcgc cgtctgggcc ccggacgcct tgctgcgcgc cttcctcgac 780 gccaccgtcg acgccttcgt gcgcgccgcg cgcggtgcgc cttcgttgcc ggcccggcgc 840 gcggcctcgt gggacgagcg ctggcgcgag gcgctcaccg gcgcgcgacg cgacttcgcg 900 ccggagggct tcgccgagcg ctccgtcgtc gatgagctga cgcgctggag cgaacccgcg 960 ctcggcgccc gggacaagct gcgcgcctgc ttccggctgg agcccccgac ggaggagcgc 1020 gagcccttcg tgctgagctt ccacctccag tccccggacg acccaagcct gctcgtcccg 1080 gccgcggacg tctggaagac gcgcgggcgc agcctggaga agctcggccg cgccttccgt 1140 gacccgcagg agtccctgct cgaggcactc ggccgcgccg cccggctctt ccccccgctg 1200 gcgctcgtgc tggagagccc acgtccccag gcgctcctgc tcgagcccga caccgcgtgg 1260 acgttcctct cggagggcgc ccgcgtgctc tcagacgccg gcttcggcgt catcgtccct 1320 ggcgagctca ccacctcggg ccgacgccgc ctgcgcctgc gcatgcgcgt gggcgcgagc 1380 acgaaggccg cgggggccgt cggtggcacc gcggggctcg ggctcgacgc gctgctgcgc 1440 gtggactggg acgccgtgct gggcgaccaa cccctctccg cccaggagct ggcgctgctg 1500 gcccagcgca aggccccgct cgtgcgattc cgcggcgagt gggtcgcggt ggatcccctc 1560 gaactcgacg ccatccagcg ccacctcgcc cagggccccg gccgcatggc gctgagcgag 1620 gcggtgcggg tgtccctgct aggcgaaacg cgccacggac agctccccgt caccgttctc 1680 gccaccgggg cgctggagga gcgcctgcgc ctgcttcggg agggcggggc caccgctcag 1740 gacgcccccc gcgcgctgcg cgccacgctg cggccctacc agtcgcgcgg tctgcactgg 1800 ctggacacgc tggcctcatt ggggctcggc gcctgcctcg cggacgacat gggcctgggc 1860 aagacggtgc aggtgctggc cttcctgctg cggcggctcg agcaggcgcc tgacgaggcg 1920 cgccccacgc tgctggtggc ccccacctcc gtggtgggca actgggagcg tgagctcgcc 1980 cgcttcgccc ccaccttgcg cctgacgcgg cactacggcg ccgagcgcgc ccgcgcggcg 2040 aaccgcttcc cccgcgcgcc cggcgccgtc gtgctcacca cctacggctt gctgcgccgg 2100 gacgccgcgc tgctcgcgcg cgtggactgg ggcgcggtgg tgctcgacga ggcgcagaac 2160 atcaagaacg cggcgtcggc taccgcccgc gcggcccggg cgttgcgcgc cagccagcgc 2220 ttcgcgctca cgggcacgcc ggtggagaac cgcctggcgg agctgtggtc catcctcgag 2280 ttcgccaacc cgggcctgct cgggccgctg gagacgttcc ggcgggagct ggcgctgccc 2340 attgaacgcc atggcaatca ggaggcctcg gcccggctgc gccggctcgt gagccccttc 2400 gtcctgcgcc gcctcaagag cgacccgacc atcatcacgg acctgcccgc gaagaatgag 2460 atgaaggtcg tctgcacgct cacgcgcgag caggcctcgc tctacaaggc ggtggtggac 2520 gaggagctgc ggcgcatcga ggaggccgac ggcatggagc gccggggccg cgtgctcgcg 2580 ctgctgctgt acacgaagca gatcgccaac cacccggcgc agtacctcgg ggagtccggg 2640 cccctgccgg ggcgctcggg gaagctggcg cgcgtggtgg agatgctcga ggagtccctg 2700 gccgctggcg acaaggcgct cgtcttcacg cagttccggg agatgggcga caagctggtg 2760 gcgcacctgt cggagtacct gggccacgag gtgctcttcc tccacggcgg cacgccccgc 2820 aaggcgcgcg acgagatggt gcggcgcttc caggaggacg tccacggtcc gcgtgtgttc 2880 gtgctgtccg tcaaggcggg aggcacgggg ctcaacctga cggcggcgag ccatgtgttc 2940 cattacgacc gctggtggaa cccggccgtc gaggaccagg ccaccgaccg cgcgtaccgc 3000 atcgggcaga cgcgcgcggt gcaggtccac aagctggtgt gtgcgggcac tgtcgaggag 3060 aaggtggacc ggctgctcga acagaagcgc cagctcgccg agaaggtcgt gggcgcgggc 3120 gagcactggg tgaccgagct ggacacgacg gcgctgcgcg agctgttctc gctgtccgag 3180 ggcgccgtgg cggacgatgg cgacgcggaa ggggaagacg acgcgcgggt gcgcgccccg 3240 cgacggcgcg gccgtgcgag cgcgaaggcg gtgtcgcgat ga 3282 <210> 54 <211> 1093 <212> PRT <213> Myxococcus xanthus <400> 54 Val Arg Ala Trp Arg Gly Val Leu Arg Trp Ala Ala Ala Gly Leu Ser 1 5 10 15 Leu Ser Ala Ala Arg Ser Pro Thr Gly His Leu Pro Val Phe Ser Gly 20 25 30 Phe Ser Val Ala Thr Asp Gly Val Gly Leu Phe Ala Gly Leu Ser Val 35 40 45 Arg Ala Leu Val His Gln Gly Pro Gly Gly Gly Pro Leu Arg Ala Pro 50 55 60 His Gly Gln Pro Gly Arg Pro Ala Ala His Gly Ala Gly Asn Pro Val 65 70 75 80 Gln Gly Arg Ser Gln Ala Cys Leu Arg Val Pro Leu Ala Arg Thr Glu 85 90 95 Phe Thr Phe Ala Ala Met Pro Leu Val Phe Leu Pro Asp Ala Glu Thr 100 105 110 Leu Phe Leu Trp Gly Pro Asp Arg Leu Pro Arg Glu Leu Ala Gly Leu 115 120 125 Pro Glu Thr Gly Asp Arg Ala Ser Ala Leu Leu Val Thr Pro Glu Gly 130 135 140 Leu Arg Glu Cys Glu Gly His Gly Leu Pro Leu Ala Ala Thr Val Glu 145 150 155 160 Arg Leu Ala Val Val Gln Thr Ser Glu Ala Glu Ser Phe Pro Gly Ser 165 170 175 Ile Ala Leu Trp Thr Leu Ala Ser Lys Leu Ala Leu Glu Leu Val Ala 180 185 190 Arg Glu Arg Val Val Pro Thr Leu Leu Arg Arg Gly Glu Arg Ile Glu 195 200 205 Ala Arg Trp Ala Ala Ala Leu Ser Ala Thr Glu Asp Ala Gly Arg Val 210 215 220 Ala Ala Leu Ala Arg Ser Met Pro Pro Gly Ala His Ala Val Pro Ala 225 230 235 240 Gly Ala Arg Pro Gly Arg Ala Val Trp Ala Pro Asp Ala Leu Leu Arg 245 250 255 Ala Phe Leu Asp Ala Thr Val Asp Ala Phe Val Arg Ala Ala Arg Gly 260 265 270 Ala Pro Ser Leu Pro Ala Arg Arg Ala Ala Ser Trp Asp Glu Arg Trp 275 280 285 Arg Glu Ala Leu Thr Gly Ala Arg Arg Asp Phe Ala Pro Glu Gly Phe 290 295 300 Ala Glu Arg Ser Val Val Asp Glu Leu Thr Arg Trp Ser Glu Pro Ala 305 310 315 320 Leu Gly Ala Arg Asp Lys Leu Arg Ala Cys Phe Arg Leu Glu Pro Pro 325 330 335 Thr Glu Glu Arg Glu Pro Phe Val Leu Ser Phe His Leu Gln Ser Pro 340 345 350 Asp Asp Pro Ser Leu Leu Val Pro Ala Ala Asp Val Trp Lys Thr Arg 355 360 365 Gly Arg Ser Leu Glu Lys Leu Gly Arg Ala Phe Arg Asp Pro Gln Glu 370 375 380 Ser Leu Leu Glu Ala Leu Gly Arg Ala Ala Arg Leu Phe Pro Pro Leu 385 390 395 400 Ala Leu Val Leu Glu Ser Pro Arg Pro Gln Ala Leu Leu Leu Glu Pro 405 410 415 Asp Thr Ala Trp Thr Phe Leu Ser Glu Gly Ala Arg Val Leu Ser Asp 420 425 430 Ala Gly Phe Gly Val Ile Val Pro Gly Glu Leu Thr Thr Ser Gly Arg 435 440 445 Arg Arg Leu Arg Leu Arg Met Arg Val Gly Ala Ser Thr Lys Ala Ala 450 455 460 Gly Ala Val Gly Gly Thr Ala Gly Leu Gly Leu Asp Ala Leu Leu Arg 465 470 475 480 Val Asp Trp Asp Ala Val Leu Gly Asp Gln Pro Leu Ser Ala Gln Glu 485 490 495 Leu Ala Leu Leu Ala Gln Arg Lys Ala Pro Leu Val Arg Phe Arg Gly 500 505 510 Glu Trp Val Ala Val Asp Pro Leu Glu Leu Asp Ala Ile Gln Arg His 515 520 525 Leu Ala Gln Gly Pro Gly Arg Met Ala Leu Ser Glu Ala Val Arg Val 530 535 540 Ser Leu Leu Gly Glu Thr Arg His Gly Gln Leu Pro Val Thr Val Leu 545 550 555 560 Ala Thr Gly Ala Leu Glu Glu Arg Leu Arg Leu Leu Arg Glu Gly Gly 565 570 575 Ala Thr Ala Gln Asp Ala Pro Arg Ala Leu Arg Ala Thr Leu Arg Pro 580 585 590 Tyr Gln Ser Arg Gly Leu His Trp Leu Asp Thr Leu Ala Ser Leu Gly 595 600 605 Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Val Gln 610 615 620 Val Leu Ala Phe Leu Leu Arg Arg Leu Glu Gln Ala Pro Asp Glu Ala 625 630 635 640 Arg Pro Thr Leu Leu Val Ala Pro Thr Ser Val Val Gly Asn Trp Glu 645 650 655 Arg Glu Leu Ala Arg Phe Ala Pro Thr Leu Arg Leu Thr Arg His Tyr 660 665 670 Gly Ala Glu Arg Ala Arg Ala Ala Asn Arg Phe Pro Arg Ala Pro Gly 675 680 685 Ala Val Val Leu Thr Thr Tyr Gly Leu Leu Arg Arg Asp Ala Ala Leu 690 695 700 Leu Ala Arg Val Asp Trp Gly Ala Val Val Leu Asp Glu Ala Gln Asn 705 710 715 720 Ile Lys Asn Ala Ala Ser Ala Thr Ala Arg Ala Ala Arg Ala Leu Arg 725 730 735 Ala Ser Gln Arg Phe Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu 740 745 750 Ala Glu Leu Trp Ser Ile Leu Glu Phe Ala Asn Pro Gly Leu Leu Gly 755 760 765 Pro Leu Glu Thr Phe Arg Arg Glu Leu Ala Leu Pro Ile Glu Arg His 770 775 780 Gly Asn Gln Glu Ala Ser Ala Arg Leu Arg Arg Leu Val Ser Pro Phe 785 790 795 800 Val Leu Arg Arg Leu Lys Ser Asp Pro Thr Ile Ile Thr Asp Leu Pro 805 810 815 Ala Lys Asn Glu Met Lys Val Val Cys Thr Leu Thr Arg Glu Gln Ala 820 825 830 Ser Leu Tyr Lys Ala Val Val Asp Glu Glu Leu Arg Arg Ile Glu Glu 835 840 845 Ala Asp Gly Met Glu Arg Arg Gly Arg Val Leu Ala Leu Leu Leu Tyr 850 855 860 Thr Lys Gln Ile Ala Asn His Pro Ala Gln Tyr Leu Gly Glu Ser Gly 865 870 875 880 Pro Leu Pro Gly Arg Ser Gly Lys Leu Ala Arg Val Val Glu Met Leu 885 890 895 Glu Glu Ser Leu Ala Ala Gly Asp Lys Ala Leu Val Phe Thr Gln Phe 900 905 910 Arg Glu Met Gly Asp Lys Leu Val Ala His Leu Ser Glu Tyr Leu Gly 915 920 925 His Glu Val Leu Phe Leu His Gly Gly Thr Pro Arg Lys Ala Arg Asp 930 935 940 Glu Met Val Arg Arg Phe Gln Glu Asp Val His Gly Pro Arg Val Phe 945 950 955 960 Val Leu Ser Val Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Ala Ala 965 970 975 Ser His Val Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asp 980 985 990 Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Arg Ala Val Gln 995 1000 1005 Val His Lys Leu Val Cys Ala Gly Thr Val Glu Glu Lys Val Asp 1010 1015 1020 Arg Leu Leu Glu Gln Lys Arg Gln Leu Ala Glu Lys Val Val Gly 1025 1030 1035 Ala Gly Glu His Trp Val Thr Glu Leu Asp Thr Thr Ala Leu Arg 1040 1045 1050 Glu Leu Phe Ser Leu Ser Glu Gly Ala Val Ala Asp Asp Gly Asp 1055 1060 1065 Ala Glu Gly Glu Asp Asp Ala Arg Val Arg Ala Pro Arg Arg Arg 1070 1075 1080 Gly Arg Ala Ser Ala Lys Ala Val Ser Arg 1085 1090 <210> 55 <211> 2871 <212> DNA <213> Nocardia farcinica <400> 55 atggtgggcg ccggcggccc gccgggtgtc ggtgccacct gcttggatgg acggatgctg 60 cacggactgt ggtcgccggg ttccggcctg gtgctgtgga ccgagggcga ggtgccgccc 120 gcgctgcccg acccggccgg tgcgttgctg cgcgcatcgc ggttccggca tcgggcgcag 180 gtgctggtgc cgggccccgc cggcccacag ctcacgcagg tgcgcgcgca cgccctggtg 240 ccacaggccg cggtcgacgt gctgcggcag cggttacccg tcgaatcggt ggcgggtgac 300 ctgcgctttc tcgctcacgt cgccgacggg atcgatcggt gggtgcgggc cggtcgcgtg 360 gtgcccgacc tgcaccgggc cgacggacag tggtgggcgc gctggcggct ggtcggcggt 420 gcccggcagc gggcctggct ggccgaactc gcggtggcga tgcccgcggc gctgcgggtg 480 gccgggcagc ccgcggcggt gctcgacgat ctggtcaccg agctgaccga tccgatcgtg 540 cgcaccaggc tcgccgacgc gccggtgacg cacccgctgg tgcgcgcact ggtgcgggac 600 cagccgctcg agacgggtag ccaccagctg gccgaggtgc tgcggcgctg gcgcgagagc 660 ctcaccgtcg acgagccgga gctggtgttg cggctgctgg aaccggacgg ggagaccggt 720 atcgacgggg acggcgggga cgaccgggac gacaccgtgg cgctgtggcg gctggaggtc 780 tgcctccgca ccgagggcga ggccccggcc ccggtgccgg cgaccgccga cccgaacctg 840 ctgcgcatcg ccgtcgagca gctcggccgg gcgcagcggg cctacccccg gctgcgcgat 900 ctgcccggcg atccgcacag cctcgacctg ctgttgccca ccgaggtggt ggccgatctc 960 gtcgcgcacg gtgcgcaggc gttgcgcgag gcgggggtgc ggctgctgct gccgcgcgcc 1020 tggaccatcg ccgaacccac cctgcggctc gcggtgagca gcgccgcgcc cgccgcggag 1080 agcaccgtgg gcatgcaggg tctgctgtcc tatcggtggg aactggcggt cggcgacaag 1140 gtgctcaccc gcgccgagat ggagcgcctg gtccgcgcca aatccgacct ggtgcagttg 1200 cgcggggaat gggtgcaggc cgaccacaag gtgctcgccg ccgccgcccg ctacgtcgcc 1260 gcgcatctgg acacgtcgcc ggtcaccctc gccgacctgc tcggcgagat cgccgccacc 1320 cgcgtcgaca aggtgccgct caccgaggtc accgccaccg gctgggcggg cgagttgttc 1380 gacggcggcc gcgagccggt ggcgaccccg ggtgggctga aggcgcagct gcgcccgtat 1440 cagctgcgcg gcctgagctg gctggcgacg atgagccgga tgggctgcgg cggcatcctc 1500 gccgacgaca tgggtctcgg caagacggtg caggtgctgg ccctgctggt gcacgagcgc 1560 gagaccagca cggcaccgcc cggcccgaca ctgctggtgt gcccgatgtc ggtggtcggc 1620 aactggcagc gcgaggcgca gcggttcgcc cccgggctgc gggtgctggt gcaccacggc 1680 gccgaccgcc gtcgcgacgc cgaactcgat gccgcggtgg cggattcgga cctggtgctc 1740 accacctacg ccatcctggc cagggatgcg gccgaactgt cgcgccagtc gtgggaccgg 1800 gtggtgctcg acgaggcgca gcacatcaag aacgccgcga ccaggcaggc acgtgccgcc 1860 cgtgccctgc cggcccggca tcgcctggcg ctcaccggaa ccccggtgga gaaccggctc 1920 gaagagttgc gctcgatcat ggatttcgcg gtgcccaagc tgctcggtac cgcaccgacc 1980 ttccgcgccc ggttcgccgt ccccatcgaa cgcgggcagg atcccaacgc cctgtcccgc 2040 ctgcgcttcc tcacccaacc gttcgtgctg cgccgggtca aggccgatcc ggcggtcatc 2100 ggcgatctgc ccgacaagct cgagatgacg gtgcgggcga acctgaccgt cgagcaggcc 2160 gccctgtacc aagccgtcgt cgacgacatg ctggtgaaac tgcgcagtgc caagggcatg 2220 gcccgcaagg gtgcggtgct cggcgcgctc acccggctca agcaggtgtg caaccatccc 2280 gcgcacttcc tcggtgacgg ttccccggtg ctgcatcgcg gcaggcaccg ctccggcaag 2340 ctcgccttgg tcgaggacgt gctcgacacc gtcgtcgcgg acggggagaa ggcgttgctg 2400 ttcacccagt tccgtgagtt cggcgacctg ctcgcgccct atctgtccga gcggttcggc 2460 gcgccgatcc cgttcctgca cggcggcgtg accaagaaga accgggacac gatggtcgag 2520 cgcttccagt ccggcgacgg cccgccggtc atgctgctgt ccctcaaggc cggcggcacc 2580 gggctcaccc tcaccgccgc caatcacgtg gtgcacctgg atcgctggtg gaatccggcg 2640 gtggagaacc aggccaccga tcgcgccttc cgcatcggcc agcgccgcga cgtccaggtg 2700 cgcaagctgg tctgcgtcga caccatcgag gaacggatcg acgagatgat caccggcaag 2760 agcaggctcg cggacctggc cgtggacgcg ggggagaact ggatcaccga gctgggcacc 2820 gaggagctgc gcgagttgtt caccctcggc gccgaggcgg tgggggagtg a 2871 <210> 56 <211> 956 <212> PRT <213> Nocardia farcinica <400> 56 Met Val Gly Ala Gly Gly Pro Pro Gly Val Gly Ala Thr Cys Leu Asp 1 5 10 15 Gly Arg Met Leu His Gly Leu Trp Ser Pro Gly Ser Gly Leu Val Leu 20 25 30 Trp Thr Glu Gly Glu Val Pro Pro Ala Leu Pro Asp Pro Ala Gly Ala 35 40 45 Leu Leu Arg Ala Ser Arg Phe Arg His Arg Ala Gln Val Leu Val Pro 50 55 60 Gly Pro Ala Gly Pro Gln Leu Thr Gln Val Arg Ala His Ala Leu Val 65 70 75 80 Pro Gln Ala Ala Val Asp Val Leu Arg Gln Arg Leu Pro Val Glu Ser 85 90 95 Val Ala Gly Asp Leu Arg Phe Leu Ala His Val Ala Asp Gly Ile Asp 100 105 110 Arg Trp Val Arg Ala Gly Arg Val Val Pro Asp Leu His Arg Ala Asp 115 120 125 Gly Gln Trp Trp Ala Arg Trp Arg Leu Val Gly Gly Ala Arg Gln Arg 130 135 140 Ala Trp Leu Ala Glu Leu Ala Val Ala Met Pro Ala Ala Leu Arg Val 145 150 155 160 Ala Gly Gln Pro Ala Ala Val Leu Asp Asp Leu Val Thr Glu Leu Thr 165 170 175 Asp Pro Ile Val Arg Thr Arg Leu Ala Asp Ala Pro Val Thr His Pro 180 185 190 Leu Val Arg Ala Leu Val Arg Asp Gln Pro Leu Glu Thr Gly Ser His 195 200 205 Gln Leu Ala Glu Val Leu Arg Arg Trp Arg Glu Ser Leu Thr Val Asp 210 215 220 Glu Pro Glu Leu Val Leu Arg Leu Leu Glu Pro Asp Gly Glu Thr Gly 225 230 235 240 Ile Asp Gly Asp Gly Gly Asp Asp Arg Asp Asp Thr Val Ala Leu Trp 245 250 255 Arg Leu Glu Val Cys Leu Arg Thr Glu Gly Glu Ala Pro Ala Pro Val 260 265 270 Pro Ala Thr Ala Asp Pro Asn Leu Leu Arg Ile Ala Val Glu Gln Leu 275 280 285 Gly Arg Ala Gln Arg Ala Tyr Pro Arg Leu Arg Asp Leu Pro Gly Asp 290 295 300 Pro His Ser Leu Asp Leu Leu Leu Pro Thr Glu Val Val Ala Asp Leu 305 310 315 320 Val Ala His Gly Ala Gln Ala Leu Arg Glu Ala Gly Val Arg Leu Leu 325 330 335 Leu Pro Arg Ala Trp Thr Ile Ala Glu Pro Thr Leu Arg Leu Ala Val 340 345 350 Ser Ser Ala Ala Pro Ala Ala Glu Ser Thr Val Gly Met Gln Gly Leu 355 360 365 Leu Ser Tyr Arg Trp Glu Leu Ala Val Gly Asp Lys Val Leu Thr Arg 370 375 380 Ala Glu Met Glu Arg Leu Val Arg Ala Lys Ser Asp Leu Val Gln Leu 385 390 395 400 Arg Gly Glu Trp Val Gln Ala Asp His Lys Val Leu Ala Ala Ala Ala 405 410 415 Arg Tyr Val Ala Ala His Leu Asp Thr Ser Pro Val Thr Leu Ala Asp 420 425 430 Leu Leu Gly Glu Ile Ala Ala Thr Arg Val Asp Lys Val Pro Leu Thr 435 440 445 Glu Val Thr Ala Thr Gly Trp Ala Gly Glu Leu Phe Asp Gly Gly Arg 450 455 460 Glu Pro Val Ala Thr Pro Gly Gly Leu Lys Ala Gln Leu Arg Pro Tyr 465 470 475 480 Gln Leu Arg Gly Leu Ser Trp Leu Ala Thr Met Ser Arg Met Gly Cys 485 490 495 Gly Gly Ile Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Val Gln Val 500 505 510 Leu Ala Leu Leu Val His Glu Arg Glu Thr Ser Thr Ala Pro Pro Gly 515 520 525 Pro Thr Leu Leu Val Cys Pro Met Ser Val Val Gly Asn Trp Gln Arg 530 535 540 Glu Ala Gln Arg Phe Ala Pro Gly Leu Arg Val Leu Val His His Gly 545 550 555 560 Ala Asp Arg Arg Arg Asp Ala Glu Leu Asp Ala Ala Val Ala Asp Ser 565 570 575 Asp Leu Val Leu Thr Thr Tyr Ala Ile Leu Ala Arg Asp Ala Ala Glu 580 585 590 Leu Ser Arg Gln Ser Trp Asp Arg Val Val Leu Asp Glu Ala Gln His 595 600 605 Ile Lys Asn Ala Ala Thr Arg Gln Ala Arg Ala Ala Arg Ala Leu Pro 610 615 620 Ala Arg His Arg Leu Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu 625 630 635 640 Glu Glu Leu Arg Ser Ile Met Asp Phe Ala Val Pro Lys Leu Leu Gly 645 650 655 Thr Ala Pro Thr Phe Arg Ala Arg Phe Ala Val Pro Ile Glu Arg Gly 660 665 670 Gln Asp Pro Asn Ala Leu Ser Arg Leu Arg Phe Leu Thr Gln Pro Phe 675 680 685 Val Leu Arg Arg Val Lys Ala Asp Pro Ala Val Ile Gly Asp Leu Pro 690 695 700 Asp Lys Leu Glu Met Thr Val Arg Ala Asn Leu Thr Val Glu Gln Ala 705 710 715 720 Ala Leu Tyr Gln Ala Val Val Asp Asp Met Leu Val Lys Leu Arg Ser 725 730 735 Ala Lys Gly Met Ala Arg Lys Gly Ala Val Leu Gly Ala Leu Thr Arg 740 745 750 Leu Lys Gln Val Cys Asn His Pro Ala His Phe Leu Gly Asp Gly Ser 755 760 765 Pro Val Leu His Arg Gly Arg His Arg Ser Gly Lys Leu Ala Leu Val 770 775 780 Glu Asp Val Leu Asp Thr Val Val Ala Asp Gly Glu Lys Ala Leu Leu 785 790 795 800 Phe Thr Gln Phe Arg Glu Phe Gly Asp Leu Leu Ala Pro Tyr Leu Ser 805 810 815 Glu Arg Phe Gly Ala Pro Ile Pro Phe Leu His Gly Gly Val Thr Lys 820 825 830 Lys Asn Arg Asp Thr Met Val Glu Arg Phe Gln Ser Gly Asp Gly Pro 835 840 845 Pro Val Met Leu Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu Thr Leu 850 855 860 Thr Ala Ala Asn His Val Val His Leu Asp Arg Trp Trp Asn Pro Ala 865 870 875 880 Val Glu Asn Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg 885 890 895 Asp Val Gln Val Arg Lys Leu Val Cys Val Asp Thr Ile Glu Glu Arg 900 905 910 Ile Asp Glu Met Ile Thr Gly Lys Ser Arg Leu Ala Asp Leu Ala Val 915 920 925 Asp Ala Gly Glu Asn Trp Ile Thr Glu Leu Gly Thr Glu Glu Leu Arg 930 935 940 Glu Leu Phe Thr Leu Gly Ala Glu Ala Val Gly Glu 945 950 955 <210> 57 <211> 3264 <212> DNA <213> Nodularia spumigena <400> 57 atggcaattt tacacggtaa ttggttagta agaaatcaaa atggttgttt atttatttgg 60 ggtgaaactt ggcgttcatc acgagtcgat tttgctctga atgtatctca agatatacca 120 ctacatccat tggtaatgtc accaattgat ttgagtgagt tgttaagtta tcataatatc 180 aaaattccta gcttaataca gcaatcccaa gttgctttat ctggcactgg gcgaactcgt 240 aaaagtacaa gtactactaa atttagctgg acaactcact ctctaatcat tgatttacca 300 actcatatct cagaaaataa tccccaagaa atagaattta tttccccttt gcattctgct 360 actttgggtt ctgaaataaa ttcaccccaa tatctccaac cgtggcgagt cgagggtttt 420 tgtctcaacc ccactgaagc gataaaattt ctcgctgctg ttcctttaaa tgctgctaga 480 gaagaagata ctttgttcgg tggagattta cgtttttggt cacaaattgc ccgttggagt 540 ttggatttaa tctctcggtg taagtttttg ccaactattc aaagacagtt tgatagttct 600 attgttgcta ggtggcaagt gcttttagac agtgcaatag atggaacacg cctggaaaaa 660 ttttctgcaa aaatgccatt agcttgtcgt acttatcgga agggaatggg gagtggggag 720 tggggagtgg ggagtgggga ggaatcttcc ccatccataa tgtatgtaga ttttccaact 780 gaaccccagg aactattatt aggatttctc aacagtacca tagatgccca agtgcgagaa 840 atgttagctt ctcaacctct actagaaact agagtgatgg catctttacc atctgcggtg 900 cgacagtggt tgcaaggttt aaccagtgca tctcacacag tgaatgcaga tgcaatggaa 960 gtagaaagat tagaagcagc cctgaaatct tggactatgc cgttgcaata tcaactggta 1020 ggaaaaccct cgtttcgcgc ctgttttcaa ctgcttcccc ctgcttctgg ggcaacagat 1080 tggatattgg catattttct ccaagctgcg gatgatgaaa atttattagt ggatgcggca 1140 actatttggc atcacccagt tgaacaatta gtttatcaaa atcgcaccat tgatcaaccc 1200 caagaaactt tattgcgggg cttgggttta gcttcgcgat tatatccagt tcttacaccg 1260 agtttagaaa cagaatatcc ccaatgttgt cgcctcaacc cattacaagc ttatgaattt 1320 atcaagtctg tagcttggcg atttgaagat agtggtttgg gggtaatttt acctcctagt 1380 ttgactaacc gcgaaggatg ggcgaaccgt ttggggttaa aaattagtgc tgaaactcaa 1440 aagaaaaaac agggacgctt gggtttacaa agtttactga attttcaatg gcaattggca 1500 attggtggac aaacaatttc taaaaccgag tttaataaac tggtagcttt aaatagccca 1560 ctggtagaaa ttaacggcga atgggtggaa ttgcgacccc aggatattaa aacagcacag 1620 acattttttg cttctcgtaa agacgaaatg acgctttctt tggaagatgc tttacgcctc 1680 agttctggcg atacccaagc gattgaaaag ttacctgtgg tcagttttga agcatctggg 1740 acattgcaag agttaattgg ggcgttaacc aataatcaag ccatttcacc cctcccaaca 1800 cctgcaaatt ttcaaggaca gttacgacct tatcaagaaa gaggggcggc ttggctggct 1860 ttcttagaac gttggggttt aggtgcttgt ttggctgatg atatggggct gggaaaaaca 1920 attcagttaa ttgccttttt actgcacctc aaagaacaag acgcactgga aaatcccaca 1980 ttacttgttt gtccgacttc tattttaggt aactgggaac gggaaattaa aaaatttgct 2040 cctactctca aagttttaca gcaccacggc gataaacgtc tcaaaggtaa agcgtttgta 2100 gaagcagtca aaaaacacga tgtaattatt accagttact cactcgttca ccgggatatt 2160 aaatctttgc agagtgtcga ttggcaaaca gttgtattag atgaagccca gaatgtgaaa 2220 aatcctgaag ctaaacaatc gcaggctgtg aggggattaa aaactacatt tcgcatagct 2280 ttaacaggga caccagtaga aaacaaactg caagaattgt ggtctatttt agattttctt 2340 aatcctgggt atttgggaaa tcgtcaattt ttccagagac ggtttgctat gccaattgaa 2400 aagtatggtg atacagcatc tttaaatcaa ttgcggggtt tagttcaacc gtttattcta 2460 cgtcgtctga aaacagatcg tgatattatt caagatttgc cagaaaagca agaaatgacg 2520 gttttttgtg ggcttgcggc tgaacaagct gcactttatc aacaagtagt tgaagcatct 2580 ttagtagaaa ttgaatctgc tgagggtttg caacgtcgag ggatgatttt agctttactt 2640 gtgaaactta aacaaatctg taatcatcca gcccaatatt tgaaagccgc gacattacaa 2700 gaacatagtt ctgctaaact gcaacggcta gatgaaatgt taacggtagc tttggaggaa 2760 ggagataggg ctttaatttt cactcaattt gctgaatggg gtaagttatt aaaagctcat 2820 ttacaacaaa cacttgggaa agaaatattc tttttatatg gtggtagcag taaaaaacaa 2880 cgcgaggaaa tgattgaccg tttccaacat gacccccaag gacctccgat tatgattctt 2940 tctttaaaag cgggtggggt aggcttgaat ttaaccaggg ctaatcatgt atttcacttt 3000 gatagatggt ggaatcccgc agtggaaaat caagcgacag atagagtatt tcgtattggt 3060 caaacccgga atgtgcaagt gcataaattt gtctgtactg gcacattaga agaaaaaatt 3120 catgacatga ttgaaagtaa aaaacaatta gcggaacaag tagttggtgc tggtgaggag 3180 tggctgactg aaatgaatac tgaccaattg cgtgatttac tcattcttga tcgcagtgcc 3240 ataattgatg aggatgaagt ttaa 3264 <210> 58 <211> 1087 <212> PRT <213> Nodularia spumigena <400> 58 Met Ala Ile Leu His Gly Asn Trp Leu Val Arg Asn Gln Asn Gly Cys 1 5 10 15 Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Ser Arg Val Asp Phe Ala 20 25 30 Leu Asn Val Ser Gln Asp Ile Pro Leu His Pro Leu Val Met Ser Pro 35 40 45 Ile Asp Leu Ser Glu Leu Leu Ser Tyr His Asn Ile Lys Ile Pro Ser 50 55 60 Leu Ile Gln Gln Ser Gln Val Ala Leu Ser Gly Thr Gly Arg Thr Arg 65 70 75 80 Lys Ser Thr Ser Thr Thr Lys Phe Ser Trp Thr Thr His Ser Leu Ile 85 90 95 Ile Asp Leu Pro Thr His Ile Ser Glu Asn Asn Pro Gln Glu Ile Glu 100 105 110 Phe Ile Ser Pro Leu His Ser Ala Thr Leu Gly Ser Glu Ile Asn Ser 115 120 125 Pro Gln Tyr Leu Gln Pro Trp Arg Val Glu Gly Phe Cys Leu Asn Pro 130 135 140 Thr Glu Ala Ile Lys Phe Leu Ala Ala Val Pro Leu Asn Ala Ala Arg 145 150 155 160 Glu Glu Asp Thr Leu Phe Gly Gly Asp Leu Arg Phe Trp Ser Gln Ile 165 170 175 Ala Arg Trp Ser Leu Asp Leu Ile Ser Arg Cys Lys Phe Leu Pro Thr 180 185 190 Ile Gln Arg Gln Phe Asp Ser Ser Ile Val Ala Arg Trp Gln Val Leu 195 200 205 Leu Asp Ser Ala Ile Asp Gly Thr Arg Leu Glu Lys Phe Ser Ala Lys 210 215 220 Met Pro Leu Ala Cys Arg Thr Tyr Arg Lys Gly Met Gly Ser Gly Glu 225 230 235 240 Trp Gly Val Gly Ser Gly Glu Glu Ser Ser Pro Ser Ile Met Tyr Val 245 250 255 Asp Phe Pro Thr Glu Pro Gln Glu Leu Leu Leu Gly Phe Leu Asn Ser 260 265 270 Thr Ile Asp Ala Gln Val Arg Glu Met Leu Ala Ser Gln Pro Leu Leu 275 280 285 Glu Thr Arg Val Met Ala Ser Leu Pro Ser Ala Val Arg Gln Trp Leu 290 295 300 Gln Gly Leu Thr Ser Ala Ser His Thr Val Asn Ala Asp Ala Met Glu 305 310 315 320 Val Glu Arg Leu Glu Ala Ala Leu Lys Ser Trp Thr Met Pro Leu Gln 325 330 335 Tyr Gln Leu Val Gly Lys Pro Ser Phe Arg Ala Cys Phe Gln Leu Leu 340 345 350 Pro Pro Ala Ser Gly Ala Thr Asp Trp Ile Leu Ala Tyr Phe Leu Gln 355 360 365 Ala Ala Asp Asp Glu Asn Leu Leu Val Asp Ala Ala Thr Ile Trp His 370 375 380 His Pro Val Glu Gln Leu Val Tyr Gln Asn Arg Thr Ile Asp Gln Pro 385 390 395 400 Gln Glu Thr Leu Leu Arg Gly Leu Gly Leu Ala Ser Arg Leu Tyr Pro 405 410 415 Val Leu Thr Pro Ser Leu Glu Thr Glu Tyr Pro Gln Cys Cys Arg Leu 420 425 430 Asn Pro Leu Gln Ala Tyr Glu Phe Ile Lys Ser Val Ala Trp Arg Phe 435 440 445 Glu Asp Ser Gly Leu Gly Val Ile Leu Pro Pro Ser Leu Thr Asn Arg 450 455 460 Glu Gly Trp Ala Asn Arg Leu Gly Leu Lys Ile Ser Ala Glu Thr Gln 465 470 475 480 Lys Lys Lys Gln Gly Arg Leu Gly Leu Gln Ser Leu Leu Asn Phe Gln 485 490 495 Trp Gln Leu Ala Ile Gly Gly Gln Thr Ile Ser Lys Thr Glu Phe Asn 500 505 510 Lys Leu Val Ala Leu Asn Ser Pro Leu Val Glu Ile Asn Gly Glu Trp 515 520 525 Val Glu Leu Arg Pro Gln Asp Ile Lys Thr Ala Gln Thr Phe Phe Ala 530 535 540 Ser Arg Lys Asp Glu Met Thr Leu Ser Leu Glu Asp Ala Leu Arg Leu 545 550 555 560 Ser Ser Gly Asp Thr Gln Ala Ile Glu Lys Leu Pro Val Val Ser Phe 565 570 575 Glu Ala Ser Gly Thr Leu Gln Glu Leu Ile Gly Ala Leu Thr Asn Asn 580 585 590 Gln Ala Ile Ser Pro Leu Pro Thr Pro Ala Asn Phe Gln Gly Gln Leu 595 600 605 Arg Pro Tyr Gln Glu Arg Gly Ala Ala Trp Leu Ala Phe Leu Glu Arg 610 615 620 Trp Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr 625 630 635 640 Ile Gln Leu Ile Ala Phe Leu Leu His Leu Lys Glu Gln Asp Ala Leu 645 650 655 Glu Asn Pro Thr Leu Leu Val Cys Pro Thr Ser Ile Leu Gly Asn Trp 660 665 670 Glu Arg Glu Ile Lys Lys Phe Ala Pro Thr Leu Lys Val Leu Gln His 675 680 685 His Gly Asp Lys Arg Leu Lys Gly Lys Ala Phe Val Glu Ala Val Lys 690 695 700 Lys His Asp Val Ile Ile Thr Ser Tyr Ser Leu Val His Arg Asp Ile 705 710 715 720 Lys Ser Leu Gln Ser Val Asp Trp Gln Thr Val Val Leu Asp Glu Ala 725 730 735 Gln Asn Val Lys Asn Pro Glu Ala Lys Gln Ser Gln Ala Val Arg Gly 740 745 750 Leu Lys Thr Thr Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn 755 760 765 Lys Leu Gln Glu Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr 770 775 780 Leu Gly Asn Arg Gln Phe Phe Gln Arg Arg Phe Ala Met Pro Ile Glu 785 790 795 800 Lys Tyr Gly Asp Thr Ala Ser Leu Asn Gln Leu Arg Gly Leu Val Gln 805 810 815 Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Arg Asp Ile Ile Gln Asp 820 825 830 Leu Pro Glu Lys Gln Glu Met Thr Val Phe Cys Gly Leu Ala Ala Glu 835 840 845 Gln Ala Ala Leu Tyr Gln Gln Val Val Glu Ala Ser Leu Val Glu Ile 850 855 860 Glu Ser Ala Glu Gly Leu Gln Arg Arg Gly Met Ile Leu Ala Leu Leu 865 870 875 880 Val Lys Leu Lys Gln Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Ala 885 890 895 Ala Thr Leu Gln Glu His Ser Ser Ala Lys Leu Gln Arg Leu Asp Glu 900 905 910 Met Leu Thr Val Ala Leu Glu Glu Gly Asp Arg Ala Leu Ile Phe Thr 915 920 925 Gln Phe Ala Glu Trp Gly Lys Leu Leu Lys Ala His Leu Gln Gln Thr 930 935 940 Leu Gly Lys Glu Ile Phe Phe Leu Tyr Gly Gly Ser Ser Lys Lys Gln 945 950 955 960 Arg Glu Glu Met Ile Asp Arg Phe Gln His Asp Pro Gln Gly Pro Pro 965 970 975 Ile Met Ile Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr 980 985 990 Arg Ala Asn His Val Phe His Phe Asp Arg Trp Trp Asn Pro Ala Val 995 1000 1005 Glu Asn Gln Ala Thr Asp Arg Val Phe Arg Ile Gly Gln Thr Arg 1010 1015 1020 Asn Val Gln Val His Lys Phe Val Cys Thr Gly Thr Leu Glu Glu 1025 1030 1035 Lys Ile His Asp Met Ile Glu Ser Lys Lys Gln Leu Ala Glu Gln 1040 1045 1050 Val Val Gly Ala Gly Glu Glu Trp Leu Thr Glu Met Asn Thr Asp 1055 1060 1065 Gln Leu Arg Asp Leu Leu Ile Leu Asp Arg Ser Ala Ile Ile Asp 1070 1075 1080 Glu Asp Glu Val 1085 <210> 59 <211> 3228 <212> DNA <213> Nostoc sp. <400> 59 atggcaattc tacacggtag ttggatatta aatgagcagg agagttgttt atttatttgg 60 ggggaaactt ggcgatcgcc acaagtggat tttaattttg cggagatatc cctcaatccc 120 ttggcgctgt ctgcactgga attaagtgag tggttgcagt ctcaacatca ggcgatcgct 180 aagttgttac cgcaacaatt ggaaaaacga acctccaaag cagcaagttc tgtaaaaata 240 aatttattaa ctcattcaca aataattgcc ctgccaacgg aaatttccca acctcgtaaa 300 aaagaaacca ttttaatttc tcctgtgcat tctgccgctt tagcatctga gtcagactct 360 gaagtttatt tacaaacttg gcgtgtagaa ggtttttgtc ttcctcctag tgcagcaatt 420 aaattgctaa cttctttacc tttaaatata actagtgggg agaatgcttt tttaggtgga 480 gatttacgtt tctggtcaca aattgcccgt tggagtttag atttaatttc taggtctaag 540 tttctcccaa ttatccaacg acaacctaat aattctgtaa gtgctaaatg gcaagtactt 600 ttagatagtg ccgtagatgg aactcgttta gaaaagtttg ctgcgaagat gcccttggtt 660 tgtcggactt atcaagaaat tgggagtggg gaatctccta tatatataga ttttcctagt 720 cagccgcagg atttaatctt gggttttctc aatagtgcga tagatacgca attgcgggag 780 atggtgggga atcagcctgt ggtggaaact cggttgatgg catctttacc atcggcggtg 840 cgacagtggt tgcaagcgtt aattgctgca tctaattcaa ttgatgcaga tgctgttggt 900 ttagaaaggc tggaagcggc gctcaaggct tggacgatgc cgctacaata tcaactagca 960 agtaaaaatc aatttcgcac ttgttttgaa ttacgttctc cagaaccaga cgaaactgaa 1020 tggacgctgg cgtatttcct gcaagcagcc gatgatccag aatttttagt agatgcggcg 1080 actatttggc aaaatcctgt tgaacagcta atttatcaac agcgaacgat tgaagaaccc 1140 caggaaacgt ttttgcgagg tttggggtta gcttctcgat tgtatccggt cattgccccc 1200 actttagata cagaatcacc ccaattttgt catctcaagc ccatgcaggc ttatgaattt 1260 atcaaggctg tggcttggcg atttgaagat agcggcttag gggtgatttt acctcctagt 1320 ttggcgaatc gtgaaggctg ggcaaatcgc ttgggtttga aaatctccgc cgaaacgccg 1380 aagaaaaaac caggacgctt aggattgcag agtttgctca atttccaatg gcacttagcg 1440 attggtgggc aaactatttc taaagctgaa tttgacagac tggtagcttt aaaaagccca 1500 ttggtagaaa ttaacggcga gtgggtggaa ttacgtcccc aagatatcaa aacagctgaa 1560 gcctttttta ctgcgcgtaa agaccaaatg gccttatctt tagaagatgc cttacgtcta 1620 agtagtggcg atacacaagt aattgagaaa ttaccagtag tcagctttga agcctctggc 1680 gcattacaag aattgattgg ggcgctgaca aataatcaag cagttgcacc attacctacg 1740 ccgaaaaact tccaaggaca gttacgtcct tatcaagaaa ggggtgcggc ttggttggcg 1800 ttcctcgaac gctggggttt aggtgcttgt ctcgccgacg acatgggact gggaaaaacg 1860 atacagttca ttgctttcct tctccatctt aaagaacagg atgtattaga aaaaccaact 1920 ttactagtgt gtcctacttc tgttttaggt aactgggaac gagaggtgag aaaatttgca 1980 cctacactta aagttctcca gtatcatggt gacaaacgtc ctaaaggtaa agcatttcaa 2040 gaagcagtaa aaaaacatga tttagttatt acaagttact cattaattca tagagatatc 2100 aaatcattgc agggtattcc ttggcaaata attgttttag atgaagccca aaatgtgaag 2160 aatgcggaag ccaaacaatc acaagcagtc agacaattag aaacaacatt tcgtattgct 2220 ttaacaggta caccagtaga aaatagacta caagaacttt ggtcaatttt agattttctt 2280 aatcctggtt acttaggtaa taagcaattc tttcaaagac gttttgctat gccaattgaa 2340 aagtatggtg atgcagcatc tttaaatcaa ttgcgtgctt tagtgcaacc atttattctg 2400 cgtcggctga aaacagaccg tgatattatt caagacttgc ccgataagca agaaatgaca 2460 gtattttgtg gtttgactgg agaacaagct gcactttatc aaaaagcggt agaaacatct 2520 ttagcagaaa ttgaatcagc cgaaggattg caacgccgag ggatgatttt agctttatta 2580 attaaactca aacaaatctg caatcatcca gcccaatatc tgaaaataaa tacattagaa 2640 caacacagtt ctggaaaact gcaaagatta gaagaaatgt tagaagaggt gttagcagag 2700 agtaatactt acggtgttgc cggtgcggga cgtgctttga tttttaccca atttgcagaa 2760 tggggtaagt tactcaaacc acatttagaa aaacaactag ggcgggaaat atttttctta 2820 tatggtggta cgagtaaaaa gcaacgagaa gaaatgattg accgttttca acacgacccc 2880 caagggccac caattatgat tctctccctc aaagcaggtg gtgtagggtt gaacttaacc 2940 agggcaaatc atgtatttca ctttgataga tggtggaatc cagccgtaga gaatcaagct 3000 acagaccgcg tatttcgcat tggtcaaact cgcaatgtac aggtgcataa atttgtttgt 3060 aatggcacct tagaagagaa aattcacgac atgattgaaa gtaaaaaaca actagcggaa 3120 caggttgttg gagcaggcga agaatggtta actgaattag atacagatca actccgcaac 3180 ttactgatac ttgatcgtag tacagtaatt gatgaagaag cagattga 3228 <210> 60 <211> 1075 <212> PRT <213> Nostoc sp. <400> 60 Met Ala Ile Leu His Gly Ser Trp Ile Leu Asn Glu Gln Glu Ser Cys 1 5 10 15 Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Pro Gln Val Asp Phe Asn 20 25 30 Phe Ala Glu Ile Ser Leu Asn Pro Leu Ala Leu Ser Ala Leu Glu Leu 35 40 45 Ser Glu Trp Leu Gln Ser Gln His Gln Ala Ile Ala Lys Leu Leu Pro 50 55 60 Gln Gln Leu Glu Lys Arg Thr Ser Lys Ala Ala Ser Ser Val Lys Ile 65 70 75 80 Asn Leu Leu Thr His Ser Gln Ile Ile Ala Leu Pro Thr Glu Ile Ser 85 90 95 Gln Pro Arg Lys Lys Glu Thr Ile Leu Ile Ser Pro Val His Ser Ala 100 105 110 Ala Leu Ala Ser Glu Ser Asp Ser Glu Val Tyr Leu Gln Thr Trp Arg 115 120 125 Val Glu Gly Phe Cys Leu Pro Pro Ser Ala Ala Ile Lys Leu Leu Thr 130 135 140 Ser Leu Pro Leu Asn Ile Thr Ser Gly Glu Asn Ala Phe Leu Gly Gly 145 150 155 160 Asp Leu Arg Phe Trp Ser Gln Ile Ala Arg Trp Ser Leu Asp Leu Ile 165 170 175 Ser Arg Ser Lys Phe Leu Pro Ile Ile Gln Arg Gln Pro Asn Asn Ser 180 185 190 Val Ser Ala Lys Trp Gln Val Leu Leu Asp Ser Ala Val Asp Gly Thr 195 200 205 Arg Leu Glu Lys Phe Ala Ala Lys Met Pro Leu Val Cys Arg Thr Tyr 210 215 220 Gln Glu Ile Gly Ser Gly Glu Ser Pro Ile Tyr Ile Asp Phe Pro Ser 225 230 235 240 Gln Pro Gln Asp Leu Ile Leu Gly Phe Leu Asn Ser Ala Ile Asp Thr 245 250 255 Gln Leu Arg Glu Met Val Gly Asn Gln Pro Val Val Glu Thr Arg Leu 260 265 270 Met Ala Ser Leu Pro Ser Ala Val Arg Gln Trp Leu Gln Ala Leu Ile 275 280 285 Ala Ala Ser Asn Ser Ile Asp Ala Asp Ala Val Gly Leu Glu Arg Leu 290 295 300 Glu Ala Ala Leu Lys Ala Trp Thr Met Pro Leu Gln Tyr Gln Leu Ala 305 310 315 320 Ser Lys Asn Gln Phe Arg Thr Cys Phe Glu Leu Arg Ser Pro Glu Pro 325 330 335 Asp Glu Thr Glu Trp Thr Leu Ala Tyr Phe Leu Gln Ala Ala Asp Asp 340 345 350 Pro Glu Phe Leu Val Asp Ala Ala Thr Ile Trp Gln Asn Pro Val Glu 355 360 365 Gln Leu Ile Tyr Gln Gln Arg Thr Ile Glu Glu Pro Gln Glu Thr Phe 370 375 380 Leu Arg Gly Leu Gly Leu Ala Ser Arg Leu Tyr Pro Val Ile Ala Pro 385 390 395 400 Thr Leu Asp Thr Glu Ser Pro Gln Phe Cys His Leu Lys Pro Met Gln 405 410 415 Ala Tyr Glu Phe Ile Lys Ala Val Ala Trp Arg Phe Glu Asp Ser Gly 420 425 430 Leu Gly Val Ile Leu Pro Pro Ser Leu Ala Asn Arg Glu Gly Trp Ala 435 440 445 Asn Arg Leu Gly Leu Lys Ile Ser Ala Glu Thr Pro Lys Lys Lys Pro 450 455 460 Gly Arg Leu Gly Leu Gln Ser Leu Leu Asn Phe Gln Trp His Leu Ala 465 470 475 480 Ile Gly Gly Gln Thr Ile Ser Lys Ala Glu Phe Asp Arg Leu Val Ala 485 490 495 Leu Lys Ser Pro Leu Val Glu Ile Asn Gly Glu Trp Val Glu Leu Arg 500 505 510 Pro Gln Asp Ile Lys Thr Ala Glu Ala Phe Phe Thr Ala Arg Lys Asp 515 520 525 Gln Met Ala Leu Ser Leu Glu Asp Ala Leu Arg Leu Ser Ser Gly Asp 530 535 540 Thr Gln Val Ile Glu Lys Leu Pro Val Val Ser Phe Glu Ala Ser Gly 545 550 555 560 Ala Leu Gln Glu Leu Ile Gly Ala Leu Thr Asn Asn Gln Ala Val Ala 565 570 575 Pro Leu Pro Thr Pro Lys Asn Phe Gln Gly Gln Leu Arg Pro Tyr Gln 580 585 590 Glu Arg Gly Ala Ala Trp Leu Ala Phe Leu Glu Arg Trp Gly Leu Gly 595 600 605 Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Phe Ile 610 615 620 Ala Phe Leu Leu His Leu Lys Glu Gln Asp Val Leu Glu Lys Pro Thr 625 630 635 640 Leu Leu Val Cys Pro Thr Ser Val Leu Gly Asn Trp Glu Arg Glu Val 645 650 655 Arg Lys Phe Ala Pro Thr Leu Lys Val Leu Gln Tyr His Gly Asp Lys 660 665 670 Arg Pro Lys Gly Lys Ala Phe Gln Glu Ala Val Lys Lys His Asp Leu 675 680 685 Val Ile Thr Ser Tyr Ser Leu Ile His Arg Asp Ile Lys Ser Leu Gln 690 695 700 Gly Ile Pro Trp Gln Ile Ile Val Leu Asp Glu Ala Gln Asn Val Lys 705 710 715 720 Asn Ala Glu Ala Lys Gln Ser Gln Ala Val Arg Gln Leu Glu Thr Thr 725 730 735 Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Gln Glu 740 745 750 Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr Leu Gly Asn Lys 755 760 765 Gln Phe Phe Gln Arg Arg Phe Ala Met Pro Ile Glu Lys Tyr Gly Asp 770 775 780 Ala Ala Ser Leu Asn Gln Leu Arg Ala Leu Val Gln Pro Phe Ile Leu 785 790 795 800 Arg Arg Leu Lys Thr Asp Arg Asp Ile Ile Gln Asp Leu Pro Asp Lys 805 810 815 Gln Glu Met Thr Val Phe Cys Gly Leu Thr Gly Glu Gln Ala Ala Leu 820 825 830 Tyr Gln Lys Ala Val Glu Thr Ser Leu Ala Glu Ile Glu Ser Ala Glu 835 840 845 Gly Leu Gln Arg Arg Gly Met Ile Leu Ala Leu Leu Ile Lys Leu Lys 850 855 860 Gln Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Ile Asn Thr Leu Glu 865 870 875 880 Gln His Ser Ser Gly Lys Leu Gln Arg Leu Glu Glu Met Leu Glu Glu 885 890 895 Val Leu Ala Glu Ser Asn Thr Tyr Gly Val Ala Gly Ala Gly Arg Ala 900 905 910 Leu Ile Phe Thr Gln Phe Ala Glu Trp Gly Lys Leu Leu Lys Pro His 915 920 925 Leu Glu Lys Gln Leu Gly Arg Glu Ile Phe Phe Leu Tyr Gly Gly Thr 930 935 940 Ser Lys Lys Gln Arg Glu Glu Met Ile Asp Arg Phe Gln His Asp Pro 945 950 955 960 Gln Gly Pro Pro Ile Met Ile Leu Ser Leu Lys Ala Gly Gly Val Gly 965 970 975 Leu Asn Leu Thr Arg Ala Asn His Val Phe His Phe Asp Arg Trp Trp 980 985 990 Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Val Phe Arg Ile Gly 995 1000 1005 Gln Thr Arg Asn Val Gln Val His Lys Phe Val Cys Asn Gly Thr 1010 1015 1020 Leu Glu Glu Lys Ile His Asp Met Ile Glu Ser Lys Lys Gln Leu 1025 1030 1035 Ala Glu Gln Val Val Gly Ala Gly Glu Glu Trp Leu Thr Glu Leu 1040 1045 1050 Asp Thr Asp Gln Leu Arg Asn Leu Leu Ile Leu Asp Arg Ser Thr 1055 1060 1065 Val Ile Asp Glu Glu Ala Asp 1070 1075 <210> 61 <211> 3168 <212> DNA <213> Nostoc sp. <400> 61 atgaaagtcc ttcatggctc gtggatacca aaccaatata gcgattttgt gcagtctgga 60 gcattttatc tatgggtaga aactccgatt aataacaaaa agcgtactca tacacaagtt 120 catcccggac atctatcttc tcttgaatta ctcaattttc tgactcaaac tttggggatt 180 aaagaaactg aagcgcaatt aaaacaacgg atatgttcta aatattttgc cctaccaact 240 gctaataatg agccattacc ttcaccagag ttagtcaaat atttagaagt agaagttcct 300 gaagagtatg aaaattttca atattggcag gtaacttgtt atgaaactgt tacttctgtg 360 aaagcagtga tagcaattaa tattattaaa ttactcaaag atattcattt tttagccctg 420 tacaatgcta gtgaatttca attagggtca gatttattat tttggtatca ttatacgcaa 480 tcatttagac aaataattac taaggatcaa tatattccat ctttaaaata tagagcgaac 540 gcagcgacta caaagaaaaa acctaaacaa ccacccccag gatttgaaat atatgctggt 600 tgggaaataa tttccgagca atacgaagcc aatattcaaa aatatattga atatatgcca 660 ttgatttgtg tagcaggtaa cagcacacaa actgataaat tagaattttt tgctccagaa 720 actctattac gccacttcag cgagtatctg cttaataatt tagtgagtaa gacaccattg 780 accgcagcat ttgaaaaaca aattgatgat tctttaattc actattgtct ttatccccaa 840 aaacacaacc cactcaaaac ccatactgct ctccaagagt atcagcagtg gttgggatgg 900 aaaaacagga ttatccgtac tcaagctgaa tcaccatttc atctttgctt ccaattacat 960 tcacctgatg ctgaacaaat tgacaattgg cagatgcaat ttttagtatc aagtaaaaaa 1020 gatccgtctc taaaattagc tttggcagat tactggataa tgaattccaa aaccaaagct 1080 ggtgtacata aagagtttgg caaagatttc gatactaatt tactgctgaa tttaggctat 1140 gcagcaagaa tgtatcccaa actttggcaa ggtttagaaa cggactctcc cacaggaatg 1200 cagctaagtt tagatgaggc gtttgatttt ctcaaagata gtgcttgggt gttggaagac 1260 tcaggattta aggtcattgt cccggcttgg tatactccgg ctggtcgtcg tcgtgcgaaa 1320 atccgcctca aagcttctag tggtcgcaag gtagctgcta cggtagggga aagcaaaagt 1380 tatttcggtt tagattcact agtgcagtat cagtatgaat tagcaattgg agagcaaact 1440 ctcacacctc aagaatggga acaattgatt aatactaaag caccactagt gcattttcgc 1500 ggtcaatgga tggaattaga ccgggataaa atgcagcagt tattagaatt ttggcagtcc 1560 cacggcgatg aacagcccca aatgagcttg ttagagttca tgcaacgcag cgcccaaggg 1620 gaagatgact gggaaattga atatgatgca gctttatcag aaataatggc aaagttacaa 1680 gataagagtc agctagagcc aatttctgaa gacttaaatt tgcaaggcaa cctgcgagaa 1740 tatcaaaagc ggggtgtagc ctggttacaa tatttagaaa aattgggatt aaatggctgt 1800 ttagccgatg atatgggact gggtaagtcc gtgcaggtaa ttgcgagatt agtacaggag 1860 aaagatagcc aaagttcccc attaccgaca ttattaattg cgccgacttc ggttgttggt 1920 aactggcaaa gagaaattgc taagtttgca ccccatttaa aaactatggt gcatcatggt 1980 agcgatcgcc tgcaagatgc tgcggagttt aagtccgcct gtcaacagca tgatgtggtg 2040 ataagttcct ttactttggc tcgcttagat gaaaaactcc taaatagtgt gacatggcaa 2100 cggttagttt tagatgaagc acaaaacatt aaaaatccca aagcagcgca gactaaagct 2160 atactcaaac tcagtgctaa acaccgtcta gctttaactg gtacaccagt tgagaaccgc 2220 ttacttgatt tgtggtcaat ttttaatttt ctcaatcccg gttatttagg gaaagaagca 2280 cagtttcgca aatcctttga aattcccatc cagaaggaca acgataaagt aaaatcgact 2340 accttaaaga aactggttga accgttaatt ttacgacggg tcaaaacaga ccaatcaatt 2400 attaaagact taccagataa agttgaacaa aaactctata ccaacctcac caaagaacag 2460 gcttcgctat atgaagtggt agtcagagat gtggaagaaa aattgcaaga agctgaggga 2520 atacaacgca aaggtttaat tctctcaacg ctgatgaaat taaaacagat ttgcaatcat 2580 cccagacagt tcctccaaga taatagcgaa tttttaccgg agcgctcgca caaactttcc 2640 cgcttagtcg aaatggtaga tgaagccatt tctgaaggag aaagtctttt aatatttagt 2700 caatttacag aagtctgcga acaaatagaa aaatatctca aacacaactt acattgcaat 2760 acctactacc tacatggggg tacaagtcgc caacgtcggg aacaaatgat tagtgacttt 2820 caaaatcctg atacggaagc atctgtattt gtcctttccc taaaagctgg cggcgtgggg 2880 attactttaa ctaaagccaa ccacgtcttt cattttgacc gttggtggaa tccagccgtt 2940 gaagaccaag ccacagaccg cgcttttcgc ataggtcaga aaaaaaatgt gtttgtacat 3000 aaatttgtcg cccttgggac tttagaagaa agaatcgacc aaatgattga agataagaaa 3060 aaactttctt ccgccgtagt tggtagtgat gaatcgtggc taaccgaatt agataacgaa 3120 gcctttaaga aactaattgc cttgaataaa agcacaatta tggagtag 3168 <210> 62 <211> 1055 <212> PRT <213> Nostoc sp. <400> 62 Met Lys Val Leu His Gly Ser Trp Ile Pro Asn Gln Tyr Ser Asp Phe 1 5 10 15 Val Gln Ser Gly Ala Phe Tyr Leu Trp Val Glu Thr Pro Ile Asn Asn 20 25 30 Lys Lys Arg Thr His Thr Gln Val His Pro Gly His Leu Ser Ser Leu 35 40 45 Glu Leu Leu Asn Phe Leu Thr Gln Thr Leu Gly Ile Lys Glu Thr Glu 50 55 60 Ala Gln Leu Lys Gln Arg Ile Cys Ser Lys Tyr Phe Ala Leu Pro Thr 65 70 75 80 Ala Asn Asn Glu Pro Leu Pro Ser Pro Glu Leu Val Lys Tyr Leu Glu 85 90 95 Val Glu Val Pro Glu Glu Tyr Glu Asn Phe Gln Tyr Trp Gln Val Thr 100 105 110 Cys Tyr Glu Thr Val Thr Ser Val Lys Ala Val Ile Ala Ile Asn Ile 115 120 125 Ile Lys Leu Leu Lys Asp Ile His Phe Leu Ala Leu Tyr Asn Ala Ser 130 135 140 Glu Phe Gln Leu Gly Ser Asp Leu Leu Phe Trp Tyr His Tyr Thr Gln 145 150 155 160 Ser Phe Arg Gln Ile Ile Thr Lys Asp Gln Tyr Ile Pro Ser Leu Lys 165 170 175 Tyr Arg Ala Asn Ala Ala Thr Thr Lys Lys Lys Pro Lys Gln Pro Pro 180 185 190 Pro Gly Phe Glu Ile Tyr Ala Gly Trp Glu Ile Ile Ser Glu Gln Tyr 195 200 205 Glu Ala Asn Ile Gln Lys Tyr Ile Glu Tyr Met Pro Leu Ile Cys Val 210 215 220 Ala Gly Asn Ser Thr Gln Thr Asp Lys Leu Glu Phe Phe Ala Pro Glu 225 230 235 240 Thr Leu Leu Arg His Phe Ser Glu Tyr Leu Leu Asn Asn Leu Val Ser 245 250 255 Lys Thr Pro Leu Thr Ala Ala Phe Glu Lys Gln Ile Asp Asp Ser Leu 260 265 270 Ile His Tyr Cys Leu Tyr Pro Gln Lys His Asn Pro Leu Lys Thr His 275 280 285 Thr Ala Leu Gln Glu Tyr Gln Gln Trp Leu Gly Trp Lys Asn Arg Ile 290 295 300 Ile Arg Thr Gln Ala Glu Ser Pro Phe His Leu Cys Phe Gln Leu His 305 310 315 320 Ser Pro Asp Ala Glu Gln Ile Asp Asn Trp Gln Met Gln Phe Leu Val 325 330 335 Ser Ser Lys Lys Asp Pro Ser Leu Lys Leu Ala Leu Ala Asp Tyr Trp 340 345 350 Ile Met Asn Ser Lys Thr Lys Ala Gly Val His Lys Glu Phe Gly Lys 355 360 365 Asp Phe Asp Thr Asn Leu Leu Leu Asn Leu Gly Tyr Ala Ala Arg Met 370 375 380 Tyr Pro Lys Leu Trp Gln Gly Leu Glu Thr Asp Ser Pro Thr Gly Met 385 390 395 400 Gln Leu Ser Leu Asp Glu Ala Phe Asp Phe Leu Lys Asp Ser Ala Trp 405 410 415 Val Leu Glu Asp Ser Gly Phe Lys Val Ile Val Pro Ala Trp Tyr Thr 420 425 430 Pro Ala Gly Arg Arg Arg Ala Lys Ile Arg Leu Lys Ala Ser Ser Gly 435 440 445 Arg Lys Val Ala Ala Thr Val Gly Glu Ser Lys Ser Tyr Phe Gly Leu 450 455 460 Asp Ser Leu Val Gln Tyr Gln Tyr Glu Leu Ala Ile Gly Glu Gln Thr 465 470 475 480 Leu Thr Pro Gln Glu Trp Glu Gln Leu Ile Asn Thr Lys Ala Pro Leu 485 490 495 Val His Phe Arg Gly Gln Trp Met Glu Leu Asp Arg Asp Lys Met Gln 500 505 510 Gln Leu Leu Glu Phe Trp Gln Ser His Gly Asp Glu Gln Pro Gln Met 515 520 525 Ser Leu Leu Glu Phe Met Gln Arg Ser Ala Gln Gly Glu Asp Asp Trp 530 535 540 Glu Ile Glu Tyr Asp Ala Ala Leu Ser Glu Ile Met Ala Lys Leu Gln 545 550 555 560 Asp Lys Ser Gln Leu Glu Pro Ile Ser Glu Asp Leu Asn Leu Gln Gly 565 570 575 Asn Leu Arg Glu Tyr Gln Lys Arg Gly Val Ala Trp Leu Gln Tyr Leu 580 585 590 Glu Lys Leu Gly Leu Asn Gly Cys Leu Ala Asp Asp Met Gly Leu Gly 595 600 605 Lys Ser Val Gln Val Ile Ala Arg Leu Val Gln Glu Lys Asp Ser Gln 610 615 620 Ser Ser Pro Leu Pro Thr Leu Leu Ile Ala Pro Thr Ser Val Val Gly 625 630 635 640 Asn Trp Gln Arg Glu Ile Ala Lys Phe Ala Pro His Leu Lys Thr Met 645 650 655 Val His His Gly Ser Asp Arg Leu Gln Asp Ala Ala Glu Phe Lys Ser 660 665 670 Ala Cys Gln Gln His Asp Val Val Ile Ser Ser Phe Thr Leu Ala Arg 675 680 685 Leu Asp Glu Lys Leu Leu Asn Ser Val Thr Trp Gln Arg Leu Val Leu 690 695 700 Asp Glu Ala Gln Asn Ile Lys Asn Pro Lys Ala Ala Gln Thr Lys Ala 705 710 715 720 Ile Leu Lys Leu Ser Ala Lys His Arg Leu Ala Leu Thr Gly Thr Pro 725 730 735 Val Glu Asn Arg Leu Leu Asp Leu Trp Ser Ile Phe Asn Phe Leu Asn 740 745 750 Pro Gly Tyr Leu Gly Lys Glu Ala Gln Phe Arg Lys Ser Phe Glu Ile 755 760 765 Pro Ile Gln Lys Asp Asn Asp Lys Val Lys Ser Thr Thr Leu Lys Lys 770 775 780 Leu Val Glu Pro Leu Ile Leu Arg Arg Val Lys Thr Asp Gln Ser Ile 785 790 795 800 Ile Lys Asp Leu Pro Asp Lys Val Glu Gln Lys Leu Tyr Thr Asn Leu 805 810 815 Thr Lys Glu Gln Ala Ser Leu Tyr Glu Val Val Val Arg Asp Val Glu 820 825 830 Glu Lys Leu Gln Glu Ala Glu Gly Ile Gln Arg Lys Gly Leu Ile Leu 835 840 845 Ser Thr Leu Met Lys Leu Lys Gln Ile Cys Asn His Pro Arg Gln Phe 850 855 860 Leu Gln Asp Asn Ser Glu Phe Leu Pro Glu Arg Ser His Lys Leu Ser 865 870 875 880 Arg Leu Val Glu Met Val Asp Glu Ala Ile Ser Glu Gly Glu Ser Leu 885 890 895 Leu Ile Phe Ser Gln Phe Thr Glu Val Cys Glu Gln Ile Glu Lys Tyr 900 905 910 Leu Lys His Asn Leu His Cys Asn Thr Tyr Tyr Leu His Gly Gly Thr 915 920 925 Ser Arg Gln Arg Arg Glu Gln Met Ile Ser Asp Phe Gln Asn Pro Asp 930 935 940 Thr Glu Ala Ser Val Phe Val Leu Ser Leu Lys Ala Gly Gly Val Gly 945 950 955 960 Ile Thr Leu Thr Lys Ala Asn His Val Phe His Phe Asp Arg Trp Trp 965 970 975 Asn Pro Ala Val Glu Asp Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly 980 985 990 Gln Lys Lys Asn Val Phe Val His Lys Phe Val Ala Leu Gly Thr Leu 995 1000 1005 Glu Glu Arg Ile Asp Gln Met Ile Glu Asp Lys Lys Lys Leu Ser 1010 1015 1020 Ser Ala Val Val Gly Ser Asp Glu Ser Trp Leu Thr Glu Leu Asp 1025 1030 1035 Asn Glu Ala Phe Lys Lys Leu Ile Ala Leu Asn Lys Ser Thr Ile 1040 1045 1050 Met Glu 1055 <210> 63 <211> 2856 <212> DNA <213> Nostoc punctiforme <400> 63 atggcgattt tacacagtaa ttggttacta aaaagtcaaa aaggttgttt atttatttgg 60 ggagaaactt ggcgatcgcc acgagttaat ttcgagtcta atggatctgg agatatccca 120 ctaaatccat tggcaatgac atcactagag ttgagcgagt ggttggtttc ccagaagatg 180 gccattacca actttatcca gcaaccccaa attgccatcg ctactactgg gcgaacacgt 240 aaagcagcca ctgccactga gataaactta ccaacgcatt cacaaataat tgccttacca 300 acttatattc ccgaagagag tgcagaagga acatctgcaa ttttccctgt gcattctgcc 360 agcttgagac tagaaacaga ctctccgcaa tatttgcaac cgtggctagt tgagggtttt 420 tgtcttaacc ccagcgaagc agtaaaattt ctcgctgctg ttcccctgaa tgctgctaaa 480 ggggaagatg cttttttagg aggagattta cgtttttggt cgcaagtttc ccgatggagt 540 ttagatttaa tctcgcggtg taagttttta ccaagaattg aacggcaatc agacggtgca 600 tttgctgcta aatggcaagt acttctagac agtgctgtag atggaactcg cctagaaaag 660 ttttctgcgg atatgccgtt ggtttgccgc acttatcagg agggagtggg gactggggac 720 tggggactga ggactgggga ggagttttcc caatccctaa tccctaattc ccaatcccta 780 ctttatgtaa acttccctac tgaacctcaa gaattgttgc tgggatttct caacagtacg 840 atagatgccc aagtgcgagg gatggtgggt tctcagcctc caatggaagc taaggcaatg 900 gcatctttac catctggggt gcggcagtgg ttgcaaggct tgactagtac atctggtaca 960 gttaacgcag atgccattga agtggaacga ctggaagcgg cactgaaggc ttggatgatg 1020 ccgctacaat accaattaac tcttaaaact ctatttcgta cctgttttca actgcgttct 1080 ccagaagctg gcgaaacaga ttggacattg gcgtattttc tgcaagcggc tgacgatcct 1140 gattttttgg tggatgcggc aactatttgg aacaatccag ttgaacgttt ggtttatgaa 1200 aatcgaacaa ttgagcaacc acaggaaaca tttttgcgag gtttaggggt agcttcccga 1260 ttatatccag cgatcgcacc cagttttgaa accgaatatc cccaatcttc tcggatcaca 1320 cccatgcaag cttatgagtt tatcaaggct gtagcttgga ggttggaaga cagtggtttg 1380 ggggtaattt tgcctcctag tttagcgaac cgcgaaggat gggcaaatcg tttgggtttg 1440 aaaattactg ctgaaacccc aaagaaaaag cagggacgtt tagggttgca aagtctgctg 1500 aatttccaat ggcaattggc aattggcgga cagactattt ccaaagctga gtttgataaa 1560 cttgtggctt taaatagtcc actagtggaa attaacggtg agtgggtaga attgcggccc 1620 caagatatca agacagccca aacatttttt accactcgca aagaccaaat ggcgctttcc 1680 ttggaagatg ccttgcgttt cagtacagga gatacccagg taattgaaaa attaccagtg 1740 gtcagctttg aggcatctgg ggcattgcaa gagttgattg gggcgctaaa taataatcaa 1800 gcgatcgcac ctttaccgac accagtaggc tttaaaggac agttgcgacc ttatcaagaa 1860 cgtggtgctg cttggctgtc cttcttggaa cgttggggct taggcgcgtg tctcgccgac 1920 gatatgggac tcggtaaaac tattcagttt attgcttttt tgctacatct taaagaacag 1980 gatgcactag aaaattcaac actgctagtt tgtccaactt ctgttttagg caactgggaa 2040 agggaagtca ataaatttgc accaagcctg aaaattttgc aatatcacgg tgacaaacgt 2100 ccaaaaggga aagcgttttt agaagcagtg aaaaatcacg atttaatcgt taccagctac 2160 tcactgcttc atcgggatat caagtcattg caaagtgttc cttggcagat aattgtttta 2220 gacgaagccc agaatgtgaa aaatccagag gcgaagcagt caaaagctgt gcggcaatta 2280 gaagctacat ttcgcattgc attaacgggg acaccagtag aaaatagact gcaagaacta 2340 tggtctattt tggattttct caatccaggg tatttaggta ataagcaatt tttccagcgg 2400 cggtttgcca tgccaattga aaagtatggt gatacggctt ctttgggtca attacgttca 2460 ttagttcagc catttatact gcggcgatta aaaagcgatc gcgaaattat tcaagacttg 2520 ccagataagc aagagatgac cgtattttgc ggtttaactg ccgaccaagc tgcactttat 2580 caacaagttg tagaacaatc tttagtagag atagaatctg ctgaaggatt gcaacgtcgg 2640 gggatgattt tggctttgct aatcaaactg aagcaaatct gcaatcatcc agcccaatat 2700 ttgaaacagg cgacattaga gcaacataat tcagccaaac ttctgcggct agaagaaatg 2760 ttagaagaag ttttagcaga aagtgaccgg gctttaatct ttacacaatt tgcagagtgg 2820 ggtaagttac ttaaacccaa aagtgttgaa tgttaa 2856 <210> 64 <211> 951 <212> PRT <213> Nostoc punctiforme <400> 64 Met Ala Ile Leu His Ser Asn Trp Leu Leu Lys Ser Gln Lys Gly Cys 1 5 10 15 Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Pro Arg Val Asn Phe Glu 20 25 30 Ser Asn Gly Ser Gly Asp Ile Pro Leu Asn Pro Leu Ala Met Thr Ser 35 40 45 Leu Glu Leu Ser Glu Trp Leu Val Ser Gln Lys Met Ala Ile Thr Asn 50 55 60 Phe Ile Gln Gln Pro Gln Ile Ala Ile Ala Thr Thr Gly Arg Thr Arg 65 70 75 80 Lys Ala Ala Thr Ala Thr Glu Ile Asn Leu Pro Thr His Ser Gln Ile 85 90 95 Ile Ala Leu Pro Thr Tyr Ile Pro Glu Glu Ser Ala Glu Gly Thr Ser 100 105 110 Ala Ile Phe Pro Val His Ser Ala Ser Leu Arg Leu Glu Thr Asp Ser 115 120 125 Pro Gln Tyr Leu Gln Pro Trp Leu Val Glu Gly Phe Cys Leu Asn Pro 130 135 140 Ser Glu Ala Val Lys Phe Leu Ala Ala Val Pro Leu Asn Ala Ala Lys 145 150 155 160 Gly Glu Asp Ala Phe Leu Gly Gly Asp Leu Arg Phe Trp Ser Gln Val 165 170 175 Ser Arg Trp Ser Leu Asp Leu Ile Ser Arg Cys Lys Phe Leu Pro Arg 180 185 190 Ile Glu Arg Gln Ser Asp Gly Ala Phe Ala Ala Lys Trp Gln Val Leu 195 200 205 Leu Asp Ser Ala Val Asp Gly Thr Arg Leu Glu Lys Phe Ser Ala Asp 210 215 220 Met Pro Leu Val Cys Arg Thr Tyr Gln Glu Gly Val Gly Thr Gly Asp 225 230 235 240 Trp Gly Leu Arg Thr Gly Glu Glu Phe Ser Gln Ser Leu Ile Pro Asn 245 250 255 Ser Gln Ser Leu Leu Tyr Val Asn Phe Pro Thr Glu Pro Gln Glu Leu 260 265 270 Leu Leu Gly Phe Leu Asn Ser Thr Ile Asp Ala Gln Val Arg Gly Met 275 280 285 Val Gly Ser Gln Pro Pro Met Glu Ala Lys Ala Met Ala Ser Leu Pro 290 295 300 Ser Gly Val Arg Gln Trp Leu Gln Gly Leu Thr Ser Thr Ser Gly Thr 305 310 315 320 Val Asn Ala Asp Ala Ile Glu Val Glu Arg Leu Glu Ala Ala Leu Lys 325 330 335 Ala Trp Met Met Pro Leu Gln Tyr Gln Leu Thr Leu Lys Thr Leu Phe 340 345 350 Arg Thr Cys Phe Gln Leu Arg Ser Pro Glu Ala Gly Glu Thr Asp Trp 355 360 365 Thr Leu Ala Tyr Phe Leu Gln Ala Ala Asp Asp Pro Asp Phe Leu Val 370 375 380 Asp Ala Ala Thr Ile Trp Asn Asn Pro Val Glu Arg Leu Val Tyr Glu 385 390 395 400 Asn Arg Thr Ile Glu Gln Pro Gln Glu Thr Phe Leu Arg Gly Leu Gly 405 410 415 Val Ala Ser Arg Leu Tyr Pro Ala Ile Ala Pro Ser Phe Glu Thr Glu 420 425 430 Tyr Pro Gln Ser Ser Arg Ile Thr Pro Met Gln Ala Tyr Glu Phe Ile 435 440 445 Lys Ala Val Ala Trp Arg Leu Glu Asp Ser Gly Leu Gly Val Ile Leu 450 455 460 Pro Pro Ser Leu Ala Asn Arg Glu Gly Trp Ala Asn Arg Leu Gly Leu 465 470 475 480 Lys Ile Thr Ala Glu Thr Pro Lys Lys Lys Gln Gly Arg Leu Gly Leu 485 490 495 Gln Ser Leu Leu Asn Phe Gln Trp Gln Leu Ala Ile Gly Gly Gln Thr 500 505 510 Ile Ser Lys Ala Glu Phe Asp Lys Leu Val Ala Leu Asn Ser Pro Leu 515 520 525 Val Glu Ile Asn Gly Glu Trp Val Glu Leu Arg Pro Gln Asp Ile Lys 530 535 540 Thr Ala Gln Thr Phe Phe Thr Thr Arg Lys Asp Gln Met Ala Leu Ser 545 550 555 560 Leu Glu Asp Ala Leu Arg Phe Ser Thr Gly Asp Thr Gln Val Ile Glu 565 570 575 Lys Leu Pro Val Val Ser Phe Glu Ala Ser Gly Ala Leu Gln Glu Leu 580 585 590 Ile Gly Ala Leu Asn Asn Asn Gln Ala Ile Ala Pro Leu Pro Thr Pro 595 600 605 Val Gly Phe Lys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Ala Ala 610 615 620 Trp Leu Ser Phe Leu Glu Arg Trp Gly Leu Gly Ala Cys Leu Ala Asp 625 630 635 640 Asp Met Gly Leu Gly Lys Thr Ile Gln Phe Ile Ala Phe Leu Leu His 645 650 655 Leu Lys Glu Gln Asp Ala Leu Glu Asn Ser Thr Leu Leu Val Cys Pro 660 665 670 Thr Ser Val Leu Gly Asn Trp Glu Arg Glu Val Asn Lys Phe Ala Pro 675 680 685 Ser Leu Lys Ile Leu Gln Tyr His Gly Asp Lys Arg Pro Lys Gly Lys 690 695 700 Ala Phe Leu Glu Ala Val Lys Asn His Asp Leu Ile Val Thr Ser Tyr 705 710 715 720 Ser Leu Leu His Arg Asp Ile Lys Ser Leu Gln Ser Val Pro Trp Gln 725 730 735 Ile Ile Val Leu Asp Glu Ala Gln Asn Val Lys Asn Pro Glu Ala Lys 740 745 750 Gln Ser Lys Ala Val Arg Gln Leu Glu Ala Thr Phe Arg Ile Ala Leu 755 760 765 Thr Gly Thr Pro Val Glu Asn Arg Leu Gln Glu Leu Trp Ser Ile Leu 770 775 780 Asp Phe Leu Asn Pro Gly Tyr Leu Gly Asn Lys Gln Phe Phe Gln Arg 785 790 795 800 Arg Phe Ala Met Pro Ile Glu Lys Tyr Gly Asp Thr Ala Ser Leu Gly 805 810 815 Gln Leu Arg Ser Leu Val Gln Pro Phe Ile Leu Arg Arg Leu Lys Ser 820 825 830 Asp Arg Glu Ile Ile Gln Asp Leu Pro Asp Lys Gln Glu Met Thr Val 835 840 845 Phe Cys Gly Leu Thr Ala Asp Gln Ala Ala Leu Tyr Gln Gln Val Val 850 855 860 Glu Gln Ser Leu Val Glu Ile Glu Ser Ala Glu Gly Leu Gln Arg Arg 865 870 875 880 Gly Met Ile Leu Ala Leu Leu Ile Lys Leu Lys Gln Ile Cys Asn His 885 890 895 Pro Ala Gln Tyr Leu Lys Gln Ala Thr Leu Glu Gln His Asn Ser Ala 900 905 910 Lys Leu Leu Arg Leu Glu Glu Met Leu Glu Glu Val Leu Ala Glu Ser 915 920 925 Asp Arg Ala Leu Ile Phe Thr Gln Phe Ala Glu Trp Gly Lys Leu Leu 930 935 940 Lys Pro Lys Ser Val Glu Cys 945 950 <210> 65 <211> 3024 <212> DNA <213> Pelodictyon phaeoclathratiforme <400> 65 atgattgcgc tgcacatctc catcattgac ggagtcccgc tactctggag tgagggaaaa 60 aagatcggga tgctgaagga gttacgcctc gcaacggctg gaatcggcat gttttccctg 120 ctcgacaaca ccacaaaaga gttttgtgtc tggctgccct gccgcgagaa aaaagctgtc 180 ccatcatctc cgcttgtcgg cgccatgccc gacctgagtg atgaagagca actccatgcc 240 tttccgatta ccgcgcttcg gctgaatttc aacgctctgt tcgagctttc cctgcttacg 300 gaaaagggca acatccccgg cagtggcatc atcttcggaa gctctctcca ctgggcacgg 360 caggtagtaa aaattgcact gaacattgtc agaacccagt cgctgctccc ttcgatcatc 420 aaaaacgata cattctggga ggccttgtgg ttgcccctcc ccgacagtgc cacatccctc 480 gcagttgaac agcttgccga tgccatgcct gcggtctgtc gctctctcgg ccgcaccgac 540 acgcaaccgc cggaaacacc aaaaaagtta ctgctcaaag gacttctctc tttccttgtc 600 aatacactgt cacgtacttt tgaaagagca ggggtgccaa aaatcagtga cttcgagagt 660 atccatgacg cgtggcttca tgcattatca aacagtgatc cccggctgaa atggaaaaat 720 gagcaggaga ttgagcagtt tgcctgtcag ctcaacgcat ggcggcgtcc cattgacctg 780 catgagcgat cacccttcag gttttgcctg caactgacag agccaccact gaaagggcgg 840 aaaaaggagc gctggcatgt tgcctatcaa ctgcagttga aagcggatcc aagcctgatt 900 cttgacgccg gggatctctg gaaccccgaa agcgaggcat cacagcacgc tttaacgtat 960 acctccgatt gtaccgaatt cctgcttact tccctgggac aagcctccgg cctctgcccc 1020 gcagtcaccc aaagcctgaa aaagaagcag ccgggtggct ttgatcttga taccgaaggg 1080 gcttacagat ttttgctgga gtatgcggaa ctgttgcgaa gcgcaggatt tgtggtcaag 1140 cttccctcgt ggtggatcgg tcgcagagga gtcaaccgta tcgggatcaa gacaaaagtg 1200 aagcttccct ctatgaaagg aagcgggtcg ggtctcacgc tggatcgcat ggttgcctgc 1260 gattatgctg ctgcacttgg caatgaggag cttgacctgc aggagctgaa aacactggca 1320 aacctgaaag ttccgctggt acgggtgcgc ggacagtgga cacagattga ccataaggag 1380 cttgccaatg ctctccattt tcttgaaaaa catccaactg gtgaactttc tgccagagaa 1440 ctcctctcaa cagctctcgg agcacaaaaa aaggaggatg ctctctttct tcgatcggtt 1500 gaaatcgagg ggtggcttca ggaactgctt gaaaaacttt cctctcaggg acaatttgaa 1560 ctgcttccac cacctgagca tttcgaggga acgcttcgcc tctatcagga gcgaggcttt 1620 tcatggctct catttctccg caagtgggga ctgggcgcct gtcttgccga cgacatgggc 1680 cttggcaaaa ccattcagac gcttgcactg ctgcagcggg agcgtgaact tggagaaaaa 1740 agggcggtgc tcctgatctg ccccacctct gtagtcaaca actggcgaaa ggaggcggag 1800 cggttcactc cggatttagc ggtgctggtg catcatggta tcgaccggat gaaaacagca 1860 gattttcgca aagctgcaag cgcttcagcc cttgtcattt caagctatgg attgttacag 1920 cgcgaccttg aatttctgtc gaaggttccc tgggcaggca ttattctcga tgaagcgcag 1980 aacatcaaaa accctgagac aaaacagtca aaagctgccc gaacaatccg ggctgattac 2040 cgtattgccc tgaccggcac tcccgttgaa aatcatgtcg gcgacctttg ggcactcatg 2100 gattttctca atcccggttt tcttggaacc cagcactttt tcaaacagaa cttctacacg 2160 ccgattcagt ggtatggcga ccctgaggct tcagcacgac tgaagtcgct gaccggcccg 2220 tttattctgc gccgcatgaa aagcgacaag tcgattattt ccgatctgcc cgacaagatc 2280 gaaatgaaag agtattgctc gctgaccaaa gagcaggcat cgctctacaa ggctgttgtc 2340 gatgaactgc aggagaaaat tgaaagcgcc gaagggattg accggcgggg ccttgtactt 2400 gcgctgctgg tcaagctcaa gcaggtctgc aaccatccgg cacatttgct tggcgacaac 2460 tctgccattg cacatcgttc aggaaaaata aaacgcctga ccgaactgct tggcgacatc 2520 cgcgaagctg gcgaaaaaac gctgctcttt acacagttta ccatgatggg aacgatgctc 2580 cagcactatc ttcaggagtt gtacggtgaa gaggtactgt ttctgcacgg tggcgtaacc 2640 aaaaaaaggc gggatgagat ggtagagagc ttccagaagg aagagggcag ttcaccctcc 2700 atctttattc tctcactgaa agccggagga acgggtctta acctgacaac agcgaaccac 2760 gttgttcact ttgaccgatg gtggaacccg gcagtagaga atcaggcaac tgaccgggct 2820 ttccgtatcg ggcagcacaa aaacgttgaa gttcataaat ttattacgac gggcacgctc 2880 gaagagcgca ttgatgagat gattgagaaa aaaacaacgg tcgccggcca ggttctcgga 2940 acgggtgagc agtggctgac cgaactgtcg aacaatgatc tgcgcaagct cattatgctc 3000 ggacaggaag caatgggaga ataa 3024 <210> 66 <211> 1007 <212> PRT <213> Pelodictyon phaeoclathratiforme <400> 66 Met Ile Ala Leu His Ile Ser Ile Ile Asp Gly Val Pro Leu Leu Trp 1 5 10 15 Ser Glu Gly Lys Lys Ile Gly Met Leu Lys Glu Leu Arg Leu Ala Thr 20 25 30 Ala Gly Ile Gly Met Phe Ser Leu Leu Asp Asn Thr Thr Lys Glu Phe 35 40 45 Cys Val Trp Leu Pro Cys Arg Glu Lys Lys Ala Val Pro Ser Ser Pro 50 55 60 Leu Val Gly Ala Met Pro Asp Leu Ser Asp Glu Glu Gln Leu His Ala 65 70 75 80 Phe Pro Ile Thr Ala Leu Arg Leu Asn Phe Asn Ala Leu Phe Glu Leu 85 90 95 Ser Leu Leu Thr Glu Lys Gly Asn Ile Pro Gly Ser Gly Ile Ile Phe 100 105 110 Gly Ser Ser Leu His Trp Ala Arg Gln Val Val Lys Ile Ala Leu Asn 115 120 125 Ile Val Arg Thr Gln Ser Leu Leu Pro Ser Ile Ile Lys Asn Asp Thr 130 135 140 Phe Trp Glu Ala Leu Trp Leu Pro Leu Pro Asp Ser Ala Thr Ser Leu 145 150 155 160 Ala Val Glu Gln Leu Ala Asp Ala Met Pro Ala Val Cys Arg Ser Leu 165 170 175 Gly Arg Thr Asp Thr Gln Pro Pro Glu Thr Pro Lys Lys Leu Leu Leu 180 185 190 Lys Gly Leu Leu Ser Phe Leu Val Asn Thr Leu Ser Arg Thr Phe Glu 195 200 205 Arg Ala Gly Val Pro Lys Ile Ser Asp Phe Glu Ser Ile His Asp Ala 210 215 220 Trp Leu His Ala Leu Ser Asn Ser Asp Pro Arg Leu Lys Trp Lys Asn 225 230 235 240 Glu Gln Glu Ile Glu Gln Phe Ala Cys Gln Leu Asn Ala Trp Arg Arg 245 250 255 Pro Ile Asp Leu His Glu Arg Ser Pro Phe Arg Phe Cys Leu Gln Leu 260 265 270 Thr Glu Pro Pro Leu Lys Gly Arg Lys Lys Glu Arg Trp His Val Ala 275 280 285 Tyr Gln Leu Gln Leu Lys Ala Asp Pro Ser Leu Ile Leu Asp Ala Gly 290 295 300 Asp Leu Trp Asn Pro Glu Ser Glu Ala Ser Gln His Ala Leu Thr Tyr 305 310 315 320 Thr Ser Asp Cys Thr Glu Phe Leu Leu Thr Ser Leu Gly Gln Ala Ser 325 330 335 Gly Leu Cys Pro Ala Val Thr Gln Ser Leu Lys Lys Lys Gln Pro Gly 340 345 350 Gly Phe Asp Leu Asp Thr Glu Gly Ala Tyr Arg Phe Leu Leu Glu Tyr 355 360 365 Ala Glu Leu Leu Arg Ser Ala Gly Phe Val Val Lys Leu Pro Ser Trp 370 375 380 Trp Ile Gly Arg Arg Gly Val Asn Arg Ile Gly Ile Lys Thr Lys Val 385 390 395 400 Lys Leu Pro Ser Met Lys Gly Ser Gly Ser Gly Leu Thr Leu Asp Arg 405 410 415 Met Val Ala Cys Asp Tyr Ala Ala Ala Leu Gly Asn Glu Glu Leu Asp 420 425 430 Leu Gln Glu Leu Lys Thr Leu Ala Asn Leu Lys Val Pro Leu Val Arg 435 440 445 Val Arg Gly Gln Trp Thr Gln Ile Asp His Lys Glu Leu Ala Asn Ala 450 455 460 Leu His Phe Leu Glu Lys His Pro Thr Gly Glu Leu Ser Ala Arg Glu 465 470 475 480 Leu Leu Ser Thr Ala Leu Gly Ala Gln Lys Lys Glu Asp Ala Leu Phe 485 490 495 Leu Arg Ser Val Glu Ile Glu Gly Trp Leu Gln Glu Leu Leu Glu Lys 500 505 510 Leu Ser Ser Gln Gly Gln Phe Glu Leu Leu Pro Pro Pro Glu His Phe 515 520 525 Glu Gly Thr Leu Arg Leu Tyr Gln Glu Arg Gly Phe Ser Trp Leu Ser 530 535 540 Phe Leu Arg Lys Trp Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly 545 550 555 560 Leu Gly Lys Thr Ile Gln Thr Leu Ala Leu Leu Gln Arg Glu Arg Glu 565 570 575 Leu Gly Glu Lys Arg Ala Val Leu Leu Ile Cys Pro Thr Ser Val Val 580 585 590 Asn Asn Trp Arg Lys Glu Ala Glu Arg Phe Thr Pro Asp Leu Ala Val 595 600 605 Leu Val His His Gly Ile Asp Arg Met Lys Thr Ala Asp Phe Arg Lys 610 615 620 Ala Ala Ser Ala Ser Ala Leu Val Ile Ser Ser Tyr Gly Leu Leu Gln 625 630 635 640 Arg Asp Leu Glu Phe Leu Ser Lys Val Pro Trp Ala Gly Ile Ile Leu 645 650 655 Asp Glu Ala Gln Asn Ile Lys Asn Pro Glu Thr Lys Gln Ser Lys Ala 660 665 670 Ala Arg Thr Ile Arg Ala Asp Tyr Arg Ile Ala Leu Thr Gly Thr Pro 675 680 685 Val Glu Asn His Val Gly Asp Leu Trp Ala Leu Met Asp Phe Leu Asn 690 695 700 Pro Gly Phe Leu Gly Thr Gln His Phe Phe Lys Gln Asn Phe Tyr Thr 705 710 715 720 Pro Ile Gln Trp Tyr Gly Asp Pro Glu Ala Ser Ala Arg Leu Lys Ser 725 730 735 Leu Thr Gly Pro Phe Ile Leu Arg Arg Met Lys Ser Asp Lys Ser Ile 740 745 750 Ile Ser Asp Leu Pro Asp Lys Ile Glu Met Lys Glu Tyr Cys Ser Leu 755 760 765 Thr Lys Glu Gln Ala Ser Leu Tyr Lys Ala Val Val Asp Glu Leu Gln 770 775 780 Glu Lys Ile Glu Ser Ala Glu Gly Ile Asp Arg Arg Gly Leu Val Leu 785 790 795 800 Ala Leu Leu Val Lys Leu Lys Gln Val Cys Asn His Pro Ala His Leu 805 810 815 Leu Gly Asp Asn Ser Ala Ile Ala His Arg Ser Gly Lys Ile Lys Arg 820 825 830 Leu Thr Glu Leu Leu Gly Asp Ile Arg Glu Ala Gly Glu Lys Thr Leu 835 840 845 Leu Phe Thr Gln Phe Thr Met Met Gly Thr Met Leu Gln His Tyr Leu 850 855 860 Gln Glu Leu Tyr Gly Glu Glu Val Leu Phe Leu His Gly Gly Val Thr 865 870 875 880 Lys Lys Arg Arg Asp Glu Met Val Glu Ser Phe Gln Lys Glu Glu Gly 885 890 895 Ser Ser Pro Ser Ile Phe Ile Leu Ser Leu Lys Ala Gly Gly Thr Gly 900 905 910 Leu Asn Leu Thr Thr Ala Asn His Val Val His Phe Asp Arg Trp Trp 915 920 925 Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly 930 935 940 Gln His Lys Asn Val Glu Val His Lys Phe Ile Thr Thr Gly Thr Leu 945 950 955 960 Glu Glu Arg Ile Asp Glu Met Ile Glu Lys Lys Thr Thr Val Ala Gly 965 970 975 Gln Val Leu Gly Thr Gly Glu Gln Trp Leu Thr Glu Leu Ser Asn Asn 980 985 990 Asp Leu Arg Lys Leu Ile Met Leu Gly Gln Glu Ala Met Gly Glu 995 1000 1005 <210> 67 <211> 3189 <212> DNA <213> Prochlorococcus marinus <400> 67 atgactctgc tgcacgccac ttggatttca actaattggc atccatctaa tttaggtcaa 60 tcagaattgt tcctttgggc agaccaatgg cgcgtagtaa ctccaaaaca aataatacaa 120 acaccttcac ctcacccgtt tagcctatct tcagatgaat taaaagaatg gctcaatagc 180 aaaaaattat tgcctaatga gagtattaat acatctgcat gtctcactct tcctagtaaa 240 cccattcaca aaaaaaataa ccaaaaatct aagaatcaaa aaactggtat tgaatctgaa 300 tggaagggac tccctttaca agctcatgaa gaaatagcaa cacaatatga atgttggcca 360 tggaaagtag atggaatttc actcactact gtcgaagcaa cagaatggct tacaaaatta 420 cctttatcaa aaaaagattc tgatcttagt gaagaattac tttggtgggc tcatttagag 480 cgttggtctc ttaatctaat tgcgagtgga ctatggctac ctcaagttaa attacacaag 540 aaagaaggaa atgaatatcg tgcatcatgg atacctctgc tgaatcaaga aaatgaaaga 600 aatcgcttag aagagtttgc aaaaaatatt cccttggtcg ctatttgtgc agtcccatgg 660 atagaagcta aaggacaaat agtcaatact gagcaagtct caaattcaaa caataataca 720 ctctctttat ataggccaag acacaatcgc gtagaagtga tggatcttct cgaagaactt 780 attgatgcac aacttcgaaa agattttcaa ccaagaacta aaaacttgga tccattgtta 840 aaagcgtggc aagaagcact tggcacgaaa gatggaataa ttaacctatc gaatgaaaac 900 gctaaaagat tagaaaaagc aagtaagaat tggaaaagag ggttgtctag taatgttcaa 960 cctgcgaaaa catgtctaga gctaattgca ccgattgatg atctagattt atgggactta 1020 aacttttcat tgcaatcaga atcagatccg agtatcagac tagctgcaga tcaaatttgg 1080 gaagcaggcg tagaagtaac caaagttggc ggaataacaa ttgacaaccc aagtgaaatt 1140 cttttagaag gcctaggaag aagtcttgaa attttccctc caattgaaaa aggactagaa 1200 agcccaactc ctcacacaat gaaactgtct gcatcagaag catttgtact tattagaaca 1260 gcagcagcaa aacttcgtga catgggtatt ggtgtaatac tgcctaatag tttgtccaaa 1320 ggatttgcaa gtcgacttgg tcttgctatt caagccgaat taccagagtc ttcactaggc 1380 gtaatgctag gagaaagttt gaactgggat tgggagttaa tgatcggagg tataaattta 1440 agcatgaaag aactagaaat gcttgcaaaa aaaaatagtc ctctactcaa tcacaaaggg 1500 acatggatcg aattacgtcc taatgatctg aaaaatgctt caaaattttt tgctaatact 1560 ccagaattaa acctcgataa agcattaagg cttagtgcta ataaaggcaa cacttttatg 1620 aaacttccag tacatcattt tgaatctgga ccaagattac aaagtgtctt agagcaatat 1680 caccatcaga aagcgcctga acctttacca gcacctaatg gattccatgg gcaattaagg 1740 ccttaccaag aaagaggtct tgggtggctt gcatttcttt atcgttttaa gcaaggagca 1800 tgcttagcag atgacatggg gcttggtaaa actattcaat tattatgttt tattcagcac 1860 ctaaaagttc aaaacgagct tactaagcct gtactcctaa ttgcgcctac atctgtgctg 1920 acaaattgga aaagagaggc tgccactttt actccagaac tatgtataca tgaacactat 1980 ggtagtaaga gacattcttc aataccaaaa ttacaaaatt atctaaaaaa agttgacatt 2040 atgatcacaa gttatgggtt actttatcga gatggcgagc tgctacaaga aatcgactgg 2100 caaggaatag ttattgatga agctcaagct attaaaaatt ccaaatcaaa gcaaagtatt 2160 ataactagag caataagcaa aaatctcata agtaatccct ttagaattgc tttaacagga 2220 acgccagtag aaaatcgtat tagtgaacta tgggcactaa tggatttcct taatccaaaa 2280 gtattaggtg aagaagattt ttttaatcag cgatacaagt taccgattga gcattatggc 2340 gacatctctt cattaaaaga tctcaaaaca caggtcagtc cttttatttt aagaagattg 2400 aaaaccgatc aatctattat ttctgatttg cctcaaaaga ttgaattaaa tgagtgggtt 2460 ggactaagcc aagagcaaga gcttctatat aaacaaacgg tagagaaaag cttagatgaa 2520 ctcgcctcat tacccattgg tcaacgccag ggtaaaacat tgggtctact tactcgtctt 2580 aaacaaattt gtaatcatcc agcaattgct ttaaaagaaa ctcaagtcga gaagaatttc 2640 ttattaagat cttcaaaatt acaaagactg gaagaaatac tacaagaagt gaaagaatct 2700 catgatagag ctctgctctt tactcaattt gctgaatggg ggcatttatt gcaagcgtac 2760 ttacaaacaa aatgggaatc agaagtacct ttcctacacg gaggcactcc taaagggaag 2820 cgacaagaaa tgatagatcg ttttcaagat gatcctagag ggccaaatat ctttttactt 2880 tcactaaaag caggaggagt gggtcttaat ctaactcgtg cgaatcatgt ttttcatatt 2940 gatcgttggt ggaatccagc agtagaaaat caagcaacag atcgtgcata ccgaattggt 3000 caaaaaaaaa gtgttatcgt ccataagttt ataaccaccg gcacaatcga agaaaaaatc 3060 aatcaaatga ttctcgaaaa gactgaacta gcagaaaata ttgtcggatc aggagaaagc 3120 tggttagggc aattaagtct tgaaaaattg agtgaattag ttgctttaga tagcaatcca 3180 gaattctaa 3189 <210> 68 <211> 1062 <212> PRT <213> Prochlorococcus marinus <400> 68 Met Thr Leu Leu His Ala Thr Trp Ile Ser Thr Asn Trp His Pro Ser 1 5 10 15 Asn Leu Gly Gln Ser Glu Leu Phe Leu Trp Ala Asp Gln Trp Arg Val 20 25 30 Val Thr Pro Lys Gln Ile Ile Gln Thr Pro Ser Pro His Pro Phe Ser 35 40 45 Leu Ser Ser Asp Glu Leu Lys Glu Trp Leu Asn Ser Lys Lys Leu Leu 50 55 60 Pro Asn Glu Ser Ile Asn Thr Ser Ala Cys Leu Thr Leu Pro Ser Lys 65 70 75 80 Pro Ile His Lys Lys Asn Asn Gln Lys Ser Lys Asn Gln Lys Thr Gly 85 90 95 Ile Glu Ser Glu Trp Lys Gly Leu Pro Leu Gln Ala His Glu Glu Ile 100 105 110 Ala Thr Gln Tyr Glu Cys Trp Pro Trp Lys Val Asp Gly Ile Ser Leu 115 120 125 Thr Thr Val Glu Ala Thr Glu Trp Leu Thr Lys Leu Pro Leu Ser Lys 130 135 140 Lys Asp Ser Asp Leu Ser Glu Glu Leu Leu Trp Trp Ala His Leu Glu 145 150 155 160 Arg Trp Ser Leu Asn Leu Ile Ala Ser Gly Leu Trp Leu Pro Gln Val 165 170 175 Lys Leu His Lys Lys Glu Gly Asn Glu Tyr Arg Ala Ser Trp Ile Pro 180 185 190 Leu Leu Asn Gln Glu Asn Glu Arg Asn Arg Leu Glu Glu Phe Ala Lys 195 200 205 Asn Ile Pro Leu Val Ala Ile Cys Ala Val Pro Trp Ile Glu Ala Lys 210 215 220 Gly Gln Ile Val Asn Thr Glu Gln Val Ser Asn Ser Asn Asn Asn Thr 225 230 235 240 Leu Ser Leu Tyr Arg Pro Arg His Asn Arg Val Glu Val Met Asp Leu 245 250 255 Leu Glu Glu Leu Ile Asp Ala Gln Leu Arg Lys Asp Phe Gln Pro Arg 260 265 270 Thr Lys Asn Leu Asp Pro Leu Leu Lys Ala Trp Gln Glu Ala Leu Gly 275 280 285 Thr Lys Asp Gly Ile Ile Asn Leu Ser Asn Glu Asn Ala Lys Arg Leu 290 295 300 Glu Lys Ala Ser Lys Asn Trp Lys Arg Gly Leu Ser Ser Asn Val Gln 305 310 315 320 Pro Ala Lys Thr Cys Leu Glu Leu Ile Ala Pro Ile Asp Asp Leu Asp 325 330 335 Leu Trp Asp Leu Asn Phe Ser Leu Gln Ser Glu Ser Asp Pro Ser Ile 340 345 350 Arg Leu Ala Ala Asp Gln Ile Trp Glu Ala Gly Val Glu Val Thr Lys 355 360 365 Val Gly Gly Ile Thr Ile Asp Asn Pro Ser Glu Ile Leu Leu Glu Gly 370 375 380 Leu Gly Arg Ser Leu Glu Ile Phe Pro Pro Ile Glu Lys Gly Leu Glu 385 390 395 400 Ser Pro Thr Pro His Thr Met Lys Leu Ser Ala Ser Glu Ala Phe Val 405 410 415 Leu Ile Arg Thr Ala Ala Ala Lys Leu Arg Asp Met Gly Ile Gly Val 420 425 430 Ile Leu Pro Asn Ser Leu Ser Lys Gly Phe Ala Ser Arg Leu Gly Leu 435 440 445 Ala Ile Gln Ala Glu Leu Pro Glu Ser Ser Leu Gly Val Met Leu Gly 450 455 460 Glu Ser Leu Asn Trp Asp Trp Glu Leu Met Ile Gly Gly Ile Asn Leu 465 470 475 480 Ser Met Lys Glu Leu Glu Met Leu Ala Lys Lys Asn Ser Pro Leu Leu 485 490 495 Asn His Lys Gly Thr Trp Ile Glu Leu Arg Pro Asn Asp Leu Lys Asn 500 505 510 Ala Ser Lys Phe Phe Ala Asn Thr Pro Glu Leu Asn Leu Asp Lys Ala 515 520 525 Leu Arg Leu Ser Ala Asn Lys Gly Asn Thr Phe Met Lys Leu Pro Val 530 535 540 His His Phe Glu Ser Gly Pro Arg Leu Gln Ser Val Leu Glu Gln Tyr 545 550 555 560 His His Gln Lys Ala Pro Glu Pro Leu Pro Ala Pro Asn Gly Phe His 565 570 575 Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly Trp Leu Ala Phe 580 585 590 Leu Tyr Arg Phe Lys Gln Gly Ala Cys Leu Ala Asp Asp Met Gly Leu 595 600 605 Gly Lys Thr Ile Gln Leu Leu Cys Phe Ile Gln His Leu Lys Val Gln 610 615 620 Asn Glu Leu Thr Lys Pro Val Leu Leu Ile Ala Pro Thr Ser Val Leu 625 630 635 640 Thr Asn Trp Lys Arg Glu Ala Ala Thr Phe Thr Pro Glu Leu Cys Ile 645 650 655 His Glu His Tyr Gly Ser Lys Arg His Ser Ser Ile Pro Lys Leu Gln 660 665 670 Asn Tyr Leu Lys Lys Val Asp Ile Met Ile Thr Ser Tyr Gly Leu Leu 675 680 685 Tyr Arg Asp Gly Glu Leu Leu Gln Glu Ile Asp Trp Gln Gly Ile Val 690 695 700 Ile Asp Glu Ala Gln Ala Ile Lys Asn Ser Lys Ser Lys Gln Ser Ile 705 710 715 720 Ile Thr Arg Ala Ile Ser Lys Asn Leu Ile Ser Asn Pro Phe Arg Ile 725 730 735 Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Ile Ser Glu Leu Trp Ala 740 745 750 Leu Met Asp Phe Leu Asn Pro Lys Val Leu Gly Glu Glu Asp Phe Phe 755 760 765 Asn Gln Arg Tyr Lys Leu Pro Ile Glu His Tyr Gly Asp Ile Ser Ser 770 775 780 Leu Lys Asp Leu Lys Thr Gln Val Ser Pro Phe Ile Leu Arg Arg Leu 785 790 795 800 Lys Thr Asp Gln Ser Ile Ile Ser Asp Leu Pro Gln Lys Ile Glu Leu 805 810 815 Asn Glu Trp Val Gly Leu Ser Gln Glu Gln Glu Leu Leu Tyr Lys Gln 820 825 830 Thr Val Glu Lys Ser Leu Asp Glu Leu Ala Ser Leu Pro Ile Gly Gln 835 840 845 Arg Gln Gly Lys Thr Leu Gly Leu Leu Thr Arg Leu Lys Gln Ile Cys 850 855 860 Asn His Pro Ala Ile Ala Leu Lys Glu Thr Gln Val Glu Lys Asn Phe 865 870 875 880 Leu Leu Arg Ser Ser Lys Leu Gln Arg Leu Glu Glu Ile Leu Gln Glu 885 890 895 Val Lys Glu Ser His Asp Arg Ala Leu Leu Phe Thr Gln Phe Ala Glu 900 905 910 Trp Gly His Leu Leu Gln Ala Tyr Leu Gln Thr Lys Trp Glu Ser Glu 915 920 925 Val Pro Phe Leu His Gly Gly Thr Pro Lys Gly Lys Arg Gln Glu Met 930 935 940 Ile Asp Arg Phe Gln Asp Asp Pro Arg Gly Pro Asn Ile Phe Leu Leu 945 950 955 960 Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His 965 970 975 Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala 980 985 990 Thr Asp Arg Ala Tyr Arg Ile Gly Gln Lys Lys Ser Val Ile Val His 995 1000 1005 Lys Phe Ile Thr Thr Gly Thr Ile Glu Glu Lys Ile Asn Gln Met 1010 1015 1020 Ile Leu Glu Lys Thr Glu Leu Ala Glu Asn Ile Val Gly Ser Gly 1025 1030 1035 Glu Ser Trp Leu Gly Gln Leu Ser Leu Glu Lys Leu Ser Glu Leu 1040 1045 1050 Val Ala Leu Asp Ser Asn Pro Glu Phe 1055 1060 <210> 69 <211> 3204 <212> DNA <213> Prochlorococcus marinus <400> 69 atgagtctgc tacacgctac ttggctgcca gcaatgcgaa ccggaagttc gcataatcca 60 ggactactca tctgggctga ttcatggaga gttgcaaaac caagcatagt cagcaatcag 120 cctgtaatac atccatttgc cttatcagca gcagatttac gtatttggct attgcaaaaa 180 aagcttttac ctaaagaaag tattgaatgt acagccttat taactctacc tagtaaatct 240 attaaaaact cattagacaa aaaattaaat ggagtaacgg actcacaaaa tactagcgat 300 caacctcaat ggagtggact acctttacaa gcaggagagc cagtaactaa acaatgtgaa 360 tggtggccct ggcaagttga aggtatagca atcaaaccca gtgaagctgc atcgtggctt 420 gcaaacttac ctctcacgaa aaaagatcct gagcttagtg aagagatcct atggtggagt 480 catttagaac gttggtctct aagtttaatt gctcgtggcc tttggttgcc acaagttgaa 540 ttaaatacaa ttgataatat tggagctaga gctaggtgga gtcctttact taataacgaa 600 aacgagcgca aaagattaga agaattctct atcaggcttc cattagtagc aacatgtgcc 660 ataaaaagag aggaaacttc tgaagaaaat caaaaccata tattaaagac tactcctagg 720 gaaacactcg atgaatacgg acttgcagta tgtcgaccaa tcaatagtcg acttcaagtg 780 gcttatctct tagaagaact cgtggatgga cagctaagaa aagattttga ggaaagttct 840 gaagaccttg atccattgct gaaagcttgg caagaggcat taggatcaca taatggagtc 900 attcgtcttc cgttggaaga ttgtgaaaga ttagccaagg caagtaaaaa ttggaaagaa 960 aatttatcag gcaatgttaa aggtgcaaga gcatgccttg agctttttgc accacttgaa 1020 ggagaagatt tatgggactt acaattctct ttacaagctg aagcagatcc atcactaaag 1080 gtagcagcag aagcagtatg gaatgcagac tcagcagttc tacagattgg tgatattcaa 1140 atagcgcagc ctggagaaat tctactagaa ggtcttggca gagcactcaa tatctttcaa 1200 ccaatagaaa ggggtctgga aaatgctact ccaaataata tgcaactcac acctgcagaa 1260 gcttttgttc tagtacgtac agcctcaaag caattacgtg atattggtat tggtgtaata 1320 ctacctagaa gtttatcagg aggattagca agtcgactag gtatagctat taaagcagag 1380 ttagcgacta gtgccagagg attaacactt cgagagaatc tagaatggag ttgggagcta 1440 atgatagggg gaagcatatt aagccttaaa gatctagaac aactggcaag taaacgcagc 1500 cctctagttc gctataagga ttcatggctt gaattacgtc caaatgatct taaaatcgcc 1560 gaaaaattct gtagcaataa tcctgaatta agcctagatg acgcattaag acttaccgca 1620 actaaagggg agactctaat gaagcttcca gtacatcaat ttaatgctgg gccaaagctc 1680 caaggcgttt tagagcaata ccaccaacat acaagtcctg agcctctagc tgcaccagat 1740 ggcttctatg gacaactgag gccttatcaa gaacgtggca taggatggtt ggctttcttg 1800 catcgtttta atcaaggtgc atgtttagca gatgacatgg gcctgggcaa aacaattcaa 1860 gtgcttgctt ttattcagca cttaaaaagt aacaaggacc tcaagaaacc tgttttgcta 1920 attgcaccta cgtcagtatt aacaaactgg aaacgagaag cttattcatt tacaccagag 1980 ttatctgtat tagagcatta cggtcctaat cgttcatcta catcaacact cttgaaaaag 2040 attctcaaaa aagtagacat tcttattact agctatggcc tactacatag agataaacag 2100 cttctgaaaa caattgattg gcaaggtgta attattgatg aagcacaagc tataaaaaat 2160 ccaaattcaa aacaaagtca aacaactcgt gaaattgtta aaggcggaaa aataatccct 2220 tttcgtattg cattaactgg tacccctata gaaaatcgtg taagtgagct ttggtcatta 2280 atggattttt taaatccatc agtacttgga gaaaaagaat tttttgatca acgctacaaa 2340 ttaccgattg aacgttatgg tgatatttct tcgttaaccg atctcaaagc tcgtgtcagt 2400 ccctttattc ttagaaggtt aaaaagtgat aaatcaatta tctcggatct accaagcaaa 2460 gtcgaactaa aagaatggat tactcttagt caagagcaaa gagctcttta taacaaaact 2520 gtagacaata ccttacagga aatcgcaaga agtcctattg gtcagcgtca tgcgaaaacc 2580 ttaggtctat taacacgtct caaacaaata tgtaatcatc ctgctcttgc cctcaaagaa 2640 aaaaacatta gcgatgattt tggaatacga tcaaccaaac ttcaaaggct ggaagaactt 2700 cttgatgtga tattcgcaac agaggacaga gctcttcttt ttacccaatt cgctgaatgg 2760 ggtcacttac tacaagctta tctagaaaaa aagtggggac atagcatact ttttctacat 2820 ggaggaactc gcaaaataga tagacaatca atggttgatc aatttcaaga agatcccaga 2880 ggcccaaaat tatttttact ttctctcaaa gcaggtggta ttggtctgaa cctgactcga 2940 gctaaccacg tgttgcatat tgatcgatgg tggaaccctg ccgtagaaaa tcaggcaaca 3000 gatcgtgctt atagaattgg tcaaaaaaat agcgtaatgg ttcacaaatt tattgctaca 3060 gggtcagtag aagaaaaaat tgatcaaatg attactgaaa agtctaagct cgcagaaaat 3120 ataattggtg caggtgaaga ttggcttggc aaacttggca tcaatgaatt acgtgaatta 3180 gtttccttag aaaaagagag ttaa 3204 <210> 70 <211> 1067 <212> PRT <213> Prochlorococcus marinus <400> 70 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Met Arg Thr Gly Ser 1 5 10 15 Ser His Asn Pro Gly Leu Leu Ile Trp Ala Asp Ser Trp Arg Val Ala 20 25 30 Lys Pro Ser Ile Val Ser Asn Gln Pro Val Ile His Pro Phe Ala Leu 35 40 45 Ser Ala Ala Asp Leu Arg Ile Trp Leu Leu Gln Lys Lys Leu Leu Pro 50 55 60 Lys Glu Ser Ile Glu Cys Thr Ala Leu Leu Thr Leu Pro Ser Lys Ser 65 70 75 80 Ile Lys Asn Ser Leu Asp Lys Lys Leu Asn Gly Val Thr Asp Ser Gln 85 90 95 Asn Thr Ser Asp Gln Pro Gln Trp Ser Gly Leu Pro Leu Gln Ala Gly 100 105 110 Glu Pro Val Thr Lys Gln Cys Glu Trp Trp Pro Trp Gln Val Glu Gly 115 120 125 Ile Ala Ile Lys Pro Ser Glu Ala Ala Ser Trp Leu Ala Asn Leu Pro 130 135 140 Leu Thr Lys Lys Asp Pro Glu Leu Ser Glu Glu Ile Leu Trp Trp Ser 145 150 155 160 His Leu Glu Arg Trp Ser Leu Ser Leu Ile Ala Arg Gly Leu Trp Leu 165 170 175 Pro Gln Val Glu Leu Asn Thr Ile Asp Asn Ile Gly Ala Arg Ala Arg 180 185 190 Trp Ser Pro Leu Leu Asn Asn Glu Asn Glu Arg Lys Arg Leu Glu Glu 195 200 205 Phe Ser Ile Arg Leu Pro Leu Val Ala Thr Cys Ala Ile Lys Arg Glu 210 215 220 Glu Thr Ser Glu Glu Asn Gln Asn His Ile Leu Lys Thr Thr Pro Arg 225 230 235 240 Glu Thr Leu Asp Glu Tyr Gly Leu Ala Val Cys Arg Pro Ile Asn Ser 245 250 255 Arg Leu Gln Val Ala Tyr Leu Leu Glu Glu Leu Val Asp Gly Gln Leu 260 265 270 Arg Lys Asp Phe Glu Glu Ser Ser Glu Asp Leu Asp Pro Leu Leu Lys 275 280 285 Ala Trp Gln Glu Ala Leu Gly Ser His Asn Gly Val Ile Arg Leu Pro 290 295 300 Leu Glu Asp Cys Glu Arg Leu Ala Lys Ala Ser Lys Asn Trp Lys Glu 305 310 315 320 Asn Leu Ser Gly Asn Val Lys Gly Ala Arg Ala Cys Leu Glu Leu Phe 325 330 335 Ala Pro Leu Glu Gly Glu Asp Leu Trp Asp Leu Gln Phe Ser Leu Gln 340 345 350 Ala Glu Ala Asp Pro Ser Leu Lys Val Ala Ala Glu Ala Val Trp Asn 355 360 365 Ala Asp Ser Ala Val Leu Gln Ile Gly Asp Ile Gln Ile Ala Gln Pro 370 375 380 Gly Glu Ile Leu Leu Glu Gly Leu Gly Arg Ala Leu Asn Ile Phe Gln 385 390 395 400 Pro Ile Glu Arg Gly Leu Glu Asn Ala Thr Pro Asn Asn Met Gln Leu 405 410 415 Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ser Lys Gln Leu 420 425 430 Arg Asp Ile Gly Ile Gly Val Ile Leu Pro Arg Ser Leu Ser Gly Gly 435 440 445 Leu Ala Ser Arg Leu Gly Ile Ala Ile Lys Ala Glu Leu Ala Thr Ser 450 455 460 Ala Arg Gly Leu Thr Leu Arg Glu Asn Leu Glu Trp Ser Trp Glu Leu 465 470 475 480 Met Ile Gly Gly Ser Ile Leu Ser Leu Lys Asp Leu Glu Gln Leu Ala 485 490 495 Ser Lys Arg Ser Pro Leu Val Arg Tyr Lys Asp Ser Trp Leu Glu Leu 500 505 510 Arg Pro Asn Asp Leu Lys Ile Ala Glu Lys Phe Cys Ser Asn Asn Pro 515 520 525 Glu Leu Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Lys Gly Glu 530 535 540 Thr Leu Met Lys Leu Pro Val His Gln Phe Asn Ala Gly Pro Lys Leu 545 550 555 560 Gln Gly Val Leu Glu Gln Tyr His Gln His Thr Ser Pro Glu Pro Leu 565 570 575 Ala Ala Pro Asp Gly Phe Tyr Gly Gln Leu Arg Pro Tyr Gln Glu Arg 580 585 590 Gly Ile Gly Trp Leu Ala Phe Leu His Arg Phe Asn Gln Gly Ala Cys 595 600 605 Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Val Leu Ala Phe 610 615 620 Ile Gln His Leu Lys Ser Asn Lys Asp Leu Lys Lys Pro Val Leu Leu 625 630 635 640 Ile Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Tyr Ser 645 650 655 Phe Thr Pro Glu Leu Ser Val Leu Glu His Tyr Gly Pro Asn Arg Ser 660 665 670 Ser Thr Ser Thr Leu Leu Lys Lys Ile Leu Lys Lys Val Asp Ile Leu 675 680 685 Ile Thr Ser Tyr Gly Leu Leu His Arg Asp Lys Gln Leu Leu Lys Thr 690 695 700 Ile Asp Trp Gln Gly Val Ile Ile Asp Glu Ala Gln Ala Ile Lys Asn 705 710 715 720 Pro Asn Ser Lys Gln Ser Gln Thr Thr Arg Glu Ile Val Lys Gly Gly 725 730 735 Lys Ile Ile Pro Phe Arg Ile Ala Leu Thr Gly Thr Pro Ile Glu Asn 740 745 750 Arg Val Ser Glu Leu Trp Ser Leu Met Asp Phe Leu Asn Pro Ser Val 755 760 765 Leu Gly Glu Lys Glu Phe Phe Asp Gln Arg Tyr Lys Leu Pro Ile Glu 770 775 780 Arg Tyr Gly Asp Ile Ser Ser Leu Thr Asp Leu Lys Ala Arg Val Ser 785 790 795 800 Pro Phe Ile Leu Arg Arg Leu Lys Ser Asp Lys Ser Ile Ile Ser Asp 805 810 815 Leu Pro Ser Lys Val Glu Leu Lys Glu Trp Ile Thr Leu Ser Gln Glu 820 825 830 Gln Arg Ala Leu Tyr Asn Lys Thr Val Asp Asn Thr Leu Gln Glu Ile 835 840 845 Ala Arg Ser Pro Ile Gly Gln Arg His Ala Lys Thr Leu Gly Leu Leu 850 855 860 Thr Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys Glu 865 870 875 880 Lys Asn Ile Ser Asp Asp Phe Gly Ile Arg Ser Thr Lys Leu Gln Arg 885 890 895 Leu Glu Glu Leu Leu Asp Val Ile Phe Ala Thr Glu Asp Arg Ala Leu 900 905 910 Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala Tyr Leu 915 920 925 Glu Lys Lys Trp Gly His Ser Ile Leu Phe Leu His Gly Gly Thr Arg 930 935 940 Lys Ile Asp Arg Gln Ser Met Val Asp Gln Phe Gln Glu Asp Pro Arg 945 950 955 960 Gly Pro Lys Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Ile Gly Leu 965 970 975 Asn Leu Thr Arg Ala Asn His Val Leu His Ile Asp Arg Trp Trp Asn 980 985 990 Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln 995 1000 1005 Lys Asn Ser Val Met Val His Lys Phe Ile Ala Thr Gly Ser Val 1010 1015 1020 Glu Glu Lys Ile Asp Gln Met Ile Thr Glu Lys Ser Lys Leu Ala 1025 1030 1035 Glu Asn Ile Ile Gly Ala Gly Glu Asp Trp Leu Gly Lys Leu Gly 1040 1045 1050 Ile Asn Glu Leu Arg Glu Leu Val Ser Leu Glu Lys Glu Ser 1055 1060 1065 <210> 71 <211> 3300 <212> DNA <213> Prochlorococcus marinus <400> 71 atgattggtt gtggaactcc tgcgtggatg gttgccgttg atcggcagtg cactcctgct 60 ccaagaaacc caacacatac tttttgcgtc gcggccatga gcctgctgca cgccacctgg 120 cttccagcca tccgtactcc gaccagctcc ggtcgccctg cgctccttgt gtgggcagat 180 acctggcgag tcgctacccc agcaggacca gcagcaactc ccgcactcca ccccttcaca 240 ctcaacccag acgatctacg tgcctggctg attgagcgcg atctactgcc cgatgaaatc 300 atcgacgcca cagcatgtct gaccctgcct agccgaacag tcaaaccgcg cagcaaagcc 360 aagaacgtat ccactgaatc cgacgaagac aaagaccaca aaacaagttg gacaggactg 420 cccttacaag caggcgaacc cattcccaaa cagactgaat ggtggccctg gcaggtgcaa 480 ggcctggcag tggagcctgc tgctgcaacg gcctggcttt cgaaactgcc tctttcagga 540 gatcatcctg atctcgccga tgaattgcgc tggtggagcc atctacagcg ctgggccctg 600 agcatgattg ctcgcggacg ttggctaccc caggtggaac tcagcaaggg agagggctat 660 ccccaccgag cacgctggac accgctactc aaccgtgaag atgatcgccg ccgcctcgaa 720 gaccttgccg ctcagctccc cttagtggcc acctgcgccc tcccctggcg ggagcccacc 780 ggaaggcgta gcaaccgaat gacccgccta agaccagagg cgatgcgagc cgctaaccct 840 gtggcttcat gccgaccccg cagcggtcgc cttcgcgtag ccagcctgct ggaagaactc 900 ttggatgccc aactgcgcac cggatttgaa gcgagtgagc aaggcctaga cccattgctc 960 acagcctggc aggaagcact ggggtcggac agcggcgtga tcaacctccc cgatgaggaa 1020 gccgaacgtc tagcgacagc aagcaaccat tggcgagaag gcgtggctgg caacgtcgca 1080 ccagccaggg cctgcttaga actcttcact cccggcgaag gggaagacct ctgggagctg 1140 cgcttcgcct tacaggctga ggctgatccc acgatcaaag taccggccgc agcagcctgg 1200 gcagcgggtc ccaaggtcct gcaactaggc gaaatccgtg tggaacatcc aggcgaggtg 1260 ctactggaag gcatggggcg agccctcacg gtgtttgcac cgatcgaacg aggcctcgac 1320 agcgccacac cagaagcaat gcagctcacc cctgctgaag cctttgtatt ggtgcgcact 1380 gcagcggccc aactgcgtga tgttggcgtt ggcgtggaat tgcctgccag cctctcggga 1440 gggctggcca gtcgcctagg cctagcgatc aaggcggagc tatcggagag atctagaggt 1500 ttcactttgg gcgaaaccct cgactggagt tgggagctca tgatcggtgg cgtcaccctg 1560 acgcttcgcg agctggagcg actagcaagc aagcgcagcc cgcttgtcaa ccacaagggc 1620 gcctggatcg aattacgccc caacgatctc aaaaatgcgg aacacttctg cagcgtcaat 1680 ccaggcatca gcctcgacga tgccttgcgc cttaccgcaa ccgatggcga cacgctgatg 1740 agactgcccg ttcaccgctt tgaggccggt ccacgactac aggcggtgtt ggagcagtac 1800 caccagcaaa aagctcccga ccccctacct gctcccgaag gcttctgcgg tcagctaagg 1860 ccttatcagg aaaggggtct gggttggctg gccttcctgc atcgcttcga tcaaggggca 1920 tgcctggccg acgacatggg cctgggcaaa acgatccagc tactggcatt cctgcaacat 1980 ctcaaggcgg aacaggaact caaacggccg gtattgctta tcgctcccac atccgtactt 2040 accaactgga agagagaggc attggccttc acaccagagt taaacgtccg agaacactat 2100 gggccgcgtc ggccctctac ccccgccgcc ttaaagaaag cactcaaagg cttagacctc 2160 gttctcacca gttacgggct cctgcagcga gatagtgagc tcctggaaac ggtcgactgg 2220 caaggagtgg tcatcgatga agcccaagcc attaagaacc ccaacgccaa acagagccaa 2280 gcagcacgcg atatgggccg cccagacaaa aacaatcgct tcaggattgc tcttaccggc 2340 acacccgtcg aaaaccgagt cagtgaactt tgggcactga tggacttcct caacccaagg 2400 gttctcggtg aagaagactt cttccgccag cgctaccggc tgccaattga acgctatggc 2460 gacatgtctt ccctgcgaga cctcaaaggc cgtgttggtc ccttcatcct gagacgacta 2520 aaaaccgaca aggcaatcat ctccgaccta cctgaaaagg tagagctgag cgaatgggtg 2580 ggtctgagca aagaacaggc agccctctat cgcaacacag tggatgaaac actggaggcc 2640 attgcccgcg cacccagtgg tcaacgtcat ggcaaggtgc tcggcttgct tacccgactg 2700 aagcaaatct gcaaccatcc cgccctagcc ctcaaagaaa aaaccgttgc aaaaggcttc 2760 atggaccgct ccgccaagct gctgcgtttg gaagaaattc tcgaggaagt gatcgaggca 2820 ggagatcgcg ctctgttatt cacccaattc gcagaatggg gtcatctcct taaggcctac 2880 ctgcaacaac gctggcgctt tgaagttccc ttcctgcacg gcagcacaag caaaactgaa 2940 cgtcaggcca tggttgatcg cttccaggag gatccacgtg gaccccaact gttcctgctg 3000 tcactcaaag ccggtggcgt aggcctaaac ctcacgcggg ctagccatgt gtttcatgtc 3060 gatcgctggt ggaatcctgc cgtagaaaac caggccactg atcgcgctta caggatcgga 3120 caaaccaatc gggtgatggt gcacaaattc atcaccagcg gctcagttga agagaaaatt 3180 gatcgcatga ttcgcgaaaa atctcgactt gccgaagaca tcattggctc tggagaagac 3240 tggttaggtg gcttaggcgt cagtcaattg cgcgaactag tggccctaga agacagctga 3300 <210> 72 <211> 1099 <212> PRT <213> Prochlorococcus marinus <400> 72 Met Ile Gly Cys Gly Thr Pro Ala Trp Met Val Ala Val Asp Arg Gln 1 5 10 15 Cys Thr Pro Ala Pro Arg Asn Pro Thr His Thr Phe Cys Val Ala Ala 20 25 30 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr 35 40 45 Ser Ser Gly Arg Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 50 55 60 Ala Thr Pro Ala Gly Pro Ala Ala Thr Pro Ala Leu His Pro Phe Thr 65 70 75 80 Leu Asn Pro Asp Asp Leu Arg Ala Trp Leu Ile Glu Arg Asp Leu Leu 85 90 95 Pro Asp Glu Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 100 105 110 Thr Val Lys Pro Arg Ser Lys Ala Lys Asn Val Ser Thr Glu Ser Asp 115 120 125 Glu Asp Lys Asp His Lys Thr Ser Trp Thr Gly Leu Pro Leu Gln Ala 130 135 140 Gly Glu Pro Ile Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln 145 150 155 160 Gly Leu Ala Val Glu Pro Ala Ala Ala Thr Ala Trp Leu Ser Lys Leu 165 170 175 Pro Leu Ser Gly Asp His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp 180 185 190 Ser His Leu Gln Arg Trp Ala Leu Ser Met Ile Ala Arg Gly Arg Trp 195 200 205 Leu Pro Gln Val Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala 210 215 220 Arg Trp Thr Pro Leu Leu Asn Arg Glu Asp Asp Arg Arg Arg Leu Glu 225 230 235 240 Asp Leu Ala Ala Gln Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp 245 250 255 Arg Glu Pro Thr Gly Arg Arg Ser Asn Arg Met Thr Arg Leu Arg Pro 260 265 270 Glu Ala Met Arg Ala Ala Asn Pro Val Ala Ser Cys Arg Pro Arg Ser 275 280 285 Gly Arg Leu Arg Val Ala Ser Leu Leu Glu Glu Leu Leu Asp Ala Gln 290 295 300 Leu Arg Thr Gly Phe Glu Ala Ser Glu Gln Gly Leu Asp Pro Leu Leu 305 310 315 320 Thr Ala Trp Gln Glu Ala Leu Gly Ser Asp Ser Gly Val Ile Asn Leu 325 330 335 Pro Asp Glu Glu Ala Glu Arg Leu Ala Thr Ala Ser Asn His Trp Arg 340 345 350 Glu Gly Val Ala Gly Asn Val Ala Pro Ala Arg Ala Cys Leu Glu Leu 355 360 365 Phe Thr Pro Gly Glu Gly Glu Asp Leu Trp Glu Leu Arg Phe Ala Leu 370 375 380 Gln Ala Glu Ala Asp Pro Thr Ile Lys Val Pro Ala Ala Ala Ala Trp 385 390 395 400 Ala Ala Gly Pro Lys Val Leu Gln Leu Gly Glu Ile Arg Val Glu His 405 410 415 Pro Gly Glu Val Leu Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe 420 425 430 Ala Pro Ile Glu Arg Gly Leu Asp Ser Ala Thr Pro Glu Ala Met Gln 435 440 445 Leu Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ala Ala Gln 450 455 460 Leu Arg Asp Val Gly Val Gly Val Glu Leu Pro Ala Ser Leu Ser Gly 465 470 475 480 Gly Leu Ala Ser Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Ser Glu 485 490 495 Arg Ser Arg Gly Phe Thr Leu Gly Glu Thr Leu Asp Trp Ser Trp Glu 500 505 510 Leu Met Ile Gly Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu 515 520 525 Ala Ser Lys Arg Ser Pro Leu Val Asn His Lys Gly Ala Trp Ile Glu 530 535 540 Leu Arg Pro Asn Asp Leu Lys Asn Ala Glu His Phe Cys Ser Val Asn 545 550 555 560 Pro Gly Ile Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Asp Gly 565 570 575 Asp Thr Leu Met Arg Leu Pro Val His Arg Phe Glu Ala Gly Pro Arg 580 585 590 Leu Gln Ala Val Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro 595 600 605 Leu Pro Ala Pro Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu 610 615 620 Arg Gly Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala 625 630 635 640 Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala 645 650 655 Phe Leu Gln His Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu 660 665 670 Leu Ile Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Leu 675 680 685 Ala Phe Thr Pro Glu Leu Asn Val Arg Glu His Tyr Gly Pro Arg Arg 690 695 700 Pro Ser Thr Pro Ala Ala Leu Lys Lys Ala Leu Lys Gly Leu Asp Leu 705 710 715 720 Val Leu Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu 725 730 735 Thr Val Asp Trp Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys 740 745 750 Asn Pro Asn Ala Lys Gln Ser Gln Ala Ala Arg Asp Met Gly Arg Pro 755 760 765 Asp Lys Asn Asn Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu 770 775 780 Asn Arg Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Arg 785 790 795 800 Val Leu Gly Glu Glu Asp Phe Phe Arg Gln Arg Tyr Arg Leu Pro Ile 805 810 815 Glu Arg Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Gly Arg Val 820 825 830 Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser 835 840 845 Asp Leu Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys 850 855 860 Glu Gln Ala Ala Leu Tyr Arg Asn Thr Val Asp Glu Thr Leu Glu Ala 865 870 875 880 Ile Ala Arg Ala Pro Ser Gly Gln Arg His Gly Lys Val Leu Gly Leu 885 890 895 Leu Thr Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys 900 905 910 Glu Lys Thr Val Ala Lys Gly Phe Met Asp Arg Ser Ala Lys Leu Leu 915 920 925 Arg Leu Glu Glu Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala 930 935 940 Leu Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Lys Ala Tyr 945 950 955 960 Leu Gln Gln Arg Trp Arg Phe Glu Val Pro Phe Leu His Gly Ser Thr 965 970 975 Ser Lys Thr Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro 980 985 990 Arg Gly Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly 995 1000 1005 Leu Asn Leu Thr Arg Ala Ser His Val Phe His Val Asp Arg Trp 1010 1015 1020 Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg 1025 1030 1035 Ile Gly Gln Thr Asn Arg Val Met Val His Lys Phe Ile Thr Ser 1040 1045 1050 Gly Ser Val Glu Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser 1055 1060 1065 Arg Leu Ala Glu Asp Ile Ile Gly Ser Gly Glu Asp Trp Leu Gly 1070 1075 1080 Gly Leu Gly Val Ser Gln Leu Arg Glu Leu Val Ala Leu Glu Asp 1085 1090 1095 Ser <210> 73 <211> 3300 <212> DNA <213> Prochlorococcus marinus <400> 73 atgattggtt gtggaactcc tgcgtggatg gttgccgttg atcggcagtg cactcctgct 60 ccaagaaacc caacacatac tttttgcgtc gcggccatga gcctgctgca cgccacctgg 120 cttccagcca tccgtactcc gaccagctcc ggtcgccctg cgctccttgt gtgggcagat 180 acctggcgag tcgctacccc agcaggacca gcagcaactc ccgcactcca ccccttcacc 240 ctcagcccag acgatctacg tgcctggctc attgagcgcg atctactgcc tgatgaaatc 300 atcgacgcca cagcatgtct gaccctgcct agccgaacag tcaaaccgcg caacaaaacc 360 aagaacgtat ccactgaatc cgacgaagcc aaagacaaca aaacaagttg gacaggactg 420 cccttacaag caggcgaacc cattcccaaa caaacagaat ggtggccctg gcaggtgcaa 480 ggcctggcag tggaacctgc tgccgcaacg gcctggcttt cgaaactgcc tctttcagga 540 aatcatcctg atctggccga tgaattgcgc tggtggagcc atctacagcg ctgggccctg 600 agcatgattg ctcgcggacg ttggctaccc caggtggaac tcagcaaggg agagggctat 660 ccccaccgag cacgctggac accgctactc aaccgtgaag atgatcgccg ccgcctcgaa 720 gaccttgccg ctcagcttcc cttagtggcc acctgcgccc tcccctggcg ggagcccacc 780 ggaaggcgta gcaaccgaat gacccgccta agaccagagg cgatgcgagc cgctaaccct 840 gtggcttcat gccgaccccg cagcggtcgc cttcgcgtag ccagcttgct ggaagaactc 900 ttggatgccc aactgcgcac cggatttgaa gcgagtgagc aaggcctaga cccattgctc 960 acagcctggc aggaagcact ggggtccgac agcggcgtga tcaacctccc cgatgaggaa 1020 gccgaacgtc tagctacagc aagcaaccat tggcgtgaag gcgtggctgg caacgtcgca 1080 ccagccagag cctgcttaga actcttcact cccggagaag gggaagacct ctgggagctg 1140 cgcttctcct tacaggctga ggctgatccc acaatcaaag taccggccgc agcagcctgg 1200 gcagctggtc ccaaggtgtt gcaactaggc gaaatccgtg tggaacatcc aggcgaggtg 1260 ctactggaag gcatggggcg agccctcacg gtgtttgcac cgatcgaacg aggcctcgac 1320 agcgccacac cagaagcaat gcagctcacc cctgctgaag cctttgtatt ggtgcgcact 1380 gcagcgaccc aactgcgtga tgttggcgtt ggcgtggaat tgcctgccag cctctcggga 1440 gggctggcca gtcgcctagg cctagcgatc aaggcggagc tatcggagag atctagaggt 1500 ttcactctgg gcgaaaccct cgactggagt tgggagctca tgatcggtgg cgtcaccctg 1560 acgcttcgcg aactggagcg actagcaagc aagcgcagcc cgcttgtcaa ccacaagggc 1620 gcctggatcg aattacgccc caacgatctc aaacatgcgg aacacttctg cagcgtcaat 1680 ccaggcatca gcctcgacga tgccttgcgc cttaccgcaa cagatggcga cacgctgatg 1740 agactgcccg ttcaccgctt tgaggccggt ccacgactac aggcggtgtt ggagcagtac 1800 caccagcaaa aagcaccaga ccccctacct gctcccgaag gcttctgcgg tcagctaagg 1860 ccttatcagg aaaggggtct gggttggctg gccttcctgc atcgcttcga tcaaggggca 1920 tgcctggccg acgacatggg ccttggcaaa acgatccagc tactggcatt cctgcaacat 1980 ctcaaggcgg aacaggaact caaacggccg gtattgctta tcgctcccac gtccgtactc 2040 accaactgga agagagaggc gttggccttc acaccagagt taaacgtccg cgaacactat 2100 gggccgcgtc ggccctctac ccccgccgcc ttaaagaaag cactcaaagg cttagacctc 2160 gttctcacca gttatgggct cctgcagcga gatagtgagc tcctggaaac ggtcgactgg 2220 caaggcgtgg tcatcgatga agcccaagcc attaagaacc ccaacgccaa acagagccaa 2280 gcagcacgcg atatgggccg cccagacaaa aacaatcgct tcaggattgc tcttaccggc 2340 acacccgtcg aaaaccgagt aagtgaactt tgggcactaa tggacttcct taacccaagg 2400 gttctcggtg aagaagactt cttccgccag cgctaccggc tgccgattga gcgctatggc 2460 gacatgtctt ccctgcgaga cctcaagggc cgtgttggtc ccttcatcct gagacgactc 2520 aaaaccgaca aggcaatcat ctccgaccta cccgaaaaag tagagctgag cgaatgggtg 2580 gggctgagca aagaacaggc agccctctat cgcaacacag tggatgaaac actggaggcc 2640 attgcccgcg cacccagggg tcaacgccat ggcaaggtgc tcggattgct taccagactg 2700 aagcaaatct gcaaccatcc cgccctagcc ctcaaagaac aaaccgttgc aaaagggttc 2760 atggaccgct ccgccaagct gctgcgtttg gaagaaattc tcgaagaagt aatcgaggca 2820 ggagatcgcg ctctgttatt cacccaattc gcagaatggg gtcatctcct taaggcctac 2880 ctgcaacaac gctggcgctt tgaagttccc ttcctgcacg gcagcacaag caaaactgaa 2940 cgtcaggcca tggttgatcg cttccaggag gatccacgtg gaccccaact gttcctgctg 3000 tcactcaaag ccggtggtgt aggcctcaac ctgacgcggg ctagccatgt gtttcatgtt 3060 gatcgctggt ggaatcctgc cgtagaaaac caggccactg atcgcgctta caggatcggg 3120 caaaccagtc gggtgatggt gcacaaattc atcaccagcg gctcagttga agagaaaatt 3180 gatcgcatga ttcgtgaaaa atctcgactt gccgaagaca tcattggctc tggagaagac 3240 tggttaggtg gcttaggcgt cagtcaattg cgcgaactag tggccctaga agacagctga 3300 <210> 74 <211> 1099 <212> PRT <213> Prochlorococcus marinus <400> 74 Met Ile Gly Cys Gly Thr Pro Ala Trp Met Val Ala Val Asp Arg Gln 1 5 10 15 Cys Thr Pro Ala Pro Arg Asn Pro Thr His Thr Phe Cys Val Ala Ala 20 25 30 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr 35 40 45 Ser Ser Gly Arg Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 50 55 60 Ala Thr Pro Ala Gly Pro Ala Ala Thr Pro Ala Leu His Pro Phe Thr 65 70 75 80 Leu Ser Pro Asp Asp Leu Arg Ala Trp Leu Ile Glu Arg Asp Leu Leu 85 90 95 Pro Asp Glu Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 100 105 110 Thr Val Lys Pro Arg Asn Lys Thr Lys Asn Val Ser Thr Glu Ser Asp 115 120 125 Glu Ala Lys Asp Asn Lys Thr Ser Trp Thr Gly Leu Pro Leu Gln Ala 130 135 140 Gly Glu Pro Ile Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln 145 150 155 160 Gly Leu Ala Val Glu Pro Ala Ala Ala Thr Ala Trp Leu Ser Lys Leu 165 170 175 Pro Leu Ser Gly Asn His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp 180 185 190 Ser His Leu Gln Arg Trp Ala Leu Ser Met Ile Ala Arg Gly Arg Trp 195 200 205 Leu Pro Gln Val Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala 210 215 220 Arg Trp Thr Pro Leu Leu Asn Arg Glu Asp Asp Arg Arg Arg Leu Glu 225 230 235 240 Asp Leu Ala Ala Gln Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp 245 250 255 Arg Glu Pro Thr Gly Arg Arg Ser Asn Arg Met Thr Arg Leu Arg Pro 260 265 270 Glu Ala Met Arg Ala Ala Asn Pro Val Ala Ser Cys Arg Pro Arg Ser 275 280 285 Gly Arg Leu Arg Val Ala Ser Leu Leu Glu Glu Leu Leu Asp Ala Gln 290 295 300 Leu Arg Thr Gly Phe Glu Ala Ser Glu Gln Gly Leu Asp Pro Leu Leu 305 310 315 320 Thr Ala Trp Gln Glu Ala Leu Gly Ser Asp Ser Gly Val Ile Asn Leu 325 330 335 Pro Asp Glu Glu Ala Glu Arg Leu Ala Thr Ala Ser Asn His Trp Arg 340 345 350 Glu Gly Val Ala Gly Asn Val Ala Pro Ala Arg Ala Cys Leu Glu Leu 355 360 365 Phe Thr Pro Gly Glu Gly Glu Asp Leu Trp Glu Leu Arg Phe Ser Leu 370 375 380 Gln Ala Glu Ala Asp Pro Thr Ile Lys Val Pro Ala Ala Ala Ala Trp 385 390 395 400 Ala Ala Gly Pro Lys Val Leu Gln Leu Gly Glu Ile Arg Val Glu His 405 410 415 Pro Gly Glu Val Leu Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe 420 425 430 Ala Pro Ile Glu Arg Gly Leu Asp Ser Ala Thr Pro Glu Ala Met Gln 435 440 445 Leu Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ala Thr Gln 450 455 460 Leu Arg Asp Val Gly Val Gly Val Glu Leu Pro Ala Ser Leu Ser Gly 465 470 475 480 Gly Leu Ala Ser Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Ser Glu 485 490 495 Arg Ser Arg Gly Phe Thr Leu Gly Glu Thr Leu Asp Trp Ser Trp Glu 500 505 510 Leu Met Ile Gly Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu 515 520 525 Ala Ser Lys Arg Ser Pro Leu Val Asn His Lys Gly Ala Trp Ile Glu 530 535 540 Leu Arg Pro Asn Asp Leu Lys His Ala Glu His Phe Cys Ser Val Asn 545 550 555 560 Pro Gly Ile Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Asp Gly 565 570 575 Asp Thr Leu Met Arg Leu Pro Val His Arg Phe Glu Ala Gly Pro Arg 580 585 590 Leu Gln Ala Val Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro 595 600 605 Leu Pro Ala Pro Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu 610 615 620 Arg Gly Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala 625 630 635 640 Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala 645 650 655 Phe Leu Gln His Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu 660 665 670 Leu Ile Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Leu 675 680 685 Ala Phe Thr Pro Glu Leu Asn Val Arg Glu His Tyr Gly Pro Arg Arg 690 695 700 Pro Ser Thr Pro Ala Ala Leu Lys Lys Ala Leu Lys Gly Leu Asp Leu 705 710 715 720 Val Leu Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu 725 730 735 Thr Val Asp Trp Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys 740 745 750 Asn Pro Asn Ala Lys Gln Ser Gln Ala Ala Arg Asp Met Gly Arg Pro 755 760 765 Asp Lys Asn Asn Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu 770 775 780 Asn Arg Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Arg 785 790 795 800 Val Leu Gly Glu Glu Asp Phe Phe Arg Gln Arg Tyr Arg Leu Pro Ile 805 810 815 Glu Arg Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Gly Arg Val 820 825 830 Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser 835 840 845 Asp Leu Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys 850 855 860 Glu Gln Ala Ala Leu Tyr Arg Asn Thr Val Asp Glu Thr Leu Glu Ala 865 870 875 880 Ile Ala Arg Ala Pro Arg Gly Gln Arg His Gly Lys Val Leu Gly Leu 885 890 895 Leu Thr Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys 900 905 910 Glu Gln Thr Val Ala Lys Gly Phe Met Asp Arg Ser Ala Lys Leu Leu 915 920 925 Arg Leu Glu Glu Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala 930 935 940 Leu Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Lys Ala Tyr 945 950 955 960 Leu Gln Gln Arg Trp Arg Phe Glu Val Pro Phe Leu His Gly Ser Thr 965 970 975 Ser Lys Thr Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro 980 985 990 Arg Gly Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly 995 1000 1005 Leu Asn Leu Thr Arg Ala Ser His Val Phe His Val Asp Arg Trp 1010 1015 1020 Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg 1025 1030 1035 Ile Gly Gln Thr Ser Arg Val Met Val His Lys Phe Ile Thr Ser 1040 1045 1050 Gly Ser Val Glu Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser 1055 1060 1065 Arg Leu Ala Glu Asp Ile Ile Gly Ser Gly Glu Asp Trp Leu Gly 1070 1075 1080 Gly Leu Gly Val Ser Gln Leu Arg Glu Leu Val Ala Leu Glu Asp 1085 1090 1095 Ser <210> 75 <211> 2886 <212> DNA <213> Rhodococcus sp. <400> 75 atggcgcgag cagggacttc acgcgctgtc ggtcgcacct gcttggatgg gtgcatgctg 60 cacggcctct ggacaccggg ttcgggtctc atgctgtggg tggaggatcg gaatccggca 120 gctccggagc cgacggacgc ggtcgggcgg atgctggcgc ggaagttccg gcatcacgtg 180 aaggtgccga tgccgacgcc gtcggggccg gagatgctcg agtgggccgc ggttgcgctc 240 gcaccaccgg atgcgacgga gttcctgctg tcggtgtcgt cccgcgaccc ccggatcgcc 300 ggggatctgc gctacctcgc ccacgtcgcc cgcggtgtcg agcggtgggc acgggccggg 360 cgggtggtgc ccgaggtaca ccgggcggag ggcggctggt ggccgcgctg gcggctgctc 420 ggcggtgaac ggcagcgtgc gtggctcacg gagctggccg tggcgatgcc gccggtccag 480 cgtcacggca cgaccccccg ggccgtgctc gacgacatgg tcaccgagct gaccgacccc 540 gtcgcccgcc gtgtcctcga acgacggcac ccggacgatt ccggcggcga cgtggatcat 600 ccgctgatcg acgcgctcgt gcggggtgac cagttcgccg agggcaccgc ccagctgtcg 660 ggatcgctgg acgggtggcg cgacagcctc aaggtggacg agcccgaact ggtgctgcgg 720 ctcctcgagc cggaagacgt ggacgtggag ggggattggg acccggacac ggtgctgtgg 780 cgactggagg tctgccttcg accggaaggc gaagccccgg tgccgattcc gttgcaccgc 840 acggaggcga gtcgtctgca gatcggggtg cgcaagctga cggaggccgt ggccgcctac 900 ccgcgactgc aggacgttcc cagtgacccc gacagcctgg acctgatgtt gcccaccgcc 960 gtggtcatcg accttgtcgg gcacggtgcg gtggcgttga aggagaaggg catcagcctg 1020 ctgctgccgc gggcgtggag tgtggcgtcg ccgtcgatgc gtctgcgggt gagctcgccg 1080 agcactccgg cgagcgcgga gaaccgggcc gtcggcaaag accagttggt gcaatacaac 1140 tgggagctgg cactcggcga cacggtgctc accgccgcgg agatgaatcg actggtcaac 1200 tccaagagcg atctcgtgcg gttgcgcggt gagtgggttc gggcggatca ggaggtgctc 1260 tcccgcgccg cgcgctacgt ggcggagcgg cacgccagcg gcgaccgggc catcgtggac 1320 ctgctgaagg acctgatcgc ggacgatctg tccgatcttc ccgtggagga ggtcacggcc 1380 accggctggg cggccgcgtt gctggacggc gacacgaagc cgcaggacgt gccgaccccg 1440 gacgggttgg acgccacgct gcgcccgtac cagaagcggg ggctcgactg gctggtgttc 1500 atgagccgtc tcggcctcgg ggccgtcctc gccgacgaca tgggactcgg caagacgctg 1560 cagttgctgg cgctgctggc acacgagaag gcgcccacgc ccacgctgct ggtgtgcccg 1620 atgtcggtgg tcggcaactg gcagcgcgag gcagcgcgct tcgtcccctc gctgcgggtg 1680 ctcgtccacc acggtccgca gcggctgagc ggcgcggagt tcaccgccgc cgtgacacag 1740 agcgatctgg tgatcaccac gtatgcgctg ctggcccgcg acgtcgcgca cctgaaggag 1800 caggactggc ggcgtgtcgt gctggacgag gcgcagcaca tcaagaacgc gaagacgtcg 1860 caggcgcggg cggcgcggag cattccggcg gcgcaccgcg tcgcgctgac cggcactccg 1920 gtcgagaacc gcctcgacga actgcgctcg atcctcgact tcgcgaactc gggcatcctg 1980 ggctcggagg tgatgttccg caagcgcttc gtggtgccga tcgagcggga gcaggacgag 2040 acagccgtcg cccggctccg cgcggtcacg tccccgttcg tgctgcgccg ggtcaagacc 2100 gatcccgcgg tcatcgccga cctccccgac aagttcgaga tgacggtgcg cgccaacctc 2160 accgcggagc aggccgcgct gtaccgggcg gtggtcgacg acatgatggc gcagatcaag 2220 gacaagaagg ggatgaagcg caagggcgcc gtcctcgccg ccctgacgaa actcaagcag 2280 gtgtgcaacc acccggcaca cttcctgcgc gacgggtcgg cggtgatgcg gcgcggacag 2340 caccgctccg gcaagctggg gctcgtcgag gacatcctgg attccgtggt cgcggacggc 2400 gagaaggcgt tgctgttcac ccagttccgg gaattcggcg acctcgtcac cccgtacctc 2460 gcggagcgtt tcggtactcc cgtgccgttt ctgcacgggg gcgtgtccaa gcagaagcgc 2520 gacgacatgg tggcctcgtt ccagggcgac gacgggccgc cgatcatgat gctctcgctg 2580 aaggcgggcg ggacgggttt gaacctcacc gcggccaatc acgtcgtcca cctcgaccgg 2640 tggtggaatc cggcggtcga gaaccaggcc acggacaggg cgttccggat cggccagcgg 2700 cgggacgtgc aggtgcgcaa gctcgtgtgc gtcggcaccc tggaggagcg gatcgacgcg 2760 atgatcgcca ccaagcagga gctggccgat ctcgccgtcg ggacgggcga gaactgggtg 2820 acggagatga gcaccgaaca actgggcgaa ctgctccgcc tcggtgacga ggcggtgggc 2880 gaatga 2886 <210> 76 <211> 961 <212> PRT <213> Rhodococcus sp. <400> 76 Met Ala Arg Ala Gly Thr Ser Arg Ala Val Gly Arg Thr Cys Leu Asp 1 5 10 15 Gly Cys Met Leu His Gly Leu Trp Thr Pro Gly Ser Gly Leu Met Leu 20 25 30 Trp Val Glu Asp Arg Asn Pro Ala Ala Pro Glu Pro Thr Asp Ala Val 35 40 45 Gly Arg Met Leu Ala Arg Lys Phe Arg His His Val Lys Val Pro Met 50 55 60 Pro Thr Pro Ser Gly Pro Glu Met Leu Glu Trp Ala Ala Val Ala Leu 65 70 75 80 Ala Pro Pro Asp Ala Thr Glu Phe Leu Leu Ser Val Ser Ser Arg Asp 85 90 95 Pro Arg Ile Ala Gly Asp Leu Arg Tyr Leu Ala His Val Ala Arg Gly 100 105 110 Val Glu Arg Trp Ala Arg Ala Gly Arg Val Val Pro Glu Val His Arg 115 120 125 Ala Glu Gly Gly Trp Trp Pro Arg Trp Arg Leu Leu Gly Gly Glu Arg 130 135 140 Gln Arg Ala Trp Leu Thr Glu Leu Ala Val Ala Met Pro Pro Val Gln 145 150 155 160 Arg His Gly Thr Thr Pro Arg Ala Val Leu Asp Asp Met Val Thr Glu 165 170 175 Leu Thr Asp Pro Val Ala Arg Arg Val Leu Glu Arg Arg His Pro Asp 180 185 190 Asp Ser Gly Gly Asp Val Asp His Pro Leu Ile Asp Ala Leu Val Arg 195 200 205 Gly Asp Gln Phe Ala Glu Gly Thr Ala Gln Leu Ser Gly Ser Leu Asp 210 215 220 Gly Trp Arg Asp Ser Leu Lys Val Asp Glu Pro Glu Leu Val Leu Arg 225 230 235 240 Leu Leu Glu Pro Glu Asp Val Asp Val Glu Gly Asp Trp Asp Pro Asp 245 250 255 Thr Val Leu Trp Arg Leu Glu Val Cys Leu Arg Pro Glu Gly Glu Ala 260 265 270 Pro Val Pro Ile Pro Leu His Arg Thr Glu Ala Ser Arg Leu Gln Ile 275 280 285 Gly Val Arg Lys Leu Thr Glu Ala Val Ala Ala Tyr Pro Arg Leu Gln 290 295 300 Asp Val Pro Ser Asp Pro Asp Ser Leu Asp Leu Met Leu Pro Thr Ala 305 310 315 320 Val Val Ile Asp Leu Val Gly His Gly Ala Val Ala Leu Lys Glu Lys 325 330 335 Gly Ile Ser Leu Leu Leu Pro Arg Ala Trp Ser Val Ala Ser Pro Ser 340 345 350 Met Arg Leu Arg Val Ser Ser Pro Ser Thr Pro Ala Ser Ala Glu Asn 355 360 365 Arg Ala Val Gly Lys Asp Gln Leu Val Gln Tyr Asn Trp Glu Leu Ala 370 375 380 Leu Gly Asp Thr Val Leu Thr Ala Ala Glu Met Asn Arg Leu Val Asn 385 390 395 400 Ser Lys Ser Asp Leu Val Arg Leu Arg Gly Glu Trp Val Arg Ala Asp 405 410 415 Gln Glu Val Leu Ser Arg Ala Ala Arg Tyr Val Ala Glu Arg His Ala 420 425 430 Ser Gly Asp Arg Ala Ile Val Asp Leu Leu Lys Asp Leu Ile Ala Asp 435 440 445 Asp Leu Ser Asp Leu Pro Val Glu Glu Val Thr Ala Thr Gly Trp Ala 450 455 460 Ala Ala Leu Leu Asp Gly Asp Thr Lys Pro Gln Asp Val Pro Thr Pro 465 470 475 480 Asp Gly Leu Asp Ala Thr Leu Arg Pro Tyr Gln Lys Arg Gly Leu Asp 485 490 495 Trp Leu Val Phe Met Ser Arg Leu Gly Leu Gly Ala Val Leu Ala Asp 500 505 510 Asp Met Gly Leu Gly Lys Thr Leu Gln Leu Leu Ala Leu Leu Ala His 515 520 525 Glu Lys Ala Pro Thr Pro Thr Leu Leu Val Cys Pro Met Ser Val Val 530 535 540 Gly Asn Trp Gln Arg Glu Ala Ala Arg Phe Val Pro Ser Leu Arg Val 545 550 555 560 Leu Val His His Gly Pro Gln Arg Leu Ser Gly Ala Glu Phe Thr Ala 565 570 575 Ala Val Thr Gln Ser Asp Leu Val Ile Thr Thr Tyr Ala Leu Leu Ala 580 585 590 Arg Asp Val Ala His Leu Lys Glu Gln Asp Trp Arg Arg Val Val Leu 595 600 605 Asp Glu Ala Gln His Ile Lys Asn Ala Lys Thr Ser Gln Ala Arg Ala 610 615 620 Ala Arg Ser Ile Pro Ala Ala His Arg Val Ala Leu Thr Gly Thr Pro 625 630 635 640 Val Glu Asn Arg Leu Asp Glu Leu Arg Ser Ile Leu Asp Phe Ala Asn 645 650 655 Ser Gly Ile Leu Gly Ser Glu Val Met Phe Arg Lys Arg Phe Val Val 660 665 670 Pro Ile Glu Arg Glu Gln Asp Glu Thr Ala Val Ala Arg Leu Arg Ala 675 680 685 Val Thr Ser Pro Phe Val Leu Arg Arg Val Lys Thr Asp Pro Ala Val 690 695 700 Ile Ala Asp Leu Pro Asp Lys Phe Glu Met Thr Val Arg Ala Asn Leu 705 710 715 720 Thr Ala Glu Gln Ala Ala Leu Tyr Arg Ala Val Val Asp Asp Met Met 725 730 735 Ala Gln Ile Lys Asp Lys Lys Gly Met Lys Arg Lys Gly Ala Val Leu 740 745 750 Ala Ala Leu Thr Lys Leu Lys Gln Val Cys Asn His Pro Ala His Phe 755 760 765 Leu Arg Asp Gly Ser Ala Val Met Arg Arg Gly Gln His Arg Ser Gly 770 775 780 Lys Leu Gly Leu Val Glu Asp Ile Leu Asp Ser Val Val Ala Asp Gly 785 790 795 800 Glu Lys Ala Leu Leu Phe Thr Gln Phe Arg Glu Phe Gly Asp Leu Val 805 810 815 Thr Pro Tyr Leu Ala Glu Arg Phe Gly Thr Pro Val Pro Phe Leu His 820 825 830 Gly Gly Val Ser Lys Gln Lys Arg Asp Asp Met Val Ala Ser Phe Gln 835 840 845 Gly Asp Asp Gly Pro Pro Ile Met Met Leu Ser Leu Lys Ala Gly Gly 850 855 860 Thr Gly Leu Asn Leu Thr Ala Ala Asn His Val Val His Leu Asp Arg 865 870 875 880 Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Phe Arg 885 890 895 Ile Gly Gln Arg Arg Asp Val Gln Val Arg Lys Leu Val Cys Val Gly 900 905 910 Thr Leu Glu Glu Arg Ile Asp Ala Met Ile Ala Thr Lys Gln Glu Leu 915 920 925 Ala Asp Leu Ala Val Gly Thr Gly Glu Asn Trp Val Thr Glu Met Ser 930 935 940 Thr Glu Gln Leu Gly Glu Leu Leu Arg Leu Gly Asp Glu Ala Val Gly 945 950 955 960 Glu <210> 77 <211> 3153 <212> DNA <213> Salinispora tropica <400> 77 gtgctggttg tccacgggtc gtggcggctc ggcatcgggc tcgccatctg ggccgaggac 60 agcgcgtcgc cgcctcgggc gccgcgccgg gccgggcggg cgccccgcga gcgaccccac 120 ccgttcgccg ccggtcaccc cgtgcttgcg gcagctctgg ccgaggtcgc cgagccgacc 180 gagcccggca cggcactgct caccctgccc acccgagctg gttcgccgct ggactcgccg 240 gagctggtcc gcaccgcgtc ggtcgagccg ctccgtgggc cggtcacgtt ggccgggtgg 300 cgggtgcccg ccctggttta cgccccggac gccgccctgt cgctgctctc ccagatcacc 360 gcggccggcg ctctacctga cgccgtaccc ggtgccactc tgcgtcacct cgcggagctg 420 gcggccttcg ccgtggacct cgccgcccgt ggtcgggtcc tgcccggcgt ccggccaccg 480 aaggaacgtg ccagcgccgc ctgggcggtg tggcagcccc tgctcaccgg cgtggacgct 540 ggctgggccc gggccctcgc cctcgccctg ccgcccgcgg tccgtgccgc cgtcgagatc 600 gatccggctc cactcgccgt acccggcgga ccggaaacgc ccgccaacgg tggtgtgccg 660 ccgcaggctc gtacgaggcg accgaccgca gccgccgggg aaccaggtga actggtggtc 720 gaggcgctcg acgcgctcac cgacgcggcc gtacgggctg ccctcgcgga gacctccctt 780 acccggggag cccgtccgcg gggcgcggtc gcggcctggc tcgcggcgct caccggcccg 840 cgtcgtgact tcaccgccga ctcggcggag ctcgacaccc tgcgcggtga gttggacgcc 900 tggcagcgcg acgctgtggg aggttcggtc cgggccagct tccggctggt ggagccgccg 960 acggacggac tctttgaggc ggcggccggg gggctggccg cggccgaggg gtcgtggcgg 1020 gtcgagttcg gcctacagcc ggccgaccag ccgggtctgc atgttgacgc cgtgcggatc 1080 tggcacgagt cggcggccct accgggcccg gccgctccgc aggaggccct gctgaccgag 1140 ttggggcggg ccagccgact ctggccggag ctgaactcgg ccctgcgcac cgccactcca 1200 gaggcgctgg agctggacgc cgcgggcgcg catcgctttc tacgcgacgg cgcgccggtg 1260 ctgcacgcag ccgggttcgc ggtgctgttg ccctcgtggt ggcagcgtcc gtcgtcccgg 1320 ctcggcgctc gactacaggc ccagagccgt accgccccgg gcaccgtcgc cggggctggc 1380 gacggggtgg ggttggatgc cctggtcgac taccgctggg aggtgtccct cggcgaccag 1440 ccgctgaccg ccgaggaact ggagtcgctg gccgcgctga aatctccgtt ggtccgcctg 1500 cgtgggcgct gggtggagct ggacccgaaa cgtctcgccg ccggcctgcg gctgctccgt 1560 tccgccggcg agctgaccgt cggcgacctg ctgcggctcg gcctctccga ccctgctacc 1620 gacgcgctgc cggtgctcga ggtggcggcc gacggtgcgt tgggtgactt gctcgccgga 1680 gctgtggagc ggcaactcac cccggtggac gcggttccgt cgttccaggg cgttctccgc 1740 ccctaccagc ggcgagggct ggcctggctg tcctttctgc agtccctcgg cctcggcggg 1800 gtgctcgctg acgacatggg tctcggcaag acggtacagc tactcgcgtt gctcgctggt 1860 gacccgccgg gcgtcggtcc gaccctgttg gtctgtccga tgtcactggt cggtaactgg 1920 cagcgggagg cggcgacctt caccccgggc gtacgggtcc atgtgcatca cggcgccgag 1980 cgggcccgcg gggcggcgtt caccgcggcg gtggaggcag cggacctggt cctcaccacc 2040 tacacggtgg ctgcccgcga tgcgggggag ctggccgggg tcgactggca tcgggtggtg 2100 gtggacgagg cacaggccat caagaacgcc tcgacgcggc aagccgaggc ggtccgggcg 2160 ttgcccgccc ggcatcggat cgcggtcacc ggcaccccgg tggagaatcg gctcgccgac 2220 ctctggtcga tcatgcagtt cgccaatccc ggtctgctcg gcccggccgc cgagttcaag 2280 aagcggtacg ccgaaccgat cgagcgacac ggcgacgcgg aggcggccga gcggctgcgc 2340 cggatcaccg gcccgttcgt gctgcgtcgc ctcaagaccg actcttcggt tatctccgac 2400 ctgccagaga agctggagat ggaggtggtg tgcaacctga ccgcggaaca ggctgccctc 2460 taccgtgcgg tggtggacga catgatggcc cagatcgagt ccagcgaggg catcgagcga 2520 cgtgggctcg tgctggccgc catgacccgg ctcaagcagg tctgcaacca cccggcgcac 2580 ctgctgcggg acaactcggc gctggtcggc cgctccggca agctggcccg gctggaggag 2640 atcctcgacg aggtgcttgt cgcgggggag aaggccctgc tcttcaccca gtacgccgag 2700 ttcggcggca tgctgcgcgg ccacctgtcg gcccggttcg gacaggagac gctgttcctg 2760 cacggcggcg tcggtaaggc cgaccgggac gcgatggtga cgcggttcca gtccccggac 2820 ggccccgcgc tcttcgtact ctcgctcaag gccggtggta ccggtctcac cctgaccgcg 2880 gccaaccatg tcgtgcacgt tgaccgctgg tggaatccgg cggtggagga ccaggccacg 2940 gaccgggcgt tccgcatcgg gcagcggcgg cgcgttcagg tccgcaagtt tgtctgcgcc 3000 ggcacggtgg aggagaaggt cgccgcgctc atcgccgaca agcgtcggct cgcctcgacg 3060 gtggtgggtg ccggtgagca gtgggttacc gagctgtcca cggcgcagct gcgggagctg 3120 ttccagctgg agtccggggc ggtggccgaa tga 3153 <210> 78 <211> 1050 <212> PRT <213> Salinispora tropica <400> 78 Val Leu Val Val His Gly Ser Trp Arg Leu Gly Ile Gly Leu Ala Ile 1 5 10 15 Trp Ala Glu Asp Ser Ala Ser Pro Pro Arg Ala Pro Arg Arg Ala Gly 20 25 30 Arg Ala Pro Arg Glu Arg Pro His Pro Phe Ala Ala Gly His Pro Val 35 40 45 Leu Ala Ala Ala Leu Ala Glu Val Ala Glu Pro Thr Glu Pro Gly Thr 50 55 60 Ala Leu Leu Thr Leu Pro Thr Arg Ala Gly Ser Pro Leu Asp Ser Pro 65 70 75 80 Glu Leu Val Arg Thr Ala Ser Val Glu Pro Leu Arg Gly Pro Val Thr 85 90 95 Leu Ala Gly Trp Arg Val Pro Ala Leu Val Tyr Ala Pro Asp Ala Ala 100 105 110 Leu Ser Leu Leu Ser Gln Ile Thr Ala Ala Gly Ala Leu Pro Asp Ala 115 120 125 Val Pro Gly Ala Thr Leu Arg His Leu Ala Glu Leu Ala Ala Phe Ala 130 135 140 Val Asp Leu Ala Ala Arg Gly Arg Val Leu Pro Gly Val Arg Pro Pro 145 150 155 160 Lys Glu Arg Ala Ser Ala Ala Trp Ala Val Trp Gln Pro Leu Leu Thr 165 170 175 Gly Val Asp Ala Gly Trp Ala Arg Ala Leu Ala Leu Ala Leu Pro Pro 180 185 190 Ala Val Arg Ala Ala Val Glu Ile Asp Pro Ala Pro Leu Ala Val Pro 195 200 205 Gly Gly Pro Glu Thr Pro Ala Asn Gly Gly Val Pro Pro Gln Ala Arg 210 215 220 Thr Arg Arg Pro Thr Ala Ala Ala Gly Glu Pro Gly Glu Leu Val Val 225 230 235 240 Glu Ala Leu Asp Ala Leu Thr Asp Ala Ala Val Arg Ala Ala Leu Ala 245 250 255 Glu Thr Ser Leu Thr Arg Gly Ala Arg Pro Arg Gly Ala Val Ala Ala 260 265 270 Trp Leu Ala Ala Leu Thr Gly Pro Arg Arg Asp Phe Thr Ala Asp Ser 275 280 285 Ala Glu Leu Asp Thr Leu Arg Gly Glu Leu Asp Ala Trp Gln Arg Asp 290 295 300 Ala Val Gly Gly Ser Val Arg Ala Ser Phe Arg Leu Val Glu Pro Pro 305 310 315 320 Thr Asp Gly Leu Phe Glu Ala Ala Ala Gly Gly Leu Ala Ala Ala Glu 325 330 335 Gly Ser Trp Arg Val Glu Phe Gly Leu Gln Pro Ala Asp Gln Pro Gly 340 345 350 Leu His Val Asp Ala Val Arg Ile Trp His Glu Ser Ala Ala Leu Pro 355 360 365 Gly Pro Ala Ala Pro Gln Glu Ala Leu Leu Thr Glu Leu Gly Arg Ala 370 375 380 Ser Arg Leu Trp Pro Glu Leu Asn Ser Ala Leu Arg Thr Ala Thr Pro 385 390 395 400 Glu Ala Leu Glu Leu Asp Ala Ala Gly Ala His Arg Phe Leu Arg Asp 405 410 415 Gly Ala Pro Val Leu His Ala Ala Gly Phe Ala Val Leu Leu Pro Ser 420 425 430 Trp Trp Gln Arg Pro Ser Ser Arg Leu Gly Ala Arg Leu Gln Ala Gln 435 440 445 Ser Arg Thr Ala Pro Gly Thr Val Ala Gly Ala Gly Asp Gly Val Gly 450 455 460 Leu Asp Ala Leu Val Asp Tyr Arg Trp Glu Val Ser Leu Gly Asp Gln 465 470 475 480 Pro Leu Thr Ala Glu Glu Leu Glu Ser Leu Ala Ala Leu Lys Ser Pro 485 490 495 Leu Val Arg Leu Arg Gly Arg Trp Val Glu Leu Asp Pro Lys Arg Leu 500 505 510 Ala Ala Gly Leu Arg Leu Leu Arg Ser Ala Gly Glu Leu Thr Val Gly 515 520 525 Asp Leu Leu Arg Leu Gly Leu Ser Asp Pro Ala Thr Asp Ala Leu Pro 530 535 540 Val Leu Glu Val Ala Ala Asp Gly Ala Leu Gly Asp Leu Leu Ala Gly 545 550 555 560 Ala Val Glu Arg Gln Leu Thr Pro Val Asp Ala Val Pro Ser Phe Gln 565 570 575 Gly Val Leu Arg Pro Tyr Gln Arg Arg Gly Leu Ala Trp Leu Ser Phe 580 585 590 Leu Gln Ser Leu Gly Leu Gly Gly Val Leu Ala Asp Asp Met Gly Leu 595 600 605 Gly Lys Thr Val Gln Leu Leu Ala Leu Leu Ala Gly Asp Pro Pro Gly 610 615 620 Val Gly Pro Thr Leu Leu Val Cys Pro Met Ser Leu Val Gly Asn Trp 625 630 635 640 Gln Arg Glu Ala Ala Thr Phe Thr Pro Gly Val Arg Val His Val His 645 650 655 His Gly Ala Glu Arg Ala Arg Gly Ala Ala Phe Thr Ala Ala Val Glu 660 665 670 Ala Ala Asp Leu Val Leu Thr Thr Tyr Thr Val Ala Ala Arg Asp Ala 675 680 685 Gly Glu Leu Ala Gly Val Asp Trp His Arg Val Val Val Asp Glu Ala 690 695 700 Gln Ala Ile Lys Asn Ala Ser Thr Arg Gln Ala Glu Ala Val Arg Ala 705 710 715 720 Leu Pro Ala Arg His Arg Ile Ala Val Thr Gly Thr Pro Val Glu Asn 725 730 735 Arg Leu Ala Asp Leu Trp Ser Ile Met Gln Phe Ala Asn Pro Gly Leu 740 745 750 Leu Gly Pro Ala Ala Glu Phe Lys Lys Arg Tyr Ala Glu Pro Ile Glu 755 760 765 Arg His Gly Asp Ala Glu Ala Ala Glu Arg Leu Arg Arg Ile Thr Gly 770 775 780 Pro Phe Val Leu Arg Arg Leu Lys Thr Asp Ser Ser Val Ile Ser Asp 785 790 795 800 Leu Pro Glu Lys Leu Glu Met Glu Val Val Cys Asn Leu Thr Ala Glu 805 810 815 Gln Ala Ala Leu Tyr Arg Ala Val Val Asp Asp Met Met Ala Gln Ile 820 825 830 Glu Ser Ser Glu Gly Ile Glu Arg Arg Gly Leu Val Leu Ala Ala Met 835 840 845 Thr Arg Leu Lys Gln Val Cys Asn His Pro Ala His Leu Leu Arg Asp 850 855 860 Asn Ser Ala Leu Val Gly Arg Ser Gly Lys Leu Ala Arg Leu Glu Glu 865 870 875 880 Ile Leu Asp Glu Val Leu Val Ala Gly Glu Lys Ala Leu Leu Phe Thr 885 890 895 Gln Tyr Ala Glu Phe Gly Gly Met Leu Arg Gly His Leu Ser Ala Arg 900 905 910 Phe Gly Gln Glu Thr Leu Phe Leu His Gly Gly Val Gly Lys Ala Asp 915 920 925 Arg Asp Ala Met Val Thr Arg Phe Gln Ser Pro Asp Gly Pro Ala Leu 930 935 940 Phe Val Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu Thr Leu Thr Ala 945 950 955 960 Ala Asn His Val Val His Val Asp Arg Trp Trp Asn Pro Ala Val Glu 965 970 975 Asp Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg Arg Val 980 985 990 Gln Val Arg Lys Phe Val Cys Ala Gly Thr Val Glu Glu Lys Val Ala 995 1000 1005 Ala Leu Ile Ala Asp Lys Arg Arg Leu Ala Ser Thr Val Val Gly 1010 1015 1020 Ala Gly Glu Gln Trp Val Thr Glu Leu Ser Thr Ala Gln Leu Arg 1025 1030 1035 Glu Leu Phe Gln Leu Glu Ser Gly Ala Val Ala Glu 1040 1045 1050 <210> 79 <211> 2970 <212> DNA <213> Symbiobacterium thermophilum <400> 79 atgatcacgg ttcacggcag tttcgtcccc tccggcgcgt ccggcttctt cttcctgtgg 60 ggcctggacg gcgtggccgc ccgggatgcc gctcctcccg gccggcgccg ccgcggggtt 120 ccgcgccacc catgcgcaac cgagccggaa gcgctctacc ccgccctgag aggattgccc 180 tacctgaaca ccctgtccct ggtccagtgg cagcccggac cggacggcgt cagcccggcc 240 cgggtcccgg ggatcgccct gtccgtgccc aacgccgtgc agtggctgtt ggatctgccc 300 gaccacttcc gcggcacgcc cctccggccg gggcacagcc tgcagctctg gtgcgtcgca 360 tccaagctgc ttctggagtt cctggggcgg ggcctgatgc tgccggtgct gcaggccgag 420 gccggggtgc tgagcgcggg ctgggcgctc cacctgaccg acgccgacga cgtccgccgc 480 ctgacccggc tggccgctgg attgccggag gcctgccgcg cccttgtgcc ccccgaccga 540 acccccaaca cctaccccct gccggtcgcc gacggcctgg tccaccagtt catgcgtacg 600 gcggccgccg gcgtgatccg gctcctcctg gaggaagagc ccctgcccga ggcccagtcg 660 ctacaggata ccgccctgcg ccactggctg gcggcgctga ccggggcgga ggcccgggac 720 ctgccgccgg gcctgcccgg cgcgcaggag ctgtacgccg ccctggaccg ctggagcgcc 780 cccgccaccg gcgtgctgag ccacgccagt ctgcggacgg gggtccgcct ccacctgccc 840 ggccccgaga ccgacggcga gtgggagctg gagctcacgc tccatgcgcc ggacgagggt 900 gcgctgcccg tcaccgccga tgcggtctgg gccagcctgg gcgccgaggt ggagatcggc 960 gggcagcggt accagggcgc cgagcagcgg ctgctggccg acctgccggc catggcccgc 1020 ctcttcccgc cactggcgcc gctgctccgg gaccccgcgc ccagccgcat gcgcattccg 1080 gcggacgacg tgctggccct gatccaggaa ggggccatgc tgctccagca ggccggccac 1140 cccgtgctgc tgccggccgc ccttgcgaag cccgccgccc tccgggtcgg aatgcgcctc 1200 agccccgccg ggggcagccc ctccatgttc gggctgcacc agatcgtgaa cgtgcgctgg 1260 gacgtggccc tgggcggcac cccgctcacg ctggacgagc tgcgccacct ggcgcggcag 1320 aagcggcccc tggtacagat gcagggccgg tgggtgcggg tggacgaacg caccctggct 1380 gcggtcctcc gccggatcga gcagcacggc gggcagatgg agctgggcac ggcgctgcgc 1440 ctggcacccg aggcggacga ggccaccgcg accggctgga tcgccgagct gctggagcgg 1500 ctgcaggagc cagcccggat ggagccggtg ccgacccccg ggggcttcgc cggcaccctg 1560 cggccgtacc agcagcgggg cctcgcctgg ctggcgttcc tgcgccgctg gggcctgggc 1620 gcgtgcctcg ccgacgacat ggggctgggc aagaccgtgc agctcatcgc ccttctcctg 1680 cacgagcggg aggccgggtg ggccgcgggc ccgaccctgc tggtctgccc cgtctcggtc 1740 ctgggcaact ggtgccggga gctggcccgc ttcgccccgg gcctgcgggt cctggtgcac 1800 catggccccg ggaggctggg cgagccggac ttcgcccggc aggccggggc ccacgacgtg 1860 gtgctgacca cgtactccct gctggcccgg gatgccgcgc tgctgggcca ggtgacctgg 1920 aacgggatcg tcgccgacga ggcgcagaac ctgaaaaacc ccgacacaca gcacgcccgg 1980 gcgctgcgaa gcctttccgg cggctaccgc atcgccctca ccggtacgcc cgtcgaaaac 2040 cacctgggcg acctgtggtc gctcttccag ttcctcaacc cggggctgct gggcagccgc 2100 gaggagttcg agcggcgcta cgccgtgccg atccagcggt accaggacga ggaggctgcg 2160 gcccggctcc gccggcaggt gggtcccttc atcctgcgcc ggcagaagaa cgaccccgcc 2220 atcgcgccgg acctgcccga caagctggag aacaccgagc tggtgaccct ctcggtggaa 2280 caggcggcgc tgtacgaggc catcgtgcag gagacgctgg agcgggccgc gcaggccgac 2340 ggcatccagc ggcaggcggc ggtcctggca ggcctcacgc ggctgaagca ggtgtgcaac 2400 catcccgcag ccgccaccgg cgacggcccc ctggtggggc ggagcggcaa gatcgaccgg 2460 ctggtgcaac tgctgcagga ggtgctggcg gcgggcgagc aggccctgct cttcacccag 2520 ttcgcccgct tcggcgggcg gctgcaggcc tacctggcgg agacgctggg ctgcgaggtg 2580 ctcttcctgc acggcggcac gccccagccc gagcgggacc ggctcgtcgc ccggttccag 2640 gccggcgagg cgcccctctt catcctctcg ctgaaagccg gcggccttgg cctcaacctc 2700 accgccgcga cccacgtctt tcacgtggac cggtggtgga atccggcggt ggaggatcag 2760 gccacagacc gggcctaccg catcggccag acgcgcaggg tgctggtgca ccggctgatc 2820 accgccggca cgctggagga gcgcatcgac cggctgctgg ccgagaagcg tgccctggcg 2880 ggccaggtga tcatcagcgg cgagtcgtgg ctcggccagc tctccaccga ggagctgcgg 2940 gccctgatcg ccctggaccg ggaggtgtag 2970 <210> 80 <211> 989 <212> PRT <213> Symbiobacterium thermophilum <400> 80 Met Ile Thr Val His Gly Ser Phe Val Pro Ser Gly Ala Ser Gly Phe 1 5 10 15 Phe Phe Leu Trp Gly Leu Asp Gly Val Ala Ala Arg Asp Ala Ala Pro 20 25 30 Pro Gly Arg Arg Arg Arg Gly Val Pro Arg His Pro Cys Ala Thr Glu 35 40 45 Pro Glu Ala Leu Tyr Pro Ala Leu Arg Gly Leu Pro Tyr Leu Asn Thr 50 55 60 Leu Ser Leu Val Gln Trp Gln Pro Gly Pro Asp Gly Val Ser Pro Ala 65 70 75 80 Arg Val Pro Gly Ile Ala Leu Ser Val Pro Asn Ala Val Gln Trp Leu 85 90 95 Leu Asp Leu Pro Asp His Phe Arg Gly Thr Pro Leu Arg Pro Gly His 100 105 110 Ser Leu Gln Leu Trp Cys Val Ala Ser Lys Leu Leu Leu Glu Phe Leu 115 120 125 Gly Arg Gly Leu Met Leu Pro Val Leu Gln Ala Glu Ala Gly Val Leu 130 135 140 Ser Ala Gly Trp Ala Leu His Leu Thr Asp Ala Asp Asp Val Arg Arg 145 150 155 160 Leu Thr Arg Leu Ala Ala Gly Leu Pro Glu Ala Cys Arg Ala Leu Val 165 170 175 Pro Pro Asp Arg Thr Pro Asn Thr Tyr Pro Leu Pro Val Ala Asp Gly 180 185 190 Leu Val His Gln Phe Met Arg Thr Ala Ala Ala Gly Val Ile Arg Leu 195 200 205 Leu Leu Glu Glu Glu Pro Leu Pro Glu Ala Gln Ser Leu Gln Asp Thr 210 215 220 Ala Leu Arg His Trp Leu Ala Ala Leu Thr Gly Ala Glu Ala Arg Asp 225 230 235 240 Leu Pro Pro Gly Leu Pro Gly Ala Gln Glu Leu Tyr Ala Ala Leu Asp 245 250 255 Arg Trp Ser Ala Pro Ala Thr Gly Val Leu Ser His Ala Ser Leu Arg 260 265 270 Thr Gly Val Arg Leu His Leu Pro Gly Pro Glu Thr Asp Gly Glu Trp 275 280 285 Glu Leu Glu Leu Thr Leu His Ala Pro Asp Glu Gly Ala Leu Pro Val 290 295 300 Thr Ala Asp Ala Val Trp Ala Ser Leu Gly Ala Glu Val Glu Ile Gly 305 310 315 320 Gly Gln Arg Tyr Gln Gly Ala Glu Gln Arg Leu Leu Ala Asp Leu Pro 325 330 335 Ala Met Ala Arg Leu Phe Pro Pro Leu Ala Pro Leu Leu Arg Asp Pro 340 345 350 Ala Pro Ser Arg Met Arg Ile Pro Ala Asp Asp Val Leu Ala Leu Ile 355 360 365 Gln Glu Gly Ala Met Leu Leu Gln Gln Ala Gly His Pro Val Leu Leu 370 375 380 Pro Ala Ala Leu Ala Lys Pro Ala Ala Leu Arg Val Gly Met Arg Leu 385 390 395 400 Ser Pro Ala Gly Gly Ser Pro Ser Met Phe Gly Leu His Gln Ile Val 405 410 415 Asn Val Arg Trp Asp Val Ala Leu Gly Gly Thr Pro Leu Thr Leu Asp 420 425 430 Glu Leu Arg His Leu Ala Arg Gln Lys Arg Pro Leu Val Gln Met Gln 435 440 445 Gly Arg Trp Val Arg Val Asp Glu Arg Thr Leu Ala Ala Val Leu Arg 450 455 460 Arg Ile Glu Gln His Gly Gly Gln Met Glu Leu Gly Thr Ala Leu Arg 465 470 475 480 Leu Ala Pro Glu Ala Asp Glu Ala Thr Ala Thr Gly Trp Ile Ala Glu 485 490 495 Leu Leu Glu Arg Leu Gln Glu Pro Ala Arg Met Glu Pro Val Pro Thr 500 505 510 Pro Gly Gly Phe Ala Gly Thr Leu Arg Pro Tyr Gln Gln Arg Gly Leu 515 520 525 Ala Trp Leu Ala Phe Leu Arg Arg Trp Gly Leu Gly Ala Cys Leu Ala 530 535 540 Asp Asp Met Gly Leu Gly Lys Thr Val Gln Leu Ile Ala Leu Leu Leu 545 550 555 560 His Glu Arg Glu Ala Gly Trp Ala Ala Gly Pro Thr Leu Leu Val Cys 565 570 575 Pro Val Ser Val Leu Gly Asn Trp Cys Arg Glu Leu Ala Arg Phe Ala 580 585 590 Pro Gly Leu Arg Val Leu Val His His Gly Pro Gly Arg Leu Gly Glu 595 600 605 Pro Asp Phe Ala Arg Gln Ala Gly Ala His Asp Val Val Leu Thr Thr 610 615 620 Tyr Ser Leu Leu Ala Arg Asp Ala Ala Leu Leu Gly Gln Val Thr Trp 625 630 635 640 Asn Gly Ile Val Ala Asp Glu Ala Gln Asn Leu Lys Asn Pro Asp Thr 645 650 655 Gln His Ala Arg Ala Leu Arg Ser Leu Ser Gly Gly Tyr Arg Ile Ala 660 665 670 Leu Thr Gly Thr Pro Val Glu Asn His Leu Gly Asp Leu Trp Ser Leu 675 680 685 Phe Gln Phe Leu Asn Pro Gly Leu Leu Gly Ser Arg Glu Glu Phe Glu 690 695 700 Arg Arg Tyr Ala Val Pro Ile Gln Arg Tyr Gln Asp Glu Glu Ala Ala 705 710 715 720 Ala Arg Leu Arg Arg Gln Val Gly Pro Phe Ile Leu Arg Arg Gln Lys 725 730 735 Asn Asp Pro Ala Ile Ala Pro Asp Leu Pro Asp Lys Leu Glu Asn Thr 740 745 750 Glu Leu Val Thr Leu Ser Val Glu Gln Ala Ala Leu Tyr Glu Ala Ile 755 760 765 Val Gln Glu Thr Leu Glu Arg Ala Ala Gln Ala Asp Gly Ile Gln Arg 770 775 780 Gln Ala Ala Val Leu Ala Gly Leu Thr Arg Leu Lys Gln Val Cys Asn 785 790 795 800 His Pro Ala Ala Ala Thr Gly Asp Gly Pro Leu Val Gly Arg Ser Gly 805 810 815 Lys Ile Asp Arg Leu Val Gln Leu Leu Gln Glu Val Leu Ala Ala Gly 820 825 830 Glu Gln Ala Leu Leu Phe Thr Gln Phe Ala Arg Phe Gly Gly Arg Leu 835 840 845 Gln Ala Tyr Leu Ala Glu Thr Leu Gly Cys Glu Val Leu Phe Leu His 850 855 860 Gly Gly Thr Pro Gln Pro Glu Arg Asp Arg Leu Val Ala Arg Phe Gln 865 870 875 880 Ala Gly Glu Ala Pro Leu Phe Ile Leu Ser Leu Lys Ala Gly Gly Leu 885 890 895 Gly Leu Asn Leu Thr Ala Ala Thr His Val Phe His Val Asp Arg Trp 900 905 910 Trp Asn Pro Ala Val Glu Asp Gln Ala Thr Asp Arg Ala Tyr Arg Ile 915 920 925 Gly Gln Thr Arg Arg Val Leu Val His Arg Leu Ile Thr Ala Gly Thr 930 935 940 Leu Glu Glu Arg Ile Asp Arg Leu Leu Ala Glu Lys Arg Ala Leu Ala 945 950 955 960 Gly Gln Val Ile Ile Ser Gly Glu Ser Trp Leu Gly Gln Leu Ser Thr 965 970 975 Glu Glu Leu Arg Ala Leu Ile Ala Leu Asp Arg Glu Val 980 985 <210> 81 <211> 3114 <212> DNA <213> Synechococcus sp. <400> 81 atgagcctgc tgcacgccac ctggctgtcg gccgacaccg ccgccgtgcc cgccctggga 60 ggcggctacc ggccgggctt gctgctctgg gccgacacct ggcgggtggc ggaaccccag 120 acaccggcca gcgaggcgcc ccagcacccc ctcagcctcg accaggacga cctcggcgcc 180 tggcttgagg aggccgacct ctggacggag gatttccgcc cggccggagc caccctctgc 240 ctgcccagcc gccgccaggg ggccaggggg aaaaagaaaa gcgacaccag cagctggagc 300 ggcctgcccc tgcaggcggg cgagccgatc ccgaaatccg tggagtggtg gccctggcgg 360 gtggagggct ggtggctgga gcccggcgcc gccaccctct ggcttgggcg cctgcccctc 420 tcaggcgacc atcccgacct ggccgatgac ctgcgctggt ggagccatct gcagcgctgg 480 tcgctgagcc tgctggcccg gggccggctg ctgccccagg tggagggggg ccgcgcccgc 540 tggctgccgt tgatcaaccg cgaagacgac cggcgccgcc tggaggatct ggcctcgcgt 600 ctgccccagg tggcggtggc ggccctggag cccggccagg gggaggccgg cgtcgcgatg 660 gcgtgctggc ggccgggatc cgggcgtcgg cggctggcct cgatcctcac gcacctggtg 720 gatgcacgca tgcgtgcggg cttcaccccc agcgaagagg ggctggatcc gctgctggcg 780 gcctggcagc gggccctcgg ccccggtgac ggccgcctcg atctcgggga cgacgactgc 840 gaacgcctgc aggtggccac tcaccactgg cgcgaagcgg tggctggccg ggtcgagccg 900 gcccgggcct gtcttgagct cgacacaccc gatgaggggg aagatctctg gcccctgcgc 960 ttcagcctcc aggccgaggc cgatcccagt ctgctgctgc ccgcagccgg ggtctgggcc 1020 gccggggccg gctgcctgca gctgggtgaa accgaactcc agcaacccgg tgaactgctg 1080 ctggaaggcc tcgggagagc cctgcaggtg ttcgagccga tcgagagggg tctcgacacc 1140 gccacaccgg agcggatggc tctcaccccg gccgaagcct tcgtgctggt gcgcaccgcc 1200 gcgctgaagc tgcgtgatgt gggcgtcggc gtggtcctgc cccccagcct cagcggtggc 1260 ctggccagcc ggctcggcct ctcgatcgag gccgatctgc ccgagcgctc ccgcggcttc 1320 agcctcggtg aaagcctgca gtggagctgg gagctgatga tcggcggcgt cacgctcacc 1380 ctgcgggacc tggagcggct ggcgggcaag cgcagcccgc tggtgcagca caagggggcc 1440 tggatcgagc tgcgtccggg tgatctgcgc aatgccgaga agttctgcgc cctcgatccg 1500 gtcctcagcc tcgatgacgc cctgcgcctg accggcaacg agggggagac cctgcagcgg 1560 ctgccggtgc accgcttcac agccggcccg aggctgaagg cggtgctgga gcagtaccac 1620 cagcagaagg cccccgatcc cctgccggcc cccgagggct tcgccggcca gctgcggccc 1680 taccaggagc gcggcctggg ctggctggcc ttcctgcacc gcttcgatca gggggcctgc 1740 ctggccgacg acatgggcct gggcaagaca atccagctgc tggccttcct gcagcacctc 1800 aaggcggagc aggaactgaa gcgtcccgta ctgctggtgg cccccacctc ggtgctcacc 1860 aactggctgc gggaagcgaa ggccttcacg ccggaactga acgtggtgga gcactacggc 1920 ccccggcggc cctccacccc cgccgccctg aagaagaagc tggaggggat ggatctggtg 1980 ctcaccagct acggcctgct gcagcgcgac agcgagttac tgagcagcct cgactggcag 2040 ggggtggtga ttgatgaggc ccaggcgatc aagaattcct cagcgcgcca gtcgcaggca 2100 gcccgcgatc tggcacgccc gctcaagcag agccgcttcc gtatcgcact caccggcacc 2160 ccggtggaga accgggtcag tgagctctgg gccctgatgg acttcctcaa tccgaaggtg 2220 cttggggagg aggagttctt ccgccagcgc taccgcctgc cgatcgagcg ctatggcgac 2280 atggcctcgg tgcgcgacct caaggcccgc gtcggcccgt tcatcctgcg gcgcctcaag 2340 actgaccgct cgatcatctc cgacctgccc gagaaggtgg aactgaagga gtgggttgga 2400 ctctcacccg agcaggtcaa gctctaccgc cgcaccgtgg aggacaccct cgatgcgatc 2460 gcgcgggcac ccgtgggcca gaagcacggc caggtgctgg ggctgctcac caagctcaag 2520 caggtctgca accacccggc cctgatgctc aaggaagggg aggtgggggc cggcttcagc 2580 gcccgctcgg ccaagttgca gcggctcgag gaaatcgtcg aggaggtgat cgcggccggc 2640 gatcgggccc tcctgtttac ccagttcgcc gaatggggcc acctgctcca gacccacctg 2700 cagcagcgct tccaccagga ggtgcccttt ctctatggca gtaccagcaa gggggagcgt 2760 caggcgatgg tggatcgctt ccaggacgac ccccggggac cacagctgtt cctgctctcg 2820 ctcaaggcag gcggcgtggg gctcaacctc acccgggcca gtcatgtgtt ccacatcgac 2880 cgctggtgga atccggcggt ggagaaccag gccaccgacc gggcctaccg catcggccag 2940 accaaccggg tgatggtgca caagttcatc accagcggct cggtggagga gaagatcgac 3000 cgcatgatcc gcgaaaaggc ccgcctggcc gaagacatcg tcggcagcgg tgaggagtgg 3060 ctcggaggcc tcgatcccgg ccagctgcgc gacctggtgg ccctggagga gtga 3114 <210> 82 <211> 1037 <212> PRT <213> Synechococcus sp. <400> 82 Met Ser Leu Leu His Ala Thr Trp Leu Ser Ala Asp Thr Ala Ala Val 1 5 10 15 Pro Ala Leu Gly Gly Gly Tyr Arg Pro Gly Leu Leu Leu Trp Ala Asp 20 25 30 Thr Trp Arg Val Ala Glu Pro Gln Thr Pro Ala Ser Glu Ala Pro Gln 35 40 45 His Pro Leu Ser Leu Asp Gln Asp Asp Leu Gly Ala Trp Leu Glu Glu 50 55 60 Ala Asp Leu Trp Thr Glu Asp Phe Arg Pro Ala Gly Ala Thr Leu Cys 65 70 75 80 Leu Pro Ser Arg Arg Gln Gly Ala Arg Gly Lys Lys Lys Ser Asp Thr 85 90 95 Ser Ser Trp Ser Gly Leu Pro Leu Gln Ala Gly Glu Pro Ile Pro Lys 100 105 110 Ser Val Glu Trp Trp Pro Trp Arg Val Glu Gly Trp Trp Leu Glu Pro 115 120 125 Gly Ala Ala Thr Leu Trp Leu Gly Arg Leu Pro Leu Ser Gly Asp His 130 135 140 Pro Asp Leu Ala Asp Asp Leu Arg Trp Trp Ser His Leu Gln Arg Trp 145 150 155 160 Ser Leu Ser Leu Leu Ala Arg Gly Arg Leu Leu Pro Gln Val Glu Gly 165 170 175 Gly Arg Ala Arg Trp Leu Pro Leu Ile Asn Arg Glu Asp Asp Arg Arg 180 185 190 Arg Leu Glu Asp Leu Ala Ser Arg Leu Pro Gln Val Ala Val Ala Ala 195 200 205 Leu Glu Pro Gly Gln Gly Glu Ala Gly Val Ala Met Ala Cys Trp Arg 210 215 220 Pro Gly Ser Gly Arg Arg Arg Leu Ala Ser Ile Leu Thr His Leu Val 225 230 235 240 Asp Ala Arg Met Arg Ala Gly Phe Thr Pro Ser Glu Glu Gly Leu Asp 245 250 255 Pro Leu Leu Ala Ala Trp Gln Arg Ala Leu Gly Pro Gly Asp Gly Arg 260 265 270 Leu Asp Leu Gly Asp Asp Asp Cys Glu Arg Leu Gln Val Ala Thr His 275 280 285 His Trp Arg Glu Ala Val Ala Gly Arg Val Glu Pro Ala Arg Ala Cys 290 295 300 Leu Glu Leu Asp Thr Pro Asp Glu Gly Glu Asp Leu Trp Pro Leu Arg 305 310 315 320 Phe Ser Leu Gln Ala Glu Ala Asp Pro Ser Leu Leu Leu Pro Ala Ala 325 330 335 Gly Val Trp Ala Ala Gly Ala Gly Cys Leu Gln Leu Gly Glu Thr Glu 340 345 350 Leu Gln Gln Pro Gly Glu Leu Leu Leu Glu Gly Leu Gly Arg Ala Leu 355 360 365 Gln Val Phe Glu Pro Ile Glu Arg Gly Leu Asp Thr Ala Thr Pro Glu 370 375 380 Arg Met Ala Leu Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala 385 390 395 400 Ala Leu Lys Leu Arg Asp Val Gly Val Gly Val Val Leu Pro Pro Ser 405 410 415 Leu Ser Gly Gly Leu Ala Ser Arg Leu Gly Leu Ser Ile Glu Ala Asp 420 425 430 Leu Pro Glu Arg Ser Arg Gly Phe Ser Leu Gly Glu Ser Leu Gln Trp 435 440 445 Ser Trp Glu Leu Met Ile Gly Gly Val Thr Leu Thr Leu Arg Asp Leu 450 455 460 Glu Arg Leu Ala Gly Lys Arg Ser Pro Leu Val Gln His Lys Gly Ala 465 470 475 480 Trp Ile Glu Leu Arg Pro Gly Asp Leu Arg Asn Ala Glu Lys Phe Cys 485 490 495 Ala Leu Asp Pro Val Leu Ser Leu Asp Asp Ala Leu Arg Leu Thr Gly 500 505 510 Asn Glu Gly Glu Thr Leu Gln Arg Leu Pro Val His Arg Phe Thr Ala 515 520 525 Gly Pro Arg Leu Lys Ala Val Leu Glu Gln Tyr His Gln Gln Lys Ala 530 535 540 Pro Asp Pro Leu Pro Ala Pro Glu Gly Phe Ala Gly Gln Leu Arg Pro 545 550 555 560 Tyr Gln Glu Arg Gly Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp 565 570 575 Gln Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln 580 585 590 Leu Leu Ala Phe Leu Gln His Leu Lys Ala Glu Gln Glu Leu Lys Arg 595 600 605 Pro Val Leu Leu Val Ala Pro Thr Ser Val Leu Thr Asn Trp Leu Arg 610 615 620 Glu Ala Lys Ala Phe Thr Pro Glu Leu Asn Val Val Glu His Tyr Gly 625 630 635 640 Pro Arg Arg Pro Ser Thr Pro Ala Ala Leu Lys Lys Lys Leu Glu Gly 645 650 655 Met Asp Leu Val Leu Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu 660 665 670 Leu Leu Ser Ser Leu Asp Trp Gln Gly Val Val Ile Asp Glu Ala Gln 675 680 685 Ala Ile Lys Asn Ser Ser Ala Arg Gln Ser Gln Ala Ala Arg Asp Leu 690 695 700 Ala Arg Pro Leu Lys Gln Ser Arg Phe Arg Ile Ala Leu Thr Gly Thr 705 710 715 720 Pro Val Glu Asn Arg Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu 725 730 735 Asn Pro Lys Val Leu Gly Glu Glu Glu Phe Phe Arg Gln Arg Tyr Arg 740 745 750 Leu Pro Ile Glu Arg Tyr Gly Asp Met Ala Ser Val Arg Asp Leu Lys 755 760 765 Ala Arg Val Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Arg Ser 770 775 780 Ile Ile Ser Asp Leu Pro Glu Lys Val Glu Leu Lys Glu Trp Val Gly 785 790 795 800 Leu Ser Pro Glu Gln Val Lys Leu Tyr Arg Arg Thr Val Glu Asp Thr 805 810 815 Leu Asp Ala Ile Ala Arg Ala Pro Val Gly Gln Lys His Gly Gln Val 820 825 830 Leu Gly Leu Leu Thr Lys Leu Lys Gln Val Cys Asn His Pro Ala Leu 835 840 845 Met Leu Lys Glu Gly Glu Val Gly Ala Gly Phe Ser Ala Arg Ser Ala 850 855 860 Lys Leu Gln Arg Leu Glu Glu Ile Val Glu Glu Val Ile Ala Ala Gly 865 870 875 880 Asp Arg Ala Leu Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu 885 890 895 Gln Thr His Leu Gln Gln Arg Phe His Gln Glu Val Pro Phe Leu Tyr 900 905 910 Gly Ser Thr Ser Lys Gly Glu Arg Gln Ala Met Val Asp Arg Phe Gln 915 920 925 Asp Asp Pro Arg Gly Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly 930 935 940 Gly Val Gly Leu Asn Leu Thr Arg Ala Ser His Val Phe His Ile Asp 945 950 955 960 Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr 965 970 975 Arg Ile Gly Gln Thr Asn Arg Val Met Val His Lys Phe Ile Thr Ser 980 985 990 Gly Ser Val Glu Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ala Arg 995 1000 1005 Leu Ala Glu Asp Ile Val Gly Ser Gly Glu Glu Trp Leu Gly Gly 1010 1015 1020 Leu Asp Pro Gly Gln Leu Arg Asp Leu Val Ala Leu Glu Glu 1025 1030 1035 <210> 83 <211> 3090 <212> DNA <213> Synechococcus sp. <400> 83 atgagcctgc tgcacgccac ctggcttccc gccattcgta cttccagcag ttccggacaa 60 ccggcactgc tcgtttgggc tgacacctgg cgtgtcgcct caccggaggg acctggactc 120 acacccgctc tgcatccctt cacccttggc tcgaacgatc tcaaggcttg gttgaccgaa 180 cgggacctga tgcctggggg cagcatcgat gccaccgcct gcctcaccct cccaagccgc 240 accgtcaaac cccgcaaaag tcgaacccaa tcgagcgaac cagatccgga ggggccagcc 300 tggaccgggt tgccaatgca agcgggagaa cccattccaa aacaaatgga atggtggcca 360 tggcaagtgc aaggcctggc ggtcgagcca tcggccgcca cggaatggct ggcccgttta 420 cccctatcgg gccgacatcc agaccttggg gatgaactgc gctggtggag tcacctccaa 480 cgttggtccc tcagcttggt ggcccgtggt cgctggattc cccaaatgga attaagcaaa 540 ggcgaggggt acccccaccg agcgcgctgg gttcccctgc tgaaccgtga ggaggatcga 600 cgccggctcg aagacctcgc cgcgacgctg cccctcgtag cgacctgtgc cctcccttgg 660 cgtgagccac tcggacgccg cagcaaccgc accaccaggc ttcgaccgga agcgatgcga 720 gccgccaatc cggtcgcctg ctgtcgccca cgaagcggtc gcctcagggt ggccaccttg 780 cttgaagact tggtggatgc ggagctgcgc aagggatttg aaccaagcac ggaaggcctc 840 gaccccttac tcaccttgtg gcaagaggcc ctggcctcag aaaccggtgt tgtggaggtg 900 ggcaacgaag acgcagaacg cctcaccgcg gcaagcctgc actggcgcga gggaattgcc 960 ggaggcttcg cggccgcccg cacctgcctc gaactcaaca ccccaaacga aggcgaagaa 1020 ctctgggacc tgaagtttgg attgcaagcg gaggccgatc ccagcctcaa gctgccggcc 1080 gccgcggcct gggcctcagg agcggaaacc cttcaactgg gggaaatcca agttgaccag 1140 gcgggggaag tgctgctgga gggtcttggc cgagccctca cggtgttccc tccgatcgaa 1200 cgcggactgg aaagcgcaac accggaaacg atgcagctca ctccagcgga ggcatttgtg 1260 ttggtgcgaa cagcaacgca ccagctccgc aatgccggca tcggcgtcga actgcccccc 1320 agtctttcag ggggcctcgc cagccggctt ggcttagcga ttaaagcgga tctaccggat 1380 cgatccagcg gcttcaccct cggcgaatct cttgactgga gctgggatct catgatcggc 1440 ggcgtcacac tcaccctccg agagctcgaa cgtctcagcg gtaagcgaag tccgctggta 1500 cgccacaagg gcgcctggat cgaactacgg cccaacgatc tccgcaacgc cgaacgcttt 1560 tgtggagcca atccagaact gagcctcgac gacgcactac ggctcacggc cacagaaggg 1620 gagctcatga tgcgcctgcc ggtgcatcgc tttgatgcag ggcctcgtct tcagggagtt 1680 ctcgagcaat accaccagca aaaagccccc gatcccctgc cagctccaga gggattttcc 1740 ggacaactcc gtccctatca agaacgtggc ttgggctggc tggccttcct gcatcgcttc 1800 gatcagggcg cctgcctggc ggacgacatg ggcttgggca agaccatcca gttattggcg 1860 ttcctgcagc acctcaaagc ggaaaacgaa ctcaaacgcc cggtgctgtt ggtggcccca 1920 acctcggtgc tcacgaattg gcgacgggaa gcggaagcct tcacccctga gctgtcggtg 1980 agagagcact acgggccacg ccggccttcc acgccggccg ccttgaaaaa agagctcaaa 2040 ggtgtggatc tggtgctcac cagttacgga ctgatgcaac gcgacagtga gctgctggac 2100 aacctcgact ggcaaggggt tgtgatcgat gaagctcagg cgatcaagaa ccctggggca 2160 aagcaaagcc aagcggcccg agacctagcg cgagccggga agagcagcag gttccgcatt 2220 gcactcacgg gcacaccggt ggaaaaccgc gtcagcgagc tgtgggcgct gatggatttc 2280 ctcaacccca aagtgttggg tgaggaagac ttttttcgtc agcgctaccg catgccaatt 2340 gagcgctacg gcgatatgtc gtcgttacgc gatctcaaag cacgggttgg tcccttcatc 2400 ctgcgccgcc tcaaaaccga caagtcgatc atttccgacc tgcctgaaaa ggtggagctc 2460 agcgaatggg tggggctcag caaagaacag aaatcgctgt acaacaaaac cgttgaagac 2520 accctcgatg ccattgccac cgcacctcga gggcaacgcc atggccaggt gctggcgctc 2580 ttgacccgtt taaaacagat ttgcaatcac ccggccttag cccaacgcga aggtgccgtt 2640 gacgccgaat tccttagccg gtccgccaag ctcatgcggc tggaagaaat ccttgaagag 2700 gtgattgaag ccggcgatcg cgctttgctg ttcacccagt tcgccgaatg gggacacctc 2760 ttgcaggcct ggatgcaaca acgctggaag tctgaggttc cctttctgca cggcggaacc 2820 cgcaaaagtg atcggcaagc gatggtggat cgattccaag aggacccccg gggacctcaa 2880 ctcttccttc tctccctcaa ggccggtggt gttggcctaa acctcacccg ggccagccac 2940 gtgttccacg ttggatcgct ggtggaatcc agcggtggaa aaccaagcca ccgaccgggc 3000 ctatcgaatt ggtcaaacca accgggtgat ggtgcacaaa ttcgtcaccc gtggctcggt 3060 ggaagaaaaa atcgaccaaa tgattcgtga 3090 <210> 84 <211> 1029 <212> PRT <213> Synechococcus sp. <400> 84 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Ser 1 5 10 15 Ser Ser Gly Gln Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Ser Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr 35 40 45 Leu Gly Ser Asn Asp Leu Lys Ala Trp Leu Thr Glu Arg Asp Leu Met 50 55 60 Pro Gly Gly Ser Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Thr Val Lys Pro Arg Lys Ser Arg Thr Gln Ser Ser Glu Pro Asp Pro 85 90 95 Glu Gly Pro Ala Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile 100 105 110 Pro Lys Gln Met Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val 115 120 125 Glu Pro Ser Ala Ala Thr Glu Trp Leu Ala Arg Leu Pro Leu Ser Gly 130 135 140 Arg His Pro Asp Leu Gly Asp Glu Leu Arg Trp Trp Ser His Leu Gln 145 150 155 160 Arg Trp Ser Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met 165 170 175 Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro 180 185 190 Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala 195 200 205 Thr Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Leu 210 215 220 Gly Arg Arg Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg 225 230 235 240 Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg 245 250 255 Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Glu Leu Arg Lys Gly 260 265 270 Phe Glu Pro Ser Thr Glu Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln 275 280 285 Glu Ala Leu Ala Ser Glu Thr Gly Val Val Glu Val Gly Asn Glu Asp 290 295 300 Ala Glu Arg Leu Thr Ala Ala Ser Leu His Trp Arg Glu Gly Ile Ala 305 310 315 320 Gly Gly Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu Asn Thr Pro Asn 325 330 335 Glu Gly Glu Glu Leu Trp Asp Leu Lys Phe Gly Leu Gln Ala Glu Ala 340 345 350 Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ser Gly Ala 355 360 365 Glu Thr Leu Gln Leu Gly Glu Ile Gln Val Asp Gln Ala Gly Glu Val 370 375 380 Leu Leu Glu Gly Leu Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu 385 390 395 400 Arg Gly Leu Glu Ser Ala Thr Pro Glu Thr Met Gln Leu Thr Pro Ala 405 410 415 Glu Ala Phe Val Leu Val Arg Thr Ala Thr His Gln Leu Arg Asn Ala 420 425 430 Gly Ile Gly Val Glu Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser 435 440 445 Arg Leu Gly Leu Ala Ile Lys Ala Asp Leu Pro Asp Arg Ser Ser Gly 450 455 460 Phe Thr Leu Gly Glu Ser Leu Asp Trp Ser Trp Asp Leu Met Ile Gly 465 470 475 480 Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg 485 490 495 Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn 500 505 510 Asp Leu Arg Asn Ala Glu Arg Phe Cys Gly Ala Asn Pro Glu Leu Ser 515 520 525 Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Glu Gly Glu Leu Met Met 530 535 540 Arg Leu Pro Val His Arg Phe Asp Ala Gly Pro Arg Leu Gln Gly Val 545 550 555 560 Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro 565 570 575 Glu Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly 580 585 590 Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp 595 600 605 Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His 610 615 620 Leu Lys Ala Glu Asn Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro 625 630 635 640 Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ala Phe Thr Pro 645 650 655 Glu Leu Ser Val Arg Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro 660 665 670 Ala Ala Leu Lys Lys Glu Leu Lys Gly Val Asp Leu Val Leu Thr Ser 675 680 685 Tyr Gly Leu Met Gln Arg Asp Ser Glu Leu Leu Asp Asn Leu Asp Trp 690 695 700 Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Gly Ala 705 710 715 720 Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Ala Gly Lys Ser Ser 725 730 735 Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser 740 745 750 Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Lys Val Leu Gly Glu 755 760 765 Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly 770 775 780 Asp Met Ser Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile 785 790 795 800 Leu Arg Arg Leu Lys Thr Asp Lys Ser Ile Ile Ser Asp Leu Pro Glu 805 810 815 Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser 820 825 830 Leu Tyr Asn Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Thr Ala 835 840 845 Pro Arg Gly Gln Arg His Gly Gln Val Leu Ala Leu Leu Thr Arg Leu 850 855 860 Lys Gln Ile Cys Asn His Pro Ala Leu Ala Gln Arg Glu Gly Ala Val 865 870 875 880 Asp Ala Glu Phe Leu Ser Arg Ser Ala Lys Leu Met Arg Leu Glu Glu 885 890 895 Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr 900 905 910 Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala Trp Met Gln Gln Arg 915 920 925 Trp Lys Ser Glu Val Pro Phe Leu His Gly Gly Thr Arg Lys Ser Asp 930 935 940 Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln 945 950 955 960 Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr 965 970 975 Arg Ala Ser His Val Phe His Val Gly Ser Leu Val Glu Ser Ser Gly 980 985 990 Gly Lys Pro Ser His Arg Pro Gly Leu Ser Asn Trp Ser Asn Gln Pro 995 1000 1005 Gly Asp Gly Ala Gln Ile Arg His Pro Trp Leu Gly Gly Arg Lys 1010 1015 1020 Asn Arg Pro Asn Asp Ser 1025 <210> 85 <211> 3195 <212> DNA <213> Synechococcus sp. <400> 85 atgagcctgc tgcacgccac ctggcttccg gccattcgta ctcctaccag ctctggacga 60 gctgcccttt tggtgtgggc cgacacctgg cgcgttgccg agcctgcagg cccaagtaca 120 acccctgcgc ttcacccgtt caccctcagc ccagacgatc tccgggcctt gctcacggaa 180 cgggatcttt tacccgacgg catcattgat gccacggcat gcctcaccct gccgagccgc 240 agcgtgaagc cccgaaaaaa acgcgaaaca gagaccagca gcactgaaca gcccagctgg 300 acaggccttc ccttacaggc tggagaaccg atccccaaac aaacagagtg gtggccttgg 360 caggttcagg ggctcgcaat tgaccccatg gcggccaccg cctggctgtc caaactgcct 420 ctgtcaggac gacatcctga tttggctgat gagttgcgct ggtggagtca catgcagcgt 480 tggtccctca gcctcgtagc ccgaagtcgc tggctccccc aagtggagct gagcaagggc 540 gagggctatc cccatcgcgc ccgctgggta ccgcttctga atcgggaaga agacaggcgc 600 cgtctagaag acttggccgc agggctccct ctcgttgcca cctgtgccct gccttggcga 660 gaaccaacgg gcaaacgcag caaccgaatc accaggctca gaccagaagc catgcgcgcc 720 gcgaatcccg tggcttgctg caggcctcgc agcggacgac taagggttgc cacgttattg 780 gccgacctga tggacgcgca gctgcgcaag ggctttactc ctgaccctga cggcttggac 840 cccctgctac gcgcctggga ggaggccttg agctcggata caggtgaaat ccaactcagc 900 gatgaagaaa ccgaacgcct agccaccgcc agtaatcatt ggcgtgaagg ggtcgctgga 960 aatgttgctg cagcccgcgc ctgcctggag ctggcaacac cagcggacga tgaggacctt 1020 tggccactgc gcttctttct gcaggcggaa gcagatccaa ccctcaagct gcccgcagga 1080 gcggcatggg ctgcaggccc cagcggcctc caacttgggg aaatcaaggt ggagcacccc 1140 agcgaggtct tgctcgaggg tatggggcga gccctgaccg tgttccaacc gatcgagcgc 1200 ggactggaca gtgccacgcc agagagcatg cagctcacac cagctgaagc gtttgttttg 1260 gtgcgcacag cagtccgaca actgcgggat gtgggcgttg gcgttgacct gccaccaagc 1320 ctgtctggag ggctggctag caggcttggc ctcgccatca aggcagaact ctccgagcgt 1380 tcgcgaggct tcacgctcgg tgaaaacctt gactggagct gggagctgat gatcggcggg 1440 gtgacgctga ccttgcgaga gcttgagcga ttggctggta agcgcagccc tctggtgcgt 1500 cacaaagggg cttggatcga actacggccc aatgacctca aaaatgccga gcgcttttgc 1560 gccgccaatc cagacctgag cctcgacgac gcgcttcggc tcaccgccac cgaaggcgac 1620 acgatgatgc gcctgcccgt gcatcaattt gatgccggtc cgcggctgca agccgtgctg 1680 gagcagtacc accagcagaa agcgccagac ccactccccg ctcccgaggg cttttcgggt 1740 caactcaggc cctatcaaga gagaggactc ggctggcttg ccttcctgca tcgcttcgac 1800 caaggcgcct gcttggccga tgacatgggc cttggcaaaa ccatccagct gctggctttt 1860 ctgcaacacc tcaaggcaga aaacgaactc aagcgatcag tgcttttaat tgcacccaca 1920 tctgtcctta cgaactggaa acgagaggca acagcgttta cacccgagct caaggtgcat 1980 gagcactacg gtccaaaacg cccgagcacc ccagcagcac tgaaaaaggc gctgaaagac 2040 gtggatctcg tgctcaccag ctatggcctg ttacaacgcg acagtgagct cctcgaaagt 2100 cacgattggc aaggcctcgt gatcgatgaa gcgcaggcga taaaaaaccc ctccgcgaag 2160 caaagccaag ccgcccgtga tctggcccgc ccgaaaaaga acagccgttt tcgcatcgca 2220 ctcaccggca caccagttga gaaccgcgtc agcgagctct gggccctgat ggacttcctc 2280 aaccctcggg tactgggaga ggaagaattt ttccgacatc gctatcgcat gccgattgag 2340 cgttacggag acctgtcctc gctgcgcgac ctcaaagccc gagtgggacc tttcatcctc 2400 agacgactca aaacagacaa agcgatcatc tcggatctac ccgagaaggt ggaattgagc 2460 gagtgggttg ggctgagcaa agagcagaag tcgctgtatg ccaaaaccgt tgaagacacc 2520 ttggatgcca ttgcccgcgc gccacgcggc aaacgtcatg gtcaggtgtt gggtctgctc 2580 accaagctca agcagatttg caaccaccct gcgcttgccc tcaaggagca gggcgccagc 2640 gaagatttcc tcaaacggtc cgtgaagctg caacgtctcg aagaaatttt ggacgaggtt 2700 gtagaagctg gggatcgagc cttgctgttt acccagttcg cggaatgggg caagttgctc 2760 caggattatt tgcaacgacg ctggcgcagc gaagttccct tcctcagcgg cagcaccagc 2820 aaaagtgaac ggcaagccat ggtcgatcgc ttccaggagg atccgcgcgg gccccagctt 2880 ttcctgttat cactcaaagc tggcggagtc ggcctcaacc tcacgcgcgc cagtcatgtc 2940 tttcacatcg accgttggtg gaaccccgcc gttgaaaatc aagccacgga ccgtgcctat 3000 cgcatcggcc aaacgaaccg ggtcatggtg cataagttca tcaccagcgg ctccgttgag 3060 gagaaaattg accgcatgat ccgcgagaag tccagactgg cggaagacat cattggctcc 3120 ggcgaagact ggcttggagg cctggaaatg ggacaactca aagagctagt gagcctggag 3180 gacaaccaag catga 3195 <210> 86 <211> 1064 <212> PRT <213> Synechococcus sp. <400> 86 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr 1 5 10 15 Ser Ser Gly Arg Ala Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Glu Pro Ala Gly Pro Ser Thr Thr Pro Ala Leu His Pro Phe Thr 35 40 45 Leu Ser Pro Asp Asp Leu Arg Ala Leu Leu Thr Glu Arg Asp Leu Leu 50 55 60 Pro Asp Gly Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Ser Val Lys Pro Arg Lys Lys Arg Glu Thr Glu Thr Ser Ser Thr Glu 85 90 95 Gln Pro Ser Trp Thr Gly Leu Pro Leu Gln Ala Gly Glu Pro Ile Pro 100 105 110 Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Ile Asp 115 120 125 Pro Met Ala Ala Thr Ala Trp Leu Ser Lys Leu Pro Leu Ser Gly Arg 130 135 140 His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Met Gln Arg 145 150 155 160 Trp Ser Leu Ser Leu Val Ala Arg Ser Arg Trp Leu Pro Gln Val Glu 165 170 175 Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro Leu 180 185 190 Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala Gly 195 200 205 Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Thr Gly 210 215 220 Lys Arg Ser Asn Arg Ile Thr Arg Leu Arg Pro Glu Ala Met Arg Ala 225 230 235 240 Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg Val 245 250 255 Ala Thr Leu Leu Ala Asp Leu Met Asp Ala Gln Leu Arg Lys Gly Phe 260 265 270 Thr Pro Asp Pro Asp Gly Leu Asp Pro Leu Leu Arg Ala Trp Glu Glu 275 280 285 Ala Leu Ser Ser Asp Thr Gly Glu Ile Gln Leu Ser Asp Glu Glu Thr 290 295 300 Glu Arg Leu Ala Thr Ala Ser Asn His Trp Arg Glu Gly Val Ala Gly 305 310 315 320 Asn Val Ala Ala Ala Arg Ala Cys Leu Glu Leu Ala Thr Pro Ala Asp 325 330 335 Asp Glu Asp Leu Trp Pro Leu Arg Phe Phe Leu Gln Ala Glu Ala Asp 340 345 350 Pro Thr Leu Lys Leu Pro Ala Gly Ala Ala Trp Ala Ala Gly Pro Ser 355 360 365 Gly Leu Gln Leu Gly Glu Ile Lys Val Glu His Pro Ser Glu Val Leu 370 375 380 Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe Gln Pro Ile Glu Arg 385 390 395 400 Gly Leu Asp Ser Ala Thr Pro Glu Ser Met Gln Leu Thr Pro Ala Glu 405 410 415 Ala Phe Val Leu Val Arg Thr Ala Val Arg Gln Leu Arg Asp Val Gly 420 425 430 Val Gly Val Asp Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser Arg 435 440 445 Leu Gly Leu Ala Ile Lys Ala Glu Leu Ser Glu Arg Ser Arg Gly Phe 450 455 460 Thr Leu Gly Glu Asn Leu Asp Trp Ser Trp Glu Leu Met Ile Gly Gly 465 470 475 480 Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ala Gly Lys Arg Ser 485 490 495 Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn Asp 500 505 510 Leu Lys Asn Ala Glu Arg Phe Cys Ala Ala Asn Pro Asp Leu Ser Leu 515 520 525 Asp Asp Ala Leu Arg Leu Thr Ala Thr Glu Gly Asp Thr Met Met Arg 530 535 540 Leu Pro Val His Gln Phe Asp Ala Gly Pro Arg Leu Gln Ala Val Leu 545 550 555 560 Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro Glu 565 570 575 Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly Trp 580 585 590 Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp Asp 595 600 605 Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His Leu 610 615 620 Lys Ala Glu Asn Glu Leu Lys Arg Ser Val Leu Leu Ile Ala Pro Thr 625 630 635 640 Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Thr Ala Phe Thr Pro Glu 645 650 655 Leu Lys Val His Glu His Tyr Gly Pro Lys Arg Pro Ser Thr Pro Ala 660 665 670 Ala Leu Lys Lys Ala Leu Lys Asp Val Asp Leu Val Leu Thr Ser Tyr 675 680 685 Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser His Asp Trp Gln 690 695 700 Gly Leu Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Ser Ala Lys 705 710 715 720 Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Pro Lys Lys Asn Ser Arg 725 730 735 Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser Glu 740 745 750 Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Arg Val Leu Gly Glu Glu 755 760 765 Glu Phe Phe Arg His Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly Asp 770 775 780 Leu Ser Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile Leu 785 790 795 800 Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser Asp Leu Pro Glu Lys 805 810 815 Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser Leu 820 825 830 Tyr Ala Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Arg Ala Pro 835 840 845 Arg Gly Lys Arg His Gly Gln Val Leu Gly Leu Leu Thr Lys Leu Lys 850 855 860 Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys Glu Gln Gly Ala Ser 865 870 875 880 Glu Asp Phe Leu Lys Arg Ser Val Lys Leu Gln Arg Leu Glu Glu Ile 885 890 895 Leu Asp Glu Val Val Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr Gln 900 905 910 Phe Ala Glu Trp Gly Lys Leu Leu Gln Asp Tyr Leu Gln Arg Arg Trp 915 920 925 Arg Ser Glu Val Pro Phe Leu Ser Gly Ser Thr Ser Lys Ser Glu Arg 930 935 940 Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln Leu 945 950 955 960 Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg 965 970 975 Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val Glu 980 985 990 Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg Val 995 1000 1005 Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu Glu Lys Ile 1010 1015 1020 Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu Asp Ile Ile 1025 1030 1035 Gly Ser Gly Glu Asp Trp Leu Gly Gly Leu Glu Met Gly Gln Leu 1040 1045 1050 Lys Glu Leu Val Ser Leu Glu Asp Asn Gln Ala 1055 1060 <210> 87 <211> 3198 <212> DNA <213> Synechococcus sp. <400> 87 atgagcctgc tgcacgccac ctggcttccc gccatccgca cctccagcag ttccggtcaa 60 ccggcactgc tcgtttgggc tgacacctgg cgggtggcca caccggaagg cccgggcctt 120 accccagcgc tgcacccctt caccctaagc catgaagacc tcagggcctg gctgagcgaa 180 cgcgacctct tgcccggcgg ctgcatcgat gccacggcgt gcctcaccct gccgagccgc 240 acggtgaagc tgcgcaaaag ccgcagcaca aaagaggagc caacaccgga accaccgggt 300 tggaccgggc taccgatgca ggccggcgaa ccgatcccca agcaaaccga atggtggccc 360 tggcaggtgc aggggctcgc ggtggaaccg tcggcagcca cggagtggct gtcccgattg 420 ccgctctccg gcaccaatcc agacctggct gatgaactgc gctggtggag ccatctgcag 480 cgctgggcct tgagtctggt ggcccggggc cgctggattc cccagatgga gttcagcaaa 540 ggggagggct atccccatcg ggcccgttgg gtgccgcttc tcaaccggga agaagaccgg 600 cgccggctgg aggatctggc ggccagcctg ccgctggtgg ccacctgcgc cttgccctgg 660 cgggaacccc tggggcgccg cagcaaccgc accacccggt tacgaccgga ggcgatgcga 720 gccgccaacc ctgtggccag ctgccggccc cgcagcggac gcctgcgggt ggcgacgctg 780 ctggaagatc tagtggacgc gcagctgcgc aaggactttg aaccctccac cgatgggctt 840 gatcccctgc tgaccctctg gcaggaggcc ctggggtcgg agaccggggt gatcgagatc 900 ggcgatgaag aggccgaacg cctggccacc gccagccatc actggcggga gggcatcgcc 960 ggcgattttg ctgcggcccg cacctgcctt gaactgcaca ccccaccgga tggggaggat 1020 ctctgggagc tgcgcttcgg gctgcaggcg gaagctgacc ccagcctgaa gctcccggcc 1080 gccgcggcct gggcggctgg tgcggaaccg ctacagcttg gagagatccg ggtggaccaa 1140 ccgggtgaag tgctgctgga aggcatgggc cgcgccctga gcgtgtttcc ggcaattgag 1200 cggggtctgg agagcgccac acctgaaacg atgcagctca ccccggccga ggccttcgtg 1260 ctggtgcgca cggccgcccg gcagctgcgg gatgccggcg tgggagtgga gctgccgccc 1320 agcctctccg gtggcctggc cagccgactg ggcctgtcga tcaaagcgga actgcccgaa 1380 cgctcgagcg gtttcacgtt gggtgagtgt ctggcctggg agtgggatct gatgatcggc 1440 ggggtgacgc tcaccctgcg ggaattggag cgcctgagcg gcaagcgcag ccccctggtg 1500 cgccacaagg gggcctggat cgaactgcgg cccaacgacc tcaaaaatgc cgaacgcttc 1560 tgtggggcga aacctgaact gagcctcgac gacgcgctgc ggctgacggg gacggaaggg 1620 gaactgttga tgcggatgcc ggtgcaccgc ttcgacgccg gcccacggct gcaatcggtg 1680 ttgcagcaat accaccagca gaaggccccc gaccccttgc cggccccgga aggattcagc 1740 gggcagctgc ggccttatca ggagcggggc ctcggctggc tcgccttcct gcaccgcttc 1800 gatcaagggg cctgtctagc tgacgacatg ggcttgggca aaaccattca gttgctagcg 1860 ttcctgcagc acctcaaagc ggagcaagaa ctgaaacgcc cggtgctgct ggtggccccc 1920 acatcggtgc tcaccaactg gcgacgggag gcggaatcgt tcactccaga gttgaaggtc 1980 accgagcatt acgggcctcg ccggccctcc acacccgccg aactcaaaaa agcgttgaag 2040 gaggtggatc tggtgctcac cagctacggg ctgctgcagc gtgacagcga actgctggaa 2100 acccaggact ggcagggggt ggtgattgac gaagcccagg cgatcaagaa ccctggcgcc 2160 aaacagagcc aagccgcccg ggatctggcc cgcaccggcc gcatcaagag caaccgcttc 2220 cgcatcgcac tcaccggcac ccccgtggaa aaccgggtga gcgaactgtg ggccttgatg 2280 gacttcctca acccaaaggt gcttggggaa gaagacttct tccgccagcg ctatcggatg 2340 ccgattgagc gctacggcga catgtcgtcc ctgcgggacc tgaaaggccg cgtgggtccg 2400 ttcatcctgc gccggctgaa aaccgacaag acgatcattt ccgacctgcc tgaaaaggtg 2460 gagctgagcg aatgggtggg gctgagcaag gagcagaaat ctctgtacag caagaccgtg 2520 gaagacaccc tcgatgccat tgcccgggcg ccgcgcgggc agcgccacgg gcaggtgctg 2580 gccctgctca cccggctgaa acagatctgc aaccatcccg ccctggccct gagcgaaggg 2640 gccgtggacg atggcttcct gggccgttcg gccaagctgc agcggctgga ggagatcctc 2700 gatgaggtga tcgaagcggg cgatcgggcc ctgctgttca cccagttcgc cgaatggggg 2760 catttgctaa gggcctggat gcagcagcgc tggaaatcag aagtgccctt cctgcacggc 2820 ggcacccgca agaacgaacg ccaggcgatg gtggatcgct tccaggagga tccccgcggt 2880 ccacagctgt tcctgctctc gctcaaggcc ggtggtgtgg gcctcaacct cacgcgggcc 2940 agccatgtgt tccacatcga tcgctggtgg aaccctgccg tggaaaacca ggccaccgac 3000 cgggcctatc ggatcggcca aacgaaccga gtgatggttc ataaattcat caccagcggt 3060 tcggtggagg aaaaaatcga tcgcatgatc cgcgagaaat cacgcctggc cgaagatgtg 3120 atcggctccg gcgaagattg gctgggaagc ctcggtggcg atcaattgcg cgatctcgtt 3180 tctttggagg acacctga 3198 <210> 88 <211> 1065 <212> PRT <213> Synechococcus sp. <400> 88 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Ser 1 5 10 15 Ser Ser Gly Gln Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Thr Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr 35 40 45 Leu Ser His Glu Asp Leu Arg Ala Trp Leu Ser Glu Arg Asp Leu Leu 50 55 60 Pro Gly Gly Cys Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Thr Val Lys Leu Arg Lys Ser Arg Ser Thr Lys Glu Glu Pro Thr Pro 85 90 95 Glu Pro Pro Gly Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile 100 105 110 Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val 115 120 125 Glu Pro Ser Ala Ala Thr Glu Trp Leu Ser Arg Leu Pro Leu Ser Gly 130 135 140 Thr Asn Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Leu Gln 145 150 155 160 Arg Trp Ala Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met 165 170 175 Glu Phe Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro 180 185 190 Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala 195 200 205 Ser Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Leu 210 215 220 Gly Arg Arg Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg 225 230 235 240 Ala Ala Asn Pro Val Ala Ser Cys Arg Pro Arg Ser Gly Arg Leu Arg 245 250 255 Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg Lys Asp 260 265 270 Phe Glu Pro Ser Thr Asp Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln 275 280 285 Glu Ala Leu Gly Ser Glu Thr Gly Val Ile Glu Ile Gly Asp Glu Glu 290 295 300 Ala Glu Arg Leu Ala Thr Ala Ser His His Trp Arg Glu Gly Ile Ala 305 310 315 320 Gly Asp Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu His Thr Pro Pro 325 330 335 Asp Gly Glu Asp Leu Trp Glu Leu Arg Phe Gly Leu Gln Ala Glu Ala 340 345 350 Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ala Gly Ala 355 360 365 Glu Pro Leu Gln Leu Gly Glu Ile Arg Val Asp Gln Pro Gly Glu Val 370 375 380 Leu Leu Glu Gly Met Gly Arg Ala Leu Ser Val Phe Pro Ala Ile Glu 385 390 395 400 Arg Gly Leu Glu Ser Ala Thr Pro Glu Thr Met Gln Leu Thr Pro Ala 405 410 415 Glu Ala Phe Val Leu Val Arg Thr Ala Ala Arg Gln Leu Arg Asp Ala 420 425 430 Gly Val Gly Val Glu Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser 435 440 445 Arg Leu Gly Leu Ser Ile Lys Ala Glu Leu Pro Glu Arg Ser Ser Gly 450 455 460 Phe Thr Leu Gly Glu Cys Leu Ala Trp Glu Trp Asp Leu Met Ile Gly 465 470 475 480 Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg 485 490 495 Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn 500 505 510 Asp Leu Lys Asn Ala Glu Arg Phe Cys Gly Ala Lys Pro Glu Leu Ser 515 520 525 Leu Asp Asp Ala Leu Arg Leu Thr Gly Thr Glu Gly Glu Leu Leu Met 530 535 540 Arg Met Pro Val His Arg Phe Asp Ala Gly Pro Arg Leu Gln Ser Val 545 550 555 560 Leu Gln Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro 565 570 575 Glu Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly 580 585 590 Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp 595 600 605 Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His 610 615 620 Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro 625 630 635 640 Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ser Phe Thr Pro 645 650 655 Glu Leu Lys Val Thr Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro 660 665 670 Ala Glu Leu Lys Lys Ala Leu Lys Glu Val Asp Leu Val Leu Thr Ser 675 680 685 Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Thr Gln Asp Trp 690 695 700 Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Gly Ala 705 710 715 720 Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Thr Gly Arg Ile Lys 725 730 735 Ser Asn Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg 740 745 750 Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Lys Val Leu 755 760 765 Gly Glu Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg 770 775 780 Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Gly Arg Val Gly Pro 785 790 795 800 Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Thr Ile Ile Ser Asp Leu 805 810 815 Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln 820 825 830 Lys Ser Leu Tyr Ser Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala 835 840 845 Arg Ala Pro Arg Gly Gln Arg His Gly Gln Val Leu Ala Leu Leu Thr 850 855 860 Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Ser Glu Gly 865 870 875 880 Ala Val Asp Asp Gly Phe Leu Gly Arg Ser Ala Lys Leu Gln Arg Leu 885 890 895 Glu Glu Ile Leu Asp Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu 900 905 910 Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Arg Ala Trp Met Gln 915 920 925 Gln Arg Trp Lys Ser Glu Val Pro Phe Leu His Gly Gly Thr Arg Lys 930 935 940 Asn Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly 945 950 955 960 Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn 965 970 975 Leu Thr Arg Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro 980 985 990 Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr 995 1000 1005 Asn Arg Val Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu 1010 1015 1020 Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu 1025 1030 1035 Asp Val Ile Gly Ser Gly Glu Asp Trp Leu Gly Ser Leu Gly Gly 1040 1045 1050 Asp Gln Leu Arg Asp Leu Val Ser Leu Glu Asp Thr 1055 1060 1065 <210> 89 <211> 3192 <212> DNA <213> Synechococcus sp. <400> 89 atgagcctgc tgcacgccac ctggcttccc gccattcgta cttccagcag ttccggacag 60 ccggcactgc tcatttgggc tgacacctgg cgtgtcgcct caccggaggg gcccggactc 120 acacccgctc tgcatccctt cacccttggc tcggacgatc tcaaagcttg gttgaccgaa 180 cgggacctga tgcctggggg cagcatcgat gccaccgcct gcctcaccct cccaagccgc 240 agcgtcaaac cccgcaaaag tcgaacccaa ccgagcgaac cagccccaga gggaccggcc 300 tggaccggat tgccaatgca agcaggagag cccattccga agcaaatgga atggtggccc 360 tggcaggtac aaggcctcgc ggtggagcca tcggccgcaa cggaatggct cgcccgttta 420 cccctatcgg gccgacatcc agacctcgga gatgaattgc gctggtggag ccatctccaa 480 cgttggtccc tcagcttggt ggcccggggg cgctggattc cccagatgga attaagcaaa 540 ggcgagggtt acccccaccg agcgcgctgg gttcccttgt tgaaccgtga ggaagatcga 600 cgacggctcg aagacctcgc ggccacgctg cccctcgtgg cgacctgtgc cctcccttgg 660 cgtgagccac ttggacgccg tagcaaccgc accaccaggc ttcgaccgga agcgatgcga 720 gccgccaacc cggtggcttg ctgccgcccc cggagcggtc gcctcagggt ggccaccttg 780 cttgaagact tggtggatgc agagctgcgc aagggatttg aacccaccac agaggggctc 840 gaccccctac tcaccctgtg gcaagaggcc ctggcctcag aaaccggtgt tgtggaggtg 900 ggcaacgagg atgcagaacg ccttaccgcg gcaagcctgc actggcgcga agggattgcc 960 ggaggcttcg ctgctgcccg cacctgcctc gaactaaaca ccccaaacga aggcgaagaa 1020 ctctgggacc tgaagtttgg cttgcaagcg gaggccgatc ccagcctcaa gctgccggcc 1080 gccgcggcct gggcctcagg agccgaaaca ctccagctcg gggagatcaa agttgaccag 1140 gcgggggaag tgctgctgga gggtcttggc cgagccctca cggtgttccc tccgatcgaa 1200 cgcggactgg aaagcgcaac gccagaaacg atgcagctca cgccagcgga ggcgtttgtc 1260 ttggtgcgaa cagcaacgca ccagctccgc aatgccggca tcggcgtcga actgcccccc 1320 agcctttcag ggggcctcgc cagccggctt ggtttagcca tcaaggcaga tttaccagat 1380 cgatccagcg gcttcaccct cggagaatct ctggactgga gctgggatct gatgatcggc 1440 ggcgtcacac tcaccctgcg agagctcgaa cggctcagcg gtaagcgcag tccgcttgtg 1500 cgccacaagg gagcctggat cgaactgcga cccaacgatc tccgcaacgc cgaacgcttc 1560 tgtggagcca atccagaact gagcctcgac gatgccctaa ggctcacggc cacagaaggg 1620 gagctaatga tgcgcttgcc ggtgcatcgc tttgatgcgg ggcctcggct tcagggagtt 1680 ctcgagcaat atcaccagca aaaagccccc gatccccttc ccgctccaga gggattttcc 1740 ggacaactgc gtccttatca agaacgtggc ttgggctggc tggccttctt acatcgcttc 1800 gatcaaggcg cctgcctggc ggacgacatg ggcttgggca agaccatcca attgttggcc 1860 ttcctgcagc acctcaaagc cgagcacgaa ctcaaacgcc cggtgctgtt ggtggcccca 1920 acctcggtgc tcacgaattg gcgacgggag gcggaagcct tcacccccga gctgtcggtg 1980 aaagagcact acggcccacg ccggccttcc acgccggccg ccttgaaaaa agaactcaaa 2040 gatgtggatc tggtgctcac cagttacggc ctgatgcaac gcgacagcga gctgctggac 2100 agcgtcgact ggcaaggggt tgtgatcgac gaagcgcagg cgatcaaaaa ccctggggcg 2160 aaacaaagcc aagcagcccg agacctggcc cgagctggaa agagcagcag gttccgcatc 2220 gcactcaccg gcacaccggt ggaaaaccgc gtcagcgagc tgtgggcgct gatggatttc 2280 ctcaacccaa aggtgttggg agaggaagac ttctttcgtc agcgctaccg catgccaatt 2340 gagcgctacg gcgatatgtc gtcgttacgc gatctcaaag cgcgggtcgg ccccttcatc 2400 ctgcgccgtc tcaaaaccga caagtcgatc atttccgacc tgcctgaaaa ggtggagctc 2460 agtgaatggg tgggtctcag caaagaacag aaatcgctgt acaacaaaac cgttgaagac 2520 accctcgacg ccattgccac cgcaccgcgg gggcaacgcc atggccaggt gctagccctc 2580 ttgacccggt taaagcagat ttgcaatcac ccggctttag cccaacgcga aggggccgtt 2640 gacagcgaat tccttggccg ttccgccaag ctgatgcgac tcgaagaaat cctcgaagag 2700 gtgattgaag ccggcgatcg cgctttgcta ttcacccaat tcgccgaatg ggggcatctc 2760 ctgcaggcct ggatgcaaca acgctggaag tctgaggttc ccttcctgca cggcggaacc 2820 cgcaagagtg atcggcaagc gatggtggat cgattccaag aggacccccg gggacctcaa 2880 ctctttcttc tgtccctcaa ggccggtggt gtaggcctca acctcacccg ggccagtcat 2940 gtgttccacg tcgatcgctg gtggaatcca gcggtggaaa accaagccac cgaccgggcc 3000 tatcgaattg gtcaaaccaa ccgggtaatg gtgcacaaat tcgtcacccg tggctcggtg 3060 gaagaaaaaa tcgaccaaat gattcgtgaa aaagctcgaa tggctgaaga cgtgatcggc 3120 tccggtgaag actggctcgg gagccttggc ggcgatcagc tgcgcaatct tgttgccctc 3180 gaggacacct aa 3192 <210> 90 <211> 1063 <212> PRT <213> Synechococcus sp. <400> 90 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Ser 1 5 10 15 Ser Ser Gly Gln Pro Ala Leu Leu Ile Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Ser Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr 35 40 45 Leu Gly Ser Asp Asp Leu Lys Ala Trp Leu Thr Glu Arg Asp Leu Met 50 55 60 Pro Gly Gly Ser Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Ser Val Lys Pro Arg Lys Ser Arg Thr Gln Pro Ser Glu Pro Ala Pro 85 90 95 Glu Gly Pro Ala Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile 100 105 110 Pro Lys Gln Met Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val 115 120 125 Glu Pro Ser Ala Ala Thr Glu Trp Leu Ala Arg Leu Pro Leu Ser Gly 130 135 140 Arg His Pro Asp Leu Gly Asp Glu Leu Arg Trp Trp Ser His Leu Gln 145 150 155 160 Arg Trp Ser Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met 165 170 175 Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro 180 185 190 Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala 195 200 205 Thr Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Leu 210 215 220 Gly Arg Arg Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg 225 230 235 240 Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg 245 250 255 Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Glu Leu Arg Lys Gly 260 265 270 Phe Glu Pro Thr Thr Glu Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln 275 280 285 Glu Ala Leu Ala Ser Glu Thr Gly Val Val Glu Val Gly Asn Glu Asp 290 295 300 Ala Glu Arg Leu Thr Ala Ala Ser Leu His Trp Arg Glu Gly Ile Ala 305 310 315 320 Gly Gly Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu Asn Thr Pro Asn 325 330 335 Glu Gly Glu Glu Leu Trp Asp Leu Lys Phe Gly Leu Gln Ala Glu Ala 340 345 350 Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ser Gly Ala 355 360 365 Glu Thr Leu Gln Leu Gly Glu Ile Lys Val Asp Gln Ala Gly Glu Val 370 375 380 Leu Leu Glu Gly Leu Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu 385 390 395 400 Arg Gly Leu Glu Ser Ala Thr Pro Glu Thr Met Gln Leu Thr Pro Ala 405 410 415 Glu Ala Phe Val Leu Val Arg Thr Ala Thr His Gln Leu Arg Asn Ala 420 425 430 Gly Ile Gly Val Glu Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser 435 440 445 Arg Leu Gly Leu Ala Ile Lys Ala Asp Leu Pro Asp Arg Ser Ser Gly 450 455 460 Phe Thr Leu Gly Glu Ser Leu Asp Trp Ser Trp Asp Leu Met Ile Gly 465 470 475 480 Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg 485 490 495 Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn 500 505 510 Asp Leu Arg Asn Ala Glu Arg Phe Cys Gly Ala Asn Pro Glu Leu Ser 515 520 525 Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Glu Gly Glu Leu Met Met 530 535 540 Arg Leu Pro Val His Arg Phe Asp Ala Gly Pro Arg Leu Gln Gly Val 545 550 555 560 Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro 565 570 575 Glu Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly 580 585 590 Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp 595 600 605 Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His 610 615 620 Leu Lys Ala Glu His Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro 625 630 635 640 Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ala Phe Thr Pro 645 650 655 Glu Leu Ser Val Lys Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro 660 665 670 Ala Ala Leu Lys Lys Glu Leu Lys Asp Val Asp Leu Val Leu Thr Ser 675 680 685 Tyr Gly Leu Met Gln Arg Asp Ser Glu Leu Leu Asp Ser Val Asp Trp 690 695 700 Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Gly Ala 705 710 715 720 Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Ala Gly Lys Ser Ser 725 730 735 Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser 740 745 750 Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Lys Val Leu Gly Glu 755 760 765 Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly 770 775 780 Asp Met Ser Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile 785 790 795 800 Leu Arg Arg Leu Lys Thr Asp Lys Ser Ile Ile Ser Asp Leu Pro Glu 805 810 815 Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser 820 825 830 Leu Tyr Asn Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Thr Ala 835 840 845 Pro Arg Gly Gln Arg His Gly Gln Val Leu Ala Leu Leu Thr Arg Leu 850 855 860 Lys Gln Ile Cys Asn His Pro Ala Leu Ala Gln Arg Glu Gly Ala Val 865 870 875 880 Asp Ser Glu Phe Leu Gly Arg Ser Ala Lys Leu Met Arg Leu Glu Glu 885 890 895 Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr 900 905 910 Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala Trp Met Gln Gln Arg 915 920 925 Trp Lys Ser Glu Val Pro Phe Leu His Gly Gly Thr Arg Lys Ser Asp 930 935 940 Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln 945 950 955 960 Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr 965 970 975 Arg Ala Ser His Val Phe His Val Asp Arg Trp Trp Asn Pro Ala Val 980 985 990 Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg 995 1000 1005 Val Met Val His Lys Phe Val Thr Arg Gly Ser Val Glu Glu Lys 1010 1015 1020 Ile Asp Gln Met Ile Arg Glu Lys Ala Arg Met Ala Glu Asp Val 1025 1030 1035 Ile Gly Ser Gly Glu Asp Trp Leu Gly Ser Leu Gly Gly Asp Gln 1040 1045 1050 Leu Arg Asn Leu Val Ala Leu Glu Asp Thr 1055 1060 <210> 91 <211> 3198 <212> DNA <213> Synechococcus sp. <400> 91 atgagcctgc tgcacgccac ctggctcccg gccatccgta cacccaccag ttccgggcgt 60 gccgccctgc tggtgtgggc ggacacctgg cgtgtggcgg agccggcggg ccccggcgtg 120 accccggcca cccatccctt caccctcagc gccgatgacc tgcgcgcctg gctgagcgaa 180 cgggagctgc tgcccgacgg catcatcgat gccaccgcct gcctcaccct gcccagccgc 240 acggtgaaac cgaagcggaa gcgtggcgag accgcccctg tggatgaggg ctggacgggt 300 ctgcccctgc aggcgggaga accgattccg aagcagaccg aatggtggcc ctggcaggta 360 cagggcctgg cggtcgaacc cggtgcagcc accgcctggc tggcccgctt gcccctctcc 420 ggccgccacc ccgacctcgc cgatgagctg cgctggtgga gccacatgca gcgctgggcc 480 ctcagcctga ttgctcgcag tcgctggatt ccccaggtgg agctgagcaa aggggagggc 540 tacccccacc gcgcccgttg ggtgcctctg ctcaatcgcg aagacgatcg ccgccgcctg 600 gaagacatgg cggcccgcct gccgctggtg gccacctgcg ctctcccctg gcgcgaaccc 660 accgggaagc gcagcaaccg caccacccgg ctgcggcctg aggcgatgcg ggcggccaat 720 ccggtggcct gttgtcgtcc ccgcagcggc cgactgcgcg tcgccaccct gctcgaagac 780 ctggtggatg cccagctgcg cacgggtttc acagcccaga cggacgggct cgatcccctg 840 cttgccgcct gggaggaggc cctcggcagc gacaccggcg tgatccacct gggcgatgaa 900 gacgcagagc gtctggccac cgccagccat cactggcgcg aaggggtggc cggcactgtg 960 gcggcggcgc gggcctgcct ggaactggag acccccgacg acggcgatga cctctggacc 1020 ctgcggttcg cactgcaggc cgaagcggat cccacgctca aggtgccggc cgccctcgcc 1080 tgggcggccg gtccgaaggg actccagctc ggcgaaatcg ccgtggagca tccgggcgaa 1140 ctgctgctgg aaggcatggg ccgggcgctc acggtgtttc caccgatcga acgcggtctc 1200 gacagcgcca cgccggaagg gatgcaactc acccccgccg aagccttcgt gctggtgcgc 1260 accgcagccc gcgaactccg cgatgtgggg gtgggcgtgg agcttccagc cagcctctcg 1320 ggtggcctgg cgagcaggct cggcctggcg attcaggcgg aactaccgga gaaatcccgc 1380 ggtttcacgc tgggcgaaac cctcgactgg agctgggagc tgatgatcgg cggcgtcacc 1440 ctgacgctgc gggaactgga gcgcctggcg ggcaagcgca gccccctggt gcggcacaag 1500 ggcacctgga tcgagctgcg ccccaacgat ctcaagaatg cggagcggtt tttcgccgcg 1560 aagcccgatc tcagcctcga cgatgccctg cgcctcaccg ccagcgaagg cgacacgctg 1620 atgcgcatgc cggtgcaccg cctggaagcg ggcccacggc tgcaggcggt gctcgagcag 1680 tatcaccaac agaaagctcc cgatcccctg ccggcgccgg agggcttctg cggccagctg 1740 cggccttacc aggagcgggg cctcggctgg ctggcctttc tgcaccgctt tgatcaaggc 1800 gcctgcctgg ccgacgacat gggtctgggc aagaccatcc agctgctcgc ctttctgcag 1860 cacctgaagg ccgagcagga gctgaagagg ccggtgttgc tcgtggcgcc cacctcggtg 1920 ctcaccaact ggaagcggga ggccgccgcc ttcacgccgg agctcgaggt gaaggagcac 1980 tacgggccca ggcgccctgc cacccctgca gcactcaaga agagcctcaa ggatgtggat 2040 ctggtgctca ccagctacgg cctgctccaa cgcgacagcg aactgctcga aagtctcgat 2100 tggcaggggg tggtgatcga cgaagcgcag gcaatcaaga atccgagcgc caaacagagc 2160 atggcggccc gagacctggc ccgcgcagga cgcagcagcc gtttccgcat tgccctcacc 2220 ggcacgccgg tggagaaccg ggtgagcgag ctctgggcct tgatggattt cctcaacccg 2280 cgggtgctcg gcgaagagga cttcttccgc cagcgctacc gcatgccgat tgagcgctat 2340 ggcgacatgt cgtcgctgcg ggatctgaaa tcccgcgtgg gacctttcat tcttcgccgg 2400 ctcaaaaccg acaaagcgat catttccgac ctgcccgaaa aggtggaact gagcgaatgg 2460 gtgggattga gcagggagca gaaagcgctc tatgccaaaa ccgtcgagga caccctcgat 2520 gcgattgccc gggcgccccg cggacaacgg catggccagg tgctggggtt gctcaccaag 2580 ctgaagcaga tctgtaacca tcccgccctg gccctgaaag aggaggcggc cggcgacgag 2640 ttcctgcagc gctccatgaa actgcagcgc ctggaggaaa tcctcgagga ggtgatcgac 2700 gccggcgacc gcgccctgct cttcacccag ttcgccgaat ggggccatct gctgcagggt 2760 tacctgcaac ggcgctggcg cagcgaagtg ccgttcctga acggcagcac cagcaagagc 2820 gaacgccagg cgatggtcga tcgcttccag gaagacccgc gggggcctca gctgttcctg 2880 ctgtcactga aagccggtgg tgtgggcctc aacctcaccc gcgccagcca tgtgtttcac 2940 atcgatcgct ggtggaatcc ggcggtggaa aaccaggcca ccgaccgcgc ctaccggatc 3000 ggccagacga accgggtgat ggtgcacaag ttcatcacca gtggatcggt cgaagaaaaa 3060 atcgaccgga tgatccgcga gaaatcacgc ctcgccgaag acatcatcgg ctcaggcgaa 3120 gattggctcg gcgggctcga catgggccag ctgaaggaac tggtgagcct cgacgacaac 3180 ggatcacttt cagcatga 3198 <210> 92 <211> 1065 <212> PRT <213> Synechococcus sp. <400> 92 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr 1 5 10 15 Ser Ser Gly Arg Ala Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Glu Pro Ala Gly Pro Gly Val Thr Pro Ala Thr His Pro Phe Thr 35 40 45 Leu Ser Ala Asp Asp Leu Arg Ala Trp Leu Ser Glu Arg Glu Leu Leu 50 55 60 Pro Asp Gly Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Thr Val Lys Pro Lys Arg Lys Arg Gly Glu Thr Ala Pro Val Asp Glu 85 90 95 Gly Trp Thr Gly Leu Pro Leu Gln Ala Gly Glu Pro Ile Pro Lys Gln 100 105 110 Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val Glu Pro Gly 115 120 125 Ala Ala Thr Ala Trp Leu Ala Arg Leu Pro Leu Ser Gly Arg His Pro 130 135 140 Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Met Gln Arg Trp Ala 145 150 155 160 Leu Ser Leu Ile Ala Arg Ser Arg Trp Ile Pro Gln Val Glu Leu Ser 165 170 175 Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro Leu Leu Asn 180 185 190 Arg Glu Asp Asp Arg Arg Arg Leu Glu Asp Met Ala Ala Arg Leu Pro 195 200 205 Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Thr Gly Lys Arg 210 215 220 Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg Ala Ala Asn 225 230 235 240 Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg Val Ala Thr 245 250 255 Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg Thr Gly Phe Thr Ala 260 265 270 Gln Thr Asp Gly Leu Asp Pro Leu Leu Ala Ala Trp Glu Glu Ala Leu 275 280 285 Gly Ser Asp Thr Gly Val Ile His Leu Gly Asp Glu Asp Ala Glu Arg 290 295 300 Leu Ala Thr Ala Ser His His Trp Arg Glu Gly Val Ala Gly Thr Val 305 310 315 320 Ala Ala Ala Arg Ala Cys Leu Glu Leu Glu Thr Pro Asp Asp Gly Asp 325 330 335 Asp Leu Trp Thr Leu Arg Phe Ala Leu Gln Ala Glu Ala Asp Pro Thr 340 345 350 Leu Lys Val Pro Ala Ala Leu Ala Trp Ala Ala Gly Pro Lys Gly Leu 355 360 365 Gln Leu Gly Glu Ile Ala Val Glu His Pro Gly Glu Leu Leu Leu Glu 370 375 380 Gly Met Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu Arg Gly Leu 385 390 395 400 Asp Ser Ala Thr Pro Glu Gly Met Gln Leu Thr Pro Ala Glu Ala Phe 405 410 415 Val Leu Val Arg Thr Ala Ala Arg Glu Leu Arg Asp Val Gly Val Gly 420 425 430 Val Glu Leu Pro Ala Ser Leu Ser Gly Gly Leu Ala Ser Arg Leu Gly 435 440 445 Leu Ala Ile Gln Ala Glu Leu Pro Glu Lys Ser Arg Gly Phe Thr Leu 450 455 460 Gly Glu Thr Leu Asp Trp Ser Trp Glu Leu Met Ile Gly Gly Val Thr 465 470 475 480 Leu Thr Leu Arg Glu Leu Glu Arg Leu Ala Gly Lys Arg Ser Pro Leu 485 490 495 Val Arg His Lys Gly Thr Trp Ile Glu Leu Arg Pro Asn Asp Leu Lys 500 505 510 Asn Ala Glu Arg Phe Phe Ala Ala Lys Pro Asp Leu Ser Leu Asp Asp 515 520 525 Ala Leu Arg Leu Thr Ala Ser Glu Gly Asp Thr Leu Met Arg Met Pro 530 535 540 Val His Arg Leu Glu Ala Gly Pro Arg Leu Gln Ala Val Leu Glu Gln 545 550 555 560 Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro Glu Gly Phe 565 570 575 Cys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly Trp Leu Ala 580 585 590 Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp Asp Met Gly 595 600 605 Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His Leu Lys Ala 610 615 620 Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro Thr Ser Val 625 630 635 640 Leu Thr Asn Trp Lys Arg Glu Ala Ala Ala Phe Thr Pro Glu Leu Glu 645 650 655 Val Lys Glu His Tyr Gly Pro Arg Arg Pro Ala Thr Pro Ala Ala Leu 660 665 670 Lys Lys Ser Leu Lys Asp Val Asp Leu Val Leu Thr Ser Tyr Gly Leu 675 680 685 Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser Leu Asp Trp Gln Gly Val 690 695 700 Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Ser Ala Lys Gln Ser 705 710 715 720 Met Ala Ala Arg Asp Leu Ala Arg Ala Gly Arg Ser Ser Arg Phe Arg 725 730 735 Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser Glu Leu Trp 740 745 750 Ala Leu Met Asp Phe Leu Asn Pro Arg Val Leu Gly Glu Glu Asp Phe 755 760 765 Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly Asp Met Ser 770 775 780 Ser Leu Arg Asp Leu Lys Ser Arg Val Gly Pro Phe Ile Leu Arg Arg 785 790 795 800 Leu Lys Thr Asp Lys Ala Ile Ile Ser Asp Leu Pro Glu Lys Val Glu 805 810 815 Leu Ser Glu Trp Val Gly Leu Ser Arg Glu Gln Lys Ala Leu Tyr Ala 820 825 830 Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Arg Ala Pro Arg Gly 835 840 845 Gln Arg His Gly Gln Val Leu Gly Leu Leu Thr Lys Leu Lys Gln Ile 850 855 860 Cys Asn His Pro Ala Leu Ala Leu Lys Glu Glu Ala Ala Gly Asp Glu 865 870 875 880 Phe Leu Gln Arg Ser Met Lys Leu Gln Arg Leu Glu Glu Ile Leu Glu 885 890 895 Glu Val Ile Asp Ala Gly Asp Arg Ala Leu Leu Phe Thr Gln Phe Ala 900 905 910 Glu Trp Gly His Leu Leu Gln Gly Tyr Leu Gln Arg Arg Trp Arg Ser 915 920 925 Glu Val Pro Phe Leu Asn Gly Ser Thr Ser Lys Ser Glu Arg Gln Ala 930 935 940 Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln Leu Phe Leu 945 950 955 960 Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg Ala Ser 965 970 975 His Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln 980 985 990 Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg Val Met Val 995 1000 1005 His Lys Phe Ile Thr Ser Gly Ser Val Glu Glu Lys Ile Asp Arg 1010 1015 1020 Met Ile Arg Glu Lys Ser Arg Leu Ala Glu Asp Ile Ile Gly Ser 1025 1030 1035 Gly Glu Asp Trp Leu Gly Gly Leu Asp Met Gly Gln Leu Lys Glu 1040 1045 1050 Leu Val Ser Leu Asp Asp Asn Gly Ser Leu Ser Ala 1055 1060 1065 <210> 93 <211> 3213 <212> DNA <213> Synechococcus sp. <400> 93 atgagcctgc tgcacgccac ctggctaccc gccatccgca ctcccagcag ctccggaagg 60 gctgctttgc tggtatgggc tgacacctgg cgtgtggccg accccctcgg ccccggggcc 120 acacccgccc ttcatccgtt caccctgagc gcggaggatc tgcgcgcctg gctcacagag 180 cgcgatttgc ttccggacgg aatcatcgat gcgaccgcat gcctcaccct gccgagccgc 240 agtgtgaaac cacggcggcc ccgtggctca gctgccgcca ccccctcatc agaagagcag 300 cccccttggt gcgggctgcc gctgcaagcc ggcgaaccga tcccgaaaac caccgagtgg 360 tggccatggc aggtgcaggg gctggcgatc gaaccgatgg ccgccacggc atggctggcc 420 aagcttccac tgtcaggcca tcaccctgat ctggccgatg agttgcgctg gtggagtcac 480 atgcagcgat gggccctcag tcttgtggct agggggcgct ggctgcccca ggtggaattg 540 agccgaggtg aggggtatcc acaccgggcc cgctgggtcc cgcttctcaa tcgagaggaa 600 gaccggcgcc gcctggagga ccttgccgcc cgtctgcccc tggttgccac gtgtgcgttg 660 ccctggagag agcccacagg aaagcgcagc aatcgcatca ccaggctgcg cccagaggcc 720 atgcgcgctg ccaatcccgt ggcctgctgt cgtccccgca gcggtcgatt gcgggtggcc 780 acattgctgg aggatctggt agatgcccag ctgcgcaagg gcttccatcc cgatgacgag 840 gggctcgacc ccctgctctg cgcctgggaa aacgccctga gttcggagac cggggtgatc 900 gatctgaatg atgaagatgc cgaacgcctt gccacggcga gccaccactg gcgcgaggga 960 gtggctggca atgtggcggc tgccagggcc tgccttgaac tcgccacacc gaacgagggg 1020 gaagagctct gggatctgcg cttctatctg caggccgaag ccgatccaac gctgaaggta 1080 ccggccggag cagcctgggc cgctggaccc gaaggccttc aactcgggga gattcctgtg 1140 gagcatcccg gtgaggtgct gctcgaaggc atggggcgtg ctctcacggt gttcgaacca 1200 atcgaacggg gcctggatag cgccacgccg gaagcgatgc agctcacccc ggcggaagcc 1260 ttcgtgctgg tgcgcaccgc cgcccgtcag ctccgggacg tgggcgttgg tgtggatctc 1320 cctcccagcc tctcgggagg cctggccagc cgcctcggtc tggcgatcaa ggccgaacta 1380 cccaaacgct cgcgggggtt cacccttggg gaaaatctcg actggaactg ggagctgatg 1440 atcgggggcg tcaccctgac gctgcgggag ctggaacggc tggccggcaa gcgcagcccc 1500 ttggtgcgcc acaagggggc ctggatcgaa ctcaggccca atgatctcaa aaatgcagaa 1560 cgattctgtg ccgccaatcc tgatctgagc ctggacgatg cccttcgcct gacggccagc 1620 gaaggggaca cgctgatgcg cctccccgtt catgcctttg atgctggccc tcgccttcaa 1680 ggggtgttgg agcaatacca ccagcagaaa gcaccggatc cacttcctgc gcccgagggt 1740 ttctgcggtc agcttcgccc ttaccaggaa cgaggcctgg gctggctggc cttcctgcac 1800 cgcttcgatc agggagcctg cctcgccgac gacatgggcc tgggcaagac gatccagctg 1860 ctggccttcc tccagcacct gaagatggaa caagaactga aacggccggt gctgctggtg 1920 gctcccacct ccgtgctcac caactggaaa cgggaagccg cggccttcac ccccgagctc 1980 acagtgcatg agcactacgg ccccaaacga ccctccaccc cagcagcact gaaaaaagcc 2040 ctgaaagacg ttgacctggt gctcaccagc tacgggcttc tgcaaagaga cagtgaactg 2100 cttgaaagtt tcgactggca gggaaccgtg atcgatgaag ctcaggcgat caagaaccct 2160 tcggccaagc aaagccaggc agcccgtgat ctggctcgca cccgcaaggg ctccaggttc 2220 cgcattgccc tcactggcac accggttgaa aacagagtga gcgagctctg ggccctgatg 2280 gatttcctca atccgaacgt gctcggcgaa gaggaatttt tccggcagcg ctaccgcatg 2340 ccgatcgaac gctatggcga tatgtcgtcg cttcgcgatc tcaagtcgcg ggtgggacca 2400 ttcattctgc ggcgcttgaa aaccgacaag gcgatcatct ccgacctccc cgaaaaagtg 2460 gagctgagtg aatgggtggg gctgagcaag gaacagaagt ccctttacgc gaaaaccgtg 2520 gagaacaccc tcgatgccat cgcccgagct ccccgaggca agcgtcacgg ccaggtgctg 2580 ggactgctga cgcgcctcaa acagatctgc aatcacccgg ctctggcctt aaaggaagag 2640 gtggcaggcg acgacttcct gcagcgatcg gtgaagctgc agcggctcga agagattctc 2700 gaagaggtga ttgcagcggg ggatcgagcc ctgctgttca cccagttcgc ggaatggggg 2760 catctgctgc agggctacct gcaacgccgc tggcgcagcg aggtgccgtt cctgagcggc 2820 agcactagca aaggagaacg tcaggccatg gtggatcgct tccaggaaga cccgcgcggc 2880 ccccagctgt tcctgttgtc cctcaaagcc ggcggtgtgg gattgaacct gacccgggcc 2940 agccacgtgt tccacatcga ccgctggtgg aatcctgcag ttgaaaacca ggccactgac 3000 cgtgcttacc ggattggcca gaccaatcgg gtgatggtgc ataagttcat caccagtggc 3060 tcagtggaag agaagatcga ccggatgatc cgggagaagt ccagactggc ggaagacatc 3120 gtgggctccg gcgaggagtg gctcggtggc ttcgacatgg gccaactcaa ggagctggtg 3180 agcctcgagg acaacgaaac acgcaaccca tga 3213 <210> 94 <211> 1070 <212> PRT <213> Synechococcus sp. <400> 94 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Ser 1 5 10 15 Ser Ser Gly Arg Ala Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Asp Pro Leu Gly Pro Gly Ala Thr Pro Ala Leu His Pro Phe Thr 35 40 45 Leu Ser Ala Glu Asp Leu Arg Ala Trp Leu Thr Glu Arg Asp Leu Leu 50 55 60 Pro Asp Gly Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Ser Val Lys Pro Arg Arg Pro Arg Gly Ser Ala Ala Ala Thr Pro Ser 85 90 95 Ser Glu Glu Gln Pro Pro Trp Cys Gly Leu Pro Leu Gln Ala Gly Glu 100 105 110 Pro Ile Pro Lys Thr Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu 115 120 125 Ala Ile Glu Pro Met Ala Ala Thr Ala Trp Leu Ala Lys Leu Pro Leu 130 135 140 Ser Gly His His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His 145 150 155 160 Met Gln Arg Trp Ala Leu Ser Leu Val Ala Arg Gly Arg Trp Leu Pro 165 170 175 Gln Val Glu Leu Ser Arg Gly Glu Gly Tyr Pro His Arg Ala Arg Trp 180 185 190 Val Pro Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu 195 200 205 Ala Ala Arg Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu 210 215 220 Pro Thr Gly Lys Arg Ser Asn Arg Ile Thr Arg Leu Arg Pro Glu Ala 225 230 235 240 Met Arg Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg 245 250 255 Leu Arg Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg 260 265 270 Lys Gly Phe His Pro Asp Asp Glu Gly Leu Asp Pro Leu Leu Cys Ala 275 280 285 Trp Glu Asn Ala Leu Ser Ser Glu Thr Gly Val Ile Asp Leu Asn Asp 290 295 300 Glu Asp Ala Glu Arg Leu Ala Thr Ala Ser His His Trp Arg Glu Gly 305 310 315 320 Val Ala Gly Asn Val Ala Ala Ala Arg Ala Cys Leu Glu Leu Ala Thr 325 330 335 Pro Asn Glu Gly Glu Glu Leu Trp Asp Leu Arg Phe Tyr Leu Gln Ala 340 345 350 Glu Ala Asp Pro Thr Leu Lys Val Pro Ala Gly Ala Ala Trp Ala Ala 355 360 365 Gly Pro Glu Gly Leu Gln Leu Gly Glu Ile Pro Val Glu His Pro Gly 370 375 380 Glu Val Leu Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe Glu Pro 385 390 395 400 Ile Glu Arg Gly Leu Asp Ser Ala Thr Pro Glu Ala Met Gln Leu Thr 405 410 415 Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ala Arg Gln Leu Arg 420 425 430 Asp Val Gly Val Gly Val Asp Leu Pro Pro Ser Leu Ser Gly Gly Leu 435 440 445 Ala Ser Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Pro Lys Arg Ser 450 455 460 Arg Gly Phe Thr Leu Gly Glu Asn Leu Asp Trp Asn Trp Glu Leu Met 465 470 475 480 Ile Gly Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ala Gly 485 490 495 Lys Arg Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg 500 505 510 Pro Asn Asp Leu Lys Asn Ala Glu Arg Phe Cys Ala Ala Asn Pro Asp 515 520 525 Leu Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Ser Glu Gly Asp Thr 530 535 540 Leu Met Arg Leu Pro Val His Ala Phe Asp Ala Gly Pro Arg Leu Gln 545 550 555 560 Gly Val Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro 565 570 575 Ala Pro Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly 580 585 590 Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu 595 600 605 Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu 610 615 620 Gln His Leu Lys Met Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val 625 630 635 640 Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Ala Ala Phe 645 650 655 Thr Pro Glu Leu Thr Val His Glu His Tyr Gly Pro Lys Arg Pro Ser 660 665 670 Thr Pro Ala Ala Leu Lys Lys Ala Leu Lys Asp Val Asp Leu Val Leu 675 680 685 Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser Phe 690 695 700 Asp Trp Gln Gly Thr Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro 705 710 715 720 Ser Ala Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Thr Arg Lys 725 730 735 Gly Ser Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg 740 745 750 Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Asn Val Leu 755 760 765 Gly Glu Glu Glu Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg 770 775 780 Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Ser Arg Val Gly Pro 785 790 795 800 Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser Asp Leu 805 810 815 Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln 820 825 830 Lys Ser Leu Tyr Ala Lys Thr Val Glu Asn Thr Leu Asp Ala Ile Ala 835 840 845 Arg Ala Pro Arg Gly Lys Arg His Gly Gln Val Leu Gly Leu Leu Thr 850 855 860 Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys Glu Glu 865 870 875 880 Val Ala Gly Asp Asp Phe Leu Gln Arg Ser Val Lys Leu Gln Arg Leu 885 890 895 Glu Glu Ile Leu Glu Glu Val Ile Ala Ala Gly Asp Arg Ala Leu Leu 900 905 910 Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Gln Gly Tyr Leu Gln 915 920 925 Arg Arg Trp Arg Ser Glu Val Pro Phe Leu Ser Gly Ser Thr Ser Lys 930 935 940 Gly Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly 945 950 955 960 Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn 965 970 975 Leu Thr Arg Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro 980 985 990 Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr 995 1000 1005 Asn Arg Val Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu 1010 1015 1020 Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu 1025 1030 1035 Asp Ile Val Gly Ser Gly Glu Glu Trp Leu Gly Gly Phe Asp Met 1040 1045 1050 Gly Gln Leu Lys Glu Leu Val Ser Leu Glu Asp Asn Glu Thr Arg 1055 1060 1065 Asn Pro 1070 <210> 95 <211> 3192 <212> DNA <213> Synechococcus sp. <400> 95 atgagcctgc tgcacgccac ctggcttccc gccatccgta cctctggcag ttccggccaa 60 ccggcactgc tcatttgggc tgacacctgg cgggtggcga caccagaggg ccccgggcta 120 actccggcgc tgcacccgtt caccctggaa cccgacgacc tcaaggcctg gcttcaggaa 180 cgcgacctgt tgccaggcgg cagcatcgat gccaccgcct gcctcaccct gcccagtcgc 240 acggtaaaac cccgcaagag ccgcagcaaa acggccgaac cagcgcccga agagcccatc 300 tggaccggtc tgccgatgca ggccggagag ccgattccga aacagacaga atggtggccg 360 tggcaagtcc agggcctcgc tgtcgagccc tctgccgcca cggagtggct ctcacgcctt 420 cccctgtcag gacggaatcc agacctggcc gatgagctgc gctggtggag ccacctgcag 480 cgctgggccc tcagccttgt ggcccggggg cgctggattc cccagatgga actgagcaaa 540 ggcgagggat atccccaccg ggcccgttgg gtgcctctgc tcaaccgcga ggaggaccgg 600 cgacgtctgg aggatctggc cgccagcctg ccgctggtgg ccacctgcgc cctgccctgg 660 cgggaaccga tgggtcggcg cagcaaccgc atgacacggc tgcgtccgga ggccatgcgt 720 gccgccaacc cggtggcctg ctgccggccc cgcagtggcc gcctgcgggt ggccacgctg 780 ctggaggatc tggtcgacgc acagctgcgc aaggactttg aaccatccac cgacggcctc 840 gatcccctgt tgaccctgtg gcaagacgcc ctgggctccg aaacaggggt gattgagatc 900 ggtgatgaac aggccgaacg gctggccagc gccagcttcc attggcgcga gggcatcgct 960 ggagatttcg ccgctgcacg cacctgcctg gaactgcaga cacctgcaga gggagaagag 1020 ctctgggagc tgcggtttgg gctgcaggcg gagtcggatc cgagcctcaa gctgcccgcc 1080 gctgcggcct gggcctccgg tgccgaccaa ctccagttgg gagaagtgac agtcgagcag 1140 cccggtgaag tgctgctgga gggtctggga cgcgccctca ccgtgttccc accgatcgaa 1200 aggggcctgg agaccgctac gcctgacacg atgcagctga cccccgccga agccttcgtg 1260 ctggtgcgga ccgcagcgcg gcagctgcgg gatgccggcg tcggcgtcga ccttcccccc 1320 agcctgtcgg ggggcctggc cagccgcctg ggtctggcga tcaaggcgga gctgccagag 1380 cgctccagcg gcttcagcct cggcgaatcc ctcgactgga gctgggatct gatgatcggc 1440 ggggtgacgc tcaccctgcg ggaactggag cggttgagcg gcaaacgcag ccccctcgtg 1500 cgccacaagg gggcctggat cgaattgcga ccgaacgatc tgagaaacgc cgaacgcttc 1560 tgcggtgcca acccggagct cagcctggac gatgccctgc ggatcaccgc caccgaaggc 1620 gatctgctga tgcgtctgcc ggtgcatcgc tttgaggccg gccccaggct gcaggcggtg 1680 ctggagcagt accaccagca gaaggccccg gatccgttgc cagcgccgga ggggttctgc 1740 ggccagctgc ggccttacca ggagcgtggc ctgggctggc tggccttcct caaccgcttc 1800 gaccaaggcg cctgcctggc ggacgacatg ggtctgggta agaccatcca gctgctggcc 1860 ttcctgcagc acctgaaagc agagcaggaa ctgaagcgcc cggtgctgct ggtggccccc 1920 acatcggtgc tcacaaactg gcgacgggaa gcggaagcct tcacccccga actggcggtg 1980 cgcgagcact acggaccgcg gcgtccctcc actccggctg cgctgaagaa ggcgttgaag 2040 gatgtcgact tagtcctcac cagctacggc ctactgcaga gggacagtga attgctggag 2100 tctcaggatt ggcagggggt tgtgatcgat gaagcccaag cgatcaagaa tcccagtgcc 2160 aagcagagcc aggcagcccg agacctggcc agaccagcca aaggcaaccg cttccgcatc 2220 gccctcacgg gcacaccggt ggagaacagg gtcagcgagc tctgggcttt gatggatttc 2280 ctcagtccca aggtgctggg agaagaagac ttcttccgtc agcgctaccg gatgccgatc 2340 gagcgctatg gcgacatggc atccctacgg gacttaaaag ccagggtcgg ccccttcatc 2400 ctgcgccggc tgaaaaccga caagacgatc atttccgatc tgcccgagaa ggtggaactc 2460 agcgaatggg tggggttgag caaggagcag aaatcgctgt acagcaaaac cgttgaagac 2520 accctggatg ccattgcccg ggcgcctcgt ggacagcgcc atggtcaggt gctgggactg 2580 ctcacccgcc tgaagcagat ctgcaaccat ccggccctgg cattgagtga aaacgctgtt 2640 gacgacggct ttctggggcg ctccgccaag ttgcaacggc ttgaggaaat cctcgatgag 2700 gtgatcgaag caggggatcg ggcgctgctg ttcacccagt tcgccgagtg gggccatctg 2760 ctgcagtcct ggatgcaaca acgttggaag gcggatgtgc ccttcctgca tggagggacg 2820 cgcaaaaacg aacggcaggc catggtggat cgttttcagg aggacccccg cggcccgcag 2880 ctgttcctgc tgtcgctcaa agccggcggg gtgggtctga acctgaccag ggccagccac 2940 gtgttccaca tcgatcgctg gtggaaccct gcggtagaga accaggccac cgaccgtgct 3000 tatcggatcg gccagaccaa ccgggtgatg gtgcacaaat tcatcacaag cggatccgta 3060 gaagaaaaaa ttgaccggat gatccgagag aagtcgcgcc tggcagagga tgtgatcggt 3120 tccggtgaag actggctcgg gtgcctggcc ggtgatcagc tgcgcaatct cgttgccctg 3180 gaggacacct ga 3192 <210> 96 <211> 1063 <212> PRT <213> Synechococcus sp. <400> 96 Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Gly 1 5 10 15 Ser Ser Gly Gln Pro Ala Leu Leu Ile Trp Ala Asp Thr Trp Arg Val 20 25 30 Ala Thr Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr 35 40 45 Leu Glu Pro Asp Asp Leu Lys Ala Trp Leu Gln Glu Arg Asp Leu Leu 50 55 60 Pro Gly Gly Ser Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg 65 70 75 80 Thr Val Lys Pro Arg Lys Ser Arg Ser Lys Thr Ala Glu Pro Ala Pro 85 90 95 Glu Glu Pro Ile Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile 100 105 110 Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val 115 120 125 Glu Pro Ser Ala Ala Thr Glu Trp Leu Ser Arg Leu Pro Leu Ser Gly 130 135 140 Arg Asn Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Leu Gln 145 150 155 160 Arg Trp Ala Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met 165 170 175 Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro 180 185 190 Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala 195 200 205 Ser Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Met 210 215 220 Gly Arg Arg Ser Asn Arg Met Thr Arg Leu Arg Pro Glu Ala Met Arg 225 230 235 240 Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg 245 250 255 Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg Lys Asp 260 265 270 Phe Glu Pro Ser Thr Asp Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln 275 280 285 Asp Ala Leu Gly Ser Glu Thr Gly Val Ile Glu Ile Gly Asp Glu Gln 290 295 300 Ala Glu Arg Leu Ala Ser Ala Ser Phe His Trp Arg Glu Gly Ile Ala 305 310 315 320 Gly Asp Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu Gln Thr Pro Ala 325 330 335 Glu Gly Glu Glu Leu Trp Glu Leu Arg Phe Gly Leu Gln Ala Glu Ser 340 345 350 Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ser Gly Ala 355 360 365 Asp Gln Leu Gln Leu Gly Glu Val Thr Val Glu Gln Pro Gly Glu Val 370 375 380 Leu Leu Glu Gly Leu Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu 385 390 395 400 Arg Gly Leu Glu Thr Ala Thr Pro Asp Thr Met Gln Leu Thr Pro Ala 405 410 415 Glu Ala Phe Val Leu Val Arg Thr Ala Ala Arg Gln Leu Arg Asp Ala 420 425 430 Gly Val Gly Val Asp Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser 435 440 445 Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Pro Glu Arg Ser Ser Gly 450 455 460 Phe Ser Leu Gly Glu Ser Leu Asp Trp Ser Trp Asp Leu Met Ile Gly 465 470 475 480 Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg 485 490 495 Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn 500 505 510 Asp Leu Arg Asn Ala Glu Arg Phe Cys Gly Ala Asn Pro Glu Leu Ser 515 520 525 Leu Asp Asp Ala Leu Arg Ile Thr Ala Thr Glu Gly Asp Leu Leu Met 530 535 540 Arg Leu Pro Val His Arg Phe Glu Ala Gly Pro Arg Leu Gln Ala Val 545 550 555 560 Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro 565 570 575 Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly 580 585 590 Trp Leu Ala Phe Leu Asn Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp 595 600 605 Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His 610 615 620 Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro 625 630 635 640 Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ala Phe Thr Pro 645 650 655 Glu Leu Ala Val Arg Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro 660 665 670 Ala Ala Leu Lys Lys Ala Leu Lys Asp Val Asp Leu Val Leu Thr Ser 675 680 685 Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser Gln Asp Trp 690 695 700 Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Ser Ala 705 710 715 720 Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Pro Ala Lys Gly Asn 725 730 735 Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser 740 745 750 Glu Leu Trp Ala Leu Met Asp Phe Leu Ser Pro Lys Val Leu Gly Glu 755 760 765 Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly 770 775 780 Asp Met Ala Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile 785 790 795 800 Leu Arg Arg Leu Lys Thr Asp Lys Thr Ile Ile Ser Asp Leu Pro Glu 805 810 815 Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser 820 825 830 Leu Tyr Ser Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Arg Ala 835 840 845 Pro Arg Gly Gln Arg His Gly Gln Val Leu Gly Leu Leu Thr Arg Leu 850 855 860 Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Ser Glu Asn Ala Val 865 870 875 880 Asp Asp Gly Phe Leu Gly Arg Ser Ala Lys Leu Gln Arg Leu Glu Glu 885 890 895 Ile Leu Asp Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr 900 905 910 Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ser Trp Met Gln Gln Arg 915 920 925 Trp Lys Ala Asp Val Pro Phe Leu His Gly Gly Thr Arg Lys Asn Glu 930 935 940 Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln 945 950 955 960 Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr 965 970 975 Arg Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val 980 985 990 Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg 995 1000 1005 Val Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu Glu Lys 1010 1015 1020 Ile Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu Asp Val 1025 1030 1035 Ile Gly Ser Gly Glu Asp Trp Leu Gly Cys Leu Ala Gly Asp Gln 1040 1045 1050 Leu Arg Asn Leu Val Ala Leu Glu Asp Thr 1055 1060 <210> 97 <211> 3060 <212> DNA <213> Synechococcus elongatus <400> 97 atggcagtgc tgcacggtgg ctggctcggc gatcgcttct gcgtttgggc cgaggcttgg 60 caggctggtg agcctcagtc ggcagcagaa attgcgattc atccctacgc gatcgcggcc 120 actgacttaa atgattggtg ccagaagtac cgtctgggat ccctgacggg gacgccaaca 180 gaagtcctgc tctctattcc cagtgacctg aagaaagagg cggttctacc gtttctgagt 240 ggtcaggaaa ttccagatgg ggcgctgctt tggtcttggc agatccccgt gctgtcgcta 300 gaagccgcga tcgccggtca atggctggcg accttgccgc tgggttcggc ggaggatcat 360 ccttggctgg ggccagatct acgcttttgg agccacatct accgctgggc acaaagtttg 420 ctggctcggg ggcgctttta tccggcgctg gagtcgagcg atcgcggttt aacggcagtt 480 tggttgccac tgtttaatca agcgggcgat cgccagcgct tcgatcgcta tagtcagcag 540 ctgcccttta gtcagttttg ctatcaggca atcgaaacag cggcagcttg tccttggcag 600 cctcaaccgc aggatctgtt gctgcgagtc ctacagactt ggttgacagc acgactacaa 660 ccggcgatcg cggcgggaac tctcgtgtct gctgatctgc tggcggcttg gcagcaatcg 720 ctagcgaatg gaaaaccgct aaagctagaa gacagtgaag ccagtcgctt gcaaacggcg 780 atcgatcgct ggttactacc agtgcagaat ggcgcagctc aggcttggcg gatggttttg 840 cgccttgtcc cgcctacgga gcaagagcag ccctggcaat tggagtttgg cttacaagca 900 gcgaccgatc ccgatcgctt tcggccggcc tctctcctct ggcaggatcc gctgccacct 960 gggctaccag atcaatctca ggaattgctg ttacgcggct tgggacaggc ttgtcggctc 1020 tatccccaat tgcaaaccag tctggcgaca gcctgtccag aattccatcc actgaccaca 1080 gcggaggtct atcagctgct caagcaggtg attcctcagt ggcaagagca gggcattgaa 1140 gtgcaactgc cgccgggctt gcgtggtcaa gggcgacacc ggctgggagt ggaagtcagc 1200 gccacgttgc cgagcgatcg cccgagtgtg gggctggaag cactactgca gtttcgttgg 1260 gagctgagtc tgggcggtca gcggctgacc aaagcagaag tggaacgctt ggcagccctg 1320 gaaacgccct tggtggaaat caacggcgac tggattgagg tgcggccgca ggatattgag 1380 tcggcgcgag agtttttccg taagcgcaag gatcagccaa atttgacctt ggcggatgcg 1440 atcgcgatcg ccagtggtga gtcgccgaat gttggtcgcc tgccggtggt caattttgaa 1500 gcggcgggct tactcgaaga agccttggcc gtgtttcagg ggcagcgatc gcctgcggct 1560 ttgcccgctc cgcccacctt tcagggcgag ctgcgaccct atcaagagcg gggggtgggc 1620 tggctcagct ttttgcagcg cttcgggatt ggggcttgcc tcgccgacga catgggcttg 1680 ggtaagacga ttcagctgct ggccttttta ctgcatctca aacacagcaa cgagctgacg 1740 cggccggtgc tgctagtctg tccgacttcg gtgctgggca actgggaacg ggaggtgcag 1800 aaatttgcac cggagcttcg ctggaagctg cactatggcc ccgatcgcgc tcagggtaag 1860 gctttggcga cagcgctcaa ggactgcgat ttggtgctga ccagttactc cttggtggcg 1920 cgagatcaga aagcgatcgc ggcgatcgac tggcaaggca ttgtgctgga tgaagcccag 1980 aacatcaaga atgaccaggc gaaacagacg caggcggtgc gagcgatcgc ccaaagtccg 2040 acgcaaaagc cccgctttcg gattgccctg acagggacgc cggttgagaa tcgcctcagt 2100 gagttgtggt cgattgtcga gtttttgcag ccgggacatt taggcaccaa gccattcttt 2160 caaaagcgct ttgtcacgcc gatcgagcgt tttggcgatg cggattcgct gacagcattg 2220 cggcagcgcg tgcaaccgtt aatcctacgg cgactgaaaa ccgatcgcag cattattgcc 2280 gacttgcctg agaagcaaga aatgacggtc ttttgtccgt tggtacagga gcaggccgat 2340 cgctatcagg tgctagtcaa tgaagcgcta gccaatattg aagcaagtga aggcattcag 2400 cggcgcggcc agattttggc attgctaacg cgactgaagc agctctgtaa tcatccgtcg 2460 ttgttgctcg aaaagccgaa gctcgatccg aattttggcg atcgctcagc caagttgcag 2520 cgcttactag aaatgttggc ggagctaacg gatgcgggcg atcgcgcttt ggtgtttacg 2580 cagtttgcgg gctggggtag tttgctgcag caatttttgc aggaacagct agggcgagag 2640 gtgctgtttt tgtcgggcag taccaagaag ggcgatcgcc aacagatggt tgatcgcttc 2700 caaaatgatc cgcaggcacc ggcaattttc atcctgtcat tgaaggctgg cggggtgggg 2760 ctcaacctga cgaaagccaa tcatgtcttt cattacgatc gctggtggaa tccggcagtt 2820 gaaaaccaag cgaccgatcg cgcgtttcgg attgggcaac gacgcaatgt acaggtgcac 2880 aagtttgtct gcgctggcac tctagaagaa aaaattgatc agatgatcgc tagcaagcaa 2940 gcattagcac agcagattgt cggtagtggt gaggattggc taacggaact agacaccaat 3000 caactccggc aactcttgat cctcgatcgc tcagcttggg tagaagagga agagccttag 3060 <210> 98 <211> 1019 <212> PRT <213> Synechococcus elongatus <400> 98 Met Ala Val Leu His Gly Gly Trp Leu Gly Asp Arg Phe Cys Val Trp 1 5 10 15 Ala Glu Ala Trp Gln Ala Gly Glu Pro Gln Ser Ala Ala Glu Ile Ala 20 25 30 Ile His Pro Tyr Ala Ile Ala Ala Thr Asp Leu Asn Asp Trp Cys Gln 35 40 45 Lys Tyr Arg Leu Gly Ser Leu Thr Gly Thr Pro Thr Glu Val Leu Leu 50 55 60 Ser Ile Pro Ser Asp Leu Lys Lys Glu Ala Val Leu Pro Phe Leu Ser 65 70 75 80 Gly Gln Glu Ile Pro Asp Gly Ala Leu Leu Trp Ser Trp Gln Ile Pro 85 90 95 Val Leu Ser Leu Glu Ala Ala Ile Ala Gly Gln Trp Leu Ala Thr Leu 100 105 110 Pro Leu Gly Ser Ala Glu Asp His Pro Trp Leu Gly Pro Asp Leu Arg 115 120 125 Phe Trp Ser His Ile Tyr Arg Trp Ala Gln Ser Leu Leu Ala Arg Gly 130 135 140 Arg Phe Tyr Pro Ala Leu Glu Ser Ser Asp Arg Gly Leu Thr Ala Val 145 150 155 160 Trp Leu Pro Leu Phe Asn Gln Ala Gly Asp Arg Gln Arg Phe Asp Arg 165 170 175 Tyr Ser Gln Gln Leu Pro Phe Ser Gln Phe Cys Tyr Gln Ala Ile Glu 180 185 190 Thr Ala Ala Ala Cys Pro Trp Gln Pro Gln Pro Gln Asp Leu Leu Leu 195 200 205 Arg Val Leu Gln Thr Trp Leu Thr Ala Arg Leu Gln Pro Ala Ile Ala 210 215 220 Ala Gly Thr Leu Val Ser Ala Asp Leu Leu Ala Ala Trp Gln Gln Ser 225 230 235 240 Leu Ala Asn Gly Lys Pro Leu Lys Leu Glu Asp Ser Glu Ala Ser Arg 245 250 255 Leu Gln Thr Ala Ile Asp Arg Trp Leu Leu Pro Val Gln Asn Gly Ala 260 265 270 Ala Gln Ala Trp Arg Met Val Leu Arg Leu Val Pro Pro Thr Glu Gln 275 280 285 Glu Gln Pro Trp Gln Leu Glu Phe Gly Leu Gln Ala Ala Thr Asp Pro 290 295 300 Asp Arg Phe Arg Pro Ala Ser Leu Leu Trp Gln Asp Pro Leu Pro Pro 305 310 315 320 Gly Leu Pro Asp Gln Ser Gln Glu Leu Leu Leu Arg Gly Leu Gly Gln 325 330 335 Ala Cys Arg Leu Tyr Pro Gln Leu Gln Thr Ser Leu Ala Thr Ala Cys 340 345 350 Pro Glu Phe His Pro Leu Thr Thr Ala Glu Val Tyr Gln Leu Leu Lys 355 360 365 Gln Val Ile Pro Gln Trp Gln Glu Gln Gly Ile Glu Val Gln Leu Pro 370 375 380 Pro Gly Leu Arg Gly Gln Gly Arg His Arg Leu Gly Val Glu Val Ser 385 390 395 400 Ala Thr Leu Pro Ser Asp Arg Pro Ser Val Gly Leu Glu Ala Leu Leu 405 410 415 Gln Phe Arg Trp Glu Leu Ser Leu Gly Gly Gln Arg Leu Thr Lys Ala 420 425 430 Glu Val Glu Arg Leu Ala Ala Leu Glu Thr Pro Leu Val Glu Ile Asn 435 440 445 Gly Asp Trp Ile Glu Val Arg Pro Gln Asp Ile Glu Ser Ala Arg Glu 450 455 460 Phe Phe Arg Lys Arg Lys Asp Gln Pro Asn Leu Thr Leu Ala Asp Ala 465 470 475 480 Ile Ala Ile Ala Ser Gly Glu Ser Pro Asn Val Gly Arg Leu Pro Val 485 490 495 Val Asn Phe Glu Ala Ala Gly Leu Leu Glu Glu Ala Leu Ala Val Phe 500 505 510 Gln Gly Gln Arg Ser Pro Ala Ala Leu Pro Ala Pro Pro Thr Phe Gln 515 520 525 Gly Glu Leu Arg Pro Tyr Gln Glu Arg Gly Val Gly Trp Leu Ser Phe 530 535 540 Leu Gln Arg Phe Gly Ile Gly Ala Cys Leu Ala Asp Asp Met Gly Leu 545 550 555 560 Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Leu His Leu Lys His Ser 565 570 575 Asn Glu Leu Thr Arg Pro Val Leu Leu Val Cys Pro Thr Ser Val Leu 580 585 590 Gly Asn Trp Glu Arg Glu Val Gln Lys Phe Ala Pro Glu Leu Arg Trp 595 600 605 Lys Leu His Tyr Gly Pro Asp Arg Ala Gln Gly Lys Ala Leu Ala Thr 610 615 620 Ala Leu Lys Asp Cys Asp Leu Val Leu Thr Ser Tyr Ser Leu Val Ala 625 630 635 640 Arg Asp Gln Lys Ala Ile Ala Ala Ile Asp Trp Gln Gly Ile Val Leu 645 650 655 Asp Glu Ala Gln Asn Ile Lys Asn Asp Gln Ala Lys Gln Thr Gln Ala 660 665 670 Val Arg Ala Ile Ala Gln Ser Pro Thr Gln Lys Pro Arg Phe Arg Ile 675 680 685 Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Ser Glu Leu Trp Ser 690 695 700 Ile Val Glu Phe Leu Gln Pro Gly His Leu Gly Thr Lys Pro Phe Phe 705 710 715 720 Gln Lys Arg Phe Val Thr Pro Ile Glu Arg Phe Gly Asp Ala Asp Ser 725 730 735 Leu Thr Ala Leu Arg Gln Arg Val Gln Pro Leu Ile Leu Arg Arg Leu 740 745 750 Lys Thr Asp Arg Ser Ile Ile Ala Asp Leu Pro Glu Lys Gln Glu Met 755 760 765 Thr Val Phe Cys Pro Leu Val Gln Glu Gln Ala Asp Arg Tyr Gln Val 770 775 780 Leu Val Asn Glu Ala Leu Ala Asn Ile Glu Ala Ser Glu Gly Ile Gln 785 790 795 800 Arg Arg Gly Gln Ile Leu Ala Leu Leu Thr Arg Leu Lys Gln Leu Cys 805 810 815 Asn His Pro Ser Leu Leu Leu Glu Lys Pro Lys Leu Asp Pro Asn Phe 820 825 830 Gly Asp Arg Ser Ala Lys Leu Gln Arg Leu Leu Glu Met Leu Ala Glu 835 840 845 Leu Thr Asp Ala Gly Asp Arg Ala Leu Val Phe Thr Gln Phe Ala Gly 850 855 860 Trp Gly Ser Leu Leu Gln Gln Phe Leu Gln Glu Gln Leu Gly Arg Glu 865 870 875 880 Val Leu Phe Leu Ser Gly Ser Thr Lys Lys Gly Asp Arg Gln Gln Met 885 890 895 Val Asp Arg Phe Gln Asn Asp Pro Gln Ala Pro Ala Ile Phe Ile Leu 900 905 910 Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Lys Ala Asn His 915 920 925 Val Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala 930 935 940 Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg Asn Val Gln Val His 945 950 955 960 Lys Phe Val Cys Ala Gly Thr Leu Glu Glu Lys Ile Asp Gln Met Ile 965 970 975 Ala Ser Lys Gln Ala Leu Ala Gln Gln Ile Val Gly Ser Gly Glu Asp 980 985 990 Trp Leu Thr Glu Leu Asp Thr Asn Gln Leu Arg Gln Leu Leu Ile Leu 995 1000 1005 Asp Arg Ser Ala Trp Val Glu Glu Glu Glu Pro 1010 1015 <210> 99 <211> 3060 <212> DNA <213> Synechococcus elongatus <400> 99 atggcagtgc tgcacggtgg ctggctcggc gatcgcttct gcgtttgggc cgaggcttgg 60 caggctggtg agcctcagtc ggcagcagaa attgcgattc atccctacgc gatcgcggcc 120 actgacttaa atgattggtg ccagaagtac cgtctgggat ccctgacggg gacgccaaca 180 gaagtcctgc tctctattcc cagtgacctg aagaaagagg cggttctacc gtttctgagt 240 ggtcaggaaa ttccagatgg ggcgctgctt tggtcttggc agatccccgt gctgtcacta 300 gaagccgcga tcgccggtca atggctggcg accttgccgc tgggttcggc ggaggatcat 360 ccttggctgg ggccagatct acgcttttgg agccacatct accgctgggc acaaagtttg 420 ctggctcggg ggcgctttta tccggcgctg gagtcgagcg atcgcggttt aacggcagtt 480 tggttgccac tgtttaatca agcgggcgat cgccagcgct tcgatcgcta tagtcagcag 540 ctgcccttta gtcagttttg ctatcaggca atcgaaacag cggcagcttg tccttggcag 600 cctcaaccgc aggatctgtt gctgcgagtc ctacagactt ggttgacagc acgactacaa 660 ccggcgatcg cggcgggaac tctcgtgtct gctgatctgc tggcggcttg gcagcaatcg 720 ctagcgaatg gaaaaccgct aaagctagaa gacagtgaag ccagtcgctt gcaaacggcg 780 atcgatcgct ggttactacc agtgcagaat ggcgcagctc aggcttggcg gatggttttg 840 cgccttgtcc cgcctacgga gcaagagcag ccctggcaat tggagtttgg cttacaagca 900 gcgaccgatc ccgatcgctt ttggccggcc tctctcctct ggcaggatcc gctgccacct 960 gggctaccag atcaatctca ggaattgctg ttacgcggct tgggacaggc ttgtcggctc 1020 tatccccaat tgcaaaccag tctggcgaca gcctgtccag aattccatcc actgaccaca 1080 gcggaggtct atcagctgct caagcaggtg attcctcagt ggcaagagca gggcattgaa 1140 gtgcaactgc cgccgggctt gcgtggtcaa gggcgacacc ggctgggagt ggaagtcagc 1200 gccacgttgc cgagcgatcg cccgagtgtg gggctggaag cactactgca gtttcgttgg 1260 gagctgagtc tgggcggtca gcggctgacc aaagcagaag tggaacgctt ggcagccctg 1320 gaaacgccct tggtggaaat caacggcgac tggattgagg tgcggccgca ggatattgag 1380 tcggcgcgag agtttttccg taagcgcaag gatcagccaa atttgacctt ggcggatgcg 1440 atcgcgatcg ccagtggtga gtcgccgaat gttggtcgcc tgccggtggt caattttgaa 1500 gcggcgggct tactcgaaga agccttggcc gtgtttcagg ggcagcgatc gcctgcggct 1560 ttgcccgctc cgcccacctt tcagggcgag ctgcgaccct atcaagagcg gggggtgggc 1620 tggctcagct ttttgcagcg cttcgggatt ggggcttgcc tcgccgacga catgggcttg 1680 ggtaagacga ttcagctgct ggccttttta ctgcatctca aacacagcaa cgagctgacg 1740 cggccggtgc tgctagtctg tccgacttcg gtgctgggca actgggaacg ggaggtgcag 1800 aaatttgcac cggagcttcg ctggaagctg cactatggcc ccgatcgcgc tcagggtaag 1860 gctttggcga cagcgctcaa ggactgcgat ttggtgctga ccagttactc cttggtggcg 1920 cgagatcaga aagcgatcgc ggcgatcgac tggcaaggca ttgtgctgga tgaagcccag 1980 aacatcaaga atgaccaggc gaaacagacg caggcggtgc gagcgatcgc ccaaagtccg 2040 acgcaaaagc cccgctttcg gattgccctg acagggacgc cggttgagaa tcgcctcagt 2100 gagttgtggt cgattgtcga gtttttgcag ccgggacatt taggcaccaa gccattcttt 2160 caaaagcgct ttgtcacgcc gatcgagcgt tttggcgatg cggattcgct gacagcattg 2220 cggcagcgcg tgcaaccgtt aatcctacgg cgactgaaaa ccgatcgcag cattattgcc 2280 gacttgcctg agaagcaaga aatgacggtc ttttgtccgt tggtacagga gcaggccgat 2340 cgctatcagg tgctagtcaa tgaagcgcta gccaatattg aagcaagtga aggcattcag 2400 cggcgcggcc agattttggc attgctaacg cgactgaagc agctctgtaa tcatccgtcg 2460 ttgttgctcg aaaagccgaa gctcgatccg aattttggcg atcgctcagc caagttgcag 2520 cgcttactag aaatgttggc ggagctaacg gatgcgggcg atcgcgcttt ggtgtttacg 2580 cagtttgcgg gctggggtag tttgctgcag caatttttgc aggaacagct agggcgagag 2640 gtgctgtttt tgtcgggcag taccaagaag ggcgatcgcc aacagatggt tgatcgcttc 2700 caaaatgatc cgcaggcacc ggcaattttc atcctgtcat tgaaggctgg cggggtgggg 2760 ctcaacctga cgaaagccaa tcatgtcttt cattacgatc gctggtggaa tccggcagtt 2820 gaaaaccaag cgaccgatcg cgcgtttcgg attgggcaac gacgcaatgt acaggtgcac 2880 aagtttgtct gcgctggcac tctagaagaa aaaattgatc agatgatcgc tagcaagcaa 2940 gcattagcac agcagattgt cggtagtggt gaggattggc taacggaact agacaccaat 3000 caactccggc aactcttgat cctcgatcgc tcagcttggg tagaagagga agagccttag 3060 <210> 100 <211> 1019 <212> PRT <213> Synechococcus elongatus <400> 100 Met Ala Val Leu His Gly Gly Trp Leu Gly Asp Arg Phe Cys Val Trp 1 5 10 15 Ala Glu Ala Trp Gln Ala Gly Glu Pro Gln Ser Ala Ala Glu Ile Ala 20 25 30 Ile His Pro Tyr Ala Ile Ala Ala Thr Asp Leu Asn Asp Trp Cys Gln 35 40 45 Lys Tyr Arg Leu Gly Ser Leu Thr Gly Thr Pro Thr Glu Val Leu Leu 50 55 60 Ser Ile Pro Ser Asp Leu Lys Lys Glu Ala Val Leu Pro Phe Leu Ser 65 70 75 80 Gly Gln Glu Ile Pro Asp Gly Ala Leu Leu Trp Ser Trp Gln Ile Pro 85 90 95 Val Leu Ser Leu Glu Ala Ala Ile Ala Gly Gln Trp Leu Ala Thr Leu 100 105 110 Pro Leu Gly Ser Ala Glu Asp His Pro Trp Leu Gly Pro Asp Leu Arg 115 120 125 Phe Trp Ser His Ile Tyr Arg Trp Ala Gln Ser Leu Leu Ala Arg Gly 130 135 140 Arg Phe Tyr Pro Ala Leu Glu Ser Ser Asp Arg Gly Leu Thr Ala Val 145 150 155 160 Trp Leu Pro Leu Phe Asn Gln Ala Gly Asp Arg Gln Arg Phe Asp Arg 165 170 175 Tyr Ser Gln Gln Leu Pro Phe Ser Gln Phe Cys Tyr Gln Ala Ile Glu 180 185 190 Thr Ala Ala Ala Cys Pro Trp Gln Pro Gln Pro Gln Asp Leu Leu Leu 195 200 205 Arg Val Leu Gln Thr Trp Leu Thr Ala Arg Leu Gln Pro Ala Ile Ala 210 215 220 Ala Gly Thr Leu Val Ser Ala Asp Leu Leu Ala Ala Trp Gln Gln Ser 225 230 235 240 Leu Ala Asn Gly Lys Pro Leu Lys Leu Glu Asp Ser Glu Ala Ser Arg 245 250 255 Leu Gln Thr Ala Ile Asp Arg Trp Leu Leu Pro Val Gln Asn Gly Ala 260 265 270 Ala Gln Ala Trp Arg Met Val Leu Arg Leu Val Pro Pro Thr Glu Gln 275 280 285 Glu Gln Pro Trp Gln Leu Glu Phe Gly Leu Gln Ala Ala Thr Asp Pro 290 295 300 Asp Arg Phe Trp Pro Ala Ser Leu Leu Trp Gln Asp Pro Leu Pro Pro 305 310 315 320 Gly Leu Pro Asp Gln Ser Gln Glu Leu Leu Leu Arg Gly Leu Gly Gln 325 330 335 Ala Cys Arg Leu Tyr Pro Gln Leu Gln Thr Ser Leu Ala Thr Ala Cys 340 345 350 Pro Glu Phe His Pro Leu Thr Thr Ala Glu Val Tyr Gln Leu Leu Lys 355 360 365 Gln Val Ile Pro Gln Trp Gln Glu Gln Gly Ile Glu Val Gln Leu Pro 370 375 380 Pro Gly Leu Arg Gly Gln Gly Arg His Arg Leu Gly Val Glu Val Ser 385 390 395 400 Ala Thr Leu Pro Ser Asp Arg Pro Ser Val Gly Leu Glu Ala Leu Leu 405 410 415 Gln Phe Arg Trp Glu Leu Ser Leu Gly Gly Gln Arg Leu Thr Lys Ala 420 425 430 Glu Val Glu Arg Leu Ala Ala Leu Glu Thr Pro Leu Val Glu Ile Asn 435 440 445 Gly Asp Trp Ile Glu Val Arg Pro Gln Asp Ile Glu Ser Ala Arg Glu 450 455 460 Phe Phe Arg Lys Arg Lys Asp Gln Pro Asn Leu Thr Leu Ala Asp Ala 465 470 475 480 Ile Ala Ile Ala Ser Gly Glu Ser Pro Asn Val Gly Arg Leu Pro Val 485 490 495 Val Asn Phe Glu Ala Ala Gly Leu Leu Glu Glu Ala Leu Ala Val Phe 500 505 510 Gln Gly Gln Arg Ser Pro Ala Ala Leu Pro Ala Pro Pro Thr Phe Gln 515 520 525 Gly Glu Leu Arg Pro Tyr Gln Glu Arg Gly Val Gly Trp Leu Ser Phe 530 535 540 Leu Gln Arg Phe Gly Ile Gly Ala Cys Leu Ala Asp Asp Met Gly Leu 545 550 555 560 Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Leu His Leu Lys His Ser 565 570 575 Asn Glu Leu Thr Arg Pro Val Leu Leu Val Cys Pro Thr Ser Val Leu 580 585 590 Gly Asn Trp Glu Arg Glu Val Gln Lys Phe Ala Pro Glu Leu Arg Trp 595 600 605 Lys Leu His Tyr Gly Pro Asp Arg Ala Gln Gly Lys Ala Leu Ala Thr 610 615 620 Ala Leu Lys Asp Cys Asp Leu Val Leu Thr Ser Tyr Ser Leu Val Ala 625 630 635 640 Arg Asp Gln Lys Ala Ile Ala Ala Ile Asp Trp Gln Gly Ile Val Leu 645 650 655 Asp Glu Ala Gln Asn Ile Lys Asn Asp Gln Ala Lys Gln Thr Gln Ala 660 665 670 Val Arg Ala Ile Ala Gln Ser Pro Thr Gln Lys Pro Arg Phe Arg Ile 675 680 685 Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Ser Glu Leu Trp Ser 690 695 700 Ile Val Glu Phe Leu Gln Pro Gly His Leu Gly Thr Lys Pro Phe Phe 705 710 715 720 Gln Lys Arg Phe Val Thr Pro Ile Glu Arg Phe Gly Asp Ala Asp Ser 725 730 735 Leu Thr Ala Leu Arg Gln Arg Val Gln Pro Leu Ile Leu Arg Arg Leu 740 745 750 Lys Thr Asp Arg Ser Ile Ile Ala Asp Leu Pro Glu Lys Gln Glu Met 755 760 765 Thr Val Phe Cys Pro Leu Val Gln Glu Gln Ala Asp Arg Tyr Gln Val 770 775 780 Leu Val Asn Glu Ala Leu Ala Asn Ile Glu Ala Ser Glu Gly Ile Gln 785 790 795 800 Arg Arg Gly Gln Ile Leu Ala Leu Leu Thr Arg Leu Lys Gln Leu Cys 805 810 815 Asn His Pro Ser Leu Leu Leu Glu Lys Pro Lys Leu Asp Pro Asn Phe 820 825 830 Gly Asp Arg Ser Ala Lys Leu Gln Arg Leu Leu Glu Met Leu Ala Glu 835 840 845 Leu Thr Asp Ala Gly Asp Arg Ala Leu Val Phe Thr Gln Phe Ala Gly 850 855 860 Trp Gly Ser Leu Leu Gln Gln Phe Leu Gln Glu Gln Leu Gly Arg Glu 865 870 875 880 Val Leu Phe Leu Ser Gly Ser Thr Lys Lys Gly Asp Arg Gln Gln Met 885 890 895 Val Asp Arg Phe Gln Asn Asp Pro Gln Ala Pro Ala Ile Phe Ile Leu 900 905 910 Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Lys Ala Asn His 915 920 925 Val Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala 930 935 940 Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg Asn Val Gln Val His 945 950 955 960 Lys Phe Val Cys Ala Gly Thr Leu Glu Glu Lys Ile Asp Gln Met Ile 965 970 975 Ala Ser Lys Gln Ala Leu Ala Gln Gln Ile Val Gly Ser Gly Glu Asp 980 985 990 Trp Leu Thr Glu Leu Asp Thr Asn Gln Leu Arg Gln Leu Leu Ile Leu 995 1000 1005 Asp Arg Ser Ala Trp Val Glu Glu Glu Glu Pro 1010 1015 <210> 101 <211> 3000 <212> DNA <213> Thermosynechococcus elongatus <400> 101 atggctattt tccatggcac atggctccca gagccggcgc cacagttttt catttgggcg 60 gaagaatggc gatcgctggc tcaggcaatc acgccttggg ctcccccggc gattccggtt 120 tatccctacg ccacccagag aaaaacacct cttaggaaga cagcccgccc aagtgccacc 180 tacgttgctt taccggccca gattcagggg catcaactgt taccaccacc gctggcggaa 240 gtgcaggggg aactcctatt tttgtggcag gtgcccggct ggtcaattcc cgcttcagaa 300 gttttagaac aactgcatca actgagtctt cacggccaag acagtggcag tattggcgat 360 gatttgcgct attggctgca cgtgagtcgc tggttgctgg atttaattgt gcgtggccaa 420 tacctgccaa caccagaggg ctggcggatt ctgctgaccc acgggggcga tcgcgatcgc 480 ctgcgccact tcagccaatt gatgccggat ctgtgtcgct gttatcaagc cgatggcaca 540 gcgttgcagt tgccacccca tgctgcagat ctcctggcgg attttctaca gcacacccta 600 cagggttatc tccacactgc ccttgctgac ctcgaattgc ccaaagtagg cttagccaaa 660 gaacatggcc actggctagc cttcctgaaa acgggtcaaa ccccggaact gccacctccc 720 ctcattgaac gcctgcaccg ctggcaagaa ccctaccgcg agcagttgca tctgcgtccc 780 caatggcgac tggctctgca attggttccc ccagatactg ccgatggtga ctggcacttg 840 gcctttgggc tgcaaacgga aggggaaacg gacaccatgc taagggccgc cgagatttgg 900 caatgcaccc aagaggccct cctctatcaa gggcaggtgc tctggcagcc ccaagaaacc 960 ctgttgcggg gactgggctt ggcctcccgc atctatcgtc ccctcgatcg cagtcttcaa 1020 gaacgctccc ccgtggctct gactttgcac accacggaag tttatgcctt cttgcaaagt 1080 gcaattgcgc cccttgagca gcagggggtt gcgatcattt tgccaccgag tctgcgccgc 1140 aatagcgccc aacatcgctt gggtctgaaa ataattgcca cattgccgcc gccggccact 1200 aacggcttga cgattgacag cttgatgcag tttcagtggc agttgcagtt ggggcagcat 1260 cccctctcgg aggcggattt tgatcaactg cgccgccaag ggacgcccct ggtttatctc 1320 aatggtgagt gggtcttgct gcgcccccaa gaggtcaagg ccgctcaaga gtttctccag 1380 tctcccccaa agacccaact ctcccttgca gagacactgc gcattgctac gggggatacg 1440 gtaacggtgg ccaagttgcc gattcttggc ttagacacca atgatgcact ccagaccctc 1500 ttggatggcc tcacgggcaa acaaagcctt gatccagtgc caacaccgca ggagttttgc 1560 ggtgaactgc gcccctacca ggcacggggg gtggcgtggc tgagtttctt ggaacgctgg 1620 cggctggggg cttgcttggc ggacgatatg ggcttgggga aaaccattca actgttggcc 1680 tttttgctcc acctcaagga aacgggacgg gcctaccgac cgacactgtt gatctgtcct 1740 acctcggtgc tggggaactg gctgcgggag tgccaaaagt ttgccccaac cttgcgggcc 1800 tatgtccacc atgggagcga tcgccccaag ggcaaggcat ttctgaaaaa ggttgaaact 1860 cacgatctaa ttttgaccag ttatgccctc ctccagcgcg atcgcaccac cttgcagcag 1920 gttctgtggc agcatttggt actggatgaa gcccaaaaca tcaagaatgc caacacccag 1980 cagtcccaag cagcgcggga actttccgcc cagtttcgca ttgccctgac gggaaccccc 2040 ctagaaaacc gcctcctcga actttggtcc attatggact tcctccatcc ggggtacttg 2100 ggccatcgca cctactttca acaccgctat gtccgtccca ttgaacgcta tggcgacacc 2160 acctccctca atgctctgcg cacctatgtc cagcccttta ttctgcggcg cctgaaaacc 2220 gaccgcagta ttattcaaga cctgccggaa aaacaggaga tgctggtgta ttgtggcctc 2280 accctagagc agatgcagct ttacactgct gtggtggaag actcccttgc tgctatcgaa 2340 aatagtcaag gcattcagcg gcggggcaat atcttggcca ccctgaccaa gttgaagcaa 2400 atctgtaacc atcccgccca gtatctcaag caagaagact atgcccccga tcgctcaggt 2460 aaattgcaac ggcttataga aatgctgcaa gcgcttcagg aagtgggcga tcgcgccctt 2520 gtctttaccc aatttgccga gtttggcacc cacctgaaaa cctatctgga aaaggcgctc 2580 cagcaggagg tgtttttcct ctcaggacgc acccccaaag cccagcggga actcatggtg 2640 gaacgctttc aacacgatcc cgaggccccc agggtcttta ttctttccct caaggcaggg 2700 ggcgtcggtc tcaatttgac tcgcgctaac catgtctttc actacgatcg ctggtggaac 2760 ccagcggtag aaaatcaggc cagcgatcgc gtcttccgca ttggtcaggc ccgcaatgtc 2820 caaatccata aatttatctg cacgggtacc ctcgaagaaa agatccacga gcaaatcgaa 2880 cagaaaaaag cccttgcgga aatgattgtg ggtagtggcg aacactggct gactgaactc 2940 aacctcgacc agttgcggca actgctcacc ttagacaaag agcggctgat caccctctag 3000 <210> 102 <211> 999 <212> PRT <213> Thermosynechococcus elongatus <400> 102 Met Ala Ile Phe His Gly Thr Trp Leu Pro Glu Pro Ala Pro Gln Phe 1 5 10 15 Phe Ile Trp Ala Glu Glu Trp Arg Ser Leu Ala Gln Ala Ile Thr Pro 20 25 30 Trp Ala Pro Pro Ala Ile Pro Val Tyr Pro Tyr Ala Thr Gln Arg Lys 35 40 45 Thr Pro Leu Arg Lys Thr Ala Arg Pro Ser Ala Thr Tyr Val Ala Leu 50 55 60 Pro Ala Gln Ile Gln Gly His Gln Leu Leu Pro Pro Pro Leu Ala Glu 65 70 75 80 Val Gln Gly Glu Leu Leu Phe Leu Trp Gln Val Pro Gly Trp Ser Ile 85 90 95 Pro Ala Ser Glu Val Leu Glu Gln Leu His Gln Leu Ser Leu His Gly 100 105 110 Gln Asp Ser Gly Ser Ile Gly Asp Asp Leu Arg Tyr Trp Leu His Val 115 120 125 Ser Arg Trp Leu Leu Asp Leu Ile Val Arg Gly Gln Tyr Leu Pro Thr 130 135 140 Pro Glu Gly Trp Arg Ile Leu Leu Thr His Gly Gly Asp Arg Asp Arg 145 150 155 160 Leu Arg His Phe Ser Gln Leu Met Pro Asp Leu Cys Arg Cys Tyr Gln 165 170 175 Ala Asp Gly Thr Ala Leu Gln Leu Pro Pro His Ala Ala Asp Leu Leu 180 185 190 Ala Asp Phe Leu Gln His Thr Leu Gln Gly Tyr Leu His Thr Ala Leu 195 200 205 Ala Asp Leu Glu Leu Pro Lys Val Gly Leu Ala Lys Glu His Gly His 210 215 220 Trp Leu Ala Phe Leu Lys Thr Gly Gln Thr Pro Glu Leu Pro Pro Pro 225 230 235 240 Leu Ile Glu Arg Leu His Arg Trp Gln Glu Pro Tyr Arg Glu Gln Leu 245 250 255 His Leu Arg Pro Gln Trp Arg Leu Ala Leu Gln Leu Val Pro Pro Asp 260 265 270 Thr Ala Asp Gly Asp Trp His Leu Ala Phe Gly Leu Gln Thr Glu Gly 275 280 285 Glu Thr Asp Thr Met Leu Arg Ala Ala Glu Ile Trp Gln Cys Thr Gln 290 295 300 Glu Ala Leu Leu Tyr Gln Gly Gln Val Leu Trp Gln Pro Gln Glu Thr 305 310 315 320 Leu Leu Arg Gly Leu Gly Leu Ala Ser Arg Ile Tyr Arg Pro Leu Asp 325 330 335 Arg Ser Leu Gln Glu Arg Ser Pro Val Ala Leu Thr Leu His Thr Thr 340 345 350 Glu Val Tyr Ala Phe Leu Gln Ser Ala Ile Ala Pro Leu Glu Gln Gln 355 360 365 Gly Val Ala Ile Ile Leu Pro Pro Ser Leu Arg Arg Asn Ser Ala Gln 370 375 380 His Arg Leu Gly Leu Lys Ile Ile Ala Thr Leu Pro Pro Pro Ala Thr 385 390 395 400 Asn Gly Leu Thr Ile Asp Ser Leu Met Gln Phe Gln Trp Gln Leu Gln 405 410 415 Leu Gly Gln His Pro Leu Ser Glu Ala Asp Phe Asp Gln Leu Arg Arg 420 425 430 Gln Gly Thr Pro Leu Val Tyr Leu Asn Gly Glu Trp Val Leu Leu Arg 435 440 445 Pro Gln Glu Val Lys Ala Ala Gln Glu Phe Leu Gln Ser Pro Pro Lys 450 455 460 Thr Gln Leu Ser Leu Ala Glu Thr Leu Arg Ile Ala Thr Gly Asp Thr 465 470 475 480 Val Thr Val Ala Lys Leu Pro Ile Leu Gly Leu Asp Thr Asn Asp Ala 485 490 495 Leu Gln Thr Leu Leu Asp Gly Leu Thr Gly Lys Gln Ser Leu Asp Pro 500 505 510 Val Pro Thr Pro Gln Glu Phe Cys Gly Glu Leu Arg Pro Tyr Gln Ala 515 520 525 Arg Gly Val Ala Trp Leu Ser Phe Leu Glu Arg Trp Arg Leu Gly Ala 530 535 540 Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala 545 550 555 560 Phe Leu Leu His Leu Lys Glu Thr Gly Arg Ala Tyr Arg Pro Thr Leu 565 570 575 Leu Ile Cys Pro Thr Ser Val Leu Gly Asn Trp Leu Arg Glu Cys Gln 580 585 590 Lys Phe Ala Pro Thr Leu Arg Ala Tyr Val His His Gly Ser Asp Arg 595 600 605 Pro Lys Gly Lys Ala Phe Leu Lys Lys Val Glu Thr His Asp Leu Ile 610 615 620 Leu Thr Ser Tyr Ala Leu Leu Gln Arg Asp Arg Thr Thr Leu Gln Gln 625 630 635 640 Val Leu Trp Gln His Leu Val Leu Asp Glu Ala Gln Asn Ile Lys Asn 645 650 655 Ala Asn Thr Gln Gln Ser Gln Ala Ala Arg Glu Leu Ser Ala Gln Phe 660 665 670 Arg Ile Ala Leu Thr Gly Thr Pro Leu Glu Asn Arg Leu Leu Glu Leu 675 680 685 Trp Ser Ile Met Asp Phe Leu His Pro Gly Tyr Leu Gly His Arg Thr 690 695 700 Tyr Phe Gln His Arg Tyr Val Arg Pro Ile Glu Arg Tyr Gly Asp Thr 705 710 715 720 Thr Ser Leu Asn Ala Leu Arg Thr Tyr Val Gln Pro Phe Ile Leu Arg 725 730 735 Arg Leu Lys Thr Asp Arg Ser Ile Ile Gln Asp Leu Pro Glu Lys Gln 740 745 750 Glu Met Leu Val Tyr Cys Gly Leu Thr Leu Glu Gln Met Gln Leu Tyr 755 760 765 Thr Ala Val Val Glu Asp Ser Leu Ala Ala Ile Glu Asn Ser Gln Gly 770 775 780 Ile Gln Arg Arg Gly Asn Ile Leu Ala Thr Leu Thr Lys Leu Lys Gln 785 790 795 800 Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Gln Glu Asp Tyr Ala Pro 805 810 815 Asp Arg Ser Gly Lys Leu Gln Arg Leu Ile Glu Met Leu Gln Ala Leu 820 825 830 Gln Glu Val Gly Asp Arg Ala Leu Val Phe Thr Gln Phe Ala Glu Phe 835 840 845 Gly Thr His Leu Lys Thr Tyr Leu Glu Lys Ala Leu Gln Gln Glu Val 850 855 860 Phe Phe Leu Ser Gly Arg Thr Pro Lys Ala Gln Arg Glu Leu Met Val 865 870 875 880 Glu Arg Phe Gln His Asp Pro Glu Ala Pro Arg Val Phe Ile Leu Ser 885 890 895 Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His Val 900 905 910 Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Ser 915 920 925 Asp Arg Val Phe Arg Ile Gly Gln Ala Arg Asn Val Gln Ile His Lys 930 935 940 Phe Ile Cys Thr Gly Thr Leu Glu Glu Lys Ile His Glu Gln Ile Glu 945 950 955 960 Gln Lys Lys Ala Leu Ala Glu Met Ile Val Gly Ser Gly Glu His Trp 965 970 975 Leu Thr Glu Leu Asn Leu Asp Gln Leu Arg Gln Leu Leu Thr Leu Asp 980 985 990 Lys Glu Arg Leu Ile Thr Leu 995 <210> 103 <211> 10 <212> PRT <213> Artificial sequence <220> <223> motif 1 <220> <221> VARIANT <222> (10)..(10) <223> /replace = "Ser" <400> 103 Leu Ala Asp Asp Met Gly Leu Gly Lys Thr 1 5 10 <210> 104 <211> 12 <212> PRT <213> Artificial sequence <220> <223> motif 1a <220> <221> VARIANT <222> (2)..(2) <223> /replace = "Val" /replace = "Ile" <220> <221> VARIANT <222> (3)..(3) <223> /replace = "Ile" /replace = "Leu" <220> <221> VARIANT <222> (4)..(4) <223> /replace = "Cys" <220> <221> VARIANT <222> (6)..(6) <223> /replace = "Met" /replace = "Val" <220> <221> VARIANT <222> (8)..(8) <223> /replace = "Ile" /replace = "Leu" <220> <221> VARIANT <222> (9)..(9) <223> /replace = "Ile" /replace = "Leu" <220> <221> UNSURE <222> (10)..(10) <400> 104 Leu Leu Val Ala Pro Thr Ser Val Val Xaa Asn Trp 1 5 10 <210> 105 <211> 8 <212> PRT <213> Artificial sequence <220> <223> motif 2 <220> <221> VARIANT <222> (5)..(5) <223> /replace = "Ala" /replace = "His" <220> <221> VARIANT <222> (6)..(6) <223> /replace = "Ile" /replace = "Leu" <400> 105 Asp Glu Ala Gln Asn Val Lys Asn 1 5 <210> 106 <211> 9 <212> PRT <213> Artificial sequence <220> <223> motif 3 <220> <221> VARIANT <222> (2)..(2) <223> /replace = "Met" <220> <221> UNSURE <222> (7)..(7) <400> 106 Ala Leu Thr Gly Thr Pro Xaa Glu Asn 1 5 <210> 107 <211> 6 <212> PRT <213> Artificial sequence <220> <223> motif 4 <220> <221> VARIANT <222> (1)..(1) <223> /replace = "Ile" <220> <221> UNSURE <222> (2)..(2) <220> <221> VARIANT <222> (4)..(4) <223> /replace = "Ser" <220> <221> VARIANT <222> (6)..(6) <223> /replace = "Tyr" <400> 107 Leu Xaa Phe Thr Gln Phe 1 5 <210> 108 <211> 17 <212> PRT <213> Artificial sequence <220> <223> motif 5 <220> <221> VARIANT <222> (2)..(2) <223> /replace = "Val" <220> <221> VARIANT <222> (7)..(7) <223> /replace = "Thr" /replace = "Leu" <220> <221> VARIANT <222> (9)..(9) <223> /replace = "Ile" <220> <221> VARIANT <222> (10)..(10) <223> /replace = "Ile" <220> <221> UNSURE <222> (13)..(13) <220> <221> UNSURE <222> (13)..(13) <400> 108 Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Xaa Ala Asn His 1 5 10 15 Val <210> 109 <211> 9 <212> PRT <213> Artificial sequence <220> <223> motif 5a <400> 109 Asp Arg Trp Trp Asn Pro Ala Val Glu 1 5 <210> 110 <211> 11 <212> PRT <213> Artificial sequence <220> <223> motif 6 <220> <221> VARIANT <222> (3)..(3) <223> /replace = "Ser" <220> <221> VARIANT <222> (6)..(6) <223> /replace = "Thr" /replace = "Val" <220> <221> VARIANT <222> (7)..(7) <223> /replace = "Tyr" <220> <221> VARIANT <222> (9)..(9) <223> /replace = "Leu" <400> 110 Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln 1 5 10 <210> 111 <211> 460 <212> PRT <213> Artificial sequence <220> <223> ATPase domain of SEQ ID NO: 2 <400> 111 Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Leu Leu Ala Phe 1 5 10 15 Leu Leu His Leu Ala Ala Glu Asp Met Leu Val Lys Pro Val Leu Ile 20 25 30 Val Cys Pro Thr Ser Val Leu Ser Asn Trp Gly His Glu Ile Asn Lys 35 40 45 Phe Ala Pro Gln Leu Lys Thr Leu Leu His His Gly Asp Arg Arg Lys 50 55 60 Lys Gly Gln Pro Leu Val Lys Gln Val Lys Asp Gln Gln Ile Val Leu 65 70 75 80 Thr Ser Tyr Ala Leu Leu Gln Arg Asp Phe Ser Ser Leu Lys Leu Val 85 90 95 Asp Trp Gln Gly Ile Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro 100 105 110 Gln Ala Lys Gln Ser Gln Ala Ala Arg Gln Leu Pro Ala Gly Phe Arg 115 120 125 Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Thr Glu Leu Trp 130 135 140 Ser Ile Leu Glu Phe Leu Asn Pro Gly Phe Leu Gly Asn Gln Ser Phe 145 150 155 160 Phe Gln Arg Arg Phe Ala Asn Pro Ile Glu Lys Phe Gly Asp Arg Gln 165 170 175 Ser Leu Leu Ile Leu Arg Asn Leu Val Arg Pro Phe Ile Leu Arg Arg 180 185 190 Leu Lys Thr Asp Gln Thr Ile Ile Gln Asp Leu Pro Glu Lys Gln Glu 195 200 205 Met Thr Val Phe Cys Asp Leu Ser Gln Glu Gln Ala Gly Leu Tyr Gln 210 215 220 Gln Leu Val Glu Glu Ser Leu Gln Ala Ile Ala Asp Ser Glu Gly Ile 225 230 235 240 Gln Arg His Gly Leu Val Leu Thr Leu Leu Thr Lys Leu Lys Gln Val 245 250 255 Cys Asn His Pro Asp Leu Leu Leu Lys Lys Pro Ala Ile Thr His Gly 260 265 270 His Gln Ser Gly Lys Leu Ile Arg Leu Ala Glu Met Leu Glu Glu Ile 275 280 285 Ile Ser Glu Gly Asp Arg Val Leu Ile Phe Thr Gln Phe Ala Ser Trp 290 295 300 Gly His Leu Leu Lys Pro Tyr Leu Glu Lys Tyr Phe Asn Gln Glu Val 305 310 315 320 Leu Tyr Leu His Gly Gly Thr Pro Ala Glu Gln Arg Gln Ala Leu Val 325 330 335 Glu Arg Phe Gln Gln Asp Pro Asn Ser Pro Tyr Leu Phe Ile Leu Ser 340 345 350 Leu Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Arg Ala Asn His Val 355 360 365 Phe His Val Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr 370 375 380 Asp Arg Ala Phe Arg Ile Gly Gln Thr Arg Asn Val Gln Val His Lys 385 390 395 400 Phe Val Cys Thr Gly Thr Leu Glu Glu Lys Ile Asn Ala Met Met Ala 405 410 415 Asp Lys Gln Gln Leu Ala Glu Gln Thr Val Asp Ala Gly Glu Asn Trp 420 425 430 Leu Thr Arg Leu Asp Thr Asp Lys Leu Arg Gln Leu Leu Thr Leu Ser 435 440 445 Ala Thr Pro Val Asp Tyr Gln Ala Glu Ala Ser Asp 450 455 460 <210> 112 <211> 1244 <212> DNA <213> Oryza sativa <400> 112 aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg 60 gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac 120 ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg 180 gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga 240 ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga 300 gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg 360 atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc 420 atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga 480 atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga 540 tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc 600 ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat 660 ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt 720 tcatgagcaa atctacaaaa ctggaaagca ataagaaata cgggactgga aaagactcaa 780 cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac 840 tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc 900 gcacactggc cttccatctc aggctagctt tctcagccac ccatcgtaca tgtcaactcg 960 gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa 1020 gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac gcacgcacgc acgcccaacc 1080 ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccacccgcgc cctcacctcg 1140 ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa 1200 aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg acaa 1244 <210> 113 <211> 59 <212> DNA <213> Artificial sequence <220> <223> primer: prm08774 <400> 113 ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gactatccac ggtaattgg 59 <210> 114 <211> 49 <212> DNA <213> Artificial sequence <220> <223> primer: prm08779 <400> 114 ggggaccact ttgtacaaga aagctgggtt caatcggacg cttcggctt 49

Claims (47)

  1. 서열번호 2로 표시된 HpaG 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계를 포함하는, 대조구 식물에 비해 식물의 종자 수확량을 증가시키는 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 제1항에 있어서, 상기 증가된 종자 수확량은 스트레스가 없는 조건하에서 얻어진 것을 특징으로 하는 방법.
  8. 제1항에 있어서, 상기 증가된 종자 수확량은 비생물적 스트레스 조건하에서 얻어진 것을 특징으로 하는 방법.
  9. 제1항에 있어서, 상기 핵산은 구성적 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
  10. 제1항에 있어서, 상기 핵산은 녹색 조직 특이적 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
  11. 삭제
  12. HpaG 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 제1항에 따른 방법에 의해 수득 가능한 종자를 포함하는 식물.
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 하기 단계를 포함하는 대조구 식물에 비해 증가된 종자 수확량을 가진 형질전환 식물의 제조 방법:
    (i) 제1항에 정의된 HpaG 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및
    (ii) 식물 세포를 배양하는 단계.
  18. 제1항에 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인해, 대조구 식물에 비하여 증가된 종자 수확량을 가진 형질전환 식물.
  19. 식물이 작물 식물 또는 단자엽 식물 또는 곡물인 것을 특징으로 하는, 제12항에 따른 형질전환 식물.
  20. 수확 가능한 부분이 종자인 것을 특징으로 하는, 제19항에 따른 식물의 수확 가능한 부분.
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
KR1020097018675A 2007-02-28 2008-02-28 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 KR101227432B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
EP07103271.8 2007-02-28
EP07103271 2007-02-28
EP07104197 2007-03-15
EP07104197.4 2007-03-15
US89605007P 2007-03-21 2007-03-21
US60/896,050 2007-03-21
US90951007P 2007-04-02 2007-04-02
US60/909,510 2007-04-02
PCT/EP2008/052450 WO2008104598A2 (en) 2007-02-28 2008-02-28 Plants having enhanced yield-related traits and a method for making the same

Publications (2)

Publication Number Publication Date
KR20090119884A KR20090119884A (ko) 2009-11-20
KR101227432B1 true KR101227432B1 (ko) 2013-01-31

Family

ID=39420317

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097018675A KR101227432B1 (ko) 2007-02-28 2008-02-28 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법

Country Status (11)

Country Link
US (2) US8440881B2 (ko)
EP (2) EP2711425A1 (ko)
KR (1) KR101227432B1 (ko)
AR (1) AR065552A1 (ko)
AU (1) AU2008220715B8 (ko)
BR (1) BRPI0808415A2 (ko)
CA (1) CA2679077A1 (ko)
DE (1) DE112008000521T5 (ko)
ES (1) ES2574981T3 (ko)
MX (1) MX2009008600A (ko)
WO (1) WO2008104598A2 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811617A (zh) 2010-01-22 2012-12-05 拜耳知识产权有限责任公司 杀螨和/或杀虫活性物质结合物
FR2970968A1 (fr) * 2011-02-01 2012-08-03 Isp Investments Inc Nouveaux peptides intervenant dans la voie de signalisation scf c-kit et compositions les comprenant
US9364414B2 (en) 2011-02-01 2016-06-14 Isp Investments Inc. Method to protect skin from ultraviolet radiation using novel peptides involved in the improvement of microparasol organization in keratinocytes
CN103717076B (zh) 2011-08-10 2016-04-13 拜耳知识产权股份有限公司 含有特定特特拉姆酸衍生物的活性化合物组合物
KR20170065583A (ko) 2014-10-01 2017-06-13 플랜트 헬스 케어, 인코포레이티드 과민성 반응 유발제 펩타이드 및 이의 용도
MX2017004278A (es) 2014-10-01 2018-03-28 Plant Health Care Inc Peptidos inductores que tienen una caja de respuesta de hipersensibilidad interrumpida y su uso.
US10793608B2 (en) 2016-04-06 2020-10-06 Plant Health Care, Inc. Hypersensitive response elicitor-derived peptides and use thereof
US11371011B2 (en) 2016-04-06 2022-06-28 Plant Health Care, Inc. Beneficial microbes for delivery of effector peptides or proteins and use thereof
CN109788736B (zh) 2016-08-09 2022-05-27 先正达参股股份有限公司 杀昆虫蛋白
US11720638B2 (en) 2019-05-30 2023-08-08 Onlineseedsales Llc Embryonic plant listing system
US11198885B1 (en) * 2020-09-28 2021-12-14 Inari Agriculture Technology, Inc. Genetic regulatory element
CN112592392B (zh) * 2020-12-28 2022-03-15 安徽科技学院 多效性基因SbSnf4在提高甘蔗糖产量、株高、茎杆鲜重和/或汁液量中的应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030068302A (ko) * 2002-02-15 2003-08-21 황인규 잰토모나스 악소노포디스 유래의 과민성 반응 유발인자 및그 용도

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
AU3756889A (en) 1988-06-01 1990-01-05 The Texas A & M University System Method for transforming plants via the shoot apex
AU4115693A (en) 1992-04-24 1993-11-29 Sri International In vivo homologous sequence targeting in eukaryotic cells
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
WO1994012015A1 (en) 1992-11-30 1994-06-09 Chua Nam Hai Expression motifs that confer tissue- and developmental-specific expression in plants
AU687961B2 (en) 1993-11-19 1998-03-05 Biotechnology Research And Development Corporation Chimeric regulatory regions and gene cassettes for expression of genes in plants
EP0733059B1 (en) 1993-12-09 2000-09-13 Thomas Jefferson University Compounds and methods for site-directed mutations in eukaryotic cells
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US7390937B2 (en) 1996-02-14 2008-06-24 The Governors Of The University Of Alberta Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof
JP3267237B2 (ja) 1998-03-27 2002-03-18 松下電器産業株式会社 映像記録媒体および映像記録装置および映像検索装置
US6153741A (en) * 1998-04-30 2000-11-28 Washington University DNA methylation gene from plants
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US20030233670A1 (en) * 2001-12-04 2003-12-18 Edgerton Michael D. Gene sequences and uses thereof in plants
GB9914623D0 (en) * 1999-06-23 1999-08-25 Novartis Ag Organic compounds
CA2366104C (en) 1999-07-22 2010-07-06 Japan As Represented By Director General Of National Institute Of Agrobiological Resources, Ministry Of Agriculture, Forestry And Fisheries Ultra-fast transformation technique for monocotyledons
AU780117B2 (en) 1999-08-26 2005-03-03 Basf Plant Science Gmbh Plant gene expression, controlled by constitutive plant V-ATpase promoters
CN1126817C (zh) 2000-12-15 2003-11-05 南京农业大学 一种编码植物生长调节剂的基因、表达产物及其用法
US20050108791A1 (en) * 2001-12-04 2005-05-19 Edgerton Michael D. Transgenic plants with improved phenotypes
CN1225559C (zh) 2002-12-23 2005-11-02 南京农业大学 水稻黄单胞hrf3基因、重组载体及用于植物转基因育种方法
CN1219059C (zh) 2002-12-23 2005-09-14 南京农业大学 水稻黄单胞hrf2基因、重组载体及用于植物转基因育种的方法
WO2004065596A2 (en) 2003-01-21 2004-08-05 Cropdesign N.V. Use of the regulatory sequence of the rice gos2 gene for the gene expression in dicotyledonous plants or plant cells
DE602004006477T2 (de) 2003-02-04 2008-02-14 Cropdesign N.V. Promotor aus reis
NL1033850C2 (nl) 2007-05-15 2008-11-18 3Force B V Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen.

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030068302A (ko) * 2002-02-15 2003-08-21 황인규 잰토모나스 악소노포디스 유래의 과민성 반응 유발인자 및그 용도

Also Published As

Publication number Publication date
EP2711425A1 (en) 2014-03-26
DE112008000521T5 (de) 2010-03-04
KR20090119884A (ko) 2009-11-20
EP2118286A2 (en) 2009-11-18
AU2008220715B8 (en) 2014-06-12
US20130298287A1 (en) 2013-11-07
AU2008220715B2 (en) 2014-05-15
EP2118286B1 (en) 2016-04-13
US20100064386A1 (en) 2010-03-11
AR065552A1 (es) 2009-06-17
MX2009008600A (es) 2009-08-21
WO2008104598A2 (en) 2008-09-04
AU2008220715A8 (en) 2014-06-12
US8440881B2 (en) 2013-05-14
WO2008104598A3 (en) 2008-11-13
ES2574981T3 (es) 2016-06-23
CA2679077A1 (en) 2008-09-04
AU2008220715A1 (en) 2008-09-04
BRPI0808415A2 (pt) 2014-07-22

Similar Documents

Publication Publication Date Title
KR101227432B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR101662483B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR101255415B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101842489B (zh) 具有增强的产量相关性状的植物和用于制备该植物的方法
KR101647732B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR101255413B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101415829B (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
CN101365786B (zh) 具有改良的生长特征的植物及其生产方法
KR101754083B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
KR20120126061A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101952441B (zh) 具有增强的产量相关性状的植物及其制备方法
CN101583720A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
CN101495640A (zh) 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法
KR101429468B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
CN101868544A (zh) 具有提高的产量相关性状的植物和用于制备该植物的方法
CN101883783A (zh) 具有增强的产量相关性状的植物及其制备方法
WO2006131547A1 (en) Plants having improved growth characteristics and method for making the same
CN101563461A (zh) 具有改良特征的植物及其制备方法
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101778942A (zh) 产率相关性状增强的植物及制备其的方法
CN101595222B (zh) 具有改良的种子产量相关性状的植物及其制备方法
CN101668859A (zh) 具有增强的产量相关性状的植物及其制备方法
CN101541970A (zh) 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法
BRPI0619242A2 (pt) proteìna, métodos para aumentar produção de semente e/ou aumentar taxa de crescimento de plantas e taxa de crescimento, célula vegetal, construção, e, métodos para produzir uma planta transgenica, para melhorar caracterìsticas de crescimento de plantas e caracterìsticas de crescimento em relação a correspondentes plantas do tipo selvagem, para aumentar produção vegetal, número de sementes em plantas e produção de semente em plantas

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160108

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170117

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee